密歇根大學 2016
摘要?
設計了一種深度學習卷積神經網絡(DLCNN),用于將在預篩選階段檢測到的微鈣化候選物區分為在計算機輔助檢測(CAD)系統中用于聚集微鈣化的真正鈣化或假陽性。從由多尺度雙邊濾波重建的數字乳房斷層合成體積生成的平面投影圖像中提取微鈣化候選者正則化的同時代數重建技術。對于DLCNN的訓練和測試,對于數據集手動標記真正的微鈣化點,并且在排除真正的微鈣化之后,從CAD系統鑒定的候選對象在預篩選中獲得假陽性。通過改變卷積層中的濾波器數目,濾波器核心大小和梯度計算參數來選擇DLCNN體系結構,得到216個組合的參數空間。在所研究的參數空間內采用窮舉網格搜索方法來選擇最佳的體系結構,并以受試者工作特性曲線(AUC)下的面積為指標進行指導。分析了不同類別參數空間的影響。選定的DLCNN與我們以前設計的CNN架構進行了比較。 CNN和DLCNN的AUC分別為0.89和0.93。改善有統計學意義(p <0.05)。
1.引言
卷積神經網絡(CNN)以前已被用于在計算機輔助檢測(CAD)中識別用于屏幕膜乳房攝影,1數字乳腺攝影(DM)2和數字乳腺斷層合成(DBT)3-5的成簇微鈣化的微鈣化,來自乳房X線照相的正常乳房組織的腫塊[6]。CNN已經被證明可用于區分微小鈣化與纖維組織結構或金屬夾之間的平面間偽影。隨著近年來計算能力和數據存儲成本的不斷提高,大規模數據樣本訓練巨大的CNN結構成為可能。深度學習CNN(DLCNN)方法已經被證明可以有效地識別各種類型的圖像中的模式[7-11]。與傳統的CNN架構相比,DLCNN通過更多的層和節點來學習復雜的模式。在本研究中,我們評估了DLCNN在DBT中CAD系統的真假微鈣化分化中的應用。我們選擇了DLCNN的最佳體系結構,分析了參數對分類性能的影響,并與之前選擇的用于屏幕膠片乳房X線照片和DM的CNN體??系結構相比較。
2 方法
2.1數據集
在這項研究中,使用了64個DBT病例,并有微小的鈣化灶。數據集包含64個顱尾(CC)和63個側偏(MLO)視圖。使用多尺度雙邊濾波(MSBF)正則化的同時代數重建技(SART)重建DBT體積,平面分辨率為0.1 mm×0.1 mm,切片間距為1 mm。DBT體積分解為使用拉普拉斯金字塔分解的高頻和低頻量,并且每個切片的高頻分量被雙邊濾波去噪。高頻體積的最大強度投影產生平面投影(PPJ)圖像。從PPJ圖像中提取以預篩選階段中識別的每個個體微鈣化候選為中心的16×16像素的感興趣區域(ROI)。
2.2計算機輔助檢測系統
我們的CAD系統的處理步驟包括使用迭代閾值和區域增長來檢測微鈣化候選者,其次是聚類和假正減少(FP)。我們以前選擇的CNN架構具有兩個隱藏層,輸入和輸出層固定在一個節點組。 隱含層分別由12個和8個濾波器核大小為5和3的節點組構成。本文將CNN架構的分類性能與DLCNN的性能進行了比較。
為了對CNN和DLCNN進行訓練和測試,數據集中的真正微鈣化由乳房成像經驗豐富的醫學物理學家手動標記。 將由CAD系統檢測到的與手動標記的位置不重疊的微鈣化候選物用作FP對象。 對象被分成獨立的訓練和測試集。 為了增加訓練樣本的種類,每個真實微鈣化的ROI被旋轉并翻轉以產生八種模式。 由于FP對象比真正的微鈣化點多得多,所以FP對象是從可用的FP中隨機抽取的,因此真假對象的ROI近似平衡。 共有4808個由2352個TP和2440個FP組成的對象被用于訓練,并且使用了包括414個TP和1806個FP的2220個對象用于測試。 以微鈣化和FP對象為中心的ROI示例如圖1所示。
2.3選擇最佳的架構
圖1顯示了用于這項研究的DLCNN16的結構。 2.由于圖像模式在我們的應用中相對簡單,訓練樣本數量有限,我們選擇了一個簡單的結構,只有兩個卷積層,連接到兩個局部連接層和一個完全連接層。大小為2的最大匯聚層將第一卷積層的輸出下采樣到大小的一半。在每個卷積層之后實施標準化層以補償由于微鈣化和金屬物體造成的對比度的可能的大的變化。參數搜索空間包括表1中列出的參數范圍。使用詳盡的網格搜索方法來選擇DLCNN的最佳體系結構。根據表1中的參數組合,共有216個DLCNN體系結構進行了培訓和測試。 C1,C2,L1和L2的濾波器數目固定為16或32或64.部分和參數影響反向傳播階段的權重梯度計算。參數(??)的可能組合取決于濾波器的輸出大小(??),由given????*??給出,????= 0;例如,對于32的輸出大小,參數可以是1,2,4,8,16或32。
結果
根據受試者工作特征(ROC)曲線下面積(AUC)比較訓練的DLCNN和CNN對測試集中真實微鈣化和假陽性分類的表現。 對于搜索空間中所有可能的參數組合,按其值從低到高排序的AUC繪制在圖3中。 對于(32,32,32,32)濾波器的數量,對于兩個卷積層,濾波器核大小分別為5和5,部分和值分別為18,16,得到最佳的AUC為0.933。 對于相同的組合,部分和參數的變化如圖4所示。 圖5分析了每類濾波器的AUC變化。圖6比較了CNN和DLCNN測試集的ROC曲線。 改善有統計學意義(p <0.05)。
4.討論與結論
選擇DLCNN體系結構并不是一個微不足道的問題,因為每個參數集的訓練和測試都有大量的參數和長的計算時間。我們通過為DBT中的微鈣化檢測問題選擇固定數量的層的參數范圍和組合來限制搜索空間的大小。所選參數空間允許窮舉搜索最優DLCNN體系結構。觀察到,隨著過濾器數量的增加,AUC的變化也增加。當部分和參數變化時,沒有觀察到趨勢,這可能是由于機器學習方法的非線性性質。今后,我們計劃增加微鈣化的樣本量,并探索自動優化方法,如遺傳算法或模擬退火。我們還將擴大參數搜索空間,以包括不同層次的濾波器數量的變化。已經在重建的體積,18-22投影視圖,21,23-25 PPJ圖像,3,26或上述方法的組合中開發了用于DBT中的微鈣化團塊的CAD的實現。我們將探索DLCNN在不同的圖像的類型。