在檢測(cè)新冠病毒方面,深度學(xué)習(xí)有多靠譜?
冠狀病毒感染的迅速傳播,對(duì)數(shù)十億人生命產(chǎn)生了巨大的影響,根據(jù)目前已有數(shù)據(jù)分析,死亡率在3.4%左右,利用2D和3D深度學(xué)習(xí)模型,有助于將冠狀病毒患者與未患該疾病人區(qū)分開(kāi)。
本文來(lái)自微信公眾號(hào):AI科技大本營(yíng)(ID:rgznai100),作者:Ophir Gozes, Maayan Frid-Adar等,譯者:劉暢
背景:新冠病毒的傳播非常迅速,并對(duì)數(shù)十億人的生活產(chǎn)生了重大影響。由于非對(duì)稱胸部CT已被證明是檢測(cè)、量化和追蹤該疾病的有效工具,因此可以開(kāi)發(fā)深度學(xué)習(xí)算法,來(lái)幫助分析大量的胸部CT圖像。
目標(biāo):開(kāi)發(fā)基于AI的自動(dòng)CT圖像分析工具,并證明它們可以將冠狀病毒患者與未患該疾病的人區(qū)分開(kāi)。
數(shù)據(jù)和方法:包括來(lái)自中國(guó)疾病感染地區(qū)的多個(gè)國(guó)際數(shù)據(jù)集。本文提出了一種利用2D和3D深度學(xué)習(xí)模型,修改和調(diào)整現(xiàn)有AI模型并將其與臨床理解相結(jié)合的系統(tǒng)。
本文進(jìn)行了多次回顧性實(shí)驗(yàn),以分析系統(tǒng)在檢測(cè)可疑COVID-19胸部CT特征中的性能,并使用3D視圖來(lái)檢查評(píng)估每位患者隨時(shí)間推移的疾病進(jìn)展,并產(chǎn)生“冠狀評(píng)分”。該研究包括了157名國(guó)際患者(中國(guó)和美國(guó))的測(cè)試集。
結(jié)果:胸部CT冠狀病毒與非冠狀病毒的分類(lèi)結(jié)果為0.996 AUC(95%CI:0.989-1.00),這是在中國(guó)對(duì)照組患者和感染患者的數(shù)據(jù)集上的結(jié)果。實(shí)際使用的結(jié)果:靈敏度為98.2%,特異性為92.2%。
對(duì)于冠狀病毒患者,系統(tǒng)可對(duì)較小的不透明物(體積,直徑)進(jìn)行定量測(cè)量,并在基于切片的“熱圖”或3D體積顯示中可視化較大的不透明物。本文提出的“冠狀(Corona)評(píng)分”可以衡量疾病隨時(shí)間的進(jìn)展。
總結(jié):這項(xiàng)最初的研究目前正在擴(kuò)展到更大的人群,證明基于AI的圖像分析可以在檢測(cè)冠狀病毒以及量化和跟蹤疾病方面取得高精度的結(jié)果。
引言
冠狀病毒感染的迅速傳播,對(duì)數(shù)十億人生命產(chǎn)生了巨大的影響,根據(jù)目前已有數(shù)據(jù)分析,死亡率在3.4%左右。
人們對(duì)當(dāng)前診斷標(biāo)準(zhǔn)在疾病最初表現(xiàn)時(shí)的敏感性提出了質(zhì)疑。Fang等熱將非對(duì)稱胸部CT的敏感性與檢測(cè)病毒核酸的逆轉(zhuǎn)錄聚合酶鏈反應(yīng)(RT-PCR)進(jìn)行了比較,它是目前檢測(cè)COVID-19的參考標(biāo)準(zhǔn)。他們的研究調(diào)查了51名在流行地區(qū)有旅行或居住史,發(fā)燒或未知原因的急性呼吸道癥狀的患者。患者接受了最初的和重復(fù)的RT-PCR測(cè)試。他們的標(biāo)準(zhǔn)是通過(guò)串行RT-PCR測(cè)試最終確認(rèn)的COVID-19感染診斷。
非對(duì)稱胸部CT檢測(cè)COVID-19感染的敏感性為98%,該論文中顯示了病例的CT特征是顯示出彌漫性或焦玻璃混濁。Xie等人和Bernheim等人的研究都表明,胸部CT毛玻璃渾濁形態(tài)是該疾病的特征,尤其是雙側(cè)和周?chē)暮喜⑿苑位鞚?。研究人員指出,隨著癥狀發(fā)作時(shí)間的延長(zhǎng),疾病的嚴(yán)重程度也隨之增加,并且描述了后來(lái)的疾病征兆,包括更大的肺部受損,線性混濁等等。有28%的早期患者,76%的中度患者和88%疾病晚期患者有雙側(cè)肺部受損現(xiàn)象。
這些最新研究表明,一旦做出使用胸部CT即可對(duì)患者進(jìn)行診斷或篩查的決定,則需要迅速判斷非常大量的影像學(xué)圖像。人工智能技術(shù),尤其是深度學(xué)習(xí)圖像分析工具,則可以被開(kāi)發(fā)來(lái)幫助放射科醫(yī)生進(jìn)行數(shù)據(jù)的分類(lèi),量化和趨勢(shì)分析。AI解決方案有可能并行分析多個(gè)病例,以檢測(cè)胸部CT是否顯示出肺部任何異常。如果該軟件表明明顯增加了疾病的可能性,則可以將該病例標(biāo)記出來(lái),以供放射科醫(yī)生或臨床醫(yī)生進(jìn)行進(jìn)一步檢查,以進(jìn)行可能的治療/隔離。
開(kāi)發(fā)深度學(xué)習(xí)算法通常需要下面幾個(gè)階段:一、數(shù)據(jù)收集階段,其中包括需要從預(yù)定義的類(lèi)別中收集大量數(shù)據(jù)樣本;需要專家對(duì)數(shù)據(jù)進(jìn)行注釋;二、訓(xùn)練階段,其中收集的數(shù)據(jù)用于訓(xùn)練網(wǎng)絡(luò)模型。每個(gè)類(lèi)別都必須有足夠的代表性。在此訓(xùn)練階段,將自動(dòng)生成大量的網(wǎng)絡(luò)參數(shù)(通常為數(shù)百萬(wàn)個(gè))。三,測(cè)試階段,其中將未在訓(xùn)練中使用的另一組數(shù)據(jù)提供給網(wǎng)絡(luò),并對(duì)網(wǎng)絡(luò)的輸出進(jìn)行統(tǒng)計(jì)測(cè)試,以確定其是否分類(lèi)成功。
由于新病毒的樣本數(shù)據(jù)非常有限,因此,本文的假設(shè)是,可以利用修改和調(diào)整現(xiàn)有AI模型并將其與臨床理解相結(jié)合的來(lái)快速開(kāi)發(fā)基于AI的工具。我們的目標(biāo)是開(kāi)發(fā)基于深度學(xué)習(xí)的自動(dòng)CT圖像分析工具,并證明它們可以使冠狀病毒患者與未患疾病的患者區(qū)分開(kāi),從而為疾病的檢測(cè)、量化和跟蹤提供支持。
方法
本文提出的系統(tǒng)具有輸入胸部CT圖像并標(biāo)記懷疑具有COVID-19病例的功能。此外,對(duì)于分類(lèi)為陽(yáng)性的病例,系統(tǒng)會(huì)輸出肺部異常定位圖和測(cè)量值。圖1顯示了開(kāi)發(fā)系統(tǒng)的框圖。
該系統(tǒng)由幾個(gè)組件組成,并在兩個(gè)不同的級(jí)別上分析CT病例:子系統(tǒng)A:使用現(xiàn)有的SOTA算法對(duì)結(jié)核和焦?jié)崆闆r的病例體積進(jìn)行3D分析,而子系統(tǒng)B:對(duì)每個(gè)切片,用最新開(kāi)發(fā)的2D分析來(lái)檢測(cè)和定位更大范圍的彌漫性混濁,包括臨床上已描述為冠狀病毒表現(xiàn)的毛玻璃態(tài)。對(duì)于子系統(tǒng)A,本文使用商用軟件來(lái)檢測(cè)3D肺部容積內(nèi)的結(jié)節(jié)和小混濁。該軟件是作為肺部病理學(xué)檢測(cè)解決方案而開(kāi)發(fā)的,可提供定量測(cè)量(包括體積測(cè)量,軸向測(cè)量RECIST,HU值,鈣化檢測(cè)以及固體,亞固體和GG的質(zhì)構(gòu)表征)。由于毛玻璃混濁(GGO)在最近的研究中已經(jīng)成為COVID-19的關(guān)鍵特征之一,因此作者假設(shè)現(xiàn)有軟件可以檢測(cè)出病例中較小尺寸的病灶。
在圖2(A)中可以看到一個(gè)例子:顯示了兩個(gè)冠狀病毒病例,其中混濁現(xiàn)象相對(duì)較弱。除了檢測(cè)異常外,還提供了測(cè)量和定位結(jié)果。在每種情況下,該軟件都會(huì)檢測(cè)單個(gè)不透明的焦點(diǎn),并顯示檢測(cè)到的不透明度的圖像及其分割結(jié)果。最后,會(huì)自動(dòng)生成并提供病變特征列表。
由于當(dāng)前的肺病理學(xué)檢測(cè)解決方案是專門(mén)針對(duì)結(jié)節(jié)檢測(cè)任務(wù)而構(gòu)建的,因此不能依靠它們來(lái)檢測(cè)更多彌散性的混濁結(jié)節(jié)。因此作者在每個(gè)切片的基礎(chǔ)上提出了一種數(shù)據(jù)驅(qū)動(dòng)的解決方案,如圖1子系統(tǒng)B所示。
在本文的解決方案(B)中,第一步是肺劃分階段:本文使用肺分割模塊提取感興趣的肺區(qū)域(ROI),分割步驟使得能夠去除與肺內(nèi)疾病的檢測(cè)無(wú)關(guān)的圖像部分。在接下來(lái)的步驟中,作者專注于檢測(cè)冠狀病毒相關(guān)的異常:本文使用Resnet-50-2D深度卷積神經(jīng)網(wǎng)絡(luò),與醫(yī)學(xué)成像領(lǐng)域一樣,本文進(jìn)一步微調(diào)網(wǎng)絡(luò)參數(shù)以解決當(dāng)前的問(wèn)題,每個(gè)切片將病例注釋為正常(n = 1036)與異常(n = 829)。為了克服數(shù)量有限的情況,本文采用了數(shù)據(jù)增強(qiáng)技術(shù)(圖像旋轉(zhuǎn),水平翻轉(zhuǎn)和裁剪)。在后續(xù)異常檢測(cè)步驟中,給定一個(gè)新切片,將其分類(lèi)為陽(yáng)性,本文提取了“網(wǎng)絡(luò)激活圖”,該圖對(duì)應(yīng)于最有助于網(wǎng)絡(luò)決策的區(qū)域。
圖2(B)顯示了四個(gè)分類(lèi)為異常的COVID-19切片示例結(jié)果。頂部是CT圖像。底部是相應(yīng)的彩色地圖。紅色表示網(wǎng)絡(luò)權(quán)重最大,而藍(lán)色表示最弱。我們注意到,這有力地表明該網(wǎng)絡(luò)學(xué)習(xí)到了與COVID-19表現(xiàn)形式相關(guān)的重要特征。
為了提供完整的案例回顧,我們結(jié)合了子系統(tǒng)A-3D分析和子系統(tǒng)B-2D切片級(jí)別的輸出。在圖3中,我們看到了一個(gè)冠狀病毒病例,并且所提出的系統(tǒng)的合并輸出結(jié)果圖也是如此。我們可以看到綠色的結(jié)節(jié)性和局灶彌漫性不透明度的檢測(cè),紅色的則是較大的不透明度檢測(cè)。這兩個(gè)子系統(tǒng)相互補(bǔ)充,并且在某些位置相互增強(qiáng)。
除了可視化之外,系統(tǒng)還會(huì)自動(dòng)提取多個(gè)感興趣的輸出,包括每個(gè)切片的不透明度(2D)定位以及整個(gè)肺部不透明度的3D體積表示。
本文還提出了Corona評(píng)分,該評(píng)分是對(duì)不透明部分的體積度量。它是通過(guò)網(wǎng)絡(luò)激活圖的體積總和來(lái)計(jì)算的,該分?jǐn)?shù)對(duì)切片厚度和像素間距也具有魯棒性。對(duì)于患者疾病的進(jìn)展監(jiān)測(cè),作者建議使用相對(duì)Corona評(píng)分,其中利用第一個(gè)時(shí)間點(diǎn)計(jì)算的評(píng)分將Corona評(píng)分歸一化。
結(jié)果
作者做了一系列實(shí)驗(yàn)來(lái)闡明該自動(dòng)分析工具的性能。
1、分類(lèi)
作者使用了10%的中國(guó)數(shù)據(jù)集作為測(cè)試集,主要測(cè)試了對(duì)冠狀病毒的檢測(cè)和辨別能力。當(dāng)閾值1.1%(檢測(cè)到的陽(yáng)性切片與肺切片的陽(yáng)性百分比),可取得98.2%的病例水平敏感性和92.2%的特異性。而閾值為1.9%時(shí),則會(huì)有96.4%的靈敏度和98%的特異性。
2、經(jīng)過(guò)一段時(shí)間的評(píng)估
在作者最后的實(shí)驗(yàn)中,評(píng)估了在病毒初次發(fā)作(發(fā)燒、咳嗽)后1-4天進(jìn)行了第一次CT掃描的時(shí)間點(diǎn)成像的患者。
圖5跟蹤了冠狀病毒患者中特定混濁度隨著時(shí)間推移的結(jié)果(紅色框)。
圖6顯示了另一例冠狀病毒患者的完整過(guò)程,該患者在整個(gè)疾病過(guò)程中均進(jìn)行了三次CT掃描。
關(guān)于具體的實(shí)驗(yàn)參數(shù),可以詳見(jiàn)論文。
本文來(lái)自微信公眾號(hào):AI科技大本營(yíng)(ID:rgznai100),作者:Ophir Gozes, Maayan Frid-Adar等,譯者:劉暢
寬泛科技專注為人工智能、邊緣計(jì)算、影視后期、動(dòng)漫設(shè)計(jì)、商務(wù)應(yīng)用等領(lǐng)域,
提供基于人臉識(shí)別、深度學(xué)習(xí)、視覺(jué)計(jì)算、VR/AR/MR、桌面虛擬化、
數(shù)據(jù)存儲(chǔ)及數(shù)據(jù)可視化、視訊會(huì)議等信息化解決方案及服務(wù)。
如果您有合作需求或?qū)氋F建議,歡迎來(lái)信。
郵箱:hezuo@kuanfans.com
合作熱線:(021) 5415 5559