點(diǎn)內(nèi)科技:基于3D深度學(xué)習(xí)自動(dòng)預(yù)測(cè)肺腺癌EGFR突變狀態(tài),預(yù)測(cè)精準(zhǔn)度超過傳統(tǒng)影像組學(xué)
點(diǎn)內(nèi)科技與多單位聯(lián)合研究成果《基于3D深度學(xué)習(xí)自動(dòng)預(yù)測(cè)肺腺癌EGFR突變狀態(tài)》登上Cancer Medicine封面。
2019年7月,國(guó)際期刊CancerMedicine以封面文章的形式,刊登了點(diǎn)內(nèi)科技、復(fù)旦大學(xué)附屬華東醫(yī)院、上海交通大學(xué)等多單位的最新聯(lián)合研究成果,《基于3D深度學(xué)習(xí)自動(dòng)預(yù)測(cè)肺腺癌EGFR突變狀態(tài)》,研究顯示預(yù)測(cè)精準(zhǔn)度超過傳統(tǒng)影像組學(xué)。
基于3D深度學(xué)習(xí)自動(dòng)預(yù)測(cè)肺腺癌EGFR突變狀態(tài),預(yù)測(cè)精準(zhǔn)度超過傳統(tǒng)影像組學(xué)
肺癌是腫瘤相關(guān)死亡的首因[1],肺癌患者中80%為非小細(xì)胞肺癌(NSCLC),腺癌為其最常見的病理類型[2]。近數(shù)十年來基于基因組學(xué)而發(fā)展的針對(duì)驅(qū)動(dòng)基因的靶向治療,如靶向特定表皮生長(zhǎng)因子受體(EGFR)突變的酪氨酸激酶抑制劑(TKI)吉非替尼、靶向ALK基因的TKI 克唑替尼等,已成為肺癌精準(zhǔn)醫(yī)學(xué)不可或缺的重要組分[3]。然而,對(duì)于無EGFR突變或非ALK陽性的肺癌患者,靶向治療卻并無臨床獲益,有時(shí)還可能導(dǎo)致PFS縮短以及不必要的醫(yī)療支出[4],因此,選擇靶向藥物前需要提前明確驅(qū)動(dòng)基因狀態(tài)。此外,EGFR TKI治療期間可能出現(xiàn)EGFR T790突變而導(dǎo)致耐藥,出現(xiàn)病情進(jìn)展,因此,也需要?jiǎng)討B(tài)監(jiān)測(cè)相關(guān)基因的突變狀態(tài)以調(diào)整治療藥物[5]。
對(duì)活檢或外科手術(shù)切除后的樣本進(jìn)行突變檢測(cè)是明確EGFR突變類型的標(biāo)準(zhǔn)手段,但取樣的侵入性、為監(jiān)測(cè)治療所必須的反復(fù)取樣等問題,以及DNA質(zhì)量不佳、腫瘤異質(zhì)性、患者床位周轉(zhuǎn)時(shí)間、檢測(cè)費(fèi)用等諸多難題限制了分子檢測(cè)的推廣,也一定程度上影響了肺癌精準(zhǔn)醫(yī)療在臨床實(shí)踐中的推廣規(guī)模[6-9]。
腫瘤的表型源于特定的基因型,因此,通過甄別特定表型來預(yù)測(cè)基因型是一種潛在可行的手段。已有研究顯示,特定的影像組學(xué)特征與EGFR突變類型相關(guān)[10,11]。然而,傳統(tǒng)影像組學(xué)面臨諸多挑戰(zhàn),如在檢測(cè)、分隔、提取特征等過程中大量依賴手工操作,費(fèi)時(shí)費(fèi)力;不同讀片者之間的可復(fù)制性較低。
近年來以深度卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)在醫(yī)學(xué)圖像計(jì)算方面顯示出令人難以置信的優(yōu)越表現(xiàn),并在很大程度上降低了人工操作的必要性。此前,點(diǎn)內(nèi)科技聯(lián)合復(fù)旦大學(xué)附屬華東醫(yī)院和上海交通大學(xué)SJTU-UCLA機(jī)器感知與推理聯(lián)合研究中心等利用3D深度學(xué)習(xí)技術(shù),成功證明了3D深度學(xué)習(xí)在預(yù)測(cè)肺腺癌侵襲性方面的有效性和效能,準(zhǔn)確率高達(dá)88%[12]。受其鼓舞,點(diǎn)內(nèi)科技再次與華東醫(yī)院李銘、Hua Yanqing團(tuán)隊(duì)、以及上海交通大學(xué)SJTU-UCLA機(jī)器感知與推理聯(lián)合研究中心、上海第十人民醫(yī)院、同濟(jì)大學(xué)同濟(jì)醫(yī)院等合作,探索了3D深度學(xué)習(xí)在基于CT影像預(yù)測(cè)EGFR突變方面的潛能。研究結(jié)果近期發(fā)表于 Cancer Medicine (IF=3.2,TowardautomaticpredictionofEGFR mutationstatusinpulmonaryadenocarcinomawith3Ddeeplearning),華東醫(yī)院李銘、滑炎卿教授為論文的共同通訊作者,華東醫(yī)院趙偉和上海交大楊健程為共同第一作者。
研究流程
研究的影像數(shù)據(jù)來自華東醫(yī)院CT數(shù)據(jù)庫(HdH數(shù)據(jù)庫579例,包括訓(xùn)練集348例、開發(fā)集116例和測(cè)試集115例)。為測(cè)試所建模型的通用性,從獨(dú)立的腫瘤公共影像庫TCIA選取37例肺結(jié)節(jié)也作為測(cè)試集。全部病例均由人工進(jìn)行定位、分割和標(biāo)記EGFR突變/野生型狀態(tài)。通過訓(xùn)練集采用3D DenseNets深度學(xué)習(xí)方法訓(xùn)練,采用強(qiáng)大的數(shù)據(jù)擴(kuò)增技術(shù)mixup以提升規(guī)范化/正則化(regularization),通過有監(jiān)督的端到端學(xué)習(xí)模型完成擬合。與此同時(shí),對(duì)全部影像數(shù)據(jù)進(jìn)行傳統(tǒng)的影像組學(xué)分析,與3D深度學(xué)習(xí)對(duì)照,計(jì)算成對(duì)關(guān)聯(lián)系數(shù)分析二者的關(guān)聯(lián)性。
結(jié)果顯示,3D深度學(xué)習(xí)在預(yù)測(cè)EGFR突變狀態(tài)方面明顯優(yōu)于傳統(tǒng)的影像組學(xué)方法(P=0.021),3D深度學(xué)習(xí)對(duì)HdH數(shù)據(jù)庫測(cè)試集和公共測(cè)試集測(cè)試的AUC分別為75.8%和75.0%(表1)。更重要的是,不同于傳統(tǒng)影像組學(xué)要求人工對(duì)感興趣的病灶部位進(jìn)行分割,非常耗時(shí)耗力,3D深度學(xué)習(xí)的興趣部位與肺結(jié)節(jié)病變部位有良好的一致性。
研究者對(duì)提取的401個(gè)傳統(tǒng)影像組學(xué)特征(上圖A)與從3D DenseNets提取的114個(gè)深度學(xué)習(xí)影像組學(xué)特征(上圖C)進(jìn)行分析發(fā)現(xiàn),3D深度學(xué)習(xí)方法提取的特征較通過人工提取的特征更具代表性,因此聚類分析的結(jié)果更佳。研究首次用矩陣的方法進(jìn)一步比較了深度學(xué)習(xí)特征與傳統(tǒng)影像組學(xué)特征(上圖B),分析發(fā)現(xiàn),深度學(xué)習(xí)特征與傳統(tǒng)影像學(xué)之間存在著強(qiáng)關(guān)聯(lián),從分類性能的ROC曲線方面,深度學(xué)習(xí)特征的敏感性和特異性更高,這說明深度學(xué)習(xí)通過增強(qiáng)的影像組學(xué)方式,從魯棒性(robustness)、緊密度(compactness)和表達(dá)能力(expressiveness)方面可以發(fā)揮強(qiáng)大的預(yù)測(cè)效能。
深度學(xué)習(xí)系統(tǒng)在各數(shù)據(jù)庫的預(yù)測(cè)表現(xiàn)匯總
研究者發(fā)展的這一深度學(xué)習(xí)體系實(shí)現(xiàn)了非侵入性、自動(dòng)預(yù)測(cè)肺腺癌EGFR突變型,從而通過明確EGFR靶向治療的獲益人群,輔助肺腺癌的臨床治療決策。研發(fā)過程中整合了近期關(guān)于深度監(jiān)督學(xué)習(xí)的一些進(jìn)展,比如深度連接、mixup技術(shù)等,從而顯著降低了過度擬合等風(fēng)險(xiǎn)。由于這一方法因無需對(duì)肺結(jié)節(jié)進(jìn)行精細(xì)的分隔,因此非常節(jié)省勞動(dòng)力,同時(shí),因?yàn)椴捎玫膶W(xué)習(xí)算法的增強(qiáng)特性,可望獲得更加穩(wěn)定的表現(xiàn)。
研究者稱,未來還需進(jìn)一步對(duì)成果進(jìn)行驗(yàn)證,比如本研究EGFR突變是通過ARMS-PCR檢測(cè)的,未來還需對(duì)有二代測(cè)序的EGFR突變數(shù)據(jù)的樣本進(jìn)行驗(yàn)證;目前的模型僅納入了CT影像信息,未來還需整合更多的臨床信息如病理、血檢驗(yàn)結(jié)果、蛋白組學(xué)等。
2019年7月刊 CancerMedicine封面
關(guān)于點(diǎn)內(nèi)科技
點(diǎn)內(nèi)科技成立于2016年4月,是一家創(chuàng)新型高科技企業(yè),總部位于中國(guó)上海。公司核心管理團(tuán)隊(duì)均來自世界500強(qiáng)制藥及醫(yī)療設(shè)備企業(yè);核心技術(shù)團(tuán)隊(duì)實(shí)力雄厚,多位核心研究人員為國(guó)家中組部千人計(jì)劃成員和美國(guó)科學(xué)家榮譽(yù)協(xié)會(huì)( Sigma ⅪSociety)會(huì)員。
此外,公司匯聚了一批人工智能行業(yè)、深度學(xué)習(xí)領(lǐng)域及醫(yī)療行業(yè)的資深專家學(xué)者,通過國(guó)內(nèi)肺部專科醫(yī)院和大三甲醫(yī)院近50000例肺部CT數(shù)據(jù)的訓(xùn)練,將人工智能與大數(shù)據(jù)技術(shù)緊密結(jié)合,利用部署在地面端的人工智能輔助診斷系統(tǒng)和云端的智能引擎系統(tǒng),為醫(yī)生提供針對(duì)肺部結(jié)節(jié)的早期輔助診斷和治療建議的產(chǎn)品。
2017年,參加“2017天池醫(yī)療AI大賽——肺部結(jié)節(jié)智能診斷大賽”,點(diǎn)內(nèi)科技從來自全球的2887支隊(duì)伍中脫穎而出,獲得大賽第一名。
2018年8月,點(diǎn)內(nèi)科技順利獲得國(guó)家CFDA醫(yī)療器械注冊(cè)證(二類)。同年,點(diǎn)內(nèi)科技作為肺結(jié)節(jié)輔助診斷處理軟件(AI類)送檢企業(yè),參與中檢院主導(dǎo)的肺部結(jié)節(jié)標(biāo)準(zhǔn)數(shù)據(jù)庫建立以及AI產(chǎn)品相關(guān)標(biāo)準(zhǔn)制定,或?qū)⒊蔀閲?guó)內(nèi)首批獲準(zhǔn)CFDA三類注冊(cè)證的AI企業(yè)。
【參考文獻(xiàn)】
1.Bray F, Ferlay J, Soerjomataram I, Siegel RL, Torre LA, JemalA. Global cancer statistics 2018: GLOBOCAN estimates of incidenceand mortality worldwide for 36 cancers in 185 countries. CACancer J Clin. 2018;68(6):394-424.
2.Ettinger DS, Wood DE, Aisner DL, et al. Cell lung cancer, Version5.2017, NCCN Clinical Practice Guidelines in Oncology. J NatlCompr Canc Netw. 2017;15(4):504-535.
3.NCCN臨床實(shí)踐指南:非小細(xì)胞肺癌(2019.V4)
4.Mok TS, Wu Y-L, Thongprasert S, et al. Gefitinib or carboplatin-paclitaxel in pulmonary adenocarcinoma. N Engl J Med.2009;361(10):947-957.
5.中國(guó)臨床腫瘤學(xué)會(huì)腫瘤生物標(biāo)志物專家委員會(huì)《中國(guó)非小細(xì)胞肺癌患者EGFR T790M基因突變檢測(cè)專家共識(shí)》制定專家組 中國(guó)非小細(xì)胞肺癌患者EGFR T790M基因突變檢測(cè)專家共識(shí) 中華醫(yī)學(xué)雜志2018,98(32:2544-51)
6.Bedard PL, Hansen AR, Ratain MJ, Siu LL. Tumour heterogeneity in the clinic. Nature. 2013;501(7467):355-364.
7.Lindeman NI, Cagle PT, Beasley MB, et al. Molecular testing guideline for selection of lung cancer patients for EGFR and ALK tyrosine kinase inhibitors: guideline from the College of American Pathologists, International Association for the Study of Lung Cancer, and Association for Molecular Pathology. J Mol Diagn. 2013;15(4):415-453.
8.Kim TO, Oh IJ, Kho BG, et al. Feasibility of re-biopsy and EGFRmutation analysis in patients with non-small cell lung cancer.Thorac Cancer. 2018;9(7):856-864.
9.Kobayashi K, Naoki K, Manabe T, et al. Comparison of detection methods of EGFR T790M mutations using plasma, serum, and tumor tissue in EGFR-TKI-resistant non-small cell lung cancer.OncoTargets Ther. 2018;11:3335-3343.
10.Yip S, Kim J, Coroller TP, et al. Associations between somatic mutations and metabolic imaging phenotypes in non‐small cell lungcancer. J Nucl Med. 2017;58(4):569-576.
11.Rios Velazquez E, Parmar C, Liu Y, et al. Somatic mutations drive distinct imaging phenotypes in lung cancer. Can Res. 2017;77(14):3922-3930.
12.Zhao W, Yang J, Sun Y, et al.3D Deep Learning from CT Scans Predicts Tumor Invasiveness ofSubcentimeter Pulmonary Adenocarcinomas. Cancer Res. 2018 Dec 15;78(24):6881-6889.
最后,記得關(guān)注微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅(qū)動(dòng)創(chuàng)新
