謝穎夫:數字驅動下的人工智能在醫(yī)療行業(yè)的應用實踐
隨著智慧醫(yī)療的快速發(fā)展,基于醫(yī)療行業(yè)數字化、智能化及資源整合的需求,人工智能等新興科技在醫(yī)療行業(yè)的應用程度越來越高。在CHIMA 2019大會上,云南省第一人民醫(yī)院信息中心主任謝穎夫以案例的形式,詳細介紹了人工智能在醫(yī)療行業(yè)的應用。
以下內容根據謝穎夫主任演講內容整理。
今天匯報的內容包括四個方面:一是大數據驅動的智慧醫(yī)療;二是智慧醫(yī)療的建設思路;三是案例介紹——研究應用的系統(tǒng);四是可穿戴智能健康技術。
人工智能可用于計算機視覺、自然語言理解與交流、認知與推理、機器人學、博弈與倫理以及機器學習等領域。
介紹一個案例:一只烏鴉給我們的啟示,烏鴉是完全可以自主的智能,可進行感知、認知、推理、學習和執(zhí)行。烏鴉自己把一件事通過少量數據想清楚,沒人教它。而烏鴉的頭不到人腦的1%。人腦的功耗大約是10到20瓦,烏鴉只有0.1到0.2瓦,就能夠實現這個功能。這給硬件芯片設計者提出了挑戰(zhàn)和思路。視覺芯片VPU,應該比后來的GPU更超前。
烏鴉認知的過程就是任務塑造智能。同樣是在概率統(tǒng)計的框架下,當前很多深度學習方法,屬于一個被稱作“大數據、小任務范式”,在這個階段需要做很多大數據的工作。開展人工智能工作,如果基礎數據沒有做好是非常困難的。
一、大數據驅動的智慧醫(yī)療
先匯報第一部分:數據驅動的醫(yī)療人工智能。當前,醫(yī)療大數據迎來爆發(fā)式增長,醫(yī)療行業(yè)在智能產業(yè)中占比顯著,達30%;醫(yī)療數據量每年以48%的速度在增長,是增速最快的行業(yè)之一,從2009年到2020年醫(yī)療數據增長將達44倍,預計到2020年,中國醫(yī)療大數據應用市場規(guī)模將達到80億元。
醫(yī)療人工智能具有以下特征:數據體量巨大,2018年全國診療人次達到84.2億,產生診療數據30000TB,每個CT圖像含有150M數據,每個標準病理圖片接近5GB;數據的增長和處理速度快,醫(yī)療大數據每年以>45%的速度增長,診療過程中的檢查檢驗結果需第一時間呈現;數據的價值密度低、應用價值高,醫(yī)學影像信息中幾百兆數據量的有用信息可能僅有幾個片段,比如:大量的傳染病監(jiān)測數據中敏感信息少;數據結構多樣,包括結構化數據、非結構化數據和醫(yī)療影像數據。
二、智慧醫(yī)療的建設思路
眾所周知,建立智慧醫(yī)療的目的之一是打通醫(yī)患、醫(yī)療機構、醫(yī)療設備之間的關聯(lián),建立全民健康信息平臺,利用人工智能技術,達到信息共享和充分利用的目的。
在政策層面,國務院印發(fā)了新一代人工智能發(fā)展規(guī)劃,對此,云南省積極響應。作為全省八大重點產業(yè)之一的生物制藥和大健康在政策引導下,做了很多實事,包括為基層提供一些輔助診療,如遠程芯片、人工智能技術、肺結核篩查等。全省智慧醫(yī)療的建設目標是以“大數據”為驅動力,建設以“智慧醫(yī)院”為主,“智慧服務”、“智慧管理”為輔的醫(yī)療平臺,實現云南省可服務于邊疆地區(qū)的一體化“智慧醫(yī)療”體系建設,使醫(yī)療資源最大化,推動這一目標的落地需要人工智能、物聯(lián)網、云計算、邊緣計算等核心技術提供支撐。
三、案例介紹——研究應用的系統(tǒng)
在開展案例方面,我們第一個做的是肺癌篩查+人工智能處理。2006年,神經網絡領域專家GeoffreyHinton教授在《Science》雜志上發(fā)表論文,首次提出“深度信念網絡”的概念,即深度學習。其實,深度學習是機器學習中的一個分支,它最重要的應用是神經網絡。近年來,很多企業(yè)和創(chuàng)業(yè)公司也開始用深度學習進行醫(yī)療行業(yè)的應用,比如病理學、腫瘤學、醫(yī)學影像學等。相對于醫(yī)學影像數據的增加,當前放射科醫(yī)生仍然非常缺乏,特別是邊遠山區(qū)的基層衛(wèi)生院非常缺乏影像人才,因此人工智能的應用有比較光明的前途,甚至在某些點上用途非常大。人工智能的理論和技術發(fā)展在自然圖像識別上已相對成熟,以深度學習為主的人工智能技術已在包括人臉識別、物體檢測等領域開展。醫(yī)學影像的數據特點非常適合人工智能來處理。
目前,肺結節(jié)具有發(fā)生率高、復查率高、對比復查要求高、閱讀耗時、人工易疲勞等特點,各大醫(yī)院在高負荷工作的情況下,個體診斷準確度參差不齊、漏診率高。應用AI輔助檢測可以幫助醫(yī)生在數百張CT片中尋找肺結節(jié),并進行標注、測量體積,判斷結節(jié)的形態(tài)和性質,最后自動生成結構化報告,從而在1-2分鐘內完成一個患者的診斷工作,大幅提升醫(yī)生的工作效率。
我們還做了基于機器學習的心血管疾病的診療系統(tǒng)。它是以心血管病為例,在醫(yī)生診斷的基礎上用計算機模擬一遍診療過程。該系統(tǒng)的實施有四個部分:一是病癥采集,對病人的門診病例、醫(yī)學影像、生理化驗等數據的收集整合,并進行預處理;二是預后評估,根據病人的后期隨訪記錄,對病人的康復情況進行合理評估;三是診療方案推薦,對診斷出相同疾病的病人數據進行聚類分析,將相同病疾病類型的病人劃歸到一個簇中,并且選擇高置信度的診療方案推薦給患者和醫(yī)生;四是病癥診斷,針對不同類型的數據采用不同的診斷分類模型,并采用集成學習的方法對得到的多個診斷分類模型進行加權集成。
我們收集的患者數據不但是影像數據,還有電子病歷數據。根據數據多樣性、非平衡性、高噪聲和復雜性等特征,采用隨機森林作為分類方法,通過對多個訓練子集進行訓練,得到多個不同的分類模型。我院通過篩選電子病歷中的各項數據,挑選可用的醫(yī)療數據,對所選擇的特征進行特征聚類,計算每個類別的聚類中心,新的醫(yī)療數據則根據與聚類中心的距離歸類,找到醫(yī)囑手術表中對應的患者的診療方案,根據預備的閥值篩選診療方案,其中推薦的手術可分別設置不同的閥值以便獲得更適合患者的推薦診療方案。
利用心血管病人相關歷史病程波形數據,結合非監(jiān)督學習中聚類算法對相關病例進行聚類,并關聯(lián)歷史診斷病例信息,建立病情嚴重程度分級模型。得到病情分級類簇中心之后,運用K近鄰算法將采集到病人的生理波形數據的“壓縮特征”與其進行匹配,不僅可以對當前病人病情進行合理的分級及病程的大粒度監(jiān)控,通過類簇中關聯(lián)的歷史診斷及康復記錄,還將為醫(yī)護人員對病人愈后康復幾率的預判提供重要參考。
四、可穿戴智能健康技術
當前,可穿戴的智能健康技術的應用也越來越廣泛。它是基于移動物聯(lián)網的智慧醫(yī)療,通過連接大量移動可穿戴設備,對海量個人健康數據進行智能采集、融合、分析、管理和挖掘,并提供相應的個性化醫(yī)療健康服務。我們做了一套基于病人完整醫(yī)療信息的四維病人生理化平臺,可以設計成病人終身的伴侶,隨著傳感器的增加,它可以利用定位技術采集病人的體位和活動信息,并支持連接市場上最新的可傳感設備收集數據。
人工智能的未來方向在哪?無論是知識圖譜還是當下的深度學習訓練,大都是基于概率統(tǒng)計理論,這個核心沒有變。我認為未來人工智能發(fā)展的方向是模糊邏輯,甚至是動態(tài)模糊邏輯,這是解決目前人工智能遇到瓶頸的技術之一。同時,人工智能的發(fā)展依然處于非常初級的階段,現狀是“沒有人工,就沒有智能”。
我們把人工智能看成一棵大樹,有人說爬到大樹上看月亮和站在地上看月亮,哪個更近,似乎沒有區(qū)別。然而并不妨礙我們給這棵大樹澆水施肥,讓我們懷著一個共同的夢想,這棵樹終有一天可以長到月亮上去。
現在的深度學習體系,如果某一個值微小的擾動,就會改變很大。解決之道就是模糊邏輯,或者是動態(tài)模糊邏輯,這塊可能是未來發(fā)展的方向。