衛寧健康:基于AI引擎的骨齡輔診系統
本案例獲得CHIMA 2020醫院新興技術創新應用典型案例“醫學人工智能創新應用”方向三等獎。
來自國家健康衛生領域綱領性文件《健康中國行動(2019—2030年)》的統計數據顯示:我國7~18歲城市男生和女生的肥胖檢出率已達到11.1%和5.8%,與此同時,兒童性早熟率也達到了約1%。這與我國目前小兒常見內分泌問題——兒童的長個息息相關。在臨床上,骨齡能更加準確地反映個體的生長發育水平和成熟程度。然而不同于其它技術的進步,現在的骨齡鑒定法依然使用上世紀50年代發明的方法。傳統的骨齡片研判有兩種方法:
一是G-P圖譜法。由于其使用簡便、直觀、耗時短,被國內外臨床專家廣泛采用。然而由于許多兒童手腕骨的發育不像標準片均衡,G-P法在使用過程中仍然存在主觀性及不精確性問題。
二是TW3計分法。TW3法精確但較為繁瑣,耗時長,需對橈-尺-掌指骨及腕部共20塊骨分別做8個等級的評分和計算,即便使用計算機軟件也需耗時15分鐘,臨床實際工作中難以推行。
通過本案例的建設和應用,在骨影像輸入后,基于AI引擎的骨齡輔診系統可迅速完成找骨骼、定級、判定和輸出結果。利用深度學習技術,結合TW3計分法、GP圖譜法等骨齡判讀標準,判斷每塊手骨的特征,檢測精確度可達到0.1歲,骨齡值誤差在3個月以內,從而有效規避傳統骨齡研判方法存在的弊端,快速輔助醫院完成兒童骨齡檢測,判定兒童生長發育水平和成熟度。
(1)基于深度學習的骨齡輔診系統
圖1 骨齡輔診系統
通過深度卷積神經網絡等系統,判定并勾畫出骨齡生長發育關鍵部位,提取關鍵部位骨齡影像學高維特征,實現對于兒童骨齡的精準判斷。
(2)基于自然語言處理的報告應用系統
借助機器學習技術,從復雜的碎片化醫療信息文本中,自動化、半自動化的抽取醫療語義本體及相互之間的關系,針對骨齡專科文本數據建立術語詞典,實現骨齡檢查報告文本的自動分詞;借助人工智能算法實現骨齡檢測報告文本的語義分析,實現骨齡??普Z言的實體識別和關系識別,將骨齡檢查報告轉化為結構化的指標數據;形成骨齡檢查專病指標庫,借助大數據分析手段實現骨齡檢查指標與骨齡發育情況的關聯關系模型。
(3)一體化影像采集、融合服務
圖2 影像采集、融合一體化
在本案例中,骨齡輔診系統與院內PACS、RIS系統高度整合,實現從影像采集、影像檢測、報告生成在內的一體化融合服務,整體業務流程如下:
使用DICOM3.0的標準通信協議,從PACS系統中自動獲得骨齡的X光片;
自動識別骨齡參數;
將參數和最終的骨齡判斷發送給RIS;
RIS系統將這些參數整合進入模板;
和患者等級年齡進行比較,確定骨齡是提前還是延后;
給出最終的骨齡報告;
關鍵技術或產品描述。
(1)基于CH Bone AI模型的骨齡影像識別
圖3 CH Bone AI模型處理流程
本案例進一步研發了基于整張手腕部DR影像深度學習特征的BA回歸模型,使模型自主學習手腕部影像中對BA檢測所有有益結構形態特征和區域,實現精確自動化BA預測。其中,回歸BA選用L1損失和L2損失相結合的聯合損失函數,即(L1損失平均絕對誤差<MAE>,L2損失均方誤差<MSE>,L1損失對異常數據的魯棒性較好,L2損失在靠近目標值時梯度較小、更容易訓練),參與卷積神經網絡訓練,以最小化類內特征距離和最大化類間特征距離,提高特征的鑒別能力,并避免訓練過程過慢,從而進一步提高BA影像分類識別性能和檢測效率,效果比較魯棒。
同時,本案例采用了Adam這種可以替代傳統隨機梯度下降過程的一階優化算法,實現基于訓練數據迭代地更新神經網絡權重;運用Grad-cam方法,實現根據特征圖的梯度和激活情況來顯示出模型所關注的區域。
總之,比較以往根據指定區域特征學習和預測BA模型,CH Bone AI模型實現了基于整張手腕部DR影像高階特征學習和預測BA,實現了端到端深度學習,并應用神經網絡的注意力機制,通過熱力圖實現了數據模型可視化。
圖4 驗證集
圖5 測試集
(2)基于自然語言處理的報告應用系統
借助機器學習技術,從復雜的碎片化醫療信息文本中,通過自動化、半自動化的方式抽取醫療語義本體及相互之間的關系,對骨齡檢查報告進行分詞,挖掘骨齡檢查報告分析指標,構成骨齡檢查專病指標庫,其中包括骨齡指標維護、骨齡分詞管理與維護、數據描繪和骨齡病例索引基于知識圖數據庫構建醫療本體語義網絡。
結合中國兒童骨齡分詞詞典,生成符合臨床醫生診斷模式的影像學輔助報告,放射學診斷意見。通過關聯其他數據,以及大數據挖掘和后結構化分析模塊,給出最后的骨齡年齡判斷。在這個過程中,運用了包括分詞線程、數據抽取、分詞處理等自然語言處理技術,以及包括骨齡檢測詞典在內的專業醫療詞典數據作為分詞處理的基礎支撐。
圖6 報告應用系統
在最終的檢查報告中,包括檢測部位、影像學表現和診斷結論,生成的報告可以一鍵導入RIS系統并支持修改,提升整體使用效率。
衛寧健康的骨齡檢測產品影像定位準確率達到98%。平均處理每張影像耗時0.4秒。常用評價骨齡檢測方法的指標是平均絕對誤差(MAE),MAE是指測得骨齡與臨床骨齡之差的絕對值。
上海市兒童醫院:
2017年,衛寧健康攜手上海市兒童醫院開始研發CHBoneAI模型。經過一年多的訓練、測試及驗證,在2018年初開始試運行,4月正式臨床應用。
在隨后的使用過程中經過不斷的打磨,醫生的采納率從最初的95%達到了目前的99%。同時,在上海市兒童醫院通過HIMSS 7的評審過程中,評審專家一致認為上海市兒童醫院在醫療人工智能上的探索讓人驚艷。
截止到2020年10月,共檢測121,977例病例。以每月22個工作日計算,每天約進行184例檢測。每天可以為醫生節省4,048分鐘(22分鐘*184例),一年按320天計算,全年節省1,295,360分鐘,合計約21,589小時。
通過本案例的建設和應用,在骨影像輸入后,人工智能可迅速完成找骨骼、定級、判定和輸出結果。利用深度學習技術,結合TW3計分法、GP圖譜法等骨齡判讀標準,判斷每塊手骨的特征,檢測精確度可以達到0.1歲,骨齡值誤差在3個月以內。
在未來,該項目對于中國健康兒童大樣本骨齡數據庫的建立、我國骨發育評價標準的制定、兒科醫聯體的共贏協作和健康發展等方面有著良好的促進作用和推動作用。
(1)推動中國健康兒童大樣本骨齡數據庫的建立
長期以來,我國缺乏大樣本的骨齡和身高長期追蹤觀察數據,中國健康兒童的骨齡數據庫并未建立起來。本案例建設不僅有利于提高醫院自身的學科建設和診療水平,同時也有利于建立社會公共人口健康樣本數據和信息資源,將院內涉及個人隱私信息進行脫敏處理后,為社會提供更大價值的利用,有利于推動中國健康兒童大樣本骨齡數據庫的建立,進而為中國兒童提供更全面的健康分析和更精準的醫療服務。
(2)推動我國骨發育評價標準的制定
人的骨骼生長發育受到遺傳因素、營養水平、飲食習慣、地理環境、人文環境等多重因素的影響,不同年代、不同種族和區域的兒童青少年的發育會有所不同。所以,針對不同民族和區域,應當制定相應的骨發育評價標準,并隨社會發展因素的變化及時修訂。
隨著基于AI引擎的骨齡輔助診斷應用的研發與運用,衛寧健康將和醫療機構一起共同推動建立中國兒童青少年骨齡判讀標準。
(3)促進兒科醫聯體的共贏協作和健康發展
對兒科醫聯體,以技術合作和利益共贏為紐帶,通過簽訂合作協議,建立技術支持、人員培訓、雙向轉診、遠程醫療、費用結算等制度,促使聯合體內醫療機構之間的業務協作。建立遠程會診專家團隊、建立??茍F隊、建立典型病例資料庫。通過骨齡檢測和診斷資料庫,對醫聯體內存儲的醫學影像數據、骨齡數據進行深度挖掘,為進一步提高醫聯體內醫療教學水平、科研水平提供信息支撐。