17.四川大學華西二院:大數據及人工智能方法在妊娠期糖尿病預測的應用【CHIMA 2019案例分享】
案例提供:四川大學華西第二醫院
病案概要
現今全面二孩政策的放開,35歲以上的高齡孕婦將逐年增多,患上妊娠糖尿病的風險系數也進一步加大。近幾年孕婦體檢數據來看,患有妊娠期糖尿病的人數越來越多,不少學者已對妊娠期糖尿病的誘發因素進行了研究,但這些研究方法基本局限于經典統計范疇,主要基于兩組病例進行對照統計分析研究,還無法對妊娠期糖尿病進行有效的預測分析。此外,妊娠期糖尿病篩查時間為妊娠 24~28周,該篩查方案難以滿足早期預測及干預的需求。因此,本次研究采用現代人工智能方法,在妊娠早期有效預測患者妊娠期糖尿病的發病概率,為早期提出干預措施提供了相應的參考依據。
服務對象
本案例的核心是利用數據推動醫院對yu孕婦妊娠期糖尿病提前預測,并制定針對性的策略,減少孕婦發生妊娠期糖尿病。服務對象包括:面向孕婦。
解決問題
運用大數據分析技術,在前期找到孕婦患妊娠期糖尿病高危人群,并根據孕婦的檢測指標經過規范化的醫學營養治療和運動干預,大部分的血糖是可以達標的。
特色及亮點
1.首次采用孕婦建卡數據進行妊娠期糖尿病預測,具體操作如下:
以本院2013~2016年建卡并定期產前檢查的孕婦資料為分析樣本,選用孕婦在妊娠第12周的檢查數據進行建模分析。采用末次月經時間在2013年10月1日到2016年1月31日的妊娠期糖尿病患者和非妊娠期糖尿病孕婦為建模訓練數據,共計5834 人,確診妊娠期糖尿病患者798人。選用末次月經時間在2016年2月1日到2016年5月19日的妊娠期糖尿病患者和非妊娠期糖尿病孕婦進行跨期檢驗,共計706人,其中確診妊娠期糖尿病患者117人。以懷孕24~28周是否確診糖尿病為預測目標,如確診糖尿病則標注為1,正常則標注為0。采集孕婦診斷數據和化驗指標進行預測分析并找到高度相關指標。
2.找到影響妊娠期糖尿病發病的相關因素,具體解釋如下:
利用多種機器學習算法建模對孕婦在第12周檢查的生化指標以及孕婦建檔數據進行分析,比較發現TreeNet算法預測效果最佳。通過TreeNet算法發現孕婦的空腹血糖、分娩年齡、孕12周的前白蛋白水平、孕12周的體質指數等指標與妊娠期患糖尿病高度相關,整體跨期驗證確診率達64%以上。并使用 CART 算法找到了一組患妊娠期糖尿病高風險人群的規則特征。通過模型發現37個與妊娠期糖尿病相關的指標,其中4個孕婦早期指標空腹血糖、分娩年齡、前白蛋白、體質指數與妊娠期糖尿病高度相關;發現的分娩年齡和體質指數與妊娠期糖尿病風險相關的規律與臨床經驗一致;發現的生化指標前白蛋白在 GDM 的臨床上一直未被關注,但最新的研究發現前白蛋白與糖尿病有某種關聯性。
成果成效
本項研究是首次基于大數據及人工智能方法建立妊娠期糖尿病預測模型,找到易發妊娠期糖尿病孕婦群體,并針對易發孕婦進行提前干預,根據患者的實際情況制定預防措施,減少妊娠期糖尿病發生概率,達到早期預防目的,減少妊娠期糖尿病患病率。
下一步計劃
目前進行完畢跨期驗證,結果顯示整體準確率達到64%,下一步進行臨床隨機試驗,將孕婦隨機分成兩部分,一部分不做任何干預;另一組運用模型進行篩選高危孕婦,并對患病高危孕婦進行干預,后期在進行查看干預組與非干預組患病情況對比。