北京腫瘤醫院:基于大數據的靜脈血栓風險智能預警系統設計與建設
CHIMA 2020醫院新興技術創新應用優秀案例征集自啟動以來,獲得了業內各方的積極響應。CHIMA將陸續刊登參評案例,展示醫療信息技術科技創新應用成果。案例征集截止日期為11月5日,歡迎大家踴躍投稿。
靜脈血栓栓塞癥(VTE)包括深靜脈血栓(DVT)和肺栓塞(PTE),是導致腫瘤患者院內非預期死亡和圍手術期死亡的重要原因。VTE的提前預防、及時治療是降低VTE發病率及死亡率的重要途徑。研究指出采用圍手術期VTE預防措施后,患者的死亡率顯著下降。近年, 我國已開始重視醫院內VTE防治體系的建設和管理工作。院內VTE防治工作不僅已納入醫療質量管理和監控體系, 同時將其提高到醫院管理、醫療質量管理及患者安全管理的高度。
醫院現行VTE預防手段主要采用評估量表實現。外科采用Caprini評估量表,內科使用Padua評估量表。既往評估量表是以表單形式存在,集成在電子病歷系統中,由臨床醫師來評估。醫務管理部門要求臨床醫師對患者書寫病歷時必須進行VTE評估量表評價。量表中所有指標信息由當前醫師根據患者病情手工點選評價,系統基于醫師所點選項目自動生成VTE評分,并基于評分結果告知醫師當前患者VTE風險程度。醫師依據風險程度開展VTE預防及治療措施。傳統手工評估模式弊端在于:1、操作評價醫師需要完全掌握當前患者病情,包括各種報告。且所有指標都是由醫師根據患者病情主管判斷選擇,主管指標判斷容易產生誤差;2、費事費力,根據調研發現平均每個患者評估時間在1~2分鐘左右,影響效率;3、無法做到實時評估,VTE風險發生率高是因為患者病情在實時變化,這種情況下無法要求醫師實時根據病情進行評估;4、評估率低,醫院自2019年4月上線Caprini量表手工評估以來評估率難以突破90%。見下表:
表一 Caprini量表手工評估率
日期 | 2019年4月 | 2019年5月 | 2019年6月 | 2019年7月 |
評估率 | 11% | 40% | 53% | 87% |
基于上述醫院VTE運行現狀,結合醫院已經部署上線的醫療大數據平臺,考慮利用大數據技術,實現VTE的智能化評估與預警。
基于大數據技術的VTE風險智能預警系統主要依托醫院內部大數據平臺建設。院內大數據平臺由數據采集、數據清洗、數據匯聚、數據備份、數據導出等五部分組成,利用大數據平臺中后構化的患者醫療信息,依據評估量表分值要求,根據后結構化信息點實時計算當前患者VTE風險得分,并依據風險得分給出當前患者VTE風險程度及預防措施,并將相關得分推送到業務系統中,以便醫師隨時掌握患者病情,及時干預,進行預防及治療。總體技術方案如下:
(1)指標提取
VTE風險智能預警系統的核心在于評價指標的提取。醫院采用的是國際通用的Caprini評估量表和Padua評估量表。基于上述兩個評估量表,首先由院內VTE核心專家組明確所有評估指標的提取內容,包括指標提取文書、位置、提取方式等。
(2)評分模型訓練
在確定評價指標提取內容后,利用醫院既往已發生VTE樣本數據,采用回顧性研究方式,對明確的指標提取內容進行效果評價。評價指標至少包括:靈敏度、特異性等。本次研究使用Odd Ratio(OR值)對所有風險因素與VTE陽性的關系做單因素分析,挑選出對于發生VTE事件的OR值具有統計顯著性的風險因素。
進一步,本次研究使用了多種建模方法實驗和建立改進版VTE風險模型,具體建模方法包括:邏輯回歸(logit regression,LR),樸素貝葉斯(Na?ve Bayes),決策樹(Decision Tree),XGBoosting,神經網絡(Neural Network)。目前這些模型還在根據數據變動持續迭代、改進中,以期獲得越來越好的預測效果。
表二 不同模型驗證結果
Model | Test AUC | Train AUC |
Logit Regression | 0.7409 | 0.7457 |
Naive Bayes | 0.5088 | 0.5042 |
Decision Tree | 0.5071 | 0.7624 |
XGBoosting | 0.7998 | 0.8342 |
Neural Network | 0.7915 | 0.7918 |
Caprini Model | 0.5847 |
在上述表格中,神經網絡和XGboosting獲得了較好的結果,但是這兩種模型欠缺可解釋性,不利于在臨床應用中向醫生說明預測依據。而邏輯回歸雖然效果略遜于神經網絡,但明顯優于Caprini模型,同時兼具可解釋性,更適合臨床應用。
(3)業務設計
基于回顧性樣本數據,不斷完善模型,待模型確認準確后,開發基于模型的VTE風險評估系統。系統基于模型從業務系統實時抓取數據評估,只要業務系統數據發生變化,評估系統就要從新計算分數,評估風險程度。
同時評估系統將評分回寫到業務系統,并在業務系統前端展示提醒。為保證VTE風險評估系統初期能夠上線成功,所有回寫業務系統數據僅設置回寫一次的需求。即外科采用Caprini評估量表在術后24小時內回寫業務系統一次評估數據。內科采用Padua評估量表在入院24小時內回寫業務系統一次評估數據。但在評估系統中上述兩種評估量表都是根據業務系統數據變化實時評估分數。
為確保VTE評估分數醫師接收到,特在業務系統加入了VTE評估結果確認功能,即醫師在業務系統看到評分結果后,必須點擊VTE評估明細查看系統評分結果內容,并對結果進行確認,以表示醫師已接收到該評估結果。醫師在確認評估結果同時也可以對評估內容進行調整,包括機器可能漏評、誤評內容等。系統會將醫師確認結果保存。這樣在評估系統中會存在兩種數據集,即一種機器依據患者資料自動生成的評估內容及結果,一種醫師依據機器評估完后修正的評估內容及結果。系統上線初期會將兩種評估結果數據集實時反饋給醫務管理人員,由醫務管理人員依據患者真實病歷資料對上述評估數據集進行差異分析。如差異由醫師產生則通過管理手段反饋臨床醫師人員。如差異由機器產生,則分析差異指標詳細情況,并修改對應指標邏輯計算方法,調整機器運算模型,提高對應指標后期準確率。
評估系統上線后,臨床評估率達到了100%,實現所有患者全評估,但后續發現部分患者評估后,臨床醫師未對結果進行確認。所以系統在后期加入了質控功能,即將VTE評估結果是否確認納入臨床病歷時限監控管理,并整合到科室績效考核,以提升評估后的醫師確認率。
本系統自2019年3月開始建設,截止2019年11月,已完成建設內容包括:VTE風險評估機器學習模型、外科版VTE風險智能預警系統、內科版VTE風險智能預警系統。
系統基于大數據平臺的基礎,外科版對caprini評估表中22個危險因素進行自動提取和結構化,實現所有外科患者術后自動評分。內科版對padua評估表中10個危險因素實現自動提取和結構化。實現所有內科患者術后自動評分。
基于系統運行數據發現,原基于表單點選式VTE風險評估單個患者評價時間在1~2分鐘左右,基于大數據的VTE風險評估實現了實時動態評估,醫師確認評估結果時間在3~5秒左右。Caprini評估表評估率也由系統上線前的40%~60%上升到100%。在上線評估確認質控功能后,VTE評估后的醫師確認率也由上線初期的60%上升到96%左右。
目前該系統我院已申請了軟件著作權《靜脈血栓栓塞癥智能預警系統》。
VTE風險智能預警系統是一個非常實用的可應用于臨床VTE防治工作和提高VTE管理水平的臨床工具。目前我院基于VTE風險智能預警系統也在深入開展二期工作,包括:1、實現VTE風險智能預警實時推送業務系統提醒;2、與移動端整合,融入醫院移動端系統,實現移動提醒;3、完善VTE提醒后的預防治療數據追蹤,包括是否給予物理預防、藥物預防及藥物治療等;4、加入隨訪,形成完成的VTE防治數據庫。
申報單位:
北京大學腫瘤醫院
參選方向:
人工智能創新應用
掃碼圖片二維碼可申報案例,歡迎大家踴躍投稿