15.海南省人民醫院:基于語義分析的電子病歷智能檢索系統【CHIMA 2019案例分享】
案例提供:海南省人民醫院
由于歷史原因,醫院同時運行著過百種醫療業務信息系統,這些多源、異構的系統彼此割裂,致使各種醫療數據處于孤島狀態,無法得到有效利用。目前全國大多數醫院的電子病歷系統只解決了病歷電子化問題,沒有解決電子病歷數據的應用問題。而國家衛計委的電子病歷應用水平評價指南已明確提出,電子化之后的交換和共享以及后續數據的挖掘和應用才是決定電子病歷的應用水平的重要指標。電子病歷智能檢索系統在已有電子病歷數據的基礎上,利用機器學習和自然語言處理技術自動抓取病歷中的臨床變量,通過將患者分散在HIS、EMR、LIS、PACS等院內系統中的病歷記錄進行融合處理,以患者為中心匯總到一起重新進行梳理,能以時間軸集成視圖方式展現每位患者的門診、住院病歷信息,是一套集臨床數據采集、存儲、分析、挖掘于一體的,符合臨床需求的智能系統,成為大數據臨床醫療科研應用的突破點。其探索的以患者為核心的開發建設思路和對大數據的分析、挖掘和利用,逐步將對數據的管理上升為對知識的管理,提升了信息化對臨床科研的支撐保障能力,為最終實現精準醫療和智慧醫療服務體系奠定了堅實的基礎。
海南省人民醫院是海南省最大的綜合性三級甲等醫院和全省疑難危重癥診治中心,醫院迫切希望引入大數據與人工智能等新興技術,提高醫院信息化建設的整體水平。2018年醫院與海南易建科技股份有限公司共同組建“醫療健康大數據聯合實驗室”,以求利用海南省人民醫院的優質醫療資源、業務場景和易建科技股份有限公司雄厚的IT技術實力,通過院、企結合的方式實現強強聯合,共同進行醫療健康大數據的技術探索和產品研發,促進大數據與人工智能技術在醫院的落地應用。
電子病歷智能檢索系統的概念
電子病歷智能檢索系統在已有電子病歷數據的基礎上,利用機器學習和自然語言處理技術自動抓取病歷中的臨床變量,通過將患者分散在HIS、EMR、LIS、PACS等院內系統中的病歷記錄進行融合處理,以患者為中心匯總到一起重新進行梳理,能以時間軸集成視圖方式展現每位患者的門診、住院病歷信息,是一套集臨床數據采集、存儲、分析、挖掘于一體的,符合臨床需求的智能系統,成為大數據臨床醫療科研應用的突破點。其探索的以患者為核心的開發建設思路和對大數據的分析、挖掘和利用,逐步將對數據的管理上升為對知識的管理,提升了信息化對臨床科研的支撐保障能力,為最終實現精準醫療和智慧醫療服務體系奠定了堅實的基礎。其系統結構如圖1所示:
圖1 電子病歷智能檢索系統的系統結構
系統的技術路線
電子病歷智能檢索系統采用以患者為核心的設計思路,對醫療大數據的分析、挖掘和利用,逐步將對醫療數據的管理上升為對醫療知識的管理,為實現精準醫療和智慧醫療服務體系奠定了堅實的基礎。
電子病歷智能檢索系統涉及到的醫院業務數據量巨大,因此本系統采用主流的分布式存儲架構進行數據的存儲與備份。基于大數據設計理念,在數據采集設計上,充分考慮了目前多元化數據源的復雜情況,主要由醫院的HIS、HRP、HIP、CIS 、EMR等系統,還包括人口主索引和互聯網采集的數據等院外數據,這些數據主要分為結構化數據庫數據源、半結構化數據源、非結構化數據源三大類構成。因此,在數據源采集的設計采用了多模式的采集方案,同時對數據采集過程及數據采集質量進行嚴密把控,實現數據采集高可用、高速度、高質量的目標,為上層數據分析應用提供擁有絕對可靠性的數據,打好系統應用的第一基礎。
從醫院業務庫中定時抽取到的原始數據,首先進入HDFS進行貼源層數據備份,經過清洗和處理后的數據保存在數據倉庫Hive中供后續服務使用,對于傳統的業務類型的數據保存在MySQL中,對于需要全文索引的數據保存在MongoDB和ElasticSearch中。
電子病歷智能檢索系統為醫生提供基于ElasticSearch搜索引擎的數據查詢工具,用于進行病例回顧或科研分析, 實現智能化檢索,同時提供查詢授權功能,限制醫生的查詢時限、范圍,并留存查詢日志,保護數據安全。
患者360度全景視圖在數據整合的基礎上,利用機器學習和自然語言處理技術自動抓取病歷中的臨床變量,以患者為中心將其分散在HIS、EMR、LIS、PACS等院內系統中的病歷記錄以時間軸集成視圖方式展現每位患者的門診、住院病歷信息,是數據的融合展現型應用。基于BS架構開發,提供API服務,可以嵌入到任何業務系統中,包括醫生站、醫技系統、手麻系統等。依賴于數據中心全量數據整合的優勢,臨床醫生通過患者360度全景視圖,不但可以查看當次就診記錄,而且可以對患者歷次就診記錄進行回顧性查看,包括門診和住院全部的就診記錄,讓醫生對就診患者的既往就診情況有完整的了解,極大地提高臨床醫生的診療精度和效率。圖2為系統實現的技術路線:
圖2 電子病歷智能檢索系統的技術路線
系統實現的主要功能
電子病歷智能檢索系統能實現醫療數據的快速檢索,提供基于醫療大數據平臺的病歷智能檢索服務,方便醫生快速檢索海量病歷記錄,醫生可以在任何辦公終端調閱患者的就醫全流程及就診資料,從而從電子病歷中獲得最真實、連續、完整的的數據,為醫院臨床科研提供決策支持,同時為臨床科研和醫療知識圖譜打下堅實的基礎。
系統提供的相似病歷分析功能以就診事件為單位,比對患者間的就診事件的相似度,對同一科室的就診事件進行相似度分析,當前相似度分析只針對診斷和醫囑,并根據權重值進行評分,最后加權平均求得病例間相似分數,方醫生檢索處相似病歷。
系統還提供患者360度全景視圖功能,可以嵌入到任何業務系統中,包括醫生站、醫技系統、手麻系統等。臨床醫生通過患者360度全景視圖,不但可以查看當次就診記錄,而且可以對患者歷次就診記錄進行回顧性查看,包括門診和住院全部的就診記錄,讓醫生對就診患者的既往就診情況有一個完整的了解,極大地提高臨床醫生的診療效率。
此外,系統引進了知識圖譜技術,通過從電子病歷中抽取臨床知識,通過本體建模方法構建病歷圖譜,可以把病歷數據歸納為患者,疾病,癥狀,醫生,科室,醫院,治療,醫囑,檢驗,檢查,手術,藥品,住院事件,門診事件,體檢事件等概念。并通過與醫療知識庫相關聯,將對醫學知識檢索、疾病預測、用藥推薦和相似病歷等打下良好的基礎,為臨床科研工作者提供些新的結論以供參考,以達到更好地輔助臨床醫學研究的目的。同時臨床電子病歷知識圖譜是專科知識圖譜的基礎,從臨床病歷中抽取專科電子病歷知識圖譜結合專科知識庫構建專科知識圖譜。圖3為知識圖譜的應用情況:
圖3 電子病歷智能檢索系統中的知識圖譜應用
系統應用效果評價
電子病歷智能檢索系統從2018年下半年開始在海南省人民醫院上線運行,已經完成了近50萬份電子病歷的后結構化處理,整合臨床醫囑和檢驗檢查結果約650萬條數據。系統集成了HIS、EMR、LIS等業務系統的院內數據,以及電子健康檔案、全員人口庫等院外數據,重構數據模型,以患者為中心重新整合,實現患者360全景健康視圖,為患者和醫生提供全方位的數據查看。
系統從數據處理、儲存到搜索方式都利用先進、高效的人工智能技術及云計算,有效使用計算資源,能夠在短短幾秒內響應用戶的請求,處理百萬、乃至千萬級別的醫療電子病歷數據,為管理、教學、公共衛生提供了良好的數據源。電子病歷智能檢索系統的應用提升了信息化對臨床科研的支撐保障能力,為醫生深入挖掘醫院醫療數據價值提供可能,為最終實現精準醫療和智慧醫療服務體系奠定了堅實的基礎。