石金龍:解放軍總醫院醫學大數據平臺建設與科研利用實踐
有效利用大數據,為醫療服務賦能,是醫院“十四五”規劃的重要內容。醫療行業在日常的臨床和管理中產生了大量數據,亟需加強統籌和分析挖掘,以充分發揮數據價值。第五屆世界智能大會智能健康與醫療高峰論壇5月21日在天津召開,在智慧醫院信息化建設研討會上解放軍總醫院醫學大數據研究中心副主任石金龍受邀發表了主題演講,詳細介紹了該院醫學大數據平臺的建設與科研利用實踐。他強調:“醫療信息化發展需求,生老病死現象背后的生物物理機制規律探索是醫學大數據研究及應用的問題‘源頭’。醫學大數據的研究成果將為醫療信息化提供新功能、為生物醫學創新研究提供驅動力。”
以下內容根據石金龍主任演講整理。
建設三大基礎數據庫,實現數據的匯聚整合
信息系統在智慧醫院發展過程中發揮了非常重要的支撐作用,尤其是在多院區架構下的大型綜合醫院,信息化是一個非常重要的基礎設施,為醫院臨床診療和運營提供技術保障。隨著信息系統應用越來越廣泛,院內累積了大量數據。
解放軍總醫院最近幾年一直在探索醫療大數據的應用。結合醫院信息化基礎和創新發展需要,醫院于2016年設立了醫療大數據中心,作為全院創新能力建設的公共基礎平臺。2017年,由解放軍總醫院牽頭,聯合國內17家優勢單位,獲批國家發展改革委醫療大數據應用技術國家工程實驗室,成為國內醫療行業唯一的大數據國家工程實驗室。2019年底,醫療大數據中心轉隸到醫學創新研究部,組建醫學大數據研究中心。
醫學大數據主要來源于醫療過程形成的多元數據,以及對人體系統宏微觀多尺度測量數據。從數據特征和分析利用的角度來看,可以初步分為五部分:結構化數據,這部分數據技術指標一般可直接用于統計分析;非結構化數據,比較典型的是電子病歷形成的數據,這部分數據一般是不可以直接利用的,需要做結構化處理;醫學影像數據,這部分也是數據利用度非常高的;時間序列數據,包括心電圖、腦電圖等數據,這塊數據目前利用并不多,但是價值非常大,能夠提供動態、連續的人體監測,有助于對健康監測進行評估;生命組學數據,這部分數據對于理解疾病背后的規律和生命背后的本質非常重要。
從國家工程實驗室定位來講,希望面向整個行業,以應用需求為導向,開展醫療大數據的技術創新、標準創新、產品創新和應用創新,推動醫療大數據應用領域的技術進步和產業發展。
近幾年,醫院建設了專科專病數據庫、醫學影像庫和電子病歷文本庫三大基礎數據庫,實現了對超過25年全部臨床數據的匯聚整合,建立了臨床基礎數據資源池,實現了全院歷史影像的在線訪問,全院的文本數據整合入庫,支持對其自由檢索。這三個技術庫的建設解決了數據可及性的問題,讓各個數據能夠看得到摸得著。原始數據沒法利用,需要進行信息加工和處理,對數據進行分層分級利用、評估和控制。目前,醫院以臨床科研為目的,已建立了30多個專病數據庫,包括心衰數據庫、急救病例數據庫、肺癌數據庫等,為科室按病種特征整理數據提供支持工具。這在一定程度上解決了數據的可用性問題。在此基礎上,通過整理發布專題數據集、組織多種主題的數據競賽活動等,進一步擴大數據利用范圍和多學科深度融合。
構建數據資源管理平臺,多角度探索數據應用
為推動數據更好地應用,解放軍總醫院建立了數據資源管理平臺,將數據納入一個平臺管理,共解決了以下兩個問題:通過對存量數據的存儲和再加工,形成數據的二次利用;基于數據資源池,對多種數據庫進行授權使用,通過數據集等方式解決數據使用的問題。
在具體實踐中,醫院進行了以下探索:搭建分布式并行檢索集群,面向臨床提供醫療數據自由檢索支撐。通過檢索應用的方式,更好地啟動可以利用的數據檢索,通過類似于數據庫的平臺,提高了數據檢索的性能;搭建高性能組學數據處理集群并部署專業生物信息處理軟件,支撐對高密度多組學數據的快速處理分析;搭建深度學習集群,支撐面向醫學影像等人工智能的深度學習等。為加強數據資源的管理,醫院制定了系列化的內部管理制度和對外合作制度,保障數據安全,保證服務質量和效率,探索有效的數據利用路徑和應用模式。
“十四五”時期,醫療大數據的發展方向主要體現在以下四個方面:技術平臺創新,主要體現為在技術研發上,進一步補充完善醫學大數據技術工具,形成包括醫學數據整合、數據檢索、專病數據庫、患者隨訪、醫學自然語言處理工具在內的體系化技術平臺;數據資源創新,體現為擴大醫療數據共享聯合體,做大做強多中心醫學數據資源,探索數據合作共享機制;臨床應用創新,主要是瞄準醫學大數據和人工智能發展的前沿熱點,著力推動大數據成果的轉化應用;服務模式創新,主要是總結大數據開發利用實踐經驗,提出醫院大數據平臺建設指南,建立大數據中心規范化的服務流程與制度,構建數據的應用模式。
醫學大數據是支撐臨床基礎創新研究的重要途徑,作用發揮取決于其滿足醫療行為優化需求的程度、融合臨床基礎醫學多學科的深度,從基本數據服務,配合臨床應用和科研需求;到有效科研支撐,將大數據融入智能醫療和醫學研究的全過程;再到數據驅動創新,推動和引導醫療服務優化和應用研究開展,醫學大數據利用有其自身發展規律和應用路徑。通過醫學數據資源的平臺化管理、數據利用的工具化支撐,并圍繞臨床應用需求開展跨學科的深度數據研究,醫學大數據價值將逐步彰顯并有效發揮作用。
醫學大數據的應用道阻且長,希望各位同道一起,探索可行的實施路徑,推動醫學大數據可持續發展。
(本文由CHIMA秘書處根據石金龍主任演講內容整理)