中國醫學科學院血液病醫院:科研大數據平臺應用探索實踐
隨著信息技術的飛速發展,醫療人工智能技術已經在許多疾病的診斷和治療中發揮了重要作用,可助力提高臨床診療的精準性與效率,快速全面提升診斷水平。然而在開展真實世界研究的過程中,面臨諸多困難和挑戰。血液系統疾病的臨床研究離不開多維度、高質量的數據支撐,如何有效打通“數據孤島”,完成合規數據整合是首先面臨的問題。
在此背景下,中國醫學科學院血液病醫院構建了全院級別的血液病醫療大數據平臺,以滿足臨床醫生科研需求,為臨床醫生提供個性化的科研數據服務。
科研大數據平臺應用探索實踐
作為我國目前最大的集醫療、科研、教學、產業于一體的國家級科研型血液病專業醫療機構,中國醫學科學院血液病醫院(中國醫學科學院血液學研究所)擁有國家血液系統疾病臨床醫學研究中心等六大國家級平臺,開啟國家重點實驗室和國家臨床醫學研究中心“雙輪驅動”新發展模式,為建設成為國內頂尖和世界一流的血液病防治、血液學研究、人才培養和成果轉化的科技創新核心基地而不懈努力。
由于我國血液系統疾病診療體系數據多割裂在幾十個甚至上百個臨床系統中,導致臨床數據難以被有效分析和應用。為深化血液系統疾病的基礎與臨床研究,提高臨床研究能力,促進研究成果的臨床應用及轉化推廣,中國醫學科學院血液病醫院整合醫院主要系統的醫療數據,與醫渡云攜手搭建了血液病醫療大數據平臺,建設了包括白血病、淋巴瘤、骨髓瘤、出凝血疾病、骨髓增生異常綜合征、再生障礙性貧血、兒童血液病、造血干細胞移植等病種的具有中國人群特色的血液系統疾病??茙臁Mㄟ^高效的數據檢索、篩選和導出,解決了醫療數據查詢困難、標準不一、利用率低,無法復用等科研問題,滿足了醫生科研成長和醫院臨床發展的基礎需求。
血液病??茙旖尤肓薍IS、LIS、EMR、PACS、病理、超聲、心電圖、手麻、基因、骨穿等系統,并基于病歷書寫結構將散落在各系統內的數據進行重組及結構化形成重點事件、患者人口學信息、就診記錄、病歷信息、診斷、檢查、檢驗、病理、治療、醫囑、隨訪、細菌培養與藥敏試驗、MICM、造血干細胞移植、生物樣本庫、費用信息及臨床試驗等18大數據模塊,并有針對性地完成專科庫的迭代和更新,優化??茙斓淖侄卧O計,更加符合臨床實際的應用場景。
圖1 中國醫學科學院血液病醫院醫學數據智能平臺
圖2 中國醫學科學院血液病醫院白血病科研??茙?/p>
平臺技術優勢
在血液病臨床大數據平臺的基礎上,中國醫學科學院血液病醫院還建設了??茙?,并接入多個科室級別的信息系統和院外數據源,包括生物樣本庫、二代測序等多種數據形式,可滿足各種研究需求。
圖3 技術路線圖
平臺具有以下技術優勢:
(1)采用私有云數據采集和處理技術,數據始終留在院內,保障數據的安全性和隱私性。
(2)運用機器學習、自然語言處理(NLP)的技術,實現數據集成、數據標準化統一生產,并實現非結構化長文本病歷轉化為結構化數據。
(3)支持專病數據反向溯源,每條數據均可追溯系統原始數據,確保數據的生產透明度和標準透明度。
(4)支持數據實時采集,提供多種數據更新方案,方便臨床醫生及時獲取結構化的患者全生命周期整合數據。
(5)數據質量監控,實時監控臨床醫生的診療行為和病歷填寫習慣,發現數據問題并提供解決方案。
基于醫院數據的復雜性及可擴展性要求,平臺采用Hadoop技術框架,Hadoop現在已成為事實上的人工智能平臺非結構化數據處理的標準配置,它將為半結構化及非結構化的臨床數據提供分布式數據存儲資源,并為NLP(自然語言處理) 、模型算法提供分布式計算資源。
平臺基于LINUX操作系統,運用虛擬化技術構建大規模Hadoop集群,自主研發運維管理平臺,自動監控平臺的各組件問題,為醫療數據處理提供深度調優,提高效率。平臺可擴展性非常強,存儲、計算、應用資源松耦合,非常方面進行擴展,靈活滿足業務需求,二次開發成本低。
成果豐碩,再攀高峰
為建立數據標準,進一步促進血液系統疾病的規范化診療和高效科研產出,目前中國醫學科學院血液病醫院已出版《白血病標準數據集》、《淋巴瘤標準數據集》、《骨髓瘤標準數據集》、《骨髓增生異常綜合征標準數據集》、《再生障礙性貧血標準數據集》、《血栓與止血標準數據集》等6本標準數據集。通過建立規范統一的血液系統疾病標準數據集,解決數據標準化的問題,實現醫療的數字化、智慧化,實現高效率的醫療資源共享、跨區域醫療、跨系統醫療,有利于各醫院在血液系統疾病數據結構和標準化方面實現統一與互通,助力高效疾病診療和醫學科研開展。
此外,醫院還建立了白血病、淋巴瘤、多發性骨髓瘤等多個疾病的大型隊列,產出了系列科研成果,發表在NEJM、Blood、Leukemia、Blood Advances、Nature computational science等專業領域高水平期刊。
同時,醫院不斷深化國家中心任務落實,建成了輻射全國的145家專科網絡聯盟,其中28家首批協同分中心共同組建多中心數據平臺,并已著手搭建國內一流、國際領先的涵蓋血液病患者臨床資料、隨訪數據、生物樣本等信息的雙向隊列研究數據庫。
總結
中國醫學科學院血液病醫院不斷致力于深化血液系統疾病的基礎與臨床研究,提高臨床研究能力,促進研究成果的臨床應用及轉化推廣,建立高質量的大數據基礎數據治理平臺及??茙?,為推動智能醫療、科研、教學、管理等方面打下了堅實的基礎,也為未來國家血液系統疾病臨床醫學研究中心的數據采集和臨床研究提供精確的數據整合平臺,從而快速推動真實世界的臨床研究。
本文由中國醫學科學院血液病醫院(中國醫學科學院血液學研究所)供稿