廣州中醫藥大學第一附屬醫院:中醫藥臨床科研一體化大數據平臺
本案例獲得CHIMA 2020醫院新興技術創新應用典型案例“醫院數據治理建設”方向二等獎。
廣州中醫藥大學第一附屬醫院信息化建設經過多年的探索與實踐,特別是“十二五”期間的不斷完善和多次升級,按照《中醫醫院信息化建設基本規范》,確立了“以病人為中心、以臨床為核心、以科研為抓手、以區域為導向,建設有中醫特色的數字化醫院”的核心建設思想,并取得了一系列顯著的建設成果:2012年建成國內第一個中醫醫院智能化運營平臺,獲得“省級基于電子病歷的醫院信息平臺試點單位”、“廣東省智慧醫院建設單位”等稱號,成為廣州首家使用微信預約掛號及繳費的三甲中醫院,榮獲2013-2014年度十大優秀移動醫療項目獎,于2019年牽頭制定“醫療數據中心建設規范--科研數據中心”的團體標準,并于2020年8月17日由廣州市標準化促進會正式發布。醫院完善的信息技術基礎為信息化深層次發展提供了有利條件。
醫院作為國家中醫臨床研究基地和嶺南醫學研究中心,除了承擔日常臨床工作之外,各學科還承擔著越來越多的國家、省部級研究課題以及企業橫向研究任務。在愈發強調疾病診療個體化和追求診療效費比的今天,依托醫院大量臨床病例開展真實世界研究成為現代醫學研究領域的熱點。廣州中醫藥大學一附院作為優勢學科聚集的研究型醫療機構,各科專家都迫切希望能夠即時獲得臨床數據用于支持其臨床研究工作,傳統基于手工謄抄病案的研究數據獲取方式因為存在重復勞動、效率低下,質量難以控制,研究周期漫長等諸多問題而難以為繼。
2019年10月10日,廣東省健康醫療大數據標準工作組科研數據中心標準小組啟動會順利召開。該標準由廣州中醫藥大學第一附屬醫院牽頭,聯合中山大學附屬第一醫院、廣州醫科大學附屬第一醫院等十家醫院共同參與編制。經過近一年的初稿編撰、意見征求、終稿修改、專家審定、公告發布等工作,《醫療數據中心建設規范第3部分科研數據中心》團體標準于2020年8月17日在“全國團體標準信息平臺”正式發布,并于2020年9月1日開始實施。
我院參照該團體標準,啟動中醫臨床科研一體化大數據平臺建設,通過科研數據中心匯聚醫院多源異構的醫療數據,利用先進的計算機技術對數據進行治理,實現數據的標準化和統一化,并在數據挖掘分析的基礎上更好地支持回顧性和前瞻性研究項目的開展,為我院臨床科研工作保駕護航。
醫院于2020年正式啟動了中醫藥臨床科研一體化大數據平臺建設項目,確定以肺癌、心衰、復發性流產、糖尿病、針灸中風、慢性鼻竇炎、COPD、慢性淺表性胃炎、股骨頭壞死、慢性腎衰竭等10個專科病種為切入點,搭建院級數據元管理、臨床研究管理、影像集成、隨訪管理、數據脫敏、基于AI的科研大數據管理中臺、一站式科研數據挖掘等應用系統,開展專病臨床數據標準化,電子病歷臨床科研一體化改造、醫院臨床數據整合與治理等系列工作,建立橫縱雙向打通醫院臨床與科研瓶頸的一體化工作平臺,為醫院開展前瞻性研究和回顧性研究提供高效支撐。
(1)加強中醫專科專病數據標準化建設
搭建標準化的中醫術語庫,針對肺癌、心衰、復發性流產、糖尿病、針灸中風、慢性鼻竇炎、COPD、慢性淺表性胃炎、股骨頭壞死、慢性腎衰竭10個病種的專病數據進行標準化處理,實現各專科病種的專有標準數據集,滿足臨床科研、臨床診療、醫院管理、醫療控費等業務的數據共享支撐。
圖1 遵循ISO1179元數據標準對專病數據進行標準化
(2)改造臨床科研一體化EMR模板
通過與各專科溝通、分析、總結,對現有EMR模版進行臨床科研一體化改造,實現10個專科病種數據從源頭實現臨床與科研數據的統一采集,以EMR改造為抓手,提升科研效率。
圖2 改造后的臨床科研一體化電子病歷模板
(3)高效再利用影像數據
無縫對接院內PACS系統,提供影像數據整合、后處理、影像協作、傳輸、管理、快速調閱等功能,實現影像數據在多終端的高效共享與再利用。
(4)加強保護患者隱私數據
存儲在科研數據中心內的所有受試者隱私數據均需通過數據脫敏系統進行漂白脫敏,并且確保科研數據脫敏后不失真,提供優質的脫敏數據,以供科研業務使用,充分防范臨床科研中發生數據泄露。
(5)建立數據驅動型的大數據科研分析平臺
通過數據的清洗、歸一、整合處理,將數據統一匯聚在科研大數據分析平臺中,形成中醫特色的專病知識圖譜,實現智能化的研究人群篩選,擴展了人群分析、研究建模、數據導出、數據質控以及患者個案視圖等六大核心應用;能夠提供更加靈活、便利的數據查詢、數據挖掘能力,更好地更快的進行研究成果挖掘。
圖3 數據清洗后的歸一整合
圖4 疾病知識圖譜
參考原國家衛生部數據元標準WST 303-306規定的衛生信息數據元模型、屬性、衛生信息數據元的命名、定義、分類以及衛生信息數據元內容標準編寫格式規范;遵循國際公認的數據元標準規范ISO11179對數據項進行標準化處理。
數據抽取主要使用ETL進行數據清洗,ETL從數據源抽取出所需的數據,并進行數據清洗轉換,最終按照預先定義好的數據倉庫模型,將數據對應地加載到數據庫中。數據脫敏是根據HIPAA的法規制定需要脫敏規則以及脫敏方法。
遵循GCP管理規范,隨訪模型 “CDISC”標準,滿足研究人員自定義研究方案,如隊列研究、藥物臨床試驗等。支持多項目、多中心平臺化管理,可進行互聯網化部署。
圖5 基于CDISC標準的方案配置
利用大數據技術,主要為N-最短路徑、HMM、由字構詞的漢語分詞方法以及基于詞表的分詞等,基于現存的標準詞庫,如ICD-10、ICD-9、SNOMED CT、LOINC等。結合人工加機器的方法,不斷將臨床醫學詞匯進行正確的歸類,逐步實現知識語料庫的建立。自然語言處理技術可以在文本信息和結構化信息間架起一座橋梁,它可以在不影響人類以自然語言交流、記錄信息的習慣前提下,將自然語言轉化成結構化語言,方便計算機進行自動的信息處理。
基于R語言技術,大數據科研分析系統提供20余種醫學上常用的統計模型,包括比較均值分析、非參檢驗、回歸分析、相關性分析和生存分析等,也包括大數據挖掘處理算法,如主成分分析、決策樹等。臨床醫生可根據具體業務應用場景靈活選擇,或自由組合查詢;并基于人群擴展了六大應用,包括人群分析、研究建模、數據導出、數據質控、數據挖掘以及患者個案視圖等。
圖6 集成R語言的統計模型
中醫藥臨床科研一體化大數據平臺的建設,對我院“醫、教、研”綜合實力的發展將啟到大力推動作用:
建立以患者整體畫像與診斷結果之間的關系為核心的中醫診斷關系脈絡圖譜,反向應用于中醫臨床診斷過程當中,幫助醫生更全面的分析患者病情,得出結果與醫生經驗相互佐證,提升臨床診斷水平,推動中醫診斷體系的標準化。
結合文獻古籍與患者的“表征→診斷→治療→預后”全流程數據,探索驗證中醫藥療法與疾病轉歸之間的關聯規律,有助于選方擇藥治療疾病。同時結合現代化西醫技術,與傳統古方互相驗證,發掘符合當代實際的治療方案,去偽存真,更好地推動中醫藥療法的發展。
基于中醫體質辨識理論體系的內容,對患者畫像數據進行客觀分析,能得到較為客觀的患者體質分型,再結合大數據分析給出的行為、表征、患病、轉歸的各個環節發展路徑預測,進行全方位、多途徑、多環節的“精準調理”,阻斷健康向亞健康發展、亞健康向疾病發展,真實有效的維持健康狀態,提升生活質量,實現超前的治未病的疾病防控目標。
平臺中積攢大量病例數據,建立經典案例庫,寓教于研,將臨床實踐與研究方法、成果同時應用于中醫臨床教學,既能更好地傳承中醫精粹,又能推廣中醫研究思路及方法,促進中醫理論體系的長足發展,大幅度提升教育水平,打造符合時代特點的中醫傳承模式。
從宏觀視野分析當下常見病、多發病的復雜病因,找出背后潛在的共同病因及關聯性,動態把握中醫疾病的發展規律。采用數據挖掘方法和復雜網絡分析方法,從中醫藥大數據中發現疾病證、治、法的特定規律,為中醫治療水平的提升提供更多的可能性。
建立中醫大數據知識圖譜,支持患者智能預問診、智能分診等自動化服務,簡化患者就醫流程,降低臨床醫生重復工作。同時通過對中醫藥大數據的深度挖掘分析,總結出不同類型人群的疾病發展路徑,發現病程各節點的疾病變化規律,分析出特定人群中醫康復治療的有效特點,最終形成個性化中醫健康管理方案,促使中醫藥手段在健康管理中發揮更大的支持作用,打造“數據多跑路,患者少出門”的中醫診療服務新體驗。
我院通過中醫臨床科研一體化大數據平臺建設,利用醫院現有臨床信息化優勢,運用大數據及AI等先進技術,遵循《醫療數據中心建設規范-第3部分-科研數據中心》的團體標準的要求,結合中醫藥的特色,堅持貫徹我院“科技興院”的理念,提高醫學科研成果轉化能力,讓科研更好地服務于臨床,服務于患者,為建設國內一流、國際知名、具有鮮明嶺南中醫藥特色的大型現代化中醫醫院而不懈努力。