《數據二十條》的號角聲
國務院于2022年12月19日發布了《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(后簡稱《數據二十條》),如何有效利用數據已經成為下一步的趨勢。另一方面,無論是基于數據中臺還是數據編織理念,兩者也都對如何利用數據提出了構想。因此醫療行業數字化建設的目標已不能再局限于如何收集數據,建立醫療行業數據的流通機制將會是越來越普遍的需求。
時鐘撥回幾年前,數據中臺概念開始火爆。人們對數據中臺的定義、詮釋盡管有諸多差異,通過數據中臺降低數據共享和利用的成本則是共同的期望。但經過這幾年的探索之后,中臺已死的觀點也在涌現。究其原因,除去中臺概念在技術上的不確定,數據流通過程中的責權益的不清晰也是嚴重的制約因素。畢竟,數據中臺自身作為一套技術框架并不能代替法律法規與市場,自動將數據轉變為商品從而創造出流通價值。
那么,如何能夠使數據的流通合規合法,使數據能夠如貨幣和商品一般自由流動,則是我們需要思考和探索的主題,這次《數據二十條》的出現,無疑為醫療信息技術工作者提供了一個明確的思考方向。
政策利好與約束
鑒于《數據二十條》對數據行業生態的覆蓋范圍之廣,涉及數據權屬界定、數據產品流通、數據收益分配和數據市場有效監管等各方面,本文將無法全面展開每一條政策進行解讀和思考,因此將聚焦于與每個從業人員都息息相關的數據產權和數據產品流通兩方面進行。
產權與所有權的破與立
還記得數年前與信息科同事談及基于醫療數據的統計與分析時,醫院的同事對于數據被第三方訪問的恐懼遠多于期待。對數據要素的權屬及其確立規則的不清晰使得每個從業人員都無法在具備法律法規保障的前提下運用數據。本次《數據二十條》對于個人數據、企業數據和公共數據進行了產權定義,還提出了數據資源持有權、數據加工使用權、數據產品經營權等分置的產權運行機制,從而打破了無法可依的尷尬局面。
可以預見的是,通過對數據的產權與使用權進行分離,在取得數據所有者(如個人或企業)授權的前提下,對數據進行加工處理,通過數據洞察進行盈利將成為合理合法的業務形態。
數據供應鏈的建立
《數據二十條》第三章對數據供應鏈體系做了一系列的規劃,包括數據流通過程中參與方的角色,如數據商和第三方專業服務機構;包括流通場所,如數據交易所以及對應的流程合規與監管規則體系的遠景。這樣一個體系的構建,其規模和復雜性并不亞于為汽車工業組織零部件生產和消費的供應鏈。
特別需要注意的是,正如《數據二十條》中明確指出的,數據供應鏈的建立必將依托數據質量標準化體系,推進對數據采集和接口的標準化,依賴于數據整合互通和互操作。
這些概念和體系對于醫療信息技術工作者來說并不陌生。然而在既往的工作中,跨企業、跨區域醫療行業數據共享的產業規模并未對標準化產生強勁的推力。盡管近年來隨著互聯互通標準化評測工作的開展,醫療信息互操作在標準化方面得到了極大的進展,但是醫療行業數據與上下游生態企業(如藥企、保險、養老機構等)間進行數據流通所需的統一語義和標準還未確立和應用,勢必將在不遠的未來對醫療信息技術工作者提出更高的挑戰。
另一方面,在鼓勵數據交易所發揮作用的同時,《數據二十條》也倡導在數據流程合規與受規則體系監管的前提下,培育一批數據商和第三方專業服務機構,依法依規在場內和場外采取開放、共享、交換、交易等方式流通數據,也為創建數據供應、數據托管和數據服務代理等多種模式的數據經濟形態創造了條件。
醫療行業數據流通案例
醫療數據產業并不是一個已經成熟的規模化產業,即使對于美國、英國這些在醫療信息化方面較早起步的國家,醫療數據產品和流通也仍然處于初步的市場探索階段。我們可以看到一個案例。
Epic COSMOS數據集
美國最大的電子病歷廠商Epic于2019年推出了數據集產品COSMOS(https://COSMOS.epic.com/)。所有Epic電子病歷系統的用戶都可以自愿與Epic簽約成為COSMOS合作伙伴,在開放自己的醫療健康數據的同時共享同樣加入了COSMOS網絡其他用戶的數據。時至今日,COSMOS已經收錄了1億6千7百萬患者的數據,覆蓋一千余家醫院和兩萬余家診所。
圖 1 COSMOS數據流
如上圖所示,Epic采用了非常傳統的“前置機+中心化存儲方案”構建。在置于院端的前置機中,以批量、定期上傳的方式加載數據集,在前置機一側對數據進行標準化和匿名化,并通過HL7 CDA標準以文檔的形式將數據傳到數據中心。置于AWS云端的數據中心負責對數據進行去重及合并。其中,數據在云端將以"非結構化"的Global形態存儲于InterSystems Caché中,并利用Caché自帶的后結構化能力將非文檔化的Global轉換并存儲為關系型數據對外提供SQL訪問能力。
在這個過程中,COSMOS進行的若干細節處理非常值得即將面臨數據開放的醫療信息技術工作者參考和借鑒。讀者可參考相關論文查閱(如https://www.thieme-connect.com/products/ejournals/pdf/10.1055/s-0041-1731004.pdf)。
1.真實數據的可訪問性:COSMOS本質上只解決了分散的,真實的醫療數據的可訪問性問題,還沒有運用任何顛覆性的BI、AI技術。作為美國最大的電子病歷廠商,手握上億人的醫療數據的Epic,需要從基礎數據的準備切入市場,這從側面反映了當前醫療行業所面臨的客觀現實,即供應鏈底層的數據原料并不存在穩定的供給,從而阻礙了其他技術的演進。這同樣是我們面臨的現狀。
2.非常傳統的數據采集:COSMOS只采集EHR中的結構化數據,并不收納任何影像、視頻和除實驗室檢測結果外的文本等多媒體數據,也未采用實時數據流進行采集。這并不意味著多媒體數據沒有價值,也不意味著實時數據流沒有價值,而是意味著半靜態的,結構化的數據中的價值并沒有得以充分提煉和發揮,僅通過收集整理結構化數據形成規模一項工作已足以支撐起龐大的價值鏈條,盡管這些靜態數據并不是唯一的價值來源。
3.去識別化與個人數據授權:作為對患者信息進行隱私保護的首要手段,COSMOS及與之相似的數據集產品Cerner Real-World Data(CRWD)均遵循美國自1996年通過的HIPPA法案,只開放法案允許開放的數據集,并按照HIPPA的要求對可能暴露患者隱私或反向識別個人的數據字段進行匿名化處理。需要注意的是,盡管CRWD相關的論文中聲明,由于對數據進行了匿名化處理,對個人醫療數據的使用不需要患者本人的授權(https://www.sciencedirect.com/science/article/pii/S2352340922003304),但COSMOS仍然提供了供患者撤回數據授權,將本人的數據從COSMOS網絡中退出的工作流。因此,即使在美國,數據所有者和數據使用者之間的權益平衡仍保留了相當的靈活性,我國在制定相關法規時也會對基于所有權和使用權定義相應的細則。
4.數據訪問控制:在前置機與云端數據中心通信過程中,CDA文檔將被加密并通過專網傳輸,避免在公網傳輸并被截獲和解析的可能。另一方面,盡管COSMOS收集了診斷、藥囑、手術史、社會史和家族史等患者個人的明細數據,但它并不對最終用戶開放這些數據;COSMOS用戶可以通過查詢門戶,制定條件,查詢基于這些明細的統計數據,例如在一定行政區域內罹患新冠的患者數量及其年齡分布等,但無法查詢到對應的個人,因此經過認證的科研機構在COSMOS中發起查詢并不再需要特定的審查委員會審核;同時COSMOS也不提供將數據從COSMOS網絡中導出的渠道,避免數據流出網絡。從這些控制手段上來看,COSMOS選擇的技術路線和服務模式與《新二十條》中“原始數據不出域、數據可用不可見”的要求和“以模型、核驗等產品和服務等形式向社會提供”的倡導高度吻合,值得借鑒。
5.數據標準化:COSMOS在前置機上收集一家醫院的數據時已落實了數據的標準化,采用固定的數據結構和術語集。醫院需要先完成對數據和術語的標準化映射,才能接入COSMOS網絡。而在云端存儲中,原始數據也是以標準化的CDA文檔形式保存,進一步鞏固了數據標準。也正是在標準化數據存儲的基礎上,最終用戶才能夠通過統一的查詢構建器,在同一種語義環境下同時訪問來自于不同醫院,采用了不同術語標準的醫療數據。因此通過數據標準術語標準達成語義一致性的重要性不言而喻,這是醫療數據的利用迅速得到規模效應的客觀需求。
醫療數據產品發展前景
如前所述,基于數據所有權與數據使用權分離的假設,很難想象未來醫療數據產品的發展方向以生數據(raw data)產品的形態,開放對個人數據的(即使經過了匿名化)訪問。相反的,基于醫療數據需求的多樣性以及個人、企業、公共數據管理規則的差異性,以生數據為基礎,以對藥企、保險等企業提供潛在可招募患者的區域鎖定或針對患者的年齡、診斷、家族史的普遍特征與醫療支出進行精算為例,針對人群展開的數據洞察和數據分析服務,更可能得到業界的認可并在數據價值利用和數據隱私保護間取得平衡,有很大概率成為率先得以實現的商業模式。同時,作為一個新興產業,生產者(數據工程師)群體的培養和儲備,以及與之配套的生產資料的制造和積累,則是醫療數據產業能夠成型的前提,值得醫療信息技術工作者關注。
因此,在未來相當長的一段時間內,對醫療行業數據的利用,將以各醫院、集團和企業建立的數據中心為基礎,通過對真實數據進行洞察分析和價值挖掘的形態,以數據服務的形式對外提供,從而迅速釋放這些被積累了很久的數據的價值。
后續我們還會繼續闡述和分析在醫療數據流通領域中的生產者和生產資料的特征,歡迎大家與我們交流,謝謝。
InterSystems開發者社區匯集了大量有用、有趣的實踐探討。我們今天推薦的是InterSystems中國資深售前工程師祝麟的一篇文章。
您也可以點擊“閱讀原文”,加入InterSystems開發者社區(中文版)查看全文。
(本文由InterSystems公司供稿)
上一篇: 柳明:醫院信息化人才培養之個人淺見