上海市同濟(jì)醫(yī)院:全院一體化科研平臺(tái)及專(zhuān)病庫(kù)應(yīng)用
2021年醫(yī)院新興技術(shù)創(chuàng)新應(yīng)用典型案例征集活動(dòng)共選出21篇典型案例,在CHIMA 2021大會(huì)上對(duì)獲選案例進(jìn)行了頒獎(jiǎng)。
國(guó)家高度重視醫(yī)療大數(shù)據(jù)的分析和利用,已經(jīng)出臺(tái)眾多政策鼓勵(lì)醫(yī)院和企業(yè)進(jìn)行相關(guān)方面的應(yīng)用和探索。如,在2016年10月中共中央、國(guó)務(wù)院印發(fā)的《“健康中國(guó)2030”規(guī)劃綱要》中指出:要加強(qiáng)精準(zhǔn)醫(yī)學(xué)、智慧醫(yī)療等關(guān)鍵技術(shù)突破,并倡導(dǎo)加強(qiáng)醫(yī)療大數(shù)據(jù)的數(shù)據(jù)挖掘和廣泛應(yīng)用,為醫(yī)療人工智能的發(fā)展指明了方向。2017年7月國(guó)務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》中指出:將醫(yī)療行業(yè)作為人工智能重點(diǎn)發(fā)展領(lǐng)域之一,提出探索智慧醫(yī)院建設(shè)及研發(fā)人機(jī)協(xié)同臨床智能診療方案,以及加強(qiáng)群體智能健康管理,強(qiáng)調(diào)數(shù)據(jù)挖掘、輔助診療、患者管理的人工智能產(chǎn)品在醫(yī)院落地,以助推精準(zhǔn)醫(yī)學(xué)和智慧醫(yī)院發(fā)展。2018年4月國(guó)家衛(wèi)生健康委印發(fā)的《全國(guó)醫(yī)院信息化建設(shè)標(biāo)準(zhǔn)與規(guī)范(試行)》中指出:要利用人工智能、大數(shù)據(jù)平臺(tái)等先進(jìn)技術(shù)進(jìn)行臨床醫(yī)療數(shù)據(jù)的處理與研究,實(shí)現(xiàn)醫(yī)療數(shù)據(jù)來(lái)源于患者,服務(wù)于患者。
同時(shí),近年來(lái),國(guó)內(nèi)醫(yī)院逐步意識(shí)到醫(yī)療大數(shù)據(jù)的重要性及潛在價(jià)值,多家醫(yī)院已建設(shè)醫(yī)療大數(shù)據(jù)平臺(tái)。但在探索的過(guò)程中,存在眾多問(wèn)題,導(dǎo)致缺乏醫(yī)療大數(shù)據(jù)的臨床研究結(jié)果產(chǎn)出。這些問(wèn)題主要有:①平臺(tái)雖然做到了臨床數(shù)據(jù)的整合,但沒(méi)有從臨床研究的角度對(duì)數(shù)據(jù)進(jìn)行治理;②專(zhuān)病大數(shù)據(jù)的采集范圍局限于院內(nèi)部分信息系統(tǒng),缺少對(duì)患者的全病程數(shù)據(jù)的采集;③平臺(tái)缺乏頂層設(shè)計(jì),以至于缺乏數(shù)據(jù)權(quán)限配置、管理等設(shè)計(jì),產(chǎn)生數(shù)據(jù)濫用等管理問(wèn)題。
本項(xiàng)目通過(guò)建設(shè)基于人工智能的全院級(jí)科研一體化平臺(tái),對(duì)醫(yī)院臨床病歷數(shù)據(jù)進(jìn)行結(jié)構(gòu)化、標(biāo)準(zhǔn)化的整合治理,面向醫(yī)院重點(diǎn)專(zhuān)科提供臨床科研數(shù)據(jù)采集和分析服務(wù),滿(mǎn)足不同臨床醫(yī)生不同的科研訴求。具體建設(shè)目標(biāo)包括:
(1)對(duì)醫(yī)院原有臨床業(yè)務(wù)系統(tǒng)中海量的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行整合治理,構(gòu)建符合科研維度、高質(zhì)量的專(zhuān)科的單病種數(shù)據(jù)庫(kù)。臨床數(shù)據(jù)中臨床科研信息豐富,但病歷文本中醫(yī)生書(shū)寫(xiě)語(yǔ)言的模糊性和隨意性以及語(yǔ)法、語(yǔ)義結(jié)構(gòu)的多樣性,給臨床科研目標(biāo)變量的提取帶來(lái)困難。本項(xiàng)目需有效解決院內(nèi)醫(yī)療數(shù)據(jù)(特別是積壓的歷史數(shù)據(jù))的非結(jié)構(gòu)化和非標(biāo)準(zhǔn)化問(wèn)題,滿(mǎn)足科研需求。
(2)加強(qiáng)科研數(shù)據(jù)采集與檢索,滿(mǎn)足不同醫(yī)生的臨床科研個(gè)性化需求。支持普通醫(yī)生等科研人員通過(guò)多維度科研變量來(lái)檢索臨床歷史數(shù)據(jù)進(jìn)行簡(jiǎn)單的回顧性研究。也滿(mǎn)足高水平醫(yī)生通過(guò)自定義eCRF系統(tǒng)自動(dòng)采集臨床科研數(shù)據(jù),實(shí)現(xiàn)前瞻性科研的需要。結(jié)合科研隨訪系統(tǒng),可采集患者報(bào)告結(jié)局,豐富單病種數(shù)據(jù)庫(kù)。采集到的科研數(shù)據(jù)能直接導(dǎo)出支持SAS/SPSS等第三方統(tǒng)計(jì)軟件使用。
(3)提高科研數(shù)據(jù)的統(tǒng)計(jì)分析功能,需要嵌套醫(yī)學(xué)統(tǒng)計(jì)中絕大多數(shù)的統(tǒng)計(jì)方法,能夠依據(jù)數(shù)據(jù)類(lèi)型自動(dòng)選擇最合適的統(tǒng)計(jì)方法,并且自動(dòng)生成統(tǒng)計(jì)報(bào)告。其中統(tǒng)計(jì)報(bào)告包含標(biāo)準(zhǔn)三線(xiàn)表、統(tǒng)計(jì)結(jié)果描述、統(tǒng)計(jì)圖形等。
該平臺(tái)的核心技術(shù)是臨床數(shù)據(jù)治理引擎。它基于先進(jìn)的自然語(yǔ)言處理、知識(shí)圖譜等AI引擎,實(shí)現(xiàn)各類(lèi)臨床數(shù)據(jù)的結(jié)構(gòu)化、標(biāo)準(zhǔn)化和歸一化等處理。針對(duì)數(shù)據(jù)驅(qū)動(dòng)的臨床研究場(chǎng)景,能夠?qū)⑨t(yī)院積存的海量臨床數(shù)據(jù)自動(dòng)結(jié)構(gòu)化、標(biāo)準(zhǔn)化成可被臨床研究直接分析、利用的科研數(shù)據(jù)。
引擎基于通用數(shù)據(jù)模型及各類(lèi)型專(zhuān)病數(shù)據(jù)模型對(duì)臨床文本數(shù)據(jù)做顆?;⒑蠼Y(jié)構(gòu)化處理,運(yùn)用人工智能結(jié)合醫(yī)學(xué)知識(shí)圖譜自動(dòng)轉(zhuǎn)化非結(jié)構(gòu)化文本數(shù)據(jù),以滿(mǎn)足回顧性查詢(xún)所需的數(shù)據(jù)細(xì)化程度。同時(shí)針對(duì)提取出的醫(yī)學(xué)信息,結(jié)合醫(yī)學(xué)知識(shí)圖譜自動(dòng)完成數(shù)據(jù)的標(biāo)準(zhǔn)化,進(jìn)一步提升數(shù)據(jù)的可用性、可交互性。
圖1 臨床數(shù)據(jù)治理
圖2 體檢檢查結(jié)構(gòu)化
圖3 醫(yī)學(xué)知識(shí)圖譜
(1)智能科研檢索
臨床科研中的一個(gè)重要步驟,即對(duì)大量的患者進(jìn)行有效的檢索篩選,以定位其中符合特定臨床研究所需的患者。這個(gè)過(guò)程通常而言需要科研人員對(duì)大量的病歷進(jìn)行閱讀與篩選,耗費(fèi)大量的時(shí)間精力,并且極易出現(xiàn)信息的遺漏。智能科研檢索將基于數(shù)據(jù)治理的成果,對(duì)病人進(jìn)行精準(zhǔn)的、細(xì)顆粒度的建模,從而快速定位和篩選滿(mǎn)足特定條件的病人。
圖4 智能搜索條件設(shè)置
圖5 智能檢索結(jié)果展示
(2)科研隊(duì)列發(fā)現(xiàn)
科研隊(duì)列發(fā)現(xiàn)管理有三個(gè)主要功能,分別為新建隊(duì)列、韋恩圖及訂閱管理。科研隊(duì)列發(fā)現(xiàn)管理方便醫(yī)生針對(duì)項(xiàng)目設(shè)計(jì)所需的隊(duì)列,從而進(jìn)行隊(duì)列研究。
圖6 科研隊(duì)列發(fā)現(xiàn)管理
圖7 基于韋恩圖構(gòu)建新隊(duì)列
(3)患者360科研視圖
由于醫(yī)院信息系統(tǒng)的復(fù)雜性和多樣性,各系統(tǒng)間數(shù)據(jù)分散,標(biāo)準(zhǔn)不一致,難以實(shí)現(xiàn)交換和共享。各種臨床數(shù)據(jù)分散在各個(gè)業(yè)務(wù)系統(tǒng),比如病歷數(shù)據(jù)在電子病歷系統(tǒng)、檢驗(yàn)數(shù)據(jù)存在LIS系統(tǒng)中,無(wú)法實(shí)現(xiàn)分散數(shù)據(jù)資料的互通互聯(lián)集成和有效利用。為解決各信息系統(tǒng)之間的數(shù)據(jù)孤島,實(shí)現(xiàn)系統(tǒng)之間的互聯(lián)互通數(shù)據(jù)集成整合,便于臨床數(shù)據(jù)分析并進(jìn)行深度挖掘,患者360科研視圖實(shí)現(xiàn)患者診療活動(dòng)的全程歷史記錄的多視角瀏覽界面。目標(biāo)是將醫(yī)生關(guān)注的臨床信息以患者為中心進(jìn)行全方位的展現(xiàn),包括門(mén)急診、住院、體檢的患者基本信息、就診記錄、診斷記錄、電子病歷、各種檢查檢驗(yàn)報(bào)告等所有臨床信息,為醫(yī)務(wù)人員的臨床科研提供全面數(shù)據(jù)支持。
圖8 患者360科研視圖界面
(4)科研數(shù)據(jù)采集
1)CRF自動(dòng)填充
針對(duì)臨床科研課題組關(guān)注的數(shù)據(jù)項(xiàng),提供臨床科研表單的自動(dòng)內(nèi)容錄入工具,用戶(hù)可使用電子CRF工具填寫(xiě)課題需要的統(tǒng)計(jì)資料;CRF表單錄入完成之后,用戶(hù)可自行選擇需要的數(shù)據(jù)導(dǎo)出到專(zhuān)業(yè)的統(tǒng)計(jì)工具中做更深入地分析。幫助醫(yī)院快速便捷地完成大量勞動(dòng)重復(fù)工作。
支持通過(guò)CRF編輯器方便制作各類(lèi)CRF表單,包含基本控件如文本、選擇框、日期、數(shù)據(jù)等,和基本模板、歷史項(xiàng)目等三種創(chuàng)建模式,并可配置基本的校驗(yàn)邏輯及跳轉(zhuǎn)邏輯。CRF錄入界面滿(mǎn)足人性化數(shù)據(jù)錄入,分模塊分表單呈現(xiàn),能快速匹配病歷資料、報(bào)告文本、檢驗(yàn)檢查等數(shù)據(jù)點(diǎn),并自動(dòng)完成填寫(xiě)CRF表單;支持WEB/移動(dòng)端同步錄入,滿(mǎn)足多種數(shù)據(jù)格式和邏輯跳轉(zhuǎn),讓數(shù)據(jù)收集更高效智能。
圖9 表單自動(dòng)填寫(xiě)
2)科研數(shù)據(jù)導(dǎo)出
科研平臺(tái)的數(shù)據(jù)可以以Excel、CSV、SAS、SPSS、CDISC等多種數(shù)據(jù)格式的導(dǎo)出,兼容常用的統(tǒng)計(jì)軟件,并支持國(guó)際上臨床試驗(yàn)的CDISC常用標(biāo)準(zhǔn)。用戶(hù)可以自定義篩選所需的變量和配置過(guò)濾條件,導(dǎo)出過(guò)程中可進(jìn)行數(shù)據(jù)分析、校驗(yàn)。
圖10 導(dǎo)出變量選擇
圖11 導(dǎo)出格式選擇
圖12 以表格形式進(jìn)行導(dǎo)出
3)數(shù)據(jù)質(zhì)量核查
平臺(tái)提供系統(tǒng)+人工數(shù)據(jù)雙重核查方式,來(lái)完成對(duì)數(shù)據(jù)質(zhì)量的控制。在此基礎(chǔ)上,另提供三級(jí)數(shù)據(jù)質(zhì)疑管理,使管理者能對(duì)疑義數(shù)據(jù)發(fā)起質(zhì)疑,提示錄入員進(jìn)行數(shù)據(jù)的核查與修改;并保留數(shù)據(jù)稽查及修改軌跡,保證數(shù)據(jù)可溯源。另提供數(shù)據(jù)資產(chǎn)管理功能,用戶(hù)對(duì)專(zhuān)病庫(kù)內(nèi)數(shù)據(jù)的所有操作(修改、讀取、調(diào)用、導(dǎo)出等)均留有記錄,清晰可溯源,方便管理。
圖13 對(duì)可以數(shù)據(jù)進(jìn)行質(zhì)疑
(5)科研統(tǒng)計(jì)
以往的科研統(tǒng)計(jì)分析過(guò)程中,醫(yī)生需要從龐大、結(jié)構(gòu)復(fù)雜的HIS系統(tǒng)或者其他數(shù)據(jù)系統(tǒng)中篩選研究相關(guān)數(shù)據(jù),之后進(jìn)行大量的人工數(shù)據(jù)清洗以及分析型變量的衍生工作,最后利用SPSS或SAS進(jìn)行統(tǒng)計(jì)分析。其中數(shù)據(jù)篩選和人工清洗過(guò)程中可能存在較高錯(cuò)誤率,導(dǎo)致最后研究結(jié)論不可靠。同時(shí)醫(yī)學(xué)科研中普遍存在統(tǒng)計(jì)方法選擇錯(cuò)誤的現(xiàn)象。除此之外,醫(yī)生對(duì)于機(jī)器學(xué)習(xí)相關(guān)應(yīng)用的需求也越發(fā)強(qiáng)烈。數(shù)據(jù)探查統(tǒng)計(jì)平臺(tái)包括自定義查詢(xún)、數(shù)據(jù)清洗與智能統(tǒng)計(jì)分析三大模塊。
圖14 科研數(shù)據(jù)探查統(tǒng)計(jì)平臺(tái)
圖15 智能統(tǒng)計(jì)分析表
(6)科研駕駛艙
項(xiàng)目管理者可使用科研駕駛艙對(duì)整個(gè)醫(yī)院的科研項(xiàng)目進(jìn)行綜合查看??蒲旭{駛艙接受各系統(tǒng)傳入的數(shù)據(jù),對(duì)它們進(jìn)行整合加工,并以可視化的形式展現(xiàn),提供直觀的支持科研決策的信息。
圖16 科研駕駛艙
(7)科研隨訪
隨訪管理。隨訪管理以科研項(xiàng)目的數(shù)據(jù)收集為目的,個(gè)性化配置隨訪表單和方案,實(shí)現(xiàn)智能化的隨訪提醒和標(biāo)準(zhǔn)化數(shù)據(jù)采集。
圖17 設(shè)置隨訪事件矩陣
圖18 患者隨訪管理
(8)數(shù)據(jù)安全權(quán)限管理
數(shù)據(jù)安全隱私管理包括數(shù)據(jù)權(quán)限控制、數(shù)據(jù)去隱私化、數(shù)據(jù)解密等。該方案涉及的所有臨床數(shù)據(jù)均存儲(chǔ)在醫(yī)院的核心機(jī)房?jī)?nèi),接受統(tǒng)一監(jiān)管。在面向臨床研究和患者服務(wù)方面均遵循醫(yī)療行業(yè)的倫理規(guī)范和信息安全等級(jí)保護(hù)規(guī)范,僅提供業(yè)務(wù)所需最小數(shù)據(jù)集,同時(shí)進(jìn)行訪問(wèn)審計(jì)。例如在臨床研究場(chǎng)景中,對(duì)于一類(lèi)患者信息(姓名、家庭地址、身份證)進(jìn)行加密,避免患者隱私泄露。
圖19 安全管理與權(quán)限設(shè)置
系統(tǒng)管理模塊有用戶(hù)權(quán)限管理、病歷匿名化等數(shù)據(jù)訪問(wèn)安全管理等功能:
權(quán)限賦予:添加新用戶(hù),并根據(jù)新用戶(hù)身份對(duì)其賦予不同的權(quán)限,包括管理員、一般用戶(hù)、隨訪角色、科研角色等。對(duì)已有角色進(jìn)行編輯、刪除以及角色權(quán)限變更;
權(quán)限配置:不同的數(shù)據(jù)權(quán)限擁有不同的數(shù)據(jù)瀏覽與檢索權(quán)限:包括全院層級(jí)數(shù)據(jù)、科室層級(jí)數(shù)據(jù)、所在醫(yī)療組層級(jí)數(shù)據(jù)的瀏覽與檢索;
病歷匿名化管理:對(duì)于病歷進(jìn)行匿名化處理,保護(hù)患者隱私與信息安全。開(kāi)啟病歷匿名化后,可選擇對(duì)患者的姓名、手機(jī)號(hào)、身份證、電話(huà)號(hào)碼等隱私信息進(jìn)行隱藏。
在繁雜的臨床數(shù)據(jù)中提取特定病種的科研數(shù)據(jù)集,首先需要制定面向特定病種的專(zhuān)用數(shù)據(jù)模型。針對(duì)項(xiàng)目所涉及的病種,依據(jù)當(dāng)前醫(yī)院所有的專(zhuān)病數(shù)據(jù)情況及研究方向,搜集國(guó)內(nèi)外相關(guān)疾病數(shù)據(jù)模型以及單病種數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行整理薈萃用以參考借鑒,進(jìn)一步完善病種數(shù)據(jù)模型,構(gòu)建符合實(shí)際研究需要的專(zhuān)病數(shù)據(jù)集。
在構(gòu)建專(zhuān)病數(shù)據(jù)模型時(shí),我們首先定義了專(zhuān)病通用標(biāo)準(zhǔn)數(shù)據(jù)集。專(zhuān)病數(shù)據(jù)集標(biāo)準(zhǔn)定義了病例所包含的各類(lèi)信息,如:患者基本信息、就診記錄、癥狀、診斷、實(shí)驗(yàn)室檢查、藥物治療、手術(shù)記錄、病理記錄、影像學(xué)檢查、內(nèi)鏡檢查、既往病史、個(gè)人史、嗜好品信息、月經(jīng)、婚育史、家族史、體格檢查、生命體征、專(zhuān)科檢查、護(hù)理記錄信息,為單病種數(shù)據(jù)模型的構(gòu)建提供標(biāo)準(zhǔn)化數(shù)據(jù)基礎(chǔ)。
通過(guò)搜集、整合各種國(guó)內(nèi)外專(zhuān)病的數(shù)據(jù)標(biāo)準(zhǔn),并針對(duì)醫(yī)院專(zhuān)科病歷進(jìn)行模型微調(diào),最終形成適合醫(yī)院特定專(zhuān)科的專(zhuān)病數(shù)據(jù)標(biāo)準(zhǔn)集,從而構(gòu)建高質(zhì)量專(zhuān)病數(shù)據(jù)庫(kù)。
(1)專(zhuān)病庫(kù)概況
專(zhuān)病庫(kù)建設(shè)概覽,通過(guò)對(duì)數(shù)據(jù)集成、變量加工方式和結(jié)果展示,展現(xiàn)高質(zhì)量的專(zhuān)病數(shù)據(jù)庫(kù)概況。
第一,支持展示專(zhuān)病庫(kù)概況,包括專(zhuān)病庫(kù)的累計(jì)納入的患者和病歷數(shù),以及治理變量總數(shù);
第二,支持展示專(zhuān)科病種條圖,顯示專(zhuān)病數(shù)據(jù)庫(kù)里診斷歸一名稱(chēng)及相應(yīng)入庫(kù)患者數(shù)量,并以可視圖展示;
第三,支持展示專(zhuān)病數(shù)據(jù)集治理過(guò)程中具有代表性的變量狀況;
第四,支持用戶(hù)針對(duì)專(zhuān)病庫(kù)中已配置的單一變量選擇可視化展示。
圖20 專(zhuān)病庫(kù)概覽
(2)專(zhuān)病數(shù)據(jù)庫(kù)設(shè)置
1)數(shù)據(jù)庫(kù)管理通過(guò)專(zhuān)病庫(kù)設(shè)置功能對(duì)專(zhuān)病庫(kù)相關(guān)信息進(jìn)行設(shè)置,包括專(zhuān)病庫(kù)名稱(chēng)、所屬領(lǐng)域、項(xiàng)目標(biāo)簽的設(shè)置;
2)支持角色與權(quán)限管理,新增和管理專(zhuān)病庫(kù)的角色。對(duì)各用戶(hù)角色的權(quán)限按照系統(tǒng)功能進(jìn)行配置管理,包括主要研究者、協(xié)助研究、錄入員、賬號(hào)管理員;
圖21 數(shù)據(jù)庫(kù)管理
3)支持成員管理,添加和管理專(zhuān)病庫(kù)的成員。支持符合專(zhuān)病庫(kù)入庫(kù)條件的新患者自動(dòng)加入專(zhuān)病庫(kù),支持在數(shù)據(jù)集設(shè)計(jì)階段確認(rèn)專(zhuān)病數(shù)據(jù)庫(kù)的入排條件,實(shí)現(xiàn)專(zhuān)病庫(kù)上線(xiàn)后符合條件的患者自動(dòng)加入專(zhuān)病庫(kù)。
(3)專(zhuān)病科研項(xiàng)目
專(zhuān)病項(xiàng)目可進(jìn)行科研項(xiàng)目設(shè)置以及數(shù)據(jù)質(zhì)疑設(shè)置,支持專(zhuān)病項(xiàng)目數(shù)據(jù)庫(kù)導(dǎo)出與數(shù)據(jù)探索。
1)支持項(xiàng)目?jī)?nèi)角色與權(quán)限管理,新增和管理專(zhuān)病項(xiàng)目角色;
2)支持專(zhuān)病庫(kù)數(shù)據(jù)集中已有數(shù)據(jù)自動(dòng)填充至專(zhuān)病項(xiàng)目中;
圖22 結(jié)構(gòu)化數(shù)據(jù)截圖
3)支持手動(dòng)錄入和修改數(shù)據(jù),并保留數(shù)據(jù)提交、修改的稽查軌跡;
4)支持?jǐn)?shù)據(jù)核查與質(zhì)疑;滿(mǎn)足系統(tǒng)核查、人工核查兩種核查方式。提供數(shù)據(jù)質(zhì)疑管理,包括查看、回復(fù)、關(guān)閉、重啟、導(dǎo)出質(zhì)疑,不同角色擁有不同權(quán)限;
5)支持專(zhuān)病項(xiàng)目通過(guò)數(shù)據(jù)探索進(jìn)行導(dǎo)出,并支持展示數(shù)據(jù)導(dǎo)出的操作日志;數(shù)據(jù)探索支持變量選擇,字段搜索,支持多變量互斥邏輯判定;創(chuàng)建、刪除、修改數(shù)據(jù)查詢(xún);對(duì)查詢(xún)數(shù)據(jù)進(jìn)行簡(jiǎn)單與高級(jí)篩選;對(duì)查詢(xún)數(shù)據(jù)進(jìn)行數(shù)據(jù)診斷;查詢(xún)結(jié)果與全部數(shù)據(jù)導(dǎo)出,導(dǎo)出格式為Excel/CSV/SPSS/SAS;
6)支持專(zhuān)病項(xiàng)目的數(shù)據(jù)清洗,提供變量分級(jí)、類(lèi)別轉(zhuǎn)變量、記錄合并、多選轉(zhuǎn)單選、缺失值填補(bǔ)、剔除文本、記錄替換、變量拆分的清洗工具;
圖23 數(shù)據(jù)清洗界面
7)支持專(zhuān)病項(xiàng)目的數(shù)據(jù)統(tǒng)計(jì)分析:提供描述性分析、差異性分析的個(gè)性化統(tǒng)計(jì)分析,可視化并導(dǎo)出相應(yīng)統(tǒng)計(jì)分析結(jié)果;
圖24 數(shù)據(jù)統(tǒng)計(jì)分析新建任務(wù)界面
8)支持統(tǒng)計(jì)分析預(yù)測(cè)模型,包括隨機(jī)森林、線(xiàn)性回歸、Logistic預(yù)測(cè)模型。
(1)系統(tǒng)院內(nèi)部署
科研平臺(tái)及專(zhuān)病庫(kù)部署于醫(yī)院內(nèi)部服務(wù)器中,與外界網(wǎng)絡(luò)不直接互通,可有效保障院內(nèi)數(shù)據(jù)不外流。所有的院內(nèi)數(shù)據(jù)均存儲(chǔ)在醫(yī)院的核心機(jī)房?jī)?nèi),接受統(tǒng)一監(jiān)管。
(2)獨(dú)立部署系統(tǒng)
科研平臺(tái)及專(zhuān)病庫(kù)獨(dú)立部署于醫(yī)院內(nèi)部,不和醫(yī)院其他系統(tǒng)嵌合,同時(shí)使用數(shù)據(jù)庫(kù)復(fù)制技術(shù)對(duì)生產(chǎn)系統(tǒng)數(shù)據(jù)庫(kù)業(yè)務(wù)數(shù)據(jù)表進(jìn)行復(fù)制,在建立的復(fù)制庫(kù)上進(jìn)行數(shù)據(jù)抽取和治理,保證對(duì)生成系統(tǒng)數(shù)據(jù)庫(kù)性能無(wú)影響,不會(huì)影響醫(yī)院業(yè)務(wù)系統(tǒng)的正常運(yùn)營(yíng)。
(3)用戶(hù)權(quán)限管理和患者隱私保護(hù)
科研平臺(tái)及專(zhuān)病庫(kù)內(nèi)對(duì)患者的隱私保護(hù)有多個(gè)維度措施,在存放個(gè)人信息時(shí),采用加密技術(shù)對(duì)個(gè)人信息字段進(jìn)行,例如:姓名、家庭地址、身份證等。在展示界面中對(duì)于敏感數(shù)據(jù)的相對(duì)于字段采用數(shù)據(jù)脫敏技術(shù),例如變形處理。并限制用戶(hù)的查詢(xún)權(quán)限,最小夠用原則,后臺(tái)進(jìn)行訪問(wèn)審計(jì)。
(1)建立醫(yī)院高質(zhì)量數(shù)據(jù)資產(chǎn)
以疾病為單元,構(gòu)建覆蓋患者全病程數(shù)據(jù)的科研數(shù)據(jù)庫(kù),通過(guò)自然語(yǔ)言處理、機(jī)器學(xué)習(xí)等技術(shù)使多源異構(gòu)的臨床數(shù)據(jù)變成滿(mǎn)足臨床研究細(xì)粒度要求、可直接用于臨床研究統(tǒng)計(jì)分析使用的結(jié)構(gòu)化、標(biāo)準(zhǔn)化的高質(zhì)量數(shù)據(jù),為醫(yī)院實(shí)現(xiàn)數(shù)據(jù)應(yīng)用奠定堅(jiān)實(shí)的研究級(jí)數(shù)據(jù)基礎(chǔ)。
本平臺(tái)完成全院2009年至2020年9月全量超700W+電子病歷數(shù)據(jù),診斷標(biāo)準(zhǔn)化分類(lèi)重構(gòu),包含:
74個(gè)申請(qǐng)單分類(lèi)
1479個(gè)申請(qǐng)單
1092個(gè)檢驗(yàn)指標(biāo)
5.5億條檢驗(yàn)明細(xì)數(shù)據(jù)
圖25 診斷標(biāo)準(zhǔn)化分類(lèi)重構(gòu)截圖
(2)構(gòu)建智能化臨床研究分析平臺(tái)
臨床研究平臺(tái)融合人工智能技術(shù),實(shí)現(xiàn)復(fù)雜的患者檢索、靈活的項(xiàng)目管理、全面的數(shù)據(jù)質(zhì)量管控、自動(dòng)化數(shù)據(jù)清洗、高效的數(shù)據(jù)分析挖掘等功能,輔助醫(yī)生提高科研效率,降低臨床研究門(mén)檻,提升科研積極性。
圖26 臨床科研平臺(tái)上線(xiàn)截圖
圖27 智能隨訪上線(xiàn)截圖
(3)推動(dòng)臨床科室向“研究型”學(xué)科發(fā)展
通過(guò)為科室建設(shè)專(zhuān)病數(shù)據(jù)庫(kù),積累科室豐富的專(zhuān)病數(shù)據(jù),為科室進(jìn)行臨床研究思路的探尋和專(zhuān)病多中心研究的開(kāi)展提供高效的工具,加速科室研究型人才培養(yǎng),促進(jìn)科室學(xué)科發(fā)展,推進(jìn)科室建成為一流研究型科室。
圖28 專(zhuān)病庫(kù)制作截圖
(4)助力醫(yī)院成為國(guó)內(nèi)數(shù)據(jù)驅(qū)動(dòng)型醫(yī)院
通過(guò)歷史電子醫(yī)療數(shù)據(jù)和實(shí)時(shí)醫(yī)療數(shù)據(jù)的集成與治理,建設(shè)醫(yī)院特色的高質(zhì)量專(zhuān)病數(shù)據(jù)資產(chǎn)庫(kù),依托大數(shù)據(jù)平臺(tái),充分挖掘醫(yī)院醫(yī)療大數(shù)據(jù),構(gòu)建“臨床行為產(chǎn)生數(shù)據(jù),洞察數(shù)據(jù)輔助決策,反饋臨床行為”的數(shù)據(jù)驅(qū)動(dòng)閉環(huán)流程,從而以數(shù)據(jù)的角度提高醫(yī)院臨床治療效果與臨床質(zhì)量。
圖29 全院培訓(xùn)現(xiàn)場(chǎng)