91日韩精品视频-91日韩视频在线观看-91日韩天堂一区二区二区-91日日夜夜人人精-91日亚欧国产内射成人网-91三级在线日韩精品片

廣州醫(yī)科大學附屬第二醫(yī)院:構(gòu)建大數(shù)據(jù)科研平臺實現(xiàn)“一站式”工作模式【CHIMA 2019案例分享】

發(fā)布時間:2019-06-13
瀏覽次數(shù):

案例提供:廣州醫(yī)科大學附屬第二醫(yī)院



案例概要


廣州醫(yī)科大學附屬第二醫(yī)院(簡稱廣醫(yī)二院),是一所集醫(yī)、教、研于一體的大型三甲綜合醫(yī)院,也是廣州市重要的醫(yī)療診治、醫(yī)學教育及醫(yī)學研究機構(gòu)。尤其在科研方面,過去十年,在神經(jīng)內(nèi)科、心血管疾病、外科學、急診醫(yī)學都多個領(lǐng)域都取得了重大突破,建立了數(shù)個重點學科及重點實驗室,并獲得各級課題立項超600余項,為醫(yī)院的綜合實力提升做出了巨大貢獻。


但與此同時,傳統(tǒng)科研模式中存在的數(shù)據(jù)獲取難、統(tǒng)計分析難、論文總結(jié)難等弊端,也一直困擾著臨床醫(yī)生,成為阻礙科研工作進一步發(fā)展的最大壁壘。亟需找到一種方法,來緩解日益增長的科研需求與數(shù)據(jù)挖掘利用困難之間的矛盾,簡化科研流程、提高科研效率,加速成果轉(zhuǎn)化。


在此背景下,我院基于原有數(shù)據(jù)中心,建立了大數(shù)據(jù)科研分析平臺。該平臺是以智能醫(yī)學數(shù)據(jù)中臺為基礎(chǔ),通過數(shù)據(jù)采集、治理,以及自然語言分詞、機器學習、知識圖譜等大數(shù)據(jù)處理和建模技術(shù),整合并挖掘院內(nèi)電子病歷、檢驗檢查、醫(yī)療影像、基因序列以及院外隨訪、課題數(shù)據(jù)庫等在內(nèi)的海量醫(yī)療數(shù)據(jù),構(gòu)建以疾病為中心、具有完整時間序列的高質(zhì)量專病數(shù)據(jù)庫;并利用機器學習算法及統(tǒng)計分析模型等,實現(xiàn)對數(shù)據(jù)的深度解析與可視化,形成覆蓋從科研構(gòu)思到數(shù)據(jù)統(tǒng)計分析的全流程“一站式”工作模式。此外,還可以通過大數(shù)據(jù)分析提取出疾病重點特征,訓練智能預(yù)測引擎,實現(xiàn)對疾病危險因素的預(yù)測等,促使科研成果有效轉(zhuǎn)化臨床,提升醫(yī)療服務(wù)質(zhì)量。


智能醫(yī)學數(shù)據(jù)中臺架構(gòu)如下圖所示:



解決的主要問題


1.輔助科研構(gòu)思


傳統(tǒng)模式下,科研人員在面對雜亂無章的海量數(shù)據(jù)時,往往很難在第一時間發(fā)現(xiàn)數(shù)據(jù)潛在的關(guān)聯(lián)關(guān)系,提出有效的科研假設(shè);同時,也無法在實驗開始前驗證研究思路的可行性,存在后期因數(shù)據(jù)質(zhì)量等問題導(dǎo)致實驗失敗的風險?;诖?,大數(shù)據(jù)科研分析平臺通過文獻復(fù)習、數(shù)據(jù)回顧和可行性研究三種路徑,在實驗設(shè)計階段即幫助科研人員很好地解決了上述問題。


(1)文獻復(fù)習:通過平臺知識庫,可以讓醫(yī)生方便地查找相關(guān)文獻,了解研究現(xiàn)狀及最新發(fā)展;


(2)數(shù)據(jù)回顧:通過對全院或各科室門急診人次、住院人次、時間分布等情況的回顧統(tǒng)計,或?qū)颊叻植?、疾病分布等進行多維特征分析,可以快速找出其中隱含的知識或規(guī)律,幫助創(chuàng)新科研思路;


(3)可行性研究:在統(tǒng)計學處理模塊,系統(tǒng)可對所選變量的數(shù)據(jù)完整度進行預(yù)覽,若數(shù)據(jù)缺失程度過高,則認為該統(tǒng)計結(jié)果不成立,需要重新調(diào)整或改變研究思路,提高實驗成功幾率。

 

2.輔助數(shù)據(jù)獲取


以往科研數(shù)據(jù)絕大部分都是基于CRF表格,通過臨床科室與信息科、檔案室、統(tǒng)計室等協(xié)調(diào)后傳遞給醫(yī)生,數(shù)據(jù)還有可能不合要求,費時費力且效果不佳。大數(shù)據(jù)科研分析平臺通過集成院內(nèi)外全量疾病相關(guān)數(shù)據(jù),可實現(xiàn)多種形式、不同維度的數(shù)據(jù)實時檢索,查詢結(jié)果秒級返回,召回率可達90%以上,大大提高了數(shù)據(jù)獲取的效率及準確性。

 

3.輔助數(shù)據(jù)處理


由于病歷中存在著大量自由文本數(shù)據(jù),無法直接用于科研,依靠人工轉(zhuǎn)錄不僅耗時耗力且極容易出錯。利用大數(shù)據(jù)科研分析平臺的自然語言處理、數(shù)據(jù)歸一等技術(shù),則可輕松實現(xiàn)對數(shù)據(jù)的后結(jié)構(gòu)化處理,以及標準化、清洗、量化等,形成計算機可識別、可利用的有效信息。

 

4.輔助統(tǒng)計分析


統(tǒng)計分析是科研活動中的環(huán)節(jié)關(guān)鍵之一,也是制約科研產(chǎn)出的主要壁壘。以往醫(yī)生通常需要手工采集、導(dǎo)出數(shù)據(jù),處理后再導(dǎo)入SPSS/SAS進行統(tǒng)計學分析,過程繁瑣且容易出現(xiàn)錯誤。大數(shù)據(jù)科研分析平臺通過集成R算法,可根據(jù)課題研究目的及分組情況自動選擇合適的統(tǒng)計模型,包括比較均值分析、非參檢驗、回歸分析、相關(guān)性分析等,有效提升了科研效率及質(zhì)量。

 

5.輔助數(shù)據(jù)質(zhì)控


臨床科研對數(shù)據(jù)質(zhì)量有著極高的要求,但實際中的數(shù)據(jù)卻存在很多問題,如:數(shù)據(jù)表示不統(tǒng)一,數(shù)據(jù)不一致、不完整,錯誤數(shù)據(jù)等,嚴重影響著其在疾控、臨床、疾病預(yù)測等方面的適用性。大數(shù)據(jù)科研分析平臺可提供對科研全變量的實時數(shù)據(jù)質(zhì)控,包括數(shù)據(jù)缺失、異常值等,為醫(yī)生選擇科研統(tǒng)計指標提供參照,避免到研究終末階段因數(shù)據(jù)質(zhì)量不合格導(dǎo)致數(shù)據(jù)重復(fù)采集和研究周期拉長等問題。同時,還可將問題溯源至原始病歷,促進病歷書寫質(zhì)量的改進,從而提升科研數(shù)據(jù)采集質(zhì)量。


數(shù)據(jù)內(nèi)容


我院利用大數(shù)據(jù)臨床科研平臺,將院內(nèi)數(shù)據(jù)(醫(yī)院數(shù)據(jù)中心HDR)與課題數(shù)據(jù)庫集成后,經(jīng)過整合、清洗、標記、解析、對齊等數(shù)據(jù)處理和自然語言分詞后,輸入到數(shù)據(jù)中臺,可方便醫(yī)生通過科研平臺直接進行研究人群的篩選、確定、關(guān)聯(lián)分析,以及對數(shù)據(jù)質(zhì)量的核對、統(tǒng)計建模分析等。

 

截至目前,我院大數(shù)據(jù)科研平臺已累積經(jīng)過規(guī)范化處理的住院患者232,813人次,門診患者9,253,814人次,覆蓋包括病歷文書、醫(yī)囑、檢驗檢查報告、課題隨訪數(shù)據(jù)等在內(nèi)的37種文檔類型,總量達36,688,402份。平臺開放變量4000余維,其中經(jīng)過自然語言處理之后的變量可占80%。

 

平臺目前已開通醫(yī)生使用賬號336個,輔助醫(yī)生搭建完成專病庫200多個,研究課題10余項,累計登錄次數(shù)達2500余次。與傳統(tǒng)人工操作相比,無論數(shù)據(jù)質(zhì)量、科研效率及還是成果產(chǎn)出,均有明顯提升。



關(guān)鍵技術(shù)


1.多層次醫(yī)療術(shù)語抽取技術(shù)


基于對病歷數(shù)據(jù)的深入理解,設(shè)計了一種基于多層次醫(yī)療術(shù)語抽取技術(shù)的醫(yī)學自然語言處理方法,以實現(xiàn)對病歷自由文本的語義分詞。語義分詞與傳統(tǒng)標簽分詞的區(qū)別主要體現(xiàn)在病歷數(shù)據(jù)本身復(fù)雜的分級結(jié)構(gòu)上,傳統(tǒng)標簽分詞是實體抽取,詞性標注,缺乏上下文語義性關(guān)聯(lián),語義分詞則能達到串聯(lián)病歷復(fù)雜分級結(jié)構(gòu)的效果。如:10年前,患者的癥狀是什么?癥狀的持續(xù)時間多長?恢復(fù)方式是什么?近期又是什么臨床表現(xiàn)?



2.數(shù)據(jù)歸一


“數(shù)據(jù)歸一”是保證數(shù)據(jù)檢索快速、精準的必不可少的核心工作,包含診斷、實驗室檢查、手術(shù)名稱、藥物名稱等專用名詞的歸一。由于病歷會持續(xù)產(chǎn)生新的非標準詞匯,需要一個增量模式去擴展詞庫。平臺以標準詞匯庫為中心,對病歷中出現(xiàn)的非標準醫(yī)療詞匯,通過機器學習技術(shù)和人工標注相結(jié)合,將意義相同的醫(yī)療詞匯進行歸一處理,持續(xù)擴大詞庫,滿足動態(tài)變化需求。



3.醫(yī)療知識圖譜構(gòu)建與應(yīng)用


醫(yī)療知識圖譜,是在醫(yī)療命名、實體及其屬性信息抽取的基礎(chǔ)上,構(gòu)建出的不同命名實體之間的關(guān)聯(lián)模型。平臺針對醫(yī)療數(shù)據(jù)跨語種、專業(yè)性強、結(jié)構(gòu)復(fù)雜等特點,利用馬爾可夫隨機場、貝葉斯網(wǎng)絡(luò)等概率圖模型方法,從大量結(jié)構(gòu)化、非結(jié)構(gòu)化的醫(yī)學數(shù)據(jù)中提取出實體、關(guān)系、屬性等知識圖譜的組成元素,以合理高效的方式存入知識庫;并對知識庫內(nèi)容進行消歧和鏈接處理,大大增強了其內(nèi)部邏輯性與表達能力。通過知識圖譜,可以完成知識推理,輔助疾病診斷、治療等。



4.統(tǒng)計分析R語言的無縫接入


R是一套完整的數(shù)據(jù)處理、計算和制圖的開源軟件系統(tǒng),功能包括:數(shù)據(jù)存儲和處理;數(shù)組運算;完整連貫的統(tǒng)計分析工具;優(yōu)秀的統(tǒng)計制圖功能;簡便強大的編程語言。鑒于其開源性和在統(tǒng)計分析方面的強大優(yōu)勢,大數(shù)據(jù)科研分析平臺無縫接入R語言,實現(xiàn)多種醫(yī)學常用統(tǒng)計分析方法及決策樹和主成分分析等數(shù)據(jù)挖掘算法,保證科研過程流暢性的同時,也提高了研究過程數(shù)據(jù)階段分析的可行性,降低了臨床研究人員使用統(tǒng)計工具的門檻。


成果成效


1.“一站式”科研工作模式


(1)研究對象篩選:支持多種篩選模式靈活組合,可自助篩選研究對象,并根據(jù)入排條件動態(tài)更新研究對象數(shù)量;



(2)確定課題信息并建立研究分組:完成對象篩選后,需進一步確定研究基本信息,如目的、類型、起止時間等;之后根據(jù)課題需要,可靈活創(chuàng)建多個研究組別或亞組;



(3)統(tǒng)計分析及結(jié)果解讀:平臺通過嵌入R語言,實現(xiàn)了對數(shù)據(jù)的實時在線統(tǒng)計分析,目前已涵蓋包括獨立樣本T檢驗、卡方檢驗等在內(nèi)的30余種常用統(tǒng)計算法;同時也支持對統(tǒng)計結(jié)果的解讀,使醫(yī)生能夠更好地選擇統(tǒng)計算法及統(tǒng)計結(jié)果。



2.數(shù)據(jù)導(dǎo)出服務(wù)


平臺可提供基于多維變量的數(shù)據(jù)導(dǎo)出,并可實現(xiàn)檢驗指標相對時間計算和導(dǎo)出值域自動量化等。



3.個案視圖


平臺通過整合患者在院期間的各類門急診、住院就診記錄,可通過時間軸進行統(tǒng)一展示,方便醫(yī)生全面了解患者情況。



4.專病庫建立


此外,平臺還支持對已有數(shù)據(jù)庫的導(dǎo)入,對其數(shù)據(jù)進行處理分析,從而輔助建立高質(zhì)量專病庫。目前,我院已建成9個單病種專病庫,包括:腦梗塞、乳腺腫瘤、冠心病、過敏性鼻炎、膿毒癥、下肢深靜脈血栓、椎間盤突出、帶狀皰疹后神經(jīng)痛、癲癇。

 

5.文獻檢索


平臺可提供對1400多萬種中外文獻的摘要檢索服務(wù),方便醫(yī)生隨時查閱。



6.權(quán)限管理


平臺提供靈活的權(quán)限管理機制??赏ㄟ^不同層級的權(quán)限設(shè)置,確保對患者數(shù)據(jù)應(yīng)用安全的最大保障。



下一步計劃


1.構(gòu)建智能預(yù)測引擎


智能預(yù)測引擎,是利用影響因素分析、主成分分析、決策樹等多種數(shù)據(jù)挖掘算法,從專病庫中提取出重點疾病特征,并通過相關(guān)真實病歷的機器學習和模型訓練,得出疾病精準預(yù)測規(guī)則,納入到知識庫中。這樣,在臨床遇到相似病例時,即可觸發(fā)該規(guī)則,實現(xiàn)對患者相關(guān)疾病危險因素的預(yù)測分析、疾病嚴重程度分級、治療效果評估等,從而提高和改善臨床診療質(zhì)量。


 


目前,我院已積攢包含30余種疾病類型、12大分析主題的近百個模型知識庫,用來對疾病的再手術(shù)、再入院、并發(fā)癥以及生存期等進行預(yù)測分析,并可針對疾病不同干預(yù)方式進行療效評價。未來,將逐步探索將模型知識應(yīng)用于實際臨床業(yè)務(wù),用以進行疾病危險程度評估和手術(shù)預(yù)警等,使科研成果能夠更好地服務(wù)臨床,擴大臨床效益。



2.多中心協(xié)作網(wǎng)絡(luò)建設(shè)


此外,我院大數(shù)據(jù)科研分析平臺目前主要還是支持本院的單中心研究。未來,發(fā)展協(xié)作網(wǎng)絡(luò)、開展多中心研究將是優(yōu)化臨床實踐和學科探索的必然趨勢。因此,將利用該平臺大力發(fā)展涉及大樣本、多中心的實驗,以智能化科研工作模式支持醫(yī)生搭建協(xié)同研究網(wǎng)絡(luò),快速積累病例、縮短研究周期,開展大規(guī)?;仡櫺曰蚯罢靶匝芯?,以提高研究水平,獲取高質(zhì)量研究成果。



【CHIMA 2019】關(guān)于召開“2019中國醫(yī)院協(xié)會信息網(wǎng)絡(luò)大會暨中外醫(yī)療信息網(wǎng)絡(luò)技術(shù)和產(chǎn)品展覽會”(CHIMA 2019)的通知

【CHIMA 2019】讀書、知識、創(chuàng)新——CHIMA 2019書展啟動

【CHIMA 2019】醫(yī)院信息化便民惠民典型案例征集

【CHIMA 2019】醫(yī)院大數(shù)據(jù)應(yīng)用典型案例推薦

【CHIMA 2019】征文通知


主站蜘蛛池模板: 欧美另类精品不卡| 亚洲理论片在线观| 麻豆久久婷婷国产综合五月| 人妻中文系列无码专区| 新国产三级视频| 在线精品无码字幕无码av| 亚洲中文字幕无码av| 亚洲av无码专区亚洲av伊甸园| 少妇呻吟白浆高潮啪啪69| 无码少妇中文av| 人妻少妇被粗大爽9797PW| 精品樱空桃一区二区三区| 国产精品久久久久人妻无码| 99精品国产一区二区三区| 国产女人久久精品| 人妻一区二区三区在线播放| 亚洲妇女自偷自偷图片 | 国产成a人亚洲精品无码樱花| 啪啪啪动态图| 精品视频一区二区三区四区| 无码一区二区三区在线| 最新国产乱子伦真实在线观看 | 亚洲国产成人精品影院| 日韩精品国产二区三区久久| 金品梅2百度影音| 纯肉高H肉辣浪荡NP论J| 国产清纯91天堂在线观看| 少妇伦子伦精品无码styles| 在线观看欧美一区二区三区| 五月激情丁香婷婷综合中文字幕| 久久中文精品无码中文字幕| 国产精品二区在线| 91麻豆精品久久毛片一级| 久久无码精品一区二区| 亚洲精品无码久久久影院相关影片| 亚洲国产欧美日韩精品一区二区三| 人妻无码AⅤ中文系列久久免费| 国产成人精品亚洲av无人区一区| 精品无码一区二区三区亚洲桃色| 亚洲国产日韩精品一区二| 亚洲欧美aⅴ在线资源|