大模型上崗三甲醫院,給每個醫生都配個“病歷質控助手”
來源:量子位 | 公眾號 QbitAI
作者:金磊、夢晨
家人們,撰寫和修改病歷這事兒,那個讓無數醫生耗時耗力的環節——
病歷內涵質控,現在有了大模型來當得力幫手。
所謂病歷內涵質控,簡單來說指的就是對病歷內容的質量控制。
那它為什么會讓醫生們如此耗時耗力呢?
首先,病歷本身就會完整、真實地反映出診療的全過程,不論對于患者或者醫生,還是對醫院的管理而言,重要程度都不言而喻。
畢竟從前期的出診,到后期的治療方案、查房、手術等眾多環節,病歷都會貫穿其中,收納、承載和呈現所有相關信息。每一份病歷涉及到的信息量都是非常大,也是非常關鍵的。
而病歷內涵質控,強調的是一種邏輯質控,難點就是邏輯非常抽象,定義和規則也不通俗;要把控它的質量就需要深厚且全面的臨床經驗和知識。
也正因如此,一般人還真做不了這事,醫院傳統的“解法”就是——
組建專家團隊,定時對歸檔病歷(尤其是重點病患)進行人工質控。
這種解法自然費時費力,而且它還很難對所有病歷進行遍歷,更多時候只能針對少部分病歷進行抽查。
△圖:由DALL·E 3生成
正如我們剛才提到的,現在這件難事兒,已經靠大模型的輔助,找到了一種能兼顧效率和質量的解法。
而且縱觀整個“AI+醫療”賽道,很多醫療信息化廠商都將大模型應用落地的箭頭指向類似病歷內涵質控這樣的應用“靶點”。
之所以如此,是因為處理病歷這項工作,正與大模型的“氣質”極其相符——專治繁瑣、量大的信息處理工作。
由此便可以讓醫生從中解放出更多的時間,投入到更匹配其專業方向的工作中。
那么具體效果如何?是否能達到醫院的標準呢?
醫療大模型,已經可以做到“快準狠”了
在專攻用大模型搞病歷內涵質控這件事上,惠每科技可以說是擁有相當豐富的經驗,是已經在多家醫院(包括三甲醫院)“上崗”并收獲大量好評的那種。
醫療大模型效果如何,我們不妨來看下惠每科技交出的“作業”。
△圖:基于不同質控規則的大模型缺陷定位實例
在惠每科技醫療大模型的加持之下,現在從醫生書寫病歷開始,它就會伴隨在旁,像個隱形的“專家級”助手,同步就會開始糾錯、提醒的工作了。
例如在上圖的三個場景中,分別對應的情況是:
■ 初步診斷中提及“前列腺術后”,但在現病史、既往史、手術外傷史中均缺少相關描述
■ 主訴“發現皮疹45分鐘”,但現病史中的癥狀描述與主訴大相徑庭
■ 病歷記錄患者“否認手術外傷史”,但體格檢查中明確記載有大腿可見局部手術瘢痕
這些細節內容要是放在之前,都是需要醫生們仔細比對校驗,并根據經驗知識來甄別、挑錯的,可實際上,不同醫生在經驗、資歷甚至是專業方向上的差別,都會讓這些細節的發現、校驗和應對變得異常復雜。
但現在,有了醫療大模型的輔助,這個助手總會默默地在合適的時機出現,把可能存在問題的內容給pick出來,供醫生們快速做判斷。
具體到病歷內涵質控的運行機制,惠每科技則是以數據中臺為核心,向下對接醫院的醫院信息系統(HIS)、影像歸檔和信息系統(PACS),以及電子病歷歸檔系統(EMR)等。
在自動抓取內容信息之后,會通過自然語言處理、術語標準化后構建患者畫像,再經由惠每醫療大模型推理計算做出提醒或預警,同時大模型還可以基于用戶的反饋持續進行優化。
△圖:惠每科技病歷內涵質控方案架構
最終,在界面的呈現上,惠每科技這個系統會有醫生端和管理端兩種:
醫生在醫生端快速做錯誤檢測和處理,專家在管理端做更進一步的專業性查缺補漏。
由此,原先那種費時費力、費人費腦的病歷內涵質控,不但實現了自動化,而且效率也一下子就有了翻天覆地的變化,更重要的是,質控之后的病歷質量也隨之同步提升??芍^一箭雙雕,甚至是一箭三雕!
眼見為實!咱們瞧瞧來自一線用戶的真實反饋。
以某三甲醫院為例,上線了惠每科技的這套方案之后,病歷內涵質控效果的“打開方式”就變成了這樣:
全院的甲級病歷(下圖中的綠色曲線)從原先的75%直接暴漲到了95%!
病歷質量的大幅提高就像“作用力與反作用力”,此舉反過來也讓醫生診療工作的規范性和病案管理質量得到了提高。
由此雙管齊下,有問題的病歷數量就變得越來越少,以某醫院為例——
僅10個月時間,病歷平均問題數從最開始的7.42個,下降到了3.28個,下降比率高達55.79%!
像這樣的實際應用效果還可以從某省級病案管理質量控制中心的病歷質控監測指標看出。
方案在該省某醫院落地后,病案首頁質量相關的主要診斷編碼正確率從78%提升至97%、病歷文書的手術相關記錄完整率從92%提升至99%、CT/MRI檢查記錄完整率從81%提升至90%、抗菌藥物使用記錄符合率從82%提升至91%,不合格復制病歷發生率則從12%下降至8%,很好地滿足了該中心的質控監測要求。
△某醫院多項病歷質控監測指標的變化趨勢
那么接下來的一個問題是,畢竟醫療場景涉及患者隱私,就這么交由大模型來訓練和推理,夠安全嗎?
對此,惠每科技也有自己深入的理解和切實可靠的實踐路徑:
私有化部署,數據不出醫院。
△圖:惠每醫療大模型技術架構
具體而言,惠每科技是以ChatGLM等流行的基座大模型為基礎,鋪于醫學知識庫和醫學知識圖譜等,還結合了RAG(檢索增強生成)技術,在垂直領域做模型的訓練和微調等工作。
與此同步,專家的反饋也會通過RLHF(人類反饋強化學習)技術加入到上述過程,并最終形成面向不同醫療場景的醫療大模型。
而這整個過程中都采用的是私有化部署的方式,微調也是基于SFT(監督微調)來展開,因此便更好地保障了安全性。
由此總結來看,醫療大模型“上崗”醫院后,在病歷內涵質控這件事上起碼做到了三點:
更專業、更安全、更效率。
但有一說一,在這個醫療大模型和系統的背后,還有一個關鍵因素在默默發力。
不僅能力到位,更要輕松落地
醫療大模型方案要想真正落地并發揮價值,除了算法模型本身要夠強大之外,還必須克服私有化部署所面臨的種種挑戰。
不論是出于數據與隱私安全、業務便捷還是成本考量,部署在本地、把控在自己手上,始終是越來越多行業用戶的期盼。
特別是對醫療行業來說,私有化的部署和落地更是一種“剛需”。
畢竟不同醫院的病歷格式本身差異就較大,加之涉及患者隱私,惠每科技的私有化部署策略,幾乎成了醫療大模型落地的最基本前提。
這樣一來,在基礎設施的選擇上,又面臨一系列問題。
成本角度上,現代化醫院本來就是各行業信息化領域的主力軍,此前多年在通用計算類IT基礎設施上曾有大量投入,在此基礎上再導入專用AI加速器需要額外投入,而且這些加速器如今獲取難度還在不斷加大(你懂的)。
從性能角度看,也要求硬件平臺能滿足AI模型推理所需的性能,特別是要滿足實時性或近實時性標準。
那么有沒有一種方案,既可以讓醫療大模型更順滑地落地,還能充分利用現有軟硬件設施,并同時兼顧性能、總擁有成本和獲取難度呢?
面對這一系列難題,惠每科技可謂是“有備而來”。
它選擇了與英特爾合作,基于英特爾? 至強? CPU Max系列處理器、OpenVINO? 工具套件及開源大模型加速庫IPEX-LLM,打造了一套”高性價比醫療大模型私有化落地方案”。
作為業界首款內置高帶寬內存 (HBM) 的x86架構CPU,至強? CPU Max系列集成了高達64GB容量的HBM2e內存,其理論帶寬可達主流DDR5內存的4倍,足以應對大模型推理時對內存性能的嚴苛要求。
此外,該處理器還內置有英特爾? AMX(英特爾? 高級矩陣擴展)加速技術,經特定優化后,其每時鐘周期可完成多達2048個INT8運算,較上一代同類指令實現了8倍性能飛躍。
△英特爾? 至強? CPU Max 系列處理器
除硬件優勢之外,在軟件方面,英特爾也為惠每科技提供了成熟的優化工具與技術支持。
例如借助IPEX-LLM大模型庫實現推理加速的低精度量化方案,以及基于 OpenVINO? 工具套件開展的非量化優化方案,雙管齊下,能讓醫療大模型在至強? 平臺上的推理效率得到顯著提升。
據惠每科技實測,經非量化方案優化后,當輸入文本為2K時,模型首詞時延由優化前的 4.03秒驟降至2.1秒,性能提升達1.92倍。平均時延則由182.86毫秒每Token縮短至47.96毫秒每 Token,提升幅度高達3.81倍。而這,已經十分接近專用AI加速芯片的性能水平了。
△英特爾優化方案帶來的性能提升
而且,除了讓醫療大模型私有化落地從“不可能”變為“可能”,基于英特爾? 至強? 平臺還有一個容易被忽視但至關重要的優勢,那就是上線效率。
得益于英特爾? 架構平臺成熟的生態以及雙方的深度協同,更重要的是醫療行業對于該平臺廣泛的部署和較高的應用水準,醫院開展惠每醫療大模型方案私有化部署時,從準備到最終產出收益,僅需3.5 個月左右。
這就讓AI智能化帶來的變革成果顯得更加“立竿見影”。
跨平臺技術助力行業加速應用
通過惠每科技病歷質量控制這一用例,不難看出:英特爾? CPU平臺+AI加速工具,不失為大模型從實驗室走向行業、加速落地與實踐的一劑”良方”。
其實在智慧醫療的背景下,病歷質控只是一個縮影。
從智能導診到輔助診斷,從藥物研發到疾病預測,AI正以多種方式為醫療行業帶來更多變革。
智慧醫療又何嘗不是“人工智能+”時代的一塊重要拼圖呢?
更廣泛的視角下,類似醫療這樣涉及隱私、對AI私有化部署有強要求的行業,還有金融、法律、教育、出行……可以說,越是距離每個人生活更近的行業,就越需要考慮這個問題。
如果再考慮到在數字化轉型中已有一定投入,希望充分利用原有IT基礎設施,以總擁有成本更低的方式開展AI實踐的行業,那就更多了。
所以說在這一輪推進智能化轉型的浪潮中,像英特爾與惠每科技合作打造的這種"一石多鳥"且“更接地氣”的方案,無疑是一個值得參考的選擇。
英特爾未來能不能繼續以更高性價比、更易于獲取和應用的軟硬件平臺為基礎,全力加速AI在各個行業的創新應用,讓科技為人類社會持續賦能,就很值得期待了。
(本文由英特爾公司供稿)