曹劍峰:AIGC與醫療展望
一AIGC發展背景
2022年是AIGC(Al-Generated Content,人工智能生成內容)火爆出圈的一年,不僅備受投資界關注,更是被技術和產業界競相追逐。大家認為AIGC會代表新一輪科學范式轉移的開始。我們先來看看AIGC發展的幾個關鍵節點:
1957年萊杰倫·希勒(Leiaren Hiller)和倫納德·艾薩克森(Leon ard lsaacson)完成了人類歷史上第一支由計算機創作的音樂作品就可以看作是AIGC的開端,距今已有65年。
2014年,伊恩·古德費洛(lan Goodfellow)提出的生成對抗網絡(Generative Adversarial Network,GAN)成為早期最為著名的生成模型。GAN使用合作的零和博弈框架來學習,被廣泛用于生成圖像、視頻、語音和三維物體模型。
隨后,Transformer基于流的生成模型(Flow-based Models)、擴散模型(Diffusion Model)等深度學習的生成算法相繼涌現。其中Transformer模型是一種采用自注意力機制的深度學習模型,這一機制可以按照給輸入數據各部分重要性的不同而分配不同的權重,可以用在自然語言處理(NLP)、計算機視覺(CV)領域應用。
擴散模型(Diffusion Model)是受非平衡熱力學的啟發,定義一個擴散步驟的馬爾可夫鏈,逐漸向數據添加隨機噪聲,然后學習逆擴散過程,從噪聲中構建所需的數據樣本。擴散模型最初設計用于去除圖像中的噪聲。隨著降噪系統的訓練時間越來越長并且越來越好,它們最終可以從純噪聲作為唯一輸入生成逼真的圖片。然而從最優化模型性能的角度出發,擴散模型相對GAN來說具有更加靈活的模型架構和精確的對數似然計算,已經取代GAN成為最先進的圖像生成器。2021年6月,OpenAl發表論文已經明確了這個結論和發展趨勢。
總的來看,AIGC在2022年的突然爆發,主要得益于深度學習模型方面的技術創新。不斷創新的生成算法、預訓練模型、多模態等技術的碰撞融合帶來了今天AIGC技術突飛猛進式的變革,并擁有通用性、基礎性、多模態、多參數、訓練數據量大、生成內容高質穩定等新特征。
二AIGC產業體系架構
第一層是基礎層:也就是由“預訓練模型”為基礎而搭建的AIGC技術基礎設施層。由于“預訓練模型”的高成本和技術投入,具有較高的進入門檻,需要分布式大模型作為基礎算力框架。以2020年5月推出的推測訓練GPT-3為例,其一個訓練計算周期的成本可能接近1200萬美元。因此目前進入預訓練模型的主要機構為領域頭部賽道企業、超大型院校科研機構等。國內影響力較強的就是即將在3月發布的文心大模型。2022年上半年,百度升級了任務相關知識增強的千億大模型文心ERNIE 3.0 Zeus。這個模型除了進行無標注數據和知識圖譜的學習外,還通過持續學習算法對百余種不同形式的任務進行學習,以實現任務知識的增強。因為有了基礎層大模型的技術支撐,下游行業才能如雨后春筍般發展,形成了目前的AIGC商業洪流。
第二層是中間層:即垂直化,場景化、個性化的模型和應用工具。預訓練的大模型是基礎設施,在此基礎上可以快速抽取生成場景化、定制化、個性化的小模型,實現在不同行業、重直領域,功能場景的工業流水線式部署,同時兼具按需使用,高效經濟的優勢。2022年6月,文心大模型中的輕量化技術加持的多個文心ERNIE 3.0 Tiny輕量級模型開源至飛槳自然語言處理模型庫PaddleNLP中,直接通過在線蒸餾技術將預訓練大模型壓縮成預訓練小模型。該模型刷新了中文小模型的SOTA成績。
隨著兼具大模型和多模態模型的AIGC模型加速成為新的技術平臺,模型即服務(Model-as-a-Service MaaS)開始成為現實,預計將對商業領域產生巨大影響。
第三層是應用層:即面向C端用戶的文字、圖片、音視頻等內容生成服務。在應用層側重滿足用戶的需求,將AIGC模型和用戶的需求無縫銜接起來實現垂直落地。應用層開放的不僅僅是程序,還有其已經訓練好的模型,后繼創業者能更好的借助這一開源工具,以C端消費級顯卡的算力門檻,挖掘出更豐富的內容生態,為AIGC在更廣泛的C端用戶中的普及起到至關重要的作用。現在貼近C端用戶的工具越發豐富多樣,包括網頁,本地安裝的程序,移動端小程序,群聊機器人等,甚至還有利用AIGC工具定制代出圖的內容消費服務。
隨著數字技術與實體經濟融合程度不斷加深,以及互聯網平臺的數字化場景向“元宇宙”轉型,人類對數字內容總量和豐富程度的整體需求不斷提高。AIGC作為當前新型的內容生產方式,已經率先在傳媒,電商、影視,娛樂等數字化程度高,內容需求豐富的行業取得重大創新發展,市場潛力逐漸顯現。與此同時在推進數實融合、加快產業數字化轉型的進程中,金融、醫療、工業等各行各業的AIGC應用也都將快速發展起來。
三AIGC特點與醫療場景結合展望
在內容消費領域,AIGC已經重構了整個應用生態。AIGC在內容生成領域有以下優勢特征:
1.通用信息抽取技術UIE(Universal Information Extraction),結合醫學NLP提供通用的后結構化增益:基于Prompt思想,將希望抽取的Schema信息轉換成“線索詞”(Schema-based Prompt)作為模型輸入的前綴,使得模型理論上能夠適應不同領域和任務的Schema信息,并按需抽取出“線索詞”指向的結果,從而實現開放域環境下的通用信息抽取。
從以上圖片看,未來的智能文檔分析平臺可提供包括文檔信息抽取、文本內容審查、企業文檔管理、文檔格式解析、文檔內容比對等全方位一站式的文檔智能服務,可以形成一套完整的垂直領域醫學文檔場景化解決方案。其結果可以支持開放式文檔抽取問答模型,直接的醫療領域場景就是健康咨詢、報告解讀、紙質和圖片醫學文檔的“爬蟲式”后結構化。這使得醫院沉淀下來的大量潛在的“數據資產”,將徹底擺脫傳統的“數據清洗”的禁錮。
2.大模型預訓練下自動內容生成,支持跨模態:基于千億級大模型并行架構下,對于通用任務大型語言和圖像Al模型可用于自動生成內容。
AIGC模型可以生成多種類型的內容,包括文本、圖像和音視頻、3D內容等等。這可以幫助專業人士創建多樣化、更有趣的內容,從而吸引更廣泛的人群。醫療領域直接的受益點就是未來患者的“電子病歷”和“電子健康檔案”中的主要醫療文書,將通過大模型的泛在語義結合指令微調小模型的精練語義相融合,而自動生成部分核心內容,其內容也將是文字結合圖片和視頻甚至部分3D內容。圖文并茂的新特性,將極大的豐富病案的可讀性和內容的可解釋性。既為未來電子病歷、電子健康檔案的“互聯互通互認”,向患者個人開放奠定基礎,也為基于醫學科研與臨床真實世界的研究提供支撐。
3.降低領域門檻和運營成本,提高專業內容和管理質量:未來領域內基于AIGC內容制作的門檻和成本將顯著降低、效率也會顯著提高。行業專家將可以以更低的成本,和更高的生產速度,創造出有獨特價值和獨立視角的內容。而且AIGC生成的內容,由于其“AI”的血緣,可能比人類創建的內容質量更高從而起到良好的智能輔助作用。因為人工智能模型能夠從大量數據中學習,并識別出人類顯在的或隱在的管理和控制新邏輯,并把這些邏輯貫穿到內容生成中,這將產生出更準確和信息更豐富的內容。以前述的醫療文書為例,文檔的模板更規范、質控邏輯更清晰、內容表達更豐富、易讀性和可解釋性也更強。而且可以極大地把醫務人員從日常繁瑣的文件梳理工作中解放出來,把更多的精力投入到患者醫療救治服務和臨床科研中去。
4.可實現個性化內容服務,聊天機器人和“數字人”成為新的、更包容性的用戶交互界面:人工智能模型可以根據個人用戶的喜好生成個性化內容。這可以使垂直領域專業人士,創建出目標受眾更感興趣的內容,并被廣泛閱讀或分享。未來隨著性能的講一步提升,對話式AIGC在搜索、知識傳播等領域有很大的應用空間。AIGC的最終目標是做一個類似于新時代的“搜索引擎”。目前從ChatGPT展示出來的內容輸出質量和內容覆蓋多維度,已經可以直面“搜索引擎"與“問答社區”等相關應用。AIGC支撐了Al驅動未來“數字人”多模態交互中的識別感知和分析決策功能,并使其“高度擬人化”。其中自然語言處理好比是“數字人”的大腦,“說人話”直接影響受眾的交互體驗。而計算機視覺ViT決定了“數字人”面部表情和肢體動作的人類情感自然流露。目前主流的方式是圍繞NLP能力通過文本驅動,本質是通過ASR-NLP-TTS等AI技術進行感知-決策-表達的閉環來驅動“數字人”交互。醫療可對接的場景很容易想到未來“12320”熱線的無人值守、數字家醫智能患者隨訪、健康評估、健康咨詢與宣教、遠程醫療等需要大量人機交互的場景和醫療服務新模式領域。
5.元宇宙概念提出后,互聯網下一個重要方向將從“在線"走向"在場",全面邁向3D互聯網新時代,而AIGC將成為打造虛實集成世界的基石。未來人們將可以在虛擬空間中構建仿真世界,在現實世界“疊加”虛擬增強,以實現逼真的臨場感。隨著各種交互、仿真、傳輸技術的不斷突破,信息在傳輸層越來越接近無損,如果“算法”、“算力”、“算據”的整合能力仍可不斷提升,則未來數字仿真能力將“真假難辨”,而人類在3D互聯網中的交互和沉浸體驗將達到新高度。如果這一天真的來臨,代表AIGC的能力已經擴展到從虛擬場景、到虛擬角色、再到虛擬內容的全面仿真能力的生成式內容全覆蓋。未來的“互聯網醫院”的場景也將升級,從現在的“線下”與“線上”的一體化,走向未來“現場”和“在場”的一體化。所謂“在場交易”,“現場交割”的互聯網診療運營和服務新模式的出現,使患者不再受到時空的限制,人人都將可以“分身有術”。醫療垂直領域服務為王、內容為王的新時代也將到來。醫療服務供方、需方、監管方的三者關系,將在新一代互聯網3D空間中以虛擬現實的方式展開全面的沉浸式體驗和內容互動。
四AIGC助推元宇宙發展
未來AIGC將是推動元宇宙發展的重要生產工具:
首先,AIGC為構建沉浸式的元宇宙空間環境提供了核心基礎設施技術,將成為元宇宙的生產力工具。元宇宙在理論上可以用于工作、會議、游戲以及生活社交等各種人類活動,因此需要在元宇宙空間中創建各種各樣的活動對象,建筑和活動環境。但是在過去為了構建這些數字環境,需要開發團隊半手工地創建每一個部分,專業化門檻高、工作量巨大其成本高企。而現在AIGC已經可以實現創建逼真的3D虛擬空間環境、虛擬人物,并且效率和成本可以滿足大規模的元宇宙字間通用環境的統一創建。AIGC使得新一代數字化“創世紀”成為可能。
其次,AIGC將作為生產力工具,為元宇宙用戶提供個性化內容體驗。大量個性化、多元化的數字內容是未來吸引人們在“元宇審”中“流連忘返”的重要原因。虛擬場景、虛擬角色、虛擬身份、虛擬內容的映射、連接和對齊需要高度智能化的生產工具。而這些內容如果僅通過人工方式來生產既成本高又耗時長,肯定無法滿足用戶的海量需求,因此需要AIGC作為重要生產力工具來滿足助推“元宇宙”的早日到來。
五結束語
數字經濟可能是未來替代石油能源經濟的發展新方向,目前緊密發布的相關文件和機構改革方案,也進一步印證了這一點。人工智能作為數字經濟的“上層建筑”,雖然目前還不是萬能的,但未來如果沒有也是萬萬不能的。“數字化”說到底其實就是為了解決結構化和語義化問題;“智能化”就是為了使邏輯和推理變得更加人性化和高度可泛化。AIGC正好同時契合了這兩個維度的方向,而且在技術體系內實現了兩者高度的融合,所以AIGC未來的發展與垂直行業相結合,接了“地氣”后發展空間將更加不可限量。
格物致知、以物格物、推近致遠,應該是我們具備的“科學態度”。這篇文章目前還是一種“推演”,而我們文中所述的種種在未來回頭再看,可能早已“一日千里”,僅僅“滄海一粟”而已。當然在興奮中之余我們也應該清醒的認識到:科技的翅膀往往會在倫理的海洋里泛起漣漪。但是無論如何,科技向善、科技為人類福祉而奮斗,應該是萬變不離其宗的“科學精神”。
作者簡介
曹劍峰,上海市衛生健康統計中心副主任(原上海市衛生健康信息中心),擁有30年的醫療健康信息化建設工作經歷:1991年進入上海市胸科醫院開始從事醫院信息化工作;1994年開始參與研發上海第一代醫院信息系統(HIS),對醫院的業務流程有深刻的理解;2006年進入衛生行政部門——上海市衛生局信息中心,開始參與全市重點項目“公共衛生突發應急工程”、“上海市民健康網工程”的項目實施與管理工作,開始了市、區兩級區域醫療信息化的探索;2015年開始負責上海市“社區綜改和家庭醫生責任制”和“1+1+1”分級診療”信息化支撐項目;2017年開始研究大數據DRGS醫院病種指數用于公立醫院精細化管理方法的探索;2018年開始在上海市拓展“健康云”——“互聯網+醫療健康”信息惠民移動服務平臺的推廣與應用;2019年開始探索建設上海“互聯網醫院”以及“互聯網監管平臺”建設。2020年參與組織實施上海市實事工程“支付一件事”,率先實現醫保“脫卡信用支付”新模式,同年參與建設青浦“長三角智慧互聯網醫院”;2021年主持參與上海醫療便捷就醫“數字化轉型”七大場景中“互聯互通互認”與“電子出院小結”兩大場景建設;2022年秉持“12512”的理念,組織開展上海衛生健康信息標準化揭榜攻關項目落地。
上一篇: 人工智能給信息科工程師發展的啟發
下一篇: 王才有:一本醫院信息化工具書帶來的新思考