黃昊:ChatGPT對醫(yī)療信息化的沖擊與挑戰(zhàn)——人智博弈,逐浪前行
作為一名信息化從業(yè)者,談到人工智能,我經(jīng)常調(diào)侃“人工和智能之間現(xiàn)在得加一頓號(hào)”,表明目前的人工智能技術(shù)還是停留在某些專業(yè)技能的智能化應(yīng)用,還不能實(shí)現(xiàn)通用智能技術(shù)的突破。
然而這段時(shí)間,我們卻不斷被人工智能的新變化沖擊著,前有ChatGPT的震撼,緊接著又迎來了GPT4.0的沖擊,期間也伴隨著國內(nèi)“文心一言”發(fā)布所展示的中國聲音。在專業(yè)領(lǐng)域應(yīng)用上,GPT4.0現(xiàn)已迅速切入了醫(yī)療領(lǐng)域,微軟子公司Nuance Communications日前推出一款基于GPT-4的醫(yī)用軟件DAX Express。老款的DAX可以將患者在就診中與醫(yī)生的交流轉(zhuǎn)化為臨床檔案,結(jié)合人工審核來確保信息的準(zhǔn)確性,整個(gè)過程需要耗費(fèi)4小時(shí),而最新推出的基于GPT-4的DAX Express,只要短短幾秒就能搞定上述工作。
GPT所展現(xiàn)出的“科技與狠活”已經(jīng)顯示了它對大眾崗位的威脅,我們自以為是的技能和多年打造出的職業(yè)經(jīng)驗(yàn),瞬間被它擊垮。動(dòng)動(dòng)嘴皮子、隨便寫個(gè)提綱,它就幫你搞定剩下的一切,此類主題的宣傳視頻在網(wǎng)上比比皆是。那些原本我們需要加班熬夜碼的代碼,在它也是小CASE,在強(qiáng)大科技面前,我們已成為一粒灰塵,風(fēng)吹過,消失在塵煙中?;贏I的繪圖軟件的出現(xiàn)直接讓一些簡單的美工崗位不復(fù)存在。人們紛紛感嘆“四年大學(xué)比不上一分鐘問詢,八年工作經(jīng)驗(yàn)擋不住一秒暴擊”,躺平之聲甚囂塵上。
一日,在食堂偶遇某臨床科室主任,他一臉真誠的對我說:“昊哥,現(xiàn)在美國ChatGPT的回答都非常專業(yè)了,我們應(yīng)該把它引進(jìn)來搞信息化。現(xiàn)在的信息系統(tǒng)太LOW了,談不上智慧醫(yī)療?!笨窗?,就算我們不進(jìn)步選擇躺平,時(shí)代都會(huì)把我們拽起來,推著我們前進(jìn)。
如此強(qiáng)悍的人工智能模型,相信不僅個(gè)人,就是各個(gè)行業(yè)都在思考,如何與它聯(lián)合,解決實(shí)際問題,探索科研奧秘。我們必須得思考類似GPT這類大模型通用智能技術(shù)對醫(yī)療信息化到底有些什么挑戰(zhàn),我們又能做些什么。
先用一組數(shù)字來說明GPT的強(qiáng)大吧。
類似GPT的大模型,其核心特征是模型參數(shù)多、訓(xùn)練數(shù)據(jù)量大。有研究估測,GPT-3是高達(dá)1750億個(gè)參數(shù)的語言大模型,需要上萬個(gè)CPU/GPU24小時(shí)不間斷地輸入數(shù)據(jù)。其能耗相當(dāng)于開車往返于地球和月球,一次運(yùn)算就要花費(fèi)450萬美元。GPT-4是一個(gè)超大的多模態(tài)模型,也就是說,它的輸入可以是文字(上限2.5萬字),還可以是圖像,其參數(shù)更是比GPT-3高了16倍,達(dá)到了1.6萬億個(gè)。百度“文心一言”的參數(shù)也高達(dá)1000億以上。
據(jù)報(bào)道,跑通一次100億以上參數(shù)量的模型,算力至少需要1000張GPU卡。GPU芯片中領(lǐng)先者如A100售價(jià)達(dá)1萬美元, 微軟Azure云服務(wù)為ChatGPT布署了超過1萬枚英偉達(dá)A100芯片。高昂的成本意味著大模型只能由超大型科技公司或少數(shù)機(jī)構(gòu)所掌握。在一次學(xué)術(shù)會(huì)議上,某全國頂級醫(yī)院的主任自豪說,我們的數(shù)據(jù)中心目前已經(jīng)擁有191塊GPU的算力了,有效算力全國醫(yī)療機(jī)構(gòu)排名第一。然而這些算力背后都是巨大的資金投入,對于大多數(shù)醫(yī)療機(jī)構(gòu)來說,要開展人工智能應(yīng)用,使用云端服務(wù)是合適的選擇。
從行業(yè)發(fā)展看,也是這樣的趨勢,自2月份百度官宣“文心一言”以來,已有超過650家企業(yè)宣布接入“文心一言”生態(tài)。術(shù)業(yè)有專攻,在大模型人工智能的使用上,少數(shù)機(jī)構(gòu)做研發(fā),其他也就是選擇場景進(jìn)行應(yīng)用了。
沖擊一
大眾對信息化的期望值被拉高
相信體驗(yàn)過ChatGPT的人都會(huì)成為它的粉絲。進(jìn)而大家也都會(huì)將嫌棄的目光投向我們在用的各個(gè)系統(tǒng)。那么如何從業(yè)務(wù)系統(tǒng)向智慧業(yè)務(wù)系統(tǒng)進(jìn)化,相信各廠商也在開始思考從現(xiàn)有的微服務(wù)架構(gòu)進(jìn)化為智能架構(gòu)了。
沖擊二
更多的云化應(yīng)用被催生
通用人工智能模型難以進(jìn)行私有化部署,“云、管、端”的模式將成為常態(tài)。對于普通大眾來說,在沒有出現(xiàn)更輕量型的模型或更高性價(jià)比的算力平臺(tái)之前,還只有采用云服務(wù)的模式。但是采用云模式必然也會(huì)受制于云,一旦云端服務(wù)中斷或者被禁止,我們的業(yè)務(wù)也會(huì)受到影響。
沖擊三
現(xiàn)有的安全體系進(jìn)一步被打破
有人說,人類進(jìn)步的動(dòng)力就是因?yàn)槲覀兊膽卸琛U羝麢C(jī)代替了馬匹;電力取代了蒸汽;互聯(lián)網(wǎng)讓我們獲取資料更方便;人工智能讓我們不必“思考”。人們肯定會(huì)用智能工具來完成各類工作,從論文撰寫、繪畫、各類報(bào)告材料等等,這在使用過程中難以避免可能造成信息的泄露。
據(jù)韓國媒體《economist》3月30日報(bào)道,近日,三星內(nèi)部發(fā)生三起涉及ChatGPT誤用與濫用案例,包括兩起“設(shè)備信息泄露”和一起“會(huì)議內(nèi)容泄露”。3月31日,意大利個(gè)人數(shù)據(jù)保護(hù)局宣布,從即日起禁止使用聊天機(jī)器人ChatGPT,限制其開發(fā)公司OpenAI處理意大利用戶信息,并開始立案調(diào)查。其個(gè)人數(shù)據(jù)保護(hù)局認(rèn)為,3月20日,ChatGPT平臺(tái)出現(xiàn)了用戶對話數(shù)據(jù)和付款服務(wù)支付信息丟失情況。而該平臺(tái)沒有就收集處理用戶信息進(jìn)行告知,且缺乏大量收集和存儲(chǔ)個(gè)人信息的法律依據(jù)。
沖擊四
人類的一些技能將更為退化
亙古以前,人類狩獵,需要逃避野獸的追擊,需要掌握武器和搏擊技能;如今,信息系統(tǒng)的應(yīng)用讓很多醫(yī)務(wù)人員都不再熟悉一些醫(yī)療管理的規(guī)章,如藥品使用、醫(yī)保政策等,反正都是系統(tǒng)在把關(guān)。同樣,當(dāng)我們能夠通過與GPT簡單的溝通就獲得一份漂亮的材料后,我們的分析能力、調(diào)查能力都會(huì)退化。
沖擊五
可能帶來的系統(tǒng)性安全事件值得關(guān)注
沒有完美的軟件,就算是ChatGPT也是不完美的。它仍然有一些局限性,還在不斷的進(jìn)步。
ChatGPT在其未經(jīng)大量語料訓(xùn)練的領(lǐng)域缺乏“人類常識(shí)”和引申能力,甚至?xí)槐菊?jīng)的“胡說八道”。ChatGPT無法處理復(fù)雜冗長或者特別專業(yè)的語言結(jié)構(gòu)。對于來自金融、自然科學(xué)或醫(yī)學(xué)等非常專業(yè)領(lǐng)域的問題,如果沒有進(jìn)行足夠的語料“喂食”,ChatGPT可能無法生成適當(dāng)?shù)幕卮?。而這些一本正經(jīng)的“胡說八道”往往還更具有迷惑性,導(dǎo)致一些錯(cuò)誤判斷發(fā)生。
ChatGPT仍然是黑盒模型。目前還未能對ChatGPT的內(nèi)在算法邏輯進(jìn)行分解,因此并不能保證ChatGPT不會(huì)產(chǎn)生攻擊甚至傷害用戶的表述。據(jù)說它的進(jìn)步已經(jīng)威脅到人類自身了,最新的消息是,一眾科技大佬紛紛發(fā)聲,要求暫停GPT的研發(fā)進(jìn)展。
坐享其成自然好,但卻不現(xiàn)實(shí)。就如GPT一類的大模型也需要數(shù)據(jù)去訓(xùn)練,而這些專業(yè)性的數(shù)據(jù)的產(chǎn)生,不僅需要技術(shù)型人才的分析能力,更需要各專業(yè)領(lǐng)域人士的投入,如數(shù)據(jù)標(biāo)注,數(shù)據(jù)的標(biāo)準(zhǔn)化處理,這類原始性工作尤顯重要。尤其是對醫(yī)療這種涉及生命安全的領(lǐng)域,大模型依然存在潛在風(fēng)險(xiǎn)。避免系統(tǒng)性問題,還需要有評估和不良事件上報(bào)的流程及管理文件的完善,這也正是國家出臺(tái)相關(guān)法規(guī)的原因之一。
結(jié)語
人工智能的應(yīng)用來勢洶洶,“算法、算力、數(shù)據(jù)” 作為AI核心三要素,相互影響,相互支撐。就算是大語言模型的GPT也需要大量標(biāo)準(zhǔn)的數(shù)據(jù)去投食去訓(xùn)練。在醫(yī)學(xué)這個(gè)細(xì)分領(lǐng)域尤其如此,如果沒有大量經(jīng)過驗(yàn)證的數(shù)據(jù)去訓(xùn)練模型(標(biāo)準(zhǔn)疾病病歷庫),也會(huì)再現(xiàn)當(dāng)年機(jī)器人沃森醫(yī)生的尷尬,來也匆匆,去也匆匆。最后用一首打油詩和大家共勉。
身邊多個(gè)萬事通,保密意識(shí)記心中。
可用切勿成依賴,順勢而為道路通。
注:此文借鑒和參考了互聯(lián)網(wǎng)上公開發(fā)表的各種資料,在此一并表示感謝,時(shí)間關(guān)系沒有按照論文格式進(jìn)行撰寫,還請諒解。
作者簡介
黃昊,現(xiàn)任陸軍特色醫(yī)學(xué)中心信息科主任、正高級工程師,CHIMA常委,中國研究型醫(yī)院學(xué)會(huì)醫(yī)院信息化分會(huì)常務(wù)理事,中國研究型醫(yī)院學(xué)會(huì)醫(yī)院信息化分會(huì)智慧醫(yī)療專委會(huì)主任委員。