智慧醫(yī)院產(chǎn)品觀(六):再談?wù)Z音交互
我對(duì)語音交互這個(gè)方向一直有所關(guān)注,并于去年年初在CHIMA公眾號(hào)發(fā)表過兩篇關(guān)于語音交互的文章。隨著語音技術(shù)作為基礎(chǔ)設(shè)施日益完善,我在平時(shí)的工作和生活中,用到語音技術(shù)的機(jī)會(huì)也越來越多。
結(jié)合以上兩點(diǎn),談?wù)勎覍?duì)語音技術(shù)最新的思考。
我覺得沒必要。語音技術(shù)的利弊和適用場(chǎng)景,我在之前的文章里已經(jīng)分析得很清楚了。寫病歷這件事,從來不是一件文體不限、鼓勵(lì)創(chuàng)新的創(chuàng)作行為。相反,寫病歷是一種受到非常多約束條件的專業(yè)文書寫作。一旦產(chǎn)生醫(yī)療糾紛、患者維權(quán)事件,病歷資料將會(huì)是認(rèn)定醫(yī)療機(jī)構(gòu)是否存在醫(yī)療過失的重要證據(jù)。
有興趣的可以看看下面這本書,這本書我看了好幾遍,受益匪淺。看完之后最大的感受是:寫病歷,還是模板好。因?yàn)椋粋€(gè)好的模板,不僅幫醫(yī)生框定了病歷的邊界、要素等大部分病歷書寫的核心內(nèi)容,還做好了前置的標(biāo)準(zhǔn)化工作。剩下的工作,只是專業(yè)人員的“完形填空”和“小作文”。
因此,我不建議,一提到語音就往“寫病歷”這件事上去靠,不僅靠不住,還會(huì)無形中放大語音技術(shù)在這個(gè)領(lǐng)域的短板。
事實(shí)上,語音交互已經(jīng)證明了其作為生產(chǎn)力工具的價(jià)值所在。在醫(yī)療領(lǐng)域,語音技術(shù)在超聲場(chǎng)景中的應(yīng)用和落地,有目共睹,有興趣的可以看看協(xié)和的案例(參見:北京協(xié)和醫(yī)院:智能語音識(shí)別技術(shù)賦能超聲檢查模式創(chuàng)新),這個(gè)案例在CHIMA舉辦的2020年醫(yī)院新興技術(shù)創(chuàng)新應(yīng)用典型案例中,獲得了“醫(yī)學(xué)人工智能創(chuàng)新方向”二等獎(jiǎng)。
在民用領(lǐng)域,語音技術(shù)也有很接地氣的案例。我在《智慧醫(yī)院產(chǎn)品觀之四:語音交互篇(上)》中,開篇就提到一個(gè)很接地氣的案例,即快遞小哥用語音技術(shù)輸入快遞地址,簡(jiǎn)單方便,非常實(shí)用。
現(xiàn)階段,對(duì)于語音技術(shù),要給它機(jī)會(huì),讓它發(fā)展,但不宜讓它挑大梁,更不要過分宣傳,免得被捧殺。
實(shí)際上,目前絕大部分手機(jī)輸入法中,“語音轉(zhuǎn)文字”已經(jīng)是標(biāo)配,連觸發(fā)模式都變得近乎一致(鍵盤底部居中,長(zhǎng)按)。
受此啟發(fā),我在年初寫作《下一代醫(yī)院信息系統(tǒng):醫(yī)療操作系統(tǒng)》時(shí),便提到:語音交互技術(shù),應(yīng)該作為一種“基礎(chǔ)設(shè)施”,成為醫(yī)療操作系統(tǒng)的標(biāo)配,把選擇和使用的權(quán)力交給用戶,把成長(zhǎng)的空間留給自己。
人們常說,陪伴是最長(zhǎng)情的告白。近期,我生活中發(fā)生的兩件小事,讓我意識(shí)到,以語音交互為代表的人工智能技術(shù),需要用戶陪跑。
一是定鬧鐘的事。上文中提到,語音技術(shù)是一種“基礎(chǔ)設(shè)施”。我生活中常見的語音基礎(chǔ)設(shè)施有:家里的某品牌智能音箱,手機(jī)上的語音助手,輸入法上的語音轉(zhuǎn)文字按鈕等等。這些基礎(chǔ)設(shè)施,共同構(gòu)成了環(huán)繞在我身邊的一個(gè)語音環(huán)境。
最近,我對(duì)語音技術(shù)的看法,隨著一件小事發(fā)生了變化。很多人都習(xí)慣用手機(jī)定鬧鐘,我也一樣。遇到春節(jié)假期,自然會(huì)考慮關(guān)閉接下來一周的鬧鐘,免得美好的假期生活被打擾。
但是,當(dāng)我想要關(guān)閉鬧鐘的時(shí)候,問題來了。我的手機(jī)上有兩套鬧鐘系統(tǒng):一套是常規(guī)的鬧鐘,也就是系統(tǒng)自帶的“時(shí)鐘”應(yīng)用中,自帶的鬧鐘;另一套鬧鐘在手機(jī)的“就寢模式”中,當(dāng)用戶設(shè)定了就寢和起床時(shí)間后,手機(jī)在相應(yīng)的時(shí)段進(jìn)行一系列的操作。比如,進(jìn)入勿擾模式,檢測(cè)拿起手機(jī)等動(dòng)作,并在“起床時(shí)間”發(fā)出提醒,這也算是鬧鐘。
尷尬的事來了,系統(tǒng)自帶的“鬧鐘”應(yīng)用比較好找,但是,“就寢模式”是近期系統(tǒng)更新后才上線的新功能,入門有點(diǎn)深,使用頻率也不高,我一時(shí)半會(huì)找不到在哪兒。
當(dāng)時(shí)已經(jīng)很晚了,我躺在床上,渾身困意,掙扎著用最后一絲清醒,喚醒手機(jī)的語音助手,并告訴她:幫我把接下來一周所有的鬧鐘都關(guān)了。
實(shí)際上,我說這句話時(shí),心里也沒底。畢竟是第一次向語音助手發(fā)出這樣“復(fù)雜”的指令。平時(shí),我和身邊的語音設(shè)施,互動(dòng)雖然很頻繁,但是內(nèi)容非常單調(diào),基本上就是用語音控制開關(guān),查一下天氣等等,都是一些非常簡(jiǎn)單的操作,對(duì)于語音技術(shù),我并沒有抱太大希望。
但是幾秒鐘后,語音助手給出讓我非常滿意的答復(fù):好的,主人。已幫你關(guān)閉時(shí)鐘和就寢模式下所有的鬧鐘。與此同時(shí),伴隨著語音,屏幕上顯示了可視化的結(jié)果:已關(guān)閉*個(gè)鬧鐘,以及就寢模式下*個(gè)鬧鐘。
這幾乎是一個(gè)滿分的回答,當(dāng)晚我很快就睡著了。第二天早上,鬧鐘確實(shí)沒響,我睡到自然醒后,又想起這個(gè)案例。這個(gè)案例最有意思的地方在于:我和語音助手都在“進(jìn)化”。我下意識(shí)地想到用語音交互來解決問題,而它(即語音助手)既聽懂了,也做到了,這是我沒想到的。
說到這里,有人可能想到去嘗試“復(fù)現(xiàn)”這個(gè)操作,我想說,不一定能實(shí)現(xiàn)。這背后,既有后端技術(shù)和算法的迭代,更有“前端”我和語音助手之間平時(shí)的積累。如果沒有平時(shí)我和語音助手之間,那些高頻次的互動(dòng),以及略顯單調(diào)的話題,我估計(jì)它很難在關(guān)鍵時(shí)刻,聽懂我想要什么,并給出滿意的結(jié)果。
二是洗手的事。除了語音之外,近期還有一個(gè)例子,讓我印象深刻。在疫情發(fā)生后,我的智能手表也更新了一項(xiàng)功能:洗手提醒。當(dāng)手表感知到用戶在洗手時(shí),會(huì)自動(dòng)啟動(dòng)20秒倒數(shù)計(jì)時(shí)器,如果檢測(cè)到你沒達(dá)到洗手時(shí)間,它會(huì)提示您繼續(xù)洗手。
這個(gè)功能最初上線時(shí),誤報(bào)和漏報(bào)的幾率很高。因?yàn)槭直硪苍趯W(xué)習(xí),它在根據(jù)你手部的動(dòng)作,傳感器和麥克風(fēng)傳來的聲音綜合判斷你是否開始洗手。當(dāng)它“懷疑”你在洗手,會(huì)彈出如下提示:
在我看來,這既是邀請(qǐng)用戶標(biāo)注數(shù)據(jù),更是一種良性的互動(dòng)。每次我遇到這種提示,我都會(huì)很自覺的、盡可能真實(shí)的反饋問題。帶來的結(jié)果是,最近,我的手表檢測(cè)洗手的準(zhǔn)確度,已經(jīng)越來越高了。
前幾日,在某行業(yè)群里參與討論時(shí),我跟大家分享了這兩個(gè)案例。有群友給出結(jié)論:AI的成長(zhǎng),需要用戶陪跑(感謝左手醫(yī)生創(chuàng)始人兼CEO張超精彩觀點(diǎn))。
我很是喜歡這句話。用戶一定要認(rèn)識(shí)到,AI不是簡(jiǎn)單的商品或者單純的服務(wù),買來就用,用完就走。或者說,你賣你的,我用我的,用得好我就給你點(diǎn)贊,用得不好就發(fā)牢騷。
用戶一定要理解AI的特殊性。我之所以樂意為手表標(biāo)注數(shù)據(jù),愿意耐著性子和語音助手互動(dòng),是我的醫(yī)工背景,加上我對(duì)于行業(yè)的理解,讓我認(rèn)識(shí)到,AI的價(jià)值體現(xiàn)和行業(yè)發(fā)展,少不了用戶的參與,這種參與不僅僅是購(gòu)買和使用,更是標(biāo)注、陪跑這種看似不起眼的小事。
最近,IBM Watson的話題再次登上媒體。對(duì)于Watson的失敗,我認(rèn)為根子在于失衡。投入與產(chǎn)出的失衡,過高的期待值與實(shí)際表現(xiàn)之間的失衡等等。
太陽底下沒有新鮮事,在我們讀書時(shí),這種事便屢見不鮮:高考時(shí),有些人奔著清華北大去的,結(jié)果考了個(gè)重點(diǎn)一本,外界難以接受,自己承受壓力,心態(tài)失衡;有人平時(shí)默默無聞,無人問津。高考時(shí),考了個(gè)重點(diǎn)一本,自己滿意,外界點(diǎn)贊。
語音技術(shù)作為人工智能的一個(gè)分支,經(jīng)過大家多年努力,已經(jīng)體現(xiàn)出自身價(jià)值和良好的落地應(yīng)用場(chǎng)景,已經(jīng)具備了成為生產(chǎn)力工具的價(jià)值和能力。希望這項(xiàng)技術(shù)不要被捧殺,也不要被低估,而是按照自己的實(shí)際,以自己的配速奔跑,也希望用戶、醫(yī)療機(jī)構(gòu)更多的參與和陪跑,多方發(fā)力,共同進(jìn)步。