醫(yī)院信息化集成建設(shè),如何從頻繁“修平臺”邁向真正“用平臺”?
“醫(yī)院系統(tǒng)為什么又出問題了?”
“為什么平臺用起來這么卡?”
......
越來越多醫(yī)院建設(shè)了集成平臺后,會出現(xiàn)以上的抱怨和困惑。有的醫(yī)院發(fā)現(xiàn),平臺搭建完成后時常出現(xiàn)問題,三日一小補(bǔ),五日一大修,運(yùn)維人員的主要工作變成了“修平臺”而非“用平臺”。如果把醫(yī)院平臺比成一輛車,那么數(shù)據(jù)就是車上貨物,道路就是承載平臺運(yùn)行的軟硬件環(huán)境和網(wǎng)絡(luò)。道路維護(hù)和車修“人員”就像運(yùn)維人員,他們不僅要保持“道路”(軟硬件環(huán)境、網(wǎng)絡(luò)情況)通暢和“車輛”(平臺運(yùn)行)完好,還要在出現(xiàn)問題時,能夠迅速采取措施,進(jìn)行調(diào)度和修復(fù),以確保“運(yùn)輸”(集成業(yè)務(wù))通暢平穩(wěn)。
這里重點(diǎn)提到的三個要素:軟硬件和網(wǎng)絡(luò)環(huán)境、平臺運(yùn)維和集成平臺自身能力,是醫(yī)院從頻繁“修平臺”邁向真正“用平臺”的關(guān)鍵因素。
環(huán)境為基——“小問題”也會引起“大情況”
“......醫(yī)院里不曉得哪個災(zāi)舅子昨天下午把網(wǎng)線拔了,然后插回去又沒插好,導(dǎo)致網(wǎng)絡(luò)一卡一卡的,今天好多系統(tǒng)都出問題了......”這是發(fā)生在一家醫(yī)院中,運(yùn)維人員花了數(shù)天確定集成平臺異常的原因后,在群里發(fā)的一句話。盡管只是調(diào)侃,但背后的原因值得思考。
良好的軟硬件配套以及穩(wěn)定高效的網(wǎng)絡(luò)環(huán)境是集成業(yè)務(wù)構(gòu)建的“基石”。如果說集成平臺能穩(wěn)定運(yùn)行,有一半的功勞歸功于平臺自身,另一半則取決于軟硬件環(huán)境的可靠性。在醫(yī)院的集成過程中,頻繁出現(xiàn)的通常是一些“小問題”,但這些“小問題”可能會引發(fā)“大情況”,以下列舉了幾個例子供參考:
由于虛擬機(jī)設(shè)置不當(dāng),出現(xiàn)內(nèi)存資源競爭問題,導(dǎo)致平臺異常;
因?yàn)槭褂玫目煺哲浖?dǎo)致每天高峰期出現(xiàn)業(yè)務(wù)異常;
安裝的殺毒軟件沒有進(jìn)行優(yōu)化和設(shè)置影響平臺進(jìn)程,導(dǎo)致CPU占用率極高,引起平臺運(yùn)行卡頓;
硬件存儲IO問題使虛擬機(jī)出現(xiàn)卡頓,進(jìn)而導(dǎo)致集成平臺無法使用,并且多個系統(tǒng)出現(xiàn)不定時卡頓故障;
......
隨著平臺在醫(yī)院信息化中的核心地位不斷上升,它對環(huán)境的敏感度也顯著增強(qiáng)。因此,醫(yī)院必須努力提供更高質(zhì)量、更干凈、更可靠的軟硬件設(shè)施和網(wǎng)絡(luò)環(huán)境,以確保平臺在復(fù)雜的醫(yī)療信息化場景中能夠穩(wěn)定運(yùn)行,并保障醫(yī)院的正常運(yùn)營。為實(shí)現(xiàn)這一目標(biāo),平臺的運(yùn)維團(tuán)隊(duì)必須規(guī)范流程,提高運(yùn)維能力,建立有效的風(fēng)險預(yù)警機(jī)制。
運(yùn)維為本:“制度”、“人員”兩手抓
百度百科中對運(yùn)維的釋義如下:“運(yùn)維,本質(zhì)上是對網(wǎng)絡(luò)、服務(wù)器、服務(wù)的生命周期各個階段的運(yùn)營與維護(hù),在成本、穩(wěn)定性、效率上達(dá)成一致可接受的狀態(tài)”。在醫(yī)院信息化集成中,集成平臺的運(yùn)維是確保平臺能持續(xù)穩(wěn)定運(yùn)行,實(shí)現(xiàn)集成業(yè)務(wù)的順暢平穩(wěn)作業(yè)的“根本”保障。在這一過程中,建立合理的管理機(jī)制和適當(dāng)?shù)娜藛T配套至關(guān)重要。
1.管理機(jī)制:主要是對運(yùn)維工作的組織和規(guī)劃,重點(diǎn)是定期觀察業(yè)務(wù)高峰期的運(yùn)行狀態(tài)、軟硬件配套和網(wǎng)絡(luò)的情況、平臺上集成業(yè)務(wù)的異常和未解決狀態(tài)等,并檢查是否做好故障預(yù)警等措施,包括:
● 巡檢監(jiān)控:運(yùn)維人員需要定期進(jìn)行系統(tǒng)巡檢,檢查硬件設(shè)備的狀態(tài)、網(wǎng)絡(luò)連接是否正常以及軟件是否運(yùn)行順暢。同時,建立有效的監(jiān)控系統(tǒng),能夠?qū)崟r監(jiān)測平臺的各項(xiàng)指標(biāo),以便及時發(fā)現(xiàn)潛在問題。Odin的一體化界面能夠?qū)崿F(xiàn)對平臺所有下屬服務(wù)器的核心數(shù)據(jù)進(jìn)行監(jiān)控和查詢,包括CPU使用率、內(nèi)存利用率以及事件異常等信息,并將這些數(shù)據(jù)按照事件類型(一般、警告、錯誤)進(jìn)行匯總,便于后續(xù)的處理分析。
● 預(yù)警機(jī)制:運(yùn)維團(tuán)隊(duì)需要建立有效的預(yù)警機(jī)制,以便在問題發(fā)生之前就能夠提前預(yù)警。這包括設(shè)置閾值,當(dāng)系統(tǒng)指標(biāo)達(dá)到或超過這些閾值時,自動觸發(fā)警報,使運(yùn)維人員能夠及時采取措施。Odin具備態(tài)勢感知功能,結(jié)合自動預(yù)警機(jī)制,能及時發(fā)現(xiàn)并監(jiān)測平臺潛在問題。此外,Odin還為常見問題提供了包括熔斷、降級、限流等在內(nèi)的多種解決措施,從技術(shù)上為醫(yī)療機(jī)構(gòu)的預(yù)警機(jī)制提供支持。
● 故障處理:當(dāng)平臺出現(xiàn)異常或故障時,運(yùn)維人員的首要任務(wù)是快速恢復(fù)日常生產(chǎn),最小化平臺停機(jī)時間,再進(jìn)行故障處理。Odin獨(dú)特的統(tǒng)一界面管理能力讓運(yùn)維人員能通過統(tǒng)一的界面對于工作實(shí)例運(yùn)行狀態(tài)以及其中各業(yè)務(wù)情況進(jìn)行瀏覽查看,避免了對服務(wù)器一一排查或頻繁切換服務(wù)器管理界面的繁瑣操作,大幅降低異常發(fā)生時集成平臺容災(zāi)恢復(fù)的時間和工作量,這是多臺服務(wù)器二次開發(fā)后搭建的 “集群”難以具備的能力。
● 性能優(yōu)化:運(yùn)維團(tuán)隊(duì)還需要不斷優(yōu)化系統(tǒng)性能,以應(yīng)對日益復(fù)雜的應(yīng)用場景和高并發(fā)的業(yè)務(wù)需求。這可能包括資源分配的調(diào)整、軟件升級和配置的優(yōu)化等工作。根據(jù)Intel官網(wǎng)發(fā)布的《ODIN 引擎全場景一體化集群版基于第三代英特爾? 至強(qiáng)? HCI 平臺優(yōu)化方案白皮書》,Intel和Odin進(jìn)行了深入的聯(lián)合測試和調(diào)優(yōu),Odin集群版的平均每秒事務(wù)處理量(TPS)可達(dá)30000以上,相當(dāng)于每分鐘處理180萬次事務(wù),充分滿足醫(yī)療集團(tuán)、醫(yī)聯(lián)體/醫(yī)共體以及區(qū)域醫(yī)療等大規(guī)模醫(yī)療衛(wèi)生機(jī)構(gòu)的平臺需求。
2.人員配套:建議有專人負(fù)責(zé)平臺運(yùn)維,同時運(yùn)維人員需具備一定的集成技術(shù)知識,可以對生產(chǎn)環(huán)境中出現(xiàn)的問題給到及時的應(yīng)對方案,并能落實(shí)好相應(yīng)的運(yùn)維機(jī)制。如果平臺自身能力比較強(qiáng)、功能比較全面和易用,那么運(yùn)維人員1到2人即可,反之可能會需要更多的人員以及對人員能力要有更高要求。
Odin針對醫(yī)院的本土化需求進(jìn)行大量開發(fā),增加國內(nèi)常用而國際著名品牌不具備的易用性功能,例如內(nèi)置API網(wǎng)關(guān)、鑒權(quán)管理、各種標(biāo)準(zhǔn)化定義、數(shù)據(jù)處理轉(zhuǎn)換工具、PDF導(dǎo)出等各類組件,并兼容國產(chǎn)服務(wù)器和操作系統(tǒng),實(shí)現(xiàn)開箱即用。同時Odin全程中文支持,純Web操作界面和可視化工具等,使操作運(yùn)維更簡單,一目了然,降低學(xué)習(xí)使用門檻,快速上手操作。
平臺為用:從“補(bǔ)丁式”、“碎片化”開發(fā)邁向“一體化”、“全局化”建設(shè)
有的醫(yī)院通過努力打造堅實(shí)的硬性和軟性基礎(chǔ),解決了頻繁“修平臺”的問題。然而,在醫(yī)療機(jī)構(gòu)中,尤其是大型三級醫(yī)院,信息化建設(shè)已步入復(fù)雜的“深水區(qū)”。醫(yī)院不僅需要確保平臺的穩(wěn)定高可用,還需要將平臺真正用起來,滿足“深度”業(yè)務(wù)需求,如閉環(huán)管理、跨院區(qū)的實(shí)時交互、互聯(lián)網(wǎng)醫(yī)院的業(yè)務(wù)協(xié)同、T+0的數(shù)據(jù)主題庫建設(shè)和業(yè)務(wù)中臺建設(shè)等高級別測評要求和著眼全局的建設(shè)規(guī)劃。
如果集成平臺日常運(yùn)維仍處于“補(bǔ)丁式”開發(fā)和“碎片化”應(yīng)用的階段,缺乏一體化、全局化的建設(shè)流程來實(shí)現(xiàn)相應(yīng)需求,將難以滿足這些復(fù)雜多樣的集成需求,或者實(shí)際使用過程非常繁瑣復(fù)雜,導(dǎo)致醫(yī)院難以充分發(fā)揮平臺的潛力,那么平臺本身的價值將受到限制,距離真正“用平臺”仍有一定距離。
Odin突破了傳統(tǒng)堆砌功能“授人以魚”的方式,而是通過“授人以漁”形成了一套DevOps規(guī)范化管理的方法論,并為該管理流程搭建了扎實(shí)的環(huán)境基礎(chǔ),例如生產(chǎn)/開發(fā)雙環(huán)境隔離、開發(fā)/測試/審核/管理人員不同權(quán)限的分離,通過熟練運(yùn)用上述環(huán)境進(jìn)行開發(fā),自然而然能引導(dǎo)醫(yī)院形成一套規(guī)范化、全局化的開發(fā)、運(yùn)維、管理流程,助力醫(yī)院應(yīng)對“碎片化”集成需求,實(shí)現(xiàn)對集成平臺的“深層次”運(yùn)用。
結(jié)語
環(huán)境為基、運(yùn)維為本、平臺為用,通過將這三者有機(jī)結(jié)合,實(shí)現(xiàn)更穩(wěn)定、更可靠、更高效的信息化集成,走出頻繁“修平臺”的困境,助力醫(yī)院邁上真正“用平臺”的新臺階。
(本文由ODIN公司供稿)