郜勇:基于云架構的多院區(qū)同城雙活災備系統(tǒng)建設探索與實踐
創(chuàng)建于1866年的華中科技大學同濟醫(yī)學院附屬協(xié)和醫(yī)院(以下簡稱“武漢協(xié)和醫(yī)院”)是中部地區(qū)歷史最悠久的委屬公立醫(yī)院,見證了西醫(yī)文明在中部的起源和發(fā)展。醫(yī)院目前擁有主院區(qū)、車谷院區(qū)、腫瘤院區(qū)和金銀湖院區(qū),采取四位一體的立體化布局,實現(xiàn)了同品質醫(yī)療、一體化管理。醫(yī)院信息與數(shù)據(jù)中心主任郜勇在CHIMA 2024大會演講時介紹:“為實現(xiàn)多院區(qū)一體化管理,我們的四個院區(qū)用一張網絡連接起來,實現(xiàn)了網絡通、信息通和數(shù)據(jù)通,這是開展多院區(qū)業(yè)務協(xié)同的基礎。”
構建災備體系勢在必行
災備體系建設關乎業(yè)務連續(xù)性和數(shù)據(jù)安全性,因此,國家出臺了相關的標準和要求,其中《信息系統(tǒng)災難恢復規(guī)范》將災備恢復等級劃分為6個,RTO(Recovery Time Objective)和RPO(Recovery Point Objective)為評估災備體系建設的重要指標。根據(jù)等保2.0的要求,不同等級對數(shù)據(jù)備份恢復和災備提出了不同要求,例如提供異地實時備份功能、重要系統(tǒng)和數(shù)據(jù)庫的容災備份,制定應急預案,定期進行演練。
對此,郜勇強調:“醫(yī)療行業(yè)從評級評測指標分析,業(yè)務容災是體系建設,不僅需要機房、服務器、存儲、網絡等硬件設備,還需要配備專業(yè)管理人員持續(xù)值守。互聯(lián)互通五級乙等容災核心指標RTO、RPO小于15分鐘,更是對醫(yī)院容災建設提出了很高的要求。”
當前,向多院區(qū)協(xié)同高質量轉型發(fā)展是武漢協(xié)和醫(yī)院建設的管理目標,其服務理念由“以疾病為中心”轉向“以患者健康為中心”,管理模式是由粗放的行政化管理轉向全方位的績效管理,由此實現(xiàn)服務隨手可及、業(yè)務順暢協(xié)同、資源高效共享、數(shù)據(jù)海量匯聚以及調配靈活彈性的目標。
醫(yī)院業(yè)務連續(xù)性對災備體系提出了新要求。“我們計劃構建同城雙活中心,核心系統(tǒng)達到應用級雙活,重要系統(tǒng)達到應用級災備,所有應用實現(xiàn)數(shù)據(jù)級備份。”郜勇指出,醫(yī)院圍繞新的數(shù)字基建方向,打造了云計算中心,推動業(yè)務深度上云,加快醫(yī)院數(shù)字化轉型和智慧醫(yī)院建設。
設計與規(guī)劃災備體系
“隨著越來越多的傳統(tǒng)應用向云原生漸進式演進,數(shù)據(jù)中心建設將從傳統(tǒng)的虛擬化架構向云計算中心轉變,即時開發(fā)、部署軟件的SaaS模式將成為主流。結合行業(yè)經驗以及技術發(fā)展趨勢,武漢協(xié)和醫(yī)院選擇基于云架構的災備體系建設方案。”郜勇強調,結合醫(yī)院信息化建設現(xiàn)狀以及業(yè)務發(fā)展特點,武漢協(xié)和醫(yī)院選擇建設基于云架構的兩地三中心災備系統(tǒng),打造“多云協(xié)同、多域災備、分級云管、自動災切”的多院區(qū)架構和系統(tǒng),圍繞這個目標制定武漢協(xié)和醫(yī)院云平臺和災備體系建設的長期規(guī)劃。
武漢協(xié)和醫(yī)院制定了災備中心建設演進路線,采取的是三步走策略:第一階段,推進金銀湖院區(qū)上云,構建同城雙活云架構;第二階段,多院區(qū)形成一朵云,實現(xiàn)核心業(yè)務逐步上云,統(tǒng)一架構、打通資源、統(tǒng)一管理,完善云上業(yè)務級災備體系;第三階段,構建異地災備中心和公有云資源中心,實現(xiàn)兩地三中心架構。
郜勇指出,武漢協(xié)和醫(yī)院災備體系建設從兩個層面開展:第一個層面是災備管理目標,圍繞著誰要做、誰來做、怎么做、如何用這四個維度,具體內容包括應用系統(tǒng)分級分類(這是災備設計的關鍵)、容災組織、容災切換及演練、容災標準規(guī)范;第二個層面是災備技術架構,包括應用雙活支撐架構設計、故障切換架構設計以及數(shù)據(jù)備份架構設計。
“我們的災備系統(tǒng)優(yōu)先建設的是醫(yī)院8大核心業(yè)務系統(tǒng)。”郜勇強調,根據(jù)前期對業(yè)務系統(tǒng)的詳細分析,武漢協(xié)和醫(yī)院將業(yè)務系統(tǒng)分為三類進行災備建設:第一類包括HIS、電子病歷、LIS和PACS,災備定級為五級,實現(xiàn)應用雙活,RTO和RPO均實現(xiàn)≤15分鐘;第二類包括集成平臺、官微、移動護理和支付系統(tǒng),災備定級為四級,實現(xiàn)應用主備,RTO≤30分鐘,RPO≤15分鐘;第三類為其他業(yè)務系統(tǒng),實現(xiàn)數(shù)據(jù)全量備份。
武漢協(xié)和醫(yī)院根據(jù)應用災備等級的劃分來進行災備方案設計,災備體系建設按照分層設計的理念和方法,從醫(yī)療應用出發(fā),從管理、應用、計算、數(shù)據(jù)庫、網絡等多個層面構建基于醫(yī)院應用系統(tǒng)級別的容災體系。
在郜勇看來,災備體系建設除安全可靠的架構外,還需要自動化的切換平臺來保障整個災備體系的運轉。武漢協(xié)和醫(yī)院選擇具備IT多維度管理的容災平臺:提供100%全視角的流程監(jiān)控,實現(xiàn)業(yè)務可視化;提供靈活的流程編排工具,實現(xiàn)自動災備切換;提供機房三維呈現(xiàn),實現(xiàn)全域可視。
為保障災備體系高效有序進行,武漢協(xié)和醫(yī)院量身定制了災備切換流程:容災切換涉及預警、啟動、切換、解除及回切五個階段,容災管理體系下相關專業(yè)組織分別參與應對,涉及內容包含事件升級、應急啟動,社會公關,技術切換、業(yè)務應急等關鍵步驟。
加強災備體系運維
災備系統(tǒng)建設交付后,日常的運維管理尤為重要。對此,郜勇表示:“災備運維服務內容包括基礎系統(tǒng)運營管理、業(yè)務連續(xù)性管理、災備人員組織管理三個方面”。
為保證武漢協(xié)和醫(yī)院災備系統(tǒng)的可用性,武漢協(xié)和醫(yī)院制定了配套的應急演練工作計劃,容災演練工作分為3類演練:1個桌面演練,2個實戰(zhàn)演練分別針對流程、系統(tǒng)及整體業(yè)務容災進行演練。
郜勇指出,基于云架構的多院區(qū)同城雙活災備系統(tǒng)具有以下意義:
1.通過構建協(xié)和醫(yī)院私有云,實現(xiàn)多中心一體化,為武漢協(xié)和醫(yī)院業(yè)務上云打造了資源共享、數(shù)據(jù)融合、架構高可用、彈性可擴展、運維簡易的基礎設施底座;
2.實現(xiàn)同城雙活應用級別的災備,并向兩地三中心模式遞進,保障了業(yè)務系統(tǒng)的不間斷平穩(wěn)運行,提升醫(yī)院的業(yè)務連續(xù)性;
3.充分利用雙院區(qū)已部署的IT資源,提高資源復用率,從而提升投入產出比;
4.通過災備管理平臺,既能實現(xiàn)災備系統(tǒng)的自動化切換,保障業(yè)務連續(xù)性,又能實現(xiàn)對多院區(qū)多云資源的統(tǒng)一監(jiān)控,提升全院運維效率。
“醫(yī)院信息化基礎設施如果不牢固,必然會對整個業(yè)務的連續(xù)性來帶影響。創(chuàng)新來自于守正,守正則源于信息系統(tǒng)的安全為業(yè)務連續(xù)性提供保障,反過來又能推動創(chuàng)新,由此產生更高端的應用。”郜勇總結道。