中國人民銀行發布的《金融數據中心容災建設指引》(JR/T 0264—2024)已于2024年7月29日正式實施。這一金融行業標準對金融數據中心容災建設中的“組織保障、需求分析、體系規劃、建設要求、運維管理”進行了規范和指導。面對不斷增加的各類網絡、業務、應用和數據風險,金融機構究竟該如何更好地規劃、建設、運維其容災系統,實現長期可持續發展的戰略目標呢?
下面,就讓我們聽聽業界的“大咖”們都怎樣說……
邁入數智化新時代,金融行業正在全面推進數字化轉型、信創、人工智能應用等,無論是業務模式還是技術架構都發生了很大變化。
美創科技副總裁顧皓天將金融行業連續性強訴求和災備資產散雜多亂的矛盾,歸納為以下三個方面:信創國產化帶來產品、技術形態的百花齊放;云生態、云原生在資產類型、技術形態、數量規模等各個方面顛覆了傳統數據中心;數字化變革讓數據規模呈現海量化。
金融行業多年來一直十分重視容災建設,相關監管機構陸續發布過多項標準、規范、指南等。顧皓天指出,此次最新發布的《指引》進一步強調了
災備的日常運營、精準匹配切換預案、保證災難切換成功率,以及最小化災難切換時長等。
出于對業務連續性的高要求,以及在技術創新的推動下,金融行業的容災建設與運維呈現出很多“新意”。
“拿捏”云容災
相比傳統的容災解決方案,云容災由于具備更高的自動化程度、更靈活的擴展能力、更低成本等優勢,得到了越來越多企業客戶的青睞,金融行業的客戶亦是如此。據SNS INSIDER預測,2023-2030年,Cloud DRaaS市場的復合年增長率為24.2%,到2030年整體規模將達到426.8億美元。
這對于云服務商以及容災方案和工具的提供商來說是一種積極的促進。他們在云容災的技術和服務上銳意創新,覆蓋數據的遷移、數據的備份與恢復、數據統一管理、數據智能化等。當前由于混合多云的接受度越來越高,多云環境下的跨云容災,以及如何更好地發揮云的優勢確保業務連續性,并加強容災演練成為研究重點。顧皓天分析指出,基于金融行業的特點和需求,在云容災方面,他們當前
更專注于云原生、私有云的容災備份等。在實踐中,美創科技基于新一代災備一體化平臺(DRCC),幫助銀行、證券、信托等金融單位建設容災備份能力及災備運營管控能力,保障業務RPO/RTO目標。
AI在災備領域已嶄露頭角
當前,人工智能(AI)技術正在加速向各個行業和領域滲透,容災系統建設也不例外。AI技術能夠有效優化災備系統的建設,并提升預警能力等。顧皓天認為,數字化是人工智能應用的基礎。AI正在容災系統建設與運維的諸多環節發揮積極作用:基于日志、錯誤、資源使用率、變更等上下文數據關聯分析,給出智能化災備告警分析;結合災備告警分析,智能推薦災備預案;采用大模型建立運維知識庫。
舉例來說,美創科技利用AI技術構建了智能監控和預警系統,實時監測系統的運行狀態,以便及時發現潛在的風險和異常情況。結合大數據分析與機器學習算法,系統能夠自動識別異常模式,提前預警。再比如,美創科技應用AI技術實現了自動化的運維管理。通過機器學習和自然語言處理技術,系統可以自動執行日常運維任務,包括數據備份、故障排查和系統恢復等,從而提高了運維效率與準確性。
災備建設與運營 “兩手抓,兩手硬”
以前,人們的關注點大多集中在容災系統的建設上,包括:需求分析、容災中心的規劃和建設等。但是若想容災系統在自然災害或系統故障發生時能夠真正發揮作用,成功切換和恢復,容災系統的運維、運營至關重要。
“金融行業的災備運營已成為日常運維管理的必需組成部分,包括災備預案設計、災備資源巡檢、災備模擬演練、災備實戰演練、系統可觀測性建設等。”顧皓天表示,“
運維一體化可觀測體系建設是新趨勢,讓人看見、讓人干預、讓人的智慧推動安全能力的發展是努力的方向。美創科技通過持續的創新,致力于通過可觀測性體系持續不斷地看見未知、看見未來;通過持續看見確定性,構建面向未來的運維、容災體系,不斷增強運行安全的韌性。”
中國人民銀行總行對人行分支機構的災備建設有突擊檢查機制。在2023版中國人民銀行總行發布的政策文件中,突擊式應急演練涉及的業務系統更多,切換流程更復雜,且RTO要求更高。因此,借助工具自動化完成演練,成為中國人民銀行各機構災備建設運維的新趨勢。
美創科技已助力全國多家人行分行應急切換管理系統建設,實現了業務連續和監管合規需求,并獲得充分認可。中國人民銀行華南某省分行根據授權在其周邊三省履行中央銀行職責。該分行攜手美創科技共同開展了演練切換。
該分行選擇對生產系統進行業務級演練切換:將4套核心生產業務切換到災備機房,以驗證銀行災備建設的成果,確保演練過程滿足央行監管要求,同時提高災備運維團隊的協作能力。
演練切換前,美創科技已協助該分行在測試環境中進行了多次評估和驗證。在演練中,模擬了真實突擊監管抽查場景:現場值班人員在獲取管理人員提供的安全碼授權后,快速通過美創災備一體化平臺(DRCC)進行一鍵切換操作;切換完成后,由災備中心繼續對外提供業務并持續運行一整天,在驗證災備正常可用后,選擇第二天晚間進行“一鍵回切”,以恢復生產業務的正常運行。
最終,在值班人員獨立操作下,順利完成4套業務系統、共計39個節點的一鍵快速切換和回切,耗時滿足央行小于30分鐘、該分行10分鐘的要求。DRCC平臺為本次切換自動生成演練報告,覆蓋詳細的切換日志、虛擬機截圖、命令行回顯視頻等,證明了切換的真實性和有效性。
“災備一體化”構建容災體系
美創科技多年來一直深耕容災建設領域,并且專注于技術和產品層面的創新演進。獨樹一幟的美創災備一體化平臺,能夠實現災備狀態可感知、災備能力可訂購、災備演練可掌控、災難切換可指揮,引領了災備建設的“五個一體化”的發展,包括
“災備能力一體化、災備管控一體化、災備運營一體化、災備觀測一體化、災備融合一體化”。
通過“災備一體化”,可以有效提升數據安全性,更好地適應多云環境的需要,不斷深化各行業在容災方面數字化、自動化、智能化的應用,保障業務連續性同時,提升運維效率,為金融行業的數智化轉型保駕護航。