圖片來源:Shutterstock

企業走向數位轉型,勢必將越來越依賴網路和系統,連帶 IT 基礎架構也必須有所轉變,才能滿足數位轉型需求。為了降低 IT 維運管理過程中的人力負擔與人為疏失風險,許多企業會導入「智慧維運平台 AIOps」。

AIOps(Artificial Intelligence for IT Operations),是最近幾年市場的熱門話題!當企業為了確保服務不中斷、系統運作穩定,甚至要做到在出現問題前預先排除,就需要另一套能做到綜合管理多重監控工具、數據,並能依據事件規則,自動執行預設流程腳本的 AI 平台,也就是 AIOps

AIOps 解決方案平台能降低成本及人為失誤風險

權威調研公司 Gartner 在研究報告中定義:AI 能透過監控工具、資訊科技服務、自動化來強化 IT 維運。以下舉一個維運的狀況案例,說明監控不察的風險在哪。

某國際電動車大廠曾遇到伺服器 App 域名憑證過期的問題,後導致系統停擺近 3 小時,接下來更因駕駛無法用 App 打開車門,在網路上引起一片抱怨聲浪。雖然事件最後平安落幕,但若維運人員無法即時定位系統問題,很可能衍伸成更危險的狀況。

IT 管理者可能得同時使用十幾種監控工具,還要面對上千條人為定義的規則,不只管理不容易,遇到事件時,也很難判斷造成事件的根本原因(Root Cause)。

奔騰網路 Marvin 結合人工智慧,從降低維運成本打造 AIOps 解決方案

AIOps 起家、致力於實踐無人化維運(NoOps)的奔騰網路營運長林中致(Tom Lin)強調:「傳統運維人力服務配置,通常是 5~6 個人,需要分三班制輪班,但若企業導入 Marvin 自動化維運平台,只需要 2 個人就已足夠。」

林中致再以導入 Amazon Web Services(AWS)後的數字說明運算的時間差:「在 AWS 上運行橫跨亞洲 5 個國家的自動化發佈系統(automation distribution system),運算反應速度比傳統的地端(on-prem.)部署快 65% 的時間。」。

奔騰網路團隊於 2017 年推出自行研發的自動化維運平台 Marvin,採用雲平台業者 AWS Amazon Simple Storage ServiceAmazon S3)、Amazon Elastic Compute CloudAmazon EC2)、Amazon Virtual Private CloudAmazon VPC)、AWS WAFAmazon CloudFront 等服務,打造出能夠運作自動化維運平台的工具庫。

還有哪些 IT 維運管理問題?AWS 團隊直接聽你問!
填寫問卷即獲得 UberEats $50 獎勵金,讓美食療癒你!

確保 IT 系統不會出錯,也是維繫品牌聲譽的方式之一

對企業來說,確保 IT 系統的正常運作,其實也是維繫品牌聲譽的一種方式。奔騰網路營運長林中致說明,某企業客戶在 2019 年時,先後遇到兩大公有雲的 Content Delivery Network(CDN)供應商服務故障的突發事件,幸好客戶已經預先在 Marvin 上設置了 CDN 容災備援的自動化腳本,當 Marvin 偵測到 CDN 出問題的時候,就會立即啟動 CDN 備援的自動化程序,先自動從備用的 CDN 服務供應商開通新服務,並且自動完成相關服務的設定配置、快速的分流。

Marvin 的自動化功能能成功協助企業客戶避免服務中斷,而且將對終端客戶潛在可能的負面影響降到最低。以前述電動車大廠的服務中斷為例,因為 Marvin 具備域名和憑證自動化更新的功能,可說是從根本避開了這個風險,也就不會引起使用者抱怨聲浪。

奔騰採用 AWS 工具協作,整合出能幫企業降低人為失誤的 AIOps

導入 AWS Marvin 平台,不僅幫企業省下時間和人力成本,也能降低人為操作失誤的機率。

舉例來說,很多企業遇到應用更新或是要發佈新服務的時候,動輒就要更新幾百台的伺服器,如果通通都是由 IT 人員手動更新,發生錯誤的機率就會很高,但 Marvin 就不會有此問題。

AWS Marvin 的結合,大幅降低企業上雲成本跟決策風險

林中致也強調,AWS Marvin 的結合,提供了從地端到雲端服務和維運移植的便利性,舉例來說,企業可以將 VMWare Template 轉換成 Amazon Machine Images (AMI),在雲上快速的啟用虛擬機器,或是同步部署地端的 Reverse Proxy跟雲端的 Amazon Route 53 AWS Elastic Load Balancing(ELB)負載平衡器,大幅降低上雲的學習成本和決策風險。

也因此,目前奔騰網路遇到企業客戶打算規劃新的應用或服務場景,第一個推薦的雲平台都是 AWS,因為 AWS 提供一個高度穩定、安全、可靠的雲端環境,且 AWS 的架構師和技術專家能夠提供即時支援,讓企業客戶能夠安心地在 AWS 上承載新的業務,並透過 Marvin 確保系統及服務穩定性。

企業在佈建數位轉型時,可能會透過虛擬化主機、超融合架構等方式擴充 IT 基礎建設,或將服務搬上雲端,但這些都有可能造成IT維運管理工作更複雜更有挑戰性。近年出現的智慧維運平台 AIOpsArtificial Intelligence for IT Operations),就是在這趨勢下誕生的解決方案,協助企業管理日漸繁複的維運系統。

讀完本文還有哪些 IT 維運管理問題?AWS 團隊直接聽你問!
填寫問卷即獲得 UberEats $50 獎勵金,讓美食療癒你!

你可能有興趣

◊ DevOps、SRE、Op 維運工程師的未來:要繼續建置基礎架構還是培養新職能?
◊ 有神人同時擔任 Google 與 FB 的工程師!帶你認識科技界的「搖滾明星法則」
◊ 【一文看懂何謂「數位轉型」】前 NCC 主委真情告白:數位發展的必要性及關鍵要素