元宇宙(metaverse)正為科技產業帶來全新商機,不論是 AR/VR 遊戲、3D 數位展演場館、電影動畫乃至建築設計,現在已越來越多行業講究提供消費者「沈浸式感官體驗」,然而,這背後可是需要運用到大量的圖像擷取運算能力,才能完美實現身歷其境的效果。

不僅如此,對汲汲追求數位轉型的金融、製造、醫療等產業來說,也仰賴著各種深度學習、AI 技術協助進行大數據分析、建模與預測。然而,並非做電腦繪圖 3D 渲染或是深度學習與 AI 運算,都需要靠高階圖形處理器(GPU)及強大運算力才跑得動,要擁有高性價比基礎架構,須深入應用情境來考量。

依工作負載挑選合適伺服器和 GPU,沒想像中困難

擁有數千個核心可並列執行大量運算的 GPU,向來適合用在 3D 渲染、AI 訓練及推論等類型工作負載,然而,光是 NVIDIA 各系列 GPU 就將近上百款,Lenovo 技術協理林旭堂指出,依據工作負載選擇合適的伺服器及 GPU,才能發揮最大功效。

Lenovo 企業客戶總監趙湘怡分享最近北部某數位展演場館的系統建置案例,該場館為了打造 4K 沈浸式展演空間,讓參觀者能融入場域環境中,計畫將多台投影設備的影像融合縫接,經過概念驗證及評選後,搭載 NVIDIA RTX A6000 顯卡的 Lenovo ThinkSystem SR650 機架式伺服器,以最佳的性價比擊敗他牌脫穎而出。

林旭堂進一步指出,該場館主要的工作負載是執行影像融接控制軟體,而此類應用最大需求正是需要大量的 GPU 記憶體,可一次載入 3~4 個影像進行融接與置換,若 GPU 記憶體不足,則需分 3 至 4 次載入影像甚至使用到主記憶體,這都將造成服務延遲。

Lenovo 企業客戶總監趙湘怡

而此次 SR650 所搭載 NVIDIA RTX A6000 顯卡,內含 GPU 記憶體達 48GB,且 CUDA Cores 更高達 10,752 個,幾乎是一般顯卡的 4 倍之多。

NVIDIA 產品銷售經理徐千柏指出,依此次概念驗證案的需求,顯卡所含的 CUDA Cores 及記憶體大小直接影響 3D 影像融接效果,而搭載 RTX A6000 顯卡的 SR 650 經壓力測試,在效能方面各項數據都表現最佳。

Lenovo 技術協理林旭堂

此外,由於 SR 650 是雙插槽 2U 機架式伺服器,內含 2 個 CPU,最高可支援 3 片雙倍寬度 GPU 卡,而在前述案例中該場館部署的 30 台 SR650,每台只使用 1 張 GPU 卡即可完成工作負載,更能保留未來擴充性。

系統管理引擎方面, SR 650 搭載 XClarity Controller 內嵌管理,可集中管理 ThinkSystem 伺服器、儲存設備及網路的虛擬化應用程式,縮短 95% 佈建時間,大幅簡化 IT 管理、加快佈建速度。

另一個案例則是在波士頓、芝加哥、達拉斯、紐約、舊金山都設有辦公室的創意工作室——Neoscape,該公司同樣也選擇升級配備 NVIDIA Quadro RTX GPU 的高性能聯想 ThinkPad、ThinkStation 以及 ThinkSystem 解決方案,成功將 3D 動畫的渲染時間,從幾小時縮短到幾分鐘之內。

對 TFLOPS 擁有清楚統計分析!擁 238 項世界紀錄的 Lenovo 這樣提供企業專業建議

林旭堂表示,Lenovo 能提供顧問諮詢服務,依不同應用情境建議搭載不同顯示卡的 ThinkSystem 系列伺服器來發揮最大功能。

以物聯網應用為例,前端就可使用 SE 350 邊緣伺服器搭載 NVIDIA T4 顯示卡將蒐集來的感知資料做初步推論,而 SR 650 則置於中間層做 AI 推論,最後可將資料送到後端 SR 850 高階伺服器做運算處理。

另一個角度看,不同顯卡浮點運算能力各異,因此適用不同的工作負載。

例如對「精度」要求較不高的機器學習、AI 推論應用來說,使用支援整數運算浮點數的 GPU 卡,如 RTX 6000 即可符合多數需求;在醫療應用方面,若是要進行 DNA 分析或是要加速高效能運算的應用,則需使用雙精度 FP64 的顯卡,如 NVIDIA V100S。

林旭堂表示,Lenovo 對於每張顯卡執行不同工作負載的每秒浮點運算次數(TFLOPS)有清楚統計分析,因此能依應用建議最適合的顯卡與系統,而聯想 ThinkSystem 伺服器,在性能方面更已創造 238 項世界紀錄。

最後,想要達到高性價比,在伺服器的選擇評比上,除了效能之外,也須納入可靠度、可用性、擴充性及管理與安全性等來考量。

根據「ITIC 2021 年全球伺服器可靠度調查報告」,Lenovo x86 伺服器在所有 x86 平台上已連續第 8 年有最佳 Uptime 表現,即使需更換零件也能在最短時間內恢復系統運作。

而在管理與安全性方面,Lenovo 的 XClarity 平台可集中管理最高 1 萬台伺服器,並運用 AI 技術在日誌問題的過濾與預測上,以簡化管理負擔。

在安全性方面,Lenovo 在系統設計之初就採用 TPM 安全晶片,並符合美國國家標準技術研究院(NIST)及 FIPS 140-2 加密規範,同時 Lenovo 的產品安全團隊也加入 FIRST 資安組織,能即時掌握弱點資訊強化系統平台安全,並獲得美國國土安全局認可為最高安全水準。

(左起)NVIDIA 產品銷售經理徐千柏、Lenovo 技術協理林旭堂、Lenovo 企業客戶總監趙湘怡、Lenovo 中亞太區解決方案首席顧問黃國柱

疫情讓全球產業加速數位轉型腳步,快速、靈活以及創新已經成為現代企業的關鍵存活密碼,從最佳化資料中心的部署開始,解決企業正面臨以及即將面臨的重大挑戰。

(本文提供合作夥伴轉載。)