NVIDIA

世界一直在變,但有些事卻是永恆不變的,例如參加黑客松做 scrum 開發的熱血,還有終於找到解決方法,看到一線曙光的那股興奮,永遠都會帶出開發者、工程師的成就感。NVIDIA 為了推廣 GPU 的好,在今年仍然不畏疫情,在線上舉辦了連續 5 天的黑客松,廣邀台灣開發者一起來挑戰。

NVIDIA TWCC GPU Hackathon 與國研院國網中心、台灣智慧雲端服務攜手協辦活動,專為開發者、研究人員設計一個連續 5 天的活動,協助開發團隊透過 GPU 找到加速程式碼的新方法。

因此,過往只知道使用 CPU 或是傳統資料分析模式的開發團隊,非常有可能在 5 天之內就可以上手 GPU,並且找到適合自身團隊的開發效率全新解決方案。這場活動特別提供 TWCC 臺灣 AI 雲運算資源供參賽者使用,甚至 NVIDIA 還會出動專家講師,特別針對 GPU 與技術工具做使用指導。

沒看過哪場黑客松,還是主辦方親自邀請團隊來體驗的

為了向開發者推廣這超好用的工具,NVIDIA 這一次舉辦黑客松不只是開放報名,還會親自上門邀請團隊參加黑客松,其中的大功臣就是 NVIDIA 資深解決方案架構師賴柏均。他表示,希望透過實際應用,讓學界與產業更了解 GPU 的應用可能及發展潛力,進而讓更多產學界夥伴擁抱這實用的工具。

為了找尋適合的團隊,賴柏均多管齊下,除了透過先前的團隊介紹,更在各式研討會、業界活動中尋找潛在需求者,邀請他們來體驗看看:透過 GPU 將工作內容全面升級,究竟是種什麼樣的感覺?

這一次 NVIDIA 也特別邀請兩組參與黑客松的團隊,親自分享專案開發過程,以及 Before and After 成果!

智慧製造的關鍵項目,產線智慧排程如何優化?

由林群惟博士、蘇粲程博士所帶領的團隊「AI Scheduler」,首度參與本屆黑客松,就透過 GPU 加速找到未來商品優化的方向。

因應彈性製造與生產時代來臨,台灣高科技製造業、生技產業等都面臨要快速排程生產的挑戰。這時候透過數位工具來做智慧排程處理,可以有效提升效率與客戶滿意度。

AI Scheduler 團隊成員來自工研院巨量資訊科技中心,8、9 年來鑽研機器學習等 AI 領域,開發了許多像是機台故障率預診斷、線上品質預測等等實用工具軟體,協助第一線生產者掌握生產流程。不過,在拓展「智慧排程」領域時,也遭遇到了產品技術升級的挑戰。

在過去,排程靠的主要是人腦,一切原則都奠基於經驗法則與直觀判斷,在小場景中其實還算實用;可若是生產規模擴大或是參數變多,那人腦可就不如電腦了。團隊主要客戶多半來自高科技光電半導體、基礎工業鋼鐵產業、製藥生技醫材產業等等領域,這些產業目前在生產與製造上,更面臨了需要彈性生產、快速換線與市場客戶需求快速變化的挑戰。

因此,智慧排程幫助生產順暢,變成為拿下訂單的重中之重。

團隊會以蒙地卡羅樹搜尋(MCTS)等方法去協助尋找最佳解,透過優化搜尋,以及系統本身的學習機制,達到智慧排程的目標;在黑客松中,團隊想做的,則是挑戰既有限制、全面加速整體排程效率。

對此,黑客松的 Mentor 在協助導入 GPU 外,還提供了不少好用的工具,比如「Nsight」,不僅能讓團隊更快找到資料處理的問題癥結,更能大幅提升資料可視化程度。

透過 GPU 強化,整體排程效率提升了 11.3 倍

以團隊此次在黑客松嘗試的 MCTS 應用來說,將模擬放到 GPU 後,整體運算時間竟然整整提升了 11.3 倍!假設一個工廠要做 5000 張訂單排程,過去用 CPU 排程,可能得花到 6 個小時;但透過 GPU,只需要不到 30 分鐘,出去喝個下午茶就搞定了!

關於這次黑客松中所獲得的成果,蘇粲程和黃浩哲表示,目前已驗證了技術可行性,期待未來能進一步將 GPU 放到商品化版本之中,協助加速 MCTS 的運算,藉此打造更方便快速的通用版排程軟體,供一般中小企業使用。

此外,在與黑客松 Mentor 互動的過程中,團隊同時也驗證自身的技術實力,發現過去偶爾卡關,原來不是因為自己功力不足,只是尚未找到對的幫手而已,也是一項意外的收穫。

GPU 加速深化台灣地球科學研究成果,提升全球學術圈重要性

譚老師團隊照片,譚諤(圖中)帶領團隊參與本次 NVIDIA 黑客松,找到地質研究的運算新方法。(圖片:譚諤團隊提供)

工業應用之外,GPU 的運算效能還能應用在基礎科學研究產業中,特別是那些包含巨量數據的科學研究領域。

譚諤博士所帶領的團隊「IES-Geodynamics」來自中研院地球研究所,而主要研究的對象,便是我們腳下的土地。台灣地處板塊交界帶,是世界上板塊活動最活躍的地方之一,不僅地層活動的頻率和速度特別快,也是地震帶上經濟發展較佳的國家,可謂是全球地震研究的重要據點。

然而,地層活動的時間尺度動輒成千上萬年,可不是能在實驗室中輕易複製的等級,於是乎,許多研究其實都需要利用大量數據去進行計算。舉例來說,研究團隊需要輸入石頭的各種物質參數,去模擬像是南中國海過去發生的海盆張裂、台灣西南部平原區及泥岩區的變形、呂宋島弧跟東亞大陸邊緣碰撞形成台灣島的過程等等。

地質研究通常是以千萬年為單位,因此處理的數據也相對大量,需要足夠運算能力才能有效率地分析。(圖片:譚諤團隊提供)

台灣的觀測站很多、收到的數據很多,研究需要進行的計算更是超、級、多,可分析時常常面臨人力和機器不足的難題,其實很難梳理所有資料。同時,研究團隊的動力模式程式需要不斷修改,且團隊常有新血加入,研究程式必需「好上手」、「易維護」,最重要的,還要「跑得快」,那麼,要怎樣才夠快呢?

地科巨量資料處理,GPU 加速了 13.6 倍

在過去,團隊會嘗試減少計算量與計算步驟,設計出適用 CPU 的方式去跑資料;但在黑客松 Mentor 的協助下,團隊找到了正確的資料輸入方式,可以透過 GPU 去運算步驟繁多的數據。譚諤也分享道,NVIDIA 的 GPU 提供警告訊息的方式十分仔細,對於未來修改內容、最佳化程式都會很有幫助。

在本次參與黑客松時,譚諤嘗試將過去與德州大學 Luc Lavier、曼菲斯大學 Eunseo Choi 等人共同開發的模型,交由GPU計算。經由博士生徐志煌及其他學生的努力,目前,該模型已有 80% 可在 GPU 上執行,速度提升了 13.6 倍。

計算速度大幅增加,究竟帶來了哪些好處呢?等待時間減少、研究模型擁有更高的解析度,不只如此,研究範圍也因此更加廣泛,因為在運算時較不會受到邊界影響。

黑客松結束後,團隊會繼續鑽研那剩下的 20%,期待可以透過 GPU 的助力,跑出更多更高解析度的模型,去深入了解我們腳下踩的這片土地,並找出地層活動與非斷層變形的真正原因,為板塊研究領域帶來重要成果。

首圖來源:Shutterstock