【投稿】科學家擁有會不斷學習的機器人,就真的無敵了嗎?

(圖片來源:Pexels)

【為什麼我們挑選這篇文章】現今,機器能透過不斷優化與分析資料持續學習進步,看似能夠直接取代「人」在一切流程當中的所有功能,但傳統人力是否真已逐漸失去其不可取代之處?本文作者孫民是 Appier 的首席人工智慧科學家,同時也是清華大學電機工程學系副教授,在多年研究人工智慧技術與產業落地執行後,對於自動化機器人的經驗與觀察有自己的一番解釋。(責任編輯:郭俐伶)

作者 Appier 首席人工智慧科學家  孫民博士

近年來,機器學習在優化資料收集和分析工具的技術不斷進步,甚至在各個產業都能看到相關的應用。而現在,一股新的趨勢又趁勢興起,那就是自動化機器學習(Auto Machine Learning),簡稱 AutoML。

一名優秀的資料科學家需同時具備高度的專業知識與技能,是臺灣大多數企業長年求之而不得的極度稀缺人才,而 AutoML 的出現能適時的降低企業對資料科學家的依賴。話雖如此,許多人對 AutoML 仍然存在一些誤解,其中最大的誤解就是認為 AutoML 的訓練完全不需要資料科學家參與其中。

AutoML 即是 AI 技術的落地實行

機器學習是一項非常強大的通用技術,能做到的相關應用領域十分廣泛且功能數量驚人,但想了解 AutoML 的能耐到底在哪,首先就要先了解機器學習是如何運作的。

機器學習包含了以下幾個步驟。首先第一步需要蒐集相關資料數據並進行資料清理,才能釐清這些資料中能歸納出來的訊息。下一步則是定義資料的特徵描述,並把資料定義放入模型,接著就需要開始訓練模型以達到最佳化精確度。由於整體訓練學習流程極為複雜,需要大量的人力參與,為了讓機器學習發揮最大效益,需要一個訓練有素的資料科學家團隊來協助創建、應用和優化模型,全程參與在整個作業流程中。

AutoML 這項技術之所以備受各產業重視,是因為 AutoML 的最終目標,是讓流程中的所有步驟都能自動化執行,提高效率的同時還能降低成本 。若能順利實現,AutoML 可望在各產業中發揮不同用途,為社會的不同面向帶來全面性變革。

同步改變資料科學家的角色

然而,如同許多新興技術所面臨的處境,實際運用的狀況往往比想像中更為複雜。AutoML 是否能發揮其最大功用,程度取決於好幾個面向,包含:涉及的產業、資料的類型、模型的種類等等。 在前面提到的資料收集和清理階段當中,數位行銷是可以從 AutoML 獲益的領域之一,當顧客與公司的行銷活動進行互動後,資料標籤將自動生成,成熟的 AutoML 工具會進一步針對這些標籤進行處理,確保它們沒有雜訊或誤差。

其他產業則更適用於自動化特徵工程。舉例而言,訓練自動駕駛車需要人們協助標註判斷出路上行人和各項交通標誌;訓練醫療顯像工具需要經驗豐富的醫師協助定位腫瘤。不過,自從神經網路能以原始顯像圖自動建構特徵後,許多資料科學家的工作量已有所減輕。

即便如此,還是必須提醒不要孤注一擲地使用 AutoML。畢竟,無論想達到的目的為何,AutoML 仍無法完全取代人類知識。 相反的,它其實是改變了我們原先利用該知識的焦點與方向。

以行銷任務為例,只有自動化機器執行的效果遠比人為作業流程更有效率。通常這些適合自動化的流程是有高度重複性,或是有高度複雜性卻有充足的資料給予支持。藉由自動化工具的協助,人們可以從重複性的任務中解脫,並將其知識應用到資料較少的領域。

因此目前的技術仍需仰賴資料科學家的支持。有人將這種人類與機器攜手合作的方式,稱為 「半自動化機器學習(Semi-AutoML)」。對照作業流程中的實際執行模式,這樣的稱謂可說是名符其實。

所有企業都該大量引進 AutoML 嗎?

企業只要能夠了解 AutoML 的能力和運作方式,便能在應用過程中有所獲益。
由於這項技術不需要人類專家時刻參與其中,所以能更有效率地進行作業,且將速度大幅提升。只要善加利用,機器的表現不僅能超越人類,更能將人為錯誤的風險降到最低,流程自動化之後,機器執行所能產生的效益將遠超於人力。

不過,其中仍有其他需納入考量卻容易被忽略的因素,也就是「成本」。
神經網路結構搜尋可說是 AutoML 領域中的「聖杯」,也就是編寫出一套人工智慧程式,以自動找出最能解決特定問題的神經網路結構。目前已有研究人員提出證據,認為確實有機會能 使神經網路結構搜尋完全自動化(且超越人類執行相同任務的表現);然而,屆時將需要龐大的運算能力才能達到目的,可能需要同時使用十幾個 CPU 進行訓練才足以應付。總而言之,整體投入的軟硬體成本將十分可觀。因此,任何公司若想尋求自動化機器學習的協助,都應先針對其可能的獲益、財務以及時間成本進行權衡和評估,才能更明智地加以運用。

儘管 AutoML 能降低人為錯誤的風險,卻無法將其根除。這項技術僅能最佳化人類設計的衡量標準,但是當衡量標準不正確時,所產出的模型自然也無法解決問題。這不僅會發生在 AutoML 上,人類也可能在採用標準機器學習時犯下相同的錯誤。不過,如果人類有參與開發過程,就有機會察覺模型行為的錯誤並協助改正。因此,雖然完全由機器執行作業流程能獲得極高的效益,但若未經考量便直接排除人為參與,可能會在無意中導致更多潛在錯誤發生。

企業如何付諸實踐

要維持人類與機器的平衡並不簡單。企業必須評估人類高度參與下的可能利弊,並決定哪種商業模式才適合自己。例如,讓人員全程參與流程階段的發展時,意味著模式將難以規模化,而若為了讓整個流程自動化而逐一建立特定的模型,又會浪費太多時間。實際案例好比行銷人員需要即時推出行銷活動,因此往往無法等上太久,因為他們追求的是時效性,需要在最佳時刻吸引到顧客的關注。

如今,最佳的解決方案往往是借助在某些特定領域採用 AutoML 的 資料科學平台(如同前面所提及的「半自動化機器學習(Semi-AutoML)」)。藉由自動執行特定步驟,企業便能專心研究如何將運算量集中在提高效率上,而成果又不會因為精準度降低而大打折扣。以上建議不僅能協助行銷人員了解 AutoML 的潛能,更能讓民眾了解 AutoML 能為企業成就帶來的實質效益,否則,即使採用了這項技術,也只是徒有其表而已。

若能保持正確觀念來運用 AutoML,企業便能享受其帶來的眾多好處,尤其是對行銷人員而言更是如此。唯有確實了解 AutoML 的運作方式、涉及範圍,以及它能對企業提供的支持,才能充分發揮 AutoML 的最大潛能。

關於作者

孫民博士  Appier 首席人工智慧科學家、清華大學電機工程學系副教授

孫民博士現任 Appier 首席人工智慧科學家,同時也是國立清華大學電機工程學系副教授,專精於電腦視覺、自然語言處理、深度學習與強化學習,研究領域涵蓋 3D 物體辨識、人體姿態辨識、場景理解、影像理解與文字摘要。
師承頂尖人工智慧專家吳恩達、李飛飛及 Silvio Savarese,他曾在由李飛飛所主持的 ImageNet 圖像識別研究計畫中,參與草創期的系統設計,也曾協助開發機器人作業系統 (ROS) 及微軟 Kinect 人體姿勢辨識系統。

孫民博士同時擁有兩項美國專利,曾帶領 Appier 研究團隊於第 32 屆美國人工智慧年會 (AAAI) 中,針對「AI 創造力」發表前瞻性研究成果,並持續協助 Appier 推動人工智慧系統規模化,將其落實到商業應用領域,為企業創造更大的商業價值。

你可能有興趣


《TO》品牌活動「CONNECT」深度專題重磅更新! 

《TO》年度品牌活動 CONNECT 2020「5G 新經濟」新專題上線! 看台灣新創如何用 5G 翻轉各產業的傳統想像,打造意想不到的創新服務! 馬上報名 獲取最新深度報導。

點關鍵字看更多相關文章: