(圖片來源:Pexels)

【為什麼我們挑選這篇文章】現今,機器能透過不斷優化與分析資料持續學習進步,看似能夠直接取代「人」在一切流程當中的所有功能,但傳統人力是否真已逐漸失去其不可取代之處?本文作者孫民是 Appier 的首席人工智慧科學家,同時也是清華大學電機工程學系副教授,在多年研究人工智慧技術與產業落地執行後,對於自動化機器人的經驗與觀察有自己的一番解釋。(責任編輯:郭俐伶)

作者 Appier 首席人工智慧科學家  孫民博士

近年來,機器學習在優化資料收集和分析工具的技術不斷進步,甚至在各個產業都能看到相關的應用。而現在,一股新的趨勢又趁勢興起,那就是自動化機器學習(Auto Machine Learning),簡稱 AutoML。

一名優秀的資料科學家需同時具備高度的專業知識與技能,是臺灣大多數企業長年求之而不得的極度稀缺人才,而 AutoML 的出現能適時的降低企業對資料科學家的依賴。話雖如此,許多人對 AutoML仍然存在一些誤解,其中最大的誤解就是認為 AutoML的訓練完全不需要資料科學家參與其中。

AutoML即是AI技術的落地實行

機器學習是一項非常強大的通用技術,能做到的相關應用領域十分廣泛且功能數量驚人,但想了解 AutoML的能耐到底在哪,首先就要先了解機器學習是如何運作的。

機器學習包含了以下幾個步驟。首先第一步需要蒐集相關資料數據並進行資料清理,才能釐清這些資料中能歸納出來的訊息。下一步則是定義資料的特徵描述,並把資料定義放入模型,接著就需要開始訓練模型以達到最佳化精確度。由於整體訓練學習流程極為複雜,需要大量的人力參與,為了讓機器學習發揮最大效益,需要一個訓練有素的資料科學家團隊來協助創建、應用和優化模型,全程參與在整個作業流程中。

AutoML這項技術之所以備受各產業重視,是因為 AutoML的最終目標,是讓流程中的所有步驟都能自動化執行,提高效率的同時還能降低成本。若能順利實現,AutoML可望在各產業中發揮不同用途,為社會的不同面向帶來全面性變革。

同步改變資料科學家的角色

然而,如同許多新興技術所面臨的處境,實際運用的狀況往往比想像中更為複雜。AutoML是否能發揮其最大功用,程度取決於好幾個面向,包含:涉及的產業、資料的類型、模型的種類等等。在前面提到的資料收集和清理階段當中,數位行銷是可以從 AutoML獲益的領域之一,當顧客與公司的行銷活動進行互動後,資料標籤將自動生成,成熟的 AutoML工具會進一步針對這些標籤進行處理,確保它們沒有雜訊或誤差。

其他產業則更適用於自動化特徵工程。舉例而言,訓練自動駕駛車需要人們協助標註判斷出路上行人和各項交通標誌;訓練醫療顯像工具需要經驗豐富的醫師協助定位腫瘤。不過,自從神經網路能以原始顯像圖自動建構特徵後,許多資料科學家的工作量已有所減輕。

即便如此,還是必須提醒不要孤注一擲地使用 AutoML。畢竟,無論想達到的目的為何,AutoML仍無法完全取代人類知識。相反的,它其實是改變了我們原先利用該知識的焦點與方向。

以行銷任務為例,只有自動化機器執行的效果遠比人為作業流程更有效率。通常這些適合自動化的流程是有高度重複性,或是有高度複雜性卻有充足的資料給予支持。藉由自動化工具的協助,人們可以從重複性的任務中解脫,並將其知識應用到資料較少的領域。

因此目前的技術仍需仰賴資料科學家的支持。有人將這種人類與機器攜手合作的方式,稱為「半自動化機器學習(Semi-AutoML)」。對照作業流程中的實際執行模式,這樣的稱謂可說是名符其實。

所有企業都該大量引進 AutoML嗎?

企業只要能夠了解 AutoML的能力和運作方式,便能在應用過程中有所獲益。
由於這項技術不需要人類專家時刻參與其中,所以能更有效率地進行作業,且將速度大幅提升。只要善加利用,機器的表現不僅能超越人類,更能將人為錯誤的風險降到最低,流程自動化之後,機器執行所能產生的效益將遠超於人力。

不過,其中仍有其他需納入考量卻容易被忽略的因素,也就是「成本」。
神經網路結構搜尋可說是 AutoML領域中的「聖杯」,也就是編寫出一套人工智慧程式,以自動找出最能解決特定問題的神經網路結構。目前已有研究人員提出證據,認為確實有機會能使神經網路結構搜尋完全自動化(且超越人類執行相同任務的表現);然而,屆時將需要龐大的運算能力才能達到目的,可能需要同時使用十幾個CPU進行訓練才足以應付。總而言之,整體投入的軟硬體成本將十分可觀。因此,任何公司若想尋求自動化機器學習的協助,都應先針對其可能的獲益、財務以及時間成本進行權衡和評估,才能更明智地加以運用。

儘管 AutoML能降低人為錯誤的風險,卻無法將其根除。這項技術僅能最佳化人類設計的衡量標準,但是當衡量標準不正確時,所產出的模型自然也無法解決問題。這不僅會發生在 AutoML上,人類也可能在採用標準機器學習時犯下相同的錯誤。不過,如果人類有參與開發過程,就有機會察覺模型行為的錯誤並協助改正。因此,雖然完全由機器執行作業流程能獲得極高的效益,但若未經考量便直接排除人為參與,可能會在無意中導致更多潛在錯誤發生。

企業如何付諸實踐

要維持人類與機器的平衡並不簡單。企業必須評估人類高度參與下的可能利弊,並決定哪種商業模式才適合自己。例如,讓人員全程參與流程階段的發展時,意味著模式將難以規模化,而若為了讓整個流程自動化而逐一建立特定的模型,又會浪費太多時間。實際案例好比行銷人員需要即時推出行銷活動,因此往往無法等上太久,因為他們追求的是時效性,需要在最佳時刻吸引到顧客的關注。

如今,最佳的解決方案往往是借助在某些特定領域採用 AutoML的資料科學平台(如同前面所提及的「半自動化機器學習(Semi-AutoML)」)。藉由自動執行特定步驟,企業便能專心研究如何將運算量集中在提高效率上,而成果又不會因為精準度降低而大打折扣。以上建議不僅能協助行銷人員了解 AutoML的潛能,更能讓民眾了解 AutoML能為企業成就帶來的實質效益,否則,即使採用了這項技術,也只是徒有其表而已。

若能保持正確觀念來運用 AutoML,企業便能享受其帶來的眾多好處,尤其是對行銷人員而言更是如此。唯有確實了解 AutoML的運作方式、涉及範圍,以及它能對企業提供的支持,才能充分發揮 AutoML的最大潛能。

關於作者

孫民博士  Appier首席人工智慧科學家、清華大學電機工程學系副教授

孫民博士現任 Appier 首席人工智慧科學家,同時也是國立清華大學電機工程學系副教授,專精於電腦視覺、自然語言處理、深度學習與強化學習,研究領域涵蓋 3D 物體辨識、人體姿態辨識、場景理解、影像理解與文字摘要。
師承頂尖人工智慧專家吳恩達、李飛飛及 Silvio Savarese,他曾在由李飛飛所主持的 ImageNet 圖像識別研究計畫中,參與草創期的系統設計,也曾協助開發機器人作業系統 (ROS) 及微軟 Kinect 人體姿勢辨識系統。

孫民博士同時擁有兩項美國專利,曾帶領 Appier 研究團隊於第 32 屆美國人工智慧年會 (AAAI) 中,針對「AI 創造力」發表前瞻性研究成果,並持續協助 Appier推動人工智慧系統規模化,將其落實到商業應用領域,為企業創造更大的商業價值。

你可能有興趣