【我以為在建模結果大部分在 Debug】機器學習工程師揭 4 大無聊工作內容,最後失望求去!

【為什麼我們挑選這篇文章】進入 5G 時代,機器學習成為當前的熱門話題,也成為許多人爭相學習的關鍵技術,然而一位機器學習工程師卻坦露心聲表示「這個工作其實比你想的還要無聊!」,推薦給入坑前的各位,從正反兩面一窺機器學習工作的真實樣貌吧!(責任編輯:何泰霖)

本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請連繫出處
作者:量子位

機器學習很無聊?至少這位工程師是這樣認為。甚至還在 Reddit 上發了文,標題就直接清楚寫道:

Why machine learning is more boring than you may think?

結果不到 15 個小時,便引起了 500+ 的熱度討論。

對此,有網友認為,「因為它是工程技術,而不是基礎研究,工程需要滿足最低標準和期限的,技術上沒有什麽挑戰性」。

而至於為何要如此強調「Boring」,這位數據科學家肖安講了以下原因,也給出了自己的解決方式。

機器學習「四大 Boring」工作內容

1.)首先是設計(Designing)的部分,占據 5% – 10% 的時間。

這時候是群策群力、迸發新想法的時候,包括新的模型體系結構、數據功能和系統設計等。

預期的情況是,在每個項目中應用最新和最出色的算法,可以在知名期刊發布的那種。但實際情況是,由於「時間限制」和其他優先事項,只能做到最簡單、有效的算法。

這時候,為了滿足作者的「成就感」,就會在附帶項目中進行一些「瘋狂」的想法,即使這些想法根本不起作用。

2.)接著是寫程式碼(Coding)的部分,根據項目的不同, 20% 到 70% 的時間占比。

通常分為五類:各自占總工作的百分比如下。

  • 建構數據管道(Data Pipeline),50-70%
  • 系統和集成學習,10–20%
  • ML 模型建立:5–10%
  • 調整除錯和 Demo 分析,5–10%

預期的情況是,花費大量的時間在編寫 ML 模型組件。

但現在已經有很多現成的架構和程式語言,將很多覆雜的東西抽象化,這樣的工作流程已經十分標準化了,根本不需要去開發和完善 ML 模型組件。

既然如此,工程師則將更多的時間花在其他低級的優化上,比如系統、數據管道等。

3.)然後是品質檢查、除錯、修復(Debug),至少要花 65% 的時間。(感受到了作者的怨念)

一般主要有兩種錯誤,不良結果和傳統軟體問題。不良結果,就是模型效果不好、評分較低(比如準確性)。傳統軟體問題,就包括系統損壞、系統配置問題。

理想的狀態,是只需要處理「不良結果」,然後去構建更好的模型。

嗯,展現才能的時間到了!

然而現實情況是,大概 70% – 90% 都是「傳統軟體」問題。

而至於不良結果,通常在建構端到端的模型訓練和數據管道之後,就可以很快獲得很好的結果了。

4.)最後一個部分,就是「滅火」(Fire-fighting),處理各種意外情況。

這大概是所有工程師都不願意看到的點了吧。

在整個交付過程中,不管是外部、甲方爸爸的要求還是內部溝通不暢、能力不足等各種人為 Bug ,用作者的話來講,「就是一場噩夢」。

這時候,除了保持微笑之外,建議將時間軸延長到 2-3 倍,在團隊裡積極交流。

唉~說到這裡追根究柢就是理想與現實之間的差距,別人以為的和你自己正在幹的區別。

比如,就像這樣。

最後,這位小哥還是注入了一些安慰劑。

就像從事任何職業一樣,最終都會感到無聊和沮喪。

但是沒關系,很正常。你應該開發一種應對機制,像玩遊戲一樣,在過程中獲得一些小獎勵,然後最終獲得勝利。

覺得機器學習太無聊?你可能找錯方法了!
AWS 提供適合每個開發者的各式學習途徑,請收看>>> 機器學習工作坊

工程師網友們怎麼看?

對於這件事,網友們倒是意見各異。

有學 CS 學了 6 年的博士生自述所遇到的迷茫,並表示打算放棄現在的博士學位。

我期望它是酷炫的、有知識性的、計算性的東西,但一直沒有等到可以大展拳腳的工程/偵錯項目。

因為這個原因,我打算退學。雖然現在還不清楚該申請什麽樣的工作。

但有人覺得,作者所說的幾個 Boring,恰好是喜歡當 ML 工程師的原因。

還給出建議:如果你想花費 100% 的時間用來建構和調整 ML 模型,那你應該去找研究職位,而不是工程職位。

還有網友表示,自己很喜歡 ML 工程師的工作,從建構出可運做的端到端模型,到正式生產,會有很強烈的成就感。

也有人具象的比喻了理想與現實:

那麽,對於這件事你怎麽看?如果你的身邊也有類似的經歷,歡迎與我們分享~

你可能有興趣

物理學家用機器學習解決熱力學難題:微觀系統的「時間之箭」
【Google 新功能實測】機器學習新玩法,用「哼哼找歌」幫你找到心中の歌!
台積電美國廠徵才中!LinkedIn 上開出研發、AI/機器學習工程師、實習生等 18 項職缺


《TO》國際版 2021 正式上線

台灣躍上世界舞台,不能少了你! 立即至 Facebook 按讚、Twitter 追蹤,第一手國際消息都會在這個 英文同名官方網站 唷!

點關鍵字看更多相關文章: