給自學機器學習的工程師:沒有學歷光環卻想找到工作,千萬注意履歷十大雷區!

【為什麼我們要挑選這篇文章】自學機器學習的工程師們沒有博士學位的光環,他們該如何在面試中脫穎而出?履歷怎麼寫?什麼又是企業真正在乎的重點項目?(責任編輯:陳伯安)

「《科技報橘》徵才中!跟我們一起定位台灣產業創新力 >> 詳細職缺訊息 
快將你的履歷自傳寄至 [email protected]

本文經 AI 新媒體量子位(公眾號 ID:QbitAI)授權轉載,轉載請聯繫出處

作者:量子位/栗子

做機器學習工程師,通常都要讀過博士。

即便沒有寫成職位的必要條件,卻也慢慢變成了自然規律。

那自學成才的人類,要寫怎樣的經歷,才能讓面試官相信,自己也是有同等能力的呢?

一個叫做 AdditionalWay  的網友,在 Reddit  提出了這個直擊靈魂的問題,引發了大量討論,兩天熱度已經超過 500

討論版上,有許多人提出了中肯的建議:

99% ML 博士生有個致命弱點

有位叫做 po-handz  的網友,他發表的意見收穫了 80  分的高度認可,佔據了評論區的頂樓:

把自己的項目投入生產環節(launch into production),就能超越 99% 的應屆生,也能超越大部分在位的 ML  工程師了。

對此,有人 (moravak) 表達了強烈贊同:

這個「大部分」,其實就是 ≥99.9%

頂樓又補充說,很多人就算讀到博士畢業,可能也沒有自己把一個項目做到生產環節的經驗。

那麼,怎樣才算有這樣的經歷呢?

沒有讀博士的你,唯一優勢就在「業界經驗」

網友(BernieFeynman)簡約地解釋了一下:

搭些模型,不用非常厲害。但要讓人能看到,模型在哪跑起來的樣子,比如有個 API  可以調用之類的。

當然,做起來並不是一句話的事,頂樓詳細描述了,一整個過程究竟能有多難:

比如,一般你不會只有一個模型,是有一組。所以,需要讓這些大模型,加載在服務器的 RAM  上。

還要接受新輸入的數據。這些數據,要和測試數據的格式保持一致,還要 scale,該怎麼 scale  呢?

推理要用 GPU  麼?那樣的話在 AWS  上每月可能要花 1000  人民幣(約 5000 台幣),預算能支持麼?

時序數據怎麼辦呢?你需要一個連續更新的模型,還要一直跟蹤調整參數。

除此之外,你需要一個實時的、可維護的數據管道(data pipeline)。搞這個,比處理一個清晰乾淨的數據集要難多了。

最後的最後,你還需要一整套 UI,網站,nginx  推疊,要做成用戶友善的樣子。

別說是剛畢業的博士,許多有經驗的數據科學家也對這些東西一竅不通,因為他們可能只在自己專業的領域里工作,都是別人把乾淨的數據集交到他們手上。

你如果在這點上打贏他們,對企業來說就有更高的價值了。

機器學習是 2019 熱門題目,那 2030 機器學習可能變什麼樣子?

8/10(六)【TechOrange 科技報橘 2019 年度論壇】CONNECT to the Future,帶你看見 2030 年最重要科技趨勢

雙人早鳥 6 折優惠票 全面開賣

ML 工程師履歷,千萬注意這十大雷區

訓練實用技能,只是一方面。

如果不想在履歷篩選環節見光死,網友(rudiXOR) 在一家「正在招聘 ML  工程師的中型企業」,總結了十大雷區,供大家參考:

第一,拿著一大堆 MOOC  證書。沒用,我試過,quiz  一路點下去誰都做得到。

第二,對 Kaggle  成績過於自豪。許多大學生都參加過 Kaggle  比賽,他們也知道這種比賽和 ML  工程師的工作,基本沒什麼共同點。

第三,去了  個月訓練營,從 PCA  到 LSTM,幾乎所有 ML  技術都修煉到了。真的沒人相信。

第四,GitHub  項目都是只提交過一次程式碼的那種。根本看不出是不是自己做的。

第五,GitHub  主頁是新的,一個項目都沒有。

第六,模型只在 toy datasets  上測試過,沒有再嚴肅點的項目了。

第七,每種語言都說「精通」。比如 C++PythonJavaC#……

第八,對照職位要求精心匹配履歷(Buzzword optimization for HR algorithms」

第九,沒有證明自己的數學 / 統計學知識水平。

第十,沒有軟體開發的經歷。

就算前九條你都忘了,也可以嚴肅地參考第十條。網友在細數了雷區之後強調:

如果你是自學的,不要一上來就投數據科學家,或者 ML  工程師。

可以先申請數據分析師,或者軟體工程師。

如果是自學 ML,又沒有軟體開發的經歷,我是不會請你的。

參考前文,如果沒有讀過博士,就要比博士多點業界的經驗才更有利。

不過,自學什麼時候都不晚。

比如,谷歌大腦的研究員 David Ha,在投入機器學習的懷抱之前,已經做到高盛的董事總經理(MD) 了。

那麼,各位也要加油啊。

Reddit 討論版傳送門

(本文經 AI 新媒體 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈自学机器学习,怎么才能找到工作啊?至少要避开十大雷区 | Reddit 高热 〉,首圖來源:unsplash, CC Licensed。)

延伸閱讀

工程師好用資源來了!超完整 Python 查詢表,程式碼複製貼上不用自己寫

AI 工程師最佳入門資源!史丹佛公布「自然語言理解」免費課程,新手們趕快存起來

衝上 GitHub 熱門第四名!Python 機器學習最強教學資源,新手工程師快存起來

點關鍵字看更多相關文章: