最完整機器學習書單,10 本讓你從凡人變神人!

【我們為什麼挑選這篇文章】懷念起以前讀書時那樣奮鬥的時光嗎?幫你列了十本書,快來看看科技界的大神都推薦什麼書!(責任編輯:鄧天心)

假期還可以好好學習,是不是一下子就有動力複習了呢?

必備解暑神器
1. Data Science from Scratch中文版:用Python學資料科學

作者 Jake VanderPlas

這本書介紹了一些核心庫,用 Python 處理數據的時候,就能感受到它們的珍貴。

具體來說,就是 IPython, Numpy, Pandas, Matplotlib, Scikit-Learn,以及相關的軟件包。

啃食此書之前,需熟悉 Python 語言。如需要這門語言的迅速入門之徑,請選用 A Whirlwind Tour of Python (Python 旋風之旅) 。而這也不是小白友好的選擇,只是為計算機相關研究人員準備的快速入門。

2. Neural Networks and Deep Learning

作者 Michael Nielsen

這本在線書,分為兩個部分——

·神經網絡,一種唯美的、從萬物生長中汲取靈感的編程範式,讓計算機能夠從數據中學習。

· 深度學習,一系列強有力的技術,讓神經網絡壯大起來。

神經網絡加深度學習,可以給許多問題找到更好的解決方案,在圖像識別、語音識別以及自然語言處理中,皆有用武之地。

此書涵蓋的是,大量的核心概念。

傳送門:
http://neuralnetworksanddeeplearning.com/

3. Think Bayes

作者 Allen B.Downey

這本書講的是,怎樣用計算方法處理貝葉斯統計。

作為 Think X 系列的一員,此書的思路是,如果你會編程,就可以用這項技能來學習其他科目了。

大多數講貝葉斯統計的書,用的都是數學符號,也是以數學概念為脈絡走的。

此書則用 Python 代碼代替數學符號,用離散近似代替連續數學。

於是,數學裡的積分變成了求和,概率分佈的運算大多成了簡單的環。

中文版已出版,資源自尋,以下為英文版地址。

傳送門:
http://greenteapress.com/wp/think-bayes/

4. Machine Learning & Big Data

作者 Kareem Alkaseer

這是一部沒有完成的作品,隨著時間推移內容也慢慢豐盈。

背後的想法是,在理論和實踐之間獲得平衡,讓軟件工程師可以輕鬆使用模型,又不用太依賴庫。

大多數情況下,模型背後的概念或技術都比較簡單直觀,但是細節和術語上就容易出問題。

另外,現有的庫通常都可以解決手邊的問題。但它們大多還是有自己的抽象方法和結構,把基本概念藏在背後了。

這本書的存在,就是想要把那些隱藏的概念釐清。

傳送門:
http://www. kareemalkaseer.com/book s/ml

5. Statistical Learning with Sparsity: The Lasso and Generalizations

作者 Trevor Hastie, Robert Tibshirani, Martin Wainwright

在過去的十年裡,計算和信息技術呈現爆炸式增長。隨之,醫療、生物、金融、時常等等領域都有了大大大量的數據。

這部作品,在一個通用的概念框架之下,描述了一些統計學和數據科學的重要觀點。

傳送門:
https://web.stanford.edu/~hastie/StatLearnSparsity/

6. Statistical inference for data science

作者 Brian Caffo

本書是 Coursera 課程 Statistical Inference ( 推論統計學 )的配套書,也是 Data Science專項課程的一部分。

不過,就算不上課,也可以學這本書。Coursera 課程視頻可以在油管上找到,搭配食用療效更佳。

此書是推論統計學的入門之書,面向的主要是有編程能力的學生,幫他們把這樣的能力用到數據科學或者統計學中。

傳送門:
https://leanpub.com/LittleInferenceBook/read

7. Convex Optimization

作者 Stephen Boyd, Lieven Vandenberghe

凸優化,是一類特殊的數學優化問題,最小二乘法和線性規劃也屬於這個類別。

最小二乘法和線性規劃問題擁有非常完善的理論,可以用編程來輕鬆解決。

而這本書要說的是,凸優化中包含了更寬廣的一類問題,但也依然可以用編程碾壓。

傳送門:
http:// stanford.edu/~boyd/cvxb ook/

8. Natural Language Processing with Python

作者 Steven Bird, Ewan Klein, Edward Loper

這是一本關於自然語言處理 (NLP)的書,英語、漢語等人類使用的語言都是系統處理的對象。

與編程語言不同,自然語言在代代相傳的過程中發生演變,很難用明確的規則來解析其中的含義。

不過,人類還是要讓計算機去理解自然語言。這本書,是基於Python以及一個名為自然語言工具包( NLTK )的開源庫,寫成的。

 

傳送門:https://bit.ly/2J4sljZ

9. Automate the Boring Stuff with Python

作者 Al Sweigart

你有沒有花好幾個小時給文件重命名、或者更新表格里的幾百個單元格的經歷?

這麼痛苦的重複工作,還是交給電腦比較好。

跟著這本書,可以學到怎樣用Python寫程序來代替你完成那些繁複的操作。

新手友好,無需經驗。

傳送門:
https://automatetheboringstuff.com/

10. Social Media Mining: An Introduction

作者 Reza Zafarani, Mohammad Ali Abbasi, Huan Liu

過去 10 年裡,社交媒體的發展革新了人們互相交流的方式,以及各行各業開展業務的方式。

在社交媒體上,通過互動、分享以及內容消費,每個個體都在以前所未有的速度產生數據。

理解並處理這類新的數據,從而蒐集可用的規律——這給跨學科研究、新算法以及工具的開發,帶來了機遇和挑戰。

此書整合了社交媒體、社交網絡分析以及數據挖掘的相關內容,為學生、數據從業者和研究人員提供一個平台,來初步了解社交媒體挖掘,以及它潛在的可能性。

中文版已出版,資源自尋,以下為英文版地址。

傳送門:
http://dmml.asu.edu/smm/SMM.pdf

獻給即將無法自拔的你。

——

延伸閱讀:

數位時代財務長必讀五本書單,從績效管理到領導力一次充滿電

比爾蓋茲 2018 夏季書單:對人性的洞悉,是專業工作者的必備養分

17 本兩位最出名的哈佛輟學生推薦書單:比爾蓋茲與馬克都看啥?

查理.蒙格個人私藏書單:這絕對是你看過類型最廣、最精彩的書單,我都替你附上精華簡介了!

(本文經合作夥伴 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈這裡有10本書,陪你歡度機器學習的清涼暑假| 豐盛的傳送門〉。)

 

AD