我們在這篇文章中推薦了10本學(xué)習(xí)機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的書,讓你的秋季閱讀計(jì)劃順利揚(yáng)帆起航。 關(guān)鍵詞:Books, Data Science, ebook, Free ebook, Machine Learning 還有什么比免費(fèi)的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)讀物更適合用來享受秋天的呢? 下面的書單中從統(tǒng)計(jì)學(xué)基礎(chǔ)知識,到機(jī)器學(xué)習(xí)的基本概念,再到更重點(diǎn)的大框架內(nèi)容,對于高深的話題也有所涉獵,最后以一本總結(jié)性的書結(jié)尾。既有經(jīng)典名著,也有當(dāng)代的作品,希望你能在其中找到一些有趣的新內(nèi)容。 1 用統(tǒng)計(jì)學(xué)的方式思考 Think Stats: Probability and Statistics for Programmers 作者:Allen B. Downey 《用統(tǒng)計(jì)學(xué)的方式思考》是為python的程序員設(shè)計(jì)的一本概率論和數(shù)理統(tǒng)計(jì)知識的入門書籍。 本書主要介紹了剖析真實(shí)數(shù)據(jù)集和解決有趣問題的簡單方法。這本書的案例使用的是美國國家衛(wèi)生研究院的數(shù)據(jù),并鼓勵讀者使用真實(shí)的數(shù)據(jù)集做項(xiàng)目。 2 概率編程與貝葉斯方法 Probabilistic Programming & Bayesian Methods for Hackers 作者:Cam Davidson-Pilon 一本介紹貝葉斯方法和概率編程的入門教程,主要是從對編程的理解出發(fā),數(shù)學(xué)知識其次。 貝葉斯方法是概率推理中一種很實(shí)用的方法,在這本書當(dāng)中,貝葉斯方法一直隱藏在一章章慢慢的數(shù)學(xué)分析的背后。貝葉斯推理的典型內(nèi)容包含兩到三章概率論知識,然后再介紹貝葉斯推理?上У氖牵捎诖蠖鄶(shù)貝葉斯模型的數(shù)學(xué)難度太高,這本書中只為讀者介紹了簡單和虛構(gòu)的例子。這會讓讀者小看貝葉斯推理。而事實(shí)上,這是因?yàn)樽髡咦约旱钠脤?dǎo)致的。 3 理解機(jī)器學(xué)習(xí) Understanding Machine Learning: From Theory to Algorithms 作者:Shai Shalev-Shwartz and Shai Ben-David 機(jī)器學(xué)習(xí)是計(jì)算機(jī)科學(xué)中發(fā)展最快的領(lǐng)域之一,有著深遠(yuǎn)的實(shí)際應(yīng)用。這本書有條理的介紹了機(jī)器學(xué)習(xí),以及相關(guān)的典型算法。這本書既介紹了機(jī)器學(xué)習(xí)的一些基本概念,也介紹了將這些概念轉(zhuǎn)化為實(shí)際算法的數(shù)學(xué)推導(dǎo)。在介紹了基本概念之后,這本書也覆蓋了一些之前的教科書中所沒有涉及過的重要主題,包括模型算法的復(fù)雜度和凸性,穩(wěn)定性的概念;重要的算法范例包括隨機(jī)梯度下降法,神經(jīng)網(wǎng)絡(luò)模型,和機(jī)構(gòu)化預(yù)測法;還有新興的理論概念比如PAC-貝葉斯法和compression-based bounds(壓縮界限法)。 4 統(tǒng)計(jì)學(xué)習(xí)精要 The Elements of Statistical Learning 作者:Trevor Hastie,Robert Tibshirani,etc 這本書用常用的概念框架解釋了統(tǒng)計(jì)領(lǐng)域中的重要概念。雖然是用的統(tǒng)計(jì)學(xué)方法,但是重點(diǎn)在概念的解讀而不是數(shù)學(xué)運(yùn)算。書中給出了很多例子,也用了很多彩圖。對數(shù)據(jù)挖掘感興趣的人和統(tǒng)計(jì)學(xué)家來說都會是很有價(jià)值的資源。這本書涵蓋的知識很廣,從監(jiān)督學(xué)習(xí)到非監(jiān)督學(xué)習(xí)都有涉獵。眾多的話題中包括神經(jīng)網(wǎng)絡(luò)模型,支持向量機(jī),以及最全面關(guān)于分類樹及推算話題的介紹。 5 統(tǒng)計(jì)學(xué)習(xí)及其在R中的應(yīng)用 An Introduction to Statistical Learning with Applications in R 作者:GarethJames,DanielaWitten,etc 這本書介紹了一些統(tǒng)計(jì)學(xué)習(xí)的方法,是為非數(shù)學(xué)專業(yè)高水平的本科生,研究生和博士生設(shè)計(jì)的。這本書也包含了一些R語言的練習(xí)題和如何在現(xiàn)實(shí)中應(yīng)用統(tǒng)計(jì)模型的詳細(xì)說明,對于新入行的數(shù)學(xué)科學(xué)家來說是非常有價(jià)值的資源。 6 數(shù)據(jù)科學(xué)基礎(chǔ) Foundations of Data Science 作者:Avrim Blum, John Hopcroft,etc 雖然計(jì)算機(jī)科學(xué)的傳統(tǒng)領(lǐng)域依然很重要,未來,更多的研究者會集中于用電腦從應(yīng)用的大量數(shù)據(jù)中提取有用信息,而不是只是解決一些確定的問題。考慮到這一點(diǎn),我們在這本書中涵蓋了未來40年可能會有用的理論,就像自動控制原理,算法和相關(guān)主題在過去的40年給予學(xué)生的巨大幫助一樣。 7 給程序員的數(shù)據(jù)挖掘指南: 數(shù)字迷宮的藝術(shù) A Programmer's Guide to Data Mining: The Ancient Art of the Numerati 作者:Ron Zacharski 這本書奉行的是邊干邊學(xué)的方法論。我希望你能用我提供過的Python代碼實(shí)踐書中的練習(xí)和實(shí)驗(yàn),而不僅僅是被動的閱讀。我希望你會積極主動的嘗試不同的數(shù)據(jù)挖掘方法。這本書由一系列互相貫通的小分支組成,當(dāng)你讀完這本書的時(shí)候,你就為理解數(shù)據(jù)挖掘技術(shù)奠定了夯實(shí)的基礎(chǔ)。 8 大數(shù)據(jù)·互聯(lián)網(wǎng)大規(guī)模 數(shù)據(jù)完覺與分布式處理 Mining of Massive Datasets 作者:Jure Leskovec, etc 這本書是基于斯坦福大學(xué)的計(jì)算機(jī)科學(xué)課程 cs246(海量數(shù)據(jù)挖掘)和 CS345A (數(shù)據(jù)挖掘)而撰寫的。 這本書,正如這門課程一樣,是為計(jì)算機(jī)科學(xué)的本科生設(shè)計(jì)的,并沒有任何先修課程的要求。為了鼓勵讀者進(jìn)行更深的探索,絕大部分的章節(jié)后面都補(bǔ)充了參考文獻(xiàn)以供深層次的閱讀。 9 深度學(xué)習(xí) Deep Learning 作者:Ian Goodfellow, Yoshua Bengio and Aaron Courville 《深度學(xué)習(xí)》這本書是為了幫助學(xué)生和相關(guān)從業(yè)人員進(jìn)入一般而言的機(jī)器學(xué)習(xí)領(lǐng)域,尤其是深度學(xué)習(xí)而設(shè)計(jì)的。這本書的在線版本現(xiàn)已完結(jié),并會長期免費(fèi)開發(fā)。 10 對機(jī)器學(xué)習(xí)的渴望 Machine Learning Yearning 作者:Andrew Ng 人工智能,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)正在改變著數(shù)不勝數(shù)的行業(yè)。但是建立一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)需要你在實(shí)際中做出下面的決定: 應(yīng)該要收集更多的訓(xùn)練數(shù)據(jù)嗎? 應(yīng)該使用端對端的深度學(xué)習(xí)嗎? 如何處理與測試集不對應(yīng)的訓(xùn)練集? …… 在以前,做出上述戰(zhàn)略性決定的唯一方法是花幾年時(shí)間去讀研究生或者去公司里學(xué)習(xí)。我寫這本書的目的是幫助你快速掌握做上述決定的能力,使你可以在人工智能系統(tǒng)方面做得更好。
|