作品介紹

數(shù)據(jù)挖掘和統(tǒng)計(jì)科學(xué)自學(xué)十大必備讀物


作者:著名作家     整理日期:2022-07-17 08:49:30


  機(jī)器學(xué)習(xí) | 數(shù)據(jù)挖掘和統(tǒng)計(jì)科學(xué)自學(xué)十大必備讀物
我們在這篇文章中推薦了10本學(xué)習(xí)機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的書,讓你的秋季閱讀計(jì)劃順利揚(yáng)帆起航。
  關(guān)鍵詞:Books, Data Science, ebook, Free ebook, Machine Learning
  還有什么比免費(fèi)的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)讀物更適合用來享受秋天的呢?
  下面的書單中從統(tǒng)計(jì)學(xué)基礎(chǔ)知識,到機(jī)器學(xué)習(xí)的基本概念,再到更重點(diǎn)的大框架內(nèi)容,對于高深的話題也有所涉獵,最后以一本總結(jié)性的書結(jié)尾。既有經(jīng)典名著,也有當(dāng)代的作品,希望你能在其中找到一些有趣的新內(nèi)容。
  機(jī)器學(xué)習(xí) | 數(shù)據(jù)挖掘和統(tǒng)計(jì)科學(xué)自學(xué)十大必備讀物
  1
  用統(tǒng)計(jì)學(xué)的方式思考
  Think Stats: Probability and Statistics for Programmers
  作者:Allen B. Downey
  《用統(tǒng)計(jì)學(xué)的方式思考》是為python的程序員設(shè)計(jì)的一本概率論和數(shù)理統(tǒng)計(jì)知識的入門書籍。
  本書主要介紹了剖析真實(shí)數(shù)據(jù)集和解決有趣問題的簡單方法。這本書的案例使用的是美國國家衛(wèi)生研究院的數(shù)據(jù),并鼓勵讀者使用真實(shí)的數(shù)據(jù)集做項(xiàng)目。
  2
  概率編程與貝葉斯方法
  Probabilistic Programming & Bayesian Methods for Hackers
  作者:Cam Davidson-Pilon
  一本介紹貝葉斯方法和概率編程的入門教程,主要是從對編程的理解出發(fā),數(shù)學(xué)知識其次。
  貝葉斯方法是概率推理中一種很實(shí)用的方法,在這本書當(dāng)中,貝葉斯方法一直隱藏在一章章慢慢的數(shù)學(xué)分析的背后。貝葉斯推理的典型內(nèi)容包含兩到三章概率論知識,然后再介紹貝葉斯推理?上У氖牵捎诖蠖鄶(shù)貝葉斯模型的數(shù)學(xué)難度太高,這本書中只為讀者介紹了簡單和虛構(gòu)的例子。這會讓讀者小看貝葉斯推理。而事實(shí)上,這是因?yàn)樽髡咦约旱钠脤?dǎo)致的。
  3
  理解機(jī)器學(xué)習(xí)
  Understanding Machine Learning: From Theory to Algorithms
  作者:Shai Shalev-Shwartz and Shai Ben-David
  機(jī)器學(xué)習(xí)是計(jì)算機(jī)科學(xué)中發(fā)展最快的領(lǐng)域之一,有著深遠(yuǎn)的實(shí)際應(yīng)用。這本書有條理的介紹了機(jī)器學(xué)習(xí),以及相關(guān)的典型算法。這本書既介紹了機(jī)器學(xué)習(xí)的一些基本概念,也介紹了將這些概念轉(zhuǎn)化為實(shí)際算法的數(shù)學(xué)推導(dǎo)。在介紹了基本概念之后,這本書也覆蓋了一些之前的教科書中所沒有涉及過的重要主題,包括模型算法的復(fù)雜度和凸性,穩(wěn)定性的概念;重要的算法范例包括隨機(jī)梯度下降法,神經(jīng)網(wǎng)絡(luò)模型,和機(jī)構(gòu)化預(yù)測法;還有新興的理論概念比如PAC-貝葉斯法和compression-based bounds(壓縮界限法)。
  4
  統(tǒng)計(jì)學(xué)習(xí)精要
  The Elements of Statistical Learning
  作者:Trevor Hastie,Robert Tibshirani,etc
  這本書用常用的概念框架解釋了統(tǒng)計(jì)領(lǐng)域中的重要概念。雖然是用的統(tǒng)計(jì)學(xué)方法,但是重點(diǎn)在概念的解讀而不是數(shù)學(xué)運(yùn)算。書中給出了很多例子,也用了很多彩圖。對數(shù)據(jù)挖掘感興趣的人和統(tǒng)計(jì)學(xué)家來說都會是很有價(jià)值的資源。這本書涵蓋的知識很廣,從監(jiān)督學(xué)習(xí)到非監(jiān)督學(xué)習(xí)都有涉獵。眾多的話題中包括神經(jīng)網(wǎng)絡(luò)模型,支持向量機(jī),以及最全面關(guān)于分類樹及推算話題的介紹。
  5
  統(tǒng)計(jì)學(xué)習(xí)及其在R中的應(yīng)用
  An Introduction to Statistical Learning with Applications in R
  作者:GarethJames,DanielaWitten,etc
  這本書介紹了一些統(tǒng)計(jì)學(xué)習(xí)的方法,是為非數(shù)學(xué)專業(yè)高水平的本科生,研究生和博士生設(shè)計(jì)的。這本書也包含了一些R語言的練習(xí)題和如何在現(xiàn)實(shí)中應(yīng)用統(tǒng)計(jì)模型的詳細(xì)說明,對于新入行的數(shù)學(xué)科學(xué)家來說是非常有價(jià)值的資源。
  6
  數(shù)據(jù)科學(xué)基礎(chǔ)
  Foundations of Data Science
  作者:Avrim Blum, John Hopcroft,etc
  雖然計(jì)算機(jī)科學(xué)的傳統(tǒng)領(lǐng)域依然很重要,未來,更多的研究者會集中于用電腦從應(yīng)用的大量數(shù)據(jù)中提取有用信息,而不是只是解決一些確定的問題。考慮到這一點(diǎn),我們在這本書中涵蓋了未來40年可能會有用的理論,就像自動控制原理,算法和相關(guān)主題在過去的40年給予學(xué)生的巨大幫助一樣。
  7
  給程序員的數(shù)據(jù)挖掘指南:
  數(shù)字迷宮的藝術(shù)
  A Programmer's Guide to Data Mining: The Ancient Art of the Numerati
  作者:Ron Zacharski
  這本書奉行的是邊干邊學(xué)的方法論。我希望你能用我提供過的Python代碼實(shí)踐書中的練習(xí)和實(shí)驗(yàn),而不僅僅是被動的閱讀。我希望你會積極主動的嘗試不同的數(shù)據(jù)挖掘方法。這本書由一系列互相貫通的小分支組成,當(dāng)你讀完這本書的時(shí)候,你就為理解數(shù)據(jù)挖掘技術(shù)奠定了夯實(shí)的基礎(chǔ)。
  8
  大數(shù)據(jù)·互聯(lián)網(wǎng)大規(guī)模
  數(shù)據(jù)完覺與分布式處理
  Mining of Massive Datasets
  作者:Jure Leskovec, etc
  這本書是基于斯坦福大學(xué)的計(jì)算機(jī)科學(xué)課程 cs246(海量數(shù)據(jù)挖掘)和 CS345A (數(shù)據(jù)挖掘)而撰寫的。
  這本書,正如這門課程一樣,是為計(jì)算機(jī)科學(xué)的本科生設(shè)計(jì)的,并沒有任何先修課程的要求。為了鼓勵讀者進(jìn)行更深的探索,絕大部分的章節(jié)后面都補(bǔ)充了參考文獻(xiàn)以供深層次的閱讀。
  9
  深度學(xué)習(xí)
  Deep Learning
  作者:Ian Goodfellow, Yoshua Bengio and Aaron Courville
  《深度學(xué)習(xí)》這本書是為了幫助學(xué)生和相關(guān)從業(yè)人員進(jìn)入一般而言的機(jī)器學(xué)習(xí)領(lǐng)域,尤其是深度學(xué)習(xí)而設(shè)計(jì)的。這本書的在線版本現(xiàn)已完結(jié),并會長期免費(fèi)開發(fā)。
  10
  對機(jī)器學(xué)習(xí)的渴望
  Machine Learning Yearning
  作者:Andrew Ng
  人工智能,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)正在改變著數(shù)不勝數(shù)的行業(yè)。但是建立一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)需要你在實(shí)際中做出下面的決定:
   應(yīng)該要收集更多的訓(xùn)練數(shù)據(jù)嗎?
   應(yīng)該使用端對端的深度學(xué)習(xí)嗎?
   如何處理與測試集不對應(yīng)的訓(xùn)練集?
  ……
  在以前,做出上述戰(zhàn)略性決定的唯一方法是花幾年時(shí)間去讀研究生或者去公司里學(xué)習(xí)。我寫這本書的目的是幫助你快速掌握做上述決定的能力,使你可以在人工智能系統(tǒng)方面做得更好。





上一本:書單推薦:預(yù)測宏觀數(shù)據(jù)和研判宏觀周期,讀什么書? 下一本:想生二胎?要生“二胎”,拿這些繪本給大寶看!

作家文集

下載說明
數(shù)據(jù)挖掘和統(tǒng)計(jì)科學(xué)自學(xué)十大必備讀物的作者是著名作家,全書語言優(yōu)美,行文流暢,內(nèi)容豐富生動引人入勝。為表示對作者的支持,建議在閱讀電子書的同時(shí),購買紙質(zhì)書。

更多好書