“這就是閱讀。即將新軟件安裝到大腦里的過(guò)程。”
就我個(gè)人而言,我從視頻和在線教程中所學(xué)到的始終沒(méi)有從書(shū)本中學(xué)到的多。
了解機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)很容易。目前有許多開(kāi)放課程,你可以馬上就開(kāi)始學(xué)習(xí)。但是,獲得更深入的學(xué)習(xí)需要額外的努力。例如:你可能會(huì)很快了解隨機(jī)森林如何運(yùn)作,但了解其背后的邏輯需要額外的努力。
質(zhì)疑的信心來(lái)自于閱讀。有些人很容易接受現(xiàn)狀。另一方面,一些好奇的人則會(huì)反思“為什么不能這樣做呢?”就是在這種情況下,人們開(kāi)始嘗試用新的方式完成任務(wù)。幾乎每個(gè)我在美國(guó)管理協(xié)會(huì)(AMA)遇到的數(shù)據(jù)科學(xué)家,都曾在公開(kāi)的采訪中強(qiáng)調(diào)過(guò)書(shū)籍在他們生活中充當(dāng)了不可取代的作用。
以下是我在過(guò)去的一年中所發(fā)現(xiàn)的 R 語(yǔ)言和 Python 相關(guān)的機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)書(shū)籍。閱讀是一個(gè)好習(xí)慣,希望通過(guò)閱讀本文,你也可以養(yǎng)成閱讀的好習(xí)慣。祝閱讀愉快!
數(shù)據(jù)科學(xué)之R語(yǔ)言
R 語(yǔ)言入門(mén)與實(shí)踐 Hands-on Programming with R
作者:Garrett Grolemund 譯者: 馮凌秉
本書(shū)適合剛開(kāi)始學(xué)習(xí) R 語(yǔ)言的人。學(xué)習(xí)寫(xiě)函數(shù)和循環(huán)可以使你用 R 實(shí)現(xiàn)更多功能。一些人認(rèn)為,R 包可以讓他們避免寫(xiě)函數(shù)和循環(huán),但那并不是長(zhǎng)久之計(jì)。本書(shū)將介紹 R 編程環(huán)境的細(xì)節(jié),同時(shí)附有有趣的項(xiàng)目,如加權(quán)骰子,撲克牌,老虎機(jī)等。本書(shū)語(yǔ)言淺顯易懂。
大家的 R:高級(jí)分析和圖形學(xué) R for Everyone: Advanced Analytics and Graphics
作者:Jared P. Lander
本書(shū)涵蓋數(shù)據(jù)可視化,數(shù)據(jù)處理,預(yù)測(cè)建模等數(shù)據(jù)科學(xué)各方面內(nèi)容,而且并不晦澀難懂。同時(shí)內(nèi)容廣泛,細(xì)節(jié)詳實(shí)。強(qiáng)調(diào)了算法的使用標(biāo)準(zhǔn)和每個(gè)示例在 R 中的實(shí)現(xiàn)。本書(shū)適合傾向從實(shí)際方面理解算法的人群。
R 語(yǔ)言經(jīng)典實(shí)例 R Cookbook
作者: Teetor Paul 譯者:李洪成
本書(shū)為幫助人們克服在數(shù)據(jù)預(yù)處理和操作中遇到的各種問(wèn)題。很多時(shí)候,面對(duì)熟悉的場(chǎng)景,我們知道要做些什么。但是,如何完成卻成為了一個(gè)巨大的挑戰(zhàn)。這本書(shū)就很好解決了這個(gè)問(wèn)題。它并沒(méi)有對(duì)概念進(jìn)行理論解釋?zhuān)攸c(diǎn)介紹如何在 R 中使用它們。本書(shū)涵蓋了廣泛的主題,如概率,統(tǒng)計(jì),時(shí)間序列分析,數(shù)據(jù)預(yù)處理等。
R 數(shù)據(jù)可視化手冊(cè) R Graphics Cookbook
作者:Winston Chang 譯者:肖楠, 鄧一碩 , 魏太云
數(shù)據(jù)可視化使人能夠使用形狀和顏色來(lái)表達(dá)和分析他們的發(fā)現(xiàn),而不僅僅使用表格。透徹的了解圖表,明確何時(shí)使用哪個(gè)圖表,以及如何定制圖表是數(shù)據(jù)科學(xué)家的關(guān)鍵技能。本書(shū)不僅僅具有理論知識(shí),而且強(qiáng)調(diào)如何在 R 中構(gòu)建樣本數(shù)據(jù)集。同時(shí)專(zhuān)注使用 ggplot2 包來(lái)進(jìn)行可視化。
應(yīng)用預(yù)測(cè)建模 Applied Predictive Modeling
作者:Max Kuhn, Kjell Johnson
作者之一 Max Kuhn 本身就是 caret 包的開(kāi)發(fā)者。本書(shū)是理論和實(shí)踐知識(shí)的完美融合。它討論了幾個(gè)關(guān)鍵的機(jī)器學(xué)習(xí)主題,如過(guò)擬合,特征選擇,線性和非線性模型,樹(shù)型方法等。并且使用 caret 包演示了所有算法。Caret 是 CRAN 庫(kù)中功能強(qiáng)大的機(jī)器學(xué)習(xí)包之一。
統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論:基于 R 應(yīng)用 Introduction to Statistical Learning
作者:Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani 譯者:王星
本書(shū)是最詳盡統(tǒng)計(jì)建模的書(shū)之一。此外,它包括對(duì)線性回歸,邏輯回歸,樹(shù)木,SVM,無(wú)監(jiān)督學(xué)習(xí)等主題的深入解釋。由于是導(dǎo)論,所以解釋淺顯易懂,任何新手都可以輕松學(xué)習(xí)。而且還附有練習(xí)。推薦這本書(shū)給所有使用 R 語(yǔ)言進(jìn)行機(jī)器學(xué)習(xí)新手。
統(tǒng)計(jì)學(xué)習(xí)要素 Elements of Statistical Learning
作者:Trevor Hastie, Robert Tibshirani, Jerome Friedman
本書(shū)是“統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論”的下一部分。它包含更高級(jí)的主題,因此不建議跳過(guò)上一本書(shū)直接讀這本。這本書(shū)適合掌握機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí)的人。它涉及收縮方法,不同的線性回歸方法,分類(lèi),內(nèi)核平滑,模型選擇等。對(duì)于想深入了解機(jī)器學(xué)習(xí)的人來(lái)說(shuō),這是一本必讀書(shū)。
機(jī)器學(xué)習(xí)與 R 語(yǔ)言 Machine Learning with R
作者: Brett Lantz 譯者: 李洪成, 許金煒, 李艦
書(shū)中作者解釋概念淺顯易懂,令人印象深刻。本書(shū)圍繞機(jī)器學(xué)習(xí),同時(shí)涵蓋了很多實(shí)踐方面的知識(shí)。通過(guò)案例研究,討論了 Bagging,Boosting,SVM,神經(jīng)網(wǎng)絡(luò),聚類(lèi)等算法。這些案例將幫助你了解這些算法。另外還闡述了機(jī)器學(xué)習(xí)參數(shù)的知識(shí)。
掌握機(jī)器學(xué)習(xí)與 R 語(yǔ)言 Mastering Machine Learning with R
作者: Cory Lesmeister
本書(shū)適合所有想要通過(guò)掌握 R 語(yǔ)言進(jìn)行機(jī)器學(xué)習(xí)人。它包括(幾乎)所有算法及其在 R 語(yǔ)言中的執(zhí)行。此外,本書(shū)介紹了一些用于機(jī)器學(xué)習(xí)的 R 包,包括最近推出的 H2o 包。本書(shū)還介紹了機(jī)器學(xué)習(xí)的最新發(fā)展,因此建議每個(gè)學(xué)習(xí) R 語(yǔ)言的人閱讀本書(shū)。但是,不能期望從本書(shū)中學(xué)習(xí)到高級(jí)機(jī)器學(xué)習(xí)概念,如堆疊。
下一頁(yè)更精彩:18本數(shù)據(jù)科學(xué)家必讀的R語(yǔ)言和Python相關(guān)書(shū)籍
|