“這就是閱讀。即將新軟件安裝到大腦里的過程!
就我個人而言,我從視頻和在線教程中所學(xué)到的始終沒有從書本中學(xué)到的多。
了解機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)很容易。目前有許多開放課程,你可以馬上就開始學(xué)習(xí)。但是,獲得更深入的學(xué)習(xí)需要額外的努力。例如:你可能會很快了解隨機(jī)森林如何運(yùn)作,但了解其背后的邏輯需要額外的努力。
質(zhì)疑的信心來自于閱讀。有些人很容易接受現(xiàn)狀。另一方面,一些好奇的人則會反思“為什么不能這樣做呢?”就是在這種情況下,人們開始嘗試用新的方式完成任務(wù)。幾乎每個我在美國管理協(xié)會(AMA)遇到的數(shù)據(jù)科學(xué)家,都曾在公開的采訪中強(qiáng)調(diào)過書籍在他們生活中充當(dāng)了不可取代的作用。
以下是我在過去的一年中所發(fā)現(xiàn)的 R 語言和 Python 相關(guān)的機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)書籍。閱讀是一個好習(xí)慣,希望通過閱讀本文,你也可以養(yǎng)成閱讀的好習(xí)慣。祝閱讀愉快!
數(shù)據(jù)科學(xué)之R語言
R 語言入門與實(shí)踐 Hands-on Programming with R
 作者:Garrett Grolemund 譯者: 馮凌秉
本書適合剛開始學(xué)習(xí) R 語言的人。學(xué)習(xí)寫函數(shù)和循環(huán)可以使你用 R 實(shí)現(xiàn)更多功能。一些人認(rèn)為,R 包可以讓他們避免寫函數(shù)和循環(huán),但那并不是長久之計。本書將介紹 R 編程環(huán)境的細(xì)節(jié),同時附有有趣的項(xiàng)目,如加權(quán)骰子,撲克牌,老虎機(jī)等。本書語言淺顯易懂。
大家的 R:高級分析和圖形學(xué) R for Everyone: Advanced Analytics and Graphics
 作者:Jared P. Lander
本書涵蓋數(shù)據(jù)可視化,數(shù)據(jù)處理,預(yù)測建模等數(shù)據(jù)科學(xué)各方面內(nèi)容,而且并不晦澀難懂。同時內(nèi)容廣泛,細(xì)節(jié)詳實(shí)。強(qiáng)調(diào)了算法的使用標(biāo)準(zhǔn)和每個示例在 R 中的實(shí)現(xiàn)。本書適合傾向從實(shí)際方面理解算法的人群。
R 語言經(jīng)典實(shí)例 R Cookbook
 作者: Teetor Paul 譯者:李洪成
本書為幫助人們克服在數(shù)據(jù)預(yù)處理和操作中遇到的各種問題。很多時候,面對熟悉的場景,我們知道要做些什么。但是,如何完成卻成為了一個巨大的挑戰(zhàn)。這本書就很好解決了這個問題。它并沒有對概念進(jìn)行理論解釋,而重點(diǎn)介紹如何在 R 中使用它們。本書涵蓋了廣泛的主題,如概率,統(tǒng)計,時間序列分析,數(shù)據(jù)預(yù)處理等。
R 數(shù)據(jù)可視化手冊 R Graphics Cookbook
 作者:Winston Chang 譯者:肖楠, 鄧一碩 , 魏太云
數(shù)據(jù)可視化使人能夠使用形狀和顏色來表達(dá)和分析他們的發(fā)現(xiàn),而不僅僅使用表格。透徹的了解圖表,明確何時使用哪個圖表,以及如何定制圖表是數(shù)據(jù)科學(xué)家的關(guān)鍵技能。本書不僅僅具有理論知識,而且強(qiáng)調(diào)如何在 R 中構(gòu)建樣本數(shù)據(jù)集。同時專注使用 ggplot2 包來進(jìn)行可視化。
應(yīng)用預(yù)測建模 Applied Predictive Modeling
 作者:Max Kuhn, Kjell Johnson
作者之一 Max Kuhn 本身就是 caret 包的開發(fā)者。本書是理論和實(shí)踐知識的完美融合。它討論了幾個關(guān)鍵的機(jī)器學(xué)習(xí)主題,如過擬合,特征選擇,線性和非線性模型,樹型方法等。并且使用 caret 包演示了所有算法。Caret 是 CRAN 庫中功能強(qiáng)大的機(jī)器學(xué)習(xí)包之一。
統(tǒng)計學(xué)習(xí)導(dǎo)論:基于 R 應(yīng)用 Introduction to Statistical Learning
 作者:Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani 譯者:王星
本書是最詳盡統(tǒng)計建模的書之一。此外,它包括對線性回歸,邏輯回歸,樹木,SVM,無監(jiān)督學(xué)習(xí)等主題的深入解釋。由于是導(dǎo)論,所以解釋淺顯易懂,任何新手都可以輕松學(xué)習(xí)。而且還附有練習(xí)。推薦這本書給所有使用 R 語言進(jìn)行機(jī)器學(xué)習(xí)新手。
統(tǒng)計學(xué)習(xí)要素 Elements of Statistical Learning
 作者:Trevor Hastie, Robert Tibshirani, Jerome Friedman
本書是“統(tǒng)計學(xué)習(xí)導(dǎo)論”的下一部分。它包含更高級的主題,因此不建議跳過上一本書直接讀這本。這本書適合掌握機(jī)器學(xué)習(xí)基礎(chǔ)知識的人。它涉及收縮方法,不同的線性回歸方法,分類,內(nèi)核平滑,模型選擇等。對于想深入了解機(jī)器學(xué)習(xí)的人來說,這是一本必讀書。
機(jī)器學(xué)習(xí)與 R 語言 Machine Learning with R
 作者: Brett Lantz 譯者: 李洪成, 許金煒, 李艦
書中作者解釋概念淺顯易懂,令人印象深刻。本書圍繞機(jī)器學(xué)習(xí),同時涵蓋了很多實(shí)踐方面的知識。通過案例研究,討論了 Bagging,Boosting,SVM,神經(jīng)網(wǎng)絡(luò),聚類等算法。這些案例將幫助你了解這些算法。另外還闡述了機(jī)器學(xué)習(xí)參數(shù)的知識。
掌握機(jī)器學(xué)習(xí)與 R 語言 Mastering Machine Learning with R
 作者: Cory Lesmeister
本書適合所有想要通過掌握 R 語言進(jìn)行機(jī)器學(xué)習(xí)人。它包括(幾乎)所有算法及其在 R 語言中的執(zhí)行。此外,本書介紹了一些用于機(jī)器學(xué)習(xí)的 R 包,包括最近推出的 H2o 包。本書還介紹了機(jī)器學(xué)習(xí)的最新發(fā)展,因此建議每個學(xué)習(xí) R 語言的人閱讀本書。但是,不能期望從本書中學(xué)習(xí)到高級機(jī)器學(xué)習(xí)概念,如堆疊。
下一頁更精彩:18本數(shù)據(jù)科學(xué)家必讀的R語言和Python相關(guān)書籍
|