在《R數(shù)據(jù)科學(xué)實戰(zhàn)》(第2版)這本書中,作者用了一些篇幅描述了什么是數(shù)據(jù)科學(xué)、數(shù)據(jù)科學(xué)家是如何解決問題的,以及對他們工作的描述。其中,包括對經(jīng)典監(jiān)督學(xué)習(xí)方法(如線性回歸和邏輯回歸)的詳細(xì)描述。我們喜歡本書的調(diào)研式風(fēng)格,以及使用的大量的競賽獲獎方法和程序包的示例(如隨機森林和xgboost)。本書涵蓋了非常有用的、可共享的經(jīng)驗和實踐建議。我們注意到,在本書中甚至包括了我們自己使用過的一-些技巧,例如使用隨機森林變量重要性進(jìn)行初始變量的篩選。 有依據(jù)的決策對于成功至關(guān)重要。將正確的數(shù)據(jù)分析技術(shù)應(yīng)用到精心籌備的業(yè)務(wù)數(shù)據(jù)中有助于做出準(zhǔn)確預(yù)測、確定趨勢,以及提前發(fā)現(xiàn)問題。R數(shù)據(jù)分析平臺提供了許多高效率的工具,可用來處理日常的數(shù)據(jù)分析和機器學(xué)習(xí)任務(wù)。《R數(shù)據(jù)科學(xué)實戰(zhàn)》(第2版)是一本基于任務(wù)的教程,引導(dǎo)讀者使用R語言參與幾十個實用的數(shù)據(jù)分析實踐。本書重點介紹讀者在工作中將面臨的*重要任務(wù),對于商業(yè)分析師和數(shù)據(jù)科學(xué)家來說都非常實用。因為數(shù)據(jù)只有在可理解的情況下才有用,所以讀者也可以在表格中找到組織和展示數(shù)據(jù)的妙招,以及快速生動的可視化效果。
|