本書是一本數(shù)據(jù)科學(xué)的入門書籍。每個知識點(diǎn)盡量從實際的應(yīng)用案例出發(fā),從數(shù)據(jù)出發(fā),以問題為導(dǎo)向,在解決問題中學(xué)習(xí)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等數(shù)據(jù)科學(xué)相關(guān)方法。本書將數(shù)據(jù)讀寫、數(shù)據(jù)清洗和預(yù)處理作為開端,逐漸深入到和數(shù)據(jù)科學(xué)相關(guān)的決策樹、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、無監(jiān)督學(xué)習(xí)等知識。此外,結(jié)合數(shù)據(jù)科學(xué)的實際應(yīng)用,書中還講解了推薦算法、文本挖掘和社交網(wǎng)絡(luò)分析等熱門實用技術(shù)。本書在寫作過程中盡量刪去太過抽樣的理論,讓具有一定高等數(shù)學(xué)和概率論基礎(chǔ)的讀者就能看得懂。當(dāng)然,如果讀者對方法原理確實不感興趣,只是為了用R程序?qū)崿F(xiàn)某種方法,可以跳過方法只看案例和程序。本書適合作為高校數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、大數(shù)據(jù)分析等相關(guān)專業(yè)的研究生和高年級本科的教科書,也適合作為相關(guān)企業(yè)的數(shù)據(jù)科學(xué)家、數(shù)據(jù)挖掘工程師、數(shù)據(jù)分析師及數(shù)據(jù)科學(xué)的愛好者等的工具書。方匡南,現(xiàn)為廈門大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計系教授、博士生導(dǎo)師,耶魯大學(xué)博士后,廈門大學(xué)數(shù)據(jù)挖掘研究中心副主任,靠前統(tǒng)計學(xué)會會士,全國工業(yè)統(tǒng)計學(xué)會理事、廈門統(tǒng)計學(xué)會常務(wù)理事。主要研究方向為數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、應(yīng)用統(tǒng)計。曾先后在國外非常不錯期刊發(fā)表論文七十多篇,主持了國家自然科學(xué)基金等項目二十多項。多年從事大數(shù)據(jù)及相關(guān)領(lǐng)域研究與教學(xué),著有《R數(shù)據(jù)分析》等多部相關(guān)作品。
|