數(shù)據(jù)挖掘(英語:Data mining),又譯為資料探勘、數(shù)據(jù)采礦。它是數(shù)據(jù)庫知識發(fā)現(xiàn)(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘通常與計算機科學有關,并通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)(依靠過去的經(jīng)驗法則)和模式識別等諸多方法來實現(xiàn)上述目標。 為了幫助小伙伴們更好地學習數(shù)據(jù)挖掘技術相關內(nèi)容,我們?yōu)榇蠹彝扑]了六本數(shù)據(jù)挖掘領域的經(jīng)典書籍,既涵蓋了數(shù)據(jù)挖掘的概念、算法等基礎知識,又包含了數(shù)據(jù)挖掘在不同子領域的具體應用。一起來看看吧! 一、基礎篇 主要目標:幫助大家了解數(shù)據(jù)挖掘領域的基本概念、代表性算法和評估技術,比如數(shù)據(jù)的關聯(lián)分析、分類及聚類算法等,為大家之后進一步學習數(shù)據(jù)挖掘知識、深入進行科研或在實際場景中應用奠定基礎。 1. Introduction to Data Mining 中文譯名:數(shù)據(jù)挖掘?qū)д摚ㄍ暾妫?br/> 作者:Pang-Ning Tang、Michael Steinbach、Vipin Kumar 適合人群:初級到中級學者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書內(nèi)容涵蓋了數(shù)據(jù)挖掘的方方面面,從什么是數(shù)據(jù)挖掘、什么是數(shù)據(jù)以及數(shù)據(jù)預處理的方法,到具體的數(shù)據(jù)挖掘算法,比如分類、關聯(lián)分析、聚類、異常檢測等,從基本的定義入手,由淺至深地幫助讀者透徹地理解數(shù)據(jù)挖掘的基礎。書中使用大量的圖表、綜合示例、關鍵算法的簡潔描述等,盡可能地直接聚焦于數(shù)據(jù)挖掘的主要概念。 推薦理由:本書是明尼蘇達大學和密歇根州立大學數(shù)據(jù)挖掘課程的教材,是數(shù)據(jù)挖掘領域經(jīng)典的入門教程。本書內(nèi)容淺顯易懂,只要求具備很少的統(tǒng)計學或數(shù)學背景知識,略去了各個定理的證明部分,通過枚舉大量具體的算法實例來簡要說明算法的流程和意義,讓初學者可以以最快速度總攬全局,掌握數(shù)據(jù)挖掘領域的基本要點。 2. Data Mining: Concepts and Techniques 中文譯名:數(shù)據(jù)挖掘:概念與技術(原書第三版) 作者:Jiawei Han、Micheline Kamber、Jian Pei 適合人群:初級到中級學者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書是最新的第三版,主要從數(shù)據(jù)庫角度全面系統(tǒng)地介紹了數(shù)據(jù)挖掘的基本概念、方法、技術以及技術的研究進展,并且重點關注了數(shù)據(jù)挖掘領域最新的技術和發(fā)展,介紹了社會網(wǎng)絡挖掘、流數(shù)據(jù)挖掘和數(shù)據(jù)立方體計算等最新的研究方法,并探討了數(shù)據(jù)挖掘方法在金融等領域的應用。書中引入了許多算法和實現(xiàn)實例,以易于理解的偽代碼編寫,適用于實際的大規(guī)模數(shù)據(jù)挖掘項目。 推薦理由:本書是一本非常優(yōu)秀的數(shù)據(jù)挖掘教材,更是數(shù)據(jù)挖掘領域具有里程碑意義的經(jīng)典著作。它不僅詳盡講述了數(shù)據(jù)挖掘的基本概念和方法,又具有一定的深度,介紹了數(shù)據(jù)挖掘領域近年來最新的課題。它結構合理、調(diào)理清晰,每一章都針對關鍵專題有單獨的指導,并且只要求讀者具備少量的編程經(jīng)驗以及了解基本的數(shù)據(jù)和統(tǒng)計分析方向的知識。 二、 應用篇 主要目標: 在大數(shù)據(jù)時代,數(shù)據(jù)的形式多種多樣,在不同科研領域、商業(yè)背景、產(chǎn)業(yè)類型中的應用也十分豐富。這里我們通過四本書來為大家介紹數(shù)據(jù)挖掘的方法和思想在三個不同的子領域中的具體應用,幫助大家了解數(shù)據(jù)挖掘領域最前沿的熱門研究方向和應用場景,為大家把握科研或工程的方向提供參考。 1. Recommender Systems: An introduction 中文譯名:推薦系統(tǒng) 作者:Dietmar Jannach、Markus Zanker、Alexander Felfernig、Gerhard Friedrich 適合人群:中級到高級學者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書比較全面地介紹了推薦系統(tǒng)涉及的相關知識點,呈現(xiàn)了許多經(jīng)典算法,并討論了如何衡量推薦系統(tǒng)的有效性。書中內(nèi)容分為基本概念和最新進展兩部分:前者涉及協(xié)同推薦、基于內(nèi)容的推薦、基于知識的推薦、混合推薦方法,推薦系統(tǒng)的解釋、評估推薦系統(tǒng)和實例分析;后者包括針對推薦系統(tǒng)的攻擊、在線消費決策、推薦系統(tǒng)和下一代互聯(lián)網(wǎng)以及普適環(huán)境中的推薦。 推薦理由:本書內(nèi)容詳盡,廣泛涵蓋了不同類型的推薦系統(tǒng),并對這些推薦系統(tǒng)逐一進行了細致地剖析,并輔以實際應用案例的介紹,適合想要了解推薦系統(tǒng)的基礎和相關研究的讀者作為推薦系統(tǒng)的入門書籍。書中包含了大量的圖、表以及示例,有助于讀者理解和把握相關知識。 2. Recommender Systems: The Textbook 作者:Charu C. Aggarwal 適合人群:中級到高級學者 推薦指數(shù):★★★★☆ 主要內(nèi)容:本書詳盡地介紹了推薦系統(tǒng)的方方面面,可以大致地被分為三個部分:“算法和評估”部分探討了推薦系統(tǒng)中的基礎算法,包括協(xié)同過濾的方法、基于內(nèi)容的方法、基于知識的方法、集成方法以及推薦系統(tǒng)的評估方法;“特定領域和上下文下的推薦系統(tǒng)”部分介紹在如時間空間數(shù)據(jù)、社交數(shù)據(jù)、標簽數(shù)據(jù)以及信用度數(shù)據(jù)等不同的上下文場景數(shù)據(jù)中如何進行推薦;“高級的主題和應用”部分介紹了和推薦系統(tǒng)的魯棒性相關的內(nèi)容,如先令系統(tǒng)、攻擊模型以及相應的防御模型。 推薦理由:這是一本非常優(yōu)秀的推薦系統(tǒng)教科書,它不僅用簡單的語言闡述了推薦系統(tǒng)的基礎,深入地介紹了核心算法的概念以及數(shù)學論證,還為讀者提供了第三方工具或框架使用時需要查詢的大量資料。它對于推薦系統(tǒng)的基礎、具體應用和相關文獻進行了全面介紹,既適合研究人員作為推薦系統(tǒng)的入門書籍,又適合工業(yè)從業(yè)人員作為工具參考書。 3. Sentiment Analysis: Mining Opinions, Sentiments,and Emotions 中文譯名:情感分析:挖掘觀點、情感和情緒 作者:Bing Liu 適合人群:中級到高級學者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書主要從自然語言處理的角度全面地介紹情感分析這個主題中的基礎算法以及先進的研究技術和科研結果。書中幾乎涵蓋了情感分析所有的核心領域,在介紹了情感分析的基本概念和多種基本的情感分析場景后,又解讀了多個新興的情感分析主題,比如辯論分析、意圖挖掘、假民意檢測等,不僅能夠讓讀者了解通常用于表達觀點和情感的問題和語言的基本結構,還能幫助讀者深入地探究大量觀點挖掘和情感分析的算法和系統(tǒng)。 推薦理由:本書是迄今為止觀點挖掘與情感分析領域最權威、最全面的著作之一。書中幾乎涵蓋了情感分析的方方面面,將理論和實踐相結合,深入淺出,同時兼顧了領域知識的深度和廣度,不僅可以作為剛接觸這一領域的學者或開發(fā)者的入門教材,又可以作為了解這一領域最前沿研究成果的經(jīng)典讀物。 4. 移動數(shù)據(jù)挖掘 作者:連德富、張富崢、王英子、袁晶、謝幸 適合人群:中級到高級學者 推薦指數(shù):★★★★★ 主要內(nèi)容:本書選取當前學術界和工業(yè)界的熱點為主題,自成體系,書中以人的軌跡數(shù)據(jù),特別是移動社交網(wǎng)絡的位置數(shù)據(jù)為中心,結合人的基本信息及社交網(wǎng)絡等相關信息來研究個人與群體的移動模式特性,介紹了移動數(shù)據(jù)挖掘的基本概念和方法,具體包括移動數(shù)據(jù)預處理、用戶移動模型、用戶畫像以及興趣位置推薦等,內(nèi)容十分新穎。 推薦理由:本書是大數(shù)據(jù)管理叢書中的一本,書中梳理總結了作者團隊過去十年在人群移動數(shù)據(jù)理解上展開的研究,這些研究經(jīng)驗不僅對于很多實際應用有著重要的價值,也有助于解決一些具有社會意義的科學問題。本書在介紹了移動數(shù)據(jù)的概念及其價值的同時,還細致地講解了移動數(shù)據(jù)領域內(nèi)的多個前沿研究課題,對于想要深入了解這個領域的學者和工業(yè)從業(yè)人員是非常好的選擇。
|