編輯推薦: 本套裝共包含《SQL反模式》、《SQL必知必會(第4版))》、《數(shù)據(jù)科學實戰(zhàn)》、《Spark快速大數(shù)據(jù)分析》、《數(shù)據(jù)科學入門》、《Python數(shù)據(jù)挖掘入門與實踐》、《Hadoop安全:大數(shù)據(jù)平臺隱私保護》、《Kafka權(quán)威指南》、《Hadoop數(shù)據(jù)分析》、《Flink基礎(chǔ)教程》10本書 《SQL反模式》是一本廣受好評的SQL圖書。它介紹了如何避免在SQL的使用和開發(fā)中陷入一些常見卻經(jīng)常被忽略的誤區(qū)。它通過講述各種具體的案例,以及開發(fā)人員和使用人員在面對這些案例時經(jīng)常采用的錯誤解決方案,來介紹如何識別、利用這些陷阱,以及面對問題時正確的解決手段。另外,《SQL反模式》還涉及了SQL的各級范式和針對它們的正確理解。 《SQL反模式》適合SQL數(shù)據(jù)庫開發(fā)人員與管理人員閱讀。 SQL是使用廣泛的數(shù)據(jù)庫語言,幾乎所有重要的DBMS都支持SQL!秷D靈程序設(shè)計叢書:SQL必知必會(第4版)》由淺入深地講解了SQL的基本概念和語法,涉及數(shù)據(jù)的排序、過濾和分組,以及表、視圖、聯(lián)結(jié)、子查詢、游標、存儲過程和觸發(fā)器等內(nèi)容,實例豐富,便于查閱。新版增加了針對ApacheOpenOfficeBase、MariaDB、SQlite等DBMS的描述,并根據(jù)新版本的Oracle、SQLServer、MySQL和PostgreSQL更新了相關(guān)示例。 《圖靈程序設(shè)計叢書:SQL必知必會(第4版)》適合SQL初學者,也可供廣大開發(fā)及管理人員參考。 《數(shù)據(jù)科學實戰(zhàn)》脫胎于哥倫比亞大學“數(shù)據(jù)科學導(dǎo)論”課程的教學講義,它界定了數(shù)據(jù)科學的研究范疇,是一本注重人文精神,多角度、全方位、深入介紹數(shù)據(jù)科學的實用指南,堪稱大數(shù)據(jù)時代的實戰(zhàn)寶典。本書旨在讓讀者能夠舉一反三地解決重要問題,內(nèi)容包括:數(shù)據(jù)科學及工作流程、統(tǒng)計模型與機器學習算法、信息提取與統(tǒng)計變量創(chuàng)建、數(shù)據(jù)可視化與社交網(wǎng)絡(luò)、預(yù)測模型與因果分析、數(shù)據(jù)預(yù)處理與工程方法。另外,本書還將帶領(lǐng)讀者展望數(shù)據(jù)科學未來的發(fā)展。 《Spark快速大數(shù)據(jù)分析》講解了網(wǎng)絡(luò)大數(shù)據(jù)時代應(yīng)運而生的、能高效迅捷地分析處理數(shù)據(jù)的工具——Spark,它帶領(lǐng)讀者快速掌握用 Spark 收集、計算、簡化和保存海量數(shù)據(jù)的方法,學會交互、迭代和增量式分析,解決分區(qū)、數(shù)據(jù)本地化和自定義序列化等問題。 《數(shù)據(jù)科學入門》本書基于易于理解且具有數(shù)據(jù)科學相關(guān)的豐富的庫的Python語言環(huán)境,從零開始講解數(shù)據(jù)科學工作。具體內(nèi)容包括:Python速成,可視化數(shù)據(jù),線性代數(shù),統(tǒng)計,概率,假設(shè)與推斷,梯度下降法,如何獲取數(shù)據(jù),k近鄰法,樸素貝葉斯算法,等等。作者借助大量具體例子以及數(shù)據(jù)挖掘、統(tǒng)計學、機器學習等領(lǐng)域的重要概念,詳細展示了什么是數(shù)據(jù)科學。 《Python數(shù)據(jù)挖掘入門與實踐》作為數(shù)據(jù)挖掘入門讀物,介紹了數(shù)據(jù)挖掘的基礎(chǔ)知識、基本工具和實踐方法,通過循序漸進地講解算法,帶你輕松踏上數(shù)據(jù)挖掘之旅。本書采用理論與實踐相結(jié)合的方式,呈現(xiàn)了如何使用決策樹和隨機森林算法預(yù)測美國職業(yè)籃球聯(lián)賽比賽結(jié)果,如何使用親和性分析方法推薦電影,如何使用樸素貝葉斯算法進行社會媒體挖掘,等等。本書也涉及神經(jīng)網(wǎng)絡(luò)、深度學習、大數(shù)據(jù)處理等內(nèi)容。 本書面向愿意學習和嘗試數(shù)據(jù)挖掘的程序員。 《Hadoop安全 大數(shù)據(jù)平臺隱私保護》闡述了Hadoop從早期開放的消費互聯(lián)網(wǎng)時代到現(xiàn)在作為敏感數(shù)據(jù)可信平臺的演變歷程,介紹了包括身份驗證、加密、密鑰管理和商業(yè)實踐在內(nèi)的諸多主題,并在實際環(huán)境下加以討論。第 1章是介紹性內(nèi)容,隨后分為四大部分:第 一部分是安全架構(gòu),第 二部分是驗證、授權(quán)和安全審計,第三部分是數(shù)據(jù)安全,第四部分是歸納總結(jié)。介紹了幾個使用案例,融合了書中諸多概念。 《Hadoop安全 大數(shù)據(jù)平臺隱私保護》適合對Hadoop感興趣的讀者,有大數(shù)據(jù)平臺保護需求的讀者。 《Kafka權(quán)威指南》是關(guān)于Kafka的全面教程,主要內(nèi)容包括:Kafka相對于其他消息隊列系統(tǒng)的優(yōu)點,主要是它如何匹配大數(shù)據(jù)平臺開發(fā);詳解Kafka內(nèi)部設(shè)計;用Kafka構(gòu)建應(yīng)用的實踐;理解在生產(chǎn)中部署Kafka的方式;如何確保Kafka集群的安全。 本書適合Java開發(fā)人員、大數(shù)據(jù)平臺開發(fā)人員以及對分布式系統(tǒng)感興趣的讀者閱讀。 《Hadoop數(shù)據(jù)分析》提供分布式數(shù)據(jù)存儲和并行計算框架,Hadoop已經(jīng)從一個集群計算的抽象演化成了一個大數(shù)據(jù)的操作系統(tǒng)。本書旨在通過以可讀且直觀的方式提供集群計算和分析的概覽,為數(shù)據(jù)科學家深入了解特定主題領(lǐng)域鋪平道路,從數(shù)據(jù)科學家的視角介紹Hadoop集群計算和分析。本書分為兩大部分,* 一部分從非常高的層次介紹分布式計算,討論如何在集群上運行計算;* 二部分則重點關(guān)注數(shù)據(jù)科學家應(yīng)該了解的工具和技術(shù),意在為各種分析和大規(guī)模數(shù)據(jù)管理提供動力。 近年來,流處理變得越來越流行。作為高度創(chuàng)新的開源流處理器,F(xiàn)link擁有諸多優(yōu)勢,包括容錯性、高吞吐、低延遲,以及同時支持流處理和批處理的能力!禙link基礎(chǔ)教程》分為6章,側(cè)重于介紹Flink的核心設(shè)計理念、功能和用途,內(nèi)容涉及事件時間和處理時間、窗口和水印機制、檢查點機制、性能測評,以及Flink如何實現(xiàn)批處理。 本書面向有興趣學習如何分析大規(guī)模流數(shù)據(jù)的讀者。
|