作品介紹

圖靈程序設(shè)計叢書：大規(guī)模數(shù)據(jù)處理入門與實戰(zhàn)

作者：Bill Karwin, Ben Forta等整理日期：2023-01-28 17:06:02

　　編輯推薦：
　　本套裝共包含《SQL反模式》、《SQL必知必會（第4版））》、《數(shù)據(jù)科學實戰(zhàn)》、《Spark快速大數(shù)據(jù)分析》、《數(shù)據(jù)科學入門》、《Python數(shù)據(jù)挖掘入門與實踐》、《Hadoop安全：大數(shù)據(jù)平臺隱私保護》、《Kafka權(quán)威指南》、《Hadoop數(shù)據(jù)分析》、《Flink基礎(chǔ)教程》10本書
　　《SQL反模式》是一本廣受好評的SQL圖書。它介紹了如何避免在SQL的使用和開發(fā)中陷入一些常見卻經(jīng)常被忽略的誤區(qū)。它通過講述各種具體的案例，以及開發(fā)人員和使用人員在面對這些案例時經(jīng)常采用的錯誤解決方案，來介紹如何識別、利用這些陷阱，以及面對問題時正確的解決手段。另外，《SQL反模式》還涉及了SQL的各級范式和針對它們的正確理解。　　《SQL反模式》適合SQL數(shù)據(jù)庫開發(fā)人員與管理人員閱讀。
　　SQL是使用廣泛的數(shù)據(jù)庫語言，幾乎所有重要的DBMS都支持SQL�！秷D靈程序設(shè)計叢書：SQL必知必會（第4版）》由淺入深地講解了SQL的基本概念和語法，涉及數(shù)據(jù)的排序、過濾和分組，以及表、視圖、聯(lián)結(jié)、子查詢、游標、存儲過程和觸發(fā)器等內(nèi)容，實例豐富，便于查閱。新版增加了針對ApacheOpenOfficeBase、MariaDB、SQlite等DBMS的描述，并根據(jù)新版本的Oracle、SQLServer、MySQL和PostgreSQL更新了相關(guān)示例。　　《圖靈程序設(shè)計叢書：SQL必知必會（第4版）》適合SQL初學者，也可供廣大開發(fā)及管理人員參考。
　　《數(shù)據(jù)科學實戰(zhàn)》脫胎于哥倫比亞大學“數(shù)據(jù)科學導(dǎo)論”課程的教學講義，它界定了數(shù)據(jù)科學的研究范疇，是一本注重人文精神，多角度、全方位、深入介紹數(shù)據(jù)科學的實用指南，堪稱大數(shù)據(jù)時代的實戰(zhàn)寶典。本書旨在讓讀者能夠舉一反三地解決重要問題，內(nèi)容包括：數(shù)據(jù)科學及工作流程、統(tǒng)計模型與機器學習算法、信息提取與統(tǒng)計變量創(chuàng)建、數(shù)據(jù)可視化與社交網(wǎng)絡(luò)、預(yù)測模型與因果分析、數(shù)據(jù)預(yù)處理與工程方法。另外，本書還將帶領(lǐng)讀者展望數(shù)據(jù)科學未來的發(fā)展。
　　《Spark快速大數(shù)據(jù)分析》講解了網(wǎng)絡(luò)大數(shù)據(jù)時代應(yīng)運而生的、能高效迅捷地分析處理數(shù)據(jù)的工具——Spark，它帶領(lǐng)讀者快速掌握用 Spark 收集、計算、簡化和保存海量數(shù)據(jù)的方法，學會交互、迭代和增量式分析，解決分區(qū)、數(shù)據(jù)本地化和自定義序列化等問題。
　　《數(shù)據(jù)科學入門》本書基于易于理解且具有數(shù)據(jù)科學相關(guān)的豐富的庫的Python語言環(huán)境，從零開始講解數(shù)據(jù)科學工作。具體內(nèi)容包括：Python速成，可視化數(shù)據(jù)，線性代數(shù)，統(tǒng)計，概率，假設(shè)與推斷，梯度下降法，如何獲取數(shù)據(jù)，k近鄰法，樸素貝葉斯算法，等等。作者借助大量具體例子以及數(shù)據(jù)挖掘、統(tǒng)計學、機器學習等領(lǐng)域的重要概念，詳細展示了什么是數(shù)據(jù)科學。
　　《Python數(shù)據(jù)挖掘入門與實踐》作為數(shù)據(jù)挖掘入門讀物，介紹了數(shù)據(jù)挖掘的基礎(chǔ)知識、基本工具和實踐方法，通過循序漸進地講解算法，帶你輕松踏上數(shù)據(jù)挖掘之旅。本書采用理論與實踐相結(jié)合的方式，呈現(xiàn)了如何使用決策樹和隨機森林算法預(yù)測美國職業(yè)籃球聯(lián)賽比賽結(jié)果，如何使用親和性分析方法推薦電影，如何使用樸素貝葉斯算法進行社會媒體挖掘，等等。本書也涉及神經(jīng)網(wǎng)絡(luò)、深度學習、大數(shù)據(jù)處理等內(nèi)容。本書面向愿意學習和嘗試數(shù)據(jù)挖掘的程序員。
　　《Hadoop安全大數(shù)據(jù)平臺隱私保護》闡述了Hadoop從早期開放的消費互聯(lián)網(wǎng)時代到現(xiàn)在作為敏感數(shù)據(jù)可信平臺的演變歷程，介紹了包括身份驗證、加密、密鑰管理和商業(yè)實踐在內(nèi)的諸多主題，并在實際環(huán)境下加以討論。第 1章是介紹性內(nèi)容，隨后分為四大部分：第一部分是安全架構(gòu)，第二部分是驗證、授權(quán)和安全審計，第三部分是數(shù)據(jù)安全，第四部分是歸納總結(jié)。介紹了幾個使用案例，融合了書中諸多概念。《Hadoop安全大數(shù)據(jù)平臺隱私保護》適合對Hadoop感興趣的讀者，有大數(shù)據(jù)平臺保護需求的讀者。
　　《Kafka權(quán)威指南》是關(guān)于Kafka的全面教程，主要內(nèi)容包括：Kafka相對于其他消息隊列系統(tǒng)的優(yōu)點，主要是它如何匹配大數(shù)據(jù)平臺開發(fā)；詳解Kafka內(nèi)部設(shè)計；用Kafka構(gòu)建應(yīng)用的實踐；理解在生產(chǎn)中部署Kafka的方式；如何確保Kafka集群的安全。本書適合Java開發(fā)人員、大數(shù)據(jù)平臺開發(fā)人員以及對分布式系統(tǒng)感興趣的讀者閱讀。
　　《Hadoop數(shù)據(jù)分析》提供分布式數(shù)據(jù)存儲和并行計算框架，Hadoop已經(jīng)從一個集群計算的抽象演化成了一個大數(shù)據(jù)的操作系統(tǒng)。本書旨在通過以可讀且直觀的方式提供集群計算和分析的概覽，為數(shù)據(jù)科學家深入了解特定主題領(lǐng)域鋪平道路，從數(shù)據(jù)科學家的視角介紹Hadoop集群計算和分析。本書分為兩大部分，* 一部分從非常高的層次介紹分布式計算，討論如何在集群上運行計算；* 二部分則重點關(guān)注數(shù)據(jù)科學家應(yīng)該了解的工具和技術(shù)，意在為各種分析和大規(guī)模數(shù)據(jù)管理提供動力。
　　近年來，流處理變得越來越流行。作為高度創(chuàng)新的開源流處理器，F(xiàn)link擁有諸多優(yōu)勢，包括容錯性、高吞吐、低延遲，以及同時支持流處理和批處理的能力�！禙link基礎(chǔ)教程》分為6章，側(cè)重于介紹Flink的核心設(shè)計理念、功能和用途，內(nèi)容涉及事件時間和處理時間、窗口和水印機制、檢查點機制、性能測評，以及Flink如何實現(xiàn)批處理。本書面向有興趣學習如何分析大規(guī)模流數(shù)據(jù)的讀者。

→ 圖靈程序設(shè)計叢書：大規(guī)模數(shù)據(jù)處理入門與實戰(zhàn)下載地址 ←

上一本：銀河界區(qū)三部曲

下一本：“共和國領(lǐng)袖真情實錄”系列

作家文集

☆ 豆豆作品集	☆ 林清玄作品集	☆ 江河作品集
☆ 李碧華作品集	☆ 林海音作品集	☆ 馬原作品集
☆ 高曉聲作品集	☆ 蔣子龍作品集	☆ 劉紹棠作品集
☆ 周立波作品集	☆ 亦舒作品集	☆ 閆紅作品集
☆ 祝勇作品集	☆ 周曉楓作品集	☆ 石一楓作品集
☆ 張廣天作品集	☆ 蔣藍作品集	☆ 李亞偉作品集
☆ 王小波作品集	☆ 木心作品集	☆ 魯迅作品集
☆ 葉圣陶作品集	☆ 張愛玲作品集	☆ 沈從文作品集
☆ 老舍作品集	☆ 巴金作品集	☆ 曹禺作品集
☆ 錢鐘書作品集	☆ 汪曾祺作品集	☆ 徐志摩作品集