本書(shū)介紹了hadoop技術(shù)的相關(guān)知識(shí),并將理論知識(shí)與實(shí)際項(xiàng)目相結(jié)合。全書(shū)共分為三個(gè)部分:基礎(chǔ)篇、應(yīng)用篇和總結(jié)篇;A(chǔ)篇詳細(xì)介紹了hadoop、yarn、mapreduce、hdfs、hive、sqoop和hbase,并深入探討了hadoop的運(yùn)維和調(diào)優(yōu);應(yīng)用篇?jiǎng)t包含了一個(gè)具有代表性的完整的基于hadoop的商業(yè)智能系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn);結(jié)束篇對(duì)全書(shū)進(jìn)行總結(jié),并對(duì)技術(shù)發(fā)展做了展望。 hadoop是目前受關(guān)注的大數(shù)據(jù)處理平臺(tái)和解決方案,并且已經(jīng)廣泛應(yīng)用于生產(chǎn)環(huán)境。本書(shū)基于新的hadoop(cdh5,apachehadoop 2.6)版本介紹hadoop技術(shù)的相關(guān)知識(shí),不但詳細(xì)介紹了hadoop、hdfs、yarn、mapreduce、hive、sqoop和hbase等,還深入探討了hadoop、hbase的運(yùn)維和性能調(diào)優(yōu),并包含了一個(gè)具有代表性的完整的基于hadoop的商業(yè)智能系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)。本書(shū)的大特點(diǎn)是面向?qū)嵺`;A(chǔ)篇介紹hadoop及相關(guān)組件的同時(shí),包含了大量動(dòng)手實(shí)例,而應(yīng)用篇包含的基于hadoop的完整實(shí)例脫胎于生產(chǎn)環(huán)境的真實(shí)項(xiàng)目。在應(yīng)用篇中,讀者不僅能夠通過(guò)項(xiàng)目實(shí)戰(zhàn)鞏固基礎(chǔ)篇的學(xué)習(xí)效果,還能學(xué)習(xí)商業(yè)智能系統(tǒng)的開(kāi)發(fā)過(guò)程。本書(shū)由淺至深,從理論基礎(chǔ)到項(xiàng)目實(shí)戰(zhàn),適合hadoop的初學(xué)者閱讀,也可以作為高等院校相關(guān)課程的教學(xué)參考書(shū)。本書(shū)主要內(nèi)容包含了hadoop新版本的幾乎所有主要特性,是hadoop目前成熟的形態(tài)。深入介紹了nosql架構(gòu)模式、hbase的架構(gòu)和實(shí)現(xiàn),以及hbase的高級(jí)特性。深入介紹了統(tǒng)一資源管理和調(diào)度平臺(tái)的范型和yarn實(shí)現(xiàn)。深入介紹了hadoop、hbase性能調(diào)優(yōu),滿(mǎn)足海量數(shù)據(jù)處理的需求。包含了一個(gè)完整的項(xiàng)目實(shí)戰(zhàn),從需求定義、系統(tǒng)設(shè)計(jì)和架構(gòu)后到代碼實(shí)現(xiàn)。包含了一個(gè)機(jī)器學(xué)習(xí)算法應(yīng)用實(shí)戰(zhàn),利用hadoop進(jìn)行大數(shù)據(jù)挖掘,從數(shù)據(jù)中尋找模式。
|