本書從基本的爬蟲原理開始講解,通過介紹Pthyon編程語言與HTML基礎(chǔ)知識引領(lǐng)讀者入門,之后根據(jù)當(dāng)前風(fēng)起云涌的云計算、大數(shù)據(jù)熱潮,重點講述了云計算的相關(guān)內(nèi)容及其在爬蟲中的應(yīng)用,進而介紹如何設(shè)計自己的爬蟲應(yīng)用。主要內(nèi)容分為基礎(chǔ)篇、中級篇、深入篇,基礎(chǔ)篇包括Python編程基礎(chǔ)、Web前端基礎(chǔ)、HTML基礎(chǔ)知識、基礎(chǔ)爬蟲設(shè)計、強化爬蟲技術(shù)等。中級篇包括數(shù)據(jù)存儲、動態(tài)網(wǎng)站抓取、協(xié)議分析、Scrapy爬蟲框架分析及實戰(zhàn)案例等。高級篇包括增量式爬蟲、分布式爬蟲、人性化爬蟲等框架設(shè)計。
|