作品介紹

Python爬蟲技術(shù)

作者：李寧編整理日期：2021-11-18 17:00:32

本書從實戰(zhàn)角度系統(tǒng)講解Python爬蟲的核心知識點，并通過大量的真實項目讓讀者熟練掌握Python爬蟲技術(shù)。本書用20多個實戰(zhàn)案例，完美演繹了使用各種技術(shù)編寫Python爬蟲的方式，讀者可以任意組合這些技術(shù)，完成很好復(fù)雜的爬蟲應(yīng)用。全書共20章，分為5篇。篇基礎(chǔ)知識（、2章），主要包括Python運行環(huán)境的搭建、HTTP基礎(chǔ)、網(wǎng)頁基礎(chǔ)（HTML、CSS、java script等）、爬蟲的基本原理、Session與Cookie。第2篇網(wǎng)絡(luò)庫（第3～6章），主要包括網(wǎng)絡(luò)庫urllib、urllib3、requests和Twisted的核心使用方法，如發(fā)送HTTP請求、處理超時、設(shè)置HTTP請求頭、搭建和使用代理、解析鏈接、Robots協(xié)議等。第3篇解析庫（第7～10章），主要包括3個常用解析庫（lxml、BeautifulSoup和pyquery）的使用方法，同時介紹多種用于分析HTML代碼的技術(shù)，如正則表達(dá)式、XPath、CSS選擇器、方法選擇器等。第4篇數(shù)據(jù)存儲（1、12章），主要包括Python中數(shù)據(jù)存儲的解決方案，如文件存儲和數(shù)據(jù)庫存儲，其中數(shù)據(jù)庫存儲包括多種數(shù)據(jù)庫，如本地數(shù)據(jù)庫SQLite、網(wǎng)絡(luò)數(shù)據(jù)庫MySQL以及文檔數(shù)據(jù)庫MongoDB。第5篇爬蟲不錯應(yīng)用（3～20章），主要包括Python爬蟲的一些不錯技術(shù)，如抓取異步數(shù)據(jù)、Selenium、Splash、抓取移動App數(shù)據(jù)、Appium、多線程爬蟲、爬蟲框架Scrapy，很后給出一個綜合的實戰(zhàn)案例，綜合了Python爬蟲、數(shù)據(jù)存儲、PyQt5、多線程、數(shù)據(jù)可視化、Web等多種技術(shù)實現(xiàn)一個可視化爬蟲。本書可以作為廣大計算機軟件技術(shù)開發(fā)者、互聯(lián)網(wǎng)技術(shù)研究人員學(xué)習(xí)“爬蟲技術(shù)”的參考用書。也可以作為高等院校計算機科學(xué)與技術(shù)、軟件工程、人工智能等專業(yè)的教學(xué)參考用書。

→ Python爬蟲技術(shù)下載地址 ←

上一本：好詞好句好段名人名言諺語歇后語詞典

下一本：桂詩春學(xué)術(shù)研究文集

作家文集

☆ 豆豆作品集	☆ 林清玄作品集	☆ 江河作品集
☆ 李碧華作品集	☆ 林海音作品集	☆ 馬原作品集
☆ 高曉聲作品集	☆ 蔣子龍作品集	☆ 劉紹棠作品集
☆ 周立波作品集	☆ 亦舒作品集	☆ 閆紅作品集
☆ 祝勇作品集	☆ 周曉楓作品集	☆ 石一楓作品集
☆ 張廣天作品集	☆ 蔣藍(lán)作品集	☆ 李亞偉作品集
☆ 王小波作品集	☆ 木心作品集	☆ 魯迅作品集
☆ 葉圣陶作品集	☆ 張愛玲作品集	☆ 沈從文作品集
☆ 老舍作品集	☆ 巴金作品集	☆ 曹禺作品集
☆ 錢鐘書作品集	☆ 汪曾祺作品集	☆ 徐志摩作品集