Python網絡爬蟲框架Scrapy從入門到精通檢視原始碼討論檢視歷史
《Python網絡爬蟲框架Scrapy從入門到精通》,張穎 著,出版社: 北京大學出版社。
北京大學出版社年出版新書約1000種,重印書2700餘種次,出版物已覆蓋人文科學、社會科學、自然科學[1]和工程技術各領域。現有產品中,大中專教材占35%,學術圖書占45%,一般圖書占20%。在文史哲、法學、經濟管理、學術普及、漢語教學等出版領域具有比較明顯的優勢和特色[2]。
內容簡介
本書從Python主流框架Scrapy的簡介及網絡爬蟲知識講起,逐步深入到Scrapy進階實戰。本書從實戰出發,根據不同需求,有針對性地講解了靜態網頁、動態網頁、App應用是如何爬取所需數據,以及Scrapy是如何部署分布式爬取,最後還介紹了用Scrapy + Pandas是如何進行數據分析及數據展示,讓讀者不但可以系統地學習Scrapy編程的相關知識,而且還能對Scrapy應用開發有更為深入的理解。
本書分為12章,涵蓋的主要內容有Scrapy框架簡介;Scrapy網絡爬蟲知識介紹;Scrapy開發環境的搭建;Scrapy架構及編程;Scrapy進階;實戰項目:Scrapy靜態網頁的爬取;實戰項目:Scrapy動態網頁的爬取;實戰項目:Scrapy爬取App應用數據;Scrapy的分布式部署與爬取;分布式的實戰項目;用Selenium框架測試網站;用Scrapy + Pandas進行數據分析。
本書內容通俗易懂,實例典型,實用性強,特別適合學習Python主流框架Scrapy的入門讀者和進階讀者閱讀,也適合數據分析與挖掘技術的初學者閱讀,還適合相關培訓機構的師生閱讀。
參考文獻
- ↑ 第十講科學學派_圖文,豆丁網,2016-10-18
- ↑ 規模現狀,北京大學出版社