Python網絡爬蟲技術檢視原始碼討論檢視歷史
《Python網絡爬蟲技術》,江吉彬,張良均 著,出版社: 人民郵電出版社。
人民郵電出版社是全國優秀出版社、全國百佳圖書出版單位。人民郵電出版社出版領域涵蓋科技出版、教育出版、大眾出版,涉及信息技術、通信、工業技術、科普[1]、經濟管理、攝影、藝術、運動與休閒、心理學、少兒、大中專教材等10餘個出版門類,年出版圖書[2]近萬種。
內容簡介
本書以任務為導向,較為全面地介紹了不同場景下Python爬取網絡數據的方法,包括靜態網頁、動態網頁、登錄後才能訪問的網頁、PC客戶端、App等場景。全書共7章,第1章介紹了爬蟲與反爬蟲的基本概念,以及Python爬蟲環境的配置,第2章介紹了爬取過程中涉及的網頁前端基礎,第3章介紹了在靜態網頁中爬取數據的過程,第4章介紹了在動態網頁中爬取數據的過程,第5章介紹了對登錄後才能訪問的網頁進行模擬登錄的方法,第6章介紹了爬取PC客戶端、App的數據的方法,第7章介紹了使用Scrapy爬蟲框架爬取數據的過程。本書所有章節都包含了實訓與課後習題,通過練習和操作實戰,可幫助讀者鞏固所學的內容。
作者介紹
張良均,信息系統項目管理師,泰迪杯全國大學生數據挖掘競賽(www.tipdm.org)發起人。華南師範大學、廣東工業大學兼職教授,廣東省工業與應用數學學會理事。兼有大型高科技企業和高校的工作經歷,主要從事大數據挖掘及其應用的策劃、研發及諮詢培訓。全國計算機技術與軟件專業技術資格(水平)考試繼續教育和CDA數據分析師培訓講師。發表數據挖掘相關論文數20餘篇,已取得國家發明專利12項,主編《Hadoop大數據分析與挖掘實戰》《Python數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等多本暢銷圖書,主持並完成科技項目9項。獲得SAS、SPSS數據挖掘認證及Hadoop開發工程師證書,具有電力、電信、銀行、製造企業、電子商務和電子政務的項目經驗和行業背景。
參考文獻
- ↑ 100部科普經典名著,豆瓣,2018-04-26
- ↑ 圖書的演變歷史資料,學習啦,2017-06-07