Python网络爬虫技术查看源代码讨论查看历史

来自孔夫子网的图片

《Python网络爬虫技术》，江吉彬，张良均著，出版社：人民邮电出版社。

人民邮电出版社是全国优秀出版社、全国百佳图书出版单位。人民邮电出版社出版领域涵盖科技出版、教育出版、大众出版，涉及信息技术、通信、工业技术、科普^[1]、经济管理、摄影、艺术、运动与休闲、心理学、少儿、大中专教材等10余个出版门类，年出版图书^[2]近万种。

内容简介

本书以任务为导向，较为全面地介绍了不同场景下Python爬取网络数据的方法，包括静态网页、动态网页、登录后才能访问的网页、PC客户端、App等场景。全书共7章，第1章介绍了爬虫与反爬虫的基本概念，以及Python爬虫环境的配置，第2章介绍了爬取过程中涉及的网页前端基础，第3章介绍了在静态网页中爬取数据的过程，第4章介绍了在动态网页中爬取数据的过程，第5章介绍了对登录后才能访问的网页进行模拟登录的方法，第6章介绍了爬取PC客户端、App的数据的方法，第7章介绍了使用Scrapy爬虫框架爬取数据的过程。本书所有章节都包含了实训与课后习题，通过练习和操作实战，可帮助读者巩固所学的内容。

作者介绍

张良均，信息系统项目管理师，泰迪杯全国大学生数据挖掘竞赛（www.tipdm.org）发起人。华南师范大学、广东工业大学兼职教授，广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历，主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格（水平）考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数20余篇，已取得国家发明专利12项，主编《Hadoop大数据分析与挖掘实战》《Python数据分析与挖掘实战》《R语言数据分析与挖掘实战》等多本畅销图书，主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书，具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

参考文献

↑ 100部科普经典名著，豆瓣，2018-04-26
↑ 图书的演变历史资料，学习啦，2017-06-07

[1] 100部科普经典名著，豆瓣，2018-04-26

[2] 图书的演变历史资料，学习啦，2017-06-07

[1]

[2]

Python网络爬虫技术查看源代码讨论查看历史

目录

内容简介

作者介绍

参考文献