Python數據分析實戰
![]() |
《Python數據分析實戰》,沈桂蘭 編,出版社: 清華大學出版社。
清華大學出版社成立於1980年6月,是教育部主管、清華大學主辦的綜合性大學出版社[1]。清華社先後榮獲 「先進高校出版社」「全國優秀出版社」「全國百佳圖書出版單位」「中國版權最具影響力企業」「首屆全國教材建設獎全國教材建設先進集體」等榮譽[2]。
目錄
內容簡介
本書全面介紹使用Python進行數據獲取、數據處理和分析、數據可視化以及文本分析的相關內容,旨在幫助讀者理解與掌握數據分析全流程的相關知識和技能。全書按照「理論+方法+示例+實戰」的設計思路,既注重知識系統性,又注重應用實戰性。
全書共分為8章,包括Python數據分析概述、Python爬蟲基礎、Python爬蟲實戰、pandas和numpy基礎、Python數據表分析、可視化分析、數據分析實戰和文本數據分析。
本書可作為高等院校各專業數據分析相關課程的教材,也可作為企業電子商務、市場營銷、數據分析人員的參考資料。
目錄
第1章Python數據分析概述
1.1什麼是數據分析
1.1.1數據分析的重要性
1.1.2數據分析的內容
1.2數據分析的基本流程
1.3數據分析的常用工具
1.4數據分析的常用類庫
1.5數據分析的開發環境
1.5.1Anaconda的下載和安裝
1.5.2Jupyter Notebook的使用
1.5.3Spyder的使用
本章小結
習題1
第2章Python爬蟲基礎
2.1認識爬蟲
2.1.1爬蟲的概念
2.1.2爬蟲的原理與類型
2.1.3爬蟲的合法性和robots協議
2.2爬蟲的組成及反爬蟲措施
2.2.1網絡爬蟲的組成
2.2.2網站反爬蟲策略
2.2.3爬取策略的制定
2.3模擬請求爬取數據
2.3.1Chrome開發者工具
2.3.2認識HTTP
2.3.3認識requests庫
2.4解析數據
2.4.1網頁的組成
2.4.2BeautifulSoup庫
2.4.3文檔樹的遍歷
2.4.4文檔樹的搜索
2.4.5CSS選擇器查找
本章小結
習題2
第3章Python爬蟲實戰
3.1實戰: 中國A股上市公司相關數據的獲取
3.1.1目標網站分析
3.1.2表格數據的爬取和解析
3.1.3模塊化程序的編寫
3.2解析數據的存取
3.2.1文本文件的存取
3.2.2CSV文件的存取
3.2.3JSON文件的存取
3.3實戰: 豆瓣讀書Top250的數據的獲取
3.3.1目標網站分析
3.3.2半結構化數據的爬取、解析和存儲
3.3.3模塊化程序的編寫
3.4正則表達式
3.4.1正則表達式基礎
3.4.2正則表達式的用法
3.4.3用正則表達式提取豆瓣讀書排行榜網頁數據的實戰案例
3.5實戰: 人民網科技類新聞的獲取
3.5.1目標網站分析
3.5.2科技新聞列表的獲取與存儲
3.5.3新聞的獲取與存儲
本章小結
習題3
第4章pandas和numpy基礎
4.1pandas及其數據結構
4.1.1Series數據結構及其創建
4.1.2DataFrame數據結構及其創建
4.2使用pandas導入和導出數據
4.2.1導入外部數據
4.2.2導出外部數據
4.3numpy及其數據結構
4.3.1使用numpy創建數組對象
4.3.2ndarray類的常用屬性及基本操作
本章小結
習題4
第5章Python數據表分析
5.1數據概覽及預處理
5.1.1數據概覽分析
5.1.2數據清洗
5.1.3數據的抽取與合併
5.1.4數據的增、刪、改
5.1.5數據轉換
5.2數據的描述性統計分析
5.2.1數據排序和排名
5.2.2常見的數據計算方法
5.3分組統計
5.3.1數據分組
5.3.2分組聚合
5.4實戰: 豆瓣讀書Top250的數據表分析
5.4.1數據預處理
5.4.2數據分析
本章小結
習題5
第6章可視化分析
6.1可視化分析概述
6.1.1圖表類型及選擇
6.1.2圖表的基本組成
6.2圖表的常用設置
6.2.1基本plot繪圖函數
6.2.2圖的屬性設置
6.2.3圖的類型設置
6.2.4其他設置
6.3圖表的繪製
6.3.1折線圖的繪製
6.3.2柱形圖的繪製
6.3.3直方圖的繪製
6.3.4餅形圖的繪製
6.3.5散點圖的繪製
6.3.6雷達圖的繪製
6.4實戰: 豆瓣讀書Top250的可視化分析
6.4.1豆瓣讀書排行榜的評分值分析
6.4.2評分值Top5排行榜分析
6.4.3出版社Top10占比分析
6.4.4Top100圖書的價格分布
本章小結
習題6
第7章數據分析實戰
7.1對比分析及實戰案例
7.1.1對比分析
7.1.2對比分析實戰案例
7.2趨勢分析及實戰案例
7.2.1趨勢分析概述
7.2.2同比分析實戰案例
7.2.3定比分析實戰案例
7.2.4環比分析實戰案例
7.3差異化分析及實戰案例
7.3.1差異化分析概述
7.3.2差異化分析實戰案例
7.4相關性分析及實戰案例
7.4.1相關性分析概述
7.4.2相關性分析實戰案例
本章小結
習題7
第8章文本數據分析
8.1文本數據預處理
8.1.1去噪聲
8.1.2中文分詞和添加用戶詞典
8.1.3去停用詞
8.1.4構建詞向量
8.2文本數據分析方法
8.2.1高頻詞分析
8.2.2關鍵詞分析
8.2.3詞性分布分析
8.3生成詞雲圖
8.4實戰: 攜程網酒店評論文本數據分析
本章小結
習題8
參考文獻
- ↑ 國家對出版社等級是怎樣評估的 ,搜狐,2024-07-06
- ↑ 企業簡介,清華大學出版社有限公司