開啟主選單

求真百科

Python數據分析與大數據處理從入門到精通

來自 孔夫子網 的圖片

Python數據分析與大數據處理從入門到精通》,朱春旭 著,出版社: 北京大學出版社。

北京大學出版社年出版新書約1000種,重印書2700餘種次,出版物已覆蓋人文科學社會科學、自然科學[1]和工程技術各領域。現有產品中,大中專教材占35%,學術圖書占45%,一般圖書占20%。在文史哲、法學、經濟管理、學術普及、漢語教學等出版領域具有比較明顯的優勢和特色[2]

目錄

內容簡介

《Python數據分析與大數據處理從入門到精通》主要講解數據分析與大數據處理所需的技術、基礎設施、核心概念、實施流程。從編程語言準備、數據採集與清洗、數據分析與可視化,到大型數據的分布式存儲與分布式計算,貫穿了整個大數據項目開發流程。本書輕理論、重實踐,目的是讓讀者快速上手。1篇首先介紹了Python的基本語法、面向對象開發、模塊化設計等,掌握Python的編程方式。然後介紹了多線程、多進程及其相互間的通信,讓讀者對分布式程序有個基本的認識。第2篇介紹了網絡數據採集、數據清洗、數據存儲等技術。第3篇介紹了Python常用的數據分析工具,擴展了更多的數據清洗、插值方法,為最終的數據可視化奠定基礎。第4篇是大數據分析的重點。首先介紹了Hadoop的框架原理、調度原理,MapReduce原理與編程模型、環境搭建,接着介紹了Spark框架原理、環境搭建方式,以及如何與Hive等第三方工具進行交互,還介紹了新的結構化流式處理技術。第5篇通過三個項目實例,綜合介紹了如何分析網頁、如何搭建分布式爬蟲、如何應對常見的反爬蟲、如何設計數據模型、如何設計架構模型、如何在實踐中綜合運用前四篇涉及的技術。本書既適合非計算機專業的編程「小白」,也適合剛畢業或即將畢業走向工作崗位的廣大畢業生,以及已經有編程經驗,但想轉行做大數據分析的專業人士。同時,還可以作為廣大職業院校、電腦培訓班的教學參考用書。

作者介紹

朱春旭,高級軟件工程師,長期對企業、軟件開發公司、政府機構培訓大數據開發與應用課程,對Python大數據處理與分析相關應用有深入研究,並編寫有《極客內參-大數據開發實戰》教程45篇,總共30000+字。

參考文獻

  1. 第十講科學學派_圖文,豆丁網,2016-10-18
  2. 規模現狀,北京大學出版社