Spark3·x大數據分析實戰檢視原始碼討論檢視歷史
《Spark3·x大數據分析實戰》,張偉洋 著,出版社: 清華大學出版社。
清華大學出版社成立於1980年6月,是教育部主管、清華大學主辦的綜合性大學出版社[1]。清華社現年出版圖書、音像製品、電子出版物等近3000種,銷售規模和綜合實力以及在高等教育教材市場、科技圖書市場、館配圖書市場占有率均名列前茅[2]。
內容簡介
本書基於Spark 3.2.x版本,從Spark核心編程語言Scala講起,涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章,第1章講解了Scala語言的基礎知識,包括IDEA工具的使用等;第2章講解了Spark的主要組件、集群架構原理、集群環境搭建以及Spark應用程序的提交和運行;第3~9章講解了離線計算框架Spark RDD、Spark SQL和實時計算框架Kafka、Spark Streaming、Structured Streaming以及圖計算框架GraphX等的基礎知識、架構原理,同時包括常用Shell命令、API操作、內核源碼剖析,並通過多個實際案例講解各個框架的具體應用以及與Hadoop生態系統框架Hive、HBase、Kafka的整合操作。
本書通俗易懂,案例豐富,注重實操,適合Spark新手和大數據開發人員閱讀,也可作為培訓機構和高校大數據及相關專業的教學用書。
作者介紹
張偉洋,大數據領域資深專家,擁有多年互聯網公司軟件研發經驗,曾在互聯網旅遊公司擔任軟件研發事業部經理。先後多次為中國海洋大學、曲阜師範大學、青島理工大學等高校舉行大數據專題講座,對Hadoop及周邊大數據框架ZooKeeper、Hive、HBase、Storm、Spark、Flink等有深入的研究,公眾號「奮鬥在IT」 的創辦人。已出版《Hadoop大數據技術開發實戰》《Flink大數據分析實戰》等圖書。
參考文獻
- ↑ 我國出版社的等級劃分和分類標準,知網出書,2021-03-01
- ↑ 企業簡介,清華大學出版社有限公司