Spark3·x大數據分析實戰

來自孔夫子網的圖片

《Spark3·x大數據分析實戰》，張偉洋著，出版社：清華大學出版社。

清華大學出版社成立於1980年6月，是教育部主管、清華大學主辦的綜合性大學出版社^[1]。清華社現年出版圖書、音像製品、電子出版物等近3000種，銷售規模和綜合實力以及在高等教育教材市場、科技圖書市場、館配圖書市場占有率均名列前茅^[2]。

內容簡介

本書基於Spark 3.2.x版本，從Spark核心編程語言Scala講起，涵蓋了當前整個Spark生態系統主流的大數據開發技術。全書共9章，第1章講解了Scala語言的基礎知識，包括IDEA工具的使用等；第2章講解了Spark的主要組件、集群架構原理、集群環境搭建以及Spark應用程序的提交和運行；第3～9章講解了離線計算框架Spark RDD、Spark SQL和實時計算框架Kafka、Spark Streaming、Structured Streaming以及圖計算框架GraphX等的基礎知識、架構原理，同時包括常用Shell命令、API操作、內核源碼剖析，並通過多個實際案例講解各個框架的具體應用以及與Hadoop生態系統框架Hive、HBase、Kafka的整合操作。

本書通俗易懂，案例豐富，注重實操，適合Spark新手和大數據開發人員閱讀，也可作為培訓機構和高校大數據及相關專業的教學用書。

作者介紹

張偉洋，大數據領域資深專家，擁有多年互聯網公司軟件研發經驗，曾在互聯網旅遊公司擔任軟件研發事業部經理。先後多次為中國海洋大學、曲阜師範大學、青島理工大學等高校舉行大數據專題講座，對Hadoop及周邊大數據框架ZooKeeper、Hive、HBase、Storm、Spark、Flink等有深入的研究，公眾號「奮鬥在IT」的創辦人。已出版《Hadoop大數據技術開發實戰》《Flink大數據分析實戰》等圖書。

參考文獻

移至 ↑ 我國出版社的等級劃分和分類標準，知網出書，2021-03-01
移至 ↑ 企業簡介，清華大學出版社有限公司

[1] 移至 ↑ 我國出版社的等級劃分和分類標準，知網出書，2021-03-01

[2] 移至 ↑ 企業簡介，清華大學出版社有限公司

[1]

[2]

Spark3·x大數據分析實戰

目錄

內容簡介

作者介紹

參考文獻