HadoopSpark大数据技术查看源代码讨论查看历史

来自孔夫子网的图片

《HadoopSpark大数据技术》，刘彬斌，李柏章，周磊，李永富著，出版社：清华大学出版社。

清华大学出版社成立于1980年6月，是教育部主管、清华大学主办的综合性大学出版社^[1]。清华社先后荣获 “先进高校出版社”“全国优秀出版社”“全国百佳图书出版单位”“中国版权最具影响力企业”“首届全国教材建设奖全国教材建设先进集体”等荣誉^[2]。

内容简介

全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。其中，Linux是学习大数据技术的基础，先从Linux入手，打下坚实的基础，之后才能更好地学习Hadoop和Spark。4部分内容分别介绍如下。大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作，为以后编程奠定坚实的基础。 Hadoop技术篇以Hadoop生态圈为中心，详细介绍Hadoop高可用集群搭建、HDFS技术、MapReduce技术、Hive技术，为读者学习大数据开发技术提供便利，并以实用的方式简单介绍HBase、Sqoop、Flume工具的使用，使读者在精通一门技术的前提下，能扩展了解相关知识，真正成为一专多能的专业型人才。 Spark技术篇从Spark概述、Scala语言、环境搭建、RDD核心技术、Spark SQL和机器学习等多方面讲解Spark大数据的开发，从基础的Scala语言开始学习，并以Hadoop环境为基础搭建Spark大数据集群，从很基础、很常用、很容易理解的思路出发，帮助读者逐步掌握Spark大数据技术。项目实战篇从真实项目“电力能源大数据分析”中抽取一部分业务作为实战解读，通过简洁的流程讲解，使读者了解大数据项目开发的整个过程。

参考文献

↑ 我国出版社的等级划分和分类标准，知网出书，2021-03-01
↑ 企业简介，清华大学出版社有限公司

[1] 我国出版社的等级划分和分类标准，知网出书，2021-03-01

[2] 企业简介，清华大学出版社有限公司

[1]

[2]

HadoopSpark大数据技术查看源代码讨论查看历史

目录

内容简介

参考文献