求真百科欢迎当事人提供第一手真实资料,洗刷冤屈,终结网路霸凌。

Elasticsearch权威指南查看源代码讨论查看历史

事实揭露 揭密真相
跳转至: 导航搜索

来自 孔夫子网 的图片

Elasticsearch权威指南》,赵建亭 著,出版社: 清华大学出版社。

清华大学出版社成立于1980年6月,是教育部主管、清华大学主办的综合性大学出版社[1]。清华社先后荣获 “先进高校出版社”“全国优秀出版社”“全国百佳图书出版单位”“中国版权最具影响力企业”“首届全国教材建设奖全国教材建设先进集体”等荣誉[2]

内容简介

基于elasticsearch7.x编写,全面、准确地讲解elasticsearch的安装、开发、技术原理、生产环境的性能调优等内容。适合有意从事搜索引起、大数据、商业智能等行业的入门人员学习参考,也是资深技术人员很好的一本参考书籍。

作者介绍

工学硕士、高级架构师、高级程序员(国家工信部认证)、江苏省级科研项目负责人(基于物联网的智能输液系统,编号BC2012071。在大数据平台、数据仓库、实时统计、可视化等大数据领域具有深度整合能力。

目录

第1章快速入门1

1.1基本概念1

1.2安装部署4

1.3开始使用集群6

1.3.1集群健康信息6

1.3.2列出集群中的索引信息7

1.3.3创建一个索引8

1.3.4索引和查询文档8

1.3.5删除索引9

1.4修改数据10

1.4.1索引和覆盖文档10

1.4.2更新文档11

1.4.3删除文档12

1.4.4批量操作12

1.5探索数据12

1.5.1加载数据集13

1.5.2搜索API13

1.5.3Elasticsearch查询语言15

1.5.4搜索文档17

1.5.5条件过滤21

1.5.6聚合查询22

第2章安装部署27

2.1安装JDK27

2.2安装Elasticsearch28

2.2.1调整Linux系统的相关参数

设置 28

2.2.2创建用户28

2.2.3下载Elasticsearch29

2.3配置Elasticsearch29目录Elasticsearch权威指南

2.3.1配置文件的位置30

2.3.2配置文件的格式30

2.3.3环境变量替换30

2.3.4设置JVM参数31

2.3.5安全设置31

2.3.6创建密钥库32

2.3.7列出密钥库中的设置项32

2.3.8添加字符串设置33

2.3.9添加文件设置33

2.3.10删除设置属性33

2.3.11可重载的安全设置33

2.3.12日志配置33

2.3.13配置日志级别35

2.3.14JSON日志格式37

2.4跨集群复制设置(用于多个集群间的数据恢复)37

2.4.1远程恢复设置37

2.4.2高级远程恢复设置37

2.4.3索引生命周期管理设置38

2.4.4序列号设置38

2.4.5监控功能设置38

2.4.6一般的监控设置38

2.4.7监控收集设置39

2.4.8本地导出器设置40

2.4.9HTTP导出器设置40

2.4.10XPack监控TLS/SSL相关设置42

2.4.11XPack监控TLS/SSL密钥和可信证书设置42

2.4.12PEM编码文件42

2.5重要的Elasticsearch配置43

2.5.1数据和日志存放目录43

2.5.2集群名称43

2.5.3节点名称44

2.5.4网络设置44

2.5.5重要节点发现和集群初始化设置44

2.5.6Heap设置45

2.5.7JVM heap dump目录设置46

2.5.8GC日志设置46

2.5.9临时文件存储目录46

2.5.10JVM致命错误日志设置47

2.6重要的系统参数设置47

2.6.1配置系统设置47

2.6.2禁用交换区48

2.6.3文件描述符49

2.6.4虚拟内存49

2.6.5线程数量限制50

2.6.6DNS缓存设置50

2.6.7JNA临时目录挂载位置50

2.7启动检查50

2.7.1Heap大小检查51

2.7.2文件描述符检查51

2.7.3内存锁定检查51

2.7.4线程数限制核查52

2.7.5最大文件大小检查52

2.7.6最大虚拟内存检查52

2.7.7最大mmap映射区域数量检查53

2.7.8JVM模式检查53

2.7.9JVM垃圾收集机制检查53

2.7.10系统调用过滤器检查53

2.7.11发现功能配置检查54

2.8启动和停止Elasticsearch54

2.9集群水平扩展54

第3章API规范56

3.1多索引56

3.2日期数学格式56

3.3通用选项58

3.3.1格式化搜索结果58

3.3.2可读输出58

3.3.3格式化日期值58

3.3.4返回信息过滤59

3.3.5展开设置63

3.3.6布尔值64

3.3.7数字值64

3.3.8时间单位64

3.3.9数据单位65

3.3.10缩略处理65

3.3.11距离单位65

3.3.12模糊性66

3.3.13启用堆栈跟踪66

3.3.14查询字符串中的请求正文67

3.3.15ContentType要求67

3.4基于URL的访问控制67

第4章操作文档69

4.1读写文档69

4.1.1基本写模型70

4.1.2写流程错误处理70

4.1.3基本读模型71

4.1.4读流程错误处理71

4.1.5一些简单的知识点72

4.2索引API72

4.2.1自动创建索引73

4.2.2ID自动生成74

4.2.3路由75

4.2.4分发75

4.2.5等待活动分片75

4.2.6detect_noop参数76

4.3GET API76

4.3.1实时性77

4.3.2字段选择77

4.3.3存储字段77

4.3.4直接获取_source 78

4.3.5路由78

4.3.6preference参数79

4.3.7refresh参数79

4.3.8分发79

4.3.9版本支持79

4.4删除API79

4.5查询删除80

4.5.1URL参数82

4.5.2返回体82

4.5.3任务API83

4.5.4取消任务API84

4.5.5动态调整API85

4.5.6切片85

4.6更新API87

4.6.1使用script更新88

4.6.2部分字段更新89

4.6.3避免无效更新89

4.6.4upsert元素90

4.6.5scripted_upsert参数91

4.6.6doc_as_upsert 参数92

4.7查询更新92

4.7.1URL参数95

4.7.2请求体95

4.7.3任务API96

4.7.4取消任务API96

4.7.5动态调整API96

4.7.6切片96

4.7.7获取新属性96

4.8MGet API98

4.8.1_source 过滤99

4.8.2存储字段100

4.8.3路由100

4.8.4重新索引101

4.9跨集群索引106

4.10批量操作API107

4.10.1路由110

4.10.2更新110

4.11Term向量111

4.11.1返回值111

4.11.2Term过滤112

4.11.3行为分析114

4.11.4获取多个文档的Term向量118

4.12refresh参数119

4.12.1如何选择refresh 的值120

4.12.2强制刷新120

4.13乐观并发控制121

第5章搜索数据123

5.1基本概念和机制123

5.2搜索API125

5.3URI模式125

5.4Body模式126

5.4.1Explain 参数128

5.4.2折叠结果131

5.4.3对结果分页133

5.4.4高亮结果133

5.4.5索引加权146

5.4.6命中文档嵌套146

5.4.7分数值过滤154

5.4.8查询命名154

5.4.9post_filter过滤155

5.4.10分片选择157

5.4.11重排序158

5.4.12脚本字段160

5.4.13滚动查询161

5.4.14search_after参数164

5.4.15搜索类型166

5.4.16排序166

5.4.17_source 字段过滤173

5.4.18存储字段174

5.4.19total返回值详解175

5.4.20版本176

5.5返回搜索分片信息177

5.6Count API177

5.7Validate API178

5.8调试搜索请求179

第6章聚合180

6.1度量值聚合180

6.1.1均值聚合181

6.1.2带权重的均值聚合183

6.1.3计数聚合185

6.1.4统计聚合187

6.1.5地理范围聚合188

6.1.6地理距离质心聚合189

6.1.7最大值聚合、最小值聚合、和值聚合192

6.1.8百分位数聚合192

6.1.9百分比排名聚合197

6.1.10脚本聚合198

6.1.11顶部命中聚合200

6.1.12单值度量聚合205

6.1.13中位数绝对偏差聚合206

6.2存储桶聚合207

6.2.1邻接矩阵聚合207

6.2.2区间聚合209

6.2.3日期区间聚合214

6.2.4IP区间聚合217

6.2.5Term聚合221

6.2.6直方图聚合227

6.2.7过滤器聚合231

6.2.8多过滤器聚合232

第7章查看API235

7.1查看子目录235

7.2应用实例及参数236

7.2.1v参数236

7.2.2help参数236

7.2.3h参数236

7.2.4常用接口汇总236

第8章集群 API238

8.1节点过滤238

8.2节点类型239

8.3常用API241

8.3.1查看集群及节点信息241

8.3.2动态更新集群设置242

8.3.3重置路由242

第9章索引 API244

9.1创建索引API244

9.1.1索引设置244

9.1.2映射245

9.1.3别名245

9.2删除索引246

9.3判断索引是否存在246

9.4打开关闭索引246

9.5收缩索引246

9.6映射247

9.6.1数据类型248

9.6.2映射属性设置253

第10章特定域查询语言(DSL)258

10.1查询和过滤上下文258

10.1.1查询上下文258

10.1.2过滤上下文258

10.2匹配所有文档259

10.3全文检索260

10.3.1匹配查询260

10.3.2模糊匹配260

10.3.3短语匹配查询261

10.3.4查询字符串261

第11章SQL接口265

11.1功能体验265

11.2术语和约定266

11.3SQL REST API267

11.3.1返回数据格式267

11.3.2过滤结果269

11.3.3支持的参数270

11.4SQL Translate API270

11.5SQL语法介绍271

11.5.1词法结构271

11.5.2SQL命令275

第12章Elasticsearch原理剖析283

12.1为什么需要搜索引擎283

12.2搜索引擎雏形283

12.3搜索引擎实现原理283

12.3.1分析284

12.3.2Lucene倒排索引284

12.3.3搜索过程284

12.3.4结果排序286

12.4分布式原理287

12.4.1分布式索引过程288

12.4.2分布式检索过程288

12.4.3分布式局部更新文档288

12.5节点发现和集群形成机制289

12.5.1集群形成过程289

12.5.2重要配置291

第13章Kibana入门介绍292

13.1安装Kibana292

13.1.1下载Kibana292

13.1.2简单配置Kibana292

13.1.3启动Kibana293

13.2基础操作293

13.2.1加载样例数据集293

13.2.2探索航班数据集294

13.2.3过滤数据295

13.2.4查询数据295

13.2.5探索数据296

13.2.6编辑可视化组件297

13.3构建Dashboard298

13.3.1导入样例数据298

13.3.2定义索引模式300

13.3.3可视化组件介绍302

13.3.4构建Dashboard302

第14章构建集约化日志管理平台305

14.1Elastic stack介绍305

14.2日志的特征305

14.2.1日志的重要性305

14.2.2日志的特征306

14.2.3日志的复杂性306

14.3集约化解决方案306

附录A参考资料及网址309

附录B中文分词算法介绍310附录CHead安装312

参考文献

  1. 我国出版社的等级划分和分类标准,知网出书,2021-03-01
  2. 企业简介,清华大学出版社有限公司