绿色记忆 » BigData

ElasticSearch学习笔记

Alex — Tue, 09 Jan 2018 16:14:56 +0000

简介

Elasticsearch是一个基于Apache Lucene的全文检索和分析引擎，可以扩容到上百台服务器，处理PB级结构化/非结构化数据。

ES的应用场景举例：

支持在线搜索、自动完成（搜索建议）功能
作为ELK栈的一部分，收集、聚合、分析日志/事务数据
海量数据的即席分析

Elasticsearch 尽可能地屏蔽了分布式系统的复杂性，它在后台自动执行的操作包括：

分配文档到不同的容器或分片中，文档可以储存在一个或多个节点中
按集群节点来均衡分配这些分片，从而对索引和搜索过程进行负载均衡
复制每个分片以支持数据冗余，从而防止硬件故障导致的数据丢失
将集群中任一节点的请求路由到存有相关数据的节点
集群扩容时无缝整合新节点，重新分配分片以便从离群节点恢复

ES是一个准实时（Near Realtime）的搜索平台，从你开始索引一个文档，到该文档可以被搜索，有个较小的延迟，通常秒级。

安装

Ubuntu

唯一的依赖是JDK，请预先安装好JDK8（建议1.8.0_131+），然后：

wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.2.3.tar.gz
tar xzf elasticsearch-6.2.3.tar.gz
mv elasticsearch-6.2.3 6.2.3

# 启动ES，-d以守护进程方式运行，默认端口9200
./elasticsearch -d
# 指定集群和节点名称
./elasticsearch -Ecluster.name=es.gmem.cc -Enode.name=es-10.gmem.cc

# 停止ES
kill -SIGTERM $ES_PID

所有节点、客户端都应该使用一样的JDK版本。

Docker

ES的Docker镜像基于CentOS:7。相关镜像的列表参考：https://www.docker.elastic.co/。

镜像分为三种风格：basic包含基本的X-Pack特性，自动激活免费License；platinum包含全部X-Pack特性，默认30天试用；oss不支持X-Pack，仅仅包含ES。

执行下面的命令拉取镜像：

docker pull docker.elastic.co/elasticsearch/elasticsearch:6.2.3
docker pull docker.elastic.co/elasticsearch/elasticsearch-platinum:6.2.3
docker pull docker.elastic.co/elasticsearch/elasticsearch-oss:6.2.3

开发环境

参考如下命令部署容器：

docker run -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" docker.elastic.co/elasticsearch/elasticsearch:6.2.3

生产环境

内核参数vm.max_map_count至少要增大到262144：

sysctl -w vm.max_map_count=262144

Kubernetes

参考kubernetes-elasticsearch-cluster搭建集群。注意点：

ES的Pod需要超级用户权限运行init容器，避免设置某些VM选项。因此你需要以--allow-privileged选项运行kubelet
ES_JAVA_OPTS的默认值为-Xms256m -Xmx256m，非常小。你可以按需调整
数据节点Pod默认在一个emptyDir中存储数据，请根据实际情况修改
PROCESSORS的默认值为1，如果需要调整，请设置resources.limits.cpu、livenessProbe
支持1.9.3+版本的K8S

从下面的仓库下载K8S资源定义文件：

git clone https://github.com/pires/kubernetes-elasticsearch-cluster.git es
cd es

准备镜像

docker pull quay.io/pires/docker-elasticsearch-kubernetes:6.2.2_1
docker tag quay.io/pires/docker-elasticsearch-kubernetes:6.2.2_1 docker.gmem.cc/elasticsearch-kubernetes:6.2.2
docker push docker.gmem.cc/elasticsearch-kubernetes:6.2.2

docker pull busybox:1.27.2
docker tag busybox:1.27.2 docker.gmem.cc/busybox:1.27.2
docker push docker.gmem.cc/busybox:1.27.2

部署

# Master节点服务
kubectl create -f es-discovery-svc.yaml
# Data节点服务
kubectl create -f es-svc.yaml
# Master节点的Deployment，默认3个Replica，init容器调用sysctl
kubectl create -f es-master.yaml
# 等待所有Master节点就绪
kubectl -n dev rollout status -f es-master.yaml
# Client节点的Deployment，默认2个Replica，init容器调用sysctl
kubectl create -f es-client.yaml
# 等待所有Client节点就绪
kubectl rollout status -f es-client.yaml

# 数据节点，使用本地目录
kubectl create -f es-data.yaml
kubectl rollout status -f es-data.yaml

# 基于SS的数据节点（推荐）
kubectl create -f stateful/es-data-svc.yaml
kubectl create -f stateful/es-data-stateful.yaml

资源规格定义如下：

apiVersion: v1
kind: Service
metadata:
  name: elasticsearch-discovery
  namespace: dev
  labels:
    component: elasticsearch
    role: master
spec:
  selector:
    component: elasticsearch
    role: master
  ports:
  - name: transport
    port: 9300
    protocol: TCP

apiVersion: v1
kind: Service
metadata:
  name: elasticsearch
  namespace: dev
  labels:
    component: elasticsearch
    role: client
spec:
  selector:
    component: elasticsearch
    role: client
  ports:
  - name: http
    port: 9200

apiVersion: apps/v1beta1
kind: Deployment
metadata:
  name: es-master
  namespace: dev
  labels:
    component: elasticsearch
    role: master
spec:
  replicas: 3
  template:
    metadata:
      labels:
        component: elasticsearch
        role: master
    spec:
      initContainers:
      - name: init-sysctl
        image: docker.gmem.cc/busybox:1.27.2
        command:
        - sysctl
        - -w
        - vm.max_map_count=262144
        securityContext:
          privileged: true
      containers:
      - name: es-master
        image: docker.gmem.cc/elasticsearch-kubernetes:6.2.2
        env:
        - name: NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        - name: NODE_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: CLUSTER_NAME
          value: gmemes
        - name: NUMBER_OF_MASTERS
          value: "2"
        - name: NODE_MASTER
          value: "true"
        - name: NODE_INGEST
          value: "false"
        - name: NODE_DATA
          value: "false"
        - name: HTTP_ENABLE
          value: "false"
        - name: ES_JAVA_OPTS
          # ES要求堆最大最小值一样
          value: -Xms256m -Xmx256m
        - name: PROCESSORS
          valueFrom:
            resourceFieldRef:
              resource: limits.cpu
        resources:
          limits:
            cpu: 1
        ports:
        - containerPort: 9300
          name: transport
        livenessProbe:
          tcpSocket:
            port: transport
        volumeMounts:
        - name: storage
          mountPath: /data
      volumes:
          # Pod第一次调度到节点上创建一个空白目录，除非重新调度到其它节点，不会重新创建
          - emptyDir:
              medium: ""
            name: "storage"

apiVersion: apps/v1beta1
kind: Deployment
metadata:
  name: es-client
  namespace: dev
  labels:
    component: elasticsearch
    role: client
spec:
  replicas: 2
  template:
    metadata:
      labels:
        component: elasticsearch
        role: client
    spec:
      initContainers:
      - name: init-sysctl
        image: docker.gmem.cc/busybox:1.27.2
        command:
        - sysctl
        - -w
        - vm.max_map_count=262144
        securityContext:
          privileged: true
      containers:
      - name: es-client
        image: docker.gmem.cc/elasticsearch-kubernetes:6.2.2
        env:
        - name: NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        - name: NODE_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: CLUSTER_NAME
          value: gmemes
        - name: NODE_MASTER
          value: "false"
        - name: NODE_DATA
          value: "false"
        - name: HTTP_ENABLE
          value: "true"
        - name: ES_JAVA_OPTS
          value: -Xms256m -Xmx256m
        - name: NETWORK_HOST
          value: _site_,_lo_
        - name: PROCESSORS
          valueFrom:
            resourceFieldRef:
              resource: limits.cpu
        resources:
          limits:
            cpu: 1
        ports:
        - containerPort: 9200
          name: http
        - containerPort: 9300
          name: transport
        livenessProbe:
          tcpSocket:
            port: transport
        readinessProbe:
          httpGet:
            path: /_cluster/health
            port: http
          initialDelaySeconds: 20
          timeoutSeconds: 5
        volumeMounts:
        - name: storage
          mountPath: /data
      volumes:
          - emptyDir:
              medium: ""
            name: storage

apiVersion: v1
kind: Service
metadata:
  name: elasticsearch-data
  namespace: dev
  labels:
    component: elasticsearch
    role: data
spec:
  ports:
  - port: 9300
    name: transport
  clusterIP: None
  selector:
    component: elasticsearch
    role: data

apiVersion: apps/v1beta1
kind: StatefulSet
metadata:
  name: es-data
  namespace: dev
  labels:
    component: elasticsearch
    role: data
spec:
  serviceName: elasticsearch-data
  replicas: 5
  template:
    metadata:
      labels:
        component: elasticsearch
        role: data
    spec:
      affinity:
        podAntiAffinity:
          # 不得存在role=data的其它pod
          preferredDuringSchedulingIgnoredDuringExecution:
          - weight: 100
            podAffinityTerm:
              labelSelector:
                matchExpressions:
                - key: role
                  operator: In
                  values:
                  - data
              # 当前节点上
              topologyKey: kubernetes.io/hostname
      initContainers:
      - name: init-sysctl
        image: docker.gmem.cc/busybox:1.27.2
        command:
        - sysctl
        - -w
        - vm.max_map_count=262144
        securityContext:
          privileged: true
      containers:
      - name: es-data
        image: docker.gmem.cc/elasticsearch-kubernetes:6.2.2
        env:
        - name: NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        - name: NODE_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: CLUSTER_NAME
          value: gmemes
        - name: NODE_MASTER
          value: "false"
        - name: NODE_INGEST
          value: "false"
        - name: HTTP_ENABLE
          value: "false"
        - name: ES_JAVA_OPTS
          value: -Xms256m -Xmx256m
        - name: PROCESSORS
          valueFrom:
            resourceFieldRef:
              resource: limits.cpu
        resources:
          limits:
            cpu: 1
        ports:
        - containerPort: 9300
          name: transport
        livenessProbe:
          tcpSocket:
            port: transport
          initialDelaySeconds: 20
          periodSeconds: 10
        volumeMounts:
        - name: es-data-pvc
          mountPath: /data
  volumeClaimTemplates:
  - metadata:
      name: es-data-pvc
      namespace: dev
    spec:
      storageClassName: rook-block
      accessModes: [ ReadWriteOnce ]
      resources:
        requests:
          storage: 4Gi

Helm

helm repo add gmem https://chartmuseum.gmem.cc
helm install --name=es --namespace=kube-system gmem/elasticsearch 

# 检查集群健康状态
curl http://es-elasticsearch.kube-system.svc.k8s.gmem.cc:9200/_cat/health?v

基本概念

集群

一系列节点的集合，它们在整体上持有完整的数据集，提供联合的索引（Federated indexing），并在整体上对外提供搜索功能。

每个集群以名字来识别，默认名字elasticsearch，每个节点只能属于单个集群。如果部署多套集群，注意确保集群名字不重复。

节点

节点是集群中的单个服务器。节点的唯一标识也是名称，默认是节点启动时随机生成的UUID。

主节点

当一个节点被选举成为主节点时，它将负责管理集群范围内的所有变更，例如增加、删除索引，或者增加、删除节点等。而主节点并不需要涉及到文档级别的变更和搜索等操作，所以当集群只拥有一个主节点的情况下，即使流量的增加它也不会成为瓶颈。任何节点都可以成为主节点。

用户可以将请求发送到集群中的任何节点，包括主节点。每个节点都知道任意文档所处的位置，并且能够将请求直接转发到存储所需文档的节点。

索引

索引是一系列具有相近特性的文档的集合。例如客户数据可以对应一个索引，商品目录可以对应另一个索引。ES中的索引类似于RDBMS中的表。索引的唯一标识是名称，名称必须全小写。

当索引作为动词使用时，表示将一个文档存储到索引（名词）中，是其支持全文检索的过程。

映射

Mapping用于描述数据的每个字段如何存储。ES自动生成一个_all字段，其类型为字符串，属于全文字段。ES会根据文档内容进行猜测，动态产生一个映射。

简单类型

Elasticsearch 支持如下简单域类型：

字符串：string
整数：byte, short, integer, long
浮点数：float, double
布尔型：boolean
日期：date

当你索引一个包含新字段的文档时，ES自动进行动态映射。JSON类型到上述类型的转换比较直白，除了要注意2018-04-03这样的字符串会被自动解析为date类型。

复杂类型

除了上述的简单标量类型外，JSON中的null、数组、对象，都是被ES支持的。

空字段不会被索引，包括：null、null、[ null ]

Lucene不理解嵌套对象，Lucene文档由一组键值对的列表构成。为了支持复杂类型的处理，ES必须对文档进行扁平化。

多值域以数组形式表示，数组的元素类型必须相同。尽管提取文档时，数组元素顺序不会丢失，但是索引是以无序的多值域形式进行的：

{
    "followers": [
        { "age": 35, "name": "Mary White"},
        { "age": 26, "name": "Alex Jones"},
        { "age": 19, "name": "Lisa Smith"}
    ]
}
# 被扁平化为
{
    # 扁平化后，age和name之间的关系丢失
    # 如果要查询是否有名为alex的26岁的follower，需要使用嵌套对象
    "followers.age":    [19, 26, 35],
    "followers.name":   [alex, jones, lisa, smith, mary, white]
}

类似的，为了让ES有效的索引嵌套对象，同样需要扁平化：

{
    "tweet":            [elasticsearch, flexible, very],
    "user.id":          [@johnsmith],
    "user.gender":      [male]
}

分析

Analysis是处理全文字段，使其可以被搜索的过程。分析包含下面的步骤：

首先，将一块文本分成适合于倒排索引的独立的词条
之后，将这些词条统一化为标准格式以提高它们的“可搜索性”

分析器

分析器负责执行上面的工作。分析器实际上是将三个功能封装到了一个包里：

字符过滤器：首先，字符串按顺序通过每个字符过滤器。他们的任务是在分词前整理字符串。一个字符过滤器可以用来去掉HTML，或者将 & 转化成and
分词器：其次，字符串被分词器分为单个的词条。一个简单的分词器遇到空格和标点的时候，可能会将文本拆分成词条
Token过滤器：最后，词条按顺序通过每个Token过滤器。这个过程可能会：
1. 改变词条，例如小写化
2. 删除词条，例如像 a， and， the这样的无用词
3. 增加词条，例如像 jump 和 leap 这种同义词

ES提供了开箱即用的字符过滤器、分词器、Token过滤器，它们可以自由的组合成分析器，满足不同应用场景。

分词器（Tokenizer）决定“从哪里切开”，分析器（Analyzer）决定“切开之后再做什么”。如果把全文检索看成一条流水线，那么字符过滤器负责预清洗，分词器负责切边界，Token 过滤器负责归一化、删词、扩词与词干化，分析器只是把这三层组件串成一个可复用名字。

分词器

分词器是分析链中唯一负责“切 token 边界”的组件。它把原始字符串切成词项序列，但通常不负责小写化、停用词过滤、同义词扩展或词干提取；这些操作通常由后续 Token 过滤器完成。

分词器	切分规则	典型用途
standard	按 Unicode 文本分词规则切分	通用全文检索默认选择，适合多数自然语言文本。
letter	按非字母字符切分	纯字母文本或规则较简单的英文内容。
lowercase	按非字母字符切分，并把 token 转成小写	英文等大小写噪声明显、又不需要复杂规则的文本。
classic	按传统英文文档规则切分	偏旧式英文文本或希望保留经典 Lucene 行为时使用。
whitespace	仅按空白字符切分	日志、命令行、格式较规整的文本。
keyword	完全不切分，整串文本作为一个 token	ID、完整路径、完整邮箱、状态码等精确值场景。
pattern	按正则表达式切分	邮件地址、分号分隔值、业务格式化字符串。
uax_url_email	按 UAX 规则切分，并尽量把 URL / Email 保持为整体	网页文本、论坛内容、带大量 URL 与邮箱的语料。
char_group	按字符组切分	对分隔符集合比较固定的半结构化文本。
ngram	把词切成连续 n-gram	模糊匹配、拼写纠错、子串召回。
edge_ngram	只保留前缀 n-gram	自动完成、前缀补全。
path_hierarchy	按路径层级展开	目录树、URL 路径、组织层级过滤。
thai	按泰语规则切分	泰语文本分析。

内置分析器

分析器	说明
标准分析器	默认的分析器，根据Unicode联盟定义的单词边界来划分文本，删除绝大部分标点符号，最后小写化
简单分析器	在任何非字母的地方拆分词条
空格分析器	以空格为界拆分词条
停用词分析器	在简单切分基础上移除停用词，适合英文等停用词明显的文本。
关键字分析器	不切分文本，整串作为一个 token，常用于需要精确匹配但又希望走分析链的场景。
模式分析器	基于正则表达式切分，适合分隔符规则清晰的文本。
指纹分析器	把 token 归一化、排序并去重后合成一个签名，常用于去重或规范化匹配。
语言分析器	针对具体自然语言构造完整分析链，通常组合小写化、停用词、词干提取、语言归一化与省音符处理。
自定义分析器	手工指定 char_filter 、 tokenizer 和 filter ，用于业务域定制。

语言分析器

内置语言分析器的目标不是“把所有语言统一切分”，而是为每种语言提供更合理的停用词、词干化和归一化规则。对英语、法语、德语、西班牙语这类有明显词形变化的语言，语言分析器通常比通用分析器更适合检索。

语言组	内置分析器	说明
西欧与北欧语言	english , french , german , spanish , italian , portuguese , brazilian , dutch , norwegian , swedish , danish , finnish , irish	重点在停用词、词干化和词形归一化。
中东、南亚与古典字母语言	arabic , armenian , persian , greek , hindi , bengali	除停用词与词干化外，通常还需要语言特定归一化。
中东欧与斯拉夫语系	czech , hungarian , romanian , russian , bulgarian , sorani , turkish	这些语言词形变化明显，直接用标准分析器往往损失召回。
南欧、小语种与区域语言	basque , catalan , galician , estonian , latvian , lithuanian , indonesian	内置语言分析器让这些语言无需手工拼装停用词和词干器。
东亚与无空格语言	cjk , thai	cjk 适合中日韩混合文本的通用切分， thai 面向泰语。

中文场景中的常见插件分析器

ES 内置分析器对中文并不充分。生产环境中的中文全文检索通常依赖插件补足中文切分、拼音召回或繁简转换能力。你给出的 DSL 就属于这一路线：它把插件分析器与自定义分析链组合起来，而不是只用内置分析器。

组件	层次	作用
ik_max_word	分词器 / 分析器链核心	尽量细粒度切分中文，适合正文、主题等召回优先场景。
ik_smart	分词器 / 分析器链核心	较粗粒度切分中文，适合人名、地址、邮件头等噪声较多但不希望切得太碎的字段。
stconvert	字符过滤器	在分词前完成繁简转换，避免繁体与简体内容索引不一致。
synonym	Token 过滤器	把业务同义词、缩写、别称纳入同一检索空间。

分析器何时生效

当索引一个文档时，它的全文域被分析成词条以用来创建倒排索引
当在全文字段上执行搜索时，查询字符串也需要类似的分析过程

当查询一个精确值字段时，分析器不会介入。

指定分析器

当ES在你的文档中检测到一个新的字符串域，它会自动设置其为一个全文字符串域，使用标准分析器对它进行分析。某些情况下你可能需要改变此默认行为：

你想使用一个不同的分析器，适用于你的数据使用的语言
你想要一个字符串域就是一个精确值，不需要分析

可以通过自定义映射来满足上述需求。

字段类型

总体来说，ES中的字段可以分为精确值、全文两个大类。

精确值包括日期、数字，字符串也可以表示精确值。精确值是大小写敏感的。精确值很容易查询，它要么匹配，要么不匹配查询条件。

查询全文字段则要复杂得多，通常不会对全文字段进行精确匹配查询。全文字段匹配查询条件时有相关度的概念，表现为分数（Score）。搜索引擎应该能够识别缩写、词根、同义词，并给出适当的相关度。

对全文检索的支持依赖于分析，在分析之后需要创建倒排索引。

text 与 keyword

text

是全文字段类型。写入时会经过分析链，查询时通常也会分析输入，因此适合正文、标题、姓名、地址、备注等需要分词和相关性排序的内容。

keyword

是精确值字段类型。它通常把整个输入值作为一个完整项存入倒排结构，不做全文分词，因此适合 ID、状态、来源类型、邮箱 Message-ID、枚举值、标签、聚合、排序和过滤。

不要把

keyword

字段类型和

keyword

分析器 / 分词器混为一谈。前者属于 mapping 层，决定字段如何建索引；后者属于 analysis 层，决定字符串在分析链中是否切分。

多字段

同一个逻辑字段可以映射出多个物理检索视图，这就是多字段（Multi-fields）。最常见的写法是一个

text

主字段负责全文召回，再挂一个

keyword

子字段负责排序、聚合和精确过滤。

{
  "subject": {
    "type": "text",
    "analyzer": "standard",
    "fields": {
      "keyword": { "type": "keyword" }
    }
  }
}

你给出的 DSL 里，

from

同时挂了

keyword

和

email

两个子字段，本质上也是同一套路：一份原始值，同时服务于精确匹配和不同分析策略。

倒排索引

ES使用一种称为倒排索引的结构来支持快速的全文检索。

倒排索引的结构类似于RDBMS的位图索引，对于索引中出现的任何不重复词条的标准形式，生成包含该词的文档列表。标准形式可能已经过词干提取、同义词扩展等处理。

相关性

默认情况下，查询返回结果是按相关性倒序排列的。每个文档都有相关性评分，用一个正浮点数字段 _score 来表示。 _score 的评分越高，相关性越高。

查询语句会为每个文档生成一个 _score 字段。评分的计算方式取决于查询类型。不同的查询语句用于不同的目的：fuzzy 查询会计算与关键词的拼写相似程度。terms 查询会计算找到的内容与关键词组成部分匹配的百分比。

通常我们说的 relevance 是我们用来计算全文字段相对于检索词相似程度的算法。可以把它理解为 TF / IDF 思想的现代工程实现：词出现得越关键、越稀有、越贴近合适长度的字段，得分通常越高。

检索词频率：检索词在该字段出现的频率。出现频率越高，相关性通常越高
反向文档频率：每个检索词在索引中出现的频率。出现越普遍，区分度越低，相关性通常越低
字段长度准则：字段本身的长度。字段越长，单个词命中的权重通常越低

BM25

现代 ES 默认使用 BM25 作为相似度模型。BM25 仍然围绕“词频、逆文档频率、字段长度归一化”这三件事工作，但它不会让词频无限线性增长，而是让重复命中的收益逐渐饱和，因此比朴素 TF 计算更稳健。

在索引 DSL 里，

similarity

可以先在

settings.index.similarity

中定义一个具名模型，再由字段通过

"similarity": "mail_bm25"

引用。这样做的意义不在于“换一种完全不同的排序理论”，而在于显式固定参数，避免不同字段沿用默认值而失去可解释性。

BM25 最常见的两个参数是

k1

和

。

k1

控制词频增长多快进入饱和区；值越大，重复命中带来的额外得分持续得越久。

控制字段长度归一化强度；值越接近 1，长字段越容易被压分，值越接近 0，长度差异影响越弱。

文档类型

Type用于对索引进行分区/分类，允许你在一个索引里存储不同类型的文档。从6.0开始Type被弃用。

文档

可被索引的最小信息单元，以JSON形式表示。

分片/副本

一个索引的数据量可以超过硬盘的物理容量限制，ES使用分片来突破此限制。每个分片都是独立的、完整功能的“子索引”

创建索引时，你可以指定分片的数量。但是，分片如何分配给节点，分片中的文档如何被聚合以响应查询，完全由ES管理，对用户透明。

每个分片可以创建0-N个副本，这样可以避免单点故障。

API

API约定

ES的API通过JSON over RESTful HTTP暴露。除非特别强调，所有API都遵守本节描述的约定。

多个索引

大部分支持index参数的API，都能够跨越多个索引执行。你可以用以下形式指定多个索引：

# 枚举
test1,test2,test3
# 所有索引
_all
# 使用通配符
test*
# 排除索引
-test3

所有支持多索引的API，均识别以下URL参数：

参数	说明
ignore_unavailable	是否忽视不存在或者关闭的索引，取值true/false
allow_no_indices	是否允许没有任何匹配的索引
expand_wildcards	通配符如何展开，open仅仅展开匹配打开的索引，其它取值all，close

索引名中的日期

指定索引名时，你可以提供一些特殊符号，以匹配时间序列索引集中的一个范围，这样可以避免全集群扫描过滤。

几乎所有支持index参数的API，均可以指定如下格式的索引名：


# static_name 索引名中固定的部分
# date_math_expr 动态计算为时间点的表达式
# date_format 日期展示格式，默认YYYY.MM.dd
# time_zone 时区，默认UTC

示例：

表达式	说明	解析为
	截断到日起点	logstash-2018.04.12
	截断到月起点	logstash-2018.04.01
	截断到月，格式化为年月	logstash-2018.04
	截断到月，减一月	logstash-2018.03
	使用东八区格式化	logstash-2018.04.12

日期计算

运算符：

+1d

添加一天、

-1d

减少一天、

/d

向下截断到最近一天、

/h

向下截断到最近一小时。例如

now-1h/d

表示当前时间的毫秒数减去1小时，然后向下截断为UTC当日零时。

日期字段：y年、M月、w周、d日、h时、m分、s秒

通用选项

选项	说明
pretty=true	格式化打印，默认打印为JSON格式
format=yaml	打印为YAML格式
human=false	是否以人类易读方式输出数字
filter_path	用于减少服务器返回的响应长度，该参数为逗号分隔的、响应字段过滤器。例如： filter_path=took,hits.hits._id,hits.hits._score filter_path=metadata.indices..stat，支持通配符 filter_path=routing_table.indices..state，通配符表示可以跨越多级路径 filter_path=-_shards，短横线表示排除
flat_settings	影响_settings查询的输出格式
error_trace	设置为true，则查询出错时返回结果包含调用栈信息，便于诊断
source	使用不支持非POST请求体的HTTP客户端库时，使用此参数传递请求体内容

参数风格

REST参数（使用HTTP时对应URL参数）使用小写+下划线的风格。

数据类型

类型	说明
布尔	取值true或者false，不支持其它取值
数字	支持原生JSON数字类型支持单位：k、m、g、t、p
时间	支持单位：d、h、m、s、ms、micros、nanos
字节数	支持单位：b、kb、mb、gb、tb、pb
距离	支持单位：km、m、cm、mm

模糊查询

某些查询/API支持非精确的“模糊查询”，你可以指定fuzziness参数。

当针对text或keyword字段进行模糊查询时，“模糊”被解释为编辑距离（Levenshtein Edit Distance）——为了让一个字符串变为另一个，所需改变的字符个数。

关于请求体

某些库不支持非POST请求的请求体，此时你可以将请求体作为source查询参数传递。

需要同时传递参数source_content_type来指定内容类型，例如application/json。

内容类型

必须通过请求头Content-Type来设置请求体格式，大部分API支持 JSON, YAML, CBOR,SMILE这些格式。批量/多搜索API支持NDJSON,JSON,SMILE。

查看集群状态

总体健康状况

curl http://localhost:9200/_cat/health?v
# status取值含义：
# green   一切正常，集群功能完整
# yellow  所有数据可用，但是某些副本分片（Replica）没有分配。集群功能完整
# red    某些数据不可用，存在没有运行的主分片

节点信息

// curl http://es-elasticsearch.kube-system.svc.k8s.gmem.cc:9200/_nodes/os?pretty

{
  "_nodes" : {
    "total" : 12,
    "successful" : 12,
    "failed" : 0
  },
  "cluster_name" : "es",
  "nodes" : {
    "CmHIMj5aReqUPXL4yglVjQ" : {
      "name" : "es-client-695458dd5c-4dt26",
      "transport_address" : "172.27.208.114:9300",
      "host" : "172.27.208.114",
      "ip" : "172.27.208.114",
      "version" : "6.2.4",
      "build_hash" : "ccec39f",
      "roles" : [
        "ingest"
      ],
      "os" : {
        "refresh_interval_in_millis" : 1000,
        "name" : "Linux",
        "arch" : "amd64",
        "version" : "4.15.18-041518-generic",
        // 可用的CPU数量
        "available_processors" : 4,
        // ES可用的CPU数量
        "allocated_processors" : 1
      }
    }
  }
}

修改副本份数

# PUT /index_name/_settings
{
   "number_of_replicas" : 2
}

默认副本份数是1，要为将来创建的索引修改副本份数，执行：

# 未来创建的以fluentd开头的索引，副本份数为0

curl -XPUT "localhost:9200/_template/logstash_template" -H 'Content-Type: application/json' -d'
{
  "index_patterns": ["fluentd*"],
  "settings": {
    "number_of_replicas": 0
  }
}
'

测试分析器

你可以使用 analyze API 来看文本是如何被分析的：

# GET /_analyze
{
  "analyzer": "standard",
  "text": "Text to analyze"
}

查看映射

使用_mapping API可以获取1-N个索引的1-N个字段的映射信息：

# 获取索引gb的tweet（文档）类型的映射信息
# GET /gb/_mapping/tweet

{
   "gb": {
      "mappings": {
         "tweet": {
            # 字段列表
            "properties": {
               "date": {
                  "type": "date",
                  "format": "strict_date_optional_time||epoch_millis"
               },
               "name": {
                  "type": "string"
               },
               "tweet": {
                  "type": "string"
               },
               "user_id": {
                  "type": "long"
               }
            }
         }
      }
   }
}

# 具有内嵌对象的文档的映射形式
{
  "gb": {
    "tweet": { 
      "properties": {
        "tweet":            { "type": "string" },
        # 内嵌文档
        "user": { 
          "type":             "object",
          "properties": {
            "id":           { "type": "string" },
            # 内嵌文档
            "name":   { 
              "type":         "object",
              "properties": {
                "first":    { "type": "string" },
                "last":     { "type": "string" }
              }
            }
          }
        }
      }
    }
  }
}

验证查询

_validate 可以用来验证查询是否合法：

# GET /gb/tweet/_validate/query
# 显示查询不合法的原因
# GET /gb/tweet/_validate/query?explain
{
   "query": {
      "tweet" : {
         "match" : "really powerful"
      }
   }
}

创建索引

curl -X PUT http://localhost:9200/media?pretty

{
  "acknowledged" : true,
  "shards_acknowledged" : true,
  "index" : "media"
}

自定义映射

尽管在很多情况下基本域数据类型已经够用，但你经常需要为单独域自定义映射，特别是字符串域。自定义映射允许你执行下面的操作：

全文字符串域和精确值字符串域的区别
使用特定语言分析器
优化域以适应部分匹配
指定自定义数据格式

指定字段映射时，最重要的属性是type，对于非string字段，通常仅仅需要设置type。

首次创建一个索引时，你可以指定自定义映射，以后，你可以使用_mapping API创建新字段的映射，或者修改现有字段的映射。注意一个限制：不能把字段从analyzed修改为not_analyzed。

首次创建索引时指定映射的例子：

# PUT /gb 
{
  "mappings": {
    "tweet" : {
      "properties" : {
        "tweet" : {
          "type" :    "string",
          # analyzed 设置为全文字段；not_analyzed 设置为精确值字段；no 不索引此字段，不支持检索
          "index" : "analyzed",
          # 分析器，默认standard
          "analyzer": "english"
        },
        "date" : {
          "type" :   "date"
        },
        "name" : {
          "type" :   "string"
        },
        "user_id" : {
          "type" :   "long"
        }
      }
    }
  }
}

上面的例子对应的是旧版写法：它使用了

string

字段类型和显式 type 名称。理解一份现代索引 DSL 时，真正需要抓住的版本分界主要有两个。第一，ES 5.0 把旧的

string

拆成了

text

与

keyword

。从这时开始，“全文字段 + keyword 子字段”的多字段写法成为主流。第二，ES 7.0 进入 typeless API 时代，创建索引与定义 mapping 时不再以业务 type 名称作为顶层键；到了 ES 8.0，mapping types 已被彻底移除。

因此，像

settings

、

mappings

、

properties

、

dynamic_templates

、多字段

fields

、自定义 analyzer / tokenizer / similarity 这样的结构，本身并不是 7.14 才引入的新能力。它们是 ES 索引设计体系中的长期组成部分。真正带来语法差异的是字段类型从 string 迁移为 text / keyword，以及mapping 从 typed 结构迁移为 typeless 结构。

动态模板与常见映射参数

显式 mapping 只能覆盖你提前知道的字段。遇到动态字段时，如果完全依赖自动映射，ES 会按默认规则猜测类型，这在日志索引或半结构化业务字段中经常不够稳。

dynamic_templates

的作用就是：当新字段第一次出现时，按“路径 + 类型匹配规则”把它映射成你指定的类型，而不是交给默认动态映射。

因此，

"all_strings_as_keyword"

这一类模板的准确含义不是“所有字符串都变成关键词字段”，而是所有未显式声明、且命中模板条件的动态字符串字段，都默认按

keyword

类型落地。这样做的目的通常是保住过滤、聚合、排序和精确匹配能力，避免动态字段被自动建成全文字段后变得难以治理。

参数	所在层次	作用
properties	mapping	显式定义字段名、字段类型和字段级参数。
dynamic_templates	mapping	为动态出现的新字段指定“命中条件 → 映射模板”的规则。
fields	字段级 mapping	为同一个原始值建立多个索引视图，例如 text 主字段加 keyword 子字段。
analyzer	字段级 mapping	控制字段在建索引时如何分析文本。
search_analyzer	字段级 mapping	控制字段在查询时如何分析输入；当查询分析策略与索引分析策略不同时使用。
ignore_above	keyword 子字段	超长值不写入该 keyword 字段，避免极端长字符串带来额外索引和存储负担。
format	日期字段	声明日期字符串允许的解析格式。
similarity	字段级 mapping	给字段绑定具名相似度模型，例如自定义 BM25 参数。

索引级 settings 常见项

除了 mapping，创建索引时通常还会同时定义一批索引级参数。它们控制的不是“字段如何解释”，而是“索引如何写入、刷新、分片和排序”。

设置项	作用	典型考虑
refresh_interval	控制新写入文档多久对搜索可见一次	值越小，检索越快看到新数据；值越大，写入吞吐通常更高。
number_of_shards	主分片数量	决定索引的并行度和未来扩展边界，创建后通常不能随意修改。
number_of_replicas	副本数量	影响高可用、读吞吐和存储成本。
max_result_window	限制 from + size 的最大深分页窗口	窗口越大，深分页代价越高；超大分页通常更适合改成游标式方案，而不是无限抬高窗口。
translog.sync_interval	事务日志同步周期	影响 translog 刷新节奏与持久化行为。
translog.durability	控制写请求何时算持久化成功	request 更稳， async 更偏吞吐。
analysis	定义自定义分析链组件	包括 char_filter 、 tokenizer 、 filter 与具名 analyzer 。
similarity	定义具名相关性模型	供字段通过 mapping 中的 similarity 参数引用。

DSL 组成	版本判断	说明
settings / mappings / properties	早期版本已存在	这是 ES 索引定义最基础的骨架，不是 7.x 新功能。
dynamic_templates	早期版本已存在	动态模板长期用于约束动态字段如何落地，7.x 继续沿用。
多字段 fields	早期版本已存在；5.0 后更常见	一个原始值映射出多个检索视图； text + keyword 组合在 5.0 之后尤其常见。
text / keyword	5.0 关键变更	这是旧 string 类型被拆分后的新语义边界。
search_analyzer / ignore_above	早期版本已存在	分别用于区分查询时分析器和限制超长 keyword 值建索引。
自定义 analyzer / tokenizer	早期版本已存在	分析链是 ES 全文检索的基础设施，7.x 只是继续使用。
pattern tokenizer	早期版本已存在	属于标准分析组件家族，不是因为邮件搜索场景才新出现。
具名 BM25 similarity	BM25 在现代 ES 中是默认相关性模型；显式命名属于配置写法	这里的重点不是“用了新算法”，而是给字段显式绑定一套可调参数。
typeless mappings.properties	7.0 关键语法变化	不再写成 mappings..properties 。
mapping types 完全移除	8.0 最终状态	如果还沿用 typed 写法，就已经不属于 8.x 兼容语法。

7.x 实战 DSL：脱敏后的结构示例

下面给出一份脱敏后的邮件检索索引定义。它保留了实战中的核心结构，但去掉了环境地址、认证信息、双索引切换逻辑和业务专有索引名，只保留索引 schema 本身。该示例适合用来解释 ES 7.x 中一份完整索引 DSL 的层次关系。

{
  "settings": { // 索引级配置
    "index": { // index.* 命名空间
      "refresh_interval": "1s", // 刷新间隔，控制文档可搜索延迟
      "max_result_window": 65536, // from + size 的最大结果窗口
      "number_of_shards": 1, // 主分片数
      "number_of_replicas": 0, // 副本分片数
      "translog": { // 事务日志配置
        "sync_interval": "5s", // translog 同步周期
        "durability": "request" // 每次写请求都要求持久化确认
      },
      "analysis": { // 文本分析组件定义
        "filter": { // token filter 定义区
          "mail_synonym": { // 同义词过滤器名称
            "type": "synonym", // 使用 synonym filter
            "synonyms_path": "analysis/synonym.txt" // 同义词文件路径
          }
        },
        "char_filter": { // 字符过滤器定义区
          "tsconvert": { // 繁转简字符过滤器名称
            "type": "stconvert", // 依赖 stconvert 插件
            "convert_type": "t2s" // traditional to simplified
          }
        },
        "analyzer": { // 自定义分析器定义区
          "ik_max_with_synonym": { // 细粒度全文分析器
            "type": "custom", // 自定义分析器
            "tokenizer": "ik_max_word", // 细粒度中文分词
            "char_filter": ["tsconvert"], // 先做繁简转换
            "filter": ["lowercase", "mail_synonym"] // 再做小写化和同义词扩展
          },
          "ik_smart_with_synonym": { // 较粗粒度分析器
            "type": "custom", // 自定义分析器
            "tokenizer": "ik_smart", // 较粗粒度中文分词
            "char_filter": ["tsconvert"], // 先做繁简转换
            "filter": ["lowercase", "mail_synonym"] // 再做小写化和同义词扩展
          },
          "email_analyzer": { // 邮箱地址搜索分析器
            "type": "custom", // 自定义分析器
            "tokenizer": "email_tokenizer", // 使用专用邮箱分词器
            "filter": ["lowercase"] // 邮箱统一小写化
          }
        },
        "tokenizer": { // 自定义分词器定义区
          "email_tokenizer": { // 邮箱分词器名称
            "type": "pattern", // 基于正则表达式切分
            "pattern": "[@.]+" // 常见邮箱与分隔符切词规则
          }
        }
      },
      "similarity": { // 相似度模型定义区
        "mail_bm25": { // 自定义 BM25 名称
          "type": "BM25", // BM25 相似度模型
          "b": 0.75, // 长度归一化参数
          "k1": 1.2 // 词频饱和参数
        }
      }
    }
  },
  "mappings": { // 字段映射定义
    "dynamic_templates": [ // 动态模板数组
      {
        "all_strings_as_keyword": { // 所有动态字符串默认落为 keyword
          "match_mapping_type": "string", // 仅匹配字符串
          "mapping": { // 命中的映射模板
            "type": "keyword" // 默认按精确值字段处理
          }
        }
      },
      {
        "item_fields_fallback": { // item.fields.* 下字符串字段的兜底模板
          "path_match": "item.fields.*", // 仅匹配该路径下字段
          "match_mapping_type": "string", // 仅匹配字符串
          "mapping": { // 命中的映射模板
            "type": "keyword" // 避免动态字段被自动落成 text
          }
        }
      }
    ],
    "properties": { // 显式字段定义
      "@timestamp": { // 事件或写入时间
        "type": "date", // 日期字段
        "format": "yyyy-MM-dd HH:mm:ss||strict_date_optional_time||epoch_millis" // 支持的日期格式
      },
      "@version": { // 数据版本号
        "type": "keyword" // 精确匹配字段
      },
      "item": { // 主业务对象
        "properties": { // item 子字段
          "id": { "type": "keyword" }, // 文档或业务主键
          "deleted": { "type": "long" }, // 删除标记
          "dataset": { "type": "long" }, // 数据集编号
          "chunk": { "type": "long" }, // 分块编号
          "doc": { // 主体全文内容
            "type": "text", // 全文字段
            "analyzer": "ik_max_with_synonym", // 建索引时使用的分析器
            "similarity": "mail_bm25" // 该字段绑定自定义 BM25
          },
          "create_time": { // 创建时间
            "type": "date", // 日期字段
            "format": "yyyy-MM-dd HH:mm:ss||strict_date_optional_time||epoch_millis" // 支持的日期格式
          },
          "update_time": { // 更新时间
            "type": "date", // 日期字段
            "format": "yyyy-MM-dd HH:mm:ss||strict_date_optional_time||epoch_millis" // 支持的日期格式
          },
          "fields": { // 结构化业务字段容器
            "properties": { // fields 子字段
              "rfc_message_id": { "type": "keyword" }, // RFC Message-ID
              "from": { // 发件人原始文本
                "type": "text", // 文本字段
                "analyzer": "ik_smart_with_synonym", // 建索引时使用较粗粒度分析器
                "fields": { // 多字段定义
                  "keyword": { // 精确匹配子字段
                    "type": "keyword", // 支持过滤、聚合、排序
                    "ignore_above": 512 // 超长值不建立该子字段索引
                  },
                  "email": { // 邮箱地址拆词子字段
                    "type": "text", // 全文字段
                    "analyzer": "email_analyzer", // 建索引分析器
                    "search_analyzer": "email_analyzer" // 查询分析器
                  }
                }
              },
              "to": { // 收件人原始文本
                "type": "text", // 文本字段
                "analyzer": "ik_smart_with_synonym" // 建索引分析器
              },
              "cc": { // 抄送原始文本
                "type": "text", // 文本字段
                "analyzer": "ik_smart_with_synonym" // 建索引分析器
              },
              "subject": { // 邮件主题
                "type": "text", // 全文字段
                "analyzer": "ik_max_with_synonym", // 细粒度分析器
                "fields": { // 多字段定义
                  "keyword": { "type": "keyword" } // 主题精确匹配子字段
                }
              },
              "body_text": { // 邮件正文纯文本
                "type": "text", // 全文字段
                "analyzer": "ik_max_with_synonym" // 细粒度分析器
              },
              "attachment_names": { // 附件名
                "type": "text", // 文本字段
                "analyzer": "standard" // 标准分析器
              },
              "date": { // 邮件发送时间
                "type": "date", // 日期字段
                "format": "yyyy-MM-dd HH:mm:ss||strict_date_optional_time||epoch_millis" // 支持的日期格式
              },
              "extra_id": { "type": "keyword" }, // 扩展业务 ID
              "source_name": { "type": "keyword" }, // 来源名称
              "source_type": { "type": "keyword" }, // 来源类型
              "source_id": { "type": "keyword" }, // 来源主键
              "origin_id": { "type": "keyword" } // 原始记录 ID
            }
          }
        }
      }
    }
  }
}

这份 DSL 的设计重点不是“字段越多越好”，而是三层控制同时成立。第一层是

properties

，把查询路径上的关键字段显式定型。第二层是

dynamic_templates

，为未知字符串字段提供稳定兜底，避免动态映射把结构化字段错误落成全文字段。第三层是多字段

fields

，让同一份原始值同时服务于全文召回、精确过滤、聚合排序和特定检索策略。

参考

修改某个文档类型的某个字段的映射的例子：

# PUT /gb/_mapping/tweet
{
  "properties" : {
    "tag" : {
      "type" :    "string",
      "index":    "not_analyzed"
    }
  }
}

列出索引

curl http://localhost:9200/_cat/indices?v
# health status index uuid                   pri rep docs.count docs.deleted store.size pri.store.size
# yellow open   media EGuJhl4oSMy-FAhgK0bPJQ   5   1          0            0      1.1kb          1.1kb
# 由于没有额外的Replica，存在单点风险，因此yellow   包含5个分片，副本份数1

索引文档

插入一个文档：

curl -X PUT 'localhost:9200/customer/_doc/1?pretty' -H 'Content-Type: application/json' -d'{"name":"Alex"}'

{
  "_index" : "customer",   # 文档所在的索引
  "_type" : "_doc",        # 文档的类型，不同规格的文档可以共享类似的Schema，这些文档放在同一个索引中，以type区分
  "_id" : "1",             # 文档标识符，从URL参数获得
  "_version" : 1,          # 文档版本号
  "result" : "created",
  "_shards" : {            # 索引操作的复制处理情况
    "total" : 2,           # 有多少分片（包括主分片、复制分片）执行了索引操作
    # 成功完成索引操作的分片个数，至少为1才意味着索引操作成功。默认情况下仅主分片成功后就会返回
    "successful" : 1,      
    "failed" : 0           
  },
  "_seq_no" : 0,
  "_primary_term" : 1
}

使用相同URL再次PUT，则对标识符为1的文档进行替换（Reindex）操作。

插入文档时，可以不显式指定ID，ES会自动随机生成一个：

POST /customer/_doc?pretty ...

自动创建索引

如果索引文档时，目标索引不存在，则：

自动创建索引，设置选项action.auto_create_index=false，可以禁用
自动创建一个类型映射，设置选项index.mapper.dynamic=false，可以禁用

版本化

每个被索引的文档都具有对应的版本号，此版本号作为响应的一部分返回。默认情况下，索引从1开始，每次更新（即使没有做任何改变）、删除操作后增1。

请求可以直接指定版本号，这种情况下ES自动进行乐观并发控制：PUT index_name/_doc/1?version=2。乐观并发控制的典型应用场景是读后更新。

版本化是完全实时的，不受检索操作的准实时性影响。如果不提供version参数，则ES不对操作进行版本检查。

版本号可以存放在ES外部，要启用此特性，设置version_type=external。这种情况下，请求参数中的版本号会和当前被索引的文档中的版本号进行比较，如果请求中的版本号大则新文档被存储、索引。

操作类型

指定

op_type=create

则强制进行创建操作，如果同ID的文档已经存在，则报错。

路由

默认情况下，文档ID的哈希值决定了它被存放到哪个分片上。你可以使用请求参数

routing

，其值作为哈希函数的入参。

复制

根据路由的结果，索引操作在相应的主分片（所在的节点）上执行。当主分片的索引操作完成后，更新操作复制到可用的从分片。

为了提升可靠性，ES允许配置为必须等待一定数量的分片的写操作完成，在此之前，请求必须等待、重试，或者超时。默认情况下只需要等待主分片，即index.write.wait_for_active_shards=1。你也可以针对请求来设置wait_for_active_shards参数。设置为all则需要等待所有分片操作完成。

超时

执行索引操作时，主分片可能处于不可用状态，默认情况下，ES会等待1分钟，此超时时间可以通过请求参数timeout定制。

更新文档

除了插入/替换文档之外，我们还可以进行更新操作。注意，实际上ES是不支持In-place更新的，它仅仅是把更新信息merge到原文档中，然后替换掉原文档。示例：

curl -XPOST 'localhost:9200/customer/_doc/1/_update?pretty' -H 'Content-Type: application/json' -d'
{
  # 可以指定一个需要merge from的文档
  "doc": { "name": "Wong", "age": 30 }
  # 也可以指定一段脚本
  "script" : "ctx._source.age += 1"
}
'

提取文档

这类API允许基于ID来取得JSON格式的文档：

curl http://localhost:9200/customer/_doc/1?pretty

{
  "_index" : "customer",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 4,
  "found" : true,
  "_source" : {           # 文档的完整JSON
    "name" : "Alex"
  }
}

存在性检查

你也可以使用HEAD方法来检查目标文档是否存在：HEAD customer/_doc/id

实时性

默认情况下get操作是实时的，不受到索引刷新率的影响。

如果所请求的文档已经更新，但是尚未刷新，则此API会即席的发起一次刷新操作。设置请求参数realtime=false禁用此自动刷新行为。

源文档过滤

默认情况下此API获取源文档的所有内容，即_source字段。设置_source=false则不返回源文档的任何内容。

如果需要返回某些字段，使用_source_include请求参数；如果需要排除某些字段，使用_source_exclude字段，示例：

# 可以使用通配符
_source_include=*.id&_source_exclude=entities
# 如果仅仅使用include，可以直接简写为_source
_source=*.id,retweeted

直接返回_source

要仅仅返回响应文档的_source字段，使用请求：customer/_doc/1/_source

路由

如果索引文档时使用routing来指定路由，则提取文档时必须传入相同的routing参数。

在哪提取

使用参数preference，可以指定在什么分片上提取文档。默认值是随机选取分片。取值_primary则仅仅在主分片上提取，取值_local则尽可能在本地分配的分片上提取。

分片副本份数越多，则操作的性能越好。

刷新

使用参数refresh=true，可以在提取之前刷新相关的分片。使用此参数时要注意对系统性能的潜在影响。

版本化

传递version参数，则仅在当前文档版本号匹配时，才返回。

批量提取

使用mget API可以同时提取多个文档：

# GET /_mget
{
   "docs" : [
      {
         "_index" : "website",
         "_type" :  "blog",
         "_id" :    2
      },
      {
         "_index" : "website",
         "_type" :  "pageviews",
         "_id" :    1,
         "_source": "views"
      }
   ]
}
# 其它变体
# GET /index_name/_mget

# 如果索引、类型都相同，则仅指定一个ids数组即可
# GET /index_name/type/_mget
{
    "ids" : [ "2", "1" ]
}

返回值包含一个docs数组

删除文档

根据ID来删除一个已被索引的文档：

curl -X DELETE 'localhost:9200/customer/_doc/1?pretty'

版本化、路由、分布式、刷新、超时类似于索引文档。

按查询删除

可以将匹配查询条件的文档删除：

curl -X POST "/twitter/_delete_by_query" -H 'Content-Type: application/json' -d'
{
  "query": { 
    "match": {
      "message": "some message"
    }
  }
}
'

此API会获取其被调用时的索引的快照，并基于此快照中匹配文档的内部版本号，执行删除操作。

注意：由于内部版本化不支持版本号0，因此version=0的文档无法被_delete_by_query删除。

删除索引

curl -X DELETE 'localhost:9200/customer?pretty'

{
  "acknowledged" : true
}

批量处理

ES提供了批量操作的API，可以把多个CRUD操作组合在一起执行：

# 插入两个文档
curl -X POST 'localhost:9200/customer/_doc/_bulk?pretty' -H 'Content-Type: application/json' -d'
{"index":{"_id":"1"}}
{"name": "John Doe" }     # Source Document
{"index":{"_id":"2"}}
{"name": "Jane Doe" }
'

# 更新一个文档，删除一个文档
curl -XPOST 'localhost:9200/customer/_doc/_bulk?pretty' -H 'Content-Type: application/json' -d'
{"update":{"_id":"1"}}
{"doc": { "name": "John Doe becomes Jane Doe" } }
{"delete":{"_id":"2"}}
'

# 注意删除操作不需要指定的Source Document

如果批处理中的某个操作失败，则它会继续处理。最终，所有操作的执行结果会返回给调用者。

全文检索

准备数据：

wget https://raw.githubusercontent.com/elastic/elasticsearch/master/docs/src/test/resources/accounts.json
# 从文件读取批处理的输入
curl -H "Content-Type: application/json" -X POST "localhost:9200/bank/_doc/_bulk?pretty&refresh" --data-binary "@accounts.json"

路由

当执行搜索时，请求会广播给索引的全部分片，并以RR算法选择分片的Replica。使用routing参数可以强制在匹配哈希值的分片上执行搜索，你可以为routing指定逗号分隔的多个值。

自适应Replica选择

除了默认的RR轮询算法以外，ES还支持自适应Replica选择，自动选取最适当的Replica。选取准则包括：

根据协调（coordinating）节点向数据节点转发请求的响应时间
在数据节点上执行请求所消耗的时间
数据节点的搜索线程池大小

要启用该特性，设置集群选项：

# PUT /_cluster/settings
{
    "transient": {
        "cluster.routing.use_adaptive_replica_selection": true
    }
}

全局超时

除了在每个请求中设置超时之外，ES还支持全局性的搜索超时search.default_search_timeout，此设置没有默认值，设置为-1可以取消先前设置的值。

取消搜索

搜索可以通过标准的任务取消机制来取消。默认情况下ES仅仅在段边界（segment boundaries）来检查请求是否已经被取消，因此取消操作可能由于大段而延迟。要降低取消操作的响应时间，可以设置search.low_level_cancellation=true，但是要注意此设置会导致更加频繁的检查。

并发和并行

默认情况下ES不限制搜索请求牵涉到的分片数量，你可以设置软限制 action.search.shard_count.limit 来拒绝命中太多分片的请求。

参数max_concurrent_shard_requests可以限制搜索请求最多同时在多少个分片上执行，可以防止单个搜索请求消耗整个集群的资源。此参数的默认值取决于集群中数据节点的数量，最多256。

检索参数

检索API支持两种传递查询参数的方式：通过URL参数、通过请求体。

要检索特定索引上，任何类型的文档，使用：/index_name/_search

要检索特定索引上，特定类型的文档，使用：/index_name/type1,type2.../_search

要检索多个索引上，具有特定标签的，使用：/index1,index2/_search?q=tag:tag1

要检索任何的索引，使用：/_all/_search

通过URL传参

示例：

# q=* 匹配所有文档，不指定field默认使用_all字段，此字段是String类型

# q=field:value 仅field字段匹配value的文档

# sort=account_number:asc  根据账号升序排列结果
curl -XGET 'localhost:9200/bank/_search?q=*&sort=account_number:asc&pretty'

注意，并非所有检索选项支持URL方式传参。

通过请求体传参

query参数传递Query DSL，示例：

curl -XGET 'localhost:9200/bank/_search?pretty' -H 'Content-Type: application/json' -d'
{
  "from" : 0, "size" : 10,
  "query": { "match_all": {} },
  "sort": [
    { "account_number": "asc" }
  ]
}
'

可用参数：

参数	说明
timeout	搜索超时，默认无
from	分页，起始偏移量，默认0
size	分页，抓取结果数量，默认10
search_type	搜索类型，取值dfs_query_then_fetch、query_then_fetch，默认query_then_fetch 只能作为URL参数传递
request_cache	true/false，是否启用搜索结果（仅针对size为0的请求，亦即聚合/建议请求）的缓存只能作为URL参数传递
terminate_after	每个分片最多收集的文档数量，如果超过限制查询立即终止，响应中的terminated_early设置为true 设置此参数为1，可以实现快速检查是否存在匹配（exists）
batched_reduce_size	在协调节点（coordinating node）上，每次Reduce分片结果的数量。可以防止单个请求占用太多的内存

搜索结果示例

{
  "took" : 10,               # 执行搜索消耗的时间
  "timed_out" : false,       # 搜索是否超时
  "_shards" : {              # 多少分片参与到搜索
    "total" : 5,
    "successful" : 5,     
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {                 # 搜索结果
    "total" : 1000,          # 匹配的总数
    "max_score" : null,      # 最大分数
    "hits" : [               # 实际匹配文档的数组
      {
        "_index" : "bank",   
        "_type" : "_doc",
        "_id" : "0",
        "_score" : null,     # 分数表示文档匹配查询的程度，值越大，匹配程度越高
        "_source" : {
          "account_number" : 0,
          "balance" : 16623,
          "firstname" : "Bradshaw",
          "lastname" : "Mckenzie",
          "age" : 29,
          "gender" : "F",
          "address" : "244 Columbus Place",
          "employer" : "Euron",
          "email" : "bradshawmckenzie@euron.com",
          "city" : "Hobucken",
          "state" : "CO"
        },
        "sort" : [
          0
        ]
      },
      {
        "_index" : "bank",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : null,
        "_source" : {
          "account_number" : 1,
          "balance" : 39225,
          "firstname" : "Amber",
          "lastname" : "Duke",
          "age" : 32,
          "gender" : "M",
          "address" : "880 Holmes Lane",
          "employer" : "Pyrami",
          "email" : "amberduke@pyrami.com",
          "city" : "Brogan",
          "state" : "IL"
        },
        "sort" : [
          1
        ]
      },
      ...
    ]
  }
}

一旦搜索结果返回，ES就不会在服务器端存留任何资源，例如游标。这个特性和关系型数据库不同。

分页查询

# 返回所有文档
{
  "query": { "match_all": {} }
}
# 返回第一个匹配的文档，size默认为10
{
  "query": { "match_all": {} },
  "size": 1
}
# 分页，返回11-20个文档
{
  "query": { "match_all": {} },
  "from": 10,
  "size": 10
}

结果排序

默认情况下，返回的结果是按照相关性（评分）进行排序的——最相关的文档排在最前，默认按照_score字段降序排序。

你也可以定制排序方式：

# 根据balance升序排列
{
  "query": { "match_all": {} },
  "sort": { "balance": { "order": "desc" } }
}

# 多值字段排序
{
   "query" : {
      "term" : { "country" : "china" }
   },
   "sort" : [
      {"population" : {"order" : "asc", "mode" : "avg"}}
   ]
}

多值字段排序

ES支持根据数组字段、多值字段进行排序，此时可以设置sort.mode字段：

sort.mode	说明
min	取数组中的最小值参与排序
max	取数组中的最大值参与排序
sum	取数组元素总和参与排序
avg	取数组元素平均值参与排序
median	取中位数参与排序

嵌套字段排序

ES支持依据文档中的嵌套字段进行排序，示例：

{
   "query" : {
      "term" : { "product" : "chocolate" }
   },
   "sort" : [
       {
          # 根据嵌套字段排序
          "offer.price" : {
             # 取嵌套字段平均值
             "mode" :  "avg",
             # 升序排列
             "order" : "asc",
             # 嵌套字段信息
             "nested": {
                # 导航路径
                "path": "offer",
                # 过滤条件
                "filter": {
                   "term" : { "offer.color" : "blue" }
                }
             }
          }
       }
    ]
}

缺失字段处理

使用missing指定可以指定当某个文档没有参与排序的字段时该怎么办，默认值为_last，可以取值_first或者自定义一个用于排序的数值：

{
    "sort" : [
        { "price" : {"missing" : "_last"} }
    ]
}

地理距离排序

ES支持根据二维平面上的距离值来排序，示例：

{
    "sort" : [
        {
            "_geo_distance" : {
                # 支持多种形式的坐标：
                "pin.location" : { "lat" : 40, "lon" : -70 },
                "pin.location" : "40,-70",
                "pin.location" : [[-70, 40], [-71, 42]],
                "pin.location" : [-70, 40],  # 排序的字段: 计算距离时的中心点
                "order" : "asc",             # 升降序
                "unit" : "km",
                "mode" : "min",              # 如果排序字段中包含多个Geo点，如何处理
                "distance_type" : "arc"      # 可以取值plane，速度快但是长距离、近极地时不准确
            }
        }
    ]
}

基于脚本排序

排序算法可以由自定义的脚本提供：

{
    "sort" : {
        "_script" : {
            "type" : "number",
            "script" : {
                "lang": "painless",
                "source": "doc['field_name'].value * params.factor",
                "params" : {
                    "factor" : 1.1
                }
            },
            "order" : "asc"
    }
}

计算分数

当使用排序时，默认不会计算匹配分数，要改变此行为设置track_scores = true

内存消耗

当执行排序时，排序相关的字段被载入内存。每个分片都需要具有足够的内存来容纳这些字段：

对于参与排序的字符串类型，不应该被analyzed/tokenized
对于参与排序的数字类型，尽可能使用更短的类型

指定返回字段

# 不返回任何字段
{
    "_source": false
}

# 返回account_number、balance两个字段
{
  "query": { "match_all": {} },
  "_source": ["account_number", "balance"]
}

# 使用通配符指定字段
{
    "_source": [ "obj1.*", "obj2.*" ]
}

# 指定需要包含、排除的字段
{
    "_source": {
        "includes": [ "obj1.*", "obj2.*" ],
        "excludes": [ "*.description" ]
    }
}

脚本生成字段

允许根据现有字段，进行计算，衍生出新的字段：

{
    "query" : {
        "match_all": {}
    },
    "script_fields" : {
        "test2" : {
            # 使用doc更快，内存消耗高（因为目标字段的terms被载入内存）。仅能返回简单的值（不能返回JSON文档）
            "script" : {
                "lang": "painless",
                "source": "doc['my_field_name'].value * params.factor",
                "params" : {
                    "factor"  : 2.0
                }
            },
            # 使用_source非常慢，因为整个文档需要载入并解析
            "script" : "params['_source']['my_field_name']"
        }
    }
}

查询条件

通常的规则是，使用查询（query）语句来进行全文搜索或者其它任何需要影响相关性得分的搜索。除此以外的情况都使用过滤（filters)。

本节以Query DSL语法说明如何指定查询条件。

查询语法

# 查询语句典型结构
{
    QUERY_NAME: {
        ARGUMENT: VALUE,
        ARGUMENT: VALUE,...
    }
}
# 针对特定字段的查询语句结构
{
    QUERY_NAME: {
        FIELD_NAME: {
            ARGUMENT: VALUE,
            ARGUMENT: VALUE,...
        }
    }
}

简单查询

# 全部匹配
"query": {}
"query": {
    "match_all": {}
}

# 账号为20
{
  "query": { "match": { "account_number": 20 } }
}
# 地址中包含mill字样
{
  "query": { "match": { "address": "mill" } }
}
# 地址中包含mill或者lane字样
{
  "query": { "match": { "address": "mill lane" } }
}
# 地址中包含"mill lane"这个短语
{
  "query": { "match_phrase": { "address": "mill lane" } }
}

# 在多个字段上进行匹配
{
    "multi_match": {
        "query":    "full text search",
        "fields":   [ "title", "body" ]
    }
}

# 查询落在指定区间的时间、数字
{
    "range": {
        "age": {
            "gte":  20,
            "lt":   30
        }
    }
}

# 精确匹配查询
{ "term": { "age":    26           }}
{ "term": { "date":   "2014-09-01" }}
{ "term": { "public": true         }}
{ "term": { "tag":    "full_text"  }}

# 精确匹配查询（多值，匹配任意一个即可）
{ "terms": { "tag": [ "search", "full_text", "nosql" ] }}


# 存在性查询
{
    # 存在title字段
    "exists":   {
        "field":    "title"
    }
    # 不存在title字段
    "missing":   {
        "field":    "title"
    }
}

逻辑或与非

{
  "query": {
    "bool": {
      # 与：地址中同时包含mill和lane
      "must": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}
{
  "query": {
    "bool": {
      # 或：地址中包含mill或lane
      "should": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}
{
  "query": {
    "bool": {
      # 非：地址中不得包含mill或lane
      "must_not": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}

{
  "query": {
    # 返回年龄为40，且不住在爱达荷州的顾客账户
    "bool": {
      "must": [
        { "match": { "age": "40" } }
      ],
      "must_not": [
        { "match": { "state": "ID" } }
      ]
    }
  }
}

过滤条件

过滤查询（Filtering queries）只是简单的检查包含或者排除，这就使得计算起来非常快。过滤查询不进行评分，结果可以被缓存。

相反，评分查询（scoring queries）不仅仅要找出匹配的文档，还要计算每个匹配文档的相关性，计算相关性使得它们比不评分查询费力的多。同时，查询结果并不缓存。

由于倒排索引（inverted index），一个简单的评分查询在匹配少量文档时可能与一个涵盖百万文档的filter表现的一样好，甚至会更好。但是在一般情况下，一个filter 会比一个评分的query性能更优异，并且每次都表现的很稳定。

注意filter可以放在不同位置，仅仅其引用的查询条件不影响评分，而不是整个查询不支持评分。过滤查询示例：

{
  "query": {
    "bool": {
      # 返回地址中包含lane（默认大小写不敏感），且余额在2w到3w之间的账户
      "must": { "match": { "address": "lane" } },
      "filter": {
        "range": {
          # 下面的条件不影响评分
          "balance": {
            "gte": 20000,
            "lte": 30000
          }
        }
      }
    }
  }
}

高亮匹配

ES支持修改搜索结果，为匹配搜索的字段添加HTML标签，以便高亮显示：

{
    "highlight": {
        "fields" : {
            # 默认情况下，about字段中匹配搜索条件的部分会被标签包围
            "about" : {}
        }
    }
}

聚合查询

示例：

{ # 不返回聚合前的结果集，我们仅仅关注聚合 "size": 0, "aggs": { # 聚合结果的键 "group_by_state": { "terms": { # 根据state字段进行分组 "field": "state.keyword" }, # 聚合函数默认是统计总数 } } } # 类似于SQL：SELECT state, COUNT(*) FROM bank GROUP BY state ORDER BY COUNT(*) DESC

执行结果如下：

{ "took" : 28, "timed_out" : false, "_shards" : { "total" : 5, "successful" : 5, "skipped" : 0, "failed" : 0 }, # 聚合前的结果集 "hits" : { "total" : 1000, "max_score" : 0.0, "hits" : [ ] }, # 聚合 "aggregations" : { # 键 "group_by_state" : { "doc_count_error_upper_bound" : 20, "sum_other_doc_count" : 770, "buckets" : [ { "key" : "ID", "doc_count" : 27 }, { "key" : "TX", "doc_count" : 27 } ... ] } } }

你可以指定聚合函数、排序方式：

{ "size": 0, "aggs": { "group_by_state": { "terms": { "field": "state.keyword", # 根据平均余额降序排列 "order": { "average_balance": "desc" } }, # 聚合函数：对账户余额取平均值 "aggs": { "average_balance": { # 字段名 "avg": { "field": "balance" } } } } } }

配置

ES提供了很适当的默认配置，需要很少的定制化。大部分配置项都可以在运行时更新。

ES的配置文件主要有三个：

elasticsearch.yml 主配置文件

jvm.options 使用的JVM参数

log4j2.properties 日志配置

这些配置文件位于conf目录，具体位置和你使用的安装方式有关。可以通过环境变量定制：

ES_PATH_CONF=/path/to/my/config ./bin/elasticsearch

主配置文件

主配置文件基于YML格式，支持通过${VAR_NAME}来引用环境变量，例如：

node.name: ${HOSTNAME} network.host: ${ES_NETWORK_HOST}

主要的配置项如下：

path: # 日志存放目录 logs: /var/log/elasticsearch # 数据存放目录 data: /var/data/elasticsearch # 可以指定多个存储位置 data: - /mnt/elasticsearch_1 - /mnt/elasticsearch_2 - /mnt/elasticsearch_3 # 当前节点所属集群名称 cluster.name: logging-prod # 当前节点的名称 node.name: ${HOSTNAME} # 绑定的监听地址 network.host: 10.0.0.1 # 节点的相互发现 # ES实现了所谓Zen Discovery，用于节点发现、Master选举 # 不进行任何配置的情况下，ES会扫描localhost的9300-9305来寻找相同服务器上运行的节点 # 在实际集群中，你需要指定当前节点需要连接的其它节点 discovery.zen.ping.unicast.hosts: - 192.168.1.10:9300 - 192.168.1.11 - seeds.mydomain.com # 节点列表可以不指定端口，默认使用transport.profiles.default.port # 如果transport.profiles.default.port没有配置则使用transport.tcp.port # 为了防止数据丢失，需要配置每个有资格成为Master的节点能够看到的，其它有资格成为Master的节点的最小数量 # 如果不设置此选项，在网络分区的情况下，集群会分裂为两个独立的小集群，即脑裂。脑裂会导致数据丢失 # 为了防止脑裂，需要设置此选项为 (master_eligible_nodes / 2) + 1 discovery.zen.minimum_master_nodes: 2 zen: # 故障发现，默认1秒执行一次，超时30秒，超时3次则剔除节点。可能导致索引重新分配 ping_interval: 1 ping_timeout: 30s ping_retries: 3

JVM配置

默认情况下，ES使用固定大小的1G堆内存。关于JVM参数配置的建议包括：

设置堆的最小值和最大值相同

堆越大，ES越可以缓存更多的东西。但是大堆意味着更长的GC停顿

Xmx不要设置超过50%的物理内存。为内核和系统缓存留下空间

ES使用Java安全管理器。JVM默认无限期的缓存DNS解析记录，如果你依赖于动态解析的DNS，则需要配置安全管理器：

networkaddress.cache.ttl=、 networkaddress.cache.negative.ttl=

操作系统配置

禁用Swap

Swap可能导致JVM堆甚至可执行页被交换到磁盘中，对性能有非常不利的影响。Swap可能导致GC从毫秒级变为分钟级完成、导致节点响应异常缓慢甚至脱离集群。因此，宁愿让OS把节点杀掉也不要启用Swap。

你可以执行下面的命令来禁用所有交换文件：

sudo swapoff -a

注释掉/etc/fstab中的相关行，可以永久禁用Swap。

设置systctl参数vm.swappiness为1，可以减小Linux内核进行Swap的倾向，让它在通常情况下不会Swap。

或者，你可以利用Linux的mlockall，将ES进程的地址空间锁定在内存中，配置ES：

bootstrap.memory_lock: true

文件描述符

ES需要使用大量的文件描述符/文件句柄。确保运行ES的用户可以打开65536或者更多的文件描述符。

虚拟内存

ES默认使用一个mmapfs目录来存储其索引，OS的mmap计数默认值很低，可能导致OOM异常。执行下面命令修改：

sysctl -w vm.max_map_count=262144 # 一个进程可以拥有的VMA(虚拟内存区域)的数量，虚拟内存区域是一个连续的虚拟地址空间区域 # 在进程的生命周期中，每当程序尝试在内存中映射文件，链接到共享内存段，或者分配堆空间的时候，这些区域将被创建

线程数

ES需要创建很多线程来完成不同的操作，你最少要保证ES能够创建4096个线程：ulimit -u 4096或者设置nprocs

x-pack

启用TLS

对于Gold/Platinum类型的License，如果你启用了安全，则必须同时启用TLS。

生成CA证书

你可以使用外部提供的CA证书，或者通过下面的命令生成：

bin/x-pack/certutil ca

生成节点密钥

可以使用下面的命令生成p12格式的私钥、证书：

bin/x-pack/certutil cert --ca elastic-stack-ca.p12

默认情况下，此证书不包含SAN字段，因此可以所有节点共享。如果需要更加严格的身份验证，可以传入--name, --dns --ip参数。

你可以可以使用外部提供的证书。

拷贝密钥

把密钥拷贝到节点的config/certs目录下

修改配置

添加以下ES配置项：

xpack.security.transport.ssl.enabled: true xpack.security.transport.ssl.verification_mode: certificate xpack.security.transport.ssl.keystore.path: certs/elastic-certificates.p12 xpack.security.transport.ssl.truststore.path: certs/elastic-certificates.p12

验证模式默认certificate，不检查SAN，如果需要更加严格的身份验证，设置为full。

重启服务后，集群节点间的TLS通信OK，你可以使用Gold/Platinum的License了。

安装License

curl -u elastic:$PSWD 'http://es-elasticsearch.kube-system.svc.k8s.gmem.cc:9200/_xpack/license' \ -H "Content-Type: application/json" -d @eslic.json # license文件路径

身份验证和授权

更改内置用户密码

登陆到客户端节点，执行下面的命令，可以随机生成elastic、kibana、logstash_system的新密码：

bin/x-pack/setup-passwords auto

或者，你也可以交互式的设置密码：

bin/x-pack/setup-passwords interactive

启用匿名用户

添加ES配置项：

xpack.security.authc: anonymous: # 匿名用户的名称 username: anonymous # 授予的角色，逗号分隔 roles: transport_client

内置角色

角色说明

ingest_admin 可以访问所有索引模板、ingest流水线配置

kibana_dashboard_only_user 可以访问Kibana仪表盘，只读访问.kibana索引

kibana_system 可以读写Kibana索引，检查集群可用性，管理索引模板。可以读.monitoring-*索引，读写.reporting-*索引

kibana_user Kibana用户的最小权限，可以访问Kibana索引，监控集群状态

logstash_admin 可以访问.logstash*索引，以管理配置

logstash_system Logstash系统级用户，可以发送监控数据给ES

monitoring_user 支持X-pack monitoring

remote_monitoring_agent 支持写入监控数据到ES

superuser 超级用户

transport_client
支持访问Node Liveness API、Cluster State API，例如/_cluster/state/version

watcher_admin 读写.watches索引

watcher_user 只读.watches索引

kibana

启用身份验证后，如果没有修改内置用户密码，则kibana登陆界面会提示：Login is currently disabled. Administrators should consult the Kibana logs for more details.

你需要更改kibana的配置项elasticsearch.password，如果在Docker中运行Kibana，也可以修改环境变量ELASTICSEARCH_PASSWORD。然后使用setup-passwords命令更改内置用户密码。

最佳实践

节点角色分离

建议把节点分为三类：

Master节点，仅仅负责集群管理，不存储数据，不提供HTTP API

Client节点，和客户端通信，不存储数据，提供HTTP API

Data节点，仅仅负责存储、索引数据，不提供HTTP API

性能优化

内存分配

对于超过32GB的堆，无法使用压缩普通对象指针（Compressed Ordinary Object Pointer），指针大小变为64bit。这导致50GB的堆，能存储的对象数量和30GB的堆差不多。

堆的最大、最小值应该设置为一致。

注意磁盘空间

低水位：默认情况下，节点磁盘用量超过85%后，ES不会分发新的分片到该节点。即便如此，已有的分片仍然可能继续增大。

高水位：默认情况下，节点磁盘用量超过90%后，ES会停止写入，并且将该节点上的分片重现分配给磁盘空闲的其它节点。

副本：默认情况下使用1个副本，这意味着两倍的磁盘空间

分片：更大的分片，在存储上越高效。但是节点失败导致数据迁移的成本也越高。

不要频繁落盘

索引是存储文档并让其可检索的过程。文档必须落盘，才能被搜索。

默认的落盘间隔是一秒，由参数refresh_interval指定。如果将此参数改为半分钟甚至更大，则能极大的增加ES的吞吐量：

PUT fluentd-2018.12.26/_settings { "index" : { "refresh_interval" : "10s" } }

每次落盘，ES都会创建一个新的段（segment ）。

更多的分片

设置更多的分片，插入数据的并发度更高：

PUT /_template/logstash_template { "index_patterns": ["fluentd*"], "settings": { "number_of_shards" : 12, "number_of_replicas": 0, "refresh_interval" : "10s" } }

字段数据缓存

字段数据（Field Data ）反转倒排索引。如果你需要知道某个字段包含哪些值，则ES需要反转字段的倒排索引，并产生字段数据。

字段数据存放在堆中，不加任何限制可能充满整个堆。参数indices.fielddata.cache.size用于控制字段数据的内存用量，可以指定百分比或者绝对值。

索引缓冲区大小

如果写入量非常大，则需要保证内存中的索引缓冲足够大，对应的参数是indices.memory.index_buffer_size。可以设置高达512MB/分片。

查询缓存

ES 6.x的查询缓存使用LRU算法清除，其内存用量通过indices.queries.cache.size配置。

使用批量请求

批量请求比针对单个文档的请求性能要好很多。批次的最佳大小需要基准测试才能得出。

可以使用多个客户端并发的进行批量请求，单线程往往不能用尽ES的吞吐能力。

禁用交换分区

交换分区会导致严重的性能下降。

文件系统缓存

在进行IO操作时，需要使用文件系统缓存。你应该保证有一半的ES节点内存用于文件系统缓存。

角色	说明
ingest_admin	可以访问所有索引模板、ingest流水线配置
kibana_dashboard_only_user	可以访问Kibana仪表盘，只读访问.kibana索引
kibana_system	可以读写Kibana索引，检查集群可用性，管理索引模板。可以读.monitoring-索引，读写.reporting-索引
kibana_user	Kibana用户的最小权限，可以访问Kibana索引，监控集群状态
logstash_admin	可以访问.logstash*索引，以管理配置
logstash_system	Logstash系统级用户，可以发送监控数据给ES
monitoring_user	支持X-pack monitoring
remote_monitoring_agent	支持写入监控数据到ES
superuser	超级用户
transport_client	支持访问Node Liveness API、Cluster State API，例如/_cluster/state/version
watcher_admin	读写.watches索引
watcher_user	只读.watches索引

The post ElasticSearch学习笔记 appeared first on 绿色记忆.

基于EFK构建日志分析系统

Alex — Tue, 09 Jan 2018 16:10:18 +0000

Elasticsearch

参考：ElasticSearch学习笔记

Fluentd

Fluentd是一个C编写的开源的日志收集器，支持100+不同系统的日志收集处理。

source

定义Fluentd的输入，需要指定一个输入插件。例如：

# 使用什么插件 @type http # 你可以这样推送日志：http://localhost:8888/tag.name?json={...} port 8888 bind 0.0.0.0

定义了一个HTTP输入。Fluentd会在8888端口上监听，等待外部传入事件。事件的例子：

curl -i -X POST -d 'json={"action":"login","user":2}' http://localhost:8888/test.cycle

source捕获到的Fluentd事件，交由Fluentd路由引擎处理。

filter

多个filter可以构成事件处理流水线。使用filter你可以将不需要的事件过滤掉，不再继续下一步处理。例如：

@type grep key action pattern ^logout$

根据正则式匹配输入事件的action字段，如果匹配，路由给match处理，否则丢弃。

match

定义Fluentd的输出，并将匹配的事件传递给目标。例如：

@type stdout

会匹配具有Tag：test.cycle的输入事件，并传递给stdout这个输出插件。

label

用于定义一个可以被跳转到的路由片段，打破默认的从上到下的路由搜索顺序。该指令内部可以包含filter、match指令。示例：

@type http bind 0.0.0.0 port 8888 # 指定路由标签 @label @STAGING # http源直接跳转到这里，不使用上面的filter @type grep key action pattern ^logout$ @type stdout

parse

可以位于source、match、filter指令的内部。对于那些支持的插件，用于解析原始数据。示例：

@type tail # 输入插件的参数 # 解析插件的类型 @type apache2 # 解析插件的参数

通用参数

每个Parser都可以覆盖这些参数的值：

参数类型说明

types hash
指定如何将各字段转换为其它类型：field1:type,field2:type...

支持的类型：string、bool、integer、float、time、array

time_key string 事件的发生事件从什么字段中获取，如果该字段不存在，则取值当前时间

null_value_pattern string 空值的Pattern

null_empty_string bool 是否将空串替换为nil，默认false

estimate_current_event bool 是否以当前时间作为time_key的值，默认false

keep_time_key bool 是否保留事件中的时间字段

时间参数

参数类型说明

time_type enum
可选值：

float：UNIX时间.纳秒
unixtime： UNIX时间（秒）
string：根据后面几个参数决定具体格式

time_format string
参考Ruby API：时间格式化、时间解析

除了遵循Ruby的时间格式化，还可以取值%iso8601

localtime bool 是否使用本地时间而非UTC，默认true

utc bool 是否使用UTC而非本地时间，默认false

timezone string 指定时区，例如+09:00、+0900、+09、Asia/Tokyo

buffer

可以位于match指令的内部，指定如何对事件进行缓冲（避免对输出的目的地造成压力）。Fluentd内置了两种缓冲插件：memory、file。

使用buffer指令时，你也需要通过@type来指定插件类型。如果省略@type，则使用输出插件（match）指定的默认插件，或者使用memory。

分块键

你可以为buffer指定分块键：

# 为空，或者逗号分隔的字符串

分块键决定了事件被收集到哪个缓冲块：

如果不指定分块键（并且输出插件也没有指定默认分块键），则输出插件将所有的事件都写到单个块中，直到此块充满

如果分块键被设置为“tag”，则不同标签（Tag）的事件被收集到不同的缓冲块

如果分块键被设置为“time”，且指定了timekey参数，则每个Time Key对应一个缓冲块：

# 如果不指定单位，默认为秒 timekey 1h # 每小时一个块 timekey_wait 5m # 延迟5分钟刷出缓冲

如果分块键被设置为其它值，则认为是事件记录的字段名

使用事件记录的嵌套字段也支持：
# 访问记录的nest.field字段

联用多个分块键也支持：

占位符

某些输出插件，可以使用分块键作为变量：

@type file path /data/${tag}/access.${key1}.${$.nest.field}.log # 输出文件名使用变量，不同块输出到不同文件

缓冲参数

参数类型说明

chunk_limit_size size 缓冲块的最大尺寸，默认值：内存缓冲8MB，文件缓冲256MB

chunk_limit_records integer 限制单个块最多包含的记录数

total_limit_size size 此缓冲插件实例的总限制。默认值：内存缓冲512MB，文件缓冲64GB

chunk_full_threshold float 刷空缓冲块的阈值，默认0.95，也就是缓冲块占用超过95%刷出

compress enum 取值text、gzip，缓冲块的压缩算法。默认text表示不压缩

刷空参数

参数类型说明

flush_at_shutdown bool 关闭前是否刷空

flush_mode enum
刷空模式：

interval 以flush_interval为周期刷空
lazy 每个timekey刷空一次
immediate 事件进入缓冲块后立即刷空

flush_interval time 默认60s

flush_thread_count integer 输出插件的线程数量，默认1，增大可以并行刷出缓冲块

flush_thread_interval float 如果没有缓冲块等待被刷出，则本次刷空后，线程休眠几秒以进行下一次尝试

flush_thread_burst_interval float 如果有缓冲块排队等待被刷出时的休眠间隔

delayed_commit_timeout time 输出插件认定异步写操作失败的超时，默认60s

overflow_action enum
当缓冲队列满了，输出插件的行为：

throw_exception 抛出异常，打印错误
block 阻塞输入插件，禁止它释放新事件
drop_oldest_chunk 丢弃最旧的缓冲块

重试参数

参数类型说明

retry_timeout time 重试超时，默认72h

retry_forever bool 是否永远重试，默认false

retry_max_times integer 最大重试刷空的次数

retry_type enum
重试方式：

exponential_backoff 频率指数降低
periodic 频率恒定

对于指数方式，底数由参数retry_exponential_backoff_base确定，默认2

对于指数方式，最大重试间隔由retry_max_interval确定

retry_wait time 下一次重试的等待间隔，默认1s

retry_randomize bool 是否随机化重试间隔，默认true。可以防止高并发

format

部分插件支持在内部包含format指令，用来指定如何对日志记录进行格式化。match、filter指令内部可以包含format指令：

@type file @type json

内置的插件包括：out_file、json、ltsv、csv、msgpack、hash、single_value。下面的配置，将事件的log字段存储到文件：

@type file path /var/log/kubernetes @type single_value message_key log

inject

可以位于match、filter指令内部，向事件记录注入额外的字段。

extract

可以位于source、match、filter指令内部，从事件记录中抽取值。

storage

部分插件支持此指令，用于指定如何存储插件的内部状态。可以位于source、match、filter指令内部。

transport

使用server插件助手的source、match、filter插件，支持在内部配置该指令。用于说明如何处理网络连接。

@include

该指令用于包含其它配置文件

system

该指令用于进行系统级的配置，包括配置项：

配置项说明

log_level 日志级别，可以取值debug、info、error、fatal

suppress_repeated_stacktrace

emit_error_log_interval

suppress_config_dump

without_source

process_name 配置fluentd的supervisor和worker进程的名称

事件结构

每个Fluentd事件包含以下部分：

Tag：标签，用于说明事件的“来源”，用于事件路由。标签是点号（.）分隔的多个字符串

Time：事件发生的时间，必须是UNIX time格式

Record：实际的日志内容，JSON对象形式

标签匹配

标签（Tag）是日志事件的一种属性。filter、match指令可以指定一个匹配Pattern，来声明它负责处理哪些事件：

Pattern 说明

app.tag 精确匹配

app.* 匹配app.tag1、app.tag2，但是不匹配app.tag1.xx

app.** 匹配任何以app开头的标签

app.{x,y}.* 匹配app.x.*以及app.y.*，其中x、y可以是Pattern，例如app.{x,y.**}

app.tag app.tag 或

Fluentd根据配置文件中声明的顺序，自上而下的尝试匹配，一旦找到匹配日志事件的filter、match就不再继续。

配置文件

如果通过td-agent包安装，则配置文件位置为/etc/td-agent/td-agent.conf。

如果通过Ruby Gem安装，则配置文件位置为/etc/fluent/fluent.conf。

要修改配置文件的位置，使用环境变量FLUENT_CONF，或者命令行选项 -c

配置参数

任何一个Fluentd插件都暴露若干可配置参数。

参数类型

类型说明

string 字符串

integer 整数

float 浮点数

size 字节数量

time 时间长度（Duration）

array JSON数组，可以
["key1", "key2"]
形式，或者
key1,key2
形式

hash JSON对象，可以
{"key1":"value1", "key2":"value2"}
或者
key1:value1,key2:value2

通用参数

Fluentd定义了一系列以@开头的参数：

参数说明

@type 插件类型

@id 插件ID

@label 指定路由标签

@log_level 插件的日志级别

type, id 和 log_level是对应上面几个参数，向后兼容用。

内嵌Ruby代码

你可以在字符串中包含
#{}
标记，其中可以包含合法的Ruby表达式，示例：

host_param "#{Socket.gethostname}" env_param "foo-#{ENV["FOO_BAR"]}"

输入插件

tail

这是一个内置插件，不需要额外的安装步骤。该插件从目标配置文件的尾部开始读取新产生的日志。

参数类型说明

tag string 支持使用通配符 * ，该符号会展开为日志文件的实际路径

path string
需要读取的日志的路径，可以指定多个路径，逗号分隔

通配符*和strftime格式占位符可以使用，用以动态的添加/移除日志文件：

# 仅仅读取default命名空间的日志 path /var/log/containers/*_default_*.log # 日期 path /path/to/%Y/%m/%d/*

exclude_path array
需要排除掉的日志路径，示例：
exclude_path ["/path/to/*.gz", "/path/to/*.zip"]

read_from_head bool 从文件的头部开始读取日志，而非尾部

directive 你必须为tail配置parse指令，说明如何解析日志内容

systemd

读取并解析Systemd日志。示例：
@type systemd @id in_systemd_kubelet # 读取Kubelet.service的0-5级别的日志 matches [{ "_SYSTEMD_UNIT": "kubelet.service", "PRIORITY": [0,1,2,3,4,5] }] @type local persistent true path /var/log/fluentd-journald-kubelet-cursor.json fields_strip_underscores true read_from_head false tag kubelet

过滤插件

record_transformer

支持以多种方式来修改事件。

参数类型说明

directive
在该指令中，定义需要新增加的字段。配置示例：

@type record_transformer enable_ruby # 添加主机名 hostname "#{Socket.gethostname}" # 将事件的标签存储为记录字段 tag ${tag} # 读取事件标签的第2部分 service_name ${tag_parts[1]} # 读取记录的字段并进行运算 avg ${record["total"] / record["count"]} # 一个名为message的字段，使用$进行字符串插值 message yay, ${record["message"]}

支持以下方式来访问标签：

tag_parts[N] 标签的第N段
tag_prefix[N] 标签的0-N段
tag_suffix[N] 标签的N+段

enable_ruby bool
默认false。如果为true，则可以在${}中包含Ruby代码，代码可以使用变量：

record 当前事件记录
time 当前事件的时间对象

配置示例：

@type record_transformer enable_ruby remove_keys [ "log" ] # 从%-5p %d{yyyy-MM-dd HH:mm:ss.SSS} ::: [%15.15t] %-48.48c{36} ::: %m%n%ex # 形式的Logback Pattern中抽取字段 level ${record["log"][0,5].strip} timestamp ${record["log"][6,23]} thread ${record["log"][35,15].strip} class ${record["log"][52,49].strip} message ${record["log"][105..-1].strip}

代码示例：

# 将记录转换为JSON ${record.to_json} # 格式化时间 ${time.strftime('%Y-%m-%dT%H:%M:%S%z')} # 取标签的最后一段 ${tag_parts.last} # 访问嵌套字段 ${record["payload"]["key"]}

auto_typecast bool 默认false。是否自动进行类型转换

renew_record bool 默认false。如果true则在空的新哈希上进行操作，而非修改incoming的记录

renew_time_key string 使用指定的字段来修改事件的时间，目标字段必须是UNIX time

keep_keys array 仅当renew_record=true时有意义。列出记录中需要保留的键

remove_keys array 列出需要删除的键

grep

根据事件的字段进行过滤，不匹配的记录被丢弃。

参数类型说明

directive
内部指定几个其它指令，进行与操作：

directive 内部指定几个其它指令，进行或操作

directive
指定基于正则式的匹配规则，不匹配的事件会被排除：
# 检查的字段 key price # 匹配的正则式 pattern /[1-9]\d*/

directive 类似上面，但是匹配的事件会被排除

示例：
# 针对所有以calico-node开头的日志 @type grep @id filter_grep_container_calico_node # 针对日志记录的log字段 key log # 仅仅保留警告、错误日志 pattern ^.{25}(W|E) # 仅仅保留具有标签tier=application的Pod产生的日志 @type grep @id filter_grep_kubernetes key $.kubernetes.labels.tier pattern ^application$

parser

解析日志的字符串字段，并把事件记录替换为解析结果：

参数类型说明

directive 指定解析器及其参数

key_name string 需要被解析的记录字段名

reserve_time bool 是否在新记录中保留原始事件的时间字段

reserve_data bool 是否在新记录中保留原始时间的所有字段

remove_key_name_field bool 如果解析成功，是否删除key_name指定的原始事件字段，1.2.2引入

inject_key_prefix string 解析结果字段，统一增加的前缀

hash_value_field string 解析结果字段，以哈希（对象）形式保存为该参数指定字段的值

emit_invalid_record_to_error bool 是否将无法解析的记录发射给@ERROR标签

示例，解析ElasticSearch的JSON格式的日志，并把Wrapping Docker日志替换掉：

@type parser @id filter_parser_containers_es_master key_name log reserve_time true reserve_data true remove_key_name_field true @type json time_format %Y-%m-%dT%H:%M:%S.%NZ

concat

该插件非内置，执行
gem install fluent-plugin-concat
安装。

用于将多个日志事件合并为一个。具有工作三种模式：

n_lines 将连续的N个事件合并为一个

multiline_start_regexp ... 根据正则式匹配来确定该事件是否作为合并后的第一个、中间事件、最后一个

partial_key 取源事件中的某个字段，如果该字段的值为partial_value指定的值，则认为它应该合并到前面的事件

注意：如果超时后仍然没有接收到被合并序例的的最后一个事件，则整个序列会被丢弃。

下面的示例用于处理被Docker的日志驱动按行收集的Java Logback日志信息，它会将日志中的异常栈合并到一起，然后与它们之前的（紧靠着的）那个事件合并：

@type concat @log_level trace key log multiline_start_regexp /^(TRACE|DEBUG|INFO|WARN|ERROR|FATAL)/ timeout_label @ES @type relabel @label @ES ...

解析插件

regexp

根据正则式来解析日志。指定的正则式至少需要指定一个命名捕获，命名捕获会作为记录的字段，名字为time的命名捕获，会作为事件的发生时间。

参数类型说明

time_key string 事件的发生时间字段，默认time

time_format string 时间的格式

keep_time_key string 是否在记录中保留时间字段，默认false

expression regexp
解析日志的正则式，需要指定至少一个命名捕获

下面的例子解析Containerd默认日志：

expression /^(?.{30}) (?\w+) . (?.*)$/

types string
指定解析出的各字段的类型，如果不指定所有字段为string类型。格式：
types :,: # 示例 types user_id:integer,paid:bool,paid_usd_amount:float

支持的类型：string、bool、integer、float、time、array

multiline

regexp的多行版本，支持将多行日志合并为一个事件，特别适用于解析异常栈。

参数类型说明

time_key string 事件的发生时间字段，默认time

time_format string 时间的格式

format_firstline string 匹配多行日志事件的第一行的正则式

formatN string N可以是1-20，指定完整的日志事件格式

keep_time_key string 是否在记录中保留时间字段，默认false

Java异常日志的例子：

@type multiline # 识别新记录的正则式 format_firstline /\d{4}-\d{1,2}-\d{1,2}/ # 解析完整记录的正则式 format1 /^(?\d{4}-\d{1,2}-\d{1,2} \d{1,2}:\d{1,2}:\d{1,2}) \[(?.*)\] (?[^\s]+)(?.*)/ # 第一个记录 2013-3-03 14:27:33 [main] INFO Main - Start # 第二个记录 2013-3-03 14:27:33 [main] ERROR Main - Exception javax.management.RuntimeErrorException: null at Main.main(Main.java:16) ~[bin/:na] # 第三个记录 2013-3-03 14:27:33 [main] INFO Main - End

Rails日志的例子：

@type multiline # 识别新记录的正则式 format_firstline /^Started/ # 分为多个参数，每个参数对应一行日志信息 format1 /Started ([^ ]+) "([^"]+)" for ([^ ]+) at ([^ ]+ [^ ]+ [^ ]+)\n/ format2 /Processing by ([^\u0023]+)\u0023([^ ]+) as ([^ ]+)\n/ format3 /( Parameters: ([^ ]+)\n)/ format4 / Rendered (

参数	类型	说明
include_tag_key	bool	是否将事件的Fluentd Tag作为ES文档的字段存储字段名默认为tag，可以用参数tag_key修改
logstash_format	bool	兼容Logstash格式的索引命名，设置为true才能使用Kibana 如果设置为true自动忽视参数index_name，索引名称自动设置为： #{logstash_prefix}-#{formated_date}
time_key	string	默认情况下，@timestamp自动会自动设置为消费日志的时间，如果要修改此行为，通过该参数指定一个记录字段名
include_timestamp	bool	是否包含一个@timestamp字段到输出文档中
logstash_prefix	string	索引名前缀，默认logstash
logstash_dateformat	string	作为索引名后缀的日期格式

查询串示例	说明
level:error	level字段包含单词error
level:(error OR warn) level:(error warn)	level字段包含单词error或warn 操作符默认OR
message: "Connection Reset"	精确包含短语Connection Reset
user.\*:(alex)	user的任何字段包含alex
_exists_:title	title字段不为空
level:e?r*	通配符：*匹配任意个数字符，?匹配单个字符
name:/joh?n(ath[oa]n)/	支持正则式
quikc~1	模糊查询操作符~，可以匹配拼写错误的情况。1为距离，默认2，取值1可以捕获80%的拼写错误
age:>10 age:>=10 age:<10 age:<=10	比较操作符
(quick OR brown) AND fox	分组操作符
date:[2012-01-01 TO 2012-12-31] count:[1 TO 5]	范围查询，闭区间
tag:{alpha TO omega}	范围查询，开区间（不包含首尾）
count:[10 TO *]	范围查询，无上限

需求	配置步骤
X轴显示时间，根据应用程序名称拆分Series	点选X-Axis，聚合方式选择Date Histogram。可以设置X轴的标签点击Add sub-bucket，选择Split Series 子聚合方式选择Terms，字段选择kubernetes.labels.app.keyword 点击做面板右上角的“播放”按钮，测试效果

参数	说明
dateFormat	日期显示格式，例如MM-DD HH:mm:ss.SSS
truncate:maxHeight	检索时，每条日志占用的最大UI高度

构件	说明
curator-recipes	对于大部分用户来说，只需要依赖此构件。包含所有recipes
curator-async	异步DSL
curator-framework	Curator框架的高层API
curator-client	客户端，代理ZooKeeper类
curator-x-discovery	基于 Curator框架的服务发现实现
curator-x-discovery-server	用于Curator发现的RESTful服务器

绿色记忆 » BigData

ElasticSearch学习笔记

基于EFK构建日志分析系统

Apache Curator学习笔记

Apache Drill学习笔记

Apache Storm学习笔记

Kafka Streams学习笔记

Apache Kafka学习笔记

OpenTSDB学习笔记

ZooKeeper学习笔记

MongoDB学习笔记

配置项	说明
log_level	日志级别，可以取值debug、info、error、fatal
suppress_repeated_stacktrace
emit_error_log_interval
suppress_config_dump
without_source
process_name	配置fluentd的supervisor和worker进程的名称

Pattern	说明
app.tag	精确匹配
app.*	匹配app.tag1、app.tag2，但是不匹配app.tag1.xx
app.**	匹配任何以app开头的标签
app.{x,y}.*	匹配app.x.以及app.y.，其中x、y可以是Pattern，例如app.{x,y.**}
app.tag app.tag	或

参数	说明
@type	插件类型
@id	插件ID
@label	指定路由标签
@log_level	插件的日志级别

方法	说明
create	启动一个znode创建操作，可以调用额外方法来设置节点类型、添加Watcher，使用forPath完成操作： client.create().withMode(CreateMode.EPHEMERAL_SEQUENTIAL).forPath("/user", new byte[0]);
delete	启动一个删除操作，使用forPath完成操作： client.delete().inBackground().forPath("/user");
checkExists	启动一个检查znode存在性的操作，使用forPath完成操作
getData	启动一个获取znode关联数据的操作，使用forPath完成操作： client.getData().watched().inBackground().forPath("/user");
setData	启动一个设置znode关联数据的操作，使用forPath完成操作
getChildren	启动获取znode子节点集合的操作，使用forPath完成操作
transactionOp	调用以生成供transaction()使用的操作条目
transaction	原子的提交一系列的操作条目
getACL	启动一个获取znode访问控制列表的操作，使用forPath完成操作
setACL	启动一个设置znode访问控制列表的操作，使用forPath完成操作

状态	说明
CONNECTED	第一次成功连接到ZooKeeper后，进入此状态。对于每个CuratorFramework对象，此状态仅出现一次
READONLY	连接进入只读模式，调用CuratorFrameworkFactory.Builder.canBeReadOnly(true)后导致此状态
SUSPENDED	到ZooKeeper的连接丢失
RECONNECTED	丢失的连接被重新建立
LOST	当Curator认为ZooKeeper会话已经过期，则进入此状态。可能的原因包括： ZooKeeper返回Watcher.Event.KeeperState.Expired或者KeeperException.Code.SESSIONEXPIRED Curator关闭了内部管理的ZooKeeper客户端实例由于网络中断导致的会话过期

Recipe	说明
DistributedAtomicLong	分布式的原子的整数，支持自增、自减、加、减等操作
NodeCache	拥有监控一个znode。每当数据变更或者此节点被删除，NodeCache都会更新自己的状态，反映当前数据（如果节点被删除数据为null）
PathChildrenCache	用于监控一个znode。每当添加、更新、删除子节点时，PathChildrenCache都会更新自己的状态，反映最新的子节点集合、子节点数据、子节点状态
TreeCache	监控一个znode的整个子树
PersistentNode	尝试驻留ZooKeeper的节点，即使在连接/会话中断的情况下
PersistentTtlNode	如果你想创建TTL节点，但是又不愿意手工周期性设置其数据，可以使用
GroupMember	管理并缓存一组成员，用于构建集群成员列表

选项	说明
drill.exec.http.ssl_enabled	布尔（TRUE\|FALSE），默认FALSE。是否启用HTTPS支持
drill.exec.sys.store.provider.class	设置持久化存储提供者（PStore），PStore保存配置数据、Profile
drill.exec.buffer.size	缓冲区大小，增加此配置可以加快查询速度
drill.exec.sort.external.spill.directories	进行Spool操作时使用的目录
drill.exec.zk.connect	提供ZooKeeper连接字符串
drill.exec.profiles.store.inmemory	布尔，默认FALSE。是否在内存中存放查询Profiles
drill.exec.profiles.store.capacity	上个选项取值TRUE时，内存中最多存放的查询Profiles数量

插件配置	说明
cp	指向Drill类路径中的JAR文件，你可以对其中的文件进行查询
dfs	指向本地文件系统。你可以使用对应的存储引擎配置指向任意分布式系统，例如Hadoop
hbase	提供到HBase的连接
hive	将Drill和Hive的元数据抽象（文件、HBase）机制集成
mongo	提供到MongoDB的连接

数据类型	说明
BIGINT	8字节有符号整数
BINARY	变长二进制字符串，示例：B@e6d9eb7
BOOLEAN	布尔值，示例：true
DATE	YYYY-MM-DD格式的日期
DECIMAL(p,s) DECIMAL(p,s) NUMERIC(p,s)	38位精度数字
FLOAT	4字节浮点数
DOUBLE	8字节浮点数
INTEGER INT	4字节有符号整数
INTERVAL	日/月时间间隔
SMALLINT	2字节有符号整数
TIME	HH:mm:ss格式的日期
TIMESTAMP	yyyy-MM-dd HH:mm:ss.SSS格式的时间戳
CHARACTER VARYING CHARACTER CHAR VARCHAR	UTF-8字符串
Map	键值对形式的容器，KVGEN、FLATTEN函数用于处理此类型
Array	数组形式的容器，FLATTEN函数用于处理此类型

窗口函数分类	说明
聚合	AVG() 计算平均值、COUNT()计算总数、MAX()计算最大值、MIN()计算最小值、SUM()求和
排名	返回当前行在分组中的排名： CUME_DIST() 返回相对排名：(高名次行数 + 同名次行数) / 总行数 DENSE_RANK() 根据窗口的ORDER BY表达式进行排序，排序号不存在gap，也就是说同名次（peer）不会导致后续名次跳号 NTILE() 尽可能的把窗口分组中的所有行划分到指定数量的排名组中 PERCENT_RANK()，百分比排名：(当前行数 - 1) / (分组总行数 - 1) RANK()，类似于第2个，但是允许gap存在，也就是说两行并列的第1名之后的名次是3 ROW_NUMBER()，返回行号，取决于ORDER BY表达式
值	LAG()，返回分组中上一行的某个列（或者表达式）的值，如果没有上一行，返回NULL LEAD()，返回分组中下一行的某个列（或者表达式）的值，如果没有下一行，返回NULL FIRST_VALUE()，返回窗口中第一行的值 LAST_VALUE()，返回窗口中最后一行的值

参数	类型	说明
path	string	文件前缀，实际文件路径为path + time + .log，其中time取决于time_slice_format
append	bool	刷出的chunk是否覆盖到已经存在的文件。默认情况下每个chunk都输出到不同位置（即取值false）不同取值对应的文件布局： # append false log.20140608_0.log log.20140608_1.log log.20140609_0.log log.20140609_1.log # append true log.20140608.log log.20140609.log
format	string	输出文件格式
time_format	string	日期写出格式
compress	string	输出压缩算法，默认gzip
time_slice_format	string	用于文件名中time部分的、时间的格式化方式： %Y: 年度 %m: 月份 01-12 %d: 日期01-31 %H: 小时00-23 %M: 分钟00-59 %S: 秒00-60 默认取值 %Y%m%d%H ，也就是每小时一个文件
time_slice_wait	time	Fluentd等待迟到日志到达的最大时间，默认10m。用于处理事件到达fluentd节点有延迟的情况
flush_interval	time	刷出缓冲的间隔，默认60s

	Storm	Hadoop
组件	JobTracker	Nimbus
	TaskTracker	Supervisor
	Child	Worker
应用	Job	Topology
接口	Mapper/Reducer	Spout /Bolt

流分组	说明
Shuffle	最常用的一种流分组。元组被随机的分发给Bolt的Task，此实现保证每个Task接受相等数量的元组
Fields	根据元组的字段值进行分组，字段值相同的元组被分发给同一个Task 可以基于1-N个字段的值进行分组
Partial Key	元组首先按照字段分组的方式被分区，并进一步的被两个下游的Bolt进行负载均衡
All	输入流的每个元组被复制到Bolt的所有实例（Task）需要执行某种广播逻辑时，考虑使用这种流分组
Global	整个流被转发给单个具有最小Id的那个Task
None	表示不关心如何进行分组，当前此分组的行为和Shuffle类似。Storm在处理这种方式分组的流时，上游Spout/Bolt和下游Bolt使用同一执行线程
Direct	上游Spout/Bolt（生产者）直接决定元组分发给下游Bolt（消费者）的哪个Task 这种分组方式仅仅能应用到被声明为直接流（Direct Stream）的流上。要释放元组到直接流上，必须调用OutputCollector.emitDirect方法。获得消费者的Task Id途径可以是：通过TopologyContext获得根据OutputCollector.emit方法的返回值获得，返回值是接受元组的Task 的Id 示例代码： // 获得某个下游组件的所有Task Id Set taskIds = context.getTaskToComponent( "downstream-bolt-id" ).keySet(); // 发送给目标Task collector.emitDirect( taskId,tuple );
Local or shuffle	如果下游Bolt在相同（与释放流的组件）工作进程（Work Process）中行运行着一个或者更多的Task，则元组被分发给这些进程内的Task。否则，行为与Shuffle grouping相同

类型	说明
AssignableMetric	支持设置度量为一个明确的值
CombinedMetric	可以被关联更新的度量的通用接口
CountMetric	计数性的度量，其方法 incr() 用于增加1个计数， incrBy(n) 用于增加n个计数
MultiCountMetric	CountMetric的HashMap
ReducedMetric	MeanReducer：用于求平均值 MultiReducedMetric：ReducedMetric的HashMap

消费者	说明
LoggingMetricsConsumer	监听度量值，以TSV格式存储到文件
HttpForwardingMetricsConsumer	监听度量值，以HTTP Post方式发送到外部服务器

配置	说明
worker.profiler.command	指定剖析工具
worker.profiler.enabled	可能被禁用，如果JDK不支持JFR记录、剖析插件也不可用的话

子命令	说明
list [KEY...]	列出当前存储的blob
cat [-f FILE] KEY	读取一个blob，写入到文件或者stdout
create [-f FILE] [-a ACL ...] [--replication-factor NUMBER] KEY	创建一个blob，其内容来自文件或者stdin ACL是一个逗号分隔的列表，条目格式[uo]:[username]:[r-][w-][a-]
update [-f FILE] KEY	更新一个blob的内容
delete KEY	删除一个blob
set-acl [-s ACL] KEY	设置一个blob的访问控制列表
replication --read KEY	读取blob的复制因子

Spout类型	说明
ITridentSpout	最通用的接口，可以用于实现事务性、非透明事务性语义
IBatchSpout	每次释放一个元组批次的非事务性Spout
IPartitionedTridentSpout	从分区数据源（例如Kafka集群）读取数据的事务性Spout
IOpaquePartitionedTridentSpout:	从分区数据源（例如Kafka集群）读取数据的非透明事务性Spout

Spout	说明
事务性Spout	事务性Spout有以下特性：每个批次的txid总是保持不变。Replay时，批次包含的元组完全不变不同批次的元组没有交集任何元组都属于一个批次这是最理想、简单的情况。例如storm-contrib提供的支持Kafka的事务性Spout实现：TransactionalTridentKafkaSpout 事务性Spout对应的状态实现，利用了txid和元组集的绝对对应关系。用一个例子说明，现在有一个Trident拓扑，用于统计单词出现数量，并持久化到一个键（单词）值（计数）数据库中。为了支持事务性，仅仅存储键值对是不够的，你必须知道哪些批次已经入库。由于Trident批次的严格有序性，额外引入一个值字段，记录上一次处理完成的txid就可以了。当Replay时，如果发现库中txid和当前批次的txid一样，跳过入库步骤即可更具体化一些，假设txid 3包含元组： ["man"] ["man"] ["dog"] ，当前数据库状态如下： # 一定要保证，状态和txid原子性的入库 man => [count=3, txid=1] # After [count=5, txid=3] dog => [count=4, txid=3] # After [count=4, txid=3] apple => [count=10, txid=2] 可以看到，单词man计数3，上一次成功的txid不等于当前txid3，因此应当把本批次的man计数2入库。再强调一下，由于批次的严格有序性，只要库中的txid不等于当前txid，那么它必然是前面批次的txid而绝不会是后面的。再看看dog记录的txid和当前txid一致，因此本批次dog计数1不应该入库为什么上一次提交出现dog入库成功，man入库失败的情况呢？这牵涉到底层数据源的工作机制，我们假设它不支持原子的写两个键值那么需要担心txid 没有处理完成么？不需要，还是严格有序性问题，一旦txid3执行到更新状态源这一步了，说明前面所有txid都成功完成了
不透明事务性Spout	为什么不仅仅使用事务性Spout？原因是，保证完全的容错可能需要更苛刻的外部条件，而这种容错级别可能并非必要以TransactionalTridentKafkaSpout为例，它的一个批次中的元组，可能来自Kafka主题的所有分区。一旦某个批次被释放，为了满足事务性语义，未来它处理失败需要Replay时，所有分区都必须可读。如果某个Kafka节点宕机（假设没有启用Replication）了呢？那么分区就读不到，相应的就无法满足事务性，整个Trident拓扑就卡住了不透明（Opaque）事务性拓扑用于解决上述问题。它允许丢失某些数据源节点，但是仍然保证一次性处理语义不透明事务性拓扑的特性是：不保证每个批次的元组完全一致保证每个元组仅仅在一个批次中被成功处理。一个元组可能在Batch 1中失败，后来在Batch 3中成功 OpaqueTridentKafkaSpout是不透明事务性Spout的例子，它允许Kafka主题的某个分区节点临时宕机。不管什么时候，它总是从上一批次最后一个Kafka记录（对应元组）的偏移量处读取下一个批次。这确保每个记录仅仅被一个批次成功处理使用不透明事务时，记录txid字段的技巧不再有效，因为批次Replay时它包含的元组可能不同。但是，引入更多的状态字段，仍然可以达成容错目标。仍然看单词计数的例子，假设当前状态源的数据如下： man => ( // 对于每个单词，存储三个字段，这些字段仍然需要原子的更新 value => 4, // 本次事务更新后的值 prevValue => 1, // 本次事务更新前的值 txid => 2 // 本次事务ID ) 现在来了包含元组 ["man"] ["man"] 的txid2，也就是和数据库记录的txid相同。这意味着什么？txid2的上一次尝试失败了。由于同一事务的两个批次的元组集可能不同，因此上次尝试记录的value是无效的。应当以prevValue为基准加上本批次包含的元组数量2，成功处理后数据变为： man => ( value => 3, prevValue => 1,txid => 2 ) 然后，又来了包含元组 ["man"] ["man"] 的txid3，也就是和数据库记录的txid不同。这意味着上一次批次处理成功了，因此数据库中记录的value是有效的。应当以value为基准加上本批次包含的元组数量2，成功处理后数据变为： man => ( value => 5, prevValue => 3,txid => 3 ) 这种机制的关键仍然是严格有序性，一旦txid3准备入库，就可以确信txid2是成功的，因此其value就有效，否则，必须回滚为prevValue再行计算
非事务性Spout	不对批次中包含的内容作任何保证

操作	说明
Function	函数根据一系列输入字段，经过计算产生0-N个输出字段。这些输出字段被添加到原始的输入元组中，构成新的字段如果函数没有释放新字段，则对应的元组被过滤掉要创建函数，考虑继承BaseFunction，要在Trident中使用函数，调用流的each方法
Filter	过滤器以元组为输入，决定它是否被保留要创建过滤器，考虑继承BaseFilter，要在Trident中使用过滤器，可以调用流的filter方法
map	针对每个元组进行1:1的转换，输出为转换后的元组要创建Map函数，考虑继承MapFunction，要在Trident中使用它，调用map方法
flatMap	针对每个元组进行1:N的转换，输出为转换后的元组要创建flatMap函数，考虑继承FlatMapFunction，要在Trident中使用它，调用flatMap方法
peek	用于针对每个元组进行额外的操作，例如查看每个元组如果经过处理管线。可以用于调试目的 peek不会影响流的后续处理
project	仅仅保留选中的输入元组字段，示例： // 仅仅保留b、d两个字段 stream.project(new Fields("b", "d"))
min / minBy	对一个元组批次的每一个分区，返回该分区中指定字段的值最小的那个元组。你可以自定义比较器函数
max / maxBy	对一个元组批次的每一个分区，返回该分区中指定字段的值最大的那个元组。你可以自定义比较器函数
Windowing	后文详述
partitionAggregate	针对批次的每个分区进行内部的聚合操作，其输出替换掉输入元组，示例： stream.partitionAggregate(new Fields("price"), new Sum(), new Fields("sum")); // 输出元组包含一个字段
stateQuery	查询状态源
partitionPersist	更新状态源

重新分区操作	说明
shuffle	随机轮回方式将元组均匀的分配给所有分区
broadcast	将每个元组广播（重复）到所有分区
partitionBy	根据一系列字段进行语义分区，先根据字段值计算哈希，然后针对分区数量取模，取模结果相同的元组被发给同一分区
global	所有元组被发送给单个分区，所有批次也都发送给该分区
batchGlobal	所有元组被发送给单个分区，不同批次可以发送给不同分区
partition	传入一个重分区函数（实现CustomStreamGrouping接口）进行分区操作

聚合操作	说明
aggregate	针对每个批次（的所有分区）进行聚合操作
persistentAggregate	针对流的所有批次进行聚合操作，并且将结果存放在状态源

聚合器接口	说明
CombinerAggregator	接口签名： public interface CombinerAggregator extends Serializable { // 针对每个输入元组，进行初始化，产生一个值 T init(TridentTuple tuple); // 每个元组产生的值，一次被送入下面的函数进行reduce，直到仅剩一个值 T combine(T val1, T val2); // 如果没有任何输入元组，调用此函数 T zero(); } 此聚合器返回单个字段构成的单一元组作为输出进行aggregate（而非partitionAggregate）时，此聚合器接口的优势体现在，Trident能够自动优化，尽可能的进行局部聚合，避免发送网络流量
ReducerAggregator	接口签名： public interface ReducerAggregator extends Serializable { // 初始值 T init(); // 针对每个输入元组进行reduce T reduce(T curr, TridentTuple tuple); } 可以和persistentAggregate一起使用
Aggregator	这个是最一般化的接口： public interface Aggregator extends Operation { // 在处理每个批次之前，调用返回值是一个代表了聚合状态的对象，会被传递给后面两个方法 T init(Object batchId, TridentCollector collector); // 针对批次分区中每个输入元组调用。此方法会更新state，还可以释放元组 void aggregate(T state, TridentTuple tuple, TridentCollector collector); // 当批次分区中所有输入元组都被处理之后调用此方法 void complete(T state, TridentCollector collector); }

时间	说明
Event Time/事件时间	事件或者数据记录的产生时间。以GPS位置采集记录为例，事件时间应该是GPS传感器捕获到位置的那个时间
Ingestion Time/吸收时间	数据记录被存入到Kafka分区日志的时间
Process Time/处理时间	数据记录被Kafka Streams处理完毕的时间

操作	说明
branch	IO：KStream → KStream 基于给定的断言集分割KStream，将其分割为1-N个KStream实例。断言按照声明的顺序依次估算，每个记录只被转发到第一个匹配的下游流中： KStream stream = ...; KStream[] branches = stream.branch( (key, value) -> key.startsWith("A"), /* 以A开头的键 / (key, value) -> key.startsWith("B"), / 以B开头的键 / (key, value) -> true / 所有其它的记录均发往此流 */ );
filter	IO：KStream → KStream 或 KTable → KTable 基于给定的断言，针对每个记录进行估算。估算结果为true的记录进入下游流： // 仅保留正数值 stream.filter((key, value) -> value > 0); // 针对一个KTable进行过滤，结果物化到一个StageStore中 Materialized m = Materialized.>as("filtered") table.filter((key, value) -> value != 0, m);
filterNot	与filter类似，仅仅保留不匹配的
flatMap	IO：KStream → KStream 基于一个记录，产生0-N个输出记录： KStream transformed = stream.flatMap( (key, value) -> { // 键值对的列表 List> result = new LinkedList<>(); result.add(KeyValue.pair(value.toUpperCase(), 1000)); result.add(KeyValue.pair(value.toLowerCase(), 9000)); return result; } );
flatMapValues	类似于flatMap，但是保持键不变，可能产生多个键相同的记录
foreach	IO：KStream → void 终结性操作，针对每个记录执行无状态的操作需要注意：操作的副作用（例如对外部系统的写）无法被Kafka跟踪，也就是说无法获得Kafka的处理语义保证示例： stream.foreach((key, value) -> System.out.println(key + " => " + value));
groupByKey	IO：KStream → KGroupedStream 分组是进行流/表的聚合操作的前提。分组保证了数据被正确的分区，保证后续操作的正常进行和分组相关的一个操作是窗口化。利用窗口化，可以将分组后的记录二次分组，形成一个个窗口，然后以窗口为单位进行聚合、Join 仅当流被标记用于重新分区，则此操作才会导致重新分区。该操作不允许修改键或者键类型示例： KGroupedStream groupedStream = stream.groupByKey( // 如果键值的类型不匹配配置的默认串行化器，则需要明确指定： Serialized.with( Serdes.ByteArray(), Serdes.String()) );
groupBy	IO：KStream → KGroupedStream 或 KTable → KGroupedTable 实际上是selectKey+groupByKey的组合基于一个新的键来分组记录，新键的类型可能和记录旧的键类型不同。当对表进行分组时，还可以指定新的值、值类型该操作总是会导致数据的重新分区，因此在可能的情况下你应该优选groupByKey，后者仅在必要的时候分区示例： KGroupedStream groupedStream = stream.groupBy( (key, value) -> value, // 产生键值对value:value并依此分组 Serialize.with( Serdes.String(), /* 键的类型发生改变 / Serdes.String()) / value / ); KGroupedTable groupedTable = table.groupBy( // 产生键值对 value:length(value)，并依此分组 (key, value) -> KeyValue.pair(value, value.length()), Serialized.with( Serdes.String(), / 键的类发生改变 / Serdes.Integer()) / 值的类型发生改变 */ );
map	IO：KStream → KStream 根据一个输入记录产生一个输出记录，你可以修改键值的类型 KStream stream = ...; KStream transformed = stream.map( (key, value) -> KeyValue.pair(value.toLowerCase(), value.length()));
mapValues	类似上面，但是仅仅映射值，键不变
print	IO：KStream → void 终结操作，打印记录到输出流中。示例： stream.print(Printed.toFile("stream.out"));
selectKey	IO：KStream → KStream 对每个记录分配一个新的键，键类型可能改变。 KStream rekeyed = stream.selectKey((key, value) -> value.split(" ")[0])
toStream	IO：KTable → KStream 将表转换为流： table.toStream();
WriteAsText	IO：KStream → void 终结性操作，将流写出到文件

API	说明
Producer	发布数据流到Kafka集群的主题上
Consumer	从Kafka集群的主题上读取数据流
Streams	在输入主题、输出主题之间进行数据流的转换
Connect	实现连接器，可以持续的从外部数据源拉拉取数据并发布到主题，或者持续的将主题推送到外部应用或者Sink系统
AdminClient	管理、查看代理、主题以及其它Kafka对象

配置项	说明
bootstrap.servers	如何连接到Kafka集群
key.converter value.converter	如何将键值从Java对象形式转换为Kafka串行化格式

配置项	说明
offset.storage.file.filename	此参数对单实例模式很重要，指明在何处存放偏移量数据

配置项	说明
group.id	集群的唯一名称，默认connect-cluster。用于构成Kafka Connect集群组此名称不能和Kafka消费者组名冲突
config.storage.topic	用于存放Connector、Task配置的主题的名称，默认connect-configs 应当是单个分区、大复制因子、压缩格式的主题
offset.storage.topic	用于存放偏移量。应当是多分区、复制的、压缩的主题
status.storage.topic	用于存放状态信息。应当是多分区、复制的、压缩的主题

配置项	说明
name	连接器的唯一性名称，尝试注册重复名称的连接器会导致失败
connector.class	连接器的Java类，可以指定权限定名或者别名，例如org.apache.kafka.connect.file.FileStreamSinkConnector、FileStreamSink、FileStreamSinkConnector都表示同一个连接器
tasks.max	最多为此连接器创建的Task数量
key.converter value.converter	覆盖Worker配置指定的键值转换器
topics	作为此连接器输入/输出的主题列表

配置项	说明
transforms	转换器的列表，配置顺序对应了转换器的执行顺序
transforms.$alias.type	$alias为转换器指定一个别名转换器的全限定类名
transforms.$alias.$transformationSpecificConfig	转换器的私有配置项