您的位置:

Elasticsearch模糊查询的全面介绍

一、Elasticsearch模糊查询快吗

在使用Elasticsearch进行数据检索时,模糊查询是一项非常常见的操作。那么,Elasticsearch的模糊查询速度是否足够快呢?

首先,我们需要注意的是,Elasticsearch的模糊查询本身并没有速度上的优劣之分,而更多地是受到一些其他因素的影响。

要想让Elasticsearch的模糊查询保持快速,我们需要注意以下几点:

首先是节点数量的配置,如果节点数量过多,会导致数据过度分散,从而影响查询速度;反之,节点数量过少,会导致数据聚集在一起,也会影响查询速度。

其次是数据量的大小,当数据量过大时,会导致查询速度 significantly reduce。

最后是查询语句的编写,过于复杂的查询语句,会导致查询速度过慢。


GET /my_index/my_type/_search
{
  "query": {
    "fuzzy": {
      "title": {
        "value":     "quick",
        "fuzziness": "AUTO"
      }
    }
  }
}

二、Elasticsearch模糊查询wildcard

Elasticsearch提供了wildcard查询,可以进行通配符匹配的模糊查询操作。比如,我们可以使用以下查询语句实现通配符匹配,找出所有以“es”结尾的文档:


GET /my_index/my_type/_search
{
  "query": {
    "wildcard": {
      "title": {
        "value": "*es"
      }
    }
  }
}

在wildcard模糊查询中,通配符“*”可以匹配任意字符序列(包括空字符序列),而“?”可以匹配单个字符。但是请注意,使用通配符查询会影响Elasticsearch查询的性能,所以建议在查询的时候进行权衡。

三、Elasticsearch模糊查询太慢

在进行模糊查询的时候,有可能会因为数据量太大,导致查询速度过慢。解决这个问题,我们可以选择在建立索引时,使用更轻量级的方式来减少索引的体积。

在Elasticsearch中,我们可以使用asymmetric mapping来减小索引的体积,这种方式会在建立索引的时候,把字段信息存储在某一个特定的field中,而不是像传统方式那样把每个field的信息都存储一份。


PUT /my_index
{
  "mappings": {
    "my_type": {
      "properties": {
        "title": {
          "type": "text",
          "fields": {
            "raw": {
              "type": "keyword"
            },
            "asym": {
              "type": "text",
              "index_options": "offsets"
            }
          }
        }
      }
    }
  }
}

在使用Elasticsearch进行模糊查询时,我们可以使用asym字段来进行查询,这样会减小查询语句的响应时间。

四、Elasticsearch模糊查询原理

Elasticsearch的模糊查询是基于Levenshtein Distance算法实现的。简单来说,Levenshtein Distance算法就是用来计算两个字符串之间的差异度的算法。

它会把两个字符串中的每个字符都按照一定的顺序进行对比,最终得到一个差异度的值。当我们在进行模糊查询的时候,就是通过这个差异度的值来进行查询的。

在实际的使用过程中,我们会发现,Elasticsearch的模糊查询不仅可以用于英文,也同样适用于其他语言,比如中文、韩文等。这是因为Levenshtein Distance算法是普适性的,在对任何语言进行模糊查询时都可以使用。

五、ElasticSearch中文文档选取

在使用Elasticsearch进行模糊查询的时候,我们通常会需要参考官方文档进行查询操作。下面是几个比较有用的ElasticSearch中文文档:

1.中文文档:https://www.elastic.co/guide/cn/elasticsearch/guide/cn/index.html

2.国内文档:http://es.xiaoleilu.com/index.html

3.官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

以上文档都提供了非常详细的Elasticsearch使用说明,特别对于模糊查询部分有着举足轻重的作用。

六、结语

以上就是关于Elasticsearch模糊查询的全面介绍了。在实际的开发过程中,我们应该根据实际情况选择不同的查询方式来进行优化。了解更多有关Elasticsearch的资讯,我们可以订阅Elasticsearch的官方文档。