filter与query深入对比解密：相关度，性能

2020-02-11

字数统计: 388 | 阅读时长≈ 1 分钟

filter与query深入对比解密：相关度，性能

1、filter与query示例

构建数据:

PUT /company/employee/2
{
“address”: {
“country”: “china”,
“province”: “jiangsu”,
“city”: “nanjing”
},
“name”: “tom”,
“age”: 30,
“join_date”: “2016-01-01”
}

PUT /company/employee/3
{
“address”: {
“country”: “china”,
“province”: “shanxi”,
“city”: “xian”
},
“name”: “marry”,
“age”: 35,
“join_date”: “2015-01-01”
}

搜索请求：年龄必须大于等于30，同时join_date必须是2016-01-01

GET /company/employee/_search
{
“query”: {
“bool”: {
“must”: [
{
“match”: {
“join_date”: “2016-01-01”
}
}
],
“filter”: {
“range”: {
“age”: {
“gte”: 30
}
}
}
}
}
}

2、filter与query对比大解密

filter:仅仅只是按照搜索条件过滤出需要的数据而已，不计算任何相关度分数，对相关度没有任何影响
query:会去计算每个document相对于搜索条件的相关度，并按照相关度进行排序

一般来说，如果你是在进行搜索，需要将最匹配搜索条件的数据先返回，那么用query；如果你只是要根据一些条件筛选出一部分数据，不关注其排序，那么用filter
除非这些搜索条件，你希望越符合这些搜索条件的document越排在前面返回，那么这些搜索条件要放在query中；如果你不希望一些搜索条件来影响你的document排序，那么就放在filter中即可

3、filter与query性能

filter: 不需要计算相关度分数，不需要按照相关度分数进行排序，同时还有内置的自动cache最常使用filter的数据
query: 相反，要计算相关度分数，按照分数进行排序，而且无法cache结果,性能相对要低一些.

打赏

版权声明： 本博客所有文章除特别声明外，著作权归作者所有。转载请注明出处！