• 元数据:_all 字段

    元数据:_all 字段

    在【简单搜索】中,我们介绍了 _all 字段:一个所有其他字段值的特殊字符串字段。query_string 在没有指定字段时默认用 _all 字段查询。

    _all 字段在新应用的探索阶段比较管用,当你还不清楚最终文档的结构时,可以将任何查询用于这个字段,就有机会得到你想要的文档:

    1. GET /_search
    2. {
    3. "match": {
    4. "_all": "john smith marketing"
    5. }
    6. }

    随着你应用的发展,搜索需求会变得更加精准。你会越来越少的使用 _all 字段。_all 是一种简单粗暴的搜索方式。通过查询独立的字段,你能更灵活,强大和精准的控制搜索结果,提高相关性。

    提示

    【相关性算法】考虑的一个最重要的原则是字段的长度:字段越短,就越重要。在较短的 title 字段中的短语会比较长的 content 字段中的短语显得更重要。而字段间的这种差异在 _all 字段中就不会出现

    如果你决定不再使用 _all 字段,你可以通过下面的映射禁用它:

    1. PUT /my_index/_mapping/my_type
    2. {
    3. "my_type": {
    4. "_all": { "enabled": false }
    5. }
    6. }

    通过 include_in_all 选项可以控制字段是否要被包含在 _all 字段中,默认值是 true。在一个对象上设置 include_in_all 可以修改这个对象所有字段的默认行为。

    你可能想要保留 _all 字段来查询所有特定的全文字段,例如 title, overview, summarytags。相对于完全禁用 _all 字段,你可以先默认禁用 include_in_all 选项,而选定字段上启用 include_in_all

    1. PUT /my_index/my_type/_mapping
    2. {
    3. "my_type": {
    4. "include_in_all": false,
    5. "properties": {
    6. "title": {
    7. "type": "string",
    8. "include_in_all": true
    9. },
    10. ...
    11. }
    12. }
    13. }

    谨记 _all 字段仅仅是一个经过分析的 string 字段。它使用默认的分析器来分析它的值,而不管这值本来所在的字段指定的分析器。而且像所有 string 类型字段一样,你可以配置 _all 字段使用的分析器:

    1. PUT /my_index/my_type/_mapping
    2. {
    3. "my_type": {
    4. "_all": { "analyzer": "whitespace" }
    5. }
    6. }