• 缓存地理位置过滤器

    缓存地理位置过滤器

    因为如下两个原因,地理位置过滤器默认是不被缓存的:

    • 地理位置过滤器通常是用于查找用户当前位置附近的东西。但是用户是在移动的,并且没有两个用户的位置完全相同,因此缓存的过滤器基本不会被重复使用到。

    • 过滤器是被缓存为比特位集合来表示段(segment)内的文档。假如我们的查询排除了几乎所有文档,只剩一个保存在这个特别的段内。一个未缓存的地理位置过滤器只需要检查这一个文档就行了,但是一个缓存的地理位置过滤器则需要检查所有在段内的文档。

    缓存对于地理位置过滤器也可以很有效。
    假设你的索引里包含了所有美国的宾馆。一个在纽约的用户是不会对旧金山的宾馆感兴趣的。
    所以我们可以认为纽约是一个热点hot spot),然后画一个边框把它和附近的区域围起来。

    如果这个地理盒模型过滤器geo_bounding_box)被缓存起来,那么当有位于纽约市的用户访问时它就可以被重复使用了。
    它可以直接排除国内其它区域的宾馆。然后我们使用未缓存的,更加明确的地理盒模型过滤器geo_bounding_box)或者地理距离过滤器geo_distance)来在剩下的结果集中把范围进一步缩小到用户附近:

    1. GET /attractions/restaurant/_search
    2. {
    3. "query": {
    4. "filtered": {
    5. "filter": {
    6. "bool": {
    7. "must": [
    8. {
    9. "geo_bounding_box": {
    10. "type": "indexed",
    11. "_cache": true, <1>
    12. "location": {
    13. "top_left": {
    14. "lat": 40,8,
    15. "lon": -74.1
    16. },
    17. "bottom_right": {
    18. "lat": 40.4,
    19. "lon": -73.7
    20. }
    21. }
    22. }
    23. },
    24. {
    25. "geo_distance": { <2>
    26. "distance": "1km",
    27. "location": {
    28. "lat": 40.715,
    29. "lon": -73.988
    30. }
    31. }
    32. }
    33. ]
    34. }
    35. }
    36. }
    37. }
    38. }
    • <1> 缓存的地理盒模型过滤器把结果集缩小到了纽约市。
    • <2> 代价更高的地理距离过滤器geo_distance)让结果集缩小到1km内的用户。