美团外卖搜索基于Elasticsearch的优化实践

爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

美团外卖搜索基于Elasticsearch的优化实践

　　美团外卖搜索工程团队在Elasticsearch的优化实践中，基于LocationBasedService（LBS）业务场景对Elasticsearch的查询性能进行优化。该优化基于RunLengthEncoding（RLE）设计了一款高效的倒排索引结构，使检索耗时（TP99）降低了84。本文从问题分析、技术选型、优化方案等方面进行阐述，并给出最终灰度验证的结论。1。前言
　　最近十年，Elasticsearch已经成为了最受欢迎的开源检索引擎，其作为离线数仓、近线检索、B端检索的经典基建，已沉淀了大量的实践案例及优化总结。然而在高并发、高可用、大数据量的C端场景，目前可参考的资料并不多。因此，我们希望通过分享在外卖搜索场景下的优化实践，能为大家提供Elasticsearch优化思路上的一些借鉴。
　　美团在外卖搜索业务场景中大规模地使用了Elasticsearch作为底层检索引擎。其在过去几年很好地支持了外卖每天十亿以上的检索流量。然而随着供给与数据量的急剧增长，业务检索耗时与CPU负载也随之上涨。通过分析我们发现，当前检索的性能热点主要集中在倒排链的检索与合并流程中。针对这个问题，我们基于RunlengthEncoding（RLE）〔1〕技术设计实现了一套高效的倒排索引，使倒排链合并时间（TP99）降低了96。我们将这一索引能力开发成了一款通用插件集成到Elasticsearch中，使得Elasticsearch的检索链路时延（TP99）降低了84。2。背景
　　当前，外卖搜索业务检索引擎主要为Elasticsearch，其业务特点是具有较强的LocationBasedService（LBS）依赖，即用户所能点餐的商家，是由商家配送范围决定的。对于每一个商家的配送范围，大多采用多组电子围栏进行配送距离的圈定，一个商家存在多组电子围栏，并且随着业务的变化会动态选择不同的配送范围，电子围栏示意图如下：
　　图1电子围栏示意图
　　考虑到商家配送区域动态变更带来的问题，我们没有使用GeoPolygon〔2〕的方式进行检索，而是通过上游一组Rtree服务判定可配送的商家列表来进行外卖搜索。因此，LBS场景下的一次商品检索，可以转化为如下的一次Elasticsearch搜索请求：POSTfoodsearch｛query：｛bool：｛must：｛term：｛spuname：｛value：烤鸭｝｝。。。｝，filter：｛terms：｛wmpoiid：〔1，3，18，27，28，29，。。。，37465542〕上万｝｝｝｝。。。｝
　　对于一个通用的检索引擎而言，Terms检索非常高效，平均到每个Term查询耗时不到0。001ms。因此在早期时，这一套架构和检索DSL可以很好地支持美团的搜索业务耗时和资源开销尚在接受范围内。然而随着数据和供给的增长，一些供给丰富区域的附近可配送门店可以达到2000030000家，这导致性能与资源问题逐渐凸显。这种万级别的Terms检索的性能与耗时已然无法忽略，仅仅这一句检索就需要510ms。3。挑战及问题
　　由于Elasticsearch在设计上针对海量的索引数据进行优化，在过去的10年间，逐步去除了内存支持索引的功能（例如RAMDirectory的删除）。为了能够实现超大规模候选集的检索，ElasticsearchLucene对Term倒排链的查询流程设计了一套内存与磁盘共同处理的方案。
　　一次Terms检索的流程分为两步：分别检索单个Term的倒排链，多个Term的倒排链进行合并。3。1倒排链查询流程从内存中的TermIndex中获取该Term所在的Block在磁盘上的位置。从磁盘中将该Block的TermDictionary读取进内存。对倒排链存储格式的进行Decode，生成可用于合并的倒排链。
　　可以看到，这一查询流程非常复杂且耗时，且各个阶段的复杂度都不容忽视。所有的Term在索引中有序存储，通过二分查找找到目标Term。这个有序的Term列表就是TermDictionary，二分查找Term的时间复杂度为O（logN），其中N是Term的总数量。Lucene采用FiniteStateTransducer〔3〕（FST）对TermDictionary进行编码构建TermIndex。FST可对Term的公共前缀、公共后缀进行拆分保存，大大压缩了TermDictionary的体积，提高了内存效率，FST的检索速度是O（len（term）），其对于M个Term的检索复杂度为O（Mlen（term））。3。2倒排链合并流程
　　在经过上述的查询，检索出所有目标Term的PostingList后，需要对这些PostingList求并集（OR操作）。在Lucene的开源实现中，其采用Bitset作为倒排链合并的容器，然后遍历所有倒排链中的每一个文档，将其加入DocIdSet中。
　　伪代码如下：Input：termsEnum：倒排表；termIterator：候选的termOutput：docIdSet：finaldocssetfortermintermIterator：iftermsEnum。seekExact（term）！null：docsreaddisk（）磁盘读取docsdecode（docs）倒排链的decode流程fordocindocs：docIdSet。or（doc）代码实现为DocIdSetBuilder。add。endfordocIdSet。build（）合并，排序，最终生成DocIdSetBuilder，对应火焰图最后一段。
　　假设我们有M个Term，每个Term对应倒排链的平均长度为K，那么合并这M个倒排链的时间复杂度为：O（KMlog（KM））。可以看出倒排链合并的时间复杂度与Terms的数量M呈线性相关。在我们的场景下，假设一个商家平均有一千个商品，一次搜索请求需要对一万个商家进行检索，那么最终需要合并一千万个商品，即循环执行一千万次，导致这一问题被放大至无法被忽略的程度。
　　我们也针对当前的系统做了大量的调研及分析，通过美团内部的JVMProfile系统得到CPU的火焰图，可以看到这一流程在CPU热点图中的反映也是如此：无论是查询倒排链、还是读取、合并倒排链都相当消耗资源，并且可以预见的是，在供给越来越多的情况下，这三个阶段的耗时还会持续增长。
　　图2profile火焰图
　　可以明确，我们需要针对倒排链查询、倒排链合并这两个问题予以优化。4。技术探索与实践4。1倒排链查询优化
　　通常情况下，使用FST作为Term检索的数据结构，可以在内存开销和计算开销上取得一个很好的平衡，同时支持前缀检索、正则检索等多种多样的检索Query，然而在我们的场景之下，FST带来的计算开销无法被忽视。
　　考虑到在外卖搜索场景有以下几个特性：Term的数据类型为long类型。无范围检索，均为完全匹配。无前缀匹配、模糊查找的需求，不需要使用前缀树相关的特性。候选数量可控，每个商家的商品数量较多，即Term规模可预期，内存可以承载这个数量级的数据。
　　因此在我们的应用场景中使用空间换取时间是值得的。
　　对于Term查询的热点：可替换FST的实现以减少CPU开销，常见的查找数据结构中，哈希表有O（1）的查询复杂度，将Term查找转变为对哈希表的一次查询。
　　对于哈希表的选取，我们主要选择了常见的HashMap和LongObjectHashMap。
　　我们主要对比了FST、HashMap和LongObjectHashMap（哈希表的一种高性能实现）的空间和时间效率。在内存占用上：FST的内存效率极佳。而HashMapLongObjectHashMap都有明显的劣势；在查询时间上：FST的查询复杂度在O（len（term）），而HashLongObjectHashMap有着O（1）的查询性能；
　　注：检索类型虽然为Long，但是我们将底层存储格式进行了调整，没有使用开源的BKDTree实现，使用FST结构，仅与FST进行对比。BKDTree在大批量整数terms的场景下劣势更为明显。
　　我们使用十万个Long，Long的键值对来构造数据，对其空间及性能进行了对比，结果如下：
　　可以看到，在内存占用上FST要远优于LongObjectHashMap和HashMap。而在查询速度上LongObjectHashMap最优。
　　我们最终选择了LongObjectHashMap作为倒排链查询的数据结构。4。2倒排链合并
　　基于上述问题，我们需要解决两个明显的CPU热点问题：倒排链读取倒排链合并。我们需要选择合适的数据结构缓存倒排链，不再执行磁盘pagecache的IO。数据结构需要必须满足以下条件：支持批量Merge，减少倒排链Merge耗时。内存占用少，需要处理千万数量级的倒排链。
　　在给出具体的解决方案之前，先介绍一下Lucene对于倒排合并的原生实现、RoaringBitMap、IndexSorting。4。2。1原生实现
　　Lucene在不同场景上使用了不同的倒排格式，提高整体的效率（空间时间），通过火焰图可以发现，在我们的场景上，TermInSetQuery的倒排合并逻辑开销最大。
　　TermInSetQuery的倒排链合并操作分为两个步骤：倒排链读取和合并。倒排链读取：Lucene倒排链压缩存储在索引文件中，倒排链读取需要实时解析，其对外暴露的API为迭代器结构。倒排链合并：倒排链合并主要由DocIdSetBuilder合并生成倒排链，先使用稀疏结构存储DocID，当DocID个数超过一定阈值时，升级到稠密结构（FixedBitSet）存储，实现方式如下（对应代码IntArrayDocIdSetBitDocIdSet）：稀疏数据：存储采用Listint〔〕array方式存储DocID，最终经过Merge和排序形成一个有序数组int〔〕，耗时主要集中在数组申请和排序。稠密数据：基于long〔〕实现的bitmap结构（FixedBitSet），耗时主要集中在FixedBitSet的插入过程，由于倒排链需要实时Decode以及FixedBitSet的底层实现，无法实现批量Merge，只能循环单个DocID插入，数据量大的情况下，耗时明显。
　　我们采用线上流量和数据压测发现该部分平均耗时约7ms。4。2。2RoaringBitmap
　　当前Elasticsearch选择RoaringBitMap做为QueryCache的底层数据结构缓存倒排链，加快查询速率。
　　RoaringBitmap是一种压缩的位图，相较于常规的压缩位图能提供更好的压缩，在稀疏数据的场景下空间更有优势。以存放Integer为例，RoaringBitmap会对存入的数据进行分桶，每个桶都有自己对应的Container。在存入一个32位的整数时，它会把整数划分为高16位和低16位，其中高16位决定该数据需要被分至哪个桶，我们只需要存储这个数据剩余的低16位，将低16位存储到Container中，若当前桶不存在数据，直接存储null节省空间。RoaringBitmap有不同的实现方式，下面以Lucene实现（RoaringDocIdSet）进行详细讲解：
　　如原理图中所示，RoaringBitmap中存在两种不同的Container：BitmapContainer和ArrayContainer。
　　图3Elasticsearch中Roaringbitmap的示意图
　　这两种Container分别对应不同的数据场景若一个Container中的数据量小于4096个时，使用ArrayContainer来存储。当ArrayContainer中存放的数据量大于4096时，RoaringBitmap会将ArrayContainer转为BitmapContainer。即ArrayContainer用于存放稀疏数据，而BitmapContainer用于存放稠密数据，这样做是为了充分利用空间。下图给出了随着容量增长ArrayContainer和BitmapContainer的空间占用对比图，当元素个数达到4096后（每个元素占用16bit），ArrayContainer的空间要大于BitmapContainer。
　　备注：RoaringBitmap可参考官方博客〔4〕。4。2。3IndexSorting
　　Elasticsearch从6。0版本开始支持IndexSorting〔5〕功能，在索引阶段可以配置多个字段进行排序，调整索引数据组织方式，可以调整文档所对应的DocID。以cityid，poiid为例：
　　图4IndexSorting示意图
　　如上示例所示：IndexSorting会将给定的排序字段（如上图的cityid字段）的文档排序在一起，相同排序值的文档的DocID严格自增，对该字段建立倒排，那么其倒排链为自增数列。4。3基于RLE的倒排格式设计
　　基于以上的背景知识以及当前ElasticsearchLucene的解决方案，可以明确目前有2个改造点需要考虑。合适的倒排结构，用于存储每个Term的倒排链。合适的中间结构，用于存储多个Term合并后的倒排链。
　　对于索引倒排格式PostingsEnum，支持接口为：publicabstractclassDocIdSetIterator｛publicabstractintdocID（）；publicabstractintnextDoc（）；publicabstractintadvance（inttarget）；｝
　　倒排仅支持单文档循环调用，不支持批量读取，因此需要为倒排增加批量顺序读取的功能。
　　对于多倒排链的合并，由于原结构DocIdSetBuilder的实现也不支持批量对数据进行合并，我们探索了评估了Elasticsearch用于缓存QueryCache的数据结构RoaringBitMap，然而其实现RoaringDocIdSet也无法满足我们对缓存数据结构特性需求，主要问题：原生RoaringDocIdSet在构建时，只能支持递增的添加DocID。而在实际生产中每一个商家的商品的DocID都是离散的。这就限制了其使用范围。原生RoaringDocIdSet的底层存储结构BitmapContainer和ArrayContainer均不支持批量合并，这就无法满足我们对倒排链合并进行优化的需求。
　　在明确这个问题的场景下，我们可以考虑最简单的改造，支持索引倒排格式PostingsEnum的批量读取。并考虑了如下几种场景：在支持批量读取倒排的情况下，直接使用原结构DocIdSetBuilder进行批量的合并。在支持批量读取倒排的情况下，使用RoaringBitMap进行批量合并。
　　然而我们发现即使对bitset进行分段合并，直接对数据成段进行OR操作，整体开销下降并不明显。其原因主要在于：对于读取的批量结果，均为稀疏分布的DocID，仅减少倒排的循环调用无法解决性能开销问题。
　　那么问题需要转化为如何解决DocID分布稀疏的问题。在上文提及的IndexSorting即一个绝佳的解决方案。并且由于业务LBS的特点，一次检索的全部结果集均集中在某个地理位置附近，以及我们检索仅针对门店列表ID的特殊场景，我们最终选择对城市ID、Geohash、门店ID进行排序，从而让稀疏分布的DocID形成连续分布。在这样的排序规则应用之后，我们得到了一组绝佳的特性：每一个商家所对应的商品，其DocID完全连续。4。3。1RunLengthEncoding
　　RunLengthEncoding〔3〕（RLE）技术诞生于50年前，最早应用于连续的文本压缩及图像压缩。在2014年，第一个开源在GitHub的RoaringBitmap诞生〔6〕，2016年，在RoaringBitMap的基础上增加了对于自增序列的RLE实现〔7〕，并应用在bitmap这一场景上。
　　在bitmap这一场景之下，主要通过压缩连续区间的稠密数据，节省内存开销。以数组〔1，2，3，。。。，59，60，89，90，91，。。。，99，100〕为例（如下图上半部分）：使用RLE编码之后就变为〔1，60，89，12〕形如〔start1，length1，start2，length2，。。。〕的形式，其中第一位为连续数字的起始值，第二位为其长度。
　　在数组完全连续场景下中，对32768个id（short）进行存储，数组存储需要64kB，Bitmap存储需要使用4kB，而RLE编码后直接存储仅需要4byte。在这一特性下，如果商家倒排链完全有序，那么商家的倒排链，可被压缩到最低仅需要两个整数即可表示。
　　当然RLE并不适用所有情况，在目标序列完全不连续的场景下，如〔1，3，5，7，。。。，M〕，RLE编码存储需要使用2Mbyte的空间，比数组直接存储的空间效率差一倍。
　　为了和Elasticsearch的实现保持一致，我们决定使用RoaringBitMap作为倒排存储的结构，以及中间结果合并的数据结构。针对RoaringDocIdSet我们进行了如下改造。
　　图5倒排链Merge方式的演进4。3。2RLEContainer的实现
　　在对商家ID字段开启IndexSorting之后，同商家的商品ID已经连续分布。那么对于商家字段的倒排链就是严格自增且无空洞的整数序列。我们采用RLE编码对倒排链进行编码存储。由于将倒排链编码为〔start1，length1，start2，length2，。。。〕，更特殊的，在我们场景下，一个倒排链的表示为〔start，length〕，RLE编码做到了对倒排链的极致压缩，假设倒排链为〔1，2，。。。。，1000〕，用ArrayContainer存储，内存空间占用为16bit100200Byte，RLE编码存储只需要16bit24Byte。考虑到具体的场景分布，以及其他场景可能存在多段有序倒排的情况，我们最终选择了〔start1，length1，start2，length2，。。。〕这样的存储格式，且〔start，startlength〕之间两两互不重叠。
　　对于多个商家的倒排合并流程，对于该格式的合并，我们并不需要对M个倒排链长度为K进行循环处理，这个问题转变为：如何对多组分段〔start，length〕进行排序，并将排序后的结果合并为一个数组。那么我们将原时间复杂度为的合并流程，改造为复杂度为O（MlogM）的合并流程，大大降低了合并的计算耗时，减少了CPU的消耗。4。3。3SparseRoaringDocIdSet实现
　　我们在RoaringDocIdSet的基础上增加了RLEContainer后，性能已经得到了明显的提升，加速了50，然而依然不符合我们的预期。我们通过对倒排链的数据分析发现：倒排链的平均长度不大，基本在十万内。但是其取值范围广〔0，Integer。MAX1〕。这些特征说明，如果以RoaringDocIdSet按高16位进行分桶的话，大部分数据将集中在其中连续的几个桶中。
　　在Elasticsearch场景上，由于无法预估数据分布，RoaringDocIdSet在申请bucket容器的数组时，会根据当前Segment中的最大DocID来申请，计算公式为：（maxDoc（116）1）16。这种方式可以避免每次均按照Integer。MAX1来创建容器带来的无谓开销。然而，当倒排链数量偏少且分布集中时，这种方式依然无法避免大量bucket被空置的空间浪费；另一方面，在对倒排链进行合并时，这些空置的bucket也会参与到遍历中，即使它被置为了空。这就又造成了性能上的浪费。我们通过压测评估证实了这一推理，即空置的bucket在合并时也会占用大量的CPU资源。
　　针对这一问题，我们设计了一套用于稀疏数据的方案，实现了SparseRoaringDocIdSet，同时保持接口与RoaringDocIdSet一致，可在各场景下进行复用，其结构如下：classSparseRoaringDocIdSet｛int〔〕index；记录有container的bucketIndexContainer〔〕denseSets；记录紧密排列的倒排链｝
　　保存倒排链的过程与RoaringDocIDSet保持一致，在确认具体的Container的分桶时，我们额外使用一组索引记录所有有值的bucket的location。
　　下图是一组分别使用RLEbasedRoaringDocIdSet和SparseRoaringDocIdSet对〔846710，100，936858，110〕倒排链（RLE编码）进行存储的示意图：
　　图6SparseRoaringDocIdSet编排
　　可以看到：在SparseRoaringDocIdSet实现下，所有不为空的bucket被紧密的排列在了一起，并在index〔〕中记录了其原始bucket的索引，这就避免了大量bucket被空置的情况。另外，在进行倒排链的合并时，就可以直接对紧密排列的denseSet进行遍历，并从index〔〕获得其对应的原始bucketlocation，这就避免了大量的空置bucket在合并时带来的性能浪费。
　　我们分别对以下4个场景进行了压测：原生的TermInSetQuery对倒排链的合并逻辑、基于FixedBitSet的批量合并、RLEbasedRoaringBitmap、RLEbasedDenseRoaringBitmap。对10000个平均长度为100的倒排链进行合并压测，压测结果如下：
　　图7倒排链Merge性能比对
　　我们实现的RLEbasedDenseRoaringBitmap，相比官方的基准实现耗时降低了96（TP9913ms下降至0。5ms）。4。4功能集成
　　至此，核心的倒排索引问题已经解决，后续主要为工程问题：如何在Elasticsearch系统中集成基于RLE的倒排格式。对于高吞吐高并发的C端在线场景，我们希望尽可能保障线上的稳定，对开源数据格式的兼容，保障前向的兼容，做到随时可降级。
　　工程部分主要分为两部分：倒排索引的集成和在线检索链路。以下主要介绍全量索引部分的链路设计。4。4。1倒排索引集成
　　倒排索引格式的改造，一般情况下，需要实现一套PostingsFormat，并实现对应的Reader、Writer。为了保证对原有检索语句的兼容，支持多种场景的检索，以及为了未来能够无缝的配合Elasticsearch的版本升级，我们并没有选择直接实现一组新的PostingsFormat，避免出现不兼容的情况导致无法升级版本。我们选择了基于现有的倒排格式，在服务加载前后初始化RLE倒排，并考虑到业务场景，我们决定将RLE倒排全量放入内存中，以达到极致的性能。具体的解决方案为：索引加载过程中增加一组Hook，用于获取现有的InternalEngine（Elasticsearch中负责索引增删改查的主要对象）。对所有的semgents遍历读取数据，解析倒排数据。对所有配置了RLE倒排优化的字段，生成RLE倒排表。将RLE倒排表与segment做关联，保证后续的检索链路中能获取到倒排表。
　　为了避免内存泄漏，我们也将索引删除，segment变更的场景进行了相应的处理。4。4。2在线检索链路
　　在线检索链路也采用了无侵入兼容的实现，我们实现了一套新的检索语句，并且在索引无RLE倒排的情况下，可以降级回原生的检索类型，更加安全。
　　我们基于Elasticsearch的插件机制，生成一组新的Query，实现了其AbstractQueryBuilder，实现对Query的解析与改写，并将Query与RLE倒排进行关联，我们通过改写具体的检索实现，将整个链路集成到Elasticsearch中。5。性能收益
　　对于Elasticsearch而言，一次检索分为这么几个阶段，可参考下图〔8〕。
　　图8Elasticsearch的检索过程由协调节点进行请求的分发，发送到各个检索节点上。每个数据节点的各自进行检索，并返回检索结果给协调节点，这一段各个数据节点的耗时即数据节点查询耗时。协调节点等待所有数据节点的返回，协调节点选取TopK后进行fetch操作。1～3步的完整耗时为完整链路查询耗时。
　　我们将上述改动（IndexSortingDenseRoaringBitmapRLE）上线到生产环境的商品索引后，性能如下：
　　图9数据节点查询耗时
　　图10完整链路查询耗时
　　至此，我们成功将全链路的检索时延（TP99）降低了84（100ms下降至16ms），解决了外卖搜索的检索耗时问题，并且线上服务的CPU也大大降低。6。总结与展望
　　本文主要针对搜索业务场景中遇到的问题，进行问题分析、技术选型、压测、选择合适的解决方案、集成、灰度验证。我们最终实现了一套基于RLE倒排格式，作为一种新型的倒排格式，彻底解决了这个场景上的性能瓶颈，从分析至上线的流程长达数月。本文希望能提供一个思路，让其他同学在遇到Elasticsearch相关的性能问题时，也能遵循相同的路径，解决业务上的问题。
　　一般的，我们分析问题可以遵循这样的路径：明确性能问题后，首先通过流量录制，获得一个用于后续基准压测的测试集合。通过相关的性能分析工具，先明确是否存在CPU的热点或IO问题，对于Java技术栈，有很多常见的可用于分析性能的工具，美团内部有Scaple分析工具，外部可以使用JProfiler、JavaFlightRecorder、AsyncProfiler、Arthas、perf这些工具。对分析火焰图进行分析，配合源代码，进行数据分析和验证。此外在Elasticsearch中还可以通过Kibana的SearchProfiler用于协助定位问题。在录制大量的流量，抽样分析后，以我们的场景为例，进行Profiler后可以明确TermInSetQuery占用了一半以上的耗时。明确问题后从索引、检索链路两侧进行分析，评估问题，进行多种解决方案的设计与尝试，通过JavaMicrobenchmarkHarness（JMH）代码基准测试工具，验证解决方案的有效性。集成验证最终效果。
　　图11Kibana中的SearchProfiler示例
　　我们最终实现的关键点：使用哈希表来实现索引Term的精确查找，以此减少倒排链的查询与读取的时间。选取RoaringBitmap作为存储倒排链的数据结构，并与RLEContainer相结合，实现对倒排链的压缩存储。当然，最重要的是，RLE编码将倒排链的合并问题转换成了排序问题，实现了批量合并，从而大幅度减少了合并的性能消耗。
　　当然，我们的方案也还具有一些可以继续探索优化的地方。我们进行具体方案开发的时候，主要考虑解决我们特定场景的问题，做了一些定制化，以取得最大的性能收益。在一些更通用的场景上，也可以通过RLE倒排获得收益，例如根据数据的分布，自动选择bitmaparrayRLE容器，支持倒排链重叠的情况下的数据合并。
　　我们在发现也有论文与我们的想法不谋而合，有兴趣了解可以参考具体论文〔9〕。另外，在增量索引场景下，如果增量索引的变更量非常大，那么势必会遇到频繁更新内存RLE倒排的情况，这对内存和性能的消耗都不小，基于性能的考量，也可以直接将RLE倒排索引的结构固化到文件中，即在写索引时就完成对倒排链的编码，这样就能避免这一问题。7。作者简介
　　泽钰、张聪、晓鹏等，均来自美团到家事业群搜索推荐技术部搜索工程团队。8。参考文献
　　〔1〕https：en。wikipedia。orgwikiRunlengthencoding
　　〔2〕https：www。elastic。coguideenelasticsearchreference7。10querydslgeopolygonquery。html
　　〔3〕https：en。wikipedia。orgwikiFinitestatetransducer
　　〔4〕FrameofReferenceandRoaringBitmaps
　　〔5〕https：www。elastic。cocnblogindexsortingelasticsearch60
　　〔6〕ChambiS，LemireD，KaserO，etal。Betterbitmapperformancewithroaringbitmaps〔J〕。Software：practiceandexperience，2016，46（5）：709719。
　　〔7〕LemireD，SsiYanKaiG，KaserO。Consistentlyfasterandsmallercompressedbitmapswithroaring〔J〕。Software：PracticeandExperience，2016，46（11）：15471569。
　　〔8〕检索两阶段流程：https：www。elastic。coguidecnelasticsearchguidecurrentfetchphase。htmlfetchphase
　　〔9〕ArroyueloD，GonzlezS，OyarznM，etal。Documentidentifierreassignmentandrunlengthcompressedinvertedindexesforimprovedsearchperformance〔C〕Proceedingsofthe36thinternationalACMSIGIRconferenceonResearchanddevelopmentininformationretrieval。2013：173182。
　　本文系美团技术团队出品，著作权归属美团。欢迎出于分享和交流等非商业目的转载或使用本文内容，敬请注明内容转载自美团技术团队。本文未经许可，不得进行商业性转载或者使用。任何商用行为，请发送邮件至techmeituan。com申请授权。

佛山这有浪漫名字的古村，遇一树成林榕树，为何称国事榕如果你是爱生活爱旅行爱摄影爱美食，跟珊珊三丫头一起出发吧！榕树，是南方城市和乡村中常见的树，许多人对其是充满情怀，在没有手机和电脑的年代，记忆中总能找到一段与榕树有关的经历与童年小江都在泰州引江河东岸的两块地2019年江苏省政府同意将扬州市江都区浦头镇引江新村东野永兴2个村民小组划入泰州市海陵区行政区域，由泰州市海陵区寺巷街道大王居委会管理。许多人以为引江河东岸再没有江都的土地了，然而我第三次回介休老营房我和老伴带小外孙在炮212团原办公楼前转眼到了2017年7月，11岁的小外孙放了暑假，正是长身体学知识的时候，我与老伴就陪着他先是到河南洛阳看龙门石窟关林，到陕西西安看西安事变五间巩义的十大古寨河洛文化郑州头条头条创作挑战赛清代中后期，外国入侵，爆发了太平天国农民起义，为抵抗太平军北伐西征，清政府及地方官吏强令民众修建了许多寨堡民国时期，军阀混战，特别是抗日战争爆发后，巩在新疆开民宿怎么样？我们和8位主理人聊了聊近年来，中国民宿行业迅速扩张，民宿数量持续增长，西北地区增速尤其明显。2021年中国民宿数量增长的TOP2的省份就是新疆，增幅高达144。4。图源迈点研究院实际在新疆开民宿怎么样？郭虾蟆城大金王朝的句号郭虾蟆城是一处鲜为人知的地方。郭虾蟆城是我们身边的古战场。郭虾蟆城是大金王朝的句号。郭蛤蟆城遗址是祖厉河东岸的一片残垣断壁，位于会宁县郭城驿镇新堡子村西侧。郭虾蟆城古称会川城，兴建海南行之海口我在海口吃早茶去海南是想了很久的事情，正好女儿放假在家，也正好还没到大批学生放假，所以带着女儿就出发了。我的第一站就是海口，当然因为它是省会，也因为它的低调，它不像三亚那般热闹，也国庆自驾之旅河南漯河市临颍县小商桥（Day7，10月7日）驱车赶到小商桥的时候已经是10月7日傍晚17点20分了。在我的想象中，小商桥也就是路边的一座野桥，顶多边上立一座文保碑而已。等我们到了才发现，围绕着小商桥居然建立了一个景区。景区位西行漫记老娘今年身体大不如前，失眠，腰腿疼，都是没法治疗的老年病，除了去医院各种检查，我更多的想着怎么让她快乐的度过每一天，所以就想着和兄弟姊妹一起陪着去一趟新疆。出发的前一天晚上，姐还在又到丽江杀猪季！有老板全体放假去吃杀猪饭如果你问云南的吃货们最喜欢的季节那很多人会毫不犹豫地回答说是夏天因为夏天有令人为之痴醉的鲜美野生菌但是对于大多数丽江吃货来说冬天才是最有口福的季节因为入冬就意味着到了丽江人一年一度泰姬陵为什么是世界奇观？印度的泰姬陵（波斯语意为宫殿之冠）是一个印度伊斯兰建筑，可以追溯到17世纪。这座大理石陵墓位于印度阿格拉市的亚穆纳河畔，是世界上最受欢迎的旅游胜地之一。泰姬陵进入了现代世界七大奇迹

<<<<<<－>>>>>>

徒步旅行灵岩寺渐凉的秋天，唯有景色来温暖你心。PART01灵岩寺都江堰灵岩山风景区位于都江堰市西南角，紧挨玉垒山。距成都大约55公里，距都江堰市区大约45公里，灵岩寺在灵岩山七星岩下，古称灵岩圣晨报快讯延边州冰雪旅游季即将开启州内滑雪场11月末开放11月7日，记者从州内各大滑雪场景区了解到，目前各地冬季旅游项目正在抓紧筹备中，预计11月末逐渐开放。延吉梦都美滑雪场2022至2023雪季预计11月末对外开放，设有4条高级雪道，湖人14分负爵士，6417两项数据印证，球队一处顽疾所致文水清清116130，湖人14分负爵士。赛后，哈姆直言，我们今天的防守是巨大的退步，我们不能这样打球，球队此前引以为傲的联盟第3防守（防守效率值104。3），怎么就被爵士疯狂轰下1李易峰为什么嫖娼？想知道答案，请先放下你的单纯最近两天很多人都在问，李易峰明明多金有颜，为什么要去嫖娼呢？说实话，一开始对这个问题不以为意，因为道理浅显易懂。但后来想了想，这个世界上总有人很单纯，至少在当下是单纯的，所以决定说打卡新地标！东莞最大华为门店今日开业，就在松山湖11月5日上午，华为智能生活馆东莞松山湖万象汇盛大开业，现场同步举行智慧松湖创新空间授牌仪式。市委副书记松山湖党工委书记刘炜，松山湖党工委副书记管委会主任欧阳南江，东莞市工业和信息九位好看的高颜值女星或网红，颜值你分别打几分？你喜欢谁？这九个都好好看，你喜欢谁？她们的颜值都很高，冬天到了，保持颜值很重要，这里有三个冬季面部护理技巧，帮助你维持皮肤的水分。你的皮肤失去了自然水分，会导致发痒和干燥。在某些情况下，它甚实拍小鹏P5造型科幻，性价比高，能成为日常家用的首选吗？相较几年之前，国内汽车市场的巨大变化让人总是有些反应不过来的感觉，主流的燃油车已经渐渐被新能源瓜分走了大量市场，而且风向越来越稳定，在新能源领域出现的新款车型也越来越多，2022年月季盆景的养护月季盆景的养护兑宝峰月季盆景是自然美与艺术美的融合，是大自然精华的浓缩，也是大自然的艺术化再现。其生动优美意趣盎然的造型，是传统与时尚的结合。造型优美的月季盆景进一步提高了月季花的互联网大佬纷纷隐退之后，江湖上再也不热闹了马云，刘强东，黄峥，王兴，贾跃亭纷纷隐退之后，网上再也听不到他们的演讲之后，感觉双十一，618都索然无味了！不清楚他们为何都几乎同时走人或者退隐，让人感觉激情燃烧的一段岁月就此画上辣椒里加一把食盐，教你秘制新做法，开胃下饭又解馋，上桌就抢光国以民为本，民以食为天，各位老饕大家好！辣椒是常见的调味品，一般是作为配菜来使用。今天，我要教大家一个腌制青线椒的方法，做成香辣开胃的小菜，做法简单，做好后可以保存很长时间，随时吃百年老照片看故宫怎么从皇宫变成博物院的？20世纪初东华门及古物陈列所牌匾1913年12月24日，北洋政府内务部下令筹办古物陈列所，并制定古物陈列所章程17条，公布施行。1914年2月4日，古物陈列所成立，10月10日正式

友情链接：快好找快生活快百科快传网中准网文好找聚热点快软网