- 索引快。高性能的建立索引(在当代CPU上,峰值性能可达到10MB/秒),500万数据索引耗时30分钟,索引即时压缩,分块存储,索引膨胀率低。数据变更即时,最长5分钟内能被检索,达到准实时搜索。
- 搜索快。高性能的搜索(500万数据,2-4GB索引, 平均每次搜索响应时间小于0.1秒)。搜索磁盘读写量低,内存占用低。单机支持每天1000万次以上搜索。
- 海量数据。目前已知可以处理超过100GB的文本数据, 在单一CPU的系统上可处理1000万文档。
- 功能全。支持分类检索、筛选;支持根据经纬度周边搜索;支持统计功能,统计不采用概率估算,统计值准确;支持多个全文检索字段(目前最多15个全文检索字段),可指定搜索字段;提供动态摘要,摘要精确清晰;支持停用词、同义词。
- 排序功能强大。支持最多5个排序字段,排序字段可是数据库字段,相关性权重,时间段。提供优秀的相关度算法,基于短语相似度和统计(TF/IDF)的复合方法。