BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Apache Lucene 4.8.0发布:不再支持Java 6

| 作者 郭蕾 关注 9 他的粉丝 发布于 2014年5月9日. 估计阅读时间: 2 分钟 | QCon上海2018 关注大数据平台技术选型、搭建、系统迁移和优化的经验。

2014年4月28日,Apache Lucene 4.8.0正式发布。由于老的JDK版本的一些JVM bug会影响到Lucene,所以新版本的Lucene不再支持JDK 7u55以下的Java版本。另外Lucene 4.8.0全面兼容Java 8。以下是Lucene 4.8.0中的一些重大改进:

  1. 所有的索引文件开始存储端到端的校验以在索引合并和读取的时候进行有效性检查。这样可以确保因为JVM内部的一些硬件问题或者BUG而引起的索引损坏可以被及时发现。
  2. 提供了新的Rescorer/QueryRescorerAPI对second-pass的重新打分。
  3. AnalyzingInfixSuggester 类提供了支持NRT(near-real-time)的自动建议功能。
  4. 使用Lucene的Sort类简化了impact-sorted postings的排序语义。
  5. 分离了bulk scoring(基于批量处理的打分过程)和基于迭代的打分过程。
  6. 建立索引的时的Hash term模块改为使用高效的MurmurHash3算法
  7. IndexWriter开始支持更新二进制类型的字段。
  8. HunspellStemFilter的内存占用比之前减少了10到100倍。
  9. 如果操作系统和文件系统允许,Lucene会在提交时fsyncs目录元信息。
  10. 使用了Java 7的文件系统函数,所以在windows中,即使索引文件在打开(使用)的时候,也可以被删除。
  11. 修复了NativeFSLockFactory类中的一个严重的bug,现在允许多个IndexWriter获取相同的锁。即使不持有锁,锁文件也不会再被从索引文件中删除。

Apache Lucene是一个使用Java开发的高性能的全文检索引擎,读者可以从这里下载最新版本的Lucene,详细的改进说明可以阅读Lucene ChangeLog。此外,基于Lucene的Solr也更新到了4.8.0版本,读者可以到其官网了解相关信息

参考文档:

  1. Lucene News
  2. Lucene Change Log
  3. 春风田的个人博客

感谢杨赛对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT