
构建实时垂直搜索网站经验分享
去哪儿网(http://www.qunar.com/)机票搜索是目前最大的中文机票搜索网站,每天为用户提供数以百万计的实时机票搜索服务,为用户提供海量的低价机票信息。随之系统的发展,服务的增多,监控工具变得愈发重要,如何有效的做好业务监控报警,也是我们要解决的问题。在本次演讲中将与大家分享这些成长的经历和系统优化的经验。
如果您观看本视频不流畅,请移步优酷版本(无Slides同步播放)

去哪儿网(http://www.qunar.com/)机票搜索是目前最大的中文机票搜索网站,每天为用户提供数以百万计的实时机票搜索服务,为用户提供海量的低价机票信息。随之系统的发展,服务的增多,监控工具变得愈发重要,如何有效的做好业务监控报警,也是我们要解决的问题。在本次演讲中将与大家分享这些成长的经历和系统优化的经验。
如果您观看本视频不流畅,请移步优酷版本(无Slides同步播放)
Lucene项目管理委员会宣布Apache Lucene 3.5.0和Apache Solr 3.5.0已经可以使用。Lucene是一个高性能、支持全文搜索的文本搜索开发库。Solr是一个独立的搜索服务器,其核心使用了Lucene来做索引和搜索。
LinkedIn已将IndexTank开源,这是一种运行在云中的文档索引引擎,它让用户可以自定义编制索引的过程,并对结果进行微调。
eBay在Hadoop世界(Hadoop World)大会的主题演讲中展示了一种全新搜索引擎Cassini的架构,该引擎预计在2012年上线。它对所有的内容和用户的元数据进行索引来得到更好的排名,并每小时刷新索引。它使用Hadoop来支持每小时进行的索引更新,使用HBase对随机存取信息提供支持。
近几年动荡的人才市场出现了许多求职的人。敏捷软件开发对许多求职者都具有吸引力,但并非所有的工作都是相同的。如果你想找一份敏捷软件开发的工作,使用像Scrum这样的敏捷框架,你就要有一个涵盖三个求职阶段的行动计划:调研/准备、面试以及评估机会。

Leandro Moreira展示了如何借助于Apache Lucene中的SpellChecker项目中携带的三种算法(Levenshtein、Jaro-Winkler和N-gram)来实现Google 中“您是不是要找”功能的领域特定版本。

搜索引擎已成长为中国互联网的第一大应用。亿万网民每天会在百度发出海量查询。基于如此巨量且千差万别的查询,如何判断一种新的排序算法是好还是差的问题,变得相当棘手。面对挑战,百度采取了两条腿走路的策略。一方面,我们设计开发了一套HC系统,将复杂的评估任务拆解,分发给大量非专业人员评价。另一方面,基于宝贵的用户日志,我们设计了一套实验框架,在不影响百度在线服务的条件下开展超大规模的对比实验,获取网民的真实反馈,评判新算法的优劣。评估算法最终是评估用户体验。在实践中,我们获得了很多宝贵和有趣的经验,愿与所有希望深入了解用户的工程师共享。
如果您观看本视频不流畅,请移步优酷版本(无Slides同步播放)

2010年,被称为中国移动互联网元年,3G和智能机在中国迅速普及,手机上网的网民数也飞速增长,各类无线应用层出不穷。移动联网的快速发展,有机遇也有挑战。本次演讲将会对移动互联网带来的挑战进行总结,并列出应对的策略,主要从以下几个内容展开:移动互联网带来的挑战、如何面对复杂的移动互联网环境、App时代/SNS时代,搜索如何应对?以及对未来搜索引擎的构思。

InfoQ中文站有幸与谷歌的高级工程师苏哲在一起探讨了开源以及Linux上软件开发的相关话题,其中包括在Linux上开发的项目有哪些、在Linux上开发有哪些挑战以及如何去克服、开发中所使用的平台、工具等等。