BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

您现在处于全屏预览
关闭全屏预览

Twitter从支撑千万到万亿级索引的搜索引擎架构演化
录制于:

| 作者 庄易 关注 0 他的粉丝 发布于 2017年4月3日 | ArchSummit北京2018 共同探讨机器学习、信息安全、微服务治理的关键点
42:48

概要
Twitter的搜索引擎起初只能检索最近7天的推文,只能满足基本的实时搜索需求。现在的完整推文集索引 (Complete Tweet Index) 可以检索有史以来10多年的所有推文。本演讲将介绍 Twitter 的搜索引擎构架如何从千万条推文的规模进化到万亿条推文的规模。本演讲还将介绍 Twitter 搜索引擎的新颖应用:如何利用搜索引擎实现时间轴重排序 (Ranked Timelines)。

个人简介

庄易,毕业于Bowdoin College 和 Carnegie Mellon University。2011年加入Twitter,带领团队设计和搭建了Twitter的能检索千亿条推文的搜索引擎,有幸见证了Twitter从300员工到3000员工的历程。2005年到2007年参加了机器人世界杯 RoboCup(Aibo机器狗组),编写机器狗视觉处理,有幸见证了我们的团队从美国最后一名到世界冠军的历程。 兴趣爱好:吃、白天小睡、猫、数学模型,以及学习各种有用没用的新技能。

全球架构师峰会(International Architect Summit,下简称ArchSummit)是由InfoQ中文站主办的一次全球性架构师峰会。ArchSummit专门针对架构师人群,讲述与架构和架构师相关的各方面趋势、技术和案例。这也是继QCon之后,InfoQ中文站主办的又一次高端技术盛会。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT