Percolator:大数据集增量更新系统
Google员工Daniel Peng和Frank Dabek发表了一篇名为《使用分布式事务和提醒触发进行大规模增量数据处理(Large-scale Incremental Processing Using Distributed Transactions and Notifications)》的论文,解释了数据库为何无法满足Google索引系统的存储和吞吐量需求,以及如何实现现有索引系统,使之能在数千台机器上存储几十PB数据,并每天处理几十亿次更新。
