BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

他的粉丝

RTC 2018实时互联网大会,与实时通信大咖一期一会

作者 Amos 关注 0 他的粉丝 发布于  2018年7月4日

2018年,实时互联网行业迎来了风口之年。诸多创新实时互动场景在 RTC 技术的激发下,踏上风口。9月7日- 9月8日,由声网Agora、极客邦科技、AllThingsRTC、CSDN联合主办的2018 RTC 实时互联网大会(下文简称 RTC 大会)将在北京举行。

他的粉丝

对话Confluent CTO :针对Kafka的分布式流数据查询引擎KSQL技术解读

作者 Srini Penchikala 关注 34 他的粉丝 ,译者 张卫滨 关注 13 他的粉丝   发布于  2017年11月2日

Confluent发布KSQL:针对Apache Kafka的交互式、分布式流数据SQL引擎。KSQL支持对Apache Kafka中的主题进行多种流处理操作,比如聚合、连接、时间窗口以及会话。Confluent是在最近举行的Kafka峰会上宣布开源这个流SQL引擎的。

他的粉丝

StreamAlert:无服务器实时数据分析

作者 麦克周 关注 21 他的粉丝 发布于  2017年8月9日 2

2017年2月1日,Airbub安全团队宣布开源框架StreamAlert发布了,它是一种实时数据分析框架,附带伴随时间点的报警功能。StreamAlert属于无服务化开源框架,每小时可以横向扩展到TB级别数据支撑力度,自动化的基础设施部署以及默认开启安全保护机制。

他的粉丝

Yelp的数据管道开源了

作者 足下 关注 1 他的粉丝 发布于  2016年12月7日

在经过了几个月的不断分享之后,Yelp终于赶在圣诞节之前放出了大招:把他们的数据管道的核心模块全都开源出来了!

他的粉丝

Confluent Platform 3.0支持使用Kafka Streams实现实时的数据处理

作者 Srini Penchikala 关注 34 他的粉丝 ,译者 张卫滨 关注 13 他的粉丝   发布于  2016年6月16日

来自Confluent的Confluent Platform 3.0消息系统已支持使用Kafka Streams实现实时的数据处理,这家公司也是在背后支撑Apache Kafka消息框架的公司,它近日宣布最新的开源Confluent platform已经达到了通用发布版本。

他的粉丝

RethinkDB已经将其数据库移植到Windows

作者 Abel Avram 关注 7 他的粉丝 ,译者 谢丽 关注 10 他的粉丝   发布于  2016年2月15日

RethinkDB已经推出了其数据库的Windows版本。该版本耗时一年开发,可以运行在64位Windows操作系统上,目前尚处于Beta测试阶段。

他的粉丝

为什么越来越多的公司在使用Spark Streaming

作者 孙镜涛 关注 2 他的粉丝 发布于  2016年1月4日 2

Databricks最近对1400多家Spark用户进行了一次调查,结果显示这些用户对Spark Streaming的使用率与2014年相比增长了56%,另外,有48%的受访者将Spark Streaming标记为最常用的Spark组件。在Spark Streaming不断增长的用户群中,Uber、Netflix和Pinterest等家喻户晓的公司赫然在列,那么为什么使用Spark Streaming加速业务发展的公司越来越多呢?最近Spark Streaming的主要开发人员Tathagata Das在DataNami上发表了一篇文章,从需求、功能以及用户场景等方面对此进行了介绍。

他的粉丝

Hortonworks进军物联网,发布基于Apache NiFi项目的DataFlow产品

作者 Abel Avram 关注 7 他的粉丝 ,译者 张晓鹏 关注 0 他的粉丝   发布于  2015年10月8日

Hortonworks已经在不知不觉中完成了他们的DataFlow平台,这个平台基于Apache NiFi项目并准备去解决物联网(IoAT)中的数据处理需求。

他的粉丝

Twitter已经用Heron替换了Storm

作者 Abel Avram 关注 7 他的粉丝 ,译者 谢丽 关注 10 他的粉丝   发布于  2015年6月16日 1

Twitter已经用Heron替换了Storm。此举将吞吐量最高提升了14倍,单词计数拓扑时间延迟最低降到了原来的1/10,所需的硬件减少了2/3。

他的粉丝

Pulsar:来自eBay的开源实时分析平台

作者 李小兵 关注 0 他的粉丝 发布于  2015年3月20日 3

Pulsar是一个来自eBay的高扩展性、高可用性、基于事件驱动的开源实时分析平台和流处理框架,它能够实时收集和处理用户行为和业务事件。Pulsar使用一种类SQL的处理语言并通过对数据进行加工(如聚合、补充、变异和过滤等)来自定义流的创建。Pulsar具有实时Session化、多维度量聚合等功能,并具有每秒百万级流量处理能力和基于标准的分布式和跨越多个数据中心云部署架构等特征。

他的粉丝

ORTC以及WebRTC的未来

作者 Abel Avram 关注 7 他的粉丝 ,译者 侯伯薇 关注 0 他的粉丝   发布于  2014年8月26日

第一版稳定的ORTC(对象RTC)规范已经发布。问题是,它会对WebRTC产生什么样的影响呢?

他的粉丝

Google揭开Mesa的神秘面纱——一个具备跨地域复制和近实时特性的可伸缩数据仓库

作者 Matt Kapilevich 关注 0 他的粉丝 ,译者 赵震一 关注 0 他的粉丝   发布于  2014年8月25日

Google揭开了他们的新数据仓库Mesa的神秘面纱。Mesa是一个规模横跨多个数据中心,并可以处理PB级数据的系统。该系统可以对查询作出亚秒级的响应,同时维持了ACID属性。对它的所有需求是Google目前那些BigTable、Megastore、Spanner和F1等大家耳熟能详的大数据技术所无法完全满足的。

他的粉丝

Spark,Storm和实时分析

作者 Alex Giamas 关注 8 他的粉丝 ,译者 马连浩 关注 0 他的粉丝   发布于  2014年6月20日 2

Hadoop绝对是首选大数据分析和计算平台。随着数据卷,多样性和速度的增长,作为批处理框架的Hadoop已不能满足实时分析的要求。Spark,Storm和Lambda架构可以帮助弥补批处理和基于事件的差距.

他的粉丝

DataTorrent 1.0每秒处理超过10亿个实时事件

作者 Abel Avram 关注 7 他的粉丝 ,译者 马德奎 关注 0 他的粉丝   发布于  2014年6月10日 1

DataTorrent是一个实时的流式处理和分析平台,它每秒可以处理超过10亿个实时事件。

他的粉丝

Sharethrough使用Spark Streaming优化实时竞价

作者 孙镜涛 关注 2 他的粉丝 发布于  2014年4月18日 1

来自于Sharethrough的数据基础设施工程师Russell Cardullo和Michael Ruggiero最近在Cloudera博客上投递了一篇博文,分享了他们是如何使用Spark Streaming解决复杂的实时问题的。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT