BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Zalando公司使用Apache Flink进行微服务和流处理架构

| 作者 Srini Penchikala 关注 38 他的粉丝 ,译者 Alina 关注 0 他的粉丝 发布于 2016年11月7日. 估计阅读时间: 3 分钟 | AICon 关注机器学习、计算机视觉、NLP、自动驾驶等20+AI热点技术和最新落地成功案例。

Javier Lopez和Mihail Vieru日前在Reactive Summit 2016大会上发表了关于基于云的数据集成和分发平台的演讲,该平台可用于商业智能用户案例的流处理。

Zalando公司是欧洲在线时尚零售商,该公司正在从整体服务架构逐渐转变为微服务架构,并且从等级组织结构向敏捷组织结构转变。

事件流的处理方式使Zalando的技术团队能够实现几近实时的商业智能。他们使用诸如FlinkKafkaElasticsearch之类的技术来处理事件流。

在他们的架构中,各应用程序通过REST API互相沟通,而数据库隐藏在Amazon Virtual Private Cloud(VPC)基础架构里面。所有团队都将数据发布到中央事件总线。该架构模型由应用程序(调用微服务(REST API)来与事件总线交互)、Kafka、Exporter和AWS S3数据存储组成。他们还用Data Lake为数据提供分布式访问和精细的安全性保护。

Lopez和Vieru讨论了如何在微服务架构中使用Flink框架。 Flink用于处理基于事件、摄取和处理时间的流数据。它还负责背压处理,这种背压处理是通过系统架构隐式实现的。

Zalando公司的业务流程涉及1000多种事件类型,并且每个事件类型都有一个Kafka主题。他们通过关联的事件类型(如Join&Union)来分析流程,并根据业务规则完善数据。他们还使用滑动窗口(1分钟至48小时)的平台快照来进行流处理。

该架构还包括用于安全性的OAuth、基于Postgres DB的配置服务、告警服务和Python可视化组件。

两位演讲者还探讨了流处理的两个用例:几近实时的业务流程监控解决方案和流ETL。实时的流程监控有助于分析如订单速度、交付速度等数据流和控制服务水平协议(SLA)。流式ETL用于释放与关系型数据仓库相关的资源,这种解决方案有助于提高数据仓库的负载,减少延迟并使平台更具可扩展性。

他们还谈到了未来用于流处理的用例,比如几近实时的销售和价格监控以及检测欺诈性付款。BPM和Flink的CEP库及状态功能的复杂事件处理能力将用于这些用例。

有关他们的事件流处理架构的更多详细信息,请访问该公司的博客网站

查看英文原文Microservices and Stream Processing Architecture at Zalando Using Apache Flink


感谢冬雨对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT