BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Splunk Hunk 6.1为大数据分析增加新功能

| 作者 Matt Kapilevich 关注 0 他的粉丝 ,译者 唐蓉 关注 0 他的粉丝 发布于 2014年5月30日. 估计阅读时间: 2 分钟 | AICon 关注机器学习、计算机视觉、NLP、自动驾驶等20+AI热点技术和最新落地成功案例。

Splunk是一家专注于搜索、监控和分析机器生成的数据的公司,该公司最近宣布推出大数据分析平台Hunk6.1版本。

基于大数据进行广告分析并进一步为决策提供有用的数据,这是一件具有挑战性的事情。Hunk为快速访问、分析和可视化Hadoop及其他NoSQL数据库的数据提供了一个平台以解决这些挑战。

我们可以把Hunk看做有点类似于Hive的软件:Hive是一个开源SQL引擎,用于对Hadoop中的数据进行查询。Hive和Hunk收到用户的查询任务时,会将它编译成一系列的MapReduce任务,并在集群上运行。

  • Hunk使用的是Splunk的 Search Processing Language(SPL)语言,而不是SQL。
  • Hunk不需要事先定义模式,而是在查询任务执行的时候创建模式。
  • Hunk不需要等MapReduce任务完成之后再展示结果。为了提供更好的用户体验,Hunk在MapReduce在后台运行时,通过流的方式展示中期结果。
  • 除了查询引擎之外,Hunk还包括了一个内置的可视化层,用户可以通过他们自己的搜索结果创建图表并进行保存。

6.1版本的Splunk 增加了一些新功能

  • 报告加速:在Hadoop中缓存搜索结果,缩短报告响应时间,提升性能。该功能可以针对单独报告启用。
  • 仪表板和图表现在具备了可交互性:支持图表叠加、平移和缩放控制,以及下拉。
  • 用户可以将图表和报告嵌入到第三方业务应用中。
  • Hunk不限于支持Hadoop。流式资源库让开发者可以将Hunk连到任何NoSQL数据存储,比如Apache CassandraMongoDBNeo4j
  • 通过通道授权改善安全性,管理者可以控制哪一个Hunk的用户能够提交MapReduce和访问HDFS文件。
  • Hunk添加了新的文件格式的支持,包括sequence filesRCFileORC filesParquet

查看英文原文:Splunk's Hunk 6.1 Brings New Capabilities for Big Data Analytics


感谢杨赛对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ)或者腾讯微博(@InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT