BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

支持大数据的JasperSoft 4发布了

| 作者 Ron Bodkin 关注 0 他的粉丝 ,译者 张龙 关注 12 他的粉丝 发布于 2011年2月19日. 估计阅读时间: 6 分钟 | 如何结合区块链技术,帮助企业降本增效?让我们深度了解几个成功的案例。

近日,JasperSoft 宣布提供对大数据系统报表的支持,包括Hadoop、几种流行的NoSQL数据库以及3个MPP分析关系数据库上的各种模型报表。他们现在支持:

  • Hadoop——Jaspersoft通过Hive SQL接口和HBase支持Hadoop,通过HDFS读取文件,包括Avro文件格式。
  • NoSQL——Jaspersoft对如下广泛使用的数据存储提供了NoSQL支持:键值存储、文档数据库、BigTable Clones、图形数据库以及Data Grid Caching。Jaspersoft的开源项目支持各种NoSQL技术报表,包括:Cassandra、MongoDB、Riak、HBase、CouchDB、Neo4J、Infinispan、VoltDB以及Redis。还有一个用于VMware GemFire的闭源连接器,目前处于Beta版。
  • MPP分析数据库——Jaspersoft支持IBM的Netezza MPP分析数据库数据仓库,不久还会提供商业的分析支持。此外还支持Vertica与EMC Greenplum。

InfoQ有幸采访到了JasperSoft技术联盟的资深总监Andrew Lampitt以详细了解此次发布。

问:此次发布与其他BI厂商所提供的产品有何不同?

答:JasperSoft一直都支持晦涩的数据格式的报表。

现在,业界都在使用非常乏味的方法制作Hadoop上的报表,使用Hive对Hadoop执行SQL查询。JasperSoft增加了对HDFS中的文件报表的支持,或是直接支持HBase,也支持各种NoSQL风格。

问:你们做过性能基准测试么?

答:他们都是第一代或第二代的连接器,更不必说产品质量了。JasperSoft与多家厂商保持着合作关系,项目所有者会制作出第一份报表。JasperSoft已经通过潜在或现有客户了解到了诸多反馈信息。

问:这些连接器的使用或评测级别如何?

答:我们既让现有的客户使用,也让新客户使用,从他们那里能获得反馈信息。从某种程度上说,此次发布是为了引起人们的注意。

我们与客户和厂商紧密合作,从中了解到这些公司最渴求的报表需求。

问:此次发布包含哪些新功能?

答:JasperSoft连接器提供了

  • 数据连通性——可以作为客户化数据源如MongoDB或Riak来连接
  • 客户化查询执行器——可以使用各种风格的系统(包括非SQL、层次系统)所使用的查询语言/语法

JasperSoft支持将文件加载到内存并在其中操作文件。

图形数据库(比如Neo4J)中的节点分析与键值存储形式是大不相同的。

问:支持非传统格式中的摘要或star schema报表么?

答:我不太确定。关系系统的报表与数据仓库的差别非常大。

对于MongoDB或Riak来说,你可以在GUI层次上操纵数据,比如说摘要,但它并非传统的分析情况。

我们将NoSQL看作是OLTP的新选择。

如果我是个使用Hadoop的开发者,想要查看一些数据,那么就可以通过文件系统报表达成所愿。

问:何时在Hadoop/HDFS中查询文件,会将整个文件加载到内存中么?

答:是内存的限制么?没必要将全部数据加载到客户端浏览器中,但在服务器端(JasperReports服务器)却总是加载全部内容。

问:有什么办法可以使用过滤器或是最小化文件数据集的大小?

答:一切皆有可能,但这并非我们现在想要解决的问题。这类似于本地的CSV文件。通常,你需要将全部文件加载到内存中。对文件进行过滤并不是一个好办法。

问:JasperSoft对HBase报表的支持如何?

答:HBase只是针对给定字段存储一系列字节而已。没有什么内建的手段可以获悉这些字节所代表的对象类型。在POC版本的连接器中,我们将一张传统的表转换成了HBase。我们将表的主键作为ROW_ID,将其他的列名作为HBase中的FAMILY,将字段值转换为字节,并将其作为VALUE。我们还使用QUALIFIER存放数据类型信息。这样,连接器就知道每个字段的数据类型是什么了。其他人也可以像我们一样将数据加载到HBase中(感兴趣的读者可以查看HBase loader的源代码了解详情)。

接下来要实现一个可插拔的反序列化引擎,将其插入到连接器中。这样,连接器就知道从给定字段中所取出的字节可以使用Java序列化机制进行序列化,也可以使用Google的Protocol Buffers或是其他序列化方法。我们就可以“获悉”每个字段的数据类型了。基于这一点,使用JasperSoft iReport(桌面版的报表设计器)的开发者就可以轻松构建报表了。

我们还可以直接或是通过Thrift间接连接到HBase。Thrift是可选的,常与HBase搭配使用。

感兴趣的读者还可以到项目的下载页面了解连接器的详细信息。

查看英文原文:JasperSoft 4 Released with Big Data Support

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT