InfoQ

新闻

企业级Ruby开发曙光:开源ActiveWarehouse插件发布

作者 Sebastien Auvray译者 霍泰稳 发布于 2007年3月28日 下午10时12分

社区
Ruby
主题
Ruby on Rails,
数据仓库
标签
ETL,
数据仓库,
Rails插件

在整个软件开发社区里,对Ruby和Rails的赞扬声从没有间断过,除了它是否能够适应企业开发的需要。比如,Rails是否能处理海量的业务数据?通过ActiveWarehouse的最新发布,开源方面的Rails程序员Anthony Eden向社区奉献了解决此问题的插件,使得使用Ruby on Rails构建数据仓库变得轻而易举。现在,ActiveWarehouse已经是最活跃的RubyForge项目之一,有关它新特性的发布路线图看上去也是那么吸引人:

ActiveWarehouse插件能简化在Rails里开发数据仓库应用。数据仓库是一个相比于运行事务处理而言,为满足分析需要而专门设计的数据库。一个典型的数据仓库可以存储好几年的数据,从不同的运行数据中提取数据。数据仓库通常是高度非规范化的,这和倾向于规范化的交易系统恰好相反。

这个版本里有很多显著的功能:Fact生成器、维度(Dimension)和立体(Cube);多维支持;集合(Aggregate)的自动生成和其他特性,未来还会包括更多。

要从多个数据源将数据提取到数据仓库,ActiveWarehouse需要和ActiveWarehouse转换和加载(ETL)组件配合使用:

ETL可以处理大部分在整合现有系统(如delimited、fixed-width、XML和数据库源等)时要用到的基本数据源类型。通过定制的解析器它还可以被扩展。另外它还有足够多可用的转换,增加新的也很容易。这一系统具有良好的可扩展性。

现有的一些其他功能也很吸引人,如虚拟源字段;对预/后处理代码的支持;ETL领域特定语言(DSL)控制文件等。但目前批量载入只对MySQL可用。Anthony在性能问题上仍在努力,这对数据库领域而言是至关重要的。

你可以通过一个全面的概览来了解ActiveWarehouse和ETL组件的功能。

没有回复

回复

深度内容

Flex与JSON及XML的互操作

平台需要互操作性。在这篇文章中,作者仔细研究了Flex和JSON及XML的互操作性。文章也包含了使用E4X库来将XML映射到图表和表格组件的内容,还演示了如何使用as3core库来解码JSON消息。

用Qi4j进行面向组合编程

本文将简要介绍面向组合编程(COP,Composite Oriented Programming)的概念,展示它如何规避OOP存在的一些问题,并重新点燃使用可重用部件组装领域模型(Domain Model)的希望。

系统开发——新学科,新教育

一门新的计算机学科——“系统开发”,强调人性化、匠艺、设计、创意、创新和新事物的涌现,并建议用被称为“bottega”的工作室替代乏善可陈的教室。

图书聚焦:Visual Studio 2008 揭秘

Mike Snell和Lars Powers用他们最近由Sams出版的新书《Visual Studio 2008揭秘》,试图帮助大家提高开发人员的生产力。本文包括一个下载样章——第10章调试。

BPEL为何不是BPM的圣杯?

Pierre Vigneras在本文中讨论了作为标准之一的BPEL所存在的问题。Pierre先给我们大致介绍了一个简单的并行流程,接着讨论了从业者在试图以一个结构化模型为基础表达非结构化流程时遇到的一系列问题。

基于范型的多语言编程

你是否仔细思考过,为什么人们总在讨论“要正确的语言做恰当的事情”?在这篇文章中,Sadek Drobi向你解释了为什么应该在系统内部混合使用多种语言。

采访与书摘《Pro Web 2.0 Application Development with GWT》

Jeff Dwyer就关于他的新书(《Pro Web 2.0 Application Development with GWT》)、GWT1.5以及创建可搜索的Ajax应用谈了一些他的见解。

时刻准备着,迎接IT业的春天

我们需要设身处地地为客户及客户的业务本身着想,与客户同舟共济。更多创新的思路、产品和模式也同样将为IT业带来新的出路。IT业并不需要坐以待毙,在春天到来之后,市场将会更加繁荣!