InfoQ ホームページニュース JasperSoft 4 がBig Dataをサポートしてリリース

JasperSoft 4 がBig Dataをサポートしてリリース

2011年2月4日読了時間 6 分

作者：

Ron Bodkin

翻訳者

編集部Ｎ

原文(投稿日：2011/01/28)へのリンク

JasperSoft は、今週、Big dataシステム向けのレポーティングをサポートすると発表した。このサポートには、Hadoop、幾つもの人気のあるNoSQL データベース、3つのMPP分析リレーショナルデータベースにおける多様なレポーティングモードが含まれている。サポートしている注目点は、以下のようである。

Hadoop - Jaspersoftは、Hive SQL インターフェースによりHadoopをサポートしており、 HDFS を介してファイルを読む。Avro ファイルフォーマットと HBaseが使える。
NoSQL - Jaspersoftは、広範囲に認知されている主要なカテゴリのデータストアをサポートしている。その中には、キー値ストア、ドキュメントデータストア、BigTable クローン、グラーフデータベース、データグリッドキャッシングなどがある。Jaspersoftによる、NoSQL技術でのレポーティングのオープンソースプロジェクトには、次のものがある。Cassandra, MongoDB, Riak, HBase, CouchDB, Neo4J, Infinispan, VoltDB、Redis。非オープンソースの VMware GemFire用コネクタがベータ段階である。
MPP 分析データベース - JaspersoftがIBMの Netezza MPP分析データベースデータウェアハウスをサポートしており、すぐに商用の分析サポートを追加する。Vertica 、EMC Greenplum もサポートされている。

InfoQは、Jaspersoftで Technology Alliancesのシニアディレクターである Andrew Lampitt氏にリリースについて聞いた。

Q:この発表は、他のBIベンダーが提供しているものと、どのように違いますか？

A: Jaspersoftは、いつも、余り知られていないデータフォーマットでのレポーティングを考慮してきました。

一般に、業界は、Hadoopでのレポーティングには、Hiveを使って、Hadoopに対してSQLクエリを実行する、という退屈なアプローチを取ってきた。Jaspersoftは、HDFSのファイル、すなわち直接にHBaseのサポートや様々なNo SQL技術に対するレポーティングを追加してきた。

Q: パフォーマンスのベンチマークは、行ったのですか？

A: これらは、第一あるいは第二世代のコネクターで、製品レベルの品質を意図していません。Jaspersoftは、プロジェクトオーナーがレポーティングの最初の成果を出せるように、どのようなベンダーともコラボしています。Jaspersoftは、いくつかの見込み顧客や既存の顧客と話して、第二あるいは第三レベルのフィードバックを得ています。

Q:これらのコネクターの採用や評価のレベルは、どうですか？

A: 我々には、それを使っている既存ユーザーとフィードバックを求めるための新しいユーザーがいます。この発表の背景の１つは、認知を高めることです。

我々は、顧客とベンダーの両方と一緒に開発しています。最も要望の高い企業のレポーティング要求は、何なのかを知りたいのです。

Q: このリリースの新しい機能は、何ですか？

A: コネクタが提供するのは、

データ接続性 - MongoDB や Riakのようなものに対してカスタムデータソースとして接続できます。
カスタムクエリエグゼキューター - Non SQLや階層的なものなどを含んで、様々な種類のシステムに使われるクエリ言語／シンタックスが使えます。

Jaspersoftによって、ファイルをメモリに読み込み、そこで操作できます。

Neo4Jのようなグラフデータベースでのノードに対する分析は、キー－値ストア形式のものとは、ずいぶん違います。

Q: 従来にないフォーマットで要約やスタースキーマに対するレポーティングをサポートしますか？

A: わかりません。オペレーショナルシステムに対するレポーティングは、ウエアハウス用とは非常に違いますから。

MongoDBやRiakには、GUIレベルでデータを操作できます、例えば、要約するなど。しかし、それはこれまでの分析スタイルではありません。

我々は、NoSQLをOLTPへの新しいオプションと見ています。

A: ハイ、その限界はメモリです。必ずしも全データをクライアントのブラウザに持ってくることは、ありませんが、いつも全てをサーバ側 (JasperReports Server)に持ってきます。

Q: ファイルに戻すデータセットにフィルターをかけたり、そのサイズを最小にする方法はありますか？

A: 何でも可能です。しかし、それは、すぐに解決するものではありません。ローカルなCSVファイルでの問題に似ています。一般に、いつもその全てをメモリに持ってきます。ファイルをフィルターするのに、何がいい技術かは、明白なことではありません。

Q: Jaspersoftは、Hbaseに対しては、どのようにレポーティングするのですか？

A: Hbaseは、あるフィールドに一塊のバイト列を格納するだけです。これらのバイト列がどのようなオブジェクト型を表すかを知るための内蔵の方法はありません。我々のPOCバージョンのコネクタでは、リレーショナルテーブルをHBaseに変換しています。テーブルのプライマリキーフィールドを ROW_IDとして使っています。他のカラム名をHBaseのFAMILYとして使っています。フィールド値をバイトに変換し、それを VALUEに使っています。データ型の情報を入れるために QUALIFIERを使っています。これによって、我々のコネクタは、各フィールドがどのデータ型かを知ることができます。他の製品も我々がやっているように、HBaseにデータをロードできるわけです（詳しくは、我々のHBaseローダーのソースコードを見てください）。

我々の次のステップは、プラグ可能なデシリアライズエンジンをコネクタに実装することです。こうなると、コネクタは、あるフィールドからバイト列が出ていくときに、本当にシリアライズされたものを知ることになります。シリアライズは、Javaのシリアライズ、Googleの Protocol Buffers、あるいは他のシリアライズ方法が使えます。これによって、各フィールドのデータ型を「発見する」ことができます。そのため、JasperSoft iReport （デスクトップレポートデザイナー）を使うとレポートの作成が非常に簡単になります。

HBaseに直接繋ぐことも、Thrift経由で繋ぐこともできることを知っておくのは、役に立ちます。HBaseと非常によく、一緒に使われるThriftは、オプションです。

---

コネクタのダウンロードページも見てください。

もし私がHadoopを使っている開発者で、データを見たいと思ったら、ファイルシステムに対してレポーティングすることになるでしょう。

Q: Hadoop / HDFSでファイルにクエリしたら、そのファイルの全てをメモリに持ってくるのですか？

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

JasperSoft 4 がBig Dataをサポートしてリリース

この記事に星をつける

このコンテンツのトピックは InfoQ です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

Cloudflare社、Rust向けQUICおよびHTTP/3を容易にするtokio-quicheをオープンソース化

Cloudflare社の年次総括：AIボットの過剰クロールと耐量子暗号50％到達、Goが倍増

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

Grab、リアルタイムデータ品質監視をプラットフォームに追加

OpenAIがHarness Engineeringを発表：Codexエージェントが大規模ソフトウェア開発を牽引

Uberのクエリアーキテクチャ：レイヤーの簡素化とオブザーバビリティの向上

人工知能によって顧客とのつながりはどう変わるか

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

NVIDIAがAI・ロボティクス・自動運転に跨るオープンモデル・データセット・ツールを公開

DeepSeek-V3.2が推論タスクでGPT-5を上回る

OpenAIがFrontierを発表、企業全体でAI エージェントを構築・デプロイ・管理するプラットフォーム

Google Cloudは、130,000ノードのGKEクラスターを用いてKubernetesの大規模スケールを実証

オープンソースのAgent Sandbox、Kubernetes上でAIエージェントの安全な展開を可能に

AI駆動サイバー脅威と戦うには多層防御がキー、CNCFレポートが明らかに

Online InfoQ Architect Certification

QCon AI Boston

QCon San Francisco

JasperSoft 4 がBig Dataをサポートしてリリース

この記事に星をつける

このコンテンツのトピックは InfoQ です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター