InfoQ ホームページニュース JasperSoft 4 がBig Dataをサポートしてリリース

JasperSoft 4 がBig Dataをサポートしてリリース

2011年2月4日読了時間 6 分

作者：

Ron Bodkin

翻訳者

編集部Ｎ

原文(投稿日：2011/01/28)へのリンク

JasperSoft は、今週、Big dataシステム向けのレポーティングをサポートすると発表した。このサポートには、Hadoop、幾つもの人気のあるNoSQL データベース、3つのMPP分析リレーショナルデータベースにおける多様なレポーティングモードが含まれている。サポートしている注目点は、以下のようである。

Hadoop - Jaspersoftは、Hive SQL インターフェースによりHadoopをサポートしており、 HDFS を介してファイルを読む。Avro ファイルフォーマットと HBaseが使える。
NoSQL - Jaspersoftは、広範囲に認知されている主要なカテゴリのデータストアをサポートしている。その中には、キー値ストア、ドキュメントデータストア、BigTable クローン、グラーフデータベース、データグリッドキャッシングなどがある。Jaspersoftによる、NoSQL技術でのレポーティングのオープンソースプロジェクトには、次のものがある。Cassandra, MongoDB, Riak, HBase, CouchDB, Neo4J, Infinispan, VoltDB、Redis。非オープンソースの VMware GemFire用コネクタがベータ段階である。
MPP 分析データベース - JaspersoftがIBMの Netezza MPP分析データベースデータウェアハウスをサポートしており、すぐに商用の分析サポートを追加する。Vertica 、EMC Greenplum もサポートされている。

InfoQは、Jaspersoftで Technology Alliancesのシニアディレクターである Andrew Lampitt氏にリリースについて聞いた。

Q:この発表は、他のBIベンダーが提供しているものと、どのように違いますか？

A: Jaspersoftは、いつも、余り知られていないデータフォーマットでのレポーティングを考慮してきました。

一般に、業界は、Hadoopでのレポーティングには、Hiveを使って、Hadoopに対してSQLクエリを実行する、という退屈なアプローチを取ってきた。Jaspersoftは、HDFSのファイル、すなわち直接にHBaseのサポートや様々なNo SQL技術に対するレポーティングを追加してきた。

Q: パフォーマンスのベンチマークは、行ったのですか？

A: これらは、第一あるいは第二世代のコネクターで、製品レベルの品質を意図していません。Jaspersoftは、プロジェクトオーナーがレポーティングの最初の成果を出せるように、どのようなベンダーともコラボしています。Jaspersoftは、いくつかの見込み顧客や既存の顧客と話して、第二あるいは第三レベルのフィードバックを得ています。

Q:これらのコネクターの採用や評価のレベルは、どうですか？

A: 我々には、それを使っている既存ユーザーとフィードバックを求めるための新しいユーザーがいます。この発表の背景の１つは、認知を高めることです。

我々は、顧客とベンダーの両方と一緒に開発しています。最も要望の高い企業のレポーティング要求は、何なのかを知りたいのです。

Q: このリリースの新しい機能は、何ですか？

A: コネクタが提供するのは、

データ接続性 - MongoDB や Riakのようなものに対してカスタムデータソースとして接続できます。
カスタムクエリエグゼキューター - Non SQLや階層的なものなどを含んで、様々な種類のシステムに使われるクエリ言語／シンタックスが使えます。

Jaspersoftによって、ファイルをメモリに読み込み、そこで操作できます。

Neo4Jのようなグラフデータベースでのノードに対する分析は、キー－値ストア形式のものとは、ずいぶん違います。

Q: 従来にないフォーマットで要約やスタースキーマに対するレポーティングをサポートしますか？

A: わかりません。オペレーショナルシステムに対するレポーティングは、ウエアハウス用とは非常に違いますから。

MongoDBやRiakには、GUIレベルでデータを操作できます、例えば、要約するなど。しかし、それはこれまでの分析スタイルではありません。

我々は、NoSQLをOLTPへの新しいオプションと見ています。

A: ハイ、その限界はメモリです。必ずしも全データをクライアントのブラウザに持ってくることは、ありませんが、いつも全てをサーバ側 (JasperReports Server)に持ってきます。

Q: ファイルに戻すデータセットにフィルターをかけたり、そのサイズを最小にする方法はありますか？

A: 何でも可能です。しかし、それは、すぐに解決するものではありません。ローカルなCSVファイルでの問題に似ています。一般に、いつもその全てをメモリに持ってきます。ファイルをフィルターするのに、何がいい技術かは、明白なことではありません。

Q: Jaspersoftは、Hbaseに対しては、どのようにレポーティングするのですか？

A: Hbaseは、あるフィールドに一塊のバイト列を格納するだけです。これらのバイト列がどのようなオブジェクト型を表すかを知るための内蔵の方法はありません。我々のPOCバージョンのコネクタでは、リレーショナルテーブルをHBaseに変換しています。テーブルのプライマリキーフィールドを ROW_IDとして使っています。他のカラム名をHBaseのFAMILYとして使っています。フィールド値をバイトに変換し、それを VALUEに使っています。データ型の情報を入れるために QUALIFIERを使っています。これによって、我々のコネクタは、各フィールドがどのデータ型かを知ることができます。他の製品も我々がやっているように、HBaseにデータをロードできるわけです（詳しくは、我々のHBaseローダーのソースコードを見てください）。

我々の次のステップは、プラグ可能なデシリアライズエンジンをコネクタに実装することです。こうなると、コネクタは、あるフィールドからバイト列が出ていくときに、本当にシリアライズされたものを知ることになります。シリアライズは、Javaのシリアライズ、Googleの Protocol Buffers、あるいは他のシリアライズ方法が使えます。これによって、各フィールドのデータ型を「発見する」ことができます。そのため、JasperSoft iReport （デスクトップレポートデザイナー）を使うとレポートの作成が非常に簡単になります。

HBaseに直接繋ぐことも、Thrift経由で繋ぐこともできることを知っておくのは、役に立ちます。HBaseと非常によく、一緒に使われるThriftは、オプションです。

---

コネクタのダウンロードページも見てください。

もし私がHadoopを使っている開発者で、データを見たいと思ったら、ファイルシステムに対してレポーティングすることになるでしょう。

Q: Hadoop / HDFSでファイルにクエリしたら、そのファイルの全てをメモリに持ってくるのですか？

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

JasperSoft 4 がBig Dataをサポートしてリリース

この記事に星をつける

このコンテンツのトピックはエンタープライズアーキテクチャです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

AnthropicがClaude Code品質苦情の6週間を3つのプロダクト変更の重なりと特定

GitHub社、Free、Pro、およびPro+ユーザーからのCopilotインタラクションデータを、AIモデルのトレーニングに使用する方針

23年間潜伏していたリモート悪用可能なLinuxカーネル脆弱性の発見にClaude Codeが使われた

CloudflareがProject Thinkを発表：AIエージェント向け永続ランタイム

Dropbox社がGitHub社と協力し、モノレポのサイズを87GBから20GBに削減

Anthropicが3エージェント・ハーネスを設計、長時間稼働するフルスタックAI開発を支援

プラットフォームエンジニアリングのインパクトをドライブし、測定する

エージェンティックAIパターンがエンジニアリング規律を強化

人工知能によって顧客とのつながりはどう変わるか

GoogleがGemma4をApache 2.0ライセンスでリリース、マルチモーダルおよびエージェント機能搭載

AnthropicがClaude Platformを提供開始、AWS上で

TigerFSは開発者およびAIエージェント向けにPostgreSQLデータベースをファイルシステムとしてマウントする機能を提供

Argo CD 3.3、安全なGitOps削除と円滑な日常運用を実現

Teleport社、企業インフラ全体でAIエージェントを保護するAgentic Identity Frameworkを発表

Cloudflare社は、自社のエッジにアクティブなAPI脆弱性スキャンを追加

Online InfoQ AI Engineering Certification

Online InfoQ Architect Certification

Online InfoQ AI Security & Privacy Engineering Program

QCon San Francisco

QCon London 2027

JasperSoft 4 がBig Dataをサポートしてリリース

この記事に星をつける

このコンテンツのトピックは エンタープライズアーキテクチャ です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター

このコンテンツのトピックはエンタープライズアーキテクチャです。