InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

ログインして、InfoQのすべての体験をアンロックしましょう！お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。

ログイン

または

アカウントをお持ちでない方

登録

InfoQ ホームページ Hadoop に関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

Apache HBase 1.3リリースで多数のパフォーマンス改善

Apache HBase 1.3.0は、2017年1月中旬にリリースされた。今回のリリースでは、日付ベース階層圧縮がサポートされ、ログ先行書き込み(WAL)や新しいRPCスケジューラなど複数箇所で改善があった。このリリースには、合計で約1,700件の解決済みのissueが含まれている。

Alexandre Rodrigues 翻訳者編集部Ｔ
投稿日 2017年2月19日午後10時19分
Julien Le Dem氏に聞く - Apache Arrowが示すカラム指向データ処理の未来

Apache ArrowプロジェクトでPMCのリーダを務めるJulien Le Dem氏が，カラム指向データ処理の今後について，Data Eng Conf NYでプレゼンテーションを行なった。Apache Arrowはカラム型インメモリデータベースのオープンソース標準である。InfoQはParquetとの違いを確認すべく，氏にインタビューした。

Alexandre Rodrigues 翻訳者吉田英人
投稿日 2017年1月9日午後10時21分
PolyBaseを使用したSQL ServerとHadoopの結合

先日リリースされたSQL Server 2016では，HadoopとAzureのBlobストレージにSQLクエリを使用することができる。マップ/レデュース操作の記述が不要になるだけでなく，リレーショナルデータベースと非リレーショナルデータベースの結合も単一のクエリで実行可能になる。

Jonathan Allen 翻訳者吉田英人
投稿日 2016年7月20日午後8時57分
Google、Cloud Machine LearningとTensorFlowのα版リリース

先月、GoogleがTensorFlowをインテグレートしたクラウド機械学習サービスのα版をリリースした。このサービスは、TensorFlowライブラリをGoogle Cloud Platform (GCP)上でスケールさせて動かしたいというニーズの高まりに応えるものだ。Googleは自らのビッグデータおよびアナリティクスプラットフォームと機械学習を密にインテグレートするという発表の中で、HadoopとSparkのマネージドサービスであるDataprocなどと統合して、TensorFlowの利用をスケールさせるための新機能について説明している。

Dylan Raithel 翻訳者笹井崇司
投稿日 2016年4月22日午前3時38分
Glenn Tamkin氏、NASA大規模気候データへのApache Hadoop適用を語る

NCCS (NASA Center for Climate Simulation) はハイパフォーマンスデータ分析にApache Hadoopを使っている。NASAチームのGlenn Tamkin氏は先月のApacheCon Conferenceで講演し、Hadoopを使って構築した、気候データ分析のためのプラットフォームの詳細について説明した。

Srini Penchikala 翻訳者笹井崇司
投稿日 2015年5月12日午後8時28分
Hortonworks，IBM，Pivotalの3社がビッグデータソリューションでOpen Data Platformをサポート

ビッグデータベンダのHortonworks，IBM，Pivotalの3社は先頃，Hadoopベースの各社プラットフォーム製品に対して，共通のOpen Data Platform(ODP)を採用することを発表した。発表が行われたHadoopSummit Europe Conferenceは，Apache Hadoop 2.6(HDFS, YARN, MapReduce)やApache Ambariソフトウェアといった，オープンプラットフォームのカンファレンスだ。

Srini Penchikala 翻訳者吉田英人
投稿日 2015年5月11日午前12時44分
Apache HBaseが1.0に

3つのDeveloper Previewと、6つのRC、1500を超えるチケットクローズを経て、Apache FoundationはApache HBaseのバージョン1.0を発表した。HBaseはHadoopエコシステムにおけるNoSQLデータベースだ。アクティブな開発から7年以上経て、HBaseチームは1.0バージョンを名乗れるくらい成熟し、安��したと考えた。

Benjamin Darfler 翻訳者笹井崇司
投稿日 2015年4月20日午後3時39分
Google、Hadoop上でネイティブコードを動かすMR4Cをオープンソース公開

GoogleがCのためのオープンソースMapReduceフレームワーク「MR4C」を発表した。これを利用することにより、開発者はHadoopフレームワーク上でネイティブコードを動かすことができる。MR4Cフレームワークは、ネイティブ開発されたアルゴリズムのパフォーマンスおよび柔軟性と、Hadoop実行フレームワークが提供するスケーラビリティおよびスループットとの間を橋渡しするものだ

Srini Penchikala 翻訳者笹井崇司
投稿日 2015年3月8日午後7時52分
Pivotal が Big Data Suite をオープンソース化

Pivotal社は、自身のBig Data Suiteのコア・コンポーネントをオープンソース化することを決定するとともに、ビッグデータ用のオープンソースの普及促進および標準化のための Open Data Platform を発表した。

Abel Avram 翻訳者株式会社オープンストリーム寺田英雄
投稿日 2015年3月2日午前12時47分
Apache Hive 1.0リリース，HiveServer2がメインエンジンに，API定義を固定化

Apache Hiveは，2015年2月６日，同プロジェクトのバージョン1.0をリリースした。当初バージョン0.14.1として予定されていたが，コミュニティの投票により，プロジェクトの到達した完成度の高さを反映すべく，バージョンナンバを1.0.0に変更したのだ。

Mikio Braun 翻訳者吉田英人
投稿日 2015年3月1日午後7時34分
Splice Machine バージョン1.0，Hadoop統合と分析ウィンドウ関数をサポート

Spline Machineバージョン1.0は，分析ウィンドウ関数とHadoopエコシステム統合をサポートする。Splice Machineチームは先頃，Hadoopでのトランザクション処理に使用可能な，HadoopベースのRDBMSデータ管理ソリューションをリリースした。

Srini Penchikala 翻訳者吉田英人
投稿日 2015年1月12日午後6時48分
LinkedInのデータ取得プラットフォームGobblin

2014 QCon San FranciscoカンファレンスでLinkedInのLin Qiao氏はGobblinプロジェクトについて話をした(ブログにも説明がある)。このプロジェクトは内部と外部のデータソースから統一した方式でデータを取得するためのシステムだ。

Mikio Braun 翻訳者徳武聡
投稿日 2015年1月4日午後10時8分
Sparkがソートパフォーマンスの新記録を達成

Databricksが先日のDaytona GraySortコンテストで，Sparkプロセッシングエンジンを使って新記録を達成した。Daytona GraySortコンテストは，100テラバイトのデータをソートする速度を計測する，サードパーティによるベンチマークである。Databricksは公式記録として，206台のクラスタ上で4,27テラバイト/分というスループットを公表している。

Benjamin Darfler 翻訳者吉田英人
投稿日 2014年12月21日午後7時27分
HortonworksがStinger.nextのロードマップを発表，Apache HiveによるHadoopスケールのSQL提供へ

Apache Hive 0.13で提供されたStinger initiativeに続いて，Hortonworksは，完全なACIDトランザクション，サブセカンド(秒以下)で動作するクエリエンジン，充実度を高めたSQL 2011の解析サポートを提供する，Stringer.nextのロードマップを策定した。これらはすべて，Hiveによって"SQLサポートの速度，スケール，範囲を拡張"するという，同社の目標に向けてのものだ。

Adam Berry 翻訳者吉田英人
投稿日 2014年10月15日午後9時59分
Hadoop-as-a-Service APIのCloudbreakが公開ベータへ

クラウドに依存しないオープンソース Hadoop-as-a-Service APIとして新たに登場したCloudbreakが，アプリケーション開発者と企業を対象としたベータ版の提供を開始した。Cloudbreakを開発したSequenceIQでは，無償で公開される同社のプロダクトについて，プロビジョニングを抽象化し，オンデマンドHadoopクラスタの管理と監視を容易にする，と主張している。

Sergio De Simone 翻訳者吉田英人
投稿日 2014年8月17日午後8時34分