BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ Hadoop に関するすべてのコンテンツ

  • オープンソースのSQL-in-Hadoopソリューション:我々はいまどこに?

    Facebookが最近Prestoをオープンソース化してリリースしたことで、既に飽和状態だったSQL-in-Hadoopマーケットがさらに錯綜している。多数のオープンソースツールが開発者の関心を集めようとしのぎを削っているのだ。Hortonworks社によるHive関連のStinger initiative, Apache Drill, Apache Tajo, Cloudera社の Impala, Salesforce社の Phoenix (for HBase),そして今回のFacebook社のPrestoがこれに挙げられる。

  • HadoopジョブをGPU上で実行するParallelX

    MapReduceパラダイムは,大規模な計算集約的アルゴリズムを扱う場合には,必ずしも理想的ではない。ある企業家の小さなチームが,これを解決するためにParallelXという製品を開発している。GPUのパワーを活用してHadoopジョブを強力に加速することで,ボトルネックを解消しようというものだ。

  • QConSF2013ハイライト - パート1

    Hyattの提供する魅惑的な施設で行われた3日間のカンファレンスには,どの日も講演や展示,アクティビティなどのスケジュールがぎっしり詰まっていて,どのトラックやイベントに参加するべきかの決断に迷うほどだった。

  • Cascading 2.5がHadoop 2をサポート

    今週リリースされたCascadingの新バージョンにはHadoop 2のサポートとCascading Lingualが含まれている。Cascading Lingualは,Hadoopベースのデータにアクセスする手段として包括的なANSI SQLインターフェースを提供する,オープンソースのプロジェクトだ。

  • YARNで強化されたHadoop

    Hadoop 2が利用可能になった。このバージョンでYARNが導入され、Hadoop上でデータ処理アプリケーションを動かせるようになった。私たちはHortonworksのプロダクトマネージャであるRohit Bakhshi氏にYARNについて、そしてYARNがHadoopユーザにとってどのような意味を持つか、話を聞いた。

  • Amazon EMRのベストプラクティス

    Best Practices for Amazon EMRというホワイトペーパーで、Parviz DeyhimはAWS EMRのベストプラクティスを説明している。データの移行やデータの収集、圧縮、集約の方法やAmazon EMRの構成の一般的なアーキテクチャパターンを説明している。

  • ConcurrentがHadoop向け機械学習DSLのPatternをリリース

    企業向け大規模データアプリケーションプラットフォーム事業者であるConcurrent, Incが業界標準に準拠するPMMLを利用した機械学習DSLであるPatternを発表した。SAS, R, Microstrategy, Oracleのような分析フレームワークはPMML形式でモデルを出力し、Hadoopクラスタで実行できる。

  • Windows Azureが更新し、Hadoop, HTML5/JS, CORS, PhoneGap, Mercurial、Dropboxをサポート

    最近リリースされたWindows Azureのアップデートは、Hadoop サービス, HTML5/JS, CORS, PhoneGapをサポートし、Mercurial, Dropbox, CodePlex、Bitbucketのデプロイが統合されている。

  • Cassandra, Hadoop, Solrのセキュリティを強化するDataStax

    先週、Cassandra、Hadoop、Solrを使っているクラスタ環境のセキュリティ関連機能を備えたDataStax Enterprise (DSE) 3.0が発表された。InfoQはDataStaxの製品担当バイスプレジデントのRobin Schumacher氏に話を聞いた。

  • ConcurrentがHadoop用SQL DSLをリリース

    Concurrent, Inc.企業ビッグデータアプリケーションプラットフォームの会社が今日、Lingualを発表した。これはオープンソースプロジェクトで、SQLを使ってApache Hadoop上で速く、簡単にビッグデータアプリケーションの開発ができるようになる。

  • GreenplumのPivotal HDがSQLのパワーとHadoopを結合する

    EMC Greenplum が新しいHadoopディストリビューションの Pivotal HD を発表した。HDFS上で "Hiveより数百倍高速" に動作するという,SQL完全準拠のMPPデータベースを備える。

  • リアルタイムHadoopの実装競争が激しくなってきた

    Hortonworksの新しいStingerイニシアチブが最高のリアルタイムHadoop実装を目指して、Apache Drill と Cloudera Impalaとの競争に加わった。

  • OracleのNoSQLデータベースを検証する

    Oracleのキーバリュー型データベース,いわゆる "Oracle NoSQL Database" がバージョン2.0になった。基本的にはBerkley DBの分散フロントエンドだが,それをはるかに越える機能を備えたデータベースだ。SQLクエリ,結果整合性に加えて完全整合性,さらにはAvroスキーマを使用したデータ識別によるストレージ領域削減オプションなど,多彩な機能を備えている。

  • Simba TechnologiesがCassandra,Hadoop,BigQuery,MongoDBにSQLのパワーを実現する

    SQLの本質は,非専門家のプログラマがデータベースに対してクエリを行って,レポートを作成することを目的に設計されたドメイン固有言語である。企業システムがリレーショナルデータベースからNoSQL製品へと移行しても,アドホックな帳票出力のニーズがなくなる訳ではなく,かえって難しいものになる。SimbaのODBCドライバは,ユーザの手にかつてのパワーを取り戻してくれる。

  • Hadoop + SQL Server + Excel = Big Data分析

    数ヶ月前Microsoftは、管理、分析、大容量データの意味を知ることができるMicrosoftのHadoopディストリビューションである HDInsightをアナウンスした。InfoQは、SQL ServerのシニアプロダクトマーケティングマネージャのVal Fontama氏と接触して、MicrosoftでのエンタープライズBig Dataストーリーの成功例について確認した。

BT