BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ Big Data に関するすべてのコンテンツ

  • DataBricks,Sparkで構造化データを操作するSpark SQLを発表

    Apache Sparkを開発するDataBricksは,SparkエコシステムにSpark SQLという新たな製品を投入すると発表した。Spark SQLはSparkから独立した製品で,Hiveを内部的に使用していない。InfoQでは同社のソフトウェア技術者であるReynold Xin,Michael Armbrust両氏とコンタクトを取り,Spark SQLについて詳しく聞いた。

  • Hadoopに挑むHydra

    ソーシャルネットワーク企業のAddThisは先日,HydraをApacheバージョン2.0ライセンスの下で,オープンソースとして公開すると発表した。Hydraは,半構造化ソーシャルデータをライブストリームとして処理することで,それらのデータに対する効率的なクエリ処理を実現するために開発された,同社の社内プラットフォームを発展させたものだ。

  • セルベースのセキュリティが導入されたHBase 0.98

    ApacheはHBase 0.98をリリースした。セルベースのセキュリティを通じてApache Accumuloとの共通化を計ると同時に,230以上のJIRAイシューを解決することを主な目的としている。新たに導入されたセキュリティ機能は,Accumuloをモデルとしたものだ。

  • ThoughtWorks Technology RadarについてRebecca Parsons氏が語��

    1月、ThoughtWorksは最新のTechnology Radarで、同社が追跡しているソフトウエア開発のエコシステムの動向を発表した。1)プロダクション環境での警告システムとリカバリ、2)プライバシとビッグデータの緊張関係、3)JavaScriptのエコシステム、4)物理と仮想の環境の境界の曖昧化、の4つが今年の大きなテーマだ。

  • ビッグデータ技術を用いたグラフ処理

    極度に大きなグラフの処理は現在でもなお難しい問題だ。しかし最近のビッグデータ技術の進歩は,このようなタスクをより実用的なものにしている。ニューヨークを拠点にクロスデバイスなコンテント配信を手掛けているTapadはビッグデータを活用して,テラバイトサイズのデータにまで拡張可能なグラフ処理を,ビジネスモデルの中心とするスタートアップだ。

  • Domino :Datascience-as-a-Service

    Dominoはデータサイエンス向けのPlatform-as-a-Serviceであり、クラウド(EC2)を使ってPythonやRのような言語でデータ分析ができる。

  • IBMがWatsonを使用したコグニティブモバイルアプリのコンテストを開催

    IBMはMobile World Congressで,IBM Watsonコグニティブ(認知)コンピューティング・プラットフォームを活用した,一般消費者およびビジネス向けモバイルアプリ開発コンテストの開催を発表した。このIBM Watson Mobile Developer Challengeの勝者は,市場へのアクセス獲得に対して,IBMの設計コンサルティングとサポートを受けることができる。

  • HazelcastがMapReduce APIをサポート

    オープンソースのインメモリデータグリッドソリューションHazelcastがMapReduceAPIを新たに導入した。

  • Elasticsearch 1.0.0リリース

    オープンソースアナリティクスツールであるElasticsearchのバージョン1.0.0がリリースされた。Elasticsearchはビッグデータ環境でのリアルタイム分析を実現する分散検索エンジンだ。新しいバージョンはさまざまな機能強化がされており、より直感的に使えるようになっている。

  • ビッグデータ革命と遺伝子情報解析

    Curoverse 社とTute Genomics社は、一般大衆に向けた遺伝子解析の提供を目指し、先月担保付き債権1,500万ドルの出資を受けた。Illumina社、Seven Bridges Genomics社、Complete Genomics社等は、研究者や民間組織に対して4桁ドル台の価格で全ゲノム配列解析サービスを提供している。Illumina社 は先ごろ、かねてから待望の1,000ドルのゲノム解析サービス HiSeq X Ten を発表した。

  • SparkRを使ってRでSparkを動かす

    2014年1月にUCバークレーのAMPLabがApache SparkをRから使うための仕組みであるSparkRプロジェクトの開発者プレビューを発表した。

  • DataFuがApacheのインキュベーションプロジェクトに

    LinkedInによるHadoop用ライブラリのコレクションであるDataFuプロジェクトが1月第1週,正式にApache Software Foundation(ASF)のインキュベーションプロジェクトになった。

  • ビッグデータ: 言語は本当に重要か?

    ビッグデータの分野では、数十億ものイベントの中で、たった1ミリセコンドの損失が重大な影響を与える。それにもかかわらず、Pythonのような遅いと考えられている言語が、この1年で非常に人気が出ている。ビッグデータコミュニティの最近の記事や議論では、データサイエンスとビッグデータのプログラミング言語の選択について、論争を始めている。

  • Presto-as-a-Service:AWSでのインタラクティブなSQL実行

    Facebookが開発したPrestoは大規模なデータにインタラクティブにSQLを実行できるが、始めてメインストリームの利用例が生まれた。ビックデータ関連のスタートアップであるQuboleAmazon Web Servicesと統合したPresto-as-a-Serviceのアルファ版を発表した。

  • Hadoop-as-a-Service提供のQuboleがGoogle Compute Engine上で稼働可能に

    マネージドHadoop-as-a-Serviceを提供するQuboleがGoogle Compute Engine (GCE)上で利用可能となった。QuboleはこれまでAmazon社のAWS上のみで利用可能だったが、この発表はGoogle Compute Engineの一般提供が開始されたほんの数日後に行われた。

BT