BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ

  • ビッグデータ: 言語は本当に重要か?

    ビッグデータの分野では、数十億ものイベントの中で、たった1ミリセコンドの損失が重大な影響を与える。それにもかかわらず、Pythonのような遅いと考えられている言語が、この1年で非常に人気が出ている。ビッグデータコミュニティの最近の記事や議論では、データサイエンスとビッグデータのプログラミング言語の選択について、論争を始めている。

  • Presto-as-a-Service:AWSでのインタラクティブなSQL実行

    Facebookが開発したPrestoは大規模なデータにインタラクティブにSQLを実行できるが、始めてメインストリームの利用例が生まれた。ビックデータ関連のスタートアップであるQuboleAmazon Web Servicesと統合したPresto-as-a-Serviceのアルファ版を発表した。

  • Hadoop-as-a-Service提供のQuboleがGoogle Compute Engine上で稼働可能に

    マネージドHadoop-as-a-Serviceを提供するQuboleがGoogle Compute Engine (GCE)上で利用可能となった。QuboleはこれまでAmazon社のAWS上のみで利用可能だったが、この発表はGoogle Compute Engineの一般提供が開始されたほんの数日後に行われた。

  • TwitterがMapReduceストリーミングフレームワークSummingbirdをオープンソースに

    Twitterは,Summingbirdと呼ぶ自社のMapReduceストリーミングフレームワークをオープンソースにした。Apache 2ライセンスで公開されるSummingbirdは,コードをバッチモード(Hadoop/MapReduceをベースとする)でもストリームモード(Stormをベースとする)でも,あるいはハイブリッドモードと呼ばれる2つの組み合わせでも同じように実行することができる,大規模データ処理システムだ。

  • データサイエンティスト向け教育プログラム

    2013年はデータサイエンティストやビッグデータ専門家向けの新しい教育プログラムが多く発表された。

  • ORMツール Hibernare 4.3がリリース,JPA 2.1仕様を実装

    Javaベースのオブジェクト-リレーショナルマッピング(ORM)フレームワークであるHibernate ORM 4.3の最終版が先日リリースされた。2013年5月にリリースされたJPA 2.1仕様 - JSR 338の実装として認定されている。

  • データラングリング・アズ・ア・サービスの簡易化を目指すTrifacta

    データ解析サービスプラットフォームのTrifactaは先頃,データアナリストのデータラングリング(Data Wrangring)作業支援という同社の活動を推進するため,VCによる出資を受け入れた。目標はデータ収集とクレンジング,マージといった作業を,現在よりはるかに少ない時間と労力で可能にすることだ。

  • オープンソースのSQL-in-Hadoopソリューション:我々はいまどこに?

    Facebookが最近Prestoをオープンソース化してリリースしたことで、既に飽和状態だったSQL-in-Hadoopマーケットがさらに錯綜している。多数のオープンソースツールが開発者の関心を集めようとしのぎを削っているのだ。Hortonworks社によるHive関連のStinger initiative, Apache Drill, Apache Tajo, Cloudera社の Impala, Salesforce社の Phoenix (for HBase),そして今回のFacebook社のPrestoがこれに挙げられる。

  • Netflix、ビッグデータがビジネス判断を動かす

    NetflixのJeff Magnusson氏が、彼らのData Platform as a ServiceについてQCon SF 2013でプレゼンテーションをした。このプレゼンテーションをフォローアップして、技術スタックがどうなっていて、それがNetflixの重要なビジネス判断にどう役立っているのか説明する。

  • 加速する変化のペースが企業アプリケーションにアジャイルを促す

    組織の変化とテクノロジー導入のペースが加速している。つまり、企業ソフトウェア開発は、こうした変化のペースに対応する方法を見つける必要があるということだ。ビッグデータの登場もまた、多数の実験を始めて、すばやく適応する必要性を促している。ブロガーであるMongoDBのMatt Asay氏は最近、"Hey, Enterprise Developers! Get Agile Or Get Steamrollered"という記事を書いた。

  • Amazon re:inventのまとめ

    Amazonはロサンゼルスで開かれたre:inventカンファレンスで、たくさんの新サービスを発表した。Amazon WorkSpaces - デスクトップコンピューティングをクラウドで、SAMLを使用したIdentity and Access Management、Amazon AppStream - クラウドからアプリケーションをストリーミング提供、Amazon Kinesis - ビッグデータをストリーム処理、CloudTrail - AWS APIコールの記録を保存、RDSのPostgresサポート、新しいEC2インスタンスタイプ

  • Cascading 2.5がHadoop 2をサポート

    今週リリースされたCascadingの新バージョンにはHadoop 2のサポートとCascading Lingualが含まれている。Cascading Lingualは,Hadoopベースのデータにアクセスする手段として包括的なANSI SQLインターフェースを提供する,オープンソースのプロジェクトだ。

  • Amazon Kinesisでビッグデータをストリーム処理

    Amazonがさまざまなソースにある大規模データをストリーム処理できるサービス、Kinesisを発表した。現在、限定プレビューとして利用できる。

  • SQLの復活

    データベース開発の新潮流はSQLへの回帰を示している。しかし、従来のリレーショナルデータベースをより優れたハードウエアに乗せるのではなく、シャードを使ったアーキテクチャでもなく、NewSQLを通じてだ。

  • Peter Bell氏に聞くNoSQLのトレンド

    Peter Bell氏が現在のNoSQLのトレンドを紹介している。NoSQLは高速進化しているデータベースの分野でさまざまなソリューションを提供する。

BT