InfoQ ホームページ データベース に関するすべてのコンテンツ
-
ビッグデータ: 言語は本当に重要か?
ビッグデータの分野では、数十億ものイベントの中で、たった1ミリセコンドの損失が重大な影響を与える。それにもかかわらず、Pythonのような遅いと考えられている言語が、この1年で非常に人気が出ている。ビッグデータコミュニティの最近の記事や議論では、データサイエンスとビッグデータのプログラミング言語の選択について、論争を始めている。
-
Presto-as-a-Service:AWSでのインタラクティブなSQL実行
Facebookが開発したPrestoは大規模なデータにインタラクティブにSQLを実行できるが、始めてメインストリームの利用例が生まれた。ビックデータ関連のスタートアップであるQuboleAmazon Web Servicesと統合したPresto-as-a-Serviceのアルファ版を発表した。
-
Hadoop-as-a-Service提供のQuboleがGoogle Compute Engine上で稼働可能に
マネージドHadoop-as-a-Serviceを提供するQuboleがGoogle Compute Engine (GCE)上で利用可能となった。QuboleはこれまでAmazon社のAWS上のみで利用可能だったが、この発表はGoogle Compute Engineの一般提供が開始されたほんの数日後に行われた。
-
TwitterがMapReduceストリーミングフレームワークSummingbirdをオープンソースに
Twitterは,Summingbirdと呼ぶ自社のMapReduceストリーミングフレームワークをオープンソースにした。Apache 2ライセンスで公開されるSummingbirdは,コードをバッチモード(Hadoop/MapReduceをベースとする)でもストリームモード(Stormをベースとする)でも,あるいはハイブリッドモードと呼ばれる2つの組み合わせでも同じように実行することができる,大規模データ処理システムだ。
-
-
OpenAccess ORM Q3 2013 SP1がVS 2013サポートを追加,従来型ウィザードとOracle 9i, MySQL 5のサポートは廃止に
先日TelerikがリリースしたOpenAccess ORM Q3 2013 AP1では,Visual Studio 2008を継続してサポートすると同時に,Visual Studio 2013のサポートが導入されている。しかし従来のウィザード,Oracle 9iとMySQL 5.0のサポートについては,OpenAccess ORMの次期リリースから廃止される予定だ。
-
ORMツール Hibernare 4.3がリリース,JPA 2.1仕様を実装
Javaベースのオブジェクト-リレーショナルマッピング(ORM)フレームワークであるHibernate ORM 4.3の最終版が先日リリースされた。2013年5月にリリースされたJPA 2.1仕様 - JSR 338の実装として認定されている。
-
データラングリング・アズ・ア・サービスの簡易化を目指すTrifacta
データ解析サービスプラットフォームのTrifactaは先頃,データアナリストのデータラングリング(Data Wrangring)作業支援という同社の活動を推進するため,VCによる出資を受け入れた。目標はデータ収集とクレンジング,マージといった作業を,現在よりはるかに少ない時間と労力で可能にすることだ。
-
EC2でMesosによるクラスタの自動デプロイを実現するElastic Mesos
EC2上でApache Mesosの自動デプロイが可能になった。Apache Mesosはクラスタのリソース全体を,複数のデータ処理フレームワークで共有するオープンソースツールである。使用されているのは,ビッグデータの新興企業Mesosphereが提供するElastic Mesosという,新しいWebサービスだ。
-
オープンソースのSQL-in-Hadoopソリューション:我々はいまどこに?
Facebookが最近Prestoをオープンソース化してリリースしたことで、既に飽和状態だったSQL-in-Hadoopマーケットがさらに錯綜している。多数のオープンソースツールが開発者の関心を集めようとしのぎを削っているのだ。Hortonworks社によるHive関連のStinger initiative, Apache Drill, Apache Tajo, Cloudera社の Impala, Salesforce社の Phoenix (for HBase),そして今回のFacebook社のPrestoがこれに挙げられる。
-
Twitterでの予測
Velocity Conf LondonでTwitterのArun Kejariwal氏がTwitterで使われている予測アルゴリズムについて話した。予測アルゴリズムはシステムリソースの予測とユーザ数やツイート数などビジネス上の指標の予測に使われている。Twitterのデータストリームのダイナミックさを考慮した場合、磨き直したARIMAモデルは一度予測エラーを検出して、異常値を排除できれば有効に働くということがわかった。
-
HadoopジョブをGPU上で実行するParallelX
MapReduceパラダイムは,大規模な計算集約的アルゴリズムを扱う場合には,必ずしも理想的ではない。ある企業家の小さなチームが,これを解決するためにParallelXという製品を開発している。GPUのパワーを活用してHadoopジョブを強力に加速することで,ボトルネックを解消しようというものだ。
-
Neo4j 2.0, 新しいブラウザとスキーマを装備
Neo Technologyは,Neo4j 2.0の一般提供を開始すると発表した。新しいグラフブラウザ,ノードラベル,オプショナルスキーマ,改良型Cypherを備える。
-
Opserver概要 - Stack Exchangeの監視ツール
OpserverはStackOverflowで有名なStackExchangeの開発したオープンソースの監視ツールだ。監視対象である各システム状態の全体像をすばやく把握するためのものだが,ドリルダウンアプローチを使うことで,さらに深い調査を行うこともできる。InfoQでは詳細を知るために,開発者のひとりであるNick Crave氏にインタビューした。
-
Netflix、ビッグデータがビジネス判断を動かす
NetflixのJeff Magnusson氏が、彼らのData Platform as a ServiceについてQCon SF 2013でプレゼンテーションをした。このプレゼンテーションをフォローアップして、技術スタックがどうなっていて、それがNetflixの重要なビジネス判断にどう役立っているのか説明する。