InfoQ ホームページ データベース に関するすべてのコンテンツ
-
データの信頼性改善とビジネスアジリティを支援する”統計予測”
統計予測(statistical forecasting)は、デリバリ予想を改善し、従来の見積にあった問題を解決する上で、極めて効率的な方法だ。Piotr Leszczynski氏によるAgileByExample 2018でのケーススタディにおいて、氏は、自身のデータをより理解して信頼し、ビジネスアジリティの改善へと進む上での、統計計測の有用性について述べている。
-
Jagadish Venkatraman氏、LinkedInのSamza 1.0開発を語る
先日のApacheCon North AmericaでJagadish Venkatraman氏は、LinkedInが大規模なストリーム処理を行うためにApache Samza 1.0を開発した経緯について講演した。その中で氏は、兆単位のイベントと数ペタバイトのデータを抱えるLinkedInのユースケースについて説明し、ステートフル処理、高レベルAPI、柔軟な展開モデルといった、1.0リリースで追加された機能を強調した。
-
"Most Impactful Contribution"受賞ソフトウェアのImmerがバージョン4をリリース
Alec Larson氏は数日前、JavaScriptライブラリImmerの4回目となるメジャーイテレーションをリリースした。今回のリリースでは、重要なエッジケースに対する修正が行われている。Immerは、コピーオンライト機構を実装することによって、不変な状態を変更可能であるように操作可能にするJavaScriptパッケージである。Immerは先頃、今年の"Breakthrough of the year React open source award"を受賞している。
-
pacheCon 2019基調講演 - Google CloudによるKubernetesを使用したビッグデータ処理の拡張
ApacheCon North AmericaでChristopher Crosbie氏が、"Yet Another Resource Negotiator for Big Data? How Google Cloud is Enhancing Data Lake Processing with Kubernetes"と題した基調講演を行った。講演の中で氏が強調したのは、Kubernetesクラスタ内でApacheソフトウェアを動作させるためのコントロールプレーンを提供する、オープンソースのKubernetesオペレータを開発することによって、Apacheのビッグデータソフトウェアを"クラウドネイティブ"にするという、Googleの取り組みについてだった。
-
GoogleがHadoopのビッグデータワークロード用にCloud Storage Connectorを公開
Googleは先日のブログ記事で、Cloud Strage Connector for Hadoopを新たに発表した。この新機能によって、従来のHDFSをGoogle Cloud Storageに置き換えることが可能になる。ParquetやORCといったカラムナファイル(Columnar file)形式により、スループット向上の実現が期待されると同時に、Cloud Storageディレクトリの分離、低いレイテンシ、並列性の向上、インテリジェントなデフォルト設定といったメリットを享受することができる。
-
AmazonがAurora Multi-MasterのGAを発表
先日の発表で、Amazonは、Aurora Multi-Masterの一般供与を開始すると公表した。これにより、複数のアベイラビリティーゾーンにわたる、複数のデータベースインスタンスを対象とした読み取りと書き込みが可能になる。結果として、データベースインスタンス障害時にプラットフォームがフェールオーバを起動する必要がなくなるため、高可用性機能が実現することになる。
-
Celia Kung氏、LinkedInのBrooklinデータストリーミングサービスを語る
LinkedInチームのCelia Kung氏は、先週のQCon New York 2019 Conferenceで、プラグイン可能なソースとデスティネーションをサポートするデータストリーミングサービスであるBrooklinについて講演した。さまざまなデータストアとメッセージングシステムが使用可能になることで、柔軟性と拡張性を備えたソリューションが実現する。Brooklinは、LinkedInで開発されたストリームインフラストラクチャプラットフォームの一部である。
-
AWSユーザにMLを提供するAmazon Personalizeが一般利用可能に
昨年11月のAWS re:Inventで初めて発表されたAmazon Personalizeが、すべてのAWSユーザを対象に一般公開された。このサービスを使用すれば、マシンラーニングの経験がなくても、パーソナライズされたプロダクトレコメンデーション、検索結果、ダイレクトマーケティングなどのモデルを含む、独自のマシンラーニングモデルをアプリケーションに加えられるようになる。
-
Sonic - 軽量でスキーマレスな検索システム
Sonicは、 Elasticsearchなどフル機能の検索システムの代替として開発が進められている、オープンソースでスキーマレスの検索バックエンドだ。自然言語による検索クエリの正規化とオートコンプリート機能を備え、検索クエリに最も関連性の高い結果を返すことができる。
-
AIとデータに関する��サンゼルスCTO円卓会議
先日ロサンゼルスで行われた"Leaders in Data CTO Roundtable"では、ビジネス向け人工知能(AI)フレームワークやプラットフォーム、今後5年間のデータ、データソフトウェアスタック、データ人材の獲得などが議論された。
-
GoogleがSQL Serverの顧客をターゲットにエンタープライズデータベースのオプションをリリース
Googleは最近のブログ投稿で、既存のGoogle Cloud Platform(GCP)データベースへの投資の強化を発表した。これにより、アルファ版のMicrosoft SQL Server用Cloud SQL、BigQueryからCloud SQLへのフェデレーションクエリ、GCP on Elastic Cloudが近いうちに日本で利用できるようになる。また、オーストラリアのシドニーでもリリースされる。
-
Badooのデータエンジニアリング:1日あたり200億のイベントを処理
Badooは現在、1日あたり数十億のイベントを処理する出会い系ソーシャルネットワークであるとデータプラットフォームエンジニアリングリードのVladimir Kazanov氏は説明する。Skills Matterで、彼はこの規模での運用の課題と、Badooがこのデータを処理およびレポートするために使用するツールについて説明した。
-
個人データを共有せずにシングルサインオンを提供する "Sign in with Apple"
先日のWWDC 2019で、Appleは、Sign in with Appleという、独自のシングルサインオン(SS)サービスを発表した。Time誌が"Appleの最も重要な、新しいイノベーション"とするSign in with Appleでは、Eメールアドレスを含む一切の個人ユーザデータを共有しないことが確約されている。
-
AmazonがAurora PostgreSQL Serverlessを一般向けに提供開始
最近、AmazonはPostgreSQL互換エディションのAurora Serverlessの一般向け提供を発表した。
-
RedisTimeSeriesモジュールによりRedisに時系列データベース機能が追加
今月初め、マイクロソフトはML.NET 1.2を発表し、そのモデルビルダーとCLIを更新した。ML.NETは、.NETエコシステム向けのオープンソースのクロスプラットフォームの機械学習(ML)フレームワークである。