InfoQ ホームページ Big Data に関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

設計/アーキテクチャ

Badooのデータエンジニアリング：1日あたり200億のイベントを処理

Badooは現在、1日あたり数十億のイベントを処理する出会い系ソーシャルネットワークであるとデータプラットフォームエンジニアリングリードのVladimir Kazanov氏は説明する。Skills Matterで、彼はこの規模での運用の課題と、Badooがこのデータを処理およびレポートするために使用するツールについて説明した。

Andrew Morgan 翻訳者編集部T _
投稿日 2019年8月28日午前1時44分
デベロップメント

個人データを共有せずにシングルサインオンを提供する "Sign in with Apple"

先日のWWDC 2019で、Appleは、Sign in with Appleという、独自のシングルサインオン(SS)サービスを発表した。Time誌が"Appleの最も重要な、新しいイノベーション"とするSign in with Appleでは、Eメールアドレスを含む一切の個人ユーザデータを共有しないことが確約されている。

Sergio De Simone 翻訳者 h_yoshida _
投稿日 2019年8月18日午後9時29分
Emerging Technologies

Hyperledger Ariesで実現する、相互運用可能なブロックチェーンIDソリューション

先日のブログ記事で、Hyperledgerプロジェクトは、検証可能なデジタル証明書を作成、転送、保管するための、相互運用可能なID管理ツールキットを提供する、Hyperledger Ariesと呼ばれる13番目のプロジェクトを発表した。このツールキットを使用することで、さまざまな分散元帳テクノロジ(DLT)を使用した、安全かつ相互運用可能な、ピアツーピアメッセージングのサポートが可能になる。

Kent Weare 翻訳者 h_yoshida _
投稿日 2019年7月29日午後8時28分
AIと機械学習、データエンジニアリング

Expo：Walmart LabsでのSpark StreamingとKafkaを使ったリアルタイムA/Bテストとモニタリング

WalmartLabsのエンジニアリングチームは、Expoと呼ばれるリアルタイムのA/Bテストツールを開発した。これは、ユーザエンゲージメントメトリックを収集し分析するものである。Spark Structured Streamingを使用して受信データを処理し、メトリクスをKairosDBに格納する。

Hrishikesh Barua 翻訳者編集部T _
投稿日 2019年7月29日午前1時24分
AIと機械学習、データエンジニアリング

MicrosoftがApache Spark向けの高性能C#およびF#サポートをリリース

Microsoftは、Apache Spark用の.NETのリリースを発表し、ビッグデータ計算エンジンに新しい高性能のC#とF#のバインディングを追加した。

Anthony Alford 翻訳者編集部T _
投稿日 2019年6月16日午後10時11分
AIと機械学習、データエンジニアリング

Databricksがデータレイクの信頼性を高めるためにDelta Lakeをオープンソース化

Databricksは最近、ACIDトランザクションをApache Sparkおよびビッグデータワークロードにもたらすための、独自のストレージレイヤであるDelta Lakeのオープンソース化をを発表した。Delta LakeはすでにMcAffee、Upworkなどのいくつかの会社で使用されているが、DatabricksはApache Spark開発者の会社である。Delta Lakeは、データレイクがよく直面する異種データの問題に取り組んでいる。

Alex Giamas 翻訳者編集部T _
投稿日 2019年6月2日午後9時36分
Emerging Technologies

機微データを保護するための新しい機械学習ライブラリ、TensorFlow Privacyの紹介

最近のブログ記事で、TensorFlowはTensorFlow Privacyを発表した。これは、研究者や開発者が強力なプライバシーを持つ機械学習モデルを構築できるようにするオープンソースライブラリである。このライブラリによって、強力な数学的保証に基づいて、トレーニングプロセスでユーザデータが記憶されないよう保証される。

Kent Weare 翻訳者編集部T _
投稿日 2019年5月6日午後9時52分
AIと機械学習、データエンジニアリング

高価値ビッグデータのためのフレームワーク

Asha Saxenaは最近、Enterprise Data World 2019会議でビッグデータ分析イニシアチブが組織にもたらす価値について話した。 Saxenaは、組織の成熟度と社内のコンピテンシーに役立つビッグデータフレームワークを提案した。

Srini Penchikala 翻訳者編集部T _
投稿日 2019年4月21日午後9時46分
Cloud

Microsoft、Azure Data Box Diskの一般提供を発表

最近のブログ記事で、MicrosoftはAzure Data Box Diskの一般提供を発表した。これはオフラインでAzureにデータを転送する、SSDベースのソリューションだ。MicrosoftはAzure Data Box Blob Storageのパブリックプレビューも発表した。これにより、顧客はData Box上のBlob Storageにデータをコピーできるようになる。

Steef-Jan Wiggers 翻訳者 sasai _
投稿日 2019年2月22日午前7時26分
カルチャー＆手法

業界におけるAI応用について、Christoph Windheuser氏とのQ&A

ハードウェア能力の増大と膨大なデータにより、パターン認識、自然言語処理、強化学習など既存の機械学習アプローチが実現可能になった。人工知能は開発プロセスに影響を与えており、バージョン管理、CI/CD、テストなどは複雑さを増している。

Ben Linders 翻訳者 sasai _
投稿日 2019年1月10日午前1時56分
Cloud

Google CloudがEU内のクラウドデータ移行用にTransfer Applianceベータ版を発表

Googleは、大容量データをGCP(Google Cloud Platform)に迅速かつ安全に移動可能な大容量サーバであるTransfer Applianceを発表した。EU(欧州連合)内でベータ版として提供される。データの転送はEU内のGCPのTransfer Applianceを使用して処理され、データがEUを離れることはない。

Steef-Jan Wiggers 翻訳者 h_yoshida _
投稿日 2019年1月9日午後10時16分
Cloud

Amazon、Managed Streaming for Kafkaのパブリックプレビューを発表

AmazonはAWS re:Invent 2018で、顧客がApache Kafkaを用いてストリーミングデータ処理を行うアプリケーションを簡単に構築および実行できるようにする新しいフルマネージドサービスを発表した。この新しいサービスはAmazon Managed Streaming for Kafka、略してAmazon MSKと呼ばれ、現在パブリックベータとして提供されている。

Steef-Jan Wiggers 翻訳者 sasai _
投稿日 2018年12月26日午前3時7分
JavaScript

Tim Berners-Lee氏の分散IDプラットフォーム - Solid

Solidは、WWWの考案者であるTim Berners-Lee氏の手による、新たな分散IDプラットフォームである。ユーザが自分自身のデータを所有し、よりよく管理するためのメカニズムを提供する。

Dylan Schiemann 翻訳者 h_yoshida _
投稿日 2018年12月26日午前2時10分
AIと機械学習、データエンジニアリング

Uberのビッグデータプラットフォームが100ペタバイト超の規模に至るまで

Uberのエンジニアリングチームは、同社のビッグデータプラットフォームが、リレーショナルデータベースを使用した旧来のETLジョブから、HadoopとSparkをベースとするものへと発展した状況に関する記事を書いた。スケーラブルな取り込みモデル、標準転送フォーマット、インクリメンタルアップデートのためのカスタムライブラリが、同社プラットフォームの主要なコンポーネントである。

Hrishikesh Barua 翻訳者 h_yoshida _
投稿日 2018年12月14日午前1時30分
Cloud

Keystone - Netflixのリアルタイムストリーム処理プラットフォーム

Netflixは先日、自社の技術ブログで、同社のリアルタイムストリーム処理プラットフォームであるKeystoneについて、その設計思想と洞察を論じた記事を公開した。Keystoneは2015年12月から運用されている。Netflixの加入者数が過去3年間で6,500万件から13,000万件以上へと増えたのに伴って、Keynoteも年を追って成長してきた。本記事ではKeynoteプラットフォームの最新情報を取り上げる。

Alex Giamas 翻訳者 h_yoshida _
投稿日 2018年12月7日午前5時49分