InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

ログインして、InfoQのすべての体験をアンロックしましょう！お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。

ログイン

または

アカウントをお持ちでない方

登録

InfoQ ホームページ Data-Lake に関するすべてのコンテンツ

ニュース

RSSフィード

Cloud

Cloudflare、データプラットフォームをエグレス料金ゼロで導入

Cloudflareは最近、Cloudflare Data Platformのオープンベータ版を発表した。これは、Apache Icebergなどのオープンスタンダードを使用して、分析データテーブルを取り込み、保存し、クエリを実行するためのマネージドソリューションである。

Renato Losio 翻訳者 Naoko Koshimura
投稿日 2026年1月15日午前7時30分
Cloud

Amazon S3がソート圧縮とZオーダー圧縮を追加、Apache Icebergクエリパフォーマン向上のため

AWSは最近、Amazon S3がApache Icebergテーブルに対してソート圧縮とZオーダー圧縮をサポートすると発表した。この新機能はスキャン時間とエンジンコストを削減し、S3 TablesおよびAWS Glue Data Catalogの最適化を使用する従来S3バケットの両方で利用可能だ。

Renato Losio 翻訳者 Hiroaki.Sugimura
投稿日 2025年9月25日午前2時30分
Cloud

AWS re:Invent 2024のハイライト：Aurora DSQLからAmazon Novaへ

2024年のre:Inventがラスベガスで閉幕した。予想通り、AIは会議の重要な焦点であり、Amazon NovaとSagemakerの新バージョンはもっとも重要なハイライトの一つであった。しかし、コミュニティでもっとも興奮を呼んだ発表は、アクティブ・アクティブな高可用性を備えたサーバーレス分散SQLデータベース、Amazon Aurora DSQLのプレビューだった。

Renato Losio 翻訳者 Takashi Kawase
投稿日 2025年2月5日午前9時30分
Cloud

Amazon S3、データ管理とクエリ改善に向けたメタデータ機能をプレビュー版に導入

Amazon Web Services社（AWS）は、ユーザーによるデータ検出と管理を簡素化を目的として設計された新機能、Amazon S3 メタデータを発表した。現在、米国東部（オハイオ州、バージニア州北部）リージョン、および米国西部（オレゴン州）リージョンでプレビュー版での利用が可能である。S3 メタデータでは、リアルタイムのメタデータ更新とAWS分析サービスとの統合を活用し、ユーザーによるS3データに対するクエリおよび分析が可能になっている。

Steef-Jan Wiggers 翻訳者 Hiroshi.Kuroki
投稿日 2025年1月14日午前3時30分
Cloud

AWSがS3 Tables Bucketを発表：S3はデータレイクハウスになるのか？

AWSは最近、分析ワークロードに最適化されたマネージドApache IcebergテーブルであるS3 Tables Bucketを発表した。クラウドプロバイダーによると、この新しいオプションは、標準的なS3ストレージと比較して、Apache Icebergテーブルのクエリパフォーマンスを最大3倍高速化し、トランザクションレートを最大10倍高速化するという。

Renato Losio 翻訳者 Hiroshi.Kuroki
投稿日 2025年1月14日午前2時31分
Cloud

Data Solutions Framework：AWS上でデータソリューションを構築するためのオープンソースプロジェクト

AWSはこの程、Data Solutions Framework (DSF)をリリースした。これは、AWS上でデータソリューションの作成を加速するために設計された、オープンソースのフレームワークである。AWS CDKを使用して構築されたこのフレームワークは、データソリューションを構築するためのビルディングブロックとして抽象化とパターンを公開しており、TypeScript（npm）とPython（PyPi）で利用できる。

Renato Losio 翻訳者 Takamasa Sugawara
投稿日 2024年3月15日午前10時30分
Cloud

B2Bデータ交換：AWS 上のマネージド電子データ交換 (EDI)

AWSは最近、企業がEDIベースのビジネス・トランザクションの変革を自動化および監視できるプラットフォーム、B2B Data Interchangeを発表した。このサービスは、取引先を管理し、EDIドキュメントをJSONやXMLフォーマットに変革するためのローコード・インターフェイスを提供する。

Renato Losio 翻訳者 Naoko Koshimura
投稿日 2024年2月1日午前3時30分
設計/アーキテクチャ

Netflix、MaestroとApache Icebergを使ったインクリメンタル処理ソリューションを構築

Netflixは、データ・プラットフォームにおけるインクリメンタル処理のための新しいソリューションを構築した。インクリメンタルアプローチは、完全なデータセットの処理を避けるため、コンピューティングリソースのコストと実行時間を大幅に削減する。同社は、Maestro workflow engineとApache Icebergを使用して、データの鮮度と精度を向上させ、マネージドバックフィル機能を提供する予定である。

Rafal Gancarz 翻訳者 Mitsuru Takatsuki
投稿日 2024年1月23日午前9時30分
Cloud

Googleがプレビュー版で新しいクロスプラットフォームデータストレージエンジンのBigLakeを発表

直近のCloud Data Summitで、GoogleはBigLakeのプレビュー版を発表した。これは、新しいデータレイクストレージエンジンであり、これによって企業がデータウェアハウスとデータレイク内のデータを簡単に分析できるようになる。

Steef-Jan Wiggers 翻訳者編集部T _
投稿日 2022年4月24日午後8時59分
AIと機械学習、データエンジニアリング

AWSがプレビュー版としてHealthLakeとRedshift MLを発表

AWSは、12月のre:Invent 2020中に、Amazon HealthLakeサービスのプレビューリリース版とRedshift MLと呼ばれるAmazon Redshiftの機能を発表した。Amazon HealthLakeは、ヘルスケア、健康保険、製薬会社がNLP（Natural Language Processing）を利用してデータから価値を引き出すためのデータレイクサービスである。Redshift MLは、SageMakerへのゲートウェイをRedshiftユーザーに提供するサービスである。

Kovid Rathee 翻訳者編集部T _
投稿日 2021年3月31日午後9時55分
設計/アーキテクチャ

一元型データモノリスの解決策としての分散型データメッシュ

企業とデータアーキテクトは、大規模な一元管理型データプラットフォームではなく、分散型のデータメッシュを構築するべきだ。

Thomas Betts 翻訳者 h_yoshida _
投稿日 2020年3月25日午後10時42分
AIと機械学習、データエンジニアリング

Databricksがデータレイクの信頼性を高めるためにDelta Lakeをオープンソース化

Databricksは最近、ACIDトランザクションをApache Sparkおよびビッグデータワークロードにもたらすための、独自のストレージレイヤであるDelta Lakeのオープンソース化をを発表した。Delta LakeはすでにMcAffee、Upworkなどのいくつかの会社で使用されているが、DatabricksはApache Spark開発者の会社である。Delta Lakeは、データレイクがよく直面する異種データの問題に取り組んでいる。

Alex Giamas 翻訳者編集部T _
投稿日 2019年6月2日午後9時36分
Apache Rangerがトップレベルのプロジェクトに昇格

Apache Hadoopエコシステムのセキュリティ管理フレームワークであるApache Rangerがトップレベルに昇格した。Rangerは、Apache HBase、Hadoop（HDFSとYARN）、Apache Hive、Apache Kafka、Apache Solrなど、サポート対象のHadoopコンポーネントに適用されるセキュリティポリシーを一元的に定義および管理するためのコンポーネントである。

Alexandre Rodrigues 翻訳者編集部Ｔ
投稿日 2017年3月22日午前1時26分