InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
AWSがApache AirflowのAmazonマネージドワークフローを導入
先頃、AWSはApache Airflow (MWAA) 用のAmazonマネージドワークフローを導入した。これは、AWSでのApache Airflowのオープンソースバージョンの実行を簡素化し、抽出-変換-ロード (ETL) ジョブとデータパイプラインを実行するワークフローを構築するフルマネージドサービスである。
-
Googleが3Dオブジェクト認識AI向けのObjectronデータセットをリリース
Google ResearchはObjectron Datasetのリリースを発表した。3Dオブジェクト認識用の機械学習データセットである。データセットには、15,000のビデオセグメントとグラウンドトゥルースアノテーション付きの4,000,000の画像が含まれている。また、データを使用してAIモデルをトレーニングするためのツールが含まれている。
-
Spark AI Summit 2020の注目点: Spark 3.0のパフォーマンス改善のイノベーション
初めてオンラインで開催された先頃のSpark AI Summit 2020で、注目点は、Spark SQLの最適化やGPUアクセラレーションなど、Apache Spark 3.0のパフォーマンスを改善するためのイノベーションだった。
-
GoogleがHealthcare Natural Language APIとAutoML Entity Extraction for Healthcareを発表
最近のブログ投稿で、Googleは新しい2つのフルマネージドAIツールのパブリックプレビュー版を発表した。Healthcare Natural Language APIとAutoML Entity Extraction for Healthcareである。どちらのツールも、医療専門家がスケーラブルな方法で何度でも医療文書を確認および分析するアシストをする。
-
DataStaxがクラウドネイティブのDatabase as a ServiceとAIOpsツールを発表
DataStaxは先月、Apache Cassandra上に構築されたクラウドネイティブのDatabase-as-a-Service (DBaaS) であるAstraのリリースを発表した。また、最近、Apache Cassandraクラスタの状態をプロアクティブに監視するVectorと呼ばれるAIOps製品を発表した。
-
Microsoftが.NET for Apache Spark 1.0をリリース
Microsoftは先月、.NET for Apache Sparkの最初のメジャーバージョンをリリースした。これは、Apache Sparkプラットフォームで.NET開発できるようにするオープンソースパッケージである。新しいリリースでは、.NET開発者が、.NETユーザ定義関数、Spark SQL、およびMicrosoft HyperspaceやML.NETなどの追加ライブラリを使用してApache Sparkアプリケーションを作成できるようになる。
-
データサイエンスチームにアジャイルを導入する
アジャイルはデータサイエンスチームの、ステークホルダとのコラボレーション改善と生産性向上に寄与する。優先順位が明確になることで、作業への集中と成果の提供が可能になるのだ。実践する上で重要なのは、アジャイルの旅に同行することによって、データサイエンスチームの賛同を得ることである。
-
機械学習によるテスト失敗の予測
機械学習を使用して、コードの変更に対するテストの動作を予測できる。これらの予測は、チェックイン時に情報を提供することで、開発者へのフィードバック時間を短縮する。Marco Achtziger氏とDr. Gregor Endler氏は、OOP 2020で失敗から学ぶために機械学習をどのように使用しているかを発表した。
-
AppleのML ComputeフレームワークがTensorFlowトレーニングを加速
最近のmac OS Big Surリリースの一部として、AppleはML Computeフレームワークを組み込んでいる。ML Computeは、IntelとM1ベースのMacの両方で、CPU上とGPU上において、トレーニングを改善するために最適化された数学ライブラリを提供する。それによって、TensorFlowディープラーニングライブラリを使用してトレーニング時間を最大7倍改善する。
-
Googleが新しいサーバーレスデータベース移行サービスを開始
最近、Googleはプレビューで新しいサーバーレスデータベース移行サービス(DMS)を発表した。このサービスは、オンプレミスまたはクラウド上のセルフホストのMySQLデータベース、および、他のクラウドのマネージドデータベースから、Cloud SQL for MySQLへの移行をサポートする。
-
MicrosoftがGPT-3 AIモデルの独占ライセンスを取得
Microsoftは、自然言語処理(NLP)用のOpenAIのGPT-3ディープラーニングモデルのライセンスに関する、OpenAIとの契約を発表した。Microsoftの発表によると、モデルの「独占的」ライセンスが付与されるが、OpenAIは引き続き独自のAPIを介してモデルへのアクセスを提供する。
-
UberのオープンソースAI抽象化レイヤ、Neuropod
UberオープンソースのNeuropodは、機械学習フレームワークの抽象化レイヤであり、研究者は統合の労力を削減しながら、選択したフレームワークでモデルを構築できるため、同じプロダクションシステムで異なるフレームワークに実装されたモデルを交換できる。Neuropodは現在、TensorFlow、PyTorch、Keras、TorchScriptなどのいくつかのフレームワークをサポートしている。
-
MicrosoftがAzure Cosmos DBおよびその他の機能の新しい価格設定モデルオプションを発表
2020年のBuildオンラインイベントで、Microsoftは、スパイクの多いワークロードに最適で、既存のプロビジョニングされたスループット価格設定モデルを補完する、「サーバレス」と呼ばれるAzure Cosmos DBの新しい消費ベースの価格設定モデルを発表した。
-
OpenAIはニューラル言語モデルのスケーリング法則を近似する
人工知能会社OpenAIは、固定のコンピューティングバジェットの最適な割り当てを決定するため、クロスエントロピー損失を使用して言語モデルの経験的スケーリング法則を研究している。
-
AWSが新しいS3 Intelligent-Tieringアーカイブアクセス層を発表
S3 Intelligent-Tieringは、AWSがユーザのストレージコストを最適化するためにAmazon S3に追加したストレージクラスである。同社は最近、2つの新しいアーカイブアクセス層を追加すると発表した。それは非常に低コストでまれなアクセス用に最適化された非同期アクセス用に設計されたものである。それはアーカイブアクセス層とディープアーカイブアクセス層である。