InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Amazon OpenSearchに履歴データの異常検出を追加
Amazon OpenSearch は先ごろ履歴データの異常検出サポートを導入した。この機械学習ベースの機能は、OpenSearch データの傾向、パターン、季節性を特定するのに役立つ。
-
OpenAIが質問応答AIのWebGPTを発表
OpenAIはWebGPTを開発した。GPT-3に基づく長い形式の質問応答用のAIモデルである。WebGPTは、Web検索クエリを使用して、その応答のサポートするリファレンスを収集する。Redditの質問に対する回答について、人間の審査員が69%の確率で、最高投票の回答よりも好んだ。
-
InfoQ 2022イベント:ソフトウェアをリードするプラクティショナーと深く掘り下げる準備へ
私たちのイベントはオンライン(InfoQ LiveとQCon Plus)と対面の両方で行われる。対面は、ロンドン(4月4日~6日)とサンフランシスコ(10月24日~28日)でQConソフトウェア開発会議が再び開催される。今年のパターンとプラクティスを採用する役に立つような、実用的なインスピレーションを得るために参加してください。
-
AIは見ることによっても聞く
Meta AIは、自己監視型音声認識モデルをリリースした。このモデルはビデオも使用し、ある程度の量があるデータに対して現在の最先端モデルよりも75%優れた精度を実現する。この新しいモデルAudio-Visual Hidden BERT (AV-HuBERT)は、視聴覚機能を使用して、音声のみに基づいてモデルを改善する。使用される視覚機能は、人間の場合と同じように、読唇術に基づいている。
-
PyTorch利用についてメタとAWSが協力
MetaとAWSは協力して、AWSでPyTorchを実行しているアプリケーションのパフォーマンスを改善する計画である。そして、開発者が人工知能と機械学習モデルを構築、トレーニング、デプロイ、運用する方法を加速する。
-
Facebookが20億パラメータの多言語音声認識モデルXLS-Rをオープンソース化
Facebook AI Research(FAIR)はXLS-Rをオープンソース化した。クロスリンガル音声認識(SR)AIモデルだ。XSLRは、128言語の436K時間の音声音声でトレーニングされている。以前の最大モデルよりも1桁多く、いくつかのダウンストリームSRタスクと翻訳タスクで現在の最先端技術を上回っている。
-
MLCommons、最新のMLPerfトレーニングベンチマークの結果を発表
エンジニアリングコンソーシアムのMLCommonsは先頃、MLPerf Trainingベンチマークコンペティションの最新ラウンドの結果を発表した。14の組織から158を越えるAIトレーニングジョブのパフォーマンスメトリクスが提出され、最高値には前回ラウンドに比較して2.3倍の向上が確認されている。
-
Googleが2800億パラメータのAI言語モデル”Gopher”をトレーニング
Google子会社のDeepMindが、2,800億のパラメータを持つAI自然言語処理(NLP)モデルGopherを発表した。Transformerアーキテクチャをベースとし、MassiveTextと呼ばれる10.5TBのコーパスでトレーニングされたGopherは、124評価タスク中の100件において現在の最高記録を凌駕する。
-
Microsoft、分散マシンラーニングライブラリSynapseMLをオープンソース公開
Microsoftは、分散マシンラーニング(ML)パイプラインの構築と管理を行うオープンソースライブラリのSynapseMLをリリースすると発表した。SyanpseMLはApache Spark上で動作し、複数のデータストアを対象に言語非依存のAPI抽象化を提供するもので、Open Neural Network Exchange(ONNX)など既存のMLテクノロジに統合される。
-
DeepMindが天気予報AIである降水のDeep Generativeモデルをリリース
DeepMindはDeep Generative Models of Rainfall(DGMR)のデータセットとトレーニング済みモデルスナップショットをオープンソース化した。短期の降水量予測用のAIシステムだ。58人の専門気象学者が、他の既存の方法との比較で実施した評価で、DGMRはテストケースの89%で精度と有用性で1位にランクインした。
-
Azure SpaceがAzure Orbitalのプレビューと新しい地理空間機能を導入
Microsoft は先ごろ、Azure Space の新しい衛星接続と地理空間機能を発表した。同クラウドプロバイダは、衛星の通信と制御を提供するサービスとしての地上局である Azure Orbital のプレビューを導入し、Esri、Blackshark.ai、および Orbital Insight との地理空間とデータ分析のパートナシップを追加した。
-
AWSが機械学習を学習し実験するための無料ツールSageMaker Studio Labを発表
AWSはSageMaker Studio Labを発表した。開発者が機械学習技術を学び、その技術を実験するのに役立つ無料サービスだ。SageMaker Studio Labは、JupyterLab IDE、CPUとGPUのモデルトレーニング、15GBの永続ストレージなど、開始するためのベースとなるものをすべてユーザに提供する。
-
MITの研究者がディープラーニングの計算負荷を調査
MIT、延世大学、ブラジリア大学の研究者チームが新しいWebサイトComputer Progressを立ち上げた。1,000を超える深層学習研究論文の計算負荷を分析するものだ。このサイトのデータにより、計算負荷が予想よりも速く増加していることが示されている。アルゴリズムにはまだ改善の余地があることを示している。
-
Hazelcastがバージョン5.0で新しい統合プラットフォームを発表
分散コンピューティング、ストレージプラットフォームのHazelcastは、Hazelcast Platformバージョン5.0のリリースを発表した。この新しいプラットフォームは、既存の製品であるHazelcast IMDGとHazelcast Jetを統合するものである。前者はデータを保存、取得、変更するための高速な方法を提供し、後者はデータの高速処理を提供する。
-
リアルタイムMLのためのストリーミングファーストなインフラストラクチャ - Chip Huyen氏の講演より
先日のQCon PlusオンラインカンファレンスでChip Huyen氏は、"Streaming-first Infrastructure for Real-time ML"と題して、継続的マシンラーニング(continual machine learning)について講演し、リアルタイムで継続的なマシンラーニングのためのストリーミングファーストなインフラストラクチャの持つアドバンテージ、リアルタイムMLのメリット、リアルタイムML実現のための課題、といった話題を取り上げた。