InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
ゼロショットラーニングの意外な効果 - Roland Meertens氏の講演より
先日のQCon PlusオンラインカンファレンスでRoland Meertens氏は、"The Unreasonable Effectiveness of Zero Shot Learning"と題して、AIベースのアプリケーション開発について講演した。その中で氏は、ファンデーションモデル(foundation model)とゼロショットラーニング(zero shot learning)を使ってアプリケーションのプロトタイプを迅速にデプロイし、フィードバックを得ることにより、大規模なデータセットの収集やモデルのトレーニングを不要にした2つの例を紹介した。
-
マシンラーニングがセキュリティにできること
マシンラーニングは、マルウェアの分析、予測の実施、セキュリティイベントのクラスタリングなど、さまざまな方法でセキュリティに適用できる。シグネチャの確立されていない、未知の攻撃を検出するために使用することも可能だ。
-
BigScience Research Workshop、AI言語モデルのT0をリリース
BigScience Research Workshopは、ゼロショット・マルチタスク(zero-shot multitask)学習の研究を目的として特別にトレーニングされた自然言語処理(NLP)AIモデルのシリーズを、T0としてリリースした。T0はBIG-benchベンチマークの大半において6倍規模のモデルを上回り、他のNLPベンチマークの一部では16倍の規模を持つGPT-3のパフォーマンスをも凌駕する。
-
MicrosoftがAzure Open AI Serviceをリリース、大規模なGPT-3モデルへのアクセスなどを提供
先日のIgniteカンファレンスにおいて、Microsoftは、Azureプラットフォーム経由でOpenAIのAPIにアクセス可能な新サービスであるAzure OpenAI Serviceのプレビューを発表した。この新たなAzure Cognitive Serviceは、OpenAIのパワフルなGPT-3モデルへのアクセスを、セキュリティ、信頼性、コンプライアンス、データのプライバシなど、Azureプラットフォームを通じて実現されるエンタープライズレベルの機能と合わせた形で実現する。
-
Baiduが110億のパラメータを持つチャットボットAIのPLATO-XLを発表
Baiduは先頃、対話生成(dialog generation)用AIモデルのPLATO-XLを発表した。英語と中国語のソーシャルメディア上の会話から収集した10億以上のサンプルを使ってトレーニングした結果、いくつかの会話ベンチマークで既存の商用チャットボットを凌ぐ、最高レベルのパフォーマンスを達成している。
-
Facebookが将来の行動を予測できる新しいAIモデルを開発
Facebookは、Anticipative Video Transformer(AVT)と呼ばれる最新の機械学習プロセスを発表した。視覚的な解釈を用いて将来のアクションを予測できる。AVTは、ビデオでのアクション予測のためのエンドツーエンドのアテンションベースのモデルとして機能する。
-
AIを有効にしたトラブルシューティングにより、リカバリ時間を短縮
異常検出の機械学習アルゴリズムは、一般化された ML モデルをトレーニングし、隠れたパターンを検出して疑わしい動作を特定するために適用し、日常業務の中でDevOpsを支援する。IT運用 (AIOP) に適用される機械学習は、企業の研究環境からプロダクション環境に移行し始めている。
-
IntelのLoihi 2とLava Frameworkでニューロモルフィックコンピューティング研究の進歩を目指す
Intelは、ニューロモルフィック (神経形態) コンピューティングの分野の研究用ツールを提供することを目的として、第2世代のニューロモルフィックチップであるLoihi 2 を発表した。また、IntelはLavaをリリースした。これは、従来のハードウェアとニューロモルフィックハードウェアの両方でニューロモルフィックアプリを構築するためのソフトウェアフレームワークだ。
-
GitHubのCopilot - オートパイロットへの道程は長い
GitHubがCopilotをローンチした3か月後、ニューヨーク大学のTandon School of Engineeringに籍を置く学者グループは、Copilotのコードコントリビューションに対する実証的サイバーセキュリティ評価をリリースし、生成されたコードの40パーセントはバグが多く脆弱であると結論付けた。
-
TeslaがAIモデルをトレーニングするためのD1 Dojoチップを発表
TeslaはTesla D1を発表した。BF16 / CFP8で362 TFLOPのパワーを提供できる人工知能用に特別に設計された新しいチップだ。
-
OpenAIがAI処理最適化のためのPythonベースのプログラミング言語であるTritonをリリース
OpenAIは最新の言語Tritonをリリースした。このオープンソースプログラミング言語によって、研究者はAI処理用に非常に効率的なGPUコードを記述できる。TritonはPythonと互換性があり、ユーザはわずか25行のコードでエキスパート品質の結果を得ることができる。コードは、Tritonのライブラリを使ってPythonで記述し、GPUで実行するためにJITコンパイルされる。
-
AWSが会話分析のためのAmazon Transcribe Call Analytics APIを発表
最近、AWSはAmazon Transcribeの新機能としてAmazon Transcribe Call Analyticsを発表した。AWSの顧客は、この新機能を使うと、顧客の会話から顧客やエージェントの感情などを分析できる。また、非通話時間、中断、声の強さ、通話速度などの会話特性を抽出できる。
-
BaiduのERNIE 3.0 AIモデルが、言語理解ベンチマークで人間のパフォーマンスを超えた
Baiduの研究チームは、Enhanced Language RepresentatioN with Informative Entities(ERNIE)の3.0バージョンに関する論文を発表した。これは自然言語処理(NLP)の深層学習モデルだ。モデルには100億のパラメーターが含まれており、SuperGLUEベンチマークで新しい最先端のスコアを達成し、人間のベースラインスコアを上回った。
-
BasisAIのオープンソース、Boxkite機械学習モニタリングツールとは
Boxkiteは、高可用なモデルサーバにおけるコンセプトドリフトを追跡するために設計されたオープンソースのインストルメンテーションライブラリだ。Grafana、Prometheus、fluentd、kubeflowなどのDevOpsツールと統合し、コードやインフラストラクチャを変更することなく、複数のレプリカを作成して水平方向にスケーリングする。プロジェクトは、速く、正しく、シンプルであるべきと主張している。
-
IT運用のための人工知能(AI) - その概要
IT運用における人工知能(AIOps)の活用は、ディープラーニング、データストリーム処理、ドメイン知識に由来する高度な手法を組み合わせ、内外のソースから取得したインフラストラクチャデータを分析することによって、運用を自動化し、異常(通常と異なるシステム挙動)がサービス品質に影響を与える前に検出しようというものである。