InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
本番環境におけるLLM最適化のための、Hugging Faceのガイド
大規模言語モデル(LLM)を実運用に導入する場合、2つの大きな課題は、それらが必要とする膨大な量のパラメータと、文脈情報を表現するための非常に長い入力シーケンスを扱う必要性から生じる。 Hugging Faceは、このようなモデルを扱った経験に基づき、これらのハードルに取り組むためのテクニックのリストを文書化した。
-
GitLabの2023年グローバルDevSecOpsレポートでは、AIが"なくてはならない"ものに
GitLabは2023年グローバルDevSecOps AIレポートを発表し、主な分析結果としてAIとMLの利用が「あるとよい」ものから「なくてはならない」ものへと進化していると発表した。
-
Amazon Opensearch Serverless用のベクトルエンジンがプレビュー開始
AWSは、Amazon OpenSearch Serverless内のベクトルストレージと検索機能のプレビューリリースを発表した。この機能は、機械学習によって拡張された検索体験と生成AIアプリケーションをサポートすることを目的としている。
-
Ai4 2023 パネルディスカッション:ビジネスと社会における生成AI
先日開催されたAi4カンファレンスでは、"Generative AI in Business and Society (「ビジネスと社会における生成AI」)"と題したパネルディスカッションが行われた。重要なポイントは、生成AIは業務効率化と製品のパーソナライゼーションに多くの機会を提供すること、企業はプライバシーへの懸念とパーソナライゼーションのバランスを取る必要があること、そして生成AIが組織全体でどのように使用されているかを理解する必要があることである。
-
GPT-3.5 Turbo、品質と性能を向上させるための微調整が可能に
OpenAIはGPT-3.5 Turboを開発者が利用できるようにし、特定のユースケースのパフォーマンスを向上させるためにモデルをカスタマイズできるようにした。OpenAIによると、GPT-3.5 Turboをファインチューニングすることで、特定のタスクではGPT-4ベースの性能を上回ることもあるという。
-
Spring AI、OpenAIおよびAzure OpenAIとの連携機能を発表
SpringOneカンファレンスでSpring AIに関する実験的なプロジェクトが紹介された。これにより、同AIの基本的なコンセプトを用いたAIアプリケーションの制作が可能となる。現在、プロジェクトはAzure OpenAIとOpenAIをAIバックエンドとして統合している。コンテンツ生成、コード生成、セマンティック検索、要約などのユースケースがプロジェクトによってサポートされている。
-
SpotifyはSidekickのLLMチャットボットをどのように改善したか?
Large Language Model (大規模言語モデル、LLM)チャットボットにより革新的なソリューションへの扉が開かれる中で、SpotifyのエンジニアであるAtes Goral氏は、ユーザーエクスペリエンスを可能な限り自然なものにするために、レンダリングジャンクを防ぎ、待ち時間を減らすための具体的な取り組みが必要であると主張している。
-
OpenAI、ビジネスに特化したChatGPT Enterpriseを発表
OpenAIは、エンタープライズグレードの保護とプライバシー、より高速でのGPT-4無制限アクセス、より長い入力を処理するための拡張コンテキストウィンドウ、追加のデータ分析機能、カスタマイズの可能性などを提供するChatGPT Enterpriseを発表した。
-
Mojoプログラミング言語の紹介
Mojoは、PythonのシンプルさとRustのスピードとメモリの安全性を組み合わせた、新しく発表されたプログラミング言語である。開発の初期段階にあり、その機能を探求するためのオンラインプレイグラウンドをユーザーに提供している。Mojoはデータサイエンスと機械学習における卓越性を目指しており、Pythonに代わる高速な言語を提供する。オープンソース化も徐々に計画されている。
-
Jupyter NotebookにジェネレーティブAI機能を搭載
オープンソースのProject Jupyterは、Jupyter Notebookに強力なジェネレーティブAI機能をもたらす無料ツールJupyter AIをリリースした。
-
AI、ML、データエンジニアリングニュースまとめ:Jupyter AI、AudioCraft、OverflowAI、StableCode、Tabnine
2023年8月7日までの記事で、人工知能、機械学習、データ・サイエンスの分野における重要な成果やリリースが紹介されている。今週の主なニュースは、Jupyter、Meta AI、Stack Overflow、Stability AI、Tabnineに関するものだった。
-
ReSharperにAIアシスタント機能を搭載
JetBrains社は、Microsoft Visual Studio用の開発者向け拡張機能であるReSharperのAI搭載バージョンをリリースした。リリースされたReSharper 2023.2はAIを搭載した最初のバージョンとなる。
-
Googleの音声AI AudioPaLMが音声転送で翻訳を行う
Googleの研究者は、音声転送によるテキスト音声変換 (TTS)、自動音声認識(ASR)、音声翻訳(S2ST)を行う大規模言語モデル(LLM)であるAudioPaLMを発表した。AudioPaLMはPaLM-2 LLM をベースにしており、翻訳ベンチマークではOpenAIのWhisperを上回っている。
-
AWS、AI/MLおよびHPCワークロード向けAmazon EC2 P5インスタンスの一般提供を開始
AWSはこのほど、AI/MLおよびHPCワークロードで高いパフォーマンスとスケーラビリティを必要とするユーザー向けに、最新のNVIDIA H100 Tensor Core GPUを搭載したAmazon EC2 P5インスタンスの一般提供(GA)を発表した。今回のGAは、先に発表されたインフラストラクチャの開発に続くものである。
-
QCon New York 2023 2日目のまとめ
2023年6月14日、ニューヨークのブルックリンにあるNew York Marriott at the Brooklyn Bridgeで、第9回QCon New Yorkカンファレンスの二日目が開催された。3日間あるこのイベントは、エンタープライズ開発コミュニティにおける偏りのないコンテンツと情報に焦点を当てたソフトウェアメディア会社であり、InfoQとQConの運営元であるC4Mediaが主催している。Alicia Dwyer Ciancioloによる基調講演と、以下4つのテーマからのプレゼンテーションが行われた。