InfoQ ホームページ プログラミング に関するすべてのコンテンツ
-
Amazon SageMaker JumpStartがBria AIのテキスト画像変換モデルでポートフォリオを拡大
Amazon Web Servicesは、Bria AIの最新のテキストから画像への基礎モデルをAmazon SageMaker JumpStartに統合し、エンタープライズグレードの生成AI機能を大幅に拡張した。今回の追加には、Bria 2.3、Bria 2.2 HD、Bria 2.3 Fastの3つのバリエーションが含まれ、それぞれがビジュアルコンテンツ生成における特定の企業ニーズに対応するように設計されている。
-
xAIがGrokモデルの新APIサービスを発表
Elon Musk氏のxAIは、開発者がアプリケーションにxAIの大規模言語モデル(LLM)を統合できるようになる、APIサービスのパブリックベータ版をローンチした。
-
DecartとEtchedがゲーム世界を変える新しいAIモデル、Oasisをリリース
Decart.aiとEtched.aiは最近Oasis、Minecraftにインスパイアされた完全インタラクティブ、リアルタイムオープンワールド体験を生成するAI駆動モデルを発表した。
-
AWSがAIエージェント管理のためのMulti-Agent Orchestratorフレームワークを公開
AWSはMulti-Agent Orchestrator、複数のAIエージェントを管理し、複雑な会話シナリオを処理するために設計されたフレームワークを発表した。このシステムはクエリを最適なエージェントにルーティングし、インタラクション間でコンテキストを維持し、AWS Lambda、ローカルセットアップ、その他クラウドプラットフォームなどさまざまなデプロイ環境とシームレスに統合する。
-
AWS が Python と .NET 関数向けのLambda SnapStartを一般提供開始
AWSはPythonと.NET関数向けのLambda SnapStart、サーバーレスアプリケーションの起動パフォーマンスを大幅に改善するために設計された機能の一般提供を開始した。
-
AISuiteは統一クロスLLM APIを提供する新オープンソースPythonライブラリ
最近Andrew Ng氏によって発表された、現在利用可能なもっとも一般的な大規模言語モデル(LLM)に対してOpenAIライクなAPIを提供することを目的としたaisuiteは、開発者がコードを変更することなく簡単にLLMを試して結果を比較したり、あるLLMから別のLLMに切り替えることを可能にする。
-
GitHub Universe 2024、AIイノベーションと開発者向けツールを発表
GitHubは、GitHub Universe 2024で重要なアップデートを発表し、開発者の自律性の強化とAIネイティブな体験の向上に向けたシフトを示した。このイベントでは、アクセシビリティ、イノベーション、マルチモ���ルの柔軟性を中心に、ワークフローを簡素化し、あらゆるスキルレベルの開発者が人工知能の力を活用できるように設計されたツールを提供した。
-
Meta社のMobileLLMでオンデバイスユースケースに向けたLLM設計が促進
Meta社の研究者のMobileLLMに対する目標は野心的だ。小型モデルの品質は搭載しているパラメータが何十億あるかに直結したものではなく、むしろ注意深いアーキテクチャ設計の賜物であることを示そうとしている。その実証として、層の深いアーキテクチャと層の浅いアーキテクチャを埋め込み共有やグループ化クエリアテンションメカニズムを組み合わせた125M、350M、600M、10Bパラメータの4つのモデルを構築し、従来の最先端モデルよりも精度を向上させた。
-
Slackは安全性と安定性のためにChefアーキテクチャを進化させる
最近のブログ投稿で、SlackエンジニアリングはChefインフラストラクチャの大幅な改善について詳述している。これはサービス、データベース、アプリケーションを実行する何万ものEC2インスタンスを管理するもので、最近、単一のChefスタックから、より弾力性のある、シャーディングされたインフラに移行した。
-
Google初のAxionプロセッサーが利用可能に:クラウド市場で最高のパフォーマンスを主張
GoogleはAxionベースのインスタンスのデビューとなるC4A仮想マシンの一般提供を発表した。クラウドプロバイダーはこれらのインスタンスはAmazon Graviton4など競合他社の最新のArmベースの代替品と比較して最大10%の価格性能向上を実現すると主張している。
-
Rhymes AIがAriaを発表:開発リソースを備えたオープンソースのマルチモーダルモデル
Rhymes AIは、テキスト、画像、ビデオ、コードを効果的に処理できるオープンソースのマルチモーダルネイティブMoE(Mixture-of-Experts)モデル、Ariaを発表した。ベンチマークテストにおいて、Ariaは他のオープンモデルを凌駕し、GPT-4oやGemini-1.5などの独自モデルに対しても競争力のある性能を示した。さらに、Rhymes AIは、微調整や開発のためのモデルの重み付けやガイダンスを含むコードベースを公開している。
-
マイクロソフト、GraphQL用Fabric APIの一般提供を発表
マイクロソフトはGraphQL用Fabric APIを発表し、データアクセスレイヤーをパブリックプレビューから一般提供(GA)に移行した。このリリースでは、Azure SQLとFabric SQLデータベースのサポート、保存された資格情報認証、詳細な監視ツール、CI/CDワークフローとの統合など、いくつかの機能強化が導入されている。
-
Amazon QがVisual Studio CodeとJetBrains IDEsにインラインチャットサポートを追加
AWSは最近、Amazon Q Developerがインラインチャットをサポートし、開発者がエディタ内でコードの問題について議論し解決できるようになったと発表した。コードを直接更新できる機能とIDE内チャットのベネフィットを組み合わせたこの機能は、Claude 3.5によって提供されVisual Studio CodeとJetBrains IDEで利用できる。
-
メモリ効率を改善したValkey 8.0が一般提供開始
Linux Foundationは、Redisの後継として開発されたオープンソースのインメモリ・ストレージ・ソリューションであるValkey 8.0の一般提供を発表した。スロットごとにディクショナリを導入し、キーをディクショナリエントリに直接埋め込むことで、開発者は最大20%の容量増加を達成し、ノードごとに追加のキーを保存可能になる。
-
マイクロソフトと清華大学が大規模言語モデル向けのDIFF Transformerを発表
マイクロソフトAI と清華大学の研究者が、Differential Transformer (DIFF Transformer) という大規模言語モデルの性能向上を目的とした新しいアーキテクチャを発表した。同モデルでは、モデルによるコンテキスト処理の微調整や無関係な情報によるハルシネーションを最小限化することで、アテンション・メカニズムが向上している。