Hugging Face Smolagents：LLMを搭載したエージェントを構築するためのシンプルなライブラリ

原文リンク(2025-01-05)

Smolagentsは、大規模言語モデル（LLM）を活用したエージェントを構築するためにHugging Faceで作成されたライブラリである。Hugging Faces社によると、この新しいライブラリはシンプルで特定のLLMにとらわれないことを目指しているという。セキュアな「コードでアクションを記述するエージェント」をサポートし、Hugging Face Hubと統合されている。

エージェント・システムは、狭いタスクを解決するために考え出された、あらかじめ決められたワークフローの単なる実行を超えて、コンピュータ・プログラムの可能性を拡張することを約束する。実際、現実の問題のほとんどは、あらかじめ決められたワークフローには当てはまらないと、ハギング・フェイス(Hugging Face)のエンジニアであるアイメリック・ルーシェ(Roucher)、メルヴェ・ノヤン(Noyan)、トーマス・ウルフ(Wolf)は言う。

HuggingFaceの考えでは、エージェントはLLMに外の世界へのアクセスを提供する。エージェントベースのシステムは、マルチステップエージェントまたはマルチエージェントであり、システム内のLLMのエージェンシーのレベルにおいて、他のLLMベースのシステムとは異なる。具体的には、AIエージェントは、LLMの出力がシステムのワークフローを制御するという特徴を持つ。これに対して、他のLLMベースのシステムでは、LLMの出力はプログラムの流れにまったく影響を与えないか、何らかの中間的な効果をもたらす。

エージェントシステムがワークフローの柔軟性を実現する方法は、LLMに外部ツールを呼び出す形のアクションを書かせることである。この考え方は、以下のメタコードで表現される。

memory = [user_defined_task] (ユーザー定義タスク)while llm_should_continue(memory)：# このループがマルチステップ部分である    action = llm_get_next_action(memory) # これはツールを呼び出す部分である。    observations = execute_action(action)    memory += [action, observations］

このアイデアは新しいものではなく、Roucher、Noyan、Wolfが指摘しているように、Anthropic、OpenAI、その他がこのようなアクション、つまり外部ツールの呼び出しを記述するために使用している、一般的に受け入れられているJSONフォーマットがすでに存在している。ここでsmolagentsは、JSONはコンピュータが何をすべきかを表現する最良の方法ではないという認識に基づいて、独自のアプローチを取った。なぜなら、プログラミング言語は、コンピュータの動作を記述するための優れた方法であり、より優れた合成性、データ管理、汎用性を備えているからだ。LLMはすでに質の高いコードを作成する能力を持っているので、このアプローチによって大きな複雑さが加わることはない。

エージェント・システムを作るには、エージェントの出力の解析や、前回の反復で起こったことに基づくプロンプトの合成など、いくつかの再帰的な問題を解決する必要がある。エラー・ロギングやリトライ・メカニズムとともに、これらはsmolagentsが提供する重要な機能のひとつである。

しかし、エージェント・システムを構築したいのであれば、まずエージェントが必要かどうかを判断する必要がある。実際、Roucher、Noyan、Wolfが説明しているように、エージェントはやりすぎかもしれない。

もし[ある]決定論的なワークフローがすべてのクエリに適合するのであれば、ぜひすべてをコード化すればよいです！そうすれば、予測不可能なLLMがワークフローに干渉することによってもたらされるエラーのリスクなしに、100％信頼できるシステムが得られます。シンプルさとロバスト性のために、エージェント的な振る舞いを使わないように規則化することをお勧めします。

エージェントが必要だと確信したら、LLMといくつかのツールが必要だ。Hugging FaceHfApiModelクラスを使ってどんなオープンモデルを使うこともできるし、LiteLMMModelを使ってたくさんのクラウドベースのLLMにアクセスもできる。ツールはLLMがいくつかの入力で実行できる関数に過ぎない。

Hugging Faceは、GPT4o、Claude3.5、LLaMA-3.3 70Bなどの主要なモデルを使って一連のベンチマークを実行し、smolagentsを作成した。そして、オープンモデルは最良のクローズドモデルに匹敵することを発見した。

Hugging Face smolagentsだけが、現在利用可能なエージェント・システム作成ツールではない。特に、OpenAIがリリースしたSwarmは、ルーチンとハンドオフを活用して、複数のエージェントを互いに協調させる。さらに、マイクロソフトはMagentic-Oneを発表し、AWSは独自のMulti-Agent Orchestratorを持っている。

作者について

Sergio De Simone

もっと見るより少なく

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

作者について

Sergio De Simone

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

Cloudflare社、Rust向けQUICおよびHTTP/3を容易にするtokio-quicheをオープンソース化

Cloudflare社の年次総括：AIボットの過剰クロールと耐量子暗号50％到達、Goが倍増

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

AIコーディングアシスタントはデリバリーを加速しない、なぜならコーディングがこれまでボトルネックではなかったから

Grab、リアルタイムデータ品質監視をプラットフォームに追加

OpenAIがHarness Engineeringを発表：Codexエージェントが大規模ソフトウェア開発を牽引

人工知能によって顧客とのつながりはどう変わるか

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

AWSがStrands Labsを発表、実験的AIエージェントプロジェクト向け

GoogleがGemini CLI Conductorに自動レビュー機能を追加

Googleの8つの基本的マルチエージェント設計パターン

Google Cloudは、130,000ノードのGKEクラスターを用いてKubernetesの大規模スケールを実証

オープンソースのAgent Sandbox、Kubernetes上でAIエージェントの安全な展開を可能に

AI駆動サイバー脅威と戦うには多層防御がキー、CNCFレポートが明らかに

QCon AI Boston

Online InfoQ Architect Certification

Online InfoQ AI Engineering Certification

QCon San Francisco

Hugging Face Smolagents：LLMを搭載したエージェントを構築するためのシンプルなライブラリ

作者について

Sergio De Simone

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。