メインコンテンツにスキップ

パート7: 本番エージェントのリリース

これまでのすべては、エージェントを使ってソフトウェアを構築することについてでした。このパートは、構築するものそのものがエージェントである場合についてです — カスタマーサポートボット、リサーチアシスタント、社内監視ツール。これらは一度実行するスクリプトではなく、実際のユーザーに提供するプロダクトであり、その下に更多くのものが必要です。

まず、実際に何を構築しているかを決める

始める前に最も有用な問いの一つ:

  • これはスクリプトか? 一回限りの自動化、個人用ツール、プロトタイプ。エージェントが目的地です。ターミナルの通常のコーディングエージェントで十分です。
  • これはプロダクトか? 実際のユーザーが依存するもの。エージェントは今やプロダクトであり、その下に基盤が必要です:専用のツール、メモリ、評価、デプロイメントインフラ。

この2つを混同することで、プロトタイプが意図せずリリースされます。何を構築するかについては、何かを書く前に明示してください。

本番エージェントがスクリプトとは異なり必要とするもの

実際のユーザーがエージェントに依存する場合、4つのことがオプションではなくなります:

  • セッションをまたいだ永続メモリ — エージェントが毎回ゼロから始めないように。
  • すべてのツールとデータソースへのスコープされた権限 — エージェントがアクセスすべきものにのみ到達できるように。
  • CIで実行されるエバリュエーションカバレッジ — リグレッションがリリース前に検出されるように(これはパート3をエージェント自体に適用したものです)。
  • エージェントが実際に何をしたかをトレースするオブザーバビリティ — 本番環境の動作が監査可能であるように(これはパート5をエージェント自体に適用したものです)。

一回限りのスクリプトではこれらを行う価値はありません。プロダクトでは、リリース後ではなく前に構築することが、保守不可能で信頼性のないシステムになる道です。

プロトタイプから本番まで一つのワークフローを維持する

これを実践的にするシフト:プロトタイプを生み出す同じターミナルベースのワークフローが、デプロイされたプロダクトまで届きます。本番に向かうための別のスタックを学ぶ必要はありません。やりたいことを説明すれば、スキルバンドル(パート2の種類のもの)が既存のコーディングエージェントにフルライフサイクルを与えます — スキャフォールド、書く、評価する、デプロイする、オブザーバビリティを組み込む — 新しいSDKなしで。

エンドツーエンドのループは会話のようになります:

# one-time setup of the skills bundle, then, in your coding agent:
> Build a support agent that answers questions from our docs.
> Evaluate it against the FAQ dataset.
> Deploy it to the runtime.

その裏で、エージェントはテンプレートからプロジェクトをスキャフォールドし、コードを書き、エバリュエーションセットを生成し、実行し、デプロイし、報告します。直接ドライブすることを好む人には、同じステップが普通のCLIコマンドとして利用できます。結果:昨日あなたのラップトップで動いていたプロトタイプが、今日ユーザーに提供する本番エージェントになります。書き直しなしで。

マルチエージェントへ

一つのエージェントでは不十分な場合、連携は3つのメカニズムで行われ、異なるスケールで使用されます:

  • 共有セッション状態 — エージェントが同じコンテキストを見るだけでいい単純なケース。
  • MCP(モデルコンテキストプロトコル) — エージェントがツールと外部サービスにアクセスする標準的な方法。
  • A2A(Agent2Agent) — 一つのエージェントが別のエージェントに作業を委任する場合。

これらは合うパターンに応じて組み合わせられます:スペシャリストにサブタスクを渡すプランナー、ジョブの異なる部分での並行ワーカー、ビルダーエージェントを確認するレビュワーエージェント。ボトルネックは実装を書くことから、各エージェントが何をすべきかを仕様化し、それが実行されたことを検証することへ移ります — このガイドの残りと同じテーマが、一段上のレベルで。

自分のワークフローをセットアップする

  • 次のエージェントのために、一文を書く:「これはスクリプトです」または「これはプロダクトです」。それがどれだけの基盤を構築するかを決めさせる。
  • プロダクトの場合、4つの必須要素を追加する:永続メモリ、スコープされた権限、CIエバリュエーション、実行トレーシング。
  • ビルド→評価→デプロイ→観測が一つのワークフローに留まるようにスキルバンドルを使用する。
  • 複数のエージェントが必要な場合、共有状態から始め、連携が実際にそれを必要とする場合にのみMCPとA2Aに手を伸ばす。