
AI Agentはどのように思考するのか?ReActとPlan-and-Execute完全ガイド
AI Agentはどのように思考するのか?ReActとPlan-and-Execute完全ガイド
チャットボットからデジタル従業員へ — 自律型AIを支えるアーキテクチャ
最近のAIの進化に注目している方なら、Claude CodeやGitHub Copilotがどこでも使われているのをご存知でしょう。もはや数行のコードを書くだけではありません。「デジタル従業員」のように、チケットを処理し、バグを修正し、テストを実行します。この自律性を支えているのがAIエージェントです。
このガイドでは、AIエージェントが実際にどのように「思考」するのか、2つのコアパターンReAct(Reason + Act)とPlan-and-Execute(計画と実行)に焦点を当てて解説します。
01 | AIエージェントとは何か?
AI業界では、広く受け入れられている公式があります:
エージェント = 脳(LLM)+ 計画 + 記憶 + ツール
| コンポーネント | 役割 |
|---|---|
| LLM(脳) | 司令塔 — 論理的推論を提供 |
| 計画(Planning) | 戦略 — 複雑なタスクをステップに分解 |
| 記憶(Memory) | コンテキスト — 過去の判断やユーザー設定を記憶 |
| ツール(Tools) | 手足 — API呼び出し、ファイル読み取り、コード実行 |
これは理論だけではありません。Claude CodeからCursor、GitHub Copilotに至るまで、主要なAIコーディングツールはすべてこのアーキテクチャの何らかのバージョンを実装しています。そして、これらのエージェントと必要なモデルを接続する最良の方法は、TokenSmindのような統合ゲートウェイです。200以上のモデル、1つのAPIキー、スマートなコスト最適化が組み込まれています。
02 | ReActモード:考えながら実行する
ReAct(Reason + Act)は最も広く使われているパターンです。その哲学:すべてを事前に計画せず、ステップごとに繰り返す。
仕組み
ReActループには3つのフェーズがあります:
- 思考(Thought) — LLMが現在の状態を分析
- 行動(Action) — どのツールを呼び出すか決定(検索、ファイル読み取り、コマンド実行など)
- 観察(Observation) — ツールの実際の出力を受け取る
- ループ: 観察結果をフィードバックし、思考から繰り返す
- 終了: 目標が達成されたら、最終回答を出力
例:バグ修正
ユーザーコマンド:「ゼロ除算によるmain.pyのクラッシュを修正して」
| ステップ | 種類 | 内容 |
|---|---|---|
| 1 | 思考 | 「main.pyを読んでクラッシュ箇所を特定しよう」 |
| 2 | 行動 | read_file("main.py") |
| 3 | 観察 | 15行目にresult = a / b、ゼロチェックなし |
| 4 | 思考 | 「問題を発見。ゼロ除算ガードを追加しよう」 |
| 5 | 行動 | write_to_file("main.py", fixed_code) |
| 6 | 観察 | 書き込み成功 ✓ |
| 最終 | 回答 | 「バグ修正完了 — 15行目に除数チェックを追加しました」 |
ReActの得意分野: 素早い反復、ツール多用のワークフロー、対話的なデバッグ
ReActの苦手分野: 長いマルチステップタスク(迷子になりやすい)
03 | Plan-and-Executeモード:まず計画し、それから実行
複雑で長期的なタスクには、ReActでは「盲人象を撫でる」ようなものです。そこでPlan-and-Executeの登場です。まず地図を作り、それから進軍します。
3ロールアーキテクチャ
このパターンは、3つの専門ロールを持つ成熟したプロジェクトチームのように機能します:
| ロール | 責任 |
|---|---|
| プランナー(Planner) | 曖昧な指示を受け取り、順序付きTODOリストに分解 |
| 実行者(Executor) | タスクを1つずつ実行(内部的には多くの場合ReActエージェント) |
| 再計画者(Replanner) | 各ステップ後に結果を評価し、必要に応じて元の計画を調整 |
例:市場調査レポート
ユーザーコマンド:「AI半導体市場を調査し、データソースの予算500ドル以内でサマリーレポートを作成して」
プランナーの初期計画:
- 主要なAI半導体メーカーを特定(NVIDIA、AMD、Intel、Google TPU)
- 公認ソースから市場規模データを取得
- パフォーマンスベンチマークを比較
- 価格動向を分析
- サマリーレポートを生成
実行者がステップごとに実行。
再計画者の動的調整:
- 予想外:NVIDIAの最新決算が予想を20%上回る
- 調整:再計画者が新しいステップ「NVIDIA決算が競合環境に与える影響を分析」を追加
- 予算再評価:追加データ取得には80ドル、500ドルの予算内で問題なし
Plan-and-Executeの得意分野: リサーチプロジェクト、ソフトウェアアーキテクチャ設計、旅行計画、マルチフェーズワークフロー
Plan-and-Executeの注意点: 計画フェーズが遅く、先行してトークンを消費する
04 | モード比較
| 特性 | ReAct | Plan-and-Execute |
|---|---|---|
| コア特性 | 動的、柔軟、適応的 | 構造化、系統的 |
| 最適な用途 | 頻繁なツール呼び出しを伴う短いタスク | 一貫性が必要な長いワークフロー |
| 強み | 高速応答、即時エラー修正 | 強力な論理、迷子にならない |
| 弱み | 長い実行で迷子、トークン浪費 | スロースタート、複数LLM呼び出し |
| 使用例 | Claude Codeのファイル編集 | マルチエージェント研究自動化 |
05 | テクニカルベストプラクティス
構造化思考にXMLタグを使用
エージェントのシステムプロンプトで、<thought>タグと<action>タグを使って出力するよう要求します。これは単なるパースのためではありません — 行動する前にモデルに明示的に考えさせるのです。
必ずHuman-in-the-Loopを追加
危険な操作(rm -rfや未知のターミナルコマンドの実行など)には、エージェントが進む前に「人間の確認」ステップを必須にします。安全第一。
メモリを階層化
- 長期記憶: ベクターデータベースに保存(RAG)
- 短期進行状況: コンテキストキャッシュに保持
- セッション記憶: 現在のタスク状態を追跡
各タスクに適したモデルを使用
TokenSmindの統合APIを使えば、単純なタスクはGPT-4o MiniやGemini Flashなどのコスト効率の良いモデルへ、複雑な推論はGPT-5やClaude Opusへ — すべて単一の統合でルーティングできます。5種類ものAPIキーを管理する必要はもうありません。
06 | 大きな展望:コンテンツ生成からアクション生成へ
AIエージェントは根本的なシフトを表しています:AIはコンテンツ生成からアクション生成へと移行しています。
- ReActは俊敏性を提供 — リアルタイムで応答し修正する能力
- Plan-and-Executeは信頼性を提供 — 複雑なマルチステップミッションに取り組む構造
この2つが組み合わさって、明日のデジタルワークフォースのアーキテクチャを形成します:
- 自律的にデバッグしデプロイするAIプログラマー
- 市場を調査しレポートを書くAIアナリスト
- デプロイメントと監視を管理するAIオペレーション
- チームやツールを横断して調整するAIアシスタント
独自のAIエージェントを構築しませんか? TokenSmindはインフラストラクチャを提供します:200以上のモデルへの統合APIアクセス、コスト最適化のためのスマートルーティング、エンタープライズグレードのログと請求、そして任意のエージェントフレームワークと接続する柔軟性 — すべて単一のAPIキーの背後で。
TokenSmind Blogで最初に公開されました。AIエージェントアーキテクチャと実践ガイドのさらなる深掘りをお楽しみに。
Related Articles
经验AI Agent suy nghĩ như thế nào? Hướng dẫn chi tiết về ReAct và Plan-and-Execute
Tìm hiểu cách AI Agent sử dụng ReAct và Plan-and-Execute để tự động suy nghĩ và hành động. Hướng dẫn đầy đủ với phân tích kiến trúc và ví dụ thực tế.
经验How AI Agents Think: ReAct vs Plan-and-Execute — A Complete Guide
Learn how AI Agents use ReAct and Plan-and-Execute patterns to think and act autonomously. Complete guide with examples, architecture breakdown, and best practices.
经验Multi-Agent Collaboration Modes: From Theory to Production at TokenSmind
Explore three proven multi-agent collaboration patterns for production AI systems: Parallel Expert Team, Serial Pipeline, and Dynamic Routing. Learn how TokenSmind makes them easy.
