Deep Agent

Agents

Deep AgentはFlowHuntの最も強力なエージェントタイプであり、単一のプロンプトと応答サイクルをはるかに超えるタスク用に構築されています。標準的なAIエージェントが質問に答えたり個別のアクションを実行したりする場合、Deep Agentは目標を追求します。目標を分解し、ステップを実行し、結果を評価し、目的が完了するまでアプローチを適応させます。

Deep AgentがRegular AI Agentと異なる点

標準的なAIエージェントはLLMで入力を処理し、オプションでツールを呼び出し、応答を返します。これは単一ステップまたはより単純なマルチステップタスク、会話、ドキュメントの要約、またはアクションのトリガーに最適です。

Deep Agentはプロアクティブで反復的です。高レベルの目標を与えられると、次のことを行います:

  • 目標を分解し、アクションを取る前にコンクリートなサブタスクのシーケンスに分割します
  • アプローチを計画し、どのツールを使用するか、どの順序で使用するかを決定します
  • ステップを反復的に実行し、ツールを呼び出し、結果を処理し、見つけたことに基づいて次に何をするかを決定します
  • 自己評価各ステップの後、結果が不十分な場合は再試行、改善、または戦略を変更します
  • 最終出力を合成すべてのサブタスクが完了した後のみ

主な実用的な違い:通常のエージェントは最大で数ステップを取ることができますが、Deep Agentは数十のステップを取ることができ、いつ停止するかを知っています。

Deep Agentを使用する場合

Deep Agentは次の場合に適切な選択肢です:

  • タスクが複数のソースから情報を収集および合成する必要がある場合
  • ワークフローが条件付きロジックを含む場合、つまり次のステップが前のステップの結果に依存する場合
  • エージェントが独自の中間結果を検証またはクロスチェックする必要がある場合
  • 目標が複雑すぎるか、単一のプロンプトで完全に指定するには開かれすぎている場合
  • エージェントがより長い期間にわたって自律的に動作することを望む場合

覚えておいてください:単純で十分に定義されたタスクの場合、標準的なAIエージェントはより高速で費用効果的です。複雑さが追加の推論の深さを正当化する場合にのみDeep Agentを使用してください。

Deep Agent設定

LLM

エージェントが使用する大規模言語モデルを選択します。6つの主要なプロバイダーからモデルを選択できます。デフォルトモデルは常にOpenAIからの最新の中程度のモデルであり、ほとんどのタスクに十分です。

Deep Agentは強力な推論能力を持つより高度なモデルから最も利益を得ます(例:最新のGPT、最新のClaude SonnetまたはOpusモデル、Gemini Proモデル)。これらは多くのステップにわたって計画を立て、曖昧さに対処でき、人間のガイダンスなしで各段階で健全な決定を下すことができるためです。

Tools

ツールはDeep Agentに世界で行動する能力を与えるものです。900以上の利用可能なツール(API、データベース、通信プラットフォーム、検索エンジン、コード実行環境にまたがる)とMCPサーバーを備えて、エージェントにそのタスクに必要な正確な機能を装備できます。

ツールを接続する方法

+ツール追加をクリックします。利用可能なツールの完全なリストが表示されます。カテゴリでフィルタリングするか、名前で検索できます:

Deep Agentに接続するツールを選択する

各ツールには独自の設定があります。それぞれについて、AIがコンテキストに基づいてそれを使用する方法を決定させるか(Deep Agentに推奨、エージェントが多くのステップにわたって適応する必要があるため)、特定の値をロックするためにパラメータを手動で設定できます。

手動入力に切り替えるには、*「AI Decides」*ボタンをクリックします。パラメータが手動で定義されると、それは固定され、AIはそれをオーバーライドできません。

ツール設定

ツールが設定されたら、*「Add with Config」*をクリックするか、「Skip & Add」をクリックして設定をスキップします。その後、他のツールの追加を続けることができます。

Deep Agentの場合、焦点を絞った関連のあるツールセットは、過度に広いツールセットよりも優れた決定と高速な実行につながります。エージェントはすべてのステップで利用可能なすべてのツールを検討するため、不要なツールはノイズを追加します。

System message

システムメッセージはDeep Agentの最も重要な設定です。エージェントの役割、目標、推論アプローチ、および尊重する必要がある制約を定義します。これは自律的なエージェントをトラックに保つための主要なメカニズムです。

Deep Agentの場合、システムメッセージは以下をカバーする必要があります:

  • 目標 — エージェントが最終的に達成しようとしていること
  • 期待される出力 — 形式、長さ、構造
  • 決定ルール — データが欠落している場合、矛盾するソースがある場合、またはツールが失敗した場合に何をするか
  • スコープ制約 — エージェントが何をすべきか、何をすべきではないか

システムメッセージの例:

あなたは深い研究エージェントです。あなたの目標は、与えられたあらゆるトピックに関する包括的で正確でよく構造化されたレポートを作成することです。

プロセス:
1. トピックを4〜6つの主要な研究質問に分割します。
2. 各質問について、利用可能なツールを使用して関連情報を検索します。
3. 各ソースの品質と関連性を使用する前に評価します。
4. すべての質問からの調査結果をコヒーレントなレポートに統合します。
5. 最後に要約、主な調査結果、およびソースのリストを含めます。

ルール:
- 情報を作成しないでください。信頼できるソースが見つからない場合は、そう言ってください。
- ツール呼び出しが失敗した場合は、修正されたクエリで1回再試行してから先に進みます。
- すべての研究質問に対処されるか、利用可能なソースを使い果たすまで停止しないでください。
- 最終レポートを事実に基づいて、トーンは中立的に、推測なしに保ってください。

出力形式:マークダウン、各セクションの見出しをクリアに。

最大再帰の深さ

エージェントがサブタスクを分解して実行するときに再帰できるレベルの深さを制御します。より高い値を指定すると、エージェントはより複雑でネストされた問題に対処できますが、実行時間とリソース使用量が増加します。ほとんどのタスクでは、デフォルト値で十分です。エージェントが真のマルチレベルのサブゴールを追求する必要がある場合にのみ増加させてください。

エージェントチャット履歴

現在の実行のコンテキストとして過去のチャットメッセージを提供します。履歴が有効な場合、Deep Agentは以前の交換を参照できます。これは、エージェントが進行中の会話またはイテレーティブワークフローの一部である場合に便利です。履歴がない場合、エージェントは各実行を完全に独立したものとして扱います。

エージェントメモリ

エージェントがワークスペースメモリから読み取り、書き込みできるかどうかを制御します。有効にすると、Deep Agentは調査結果、決定、および蓄積された知識を別の実行にわたって保持できます。これにより、知識ベースを段階的に構築するか、ゼロから始めるのが無駄になる長期実行プロジェクトを再開することが可能になります。有効にした場合は、保存されるもの、およびそれがどのように取得されるかを管理する動作プロンプトとメモリモードを定義するよう求められます。

**注:**ツール入力のみが厳密に必須です。他のすべての設定はオプションですが、Deep Agentの出力の品質と信頼性に大きな影響を与えます。

Deep Agentがタスクを解決する方法

Deep Agentは構造化された実行ループに従います。このループは、Deep Agentが標準的なエージェントを圧倒するタスクを処理できるようにする理由です:

  • **目標分解:**エージェントは目標を分析し、サブタスクのシーケンスに分割します。
  • **反復的実行:**エージェントはサブタスクを1つずつ処理し、ツールを呼び出し、結果を処理し、完了したステップに基づいて次に何をするかを決定します。
  • **自己評価:**各ステップの後、エージェントは結果が前に進むのに十分であるか、または再試行、クエリを改善、またはまったく異なるアプローチを取る必要があるかを評価します。
  • **合成:**すべてのサブタスクが完了すると、エージェントは中間結果を最終的で首尾一貫した出力に組み合わせます。
  • **終了:**エージェントは目標が達成された場合、設定された制限に達した場合、または利用可能なツールと情報でタスクを完了できないと判断した場合に停止します。

Deep Agentに適切なモデルを選択する

LLMはDeep Agentが行うすべての決定の背後にある推論エンジンです。深いマルチステップのタスクでは、モデルの品質がパフォーマンスに大きな影響を与えます。

  • **フロンティアモデル(GPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro):**複雑な推論、長期計画、およびエージェントが曖昧さに対処するか人間の入力なしに判断を下す必要があるタスクに最適です。より高いコストは通常、Deep Agentワークロードに正当化されます。
  • **中程度のモデル:**中程度の複雑さだが十分に定義されたタスク向けの能力とコストの堅実なバランス。
  • **小規模言語モデル:**Deep Agentの主要なモデルとしては推奨されません。信頼できるマルチステップ実行に必要な推論の深さが不足しています。とはいえ、速度とコストが推論品質よりも重要なより大きなワークフロー内の単純なサブタスクには、まだ適しています。

中程度のモデルから始めて、パフォーマンスが必要な場合にのみアップグレードしてください。正しい選択はタスクの複雑さ、許容可能なレイテンシ、および予算に依存します。

よくある質問

AIエージェントを仕事に投入する準備はできていますか?

複雑なタスクに自動的に取り組む専門化されたAIエージェントのチームを構築します。コーディングは不要です。

詳しく見る

AIエージェント
AIエージェント

AIエージェント

FlowHuntでAIエージェントを構築、設定、およびオーケストレーションする方法を学びます。シンプルなエージェントからディープエージェント、フルクルーまで、必要なすべてのガイドをここで見つけることができます。...

1 分で読める
Agents
高度なAIエージェント:AIエージェントに効果的な計画を立てさせる方法
高度なAIエージェント:AIエージェントに効果的な計画を立てさせる方法

高度なAIエージェント:AIエージェントに効果的な計画を立てさせる方法

AIエージェントが計画を活用してコンテキストウィンドウの制限を克服し、タスク実行を向上させる方法を学びましょう。LangGraphの実装、状態機械、先進的な計画技術も解説します。...

1 分で読める
AI Agents LLM +2
AIアンサー生成器(無料・幻覚なし)
AIアンサー生成器(無料・幻覚なし)

AIアンサー生成器(無料・幻覚なし)

幻覚を起こさないAIアンサー生成器。リアルタイムデータに接続することでそれを実現しました。無料でお試しいただくか、ご自身で作成できます。...

1 分で読める
AI Answer Generator +4