フローの説明
目的と利点
このワークフローは、ウェブサイトの sitemap.xml
を構造化された AI 向けの llms.txt
形式に変換するプロセスを自動化します。AI エージェントと取得ツールを活用し、サイトの内容を大規模言語モデル(LLM)やその他 AI アプリケーション向けに準備する作業を効率化します。以下は、そのステップと構成要素の詳細な内訳です。
1. ユーザー体験とエントリーポイント
2. ユーザー入力の処理
- チャット入力ノード
ユーザーは自分の sitemap.xml
ファイルの URL をチャットインターフェースに貼り付けます。 - ワークフローのトリガー
入力された URL は自動的に次のステップへ渡され、処理が開始されます。
3. サイトマップ URL の取得と処理
4. 外部知識による補強
5. AI エージェントによるコンテンツ変換
- AI エージェントノード
このワークフローの中核である AI エージェントは、次の設定で構成されています:- ゴール:
sitemap.xml
の内容を、例に従い構造化された llms.txt
に変換 - 背景と役割:
llms.txt
ファイル生成のスペシャリストとして設定 - ツール:
Google 検索と URL 取得ツールを併用し、サイト/ウェブの内容へアクセス - 動作:
エージェントは以下を行います:- 取得したすべてのページ内容を読み取る
- タイトルと構造を特定
- 重要なページを優先してリストアップ
- 重要度の低いページ(カテゴリやタグなど)は末尾に配置
- 厳密なフォーマットを順守し、LLM 用
llms.txt
の要件を満たす出力に
6. 出力とユーザーフィードバック
- チャット出力ノード
AI エージェントがフォーマットした(llms.txt
の)出力がチャット上に表示され、そのまま AI トレーニングやインジェストに利用できます。
ワークフロー構成(プロセス概要)
ステップ | コンポーネント | 目的 |
---|
1 | チャットオープントリガー | ウェルカム/案内メッセージを表示 |
2 | メッセージウィジェット | ユーザーに sitemap.xml URL の入力を案内 |
3 | チャット入力 | ユーザーが sitemap.xml URL を送信 |
4 | URL 取得 | サイトマップから URL やコンテンツを取得・解析 |
5 | Google 検索ツール | (任意)ページの追加情報・文脈取得 |
6 | URL 取得(Google) | (任意)Google で見つかった URL からコンテンツ取得 |
7 | AI エージェント | すべてのページデータをフォーマット済み llms.txt に変換 |
8 | チャット出力 | フォーマット済み llms.txt をユーザーに提示 |
このワークフローが役立つ理由
スケーラビリティ
面倒な手作業を自動化し、技術知識がなくても任意サイトのサイトマップを LLM 向けに変換できます。
品質と一貫性
厳密なフォーマットに合わせて出力し、AI トレーニングデータの品質を向上
拡張性
知識ソース追加や高度な抽出ロジックへのカスタマイズも可能
効率性
キャッシュやトークン制限を統合し、大規模サイトでも高速・確実に処理
AI 主導の判断
重要ページの優先順位付けや構造化も自動で、手動では煩雑な作業をインテリジェントに実現
利用例
- サイト全体を 1 つの構造化ドキュメントとして AI に取り込む準備
- ナレッジベースやドキュメントシステム向けのコンテンツ自動収集
- ドメイン特化サイト内容での LLM ファインチューニング用データセット作成のスケールアップ
このワークフローなら、ウェブサイトのサイトマップを AI 最適化テキストファイルに手早く確実に変換可能。手作業の時間を大幅に削減し、高品質な構造化データを AI モデルに提供できます。