コンポーネントの説明
XMLドキュメント検索コンポーネントの仕組み
XMLドキュメント検索コンポーネントは、XMLドキュメント内の検索を効率化する多機能ツールです。シンプルなテキスト検索からpandasライクな高度なクエリにも対応しており、AIワークフローにおける構造化データリソースから特定情報の抽出に最適です。
このコンポーネントの役割
このコンポーネントを利用すると、内部ドキュメントのアップロードやXMLファイルのURL指定による検索が行えます。特定要素や値の検索、様々な条件でのコンテンツのフィルタリング、AIパイプラインでのさらなる処理のためのデータ抽出が可能です。
主な機能・特徴
- テキスト & クエリ検索: 基本的なテキストマッチやpandasライクなクエリ表現でXMLを検索し、複雑なデータ抽出も実現。
- 柔軟なソース選択: 内部ドキュメントID指定、または外部XMLファイル(URL指定)の両方に対応。
- 要素フィルタリング: XML要素のパス指定で検索範囲を限定可能。
- 大文字・小文字区別: 検索時の大文字・小文字判定を選択可能。
- 検索結果件数制限: 出力結果の最大件数を設定し、過剰な出力を防止。
- キャッシュ: XMLファイル内容を任意期間キャッシュして、パフォーマンスと処理効率を向上。
- 詳細出力: 実行時に詳細なログを取得できるverboseモード搭載。
入力
このコンポーネントには入力ハンドルはありません。
設定項目
以下は設定可能な入力パラメータの概要です:
| 入力名 | 説明 | 必須 | デフォルト値 | 詳細設定 |
|---|---|---|---|---|
| XMLドキュメントID | 内部XMLドキュメントをIDで選択します。 | いいえ | (空) | はい |
| XMLファイルURL | 内部ドキュメントを使わない場合に外部XMLファイルのURLを指定します。 | いいえ | (空) | はい |
| 要素パス | 検索範囲を限定するXML要素パス(カンマ区切り、例: product,category)。 | いいえ | (空) | はい |
| 大文字・小文字区別 | 検索時に大文字・小文字を区別するかどうか。 | いいえ | False | はい |
| 最大結果数 | 返却する検索結果の最大件数。 | はい | 50 | いいえ |
| キャッシュTTL | XML内容のキャッシュ期間(例: キャッシュなし、5分、2週間など)。 | いいえ | 2週間 | はい |
| 詳細出力 | デバッグや詳細ログ用の詳細出力を有効化。 | いいえ | False | はい |
| ツール名 | エージェント型ワークフローでの参照に便利なカスタムツール名。 | いいえ | (空) | はい |
| ツール説明 | このツールの用途や目的をエージェントが理解しやすいように記載。 | いいえ | (空) | はい |
注意: XMLファイルの指定には「XMLドキュメントID」または「XMLファイルURL」のいずれかを入力してください。
出力
- ツール: このコンポーネントの出力は、より大きなAIワークフローに組み込むことができるツールインスタンスです。設定に基づく検索結果を返します。
ユースケースとメリット
- データ抽出: XMLファイルから機械学習やデータ分析用の構造化データを素早く抽出。
- コンテンツフィルタリング: 要素パス指定により大規模XMLから特定セクション・要素のみを抽出。
- ワークフロー自動化: XMLデータ検索を自動化パイプラインに組み込み、シームレスなデータ取り込みと変換を実現。
- パフォーマンス最適化: キャッシュ機能により大容量XMLの再ダウンロードや処理を回避し、効率化。
利用シーン
このコンポーネントは、製品カタログや設定ファイル、構造化レポートなど、AI処理でXML形式の情報を扱う必要がある場合に特に有用です。シンプルな検索から複雑なクエリまで柔軟に設定でき、幅広いデータ抽出・変換シナリオに適応します。
XMLドキュメント検索コンポーネントを導入することで、AIワークフロー内でのXMLデータソースとの連携や価値抽出を大幅に効率化できます。
よくある質問
- XMLドキュメント検索コンポーネントは何ができますか?
自動化ワークフロー内でXMLファイルを検索・フィルタ・データ抽出できます。シンプルなテキスト検索や高度なクエリエクスプレッションも利用可能です。
- 内部・外部両方のXMLファイルが利用できますか?
はい。内部保存されたXMLファイルも外部URLからの読み込みも選択できますので、柔軟なデータ取得が可能です。
- 検索結果件数の上限設定はできますか?
はい。返却される最大件数を設定できるため、効率的かつ的確なデータ抽出が可能です。
- このコンポーネントはキャッシュに対応していますか?
はい。検索結果のキャッシュ期間を指定でき、繰り返しのクエリでパフォーマンスが向上します。
- 検索時の大文字・小文字の区別は制御できますか?
はい。大文字・小文字を区別するかどうかを要件に合わせて設定できます。
