XMLドキュメント検索

XMLドキュメント検索

XMLドキュメント検索コンポーネントは、テキストやクエリエクスプレッションでXMLファイルを検索・情報抽出でき、キャッシュやカスタム検索結果制限もサポートします。

コンポーネントの説明

XMLドキュメント検索コンポーネントの仕組み

XMLドキュメント検索コンポーネントは、XMLドキュメント内の検索を効率化する多機能ツールです。シンプルなテキスト検索からpandasライクな高度なクエリにも対応しており、AIワークフローにおける構造化データリソースから特定情報の抽出に最適です。

このコンポーネントの役割

このコンポーネントを利用すると、内部ドキュメントのアップロードやXMLファイルのURL指定による検索が行えます。特定要素や値の検索、様々な条件でのコンテンツのフィルタリング、AIパイプラインでのさらなる処理のためのデータ抽出が可能です。

主な機能・特徴

  • テキスト & クエリ検索: 基本的なテキストマッチやpandasライクなクエリ表現でXMLを検索し、複雑なデータ抽出も実現。
  • 柔軟なソース選択: 内部ドキュメントID指定、または外部XMLファイル(URL指定)の両方に対応。
  • 要素フィルタリング: XML要素のパス指定で検索範囲を限定可能。
  • 大文字・小文字区別: 検索時の大文字・小文字判定を選択可能。
  • 検索結果件数制限: 出力結果の最大件数を設定し、過剰な出力を防止。
  • キャッシュ: XMLファイル内容を任意期間キャッシュして、パフォーマンスと処理効率を向上。
  • 詳細出力: 実行時に詳細なログを取得できるverboseモード搭載。

入力

このコンポーネントには入力ハンドルはありません。

設定項目

以下は設定可能な入力パラメータの概要です:

入力名説明必須デフォルト値詳細設定
XMLドキュメントID内部XMLドキュメントをIDで選択します。いいえ(空)はい
XMLファイルURL内部ドキュメントを使わない場合に外部XMLファイルのURLを指定します。いいえ(空)はい
要素パス検索範囲を限定するXML要素パス(カンマ区切り、例: product,category)。いいえ(空)はい
大文字・小文字区別検索時に大文字・小文字を区別するかどうか。いいえFalseはい
最大結果数返却する検索結果の最大件数。はい50いいえ
キャッシュTTLXML内容のキャッシュ期間(例: キャッシュなし、5分、2週間など)。いいえ2週間はい
詳細出力デバッグや詳細ログ用の詳細出力を有効化。いいえFalseはい
ツール名エージェント型ワークフローでの参照に便利なカスタムツール名。いいえ(空)はい
ツール説明このツールの用途や目的をエージェントが理解しやすいように記載。いいえ(空)はい

注意: XMLファイルの指定には「XMLドキュメントID」または「XMLファイルURL」のいずれかを入力してください。

出力

  • ツール: このコンポーネントの出力は、より大きなAIワークフローに組み込むことができるツールインスタンスです。設定に基づく検索結果を返します。

ユースケースとメリット

  • データ抽出: XMLファイルから機械学習やデータ分析用の構造化データを素早く抽出。
  • コンテンツフィルタリング: 要素パス指定により大規模XMLから特定セクション・要素のみを抽出。
  • ワークフロー自動化: XMLデータ検索を自動化パイプラインに組み込み、シームレスなデータ取り込みと変換を実現。
  • パフォーマンス最適化: キャッシュ機能により大容量XMLの再ダウンロードや処理を回避し、効率化。

利用シーン

このコンポーネントは、製品カタログや設定ファイル、構造化レポートなど、AI処理でXML形式の情報を扱う必要がある場合に特に有用です。シンプルな検索から複雑なクエリまで柔軟に設定でき、幅広いデータ抽出・変換シナリオに適応します。

XMLドキュメント検索コンポーネントを導入することで、AIワークフロー内でのXMLデータソースとの連携や価値抽出を大幅に効率化できます。

よくある質問

XMLドキュメント検索コンポーネントは何ができますか?

自動化ワークフロー内でXMLファイルを検索・フィルタ・データ抽出できます。シンプルなテキスト検索や高度なクエリエクスプレッションも利用可能です。

内部・外部両方のXMLファイルが利用できますか?

はい。内部保存されたXMLファイルも外部URLからの読み込みも選択できますので、柔軟なデータ取得が可能です。

検索結果件数の上限設定はできますか?

はい。返却される最大件数を設定できるため、効率的かつ的確なデータ抽出が可能です。

このコンポーネントはキャッシュに対応していますか?

はい。検索結果のキャッシュ期間を指定でき、繰り返しのクエリでパフォーマンスが向上します。

検索時の大文字・小文字の区別は制御できますか?

はい。大文字・小文字を区別するかどうかを要件に合わせて設定できます。

XMLドキュメント検索を試す

強力なXML検索・抽出でワークフローを強化—今すぐFlowHuntでXMLドキュメント検索を使い始めましょう。

詳細はこちら

CSVドキュメント検索
CSVドキュメント検索

CSVドキュメント検索

CSVファイル内の情報を簡単に検索・抽出し、ワークフローに組み込むことができます。CSVドキュメント検索コンポーネントは、テキスト検索や高度なpandasクエリ式によって特定のデータを見つけることができ、内部・外部両方のCSVソースに対応しています。検索カラムや大文字小文字の区別、結果の上限などを自由にカスタマイズ可能...

1 分で読める
Data CSV +4
JSONドキュメント検索
JSONドキュメント検索

JSONドキュメント検索

JSONドキュメント検索コンポーネントは、テキスト検索または高度なクエリエクスプレッションを用いてJSONファイル内の強力な検索機能を提供します。外部または内部のJSONデータを接続し、検索パラメータを設定して、ワークフローのために効率よく関連情報を取得できます。...

1 分で読める
Data Automation +4
検索メモリ
検索メモリ

検索メモリ

検索メモリコンポーネントでワークフローの力を引き出しましょう。ユーザーのクエリに基づき、保存されたメモリから関連情報を取得します。効率的な検索・フィルタリング・情報抽出により、AIフローがコンテキスト認識型リソースや長期データへアクセス可能になります。...

1 分で読める
AI Memory +4