コンポーネントの説明
CSVドキュメント検索コンポーネントの仕組み
CSVドキュメント検索コンポーネントは、AIワークフローの一部としてCSVファイル内をインテリジェントに検索するための多機能ツールです。ユーザーはテキストベースの検索やpandasクエリ式の実行が可能で、構造化データを動的に検索・分析したい場面に最適です。
このコンポーネントでできること
このコンポーネントでは、次のことが可能です:
- CSVファイル内を検索:キーワード検索やpandasスタイルの高度なクエリ式による検索に対応。
- 検索結果のフィルタリング:特定カラムのみ、または未指定時は全カラムから検索。
- 返却される結果数の制御:最大件数を設定可能。
- データソースの柔軟な選択:内部ドキュメントからCSVファイルを選択、または外部ファイルURLを指定。
- キャッシュ設定によるパフォーマンス最適化:大きなファイルの繰り返し読み込み・解析の負担を軽減。
これらの機能により、構造化データのクエリをAIやデータ処理パイプラインへ統合する場合に特に有用です。自動化・再現性のある表形式データアクセスが求められる場面に適しています。
入力
このコンポーネントには入力ハンドルはありません。
設定
| パラメータ | 説明 | デフォルト/例 | 必須 |
|---|---|---|---|
| CSVドキュメントID | 検索する内部ストレージ上のCSVファイルを選択。 | いいえ | |
| CSVファイルURL | 内部ドキュメントを利用しない場合、外部のCSVファイルのURLを指定。 | いいえ | |
| 検索カラム | 検索対象のカラム(カンマ区切り)を指定。未記入の場合は全カラムを検索。 | いいえ | |
| 大文字小文字の区別 | 大文字小文字を区別して検索するかどうかを指定。 | False | いいえ |
| 最大結果数 | 各検索で返す最大件数を設定。 | 5000 | はい |
| キャッシュTTL | CSV内容をキャッシュする期間(「キャッシュなし」から「1年」まで)。 | 2週間 | いいえ |
| 詳細出力 | デバッグや開発用に詳細出力を有効化。 | False | いいえ |
| ツール名 | エージェントワークフロー内で参照するためのカスタム名を設定。 | いいえ | |
| ツール説明 | エージェントがツールの目的や使い方を理解しやすい説明文を入力。 | いいえ |
出力
- ツール:主な出力はツールオブジェクトで、ワークフローへの統合やエージェントによるドキュメント検索に利用できます。
主なユースケース
- 自動データ抽出:ユーザー指定のクエリやパラメータに基づき、大規模CSVデータセットから該当行を取得。
- データ前処理:さらなる分析や機械学習のために、データの一部を抽出・フィルタリング。
- AIエージェントによる動的データ検索:意思決定プロセスの一部として、AIエージェントがオンデマンドで表形式データを検索。
なぜCSVドキュメント検索を使うのか
- 柔軟性:内部・外部のCSVファイルどちらにも対応し、多様なデータ保存戦略に適合。
- パフォーマンス:キャッシュによる高速化とデータ再読み込み回数の削減。
- カスタマイズ性:検索パラメータや結果数・検索範囲(カラムや大文字小文字の区別)をニーズに合わせて調整可能。
- シームレスな統合:大規模AIワークフローのモジュール部品として設計され、下流タスクのための構造化データアクセスを容易にします。
このコンポーネントは、AI自動化や分析パイプライン内で表形式データをプログラム的かつ再現可能に検索したいすべての方に最適です。
よくある質問
- CSVドキュメント検索コンポーネントは何ができますか?
ワークフロー内でCSVドキュメントの情報を、シンプルなテキスト検索またはpandasクエリ式を使って検索・抽出できます。
- 自分のCSVファイルを使えますか?
はい、内部CSVドキュメントだけでなく、URL経由で外部CSVファイルも検索できます。
- 検索範囲はどのように指定できますか?
検索するカラムを指定したり、大文字小文字を区別するかどうかを設定できます。カラムを指定しない場合は全カラムが検索対象となります。
- 取得できる結果の最大数は?
返す結果の最大数を設定でき、デフォルトは最大5000件です。
- 内容はキャッシュされますか?
はい、CSV内容のキャッシュ期間を、キャッシュなしから1年まで設定できます。パフォーマンス最適化に役立ちます。
- どんなクエリが使えますか?
シンプルなテキスト検索に加え、さらに柔軟なデータ取得のために高度なpandasクエリ式も使用できます。
