Komponenta Vyhledávání v CSV dokumentech je univerzální nástroj navržený pro inteligentní vyhledávání v CSV souborech v rámci vašeho AI workflow. Umožňuje uživatelům provádět textová vyhledávání nebo spouštět panda dotazy nad CSV dokumenty, což je velmi vhodné v situacích, kdy je třeba dynamicky dotazovat a analyzovat strukturovaná data.
Co tato komponenta dělá?
Tato komponenta vám umožňuje:
- Vyhledávat v CSV souborech pomocí klíčových slov nebo pokročilých panda dotazů ve stylu pandas.
- Filtrovat výsledky vyhledávání podle konkrétních sloupců nebo vyhledávat napříč všemi sloupci, pokud nejsou určeny.
- Omezit počet vrácených výsledků nastavením maximálního limitu.
- Flexibilně volit zdroje dat – vybrat CSV soubor z interních dokumentů nebo zadat externí URL souboru.
- Optimalizovat výkon a efektivitu díky možnostem cachování, což snižuje potřebu opakovaného načítání a zpracování velkých souborů.
Díky tomu je komponenta zvlášť užitečná při integraci dotazů na strukturovaná data do větších AI nebo datových pipeline, kde je potřeba automatizovaný, opakovatelný přístup k tabulkovým datům.
Vstupy
Tato komponenta nemá vstupní handle.
Nastavení
| Parametr | Popis | Výchozí/příkladová hodnota | Povinné |
|---|---|---|---|
| ID CSV dokumentu | Vyberte CSV soubor z interního úložiště pro vyhledávání. | Ne | |
| URL CSV souboru | Zadejte externí URL k CSV souboru, pokud nepoužíváte interní dokument. | Ne | |
| Sloupce pro vyhledávání | Určete, ve kterých sloupcích se má vyhledávat (oddělené čárkou). Pokud ponecháte prázdné, vyhledává se ve všech. | Ne | |
| Rozlišovat velikost písmen | Určuje, zda má být vyhledávání rozlišující velikost písmen. | False | Ne |
| Maximální počet výsledků | Nastavuje maximální počet výsledků, které mají být pro každý dotaz vráceny. | 5000 | Ano |
| Doba cache (Cache TTL) | Definuje, jak dlouho má být obsah CSV cachován (různé intervaly od „Bez cache“ po „1 rok“). | 2 týdny | Ne |
| Verbose | Zapne podrobnější výstup pro ladění nebo vývojářské účely. | False | Ne |
| Název nástroje | Přiřaďte nástroji vlastní název pro použití v agentních workflow. | Ne | |
| Popis nástroje | Uveďte popis nástroje, aby agenti lépe pochopili jeho účel a použití. | Ne |
Výstupy
- Nástroj: Hlavním výstupem je objekt Nástroj, který lze integrovat do vašeho workflow nebo použít agenty pro vyhledávání v dokumentech dle potřeby.
Typické scénáře využití
- Automatizovaná extrakce dat: Získávejte relevantní řádky z velkých CSV datových sad na základě uživatelských dotazů nebo parametrů.
- Předzpracování dat: Filtrování a extrakce podmnožin dat jako příprava pro další analýzu nebo strojové učení.
- Dynamické vyhledávání dat v AI agentech: Umožněte AI agentům přístup k tabulkovým datům na vyžádání jako součást širšího rozhodovacího procesu.
Proč používat Vyhledávání v CSV dokumentech?
- Flexibilita: Funguje s interními i externími CSV soubory, přizpůsobí se různým strategiím ukládání dat.
- Výkon: Možnosti cachování zvyšují rychlost a omezují opakované načítání dat.
- Přizpůsobitelnost: Parametry vyhledávání, limity výsledků a rozsah vyhledávání (sloupce, rozlišování velikosti písmen) lze nastavit dle konkrétních potřeb.
- Bezproblémová integrace: Navrženo jako modulární komponenta větších AI workflow pro usnadnění přístupu ke strukturovaným datům pro následné úkoly.
Tato komponenta je ideální pro každého, kdo potřebuje programovatelnou a opakovatelnou schopnost vyhledávat v tabulkových datech v rámci AI automatizace nebo analytického workflow.
