Vyhledávání v CSV dokumentech

Vyhledávejte a extrahujte data z CSV souborů pomocí flexibilních dotazů – integrujte strukturovaná data plynule do svých toků.

Data CSV Automation Integration

Jak komponenta Vyhledávání v CSV dokumentech funguje

Komponenta Vyhledávání v CSV dokumentech je univerzální nástroj navržený pro inteligentní vyhledávání v CSV souborech v rámci vašeho AI workflow. Umožňuje uživatelům provádět textová vyhledávání nebo spouštět panda dotazy nad CSV dokumenty, což je velmi vhodné v situacích, kdy je třeba dynamicky dotazovat a analyzovat strukturovaná data.

Co tato komponenta dělá?

Tato komponenta vám umožňuje:

Vyhledávat v CSV souborech pomocí klíčových slov nebo pokročilých panda dotazů ve stylu pandas.
Filtrovat výsledky vyhledávání podle konkrétních sloupců nebo vyhledávat napříč všemi sloupci, pokud nejsou určeny.
Omezit počet vrácených výsledků nastavením maximálního limitu.
Flexibilně volit zdroje dat – vybrat CSV soubor z interních dokumentů nebo zadat externí URL souboru.
Optimalizovat výkon a efektivitu díky možnostem cachování, což snižuje potřebu opakovaného načítání a zpracování velkých souborů.

Díky tomu je komponenta zvlášť užitečná při integraci dotazů na strukturovaná data do větších AI nebo datových pipeline, kde je potřeba automatizovaný, opakovatelný přístup k tabulkovým datům.

Vstupy

Tato komponenta nemá vstupní handle.

Nastavení

Parametr	Popis	Výchozí/příkladová hodnota	Povinné
ID CSV dokumentu	Vyberte CSV soubor z interního úložiště pro vyhledávání.		Ne
URL CSV souboru	Zadejte externí URL k CSV souboru, pokud nepoužíváte interní dokument.		Ne
Sloupce pro vyhledávání	Určete, ve kterých sloupcích se má vyhledávat (oddělené čárkou). Pokud ponecháte prázdné, vyhledává se ve všech.		Ne
Rozlišovat velikost písmen	Určuje, zda má být vyhledávání rozlišující velikost písmen.	False	Ne
Maximální počet výsledků	Nastavuje maximální počet výsledků, které mají být pro každý dotaz vráceny.	5000	Ano
Doba cache (Cache TTL)	Definuje, jak dlouho má být obsah CSV cachován (různé intervaly od „Bez cache“ po „1 rok“).	2 týdny	Ne
Verbose	Zapne podrobnější výstup pro ladění nebo vývojářské účely.	False	Ne
Název nástroje	Přiřaďte nástroji vlastní název pro použití v agentních workflow.		Ne
Popis nástroje	Uveďte popis nástroje, aby agenti lépe pochopili jeho účel a použití.		Ne

Výstupy

Nástroj: Hlavním výstupem je objekt Nástroj, který lze integrovat do vašeho workflow nebo použít agenty pro vyhledávání v dokumentech dle potřeby.

Typické scénáře využití

Automatizovaná extrakce dat: Získávejte relevantní řádky z velkých CSV datových sad na základě uživatelských dotazů nebo parametrů.
Předzpracování dat: Filtrování a extrakce podmnožin dat jako příprava pro další analýzu nebo strojové učení.
Dynamické vyhledávání dat v AI agentech: Umožněte AI agentům přístup k tabulkovým datům na vyžádání jako součást širšího rozhodovacího procesu.

Proč používat Vyhledávání v CSV dokumentech?

Flexibilita: Funguje s interními i externími CSV soubory, přizpůsobí se různým strategiím ukládání dat.
Výkon: Možnosti cachování zvyšují rychlost a omezují opakované načítání dat.
Přizpůsobitelnost: Parametry vyhledávání, limity výsledků a rozsah vyhledávání (sloupce, rozlišování velikosti písmen) lze nastavit dle konkrétních potřeb.
Bezproblémová integrace: Navrženo jako modulární komponenta větších AI workflow pro usnadnění přístupu ke strukturovaným datům pro následné úkoly.

Tato komponenta je ideální pro každého, kdo potřebuje programovatelnou a opakovatelnou schopnost vyhledávat v tabulkových datech v rámci AI automatizace nebo analytického workflow.

Často kladené otázky

Umožňuje vyhledávat a extrahovat informace z CSV dokumentů v rámci vašeho workflow buď pomocí jednoduchého textového vyhledávání, nebo panda dotazů.

Ano, můžete vyhledávat jak v interních CSV dokumentech, tak v externích CSV souborech prostřednictvím URL.

Můžete určit, ve kterých sloupcích se má vyhledávat, a nastavit, zda má být vyhledávání rozlišující velikost písmen. Pokud sloupce nejsou uvedeny, vyhledává se ve všech.

Můžete nastavit maximální počet vrácených výsledků, přičemž výchozí je až 5000.

Ano, můžete nastavit, jak dlouho má být obsah CSV cachován – od žádné cache až po jeden rok, pro optimalizaci výkonu.

Můžete provádět jednoduché textové vyhledávání nebo využít pokročilejší panda dotazy pro flexibilní získávání dat.