
Parse Data
Komponenta Parse Data převádí strukturovaná data na prostý text pomocí přizpůsobitelných šablon. Umožňuje flexibilní formátování a převod datových vstupů pro da...
Převádějte strukturovaná data do čitelného markdown textu pomocí komponenty Dokument na text od FlowHunt s nastavitelnými ovládacími prvky pro efektivní a relevantní AI výstupy.
Popis komponenty
AI dokáže analyzovat velké množství dat během několika sekund, ale pouze některá data budou relevantní nebo vhodná pro výstup. Komponenta Dokument na text vám dává kontrolu nad tím, jak jsou data z retrieverů zpracována a transformována do textu.
Komponenta Dokument na text je navržena pro převod vstupních znalostních dokumentů do formátu prostého textu. To je obzvláště užitečné v AI a datových workflowech, kde je vyžadován textový výstup pro další zpracování, analýzu nebo jako vstup pro jazykové modely.
Tato komponenta přijímá jeden nebo více strukturovaných dokumentů (například HTML, Markdown, PDF nebo jiné podporované formáty) a extrahuje z nich textový obsah. Umožňuje přesně určit, které části dokumentů exportovat, zda zahrnout metadata a jak nakládat se sekcemi nebo záhlavími dokumentu. Výstupem je sjednocený objekt zprávy obsahující extrahovaný text, připravený pro následné úkoly jako sumarizace, klasifikace nebo odpovědi na dotazy.
Komponenta přijímá několik konfigurovatelných vstupů:
Název vstupu | Typ | Povinné | Popis | Výchozí hodnota |
---|---|---|---|---|
Dokumenty | List[Document] | Ano | Znalostní dokumenty, které se mají převést na text. | N/A (zadává uživatel) |
Od H1 pokud existuje | Boolean | Ano | Zahájit extrakci od prvního H1 záhlaví, pokud je přítomno. | true |
Načítat z pointeru | Boolean | Ano | Zahájit extrakci z pointeru, který nejlépe odpovídá vstupnímu dotazu, nebo načíst vše. | true |
Max Tokenů | Integer | Ne | Maximální počet tokenů ve výstupním textu. | 3000 |
Přeskočit poslední záhlaví | Boolean | Ano | Přeskočit poslední záhlaví (často patička) pro optimalizaci výstupu. | false |
Strategie | String | Ano | Strategie extrakce textu: spojení dokumentů nebo zahrnutí stejné velikosti z každého. | “Include equal size from each documents” |
Exportovat obsah | Multi-select | Ne | Které typy obsahu zahrnout (např. H1, H2, Odstavec). | Všechny typy vybrány |
Zahrnout metadata | Multi-select | Ne | Metadata pole, která mají být zahrnuta ve výstupu, pokud jsou k dispozici. | Product |
Dostupné typy obsahu: H1, H2, H3, H4, H5, H6, Odstavec
Možnosti metadat: Autor, Produkt, BreadcrumbList, VideoObject, BlogPosting, FAQPage, WebSite, opengraph
Komponenta produkuje následující výstup:
Schopnost | Popis |
---|---|
Typy vstupů | Seznam dokumentů |
Typ výstupu | Zpráva (Text + Metadata) |
Granularita obsahu | Výběr záhlaví/odstavců k zahrnutí |
Možnosti metadat | Výběr více polí metadat k exportu |
Řízení velikosti výstupu | Nastavení max. počtu tokenů |
Strategie extrakce | Spojit nebo vyvážit mezi dokumenty |
Výběr sekce | Začít od H1, z pointeru nebo přeskočit poslední záhlaví |
Bot může pro vytvoření textového výstupu procházet mnoho dokumentů. Nastavení Strategie vám umožní řídit, jak tyto dokumenty využívá chytře a zároveň zůstává v rámci limitu tokenů.
Aktuálně jsou možné dvě strategie:
Jedná se o transformer komponentu, což znamená, že spojuje výstupy dvou komponent. Dokument na text přijímá Dokumenty, které vrací komponenty Retriever:
Znalosti jsou při průchodu transformerem převedeny do čitelného Markdown textu. Tento text pak lze připojit ke komponentám vyžadujícím textový vstup, jako jsou splittery, widgety nebo výstupní komponenty.
Zde je příklad flow, který používá komponentu Dokument na text jako most mezi retrievery dokumentů a AI generátorem:
Tato komponenta získává znalosti z typů komponent retriever a převádí je do čitelného markdown textu, který lze následně připojit ke kterékoli komponentě přijímající textový vstup.
Začněte tvořit chytřejší AI řešení díky komponentě Dokument na text od FlowHunt. Plynule převádějte data na akční text a zlepšete své automatizované workflowy.
Komponenta Parse Data převádí strukturovaná data na prostý text pomocí přizpůsobitelných šablon. Umožňuje flexibilní formátování a převod datových vstupů pro da...
Komponent Export do souboru ve FlowHunt vám umožňuje uložit text nebo data generovaná během vašeho workflow do stahovatelných souborů v různých formátech, včetn...
Komponenta Poznámka ve FlowHunt vám umožňuje přidávat komentáře a dokumentaci přímo do vašeho pracovního postupu. Použijte ji k upřesnění, poznámkám nebo poskyt...