Popis flow
Účel a výhody
Tento workflow automatizuje proces převodu sitemap.xml
webové stránky do strukturovaného a AI-friendly formátu llms.txt
. Tok využívá AI agenty a nástroje na získání obsahu, aby zjednodušil přípravu obsahu vašeho webu pro použití ve velkých jazykových modelech (LLM) a dalších AI aplikacích. Níže naleznete podrobný rozpis jednotlivých kroků a komponent.
1. Uživatelská zkušenost & vstupní bod
Uvítací zpráva při otevření chatu
Když uživatel otevře chat, widget zobrazí přátelskou výzvu:
🗂️ Přetáhněte níže adresu vašeho sitemap.xml!
Převedu ji do čistého formátu llms.txt, ideálního pro použití v AI modelech 🤖📄
To nastaví jasná očekávání a navede uživatele ke správnému vstupu.
2. Zpracování uživatelského vstupu
- Uzlový prvek pro zadání chatu
Uživatel vloží URL svého souboru sitemap.xml
do chatovacího rozhraní. - Spuštění workflow
Zadaná URL je automaticky předána do dalšího kroku ke zpracování.
3. Načítání a zpracování URL ze sitemapu
4. Rozšíření o externí znalosti
Nástroj Google Search
AI agent je vybaven nástrojem Google Search, který umožňuje:
- Hledat další kontext nebo související dokumentaci dle potřeby.
- Omezit výsledky (výchozí: 3), specifikovat zemi/jazyk.
- Využívat uložené výsledky pro efektivitu.
Sekundární URL Retriever
Další uzel retrieveru lze nastavit pro načítání obsahu z URL nalezených přes Google Search, což dále obohacuje znalostní základnu AI agenta, pokud je to potřeba.
5. AI agent pro převod obsahu
- Uzel AI agenta
Jádrem workflow je AI agent nastavený následovně:- Cíl:
Převést obsah sitemap.xml
do dobře strukturovaného souboru llms.txt
dle poskytnutého příkladu. - Pozadí & role:
Agent je prezentován jako specialista na generování souborů llms.txt
. - Nástroje:
Využívá jak Google Search, tak URL Retriever pro přístup k obsahu webu. - Provoz:
Agent:- Načte veškerý získaný obsah stránek.
- Identifikuje název a strukturu.
- Rozhodne, které stránky jsou nejdůležitější, a uvede je na začátku.
- Méně důležité stránky (např. kategorie, tagy) zařadí na konec.
- Dodržuje striktní formát, aby výstup odpovídal požadavkům na ingestování do LLM přes
llms.txt
.
6. Výstup a zpětná vazba uživateli
- Uzlový prvek pro výstup chatu
Formátovaný výstup AI agenta (obsah llms.txt
) je zobrazen uživateli v chatu, připravený k použití pro trénink AI nebo ingestování.
Struktura workflow (přehled procesu)
Krok | Komponenta | Účel |
---|
1 | Chat Opened Trigger | Zobrazí uvítací/instruktážní zprávu |
2 | Message Widget | Navede uživatele k zadání URL sitemap.xml |
3 | Chat Input | Přijme uživatelem vloženou URL na sitemap.xml |
4 | URL Retriever | Načte a zpracuje URL a obsah ze sitemapu |
5 | Google Search Tool | (Volitelně) hledá další kontext pro stránky |
6 | URL Retriever (Google) | (Volitelně) načítá obsah z URL nalezených přes Google |
7 | AI Agent | Převádí všechna data stránek do formátu llms.txt |
8 | Chat Output | Zobrazí formátovaný llms.txt uživateli |
Proč je tento workflow užitečný?
Škálovatelnost:
Automatizuje časově náročný ruční proces a umožňuje převést sitemap libovolného webu do použitelného formátu pro LLM bez technických znalostí.
Kvalita a konzistence:
Zajišťuje, že výstup odpovídá přísnému formátu, což zvyšuje kvalitu vašich trénovacích dat pro AI.
Rozšiřitelnost:
Lze upravit, aby zahrnoval další zdroje znalostí nebo pokročilejší logiku extrakce.
Efektivita:
Integruje cache a limity tokenů, díky čemuž zvládne i velké weby rychle a spolehlivě.
AI řízené rozhodování:
Agent umí upřednostnit důležité stránky a inteligentně strukturovat výstup – což by bylo ručně zdlouhavé nebo náchylné k chybám.
Příklady využití
- Příprava celého webu jako jednoho, dobře strukturovaného dokumentu pro ingestování do AI.
- Automatizace kurátorství obsahu pro znalostní báze nebo dokumentační systémy.
- Škálování tvorby datasetů pro doladění LLM s oborovým obsahem webu.
Tento workflow umožňuje snadný, rychlý a spolehlivý převod sitemap webu do AI-optimalizovaných textových souborů, šetří hodiny ruční práce a zajišťuje vašim AI modelům kvalitní, strukturovaný vstup.