Flow-beskrivning
Syfte och fördelar
Detta arbetsflöde automatiserar processen att omvandla en webbplats sitemap.xml
till ett strukturerat och AI-vänligt llms.txt
-format. Flödet använder AI-agenter och hämtningsverktyg för att effektivisera förberedelsen av din webbplats innehåll för användning i stora språkmodeller (LLMs) och andra AI-applikationer. Nedan följer en detaljerad genomgång av dess steg och komponenter.
1. Användarupplevelse & ingångspunkt
2. Hantering av användarinmatning
- Chat Input-nod
Användaren klistrar in URL:en till sin sitemap.xml
-fil i chattgränssnittet. - Start av arbetsflöde
Den inmatade URL:en skickas automatiskt vidare till nästa steg för bearbetning.
3. Hämtning och bearbetning av sitemap-URL:er
4. Komplettering med extern kunskap
Google-sökverktyg
AI-agenten är utrustad med ett Google-sökverktyg, vilket gör att den kan:
- Söka efter ytterligare kontext eller relaterad dokumentation vid behov.
- Begränsa resultat (standard: 3), ange land/språk.
- Använda cachade resultat för effektivitet.
Sekundär URL-hämtare
En extra hämtarnod kan konfigureras för att hämta innehåll från URL:er som hittas via Google-sökning, vilket ytterligare berikar AI-agentens kunskapsbas vid behov.
5. AI-agent för innehållsomvandling
- AI-agentnod
Kärnan i arbetsflödet är en AI-agent konfigurerad med följande:- Mål:
Omvandla innehållet i sitemap.xml
till en välstrukturerad llms.txt
enligt ett angivet exempel. - Bakgrund & roll:
Agenten är positionerad som specialist på att generera llms.txt
-filer. - Verktyg:
Använder både Google-sök och URL-hämtare för åtkomst till webbplats- och webbinnehåll. - Arbetssätt:
Agenten:- Läser allt hämtat sidinnehåll.
- Identifierar titel och struktur.
- Avgör vilka sidor som är viktigast och listar dem först.
- Placerar mindre kritiska sidor (t.ex. kategorier, taggar) i slutet.
- Följer ett strikt format för att säkerställa att utdata matchar kraven på
llms.txt
för LLM-inläsning.
6. Utdata och användarfeedback
- Chat Output-nod
AI-agentens formaterade utdata (llms.txt-innehållet) visas för användaren i chatten, redo att användas för AI-träning eller inläsning.
Arbetsflödesstruktur (processöversikt)
Steg | Komponent | Syfte |
---|
1 | Chat Opened Trigger | Visar välkomst-/instruktionsmeddelande |
2 | Message Widget | Vägledare användaren att mata in sitemap.xml-URL |
3 | Chat Input | Tar emot användarens sitemap.xml-URL |
4 | URL Retriever | Hämtar och tolkar URL:er/innehåll från sitemapen |
5 | Google Search Tool | (Valfritt) Hittar ytterligare kontext för sidor |
6 | URL Retriever (Google) | (Valfritt) Hämtar innehåll från Google-hittade URL:er |
7 | AI Agent | Omvandlar allt siddata till formaterad llms.txt |
8 | Chat Output | Presenterar formaterad llms.txt för användaren |
Varför är detta arbetsflöde användbart?
Skalbarhet:
Automatiserar en tidskrävande manuell process, så att du kan omvandla vilken webbplats sitemap som helst till ett användbart format för LLM:er utan teknisk expertis.
Kvalitet och konsekvens:
Säkerställer att utdata följer ett strikt format, vilket förbättrar kvaliteten på din AI-träningsdata.
Utbyggbarhet:
Kan anpassas för att inkludera ytterligare kunskapskällor eller tillämpa mer avancerad extraktionslogik.
Effektivitet:
Integrerar cache och tokenbegränsningar för att hantera även stora webbplatser snabbt och tillförlitligt.
AI-drivna beslut:
Agenten kan prioritera viktiga sidor och strukturera utdata intelligent—något som annars vore tidskrävande eller felbenäget att göra manuellt.
Exempel på användningsområden
- Förbereda hela din webbplats som ett enda, välstrukturerat dokument för AI-inläsning.
- Automatisera innehållskurering för kunskapsbaser eller dokumentationssystem.
- Skala upp datamängdsskapande för finjustering av LLM:er med domänspecifikt webbplatsinnehåll.
Detta arbetsflöde gör det enkelt, snabbt och tillförlitligt att omvandla webbplatsers sitemaps till AI-optimerade textfiler, vilket sparar dig många timmars manuellt arbete och säkerställer att dina AI-modeller får högkvalitativ, strukturerad input.