URL Retriever

URL Retriever

URL Retriever vám umožní získávat a zpracovávat obsah z webových odkazů, podporuje OCR, extrakci metadat a flexibilní výstup pro pohon AI workflow.

Popis komponenty

Jak komponenta URL Retriever funguje

URL Retriever je univerzální flow komponenta určená k získávání a zpracování webového obsahu ze zadaných URL a vrací informace jako strukturované dokumenty. Slouží jako most mezi externím online obsahem a vaším AI workflow, což vám umožňuje efektivně integrovat, analyzovat nebo zpracovávat webové informace.

Co dělá?

Tato komponenta načte obsah jedné nebo více URL, které zadáte jako vstup. Umí extrahovat hlavní text, metadata a dokonce zpracovat obsah z obrázků pomocí optického rozpoznávání znaků (OCR). Získaná data jsou poté k dispozici v různých strukturovaných formátech vhodných pro následné AI úlohy jako sumarizace, odpovídání na dotazy nebo extrakce znalostí.

Možnosti vstupu

URL můžete komponentě dodat dvěma způsoby:

  • Textové URL:

    • Typ vstupu: Message
    • Popis: Seznam prostých URL odkazů, ze kterých má komponenta získávat obsah.
  • URL záznamy:

    • Typ vstupu: UrlRecord
    • Popis: Seznam strukturovaných záznamů URL, které mohou obsahovat další metadata.

Pokročilé vstupní parametry

ParametrTypVýchozíPopis
Použít OCRBooleanfalsePokud je povoleno, použije OCR k extrakci textu z obrázků v dokumentu.
Cache TTLDropdown2 týdnyJak dlouho má být obsah cachován, možnosti od žádné mezipaměti až po 1 rok.
Od H1 pokud existujeBooleantrueZahájí extrakci od tagu H1, pokud je přítomen, se zaměřením na hlavní obsah.
Načítat z pointeruBooleantrueNačítá obsah od nejrelevantnější sekce podle vašeho dotazu.
Skrýt zdrojeBooleanfalseSkryje získané zdroje před výstupem nebo zobrazením.
Max. počet tokenůInteger3000Nastaví maximální počet tokenů pro výstupní text.
Přeskočit poslední nadpisBooleantruePři extrakci přeskočí poslední nadpis pro zjednodušený obsah.
StrategieDropdownZahrnout stejnou velikost z každého dokumentuUrčuje, jak bude obsah kombinován: plná konkatenace či zahrnutí stejných částí z dokumentů.
Exportovat obsahMulti-selectVšeVyberte, které HTML prvky exportovat (H1-H6, odstavec).
Zahrnout metadataMulti-selectProduktUrčete, která pole metadat zahrnout (např. Produkt, Autor, Web atd.).
VerboseBooleanfalsePovolit detailní výstup pro ladění nebo informativní účely.
Název nástrojeString(prázdné)Volitelně zadejte vlastní název nástroje pro agenta.
Popis nástrojeVíceřádkový(prázdné)Přidejte popis, který pomůže agentům pochopit účel nástroje.

Výstupy

URL Retriever poskytuje své výstupy v několika formátech, takže můžete flexibilně integrovat do různých AI procesů:

Název výstupuTypPopis
DokumentyMessageZpracovaný obsah z URL, připravený pro workflow založené na zprávách.
Surové dokumentyDocumentSurové, nezpracované objekty dokumentů pro pokročilé následné zpracování.
Dokumenty jako nástrojToolObsah zabalený jako nástroj, umožňující workflowům agentů využívat tyto dokumenty.

Proč používat URL Retriever?

  • Integrace externích znalostí: Plynule přeneste webové informace do svých AI aplikací, jako jsou chatboti, vyhledávače či znalostní báze.
  • Přizpůsobitelná extrakce: Nastavte, jaký obsah a metadata chcete, řiďte množství dat a použijte OCR pro obrázky.
  • Výkon & efektivita: Využijte cachování k omezení opakovaných stahování a omezte výstupní tokeny pro výkon.
  • Flexibilní výstupní formáty: Vyberte formát výstupu, který nejlépe odpovídá dalšímu kroku workflow – strukturovaný dokument, zpráva nebo nástroj.

Příklady použití

  • Tvorba znalostně řízených konverzačních agentů, kteří odpovídají na dotazy pomocí aktuálního webového obsahu.
  • Agregace produktových dat z e-shopů pro porovnávání či analytiku.
  • Monitorování a analýza blogových nebo zpravodajských článků na základě témat či klíčových slov.
  • Extrakce informací z webových stránek obsahujících smíšená média (text i obrázky).

Souhrnná tabulka

FunkcePopis
Načítání URLZískává a zpracovává webový obsah ze zadaných URL.
Podpora OCRExtrahuje text z obrázků v dokumentech, pokud je povoleno.
Extrakce metadatVolitelně zahrnuje metadata jako autor, produkt nebo typy schema.org.
Přizpůsobitelný výstupVyberte, které HTML prvky nebo metadata exportovat.
CachováníKonfigurovatelná doba uložení v mezipaměti pro efektivitu.
Více typů výstupůPodpora výstupu jako zpráva, surový dokument i nástroj pro flexibilitu workflow.

URL Retriever je výkonný a flexibilní most mezi webovým obsahem a vašimi AI workflow, nabízející detailní kontrolu nad extrakcí i integrací obsahu.

Příklady šablon flow používajících komponentu URL Retriever

Abychom vám pomohli rychle začít, připravili jsme několik ukázkových šablon flow, které demonstrují efektivní použití komponenty URL Retriever. Tyto šablony prezentují různé případy použití a osvědčené postupy, což vám usnadní pochopení a implementaci komponenty ve vašich vlastních projektech.

Pokročilý generátor AI blogových příspěvků
Pokročilý generátor AI blogových příspěvků

Pokročilý generátor AI blogových příspěvků

Generujte komplexní, SEO-optimalizované blogové příspěvky s pokročilou strukturou a vysokým počtem slov pomocí více AI agentů. Workflow zahrnuje automatizovaný ...

4 min čtení
Proměňte libovolnou URL na poutavý X příspěvek
Proměňte libovolnou URL na poutavý X příspěvek

Proměňte libovolnou URL na poutavý X příspěvek

Automaticky přemění obsah jakékoliv zadané URL na stručný, poutavý příspěvek vhodný pro X (Twitter), což pomáhá marketérům a tvůrcům rychle zvýšit jejich přítom...

2 min čtení
Převod technické dokumentace na SEO článek
Převod technické dokumentace na SEO článek

Převod technické dokumentace na SEO článek

Přeměňte technickou dokumentaci z URL adresy na poutavý, SEO-optimalizovaný článek pro váš web. Tento flow analyzuje nejlépe hodnocený konkurenční obsah, vytvoř...

4 min čtení
Shrňte libovolné URL do meta popisu
Shrňte libovolné URL do meta popisu

Shrňte libovolné URL do meta popisu

Automaticky vytvoří poutavý, SEO optimalizovaný meta popis pro libovolnou webovou stránku, PDF, YouTube video nebo odkaz na dokument analýzou jeho obsahu a gene...

2 min čtení
Tvůrce AI pitch decků pro Google Slides
Tvůrce AI pitch decků pro Google Slides

Tvůrce AI pitch decků pro Google Slides

Automaticky generujte profesionální pitch decky v Google Slides pomocí AI a aktuálního webového výzkumu. Tento workflow shromažďuje vstupy od uživatele, vyhledá...

3 min čtení
Vylepšovač popisů produktů pro Shopify
Vylepšovač popisů produktů pro Shopify

Vylepšovač popisů produktů pro Shopify

Tento AI workflow vylepšuje popisy produktů na Shopify na základě názvu produktu nebo URL zadané uživatelem. Využívá LLM, získává obsah produktu ze Shopify a z ...

4 min čtení
Výzkum cen produktů na Shopify – AI agent
Výzkum cen produktů na Shopify – AI agent

Výzkum cen produktů na Shopify – AI agent

Tento workflow využívající AI pomáhá obchodníkům na Shopify analyzovat produkty konkurence, zkoumat trendy na trhu a generovat optimalizované cenové strategie. ...

4 min čtení
YouTube video chatbot
YouTube video chatbot

YouTube video chatbot

Interagujte s jakýmkoli YouTube videem prostřednictvím chatu s jeho přepisem. Okamžitě extrahujte a dotazujte se na obsah videa a získejte stručné, AI-poháněné ...

3 min čtení

Často kladené otázky

Co dělá komponenta URL Retriever?

URL Retriever získává a zpracovává obsah ze zadaných webových odkazů a zpřístupňuje text i metadata z online dokumentů pro váš workflow nebo AI agenta.

Umí extrahovat obsah z obrázků nebo PDF?

Ano, pokud povolíte možnost OCR, komponenta dokáže extrahovat text z obrázkových dokumentů nebo naskenovaných PDF.

Jaké typy výstupů poskytuje?

Výstupem jsou zpracované dokumenty jako textové zprávy, surové objekty dokumentů nebo jako nástroj pro workflow agenta, podle vašeho nastavení.

Jak funguje cachování v URL Retrieveru?

Můžete nastavit, jak dlouho bude získaný obsah uložen v mezipaměti, což snižuje opakovaná stahování a urychluje vaše toky.

Mohu ovládat, které části webové stránky se budou extrahovat?

Ano, můžete určit, které nadpisy, odstavce nebo pole metadat mají být zahrnuty ve výstupu, což umožňuje cílenou extrakci.

Je to vhodné pro tvorbu znalostních botů nebo webových automatizací?

Rozhodně. URL Retriever je zásadní pro každou automatizaci nebo chatbota, který potřebuje číst, zpracovávat nebo shrnovat živý webový obsah.

Vyzkoušejte FlowHunt URL Retriever

Vylepšete své workflow integrací živého webového obsahu. Extrahujte, zpracovávejte a využívejte data z URL snadno.

Zjistit více

File Retriever
File Retriever

File Retriever

Komponenta File Retriever ve FlowHunt vám umožňuje vkládat soubory do vašich workflow a převádět je na dokumenty pro další zpracování. Podporuje strategie pro p...

3 min čtení
Files Automation +3
Google Docs Retriever
Google Docs Retriever

Google Docs Retriever

Integrujte své pracovní postupy s Google Docs pomocí komponenty Google Docs Retriever—pohodlně získávejte obsah dokumentů pro použití v automatizacích, chatbote...

2 min čtení
Google Docs Automation +3
Jak nastavit Document Retriever
Jak nastavit Document Retriever

Jak nastavit Document Retriever

Naučte se nastavit parametry 'Od H1 pokud existuje', 'Načíst z ukazatele' a 'Přeskočit poslední nadpis'.

6 min čtení
Document Retriever AI knowledge base +3