Récupérateur d'URL

Récupérateur d'URL

Le Récupérateur d’URL vous permet de récupérer et de traiter du contenu à partir de liens web, en prenant en charge l’OCR, l’extraction de métadonnées et une sortie flexible pour alimenter vos flux de travail IA.

Description du composant

Comment fonctionne le composant Récupérateur d'URL

The URL Retriever is a versatile flow component designed to fetch and process web content from specified URLs, returning the information as structured documents. It serves as a bridge between external online content and your AI workflow, enabling you to integrate, analyze, or process web-based information efficiently.

What Does It Do?

This component retrieves the content of one or multiple URLs provided as input. It can extract the main text, metadata, and even process content from images using Optical Character Recognition (OCR). The retrieved data is then made available in various structured formats suitable for downstream AI tasks such as summarization, question answering, or knowledge extraction.

Input Options

You can supply URLs to the component in two ways:

  • Text URLs:

    • Input Type: Message
    • Description: A list of plain URL links for the component to fetch content from.
  • URL Records:

    • Input Type: UrlRecord
    • Description: A list of structured URL records, which may include additional metadata.

Advanced Input Parameters

ParameterTypeDefaultDescription
Apply OCRBooleanfalseIf enabled, applies OCR to extract text from images in the document.
Cache TTLDropdown2 weeksHow long the content should be cached, with options from no cache up to 1 year.
From H1 if existsBooleantrueBegins extraction from the H1 tag if present, focusing on main content.
Load from pointerBooleantrueLoads content starting from the most relevant section based on your query.
Hide ResourcesBooleanfalseHides the retrieved resources from being output or displayed.
Max TokensInteger3000Sets the maximum number of tokens for the output text.
Skip Last HeaderBooleantrueSkips the last header during extraction for streamlined content.
StrategyDropdownInclude equal size from each documentsDetermines how content is combined: concatenate fully or include equal parts from each document.
Export ContentMulti-selectAllChoose which HTML elements to export (H1-H6, Paragraph).
Include MetadataMulti-selectProductSpecify which metadata fields to include (e.g., Product, Author, Website, etc.).
VerboseBooleanfalseEnables detailed output for debugging or information purposes.
Tool NameString(empty)Optionally assign a custom name to the tool for agent reference.
Tool DescriptionMultiline(empty)Provide a description to help agents understand the tool’s purpose.

Outputs

The URL Retriever provides its outputs in several formats, allowing flexible integration with various AI processes:

Output NameTypeDescription
DocumentsMessageThe processed content from the URLs, ready for use in messaging-oriented workflows.
Raw DocumentsDocumentThe raw, unprocessed document objects for advanced downstream processing.
Documents As ToolToolThe content packaged as a tool, enabling agent-based workflows to utilize the documents.

Why Use the URL Retriever?

  • Integrate External Knowledge: Seamlessly bring web-based information into your AI applications, such as chatbots, search engines, or knowledge bases.
  • Customizable Extraction: Fine-tune what content and metadata you want, control the amount of data, and use OCR for images.
  • Performance & Efficiency: Use caching to avoid redundant downloads, and limit token output for performance.
  • Flexible Output Formats: Choose the output format that best fits your next workflow step—structured document, message, or tool.

Example Use Cases

  • Building knowledge-grounded conversational agents that answer questions using up-to-date web content.
  • Aggregating product data from e-commerce sites for comparison or analytics.
  • Monitoring and analyzing blog or news articles based on specific topics or keywords.
  • Extracting information from web pages containing mixed media (text and images).

Summary Table

FeatureDescription
Fetches URLsRetrieves and processes web content from provided URLs.
OCR SupportExtracts text from images in documents if enabled.
Metadata ExtractionOptionally includes metadata such as author, product, or schema.org types.
Customizable OutputSelect which HTML elements or metadata to export.
CachingConfigurable cache lifetimes for efficiency.
Multiple Output TypesSupports message, raw document, and tool outputs for workflow flexibility.

The URL Retriever is a powerful and flexible bridge between web content and your AI workflows, offering granular control over content extraction and integration.

Exemples de modèles de flux utilisant le composant Récupérateur d'URL

Pour vous aider à démarrer rapidement, nous avons préparé plusieurs exemples de modèles de flux qui démontrent comment utiliser efficacement le composant Récupérateur d'URL. Ces modèles présentent différents cas d'utilisation et meilleures pratiques, facilitant votre compréhension et l'implémentation du composant dans vos propres projets.

Agent IA de recherche de tarification de produits Shopify
Agent IA de recherche de tarification de produits Shopify

Agent IA de recherche de tarification de produits Shopify

Ce workflow alimenté par l'IA aide les commerçants Shopify à analyser les produits concurrents, rechercher les tendances du marché et générer des stratégies de ...

5 min de lecture
Améliorateur de descriptions produits Shopify
Améliorateur de descriptions produits Shopify

Améliorateur de descriptions produits Shopify

Ce workflow alimenté par l’IA améliore les descriptions produits Shopify à partir du nom du produit ou de l’URL fournie par l’utilisateur. Il exploite les LLM, ...

4 min de lecture
Analyse d'entreprise IA & Étude de Marché
Analyse d'entreprise IA & Étude de Marché

Analyse d'entreprise IA & Étude de Marché

Flux de travail complet piloté par l'IA pour l'analyse d'entreprise et l'étude de marché. Rassemble et analyse automatiquement des données sur l'historique de l...

5 min de lecture
Analyse d'entreprise par IA exportée vers Google Sheets
Analyse d'entreprise par IA exportée vers Google Sheets

Analyse d'entreprise par IA exportée vers Google Sheets

Ce workflow alimenté par l'IA fournit une analyse d'entreprise complète et fondée sur les données. Il rassemble des informations sur l'historique de l'entrepris...

5 min de lecture
Analyse de blogs concurrents & Générateur d'idées d'articles
Analyse de blogs concurrents & Générateur d'idées d'articles

Analyse de blogs concurrents & Générateur d'idées d'articles

Analysez automatiquement les blogs concurrents les mieux classés de la semaine passée et générez de nouvelles idées d’articles pour votre site web. Ce flux de t...

5 min de lecture
Analyseur d'écart de contenu SEO
Analyseur d'écart de contenu SEO

Analyseur d'écart de contenu SEO

Ce flux de travail alimenté par l'IA analyse la structure de contenu de votre page web, la compare avec les pages concurrentes les mieux classées et fournit des...

5 min de lecture
Analyseur de Fréquence des Mots-Clés pour le SEO
Analyseur de Fréquence des Mots-Clés pour le SEO

Analyseur de Fréquence des Mots-Clés pour le SEO

Ce flux analyse les mots-clés les plus fréquemment utilisés sur les pages web les mieux classées pour un mot-clé cible. Idéal pour les professionnels du SEO et ...

4 min de lecture
Analyseur de lisibilité de site web
Analyseur de lisibilité de site web

Analyseur de lisibilité de site web

Analysez la lisibilité de n'importe quel site web en saisissant son URL. Ce workflow récupère le contenu à partir de l'URL fournie et évalue sa lisibilité à l'a...

3 min de lecture
Analyseur de mots-clés concurrents SEO par IA
Analyseur de mots-clés concurrents SEO par IA

Analyseur de mots-clés concurrents SEO par IA

Analysez automatiquement l’URL de la page d’accueil de votre concurrent pour découvrir ses mots-clés les mieux classés, collectez les données de mots-clés depui...

4 min de lecture
Assistant de recherche IA pour Google Docs
Assistant de recherche IA pour Google Docs

Assistant de recherche IA pour Google Docs

Ce workflow alimenté par l'IA extrait des informations spécifiques d'un Google Doc puis les développe en effectuant des recherches sur des sources telles que la...

4 min de lecture
Assistant de recherche sur les sujets tendance
Assistant de recherche sur les sujets tendance

Assistant de recherche sur les sujets tendance

Découvrez de quoi les gens parlent en ligne autour du mot-clé de votre choix. Ce flux de travail alimenté par l'IA recherche les sujets tendance ou connexes iss...

4 min de lecture
Assistant IA avec prise en compte de Google Agenda
Assistant IA avec prise en compte de Google Agenda

Assistant IA avec prise en compte de Google Agenda

Un assistant IA intelligent qui s’intègre à Google Agenda pour aider les utilisateurs à gérer leurs emplois du temps. Les utilisateurs peuvent interagir via le ...

4 min de lecture
Chatbot de génération de leads IA avec notification par e-mail
Chatbot de génération de leads IA avec notification par e-mail

Chatbot de génération de leads IA avec notification par e-mail

Ce chatbot de génération de leads alimenté par l’IA offre un support client personnalisé en s’appuyant sur votre base de connaissances interne, identifie les pr...

4 min de lecture
Chatbot de réponses Google alimenté par l'IA
Chatbot de réponses Google alimenté par l'IA

Chatbot de réponses Google alimenté par l'IA

Un chatbot IA qui fournit instantanément des réponses actualisées à toute question en recherchant sur Google et en récupérant le contenu pertinent des sites web...

4 min de lecture
Chatbot de service client IA avec transfert à un humain
Chatbot de service client IA avec transfert à un humain

Chatbot de service client IA avec transfert à un humain

Un chatbot de service client alimenté par l'IA qui assiste automatiquement les utilisateurs, récupère des informations depuis des documents internes et le web, ...

4 min de lecture
Chatbot IA avec Escalade Humaine via Slack
Chatbot IA avec Escalade Humaine via Slack

Chatbot IA avec Escalade Humaine via Slack

Déployez un chatbot de support client intelligent pour LiveAgent qui répond automatiquement aux questions des visiteurs, récupère des documents de la base de co...

5 min de lecture
Chatbot RAG en temps réel spécifique à un domaine
Chatbot RAG en temps réel spécifique à un domaine

Chatbot RAG en temps réel spécifique à un domaine

Un chatbot en temps réel qui utilise la recherche Google restreinte à votre propre domaine, récupère le contenu web pertinent et exploite OpenAI LLM pour répond...

5 min de lecture
Chatbot Vidéo YouTube
Chatbot Vidéo YouTube

Chatbot Vidéo YouTube

Interagissez avec n'importe quelle vidéo YouTube en discutant avec sa transcription. Extrayez et interrogez instantanément le contenu de la vidéo pour obtenir d...

4 min de lecture
Convertir la documentation technique en article SEO
Convertir la documentation technique en article SEO

Convertir la documentation technique en article SEO

Transformez la documentation technique d'une URL en un article captivant et optimisé SEO pour votre site web. Ce flux analyse le contenu des concurrents les mie...

5 min de lecture
Créateur de Pitch Deck IA pour Google Slides
Créateur de Pitch Deck IA pour Google Slides

Créateur de Pitch Deck IA pour Google Slides

Générez automatiquement des pitch decks professionnels dans Google Slides grâce à l'IA et à la recherche web en direct. Ce workflow recueille les informations d...

4 min de lecture
Curateur IA des meilleures actualités Hacker News
Curateur IA des meilleures actualités Hacker News

Curateur IA des meilleures actualités Hacker News

Un workflow automatisé propulsé par l’IA pour récupérer, résumer et présenter les meilleures actualités de Hacker News, incluant les détails, les URL et les mei...

5 min de lecture
Extracteur de Transcriptions Vidéo
Extracteur de Transcriptions Vidéo

Extracteur de Transcriptions Vidéo

Générez des transcriptions à partir de vidéos en extrayant les sous-titres à partir d’URL fournies. Utile pour obtenir rapidement un texte lisible à partir de v...

3 min de lecture
Générateur Avancé d’Articles de Blog par IA
Générateur Avancé d’Articles de Blog par IA

Générateur Avancé d’Articles de Blog par IA

Générez des articles de blog complets, optimisés pour le SEO, avec une structure avancée et un nombre de mots élevé grâce à plusieurs agents IA. Le workflow inc...

5 min de lecture
Générateur d'Analyse de Produit par IA
Générateur d'Analyse de Produit par IA

Générateur d'Analyse de Produit par IA

Générez des analyses complètes de produits à l'aide d'agents IA qui collectent et résument des informations sur les produits, les prix, les fonctionnalités, les...

4 min de lecture
Générateur d'annonces Google Ads à partir d'une URL
Générateur d'annonces Google Ads à partir d'une URL

Générateur d'annonces Google Ads à partir d'une URL

Générez automatiquement plusieurs variantes d'annonces Google Ads pour n'importe quelle URL. Collez le lien de votre site web et recevez des titres et descripti...

3 min de lecture
Générateur d'Articles d'Actualités Quotidiennes par IA
Générateur d'Articles d'Actualités Quotidiennes par IA

Générateur d'Articles d'Actualités Quotidiennes par IA

Génère automatiquement des articles d'actualité à jour sur n'importe quel sujet choisi en recherchant les derniers articles tendance sur Google et YouTube, en e...

4 min de lecture
Générateur d'articles de glossaire IA
Générateur d'articles de glossaire IA

Générateur d'articles de glossaire IA

Générez des articles de glossaire approfondis et optimisés pour le SEO grâce à l’IA et à la recherche web en temps réel. Ce flux analyse les contenus les mieux ...

5 min de lecture
Générateur d'articles de revue de logiciels par IA
Générateur d'articles de revue de logiciels par IA

Générateur d'articles de revue de logiciels par IA

Générez des articles de revue de produits logiciels complets et optimisés SEO, incluant des descriptions détaillées des fonctionnalités, tarifs, avis d'utilisat...

4 min de lecture
Générateur d'e-mails IA
Générateur d'e-mails IA

Générateur d'e-mails IA

Générez instantanément des e-mails structurés et clairs, adaptés à votre ton et à votre intention, avec une ligne d'objet suggérée grâce à l'IA. Parfait pour le...

2 min de lecture
Générateur d'essais MLA avec sources fiables
Générateur d'essais MLA avec sources fiables

Générateur d'essais MLA avec sources fiables

Génère automatiquement des essais factuels et bien structurés au format MLA en utilisant des sources crédibles trouvées via la recherche Google. Idéal pour les ...

4 min de lecture
Générateur d'idées de contenu IA
Générateur d'idées de contenu IA

Générateur d'idées de contenu IA

Générez des idées de contenu uniques et des résumés à l'aide de l'IA en recherchant les meilleurs résultats Google pour n'importe quel mot-clé. Idéal pour les m...

4 min de lecture
Générateur d'idées et de propositions de valeur IA
Générateur d'idées et de propositions de valeur IA

Générateur d'idées et de propositions de valeur IA

Ce workflow alimenté par l’IA aide les chefs de produit et les marketeurs à brainstormer instantanément des idées innovantes et à découvrir des propositions de ...

5 min de lecture
Générateur de bibliographie LaTeX à partir d'une URL
Générateur de bibliographie LaTeX à partir d'une URL

Générateur de bibliographie LaTeX à partir d'une URL

Générez une entrée de bibliographie au format LaTeX pour tout article académique en fournissant simplement son URL. Ce workflow automatise l'extraction des déta...

3 min de lecture
Générateur de bio Instagram avec IA
Générateur de bio Instagram avec IA

Générateur de bio Instagram avec IA

Générez automatiquement des bios Instagram à forte conversion grâce à l'IA, la recherche Google et le contenu de guides de bonnes pratiques. Parfait pour les ma...

3 min de lecture
Générateur de blog IA avec humanisation
Générateur de blog IA avec humanisation

Générateur de blog IA avec humanisation

Générez des blogs détaillés et optimisés pour le SEO avec l'aide d'agents IA. Le flux effectue des recherches sur les meilleurs résultats Google, crée un brief ...

4 min de lecture
Générateur de blog SEO à partir de vidéo YouTube
Générateur de blog SEO à partir de vidéo YouTube

Générateur de blog SEO à partir de vidéo YouTube

Générez automatiquement des articles de blog SEO performants à partir de vidéos YouTube. Ce workflow extrait les transcriptions vidéo, analyse les meilleurs mot...

5 min de lecture
Générateur de cas d'utilisation produit IA
Générateur de cas d'utilisation produit IA

Générateur de cas d'utilisation produit IA

Générez des rapports complets et pilotés par l’IA sur les cas d’utilisation d’un produit logiciel pour le marketing et la vente. Ce workflow recherche le produi...

4 min de lecture
Générateur de conclusions pour sites web et vidéos
Générateur de conclusions pour sites web et vidéos

Générateur de conclusions pour sites web et vidéos

Générez des conclusions concises à partir de sites web, documents téléchargés ou vidéos YouTube grâce à l’IA. Parfait pour résumer rapidement les points clés et...

4 min de lecture
Générateur de contenu pour pages les mieux classées
Générateur de contenu pour pages les mieux classées

Générateur de contenu pour pages les mieux classées

Générez du contenu de page web bien structuré basé sur l'analyse des pages Google les mieux classées pour n'importe quel mot-clé. Ce flux automatise la recherch...

4 min de lecture
Générateur de descriptions de catégories e-commerce par IA
Générateur de descriptions de catégories e-commerce par IA

Générateur de descriptions de catégories e-commerce par IA

Générez automatiquement des descriptions optimisées pour le référencement (SEO) des pages de catégories e-commerce grâce à l'IA. Il suffit de fournir une URL de...

3 min de lecture
Générateur de descriptions de produits par IA
Générateur de descriptions de produits par IA

Générateur de descriptions de produits par IA

Créez des descriptions de produits accrocheuses et optimisées pour le SEO pour le e-commerce en recueillant les informations clés sur Google, Reddit, YouTube et...

3 min de lecture
Générateur de descriptions YouTube à partir d’une URL
Générateur de descriptions YouTube à partir d’une URL

Générateur de descriptions YouTube à partir d’une URL

Générez automatiquement des titres, descriptions et hashtags YouTube optimisés pour le SEO à partir de n’importe quelle URL de page web. Parfait pour les market...

3 min de lecture
Générateur de données structurées Schema.org
Générateur de données structurées Schema.org

Générateur de données structurées Schema.org

Génère automatiquement des données structurées Schema.org au format JSON pour n'importe quelle URL de site web, facilitant ainsi la compréhension et l'indexatio...

4 min de lecture
Générateur de FAQ automatisé à partir de la recherche web
Générateur de FAQ automatisé à partir de la recherche web

Générateur de FAQ automatisé à partir de la recherche web

Ce flux de travail alimenté par l'IA génère des réponses FAQ concises et de haute qualité pour toute question donnée en recherchant sur le web, en extrayant le ...

4 min de lecture
Générateur de FAQ avec balisage Schema.org
Générateur de FAQ avec balisage Schema.org

Générateur de FAQ avec balisage Schema.org

Générez des sections FAQ optimisées pour le SEO à partir de n'importe quelle URL de site web et formatez automatiquement les FAQ en balisage Schema.org pour amé...

3 min de lecture
Générateur de listes d'avantages et d'inconvénients par IA
Générateur de listes d'avantages et d'inconvénients par IA

Générateur de listes d'avantages et d'inconvénients par IA

Générez une liste détaillée et équilibrée d'avantages et d'inconvénients pour n'importe quel sujet en utilisant la recherche IA et les informations web en direc...

4 min de lecture
Générateur de plan de contenu SEO
Générateur de plan de contenu SEO

Générateur de plan de contenu SEO

Générez un plan de contenu optimisé pour le SEO en analysant les premiers résultats de recherche Google pour un mot-clé donné. Ce flux de travail utilise l'IA e...

4 min de lecture
Générateur de posts LinkedIn à partir d'une URL
Générateur de posts LinkedIn à partir d'une URL

Générateur de posts LinkedIn à partir d'une URL

Créez facilement un texte de post LinkedIn attrayant à partir de n'importe quelle URL de page web. Ce flux de travail automatisé extrait le contenu de votre sit...

3 min de lecture
Générateur de prompts d'image à partir d'une URL
Générateur de prompts d'image à partir d'une URL

Générateur de prompts d'image à partir d'une URL

Transformez n'importe quel article ou page web en un prompt créatif et détaillé pour les modèles texte-vers-image. Ce workflow récupère le contenu d'une URL, l'...

4 min de lecture
Générateur de publications Instagram avec IA
Générateur de publications Instagram avec IA

Générateur de publications Instagram avec IA

Générez automatiquement des publications Instagram engageantes, incluant des titres accrocheurs, des légendes créatives et des images visuellement attrayantes g...

4 min de lecture
Génération automatisée de leads C-Suite
Génération automatisée de leads C-Suite

Génération automatisée de leads C-Suite

Ce workflow alimenté par l'IA automatise la génération de leads sortants en identifiant les meilleures entreprises dans un secteur et une localisation spécifiqu...

4 min de lecture
Générez une page Web SEO à partir d'une transcription YouTube
Générez une page Web SEO à partir d'une transcription YouTube

Générez une page Web SEO à partir d'une transcription YouTube

Transformez automatiquement n'importe quelle transcription de vidéo YouTube en contenu de page Web optimisé pour le SEO. Entrez une URL YouTube et obtenez un br...

3 min de lecture
Image principale de blog à partir d'une URL
Image principale de blog à partir d'une URL

Image principale de blog à partir d'une URL

Génère automatiquement une image principale attrayante pour tout article de blog en analysant son contenu. Il suffit de fournir l’URL du blog, et le workflow ut...

3 min de lecture
Précédent Suivant

Questions fréquemment posées

Que fait le composant Récupérateur d'URL ?

Le Récupérateur d'URL récupère et traite le contenu de liens web spécifiés, rendant le texte et les métadonnées de documents en ligne disponibles pour votre flux de travail ou agent IA.

Peut-il extraire du contenu à partir d'images ou de PDF ?

Oui, en activant l'option OCR, le composant peut extraire le texte de documents basés sur des images ou des PDF scannés.

Quels types de sorties propose-t-il ?

Il fournit les documents traités sous forme de messages texte, d'objets document bruts ou comme outil pour des flux de travail d'agent, selon votre configuration.

Comment fonctionne la mise en cache dans le Récupérateur d'URL ?

Vous pouvez définir la durée de mise en cache du contenu récupéré, réduisant ainsi les téléchargements répétés et accélérant vos flux.

Puis-je contrôler quelles parties d'une page web sont extraites ?

Oui, vous pouvez spécifier quels titres, paragraphes ou champs de métadonnées inclure dans la sortie, permettant une extraction ciblée.

Est-ce adapté à la création de bots de connaissance ou d'automatisations de données web ?

Absolument. Le Récupérateur d'URL est essentiel pour toute automatisation ou chatbot ayant besoin de lire, traiter ou résumer du contenu web en direct.

Essayez le Récupérateur d'URL FlowHunt

Boostez vos flux de travail en intégrant du contenu web en direct. Extrayez, traitez et exploitez des données depuis des URL en toute simplicité.

En savoir plus

Récupérateur Google Docs
Récupérateur Google Docs

Récupérateur Google Docs

Intégrez vos flux de travail avec Google Docs grâce au composant Récupérateur Google Docs—récupérez sans effort le contenu de vos documents pour l'utiliser dans...

3 min de lecture
Google Docs Automation +3
Récupérateur de fichiers
Récupérateur de fichiers

Récupérateur de fichiers

Le composant Récupérateur de fichiers dans FlowHunt vous permet d'intégrer des fichiers dans votre flux de travail et de les convertir en documents pour un trai...

3 min de lecture
Files Automation +3
Outil de capture d'écran
Outil de capture d'écran

Outil de capture d'écran

Capturez instantanément des instantanés de sites web avec le composant Outil de capture d'écran. Automatisez facilement la prise de captures d'écran de n'import...

2 min de lecture
Automation Web +3