Datei-Retriever

Wandeln Sie hochgeladene Dateien in zugängliche Dokumente innerhalb Ihres Flows um, mit Optionen für OCR und Dokumentenverarbeitungsstrategien.

Datei-Retriever

Komponentenbeschreibung

So funktioniert die Datei-Retriever-Komponente

Datei-Retriever-Komponente

Der Datei-Retriever ist eine Flow-Komponente, die darauf ausgelegt ist, den Inhalt von Dateien zu extrahieren und in strukturierte Dokumente umzuwandeln, sodass diese für die weitere Verarbeitung in Ihren KI-Workflows zugänglich werden. Diese Komponente ist besonders nützlich, wenn Sie Wissen aus vom Benutzer hochgeladenen Dateien oder Dokumenten als Teil Ihrer KI-Pipeline integrieren möchten, z.B. für Dokumentenanalyse, Zusammenfassungen oder Retrieval-Augmented-Generation-Aufgaben.

Was die Komponente macht

Im Kern nimmt der Datei-Retriever eine oder mehrere Dateianhänge entgegen und verarbeitet sie, um deren Textinhalt zu extrahieren. Die Inhalte werden dabei in Dokumente umgewandelt, die in Ihrem Workflow weiterverwendet werden können. Es stehen erweiterte Optionen wie optische Zeichenerkennung (OCR) für bildbasierte Dokumente, anpassbare Extraktionsstrategien und die Steuerung der Ausgabetokens zur Verfügung.

Wichtige Eingaben

EingabenameBeschreibungTypStandard / OptionenErweitert
DateienDateien, die in Dokumente umgewandelt werden sollen.FlowSessionAttachmentResponse— (Benutzer lädt Dateien hoch oder stellt sie bereit)Nein
OCR anwendenOCR anwenden, um Text aus bildbasierten Dokumenten zu extrahieren. Nützlich für gescannte PDFs, Bilder.BooleanfalseJa
Max TokensMaximale Anzahl an Tokens im Ausgabetext. Steuert die Größe/Länge des extrahierten Textes.Integer3000Ja
StrategieStrategie zur Umwandlung von Dokumenten:
- Dokumente zusammenfügen, beginnend mit dem ersten bis zum Token-Limit
- Gleichmäßige Verteilung des Inhalts aus jedem Dokument
String (Dropdown)Gleichmäßige Verteilung des Inhalts aus jedem DokumentJa
Tool-NameOptionaler Name, um dieses Tool in agentenbasierten Workflows zu referenzieren.StringJa
Tool-BeschreibungOptionale Beschreibung, die Agenten hilft, dieses Tool zu verwenden.String (Mehrzeilig)Ja
AusführlichGibt an, ob ausführliche Ausgaben (zum Debuggen oder für detaillierte Protokolle) angezeigt werden sollen.BooleanfalseJa

Ausgaben

Die Komponente bietet mehrere Ausgaben, um verschiedenen Anforderungen im weiteren Workflow gerecht zu werden:

AusgabenameTypBeschreibung
DokumenteNachrichtVerarbeitete Dokumente als Nachrichtenobjekte, bereit zur Verwendung im Workflow.
RohdokumenteDokumentDie extrahierten Rohdokumente, die direkten Zugriff auf den Inhalt bieten.
ToolToolDie Dokumente stehen als Tool für agentenbasierte Workflows zur Verfügung.

Warum den Datei-Retriever verwenden?

  • Nahtlose Integration von dateibasiertem Wissen: Bringen Sie Inhalte aus hochgeladenen Dateien (PDFs, Bilder, Text usw.) mühelos in Ihre KI-Workflows ein.
  • OCR-Unterstützung: Extrahiert automatisch Text aus Bildern oder gescannten Dokumenten und erweitert so die Bandbreite der verwendbaren Dateitypen.
  • Flexible Extraktionsstrategien: Wählen Sie zwischen dem Zusammenfügen von Dokumenten oder der gleichmäßigen Verteilung von Inhalten, mit Token-Limits zur Anpassung an Modellanforderungen.
  • Agentenbereit: Optionale Felder für Tool-Namen und Beschreibung erleichtern die Referenzierung in agentengesteuerten Prozessen.
  • Anpassbar und transparent: Erweiterte Optionen für ausführliche Ausgaben und Token-Steuerung unterstützen beim Debuggen und Optimieren der Workflow-Performance.

Typische Anwendungsfälle

  • Wissensaufnahme: Umwandlung von benutzerbereitgestellten Dokumenten in strukturierte Daten für KI-Modelle.
  • Dokumentenanalyse: Vorbereitung von Dokumenten für Zusammenfassungen, Suche oder Frage-Antwort-Aufgaben.
  • Agenten-Tooling: Ermöglichen Sie KI-Agenten den Zugriff auf Dokumente als Tools mit klaren Beschreibungen und Referenzen.

Diese Komponente bietet eine robuste, flexible Grundlage für die Einbindung externer Dateiinhalte in Ihre KI-gesteuerten Prozesse und erhöht die Intelligenz sowie Anpassungsfähigkeit Ihrer Workflows.

Beispiele für Flow-Vorlagen mit der Datei-Retriever-Komponente

Um Ihnen den schnellen Einstieg zu erleichtern, haben wir mehrere Beispiel-Flow-Vorlagen vorbereitet, die zeigen, wie die Datei-Retriever-Komponente effektiv genutzt wird. Diese Vorlagen präsentieren verschiedene Anwendungsfälle und Best Practices und erleichtern Ihnen das Verständnis und die Implementierung der Komponente in Ihren eigenen Projekten.

Häufig gestellte Fragen

Was macht die Datei-Retriever-Komponente?

Sie ermöglicht es Ihnen, Dateien hochzuladen und diese automatisch in Dokumente umzuwandeln, die dann in Ihrem Workflow für die weitere Verarbeitung oder als Wissensquellen genutzt werden können.

Kann der Datei-Retriever bildbasierte Dokumente verarbeiten?

Ja, er unterstützt OCR (Optische Zeichenerkennung), wodurch Text aus Bildern in Dokumenten extrahiert werden kann.

Wie geht die Komponente mit mehreren Dateien oder großen Dokumenten um?

Sie können Strategien für die Dokumentenextraktion konfigurieren, wie z.B. das Kombinieren von Inhalten oder das gleichmäßige Verteilen von Text, und Begrenzungen mit Max-Token-Optionen festlegen.

Welche Arten von Ausgaben sind von dieser Komponente verfügbar?

Sie kann verarbeitete Dokumente in Formaten ausgeben, die für Messaging, die Rohverwendung von Dokumenten oder als Tools für Agenten in Ihrem Flow geeignet sind.

Wird technisches Fachwissen benötigt, um den Datei-Retriever zu nutzen?

Nein, die Komponente ist benutzerfreundlich gestaltet und bietet konfigurierbare Optionen für sowohl grundlegende als auch fortgeschrittene Anforderungen.

Testen Sie den FlowHunt Datei-Retriever

Extrahieren und verarbeiten Sie Dateien ganz einfach als Dokumente in Ihren KI-Workflows. Entdecken Sie noch heute die Flexibilität der Datei-Retriever-Komponente.

Mehr erfahren