
LangChain
LangChain ist ein Open-Source-Framework zur Entwicklung von Anwendungen, die von großen Sprachmodellen (LLMs) unterstützt werden. Es vereinfacht die Integration...

Erfahren Sie, wie die Middleware-Architektur von LangChain 1.0 die Agentenentwicklung revolutioniert und es Entwicklern ermöglicht, leistungsstarke, erweiterbare Deep Agents mit Planung, Dateisystemen und Sub-Agenten-Fähigkeiten zu bauen.
FlowHunt verwendet die LangChain-Bibliothek im Backend. In diesem Blogbeitrag beleuchte ich die Middleware-Architektur von LangChain und wie sie es ermöglicht, noch ausgefeiltere KI-Agenten zu bauen. Die Entwicklung von KI-Agenten steht an einem Wendepunkt: Mit wachsender Leistungsfähigkeit von Sprachmodellen steigt der Bedarf an ausgefeilten Agentenarchitekturen, die komplexe, mehrstufige Workflows bewältigen können. LangChain 1.0 bringt mit seiner innovativen Middleware-Architektur einen Paradigmenwechsel in der Agentenentwicklung und verändert grundlegend, wie wir an Erweiterbarkeit und Komposition von Agenten herangehen. Dieser umfassende Leitfaden beleuchtet die komplette Neuentwicklung von Deep Agents auf Basis von LangChain 1.0 und zeigt, wie Middleware die Agentenentwicklung von einem starren, monolithischen Ansatz in ein flexibles, komponierbares System verwandelt, das Entwicklern ermöglicht, leistungsstarke Agenten nach ihren Bedürfnissen zu gestalten.
Bevor wir in die technische Architektur eintauchen, ist es wichtig zu verstehen, was Deep Agents von herkömmlichen Tool-Calling-Systemen unterscheidet. Im Kern sind Deep Agents ausgeklügelte Tool-Calling-Schleifen, die mit spezifischen eingebauten Fähigkeiten erweitert wurden, sodass sie komplexe, mehrstufige Workflows mit minimaler menschlicher Intervention bewältigen können. Während einfache Tool-Calling-Agenten Aufgaben nacheinander durch Aufruf von Werkzeugen und Verarbeitung der Ergebnisse ausführen, fügen Deep Agents eine Schicht Intelligenz und Struktur hinzu, die ihr Problemlösungsverhalten grundlegend verändert.
Die Grundlage von Deep Agents ruht auf vier zentralen Säulen. Erstens ermöglichen Planungsfähigkeiten Agenten, strukturierte To-Do-Listen zu erstellen und zu befolgen, komplexe Aufgaben in überschaubare Schritte zu zerlegen und diese erst dann auszuführen. Diese Planungsphase ist entscheidend, weil der Agent so den gesamten Workflow durchdenkt, Abhängigkeiten erkennt und die Reihenfolge der Schritte optimiert. Zweitens bietet Dateisystemzugriff Agenten persistenten Speicher, um Kontext auszulagern, Informationen in Dateien abzulegen und später wieder abzurufen, anstatt alles in der Gesprächshistorie zu halten. Das ist besonders wertvoll zum Management großer Datenmengen oder für die Statusverwaltung über mehrere Operationen hinweg. Drittens ermöglicht das Erzeugen von Sub-Agenten dem Hauptagenten, Aufgaben an spezialisierte Sub-Agenten für isolierte Aufgaben zu delegieren, was die Effizienz steigert und domänenspezifische Expertise ermöglicht. Schließlich sorgen detaillierte Systemprompts für umfassende Anleitungen zur Nutzung dieser Tools, damit der Agent nicht nur weiß, welche Werkzeuge es gibt, sondern auch wann und wie sie optimal einzusetzen sind.
Diese Fähigkeiten haben sich in produktiven Systemen wie Manus und Cloud Code als äußerst wertvoll erwiesen, wo Agenten komplexe Workflows navigieren, große Mengen an Kontext verwalten und kluge Entscheidungen über die Aufgabenverteilung treffen müssen. Ziel des Deep-Agents-Packages ist es, diesen ausgefeilten Architekturansatz zu demokratisieren und Entwicklern den Aufbau leistungsfähiger Agenten zu erleichtern, ohne das Rad neu zu erfinden oder sämtliche Implementierungsdetails verstehen zu müssen.
Traditionell wurden Agenten als monolithische Strukturen gebaut, in denen sämtliche Funktionalitäten – Planung, Toolmanagement, Statusverwaltung, Prompt-Engineering – eng miteinander verwoben waren. Das führte zu mehreren Problemen: Erweiterungen erforderten Änderungen an der Kernlogik, Wiederverwendung von Komponenten über verschiedene Agenten hinweg war schwierig und das Testen einzelner Funktionen isoliert nahezu unmöglich. Entwickler mussten entweder Einschränkungen akzeptieren oder umfassende Refaktorierungen vornehmen, um neue Funktionen zu integrieren.
LangChain 1.0 begegnet diesen Herausforderungen mit einem revolutionären Konzept: Middleware. Middleware steht für einen Paradigmenwechsel in der Agentenarchitektur und führt eine stapelbare Abstraktion ein, mit der sich Agentenfähigkeiten wie Bausteine zusammensetzen lassen. Anstatt die zentrale Agentenschleife zu verändern, fängt Middleware gezielt Punkte im Ausführungsfluss des Agenten ab und erweitert diese, sodass Verantwortlichkeiten sauber getrennt und maximale Wiederverwendbarkeit erreicht wird. Diese Innovation verwandelt die Agentenentwicklung von einem monolithischen, Alles-oder-Nichts-Ansatz in ein modulares, komponierbares System, in dem jede Funktionalität unabhängig entwickelt, getestet und eingesetzt werden kann.
Das Besondere an Middleware ist ihre Stapelbarkeit. Entwickler können mehrere Middleware-Komponenten definieren und sie der Reihe nach anwenden, wobei jede Schicht eigene Zustandserweiterungen, Werkzeuge und Systemprompt-Anpassungen hinzufügt. So kann ein einzelner Agent von Planungsfähigkeiten, Dateisystemzugriff, Sub-Agenten und individuellen domänenspezifischen Erweiterungen profitieren – alles nahtlos kombiniert. Die Reihenfolge der Middleware-Anwendung ist dabei entscheidend, da jede Schicht auf der vorigen aufbaut und ein kumulativer Effekt entsteht, der zu hochleistungsfähigen Agenten führt.
Um Middleware zu verstehen, muss man betrachten, wie sie die grundlegende ReAct-Agentenschleife (Reasoning + Acting) verändert. Das ReAct-Muster ist heute Standard für Tool-Calling-Agenten und sieht vor, dass das Modell überlegt, welche Aktion es ausführen soll, diese über ein Werkzeug ausführt, das Ergebnis beobachtet und diesen Zyklus wiederholt, bis die Aufgabe abgeschlossen ist. Middleware ersetzt diese Schleife nicht, sondern erweitert sie an strategischen Stellen.
Middleware arbeitet über drei Hauptmechanismen. Erstens erweitert sie das Zustandsschema, indem neue Schlüssel und Datenstrukturen hinzugefügt werden, auf die der Agent zugreifen und die er modifizieren kann. So können unterschiedliche Middleware-Komponenten ihren eigenen Zustand pflegen, ohne sich gegenseitig zu beeinträchtigen. Zweitens fügt sie neue Tools zum Agenten-Werkzeugkasten hinzu, sodass das Modell zusätzliche Möglichkeiten zur Zielerreichung bekommt. Drittens modifiziert sie die Modellabfrage, meist durch das Anfügen individueller Anweisungen an den Systemprompt, die erklären, wie neue Tools zu nutzen und wann sie anzuwenden sind.
Durch diesen dreiteiligen Ansatz sind Middleware-Erweiterungen umfassend und gut integriert. Ein Werkzeug nur hinzuzufügen, ohne das Zustandsschema zu erweitern oder Anleitungen zu geben, wäre ineffektiv – das Modell wüsste nicht, wie oder wann das Tool einzusetzen ist. Durch die Kombination aller drei Mechanismen entsteht eine konsistente Erweiterung, die das Modell voll ausschöpfen kann.
Die Planungs-Middleware zeigt beispielhaft, wie Middleware-Architektur anspruchsvolle Agentenfähigkeiten ermöglicht. Sie erweitert das Zustandsschema des Agenten um eine To-Do-Liste, eine simple, aber leistungsstarke Datenstruktur, mit der Agenten einen strukturierten Handlungsplan führen können. Die Implementierung ist dabei elegant einfach: Die Middleware fügt dem Zustandsschema nur einen Schlüssel hinzu, der jedoch weitreichende Fähigkeiten eröffnet.
Um das Planungswerkzeug effektiv zu machen, stellt die Middleware ein Write-To-Dos-Tool bereit, mit dem das Modell die To-Do-Liste erstellen, aktualisieren und verwalten kann. Bei komplexen Aufgaben kann der Agent dieses Werkzeug nutzen, um die Aufgabe in kleinere, handhabbare Schritte zu zerlegen. Statt alles auf einmal zu lösen, erstellt der Agent einen Plan, setzt einzelne Schritte um und aktualisiert die Liste fortlaufend. Dieser strukturierte Ansatz bringt mehrere Vorteile: Die Überlegungen des Agenten werden transparent und nachvollziehbar, Fehler lassen sich leichter beheben (schlägt ein Schritt fehl, kann der Plan angepasst werden), und meist läuft die Ausführung effizienter ab, weil der gesamte Workflow durchdacht wurde.
Entscheidend ist, dass die Planungs-Middleware nicht nur ein Tool hinzufügt, sondern auch den Systemprompt mit detaillierten Anweisungen zur effektiven Nutzung des Tools anpasst. Diese Anleitungen erklären, wann Planung sinnvoll ist, wie ein guter Plan aufgebaut wird und wie der Plan bei Fortschritt aktualisiert wird. Diese Systemprompt-Erweiterung ist unerlässlich, weil sie das Verhalten des Modells gezielt steuert und sicherstellt, dass das Planungswerkzeug strategisch eingesetzt wird.
Während sich die Planungs-Middleware auf Aufgabenzerlegung konzentriert, adressiert die Dateisystem-Middleware eine ebenso wichtige Herausforderung: Kontextmanagement und Statuspersistenz über mehrere Operationen hinweg. Die Dateisystem-Middleware erweitert den Agentenzustand um ein Dateien-Dictionary und schafft so ein virtuelles Dateisystem, in dem der Agent lesen und schreiben kann.
Im Gegensatz zur Planungs-Middleware, die ein einzelnes Tool bereitstellt, bietet die Dateisystem-Middleware mehrere Werkzeuge für verschiedene Dateioperationen. Der Agent kann Dateien auflisten, um sich einen Überblick zu verschaffen, Dateien lesen, um Informationen in den Kontext zu laden, neue Dateien schreiben, um Informationen zu speichern, und bestehende Dateien bearbeiten, um Daten zu aktualisieren. Dieser Multi-Tool-Ansatz spiegelt die Vielfalt der Dateisysteminteraktionen wider, die je nach Szenario unterschiedliche Operationen erfordern.
Die Dateisystem-Middleware ist besonders wertvoll, um große Datenmengen oder Status über mehrere Operationen hinweg zu verwalten. Anstatt alles in der Gesprächshistorie zu halten (was viele Tokens verbraucht und Kontextgrenzen sprengen kann), kann der Agent Informationen in Dateien speichern und bei Bedarf abrufen. Ein Agent, der beispielsweise ein Forschungsprojekt bearbeitet, könnte Erkenntnisse thematisch in Dateien ablegen und beim Ziehen von Schlussfolgerungen gezielt passende Dateien wieder einlesen. So werden deutlich größere Datenmengen handhabbar, als es das Kontextfenster allein erlauben würde.
Wie die Planungs-Middleware enthält auch die Dateisystem-Middleware individuelle Systemprompts, die die effektive Nutzung der Dateisystemtools erläutern. Sie geben Hinweise, wann Informationen gespeichert werden sollten, wie man Dateien sinnvoll organisiert und Best Practices für das Management des virtuellen Dateisystems.
Die Sub-Agenten-Middleware stellt das anspruchsvollste Element der Deep-Agents-Architektur dar. Sie ermöglicht es dem Hauptagenten, spezialisierte Sub-Agenten für isolierte Aufgaben zu erzeugen, wodurch eine hierarchische Struktur entsteht, die die Effizienz steigert und domänenspezifische Expertise erlaubt. Die Implementierung ist komplexer als bei Planungs- oder Dateisystem-Middleware, da mehrere Szenarien und Konfigurationen abgedeckt werden müssen.
Im Kern stellt die Sub-Agenten-Middleware ein Task-Tool bereit, mit dem der Hauptagent Arbeit an Sub-Agenten delegieren kann. Entscheidet der Hauptagent, dass eine Aufgabe einem Sub-Agenten übergeben werden soll, ruft er das Task-Tool auf, wählt den passenden Sub-Agenten aus und übergibt relevante Informationen. Der Sub-Agent führt die Aufgabe aus und liefert eine umfassende Antwort zurück. Dieses Delegationsmodell hat mehrere Vorteile: Es isoliert den Kontext (der Sub-Agent sieht nur für seine Aufgabe relevante Informationen), erlaubt Spezialisierung (verschiedene Sub-Agenten können unterschiedliche Tools und Prompts nutzen) und sorgt oftmals für eine sauberere, effizientere Ausführung.
Die Sub-Agenten-Middleware unterstützt zwei Hauptanwendungsfälle für Sub-Agenten. Der erste ist die Kontextisolierung, bei der ein allgemeiner Sub-Agent die gleichen Tools wie der Hauptagent erhält, jedoch eine eng umrissene Aufgabe bearbeitet. Der Sub-Agent löst diese Aufgabe und liefert eine klare, umfassende Antwort zurück – ohne Zwischenschritte oder Kontext, der die Historie des Hauptagenten überladen würde. Das spart Tokens und Zeit. Der zweite Anwendungsfall ist die Domänenspezialisierung, bei der ein Sub-Agent mit individuellem Prompt und einer spezifischen Werkzeugauswahl für eine bestimmte Aufgabe oder Domäne erstellt wird. Ein Forschungsagent könnte beispielsweise einen Sub-Agenten für Literaturrecherche mit Zugriff auf akademische Datenbanken haben und einen anderen für Datenanalyse mit statistischen Tools.
Die Middleware erlaubt zwei Methoden zur Definition von Sub-Agenten. Tool-Calling-Sub-Agenten werden von Grund auf mit individuellem Prompt und eigener Werkzeugliste erstellt. Sie können völlig andere Tools als der Hauptagent haben, was echte Spezialisierung ermöglicht. Entwickler können zudem für jeden Sub-Agenten ein eigenes Modell definieren. Eigene Sub-Agenten bieten noch mehr Flexibilität, indem Entwickler bereits vorhandene LangGraph-Graphen direkt als Sub-Agenten übergeben können – ideal, wenn bereits ausgefeilte Agenten-Workflows existieren, die dem Hauptagenten als Sub-Agenten zur Verfügung gestellt werden sollen.
Wichtig: Auch Sub-Agenten erhalten Middleware und profitieren so von Planung, Dateisystemzugriff und weiteren Erweiterungen. Damit sind Sub-Agenten nicht auf simples Tool Calling beschränkt – sie können genauso ausgefeilt sein wie der Hauptagent, inklusive eigener Planung, Dateisystemzugriff und sogar eigener Sub-Agenten.
Je länger Agenten mit Nutzern interagieren und je komplexer ihre Aufgaben werden, desto wichtiger wird das Kontextfenster. Die Zusammenfassungs-Middleware löst diese Herausforderung, indem sie den Kontext automatisch verwaltet, sobald er zu groß wird. Sie überwacht die Gesprächshistorie und fasst ältere Nachrichten bei Annäherung an die Tokenbegrenzung automatisch zusammen, während aktuelle Nachrichten erhalten bleiben.
Die Zusammenfassungs-Middleware ist unverzichtbar für produktive Agenten, die über längere Konversationen hinweg Kontext bewahren müssen. Ohne sie würden Agenten irgendwann die Kontextgrenze erreichen und den Zugriff auf wichtige Informationen aus der Vergangenheit verlieren. Mit Zusammenfassung behalten Agenten den Überblick über frühere Interaktionen und bleiben dennoch innerhalb der Tokenlimits. Die Middleware balanciert intelligent das Bedürfnis nach aktuellem Kontext (meist am relevantesten) mit der Möglichkeit, älteren Kontext zu komprimieren (ohne kritische Informationen zu verlieren).
Dieser Ansatz spiegelt ein Grundprinzip im Agentendesign wider: Kontext ist eine wertvolle Ressource, die sorgsam verwaltet werden muss. Jeder für Kontext verwendete Token steht nicht für Reasoning oder Tool-Ausgaben zur Verfügung. Durch das automatische Zusammenfassen des Kontexts bei Bedarf stellt die Zusammenfassungs-Middleware sicher, dass Agenten auch in langlaufenden Szenarien effizient arbeiten können.
In geschäftskritischen Anwendungen, in denen Agenten sensible Werkzeuge aufrufen (z.B. E-Mails versenden, Eskalationen, Finanztransaktionen), bietet die Human-in-the-Loop-Middleware wesentliche Schutzmechanismen. Sie ermöglicht es Entwicklern, festzulegen, bei welchen Tools die Ausführung unterbrochen wird, sodass Menschen die Aufrufe vor der Ausführung prüfen und genehmigen (oder anpassen) können.
Die Human-in-the-Loop-Middleware nimmt eine Tool-Konfiguration entgegen, mit der festgelegt wird, welche Tools unterbrochen werden und welche Aktionen Menschen bei diesen Toolaufrufen durchführen dürfen. Vor dem Aufruf eines sensiblen Tools (z.B. E-Mail-Versand) kann so eingestellt werden, dass Menschen die Aktion genehmigen, Parameter bearbeiten oder dem Agenten Feedback geben. So entsteht ein kollaborativer Workflow, bei dem der Agent für Reasoning und Planung zuständig ist, Menschen aber die Kontrolle über kritische Aktionen behalten.
Diese Middleware zeigt exemplarisch, wie die Middleware-Architektur es ermöglicht, anspruchsvolle Governance- und Sicherheitsfunktionen hinzuzufügen, ohne die Kernlogik des Agenten ändern zu müssen. Unterschiedliche Anwendungen stellen unterschiedliche Anforderungen an menschliche Kontrolle, und der Middleware-Ansatz erlaubt es, für jeden Anwendungsfall das passende Maß an Human-in-the-Loop zu konfigurieren.
Während LangChain 1.0 bereits mehrere vorgefertigte Middleware-Komponenten bietet, liegt die wahre Stärke der Middleware-Architektur in ihrer Erweiterbarkeit. Entwickler können eigene Middleware entwickeln, indem sie die Agenten-Middleware-Basisklasse erweitern und neue Zustandsschlüssel, Tools sowie Systemprompt-Anpassungen für ihren Anwendungsfall ergänzen.
Die Entwicklung eigener Middleware folgt dem gleichen Muster wie eingebaute Middleware: Das Zustandsschema wird um neue Schlüssel ergänzt, passende Tools werden hinzugefügt und der Systemprompt mit Anleitungen zur Verwendung dieser Tools erweitert. Dank dieses konsistenten Musters lassen sich neue Middleware-Komponenten einfach entwickeln und nahtlos mit bestehenden kombinieren.
Ein Entwickler, der beispielsweise einen Agenten für den Kundenservice baut, könnte eigene Middleware erstellen, die ein Kundendatenbank-Tool zum Abrufen von Kundendaten, ein Ticketmanagement-Tool zur Erstellung und Aktualisierung von Supporttickets sowie ein Wissensdatenbank-Tool zur Bereitstellung relevanter Dokumentation hinzufügt. Diese eigene Middleware erweitert die Fähigkeiten des Agenten spezifisch für den Kundenservice, während weiterhin die Planungs-, Dateisystem- und Sub-Agenten-Funktionalität der eingebauten Middleware genutzt wird.
Dank der Möglichkeit, eigene Middleware zu erstellen, sind Entwickler nie auf eingebaute Funktionen beschränkt. Benötigt ein Agent ein bestimmtes Tool oder ein spezielles Statusmanagement, kann dies als Middleware implementiert und nahtlos in die Agentenarchitektur eingebunden werden.
Während LangChain 1.0 die architektonische Grundlage für ausgefeilte Agenten bietet, geht FlowHunt noch einen Schritt weiter und stellt eine No-Code-Oberfläche für Bau, Deployment und Management von KI-Agenten bereit. Die KI-Agenten-Komponente von FlowHunt setzt auf die Prinzipien der Middleware-basierten Architektur und ermöglicht es Entwicklern, leistungsfähige Agenten ganz ohne Programmierkenntnisse zu erstellen.
Der Ansatz von FlowHunt passt perfekt zur Middleware-Philosophie: Komponierbarkeit, Erweiterbarkeit und Benutzerfreundlichkeit. Entwickler müssen sich nicht mit den technischen Details der Middleware-Implementierung beschäftigen, sondern können in einer visuellen Oberfläche Agentenfähigkeiten durch das Verbinden von Komponenten zusammenstellen. Die Plattform übernimmt die Middleware-Orchestrierung im Hintergrund, sodass sich Entwickler auf die Definition der Agentenaufgaben konzentrieren können, anstatt deren technische Umsetzung.
Agenten in FlowHunt können mit Planungsfähigkeiten, Dateisystemzugriff, Sub-Agenten und individuellen Tools konfiguriert werden – alles in einer intuitiven visuellen Oberfläche. So wird die Agentenentwicklung demokratisiert und auch Entwicklern ohne tiefes LangChain- oder Architekturwissen zugänglich gemacht. Zudem bietet FlowHunt Funktionen wie ausführliche Agentenlogs, Historien-Tracking und Ausgabenüberwachung, um die Agentenleistung transparent zu machen und zu optimieren.
Erleben Sie, wie FlowHunt Ihre KI-Content- und SEO-Workflows automatisiert – von Recherche und Content-Generierung über Veröffentlichung bis zur Analyse – alles an einem Ort.
Die Theorie hinter Middleware-Architekturen ist wertvoll – die eigentliche Stärke zeigt sich jedoch in der praktischen Umsetzung. Einen Deep Agent mit LangChain 1.0 erstellt man über die Funktion create_deep_agent, die eine vorgefertigte Schnittstelle für Agenten mit allen oben beschriebenen Fähigkeiten bereitstellt.
Die Funktion create_deep_agent nimmt mehrere zentrale Parameter entgegen. Entwickler übergeben Werkzeuge, auf die der Agent Zugriff haben soll, individuelle Anweisungen, die das Verhalten und die Ziele des Agenten definieren, sowie Sub-Agenten, an die der Hauptagent Aufgaben delegieren kann. Die Funktion nutzt dann den Agenten-Builder, um durch sequenzielle Anwendung der passenden Middleware den Agenten zu konstruieren.
Der Agenten-Builder ist das Herzstück: Er beginnt mit der Auswahl des Modells (standardmäßig Claude Sonnet 3.5, aber anpassbar auf jedes unterstützte Modell) und wendet dann die Middleware in einer bestimmten Reihenfolge an. Zuerst wird die Planungs-Middleware angewendet, die den Zustand um eine To-Do-Liste erweitert und das Write-To-Dos-Tool hinzufügt. Danach folgt die Dateisystem-Middleware mit Dateisystem-Tools und Status. Drittens kommt die Sub-Agenten-Middleware für Aufgaben-Delegation. Abschließend wird die Zusammenfassungs-Middleware zur Kontextverwaltung hinzugefügt.
Diese Reihenfolge ist entscheidend: Jede Middleware-Schicht baut auf der vorherigen auf, sodass der Systemprompt um die jeweiligen Anleitungen ergänzt wird und das Modell umfassende Hinweise zur Nutzung aller Fähigkeiten erhält. Das Zustandsschema wächst mit jeder Middleware und ermöglicht die parallele Verwaltung verschiedener Statusinformationen. Das Werkzeugset erweitert sich, was dem Modell mehr Optionen zur Zielerreichung verschafft.
Entwickler können diesen Prozess individuell anpassen und auswählen, welche Middleware angewendet wird. Braucht ein Agent keinen Dateisystemzugriff, kann die Middleware dafür weggelassen werden. Sind keine Sub-Agenten nötig, kann auch diese Middleware ausgelassen werden. So werden Agenten exakt mit den benötigten Fähigkeiten konfiguriert – ohne unnötigen Overhead.
Mit steigender Komplexität der Agentenanwendungen müssen häufig mehrere Agenten orchestriert werden, um anspruchsvolle Ziele zu erreichen. Die Middleware-Architektur ermöglicht elegante Lösungen für Multi-Agenten-Orchestrierung über das Sub-Agenten-System.
Ein mächtiges Muster ist die hierarchische Delegation, bei der ein Hauptagent eine komplexe Aufgabe in Teilaufgaben zerlegt und jede davon an einen spezialisierten Sub-Agenten delegiert. Ein Forschungsagent könnte z.B. die Literaturrecherche an einen Sub-Agenten, die Datenanalyse an einen anderen und die Synthese an einen dritten delegieren. Jeder Sub-Agent ist auf seine Aufgabe optimiert, mit individuellen Prompts und Werkzeugen. Der Hauptagent koordiniert den Gesamtworkflow und sorgt für die richtige Reihenfolge und Integration der Ergebnisse.
Ein weiteres Muster ist die parallele Ausführung, bei der mehrere Sub-Agenten gleichzeitig an unterschiedlichen Aspekten eines Problems arbeiten. Während die aktuelle Implementierung Sub-Agenten sequenziell abarbeitet, unterstützt die Architektur auch Muster, bei denen mehrere Sub-Agenten parallel gestartet und deren Ergebnisse aggregiert werden. Das ist besonders nützlich für Aufgaben, die sich in unabhängige Teilaufgaben aufteilen lassen.
Ein drittes Muster ist die iterative Verfeinerung, bei der der Hauptagent Sub-Agenten initiale Lösungen entwickeln lässt, deren Ergebnisse dann zur Optimierung herangezogen und in weiteren Iterationen von Sub-Agenten vertieft werden. Dieses Vorgehen eignet sich für komplexe Problemlösungen, bei denen mehrere Analyse- und Optimierungsrunden zu besseren Ergebnissen führen.
Diese Muster zeigen, wie die Middleware-Architektur ausgefeilte Multi-Agenten-Systeme ermöglicht, ohne dass Entwickler komplexe Orchestrierungslogik von Grund auf bauen müssen. Die Sub-Agenten-Middleware übernimmt die technischen Details von Delegation und Kommunikation, sodass sich Entwickler auf die Workflow-Definition und Agentenfähigkeiten konzentrieren können.
Ein besonders praxisrelevanter Vorteil der Deep-Agents-Architektur ist die Token-Effizienz und die damit verbundene Kostenoptimierung. Durch die Kombination aus Planung, Dateisystemzugriff und Sub-Agenten-Delegation können Deep Agents komplexe Aufgaben mit deutlich weniger Tokens als einfachere Agenten erledigen.
Planung senkt den Tokenverbrauch, weil Agenten Workflows vorher durchdenken und so unnötige Versuche und Irrwege vermeiden. Statt verschiedene Ansätze zu testen und aus Misserfolgen zu lernen, plant der Agent einen effizienten Lösungsweg im Voraus. Dateisystemzugriff reduziert Tokens, indem Kontext ausgelagert und nicht permanent in der Gesprächshistorie gehalten wird. Informationen, die nicht sofort benötigt werden, können in Dateien abgelegt und später wieder geladen werden, wodurch das aktive Kontextfenster schlank bleibt. Sub-Agenten-Delegation spart Tokens, indem sie Kontext isoliert – Sub-Agenten sehen nur für ihre Aufgabe relevante Informationen, was die Anhäufung irrelevanten Kontexts und damit Tokenverbrauch vermeidet.
Die Zusammenfassungs-Middleware optimiert den Tokenverbrauch zusätzlich, indem sie die Konversationshistorie bei Bedarf automatisch komprimiert. Anstatt Zugriff auf ältere Informationen zu verlieren oder Kontextgrenzen zu überschreiten, werden ältere Nachrichten zusammengefasst und wichtige Informationen erhalten, während Tokens für aktuelle Reasoning-Aufgaben frei bleiben.
Gerade für Unternehmen, die Agenten im großen Stil einsetzen, führen diese Effizienzgewinne direkt zu Kosteneinsparungen. Ein Agent, der 30 % weniger Tokens für die gleiche Aufgabe benötigt, verursacht 30 % weniger API-Kosten. Auf Tausende Agentenausführungen summiert sich das erheblich.
Die Middleware-Architektur bietet einen klaren Weg für zukünftige Erweiterungen und Verbesserungen. Neue Fähigkeiten oder Anwendungsfälle können als Middleware implementiert werden, ohne bestehende Agenten zu stören. So bleiben Agentenanwendungen technologisch zukunftssicher und schnelle Iterationen für neue Funktionen möglich.
Wird beispielsweise eine neue Fähigkeit für Echtzeit-Websuche verfügbar, kann diese als Middleware mit Suchwerkzeug und passender Prompt-Anleitung umgesetzt werden. Bestehende Agenten profitieren sofort, indem sie die neue Middleware einfach zu ihrer Konfiguration hinzufügen. Ebenso lassen sich neue Modelle mit anderen Fähigkeiten oder Kostenprofilen integrieren, ohne Änderungen an der Middleware-Architektur selbst.
Diese Erweiterbarkeit eröffnet auch der Community die Möglichkeit, neue Middleware-Komponenten beizusteuern. Entdecken Entwickler nützliche Muster und Funktionen, können sie ihre Middleware-Implementierungen teilen und so ein Ökosystem wiederverwendbarer Agentenerweiterungen schaffen. Dieser kollaborative Ansatz beschleunigt Innovationen und ermöglicht es der Agentenentwickler-Community, gemeinsam immer leistungsfähigere Agenten zu bauen.
Die Neuentwicklung von Deep Agents auf Basis der Middleware-Architektur von LangChain 1.0 markiert einen grundlegenden Fortschritt im Bau von KI-Agenten. Mit der Einführung einer stapelbaren, komponierbaren Abstraktion für Agentenerweiterungen verwandelt LangChain 1.0 die Agentenentwicklung von einem monolithischen Alles-oder-Nichts-Ansatz in ein modulares, flexibles System, in dem Fähigkeiten beliebig kombiniert werden können, um Agenten für jeden Anwendungsfall maßzuschneidern. Die Planungs-Middleware ermöglicht strukturierte Aufgabenzerlegung, die Dateisystem-Middleware sorgt für Kontextmanagement und Persistenz, die Sub-Agenten-Middleware für Delegation und Spezialisierung und die Zusammenfassungs-Middleware für die Bewältigung von Kontextgrenzen. Eigene Middleware erlaubt Entwicklern die Erweiterung um domänenspezifische Fähigkeiten, während Plattformen wie FlowHunt die Agentenentwicklung mit No-Code-Oberflächen demokratisieren. Diese Architektur macht Agenten nicht nur leistungsfähiger und effizienter, sondern auch besser wartbar, testbar und zukunftssicher. Mit der zunehmenden Bedeutung von KI-Agenten im Geschäftsalltag liefert die von LangChain 1.0 eingeführte Middleware-Architektur das Fundament für die nächste Generation intelligenter, autonomer Systeme.
Deep Agents sind ausgeklügelte Tool-Calling-Schleifen, die mit spezifischen eingebauten Fähigkeiten erweitert wurden: Planungswerkzeuge mit To-Do-Listen, Dateisystemzugriff zum Auslagern von Kontext, die Fähigkeit, Sub-Agenten für isolierte Aufgaben zu erstellen, und detaillierte Systemprompts. Im Gegensatz zu einfachen Tool-Calling-Agenten, die Aufgaben nacheinander ausführen, können Deep Agents komplexe Workflows verwalten, den Status über mehrere Operationen hinweg aufrechterhalten und Aufgaben an spezialisierte Sub-Agenten delegieren.
Middleware in LangChain 1.0 ist eine stapelbare Abstraktion, die die zentrale ReAct-Agentenschleife modifiziert. Sie ermöglicht es Entwicklern, das Zustandsschema des Agenten zu erweitern, neue Werkzeuge hinzuzufügen und Systemprompts anzupassen, ohne die gesamte Agentenlogik neu schreiben zu müssen. Middleware ist entscheidend, weil sie zusammensetzbare, wiederverwendbare Agentenerweiterungen ermöglicht, die in beliebiger Reihenfolge kombiniert werden können, um leistungsfähige, spezialisierte Agenten zu erschaffen.
Die Planungs-Middleware erweitert den Agentenzustand um eine To-Do-Liste und stellt ein Write-To-Dos-Tool bereit. So können Agenten komplexe Aufgaben in handhabbare Schritte unterteilen, einen klaren Handlungsplan erstellen und den Fortschritt verfolgen. Die Middleware beinhaltet zudem individuelle Systemprompts, die das Modell anweisen, wie das Planungswerkzeug effektiv eingesetzt wird, sodass der Agent strukturierte Pläne erstellt und ihnen folgt.
Sub-Agenten sind spezialisierte Agenten, die vom Hauptagenten für isolierte, fokussierte Aufgaben erzeugt werden. Es gibt zwei Hauptgründe für die Erstellung von Sub-Agenten: (1) Kontextisolierung – ein Sub-Agent erhält eine eng umrissene Aufgabe und liefert eine klare Antwort ohne Zwischenschritte, was Tokens spart; und (2) die Erstellung domänenspezifischer Agenten mit individuellen Prompts und spezialisierten Werkzeugen, die auf bestimmte Aufgaben zugeschnitten sind.
Die Zusammenfassungs-Middleware überwacht die Gesprächshistorie und komprimiert sie automatisch, wenn die Tokenanzahl die Grenze des Kontextfensters erreicht. Sie fasst ältere Nachrichten zusammen und bewahrt die aktuellen, sodass der Agent den Überblick über frühere Interaktionen behält, ohne die Tokenlimits zu überschreiten. Das ist unerlässlich für lang laufende Agenten, die über längere Konversationen hinweg Kontext behalten müssen.
Ja, absolut. Deep Agents sind auf Erweiterbarkeit ausgelegt. Sie können eigene Middleware entwickeln, indem Sie die Basis-Klasse für Agenten-Middleware erweitern und so neue Zustandsschlüssel, Werkzeuge und Systemprompt-Anpassungen hinzufügen. Dadurch können Sie Agenten spezifisch auf Ihren Anwendungsfall zuschneiden und trotzdem die bestehende Deep-Agenten-Infrastruktur nutzen.
Viktor Zeman ist Miteigentümer von QualityUnit. Auch nach 20 Jahren als Leiter des Unternehmens bleibt er in erster Linie Softwareentwickler, spezialisiert auf KI, programmatisches SEO und Backend-Entwicklung. Er hat zu zahlreichen Projekten beigetragen, darunter LiveAgent, PostAffiliatePro, FlowHunt, UrlsLab und viele andere.
Erstellen Sie erweiterbare, intelligente Agenten mit der intuitiven Plattform von FlowHunt. Automatisieren Sie komplexe Workflows mit Planung, Dateisystemen und Multi-Agenten-Orchestrierung – ganz ohne Programmierkenntnisse.
LangChain ist ein Open-Source-Framework zur Entwicklung von Anwendungen, die von großen Sprachmodellen (LLMs) unterstützt werden. Es vereinfacht die Integration...
Erfahren Sie, wie Sie Human-in-the-Loop-Middleware in Python mit LangChain implementieren, um KI-Agenten mit Freigabe-, Bearbeitungs- und Ablehnungsfunktionen v...
Erfahren Sie, warum führende Ingenieure sich von MCP-Servern abwenden und entdecken Sie drei bewährte Alternativen—CLI-basierte Ansätze, skriptbasierte Tools un...
Cookie-Zustimmung
Wir verwenden Cookies, um Ihr Surferlebnis zu verbessern und unseren Datenverkehr zu analysieren. See our privacy policy.


