Leitfaden zum Erstellen von ADK-Agenten mit leistungsstarken Fähigkeiten

Letzte Aktualisierung: 04/08/2026
  • ADK-Skills nutzen progressive Offenlegung und klare Designmuster, um Domänenwissen nur bei Bedarf zu laden und gleichzeitig die Eingabeaufforderungen schlank zu halten.
  • Multiagentenarchitekturen mit Router-, Sequenz-, Schleifen- und Parallelworkflows ermöglichen es spezialisierten Agenten, bei komplexen Aufgaben zusammenzuarbeiten.
  • Praxisnahe Technologien wie AgentKit 2.0 und die Kompetenzen der Community ermöglichen modulare, sichere und überprüfbare KI-Systeme über den gesamten Softwarelebenszyklus hinweg.
  • Lokale ADK-Web-Setups auf macOS, Linux und Windows erleichtern das Prototyping, Testen und Verfeinern von qualifizierten Agenten anhand realer APIs und Daten.

ADK-Agenten-Kompetenzleitfaden

Intelligente Agenten, die mit einem Agent Development Kit (ADK) erstellt wurden, entwickeln sich schnell zum Rückgrat moderner KI-gestützter Anwendungen.Weit über einfache Chatbots hinaus, die lediglich Fragen beantworten, können diese Agenten dank eines geeigneten Kompetenzsystems logisch denken, planen, Tools aufrufen, mit anderen Agenten zusammenarbeiten und ihre Arbeit sogar in Schleifen optimieren. Gleichzeitig bleiben Token-Verbrauch und Latenz dank progressiver Offenlegungstechniken unter Kontrolle.

In diesem ausführlichen Leitfaden erfahren Sie, wie Sie ADK-Agenten mit den entsprechenden Fähigkeiten entwerfen, strukturieren und orchestrieren.Von einfachen Einzelagenten-Workflows bis hin zu Multiagenten-Workflows, die sequenziell, in Schleifen und parallel ausgeführt werden – Sie erfahren, wie reale Technologien wie Googles ADK Codelabs, Community-Skills und Orchestrierungs-Frameworks wie AgentKit 2.0 Muster wie Router, SequentialAgent, LoopAgent und ParallelAgent nutzen. Außerdem lernen Sie, wie Unternehmen wie Q2BSTUDIO diese mit Cloud-Plattformen und Cybersicherheit kombinieren, um produktionsreife Systeme bereitzustellen.

Warum ADK-Agenten mit entsprechenden Fähigkeiten für moderne Softwareteams wichtig sind

Die rasante Verbreitung von KI in der Softwareentwicklung hat Teams dazu veranlasst, nach Möglichkeiten zu suchen, Fachwissen und Arbeitsabläufe in wiederverwendbare, zusammensetzbare Einheiten zu kapseln.ADKs erfüllen dieses Bedürfnis, indem sie es ermöglichen, Verhalten, Domänenregeln und Tools in Agenten zu verpacken, die projekt-, team- und sogar produktübergreifend wiederverwendet werden können.

Im Mittelpunkt dieses Ansatzes stehen die Fähigkeiten der Agenten.Dabei handelt es sich um in sich abgeschlossene Wissensmodule, die ein Agent bei Bedarf laden kann. Anstatt alle Richtlinien und Regeln in einer einzigen, umfangreichen Eingabeaufforderung anzuzeigen, wenden Fähigkeiten eine progressive Offenlegung Architektur: Anweisungen, Assets und Skripte werden nur bei Bedarf angezeigt, wodurch der Kontext schlank und die Leistung hoch bleibt, selbst wenn Hunderte von Skills installiert sind.

Diese Effizienz ist in einer Welt, in der Token-Budgets, Latenz und Rechenkosten reale Beschränkungen darstellen, von entscheidender Bedeutung.Das Laden aller Styleguides, API-Spezifikationen und Betriebsregeln in eine einzige Eingabeaufforderung ist nicht skalierbar. Mit Skills können Sie „kaltes“ Wissen auf der Festplatte (oder in Repositories) speichern und es nur dann in den Kontext des Agenten einbinden, wenn eine bestimmte Funktion relevant ist.

Unternehmen wie Q2BSTUDIO nutzen dieses Modell, um maßgeschneiderte KI-Systeme für Unternehmen zu entwickeln.Durch die Verknüpfung von Business Intelligence, Domänenwissen und modernen Cybersicherheitspraktiken werden die Agenten nicht nur leistungsfähig und kontextsensibel, sondern auch gegen gängige Angriffsvektoren der heutigen Bedrohungslandschaft geschützt.

Die Architektur der schrittweisen Offenlegung von ADK-Fähigkeiten verstehen

ADK-basierte Skills folgen typischerweise einem dreistufigen Lademodell, das den Agentenkontext fokussiert hält. gleichzeitig wird bei Bedarf eine tiefgreifende Domänenspezialisierung ermöglicht. Man kann es sich als eine stufenweise Wissenspipeline vorstellen:

Stufe 1 – EntdeckungWenn ein Gespräch beginnt, sieht der Agent lediglich einen Katalog der verfügbaren Fähigkeiten: deren Namen und Kurzbeschreibungen. Es werden noch keine komplexen Daten geladen. Dies genügt dem Agenten, um zu entscheiden, welche Fähigkeit für die Anfrage des Nutzers relevant sein könnte.

Stufe 2 – AnweisungenSobald eine Fähigkeit als passend eingestuft wird, liest der Agent ihre SKILL.md oder einer gleichwertigen Anweisungsdatei. Dieses Dokument enthält detaillierte Anleitungen, Muster und Regeln für diese Fertigkeit und wird nur bei Bedarf in den Modellkontext eingebunden.

Stufe 3 – RessourcenUmfangreiche Dateien wie große Schemas, lange Checklisten, Skripte oder ausführliche Dokumente bleiben als Referenzen im Dateisystem erhalten.

und werden bei Bedarf abgerufen Nur wenn die jeweilige Fähigkeit explizit darauf verweist. Der Agent liest oder führt diese Ressourcen nach Bedarf aus, anstatt sie immer in der Hauptaufforderung anzuzeigen.

Dieses Muster ist zentral für Frameworks wie AgentKit 2.0 und auf Antigravity basierende Setups.Sie können Skills direkt in kompatible Agenten (Claude Code, Cursor, Antigravity und andere) installieren, indem Sie Befehle wie die folgenden verwenden: npx add-skill vercel-labs/agent-skills, die die Skill-Repositories klonen, sie in die richtigen Verzeichnisse einfügen und sie ohne manuelles Bearbeiten der Eingabeaufforderungen auffindbar machen.

Entwurfsmuster zur Strukturierung von ADK-Fähigkeiten

Das Erlernen einer neuen Fähigkeit von Grund auf hat oft weniger mit Werkzeugen als vielmehr mit Inhaltsgestaltung zu tun.Die ADK-Spezifikation gibt üblicherweise an, wie das Paket strukturiert sein soll (Frontmatter in YAML, references/, assets/, scripts/ Verzeichnisse usw.), aber es erklärt nicht, wie man die eigentlichen Anweisungen schreibt. Hier kommen wiederverwendbare Entwurfsmuster ins Spiel.

Praktiker, die Dutzende von Fähigkeiten entwickelt haben, berichten, dass eine Handvoll Strukturmuster die meisten Anwendungsfälle in der realen Welt abdecken.Fünf der nützlichsten sind:

WerkzeugverpackungDieses Muster fasst die Konventionen und Best Practices einer bestimmten Bibliothek oder Plattform in einer Fertigkeit zusammen. Die Anweisungen beschreiben die zu befolgenden Regeln, während references/ Sie enthält die offizielle Dokumentation. Normalerweise gibt es keine Vorlagen oder Skripte; es geht darum, dem Anwender ein „mentales Modell“ eines Tools wie FastAPI, React oder Postgres zu vermitteln.

StromerzeugerHier erzeugt die Funktion mithilfe von in gespeicherten Vorlagen eine konsistente, strukturierte Ausgabe. assets/Beispiele hierfür sind API-Dokumentationen, Commit-Nachrichten, technische Berichte oder Änderungsprotokolle. Anweisungen definieren Qualitätsregeln, während Vorlagen die Struktur der Ausgabe festlegen, sodass Sie wiederholbare Formate mit jeweils unterschiedlichem Inhalt erhalten.

KritikerDieses Muster trennt was um zu überprüfen von wie um es zu überprüfen. Eine Checklistendatei in references/ Die Checkliste listet die zu prüfenden Punkte (Sicherheit, Stil, Architektur usw.) auf, während die Anweisungen das Prüfprotokoll definieren: Gruppierung der Ergebnisse nach Schweregrad, Forderung nach Begründung und Vorschläge für Korrekturen. Tauscht man die Checklistendatei aus, erhält man effektiv einen komplett neuen Prüfer, ohne die Kompetenz neu schreiben zu müssen.

Interview (Inversion)Anstatt sofort zu handeln, befragt die Anwendung den Nutzer zunächst in Phasen anhand strukturierter Fragen, wobei Bedingungen wie „Mit dem Bau erst beginnen, wenn alle Phasen abgeschlossen sind“ enthalten sind. Dies verhindert, dass der Agent weitreichende Annahmen trifft, und zwingt ihn, Ziele und Einschränkungen zu klären, bevor er detaillierte Ergebnisse generiert.

PipelineDieses Muster kodiert mehrstufige Arbeitsabläufe mit expliziten Kontrollmechanismen zwischen den Schritten, wie z. B. „Fahre erst mit Schritt 3 fort, wenn der Benutzer dies bestätigt hat“. Es ist komplexer als die anderen, aber das einzige, das zuverlässig verhindert, dass Agenten Validierungsphasen überspringen. Pipeline-Skills können Reviewer-Schritte, Generator-Ausgaben oder Interviewphasen in denselben Ablauf integrieren.

Praxisnahe Kompetenzen von Google, Vercel und Supabase kombinieren häufig zwei oder mehr dieser Muster pro Kompetenzbereich.Eine Governance-Funktion könnte beispielsweise den Benutzer zu Projektbeschränkungen befragen, anschließend einen Prüfprozess mit verschiedenen Checklisten durchführen und mit Hilfe eines vorlagenbasierten Generators einen Governance-Bericht erstellen.

Von Einzelagenten bis hin zu Multiagentensystemen mit ADK

Sobald Sie verstanden haben, wie Fähigkeiten Wissen bündeln, besteht der nächste Schritt darin, zu sehen, wie ADK-Agenten dieses Wissen in Arbeitsabläufen orchestrieren.Die offiziellen ADK-Codelabs von Google sind eine hervorragende Referenz: Sie führen Sie von einem einfachen Einzelagenten über Tools, Speicherverwaltung und die Koordination mehrerer Agenten hinweg – alles in praktischen Colab-Notebooks.

Die Reise beginnt mit Ihrem ersten Agenten, der mit einem Runner erstellt wurde.Im Codelab definieren Sie ein day_trip_agent Dessen Aufgabe es ist, eine Tagesreiseroute zu erstellen, die den Vorlieben und dem Budget des Nutzers entspricht. Drei Komponenten veranschaulichen das allgemeine Interaktionsmodell von ADK:

Der Agent Das „Gehirn“ wird durch seine Anweisungen, das zugrunde liegende Modell (z. B. Gemini) und die von ihm aufgerufenen Werkzeuge definiert. Im Beispiel verfügt der Agent über detaillierte Richtlinien und Zugriff auf die Google-Suche.

Die Sitzung Es dient als Konversationsspeicher und speichert den gesamten Verlauf der Benutzernachrichten und Agentenantworten. Durch die Wiederverwendung desselben Sitzungsobjekts bleibt der Kontext über mehrere Gesprächsrunden hinweg erhalten.

Der Runner koordiniert die Ausführung, indem ein Agent und eine Sitzung verwendet werden, jede Benutzeranfrage verarbeitet und die Antwort zurückgegeben wird.

währenddessen wird die Sitzung aktualisiertNützliche Helfer wie run_agent_query() Kapseln Sie diese Schleife, damit Sie Agenten einfach über Tests oder UI-Integrationen auslösen können.

Das Durchlesen dieses ersten Beispiels zeigt, wie gute Anweisungen direkt auf Benutzereingaben eingehen.Eine Testanfrage könnte beispielsweise nach einem „preisgünstigen“ und „entspannenden“ Tagesausflug fragen, und da die Anweisungen Wert auf Kostenbewusstsein legen, bezieht der Agent Budgetüberlegungen zuverlässig in seine Antworten ein.

Verbinden von benutzerdefinierten Tools mit Ihren ADK-Agenten

Agenten werden erst dann wirklich leistungsstark, wenn sie Ihre eigenen APIs und internen Dienste aufrufen können, anstatt nur generische Tools wie die Websuche zu verwenden.ADKs vereinfachen dies, indem sie normale Funktionen anhand ihrer Signaturen und Dokumentationsstrings in Werkzeuge umwandeln.

In den Codelabs verwendet ein einfaches Beispiel eine Python-Funktion, die eine Echtzeit-Wetter-API aufruft.Eine Funktion wie get_live_weather_forecast(location: str) Ruft aktuelle Daten von einem öffentlichen Wetterdienst ab und gibt strukturierte Informationen, z. B. Temperatur und Bedingungen, in einem Wörterbuch zurück.

Der entscheidende Teil ist der Docstring.Das ADK analysiert die Dokumentationszeichenkette der Funktion, um zu verstehen, was das Tool bewirkt, welche Argumente es akzeptiert und welchen Wert es zurückgibt. Das Sprachmodell liest diese Beschreibung und entscheidet während der Argumentation, wann und wie das Tool aufgerufen wird.

Um das Tool in einen Agenten einzubinden, übergeben Sie es einfach während der Initialisierung als Teil der Tool-Liste.Beispielsweise tools=[get_live_weather_forecast]Die Anweisungen des weather_agent kann dem Modell dann explizit mitteilen, dass es dieses Tool aufrufen soll, bevor Outdoor-Aktivitäten vorgeschlagen werden.

Bei Tests lösen Eingabeaufforderungen wie „Ich möchte in der Nähe des Lake Tahoe wandern gehen, wie ist das Wetter?“ das Tool direkt aus.Denn die Mission und die Anweisungen des Agenten bestehen darauf, die Live-Wettervorhersage zu nutzen, bevor ein Plan empfohlen wird. Dieses Muster lässt sich auf Ihre eigenen APIs übertragen: Bestandsverwaltung, Preisgestaltung, CRM, Analysen oder jedes Backend, das Sie als Funktion einbinden können.

Das Agent-als-Werkzeug-Muster: Aufbau von Spezialistenteams

Anstatt alle Verantwortung einem einzigen, monolithischen Agenten zu übertragen, ermutigt ADK Sie dazu, ein Team aus kleineren Experten zu bilden.Der Schlüssel liegt im Agent-als-Werkzeug-Muster, bei dem ein Agent einen anderen Agenten aufrufen kann, als wäre dieser nur ein weiteres Werkzeug.

Eine typische Demonstration in den Codelabs baut ein mehrschichtiges Reiseplanungssystem auf.:

Spezialisierte Agenten enge Domänen handhaben: a food_critic_agent das schlägt nur Restaurants vor, ein db_agent das Hoteldaten abfragt, und ein concierge_agent Das fungiert als höflicher Assistent für die Interaktion mit Nutzern.

Der Concierge selbst behandelt den Restaurantkritiker als Werkzeug., indem die Restaurantauswahl dem Kritiker überlassen und das Ergebnis anschließend in einer verständlicheren Sprache neu formuliert wird.

An der Spitze steht ein Orchestrator-Agent, wie zum Beispiel trip_data_concierge_agent, deren Aufgabe es ist, die Gesamtanfrage des Benutzers zu verstehen und über spezielle Wrapper-Funktionen zu entscheiden, welcher Spezialist aufgerufen werden soll, wie zum Beispiel call_db_agent , call_concierge_agent.

Wenn Sie eine Suchanfrage wie „Finde mir ein Hotel und ein Restaurant in der Nähe“ ausführenDie Protokolle der Tools zeigen eine Delegationskette: Der Orchestrator ruft den DB-Agenten für Hotels auf, dann den Concierge-Agenten für Restaurantempfehlungen, und dieser wiederum kontaktiert den Restaurantkritiker. Jeder Agent konzentriert sich auf seinen eigenen Bereich, während der Orchestrator die Zusammenstellung übernimmt.

Dieser Ansatz entspricht weitgehend der Strukturierung der 16 spezialisierten Agenten von AgentKit 2.0. Die Funktionen decken Frontend, Backend, Sicherheit, Tests und Infrastruktur ab. Jeder Agent verfügt über domänenspezifische Kenntnisse (React Best Practices, Datenbankeinrichtung, Sicherheitsaudits, Bereitstellungsabläufe und mehr), und ein Orchestrator setzt diese zusammen, um größere Ziele wie „Erstellung und Bereitstellung eines Benutzerauthentifizierungsmoduls“ zu erreichen.

Agenten Speicher geben: Sitzungen und adaptive Planung

Um sich wirklich intelligent zu fühlen, muss ein Agent den Kontext über mehrere Spielzüge hinweg im Gedächtnis behalten.Pläne werden anhand von Feedback angepasst, anstatt jede Nachricht als Neuanfang zu betrachten. Hier kommen Sitzungen und Gedächtnismanagement ins Spiel.

Im ADK-Codelab veranschaulicht ein Agent zur Planung mehrtägiger Reisen den Unterschied zwischen korrektem und fehlerhaftem Speicher.Eine Funktion wie create_multi_day_trip_agent() richtet einen Agenten ein, dessen Anweisungen die schrittweise Planung, das Erinnern von Entscheidungen und das überlegte Reagieren auf Korrekturen betonen.

Eine adaptive Demo verwendet ein einzelnes Sitzungsobjekt über mehrere Runden hinweg wieder.:

Turn 1Der Nutzer wünscht einen zweitägigen Reiseplan, und der Reiseberater schlägt Aktivitäten für den ersten Tag vor.

Turn 2Der Nutzer gibt an, kein Interesse an Schlössern zu haben. Da die Sitzung die vorherige Reiseroute enthält, weiß der Agent, welcher Teil angepasst werden muss, und schlägt für diesen Abschnitt eine Alternative vor, während die übrigen Details unverändert bleiben.

Turn 3Der Benutzer bestätigt die Änderung und fragt nach den nächsten Schritten, sodass der Agent unter Berücksichtigung des gesamten vorherigen Kontextes mit der Planung für Tag 2 fortfährt.

Eine kontrastierende „Fehler“-Demo erzeugt für jeden Durchgang eine neue Sitzung.Der Agent beantwortet die erste Frage korrekt, aber wenn der Benutzer später auf „Tag 2“ Bezug nimmt, hat die neue Sitzung keine Historie und der Agent leidet quasi unter Amnesie und kann die Anfrage nicht mit dem früheren Plan in Verbindung bringen.

Die wichtigste Erkenntnis ist einfach, aber grundlegend: Kontinuierliche Gespräche erfordern kontinuierliche SitzungenFür Produktionssysteme müssen Sie den Sitzungsstatus über API-Aufrufe, Geräte und manchmal sogar Benutzer hinweg speichern und abrufen können, insbesondere wenn sich Arbeitsabläufe über Tage oder Wochen erstrecken.

Der Router-Agent: Weiterleitung von Anfragen an den richtigen Spezialisten

Mit zunehmender Größe Ihres Agenten- und Kompetenzkatalogs benötigen Sie einen Mechanismus, um jede eingehende Anfrage an den richtigen Experten weiterzuleiten.Das ist die Aufgabe eines Router-Agenten, einer kleinen, aber entscheidenden Komponente in Multiagentenarchitekturen.

Die Hauptaufgabe eines Routers besteht in der Klassifizierung und nicht in der direkten Beantwortung von Benutzerfragen.In der Regel weisen die Anweisungen das Programm an, eine Benutzeranfrage zu lesen und nur den Namen des am besten geeigneten Agenten (oder Workflows) für diese Aufgabe auszugeben.

In den Multiagenten-Abschnitten des Codelabs wählt der Router zwischen verschiedenen Domänenagenten aus. Beispiele hierfür sind ein Tagesausflugsplaner, ein Vermittler für kulinarische Genüsse oder ein Transportdienstleister. Die Ausführungsfunktion fragt zunächst den Router nach einer Route und ruft dann mithilfe einfacher bedingter Logik basierend auf der Antwort des Routers den passenden Spezialisten auf.

Dieses Muster entspricht der Beschreibung der Multiagenten-Orchestrierung in AgentKit 2.0.Dort empfängt ein Orchestrator-Agent ein übergeordnetes Ziel, delegiert das Schema-Design an einen Datenbank-Agenten, das Formulargerüst an einen Frontend-Agenten, führt eine Sicherheitsprüfung durch, übergibt dann an einen Deployment-Agenten und aggregiert schließlich Unterschiede und URLs zu einer übersichtlichen Zusammenfassung für den Benutzer.

SequentialAgent: Orchestrierung geordneter, mehrstufiger Arbeitsabläufe

Manche Aufgaben lassen sich naturgemäß in geordnete Phasen unterteilen, wobei das Ergebnis eines Schrittes in den nächsten einfließt.Beispielsweise erfordert die Anfrage „Finde das beste Sushi in Palo Alto und sag mir dann, wie ich dorthin komme“ eindeutig zuerst einen Recherche-Schritt und dann einen Navigations-Schritt.

ADKs bieten einen spezialisierten Workflow-Agenten, der oft als solcher bezeichnet wird. SequentialAgentum diese Ketten sauber zu verwaltenAnstatt die Orchestrierungslogik manuell zu schreiben, definieren Sie eine Liste von Subagenten und gemeinsamen Statusschlüsseln, und das Framework kümmert sich um die Sequenzierung und die Datenübertragung.

Im Codelab-Beispiel wird der Foodie-Agent so umgestaltet, dass er sein Ergebnis unter einem bestimmten Parameter ausgibt. output_key Google Trends, Amazons Bestseller "destination"Die Anweisungen des Transportagenten enthalten dann einen Platzhalter wie beispielsweise {destination} den das ADK automatisch mit dem gespeicherten Wert aus dem gemeinsamen Zustand füllt.

Der übergeordnete Workflow-Agent, sagen wir find_and_navigate_agent, ist konfiguriert als SequentialAgent mit Unteragenten in fester Reihenfolge Google Trends, Amazons Bestseller [foodie_agent, transportation_agent]Bei Aufruf verhält es sich aus Sicht des Anrufers wie ein einzelner Agent, während es intern die beiden Schritte koordiniert und den gemeinsamen Zustand verwaltet.

Dieser Ansatz vereinfacht den Orchestrierungscode drastisch.Bedingte Entscheidungsbäume und ad-hoc-Datenverbindungen verschwinden und werden durch deklarative Definitionen von Subagenten und Schlüsseln ersetzt. Dadurch werden Workflows auch einfacher zu testen und zu erweitern, da jeder Subagent modular bleibt und in anderen Ketten wiederverwendet werden kann.

LoopAgent: Iterative Verfeinerung mit Planer, Kritiker und Verfeinerer

Viele reale Probleme profitieren von iterativen Verbesserungen anstatt von einmaligen Lösungen.Stellen Sie sich vor, Sie entwerfen einen Plan, überprüfen ihn, verfeinern ihn und wiederholen diesen Vorgang, bis ein bestimmter Qualitätsstandard erreicht ist. Schleifenartige Arbeitsabläufe erfüllen dieses Bedürfnis.

ADKs erfassen dieses Muster mit einem LoopAgent, ein Workflow-Agent, der wiederholt eine Sequenz von Subagenten ausführt, bis eine Abbruchbedingung ausgelöst wirdDies ist ideal für „perfektionistische“ Agenten, die ihre eigenen Ergebnisse anhand formaler Kriterien selbst überprüfen und korrigieren müssen.

Ein klassischer Schleifenaufbau umfasst drei Rollen: ein Planungsagent, der einen ersten Plan erstellt, ein Kritikeragent, der den Plan anhand von Einschränkungen bewertet, und ein Verfeinerungsagent, der den Plan auf der Grundlage des Feedbacks des Kritikers bearbeitet oder neu schreibt.

Die Schleifendefinition verknüpft diese Rollen zu einem Zyklus mit einer maximalen Anzahl von Iterationen. um beispielsweise Endlosschleifen zu vermeiden. max_iterations=3Bei jedem Durchlauf entscheidet der Kritiker, ob der Plan akzeptabel ist; falls nicht, erstellt der Verfeinerer eine überarbeitete Version, und der Kreislauf beginnt von Neuem.

Das Verlassen der Schleife erfordert üblicherweise ein Spezialwerkzeug., sowie exit_loopDer Veredler ruft diese Funktion auf, sobald die Bewertung des Kritikers positiv ausfällt. Zu diesem Zeitpunkt wird der endgültige, validierte Plan an den Benutzer zurückgegeben oder an nachgelagerte Agenten weitergeleitet.

Dieses Muster ist besonders nützlich in Bereichen wie Architekturdesign, Sicherheitsüberprüfung oder Inhaltserstellung., wo einmalige Antworten selten ausreichen und eingebaute Kritikzyklen die durchschnittliche Qualität erheblich steigern können.

ParallelAgent: Beschleunigung der Arbeit durch gleichzeitige Subagenten

Wenn verschiedene Teile einer Benutzeranfrage unabhängig voneinander sind, ist deren sequentielle Ausführung Zeitverschwendung.Beispielsweise erfordert die Suchanfrage „Finde ein Museum, ein Konzert und ein tolles Restaurant für heute Abend“ nicht, dass jede Suche auf die andere wartet.

Parallele Arbeitsabläufe lösen dieses Problem, indem mehrere Spezialisten gleichzeitig eingesetzt werden.In ADKs, ein ParallelAgent führt eine Liste von Unteragenten gleichzeitig aus und führt anschließend deren Ergebnisse über einen gemeinsamen Zustand und einen abschließenden Syntheseschritt zusammen.

Eine typische Konfiguration definiert drei domänenspezifische Agenten Google Trends, Amazons Bestseller museum_finder, concert_finder , restaurant_finder, jeder mit seinem eigenen output_key Im gemeinsamen Zustand führt der Parallelagent alle drei Operationen parallel aus, sodass die Gesamtzeit eher der langsamsten Einzelagentin als der Summe aller drei entspricht.

Nachdem diese Agenten ihre Arbeit abgeschlossen haben, liest ein Syntheseagent Platzhalter wie zum Beispiel {museum_result}, {concert_result} , {restaurant_result} aus dem gemeinsamen ZustandAnschließend erarbeitet er eine kohärente, benutzerfreundliche Antwort, die alle drei Informationsebenen miteinander verbindet.

Dieses Muster spiegelt die Vorteile der „parallelen Ausführung“ wider, die in den Orchestrierungsabläufen von AgentKit 2.0 beschrieben werden.Unabhängige Subagenten erledigen ihre Aufgaben gleichzeitig, wobei sie durch ihre jeweiligen Fähigkeiten voneinander isoliert sind, sodass sie sich nicht gegenseitig beeinträchtigen, während der Orchestrator die allgemeine Fehlertoleranz und Überprüfbarkeit aufrechterhält.

AgentKit 2.0, Community-Skills und modulare Agentenorchestrierung

AgentKit 2.0 zeigt, wie ein ausgereiftes Ökosystem von ADK-Skills und -Agenten in der Praxis aussieht.Es wird mit 16 spezialisierten Agenten ausgeliefert, die Frontend, Backend, Sicherheit, Tests und Infrastruktur abdecken und jeweils mit Domänenkenntnissen ausgestattet sind, sodass sie komplexe Teilaufgaben autonom ausführen können.

Mehr als 40 fachspezifische Kompetenzen sind standardmäßig enthalten.Dies umfasst wiederkehrende Bereiche wie Authentifizierungsabläufe, Datenbankkonfiguration, Echtzeitbereitstellungen und Leistungsüberwachung. Genau diese Aspekte moderner Technologie-Stacks erfordern in der Regel den größten Entwicklungsaufwand.

Hinzu kommt, dass die breitere Gemeinschaft mehr als 1,000 gepflegte Fertigkeiten beisteuert.Zusammen mit Frameworks wie Agent MD ermöglichen diese Fähigkeiten den Agenten, detaillierte Betriebsregeln zu interpretieren und sie konsistent auf große, komplexe Codebasen und mehrschichtige Bereitstellungen anzuwenden.

Die Kernphilosophie ist modulare, agentengesteuerte Entwicklung.Anstatt eines einzigen Mega-Agenten, der alles erledigen soll, stellt man ein Team aus spezialisierten Experten zusammen und koordiniert deren Arbeit. Jeder Agent lädt nur die für seinen Bereich benötigten Fähigkeiten hoch, entsprechend dem progressiven Offenlegungsmodell, das auch auf der Kompetenzebene angewendet wird.

Typische Orchestrierungsabläufe folgen einem klaren MusterEin Orchestrator-Agent empfängt ein übergeordnetes Ziel, übergibt das Datenbankdesign an einen DB-Agenten (mit Schema-Kenntnissen), sendet das UI-Gerüst an einen Frontend-Agenten (mit React-Best-Practices-Kenntnissen), führt einen Sicherheitsagenten für Audits aus und fordert schließlich einen Deployment-Agenten auf, die Änderungen auf die Infrastruktur, beispielsweise InForge, zu übertragen. Während des gesamten Prozesses erfasst der Orchestrator die Ergebnisse, wiederholt fehlgeschlagene Schritte bei Bedarf und protokolliert die Interaktionen zu Auditzwecken.

Diese Architektur verbessert nicht nur Leistung und Zuverlässigkeit, sondern skaliert auch mit dem Wachstum der Community-Kompetenzen auf Tausende.Sie benötigen keinen einzelnen „Besserwisser“-Agenten mehr; stattdessen verlassen Sie sich auf ein gut aufgestelltes Team, in dem jedes Mitglied seine jeweiligen Fähigkeiten auf dem neuesten Stand hält.

Praxisbeispiele: Lokales Ausführen von ADK-Webagenten unter macOS, Linux und Windows

All diese Konzepte werden viel deutlicher, wenn man einen echten, ADK-basierten Agenten auf dem eigenen Rechner startet.Die in den Beispiel-Repositories bereitgestellte ADK-Webkonfiguration ermöglicht es Ihnen, einen Tagesausflugsplanungsagenten lokal mit einer einfachen Weboberfläche auszuführen.

Bevor Sie beginnen, benötigen Sie einige Voraussetzungen.Sie benötigen Python 3.8 oder höher (3.9+ wird empfohlen), einen Google AI Studio API-Schlüssel und eine Internetverbindung. Für neuere Python-Versionen können Sie Folgendes installieren: google-adk==1.5.0Benutzer von Python 3.8 sollten hingegen eine kompatible Version wie … verwenden. google-adk==0.3.0.

Der grundlegende Ablauf für macOS und Linux beginnt mit dem Klonen des Repositorys und dem Einrichten einer virtuellen Umgebung.Nach dem Laufen git clone , cd Im Projekt können Sie entweder ein automatisches Skript ausführen, wie zum Beispiel ./setup_venv.sh (nach Erteilung der Ausführungsberechtigungen) oder manuell eine virtuelle Umgebung erstellen und aktivieren mit python3 -m venv .adk_env , source .adk_env/bin/activate, Gefolgt von pip install -r requirements.txt.

Ein wichtiger Schritt ist das Festlegen von Umgebungsvariablen über einen .env Datei in das agent/ VerzeichnisSie erstellen diese Datei, öffnen sie in einem Editor und fügen Zeilen wie die folgenden hinzu: GOOGLE_GENAI_USE_VERTEXAI=FALSE , GOOGLE_API_KEY=your_actual_api_key_hereErsetzen Sie dabei den Platzhalter durch Ihren tatsächlichen API-Schlüssel. Wenn Sie diesen Schritt überspringen, kann der Agent die zugrunde liegenden Modelle nicht aufrufen.

Sobald die Umgebung aktiv ist, führen Sie einfach Folgendes aus: adk web um die lokale Weboberfläche zu startenDas Terminal zeigt eine URL an, üblicherweise http://localhost:8000Dort können Sie Ihren Browser öffnen und die Option auswählen. agent Wählen Sie eine Option aus einem Dropdown-Menü und beginnen Sie einen Chat mit dem Tagesausflugsplaner. Nach Beendigung des Chats deaktivieren Sie die virtuelle Umgebung mit der entsprechenden Schaltfläche. deactivate Befehl.

Windows-Benutzer folgen einem sehr ähnlichen Muster und verwenden dazu die Eingabeaufforderung oder PowerShell.Nach dem Klonen des Repositorys und dem Wechsel in das entsprechende Verzeichnis können Sie ein praktisches Skript wie folgt ausführen: setup_venv.bat oder erstellen Sie manuell eine virtuelle Umgebung mit python -m venv .adk_env und aktivieren Sie es über .adk_env\Scripts\activate in der Eingabeaufforderung oder .adk_env\Scripts\Activate.ps1 in PowerShell.

Das .env Die Datei unter Windows befindet sich im selben Verzeichnis. agent\ Verzeichnisbeispielsweise erstellt mit type nul > agent\.env und mit Notepad bearbeitet. Anschließend fügen Sie dieselben Schlüssel-Wert-Paare hinzu, um den Zugriff auf Google AI zu konfigurieren. Falls in PowerShell Probleme mit der Ausführungsrichtlinie auftreten, verwenden Sie einen Befehl wie Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser löst sie für lokale Skripte auf.

Nach der Installation der Abhängigkeiten und der Konfiguration der Umgebungsvariablen führen Sie Folgendes aus: adk web bietet Ihnen die gleiche browserbasierte Agenten-Benutzererfahrung unter Windows wie unter macOS oder Linux, mit der Möglichkeit, die Umgebung jederzeit zu deaktivieren deactivate.

Zusammenfassend bieten ADK-Agenten mit Skills, progressiver Offenlegung und Multi-Agenten-Orchestrierung eine leistungsstarke Möglichkeit, skalierbare, sichere und hochspezialisierte KI-Systeme zu entwickeln. die sich an realen Software-Workflows orientieren. Durch die Strukturierung von Fähigkeiten mit soliden Designmustern, die Anbindung von Agenten an eigene Tools und APIs, die Nutzung von Router-, Sequential-, Loop- und Parallel-Agenten und die Ausführung von Setups lokal oder in der Cloud können Teams von einfachen Chatbots zu robusten KI-Kollaborateuren übergehen, die Entwickler, Analysten und Operatoren im täglichen Arbeitsablauf unterstützen.

Zusammenhängende Posts: