§ ARTICLE / · 12 Min. Lesezeit
KI-Agenten entwickeln im Jahr 2026: eine praxisnahe Schritt-für-Schritt-Anleitung
Um einen KI-Agenten zu bauen, begrenzen Sie eine einzelne Aufgabe, verbinden ein LLM mit einer überschaubaren Menge an Tools, die es aufrufen darf, betreiben es in einer Reason–Act-Schleife und umhüllen diese Schleife mit Guardrails, damit es nichts tun kann, was Sie nicht ausdrücklich erlaubt haben. Das Modell ist der einfache Teil. Was ein Wochenend-Demo von einem Produktionsagenten unterscheidet, ist alles rund um die Schleife: Tool-Design, Policy-Enforcement, Kostenkontrolle, adversarisches Testen und ein Audit-Trail. Diese Anleitung führt Sie durch alle sieben Schritte — inklusive funktionsfähigem Code.
TL;DR
Bauen Sie einen KI-Agenten in sieben Schritten: Begrenzen Sie den Aufgabenbereich, wählen Sie ein Framework (oder keines), geben Sie ihm 2–4 eng gefasste Tools, fügen Sie Guardrails im Request-Pfad hinzu, verdrahten Sie Governance und Audit-Trails vor dem Launch, testen Sie ihn adversarisch und deployen Sie ihn mit Monitoring und einem Kill-Switch. Teams, die die Schritte 4–6 überspringen, schreiben später Incident-Reports.
Was ein KI-Agent wirklich ist
Ein KI-Agent ist ein LLM-gesteuertes Programm, das ein Ziel verfolgt, indem es in einer Schleife denkt: Kontext lesen → Aktion festlegen → Tool aufrufen → Ergebnis beobachten → wiederholen, bis die Aufgabe erledigt ist. Drei Komponenten definieren jeden Agenten:
- Ein Modell, das die Überlegungen anstellt (GPT, Claude, Gemini oder ein Open-Weight-Modell)
- Tools — Funktionen, APIs und Datenquellen, die der Agent aufrufen darf
- Anweisungen und Einschränkungen — der System-Prompt plus die Laufzeit-Policies, die den Handlungsspielraum begrenzen
Der Unterschied zu einem Chatbot ist entscheidend: Ein Chatbot produziert Text; ein Agent handelt in externen Systemen — er sendet E-Mails, schreibt in Datenbanken, löst Rückerstattungen aus. Genau deshalb sind die nachfolgenden Sicherheits- und Governance-Schritte keine optionalen Extras.
Schritt 1: Eine Aufgabe eingrenzen (kein Alleskönner-Assistent)
Jede Anleitung — von OpenAIs praktischem Leitfaden bis zum Agent-Curriculum von Microsoft — kommt zum gleichen Schluss: Beginnen Sie mit einer einzigen, repetitiven, klar abgegrenzten Aufgabe mit eindeutigen Erfolgskriterien. Gute erste Agenten:
- Eingehende Support-Tickets priorisieren und Entwürfe für die menschliche Prüfung erstellen
- Fragen über einen festen Dokumentenbestand beantworten (RAG mit Quellenangaben)
- Nächtliche Datenqualitätsprüfungen durchführen und einen Bericht einreichen
Schlechter erster Agent: "Ein Assistent, der alles erledigt, was unsere Kunden fragen." Ein breiter Scope multipliziert die Tool-Fläche, die Fehlerszenarien und die Angriffsfläche gleichzeitig.
Schritt 2: Ein Framework wählen — oder keines
Die ehrliche Entscheidungsmatrix:
- Kein Framework. Eine Schleife rund um die Modell-API mit Function Calling. Die beste Methode, um zu verstehen, was Agenten tatsächlich tun; für Single-Tool-Agenten vollkommen ausreichend.
- OpenAI Agents SDK. Schlank und vollständig ausgestattet: Agenten, Handoffs, Sessions, Tracing-Hooks. Der schnellste seriöse Einstieg in Python.
- LangChain / LangGraph. Das größte Ökosystem. LangGraphs explizite Zustandsgraphen zahlen sich aus, wenn Ihr Agent Verzweigungen, Wiederholungsversuche und Human-in-the-Loop-Pausen benötigt.
- CrewAI / AutoGen. Rollenbasierte Multi-Agenten-Teams. Greifen Sie darauf erst zurück, wenn ein einzelner Agent funktioniert — Multi-Agenten-Systeme vervielfachen jeden Fehlerfall.
- n8n oder andere No-Code-Plattformen. Legitim für workflow-artige Agenten; Sie tauschen Flexibilität gegen Geschwindigkeit.
Ein minimaler Agent ohne Framework — das ist buchstäblich alles, was ein Agent ist:
# A minimal tool-calling agent loop (Python, OpenAI API)
import json
from openai import OpenAI
client = OpenAI()
def search_orders(customer_email: str) -> str:
... # your real lookup
return json.dumps({"orders": [{"id": "A-1042", "status": "shipped"}]})
TOOLS = [{
"type": "function",
"function": {
"name": "search_orders",
"description": "Look up a customer's orders by email.",
"parameters": {
"type": "object",
"properties": {"customer_email": {"type": "string"}},
"required": ["customer_email"],
},
},
}]
messages = [
{"role": "system", "content": "You are a support agent. Use tools; never guess order data."},
{"role": "user", "content": "Where is my order? I'm jane@example.com"},
]
while True:
resp = client.chat.completions.create(model="gpt-4o-mini", messages=messages, tools=TOOLS)
msg = resp.choices[0].message
if not msg.tool_calls:
print(msg.content) # final answer
break
messages.append(msg)
for call in msg.tool_calls:
result = search_orders(**json.loads(call.function.arguments))
messages.append({"role": "tool", "tool_call_id": call.id, "content": result})Schritt 3: Die Tools gestalten — hier liegt die eigentliche Fähigkeit
Das Modell entscheidet, was zu tun ist; Tools definieren, was es tun kann. Regeln, die sich in der Produktion bewähren:
- 2–4 Tools zum Start. Jedes zusätzliche Tool verwässert die Tool-Auswahlgenauigkeit und vergrößert den Schadensradius.
- Enge, typisierte Signaturen.
refund_order(order_id, amount_cents)mit einem serverseitigen Maximum schlägtrun_sql(query)jedes Mal. - Lesende von schreibenden Zugriffen trennen. Lesend-Tools können großzügig sein; jedes schreibfähige Tool braucht einen Eigentümer, ein Limit und oft ein Freigabe-Gate.
- Fehler zurückgeben, mit denen das Modell umgehen kann. "Bestellung nicht gefunden — bitten Sie den Kunden, die Bestellnummer zu bestätigen" erlaubt eine Wiederherstellung; ein bloßer Stack-Trace führt zu einer Endlosschleife.
- Drittanbieter-Tools als Supply Chain behandeln. Wenn Sie MCP-Server nutzen, pinnen Sie Tool-Deskriptoren und blockieren Sie bei Abweichungen — Tool-Description-Poisoning ist eine reale, aktiv ausgenutzte Angriffskategorie.
Schritt 4: Guardrails im Request-Pfad hinzufügen
Sobald Ihr Agent Eingaben liest, die Sie nicht kontrollieren (Kundennachrichten, Webseiten, abgerufene Dokumente), ist er Prompt-Injection ausgesetzt: Anweisungen, die in Daten eingebettet sind und versuchen, den Agenten umzuleiten. Guardrails, die wirklich wichtig sind:
- Eingaben scannen auf Injection-Muster, bevor das Modell den Text sieht
- Ausgaben scannen auf PII, Geheimnisse und Policy-Verstöße, bevor die Antwort Ihr System verlässt
- Tool-Call-Prüfungen — Allowlist, Argument-Validierung, Rate- und Kostenlimits — evaluiert vor der Ausführung des Tools
Der architektonische Fehler, den die meisten Teams begehen: Guardrails müssen synchron im Request-Pfad laufen. Ein Dashboard, das einen Verstoß fünf Minuten nach der ausgeführten Rückerstattung meldet, ist Observability — kein Enforcement.
Schritt 5: Governance vor dem Launch einrichten, nicht nach dem Vorfall
Guardrails schützen einen einzelnen Aufruf. Governance verwaltet den Agenten als betriebliche Einheit: Wer ist verantwortlich, welche Autonomie hat er, was gibt er aus, und welche Nachweise existieren für jede Aktion. Konkret brauchen Sie vor dem Produktionseinsatz:
- Ein deklariertes Autonomie-Level — beobachten, beraten, mit-Freigabe-handeln oder autonom — mit dem dazugehörigen Control-Bundle, das durchgesetzt wird
- Eine Tool-Allowlist im Block-Modus, sodass ein nicht deklarierter Tool-Aufruf geschlossen fehlschlägt
- Budget-Caps pro Agent und Tag/Monat mit automatischer Abschaltung — nicht nur Warnmeldungen
- Menschliche Freigabe für irreversible Aktionen (Zahlungen, Löschungen, externe E-Mails)
- Ein manipulationssicherer Audit-Trail jeder Aktion — für viele Deployments vorgeschrieben unter SOC 2 und dem EU AI Act, und bei jeder nachträglichen Untersuchung unverzichtbar
Diese Schicht stellt Execlave bereit. Die Integration ab Schritt 2 ist ein einziger SDK-Aufruf — ein Callback-Handler für LangChain, ein Trace-Processor für den OpenAI Agents SDK:
# LangChain
from execlave import Execlave
from execlave.integrations.langchain import ExeclaveCallbackHandler
exe = Execlave(api_key=os.environ["EXECLAVE_API_KEY"])
handler = ExeclaveCallbackHandler(exe, agent_id="support-bot")
chain.invoke(input, config={"callbacks": [handler]})
# OpenAI Agents SDK
from execlave.integrations.openai_agents import ExeclaveTracingProcessor
add_trace_processor(ExeclaveTracingProcessor(exe, agent_id="support-bot"))Die Policy-Auswertung fügt im Prozess Mikrosekunden hinzu und serverseitig wenige einstellige Millisekunden (veröffentlichte, reproduzierbare Benchmarks) — gering genug, um im Request-Pfad eines kundenseitigen Agenten zu sitzen. Die vollständige zehnminütige Anleitung finden Sie unter LangChain-Agenten in 10 Minuten gouvernieren.
Schritt 6: Adversarisch testen, bevor Autonomie gewährt wird
Funktionale Tests beweisen, dass der Agent funktioniert. Adversarische Tests beweisen, dass er sicher versagt:
- Varianten von "Ignoriere vorherige Anweisungen" in jeden Eingabekanal injizieren — einschließlich abgerufener Dokumente und Tool-Outputs, nicht nur Chat
- Den Agenten bitten, Tools zu verwenden, die er nicht haben sollte, und sicherstellen, dass die Allowlist bei der Ausführung blockiert
- Tool-Fehler und Timeouts erzwingen; auf Wiederholungsschleifen achten, die das Budget aufbrauchen
- Die Hochstufung auf autonomen Betrieb an einen Mindest-Resilienz-Score knüpfen — Execlave's Red-Team-Gate automatisiert genau das
Schritt 7: Mit Monitoring und Kill-Switch deployen
Produktionsanforderungen vom ersten Tag an:
- Execution Traces — jeder LLM-Aufruf, jede Tool-Invokation, Latenz und Kosten, abfragbar, wenn etwas schiefläuft
- Kostenzuordnung pro Agent, Team und Umgebung
- Alerting bei Verstoß-Häufungen, Fehler-Spitzen und Budget-Burn-Rate — geleitet an den Ort, den Ihr Team bereits beobachtet (Splunk / Sentinel)
- Ein Remote-Kill-Switch — wenn ein Agent sich falsch verhält, pausieren Sie ihn in Sekunden, ohne ein Redeployment
Wie das fertige System aussieht — zwei gouvernierte Agenten, das Policy-Set, Autonomie-Tiers, gemessene Enforcement-Latenz und SIEM-Routing — finden Sie im Referenz-Deployment.
Häufige Fragen
Brauche ich ein Framework, um einen KI-Agenten zu bauen?
Nein. Ein minimaler Agent ist eine Schleife um eine LLM-API mit Function Calling — unter 100 Zeilen. Frameworks verdienen ihren Platz, wenn Sie Orchestrierung, Memory, Retrieval oder Multi-Agenten-Koordination benötigen.
Wie verhindere ich, dass mein Agent etwas Gefährliches tut?
Drei Schichten: enge Tools (er kann nicht aufrufen, was er nicht hat), synchrones Policy-Enforcement (Allowlists, Caps, Scanning vor der Ausführung) und menschliche Freigabe für irreversible Aktionen.
Was kostet es, einen Agenten zu betreiben?
Token-Ausgaben dominieren und skalieren mit der Schleifenlänge — eine Wiederholungsschleife kann in Minuten hunderte von Euro verbrennen. Harte Budget-Caps mit automatischer Abschaltung sind die einzige zuverlässige Kontrolle.
Wann ist mein Agent produktionsreif?
Wenn er adversarische Tests besteht, ein deklariertes Autonomie-Level mit durchgesetzten Controls hat, einen vollständigen Audit-Trail ausgibt, Budget-Caps einhält und remote pausiert werden kann. Alles darunter ist ein Demo.
Ersten Agenten kostenlos verwalten
Im kostenlosen Tarif enthalten: 1 Agent, 500 Traces/Monat und 30 Tage Aufbewahrung. Keine Kreditkarte erforderlich.
Get started free