An AI agent is an LLM-powered program that pursues a goal by reasoning in a loop: it reads context, decides on an action, calls a tool (an API, database, or function), observes the result, and repeats until the task is done. Unlike a chatbot, an agent takes actions in external systems, which is why guardrails and governance matter.

Do I need a framework to build an AI agent?

No. A minimal agent is a loop around an LLM API with function calling — under 100 lines of code. Frameworks like LangChain, OpenAI Agents SDK, and CrewAI earn their place when you need multi-step orchestration, memory, retrieval, or multi-agent coordination.

How do I stop my AI agent from doing something dangerous?

Three layers: narrow tools (the agent physically cannot call what it is not given), runtime policy enforcement (a tool allowlist, cost caps, PII and injection scanning evaluated before each action executes), and human approval gates for high-risk actions. Enforcement must run synchronously in the request path — alerts after the fact do not prevent anything.

How much does it cost to run an AI agent?

Cost is dominated by LLM tokens and scales with loop length: a runaway agent that retries in a loop can spend hundreds of dollars in minutes. Set per-agent budget caps with automatic cut-off, attribute spend per agent and team, and alert on burn rate before the budget is hit.

When is an AI agent ready for production?

When it passes adversarial testing (prompt injection, tool misuse probes), has a declared autonomy level with the matching control bundle enforced, emits a complete audit trail for every action, stays inside budget caps, and can be paused remotely. If any of those is missing, it is a demo, not a production system.

§ ARTICLE / 11. Juni 2026 · 12 Min. Lesezeit

KI-Agenten entwickeln im Jahr 2026: eine praxisnahe Schritt-für-Schritt-Anleitung

TutorialKI-AgentenAnleitung

Founder, Execlave

Um einen KI-Agenten zu bauen, begrenzen Sie eine einzelne Aufgabe, verbinden ein LLM mit einer überschaubaren Menge an Tools, die es aufrufen darf, betreiben es in einer Reason–Act-Schleife und umhüllen diese Schleife mit Guardrails, damit es nichts tun kann, was Sie nicht ausdrücklich erlaubt haben. Das Modell ist der einfache Teil. Was ein Wochenend-Demo von einem Produktionsagenten unterscheidet, ist alles rund um die Schleife: Tool-Design, Policy-Enforcement, Kostenkontrolle, adversarisches Testen und ein Audit-Trail. Diese Anleitung führt Sie durch alle sieben Schritte — inklusive funktionsfähigem Code.

TL;DR

Bauen Sie einen KI-Agenten in sieben Schritten: Begrenzen Sie den Aufgabenbereich, wählen Sie ein Framework (oder keines), geben Sie ihm 2–4 eng gefasste Tools, fügen Sie Guardrails im Request-Pfad hinzu, verdrahten Sie Governance und Audit-Trails vor dem Launch, testen Sie ihn adversarisch und deployen Sie ihn mit Monitoring und einem Kill-Switch. Teams, die die Schritte 4–6 überspringen, schreiben später Incident-Reports.

Was ein KI-Agent wirklich ist

Ein KI-Agent ist ein LLM-gesteuertes Programm, das ein Ziel verfolgt, indem es in einer Schleife denkt: Kontext lesen → Aktion festlegen → Tool aufrufen → Ergebnis beobachten → wiederholen, bis die Aufgabe erledigt ist. Drei Komponenten definieren jeden Agenten:

Ein Modell, das die Überlegungen anstellt (GPT, Claude, Gemini oder ein Open-Weight-Modell)
Tools — Funktionen, APIs und Datenquellen, die der Agent aufrufen darf
Anweisungen und Einschränkungen — der System-Prompt plus die Laufzeit-Policies, die den Handlungsspielraum begrenzen

Der Unterschied zu einem Chatbot ist entscheidend: Ein Chatbot produziert Text; ein Agent handelt in externen Systemen — er sendet E-Mails, schreibt in Datenbanken, löst Rückerstattungen aus. Genau deshalb sind die nachfolgenden Sicherheits- und Governance-Schritte keine optionalen Extras.

Schritt 1: Eine Aufgabe eingrenzen (kein Alleskönner-Assistent)

Jede Anleitung — von OpenAIs praktischem Leitfaden bis zum Agent-Curriculum von Microsoft — kommt zum gleichen Schluss: Beginnen Sie mit einer einzigen, repetitiven, klar abgegrenzten Aufgabe mit eindeutigen Erfolgskriterien. Gute erste Agenten:

Eingehende Support-Tickets priorisieren und Entwürfe für die menschliche Prüfung erstellen
Fragen über einen festen Dokumentenbestand beantworten (RAG mit Quellenangaben)
Nächtliche Datenqualitätsprüfungen durchführen und einen Bericht einreichen

Schlechter erster Agent: "Ein Assistent, der alles erledigt, was unsere Kunden fragen." Ein breiter Scope multipliziert die Tool-Fläche, die Fehlerszenarien und die Angriffsfläche gleichzeitig.

Schritt 2: Ein Framework wählen — oder keines

Die ehrliche Entscheidungsmatrix:

Kein Framework. Eine Schleife rund um die Modell-API mit Function Calling. Die beste Methode, um zu verstehen, was Agenten tatsächlich tun; für Single-Tool-Agenten vollkommen ausreichend.
OpenAI Agents SDK. Schlank und vollständig ausgestattet: Agenten, Handoffs, Sessions, Tracing-Hooks. Der schnellste seriöse Einstieg in Python.
LangChain / LangGraph. Das größte Ökosystem. LangGraphs explizite Zustandsgraphen zahlen sich aus, wenn Ihr Agent Verzweigungen, Wiederholungsversuche und Human-in-the-Loop-Pausen benötigt.
CrewAI / AutoGen. Rollenbasierte Multi-Agenten-Teams. Greifen Sie darauf erst zurück, wenn ein einzelner Agent funktioniert — Multi-Agenten-Systeme vervielfachen jeden Fehlerfall.
n8n oder andere No-Code-Plattformen. Legitim für workflow-artige Agenten; Sie tauschen Flexibilität gegen Geschwindigkeit.

Ein minimaler Agent ohne Framework — das ist buchstäblich alles, was ein Agent ist:

# A minimal tool-calling agent loop (Python, OpenAI API)
import json
from openai import OpenAI

client = OpenAI()

def search_orders(customer_email: str) -> str:
    ...  # your real lookup
    return json.dumps({"orders": [{"id": "A-1042", "status": "shipped"}]})

TOOLS = [{
    "type": "function",
    "function": {
        "name": "search_orders",
        "description": "Look up a customer's orders by email.",
        "parameters": {
            "type": "object",
            "properties": {"customer_email": {"type": "string"}},
            "required": ["customer_email"],
        },
    },
}]

messages = [
    {"role": "system", "content": "You are a support agent. Use tools; never guess order data."},
    {"role": "user", "content": "Where is my order? I'm jane@example.com"},
]

while True:
    resp = client.chat.completions.create(model="gpt-4o-mini", messages=messages, tools=TOOLS)
    msg = resp.choices[0].message
    if not msg.tool_calls:
        print(msg.content)  # final answer
        break
    messages.append(msg)
    for call in msg.tool_calls:
        result = search_orders(**json.loads(call.function.arguments))
        messages.append({"role": "tool", "tool_call_id": call.id, "content": result})

Schritt 3: Die Tools gestalten — hier liegt die eigentliche Fähigkeit

Das Modell entscheidet, was zu tun ist; Tools definieren, was es tun kann. Regeln, die sich in der Produktion bewähren:

2–4 Tools zum Start. Jedes zusätzliche Tool verwässert die Tool-Auswahlgenauigkeit und vergrößert den Schadensradius.
Enge, typisierte Signaturen. refund_order(order_id, amount_cents) mit einem serverseitigen Maximum schlägt run_sql(query) jedes Mal.
Lesende von schreibenden Zugriffen trennen. Lesend-Tools können großzügig sein; jedes schreibfähige Tool braucht einen Eigentümer, ein Limit und oft ein Freigabe-Gate.
Fehler zurückgeben, mit denen das Modell umgehen kann. "Bestellung nicht gefunden — bitten Sie den Kunden, die Bestellnummer zu bestätigen" erlaubt eine Wiederherstellung; ein bloßer Stack-Trace führt zu einer Endlosschleife.
Drittanbieter-Tools als Supply Chain behandeln. Wenn Sie MCP-Server nutzen, pinnen Sie Tool-Deskriptoren und blockieren Sie bei Abweichungen — Tool-Description-Poisoning ist eine reale, aktiv ausgenutzte Angriffskategorie.

Schritt 4: Guardrails im Request-Pfad hinzufügen

Sobald Ihr Agent Eingaben liest, die Sie nicht kontrollieren (Kundennachrichten, Webseiten, abgerufene Dokumente), ist er Prompt-Injection ausgesetzt: Anweisungen, die in Daten eingebettet sind und versuchen, den Agenten umzuleiten. Guardrails, die wirklich wichtig sind:

Eingaben scannen auf Injection-Muster, bevor das Modell den Text sieht
Ausgaben scannen auf PII, Geheimnisse und Policy-Verstöße, bevor die Antwort Ihr System verlässt
Tool-Call-Prüfungen — Allowlist, Argument-Validierung, Rate- und Kostenlimits — evaluiert vor der Ausführung des Tools

Der architektonische Fehler, den die meisten Teams begehen: Guardrails müssen synchron im Request-Pfad laufen. Ein Dashboard, das einen Verstoß fünf Minuten nach der ausgeführten Rückerstattung meldet, ist Observability — kein Enforcement.

Schritt 5: Governance vor dem Launch einrichten, nicht nach dem Vorfall

Guardrails schützen einen einzelnen Aufruf. Governance verwaltet den Agenten als betriebliche Einheit: Wer ist verantwortlich, welche Autonomie hat er, was gibt er aus, und welche Nachweise existieren für jede Aktion. Konkret brauchen Sie vor dem Produktionseinsatz:

Ein deklariertes Autonomie-Level — beobachten, beraten, mit-Freigabe-handeln oder autonom — mit dem dazugehörigen Control-Bundle, das durchgesetzt wird
Eine Tool-Allowlist im Block-Modus, sodass ein nicht deklarierter Tool-Aufruf geschlossen fehlschlägt
Budget-Caps pro Agent und Tag/Monat mit automatischer Abschaltung — nicht nur Warnmeldungen
Menschliche Freigabe für irreversible Aktionen (Zahlungen, Löschungen, externe E-Mails)
Ein manipulationssicherer Audit-Trail jeder Aktion — für viele Deployments vorgeschrieben unter SOC 2 und dem EU AI Act, und bei jeder nachträglichen Untersuchung unverzichtbar

Diese Schicht stellt Execlave bereit. Die Integration ab Schritt 2 ist ein einziger SDK-Aufruf — ein Callback-Handler für LangChain, ein Trace-Processor für den OpenAI Agents SDK:

# LangChain
from execlave import Execlave
from execlave.integrations.langchain import ExeclaveCallbackHandler

exe = Execlave(api_key=os.environ["EXECLAVE_API_KEY"])
handler = ExeclaveCallbackHandler(exe, agent_id="support-bot")
chain.invoke(input, config={"callbacks": [handler]})

# OpenAI Agents SDK
from execlave.integrations.openai_agents import ExeclaveTracingProcessor
add_trace_processor(ExeclaveTracingProcessor(exe, agent_id="support-bot"))

Die Policy-Auswertung fügt im Prozess Mikrosekunden hinzu und serverseitig wenige einstellige Millisekunden (veröffentlichte, reproduzierbare Benchmarks) — gering genug, um im Request-Pfad eines kundenseitigen Agenten zu sitzen. Die vollständige zehnminütige Anleitung finden Sie unter LangChain-Agenten in 10 Minuten gouvernieren.

Schritt 6: Adversarisch testen, bevor Autonomie gewährt wird

Funktionale Tests beweisen, dass der Agent funktioniert. Adversarische Tests beweisen, dass er sicher versagt:

Varianten von "Ignoriere vorherige Anweisungen" in jeden Eingabekanal injizieren — einschließlich abgerufener Dokumente und Tool-Outputs, nicht nur Chat
Den Agenten bitten, Tools zu verwenden, die er nicht haben sollte, und sicherstellen, dass die Allowlist bei der Ausführung blockiert
Tool-Fehler und Timeouts erzwingen; auf Wiederholungsschleifen achten, die das Budget aufbrauchen
Die Hochstufung auf autonomen Betrieb an einen Mindest-Resilienz-Score knüpfen — Execlave's Red-Team-Gate automatisiert genau das

Schritt 7: Mit Monitoring und Kill-Switch deployen

Produktionsanforderungen vom ersten Tag an:

Execution Traces — jeder LLM-Aufruf, jede Tool-Invokation, Latenz und Kosten, abfragbar, wenn etwas schiefläuft
Kostenzuordnung pro Agent, Team und Umgebung
Alerting bei Verstoß-Häufungen, Fehler-Spitzen und Budget-Burn-Rate — geleitet an den Ort, den Ihr Team bereits beobachtet (Splunk / Sentinel)
Ein Remote-Kill-Switch — wenn ein Agent sich falsch verhält, pausieren Sie ihn in Sekunden, ohne ein Redeployment

Wie das fertige System aussieht — zwei gouvernierte Agenten, das Policy-Set, Autonomie-Tiers, gemessene Enforcement-Latenz und SIEM-Routing — finden Sie im Referenz-Deployment.

Häufige Fragen

Brauche ich ein Framework, um einen KI-Agenten zu bauen?

Nein. Ein minimaler Agent ist eine Schleife um eine LLM-API mit Function Calling — unter 100 Zeilen. Frameworks verdienen ihren Platz, wenn Sie Orchestrierung, Memory, Retrieval oder Multi-Agenten-Koordination benötigen.

Wie verhindere ich, dass mein Agent etwas Gefährliches tut?

Drei Schichten: enge Tools (er kann nicht aufrufen, was er nicht hat), synchrones Policy-Enforcement (Allowlists, Caps, Scanning vor der Ausführung) und menschliche Freigabe für irreversible Aktionen.

Was kostet es, einen Agenten zu betreiben?

Token-Ausgaben dominieren und skalieren mit der Schleifenlänge — eine Wiederholungsschleife kann in Minuten hunderte von Euro verbrennen. Harte Budget-Caps mit automatischer Abschaltung sind die einzige zuverlässige Kontrolle.

Wann ist mein Agent produktionsreif?

Wenn er adversarische Tests besteht, ein deklariertes Autonomie-Level mit durchgesetzten Controls hat, einen vollständigen Audit-Trail ausgibt, Budget-Caps einhält und remote pausiert werden kann. Alles darunter ist ein Demo.

Ersten Agenten kostenlos verwalten

Im kostenlosen Tarif enthalten: 1 Agent, 500 Traces/Monat und 30 Tage Aufbewahrung. Keine Kreditkarte erforderlich.

Get started free

Was ist KI-Agent-Governance? →LangChain in 10 Minuten gouvernieren →Prompt-Injection-Angriffe →Referenz-Deployment →