Skip to content

§ ARTICLE / · 12 Min. Lesezeit

KI-Agenten entwickeln im Jahr 2026: eine praxisnahe Schritt-für-Schritt-Anleitung

TutorialKI-AgentenAnleitung
RM
Founder, Execlave

Um einen KI-Agenten zu bauen, begrenzen Sie eine einzelne Aufgabe, verbinden ein LLM mit einer überschaubaren Menge an Tools, die es aufrufen darf, betreiben es in einer Reason–Act-Schleife und umhüllen diese Schleife mit Guardrails, damit es nichts tun kann, was Sie nicht ausdrücklich erlaubt haben. Das Modell ist der einfache Teil. Was ein Wochenend-Demo von einem Produktionsagenten unterscheidet, ist alles rund um die Schleife: Tool-Design, Policy-Enforcement, Kostenkontrolle, adversarisches Testen und ein Audit-Trail. Diese Anleitung führt Sie durch alle sieben Schritte — inklusive funktionsfähigem Code.

TL;DR

Bauen Sie einen KI-Agenten in sieben Schritten: Begrenzen Sie den Aufgabenbereich, wählen Sie ein Framework (oder keines), geben Sie ihm 2–4 eng gefasste Tools, fügen Sie Guardrails im Request-Pfad hinzu, verdrahten Sie Governance und Audit-Trails vor dem Launch, testen Sie ihn adversarisch und deployen Sie ihn mit Monitoring und einem Kill-Switch. Teams, die die Schritte 4–6 überspringen, schreiben später Incident-Reports.

Was ein KI-Agent wirklich ist

Ein KI-Agent ist ein LLM-gesteuertes Programm, das ein Ziel verfolgt, indem es in einer Schleife denkt: Kontext lesen → Aktion festlegen → Tool aufrufen → Ergebnis beobachten → wiederholen, bis die Aufgabe erledigt ist. Drei Komponenten definieren jeden Agenten:

  • Ein Modell, das die Überlegungen anstellt (GPT, Claude, Gemini oder ein Open-Weight-Modell)
  • Tools — Funktionen, APIs und Datenquellen, die der Agent aufrufen darf
  • Anweisungen und Einschränkungen — der System-Prompt plus die Laufzeit-Policies, die den Handlungsspielraum begrenzen

Der Unterschied zu einem Chatbot ist entscheidend: Ein Chatbot produziert Text; ein Agent handelt in externen Systemen — er sendet E-Mails, schreibt in Datenbanken, löst Rückerstattungen aus. Genau deshalb sind die nachfolgenden Sicherheits- und Governance-Schritte keine optionalen Extras.

Schritt 1: Eine Aufgabe eingrenzen (kein Alleskönner-Assistent)

Jede Anleitung — von OpenAIs praktischem Leitfaden bis zum Agent-Curriculum von Microsoft — kommt zum gleichen Schluss: Beginnen Sie mit einer einzigen, repetitiven, klar abgegrenzten Aufgabe mit eindeutigen Erfolgskriterien. Gute erste Agenten:

  • Eingehende Support-Tickets priorisieren und Entwürfe für die menschliche Prüfung erstellen
  • Fragen über einen festen Dokumentenbestand beantworten (RAG mit Quellenangaben)
  • Nächtliche Datenqualitätsprüfungen durchführen und einen Bericht einreichen

Schlechter erster Agent: "Ein Assistent, der alles erledigt, was unsere Kunden fragen." Ein breiter Scope multipliziert die Tool-Fläche, die Fehlerszenarien und die Angriffsfläche gleichzeitig.

Schritt 2: Ein Framework wählen — oder keines

Die ehrliche Entscheidungsmatrix:

  • Kein Framework. Eine Schleife rund um die Modell-API mit Function Calling. Die beste Methode, um zu verstehen, was Agenten tatsächlich tun; für Single-Tool-Agenten vollkommen ausreichend.
  • OpenAI Agents SDK. Schlank und vollständig ausgestattet: Agenten, Handoffs, Sessions, Tracing-Hooks. Der schnellste seriöse Einstieg in Python.
  • LangChain / LangGraph. Das größte Ökosystem. LangGraphs explizite Zustandsgraphen zahlen sich aus, wenn Ihr Agent Verzweigungen, Wiederholungsversuche und Human-in-the-Loop-Pausen benötigt.
  • CrewAI / AutoGen. Rollenbasierte Multi-Agenten-Teams. Greifen Sie darauf erst zurück, wenn ein einzelner Agent funktioniert — Multi-Agenten-Systeme vervielfachen jeden Fehlerfall.
  • n8n oder andere No-Code-Plattformen. Legitim für workflow-artige Agenten; Sie tauschen Flexibilität gegen Geschwindigkeit.

Ein minimaler Agent ohne Framework — das ist buchstäblich alles, was ein Agent ist:

# A minimal tool-calling agent loop (Python, OpenAI API)
import json
from openai import OpenAI

client = OpenAI()

def search_orders(customer_email: str) -> str:
    ...  # your real lookup
    return json.dumps({"orders": [{"id": "A-1042", "status": "shipped"}]})

TOOLS = [{
    "type": "function",
    "function": {
        "name": "search_orders",
        "description": "Look up a customer's orders by email.",
        "parameters": {
            "type": "object",
            "properties": {"customer_email": {"type": "string"}},
            "required": ["customer_email"],
        },
    },
}]

messages = [
    {"role": "system", "content": "You are a support agent. Use tools; never guess order data."},
    {"role": "user", "content": "Where is my order? I'm jane@example.com"},
]

while True:
    resp = client.chat.completions.create(model="gpt-4o-mini", messages=messages, tools=TOOLS)
    msg = resp.choices[0].message
    if not msg.tool_calls:
        print(msg.content)  # final answer
        break
    messages.append(msg)
    for call in msg.tool_calls:
        result = search_orders(**json.loads(call.function.arguments))
        messages.append({"role": "tool", "tool_call_id": call.id, "content": result})

Schritt 3: Die Tools gestalten — hier liegt die eigentliche Fähigkeit

Das Modell entscheidet, was zu tun ist; Tools definieren, was es tun kann. Regeln, die sich in der Produktion bewähren:

  • 2–4 Tools zum Start. Jedes zusätzliche Tool verwässert die Tool-Auswahlgenauigkeit und vergrößert den Schadensradius.
  • Enge, typisierte Signaturen. refund_order(order_id, amount_cents) mit einem serverseitigen Maximum schlägt run_sql(query) jedes Mal.
  • Lesende von schreibenden Zugriffen trennen. Lesend-Tools können großzügig sein; jedes schreibfähige Tool braucht einen Eigentümer, ein Limit und oft ein Freigabe-Gate.
  • Fehler zurückgeben, mit denen das Modell umgehen kann. "Bestellung nicht gefunden — bitten Sie den Kunden, die Bestellnummer zu bestätigen" erlaubt eine Wiederherstellung; ein bloßer Stack-Trace führt zu einer Endlosschleife.
  • Drittanbieter-Tools als Supply Chain behandeln. Wenn Sie MCP-Server nutzen, pinnen Sie Tool-Deskriptoren und blockieren Sie bei Abweichungen — Tool-Description-Poisoning ist eine reale, aktiv ausgenutzte Angriffskategorie.

Schritt 4: Guardrails im Request-Pfad hinzufügen

Sobald Ihr Agent Eingaben liest, die Sie nicht kontrollieren (Kundennachrichten, Webseiten, abgerufene Dokumente), ist er Prompt-Injection ausgesetzt: Anweisungen, die in Daten eingebettet sind und versuchen, den Agenten umzuleiten. Guardrails, die wirklich wichtig sind:

  • Eingaben scannen auf Injection-Muster, bevor das Modell den Text sieht
  • Ausgaben scannen auf PII, Geheimnisse und Policy-Verstöße, bevor die Antwort Ihr System verlässt
  • Tool-Call-Prüfungen — Allowlist, Argument-Validierung, Rate- und Kostenlimits — evaluiert vor der Ausführung des Tools

Der architektonische Fehler, den die meisten Teams begehen: Guardrails müssen synchron im Request-Pfad laufen. Ein Dashboard, das einen Verstoß fünf Minuten nach der ausgeführten Rückerstattung meldet, ist Observability — kein Enforcement.

Schritt 5: Governance vor dem Launch einrichten, nicht nach dem Vorfall

Guardrails schützen einen einzelnen Aufruf. Governance verwaltet den Agenten als betriebliche Einheit: Wer ist verantwortlich, welche Autonomie hat er, was gibt er aus, und welche Nachweise existieren für jede Aktion. Konkret brauchen Sie vor dem Produktionseinsatz:

  • Ein deklariertes Autonomie-Level — beobachten, beraten, mit-Freigabe-handeln oder autonom — mit dem dazugehörigen Control-Bundle, das durchgesetzt wird
  • Eine Tool-Allowlist im Block-Modus, sodass ein nicht deklarierter Tool-Aufruf geschlossen fehlschlägt
  • Budget-Caps pro Agent und Tag/Monat mit automatischer Abschaltung — nicht nur Warnmeldungen
  • Menschliche Freigabe für irreversible Aktionen (Zahlungen, Löschungen, externe E-Mails)
  • Ein manipulationssicherer Audit-Trail jeder Aktion — für viele Deployments vorgeschrieben unter SOC 2 und dem EU AI Act, und bei jeder nachträglichen Untersuchung unverzichtbar

Diese Schicht stellt Execlave bereit. Die Integration ab Schritt 2 ist ein einziger SDK-Aufruf — ein Callback-Handler für LangChain, ein Trace-Processor für den OpenAI Agents SDK:

# LangChain
from execlave import Execlave
from execlave.integrations.langchain import ExeclaveCallbackHandler

exe = Execlave(api_key=os.environ["EXECLAVE_API_KEY"])
handler = ExeclaveCallbackHandler(exe, agent_id="support-bot")
chain.invoke(input, config={"callbacks": [handler]})

# OpenAI Agents SDK
from execlave.integrations.openai_agents import ExeclaveTracingProcessor
add_trace_processor(ExeclaveTracingProcessor(exe, agent_id="support-bot"))

Die Policy-Auswertung fügt im Prozess Mikrosekunden hinzu und serverseitig wenige einstellige Millisekunden (veröffentlichte, reproduzierbare Benchmarks) — gering genug, um im Request-Pfad eines kundenseitigen Agenten zu sitzen. Die vollständige zehnminütige Anleitung finden Sie unter LangChain-Agenten in 10 Minuten gouvernieren.

Schritt 6: Adversarisch testen, bevor Autonomie gewährt wird

Funktionale Tests beweisen, dass der Agent funktioniert. Adversarische Tests beweisen, dass er sicher versagt:

  • Varianten von "Ignoriere vorherige Anweisungen" in jeden Eingabekanal injizieren — einschließlich abgerufener Dokumente und Tool-Outputs, nicht nur Chat
  • Den Agenten bitten, Tools zu verwenden, die er nicht haben sollte, und sicherstellen, dass die Allowlist bei der Ausführung blockiert
  • Tool-Fehler und Timeouts erzwingen; auf Wiederholungsschleifen achten, die das Budget aufbrauchen
  • Die Hochstufung auf autonomen Betrieb an einen Mindest-Resilienz-Score knüpfen — Execlave's Red-Team-Gate automatisiert genau das

Schritt 7: Mit Monitoring und Kill-Switch deployen

Produktionsanforderungen vom ersten Tag an:

  • Execution Traces — jeder LLM-Aufruf, jede Tool-Invokation, Latenz und Kosten, abfragbar, wenn etwas schiefläuft
  • Kostenzuordnung pro Agent, Team und Umgebung
  • Alerting bei Verstoß-Häufungen, Fehler-Spitzen und Budget-Burn-Rate — geleitet an den Ort, den Ihr Team bereits beobachtet (Splunk / Sentinel)
  • Ein Remote-Kill-Switch — wenn ein Agent sich falsch verhält, pausieren Sie ihn in Sekunden, ohne ein Redeployment

Wie das fertige System aussieht — zwei gouvernierte Agenten, das Policy-Set, Autonomie-Tiers, gemessene Enforcement-Latenz und SIEM-Routing — finden Sie im Referenz-Deployment.

Häufige Fragen

Brauche ich ein Framework, um einen KI-Agenten zu bauen?

Nein. Ein minimaler Agent ist eine Schleife um eine LLM-API mit Function Calling — unter 100 Zeilen. Frameworks verdienen ihren Platz, wenn Sie Orchestrierung, Memory, Retrieval oder Multi-Agenten-Koordination benötigen.

Wie verhindere ich, dass mein Agent etwas Gefährliches tut?

Drei Schichten: enge Tools (er kann nicht aufrufen, was er nicht hat), synchrones Policy-Enforcement (Allowlists, Caps, Scanning vor der Ausführung) und menschliche Freigabe für irreversible Aktionen.

Was kostet es, einen Agenten zu betreiben?

Token-Ausgaben dominieren und skalieren mit der Schleifenlänge — eine Wiederholungsschleife kann in Minuten hunderte von Euro verbrennen. Harte Budget-Caps mit automatischer Abschaltung sind die einzige zuverlässige Kontrolle.

Wann ist mein Agent produktionsreif?

Wenn er adversarische Tests besteht, ein deklariertes Autonomie-Level mit durchgesetzten Controls hat, einen vollständigen Audit-Trail ausgibt, Budget-Caps einhält und remote pausiert werden kann. Alles darunter ist ein Demo.

Ersten Agenten kostenlos verwalten

Im kostenlosen Tarif enthalten: 1 Agent, 500 Traces/Monat und 30 Tage Aufbewahrung. Keine Kreditkarte erforderlich.

Get started free
How to Build an AI Agent in 2026: A Practical Step-by-Step Guide | Execlave