Skip to content
Zurück zur Startseite

§ REFERENZARCHITEKTUR

Referenz-Deployment

Wie eine governte Produktionsflotte aus zwei Agenten von Anfang bis Ende aussieht: Stack, Autonomiestufen, Richtliniensatz, gemessene Durchsetzungskosten, SIEM-Routing und die Audit-Nachweise, die jede Kontrolle erzeugt.

Was diese Seite ist — und was nicht

Dies ist eine Referenzarchitektur, keine anonymisierte Kundenfallstudie. Das Szenario beruht darauf, wie wir Execlave selbst betreiben und testen; jede Fähigkeit und jede Zahl auf dieser Seite ist anderswo auf dieser Website dokumentiert — die Latenzwerte stammen aus den veröffentlichten, reproduzierbaren Benchmarks und nichts hier ist eine Schätzung. Wenn wir Kundenfallstudien veröffentlichen, werden sie als solche gekennzeichnet.

§ 01

Szenario & Stack

Ein mittelgroßes Produktunternehmen betreibt zwei Produktionsagenten mit unterschiedlichen Risikoprofilen — die häufige Ausgangsform, die wir sehen.

KomponenteWahlWarum
Support-AgentLangChain (Python), kundenseitigVerarbeitet Endbenutzereingaben — höchste Injection- und PII-Exposition.
Ops-AgentOpenAI Agents SDK (Python), internSchreibt in interne Systeme — Werkzeugmissbrauch ist das Hauptrisiko.
GovernanceExeclave Cloud (selbst gehostet verfügbar)Beide Agenten mit je einem SDK-Aufruf instrumentiert.
UmgebungenProduktion + StagingGleiche Richtlinien in beiden; in Staging werden verschärfte Richtlinien erneut getestet.
SIEMSplunk oder Microsoft SentinelVerstöße landen in der bestehenden SOC-Warteschlange — siehe die Integrationsleitfäden.
# Support-Agent — LangChain (Python)handler = ExeclaveCallbackHandler(exe, agent_id="support-bot")chain.invoke(input, config={"callbacks": [handler]}) # Ops-Agent — OpenAI Agents SDK (Python)add_trace_processor(ExeclaveTracingProcessor(exe, agent_id="ops-agent"))
§ 02

Autonomiestufen & Richtliniensatz

Jeder Agent deklariert eine Autonomiestufe; Execlave wendet das passende Kontrollpaket an. Richtlinien außerhalb der Stufe werden als auditierte Ausnahmen gekennzeichnet.

AgentAutonomiestufeWas das bedeutet
support-botact_with_approvalAntwortet frei; ausgehende Aktionen (Erstattungen, E-Mails) werden mit 30-minütiger Freigabe-Gültigkeit zur menschlichen Bestätigung in die Warteschlange gestellt.
ops-agentautonomousSchreibt ohne Freigabe pro Aktion, innerhalb von Kostenobergrenzen, Werkzeug-Allowlist und Limits für externe Aufrufe.
# Repräsentativer Richtliniensatz (4 von 19 verfügbaren Richtlinientypen) prompt_injection:        # beide Agenten  enforcement: block     # 13-Sprachen-Scan, schweregrad-bewertetpii_detection:           # Support-Agent  enforcement: warn      # 14 Kategorien, an der Grenze gehashttool_allowlist:          # beide Agenten  enforcement: block     # send_email erfordert Freigabe; db_write für Support gesperrtcost_budget:             # Organisation + pro Agent  enforcement: block     # Tageslimit pro Agent, Monatslimit pro Org, Burn-Rate-Alarm bei 80%

Pro Richtlinie stehen vier Durchsetzungsmodi zur Verfügung — monitor, warn, require_approval, block — sodass dieselbe Richtlinie zunächst nur als Monitor ausgerollt werden und nach einer Woche sauberem Signal zu Block aufsteigen kann. Siehe Richtlinien für den vollständigen Katalog mit 19 Typen.

§ 03

Was Durchsetzung zur Laufzeit kostet

Veröffentlichte, gemessene Werte — reproduzieren Sie sie mit den eingecheckten Harnesses (backend/scripts/bench-enforcement.ts, bench-enforce-e2e.ts).

MetrikGemessen
In-Process-Richtlinienauswertung — p50 / p95 / p998.4 µs / 10.6 µs / ~21 µs
Auswertungsdurchsatz — einzelner Kern~96.000 Durchläufe/Sek.
Serverseitige Enforce-Entscheidung, inkl. DB — p50 / p95 / p992.1 ms / 2.9 ms / 3.9 ms
Semantische Stufe (modellgestützte Prüfungen)noch nicht veröffentlicht — nie geschätzt

Methodik, Umgebung und Vorbehalte finden Sie auf der Benchmarks-Seite. Die praktische Erkenntnis für dieses Deployment: Governance auf Muster-Ebene fügt in-process Mikrosekunden und serverseitig niedrige einstellige Millisekunden hinzu — klein genug, um im Anfragepfad beider Agenten zu sitzen.

§ 04

Wenn etwas auslöst

Die operative Schleife, die diese Architektur erzeugt.

Ein Prompt-Injection-Versuch gegen support-bot wird zur Durchsetzungszeit blockiert und der Trace als policy_blocked markiert. Der Trace streamt ins SIEM, wo die Verstoß-Burst-Regel (ausgeliefert in den Splunk / Sentinel Leitfäden) einen Vorfall in der SOC-Warteschlange auslöst. Der Analyst folgt dem Incident-Response-Workflow: Pivot nach trace_id, Prüfung der Span-Zeitachse und des Agentenpasses, Verschärfen oder Bestätigen der Richtlinie und Anhängen des hash-verketteten Audit-Exports an den Vorfalldatensatz.

§ 05

Welche Nachweise dieses Deployment erzeugt

Was Sie einem Prüfer übergeben — jedes Artefakt ordnet sich einer konkreten Kontrolle oben zu.

ArtefaktErzeugt durch
Signierter Compliance-Bericht (RSA-SHA256, offline verifizierbar)GET /api/v1/compliance/report — 7 Frameworks einschließlich EU AI Act
Append-only, hash-verkettetes Audit-Log (Aufbewahrung bis zu 10 Jahre)Jede Durchsetzungsentscheidung, Freigabe und Richtlinienänderung
Freigabedatensätze mit menschlicher Identität + Zeitstempelact_with_approval-Aktionen auf support-bot
Nachweiszuordnung pro EU-AI-Act-Artikeldocs/compliance/eu-ai-act — Artikel für Artikel

Vollständige Zuordnung mit Nachweis-Links pro Artikel: EU-AI-Act-Compliance. Um diese Architektur zu reproduzieren, beginnen Sie mit Erste Schritte und den Framework-Integrationen.

Referenz-Deployment — Execlave Docs