AI-Agenten-Risiko: Warum Agenten ein neues Governance-Modell brauchen

AI Agent Risk: Why Agents Need A New Governance Model

12. April 2026 · 8 Min. Lesezeit

KI-Agenten werden schnell zur neuen Standarderzählung im Enterprise-AI-Bereich. Anbieter integrieren Agenten in Produktivitätssuiten, Customer-Service-Plattformen, Entwicklerwerkzeuge, Workflowsysteme und Low-Code-Umgebungen. Microsoft Copilot Studio positioniert sich zum Beispiel inzwischen als Plattform, um KI-Agenten zu erstellen, anzupassen, bereitzustellen und zu verwalten, die mit Geschäftsdaten verbunden sind, Werkzeuge nutzen und in Kanälen wie Microsoft 365 Copilot, Teams, SharePoint und Websites veröffentlicht werden können.

Diese Entwicklung ist wichtig. Aber sie schafft auch ein Sprachproblem.

Nicht jedes Produkt, das als "Agent" bezeichnet wird, trägt dasselbe Risiko.

Ein einfacher Prompt-und-Response-Assistent, der auf einigen Dokumenten basiert, ist nicht dasselbe wie ein autonomer Workflow-Agent, der Ereignisse überwacht, Entscheidungen trifft, Werkzeuge aufruft, Datensätze aktualisiert, Nachrichten versendet, Fälle eskaliert oder im Hintergrund Geschäftsprozesse auslöst. Beide können als Agenten vermarktet werden. Sie brauchen trotzdem nicht dasselbe Governance-Modell.

Kernaussage: Ein Agent ist eine Produktkategorie, aber agentisches Verhalten ist eine Risikoeigenschaft.

Von KI, die antwortet, zu KI, die handelt

Traditionelle KI-Governance beginnt oft mit Fragen wie:

Ist das Modell akkurat?
Ist die Ausgabe verzerrt?
Erklärt das System sein Ergebnis?
Werden personenbezogene Daten rechtmäßig verarbeitet?
Können Nutzer der Antwort vertrauen?

Diese Fragen bleiben wichtig. Aber agentische Systeme fügen eine neue Ebene hinzu: Handlung.

Bei Agenten verschiebt sich die Governance-Frage von:

Was hat das Modell gesagt?

Zu:

Was durfte der Agent tun, was hat er tatsächlich getan, warum hat er es getan, wer hat es genehmigt und können wir es nachweisen?

Das ist ein sehr anderes Kontrollproblem.

Ein Chatbot kann eine falsche Antwort geben. Ein Agent kann eine falsche Antwort geben und dann auf dieser Basis handeln. Er kann eine API aufrufen, ein Ticket aktualisieren, einem Kunden eine E-Mail senden, einen Datensatz ändern, sensible Daten abrufen, eine Rückerstattung anstoßen, eine Aufgabe erstellen oder Arbeit an einen anderen Agenten weiterreichen.

In dem Moment, in dem ein KI-System ein anderes System beeinflussen kann, wird KI-Governance zu operativer Governance.

Das Agenten-Label ist zu breit

Microsofts eigene Dokumentation macht das Spektrum sichtbar. Microsoft 365 Copilot beschreibt Agenten als Systeme, die von einfachen Prompt-und-Response-Agenten bis hin zu fortgeschrittenen, vollständig autonomen Agenten reichen. Copilot Studio erweitert dies um autonome Fähigkeiten, bei denen Agenten auf Basis von Triggern, Instruktionen und Guardrails handeln und im Hintergrund arbeiten, statt nur in einer Konversation zu reagieren.

Dieses Spektrum ist hilfreich. Es erzeugt aber auch Verwirrung.

Viele Organisationen hören das Wort "Agent" und nehmen an, dass es sich um eine einzige Kategorie handelt. In der Praxis gibt es mehrere Stufen agentischen Verhaltens.

Stufe 1: Wissensassistent

Das ist ein wenig agentisches Werkzeug. Es beantwortet Fragen mithilfe von Instruktionen und ausgewählten Wissensquellen.

Beispiel:

Ein interner HR-Assistent, der Fragen zu Richtlinien anhand freigegebener Dokumente beantwortet.
Ein Copilot-Studio-Agent, der in Teams-Chats mit konfigurierten Themen und Wissensquellen antwortet.

Primäre Risiken:

Falsche Antworten
Veraltetes Wissen
Unangemessene Offenlegung
Übermäßiges Vertrauen der Nutzer

Governance-Fokus:

Inhaltsqualität
Zugriff auf Wissensquellen
Hinweise und Eskalation
Grundlegendes Logging

Stufe 2: Geführter Workflow-Assistent

Dieses Werkzeug hilft einem Nutzer bei der Bearbeitung einer Aufgabe, aber der Mensch bleibt am Steuer.

Beispiel:

Ein Support-Assistent, der eine Antwort entwirft und den nächsten Schritt vorschlägt.
Ein Sales-Assistent, der Kontoinformationen zusammenfasst und eine Follow-up-E-Mail vorschlägt.

Primäre Risiken:

Schlechte Empfehlungen
Unvollständiger Kontext
Irreführende Zusammenfassungen
Abnicken ohne echte Prüfung

Governance-Fokus:

Menschliche Prüfung
Transparenz der Quellen
Workflow-Grenzen
Nutzerschulung

Stufe 3: Werkzeugnutzender Agent

Hier beginnt sich das Risiko materiell zu verändern. Der Agent kann Werkzeuge, APIs, Flows oder Konnektoren aufrufen.

Beispiel:

Ein IT-Support-Agent, der Tickets erstellt und den Gerätestatus prüft.
Ein Customer-Service-Agent, der Bestellungen nachschlägt und freigegebene Aktionen anstößt.
Ein Copilot-Studio-Agent, der mit Power-Automate-Flows oder APIs von Geschäftssystemen verbunden ist.

Primäre Risiken:

Unbefugte Werkzeugnutzung
Zu weitreichende Berechtigungen
Prompt Injection mit Werkzeug-Missbrauch
Datenabfluss über Tool-Inputs oder -Outputs
Unvollständige Nachvollziehbarkeit

Governance-Fokus:

Tool-Permission-Matrix
Least-Privilege-Zugriff
Genehmigungsregeln
Audit-Logs
Runtime-Policy-Enforcement

Stufe 4: Autonomer Workflow-Agent

Der Agent kann Ereignisse überwachen, Entscheidungen treffen und Aufgaben ausführen, ohne auf einen Nutzer-Prompt zu warten.

Beispiel:

Ein Agent, der eingehende Lieferanten-E-Mails überwacht, Vertragsänderungen extrahiert, Risiken klassifiziert und Genehmigungen weiterleitet.
Ein Finanz-Agent, der Abstimmungsabweichungen überwacht und Korrektur-Workflows startet.
Ein Security-Agent, der Alarme beobachtet, Fälle anreichert und Eindämmungsmaßnahmen einleitet.

Primäre Risiken:

Nicht genehmigte Aktion
Falsche Entscheidung im großen Maßstab
Stiller Fehler
Fehler bei Eskalationen
Störung von Geschäftsprozessen
Lücken bei Compliance-Nachweisen

Governance-Fokus:

Validierung von Triggern
Entscheidungsgrenzen
Menschliche Genehmigung für kritische Aktionen
Monitoring und Alerting
Incident Response
Kill Switches

Stufe 5: Multi-Agenten-Orchestrierung

Mehrere Agenten koordinieren sich, delegieren oder übergeben Arbeit.

Beispiel:

Ein Customer-Onboarding-Prozess, bei dem ein Agent Dokumente sammelt, ein anderer Compliance prüft, ein weiterer Systeme aktualisiert und ein weiterer mit dem Kunden kommuniziert.

Primäre Risiken:

Verantwortlichkeitslücken
Widersprüchliche Instruktionen
Fehlerfortpflanzung
Versteckte Delegation
Schwierige Ursachenanalyse

Governance-Fokus:

Agenten-Identität
Delegationsregeln
End-to-End-Nachvollziehbarkeit
Systemweites Testing
Ownership-Modell

Praktische Regel: Nicht das Label governen, sondern das Verhalten.

Beispielhafte Anwendungsfälle nach Agentenstufe

Die Stufen sind nicht als perfekte Schubladen gedacht. Sie sind ein praktischer Weg zu fragen: Wie viel Agency hat dieses System wirklich?

Agentenstufe	Typische Anwendungsfälle	Was es agentisch macht	Governance-Schwerpunkt
Stufe 1: Wissensassistent	HR-Policy-Q&A, IT-Helpdesk-Wissenssuche, interne Compliance-FAQ, Produktdokumentations-Assistent, Onboarding-Assistent	Antwortet aus freigegebenen Wissensquellen, führt aber keine Aktionen aus	Wissensqualität, Zugriffskontrolle, Aktualität der Quellen, Hinweise, Eskalationspfade
Stufe 2: Geführter Workflow-Assistent	Entwurf von Kundenantworten, Zusammenfassung von Sales-Accounts, Erstellung von Meeting-Briefs, Vorschläge für Next Best Actions, erste Entwürfe von Risikonotizen	Unterstützt einen Menschen bei einer Aufgabe, während der Mensch Entscheider bleibt	Menschliche Prüfung, Quellentransparenz, Workflow-Grenzen, Schulung, Freigabe des Endergebnisses
Stufe 3: Werkzeugnutzender Agent	Support-Tickets erstellen, Bestellstatus prüfen, CRM-Daten abfragen, IT-Service-Requests eröffnen, Power-Automate-Flows auslösen	Ruft Werkzeuge oder Konnektoren auf, meist innerhalb einer vom Nutzer gestarteten Sitzung	Tool-Permission-Matrix, Least Privilege, Audit-Logging, Freigaberegeln, Prompt-Injection-Tests
Stufe 4: Autonomer Workflow-Agent	Lieferanten-E-Mails überwachen, Vertragsausnahmen routen, Security Alerts triagieren, Finanzabweichungen abgleichen, Kundenvorfälle eskalieren	Handelt auf Basis von Triggern und führt Teile eines Prozesses ohne jeden einzelnen Nutzer-Prompt aus	Trigger-Validierung, Aktionsgrenzen, Monitoring, Kill Switches, menschliche Freigabe bei High-Impact-Aktionen
Stufe 5: Multi-Agenten-Orchestrierung	Customer Onboarding über KYC, Legal, CRM und Support hinweg; Incident Response mit Untersuchungs- und Remediation-Agenten; Enterprise-Procurement-Workflows	Mehrere Agenten koordinieren sich, delegieren oder übergeben Arbeit über Systeme und Teams hinweg	Agenten-Identität, Delegationsregeln, End-to-End-Nachvollziehbarkeit, systemweites Testing, Ownership und Verantwortlichkeit

Wenig agentische Werkzeuge brauchen trotzdem Governance

Es wäre ein Fehler, wenig agentische Plattformen als harmlos abzutun. Ein einfacher Copilot-Studio-Agent kann dennoch sensible Informationen offenlegen, irreführende Antworten geben, sich auf veraltetes Wissen stützen oder ein falsches Gefühl von Autorität erzeugen.

Aber wenig agentische Werkzeuge passen meist in ein leichteres Governance-Modell, weil das System hauptsächlich reagiert und nicht eigenständig handelt.

Für wenig agentische Werkzeuge sind die wichtigsten Fragen:

Auf welche Wissensquellen kann der Agent zugreifen?
Werden Berechtigungen korrekt aus Microsoft 365, SharePoint oder anderen Systemen übernommen?
Sind Antworten in freigegebenen Inhalten verankert?
Wissen Nutzer, wann sie verifizieren oder eskalieren müssen?
Werden Konversationen angemessen protokolliert?
Wem gehört der Agent nach dem Launch?

Das ist Governance, aber sie besteht hauptsächlich aus Content-, Zugriffs-, Qualitäts- und Ownership-Governance.

Das größere Risiko beginnt, wenn der Agent Werkzeuge, Autonomie, Memory, Trigger oder die Fähigkeit, Geschäftssysteme zu beeinflussen, hinzubekommt.

Ab diesem Punkt muss das Governance-Modell Kontrolldesign enthalten, nicht nur Content-Review.

Warum bestehende KI-Governance nicht ausreicht

Viele KI-Governance-Programme wurden um Modelle und Use Cases herum aufgebaut. Teams sollen das Modell dokumentieren, den Use Case klassifizieren, Datenschutzfolgen bewerten, Bias testen und die Einführung genehmigen.

Das ist ein guter Anfang. Aber Agenten bringen Risiken mit sich, die von modellzentrierter Governance nicht vollständig erfasst werden.

1. Agenten haben Berechtigungen

Modelle erzeugen Ausgaben. Agenten haben oft Berechtigungen.

Sie können auf Dateien zugreifen, Datenbanken abfragen, APIs aufrufen, E-Mails versenden, Datensätze erstellen oder Workflows auslösen. Das bedeutet: Agent Governance muss sich bei Identity and Access Management bedienen.

Die zentrale Frage lautet:

Was darf dieser Agent unter welchen Bedingungen tun, und wer hat diese Berechtigungen genehmigt?

2. Agenten haben Werkzeuge

Werkzeuge schaffen eine neue Angriffsfläche. Eine bösartige Instruktion, versteckt in einem Dokument, einer E-Mail, einer Webseite, einem Ticket oder einer abgerufenen Wissensquelle, kann versuchen, den Agenten dazu zu bringen, seine Werkzeuge falsch einzusetzen.

Bei Agenten geht es bei Prompt Injection nicht nur darum, Text zu beeinflussen. Es kann darum gehen, Handlungen zu beeinflussen.

3. Agenten haben Laufzeitverhalten

Eine Modellbewertung vor dem Launch reicht nicht aus. Agenten können sich je nach Triggern, Kontext, Tool-Antworten, abgerufenen Daten, Nutzerinstruktionen und Workflow-Zustand unterschiedlich verhalten.

Governance muss zur Laufzeit über Logging, Monitoring, Alerts und Incident Response fortgeführt werden.

4. Agenten brauchen Aktionsgrenzen

Eine akzeptable Antwort ist nicht dasselbe wie eine akzeptable Aktion.

Ein Agent darf zum Beispiel vielleicht eine Rückerstattungsempfehlung entwerfen, aber die Rückerstattung nicht selbst ausführen. Er darf vielleicht ein Ticket erstellen, aber nicht schließen. Er darf vielleicht Vertragsrisiken zusammenfassen, aber den überarbeiteten Vertrag nicht an die Gegenpartei senden.

Diese Grenzen müssen explizit sein.

5. Agenten erzeugen Nachweisanforderungen

Wenn etwas schiefgeht, muss die Organisation die Sequenz rekonstruieren können:

Was hat den Agenten ausgelöst?
Welche Daten hat er gesehen?
Welcher Instruktion ist er gefolgt?
Welche Werkzeuge hat er aufgerufen?
Welche Policy-Entscheidung wurde getroffen?
War menschliche Freigabe erforderlich?
Wer hat die Aktion genehmigt oder abgelehnt?
Was hat sich im Geschäftssystem geändert?

Wenn Sie diese Fragen nicht beantworten können, haben Sie keine Agent Governance. Dann haben Sie Agenten-Hoffnung.

Ein praktisches Governance-Modell für KI-Agenten

Ein nützliches Governance-Modell für Agenten sollte mindestens acht Kontrollebenen umfassen.

1. Agenten-Inventar

Was Sie nicht sehen, können Sie nicht governen.

Erfassen Sie jeden Agenten mit:

Owner
Zweck
Nutzergruppe
Modell oder Plattform
Datenquellen
Werkzeuge und Konnektoren
Autonomiegrad
Risikostufe
Freigabestatus
Review-Datum
Monitoring-Verantwortlichem

2. Agentische Risikostufung

Klassifizieren Sie Agenten nach Verhalten, nicht nach Anbieterlabel.

Nützliche Dimensionen sind:

Kann er auf sensible Daten zugreifen?
Kann er Werkzeuge aufrufen?
Kann er in Systeme schreiben?
Kann er ohne Nutzer-Prompt handeln?
Kann er externe Kommunikation auslösen?
Kann er High-Impact-Entscheidungen treffen oder beeinflussen?
Kann er an andere Agenten delegieren?

3. Tool-Permission-Matrix

Jedes Werkzeug sollte eine explizite Policy haben.

Definieren Sie für jedes Werkzeug:

Erlaubt oder blockiert
Read-only oder write-fähig
Freigabe erforderlich oder nicht
Maximalgrenzen
Erlaubte Datenklassen
Erlaubte Nutzergruppen
Logging-Anforderungen

Ein Rückerstattungs-Tool könnte zum Beispiel Entwürfe ohne Freigabe erlauben, unterhalb eines Schwellwerts Freigabe verlangen und autonome Rückerstattungen oberhalb eines Schwellwerts blockieren.

4. Menschliche Freigabepunkte

Human-in-the-loop sollte kein Slogan sein. Es sollte in den Workflow eingebaut werden.

Freigaben sollten erforderlich sein für:

Rechtliche Verpflichtungen
Finanztransaktionen
HR-Entscheidungen
Kundenwirksame Aktionen
Sicherheitskritische Änderungen
Irreversible Aktionen
Automatisierte Entscheidungen in hohem Volumen

Die Freigabe sollte Teil des Audit Trails werden.

5. Prompt-Injection- und Tool-Misuse-Testing

Agenten sollten vor der Produktion gegen adversariale Szenarien getestet werden.

Testen Sie auf:

Bösartige abgerufene Dokumente
Widersprüchliche Instruktionen
Versuche der Datenexfiltration
Versuche, Freigaben zu umgehen
Versuche, unautorisierte Werkzeuge zu nutzen
Versuche, Systeminstruktionen zu überschreiben
Versuche, Aktionen aus nicht vertrauenswürdigen Inputs auszulösen

6. Runtime-Audit-Logging

Logs sollten mehr erfassen als nur die endgültige Antwort.

Mindestens protokolliert werden sollten:

Nutzer- oder Event-Trigger
Agent-ID
Prompt- oder Instruktionsversion
Modellversion
Abgerufener Kontext
Tool-Aufrufe
Tool-Inputs und -Outputs
Policy-Entscheidungen
Menschliche Freigaben
Endgültige Aktion
Trace-ID

7. Monitoring und Kill Switches

Agenten brauchen operative Kontrollen.

Beobachtet werden sollte:

Unerwartete Werkzeugnutzung
Ungewöhnlicher Datenzugriff
Wiederholte Fehler
Eskalationsspitzen
Kostenanomalien
Schleifenverhalten
Aktionen außerhalb normaler Muster

Ein High-Risk-Agent sollte eine klare Pause-, Entzugs- oder Kill-Switch-Prozedur haben.

8. Lifecycle Reviews

Agenten entwickeln sich weiter. Ihre Werkzeuge, Prompts, Datenquellen, Modelle, Nutzer und geschäftlichen Kontexte ändern sich.

Reviewen Sie Agenten, wenn:

Ein neues Werkzeug hinzugefügt wird
Eine neue Datenquelle verbunden wird
Die Autonomie zunimmt
Das Modell wechselt
Der Agent in einem neuen Kanal veröffentlicht wird
Sich der Geschäftsprozess ändert
Ein Vorfall eintritt

Die Lehre aus Microsoft Copilot Studio

Microsofts Ansatz ist nützlich, weil er das entstehende Enterprise-Muster zeigt. Copilot Studio bringt Low-Code-Agentenerstellung, Grounding auf Geschäftsdaten, Werkzeuge, Flows, APIs, Publishing-Kanäle, Management-Funktionen, Analytics und Governance-Features zusammen.

Es zeigt aber auch, warum Unternehmen ihre eigene Sprache für Agentenrisiken brauchen.

Ein einfacher deklarativer oder Prompt-und-Response-Agent kann eine beherrschbare Erweiterung von Knowledge Management sein. Ein autonomer Copilot-Studio-Agent, der mit Geschäftsworkflows verbunden ist, ist eher ein digitaler Prozessakteur. Ein Multi-Agenten-System, das über Werkzeuge und Abteilungen hinweg koordiniert, ist eher ein verteiltes operatives System.

Diese Systeme sollten nicht durch dieselbe Freigabe-Checkliste laufen.

Die Risikofrage ist nicht:

Wurde das in Copilot Studio, Azure AI Foundry, LangGraph, OpenAI, CrewAI oder einem anderen Framework gebaut?

Die bessere Frage ist:

Welchen Grad an Agency hat dieses System, und welche Kontrollen passen zu diesem Grad an Agency?

Diese Sichtweise hilft auch, anbieterbezogene Blind Spots zu vermeiden. Eine Low-Code-Plattform kann nützliche Guardrails, Admin-Kontrollen und Integrationen mit Enterprise-Governance-Werkzeugen bieten. Das ist wertvoll. Aber die Organisation muss trotzdem entscheiden, welche Aktionen akzeptabel sind, welche Freigaben erforderlich sind, welche Nachweise aufbewahrt werden müssen und wem der Agent nach dem Deployment gehört.

Eine einfache Faustregel

Je mehr ein KI-System handeln kann, desto stärker muss Governance von Dokumentation zu Kontrolle werden.

Nutzen Sie diese Regel:

Wenn es nur antwortet, governen Sie Content, Zugriff und Genauigkeit.
Wenn es empfiehlt, governen Sie Decision Support und menschliche Review.
Wenn es Werkzeuge nutzt, governen Sie Berechtigungen und Tool-Call-Policies.
Wenn es autonom handelt, governen Sie Trigger, Freigaben, Monitoring und Incident Response.
Wenn es mit anderen Agenten koordiniert, governen Sie Identität, Delegation und End-to-End-Nachvollziehbarkeit.

Das ist das Fundament von AI Agent Risk.

Was jetzt zu tun ist

Für Organisationen, die jetzt starten, sind die ersten Schritte praktisch:

Erstellen Sie ein Inventar aller Agenten und agentenähnlichen Systeme.
Klassifizieren Sie sie nach Agency-Stufe, nicht nach Produktnamen.
Identifizieren Sie, welche Agenten auf Daten zugreifen, Werkzeuge aufrufen oder Aktionen auslösen können.
Definieren Sie für jeden werkzeugnutzenden Agenten eine Tool-Permission-Matrix.
Verlangen Sie menschliche Freigaben für sensible oder irreversible Aktionen.
Protokollieren Sie Agentenaktionen so, dass Audit und Incident Response unterstützt werden.
Testen Sie Agenten auf Prompt Injection, Datenabfluss und Umgehung von Freigaben.
Reviewen Sie Agenten jedes Mal, wenn ihre Autonomie, Werkzeuge oder Datenzugriffe erweitert werden.

Die Zukunft der KI-Governance wird nicht nur von Modellen handeln. Sie wird von Systemen handeln, die wahrnehmen, entscheiden und handeln innerhalb von Geschäftsprozessen.

Deshalb brauchen Agenten ein neues Governance-Modell.

AI-Agenten-Risiko: Warum Agenten ein neues Governance-Modell brauchen

Von KI, die antwortet, zu KI, die handelt

Das Agenten-Label ist zu breit

Stufe 1: Wissensassistent

Stufe 2: Geführter Workflow-Assistent

Stufe 3: Werkzeugnutzender Agent

Stufe 4: Autonomer Workflow-Agent

Stufe 5: Multi-Agenten-Orchestrierung

Beispielhafte Anwendungsfälle nach Agentenstufe

Wenig agentische Werkzeuge brauchen trotzdem Governance

Warum bestehende KI-Governance nicht ausreicht

1. Agenten haben Berechtigungen

2. Agenten haben Werkzeuge

3. Agenten haben Laufzeitverhalten

4. Agenten brauchen Aktionsgrenzen

5. Agenten erzeugen Nachweisanforderungen

Ein praktisches Governance-Modell für KI-Agenten

1. Agenten-Inventar

2. Agentische Risikostufung

3. Tool-Permission-Matrix

4. Menschliche Freigabepunkte

5. Prompt-Injection- und Tool-Misuse-Testing

6. Runtime-Audit-Logging

7. Monitoring und Kill Switches

8. Lifecycle Reviews

Die Lehre aus Microsoft Copilot Studio

Eine einfache Faustregel

Was jetzt zu tun ist

Quellen