Como avaliar o risco de um agente de IA antes da produção

10 de maio de 2026 · 10 min de leitura

A avaliação de risco de um agente de IA deve acontecer antes da produção, não depois do primeiro incidente, da primeira solicitação de auditoria ou de uma escalada confusa.

Ela não precisa ser pesada. Se o processo ficar pesado demais, os times vão contorná-lo. A versão útil é uma entrada estruturada que ajuda produto, compliance, segurança, arquitetura e responsáveis de negócio a responder uma pergunta:

O que este agente poderia fazer, quem seria afetado e quais controles precisam existir antes que ele possa operar?

Este artigo apresenta um modelo prático para avaliar agentes de IA corporativos no momento em que já existe um caso de uso real, uma arquitetura preliminar e um caminho de lançamento, mas ainda não uma aprovação de produção.

Versão curta

Antes da produção, avalie sete dimensões:

Dimensão	O que determinar
Intake do caso de uso	Objetivo, usuários, responsável, processo e contexto de implantação
Autonomia	Se o agente apenas responde, recomenda, age ou roda por gatilhos
Acesso a ferramentas	Quais sistemas ele pode chamar e se as chamadas são de leitura ou escrita
Sensibilidade dos dados	Quais dados pessoais, confidenciais, regulados ou privilegiados ele pode acessar
Supervisão humana	Onde uma pessoa revisa, aprova, interrompe ou reverte
Impacto no negócio	Que dano pode ocorrer se o agente errar, for manipulado, ficar indisponível ou agir com excesso de confiança
Nível final de risco	Se o agente tem risco baixo, médio, alto ou inaceitável sem redesenho

O resultado deve ser um nível de risco curto, uma checklist de controles, responsáveis nomeados e evidências reutilizáveis em revisões de segurança, privacidade, compliance e arquitetura.

Por que avaliar agentes é diferente

Revisões tradicionais de IA costumam focar no modelo, dados, uso pretendido, qualidade da saída, viés, explicabilidade e privacidade. Isso continua importante.

Agentes adicionam risco operacional.

Um agente pode:

Chamar ferramentas ou APIs.
Recuperar documentos ou registros.
Usar permissões delegadas.
Armazenar memória.
Executar planos de múltiplas etapas.
Rodar a partir de gatilhos em segundo plano.
Enviar mensagens, atualizar registros, abrir tickets, aprovar etapas de workflow ou acionar processos de clientes, funcionários, finanças, jurídico, segurança ou infraestrutura.

A avaliação não pode parar em "a resposta está correta?" Ela também precisa perguntar: "o que o sistema pode fazer com essa resposta?"

O modelo deve avaliar comportamento, não rótulos. Um chatbot chamado agente pode ter baixo risco. Um assistente de workflow com ferramentas pode ter alto risco mesmo usando um modelo conhecido.

Etapa 1: comece pelo intake

O intake define os limites. Sem limites, o restante da avaliação fica abstrato.

Registre:

Nome do agente e responsável de negócio.
Objetivo pretendido.
Usuários principais.
Clientes, funcionários, fornecedores ou terceiros afetados.
Processo de negócio suportado.
Canal de implantação: site, Teams, Slack, portal interno, API ou workflow em segundo plano.
Gatilho de produção: prompt do usuário, criação de ticket, e-mail recebido, job agendado, webhook ou evento de fila.
Escopo do lançamento: piloto, produção interna, voltado ao cliente ou corporativo.
Responsável por suporte e incidentes.

O ponto central é ownership. Se o agente não tem responsável de negócio, caminho de suporte e responsável por incidentes, ele não está pronto para produção.

Etapa 2: pontue a autonomia

Autonomia mede quanto o agente pode decidir e agir sem uma pessoa conduzindo cada etapa.

Pontuação	Nível de autonomia	Descrição
0	Apenas responde	O agente responde perguntas e não age
1	Recomenda	O agente sugere ações, mas um humano as executa
2	Age com aprovação	O agente prepara ou executa ações após aprovação explícita
3	Age autonomamente	O agente opera por gatilhos ou conclui etapas sem aprovação caso a caso

Perguntas:

Ele pode rodar sem mensagem de usuário?
Pode concluir mais de uma etapa antes de voltar a uma pessoa?
Pode escolher qual ferramenta chamar?
Pode decidir quando uma tarefa terminou?
Pode tentar de novo, escalar, delegar ou mudar planos?
Pode afetar registros de negócio, comunicação com cliente, pagamento, decisão de RH, contrato, controle de segurança ou configuração de infraestrutura?

Alta autonomia não é automaticamente inaceitável. Mas exige limites claros, logging forte, aprovação para ações de alto impacto, monitoramento e uma forma rápida de parar o agente.

Etapa 3: pontue o acesso a ferramentas

Acesso a ferramentas torna o risco concreto. Ferramentas incluem APIs, bancos de dados, navegadores, e-mail, tickets, CRM, ERP, RH, automação, execução de código, arquivos, pagamentos e ferramentas de segurança.

Pontuação	Acesso a ferramentas	Descrição
0	Sem ferramentas	O agente apenas gera respostas
1	Somente leitura	Recupera dados, mas não modifica sistemas
2	Escrita limitada	Cria rascunhos, tickets, notas ou registros de baixo impacto
3	Alto impacto	Modifica estado de cliente, finanças, RH, jurídico, segurança ou infraestrutura

Para cada ferramenta, documente nome, objetivo, leitura ou escrita, autenticação, identidade usada, escopos, limites, se o modelo escolhe argumentos, se a saída influencia chamadas futuras e se exige aprovação.

Aqui entra o menor privilégio. Se o agente só precisa do status do pedido, não dê permissão de reembolso. Se só precisa criar um rascunho, não permita enviar a mensagem.

Etapa 4: pontue a sensibilidade dos dados

Agentes podem expor dados diretamente ou indiretamente, ao resumir, transformar, combinar ou enviar dados por outro canal.

Pontuação	Nível de dados	Descrição
0	Público	Apenas informações públicas
1	Interno	Informação não pública de baixa sensibilidade
2	Confidencial ou pessoal	Dados de clientes, funcionários, comerciais, contratuais ou operacionais
3	Restrito ou regulado	Dados pessoais sensíveis, credenciais, segredos, pagamentos, privilégio legal, registros regulados ou informações de segurança

Pergunte:

Quais fontes de dados o agente pode acessar?
Ele pode combinar dados de vários sistemas?
Pode acessar dados pessoais?
Pode ver contratos confidenciais, arquivos de funcionários, finanças, código-fonte, credenciais, logs de segurança ou material jurídico?
Pode mover dados para canais menos protegidos?
Pode armazenar memória?
Retenção e exclusão estão definidas?
Minimização e limitação de finalidade foram tratadas?

Quando há dados pessoais, conecte a avaliação à revisão de privacidade. Em contexto europeu, o GDPR é relevante para base legal, minimização, segurança, violações e DPIA quando necessário.

Etapa 5: defina a supervisão humana

Supervisão humana não significa ter uma pessoa perto do processo. Ela precisa ser específica o suficiente para mudar o resultado.

Para cada ação relevante, defina quem revisa, o que vê, qual decisão pode tomar, se pode rejeitar, editar, escalar ou pausar, se a aprovação fica em log, o que acontece se a pessoa não estiver disponível e se alguém pode parar o agente.

Deve haver aprovação quando a ação é difícil de reverter, afeta direitos ou acesso, movimenta dinheiro, muda status de RH, envia comunicação externa, altera registros legais ou contratuais, muda postura de segurança ou afeta infraestrutura de produção.

Supervisão fraca:

Há um humano no loop.

Supervisão útil:

Um supervisor de suporte deve aprovar reembolsos acima de CHF 100. A tela mostra solicitação do cliente, política recuperada, valor proposto, motivo, pedido de origem, flags de risco e trace ID. Aprovação ou rejeição é registrada antes da chamada à API de reembolso.

Esse nível de especificidade sobrevive à produção.

Etapa 6: pontue o impacto no negócio

Impacto no negócio descreve o que acontece se o agente falhar.

Pontuação	Impacto	Descrição
0	Mínimo	Pequeno incômodo ou saída fácil de corrigir
1	Baixo	Retrabalho interno, confusão limitada ou pequeno custo operacional
2	Moderado	Impacto em cliente, lacuna de evidência de compliance, perda financeira, exposição de dados ou interrupção de processo
3	Severo	Dano material jurídico, financeiro, de segurança, direitos, regulatório ou reputacional

Considere se o agente erra, age com excesso de confiança, segue prompt injection, chama a ferramenta certa com argumentos errados, expõe dados, pula aprovação, age em escala, falha em silêncio, não explica o ocorrido ou cria registros confiados por sistemas downstream.

Escala importa. Um rascunho ruim não é igual a 10.000 e-mails errados para clientes. Uma recomendação ruim não é igual a um gatilho autônomo que se repete a cada poucos minutos.

Etapa 7: atribua o nível final

Uma abordagem prática é pontuar autonomia, ferramentas, dados e impacto de 0 a 3, usando a maior pontuação e red flags.

Nível	Perfil típico	Postura de produção
Baixo	Responde ou recomenda, baixa sensibilidade, baixo impacto	Revisão padrão, owner definido, logging básico
Médio	Ferramentas de leitura, dados internos ou confidenciais, impacto limitado	Revisão segurança/privacidade, controle de acesso, monitoramento, orientação ao usuário
Alto	Ferramentas de escrita, alta autonomia, dados restritos, impacto em cliente ou regulatório	Revisão de arquitetura, aprovação, audit logs, testes, plano de incidente, aceitação de risco
Inaceitável sem redesenho	Ações irreversíveis de alto impacto, permissões excessivas, sem owner, sem logs, sem supervisão real ou base legal incerta	Não lançar antes do redesenho

A fórmula ajuda, mas não substitui julgamento. Um agente com baixa autonomia e acesso à folha de pagamento ainda exige revisão forte. Um agente sem dados sensíveis, mas com permissão para mudar firewall, não é baixo risco.

Checklist do gate de produção

Antes do lançamento, exija evidências:

Responsável de negócio e técnico.
Intake aprovado.
Entrada no inventário.
Matriz de permissões de ferramentas.
Classificação de dados e revisão de privacidade quando necessário.
Desenho da supervisão humana.
Plano de logging e rastreabilidade.
Testes de prompt injection e mau uso para agentes com ferramentas.
Plano de monitoramento e alertas.
Responsável por incidentes e caminho de escalada.
Data de revisão e gatilhos de reavaliação.

Agentes de alto risco também precisam de revisão de arquitetura, aceitação explícita do risco, testes de workflows de aprovação, cenários red team, rollback ou kill switch, change control para prompts, ferramentas, fontes de retrieval e políticas, além de regras de retenção de evidências.

Exemplo: agente de suporte para reembolso

Um agente de suporte pode ler histórico de pedidos, resumir mensagens, verificar políticas e preparar reembolsos.

Dimensão	Pontuação	Racional
Autonomia	2	Propõe e prepara ações, mas reembolsos exigem aprovação
Ferramentas	3	A API de reembolso altera registros financeiros
Dados	2	Dados de cliente e histórico de pedidos estão no escopo
Impacto	2	Reembolsos ou recusas erradas impactam cliente, finanças e compliance

Nível final: Alto.

Controles necessários:

Ferramenta de reembolso limitada ao escopo mínimo.
Limite de valor.
Aprovação humana acima de um valor definido.
Bloqueio automático de padrões incomuns.
Testes de prompt injection com mensagens e anexos de clientes.
Audit log para solicitação, política recuperada, decisão proposta, aprovação, chamada de ferramenta e resultado.
Owner de suporte e rota de incidente claros.

O objetivo não é bloquear sistemas úteis, mas tornar visíveis os controles antes de tocar clientes e dinheiro reais.

Exemplo: assistente de políticas de RH

Um assistente de RH responde perguntas de funcionários usando documentos aprovados. Ele não tem ferramentas de escrita nem acesso a arquivos individuais.

Dimensão	Pontuação	Racional
Autonomia	0	Apenas responde perguntas
Ferramentas	1	Recupera conteúdo aprovado
Dados	1	Usa políticas internas, não arquivos de funcionários
Impacto	1	Respostas erradas podem confundir, mas devem escalar para RH

Nível final: Baixo a médio, dependendo da audiência e dos temas.

Controles: fontes aprovadas, owner para atualização das políticas, links de fonte, escalada para temas trabalhistas, jurídicos, benefícios ou dados sensíveis, e logging de uso.

Base de referência

Este padrão se alinha ao NIST AI Risk Management Framework 1.0, NIST AI RMF Generative AI Profile, NIST AI 600-1, OWASP Top 10 for LLM Applications 2025, OWASP Agentic AI - Threats and Mitigations, EU AI Act, Regulation (EU) 2024/1689 e GDPR, Regulation (EU) 2016/679.

A lição prática é simples: avaliar agentes não deve ser documentação de modelo com outro nome. Deve conectar capacidades reais do agente a impacto de negócio e controles de produção.

Regra prática

Se um agente só responde, avalie qualidade e acesso a dados.

Se pode agir, avalie o caminho da ação.

Se pode agir sem esperar uma pessoa, avalie o modelo operacional.

E se ninguém consegue explicar quem é dono do agente, o que ele pode fazer, o que fez e como pará-lo, ele não está pronto para produção.