Agente de IA para Coleta Automatizada de Dados de Crédito

28 de November de 2025 • Tempo de leitura: 5 min

Como criar um agente de IA que automatiza a coleta de dados de crédito de consumidores.

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados, e demais requisitos funcionais para o Fluxo de Agentes "Coleta Automatizada de Dados de Crédito", uma solução de automação projetada para coletar dados de crédito de consumidores de forma contínua e precisa. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.

O objetivo principal é automatizar a coleta de dados de crédito de diferentes fontes confiáveis, garantindo a integração contínua e precisa desses dados nos sistemas dos bureaus de crédito.

2. Contexto e Problema

Cenário Atual

A coleta de dados de crédito de consumidores é um processo manual e lento, propenso a erros humanos e que necessita de atualização constante para garantir decisões precisas. Alguns dos problemas específicos enfrentados incluem:

  • Processos manuais e lentos para coleta de dados de crédito de consumidores.
  • Risco de erro humano na atualização de informações de crédito.
  • Necessidade de manter as informações de crédito sempre atualizadas para decisões precisas.

Problemas Identificados

  • Consumo de tempo: O processo manual é demorado, afetando a agilidade na tomada de decisões.
  • Risco de Erros: A intervenção humana pode introduzir erros que comprometem a qualidade dos dados.
  • Desatualização: Informações desatualizadas podem levar a decisões imprecisas sobre crédito.

3. Impactos Esperados

A implementação deste fluxo de automação visa alcançar os seguintes resultados:

  • Acelerar o processo de coleta de dados de crédito em pelo menos 70%.
  • Reduzir a taxa de erros humanos em atualizações de dados de crédito.
  • Garantir que as informações de crédito estejam sempre atualizadas para decisões mais precisas e rápidas.

4. Visão Geral da Solução

O agente de IA para coleta automatizada de dados de crédito automatiza a obtenção e atualização de informações de crédito de consumidores, integrando dados de múltiplas fontes confiáveis diretamente nos sistemas dos bureaus de crédito. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que este agente atue como um assistente eficiente e autônomo na gestão de dados de crédito.

A solução consiste em um fluxo de automação composto por 5 agentes de IA. O processo inicia com a preparação de parâmetros de coleta e termina com a preparação do payload para envio aos bureaus de crédito.

A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.

Agentes Função Principal
Agente Preparador de Parâmetros de Coleta de Crédito (RF 1) Definir fontes, escopo e preparar os payloads padronizados para consulta de dados de crédito de consumidores.
Agente de Execução de Chamada à API (Fontes de Dados de Crédito) (RF 2) Realizar chamadas às APIs das fontes confiáveis selecionadas para obter dados de crédito do(s) consumidor(es).
Agente de Normalização e Consolidação de Dados de Crédito (RF 3) Unificar e padronizar os dados brutos retornados pelas múltiplas fontes em um esquema canônico, com preservação de proveniência.
Agente de Verificação e Qualidade de Dados de Crédito (RF 4) Aplicar verificações, validações cruzadas e scoring de qualidade para assegurar precisão dos dados consolidados.
Agente de Preparação de Payload para Bureaus de Crédito (RF 5) Transformar os dados validados no formato exigido por cada bureau de crédito, com idempotência e versionamento do envio.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.

6. Requisitos Funcionais

RF 1. Agente Preparador de Parâmetros de Coleta de Crédito

1.1 Tarefa do Agente

Definir fontes, escopo e preparar os payloads padronizados para consulta de dados de crédito de consumidores.

1.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um objeto JSON com os identificadores do(s) consumidor(es) e preferências de coleta. Exemplo: {"consumidores":[{"cpf":"00000000000","nome":"Fulano de Tal","data_nascimento":"1990-05-10"}],"escopo":["dados_cadastrais","contas_credito","inadimplencias","consultas"],"prioridade":"alta","janela_temporal_meses":24}.

# 2. Objetivo
Definir fontes, escopo e preparar os payloads padronizados para consulta de dados de crédito de consumidores.

# 3. Regras que você deve seguir para gerar sua resposta
- Validar CPF com 11 dígitos numéricos; remover caracteres não numéricos; se ausente ou inválido, o consumidor deve ser marcado como inelegível e não incluído em payloads.
- Para cada item do escopo, selecionar ao menos uma fonte confiável do catálogo interno. Ex.: dados_cadastrais→fonte_cadastral_X; contas_credito→fonte_tradelines_Y.
- Para cada fonte, construir objeto com: fonte_id, endpoint, metodo, headers mínimos (Authorization com {{auth_token}} e Content-Type application/json), body específico com campos exigidos pela fonte.
- Se janela_temporal_meses não vier informada, definir padrão 24; replicar de forma consistente em todos os bodies aplicáveis.
- Preencher criterios_priorizacao em ordem decrescente de confiabilidade e profundidade histórica da fonte; manter ao menos um fallback para cada domínio do escopo quando disponível.
- Gerar chave_deduplicacao no formato "cpf:XXXXXXXXXXX:AAAA-MM-DD" (data de execução). Essa chave deve ser idêntica para todos os payloads de um mesmo consumidor e execução.
- Definir politica_rate_limit com max_por_minuto coerente ao pior limite dentre as fontes selecionadas e backoff_ms mínimo de 500.
- Quando consumidores>1, criar batching com tamanho_maximo≤limite da fonte (padrão 50 se desconhecido).
- Incluir nos bodies somente os campos estritamente necessários à coleta.
- Assegurar que a automatização da coleta multi-fontes esteja explicitamente refletida em fonte_alvos.
1.3 Configurações do Agente

1.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de um objeto JSON via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload do JSON na interface da Prototipe AI, para acelerar o processo de validação.
  • Tipo do input: O input inicial para o fluxo é um objeto JSON contendo identificadores de consumidores e preferências de coleta.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 10.000 caracteres.

1.3.2 Especificação do Output

  • Formato de output: O output deve ser um objeto JSON contendo os parâmetros de coleta, incluindo fonte_alvos, chave_deduplicacao, criterios_priorizacao, e politica_rate_limit.
  • Exemplo de Estrutura de Output:
     {"fonte_alvos":[{"fonte_id":"fonte_cadastral_X","endpoint":"/v1/credit/consumers","metodo":"POST","headers":{"Authorization":"Bearer {{auth_token}}","Content-Type":"application/json"},"body":{"cpf":"00000000000","janela_temporal_meses":24,"itens":["dados_cadastrais"]},"timeout_ms":15000,"retentativas":2,"versao":"v1"}],"chave_deduplicacao":"cpf:00000000000:2025-11-28","criterios_priorizacao":["fonte_cadastral_X"],"politica_rate_limit":{"max_por_minuto":60,"backoff_ms":500}}
  • Número de caracteres esperado: O JSON gerado deve ser claro e direto, com um tamanho estimado em 2.000 caracteres.

1.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

1.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

1.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Execução de Chamada à API (RF 2).

1.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Execução de Chamada à API (RF 2).

RF 2. Agente de Execução de Chamada à API (Fontes de Dados de Crédito)

2.1 Tarefa do Agente

Realizar chamadas às APIs das fontes confiáveis selecionadas para obter dados de crédito do(s) consumidor(es).

2.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um objeto JSON gerado pelo agente preparador, contendo a lista fonte_alvos com endpoint, método, headers, body, timeout e retentativas para cada fonte.

# 2. Objetivo
Realizar chamadas às APIs das fontes confiáveis selecionadas para obter dados de crédito do(s) consumidor(es).

# 3. Regras que você deve seguir para gerar sua resposta
- Este agente não precisa de instruções para chamadas ao LLM, pois sua única função é executar a chamada à API cujo payload ele já recebe pronto.
- Tratar e registrar quaisquer falhas de chamada, como timeouts ou erros de autenticação.
- Coletar e armazenar os dados retornados para processamento posterior.
2.3 Configurações do Agente

2.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
  • Tipo do input: Este agente deve ser apto a receber como input um objeto JSON contendo os parâmetros de coleta preparados pelo agente anterior.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 10.000 caracteres.

2.3.2 Especificação do Output

  • Formato de output: O output deve ser um objeto JSON contendo os resultados das chamadas API, incluindo status de sucesso ou falha para cada fonte.
  • Exemplo de Estrutura de Output:
     {"resultados":[{"fonte_id":"fonte_cadastral_X","status_http":200,"tempo_ms":842,"dados":{...}}],"falhas":[{"fonte_id":"fonte_Z","status_http":504,"erro":"timeout"}],"resumo":{"total_chamadas":3,"sucesso":2,"falhas":1}}
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 3.000 caracteres.

2.3.3 Parâmetros de Geração

  • Modelo: Não se aplica (uso de ferramenta)
  • Temperatura: Não se aplica

2.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: O agente deve se conectar às APIs externas das fontes de dados de crédito.

2.3.5 Memória

2.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Normalização e Consolidação de Dados de Crédito (RF 3).

RF 3. Agente de Normalização e Consolidação de Dados de Crédito

3.1 Tarefa do Agente

Unificar e padronizar os dados brutos retornados pelas múltiplas fontes em um esquema canônico, com preservação de proveniência.

3.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um objeto JSON com campos resultados (lista de respostas por fonte) e falhas (lista de falhas por fonte), conforme output do executor de API.

# 2. Objetivo
Unificar e padronizar os dados brutos retornados pelas múltiplas fontes em um esquema canônico, com preservação de proveniência.

# 3. Regras que você deve seguir para gerar sua resposta
- Organizar dados nos domínios: dados_cadastrais (enderecos[{logradouro,numero,complemento,bairro,cidade,uf,cep}], telefones[{ddd,numero,tipo}], emails[{endereco}]), contas_credito[{instituicao,tipo_conta,limite_total,saldo_atual,situacao,abertura,encerramento?,moeda,atualizado_em,fonte}].
- Para cada item incluído no canônico, registrar proveniencia.mapa com {campo, fonte, quando}.
- Se múltiplas fontes informarem o mesmo atributo com valores distintos, escolher o valor com timestamp atual mais recente.
- Quando campo obrigatório estiver ausente, preencher com null e adicionar em lacunas_informacao.
- Garantir que o canônico contenha somente campos válidos e padronizados.
3.3 Configurações do Agente

3.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
  • Tipo do input: Este agente deve ser apto a receber um objeto JSON com campos resultados e falhas, conforme output do executor de API.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 10.000 caracteres.

3.3.2 Especificação do Output

  • Formato de output: O output deve ser um objeto JSON canônico, com dados normalizados e proveniência dos dados.
  • Exemplo de Estrutura de Output:
     {"consumidor":{"cpf":"00000000000","nome":"Fulano de Tal","data_nascimento":"1990-05-10"},"canonico":{"dados_cadastrais":{"enderecos":[...],"telefones":[...],"emails":[...]},"contas_credito":[{"instituicao":"","tipo_conta":"cartao","limite_total":0,"saldo_atual":0,"situacao":"ativa","abertura":"AAAA-MM-DD","moeda":"BRL","atualizado_em":"AAAA-MM-DD","fonte":"fonte_tradelines_Y"}]},"proveniencia":{"mapa":[{"campo":"contas_credito[0]","fonte":"fonte_tradelines_Y","quando":"AAAA-MM-DD"}]},"lacunas_informacao":[{"campo":"dados_cadastrais.enderecos[0].cep","motivo":"ausente","severidade":"media"}]}
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 4.000 caracteres.

3.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

3.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

3.3.5 Memória

3.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Verificação e Qualidade de Dados de Crédito (RF 4).

RF 4. Agente de Verificação e Qualidade de Dados de Crédito

4.1 Tarefa do Agente

Aplicar verificações, validações cruzadas e scoring de qualidade para assegurar precisão dos dados consolidados.

4.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um objeto JSON canônico consolidado, incluindo proveniencia e lacunas_informacao, conforme output do agente de normalização.

# 2. Objetivo
Aplicar verificações, validações cruzadas e scoring de qualidade para assegurar precisão dos dados consolidados.

# 3. Regras que você deve seguir para gerar sua resposta
- Saldo_atual ≥ 0, salvo se situacao indicar atraso severo/chargeoff; limite_total ≥ saldo_atual.
- Datas de abertura ≤ data atual; datas de encerramento ≥ abertura.
- Se houver múltiplos endereços, verificar consistência mínima: mesma cidade+UF ou justificativa de mudança.
- Para cada domínio presente no escopo original, exigir ao menos um registro válido ou lacuna_informacao justificada.
- Calcular confianca ∈[0,1] combinando: frescor, concordância entre fontes, completude.
4.3 Configurações do Agente

4.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 3).
  • Tipo do input: Este agente deve ser apto a receber um objeto JSON canônico consolidado, incluindo proveniencia e lacunas_informacao.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 10.000 caracteres.

4.3.2 Especificação do Output

  • Formato de output: O output deve ser um objeto JSON contendo dados validados, relatório de qualidade, discrepâncias e score de confiança.
  • Exemplo de Estrutura de Output:
     {"dados_validados":{...},"relatorio_qualidade":{"erros":[{"campo":"contas_credito[0].saldo_atual","tipo":"valor_incoerente","descricao":"Saldo negativo sem flag de chargeoff"}],"avisos":[{"campo":"dados_cadastrais.endereco","tipo":"lacuna","descricao":"CEP ausente"}],"regras_aplicadas":["coerencia_numerica_v1","coerencia_temporal_v1"]},"discrepancias":[{"tipo":"divergencia_valor","campo":"limite_total","fontes_envovidas":["fonte_A","fonte_B"],"criterio_selecao":"mais_recente"}],"confianca":0.92,"validacao_aprovada":true}
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 4.000 caracteres.

4.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

4.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

4.3.5 Memória

4.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Preparação de Payload para Bureaus de Crédito (RF 5).

RF 5. Agente de Preparação de Payload para Bureaus de Crédito

5.1 Tarefa do Agente

Transformar os dados validados no formato exigido por cada bureau de crédito, com idempotência e versionamento do envio.

5.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um objeto JSON com dados_validados, relatorio_qualidade, confianca e o identificador do bureau de destino.

# 2. Objetivo
Transformar os dados validados no formato exigido por cada bureau de crédito, com idempotência e versionamento do envio.

# 3. Regras que você deve seguir para gerar sua resposta
- Escolher o mapa de campos do bureau informado, convertendo nomes e formatos conforme especificação do bureau.
- Idempotency_key = cpf + data de execução (AAAA-MM-DD) + versão do template.
- Verificar presença e formato de: CPF, data_nascimento, ao menos um endereço com UF e cidade.
- Apenas definir pronto_para_envio=true quando validacao_aprovada=true e confianca≥0.70.
5.3 Configurações do Agente

5.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 4).
  • Tipo do input: Este agente deve ser apto a receber um objeto JSON com dados_validados, relatorio_qualidade, confianca e o identificador do bureau de destino.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 10.000 caracteres.

5.3.2 Especificação do Output

  • Formato de output: O output deve ser um objeto JSON pronto para envio, incluindo idempotency_key, lotes, criterios_transformacao, e status de pronto_para_envio.
  • Exemplo de Estrutura de Output:
     {"bureau":"bureau_alpha","versao_payload":"1.0.0","idempotency_key":"cpf:00000000000:2025-11-28:v1","lotes":[{"sequencia":1,"itens":[{...}]}],"criterios_transformacao":["mapa_campos_v1"],"pronto_para_envio":true,"motivos_bloqueio":[]}
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 4.000 caracteres.

5.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

5.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Esse agente, após realizar o processamento, irá enviar sua resposta para os sistemas dos bureaus de crédito definidos no campo "bureau". Esse envio deve ser configurado manualmente na interface do fluxo na plataforma da Prototipe AI, no item "Envio da Resposta do Agente" e não será realizado por essa configuração inicial.

5.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.

5.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo. O JSON gerado é o resultado que deve ser disponibilizado ao usuário.

© 2025 prototipe.ai. Todos os direitos reservados.