Agente de IA para Análise de Dados de Avaliações Psicopedagógicas

02 de December de 2025 • Tempo de leitura: 5 min

Como criar um agente de IA que interpreta dados de avaliações psicopedagógicas para identificar padrões.

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados, consulta a documentos e demais requisitos funcionais para o Agente de IA para Análise de Dados de Avaliações Psicopedagógicas. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.

O objetivo principal é interpretar dados de avaliações psicopedagógicas para identificar padrões e fornecer insights sobre o desenvolvimento cognitivo e emocional dos alunos, auxiliando educadores no planejamento de intervenções eficazes.

2. Contexto e Problema

Cenário Atual

O volume de dados psicopedagógicos é complexo e extenso, dificultando a análise manual e a identificação de padrões relevantes. Educadores enfrentam a falta de insights claros sobre o desenvolvimento cognitivo e emocional dos alunos, tornando desafiador planejar intervenções eficazes.

  • Volume de dados psicopedagógicos complexos que dificultam a análise manual.
  • Falta de insights claros sobre o desenvolvimento cognitivo e emocional dos alunos.
  • Dificuldade em identificar padrões relevantes nos dados de avaliações.

3. Impactos Esperados

A implementação deste agente de IA visa alcançar os seguintes resultados:

  • Automatizar a análise de dados psicopedagógicos, reduzindo o tempo e esforço necessários para obter insights valiosos.
  • Fornecer insights acionáveis sobre o desenvolvimento cognitivo e emocional dos alunos.
  • Apoiar educadores no planejamento de intervenções pedagógicas mais eficazes e personalizadas.

4. Visão Geral da Solução

O agente de IA para análise de dados de avaliações psicopedagógicas interpreta grandes volumes de dados, identifica padrões e gera insights sobre o desenvolvimento cognitivo e emocional dos alunos. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na análise de dados psicopedagógicos.

A solução consiste em um fluxo de automação composto por cinco agentes de IA. O processo inicia com a validação e preparação dos dados e termina com a geração de um relatório estruturado para educadores.

A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.

Agentes Função Principal
Agente de Validação e Preparação de Dados (RF 1) Validar e preparar dados de avaliações psicopedagógicas para análise.
Agente de Análise Estatística e Identificação de Padrões (RF 2) Calcular estatísticas descritivas, correlações e tendências temporais para variáveis cognitivas e emocionais.
Agente de Benchmark e Comparativos Agente Condicionado (RF 3) Comparar resultados dos alunos com benchmarks/coortes de referência.
Agente de Geração de Insights Psicopedagógicos (RF 4) Transformar achados estatísticos em insights acionáveis e recomendações pedagógicas.
Agente de Geração de Relatório Estruturado (RF 5) Compilar relatório em Markdown com narrativa clara para educadores.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.

6. Requisitos Funcionais

RF 1. Agente de Validação e Preparação de Dados

1.1 Tarefa do Agente

Validar estrutura e qualidade dos dados de avaliações psicopedagógicas, padronizar escalas e preparar um dataset coerente para análise.

1.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo uma planilha/CSV com avaliações psicopedagógicas. Esta planilha contém observações por aluno por data, com colunas de identificadores, datas, variáveis cognitivas e emocionais.

# 2. Objetivo
Validar a estrutura e qualidade dos dados, padronizar escalas e preparar um dataset coerente para análise.

# 3. Regras que você deve seguir para gerar sua resposta
- Exigir colunas mínimas: id_aluno (string), data_avaliacao (YYYY-MM-DD), pelo menos 1 variável cognitiva e 1 emocional; se ausente, definir schema_validado=false e listar motivos_falha_schema.
- Converter datas para ISO (YYYY-MM-DD); registros com data inválida devem ser movidos para registros_invalidos e excluídos de dados_normalizados.
- Deduplicar registros por (id_aluno, data_avaliacao, origem_avaliacao se existir) mantendo o de preenchimento mais completo (menor proporção de NA); reportar duplicidades no relatorio_qualidade.
- Padronizar escalas: se escala_por_variavel informa intervalos (ex.: 1-5 Likert), normalizar para 0-100 usando min-max; se não informado, inferir: valores inteiros entre 1-5 ou 1-7 => Likert; percentuais 0-100 manter; notas 0-10 escalar para 0-100.
- Tratar faltantes: calcular pct_faltantes por variável; se pct_faltantes>40%, marcar variavel_status="baixa_disponibilidade"; não imputar valores, apenas sinalizar.
- Outliers: para variáveis contínuas padronizadas (0-100), marcar como outlier valores <0 ou >100; recortar em [0,100] e registrar em transformacoes_aplicadas.
- Tipagem: classificar variáveis como {ordinal, continua, categórica} pela escala e cardinalidade; registrar em dicionario_variaveis.tipo_dado.
- Identificadores: manter id_aluno como string; se houver nome_aluno, gerar campo pseudonimo (iniciais + hash curto) e remover nome completo de dados_normalizados, preservando apenas pseudonimo.
- Emitir relatorio_qualidade com: total_registros_entrada, total_validos, total_invalidos, pct_faltantes_por_variavel, n_outliers_tratados, n_duplicidades_resolvidas.
- Produzir transformacoes_aplicadas como lista ordenada de etapas com {etapa, variaveis_afetadas, parametros, n_registros_afetados}. 
1.3 Configurações do Agente

1.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de uma planilha/CSV com avaliações psicopedagógicas via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload do arquivo na interface da Prototipe AI, para acelerar o processo de validação.
  • Tipo do input: O input inicial para o fluxo é uma planilha/CSV com dados de avaliações psicopedagógicas.
  • Formatos Suportados: Esse agente deve ser capaz de receber dados nos formatos: .csv, .xls, .xlsx.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 100.000 caracteres.

1.3.2 Especificação do Output

  • Formato de output: O output deve ser um arquivo no formato JSON contendo: schema_validado, motivos_falha_schema, dados_normalizados, relatorio_qualidade, transformacoes_aplicadas, dicionario_variaveis, chaves_registro.
  • Exemplo de Estrutura de Output:
     {
      "schema_validado": true,
      "motivos_falha_schema": [],
      "dados_normalizados": [...],
      "relatorio_qualidade": {
        "total_registros_entrada": 1000,
        "total_validos": 980,
        "total_invalidos": 20,
        "pct_faltantes_por_variavel": {...},
        "n_outliers_tratados": 5,
        "n_duplicidades_resolvidas": 3
      },
      "transformacoes_aplicadas": [...],
      "dicionario_variaveis": {...},
      "chaves_registro": {"id_aluno": "string", "data_avaliacao": "string"}
    } 
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 5.000 caracteres, variando conforme a complexidade dos dados processados.

1.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

1.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

1.3.5 Memória

1.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Análise Estatística e Identificação de Padrões (RF 2).

RF 2. Agente de Análise Estatística e Identificação de Padrões

2.1 Tarefa do Agente

Calcular estatísticas descritivas, correlações e tendências temporais para variáveis cognitivas e emocionais.

2.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um JSON contendo dados_normalizados, dicionario_variaveis e chaves_registro, preparados pelo agente anterior.

# 2. Objetivo
Calcular estatísticas descritivas, correlações e tendências temporais para variáveis cognitivas e emocionais.

# 3. Regras que você deve seguir para gerar sua resposta
- Estatística descritiva: para variáveis contínuas (0-100) calcular média, mediana, desvio_padrao, p10, p25, p75, p90; para ordinais apresentar mediana e distribuição (frequências), representando percentis quando possível.
- Correlações: usar Spearman para ordinais/categóricas ordenáveis e Pearson para contínuas; reportar somente pares com |r|>=0.30; incluir n_usado e metodo no output.
- Mínimo amostral: se n<30 para uma estatística global, marcar como baixa_confianca=true para aquela variável/pareamento.
- Tendências temporais: por aluno com ≥3 pontos no tempo, ajustar linha por data_avaliacao (em ordem cronológica) e classificar direção: melhora se inclinação>=+5 pontos por semestre; queda se <=-5; caso contrário, estável. Também calcular tendência agregada no grupo.
- Discrepâncias cog_vs_emoc: padronizar cada variável por z-score no grupo (média 0, desvio 1) e comparar médias z de conjuntos cognitivo vs emocional por aluno; discrepância relevante se |delta_z|>=1.0, sinalizando area_predominante (cognitivo ou emocional).
- Documentar critérios e limiares usados no campo parametros_utilizados do output. 
2.3 Configurações do Agente

2.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 1).
  • Tipo do input: Este agente deve ser apto a receber como input um JSON contendo os dados_normalizados preparados pelo agente anterior.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json (JSON).
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 10.000 caracteres.

2.3.2 Especificação do Output

  • Formato de output: O output deve ser um arquivo no formato JSON contendo: estatisticas_descritivas, correlacoes_relevantes, tendencias_temporais, discrepancias_cog_emoc, confiabilidade_medidas, parametros_utilizados.
  • Exemplo de Estrutura de Output:
     {
      "estatisticas_descritivas": {...},
      "correlacoes_relevantes": [...],
      "tendencias_temporais": [...],
      "discrepancias_cog_emoc": [...],
      "confiabilidade_medidas": [...],
      "parametros_utilizados": {...}
    } 
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 7.000 caracteres, variando conforme a complexidade dos dados processados.

2.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

2.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

2.3.5 Memória

2.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Geração de Insights Psicopedagógicos (RF 4).

RF 3. Agente de Benchmark e Comparativos Agente Condicionado

3.1 Tarefa do Agente

Comparar resultados dos alunos com benchmarks/coortes de referência quando fornecidos.

3.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo dados_normalizados, dicionario_variaveis do Agente 1, estatisticas_descritivas do Agente 2, e uma tabela_benchmark com percentis por variável.

# 2. Objetivo
Comparar os resultados dos alunos com benchmarks/coortes de referência, quando fornecidos.

# 3. Regras que você deve seguir para gerar sua resposta
- Aplicabilidade: só comparar variáveis com mesma escala e definição; se dicionario_variaveis.escala != benchmark.escala, marcar comparacao_aplicavel=false.
- Seleção de faixa: usar faixa etária/série correspondente; se ausente, usar benchmark geral e marcar faixa_substituida=true.
- Posição percentil: estimar por interpolação linear entre percentis conhecidos; rotular abaixo_do_esperado se p75.
- Gaps: calcular distância para p50 e p75 em pontos (0-100); incluir no output por aluno/variável.
- Sinalizar limitações: se n_benchmark<100, adicionar alerta_limitação_benchmark no resultado. 
3.3 Configurações do Agente

3.3.1 Condições de Ativação

Este agente é acionado somente se a seguinte condição for atendida:

  • O campo inclui_benchmark_referencia está presente e é true.

3.3.2 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado condicionalmente após a conclusão do agente anterior (RF 2), apenas se benchmarks de referência forem incluídos.
  • Tipo do input: Este agente deve ser apto a receber dados_normalizados e dicionario_variaveis do Agente 1, estatisticas_descritivas do Agente 2, e uma tabela_benchmark.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs nos formatos: .json (JSON).
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input combinado de até 15.000 caracteres.

3.3.3 Especificação do Output

  • Formato de output: O output deve ser um arquivo no formato JSON contendo: comparativos_por_variavel, classificacao_relativa, gaps, observacoes_benchmark.
  • Exemplo de Estrutura de Output:
     {
      "comparativos_por_variavel": [...],
      "classificacao_relativa": [...],
      "gaps": [...],
      "observacoes_benchmark": [...]
    } 
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 6.000 caracteres, variando conforme a complexidade dos dados processados.

3.3.4 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

3.3.5 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

3.3.6 Memória

3.3.7 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Geração de Insights Psicopedagógicos (RF 4).

RF 4. Agente de Geração de Insights Psicopedagógicos

4.1 Tarefa do Agente

Transformar achados estatísticos em insights acionáveis e recomendações pedagógicas, evitando linguagem diagnóstica clínica.

4.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo achados dos agentes anteriores: estatisticas_descritivas, correlacoes_relevantes, tendencias_temporais, discrepancias_cog_emoc e, se existir, comparativos_por_variavel.

# 2. Objetivo
Transformar achados estatísticos em insights acionáveis e recomendações pedagógicas, evitando linguagem diagnóstica clínica.

# 3. Regras que você deve seguir para gerar sua resposta
- Evitar rótulos clínicos; usar linguagem descritiva focada em comportamentos e desempenhos observáveis.
- Priorização: classificar urgencia=alta se tendência de queda ≤-5 pontos/semestre por 2 ciclos consecutivos ou se discrepancia |delta_z|>=1.0; impacto_estimado=alto se a variável afetada tiver alta correlação (|r|>=0.40) com desfechos acadêmicos medidos no dataset.
- Recomendações: para cada insight, propor 1–3 intervenções pedagógicas específicas, ex.: prática distribuída, reforço positivo, rotina de autorregulação; vincular cada intervenção a um indicador_monitoramento (métrica em 0-100) e meta (ex.: +10 pontos em 8 semanas).
- Evidências: referenciar explicitamente os campos de origem (ex.: correlacoes_relevantes[pare_i], tendencias_temporais[aluno_j]).
- Ética/privacidade: não incluir nomes completos; usar pseudonimos; não inferir condições médicas; sinalizar baixa_confianca quando n<30 ou quando pct_faltantes>40% nas variáveis base do insight.
- Escopo: se não houver dados temporais suficientes (≤2 pontos), não gerar insights de tendência; registrar escopo_limites correspondente. 
4.3 Configurações do Agente

4.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 2 ou RF 3).
  • Tipo do input: Este agente deve ser apto a receber achados dos agentes anteriores, incluindo estatisticas_descritivas, correlacoes_relevantes, tendencias_temporais, discrepancias_cog_emoc e, se existir, comparativos_por_variavel.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json (JSON).
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input combinado de até 12.000 caracteres.

4.3.2 Especificação do Output

  • Formato de output: O output deve ser um arquivo no formato JSON contendo: insights_acionaveis, mapa_forcas_dificuldades, riscos_e_cuidados, escopo_limites.
  • Exemplo de Estrutura de Output:
     {
      "insights_acionaveis": [...],
      "mapa_forcas_dificuldades": [...],
      "riscos_e_cuidados": [...],
      "escopo_limites": [...]
    } 
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 8.000 caracteres, variando conforme a complexidade dos dados processados.

4.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

4.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

4.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Geração de Relatório Estruturado (RF 5).

4.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Geração de Relatório Estruturado (RF 5).

RF 5. Agente de Geração de Relatório Estruturado

5.1 Tarefa do Agente

Compilar relatório em Markdown com narrativa clara para educadores, incluindo sumário executivo, achados e recomendações.

5.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um JSON de insights_acionaveis, mapa_forcas_dificuldades e anexos estatísticos dos agentes anteriores.

# 2. Objetivo
Compilar relatório em Markdown com narrativa clara para educadores, incluindo sumário executivo, achados e recomendações.

# 3. Regras que você deve seguir para gerar sua resposta
- Estrutura fixa das seções conforme expected_output; incluir bullets claros e tabelas compactas (máx. 15 linhas por tabela no corpo; excedente nos Anexos).
- Redação: objetiva, sem jargões clínicos; foco em ações pedagógicas e monitoramento; tom respeitoso e inclusivo.
- Identificação: usar apenas pseudonimos/IDs; remover qualquer dado pessoal sensível do texto.
- Sumário Executivo: apresentar 3–5 pontos chave (tendências, discrepâncias, correlações relevantes) e 3 ações prioritárias com prazos.
- Metodologia: descrever origens dos dados, regras de normalização (0–100), limiares usados (|r|>=0.30; tendência ±5 pontos/semestre) e limitações (n<30, faltantes>40%).
- Recomendações: para cada ação, explicitar indicador, baseline, meta, prazo e responsável_sugerido (ex.: professor_regente, orientacao).
- Anexos: incluir tabelas de estatisticas_descritivas, lista de correlacoes_relevantes com método e n, e descrição dos parametros_utilizados. 
5.3 Configurações do Agente

5.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 4).
  • Tipo do input: Este agente deve ser apto a receber um JSON de insights_acionaveis, mapa_forcas_dificuldades e anexos estatísticos dos agentes anteriores.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json (JSON).
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 15.000 caracteres.

5.3.2 Especificação do Output

  • Formato de output: O output deve ser um relatório em formato Markdown, com seções claramente definidas: 1) Sumário Executivo; 2) Metodologia e Limitações; 3) Achados Principais; 4) Recomendações e Plano de Acompanhamento; 5) Indicadores e Metas; 6) Considerações Éticas e Privacidade; 7) Anexos Técnicos.
  • Exemplo de Estrutura de Output:
     # Sumário Executivo
    - Ponto chave 1
    - Ponto chave 2
    
    # Metodologia e Limitações
    Descrição...
    
    # Achados Principais
    - Achado 1
    - Achado 2
    
    # Recomendações e Plano de Acompanhamento
    - Ação 1
    - Ação 2
    
    # Indicadores e Metas
    - Indicador 1
    - Indicador 2
    
    # Considerações Éticas e Privacidade
    - Consideração 1
    
    # Anexos Técnicos
    - Anexo 1
    - Anexo 2 
  • Número de caracteres esperado: O relatório final terá um tamanho aproximado de 10.000 caracteres, variando conforme a complexidade dos dados processados.

5.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

5.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

5.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente é o resultado final e não é passada para outros agentes internos.

5.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo. O relatório gerado é o resultado que deve ser disponibilizado ao usuário.

© 2025 prototipe.ai. Todos os direitos reservados.