Skip to content
/ app Public

Framework de Mixture of Experts para Explicabilidade de Estados de Ansiedade

License

Notifications You must be signed in to change notification settings

fdhot/app

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Este notebook implementa um framework de Mixture of Experts (MoE) para melhorar a explicabilidade dos estados de ansiedade antes e após intervenções em diferentes grupos experimentais. O framework combina Modelos de Linguagem Grandes (LLMs) com inferência causal e um agente DDQN (Deep Q-Network Duplo) simplificado para potenciais recomendações de ação.

Estrutura do Fluxo de Trabalho

O notebook segue um fluxo de trabalho estruturado para análise de dados de intervenção de ansiedade:

  1. Carregamento e Validação de Dados: Carrega dados sintéticos de intervenção de ansiedade, valida sua estrutura, conteúdo e tipos de dados, tratando potenciais erros com elegância.

  2. Pré-processamento de Dados: Realiza codificação one-hot de características categóricas e escala características numéricas.

  3. Descoberta de Estrutura Causal (Baseada em Regressão): Utiliza regressão para inferir potenciais relações causais entre variáveis.

  4. Cálculo de Valores SHAP: Computa valores SHAP para avaliar a importância das características na previsão dos níveis de ansiedade pós-intervenção.

  5. Visualização de Dados: Gera gráficos KDE, Violin, Coordenadas Paralelas, Hipergrafo e Matriz de Correlação para facilitar a compreensão dos padrões nos dados.

  6. Resumo Estatístico: Realiza análise bootstrap e gera estatísticas resumidas para quantificar os efeitos da intervenção.

  7. Agente DDQN (Simplificado): Inclui um agente DDQN simplificado como um espaço reservado para potenciais recomendações de ação baseadas na análise.

  8. Relatório de Insights via LLM: Sintetiza descobertas usando Grok, Claude e Grok-Enhanced, enfatizando explicabilidade e a combinação de diferentes técnicas de análise.

Componentes Técnicos

Modelos de Linguagem

O framework integra três modelos de linguagem para análise e interpretação:

  • Grok-base: Fornece análise estatística robusta e relacionamentos causais potenciais
  • Claude 3.7 Sonnet: Foca em padrões visuais e importância de características
  • Grok-Enhanced: Adiciona interpretação nuançada de relacionamentos complexos

Métodos de Visualização

O notebook implementa várias técnicas de visualização:

  • Gráficos KDE: Comparam distribuições de ansiedade pré e pós-intervenção
  • Gráficos Violin: Detalham as formas das distribuições de ansiedade entre grupos
  • Coordenadas Paralelas: Mostram trajetórias individuais de estados de ansiedade pré e pós-intervenção
  • Hipergrafo: Identifica comunidades emergentes de participantes com padrões similares
  • Matriz de Correlação: Revela relações potencialmente causais entre variáveis

Métodos Analíticos

  • Descoberta de Estrutura Causal por Regressão: Uma abordagem baseada em regressão linear para inferência causal
  • Análise SHAP: Explica a contribuição de cada variável para os níveis de ansiedade pós-intervenção
  • Bootstrap Estatístico: Proporciona intervalos de confiança para estimativas robustas
  • DDQN Simplificado: Um agente de aprendizado por reforço demonstrativo para recomendações potenciais

Instalação e Dependências

O notebook requer as seguintes bibliotecas Python:

  • pandas
  • matplotlib
  • seaborn
  • networkx
  • shap
  • scikit-learn
  • numpy
  • plotly
  • scipy

Segurança e Utilização de API

O código inclui espaços reservados para chaves de API (não-funcionais) para Grok e Claude. Em um ambiente de produção, estas chaves deveriam ser gerenciadas com segurança através de variáveis de ambiente ou serviços de gerenciamento de segredos.

Saídas

O framework gera:

  1. Visualizações - armazenadas no diretório de saída especificado
  2. Estatísticas resumidas - salvas como arquivo de texto
  3. Relatório de insights combinado - integrando análises dos três modelos LLM

Limitações e Considerações

  • O agente DDQN é um espaço reservado simplificado e necessitaria adaptação significativa para aplicações do mundo real
  • Os dados utilizados são sintéticos; adaptações seriam necessárias para conjuntos de dados reais
  • As funções de análise de texto LLM são simuladas; em um ambiente de produção, seriam substituídas por chamadas de API reais

Autor

Hélio Craveiro Pessoa Júnior