Explorando métodos de classificação preguiçosos no contexto do perspectivismo

Resumo

Tarefas subjetivas de Processamento de Linguagem Natural (PLN), como a detecção de discurso de ódio ou de ironia, apresentam desafios únicos, pois a classificação depende fortemente do contexto cultural e da percepção individual. Uma característica inerente a esses problemas é o desacordo natural entre anotadores, reflexo de suas diferentes vivências e interpretações. Embora tradicionalmente seja tratado como ruído, esse desacordo pode conter informações valiosas.

O perspectivismo surge como uma forma de preservar múltiplas anotações em vez de depender apenas do voto majoritário, visando capturar diferentes visões e promover maior equidade. Essa abordagem busca mitigar vieses, especialmente contra grupos historicamente marginalizados. Trabalhos como o de Casola et al. demonstraram a eficácia de ensembles perspectivistas, em que modelos de linguagem (SLMs) são ajustados (fine-tuning) para cada perspectiva. Contudo, o ajuste fino de múltiplos SLMs impõe uma elevada demanda computacional. Pesquisas recentes indicam que combinar SLMs (sem fine-tuning) com modelos tradicionais de machine learning pode manter a eficácia, reduzindo substancialmente o custo computacional. No entanto, observou-se que abordagens baseadas em ensembles podem sofrer com a baixa representatividade de algumas perspectivas (baixa confiança nas predições), potencialmente comprometendo o princípio de equidade. Hipotetiza-se que isso decorre da descalibração dos modelos base, gerando probabilidades incompatíveis.

Experimentos preliminares sugerem que a calibração pode melhorar o equilíbrio entre as perspectivas. Neste contexto, este plano de trabalho propõe explorar melhorias na eficiência e equidade de abordagens perspectivistas, integrando modelos tradicionais de aprendizado de máquina com SLMs através de metamodelos preguiçosos (lazy) de classificação. A intuição é que modelos lazy podem realizar uma combinação mais adaptativa e “inteligente” dos modelos base, de acordo com o contexto da instância a ser classificada, mantendo a efetividade a um custo computacional menor e promovendo uma contribuição mais justa das diferentes perspectivas.

Objetivo

Investigar e desenvolver uma abordagem perspectivista, computacionalmente eficiente e equitativa, para a classificação de textos subjetivos, utilizando meta-modelos lazy para combinar SLMs e classificadores tradicionais.

Instituições Participantes

Universidade Federal da Fronteira do Sul (UFFS)

Coordenador

Guilherme Dal Bianco

Pesquisadores

Marcos Gonçalves (UFMG)
Valério Basile (University of Turin) - Colaborador Externo

Explorando métodos de classificação preguiçosos no contexto do perspectivismo

Resumo

Objetivo

Instituições Participantes

Coordenador

Pesquisadores

Projetos relacionados

Análise e Modelagem do Comportamento de Influenciadores de Público Infantil no Youtube

Novo CorPop Saúde: vocabulários e textos simplificados, comunicação acessível sobre cuidados, uso de medicamentos e termos de consentimento

Identificação de Perfis de Usuários a partir de Comentários Textuais