Explorando métodos de classificação preguiçosos no contexto do perspectivismo
Resumo
Tarefas subjetivas de Processamento de Linguagem Natural (PLN), como a detecção de discurso de ódio ou de ironia, apresentam desafios únicos, pois a classificação depende fortemente do contexto cultural e da percepção individual. Uma característica inerente a esses problemas é o desacordo natural entre anotadores, reflexo de suas diferentes vivências e interpretações. Embora tradicionalmente seja tratado como ruído, esse desacordo pode conter informações valiosas.
O perspectivismo surge como uma forma de preservar múltiplas anotações em vez de depender apenas do voto majoritário, visando capturar diferentes visões e promover maior equidade. Essa abordagem busca mitigar vieses, especialmente contra grupos historicamente marginalizados. Trabalhos como o de Casola et al. demonstraram a eficácia de ensembles perspectivistas, em que modelos de linguagem (SLMs) são ajustados (fine-tuning) para cada perspectiva. Contudo, o ajuste fino de múltiplos SLMs impõe uma elevada demanda computacional. Pesquisas recentes indicam que combinar SLMs (sem fine-tuning) com modelos tradicionais de machine learning pode manter a eficácia, reduzindo substancialmente o custo computacional. No entanto, observou-se que abordagens baseadas em ensembles podem sofrer com a baixa representatividade de algumas perspectivas (baixa confiança nas predições), potencialmente comprometendo o princípio de equidade. Hipotetiza-se que isso decorre da descalibração dos modelos base, gerando probabilidades incompatíveis.
Experimentos preliminares sugerem que a calibração pode melhorar o equilíbrio entre as perspectivas. Neste contexto, este plano de trabalho propõe explorar melhorias na eficiência e equidade de abordagens perspectivistas, integrando modelos tradicionais de aprendizado de máquina com SLMs através de metamodelos preguiçosos (lazy) de classificação. A intuição é que modelos lazy podem realizar uma combinação mais adaptativa e “inteligente” dos modelos base, de acordo com o contexto da instância a ser classificada, mantendo a efetividade a um custo computacional menor e promovendo uma contribuição mais justa das diferentes perspectivas.
Objetivo
Investigar e desenvolver uma abordagem perspectivista, computacionalmente eficiente e equitativa, para a classificação de textos subjetivos, utilizando meta-modelos lazy para combinar SLMs e classificadores tradicionais.
Instituições Participantes
Universidade Federal da Fronteira do Sul (UFFS)
Coordenador
Pesquisadores
Valério Basile (University of Turin) - Colaborador Externo