Análise e Modelagem do Comportamento de Influenciadores de Público Infantil no Youtube

Resumo

O crescimento exponencial de conteúdos digitais voltados ao público infantil em plataformas como YouTube levanta preocupações críticas quanto à exposição de crianças a discursos tóxicos disfarçados de entretenimento [1,2,3]. No ciclo anterior desta pesquisa, buscou-se identificar e modelar a toxicidade em falas de influenciadores de jogos como Minecraft e Roblox. A metodologia envolveu a coleta via API, transcrição [4] e avaliação com ferramentas de Processamento de Linguagem Natural baseadas em Transformers [5,6]. Como principal contribuição metodológica deste primeiro ciclo, foi desenvolvido o Video Toxicity Model Graph (VTMG), uma representação probabilística capaz de estimar o próximo estado de um vídeo transcrito, considerando a divisão do áudio em Sliced Video Transcriptions (SVTs) e mapear as transições imediatas de toxicidade. Análises de agrupamento aplicadas aos VTMGs revelaram uma alta similaridade global entre os influenciadores, sugerindo um comportamento predominantemente não tóxico na média. Contudo, a mineração de sequências frequentes expôs um cenário mais complexo: rajadas de toxicidade não são eventos aleatórios, mas podem ser resultados de escaladas comportamentais que modelos de memória curta não captam integralmente.

Além disso, técnicas de modelagem de tópicos foram empregadas para caracterizar os padrões discursivos e identificar quais conteúdos estão associados aos episódios de toxicidade, permitindo distinguir não apenas a presença de toxicidade, mas também seus tipos e contextos no discurso de influenciadores infantis. Diante disto, a renovação deste projeto propõe o desenvolvimento de uma ferramenta de inferência de dinâmica de toxicidade. O objetivo é evoluir da análise descritiva para a preditiva, superando as limitações da primeira ordem e incorporando janelas de contexto expandidas. Essa nova abordagem visa detectar padrões complexos de linguagem e fornecer uma modelagem mais fiel dos riscos reais aos quais o público infantil está exposto, contribuindo para a criação de mecanismos de segurança digital mais robustos.

Objetivo

Aprimorar e validar uma metodologia de divisão de transcrição de vídeo para identificação de discurso inapropriado para crianças e adolescentes em ambientes digitais online.

Instituições Participantes

Universidade Federal de Minas Gerais (UFMG)
Pontifícia Universidade Católica de Minas Gerais (PUC MG)

Coordenador

Humberto Torres Marques Neto

Pesquisadores

Jussara M. Almeida (UFMG)
Marcos Gonçalves (UFMG)

Análise e Modelagem do Comportamento de Influenciadores de Público Infantil no Youtube

Resumo

Objetivo

Instituições Participantes

Coordenador

Pesquisadores

Projetos relacionados

Identificação de Perfis de Usuários a partir de Comentários Textuais

Avaliação da Confiabilidade de Respostas Geradas por Modelos de Linguagem por meio de Inferência em Linguagem Natural (NLI)

Explorando métodos de classificação preguiçosos no contexto do perspectivismo