Detecção de discurso de ódio em redes sociais utilizando deep learning

dc.contributor.advisor1Ciarelli, Patrick Marques
dc.contributor.advisor1IDhttps://orcid.org/0000000331774028
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1267950518719423
dc.contributor.authorVenturott, Lígia Iunes
dc.contributor.referee1Samatelo, Jorge Leonid Aching
dc.contributor.referee2Oliveira, Elias Silva de
dc.date.accessioned2024-05-30T00:52:44Z
dc.date.available2024-05-30T00:52:44Z
dc.date.issued2021-10-25
dc.description.abstractIn the last decade, online social networks went through a quick expansion. The main goal of these platforms is to allow the communication between people from different backgrounds, religions, cultures and countries. However, this new form of contact, allied to the feeling of anonymity and impunity of the digital enviroment, turned social networks into a favorable enviroment for disseminating hate speech, such as xenophobia, racism, sexism, homophobia, and others. Most platforms, such as Twitter and Facebook, explicitly forbid this kind of behaviour. However, the large volume of daily posts make manually detecting hate speech an almost impossible task. In this context, there is a need for automatic detection tools for hate speech in social networks, but most works focus on detecting of hateful content in English. This work develops a method for detecting hate speech in social networks focused on Portuguese, using deep neural networks as the main resource. To that end, first we identified the main issues regarding hate speech detection in Portuguese, and it was observed that there is a lack of labeled datasets for hate speech and offensive language in Portuguese. The few existing datasets consist of few documents, which makes the application of deep learning techniques difficult. In order to mitigate this problem, we propose using data augmentation techniques. Three techniques were selected from the literature and were applied in different scenarios, where we tried to identify in which cases these techniques would be the most beneficial. It was concluded that the data augmentation techniques selected can be helpful when applied to very reduced datasets, varying from 1,000 to 2,000 documents.
dc.description.resumoNa última década houve uma rápida expansão do uso das redes sociais online. Essas plataformas tem como objetivo permitir a comunicação e interação de pessoas de diferentes regiões, etnias, culturas e histórias. Porém, esse contato, somado à sensação de anonimato e impunidade do meio digital, gera nas redes sociais um ambiente propício para a disseminação do discurso de ódio, como xenofobia, racismo, sexismo, homofobia, entre outros. A maior parte das plataformas, como Twitter e Facebook, proíbem esse tipo de comportamento. Porém, a grande quantidade de publicações diárias torna a análise manual uma tarefa praticamente impossível. Esse contexto leva à necessidade de criação de ferramentas que possam detectar automaticamente discursos de ódio em redes sociais. Contudo, a maioria dos trabalhos atuais foca na criação de ferramentas de classificação para a língua inglesa. Esse trabalho propõe o desenvolvimento de um método para detecção de discurso de ódio em redes sociais para a língua portuguesa, usando como ferramenta principal redes neurais profundas. Para isso, foi feita uma análise tentando identificar os problemas envolvidos nessa tarefa, e foi detectada uma escassez em bases de dados rotuladas em português, o que dificulta a utilização de redes neurais profundas. Para amenizar esse problema, foi proposta a utilização de técnicas de aumento de dados. Três técnicas foram selecionadas da literatura e foram aplicadas em diversos cenários, tentando identificar em que cenários essas técnicas trazem mais benefícios. Concluiu-se que as técnicas de aumento de dados selecionadas podem trazer resultados positivos para bases de dados muito limitadas, com tamanho entre 1.000 e 2.000 documentos.
dc.formatText
dc.identifier.urihttps://dspace5.ufes.br/handle/10/15540
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseMestrado em Engenharia Elétrica
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica
dc.rightsopen access
dc.subjectDiscurso de ódio
dc.subjectredes sociais
dc.subjectredes neurais convolucionais
dc.subjectredes neurais recursivas
dc.subjectaumento de dados
dc.subject.br-rjbnsubject.br-rjbn
dc.subject.cnpqEngenharia Elétrica
dc.titleDetecção de discurso de ódio em redes sociais utilizando deep learning
dc.title.alternativetitle.alternative
dc.typemasterThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
LigiaIunesVenturott-2021-dissertacao.pdf
Tamanho:
8.54 MB
Formato:
Adobe Portable Document Format