Detecção de discurso de ódio em redes sociais utilizando deep learning

Venturott, Lígia Iunes

Detecção de discurso de ódio em redes sociais utilizando deep learning

dc.contributor.advisor1	Ciarelli, Patrick Marques
dc.contributor.advisor1ID	https://orcid.org/0000000331774028
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/1267950518719423
dc.contributor.author	Venturott, Lígia Iunes
dc.contributor.referee1	Samatelo, Jorge Leonid Aching
dc.contributor.referee2	Oliveira, Elias Silva de
dc.date.accessioned	2024-05-30T00:52:44Z
dc.date.available	2024-05-30T00:52:44Z
dc.date.issued	2021-10-25
dc.description.abstract	In the last decade, online social networks went through a quick expansion. The main goal of these platforms is to allow the communication between people from different backgrounds, religions, cultures and countries. However, this new form of contact, allied to the feeling of anonymity and impunity of the digital enviroment, turned social networks into a favorable enviroment for disseminating hate speech, such as xenophobia, racism, sexism, homophobia, and others. Most platforms, such as Twitter and Facebook, explicitly forbid this kind of behaviour. However, the large volume of daily posts make manually detecting hate speech an almost impossible task. In this context, there is a need for automatic detection tools for hate speech in social networks, but most works focus on detecting of hateful content in English. This work develops a method for detecting hate speech in social networks focused on Portuguese, using deep neural networks as the main resource. To that end, first we identified the main issues regarding hate speech detection in Portuguese, and it was observed that there is a lack of labeled datasets for hate speech and offensive language in Portuguese. The few existing datasets consist of few documents, which makes the application of deep learning techniques difficult. In order to mitigate this problem, we propose using data augmentation techniques. Three techniques were selected from the literature and were applied in different scenarios, where we tried to identify in which cases these techniques would be the most beneficial. It was concluded that the data augmentation techniques selected can be helpful when applied to very reduced datasets, varying from 1,000 to 2,000 documents.
dc.description.resumo	Na última década houve uma rápida expansão do uso das redes sociais online. Essas plataformas tem como objetivo permitir a comunicação e interação de pessoas de diferentes regiões, etnias, culturas e histórias. Porém, esse contato, somado à sensação de anonimato e impunidade do meio digital, gera nas redes sociais um ambiente propício para a disseminação do discurso de ódio, como xenofobia, racismo, sexismo, homofobia, entre outros. A maior parte das plataformas, como Twitter e Facebook, proíbem esse tipo de comportamento. Porém, a grande quantidade de publicações diárias torna a análise manual uma tarefa praticamente impossível. Esse contexto leva à necessidade de criação de ferramentas que possam detectar automaticamente discursos de ódio em redes sociais. Contudo, a maioria dos trabalhos atuais foca na criação de ferramentas de classificação para a língua inglesa. Esse trabalho propõe o desenvolvimento de um método para detecção de discurso de ódio em redes sociais para a língua portuguesa, usando como ferramenta principal redes neurais profundas. Para isso, foi feita uma análise tentando identificar os problemas envolvidos nessa tarefa, e foi detectada uma escassez em bases de dados rotuladas em português, o que dificulta a utilização de redes neurais profundas. Para amenizar esse problema, foi proposta a utilização de técnicas de aumento de dados. Três técnicas foram selecionadas da literatura e foram aplicadas em diversos cenários, tentando identificar em que cenários essas técnicas trazem mais benefícios. Concluiu-se que as técnicas de aumento de dados selecionadas podem trazer resultados positivos para bases de dados muito limitadas, com tamanho entre 1.000 e 2.000 documentos.
dc.format	Text
dc.identifier.uri	https://dspace5.ufes.br/handle/10/15540
dc.language	por
dc.publisher	Universidade Federal do Espírito Santo
dc.publisher.country	BR
dc.publisher.course	Mestrado em Engenharia Elétrica
dc.publisher.department	Centro Tecnológico
dc.publisher.initials	UFES
dc.publisher.program	Programa de Pós-Graduação em Engenharia Elétrica
dc.rights	open access
dc.subject	Discurso de ódio
dc.subject	redes sociais
dc.subject	redes neurais convolucionais
dc.subject	redes neurais recursivas
dc.subject	aumento de dados
dc.subject.br-rjbn	subject.br-rjbn
dc.subject.cnpq	Engenharia Elétrica
dc.title	Detecção de discurso de ódio em redes sociais utilizando deep learning
dc.title.alternative	title.alternative
dc.type	masterThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: LigiaIunesVenturott-2021-dissertacao.pdf
Tamanho:: 8.54 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

Mestrado em Engenharia Elétrica