Detecção de discurso de ódio em redes sociais utilizando deep learning
| dc.contributor.advisor1 | Ciarelli, Patrick Marques | |
| dc.contributor.advisor1ID | https://orcid.org/0000000331774028 | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1267950518719423 | |
| dc.contributor.author | Venturott, Lígia Iunes | |
| dc.contributor.referee1 | Samatelo, Jorge Leonid Aching | |
| dc.contributor.referee2 | Oliveira, Elias Silva de | |
| dc.date.accessioned | 2024-05-30T00:52:44Z | |
| dc.date.available | 2024-05-30T00:52:44Z | |
| dc.date.issued | 2021-10-25 | |
| dc.description.abstract | In the last decade, online social networks went through a quick expansion. The main goal of these platforms is to allow the communication between people from different backgrounds, religions, cultures and countries. However, this new form of contact, allied to the feeling of anonymity and impunity of the digital enviroment, turned social networks into a favorable enviroment for disseminating hate speech, such as xenophobia, racism, sexism, homophobia, and others. Most platforms, such as Twitter and Facebook, explicitly forbid this kind of behaviour. However, the large volume of daily posts make manually detecting hate speech an almost impossible task. In this context, there is a need for automatic detection tools for hate speech in social networks, but most works focus on detecting of hateful content in English. This work develops a method for detecting hate speech in social networks focused on Portuguese, using deep neural networks as the main resource. To that end, first we identified the main issues regarding hate speech detection in Portuguese, and it was observed that there is a lack of labeled datasets for hate speech and offensive language in Portuguese. The few existing datasets consist of few documents, which makes the application of deep learning techniques difficult. In order to mitigate this problem, we propose using data augmentation techniques. Three techniques were selected from the literature and were applied in different scenarios, where we tried to identify in which cases these techniques would be the most beneficial. It was concluded that the data augmentation techniques selected can be helpful when applied to very reduced datasets, varying from 1,000 to 2,000 documents. | |
| dc.description.resumo | Na última década houve uma rápida expansão do uso das redes sociais online. Essas plataformas tem como objetivo permitir a comunicação e interação de pessoas de diferentes regiões, etnias, culturas e histórias. Porém, esse contato, somado à sensação de anonimato e impunidade do meio digital, gera nas redes sociais um ambiente propício para a disseminação do discurso de ódio, como xenofobia, racismo, sexismo, homofobia, entre outros. A maior parte das plataformas, como Twitter e Facebook, proíbem esse tipo de comportamento. Porém, a grande quantidade de publicações diárias torna a análise manual uma tarefa praticamente impossível. Esse contexto leva à necessidade de criação de ferramentas que possam detectar automaticamente discursos de ódio em redes sociais. Contudo, a maioria dos trabalhos atuais foca na criação de ferramentas de classificação para a língua inglesa. Esse trabalho propõe o desenvolvimento de um método para detecção de discurso de ódio em redes sociais para a língua portuguesa, usando como ferramenta principal redes neurais profundas. Para isso, foi feita uma análise tentando identificar os problemas envolvidos nessa tarefa, e foi detectada uma escassez em bases de dados rotuladas em português, o que dificulta a utilização de redes neurais profundas. Para amenizar esse problema, foi proposta a utilização de técnicas de aumento de dados. Três técnicas foram selecionadas da literatura e foram aplicadas em diversos cenários, tentando identificar em que cenários essas técnicas trazem mais benefícios. Concluiu-se que as técnicas de aumento de dados selecionadas podem trazer resultados positivos para bases de dados muito limitadas, com tamanho entre 1.000 e 2.000 documentos. | |
| dc.format | Text | |
| dc.identifier.uri | https://dspace5.ufes.br/handle/10/15540 | |
| dc.language | por | |
| dc.publisher | Universidade Federal do Espírito Santo | |
| dc.publisher.country | BR | |
| dc.publisher.course | Mestrado em Engenharia Elétrica | |
| dc.publisher.department | Centro Tecnológico | |
| dc.publisher.initials | UFES | |
| dc.publisher.program | Programa de Pós-Graduação em Engenharia Elétrica | |
| dc.rights | open access | |
| dc.subject | Discurso de ódio | |
| dc.subject | redes sociais | |
| dc.subject | redes neurais convolucionais | |
| dc.subject | redes neurais recursivas | |
| dc.subject | aumento de dados | |
| dc.subject.br-rjbn | subject.br-rjbn | |
| dc.subject.cnpq | Engenharia Elétrica | |
| dc.title | Detecção de discurso de ódio em redes sociais utilizando deep learning | |
| dc.title.alternative | title.alternative | |
| dc.type | masterThesis |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- LigiaIunesVenturott-2021-dissertacao.pdf
- Tamanho:
- 8.54 MB
- Formato:
- Adobe Portable Document Format
