Identificação de sentimento em voz por meio da combinação de classificações intermediárias dos sinais em excitação, valência e quadrante

dc.contributor.advisor1Salles, Evandro Ottoni Teatini
dc.contributor.advisor1IDhttps://orcid.org/0000000282873045
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5893731382102675
dc.contributor.authorGering, Guilherme Butzke Schreiber
dc.contributor.referee1Andreao, Rodrigo Varejao
dc.contributor.referee2Samatelo, Jorge Leonid Aching
dc.date.accessioned2024-05-29T22:11:57Z
dc.date.available2024-05-29T22:11:57Z
dc.date.issued2019-12-20
dc.description.abstractSpeech emotion recogntion is important in areas such as health, psychology, and telemedicine for information about an individual’s states of emotions. Speech emotion recogntion is commonly performed in categorical classes, such as “sadness” or “joy”. According to Rus sell’s map of affection, emotions can also be classified by arousal (excitation), valence, and quadrants. In this work is proposed a method to increase the performance of speech emotion recogntion in categorical classes using classifiers that perform intermediate classification in the classes of valence, excitation and quadrants using a multiview approach. Moreover, three types of classifiers perform the same task, using different features extracted from the voice signal, which combine in one Ensemble they tend to increase individual results. To combine these results and obtain the final classification, a decision tree is proposed and that increases F1 metrics from 0.61 by Ensemble of three kinds of classifiers to 0.63 in a public database
dc.description.resumoReconhecimento de sentimento em voz é importante em áreas como saúde, psicologia e telemedicina para obter informações sobre os estados de emoções de um indivíduo. A identificação de sentimento em voz é comumente realizada em classes categóricas como “tristeza” ou “alegria”. De acordo com o mapa de afeto de Russell, sentimentos também podem ser classificados por excitação, valência e quadrantes. Neste trabalho é proposto um método para incrementar o desempenho de identificação de sentimentos em classes categóricas utilizando classificadores que realizam classificação intermediária nas classes de excitação, valência e quadrantes usando uma abordagem Multi-tarefa. Além disso, três tipos de classificadores realizam a mesma tarefa de classificação, utilizando diferentes características extraídas do sinal da voz, que combinadas em um Ensemble tendem a incrementar os resultados individuais. Para combinar esses resultados e obter a classificação f inal é proposta uma árvore de decisão que aumentou o desempenho F1 de 0,61 do Ensemble de três tipos de classificadores para 0,63 sobre uma base de dados pública
dc.formatText
dc.identifier.urihttps://dspace5.ufes.br/handle/10/13656
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseMestrado em Engenharia Elétrica
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica
dc.rightsopen access
dc.subjectIdentificação de sentimento em voz
dc.subjectAprendizado de máquinas
dc.subjectInteligência artificial
dc.subjectAplicações médicas
dc.subjectEmoções
dc.subjectReconhecimento automático da voz
dc.subjectSpeech emotion recognition
dc.subjectMulti-task
dc.subjectArousal-valence
dc.subject.br-rjbnsubject.br-rjbn
dc.subject.cnpqEngenharia Elétrica
dc.titleIdentificação de sentimento em voz por meio da combinação de classificações intermediárias dos sinais em excitação, valência e quadrante
dc.title.alternativetitle.alternative
dc.typemasterThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertacao_GuilhermeButzke.pdf
Tamanho:
2.07 MB
Formato:
Adobe Portable Document Format