Exploring label correlations in multi-label ensemble classifiers using decision templates
| dc.contributor.advisor1 | Varejão, Flavio Miguel | |
| dc.contributor.advisor1ID | https://orcid.org/0000-0002-5444-1974 | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/6501574961643171 | |
| dc.contributor.author | Rocha, Victor Freitas | |
| dc.contributor.authorID | https://orcid.org/ | |
| dc.contributor.authorLattes | http://lattes.cnpq.br/7323325781453782 | |
| dc.contributor.referee1 | Santos, Thiago Oliveira dos | |
| dc.contributor.referee1ID | https://orcid.org/0000-0001-7607-635X | |
| dc.contributor.referee1Lattes | http://lattes.cnpq.br/5117339495064254 | |
| dc.contributor.referee2 | Rodrigues, Alexandre Loureiros | |
| dc.contributor.referee2Lattes | http://lattes.cnpq.br/0000601083852823 | |
| dc.date.accessioned | 2024-05-30T00:54:05Z | |
| dc.date.available | 2024-05-30T00:54:05Z | |
| dc.date.issued | 2022-08-25 | |
| dc.description.abstract | In the context of machine learning, classification is the task of identifying which class an instance belongs according to the knowledge obtained through a training set, that is, a set of instances whose classification is previously known. Single-label classification, one of the most traditional versions of the classification problem, allows an instance to belong to only one class, thus making them mutually exclusive. However, real-world problems where intersections between classes often occur can be better modeled as multi-label classification problems, whose task is to allow multiple labels to be assigned to the same instance. Multiple classifiers, both single-label and multi-label, can be trained on the same classification problem and generate a combined result. This technique, known as classifier ensembles, is commonly used to improve classification performance. Several approaches have already been proposed to perform the combination of the individual classifiers’ results. In this work, an approach for combining multiple-label classification sets based on the Decision Templates for Ensemble of Classifier Chains technique is presented that incorporates the exploration of correlations between the labels in the classifiers’ fusion process. In the Decision Templates technique, originally proposed for merging single-label classifiers, a per-class decision model is estimated using the same training set that is used for the set of classifiers. The classification for each unseen instance is obtained by measuring the similarity between its decision profile and the decision templates. The proposed method estimates two decision templates per class, one representing the presence of the class and the other representing its absence. For each new instance, a new decision profile is created and the similarity between the decision templates and the decision profile determines the resulting set of labels. For each label analyzed, information about correlated labels is incorporated. The proposed fusion method is used in a traditional and proven algorithm of multiple-label classifier committee: Ensemble of Classifier Chains. Empirical evidence indicates that the use of the proposed Decision Templates adaptation can improve performance over traditionally used fusion schemes on most of the evaluated metrics. | |
| dc.description.resumo | No contexto de aprendizado de máquina, a classificação é a tarefa de identificar a que classe pertence uma instância de acordo com o conhecimento obtido atráves de um conjunto de treinamento, ou seja, um conjunto de instâncias cuja classificação é previamente conhecida. A classificação unirrótulo, uma das versões mais tradicionais do problema de classificação, permite que uma instância pertença a apenas uma classe considerando-as, portanto, mutualmente exclusivas. Entretanto, problemas do mundo real em que interseções entre classes ocorrem frequentemente podem ser melhor modelados como problemas de classificação multirrótulo, cuja tarefa permite que múltiplos rótulos sejam atribuidos à mesma instancia. Múltiplos classificadores, tanto unirrótulo quanto multirrótulo, podem ser treinados para o mesmo problema de classificação e gerar um resultado combinado. Essa técnica, conhecida como comitês de classificadores, é comumente utilizada para melhorar a performance de classificação. Várias abordagens já foram propostas para realizar a combinação dos resultados individuais dos classificadores. Neste trabalho, é apresentada uma abordagem de combinação de conjuntos de classificação múltirrótulo baseado na técnica Modelos de Decisão para Comitês de Cadeias de Classificadores que incorpora a exploração de correlações entre os rótulos no processo de fusão dos classificadores. Na técnica de Perfis de Decisão, originalmente proposta para a fusão de classificadores de rótulo único, estima-se um perfil de decisão por classe usando o mesmo conjunto de treinamento que é usado para o conjunto de classificadores. A classificação para cada instância invisível é obtida medindo a similaridade entre seu perfil de decisão e os perfis de decisão das classes. O método proposto estima dois perfis de decisão por classe, um representando a presença da classe e o outro representando sua ausência. Para cada nova instância, é criado um novo perfil de decisão e a similaridade entre os perfis de decisão das classes e o perfil de decisão da instância determina o conjunto de rótulos resultante. Para cada rótulo analisado, informações sobre rótulos correlacionados é incorporada. O método de fusão proposto é utilizado em um algoritmo tradicional e de eficiência comprovada de comitê de classificadores múltirrótulo: Comitês de Cadeias de Classificadores. As evidências empíricas indicam que o uso da adaptação dos Perfis de Decisão proposto pode melhorar o desempenho em relação aos esquemas de combinação tradicionalmente usados na maioria das métricas avaliadas melhorando o desempenho de um método de comitê de classificadores já conhecido na literatura multirrótulo. | |
| dc.format | Text | |
| dc.identifier.uri | https://dspace5.ufes.br/handle/10/16218 | |
| dc.language | por | |
| dc.publisher | Universidade Federal do Espírito Santo | |
| dc.publisher.country | BR | |
| dc.publisher.course | Mestrado em Informática | |
| dc.publisher.department | Centro Tecnológico | |
| dc.publisher.initials | UFES | |
| dc.publisher.program | Programa de Pós-Graduação em Informática | |
| dc.rights | open access | |
| dc.subject | Multirrótulo | |
| dc.subject | Classificação | |
| dc.subject | Perfis de decisão | |
| dc.subject.br-rjbn | subject.br-rjbn | |
| dc.subject.cnpq | Ciência da Computação | |
| dc.title | Exploring label correlations in multi-label ensemble classifiers using decision templates | |
| dc.type | masterThesis |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- VictorFreitasRocha-2022-dissertacao.pdf
- Tamanho:
- 1.04 MB
- Formato:
- Adobe Portable Document Format
