Please use this identifier to cite or link to this item:
https://hdl.handle.net/10216/73795
Author(s): | João David Pereira da Costa |
Title: | Ensemble methods in ordinal data classification |
Issue Date: | 2014-07-14 |
Abstract: | Ordinal classification problems can be found in various areas, such as product recommendation systems, intelligent health systems and image recognition. This problems have the goal of learning how to classify certain instances (e.g a movie) in an ordinal scale (e.g. good, average, bad). The performance of supervised learned problems (such as ordinal classification) can be improved by using ensemble methods, where various models are combined to perform better decisions. While there are various ensemble methods for nominal classification, ranking and regression, ordinal classification has not received the same level of attention. The goal of this dissertation is, therefore, to introduce novel ensemble methods for the classification of ordinal data. To do this, first a new ordinal classification algorithm based on decision trees and the data replication method is presented, whose results show that this classifier might perform better than other non-ordinal classifiers. Then, the main ideas of this method are exploited to try and improve ensembles whose models share similarities with decision trees (i.e. AdaBoost.M1 with Decision Stumps and Random Forests). |
Description: | Problemas de classificação ordinal podem ser encontrados nas mais diversas áreas, tais como sistemas de recomendação de produtos, sistemas inteligentes de saúde e reconhecimento de imagem. Estes problemas têm como objectivo aprender a classificar uma determinada instância (e.g. um filme) numa escala ordinal (e.g. bom, médio, mau). Uma forma de melhorar o desempenho de problemas de aprendizagem supervisionada (como é o caso da classificação ordinal) é usando métodos de ensemble, onde vários modelos são combinados para tomar melhores decisões. Embora existam diversos métodos de ensemble desenvolvidos para problemas de classificação nominal, ranking e regressão, a classificação ordinal não tem recebido a mesma atenção. O objectivo desta dissertação é, assim, introduzir novos métodos de ensemble para dados ordinais. Para isso, em primeiro lugar é apresentado um novo algoritmo de classificação baseado em árvores de decisão e no método de replicação dos dados, cujos resultados revelam que este pode ser vantajoso em relação a outros classificadores não ordinais. Depois as ideias principais deste classificador são aproveitadas para melhorar ensembles cujos modelos gerados possuem semelhanças com árvores de decisão (i.e. AdaBoost.M1 com Decision Stumps e Random Forests). |
Subject: | Ciências da computação e da informação Computer and information sciences |
Scientific areas: | Ciências exactas e naturais::Ciências da computação e da informação Natural sciences::Computer and information sciences |
TID identifier: | 201307065 |
URI: | https://hdl.handle.net/10216/73795 |
Document Type: | Dissertação |
Rights: | openAccess |
License: | https://creativecommons.org/licenses/by-nc/4.0/ |
Appears in Collections: | FEUP - Dissertação |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
31903.pdf | Ensemble methods in ordinal data classification | 395.44 kB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License