Ensemble methods in ordinal data classification

João David Pereira da Costa

Please use this identifier to cite or link to this item: https://hdl.handle.net/10216/73795

Author(s):	João David Pereira da Costa
Title:	Ensemble methods in ordinal data classification
Issue Date:	2014-07-14
Abstract:	Ordinal classification problems can be found in various areas, such as product recommendation systems, intelligent health systems and image recognition. This problems have the goal of learning how to classify certain instances (e.g a movie) in an ordinal scale (e.g. good, average, bad). The performance of supervised learned problems (such as ordinal classification) can be improved by using ensemble methods, where various models are combined to perform better decisions. While there are various ensemble methods for nominal classification, ranking and regression, ordinal classification has not received the same level of attention. The goal of this dissertation is, therefore, to introduce novel ensemble methods for the classification of ordinal data. To do this, first a new ordinal classification algorithm based on decision trees and the data replication method is presented, whose results show that this classifier might perform better than other non-ordinal classifiers. Then, the main ideas of this method are exploited to try and improve ensembles whose models share similarities with decision trees (i.e. AdaBoost.M1 with Decision Stumps and Random Forests).
Description:	Problemas de classificação ordinal podem ser encontrados nas mais diversas áreas, tais como sistemas de recomendação de produtos, sistemas inteligentes de saúde e reconhecimento de imagem. Estes problemas têm como objectivo aprender a classificar uma determinada instância (e.g. um filme) numa escala ordinal (e.g. bom, médio, mau). Uma forma de melhorar o desempenho de problemas de aprendizagem supervisionada (como é o caso da classificação ordinal) é usando métodos de ensemble, onde vários modelos são combinados para tomar melhores decisões. Embora existam diversos métodos de ensemble desenvolvidos para problemas de classificação nominal, ranking e regressão, a classificação ordinal não tem recebido a mesma atenção. O objectivo desta dissertação é, assim, introduzir novos métodos de ensemble para dados ordinais. Para isso, em primeiro lugar é apresentado um novo algoritmo de classificação baseado em árvores de decisão e no método de replicação dos dados, cujos resultados revelam que este pode ser vantajoso em relação a outros classificadores não ordinais. Depois as ideias principais deste classificador são aproveitadas para melhorar ensembles cujos modelos gerados possuem semelhanças com árvores de decisão (i.e. AdaBoost.M1 com Decision Stumps e Random Forests).
Subject:	Ciências da computação e da informação Computer and information sciences
Scientific areas:	Ciências exactas e naturais::Ciências da computação e da informação Natural sciences::Computer and information sciences
TID identifier:	201307065
URI:	https://hdl.handle.net/10216/73795
Document Type:	Dissertação
Rights:	openAccess
License:	https://creativecommons.org/licenses/by-nc/4.0/
Appears in Collections:	FEUP - Dissertação

Files in This Item:

File	Description	Size	Format
31903.pdf	Ensemble methods in ordinal data classification	395.44 kB	Adobe PDF	View/Open

Show full item record Recommend this item Display Statistics

This item is licensed under a Creative Commons License