Please use this identifier to cite or link to this item: http://hdl.handle.net/10216/73795
Author(s): João David Pereira da Costa
Title: Ensemble methods in ordinal data classification
Issue Date: 2014-07-14
Abstract: Ordinal classification problems can be found in various areas, such as productrecommendation systems, intelligent health systems and image recognition. Thisproblems have the goal of learning how to classify certain instances (e.g a movie)in an ordinal scale (e.g. good, average, bad).The performance of supervised learned problems (such as ordinal classification)can be improved by using ensemble methods, where various models are combinedto perform better decisions. While there are various ensemble methods fornominal classification, ranking and regression, ordinal classification hasnot received the same level of attention.The goal of this dissertation is, therefore, to introduce novel ensemblemethods for the classification of ordinal data. To do this, first a new ordinalclassification algorithm based on decision trees and the data replication methodis presented, whose results show that this classifier might performbetter than other non-ordinal classifiers. Then, the main ideas of thismethod are exploited to try and improve ensembles whose modelsshare similarities with decision trees (i.e. AdaBoost.M1 with Decision Stumps andRandom Forests).
Description: Problemas de classificação ordinal podem ser encontrados nas mais diversasáreas, tais como sistemas de recomendação de produtos, sistemas inteligentesde saúde e reconhecimento de imagem. Estes problemas têm como objectivoaprender a classificar uma determinada instância (e.g. um filme) numa escalaordinal (e.g. bom, médio, mau).Uma forma de melhorar o desempenho de problemas de aprendizagem supervisionada(como é o caso da classificação ordinal) é usando métodos de ensemble,onde vários modelos são combinados para tomar melhores decisões. Embora existamdiversos métodos de ensemble desenvolvidos para problemas declassificação nominal, ranking e regressão, a classificação ordinal nãotem recebido a mesma atenção.O objectivo desta dissertação é, assim, introduzir novos métodos de ensemblepara dados ordinais. Para isso, em primeiro lugar é apresentado um novo algoritmo declassificação baseado em árvores de decisão e no método de replicação dosdados, cujos resultados revelam que este pode ser vantajoso em relação a outrosclassificadores não ordinais. Depois as ideias principais deste classificadorsão aproveitadas para melhorar ensembles cujos modelos gerados possuem semelhançascom árvores de decisão (i.e. AdaBoost.M1 com Decision Stumps e Random Forests).
Subject: Ciências da computação e da informação
Call Number: 31903
URI: http://hdl.handle.net/10216/73795
Document Type: Dissertação
Rights: openAccess
License: https://creativecommons.org/licenses/by-nc/4.0/
Appears in Collections:FEUP - Dissertação

Files in This Item:
File Description SizeFormat 
31903.pdfEnsemble methods in ordinal data classification395.44 kBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons