Please use this identifier to cite or link to this item: https://hdl.handle.net/10216/137700
Author(s): Diogo Manuel Oliveira Moreira
Title: Wine Price and Prediction Using Machine Learning
Issue Date: 2021-07-19
Abstract: The wine industry is a growing field across all countries around the globe. Wine selling and production are seen as a benefit for the economy of a country and its culture. Although most of the wine is sold and bought in the usual local supermarket for immediate consumption, many enthusiasts like to invest and appreciate more exquisite wines. More exquisite wines may be sold in different values depending on the region where they are being sold. If the wine is of difficult access in a region, if it is of a unique kind, and so on. These impactful factors could lead to a single bottle of wine to take absurdly huge prices. In this dissertation, the quality and price of wine attributes will be explored systematically by using a data-driven approach to generate prediction models. It is expected that these models will potentially help owners of wine, consumers or producers to provide reliable indicators on the price and quality of a targeted wine. In terms of the related work, there are research articles going as far back as 2008, which already apply a systematic approach to these factors, some of which include data science approaches. One of the most notable works, done by Drs. Michelle Yeo, Tristan Fletcher and John Shawe-Taylor and published by Cambridge University Press in the "Journal of Wine Economics, Volume 10", "Machine Learning in Fine Wine Price Prediction", applies machine learning models such as Gaussian process regression and multi-task learning to predict wine prices, and bases the model on wine historical price data. On the other hand in an article of "Wineinformatics: Regression on the Grade and Price of Wines through Their Sensory Attributes" authored by James Palmer and Bernard Chen, a dataset of consumers' reviews, with more than 105,085 wines reviews, is used to predict the quality and price of wine through Support Vector Regression models. Drs Paulo Cortez, Juliana Teixeira, António Cerdeira, Fernando Almeida, Telmo Matos, and José Reis applied the same model, on an article on "Using Data Mining for Wine Quality Assessment". Where "Vinho Verde" is explored through a dataset of physicochemical laboratory tests. In this dissertation, a new method is applied to predict the wine's price while simultaneously predicting its quality through a dataset focused on the global wine industry data.
Description: A indústria do vinho tem vindo a crescer em vários sectores em todos paíse à volta do mundo. O mercado e a produção de vinho são vistos como um benefício para a economia de um país, assim como para a sua cultura. Apesar de, hoje em dia, vinho ser vendido e comprado no regular supermercado local, normalmente, para consumo imediato, existem muitos entusiastas que gostam de investir e apreciar vinhos mais requintados. Este tipo de vinhos podem ser vendidos por diferentes valores, dependendo da região onde são vendidos. Se o vinho for de díficil acesso numa certa região, se for de uma casta única, e assim em diante... Estes serão todos grandes factores que podem potenciar uma garrafa de vinho a ser vendida por preços absurdamente elevados. Nesta dissertação, a qualidade e o preço de vinho vão ser explorados de uma forma sistemática, através de uma abordagem \emph{data-driven}, de forma a gerar modelos de previsão. É expectável que estes modelos ajudem proprietários de vinhos, sejam estes consumidores ou produtores, a fim de fornecer indicadores confiáveis sobre o preço e qualidade de vinho. Em relação a prévios trabalhos no tema, existem vários artigos de pesquisa, começando em 2008, que já aplicamn uma abordagem sistemática a estes fatores, alguns já incluindo abordagens de \emph{data science}. Um dos trabalhos mais notáveis, autorado por Drs. Michelle Yeo, Tristan Fletcher and John Shawe-Taylor, e publicado pela Cambridge University Press, em "Journal of Wine Economics, Volume 10", "Machine Learning in Fine Wine Price Prediction", aplica métodos de aprendizagem computacional como o processo de regressão Gaussiana e aprendizagem multitarefa para a previsão de preços de vinho. Estes modelos têm por base dados sobre o historial de preços de vinho ao longo do tempo. Por outro lado, no artigo, "Wineinformatics: Regression on the Grade and Price of Wines through Their Sensory Attributes", autorado por James Palmer e Bernard Chen, usam um conjunto de dados de avaliações de consumidores, com mais de 105,085 avaliações. Estes daados são usados para prever a qualidade de vinho através da aplicação de modelos de \emph{Support Vector Regression}. O mesmo modelo é aplicado pelos Drs. Paulo Cortez, Juliana Teixeira, António Cerdeira, Fernando Almeida, Telmo Matos, e José Reis num artigo, "Using Data Mining for Wine Quality Assessment", onde o vinho verde é explorado com a ajuda de um conjunto de dados de ensaios físico-químicos. Nesta dissertação, um novo método será aplicado para prever a qualidade e, simultâneamente, o preço de vinho, através de um conjunto de dados focado em vinhos nacionais.
Subject: Engenharia electrotécnica, electrónica e informática
Electrical engineering, Electronic engineering, Information engineering
Scientific areas: Ciências da engenharia e tecnologias::Engenharia electrotécnica, electrónica e informática
Engineering and technology::Electrical engineering, Electronic engineering, Information engineering
DOI: 10.34626/y3vw-pe36
TID identifier: 202819280
URI: https://hdl.handle.net/10216/137700
Document Type: Dissertação
Rights: openAccess
Appears in Collections:FEUP - Dissertação

Files in This Item:
File Description SizeFormat 
514640.pdfWine Price and Quality Prediction Using Machine Learning (Final)3.37 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.