Please use this identifier to cite or link to this item: https://hdl.handle.net/10216/89719
Author(s): Gil Filipe da Rocha
Title: ArgMine: Argumentation Mining from Text
Issue Date: 2016-07-08
Abstract: The aim of argumentation mining is the automatic detection and identification of the argumentative structure contained within a piece of natural language text. An argument is an ancient and well studied rhetorical structure. In a general form, arguments are justifiable positions where pieces of evidence (premises) are offered in support of a conclusion. The ambiguity of natural language text, different writing styles, implicit context and the complexity of building argument structures are some of the challenges which make this task very challenging. By automatically extracting arguments from text, we are able to tell not just what views are being expressed, but also what are the reasons to believe those particular views. Therefore, argumentation mining has the potential to improve some research topics such as opinion mining, recommender systems and multi-agent systems. The full task of argumentation mining can be decomposed into several subtasks. This thesis focuses on the automatic detection and identification of the argumentative components presented in the original text. This involves detecting the zones of text that contain argumentative content and the identification of fragments of text that will form the elementary units of the argument. In order to automatically detect and identify argumentative components in text, supervised machine learning algorithms will be used. The target corpus used to train the algorithms are news written in Portuguese language.
Description: O objetivo da prospeção de argumentos a partir de texto é a deteção e identificação de forma automática da estrutura argumentativa contida num texto escrito em linguagem natural.Um argumento é uma estrutura retórica que é estudada desde à muitos anos e que se encontra bem fundamentada. De uma forma geral, argumentos são posições justificáveis onde factos (premissas) são apresentados em suporte de uma conclusão.A ambiguidade do texto escrito em linguagem natural, diferentes estilos de escrita, contexto implícito e a complexidade em construir estruturas argumentativas são alguns dos desafios que fazem desta tarefa muito desafiadora.Extraindo de forma automática argumentos a partir de texto, somos capazes de saber não apenas quais são os pontos de vista que estão a ser expressos, mas também quais são as razões para acreditar nesse pontos de vista. Assim sendo, a prospeção de argumentos de forma automática tem o potencial de trazer avanços em algumas áreas de investigação tais como prospeção de opiniões, sistemas de recomendação e sistemas multi-agente.A tarefa completa de prospeção de argumentos pode ser decomposta em várias sub-tarefas. Esta tese aborda a deteção e identificação, de forma automática, dos componentes argumentativos presentes no texto. Isso envolve detetar as zonas do texto que contêm conteúdo argumentativo e, a seleção dos fragmentos de texto que correspondem às unidades elementares de argumentos. Para que seja possível de uma forma automática detetar e identificar componentes argumentativos a partir de texto, algoritmos de aprendizagem máquina supervisionada serão usados.O conjunto de dados alvo que será usado para treinar os algoritmos são noticias escritas na língua Portuguesa.
Subject: Engenharia electrotécnica, electrónica e informática
Electrical engineering, Electronic engineering, Information engineering
Scientific areas: Ciências da engenharia e tecnologias::Engenharia electrotécnica, electrónica e informática
Engineering and technology::Electrical engineering, Electronic engineering, Information engineering
TID identifier: 201304082
URI: https://repositorio-aberto.up.pt/handle/10216/89719
Document Type: Dissertação
Rights: openAccess
Appears in Collections:FEUP - Dissertação

Files in This Item:
File Description SizeFormat 
138756.pdfArgMine: Argumentation Mining from Text1.24 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.