Please use this identifier to cite or link to this item: http://hdl.handle.net/10216/68545
Author(s): Tiago Daniel Sá Cunha
Title: TweeProfiles: deteção de padrões espácio-temporais no Twitter
Issue Date: 2013-07-08
Abstract: Online social networks present themselves as valuable information sources about their users andtheir respective interests. Such information has been subjected to many studies conducted by DataMining scholars throughout the world in order to discover users' behaviours and patterns. Besides,there has also been also investment applied in creating platforms for the continuous informationextraction and for their data visualization.This dissertation aims to identify tweet profiles by analysing multiple types of data: spatial,temporal, social and content. The goals set are to develop a information extraction approach tovalidate dimensional combination and to develop a visualization tool capable of displaying thepatterns found using state of the art representations.The data mining process is composed by dissimilarity matrices computation, normalizationand combination. Each dissimilarity matrix is then subjected to a clustering algorithm that retrievesthe information. This dissertation studies in depth appropriate distance functions for thedifferent types of data, the normalization and combination methods available for different dimensionsand the clustering algorithms existent.The visualization platform is designed for a dynamic and intuitive usage, aimed at revealingthe discovered patterns in the data mining process in an understandable and interactive manner. Inorder to accomplish such, various visualization patterns were studied and widgets chosen to betterrepresent the information retrieved.The study case on which it will be applied is the geo-referenced data from TwitterEcho, althoughit will be developed to use any geo-referenced tweets extracted form Twitter itself.
Description: Redes sociais na internet apresentam-se como fontes de informação valiosas, no que diz respeitoaos seus utilizadores e aos seus respectivos interesses. Tal informação tem sido sujeita a váriosestudos, conduzidos por investigadores de Data Mining de todo o Mundo, de forma a descobrircomportamentos e padrões dos utilizadores. Para além disso, tem existido também investimentoem criar plataformas para extracção contínua e visualização de informação.Esta dissertação espera identificar perfis de tweets envolvendo multiplos tipos de informação:espacial, temporal, social e de conteúdo. Os objectivos estabelecidos são para o desenvolvimentode uma metodologia de data mining que valide a combinação dimensional e a criação de umaferramenta de visualização para representar os resultados obtidos recorrendo a representações encontradasno estado da Arte.O processo de data mining é composto pela computação, normalização e combinação de matrizesde dissemelhança. Cada matriz de dissemelhança é submetida a um algoritmo de clusteringque realiza a extracção do conhecimento. Esta dissertação estuda em profundidade várias funçõesde distância para diferentes tipos de dados, os métodos de combinação e normalização disponíveise os algoritmos de clustering existentes.A ferramenta de visualização está desenhada para uma utilização dinâmica e intuitiva, direccionadapara a representação de padrões no processo de Data Mining de uma forma compreensívele interactiva. Para atingir estes objectivos, vários padrões de visualização foram estudados, assimcomo vários widgets capazes de representar os padrões obtidos.O caso de estudo em que esta dissertação será aplicada são os dados georeferenciados do TwitterEcho,apesar de ser desenvolvida para suportar quaisquer tweets georeferenciados provenientesdo Twitter.
Subject: Ciências da engenharia e tecnologias
Engineering and technology
URI: http://hdl.handle.net/10216/68545
Document Type: Dissertação
Rights: openAccess
License: https://creativecommons.org/licenses/by-nc/4.0/
Appears in Collections:FEUP - Dissertação

Files in This Item:
File Description SizeFormat 
26802.pdfTweeProfiles: Detection of spatio-temporal patterns on Twitter15.49 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons