Please use this identifier to cite or link to this item: https://hdl.handle.net/10216/106389
Author(s): Luís Miguel Barroso Natividade
Title: Data Mining para análise dos resultados de Gene Expression
Issue Date: 2017-07-14
Abstract: We currently live in an age when technology is involved in all areas and technological evolution has direct consequences in the study of different scientific areas.In the area of biology, genome sequencing has undergone tremendous advances in recent years. It has become more accurate, faster and less costly financially.These developments lead to increased use of this technology in carrying out deeper and more complex studies in genomics, in particular in research studies on the genomic origin of different types of cancer.One of the characteristics of these new sequencing technology is that it requires considerable computational resources and generates an enormous amount of data, which makes it impossible to manually analyze these data to obtain conclusions from the experts.Derived from the enormous amount of data generated and the amount of information available on the Internet these days, there are already several databases accessible on the WEB with this type of information. Although it is quite positive that there is a lot of information on different websites, it is arduous and complex to find all the necessary information about a gene. In addition, it gets more difficult because often each database has its own identifier for each gene.The final objective of this dissertation is the elaboration of a platform for the use of biological research specialists, which will facilitate their work, thus allowing the development of progress in the investigation of various diseases of genomic origin, such as cancers or tumors.In order to acomplish this we have developed a WEB Platform that allows the use of different data mining techniques, classification and clustering techniques in order to allow the experts to draw conclusions in the analysis of results of the genetic expression. In addition, and in order to simplify the work of the specialists, the platform also allows the collection of gene information from different databases, being possible to extract this information for several file formats, for later use. Targeting a wide range of users the platform has a simple and intuitive interface, allowing it to be usable by users without great experience in computing.The evaluation of the platform was done through an objective evaluation, own of the tools of data mining, and subjective, resorting to specialists of I3S.
Description: Atualmente vivemos numa era em que a tecnologia está envolvida em todas as áreas e a evolução tecnológica tem consequências diretas no estudo das diferentes áreas científicas. Na área da biologia, a sequenciação de genomas tem sofrido enormes avanços nos últimos anos. Tornou-se mais precisa, mais rápida e menos custosa financeiramente.Estes progressos têm como consequência uma maior utilização desta tecnologia na realização de estudos mais profundos e complexos em genómica, nomeadamente em estudos de investigação da origem genómica dos diferentes tipos de cancro.Uma das características desta nova tecnologia de sequenciação é que requer consideráveis recursos computacionais e gera uma enorme quantidade de dados, que impossibilita a análise manual desses dados para obtenção de conclusões por parte de especialistas.Derivado da enorme quantidade de dados gerada e da quantidade de informação disponibilizada na internet nos dias de hoje, existem já várias bases de dados acessíveis na WEB com este tipo de informação. Embora seja bastante positivo o facto de existir muita informação, em diferentes sítios WEB, torna-se trabalhoso e por vezes complexo localizar toda a informação necessária relativa a um gene. Acresce ainda a dificuldade de os identificadores das entidades biológicas, como genes, serem, frequentemente, diferentes em cada sítio WEB.O objetivo final desta dissertação é a elaboração de uma plataforma para uso de especialistas de investigação biológica, que permita facilitar o trabalho dos mesmos, possibilitando assim o desenvolvimento de progressos na investigação de várias doenças de origem genómica, como cancros ou tumores.Para tal elaborámos uma plataforma WEB que permite a utilização de diferentes técnicas de data mining, técnicas de classificação e clustering de modo a permitir aos especialistas retirar conclusões na análise de resultados da expressão genética. Em complemento e de modo a simplificar o trabalho dos especialistas, a plataforma permite também a recolha de informação génica de diferentes bases de dados, sendo possível extrair essa informação para vários formatos de ficheiro, para utilização posterior. Almejando um leque de utilizadores alargado a plataforma possui uma interface simples e intuitiva, permitindo-a ser utilizável por utilizadores sem grande experiência em informática.A avaliação da plataforma foi feita através de uma avaliação objetiva, própria das ferramentas de data mining, e subjetiva, recorrendo a especialistas do I3S.
Subject: Engenharia electrotécnica, electrónica e informática
Electrical engineering, Electronic engineering, Information engineering
Scientific areas: Ciências da engenharia e tecnologias::Engenharia electrotécnica, electrónica e informática
Engineering and technology::Electrical engineering, Electronic engineering, Information engineering
TID identifier: 201804727
URI: https://repositorio-aberto.up.pt/handle/10216/106389
Document Type: Dissertação
Rights: openAccess
Appears in Collections:FEUP - Dissertação

Files in This Item:
File Description SizeFormat 
205121.pdfFinal_Data Mining para análise dos resultados de Gene Expression4.61 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.