Please use this identifier to cite or link to this item: http://hdl.handle.net/10216/114061
Author(s): Guilherme Oliveira Santos
Title: Automotive Interior Sensing - Imaging Solutions
Issue Date: 2018-07-20
Abstract: This dissertation addresses the problem of object detection inside the vehicle. Comparing all the state-of-the-art algorithms, approaches based on R-CNN stand out in terms of Average Precision. Typically two-stage detectors have higher accuracy rates while one-stage detectors reaches lower inference times. Mask R-CNN was chosen thanks to the high values obtained for Average Precision without compromising inference times, as well as providing object instance segmentation. This may be useful for approaches such as Multiview in which it is important to match points of the image acquired from one camera with points of the image acquired by other camera in another position. It was necessary to test the adaptability of Mask R-CNN to other datasets by changing COCO dataset to have different number of classes. At the end, the trained network over Bosch dataset, was Faster R-CNN with Mask weights pre-trained over COCO.
Description: Esta dissertação recai sobre o problema da deteção de objetos dentro do veículo. Comparando todos os algoritmos do estado da arte, abordagens baseadas em R-CNN destacam-se em termos de "Average Precision". Normalmente, os detectores "two-stage" têm taxas de precisão mais altas enquanto os detectores "one-stage" conseguem alcançar menores tempos de inferência. O Mask R-CNN foi escolhido graças aos altos valores de "Average Precision" obtidos sem comprometer o tempo de inferência, assim como fornecer a segmentação de instância dos objetos. Isto pode ser útil para abordagens como o "Multiview" no qual é importante estabelecer uma ligação entre os pontos da imagem adquirida por uma câmera com os pontos da imagem adquirida por outra câmera noutra posição. Foi necessário testar a adaptabilidade da Mask R-CNN para outros "datasets" alterando o "dataset" do COCO para ter um número de classes diferente do original. No fim, a rede treinada sobre o "dataset" da Bosch, foi a Faster R-CNN em que os pesos da Mask usados foram os pré-treinados sobre o COCO.
Subject: Engenharia electrotécnica, electrónica e informática
Electrical engineering, Electronic engineering, Information engineering
URI: http://hdl.handle.net/10216/114061
Document Type: Dissertação
Rights: embargoedAccess
Embargo End Date: 2021-07-19
Appears in Collections:FEUP - Dissertação

Files in This Item:
File Description SizeFormat 
277688.pdfAutomotive Interior Sensing - Imaging Solutions12.44 MBAdobe PDF    Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.