Estimação de profundidade monocular baseada em redes neurais profundas para mapeamento, localização e navegação de veículos autônomos

dc.contributor.advisor1Souza, Alberto Ferreira de
dc.contributor.advisor1IDhttps://orcid.org/0000000315618447
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/7573837292080522
dc.contributor.authorPiumbini, Marcos Thiago
dc.contributor.authorIDhttps://orcid.org/0009-0002-4865-994X
dc.contributor.authorLatteshttp://lattes.cnpq.br/6218782772837891
dc.contributor.referee1Komati, Karin Satie
dc.contributor.referee2Pacheco, Andre Georghton Cardoso
dc.contributor.referee2Latteshttp://lattes.cnpq.br/8898143425329967
dc.date.accessioned2024-05-29T20:55:15Z
dc.date.available2024-05-29T20:55:15Z
dc.date.issued2023-09-22
dc.description.abstractWe present a grid map occupancy builder system for the IARA autonomous car, using depth from monocular images obtained through neural networks. Depth estimation from monocular images is still a challenge for deep neural networks, however, recent transformer-based architectures have shown promising performance, making their use in real-world robotic applications possible. In this work, we employed the transformer-based architecture GLPDepth to build a system that calculates depth from monocular images captured by an autonomous car and, with adequate pre-processing, employs this depth information to construct appropriate grid maps for autonomous vehicles. To evaluate the performance of the proposed system, we integrated it into the perception and navigation systems of an autonomous vehicle and tested it in real-world scenarios. Our results showed that monocular cameras can be used as the main sensor for autonomous operation of vehicles at low speeds. However, it is important to note that the system's performance is still limited compared to the use of LIDAR sensors in high-speed or complex and challenging environments. The proposed system shows promising performance for building occupancy grid maps for autonomous cars using monocular cameras with transformer-based deep neural networks, and can be a more economical and simpler alternative to LIDAR sensors in certain situations. However, the use of other sensors, in addition to monocular cameras, may be necessary to ensure safety in all operating condition.
dc.description.resumoApresentamos um sistema de construção de mapas de grade de ocupação para o carro autônomo IARA, utilizando a profundidade de imagens monoculares obtida através de redes neurais. A estimativa de profundidade a partir de imagens monoculares ainda é um desafio para redes neurais profundas, no entanto, arquiteturas recentes baseadas em transformadores têm demonstrado um desempenho promissor, tornando possível sua utilização em aplicações robóticas do mundo real. Neste trabalho, utilizamos a arquitetura baseada em transformadores GLPDepth para construir um sistema que calcula a profundidade de imagens monoculares capturadas por um carro autônomo e, com pré-processamento adequado, emprega essas informações de profundidade para construir mapas de grade de ocupação apropriados para veículos autônomos. Para avaliar o desempenho do sistema proposto, integramos o sistema aos sistemas de percepção e navegação de um veículo autônomo e testamos em cenários do mundo real. Nossos resultados mostraram que as câmeras monoculares podem ser usadas como o principal sensor para operação autônoma de carros autônomos em baixas velocidades. No entanto, é importante destacar que o desempenho do sistema ainda é limitado em relação ao uso de sensores LIDAR em situações de alta velocidade ou em ambientes complexos e desafiadores. O sistema proposto apresenta um desempenho promissor para a construção de mapas de grade de ocupação para carros autônomos usando câmeras monoculares com redes neurais profundas baseadas em transformadores, e pode ser uma alternativa mais econômica e simples para os sensores LIDAR em certas situações. No entanto, o uso de outros sensores, juntamente com as câmeras monoculares, pode ser necessário para garantir a segurança em todas as condições de operação.
dc.description.sponsorshipFundação Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.formatText
dc.identifier.urihttps://dspace5.ufes.br/handle/10/12426
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseMestrado em Informática
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Informática
dc.rightsopen access
dc.subjectVeículos autônomos
dc.subjectRedes neurais profundas
dc.subjectEstimação de profundidade monocular
dc.subject.cnpqCiência da Computação
dc.titleEstimação de profundidade monocular baseada em redes neurais profundas para mapeamento, localização e navegação de veículos autônomos
dc.typemasterThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
MarcosThiagoPiumbini-2023-dissertacao.pdf
Tamanho:
2.68 MB
Formato:
Adobe Portable Document Format