Detecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual

dc.contributor.advisor1Frizera Neto, Anselmo
dc.contributor.advisor1IDhttps://orcid.org/0000000206873967
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8928890008799265
dc.contributor.authorConceglieri, Heitor Delesporte
dc.contributor.referee1Diaz, Camilo Arturo Rodriguez
dc.contributor.referee2Mello, Ricardo Carminati de
dc.date.accessioned2024-05-29T20:55:26Z
dc.date.available2024-05-29T20:55:26Z
dc.date.issued2023-07-25
dc.description.abstractThe number of visually impaired individuals in today’s society has been increasing, and vision is of paramount importance for an individual’s perception, orientation, and location in their environment. Assistive devices such as traditional canes and smart canes, which use ultrasonic and infrared sensors, and guide dogs are implemented to provide support to users. However, these devices lack the means to acquire essential information to assist in situations commonly reported by users, such as the detection and positioning of elevated obstacles. This study aims to present and validate a strategy for object detection and localization through images captured by an RGB-D camera. Additionally, challenges and potentials in the synergistic implementation of this strategy with devices already employed for mobility assistance are discussed. The use of RGB-D cameras provides relevant information through their depth and RGB sensors to complement the use of traditional devices and assist with users’ mobility and navigation. As variable system parameters (e.g., azimuth and polar angles, and depth parameter) can considerably affect the system’s operation, two sets of experiments are conducted to validate the strategy and understand the impact of detection quality and system operation during navigation. For the experiments, the strategy is employed, and a new database with a newly trained class, ”Balloons,”is generated. Training the new class enabled the system to detect 100% of the trained class images with a minimum confidence threshold of 0.887, indicating a good detection capability. The strategy successfully detected static and dynamic objects, including elevated ones and those in the same camera axis. Results from the same experiments conducted while implementing the strategy show azimuth angle deviations with a maximum variation of 2% and depth parameter deviations ranging from 0.05% to 0.3%. These results demonstrate the feasibility of the proposed detection strategy for both static and dynamic scenarios, providing alternatives for new studies related to object detection for the assistance of visually impaired individuals. The generation of new datasets for system implementation in different scenarios, such as urban environments, integration into various mobile computing platforms for convenience and mobility, and the implementation of other user feedback methods are some of the contributions of this research.
dc.description.resumoO número de pessoas com deficiência visual na sociedade atual tem aumentado e a visão é de suma importância para a percepção, orientação e localização do indivíduo no ambiente. Dispositivos de assistência, como as tradicionais bengalas e as bengalas inteligentes, as quais utilizam sensores ultrassônicos e infravermelho, e os cães guia, são implementados para fornecer suporte aos usuários. No entanto, estes dispositivos carecem de meios para a aquisição de informações importantes para auxiliar em situações comumente relatadas pelos usuários, como a detecção e posicionamento de obstáculos elevados. O presente estudo visa apresentar e validar uma estratégia de detecção e localização de objetos por meio de imagens captadas por uma câmera RGB-D. Além disso, também são discutidos desafios e potencialidades na implementação sinérgica de tal estratégia aos dispositivos já empregados para auxílio à locomoção. O uso de câmeras RGB-D fornece, então, informações pertinentes através de seus sensores de profundidade e RGB para complementar o uso dos dispositivos tradicionais e auxiliar a locomoção e navegação dos usuários. Como parâmetros variáveis do sistema (e.g., os ângulos azimute e polar, e o parâmetro da profundidade) podem afetar de maneira considerável o funcionamento do sistema, são realizados dois grupos de experimentos para validar a estratégia e entender os impactos da qualidade de detecção e funcionamento do sistema durante a navegação. Para o conjunto de experimentos, é empregada a estratégia e gerado um novo banco de dados com uma nova classe treinada, Balloons. O treinamento da nova classe permitiu que o sistema detectasse 100% das imagens da classe treinada com limiar de confiança mínimo de 0,887, indicando boa capacidade de detecção. A estratégia conseguiu detectar objetos estáticos e dinâmicos, além de elevados e no mesmo eixo da câmera. Resultados dos mesmos experimentos realizados, implementando a estratégia, mostram desvios do ângulo azimute apresentando variação máxima de 2% e entre 0,05% a 0,3% para o parâmetro de profundidade. Esses resultados demonstram a viabilidade da estratégia de detecção proposta tanto para cenários estáticos quanto dinâmicos, oferecendo alternativas para novos estudos em relação à detecção de objetos para auxílio à locomoção de deficientes visuais. A geração de novos conjuntos de dados para a implementação do sistema em novos cenários, como o urbano, a integração em diferentes plataformas computacionais móveis visando praticidade e mobilidade, e a implementação de outros métodos de realimentação ao usuário são algumas das contribuições desta pesquisa.
dc.formatText
dc.identifier.urihttps://dspace5.ufes.br/handle/10/12553
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseMestrado em Engenharia Elétrica
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica
dc.rightsopen access
dc.subjectVisão Computacional
dc.subjectDetecção em tempo real
dc.subjectDeficientes visuais
dc.subjectCâmera RGB-D
dc.subjectTecnologia assistiva
dc.subject.cnpqEngenharia Elétrica
dc.titleDetecção e posicionamento de objetos em tempo real para auxiliar a mobilidade de usuários com deficiência visual
dc.typemasterThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
HeitorDelesporteConceglieri-2023-Trabalho.pdf
Tamanho:
15.5 MB
Formato:
Adobe Portable Document Format