Uso de Redes Neurais Recorrentes para Modelagem de Propagação Não Linear de Pulsos Ópticos e Geração de Supercontínuos

dc.contributor.advisor-co1Rocha, Helder Roberto de Oliveira
dc.contributor.advisor1Castellani, Carlos Eduardo Schmidt
dc.contributor.advisor1IDhttps://orcid.org/0000-0003-4154-5683
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/1975160943820607
dc.contributor.authorMartins, Gustavo Rossi
dc.contributor.referee1Samatelo, Jorge Leonid Aching
dc.contributor.referee2Nunes, Reginaldo Barbosa
dc.date.accessioned2024-06-17T11:26:06Z
dc.date.available2024-06-17T11:26:06Z
dc.date.issued2024-04-19
dc.description.abstractOptical fibers have become the backbone of modern telecommunication systems, linking countries, and continents through long submarine cables. Even with an attenuation of only 0.2 dB/km, this communication channel is not so transparent or passive, since its self-phase modulation and dispersive effects can be destructive for the communication system. Such effects are highly complex and require computationally demanding simulations based on the nonlinear Schrödinger equation (NLSE). The split-step Fourier state-of-the-art algorithm is a simple solution to evaluate the propagation of optical pulses, however, this method creates a severe bottleneck for real-time experiments, highly nonlinear cases, or with a great number of numerical simulations. This project uses recurrent neural networks to predict temporal and spectral evolution in the case of nonlinear pulse propagation, bypassing the need for numerical solutions. Due to the temporal characteristics of the propagation problem, it makes sense the use of recurrent networks such as the long short-term memory (LSTM). The first part of this work tested two networks, the LSTM and the convolutional LSTM (CLSTM). A range of hyperparameters was tested empirically in search of the best configuration that captures the optical transformations. Both networks presented good performance, with R² > 96%, however, in a deep analysis, we extended the initial conditions, and the pulse waveform, showing the CLSTM difficulty to adapt itself, highlighting the LSTM, with a maximum error of RMSE = 5.328 × 10−³ . In the second part, we tried to generalize the network applications also to the spectral domain. The bidirectional LSTM (BiLSTM) network is used, considering its bidirectional structure, allowing to learn long-term temporal dependencies and capture complex nonlinear patterns. The temporal and spectral domains are treated simultaneously here. The BiLSTM presented excellent performance, with R² > 97% to both domains, the RMSE = 4.39 × 10−³ for the temporal domain and RMSE = 1.21 × 10−² for the spectral domain, superior to the LSTM in the same conditions. Still, the same networks were applied to a supercontinuum generation case, more complex, and both networks showed good results. The BiLSTM, for example, returned an RMSE = 1.75 × 10−² for the temporal domain, and an RMSE = 1.32 × 10−² for the spectral domain. This work contributes to the applications of machine learning in nonlinear photonics, helping to build a neural model to get along with dynamics in optical pulse propagation, and supercontinuum generation.
dc.description.resumoAs fibras óticas formam o backbone do sistema de telecomunicações moderno, interligando países e continentes via extensos cabos submarinos. Mesmo com uma atenuação de apenas 0,2 dB/km, esse meio de comunicação não é tão transparente ou passivo, e seus efeitos de dispersão e auto-modulação de fase podem ser destrutivos para os sistemas de comunicação. Tais efeitos são demasiado complexos e exigem simulações computacionais sofisticadas baseadas na equação não linear de Schrödinger (NLSE). O algorítimo estado da arte splitstep Fourier é uma solução simples para avaliar a propagação de pulsos óticos, contudo, esse método pode ser um gargalo para experimentos em tempo real, casos muito não lineares, ou com grande número de simulações numéricas. O presente trabalho faz uso de redes neurais recorrentes para predizer a evolução temporal e espectral no caso de propagação não linear de pulsos óticos, dispensando o uso de soluções numéricas no modelo. Devido ao caráter temporal do problema de propagação, faz sentido o uso de redes recorrentes como a long short-term memory (LSTM). Na primeira etapa do trabalho foram testadas duas redes, a LSTM e a convolutional LSTM (CLSTM). Uma gama de hiperparâmetros foi testado empiricamente em busca da configuração que melhor captura as transformações ópticas. Ambas redes apresentaram boa performance, com R² > 96%, no entanto, uma análise mais profunda, estendendo as condições iniciais, e a forma de onda do pulso, evidenciou a dificuldade da CLSTM em se adaptar, destacando a LSTM, com erro máximo de RMSE = 5,328 ×10−³. Na segunda etapa, buscamos generalizar a aplicação das redes também para o domínio espectral. A rede bidirecional LSTM (BiLSTM) é usada, considerando sua estrutura bidirecional, permitindo aprender dependências temporais de longo prazo e capturar padrões não lineares complexos. O domínio temporal e espectral são tratados simultaneamente nesse caso. A BiLSTM apresentou excelente desempenho, com R² > 97% para ambos domínios, com RMSE = 4,39 × 10−³ no domínio temporal e com RMSE = 1,21 × 10−² no domínio espectral, superior ao LSTM para as mesmas condições. Ainda, as mesmas redes foram aplicadas para um caso de geração de supercontínuo, mais complexo, e ambas redes apresentaram bons resultados. A BiLSTM, por exemplo, apresentou um RMSE = 1,75 × 10−² no domínio temporal e RMSE = 1,32 × 10−² no domínio espectral. Este trabalho contribui para as aplicações de machine learning em fotônica não linear, auxiliando na construção de modelos neurais para lidar com dinâmicas presentes na propagação de pulsos ópticos e geração de supercontínuos.
dc.formatText
dc.identifier.urihttps://dspace5.ufes.br/handle/10/17335
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseMestrado em Engenharia Elétrica
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica
dc.rightsopen access
dc.subjectPropagação ótica
dc.subjectNLSE
dc.subjectSplit-step Fourier
dc.subjectLSTM
dc.subjectCLSTM
dc.subjectBiLSTM
dc.subject.br-rjbnsubject.br-rjbn
dc.subject.cnpqÁrea(s) do conhecimento do documento (Tabela CNPq)
dc.titleUso de Redes Neurais Recorrentes para Modelagem de Propagação Não Linear de Pulsos Ópticos e Geração de Supercontínuos
dc.title.alternativetitle.alternative
dc.typemasterThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
GustavoRossiMartins-2024-dissertacao.pdf
Tamanho:
1.85 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: