Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo
| dc.contributor.advisor1 | Filgueiras, Paulo Roberto | |
| dc.contributor.advisor1ID | https://orcid.org/0000000326171601 | |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1907915547207861 | |
| dc.contributor.author | Moro, Mariana Kuster | |
| dc.contributor.authorLattes | http://lattes.cnpq.br/9789087871167165 | |
| dc.contributor.referee1 | Romão, Wanderson | |
| dc.contributor.referee1ID | https://orcid.org/0000000222546683 | |
| dc.contributor.referee1Lattes | http://lattes.cnpq.br/9121022613112821 | |
| dc.contributor.referee2 | Cunha Neto, Alvaro | |
| dc.contributor.referee2ID | https://orcid.org/0000-0002-1814-6214 | |
| dc.contributor.referee2Lattes | http://lattes.cnpq.br/7448379486432052 | |
| dc.contributor.referee3 | Borges Neto, Waldomiro | |
| dc.contributor.referee3ID | https://orcid.org/0000-0002-5808-5073 | |
| dc.contributor.referee3Lattes | http://lattes.cnpq.br/7646193734918354 | |
| dc.contributor.referee4 | Duarte, Lucas Mattos | |
| dc.date.accessioned | 2024-05-30T00:53:17Z | |
| dc.date.available | 2024-05-30T00:53:17Z | |
| dc.date.issued | 2022-02-18 | |
| dc.description.abstract | Data fusion from different analytical sources can be a viable way to estimate physicochemical properties ou classificate crude oil samples, when compared to using a single analytical technique. This is because outputs from different instrumental techniques can carry additional information and act synergistically during calibration. In this work, the potential of data fusion strategies was investigated to estimate seven properties of crude oil: sulfur content (S), total nitrogen content (NT), basic nitrogen content (NB), total acid number (NAT), saturated (SAT), aromatic (ARO) and polar (POL) fractions. A total of 125 crude oil samples were available, divided into 70% for calibration and 30% for prediction. The physicochemical properties of the samples were determined using standardized experimental methods. Partial least squares (PLS) regression models were constructed from pre-treated mid-infrared spectroscopy (MIR) data and 1H and 13C nuclear magnetic resonance (RMN) spectroscopy data, using the data in individual form and also fused at low-level, mid-level with PCA and PLS and high-level in different combinations. The optimal number of latent variables was determined by cross-validation, using the Venetian Blind method. The results showed that, while mid-level data fusion by PLS increased the accuracy of some of the models, low, mid by PCA and high-level fusion provided negligible improvements. Using mid-level by PLS data fusion, the contents of S, NT, NB, NAT, SAT, ARO and POL were estimated, respectively, with RMSEP equal to 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% and 6,50 m/m% and coefficient of determination equal to 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 and 0,66. Low and mid-level by PCA data fusion was also applied to near infrared (NIR) and MIR spectroscopy data for discrimination of crude oil samples into sweet/sour, poor/rich in nitrogen, non-acidic/acidic/highly acidic and light/ medium/heavy. The classification models were obtained through the method of discriminant analysis by partial least squares (PLS-DA). Classification models based on individual spectra and on the low and mid-level fused spectra were compared using the performance parameters sensitivity, specificity, efficiency, accuracy and total prediction error. Compared to the individual models, low and/or med-level data fusion provided greater accuracy and lower total prediction error rate in all four classifications proposed in this study. The classification models built from data fusion showed high accuracy, reaching values equal to or greater than 92%. These results demonstrate that the proposed spectroscopic techniques can complement each other, through the data fusion strategy, generating a greater synergistic effect and, consequently, producing models with greater predictive capacity. | |
| dc.description.resumo | A fusão de dados de diferentes fontes analíticas pode ser uma forma viável de estimar as propriedades físico-químicas do petróleo quando comparada ao uso de uma única técnica analítica. Isso ocorre porque saídas de diferentes fontes instrumentais podem transportar informações complementares e agir sinergicamente durante a calibração. Neste trabalho, foi investigado o potencial das estratégias de fusão de dados para estimar sete propriedades do petróleo bruto: teor de enxofre (S), teor de nitrogênio total (NT), teor de nitrogênio básico (NB), número de ácido total (NAT), frações de saturados (SAT), aromáticos (ARO) e polares (POL). Foram disponibilizadas 125 amostras de petróleo bruto, divididas em 70% para calibração e 30% para previsão. As propriedades físico-químicas das amostras foram determinadas por meio de métodos experimentais padronizados. Modelos de regressão por mínimos quadrados parciais (PLS) foram construídos a partir dos dados, previamente pré-tratados, de espectroscopia no infravermelho médio (MIR) com transformada de Fourier e de espectroscopia de ressonância magnética nuclear (RMN) de 1H e 13C, individuais e fundidos a nível baixo, médio por PCA e PLS e alto em diferentes combinações. O número ótimo de variáveis latentes foi determinado por validação cruzada, pelo método Venetian Blind. Os resultados mostraram que, enquanto a fusão de nível médio por PLS aumentou a exatidão de alguns dos modelos, a fusão de nível baixo, médio por PCA e alto proporcionou melhorias insignificantes. Aplicando a fusão de nível médio por PLS, os teores de S, NT, NB, NAT, SAT, ARO e POL foram estimados, respectivamente, com RMSEP iguais a 0,057 m/m%, 0,041 m/m%, 0,0067 m/m%, 0,16 mgKOHg –1 , 4,73 m/m%, 3,66 m/m% e 6,50 m/m% e coeficientes de determinação iguais a 0,90, 0,83, 0,98, 0,91, 0,84, 0,67 e 0,66, para o conjunto de amostras teste. A fusão de nível médio por PLS demonstrou, para estes casos, ser a melhor estratégia fusão entre as demais, melhorando a exatidão dos modelos. A fusão de dados a nível baixo e médio por PCA também foi aplicada em dados de espectroscopia no infravermelho próximo (NIR) e MIR para discriminação de amostras de petróleo bruto em doce/azedo, pobre/rico em nitrogênio, não ácido/ácido/altamente ácido e leve/médio/pesado. Os modelos de classificação foram obtidos por meio do método de análise discriminante por mínimos quadrados parciais (PLS-DA). Os modelos de classificação baseados nos espectros individuais e nos espectros fundidos a nível baixo e médio foram comparados utilizando os parâmetros de desempenho sensibilidade, especificidade, eficiência, acurácia e erro de predição total. Em comparação com os modelos individuais, a fusão de dados a nível baixo e/ou médio proporcionou uma maior acurácia e menor taxa de erro de predição total em todas as quatro classificações propostas neste estudo. Os modelos de classificação construídos a partir da fusão de dados apresentaram alta acurácia, atingindo valores iguais ou superiores a 92%. Esses resultados demonstraram que as técnicas espectroscópicas propostas podem se complementar, por meio da estratégia de fusão de dados, gerando maior efeito sinérgico e, conseqüentemente, produzindo modelos com maior capacidade de previsão. | |
| dc.format | Text | |
| dc.identifier.uri | https://dspace5.ufes.br/handle/10/15921 | |
| dc.language | por | |
| dc.publisher | Universidade Federal do Espírito Santo | |
| dc.publisher.country | BR | |
| dc.publisher.course | Doutorado em Química | |
| dc.publisher.department | Centro de Ciências Exatas | |
| dc.publisher.initials | UFES | |
| dc.publisher.program | Programa de Pós-Graduação em Química | |
| dc.rights | open access | |
| dc.subject | Fusão de dados | |
| dc.subject | Petróleo bruto | |
| dc.subject | RMN | |
| dc.subject | PLS | |
| dc.subject.br-rjbn | subject.br-rjbn | |
| dc.subject.cnpq | Química | |
| dc.title | Fusão de dados espectrais em quimiometria: Uma abordagem em química do petróleo | |
| dc.title.alternative | Spectral data fusion in chemometric: An approach in petroleum chemistry | |
| dc.type | doctoralThesis |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- Tese Mariana Kuster Moro - versão final.pdf
- Tamanho:
- 3.74 MB
- Formato:
- Adobe Portable Document Format
