ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA
En los últimos años se identifica un desarrollo notorio en el campo de la ciencia de los materiales logrando grandes cantidades de información. Dicha información se hace compleja de recopilar debido a distintos factores que dificultan obtener una base de datos confiable con una estructura bien defin...
- Autores:
-
Toscano Higuera, Sebastián Camilo
Arroyave Zapata, Juan David
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad Industrial de Santander
- Repositorio:
- Repositorio UIS
- Idioma:
- spa
- OAI Identifier:
- oai:noesis.uis.edu.co:20.500.14071/11895
- Palabra clave:
- Imputación
Mezclas gaussianas
Celdas solares de Perovskita
Imputation
Gaussian mix
Solar cells
Perovskite
- Rights
- openAccess
- License
- Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
id |
UISANTADR2_d5b0283da410d4b45f57e15932a62199 |
---|---|
oai_identifier_str |
oai:noesis.uis.edu.co:20.500.14071/11895 |
network_acronym_str |
UISANTADR2 |
network_name_str |
Repositorio UIS |
repository_id_str |
|
dc.title.none.fl_str_mv |
ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA |
dc.title.english.none.fl_str_mv |
AUTOMATIC ENRICHMENT OF EXTRACTED DATA USING NATURAL LANGUAGE PROCESSING IN PEROVSKITE SOLAR CELL INFORMATION MINING |
title |
ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA |
spellingShingle |
ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA Imputación Mezclas gaussianas Celdas solares de Perovskita Imputation Gaussian mix Solar cells Perovskite |
title_short |
ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA |
title_full |
ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA |
title_fullStr |
ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA |
title_full_unstemmed |
ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA |
title_sort |
ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA |
dc.creator.fl_str_mv |
Toscano Higuera, Sebastián Camilo Arroyave Zapata, Juan David |
dc.contributor.advisor.none.fl_str_mv |
Camacho Parra, Cristian David Sepulveda Sepulveda, Franklin Alexander |
dc.contributor.author.none.fl_str_mv |
Toscano Higuera, Sebastián Camilo Arroyave Zapata, Juan David |
dc.contributor.evaluator.none.fl_str_mv |
Correa Cely, Carlos Rodrigo Fajardo Ariza, Carlos Augusto |
dc.subject.none.fl_str_mv |
Imputación Mezclas gaussianas Celdas solares de Perovskita |
topic |
Imputación Mezclas gaussianas Celdas solares de Perovskita Imputation Gaussian mix Solar cells Perovskite |
dc.subject.keyword.none.fl_str_mv |
Imputation Gaussian mix Solar cells Perovskite |
description |
En los últimos años se identifica un desarrollo notorio en el campo de la ciencia de los materiales logrando grandes cantidades de información. Dicha información se hace compleja de recopilar debido a distintos factores que dificultan obtener una base de datos confiable con una estructura bien definida. Por esta razón, las técnicas de PLN ofrecen una solución a una robusta recopilación de datos. Sin embargo, este conjunto de datos extraído con PLN presentan incongruencias y/o instancias incompletas. Por ello, se hace necesario aplicar estrategias para manejar estos problemas, las cuales en este trabajo de investigación se usa un único modelo de función de probabilidad para el enriquecimiento de un conjunto de datos de parámetros de celdas solares de Perovskita. El desarrollo de esta investigación se lleva a cabo en 2 fases. En la primera se acondiciona la base de datos para eliminar valores atípicos y en la segunda se entrena y evalúa el modelo. En consecuencia a este procedimiento se consigue una precisión media mayor al 50% y en el caso de la variable de eficiencia de conversión de energía se logra una precisión del 84%. En conclusión, esta investigación presenta resultados prometedores dada que resulta ser una propuesta innovadora en el campo de las celdas solares de Perovskita. Por último para obtener un mejor entrenamiento del modelo se recomienda hacer uso de una base de datos con una cantidad de datos más significativa. |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-11-04T12:58:19Z |
dc.date.available.none.fl_str_mv |
2022-11-04T12:58:19Z |
dc.date.created.none.fl_str_mv |
2022-11-03 |
dc.date.issued.none.fl_str_mv |
2022-11-03 |
dc.type.local.none.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
dc.type.hasversion.none.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
format |
http://purl.org/coar/resource_type/c_7a1f |
dc.identifier.uri.none.fl_str_mv |
https://noesis.uis.edu.co/handle/20.500.14071/11895 |
dc.identifier.instname.none.fl_str_mv |
Universidad Industrial de Santander |
dc.identifier.reponame.none.fl_str_mv |
Universidad Industrial de Santander |
dc.identifier.repourl.none.fl_str_mv |
https://noesis.uis.edu.co |
url |
https://noesis.uis.edu.co/handle/20.500.14071/11895 https://noesis.uis.edu.co |
identifier_str_mv |
Universidad Industrial de Santander |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.license.none.fl_str_mv |
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) |
dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.rights.coar.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.accessrights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.creativecommons.none.fl_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) |
rights_invalid_str_mv |
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) http://creativecommons.org/licenses/by-nc-nd/4.0/ http://purl.org/coar/access_right/c_abf2 Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Industrial de Santander |
dc.publisher.faculty.none.fl_str_mv |
Facultad de Ingeníerias Fisicomecánicas |
dc.publisher.program.none.fl_str_mv |
Ingeniería Electrónica |
dc.publisher.school.none.fl_str_mv |
Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones |
publisher.none.fl_str_mv |
Universidad Industrial de Santander |
institution |
Universidad Industrial de Santander |
bitstream.url.fl_str_mv |
https://noesis.uis.edu.co/bitstreams/778e13f9-3e9e-47ea-9b2c-802ba8c5102e/download https://noesis.uis.edu.co/bitstreams/6f67303d-7f1e-4a2c-ba03-1e5b624de66f/download https://noesis.uis.edu.co/bitstreams/d21cfbae-f33c-4c81-ba14-2911ef2b3627/download https://noesis.uis.edu.co/bitstreams/bb91a983-51a1-4acf-879c-196243c26aa6/download |
bitstream.checksum.fl_str_mv |
a237fc37469359c66722c48331d1b101 83fa8903c6de473dfee4c8d1a1c42004 46593a131ed897e59e154779141aa265 d6298274a8378d319ac744759540b71b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
DSpace at UIS |
repository.mail.fl_str_mv |
noesis@uis.edu.co |
_version_ |
1814095243778195456 |
spelling |
Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/http://purl.org/coar/access_right/c_abf2info:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)Camacho Parra, Cristian DavidSepulveda Sepulveda, Franklin AlexanderToscano Higuera, Sebastián CamiloArroyave Zapata, Juan DavidCorrea Cely, Carlos RodrigoFajardo Ariza, Carlos Augusto2022-11-04T12:58:19Z2022-11-04T12:58:19Z2022-11-032022-11-03https://noesis.uis.edu.co/handle/20.500.14071/11895Universidad Industrial de SantanderUniversidad Industrial de Santanderhttps://noesis.uis.edu.coEn los últimos años se identifica un desarrollo notorio en el campo de la ciencia de los materiales logrando grandes cantidades de información. Dicha información se hace compleja de recopilar debido a distintos factores que dificultan obtener una base de datos confiable con una estructura bien definida. Por esta razón, las técnicas de PLN ofrecen una solución a una robusta recopilación de datos. Sin embargo, este conjunto de datos extraído con PLN presentan incongruencias y/o instancias incompletas. Por ello, se hace necesario aplicar estrategias para manejar estos problemas, las cuales en este trabajo de investigación se usa un único modelo de función de probabilidad para el enriquecimiento de un conjunto de datos de parámetros de celdas solares de Perovskita. El desarrollo de esta investigación se lleva a cabo en 2 fases. En la primera se acondiciona la base de datos para eliminar valores atípicos y en la segunda se entrena y evalúa el modelo. En consecuencia a este procedimiento se consigue una precisión media mayor al 50% y en el caso de la variable de eficiencia de conversión de energía se logra una precisión del 84%. En conclusión, esta investigación presenta resultados prometedores dada que resulta ser una propuesta innovadora en el campo de las celdas solares de Perovskita. Por último para obtener un mejor entrenamiento del modelo se recomienda hacer uso de una base de datos con una cantidad de datos más significativa.PregradoIngeniero ElectrónicoIn recent years, a notable development has been identified in the field of materials science, achieving large amounts of information. This information becomes complex to collect due to different factors that make it difficult to obtain a reliable database with a well-defined structure. For this reason, PLN techniques offer a solution to robust data collection. However, this dataset extracted with PLN presents inconsistencies and/or incomplete instances. Therefore, it is necessary to apply strategies to handle these problems, which in this research work we use a single probability function model for the enrichment of a dataset of Perovskite solar cell parameters. The development of this research is carried out in 2 phases. In the first, the database is conditioned to eliminate outliers, and in the second, the model is trained and evaluated. As a result of this procedure, an average accuracy greater than 50% is achieved and in the case of the energy conversion efficiency variable, an accuracy of 84% is achieved. In conclusion, this research presents promising results given that it turns out to be an innovative proposal in the field of Perovskite solar cells. Finally, to obtain a better training of the model, it is recommended to use a database with a more significant amount of data.application/pdfspaUniversidad Industrial de SantanderFacultad de Ingeníerias FisicomecánicasIngeniería ElectrónicaEscuela de Ingenierías Eléctrica, Electrónica y TelecomunicacionesImputaciónMezclas gaussianasCeldas solares de PerovskitaImputationGaussian mixSolar cellsPerovskiteENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITAAUTOMATIC ENRICHMENT OF EXTRACTED DATA USING NATURAL LANGUAGE PROCESSING IN PEROVSKITE SOLAR CELL INFORMATION MININGTesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/version/c_b1a7d7d4d402bccehttp://purl.org/coar/resource_type/c_7a1fORIGINALCarta de autorización.pdfCarta de autorización.pdfapplication/pdf183770https://noesis.uis.edu.co/bitstreams/778e13f9-3e9e-47ea-9b2c-802ba8c5102e/downloada237fc37469359c66722c48331d1b101MD51Documento.pdfDocumento.pdfapplication/pdf1003944https://noesis.uis.edu.co/bitstreams/6f67303d-7f1e-4a2c-ba03-1e5b624de66f/download83fa8903c6de473dfee4c8d1a1c42004MD52Nota de proyecto.pdfNota de proyecto.pdfapplication/pdf91198https://noesis.uis.edu.co/bitstreams/d21cfbae-f33c-4c81-ba14-2911ef2b3627/download46593a131ed897e59e154779141aa265MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-82237https://noesis.uis.edu.co/bitstreams/bb91a983-51a1-4acf-879c-196243c26aa6/downloadd6298274a8378d319ac744759540b71bMD5420.500.14071/11895oai:noesis.uis.edu.co:20.500.14071/118952022-11-04 07:58:22.83http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessembargohttps://noesis.uis.edu.coDSpace at UISnoesis@uis.edu.coRWwgc3VzY3JpdG8gQVVUT1Ig4oCTIEVTVFVESUFOVEUsIGlkZW50aWZpY2FkbyBjb21vIGFwYXJlY2UgYWwgcGllIGRlIG1pIGZpcm1hLCBhY3R1YW5kbyBlbiBub21icmUgcHJvcGlvLCB5IGVuIG1pIGNhbGlkYWQgZGUgYXV0b3IgZGVsIHRyYWJham8gZGUgZ3JhZG8sIGRlbCB0cmFiYWpvIGRlIGludmVzdGlnYWNpw7NuLCBvIGRlIGxhIHRlc2lzIGRlbm9taW5hZGEgY29tbyBzZSBlc3BlY2lmaWNhIGVuIGVsIGNhbXBvIOKAmFTDrXR1bG/igJksIHBvciBtZWRpbyBkZWwgcHJlc2VudGUgZG9jdW1lbnRvIGF1dG9yaXpvIGEgbGEgVU5JVkVSU0lEQUQgSU5EVVNUUklBTCBERSBTQU5UQU5ERVIsIHBhcmEgcXVlIGVuIGxvcyB0w6lybWlub3MgZXN0YWJsZWNpZG9zIGVuIGxhIExleSAyMyBkZSAxOTgyLCBsYSBMZXkgNDQgZGUgMTk5MywgZWwgRGVjcmV0byA0NjAgZGUgMTk5NSwgbGEgRGVjaXNpw7NuIEFuZGluYSAzNTEgZGUgMTk5MywgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBkZXJlY2hvcyBkZSBhdXRvciwgcmVhbGljZSBsYSByZXByb2R1Y2Npw7NuLCBjb211bmljYWNpw7NuIHDDumJsaWNhLCBlZGljacOzbiwgZGlzdHJpYnVjacOzbiBiYWpvIGxhIG1vZGFsaWRhZCBkZSBhbHF1aWxlciwgcHLDqXN0YW1vIHDDumJsaWNvIG8gaW1wb3J0YWNpw7NuIGVuIGZvcm1hdG8gaW1wcmVzbyB5IGRpZ2l0YWwsIGxhIHRyYW5zZm9ybWFjacOzbiwgbGEgcHVibGljYWNpw7NuIGNvbW8gb2JyYSBsaXRlcmFyaWEsIGxpYnJvIGVsZWN0csOzbmljbyAoZS1Cb29rKSBvIHJldmlzdGEgZWxlY3Ryw7NuaWNhLCBpbmNsdXllbmRvIGxhIHBvc2liaWxpZGFkIGRlIGRpc3RyaWJ1aXJsYSBwb3IgbWVkaW9zIHRyYWRpY2lvbmFsZXMgbyBwb3IgSW50ZXJuZXQgYSBjdWFscXVpZXIgdMOtdHVsbyAgcG9yIGxhIFVuaXZlcnNpZGFkIHkgY29uIHF1aWVuIHRlbmdhIGNvbnZlbmlvIHBhcmEgZWxsbywgaW5jbHV5ZW5kbyBsYSBwb3NpYmlsaWRhZCBkZSBoYWNlciBhZGFwdGFjaW9uZXMsIGFjdHVhbGl6YWNpb25lcyB5IHRyYWR1Y2Npb25lcyBlbiB0b2RvcyBsb3MgaWRpb21hczsgbGEgaW5jb3Jwb3JhY2nDs24gYSB1bmEgY29sZWNjacOzbiBvIGNvbXBpbGFjacOzbiwgbGEgdHJhZHVjY2nDs24sIGZpamFjacOzbiBlbiBmb25vZ3JhbWEsIHB1ZXN0YSBhIGRpc3Bvc2ljacOzbiBlbiBmb3JtYXRvIGFuw6Fsb2dvLCBkaWdpdGFsLCBhdWRpb3Zpc3VhbCwgbWFnbsOpdGljbywgeSwgZW4gZ2VuZXJhbCwgbG9zIGZvcm1hdG9zIGVuICBxdWUgc2UgcHVlZGEgcmVwcm9kdWNpciB5IGNvbXVuaWNhciAgZGUgbWFuZXJhIHRvdGFsIHkgcGFyY2lhbCBtaSB0cmFiYWpvIGRlIGdyYWRvIG8gdGVzaXMuIAoKTGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBzZSBoYWNlIGV4dGVuc2l2YSBhIGxhcyBmYWN1bHRhZGVzIHkgZGVyZWNob3MgZGUgdXNvIHNvYnJlIGxhIG9icmEgZW4gZm9ybWF0byBvIHNvcG9ydGUgYW7DoWxvZ28sIGZvcm1hdG8gdmlydHVhbCwgZWxlY3Ryw7NuaWNvLCBkaWdpdGFsLCDDs3B0aWNvLCB1c28gZW4gcmVkLCBJbnRlcm5ldCwgZXh0cmFuZXQsIGludHJhbmV0LCBlbnRyZSBvdHJvcyBmb3JtYXRvcyB5IG1lZGlvcy4KCkVsIEFVVE9SIOKAkyBFU1RVRElBTlRFLCBtYW5pZmllc3RhIHF1ZSBsYSBvYnJhIG9iamV0byBkZSBsYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIGVzIG9yaWdpbmFsIHkgbGEgcmVhbGl6w7Mgc2luIHZpb2xhciBvIHVzdXJwYXIgZGVyZWNob3MgZGUgYXV0b3IgZGUgdGVyY2Vyb3MsIHBvciBsbyB0YW50bywgbGEgb2JyYSBlcyBkZSBzdSBleGNsdXNpdmEgYXV0b3LDrWEgeSBkZXRlbnRhIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLiAgCgpQYXJhIHRvZG9zIGxvcyBlZmVjdG9zIGxhIFVOSVZFUlNJREFEIElORFVTVFJJQUwgREUgU0FOVEFOREVSIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8gZGUgYnVlbmEgZmU7IGVuIGNvbnNlY3VlbmNpYSwgZW4gY2FzbyBkZSBwcmVzZW50YXJzZSBjdWFscXVpZXIgcmVjbGFtYWNpw7NuIG8gYWNjacOzbiBwb3IgcGFydGUgZGUgdW4gdGVyY2VybyBlbiBjdWFudG8gYSBsb3MgZGVyZWNob3MgZGUgYXV0b3Igc29icmUgbGEgb2JyYSBlbiBjdWVzdGnDs24sIEVsIEFVVE9SIOKAkyBFU1RVRElBTlRFLCBhc3VtaXLDoSB0b2RhIGxhIHJlc3BvbnNhYmlsaWRhZCwgeSBzYWxkcsOhIGVuIGRlZmVuc2EgZGUgbG9zIGRlcmVjaG9zIGFxdcOtIGF1dG9yaXphZG9zLgo= |