Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal
Gracias a los avances tecnológicos, los sistemas de información cada día han ido almacenando conjuntos de datos cada vez más grandes. Por lo anterior, crear modelos de estimación ha sido una tarea necesaria en diferentes campos de acción. La regresión lineal, como modelo matemático, es entonces una...
- Autores:
-
Betancur Cervantes, Fabián Andres
Castro Calvo, Ruben Dario
- Tipo de recurso:
- Fecha de publicación:
- 2016
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/5846
- Acceso en línea:
- http://hdl.handle.net/10584/5846
- Palabra clave:
- Regresión lineal
Validación cruzada
Metaheurísticas
Linear regression
Metaheuristics
Cross Validation
- Rights
- License
- Universidad del Norte
id |
REPOUNORT2_02a23feff775b2e7fc7a0aeb71c71f42 |
---|---|
oai_identifier_str |
oai:manglar.uninorte.edu.co:10584/5846 |
network_acronym_str |
REPOUNORT2 |
network_name_str |
Repositorio Uninorte |
repository_id_str |
|
dc.title.es_ES.fl_str_mv |
Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal |
dc.title.en_US.fl_str_mv |
Design and implementation of a tool with metaheuristics for the approximation of optimal sub-spaces in linear regression problems |
title |
Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal |
spellingShingle |
Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal Regresión lineal Validación cruzada Metaheurísticas Linear regression Metaheuristics Cross Validation |
title_short |
Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal |
title_full |
Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal |
title_fullStr |
Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal |
title_full_unstemmed |
Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal |
title_sort |
Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal |
dc.creator.fl_str_mv |
Betancur Cervantes, Fabián Andres Castro Calvo, Ruben Dario |
dc.contributor.advisor.none.fl_str_mv |
Niño Ruiz, Elías David |
dc.contributor.author.none.fl_str_mv |
Betancur Cervantes, Fabián Andres Castro Calvo, Ruben Dario |
dc.subject.es_ES.fl_str_mv |
Regresión lineal Validación cruzada Metaheurísticas |
topic |
Regresión lineal Validación cruzada Metaheurísticas Linear regression Metaheuristics Cross Validation |
dc.subject.en_US.fl_str_mv |
Linear regression Metaheuristics Cross Validation |
description |
Gracias a los avances tecnológicos, los sistemas de información cada día han ido almacenando conjuntos de datos cada vez más grandes. Por lo anterior, crear modelos de estimación ha sido una tarea necesaria en diferentes campos de acción. La regresión lineal, como modelo matemático, es entonces una herramienta de ajuste que aproxima la relación que hay entre la variable dependiente (la solución asociada al sub-espacio) y las variables independientes (los atributos de grupo de muestras dadas). El inconveniente que presenta la regresión lineal es que compromete cierta precisión en el ajuste a cambio de tener un tiempo menor de procesamiento. El proyecto presenta como resultado cuatro mecanismos de optimización combinatoria (basados en: Búsqueda Tabú, Recocido Simulado, Colonia de Hormigas y un Algoritmo Genético) que realizan el proceso de estimación agrupando atributos del conjunto de datos haciendo posible la generación de un sub-espacio más óptimo que el de la regresión lineal simple tradicional. La solución propuesta realiza agrupamiento de atributos y consta de algoritmos de validación cruzada que generan los coeficientes para la regresión creada, estos son buscados mediante una descomposición en valores singulares, efectuando una mejora en la velocidad con una perdida muy baja de precisión, esto se valida con el método de mínimos cuadrados, considerando que la distancia entre las ecuaciones generadas represente mejor la muestra. Cuando se obtiene la mejor solución, luego de realizar distintas iteraciones, se obtienen los coeficientes obtenidos por el recurso desarrollado. Para realizar las pruebas se tomaron diferentes conjuntos de datos con una cantidad relativamente grande de atributos (20 a 100), todos ellos de libre acceso obteniendo así sub-espacios en los que el error de aproximación era menor al de la solución obtenida por medio de la regresión lineal tradicional. |
publishDate |
2016 |
dc.date.accessioned.none.fl_str_mv |
2016-11-25T22:07:51Z |
dc.date.available.none.fl_str_mv |
2016-11-25T22:07:51Z |
dc.date.issued.none.fl_str_mv |
2016-11-19 |
dc.type.es_ES.fl_str_mv |
article |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10584/5846 |
url |
http://hdl.handle.net/10584/5846 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
Universidad del Norte |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Universidad del Norte http://purl.org/coar/access_right/c_abf2 |
dc.publisher.es_ES.fl_str_mv |
Barranquilla, Universidad del Norte, 2016 |
institution |
Universidad del Norte |
bitstream.url.fl_str_mv |
http://172.16.14.36:8080/bitstream/10584/5846/5/license.txt http://172.16.14.36:8080/bitstream/10584/5846/1/ArqSoluci%c3%b3n.pdf http://172.16.14.36:8080/bitstream/10584/5846/2/ArqSoluci%c3%b3n.png http://172.16.14.36:8080/bitstream/10584/5846/3/ArqSoluci%c3%b3nEN.png http://172.16.14.36:8080/bitstream/10584/5846/4/ArqSoluci%c3%b3nEN.pdf |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 1e9f51a4d60eb52935ee0a48eb396c71 dc920ac5bc51a262f7de627aa00f24b5 bfd6d29574b66de0048a4fabbe262e0b 65f7a014929c85fe19726ddc9e59877a |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Digital de la Universidad del Norte |
repository.mail.fl_str_mv |
mauribe@uninorte.edu.co |
_version_ |
1812183107671949312 |
spelling |
Niño Ruiz, Elías DavidBetancur Cervantes, Fabián AndresCastro Calvo, Ruben Dario2016-11-25T22:07:51Z2016-11-25T22:07:51Z2016-11-19http://hdl.handle.net/10584/5846Gracias a los avances tecnológicos, los sistemas de información cada día han ido almacenando conjuntos de datos cada vez más grandes. Por lo anterior, crear modelos de estimación ha sido una tarea necesaria en diferentes campos de acción. La regresión lineal, como modelo matemático, es entonces una herramienta de ajuste que aproxima la relación que hay entre la variable dependiente (la solución asociada al sub-espacio) y las variables independientes (los atributos de grupo de muestras dadas). El inconveniente que presenta la regresión lineal es que compromete cierta precisión en el ajuste a cambio de tener un tiempo menor de procesamiento. El proyecto presenta como resultado cuatro mecanismos de optimización combinatoria (basados en: Búsqueda Tabú, Recocido Simulado, Colonia de Hormigas y un Algoritmo Genético) que realizan el proceso de estimación agrupando atributos del conjunto de datos haciendo posible la generación de un sub-espacio más óptimo que el de la regresión lineal simple tradicional. La solución propuesta realiza agrupamiento de atributos y consta de algoritmos de validación cruzada que generan los coeficientes para la regresión creada, estos son buscados mediante una descomposición en valores singulares, efectuando una mejora en la velocidad con una perdida muy baja de precisión, esto se valida con el método de mínimos cuadrados, considerando que la distancia entre las ecuaciones generadas represente mejor la muestra. Cuando se obtiene la mejor solución, luego de realizar distintas iteraciones, se obtienen los coeficientes obtenidos por el recurso desarrollado. Para realizar las pruebas se tomaron diferentes conjuntos de datos con una cantidad relativamente grande de atributos (20 a 100), todos ellos de libre acceso obteniendo así sub-espacios en los que el error de aproximación era menor al de la solución obtenida por medio de la regresión lineal tradicional.Thanks to technological advances, information systems store bigger datasets. This is why creating estimation models has been a necessary task to manage appropriately any given system, whether in a public or a private setting. Linear regression, as a mathematical model is, then, an adjustment tool which approximates the relation that exists between a dependent variable (related to the solution) and the independent variables (the attributes of a samples group). The inconvenient presented by linear regression is that it compromises some precision in the adjustment, in exchange of less processing time. The project presents as result four combinatorial optimization mechanisms (based on: Tabu Search, Simulated Annealing, Ant Colony and a genetic algorithm) that carry out the estimation process grouping attributes from the dataset, attempting to generate a more optimum sub-space than that in the traditional simple linear regression. A waterfall model method was used to complete the project. The proposed solution groups attributes and consists of crossovering algorithms that generate the coefficients for the given regression. These are found through a singular value decomposition, reaching an improvement in the speed, with a very low precision loss. This is validated with the least squares method, considering that the distance between the given equations represents the sample better. When the best solution is obtained, after performing various iterations, the coefficients given by the developed resource were obtained. To carry out the tests different datasets were taken with many attributes (between 20 and 100), all of them of free access obtaining a sub-space in which the approximation error was lower than the solution obtained from traditional linear regression.spaBarranquilla, Universidad del Norte, 2016Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Regresión linealValidación cruzadaMetaheurísticasLinear regressionMetaheuristicsCross ValidationDiseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión linealDesign and implementation of a tool with metaheuristics for the approximation of optimal sub-spaces in linear regression problemsarticlehttp://purl.org/coar/resource_type/c_6501LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://172.16.14.36:8080/bitstream/10584/5846/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55ORIGINALArqSolución.pdfArqSolución.pdfArquitectura de la soluciónapplication/pdf7178096http://172.16.14.36:8080/bitstream/10584/5846/1/ArqSoluci%c3%b3n.pdf1e9f51a4d60eb52935ee0a48eb396c71MD51ArqSolución.pngArqSolución.pngimage/png1596046http://172.16.14.36:8080/bitstream/10584/5846/2/ArqSoluci%c3%b3n.pngdc920ac5bc51a262f7de627aa00f24b5MD52ArqSoluciónEN.pngArqSoluciónEN.pngArquitectura de la solución ENimage/png1187704http://172.16.14.36:8080/bitstream/10584/5846/3/ArqSoluci%c3%b3nEN.pngbfd6d29574b66de0048a4fabbe262e0bMD53ArqSoluciónEN.pdfArqSoluciónEN.pdfArquitectura de la solución ENapplication/pdf2868652http://172.16.14.36:8080/bitstream/10584/5846/4/ArqSoluci%c3%b3nEN.pdf65f7a014929c85fe19726ddc9e59877aMD5410584/5846oai:172.16.14.36:10584/58462016-11-25 17:07:51.493Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.co |