Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal

Gracias a los avances tecnológicos, los sistemas de información cada día han ido almacenando conjuntos de datos cada vez más grandes. Por lo anterior, crear modelos de estimación ha sido una tarea necesaria en diferentes campos de acción. La regresión lineal, como modelo matemático, es entonces una...

Full description

Autores:
Betancur Cervantes, Fabián Andres
Castro Calvo, Ruben Dario
Tipo de recurso:
Fecha de publicación:
2016
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/5846
Acceso en línea:
http://hdl.handle.net/10584/5846
Palabra clave:
Regresión lineal
Validación cruzada
Metaheurísticas
Linear regression
Metaheuristics
Cross Validation
Rights
License
Universidad del Norte
id REPOUNORT2_02a23feff775b2e7fc7a0aeb71c71f42
oai_identifier_str oai:manglar.uninorte.edu.co:10584/5846
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal
dc.title.en_US.fl_str_mv Design and implementation of a tool with metaheuristics for the approximation of optimal sub-spaces in linear regression problems
title Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal
spellingShingle Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal
Regresión lineal
Validación cruzada
Metaheurísticas
Linear regression
Metaheuristics
Cross Validation
title_short Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal
title_full Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal
title_fullStr Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal
title_full_unstemmed Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal
title_sort Diseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión lineal
dc.creator.fl_str_mv Betancur Cervantes, Fabián Andres
Castro Calvo, Ruben Dario
dc.contributor.advisor.none.fl_str_mv Niño Ruiz, Elías David
dc.contributor.author.none.fl_str_mv Betancur Cervantes, Fabián Andres
Castro Calvo, Ruben Dario
dc.subject.es_ES.fl_str_mv Regresión lineal
Validación cruzada
Metaheurísticas
topic Regresión lineal
Validación cruzada
Metaheurísticas
Linear regression
Metaheuristics
Cross Validation
dc.subject.en_US.fl_str_mv Linear regression
Metaheuristics
Cross Validation
description Gracias a los avances tecnológicos, los sistemas de información cada día han ido almacenando conjuntos de datos cada vez más grandes. Por lo anterior, crear modelos de estimación ha sido una tarea necesaria en diferentes campos de acción. La regresión lineal, como modelo matemático, es entonces una herramienta de ajuste que aproxima la relación que hay entre la variable dependiente (la solución asociada al sub-espacio) y las variables independientes (los atributos de grupo de muestras dadas). El inconveniente que presenta la regresión lineal es que compromete cierta precisión en el ajuste a cambio de tener un tiempo menor de procesamiento. El proyecto presenta como resultado cuatro mecanismos de optimización combinatoria (basados en: Búsqueda Tabú, Recocido Simulado, Colonia de Hormigas y un Algoritmo Genético) que realizan el proceso de estimación agrupando atributos del conjunto de datos haciendo posible la generación de un sub-espacio más óptimo que el de la regresión lineal simple tradicional. La solución propuesta realiza agrupamiento de atributos y consta de algoritmos de validación cruzada que generan los coeficientes para la regresión creada, estos son buscados mediante una descomposición en valores singulares, efectuando una mejora en la velocidad con una perdida muy baja de precisión, esto se valida con el método de mínimos cuadrados, considerando que la distancia entre las ecuaciones generadas represente mejor la muestra. Cuando se obtiene la mejor solución, luego de realizar distintas iteraciones, se obtienen los coeficientes obtenidos por el recurso desarrollado. Para realizar las pruebas se tomaron diferentes conjuntos de datos con una cantidad relativamente grande de atributos (20 a 100), todos ellos de libre acceso obteniendo así sub-espacios en los que el error de aproximación era menor al de la solución obtenida por medio de la regresión lineal tradicional.
publishDate 2016
dc.date.accessioned.none.fl_str_mv 2016-11-25T22:07:51Z
dc.date.available.none.fl_str_mv 2016-11-25T22:07:51Z
dc.date.issued.none.fl_str_mv 2016-11-19
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/5846
url http://hdl.handle.net/10584/5846
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Barranquilla, Universidad del Norte, 2016
institution Universidad del Norte
bitstream.url.fl_str_mv http://172.16.14.36:8080/bitstream/10584/5846/5/license.txt
http://172.16.14.36:8080/bitstream/10584/5846/1/ArqSoluci%c3%b3n.pdf
http://172.16.14.36:8080/bitstream/10584/5846/2/ArqSoluci%c3%b3n.png
http://172.16.14.36:8080/bitstream/10584/5846/3/ArqSoluci%c3%b3nEN.png
http://172.16.14.36:8080/bitstream/10584/5846/4/ArqSoluci%c3%b3nEN.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
1e9f51a4d60eb52935ee0a48eb396c71
dc920ac5bc51a262f7de627aa00f24b5
bfd6d29574b66de0048a4fabbe262e0b
65f7a014929c85fe19726ddc9e59877a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1812183107671949312
spelling Niño Ruiz, Elías DavidBetancur Cervantes, Fabián AndresCastro Calvo, Ruben Dario2016-11-25T22:07:51Z2016-11-25T22:07:51Z2016-11-19http://hdl.handle.net/10584/5846Gracias a los avances tecnológicos, los sistemas de información cada día han ido almacenando conjuntos de datos cada vez más grandes. Por lo anterior, crear modelos de estimación ha sido una tarea necesaria en diferentes campos de acción. La regresión lineal, como modelo matemático, es entonces una herramienta de ajuste que aproxima la relación que hay entre la variable dependiente (la solución asociada al sub-espacio) y las variables independientes (los atributos de grupo de muestras dadas). El inconveniente que presenta la regresión lineal es que compromete cierta precisión en el ajuste a cambio de tener un tiempo menor de procesamiento. El proyecto presenta como resultado cuatro mecanismos de optimización combinatoria (basados en: Búsqueda Tabú, Recocido Simulado, Colonia de Hormigas y un Algoritmo Genético) que realizan el proceso de estimación agrupando atributos del conjunto de datos haciendo posible la generación de un sub-espacio más óptimo que el de la regresión lineal simple tradicional. La solución propuesta realiza agrupamiento de atributos y consta de algoritmos de validación cruzada que generan los coeficientes para la regresión creada, estos son buscados mediante una descomposición en valores singulares, efectuando una mejora en la velocidad con una perdida muy baja de precisión, esto se valida con el método de mínimos cuadrados, considerando que la distancia entre las ecuaciones generadas represente mejor la muestra. Cuando se obtiene la mejor solución, luego de realizar distintas iteraciones, se obtienen los coeficientes obtenidos por el recurso desarrollado. Para realizar las pruebas se tomaron diferentes conjuntos de datos con una cantidad relativamente grande de atributos (20 a 100), todos ellos de libre acceso obteniendo así sub-espacios en los que el error de aproximación era menor al de la solución obtenida por medio de la regresión lineal tradicional.Thanks to technological advances, information systems store bigger datasets. This is why creating estimation models has been a necessary task to manage appropriately any given system, whether in a public or a private setting. Linear regression, as a mathematical model is, then, an adjustment tool which approximates the relation that exists between a dependent variable (related to the solution) and the independent variables (the attributes of a samples group). The inconvenient presented by linear regression is that it compromises some precision in the adjustment, in exchange of less processing time. The project presents as result four combinatorial optimization mechanisms (based on: Tabu Search, Simulated Annealing, Ant Colony and a genetic algorithm) that carry out the estimation process grouping attributes from the dataset, attempting to generate a more optimum sub-space than that in the traditional simple linear regression. A waterfall model method was used to complete the project. The proposed solution groups attributes and consists of crossovering algorithms that generate the coefficients for the given regression. These are found through a singular value decomposition, reaching an improvement in the speed, with a very low precision loss. This is validated with the least squares method, considering that the distance between the given equations represents the sample better. When the best solution is obtained, after performing various iterations, the coefficients given by the developed resource were obtained. To carry out the tests different datasets were taken with many attributes (between 20 and 100), all of them of free access obtaining a sub-space in which the approximation error was lower than the solution obtained from traditional linear regression.spaBarranquilla, Universidad del Norte, 2016Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Regresión linealValidación cruzadaMetaheurísticasLinear regressionMetaheuristicsCross ValidationDiseño e implementación de una herramienta con metaheurísticas para la aproximación de sub-espacios óptimos en problemas de regresión linealDesign and implementation of a tool with metaheuristics for the approximation of optimal sub-spaces in linear regression problemsarticlehttp://purl.org/coar/resource_type/c_6501LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://172.16.14.36:8080/bitstream/10584/5846/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55ORIGINALArqSolución.pdfArqSolución.pdfArquitectura de la soluciónapplication/pdf7178096http://172.16.14.36:8080/bitstream/10584/5846/1/ArqSoluci%c3%b3n.pdf1e9f51a4d60eb52935ee0a48eb396c71MD51ArqSolución.pngArqSolución.pngimage/png1596046http://172.16.14.36:8080/bitstream/10584/5846/2/ArqSoluci%c3%b3n.pngdc920ac5bc51a262f7de627aa00f24b5MD52ArqSoluciónEN.pngArqSoluciónEN.pngArquitectura de la solución ENimage/png1187704http://172.16.14.36:8080/bitstream/10584/5846/3/ArqSoluci%c3%b3nEN.pngbfd6d29574b66de0048a4fabbe262e0bMD53ArqSoluciónEN.pdfArqSoluciónEN.pdfArquitectura de la solución ENapplication/pdf2868652http://172.16.14.36:8080/bitstream/10584/5846/4/ArqSoluci%c3%b3nEN.pdf65f7a014929c85fe19726ddc9e59877aMD5410584/5846oai:172.16.14.36:10584/58462016-11-25 17:07:51.493Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.co