Problemas abiertos en la aplicación de la Regresión Simbólica en el pronóstico de series de tiempo

La regresión simbólica, ha tomado gran fuerza en los últimos años debido a su capacidad de deducir la ecuación y aquellos parámetros que mejor aproximan la relación entre la variable de salida y el conjunto de variables de entrada; sin embargo, al ser aplicada en la predicción de series de tiempo, p...

Full description

Autores:
Martínez, Carlos Alberto
Tipo de recurso:
Fecha de publicación:
2011
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/8483
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/8483
http://bdigital.unal.edu.co/5133/
Palabra clave:
0 Generalidades / Computer science, information and general works
Pronóstico, Series de tiempo, Regresión simbólica, Programación genética.
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
Description
Summary:La regresión simbólica, ha tomado gran fuerza en los últimos años debido a su capacidad de deducir la ecuación y aquellos parámetros que mejor aproximan la relación entre la variable de salida y el conjunto de variables de entrada; sin embargo, al ser aplicada en la predicción de series de tiempo, presenta limitaciones en la incorporación de todos los rezagos en los individuos, la inclusión de los modelos de predicción utilizados tradicionalmente en la literatura y la redundancia de operadores que no mejoran los resultados del modelo. Para abordarlos, en este trabajo se pretendió modificar el algoritmo de programación genética original, incorporando los bloques funcionales (funciones que se incorporan en los individuos del algoritmo de programación genética original correspondientes a modelos de predicción de la literatura) y modificando el operador de cruce, lo cual permitió la inclusión de los modelos actuales de predicción y la focalización de los individuos en regiones de interés durante el proceso de exploración. Adicionalmente las modificaciones propuestas fueron implementadas en un prototipo en el lenguaje R, y validado contra series de tiempo con ecuación de generación conocida (para verificar la capacidad de deducción de la ecuación a partir de los datos) y benchmark de la literatura de predicción de series de tiempo como son las series: AIRLINE, SUNSPOT, LYNX, INTERNET y POLLUTION, cuyos resultados en términos de medidas de error comparados contra modelos ARIMA, SVM, MLP, NN, DAN y el algoritmo original de GP, fueron mejores tanto en el entrenamiento como la predicción./Abstract.The symbolic regression has taken great strength in recent years due to its ability to deduce the equation and the parameters that best approximate the relationship between the output variable and the set of input variables, however, when applied to the prediction time series, has limited incorporation of all the lags in the individual, including predictive models traditionally used in the literature and the redundancy of operators that do not improve model results. To address in this paper we tried to modify the original genetic programming algorithm, incorporating the functional blocks (functions that are incorporated in the individuals in the original genetic programming algorithm for prediction models from the literature) and modifying the crossover operator, which allowed the inclusion of current predictive models and targeting individuals in regions of interest during the scanning process. Additionally, the proposed changes were implemented in a prototype in the R language, and validated against time series with known generating equation (to verify the deduction of the equation from the data) and literature benchmark series prediction time series such as: AIRLINE, Sunspot, Lynx, Internet and POLLUTION, the results in terms of error measures compared to ARIMA models, SVM, MLP NN, DAN and original GP algorithm were better in both training as the prediction.