Data driven initialization for machine learning classification models

El principal objetivo de este proyecto de grado es desarrollar una estrategia para la inicialización de los parámetros θ tanto para la regresión logística (clasificador lineal) como para la regresión multinomial, y las redes neuronales clásicas (fully connected feed-forward). Esta inicialización se...

Full description

Autores:
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad del Rosario
Repositorio:
Repositorio EdocUR - U. Rosario
Idioma:
eng
OAI Identifier:
oai:repository.urosario.edu.co:10336/34737
Acceso en línea:
https://doi.org/10.48713/10336_34737
https://repository.urosario.edu.co/handle/10336/34737
Palabra clave:
Redes Neuronales
Regresión Logística
Gradiente Descendiente
Parámetros de un Modelo de Clasificación
Vectores Característicos
Distribución de las Clases
Matemáticas
Neural Networks
Logistic Regression
Characteristic Vectors
Classes Distributions
Classification Models Parameters
Rights
License
Atribución-NoComercial-CompartirIgual 2.5 Colombia
Description
Summary:El principal objetivo de este proyecto de grado es desarrollar una estrategia para la inicialización de los parámetros θ tanto para la regresión logística (clasificador lineal) como para la regresión multinomial, y las redes neuronales clásicas (fully connected feed-forward). Esta inicialización se basó en las propiedades de la distribución estadística de los datos con los que se entrenan los modelos. Esto con el fin de inicializar el modelo en una región de la función de costo más adecuada y así, pueda llegar a una mejorar su tasa de convergencia, y producir mejores resultados en menores tiempos de entrenamiento. La tesis presenta una explicación intuitiva y matemática de los modelos de inicialización propuestos, y contrasta el desarrollo teórico con un benchmark donde se utilizaron diferentes datasets, incluyendo toy examples. Así mismo, también se presenta un análisis de estos resultados, se discuten las limitaciones de las propuestas y el trabajo futuro que se puede derivar a partir de este trabajo.