Diseño de herramienta computacional basada en machine learning para la detección de desviaciones de consumo

Detectar de forma temprana desviaciones en los patrones de consumo es una de las actividades críticas del negocio eléctrico y en general de cualquier empresa prestadora de un servicio público. El siguiente proyecto tiene por objetivo desarrollar una herramienta computacional web a través de la cual...

Full description

Autores:
Ahumada Sierra, Loui Alejandro
Tipo de recurso:
Fecha de publicación:
2018
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/7894
Acceso en línea:
http://hdl.handle.net/10584/7894
Palabra clave:
Aprendizaje automático
Detección de desviaciones
machine learning
Outlier detection
One Class Support Vector Machines
Isolation Forest
Robust Covariance
Local Outlier Factor
Rights
License
Universidad del Norte
Description
Summary:Detectar de forma temprana desviaciones en los patrones de consumo es una de las actividades críticas del negocio eléctrico y en general de cualquier empresa prestadora de un servicio público. El siguiente proyecto tiene por objetivo desarrollar una herramienta computacional web a través de la cual se validen las curvas históricas de consumo de energía eléctrica de clientes no regulados del caribe colombiano a través de métodos especializados de machine learning. Se realizó inicialmente una evaluación completa del proceso de análisis energético a través de métodos y herramientas dentro del espectro del estudio del trabajo. Del levantamiento de la información se logran poner de presente las principales falencias del proceso y se evidencia la falta de información para realizar una evaluación comparativa entre la herramienta VBA actualmente utilizada por la compañía para analizar la energía, y la nueva herramienta propuesta en este proyecto. De manera consecuente, se determina someter a crítica el resultado de cuatro técnicas de machine learning: One Class Support Vector Machines, Isolation Forest, Robust Covariance y Local Outlier Factor; para determinar el mejor modelo a partir de la construcción de la realidad en conjunto con los analistas. A través de la crítica y análisis de resultados de la validación de los métodos se logra medir el rendimiento de cada uno de los modelos, y se determina finalmente que la mejor técnica para detectar desviaciones de consumo dentro del contexto comercial de la compañía es Robust Covariance. La técnica obtuvo la mayor valoración F1-score para modelos de machine learning, evidenciando un equilibrio fundamental entre la ocurrencia de eventos falsos positivos, falsos negativos y verdaderos positivos; así como una reducción del 93% del número de puntos de medida revisados manualmente en comparación con la herramienta VBA.