Implementación de una serie de pasos para la aplicación de técnicas de minería de datos en el análisis de información generada por la planta DEMEX de Ecopetrol

La información y los almacenes de datos como se conocen hoy en día, son probablemente uno de los recursos más valiosos para las empresas, ya que en ellos, reposa dormida información de carácter vital y altamente lucrativa, que además puede significar para las empresas reducciones de costos, y aument...

Full description

Autores:
Pérez Uribe, Tatiana
Tarazona Román, Oswaldo Javier
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2006
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/1363
Acceso en línea:
http://hdl.handle.net/20.500.12749/1363
Palabra clave:
Data mining
Search in databases
Silab Property Prediction System
SPP (Computer Program)
Databases
Systems Engineering
Investigations
Analysis
Minería de datos
Búsqueda en bases de datos
Silab Sistema de predicción de propiedades
SPP (Programa para computador)
Bases de datos
Ingeniería de sistemas
Investigaciones
Análisis
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Description
Summary:La información y los almacenes de datos como se conocen hoy en día, son probablemente uno de los recursos más valiosos para las empresas, ya que en ellos, reposa dormida información de carácter vital y altamente lucrativa, que además puede significar para las empresas reducciones de costos, y aumentos sustanciales en sus utilidades. La gran inquietud que mantiene a los expertos a la expectativa, es cómo sacar a la luz tales conocimientos y hacerlos efectivos para poner en marcha los planes futuros de las empresas. De aquí nació el concepto de KDD (Knowledge Discovery and Data Mining), o descubrimiento de conocimiento a partir de bases de datos, reconociendo patrones y asociaciones que se mantienen ocultas en los datos, esperando a ser extraídas para darles un uso adecuado. Una de las compañías más interesadas en poder explotar sus datos recopilados a través de los años es el Instituto Colombiano de Petróleo ICP, el cual posee grandes almacenes de datos archivados en medios computacionales, esperando a ser explotados mediante las técnicas de Minería de Datos y técnicas estadísticas, las cuales generarán los conocimientos adecuados para las disminución de costos, y la maximización de la productividad. En este proyecto se hace el máximo esfuerzo por mejorar un prototipo computacional ya existente, desarrollado en Java, y basado en el paquete computacional de Minería de Datos WEKA, con el cual se pretenden explorar los datos generados por la planta DEMEX de ECOPETROL, y que reposan en la base de datos SILAB. Se aplican los términos de Minería de Datos, y de ingeniería de software de la forma más fiel para obtener un producto de excelente calidad, y con resultados muy certeros, pero además para dar al usuario un soporte metodológico para aplicar correctamente las técnicas y así darle el mejor uso al prototipo que se presenta a continuación.