Razonamiento basado en la memoria (MBR) aplicado a sistemas FAQ

"En Internet y en otras muchas fuentes de datos con poca estructuración, se encuentran esparcidos datos, que generalmente pueden ser de mucha importancia, pero para llegar a obtener dicha información, es necesario, aplicar algunas técnicas de datamining y extracción de información, entre estas...

Full description

Autores:
Joya Cruz, Juan José
Tipo de recurso:
Fecha de publicación:
2002
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/10455
Acceso en línea:
http://hdl.handle.net/1992/10455
Palabra clave:
Procesamiento electrónico de datos
Sistemas de almacenamiento y recuperación de información
Ingeniería
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:"En Internet y en otras muchas fuentes de datos con poca estructuración, se encuentran esparcidos datos, que generalmente pueden ser de mucha importancia, pero para llegar a obtener dicha información, es necesario, aplicar algunas técnicas de datamining y extracción de información, entre estas técnicas encontramos algunas que son convencionales como MBR, clustering y las estadísticas como la clasificación bayesiana, sin embargo no todas tienen el mismo desempeño y dependen del escenario donde se encuentren. Los documentos "texto" son una clase de fuente que se considera no estructurada o semiestructurada; por esto es necesario realizar algún tipo de mining, que permita encontrar patrones o información oculta, un ejemplo de esto es los documentos FAQ (Frecuently Asked Questions) o PUF (Preguntas Usadas Frecuentemente). Del mismo modo, el texto es una forma de comunicación entre humanos; por ejemplo se puede leer textos en revistas, periódicos, memos; y por eso el texto se ha constituido como un medio que posee mucho significado en su información..."--Tomado de la Introducción.