Extracción de datos semiestructurados en la web
La gran proliferación de textos, sobre todo en el formato electrónico hace muy difícil que cualquier persona sea capaz de leer, comprender y sintetizar tal cantidad de información. Es esto lo que ha llevado a un gran número de investigadores a desarrollar una serie de estrategias para el manejo de e...
- Autores:
-
Correa Trocha, Mayra Alejandra
Peñuela Morales, Sarith Mayerly
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2001
- Institución:
- Universidad Autónoma de Bucaramanga - UNAB
- Repositorio:
- Repositorio UNAB
- Idioma:
- spa
- OAI Identifier:
- oai:repository.unab.edu.co:20.500.12749/27074
- Acceso en línea:
- http://hdl.handle.net/20.500.12749/27074
- Palabra clave:
- Systems engineer
Technological innovations
Information systems
Data extraction
Database
Information retrieval
Information storage and retrieval systems
Software architecture
Ingeniería de sistemas
Innovaciones tecnológicas
Recuperación de información
Sistemas de almacenamiento y recuperación de información
Arquitectura de software
Sistemas de información
Extracción de datos
Base de datos
- Rights
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
Summary: | La gran proliferación de textos, sobre todo en el formato electrónico hace muy difícil que cualquier persona sea capaz de leer, comprender y sintetizar tal cantidad de información. Es esto lo que ha llevado a un gran número de investigadores a desarrollar una serie de estrategias para el manejo de esta información. Entre éstas se encuentra la Extracción de Información (IE). La IE pretende, a partir de estos textos, obtener información relevante que pueda ser utilizada electrónicamente, ° De esta manera, para hacer uso eficiente de la información contenida en un texto, es útil que la información sea almacenada en alguna clase de formato estructurado; por ejemplo, una base de datos relacional. Generalmente, el proceso de extracción de la información requerida de un documento hacia una Base de Datos es usualmente un proceso manual. Debido al enorme volumen de los textos que se encuentran en la Web, se crea la necesidad de tener métodos de procesamiento automático para extraer la información. |
---|