Modelos clásicos de recuperación de la información
La recuperación de la información (RI, Information Retrieval en inglés) es una rama de la computación que se ocupa, como su nombre lo indica, de extraer información de documentos no estructurados (cartas, periódicos, artículos, etc.) de los cuales, a diferencia de los datos con estructura (almacenad...
- Autores:
- Tipo de recurso:
- Fecha de publicación:
- 2005
- Institución:
- Universidad Industrial de Santander
- Repositorio:
- Repositorio UIS
- Idioma:
- spa
- OAI Identifier:
- oai:noesis.uis.edu.co:20.500.14071/7079
- Acceso en línea:
- https://revistas.uis.edu.co/index.php/revistaintegracion/article/view/479
https://noesis.uis.edu.co/handle/20.500.14071/7079
- Palabra clave:
- information Retrieval
text mining
data mining o data discovery
- Rights
- openAccess
- License
- Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
Summary: | La recuperación de la información (RI, Information Retrieval en inglés) es una rama de la computación que se ocupa, como su nombre lo indica, de extraer información de documentos no estructurados (cartas, periódicos, artículos, etc.) de los cuales, a diferencia de los datos con estructura (almacenados en bases de datos) no es fácil sacar información útil automáticamente. Estas técnicas son parte de una rama más amplia de la computación, conocida como minería de textos (text mining), que puede ser vista como un caso particular de "minería de datos" (Data Mining o Data Discovery). Actualmente estas técnicas son ampliamente usadas en buscadores de Internet como Google, Yahoo, etc. En este trabajo se revisaron 3 modelos clásicos: booleano, vectorial y probabilístico. Estos tres modelos usan una simplificación que solo tiene en cuenta el aspecto léxico, pero no la semántica del documento. |
---|