Sistema de extracción de cuerpos de texto de la web para tareas lingüísticas
En este artículo se describe un sistema desarrollado para la extracción de grandes cuerpos de texto de Internet, teniendo como motivación el valor que ofrecen los ejemplos de lenguaje natural disponibles en la red para las tareas de aprendizaje no supervi- sado de dichos naturales, dado por caracter...
- Autores:
-
Cadavid Rengifo, Héctor Fabio
Gómez Perdomo, Jonatan
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2009
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/29181
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/29181
http://bdigital.unal.edu.co/19229/
http://bdigital.unal.edu.co/19229/2/
- Palabra clave:
- Web Corpus
crawler
unsupervised language learning
concurrent programming
corpus web
crawler
aprendizaje no supervisado de lenguajes
programación concurrente
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional