Sistema de extracción de cuerpos de texto de la web para tareas lingüísticas

En este artículo se describe un sistema desarrollado para la extracción de grandes cuerpos de texto de Internet, teniendo como motivación el valor que ofrecen los ejemplos de lenguaje natural disponibles en la red para las tareas de aprendizaje no supervisado de dichos naturales, dado por caracterís...

Full description

Autores:
Cadavid Rengifo, Héctor Fabio
Gómez Perdomo, Jonatan
Tipo de recurso:
Article of journal
Fecha de publicación:
2009
Institución:
Escuela Colombiana de Ingeniería Julio Garavito
Repositorio:
Repositorio Institucional ECI
Idioma:
spa
OAI Identifier:
oai:repositorio.escuelaing.edu.co:001/1903
Acceso en línea:
https://repositorio.escuelaing.edu.co/handle/001/1903
Palabra clave:
corpus web
crawler
aprendizaje no supervisado de lenguajes
programación concurrente
web corpus
crawler
unsupervised language learning
concurrent programming
Rights
openAccess
License
https://creativecommons.org/licenses/by/4.0/