Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages

RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su proc...

Full description

Autores:
Pemberty Tamayo, José Luis
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/16570
Acceso en línea:
http://hdl.handle.net/10495/16570
Palabra clave:
Lingüística computacional
Computational linguistics
Etiquetado
Lingüística de corpus
Linguistica - Procesamiento de datos
Lingüística aplicada
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
Description
Summary:RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su procesamiento automático en muchos casos. En este sentido, se propone y se describe un algoritmo que busca asistir el etiquetado manual a nivel de POS de corpus textuales en lenguas para las que aún no existe el etiquetado automático. Así mismo, se presenta un ejemplo de aplicación de este algoritmo a través de un sencillo programa que puede ser probado por el lector.