Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua

En esta investigación se pretende proporcionar un aporte en la revisión del estado actual del etiquetado lingüístico y la manera como se implementa en el corpus, entendiendo éste como un conjunto de texto que contribuye de manera fundamental al estudio del etiquetado. Se llevará a cabo una profundiz...

Full description

Autores:
Gomez Martinez, Jonatan Alejandro
Gallego Gaviria, Andres Felipe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2018
Institución:
Tecnológico de Antioquia
Repositorio:
Repositorio Tdea
Idioma:
spa
OAI Identifier:
oai:dspace.tdea.edu.co:tda/435
Acceso en línea:
https://dspace.tdea.edu.co/handle/tda/435
Palabra clave:
Etiquetado
Linguistica computacional
Programas para computador
Rights
openAccess
License
Derechos reservados - Tecnológico de Antioquia
Description
Summary:En esta investigación se pretende proporcionar un aporte en la revisión del estado actual del etiquetado lingüístico y la manera como se implementa en el corpus, entendiendo éste como un conjunto de texto que contribuye de manera fundamental al estudio del etiquetado. Se llevará a cabo una profundización teórica y contextual a cerca de las ventajas de las herramientas utilizadas y las dificultades que se pueden presentar con ellas en el ámbito del etiquetado lingüístico. En las últimas décadas se ha venido evidenciando un aumento en la implementación de nuevas tareas dentro del área de la lingüística computacional, como lo es la anotación de corpus, la cual nos permite lograr un acercamiento al aprendizaje automático o también conocido como la Inferencia Gramatical (Nivre 2006; Seginer 2007). Este proceso consiste básicamente en el continuo aprendizaje o inferencia de las reglas gramaticales de un idioma teniendo como base un análisis sintáctico realizado por lingüistas. Para la práctica de utilización de un corpus y para la visualización de los datos ya organizados y etiquetados, se pretenden implementar dos programas que son dedicados a la etiquetación lingüística en varios idiomas, dichos software son FreeLing y TreeTagger los cuales, en sus estructuras básicas están basadas en librerías (API) que son llamadas por comandos DOS u otras herramientas como JavaScript, PHP, Java, entre otras. Así mismo con la realización de esta investigación, se intenta dar luz sobre los desafíos que se presentan dentro del procesamiento del lenguaje natural, como lo es el etiquetado lingüístico. Es importante mencionar que se han realizado investigaciones sobre la perspectiva teórica de la lingüística, pero a pesar de la mayoría de los casos, la teoría no es suficientemente amplia para lograr la formalización de los textos dentro de un procesamiento computacional y sigue siendo un tema de investigación.