Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua

En esta investigación se pretende proporcionar un aporte en la revisión del estado actual del etiquetado lingüístico y la manera como se implementa en el corpus, entendiendo éste como un conjunto de texto que contribuye de manera fundamental al estudio del etiquetado. Se llevará a cabo una profundiz...

Full description

Autores:
Gomez Martinez, Jonatan Alejandro
Gallego Gaviria, Andres Felipe
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2018
Institución:
Tecnológico de Antioquia
Repositorio:
Repositorio Tdea
Idioma:
spa
OAI Identifier:
oai:dspace.tdea.edu.co:tda/435
Acceso en línea:
https://dspace.tdea.edu.co/handle/tda/435
Palabra clave:
Etiquetado
Linguistica computacional
Programas para computador
Rights
openAccess
License
Derechos reservados - Tecnológico de Antioquia
id RepoTdea2_256fd8d39f721481fdf9ca562d0df288
oai_identifier_str oai:dspace.tdea.edu.co:tda/435
network_acronym_str RepoTdea2
network_name_str Repositorio Tdea
repository_id_str
dc.title.spa.fl_str_mv Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua
title Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua
spellingShingle Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua
Etiquetado
Linguistica computacional
Programas para computador
title_short Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua
title_full Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua
title_fullStr Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua
title_full_unstemmed Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua
title_sort Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua
dc.creator.fl_str_mv Gomez Martinez, Jonatan Alejandro
Gallego Gaviria, Andres Felipe
dc.contributor.advisor.none.fl_str_mv Marin Morales, Maria Isable
dc.contributor.author.none.fl_str_mv Gomez Martinez, Jonatan Alejandro
Gallego Gaviria, Andres Felipe
dc.subject.spa.fl_str_mv Etiquetado
Linguistica computacional
Programas para computador
topic Etiquetado
Linguistica computacional
Programas para computador
description En esta investigación se pretende proporcionar un aporte en la revisión del estado actual del etiquetado lingüístico y la manera como se implementa en el corpus, entendiendo éste como un conjunto de texto que contribuye de manera fundamental al estudio del etiquetado. Se llevará a cabo una profundización teórica y contextual a cerca de las ventajas de las herramientas utilizadas y las dificultades que se pueden presentar con ellas en el ámbito del etiquetado lingüístico. En las últimas décadas se ha venido evidenciando un aumento en la implementación de nuevas tareas dentro del área de la lingüística computacional, como lo es la anotación de corpus, la cual nos permite lograr un acercamiento al aprendizaje automático o también conocido como la Inferencia Gramatical (Nivre 2006; Seginer 2007). Este proceso consiste básicamente en el continuo aprendizaje o inferencia de las reglas gramaticales de un idioma teniendo como base un análisis sintáctico realizado por lingüistas. Para la práctica de utilización de un corpus y para la visualización de los datos ya organizados y etiquetados, se pretenden implementar dos programas que son dedicados a la etiquetación lingüística en varios idiomas, dichos software son FreeLing y TreeTagger los cuales, en sus estructuras básicas están basadas en librerías (API) que son llamadas por comandos DOS u otras herramientas como JavaScript, PHP, Java, entre otras. Así mismo con la realización de esta investigación, se intenta dar luz sobre los desafíos que se presentan dentro del procesamiento del lenguaje natural, como lo es el etiquetado lingüístico. Es importante mencionar que se han realizado investigaciones sobre la perspectiva teórica de la lingüística, pero a pesar de la mayoría de los casos, la teoría no es suficientemente amplia para lograr la formalización de los textos dentro de un procesamiento computacional y sigue siendo un tema de investigación.
publishDate 2018
dc.date.accessioned.none.fl_str_mv 2018-12-12T22:35:14Z
dc.date.available.none.fl_str_mv 2018-12-12T22:35:14Z
dc.date.issued.none.fl_str_mv 2018-12-12
dc.type.spa.fl_str_mv Trabajo de grado - Pregrado
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.spa.fl_str_mv Text
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/TP
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
format http://purl.org/coar/resource_type/c_7a1f
status_str publishedVersion
dc.identifier.uri.spa.fl_str_mv https://dspace.tdea.edu.co/handle/tda/435
url https://dspace.tdea.edu.co/handle/tda/435
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.spa.fl_str_mv Derechos reservados - Tecnológico de Antioquia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.creativecommons.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)
rights_invalid_str_mv Derechos reservados - Tecnológico de Antioquia
https://creativecommons.org/licenses/by-nc/4.0/
Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 93 páginas; ilustraciones
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Tecnologico de Antioquia
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingenieria
dc.publisher.program.spa.fl_str_mv Ingenieria de Software
dc.publisher.degree.spa.fl_str_mv Ingeniero de Software
institution Tecnológico de Antioquia
bitstream.url.fl_str_mv https://dspace.tdea.edu.co/bitstream/tda/435/4/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf.txt
https://dspace.tdea.edu.co/bitstream/tda/435/6/Jonatan%20Alejandro%20Gomez%20Martinez.PDF.txt
https://dspace.tdea.edu.co/bitstream/tda/435/5/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf.jpg
https://dspace.tdea.edu.co/bitstream/tda/435/7/Jonatan%20Alejandro%20Gomez%20Martinez.PDF.jpg
https://dspace.tdea.edu.co/bitstream/tda/435/1/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf
https://dspace.tdea.edu.co/bitstream/tda/435/2/Jonatan%20Alejandro%20Gomez%20Martinez.PDF
https://dspace.tdea.edu.co/bitstream/tda/435/3/license.txt
bitstream.checksum.fl_str_mv 41a9e3d004c6067885e03ce582b04f83
e1c06d85ae7b8b032bef47e42e4c08f9
88ee0cdf17dc4660c3d981b9507eef47
965b7ab313a6992b00d801fb0b629083
9a6d5feefc1b94a57b86f0ff0483eef6
742dc53219b8614762e9ee28c58c7d9c
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Tecnologico de Antioquia
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1812189221898682368
spelling Marin Morales, Maria Isable13f1f68c-d1e2-40fd-b39b-50ba0a62eb22-1Gomez Martinez, Jonatan Alejandro34b1d899-d136-45d5-a92a-5cd21b12752e-1Gallego Gaviria, Andres Felipee3860714-c930-4dd8-88dc-30ef6a9fab7b-12018-12-12T22:35:14Z2018-12-12T22:35:14Z2018-12-12https://dspace.tdea.edu.co/handle/tda/435En esta investigación se pretende proporcionar un aporte en la revisión del estado actual del etiquetado lingüístico y la manera como se implementa en el corpus, entendiendo éste como un conjunto de texto que contribuye de manera fundamental al estudio del etiquetado. Se llevará a cabo una profundización teórica y contextual a cerca de las ventajas de las herramientas utilizadas y las dificultades que se pueden presentar con ellas en el ámbito del etiquetado lingüístico. En las últimas décadas se ha venido evidenciando un aumento en la implementación de nuevas tareas dentro del área de la lingüística computacional, como lo es la anotación de corpus, la cual nos permite lograr un acercamiento al aprendizaje automático o también conocido como la Inferencia Gramatical (Nivre 2006; Seginer 2007). Este proceso consiste básicamente en el continuo aprendizaje o inferencia de las reglas gramaticales de un idioma teniendo como base un análisis sintáctico realizado por lingüistas. Para la práctica de utilización de un corpus y para la visualización de los datos ya organizados y etiquetados, se pretenden implementar dos programas que son dedicados a la etiquetación lingüística en varios idiomas, dichos software son FreeLing y TreeTagger los cuales, en sus estructuras básicas están basadas en librerías (API) que son llamadas por comandos DOS u otras herramientas como JavaScript, PHP, Java, entre otras. Así mismo con la realización de esta investigación, se intenta dar luz sobre los desafíos que se presentan dentro del procesamiento del lenguaje natural, como lo es el etiquetado lingüístico. Es importante mencionar que se han realizado investigaciones sobre la perspectiva teórica de la lingüística, pero a pesar de la mayoría de los casos, la teoría no es suficientemente amplia para lograr la formalización de los textos dentro de un procesamiento computacional y sigue siendo un tema de investigación.93 páginas; ilustracionesapplication/pdfspaTecnologico de AntioquiaFacultad de IngenieriaIngenieria de SoftwareIngeniero de SoftwareDerechos reservados - Tecnológico de Antioquiahttps://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccessAtribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)http://purl.org/coar/access_right/c_abf2EtiquetadoLinguistica computacionalProgramas para computadorDiagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lenguaTrabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1fTextinfo:eu-repo/semantics/bachelorThesishttps://purl.org/redcol/resource_type/TPinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/version/c_970fb48d4fbd8a85TEXTDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdf.txtDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdf.txtExtracted texttext/plain109031https://dspace.tdea.edu.co/bitstream/tda/435/4/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf.txt41a9e3d004c6067885e03ce582b04f83MD54open accessJonatan Alejandro Gomez Martinez.PDF.txtJonatan Alejandro Gomez Martinez.PDF.txtExtracted texttext/plain2https://dspace.tdea.edu.co/bitstream/tda/435/6/Jonatan%20Alejandro%20Gomez%20Martinez.PDF.txte1c06d85ae7b8b032bef47e42e4c08f9MD56open accessTHUMBNAILDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdf.jpgDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdf.jpgGenerated Thumbnailimage/jpeg7585https://dspace.tdea.edu.co/bitstream/tda/435/5/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf.jpg88ee0cdf17dc4660c3d981b9507eef47MD55open accessJonatan Alejandro Gomez Martinez.PDF.jpgJonatan Alejandro Gomez Martinez.PDF.jpgGenerated Thumbnailimage/jpeg3688https://dspace.tdea.edu.co/bitstream/tda/435/7/Jonatan%20Alejandro%20Gomez%20Martinez.PDF.jpg965b7ab313a6992b00d801fb0b629083MD57open accessORIGINALDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdfDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdfapplication/pdf1954909https://dspace.tdea.edu.co/bitstream/tda/435/1/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf9a6d5feefc1b94a57b86f0ff0483eef6MD51open accessJonatan Alejandro Gomez Martinez.PDFJonatan Alejandro Gomez Martinez.PDFapplication/pdf28116https://dspace.tdea.edu.co/bitstream/tda/435/2/Jonatan%20Alejandro%20Gomez%20Martinez.PDF742dc53219b8614762e9ee28c58c7d9cMD52open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://dspace.tdea.edu.co/bitstream/tda/435/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53open accesstda/435oai:dspace.tdea.edu.co:tda/4352021-05-01 00:45:41.984An error occurred on the license name.|||https://creativecommons.org/licenses/by-nc/4.0/open accessRepositorio Institucional Tecnologico de Antioquiabdigital@metabiblioteca.comTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=