Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua
En esta investigación se pretende proporcionar un aporte en la revisión del estado actual del etiquetado lingüístico y la manera como se implementa en el corpus, entendiendo éste como un conjunto de texto que contribuye de manera fundamental al estudio del etiquetado. Se llevará a cabo una profundiz...
- Autores:
-
Gomez Martinez, Jonatan Alejandro
Gallego Gaviria, Andres Felipe
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2018
- Institución:
- Tecnológico de Antioquia
- Repositorio:
- Repositorio Tdea
- Idioma:
- spa
- OAI Identifier:
- oai:dspace.tdea.edu.co:tda/435
- Acceso en línea:
- https://dspace.tdea.edu.co/handle/tda/435
- Palabra clave:
- Etiquetado
Linguistica computacional
Programas para computador
- Rights
- openAccess
- License
- Derechos reservados - Tecnológico de Antioquia
id |
RepoTdea2_256fd8d39f721481fdf9ca562d0df288 |
---|---|
oai_identifier_str |
oai:dspace.tdea.edu.co:tda/435 |
network_acronym_str |
RepoTdea2 |
network_name_str |
Repositorio Tdea |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua |
title |
Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua |
spellingShingle |
Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua Etiquetado Linguistica computacional Programas para computador |
title_short |
Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua |
title_full |
Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua |
title_fullStr |
Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua |
title_full_unstemmed |
Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua |
title_sort |
Diagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lengua |
dc.creator.fl_str_mv |
Gomez Martinez, Jonatan Alejandro Gallego Gaviria, Andres Felipe |
dc.contributor.advisor.none.fl_str_mv |
Marin Morales, Maria Isable |
dc.contributor.author.none.fl_str_mv |
Gomez Martinez, Jonatan Alejandro Gallego Gaviria, Andres Felipe |
dc.subject.spa.fl_str_mv |
Etiquetado Linguistica computacional Programas para computador |
topic |
Etiquetado Linguistica computacional Programas para computador |
description |
En esta investigación se pretende proporcionar un aporte en la revisión del estado actual del etiquetado lingüístico y la manera como se implementa en el corpus, entendiendo éste como un conjunto de texto que contribuye de manera fundamental al estudio del etiquetado. Se llevará a cabo una profundización teórica y contextual a cerca de las ventajas de las herramientas utilizadas y las dificultades que se pueden presentar con ellas en el ámbito del etiquetado lingüístico. En las últimas décadas se ha venido evidenciando un aumento en la implementación de nuevas tareas dentro del área de la lingüística computacional, como lo es la anotación de corpus, la cual nos permite lograr un acercamiento al aprendizaje automático o también conocido como la Inferencia Gramatical (Nivre 2006; Seginer 2007). Este proceso consiste básicamente en el continuo aprendizaje o inferencia de las reglas gramaticales de un idioma teniendo como base un análisis sintáctico realizado por lingüistas. Para la práctica de utilización de un corpus y para la visualización de los datos ya organizados y etiquetados, se pretenden implementar dos programas que son dedicados a la etiquetación lingüística en varios idiomas, dichos software son FreeLing y TreeTagger los cuales, en sus estructuras básicas están basadas en librerías (API) que son llamadas por comandos DOS u otras herramientas como JavaScript, PHP, Java, entre otras. Así mismo con la realización de esta investigación, se intenta dar luz sobre los desafíos que se presentan dentro del procesamiento del lenguaje natural, como lo es el etiquetado lingüístico. Es importante mencionar que se han realizado investigaciones sobre la perspectiva teórica de la lingüística, pero a pesar de la mayoría de los casos, la teoría no es suficientemente amplia para lograr la formalización de los textos dentro de un procesamiento computacional y sigue siendo un tema de investigación. |
publishDate |
2018 |
dc.date.accessioned.none.fl_str_mv |
2018-12-12T22:35:14Z |
dc.date.available.none.fl_str_mv |
2018-12-12T22:35:14Z |
dc.date.issued.none.fl_str_mv |
2018-12-12 |
dc.type.spa.fl_str_mv |
Trabajo de grado - Pregrado |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.redcol.spa.fl_str_mv |
https://purl.org/redcol/resource_type/TP |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
publishedVersion |
dc.identifier.uri.spa.fl_str_mv |
https://dspace.tdea.edu.co/handle/tda/435 |
url |
https://dspace.tdea.edu.co/handle/tda/435 |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.rights.spa.fl_str_mv |
Derechos reservados - Tecnológico de Antioquia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.uri.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.creativecommons.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0) |
rights_invalid_str_mv |
Derechos reservados - Tecnológico de Antioquia https://creativecommons.org/licenses/by-nc/4.0/ Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0) http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.extent.spa.fl_str_mv |
93 páginas; ilustraciones |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.publisher.spa.fl_str_mv |
Tecnologico de Antioquia |
dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingenieria |
dc.publisher.program.spa.fl_str_mv |
Ingenieria de Software |
dc.publisher.degree.spa.fl_str_mv |
Ingeniero de Software |
institution |
Tecnológico de Antioquia |
bitstream.url.fl_str_mv |
https://dspace.tdea.edu.co/bitstream/tda/435/4/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf.txt https://dspace.tdea.edu.co/bitstream/tda/435/6/Jonatan%20Alejandro%20Gomez%20Martinez.PDF.txt https://dspace.tdea.edu.co/bitstream/tda/435/5/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf.jpg https://dspace.tdea.edu.co/bitstream/tda/435/7/Jonatan%20Alejandro%20Gomez%20Martinez.PDF.jpg https://dspace.tdea.edu.co/bitstream/tda/435/1/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf https://dspace.tdea.edu.co/bitstream/tda/435/2/Jonatan%20Alejandro%20Gomez%20Martinez.PDF https://dspace.tdea.edu.co/bitstream/tda/435/3/license.txt |
bitstream.checksum.fl_str_mv |
41a9e3d004c6067885e03ce582b04f83 e1c06d85ae7b8b032bef47e42e4c08f9 88ee0cdf17dc4660c3d981b9507eef47 965b7ab313a6992b00d801fb0b629083 9a6d5feefc1b94a57b86f0ff0483eef6 742dc53219b8614762e9ee28c58c7d9c 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Tecnologico de Antioquia |
repository.mail.fl_str_mv |
bdigital@metabiblioteca.com |
_version_ |
1812189221898682368 |
spelling |
Marin Morales, Maria Isable13f1f68c-d1e2-40fd-b39b-50ba0a62eb22-1Gomez Martinez, Jonatan Alejandro34b1d899-d136-45d5-a92a-5cd21b12752e-1Gallego Gaviria, Andres Felipee3860714-c930-4dd8-88dc-30ef6a9fab7b-12018-12-12T22:35:14Z2018-12-12T22:35:14Z2018-12-12https://dspace.tdea.edu.co/handle/tda/435En esta investigación se pretende proporcionar un aporte en la revisión del estado actual del etiquetado lingüístico y la manera como se implementa en el corpus, entendiendo éste como un conjunto de texto que contribuye de manera fundamental al estudio del etiquetado. Se llevará a cabo una profundización teórica y contextual a cerca de las ventajas de las herramientas utilizadas y las dificultades que se pueden presentar con ellas en el ámbito del etiquetado lingüístico. En las últimas décadas se ha venido evidenciando un aumento en la implementación de nuevas tareas dentro del área de la lingüística computacional, como lo es la anotación de corpus, la cual nos permite lograr un acercamiento al aprendizaje automático o también conocido como la Inferencia Gramatical (Nivre 2006; Seginer 2007). Este proceso consiste básicamente en el continuo aprendizaje o inferencia de las reglas gramaticales de un idioma teniendo como base un análisis sintáctico realizado por lingüistas. Para la práctica de utilización de un corpus y para la visualización de los datos ya organizados y etiquetados, se pretenden implementar dos programas que son dedicados a la etiquetación lingüística en varios idiomas, dichos software son FreeLing y TreeTagger los cuales, en sus estructuras básicas están basadas en librerías (API) que son llamadas por comandos DOS u otras herramientas como JavaScript, PHP, Java, entre otras. Así mismo con la realización de esta investigación, se intenta dar luz sobre los desafíos que se presentan dentro del procesamiento del lenguaje natural, como lo es el etiquetado lingüístico. Es importante mencionar que se han realizado investigaciones sobre la perspectiva teórica de la lingüística, pero a pesar de la mayoría de los casos, la teoría no es suficientemente amplia para lograr la formalización de los textos dentro de un procesamiento computacional y sigue siendo un tema de investigación.93 páginas; ilustracionesapplication/pdfspaTecnologico de AntioquiaFacultad de IngenieriaIngenieria de SoftwareIngeniero de SoftwareDerechos reservados - Tecnológico de Antioquiahttps://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccessAtribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)http://purl.org/coar/access_right/c_abf2EtiquetadoLinguistica computacionalProgramas para computadorDiagnostico del estado de la cuestion del etiquetado linguistico del espanol segun los niveles de analisis d ela lenguaTrabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1fTextinfo:eu-repo/semantics/bachelorThesishttps://purl.org/redcol/resource_type/TPinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/version/c_970fb48d4fbd8a85TEXTDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdf.txtDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdf.txtExtracted texttext/plain109031https://dspace.tdea.edu.co/bitstream/tda/435/4/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf.txt41a9e3d004c6067885e03ce582b04f83MD54open accessJonatan Alejandro Gomez Martinez.PDF.txtJonatan Alejandro Gomez Martinez.PDF.txtExtracted texttext/plain2https://dspace.tdea.edu.co/bitstream/tda/435/6/Jonatan%20Alejandro%20Gomez%20Martinez.PDF.txte1c06d85ae7b8b032bef47e42e4c08f9MD56open accessTHUMBNAILDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdf.jpgDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdf.jpgGenerated Thumbnailimage/jpeg7585https://dspace.tdea.edu.co/bitstream/tda/435/5/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf.jpg88ee0cdf17dc4660c3d981b9507eef47MD55open accessJonatan Alejandro Gomez Martinez.PDF.jpgJonatan Alejandro Gomez Martinez.PDF.jpgGenerated Thumbnailimage/jpeg3688https://dspace.tdea.edu.co/bitstream/tda/435/7/Jonatan%20Alejandro%20Gomez%20Martinez.PDF.jpg965b7ab313a6992b00d801fb0b629083MD57open accessORIGINALDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdfDIAGNOSTICO DEL ESTADO DE LA CUESTION DEL ETIQUETADO LINGUISTICO.pdfapplication/pdf1954909https://dspace.tdea.edu.co/bitstream/tda/435/1/DIAGNOSTICO%20DEL%20ESTADO%20DE%20LA%20CUESTION%20DEL%20ETIQUETADO%20LINGUISTICO.pdf9a6d5feefc1b94a57b86f0ff0483eef6MD51open accessJonatan Alejandro Gomez Martinez.PDFJonatan Alejandro Gomez Martinez.PDFapplication/pdf28116https://dspace.tdea.edu.co/bitstream/tda/435/2/Jonatan%20Alejandro%20Gomez%20Martinez.PDF742dc53219b8614762e9ee28c58c7d9cMD52open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://dspace.tdea.edu.co/bitstream/tda/435/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD53open accesstda/435oai:dspace.tdea.edu.co:tda/4352021-05-01 00:45:41.984An error occurred on the license name.|||https://creativecommons.org/licenses/by-nc/4.0/open accessRepositorio Institucional Tecnologico de Antioquiabdigital@metabiblioteca.comTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |