Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su proc...
- Autores:
-
Pemberty Tamayo, José Luis
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2020
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/16570
- Acceso en línea:
- http://hdl.handle.net/10495/16570
- Palabra clave:
- Lingüística computacional
Computational linguistics
Etiquetado
Lingüística de corpus
Linguistica - Procesamiento de datos
Lingüística aplicada
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
id |
UDEA2_172e8e75f6e0ea87c1897c2c212af4aa |
---|---|
oai_identifier_str |
oai:bibliotecadigital.udea.edu.co:10495/16570 |
network_acronym_str |
UDEA2 |
network_name_str |
Repositorio UdeA |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
dc.title.alternative.spa.fl_str_mv |
Conception and development of a semi-automatic tagging system for under-resourced languages |
title |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
spellingShingle |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages Lingüística computacional Computational linguistics Etiquetado Lingüística de corpus Linguistica - Procesamiento de datos Lingüística aplicada |
title_short |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
title_full |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
title_fullStr |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
title_full_unstemmed |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
title_sort |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
dc.creator.fl_str_mv |
Pemberty Tamayo, José Luis |
dc.contributor.advisor.none.fl_str_mv |
Molina Mejía, Jorge Mauricio |
dc.contributor.author.none.fl_str_mv |
Pemberty Tamayo, José Luis |
dc.subject.lemb.none.fl_str_mv |
Lingüística computacional Computational linguistics |
topic |
Lingüística computacional Computational linguistics Etiquetado Lingüística de corpus Linguistica - Procesamiento de datos Lingüística aplicada |
dc.subject.proposal.spa.fl_str_mv |
Etiquetado Lingüística de corpus Linguistica - Procesamiento de datos Lingüística aplicada |
description |
RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su procesamiento automático en muchos casos. En este sentido, se propone y se describe un algoritmo que busca asistir el etiquetado manual a nivel de POS de corpus textuales en lenguas para las que aún no existe el etiquetado automático. Así mismo, se presenta un ejemplo de aplicación de este algoritmo a través de un sencillo programa que puede ser probado por el lector. |
publishDate |
2020 |
dc.date.accessioned.none.fl_str_mv |
2020-09-03T14:14:26Z |
dc.date.available.none.fl_str_mv |
2020-09-03T14:14:26Z |
dc.date.issued.none.fl_str_mv |
2020 |
dc.type.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
dc.type.hasversion.spa.fl_str_mv |
info:eu-repo/semantics/draft |
dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
dc.type.redcol.spa.fl_str_mv |
https://purl.org/redcol/resource_type/TP |
dc.type.local.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
format |
http://purl.org/coar/resource_type/c_7a1f |
status_str |
draft |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10495/16570 |
url |
http://hdl.handle.net/10495/16570 |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.rights.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) |
dc.rights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
dc.rights.accessrights.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.creativecommons.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
rights_invalid_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) http://creativecommons.org/licenses/by-nc-nd/2.5/co/ http://purl.org/coar/access_right/c_abf2 https://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.format.extent.spa.fl_str_mv |
59 |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
dc.publisher.group.spa.fl_str_mv |
Grupo de Estudios Sociolingüísticos |
dc.publisher.place.spa.fl_str_mv |
Medellín, Colombia |
institution |
Universidad de Antioquia |
bitstream.url.fl_str_mv |
http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/2/PembertyJose_2020_EtiquetadoSemiautom%c3%a1ticoUnder-resourced.pdf http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/3/ActaSustentaci%c3%b3n.pdf http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/5/UnderRL_Tagger_exe.zip http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/6/UnderRL_Tagger_py.zip http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/7/license_rdf http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/8/license.txt |
bitstream.checksum.fl_str_mv |
20d27a9e9950d665ca82e22f6438ae16 25a3dbe727194b1a45a9385bef19946b e253710087041711ce7b908bf5ce36fb c2868204d1fc9ddbb46e55d10474d802 b88b088d9957e670ce3b3fbe2eedbc13 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad de Antioquia |
repository.mail.fl_str_mv |
andres.perez@udea.edu.co |
_version_ |
1812173180965486592 |
spelling |
Molina Mejía, Jorge MauricioPemberty Tamayo, José Luis2020-09-03T14:14:26Z2020-09-03T14:14:26Z2020http://hdl.handle.net/10495/16570RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su procesamiento automático en muchos casos. En este sentido, se propone y se describe un algoritmo que busca asistir el etiquetado manual a nivel de POS de corpus textuales en lenguas para las que aún no existe el etiquetado automático. Así mismo, se presenta un ejemplo de aplicación de este algoritmo a través de un sencillo programa que puede ser probado por el lector.ABSTRACT: This work is based in the fact that corpus linguistics and computational linguistics are gaining importance in the understanding and study of languages and that the great linguistic diversity of our country and the world makes it difficult to create resources for their automatic processing in many cases. In this sense, an algorithm that seeks to assist manual tagging at the POS level of textual corpora in languages for which automatic tagging does not yet exist is proposed and described. Also, an example of application of this algorithm is presented through a simple program that can be tested by the reader.59application/pdfspainfo:eu-repo/semantics/draftinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1fhttps://purl.org/redcol/resource_type/TPTesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/version/c_b1a7d7d4d402bcceAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/co/http://purl.org/coar/access_right/c_abf2https://creativecommons.org/licenses/by-nc-nd/4.0/Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languagesConception and development of a semi-automatic tagging system for under-resourced languagesGrupo de Estudios SociolingüísticosMedellín, ColombiaLingüística computacionalComputational linguisticsEtiquetadoLingüística de corpusLinguistica - Procesamiento de datosLingüística aplicadaFilólogo HispanistaPregradoFacultad de Comunicaciones y Filología. Carrera de Filología HispánicaUniversidad de AntioquiaORIGINALPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdfPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdfTrabajo de grado de pregradoapplication/pdf1533658http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/2/PembertyJose_2020_EtiquetadoSemiautom%c3%a1ticoUnder-resourced.pdf20d27a9e9950d665ca82e22f6438ae16MD52ActaSustentación.pdfActaSustentación.pdfapplication/pdf157364http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/3/ActaSustentaci%c3%b3n.pdf25a3dbe727194b1a45a9385bef19946bMD53UnderRL_Tagger_exe.zipUnderRL_Tagger_exe.zipAnexoapplication/zip406315388http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/5/UnderRL_Tagger_exe.zipe253710087041711ce7b908bf5ce36fbMD55UnderRL_Tagger_py.zipUnderRL_Tagger_py.zipAnexoapplication/zip17880http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/6/UnderRL_Tagger_py.zipc2868204d1fc9ddbb46e55d10474d802MD56CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8823http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/7/license_rdfb88b088d9957e670ce3b3fbe2eedbc13MD57LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://bibliotecadigital.udea.edu.co/bitstream/10495/16570/8/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5810495/16570oai:bibliotecadigital.udea.edu.co:10495/165702021-06-15 16:12:13.303Repositorio Institucional Universidad de Antioquiaandres.perez@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |