Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina

En este artículo se aplican algunos métodos de clasificación a un conjunto de textos con el objetivo de estudiar la probabilidad que el libro Novela de la tía fingida haya sido escrita por Miguel de Cervantes. Esta novela se le ha atribuido históricamente, pero existen algunas posiciones encontradas...

Full description

Autores:
López, Freddy
Tipo de recurso:
Article of journal
Fecha de publicación:
2011
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/40785
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/40785
http://bdigital.unal.edu.co/30882/
Palabra clave:
análisis discriminante
árboles de clasificación
máquinas de aprendizaje
regla de Bayes
regresión logística
validación cruzada
Bayes rule
Classification tree
Cross validation
Discriminant Analysis
Logistic regression
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_9c002c6cd94aac179b9db367222b2dfb
oai_identifier_str oai:repositorio.unal.edu.co:unal/40785
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina
title Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina
spellingShingle Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina
análisis discriminante
árboles de clasificación
máquinas de aprendizaje
regla de Bayes
regresión logística
validación cruzada
Bayes rule
Classification tree
Cross validation
Discriminant Analysis
Logistic regression
title_short Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina
title_full Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina
title_fullStr Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina
title_full_unstemmed Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina
title_sort Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina
dc.creator.fl_str_mv López, Freddy
dc.contributor.author.spa.fl_str_mv López, Freddy
dc.subject.proposal.spa.fl_str_mv análisis discriminante
árboles de clasificación
máquinas de aprendizaje
regla de Bayes
regresión logística
validación cruzada
Bayes rule
Classification tree
Cross validation
Discriminant Analysis
Logistic regression
topic análisis discriminante
árboles de clasificación
máquinas de aprendizaje
regla de Bayes
regresión logística
validación cruzada
Bayes rule
Classification tree
Cross validation
Discriminant Analysis
Logistic regression
description En este artículo se aplican algunos métodos de clasificación a un conjunto de textos con el objetivo de estudiar la probabilidad que el libro Novela de la tía fingida haya sido escrita por Miguel de Cervantes. Esta novela se le ha atribuido históricamente, pero existen algunas posiciones encontradas al respecto. Los métodos usados en este artículo contemplan: regresión logística, regresión logística aditiva, análisis discriminante lineal, cuadrático, regularizado, de mezclas y flexible, árboles de clasificación, método de los k-ésimos vecinos más cercanos, método de Bayes ingenuo y máquinas de soporte vectorial. Los métodos fueron calibrados y aplicados utilizando un corpus de autores contemporáneos a Cervantes (Lope de Vega, Jerónimo de Pasamonte, Alonso Fernández de Avellaneda, Mateo Alemán y Francisco de Quevedo) junto con más de cuarenta variables, principalmente palabras y signos de puntuación, medidas sobre muestras de los textos escritos por estos autores. Con respecto a estos métodos, la mayoría clasifica la obra como cervantina; sin embargo, es recomendable ampliar el corpus utilizado para el estudio e incluir más autores para la comparación.
publishDate 2011
dc.date.issued.spa.fl_str_mv 2011
dc.date.accessioned.spa.fl_str_mv 2019-06-28T09:40:46Z
dc.date.available.spa.fl_str_mv 2019-06-28T09:40:46Z
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/ART
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/40785
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/30882/
url https://repositorio.unal.edu.co/handle/unal/40785
http://bdigital.unal.edu.co/30882/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.spa.fl_str_mv http://revistas.unal.edu.co/index.php/estad/article/view/29882
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de Estadística
Revista Colombiana de Estadística
dc.relation.ispartofseries.none.fl_str_mv Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 0120-1751
dc.relation.references.spa.fl_str_mv López, Freddy (2011) Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina. Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 0120-1751 .
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Nacional de Colombia
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/40785/1/29882-142458-1-PB.html
https://repositorio.unal.edu.co/bitstream/unal/40785/2/29882-107496-1-PB.pdf
https://repositorio.unal.edu.co/bitstream/unal/40785/3/29882-107496-1-PB.pdf.jpg
bitstream.checksum.fl_str_mv 78cda7357c7b0cea7120491c845ce2c9
e817db98c6a33c4ccf70c5403a453d2a
f0ea9830555f83a634d59720c31dcfb3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089983031508992
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2López, Freddy70f0cc3a-b891-47a2-af9a-d9a12208b22c3002019-06-28T09:40:46Z2019-06-28T09:40:46Z2011https://repositorio.unal.edu.co/handle/unal/40785http://bdigital.unal.edu.co/30882/En este artículo se aplican algunos métodos de clasificación a un conjunto de textos con el objetivo de estudiar la probabilidad que el libro Novela de la tía fingida haya sido escrita por Miguel de Cervantes. Esta novela se le ha atribuido históricamente, pero existen algunas posiciones encontradas al respecto. Los métodos usados en este artículo contemplan: regresión logística, regresión logística aditiva, análisis discriminante lineal, cuadrático, regularizado, de mezclas y flexible, árboles de clasificación, método de los k-ésimos vecinos más cercanos, método de Bayes ingenuo y máquinas de soporte vectorial. Los métodos fueron calibrados y aplicados utilizando un corpus de autores contemporáneos a Cervantes (Lope de Vega, Jerónimo de Pasamonte, Alonso Fernández de Avellaneda, Mateo Alemán y Francisco de Quevedo) junto con más de cuarenta variables, principalmente palabras y signos de puntuación, medidas sobre muestras de los textos escritos por estos autores. Con respecto a estos métodos, la mayoría clasifica la obra como cervantina; sin embargo, es recomendable ampliar el corpus utilizado para el estudio e incluir más autores para la comparación.In this paper, some classification methods are applied to a set of texts with the aim of studying the probability that the book Novela de la tía fingida has been written by Miguel de Cervantes. This novel has been historically attributed to him but there are some encountered positions about this. The methods used in this paper range from: logistic regression, additive logistic regression, linear, quadratic, regularized, mixture and flexible discriminant analysis, classification tree, k-nearest neighbour, Naive Bayes method and support vector machines. Methods were trained and applied using a corpus of authors contemporary to Cervantes as Lope de Vega, Jerónimo de Pasamonte, Alonso Fernández de Avellaneda, Mateo Alemán, and Francisco de Quevedo and more than forty variables, mainly words and punctuation marks, measured over written texts by these authors. Respect to these methods, most of them classify the novel as another Cervantes’ work; however, is our recommendation to include more texts from these authors and more authors.application/pdfspaUniversidad Nacional de Colombiahttp://revistas.unal.edu.co/index.php/estad/article/view/29882Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de EstadísticaRevista Colombiana de EstadísticaRevista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 0120-1751López, Freddy (2011) Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantina. Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 Revista Colombiana de Estadística; Vol. 34, núm. 1 (2011); 15-37 0120-1751 .Donde se muestran algunos resultados de atribución de autor en torno a la obra cervantinaArtículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTanálisis discriminanteárboles de clasificaciónmáquinas de aprendizajeregla de Bayesregresión logísticavalidación cruzadaBayes ruleClassification treeCross validationDiscriminant AnalysisLogistic regressionORIGINAL29882-142458-1-PB.htmltext/html8453https://repositorio.unal.edu.co/bitstream/unal/40785/1/29882-142458-1-PB.html78cda7357c7b0cea7120491c845ce2c9MD5129882-107496-1-PB.pdfapplication/pdf1001400https://repositorio.unal.edu.co/bitstream/unal/40785/2/29882-107496-1-PB.pdfe817db98c6a33c4ccf70c5403a453d2aMD52THUMBNAIL29882-107496-1-PB.pdf.jpg29882-107496-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg5435https://repositorio.unal.edu.co/bitstream/unal/40785/3/29882-107496-1-PB.pdf.jpgf0ea9830555f83a634d59720c31dcfb3MD53unal/40785oai:repositorio.unal.edu.co:unal/407852024-01-27 23:06:09.893Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co