Sobre la agrupación de niveles del factor

Se discute el efecto que se produce sobre el modelo logit binario con un único factor explicativo cuando el investigador decide agrupar algunos niveles de dicho factor. Con base en la parametrización de referencia y el modelo saturado se sugiere un procedimiento que, aprovechando los cómputos de un...

Full description

Autores:
Ponsot Balaguer, Ernesto
Sinha, Surendra
Goitía, Arnaldo
Tipo de recurso:
Article of journal
Fecha de publicación:
2009
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/40720
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/40720
http://bdigital.unal.edu.co/30817/
Palabra clave:
modelo logit
agregación de niveles
datos agregados
tablas de contingencia
modelo lineal generalizado
Logit model
Joining levels
Aggregate data
Contingency tables
Generalized linear model
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_b4ca5d4c732b56fb343d66fc1d02ccab
oai_identifier_str oai:repositorio.unal.edu.co:unal/40720
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Sobre la agrupación de niveles del factor
title Sobre la agrupación de niveles del factor
spellingShingle Sobre la agrupación de niveles del factor
modelo logit
agregación de niveles
datos agregados
tablas de contingencia
modelo lineal generalizado
Logit model
Joining levels
Aggregate data
Contingency tables
Generalized linear model
title_short Sobre la agrupación de niveles del factor
title_full Sobre la agrupación de niveles del factor
title_fullStr Sobre la agrupación de niveles del factor
title_full_unstemmed Sobre la agrupación de niveles del factor
title_sort Sobre la agrupación de niveles del factor
dc.creator.fl_str_mv Ponsot Balaguer, Ernesto
Sinha, Surendra
Goitía, Arnaldo
dc.contributor.author.spa.fl_str_mv Ponsot Balaguer, Ernesto
Sinha, Surendra
Goitía, Arnaldo
dc.subject.proposal.spa.fl_str_mv modelo logit
agregación de niveles
datos agregados
tablas de contingencia
modelo lineal generalizado
Logit model
Joining levels
Aggregate data
Contingency tables
Generalized linear model
topic modelo logit
agregación de niveles
datos agregados
tablas de contingencia
modelo lineal generalizado
Logit model
Joining levels
Aggregate data
Contingency tables
Generalized linear model
description Se discute el efecto que se produce sobre el modelo logit binario con un único factor explicativo cuando el investigador decide agrupar algunos niveles de dicho factor. Con base en la parametrización de referencia y el modelo saturado se sugiere un procedimiento que, aprovechando los cómputos de un primer ajuste logit y corrigiendo el supuesto distribucional sobre la varianza, produce estimaciones más eficientemente y con mayor precisión que las que se producen si solo se decide reiterar un ajuste logit. Una vez colocado el tema en perspectiva, se desarrollan las ecuaciones que sustentan el procedimiento sugerido, apelando a la teoría asintótica. Se ilustra mediante un ejemplo la diferencia entre el procedimiento sugerido y el habitual y, con base en una extensa simulación, se muestran tendencias sólidas a favor del primero, en la medida en que las probabilidades de éxito de la variable respuesta (Y = 1), asociadas con las categorías del factor explicativo incluidas en la agrupación, sean más disímiles entre sí.
publishDate 2009
dc.date.issued.spa.fl_str_mv 2009
dc.date.accessioned.spa.fl_str_mv 2019-06-28T09:39:17Z
dc.date.available.spa.fl_str_mv 2019-06-28T09:39:17Z
dc.type.spa.fl_str_mv Artículo de revista
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/ART
format http://purl.org/coar/resource_type/c_6501
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/40720
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/30817/
url https://repositorio.unal.edu.co/handle/unal/40720
http://bdigital.unal.edu.co/30817/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.spa.fl_str_mv http://revistas.unal.edu.co/index.php/estad/article/view/29760
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de Estadística
Revista Colombiana de Estadística
dc.relation.ispartofseries.none.fl_str_mv Revista Colombiana de Estadística; Vol. 32, núm. 2 (2009); 157-187 Revista Colombiana de Estadística; Vol. 32, núm. 2 (2009); 157-187 0120-1751
dc.relation.references.spa.fl_str_mv Ponsot Balaguer, Ernesto and Sinha, Surendra and Goitía, Arnaldo (2009) Sobre la agrupación de niveles del factor. Revista Colombiana de Estadística; Vol. 32, núm. 2 (2009); 157-187 Revista Colombiana de Estadística; Vol. 32, núm. 2 (2009); 157-187 0120-1751 .
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Nacional de Colombia
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/40720/1/29760-152766-1-PB.html
https://repositorio.unal.edu.co/bitstream/unal/40720/2/29760-106905-1-PB.pdf
https://repositorio.unal.edu.co/bitstream/unal/40720/3/29760-106905-1-PB.pdf.jpg
bitstream.checksum.fl_str_mv 77e7f5f7dbfa47132ee1fb50d79bd96f
a302e40936fd6aba2fca9e1c73271e4d
181604f342c5283266be125c016e24fb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089353740156928
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Ponsot Balaguer, Ernestoe324f823-aca6-47fd-b5cd-96dd187e56f6300Sinha, Surendradbefe7a1-4af7-446b-9ea6-2f40600286d6300Goitía, Arnaldo8741f531-4ca6-478e-ae33-3882ee22dd523002019-06-28T09:39:17Z2019-06-28T09:39:17Z2009https://repositorio.unal.edu.co/handle/unal/40720http://bdigital.unal.edu.co/30817/Se discute el efecto que se produce sobre el modelo logit binario con un único factor explicativo cuando el investigador decide agrupar algunos niveles de dicho factor. Con base en la parametrización de referencia y el modelo saturado se sugiere un procedimiento que, aprovechando los cómputos de un primer ajuste logit y corrigiendo el supuesto distribucional sobre la varianza, produce estimaciones más eficientemente y con mayor precisión que las que se producen si solo se decide reiterar un ajuste logit. Una vez colocado el tema en perspectiva, se desarrollan las ecuaciones que sustentan el procedimiento sugerido, apelando a la teoría asintótica. Se ilustra mediante un ejemplo la diferencia entre el procedimiento sugerido y el habitual y, con base en una extensa simulación, se muestran tendencias sólidas a favor del primero, en la medida en que las probabilidades de éxito de la variable respuesta (Y = 1), asociadas con las categorías del factor explicativo incluidas en la agrupación, sean más disímiles entre sí.We discuss the effect that is produced on the binary logit model with one explanatory factor, when the researcher decides to join some levels of the factor. Based on the reference parametrization and the saturated model a procedure is suggested, that takes advantage of the calculations of the first adjustment and corrects the distribucional supposition around the variance. As a result, it produces estimations more efficiently and with more precision, than those which take place if it is decided to repeat the usual logit fit. Once placed the topic in perspective, we develop the equations that support the suggested procedure, based on asymptotic theory. We illustrate with an example the difference between the suggested procedure and the usual one. By developing an extensive simulation, some solid trends appear in favour of the first one, especially when the probabilities of success of the response (Y = 1), associated with the categories of the explanatory factor included in the group, are less similar each other.application/pdfspaUniversidad Nacional de Colombiahttp://revistas.unal.edu.co/index.php/estad/article/view/29760Universidad Nacional de Colombia Revistas electrónicas UN Revista Colombiana de EstadísticaRevista Colombiana de EstadísticaRevista Colombiana de Estadística; Vol. 32, núm. 2 (2009); 157-187 Revista Colombiana de Estadística; Vol. 32, núm. 2 (2009); 157-187 0120-1751Ponsot Balaguer, Ernesto and Sinha, Surendra and Goitía, Arnaldo (2009) Sobre la agrupación de niveles del factor. Revista Colombiana de Estadística; Vol. 32, núm. 2 (2009); 157-187 Revista Colombiana de Estadística; Vol. 32, núm. 2 (2009); 157-187 0120-1751 .Sobre la agrupación de niveles del factorArtículo de revistainfo:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Texthttp://purl.org/redcol/resource_type/ARTmodelo logitagregación de nivelesdatos agregadostablas de contingenciamodelo lineal generalizadoLogit modelJoining levelsAggregate dataContingency tablesGeneralized linear modelORIGINAL29760-152766-1-PB.htmltext/html10141https://repositorio.unal.edu.co/bitstream/unal/40720/1/29760-152766-1-PB.html77e7f5f7dbfa47132ee1fb50d79bd96fMD5129760-106905-1-PB.pdfapplication/pdf341724https://repositorio.unal.edu.co/bitstream/unal/40720/2/29760-106905-1-PB.pdfa302e40936fd6aba2fca9e1c73271e4dMD52THUMBNAIL29760-106905-1-PB.pdf.jpg29760-106905-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg5241https://repositorio.unal.edu.co/bitstream/unal/40720/3/29760-106905-1-PB.pdf.jpg181604f342c5283266be125c016e24fbMD53unal/40720oai:repositorio.unal.edu.co:unal/407202024-01-26 23:07:54.08Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co