Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R

El modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos, es un modelo de regresión donde la variable respuesta se encuentra definida a partir de una distribución para datos proporcionales, como la distribución beta o la distribución simplex, que dan resultados en el interv...

Full description

Autores:
Díaz Zapata, Juan Camilo
Tipo de recurso:
Fecha de publicación:
2018
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/63743
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/63743
http://bdigital.unal.edu.co/64250/
Palabra clave:
0 Generalidades / Computer science, information and general works
5 Ciencias naturales y matemáticas / Science
6 Tecnología (ciencias aplicadas) / Technology
Modelos lineales mixtos
Dtos proporcionales inflados
Cuadratura de Gauss-Hermite
Máxima verosimilitud
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_71781411af47b1e07f7565ca42944a1e
oai_identifier_str oai:repositorio.unal.edu.co:unal/63743
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R
title Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R
spellingShingle Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R
0 Generalidades / Computer science, information and general works
5 Ciencias naturales y matemáticas / Science
6 Tecnología (ciencias aplicadas) / Technology
Modelos lineales mixtos
Dtos proporcionales inflados
Cuadratura de Gauss-Hermite
Máxima verosimilitud
title_short Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R
title_full Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R
title_fullStr Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R
title_full_unstemmed Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R
title_sort Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R
dc.creator.fl_str_mv Díaz Zapata, Juan Camilo
dc.contributor.author.spa.fl_str_mv Díaz Zapata, Juan Camilo
dc.contributor.spa.fl_str_mv Hernández Barajas, Freddy
dc.subject.ddc.spa.fl_str_mv 0 Generalidades / Computer science, information and general works
5 Ciencias naturales y matemáticas / Science
6 Tecnología (ciencias aplicadas) / Technology
topic 0 Generalidades / Computer science, information and general works
5 Ciencias naturales y matemáticas / Science
6 Tecnología (ciencias aplicadas) / Technology
Modelos lineales mixtos
Dtos proporcionales inflados
Cuadratura de Gauss-Hermite
Máxima verosimilitud
dc.subject.proposal.spa.fl_str_mv Modelos lineales mixtos
Dtos proporcionales inflados
Cuadratura de Gauss-Hermite
Máxima verosimilitud
description El modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos, es un modelo de regresión donde la variable respuesta se encuentra definida a partir de una distribución para datos proporcionales, como la distribución beta o la distribución simplex, que dan resultados en el intervalo cero uno, más dos valores dados por cero y/o uno, representando la ausencia o presencia total de cierta característica. Diferentes autores han trabajado en el desarrollo de diferentes modelos y metodologías de estimación, sin embargo, no se ha desarrollado un modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos, que reúna los principales modelos de regresión de este tipo y que la estimación de los parámetros sean vía máxima verosimilitud y la cuadratura de Gauss-Hermite. En este trabajo se presenta el paquete ZOIP del sistema computacional R, alojado en el CRAN y en GitHub, en ´el que se implementa la distribución ZOIP (Zeros Ones Inflated Proporcional), el modelo de regresión para efectos fijos y mixtos, ZOIP, que reúne las distribuciones y los modelos de regresión de efectos fijos y mixtos para las distribuciones beta en tres diferentes parametrizaciones y la distribución simplex, inflada con ceros y/o unos, la estimación de los parámetros se hace vía máxima verosimilitud y la cuadratura de Gauss-Hermite utilizando diferentes alternativas, como la cuadratura de Gauss-Hermite adaptativa con o sin pruning. Se realizan tres estudios de simulación que muestran la onvergencia de los parámetros para el ajuste de una distribución ZOIP y los diferentes casos de uso de los modelos de regresi´on ZOIP con efectos fijos y mixtos, a través de los estudios de simulación se presenta las ventajas y desventajas de los métodos de estimación propuestos y la alternativa de estimación que obtiene mejor desempeño, para cada modelo presentado. Además, se ajustan diferentes modelos de regresión ZOIP a un caso real sobre el porcentaje de uso de las tarjetas de crédito en una entidad bancaria colombiana y la dependencia a diferentes variables de negocio que fueron definidas previamente como efectos fijos y aleatorios, dependiendo del caso de estudio Palabras clave: modelos lineales mixtos, datos proporcionales inflados, cuadratura de Gauss-Hermite, máxima verosimilitud
publishDate 2018
dc.date.issued.spa.fl_str_mv 2018-03-31
dc.date.accessioned.spa.fl_str_mv 2019-07-02T22:05:48Z
dc.date.available.spa.fl_str_mv 2019-07-02T22:05:48Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/63743
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/64250/
url https://repositorio.unal.edu.co/handle/unal/63743
http://bdigital.unal.edu.co/64250/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística
Escuela de Estadística
dc.relation.references.spa.fl_str_mv Díaz Zapata, Juan Camilo (2018) Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R. Maestría thesis, Universidad Nacional de Colombia - Sede Medellín.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/63743/1/1152690123.2018.pdf
https://repositorio.unal.edu.co/bitstream/unal/63743/2/1152690123.2018.pdf.jpg
bitstream.checksum.fl_str_mv 39094f132cc60ec7546f5cc57b42165d
7c18c82decdfa9ff4ed7012dc96b0161
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089339026538496
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Hernández Barajas, FreddyDíaz Zapata, Juan Camilofceddda9-0ffa-49f5-8fc6-9451c56b36bf3002019-07-02T22:05:48Z2019-07-02T22:05:48Z2018-03-31https://repositorio.unal.edu.co/handle/unal/63743http://bdigital.unal.edu.co/64250/El modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos, es un modelo de regresión donde la variable respuesta se encuentra definida a partir de una distribución para datos proporcionales, como la distribución beta o la distribución simplex, que dan resultados en el intervalo cero uno, más dos valores dados por cero y/o uno, representando la ausencia o presencia total de cierta característica. Diferentes autores han trabajado en el desarrollo de diferentes modelos y metodologías de estimación, sin embargo, no se ha desarrollado un modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos, que reúna los principales modelos de regresión de este tipo y que la estimación de los parámetros sean vía máxima verosimilitud y la cuadratura de Gauss-Hermite. En este trabajo se presenta el paquete ZOIP del sistema computacional R, alojado en el CRAN y en GitHub, en ´el que se implementa la distribución ZOIP (Zeros Ones Inflated Proporcional), el modelo de regresión para efectos fijos y mixtos, ZOIP, que reúne las distribuciones y los modelos de regresión de efectos fijos y mixtos para las distribuciones beta en tres diferentes parametrizaciones y la distribución simplex, inflada con ceros y/o unos, la estimación de los parámetros se hace vía máxima verosimilitud y la cuadratura de Gauss-Hermite utilizando diferentes alternativas, como la cuadratura de Gauss-Hermite adaptativa con o sin pruning. Se realizan tres estudios de simulación que muestran la onvergencia de los parámetros para el ajuste de una distribución ZOIP y los diferentes casos de uso de los modelos de regresi´on ZOIP con efectos fijos y mixtos, a través de los estudios de simulación se presenta las ventajas y desventajas de los métodos de estimación propuestos y la alternativa de estimación que obtiene mejor desempeño, para cada modelo presentado. Además, se ajustan diferentes modelos de regresión ZOIP a un caso real sobre el porcentaje de uso de las tarjetas de crédito en una entidad bancaria colombiana y la dependencia a diferentes variables de negocio que fueron definidas previamente como efectos fijos y aleatorios, dependiendo del caso de estudio Palabras clave: modelos lineales mixtos, datos proporcionales inflados, cuadratura de Gauss-Hermite, máxima verosimilitudAbstract: The mixed regression model for proportional data inflated with zeros and/or ones is a regression model where the response variable is defined by a proportional data distribution. A proportional data distribution could be the beta distribution or the simplex distribution, which its results are given in the interval zero one, and in other two values given by zero and/or one that represent the absence or total presence of a given characteristic. Although several authors have worked on the development of different models and estimation methodologies, a mixed regression model for proportional data inflated with zeros and/or ones that aggregates the main regression models and the estimation of the parameters through the maximum likelihood and Gauss-Hermite quadrature has not been developed. In this paper, it is presented the ZOIP package for the computational system R, hosted in the CRAN and in GitHub, in which the ZOIP (Zeros Ones Inflated Proportional) distribution is implemented. In the ZOIP package is used a regression model for fixed and mixed effects, which unifies the distributions and these types of egressions for beta distribution with three differents cases of parameters and simplex distribution, inflated with zeros and/or ones, and the estimation of the parameters solved by the maximum likelihood and Gauss-Hermite quadrature using differents choices, like the Gauss-Hermite adaptive quadrature with pruning or without pruning. Three simulation studies are performed showing the convergence of the parameters for the fit of a ZOIP distribution and the different cases of use of the ZOIP regression model with fixed and mixed effects, with this simulation studies show the advantages and disadvantages of the proposed estimation methods and the estimation alternative that presents the best performance. Furthermore, different ZOIP regression models are fitted to a real case about percentage of use of credit cards in a Colombian bank and your dependence with different business variables that were previously defined as fixed and random effects, depending on the case of study.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de EstadísticaEscuela de EstadísticaDíaz Zapata, Juan Camilo (2018) Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R. Maestría thesis, Universidad Nacional de Colombia - Sede Medellín.0 Generalidades / Computer science, information and general works5 Ciencias naturales y matemáticas / Science6 Tecnología (ciencias aplicadas) / TechnologyModelos lineales mixtosDtos proporcionales infladosCuadratura de Gauss-HermiteMáxima verosimilitudModelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en RTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL1152690123.2018.pdfTesis de Maestría en Ciencias - Estadísticaapplication/pdf867587https://repositorio.unal.edu.co/bitstream/unal/63743/1/1152690123.2018.pdf39094f132cc60ec7546f5cc57b42165dMD51THUMBNAIL1152690123.2018.pdf.jpg1152690123.2018.pdf.jpgGenerated Thumbnailimage/jpeg4081https://repositorio.unal.edu.co/bitstream/unal/63743/2/1152690123.2018.pdf.jpg7c18c82decdfa9ff4ed7012dc96b0161MD52unal/63743oai:repositorio.unal.edu.co:unal/637432024-04-30 23:11:00.19Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co