Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching

Las técnicas de inferencia causal aplicadas a la evaluación estadística de los resultados de un experimento o estudio observacional constituyen una herramienta de vital importancia en la toma de decisiones en diferentes campos del saber común. Ejemplos naturales de este tipo de estudios son la evalu...

Full description

Autores:
Montaño Rincón, Cristian Fabian
Tipo de recurso:
Fecha de publicación:
2019
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/76683
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/76683
http://bdigital.unal.edu.co/73345/
Palabra clave:
Estudios observacionales
Diseños muestrales
Propensity score matching
Muestreo en dos fases
Observational studies
Sampling designs
Propensity score matching
Two phase sampling
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_b91586b2cd142962edfcf81b95bda971
oai_identifier_str oai:repositorio.unal.edu.co:unal/76683
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
spellingShingle Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
Estudios observacionales
Diseños muestrales
Propensity score matching
Muestreo en dos fases
Observational studies
Sampling designs
Propensity score matching
Two phase sampling
title_short Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title_full Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title_fullStr Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title_full_unstemmed Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title_sort Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
dc.creator.fl_str_mv Montaño Rincón, Cristian Fabian
dc.contributor.author.spa.fl_str_mv Montaño Rincón, Cristian Fabian
dc.contributor.spa.fl_str_mv Trujillo Oyola, Leonardo
dc.subject.proposal.spa.fl_str_mv Estudios observacionales
Diseños muestrales
Propensity score matching
Muestreo en dos fases
Observational studies
Sampling designs
Propensity score matching
Two phase sampling
topic Estudios observacionales
Diseños muestrales
Propensity score matching
Muestreo en dos fases
Observational studies
Sampling designs
Propensity score matching
Two phase sampling
description Las técnicas de inferencia causal aplicadas a la evaluación estadística de los resultados de un experimento o estudio observacional constituyen una herramienta de vital importancia en la toma de decisiones en diferentes campos del saber común. Ejemplos naturales de este tipo de estudios son la evaluación del impacto de alguna intervención política o programa por parte del gobierno, o cuando se quiere evaluar el efecto de un nuevo tratamiento médico, entre otros tipos de estudios. Sin embargo, es común enfrentarse a problemas económicos, éticos o logísticos que restringen la posibilidad de asignar unidades a los tratamientos de manera estrictamente aleatoria (estudios cuasi-experimentales). Adicionalmente, en muchas ocasiones no existe la posibilidad de medir pos-tratamiento a todas las unidades en el estudio; razón por la cual es necesario realizar la selección de una muestra probabilística que en algunos casos utilizan diseños muestrales complejos con probabilidades de inclusión desiguales. Suponiendo ausencia de un proceso de aleatorización que garantice el balanceo en las covariables medibles y no medibles entre el grupo tratamiento y control, y bajo el escenario de trabajar con una muestra probabilística, en este documento, se procedió a usar la técnica de Propensity Score matching con el fin de conformar dos grupos balanceados con los cuales tuviera sentido realizar comparaciones. Posterior a esto se evaluó el efecto del tratamiento utilizando el estimador de diferencias DIF y el de diferencias en diferencias DIFDIF. Se evaluaron diferentes estrategias de estimación cuando se incluyen los pesos de muestreo y se analizó el efecto que puede tener el incorporarlos u omitirlos. Las ponderaciones para el estimador consistieron en la combinación de las probabilidades de inclusión inducidas por el diseño muestral junto a transformaciones de la medida de probabilidad inducida por el propensity score, encontradas en la literatura. Para esto se trabajó bajo un esquema de diseño en dos fases. Los resultados de las simulaciones, así como una aplicación al conjunto de datos del Programa Todos a Aprender (PTA) del Ministerio de Educación en Colombia, mostraron la importancia de usar las combinaciones de pesos muestrales y de propensity score en la reducción del sesgo, ante diferentes tipos de composiciones del soporte común entre los grupos control y tratamiento, diferentes tipos de diseños muestrales y diferentes ajustes del modelo de propensity score.
publishDate 2019
dc.date.issued.spa.fl_str_mv 2019-08-24
dc.date.accessioned.spa.fl_str_mv 2020-03-30T06:26:07Z
dc.date.available.spa.fl_str_mv 2020-03-30T06:26:07Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/76683
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/73345/
url https://repositorio.unal.edu.co/handle/unal/76683
http://bdigital.unal.edu.co/73345/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Estadística
Departamento de Estadística
dc.relation.haspart.spa.fl_str_mv 31 Colecciones de estadística general / Statistics
dc.relation.references.spa.fl_str_mv Montaño Rincón, Cristian Fabian (2019) Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching. Maestría thesis, Universidad Nacional de Colombia - Sede Bogotá.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/76683/1/Tesis_CristianMontano.pdf
https://repositorio.unal.edu.co/bitstream/unal/76683/2/Tesis_CristianMontano.pdf.jpg
bitstream.checksum.fl_str_mv 32adce70277dc1ae305b67b3a37da90a
6c9aa4dd92ee21f2388d621a1e6ea022
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1806886326573727744
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Trujillo Oyola, LeonardoMontaño Rincón, Cristian Fabianaf25d28f-e605-4b9e-89a3-3560c8865a753002020-03-30T06:26:07Z2020-03-30T06:26:07Z2019-08-24https://repositorio.unal.edu.co/handle/unal/76683http://bdigital.unal.edu.co/73345/Las técnicas de inferencia causal aplicadas a la evaluación estadística de los resultados de un experimento o estudio observacional constituyen una herramienta de vital importancia en la toma de decisiones en diferentes campos del saber común. Ejemplos naturales de este tipo de estudios son la evaluación del impacto de alguna intervención política o programa por parte del gobierno, o cuando se quiere evaluar el efecto de un nuevo tratamiento médico, entre otros tipos de estudios. Sin embargo, es común enfrentarse a problemas económicos, éticos o logísticos que restringen la posibilidad de asignar unidades a los tratamientos de manera estrictamente aleatoria (estudios cuasi-experimentales). Adicionalmente, en muchas ocasiones no existe la posibilidad de medir pos-tratamiento a todas las unidades en el estudio; razón por la cual es necesario realizar la selección de una muestra probabilística que en algunos casos utilizan diseños muestrales complejos con probabilidades de inclusión desiguales. Suponiendo ausencia de un proceso de aleatorización que garantice el balanceo en las covariables medibles y no medibles entre el grupo tratamiento y control, y bajo el escenario de trabajar con una muestra probabilística, en este documento, se procedió a usar la técnica de Propensity Score matching con el fin de conformar dos grupos balanceados con los cuales tuviera sentido realizar comparaciones. Posterior a esto se evaluó el efecto del tratamiento utilizando el estimador de diferencias DIF y el de diferencias en diferencias DIFDIF. Se evaluaron diferentes estrategias de estimación cuando se incluyen los pesos de muestreo y se analizó el efecto que puede tener el incorporarlos u omitirlos. Las ponderaciones para el estimador consistieron en la combinación de las probabilidades de inclusión inducidas por el diseño muestral junto a transformaciones de la medida de probabilidad inducida por el propensity score, encontradas en la literatura. Para esto se trabajó bajo un esquema de diseño en dos fases. Los resultados de las simulaciones, así como una aplicación al conjunto de datos del Programa Todos a Aprender (PTA) del Ministerio de Educación en Colombia, mostraron la importancia de usar las combinaciones de pesos muestrales y de propensity score en la reducción del sesgo, ante diferentes tipos de composiciones del soporte común entre los grupos control y tratamiento, diferentes tipos de diseños muestrales y diferentes ajustes del modelo de propensity score.Abstract: Causal inference techniques applied to the statistical evaluation of the results of an experiment or an observational study constitutes a tool of vital importance when taking a decision in several fields of knowledge. Natural examples of these types of studies are analyzing of the impact for some public policy, program or intervention by the government; also when you want to evaluate the effect of a new medical treatment, and among others. However, in the practice, there are economic, ethic or logistic problems which makes difficult to assign units to treatments in a random way (quasi-experimental methodologies). In several occasions, when people want to evaluate these results there is not a possibility to measure the whole set of units in the population; then, it is necessary to draw a probabilistic sample which in the most of the cases is selected by complex sampling designs with unequal inclusion probabilities. Assuming the absence of a randomization process that guarantees the balance for measurable and non-measurable covariates between the treatment and control group, when a probabilistic sample was selected, the Propensity Score Matching technique was used in this document in order to get two balanced groups for the purpose of making comparisons. After this, the treatment effect was evaluated using the difference estimator DIF and the differences in differences estimator DIFDIF. Different estimation strategies were evaluated when the sample weights were included; furthermore, the effect of ignoring these weights was analyzed. The weights for the estimator consisted in the combination of inclusion probabilities induced by the sample design and a transformation of the probability measure induced by the propensity score, these transformations were found in different papers. In order to develop this, it was necessary to follow a scheme in two phase sampling. Simulation results, as well as an application to actual data from the Todos a Aprender Program (PTA in Spanish, it translates Everybody to Learn) of the Colombian Ministry of Education, show the importance of using both sampling and propensity score weights in order to reduce the bias, according to different types of compositions for the common support between control and treatment groups, different sampling designs and different propensity score models.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de EstadísticaDepartamento de Estadística31 Colecciones de estadística general / StatisticsMontaño Rincón, Cristian Fabian (2019) Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching. Maestría thesis, Universidad Nacional de Colombia - Sede Bogotá.Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score MatchingTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMEstudios observacionalesDiseños muestralesPropensity score matchingMuestreo en dos fasesObservational studiesSampling designsPropensity score matchingTwo phase samplingORIGINALTesis_CristianMontano.pdfapplication/pdf955404https://repositorio.unal.edu.co/bitstream/unal/76683/1/Tesis_CristianMontano.pdf32adce70277dc1ae305b67b3a37da90aMD51THUMBNAILTesis_CristianMontano.pdf.jpgTesis_CristianMontano.pdf.jpgGenerated Thumbnailimage/jpeg4358https://repositorio.unal.edu.co/bitstream/unal/76683/2/Tesis_CristianMontano.pdf.jpg6c9aa4dd92ee21f2388d621a1e6ea022MD52unal/76683oai:repositorio.unal.edu.co:unal/766832024-07-14 01:06:00.052Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co