Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
Las técnicas de inferencia causal aplicadas a la evaluación estadística de los resultados de un experimento o estudio observacional constituyen una herramienta de vital importancia en la toma de decisiones en diferentes campos del saber común. Ejemplos naturales de este tipo de estudios son la evalu...
- Autores:
-
Montaño Rincón, Cristian Fabian
- Tipo de recurso:
- Fecha de publicación:
- 2019
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/76683
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/76683
http://bdigital.unal.edu.co/73345/
- Palabra clave:
- Estudios observacionales
Diseños muestrales
Propensity score matching
Muestreo en dos fases
Observational studies
Sampling designs
Propensity score matching
Two phase sampling
- Rights
- openAccess
- License
- Atribución-NoComercial 4.0 Internacional
id |
UNACIONAL2_b91586b2cd142962edfcf81b95bda971 |
---|---|
oai_identifier_str |
oai:repositorio.unal.edu.co:unal/76683 |
network_acronym_str |
UNACIONAL2 |
network_name_str |
Universidad Nacional de Colombia |
repository_id_str |
|
dc.title.spa.fl_str_mv |
Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching |
title |
Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching |
spellingShingle |
Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching Estudios observacionales Diseños muestrales Propensity score matching Muestreo en dos fases Observational studies Sampling designs Propensity score matching Two phase sampling |
title_short |
Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching |
title_full |
Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching |
title_fullStr |
Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching |
title_full_unstemmed |
Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching |
title_sort |
Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching |
dc.creator.fl_str_mv |
Montaño Rincón, Cristian Fabian |
dc.contributor.author.spa.fl_str_mv |
Montaño Rincón, Cristian Fabian |
dc.contributor.spa.fl_str_mv |
Trujillo Oyola, Leonardo |
dc.subject.proposal.spa.fl_str_mv |
Estudios observacionales Diseños muestrales Propensity score matching Muestreo en dos fases Observational studies Sampling designs Propensity score matching Two phase sampling |
topic |
Estudios observacionales Diseños muestrales Propensity score matching Muestreo en dos fases Observational studies Sampling designs Propensity score matching Two phase sampling |
description |
Las técnicas de inferencia causal aplicadas a la evaluación estadística de los resultados de un experimento o estudio observacional constituyen una herramienta de vital importancia en la toma de decisiones en diferentes campos del saber común. Ejemplos naturales de este tipo de estudios son la evaluación del impacto de alguna intervención política o programa por parte del gobierno, o cuando se quiere evaluar el efecto de un nuevo tratamiento médico, entre otros tipos de estudios. Sin embargo, es común enfrentarse a problemas económicos, éticos o logísticos que restringen la posibilidad de asignar unidades a los tratamientos de manera estrictamente aleatoria (estudios cuasi-experimentales). Adicionalmente, en muchas ocasiones no existe la posibilidad de medir pos-tratamiento a todas las unidades en el estudio; razón por la cual es necesario realizar la selección de una muestra probabilística que en algunos casos utilizan diseños muestrales complejos con probabilidades de inclusión desiguales. Suponiendo ausencia de un proceso de aleatorización que garantice el balanceo en las covariables medibles y no medibles entre el grupo tratamiento y control, y bajo el escenario de trabajar con una muestra probabilística, en este documento, se procedió a usar la técnica de Propensity Score matching con el fin de conformar dos grupos balanceados con los cuales tuviera sentido realizar comparaciones. Posterior a esto se evaluó el efecto del tratamiento utilizando el estimador de diferencias DIF y el de diferencias en diferencias DIFDIF. Se evaluaron diferentes estrategias de estimación cuando se incluyen los pesos de muestreo y se analizó el efecto que puede tener el incorporarlos u omitirlos. Las ponderaciones para el estimador consistieron en la combinación de las probabilidades de inclusión inducidas por el diseño muestral junto a transformaciones de la medida de probabilidad inducida por el propensity score, encontradas en la literatura. Para esto se trabajó bajo un esquema de diseño en dos fases. Los resultados de las simulaciones, así como una aplicación al conjunto de datos del Programa Todos a Aprender (PTA) del Ministerio de Educación en Colombia, mostraron la importancia de usar las combinaciones de pesos muestrales y de propensity score en la reducción del sesgo, ante diferentes tipos de composiciones del soporte común entre los grupos control y tratamiento, diferentes tipos de diseños muestrales y diferentes ajustes del modelo de propensity score. |
publishDate |
2019 |
dc.date.issued.spa.fl_str_mv |
2019-08-24 |
dc.date.accessioned.spa.fl_str_mv |
2020-03-30T06:26:07Z |
dc.date.available.spa.fl_str_mv |
2020-03-30T06:26:07Z |
dc.type.spa.fl_str_mv |
Trabajo de grado - Maestría |
dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
dc.type.content.spa.fl_str_mv |
Text |
dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/TM |
status_str |
acceptedVersion |
dc.identifier.uri.none.fl_str_mv |
https://repositorio.unal.edu.co/handle/unal/76683 |
dc.identifier.eprints.spa.fl_str_mv |
http://bdigital.unal.edu.co/73345/ |
url |
https://repositorio.unal.edu.co/handle/unal/76683 http://bdigital.unal.edu.co/73345/ |
dc.language.iso.spa.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.spa.fl_str_mv |
Universidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Estadística Departamento de Estadística |
dc.relation.haspart.spa.fl_str_mv |
31 Colecciones de estadística general / Statistics |
dc.relation.references.spa.fl_str_mv |
Montaño Rincón, Cristian Fabian (2019) Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching. Maestría thesis, Universidad Nacional de Colombia - Sede Bogotá. |
dc.rights.spa.fl_str_mv |
Derechos reservados - Universidad Nacional de Colombia |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
dc.rights.license.spa.fl_str_mv |
Atribución-NoComercial 4.0 Internacional |
dc.rights.uri.spa.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
eu_rights_str_mv |
openAccess |
dc.format.mimetype.spa.fl_str_mv |
application/pdf |
institution |
Universidad Nacional de Colombia |
bitstream.url.fl_str_mv |
https://repositorio.unal.edu.co/bitstream/unal/76683/1/Tesis_CristianMontano.pdf https://repositorio.unal.edu.co/bitstream/unal/76683/2/Tesis_CristianMontano.pdf.jpg |
bitstream.checksum.fl_str_mv |
32adce70277dc1ae305b67b3a37da90a 6c9aa4dd92ee21f2388d621a1e6ea022 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Colombia |
repository.mail.fl_str_mv |
repositorio_nal@unal.edu.co |
_version_ |
1814089713251778560 |
spelling |
Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Trujillo Oyola, LeonardoMontaño Rincón, Cristian Fabianaf25d28f-e605-4b9e-89a3-3560c8865a753002020-03-30T06:26:07Z2020-03-30T06:26:07Z2019-08-24https://repositorio.unal.edu.co/handle/unal/76683http://bdigital.unal.edu.co/73345/Las técnicas de inferencia causal aplicadas a la evaluación estadística de los resultados de un experimento o estudio observacional constituyen una herramienta de vital importancia en la toma de decisiones en diferentes campos del saber común. Ejemplos naturales de este tipo de estudios son la evaluación del impacto de alguna intervención política o programa por parte del gobierno, o cuando se quiere evaluar el efecto de un nuevo tratamiento médico, entre otros tipos de estudios. Sin embargo, es común enfrentarse a problemas económicos, éticos o logísticos que restringen la posibilidad de asignar unidades a los tratamientos de manera estrictamente aleatoria (estudios cuasi-experimentales). Adicionalmente, en muchas ocasiones no existe la posibilidad de medir pos-tratamiento a todas las unidades en el estudio; razón por la cual es necesario realizar la selección de una muestra probabilística que en algunos casos utilizan diseños muestrales complejos con probabilidades de inclusión desiguales. Suponiendo ausencia de un proceso de aleatorización que garantice el balanceo en las covariables medibles y no medibles entre el grupo tratamiento y control, y bajo el escenario de trabajar con una muestra probabilística, en este documento, se procedió a usar la técnica de Propensity Score matching con el fin de conformar dos grupos balanceados con los cuales tuviera sentido realizar comparaciones. Posterior a esto se evaluó el efecto del tratamiento utilizando el estimador de diferencias DIF y el de diferencias en diferencias DIFDIF. Se evaluaron diferentes estrategias de estimación cuando se incluyen los pesos de muestreo y se analizó el efecto que puede tener el incorporarlos u omitirlos. Las ponderaciones para el estimador consistieron en la combinación de las probabilidades de inclusión inducidas por el diseño muestral junto a transformaciones de la medida de probabilidad inducida por el propensity score, encontradas en la literatura. Para esto se trabajó bajo un esquema de diseño en dos fases. Los resultados de las simulaciones, así como una aplicación al conjunto de datos del Programa Todos a Aprender (PTA) del Ministerio de Educación en Colombia, mostraron la importancia de usar las combinaciones de pesos muestrales y de propensity score en la reducción del sesgo, ante diferentes tipos de composiciones del soporte común entre los grupos control y tratamiento, diferentes tipos de diseños muestrales y diferentes ajustes del modelo de propensity score.Abstract: Causal inference techniques applied to the statistical evaluation of the results of an experiment or an observational study constitutes a tool of vital importance when taking a decision in several fields of knowledge. Natural examples of these types of studies are analyzing of the impact for some public policy, program or intervention by the government; also when you want to evaluate the effect of a new medical treatment, and among others. However, in the practice, there are economic, ethic or logistic problems which makes difficult to assign units to treatments in a random way (quasi-experimental methodologies). In several occasions, when people want to evaluate these results there is not a possibility to measure the whole set of units in the population; then, it is necessary to draw a probabilistic sample which in the most of the cases is selected by complex sampling designs with unequal inclusion probabilities. Assuming the absence of a randomization process that guarantees the balance for measurable and non-measurable covariates between the treatment and control group, when a probabilistic sample was selected, the Propensity Score Matching technique was used in this document in order to get two balanced groups for the purpose of making comparisons. After this, the treatment effect was evaluated using the difference estimator DIF and the differences in differences estimator DIFDIF. Different estimation strategies were evaluated when the sample weights were included; furthermore, the effect of ignoring these weights was analyzed. The weights for the estimator consisted in the combination of inclusion probabilities induced by the sample design and a transformation of the probability measure induced by the propensity score, these transformations were found in different papers. In order to develop this, it was necessary to follow a scheme in two phase sampling. Simulation results, as well as an application to actual data from the Todos a Aprender Program (PTA in Spanish, it translates Everybody to Learn) of the Colombian Ministry of Education, show the importance of using both sampling and propensity score weights in order to reduce the bias, according to different types of compositions for the common support between control and treatment groups, different sampling designs and different propensity score models.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de EstadísticaDepartamento de Estadística31 Colecciones de estadística general / StatisticsMontaño Rincón, Cristian Fabian (2019) Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching. Maestría thesis, Universidad Nacional de Colombia - Sede Bogotá.Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score MatchingTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMEstudios observacionalesDiseños muestralesPropensity score matchingMuestreo en dos fasesObservational studiesSampling designsPropensity score matchingTwo phase samplingORIGINALTesis_CristianMontano.pdfapplication/pdf955404https://repositorio.unal.edu.co/bitstream/unal/76683/1/Tesis_CristianMontano.pdf32adce70277dc1ae305b67b3a37da90aMD51THUMBNAILTesis_CristianMontano.pdf.jpgTesis_CristianMontano.pdf.jpgGenerated Thumbnailimage/jpeg4358https://repositorio.unal.edu.co/bitstream/unal/76683/2/Tesis_CristianMontano.pdf.jpg6c9aa4dd92ee21f2388d621a1e6ea022MD52unal/76683oai:repositorio.unal.edu.co:unal/766832024-07-14 01:06:00.052Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co |