Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching

Las técnicas de inferencia causal aplicadas a la evaluación estadística de los resultados de un experimento o estudio observacional constituyen una herramienta de vital importancia en la toma de decisiones en diferentes campos del saber común. Ejemplos naturales de este tipo de estudios son la evalu...

Full description

Autores:: Montaño Rincón, Cristian Fabian

Tipo de recurso:

Fecha de publicación:: 2019

Institución:: Universidad Nacional de Colombia

Repositorio:: Universidad Nacional de Colombia

Idioma:: spa

id	UNACIONAL2_b91586b2cd142962edfcf81b95bda971
oai_identifier_str	oai:repositorio.unal.edu.co:unal/76683
network_acronym_str	UNACIONAL2
network_name_str	Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv	Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title	Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
spellingShingle	Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching Estudios observacionales Diseños muestrales Propensity score matching Muestreo en dos fases Observational studies Sampling designs Propensity score matching Two phase sampling
title_short	Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title_full	Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title_fullStr	Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title_full_unstemmed	Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
title_sort	Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching
dc.creator.fl_str_mv	Montaño Rincón, Cristian Fabian
dc.contributor.author.spa.fl_str_mv	Montaño Rincón, Cristian Fabian
dc.contributor.spa.fl_str_mv	Trujillo Oyola, Leonardo
dc.subject.proposal.spa.fl_str_mv	Estudios observacionales Diseños muestrales Propensity score matching Muestreo en dos fases Observational studies Sampling designs Propensity score matching Two phase sampling
topic	Estudios observacionales Diseños muestrales Propensity score matching Muestreo en dos fases Observational studies Sampling designs Propensity score matching Two phase sampling
description	Las técnicas de inferencia causal aplicadas a la evaluación estadística de los resultados de un experimento o estudio observacional constituyen una herramienta de vital importancia en la toma de decisiones en diferentes campos del saber común. Ejemplos naturales de este tipo de estudios son la evaluación del impacto de alguna intervención política o programa por parte del gobierno, o cuando se quiere evaluar el efecto de un nuevo tratamiento médico, entre otros tipos de estudios. Sin embargo, es común enfrentarse a problemas económicos, éticos o logísticos que restringen la posibilidad de asignar unidades a los tratamientos de manera estrictamente aleatoria (estudios cuasi-experimentales). Adicionalmente, en muchas ocasiones no existe la posibilidad de medir pos-tratamiento a todas las unidades en el estudio; razón por la cual es necesario realizar la selección de una muestra probabilística que en algunos casos utilizan diseños muestrales complejos con probabilidades de inclusión desiguales. Suponiendo ausencia de un proceso de aleatorización que garantice el balanceo en las covariables medibles y no medibles entre el grupo tratamiento y control, y bajo el escenario de trabajar con una muestra probabilística, en este documento, se procedió a usar la técnica de Propensity Score matching con el fin de conformar dos grupos balanceados con los cuales tuviera sentido realizar comparaciones. Posterior a esto se evaluó el efecto del tratamiento utilizando el estimador de diferencias DIF y el de diferencias en diferencias DIFDIF. Se evaluaron diferentes estrategias de estimación cuando se incluyen los pesos de muestreo y se analizó el efecto que puede tener el incorporarlos u omitirlos. Las ponderaciones para el estimador consistieron en la combinación de las probabilidades de inclusión inducidas por el diseño muestral junto a transformaciones de la medida de probabilidad inducida por el propensity score, encontradas en la literatura. Para esto se trabajó bajo un esquema de diseño en dos fases. Los resultados de las simulaciones, así como una aplicación al conjunto de datos del Programa Todos a Aprender (PTA) del Ministerio de Educación en Colombia, mostraron la importancia de usar las combinaciones de pesos muestrales y de propensity score en la reducción del sesgo, ante diferentes tipos de composiciones del soporte común entre los grupos control y tratamiento, diferentes tipos de diseños muestrales y diferentes ajustes del modelo de propensity score.
publishDate	2019
dc.date.issued.spa.fl_str_mv	2019-08-24
dc.date.accessioned.spa.fl_str_mv	2020-03-30T06:26:07Z
dc.date.available.spa.fl_str_mv	2020-03-30T06:26:07Z
dc.type.spa.fl_str_mv	Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv	info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv	info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv	Text
dc.type.redcol.spa.fl_str_mv	http://purl.org/redcol/resource_type/TM
status_str	acceptedVersion
dc.identifier.uri.none.fl_str_mv	https://repositorio.unal.edu.co/handle/unal/76683
dc.identifier.eprints.spa.fl_str_mv	http://bdigital.unal.edu.co/73345/
url	https://repositorio.unal.edu.co/handle/unal/76683 http://bdigital.unal.edu.co/73345/
dc.language.iso.spa.fl_str_mv	spa
language	spa
dc.relation.ispartof.spa.fl_str_mv	Universidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Estadística Departamento de Estadística
dc.relation.haspart.spa.fl_str_mv	31 Colecciones de estadística general / Statistics
dc.relation.references.spa.fl_str_mv	Montaño Rincón, Cristian Fabian (2019) Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching. Maestría thesis, Universidad Nacional de Colombia - Sede Bogotá.
dc.rights.spa.fl_str_mv	Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv	http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv	Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv	http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv	info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Atribución-NoComercial 4.0 Internacional Derechos reservados - Universidad Nacional de Colombia http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv	openAccess
dc.format.mimetype.spa.fl_str_mv	application/pdf
institution	Universidad Nacional de Colombia
bitstream.url.fl_str_mv	https://repositorio.unal.edu.co/bitstream/unal/76683/1/Tesis_CristianMontano.pdf https://repositorio.unal.edu.co/bitstream/unal/76683/2/Tesis_CristianMontano.pdf.jpg
bitstream.checksum.fl_str_mv	32adce70277dc1ae305b67b3a37da90a 6c9aa4dd92ee21f2388d621a1e6ea022
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv	repositorio_nal@unal.edu.co
_version_	1814089713251778560
spelling	Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Trujillo Oyola, LeonardoMontaño Rincón, Cristian Fabianaf25d28f-e605-4b9e-89a3-3560c8865a753002020-03-30T06:26:07Z2020-03-30T06:26:07Z2019-08-24https://repositorio.unal.edu.co/handle/unal/76683http://bdigital.unal.edu.co/73345/Las técnicas de inferencia causal aplicadas a la evaluación estadística de los resultados de un experimento o estudio observacional constituyen una herramienta de vital importancia en la toma de decisiones en diferentes campos del saber común. Ejemplos naturales de este tipo de estudios son la evaluación del impacto de alguna intervención política o programa por parte del gobierno, o cuando se quiere evaluar el efecto de un nuevo tratamiento médico, entre otros tipos de estudios. Sin embargo, es común enfrentarse a problemas económicos, éticos o logísticos que restringen la posibilidad de asignar unidades a los tratamientos de manera estrictamente aleatoria (estudios cuasi-experimentales). Adicionalmente, en muchas ocasiones no existe la posibilidad de medir pos-tratamiento a todas las unidades en el estudio; razón por la cual es necesario realizar la selección de una muestra probabilística que en algunos casos utilizan diseños muestrales complejos con probabilidades de inclusión desiguales. Suponiendo ausencia de un proceso de aleatorización que garantice el balanceo en las covariables medibles y no medibles entre el grupo tratamiento y control, y bajo el escenario de trabajar con una muestra probabilística, en este documento, se procedió a usar la técnica de Propensity Score matching con el fin de conformar dos grupos balanceados con los cuales tuviera sentido realizar comparaciones. Posterior a esto se evaluó el efecto del tratamiento utilizando el estimador de diferencias DIF y el de diferencias en diferencias DIFDIF. Se evaluaron diferentes estrategias de estimación cuando se incluyen los pesos de muestreo y se analizó el efecto que puede tener el incorporarlos u omitirlos. Las ponderaciones para el estimador consistieron en la combinación de las probabilidades de inclusión inducidas por el diseño muestral junto a transformaciones de la medida de probabilidad inducida por el propensity score, encontradas en la literatura. Para esto se trabajó bajo un esquema de diseño en dos fases. Los resultados de las simulaciones, así como una aplicación al conjunto de datos del Programa Todos a Aprender (PTA) del Ministerio de Educación en Colombia, mostraron la importancia de usar las combinaciones de pesos muestrales y de propensity score en la reducción del sesgo, ante diferentes tipos de composiciones del soporte común entre los grupos control y tratamiento, diferentes tipos de diseños muestrales y diferentes ajustes del modelo de propensity score.Abstract: Causal inference techniques applied to the statistical evaluation of the results of an experiment or an observational study constitutes a tool of vital importance when taking a decision in several fields of knowledge. Natural examples of these types of studies are analyzing of the impact for some public policy, program or intervention by the government; also when you want to evaluate the effect of a new medical treatment, and among others. However, in the practice, there are economic, ethic or logistic problems which makes difficult to assign units to treatments in a random way (quasi-experimental methodologies). In several occasions, when people want to evaluate these results there is not a possibility to measure the whole set of units in the population; then, it is necessary to draw a probabilistic sample which in the most of the cases is selected by complex sampling designs with unequal inclusion probabilities. Assuming the absence of a randomization process that guarantees the balance for measurable and non-measurable covariates between the treatment and control group, when a probabilistic sample was selected, the Propensity Score Matching technique was used in this document in order to get two balanced groups for the purpose of making comparisons. After this, the treatment effect was evaluated using the difference estimator DIF and the differences in differences estimator DIFDIF. Different estimation strategies were evaluated when the sample weights were included; furthermore, the effect of ignoring these weights was analyzed. The weights for the estimator consisted in the combination of inclusion probabilities induced by the sample design and a transformation of the probability measure induced by the propensity score, these transformations were found in different papers. In order to develop this, it was necessary to follow a scheme in two phase sampling. Simulation results, as well as an application to actual data from the Todos a Aprender Program (PTA in Spanish, it translates Everybody to Learn) of the Colombian Ministry of Education, show the importance of using both sampling and propensity score weights in order to reduce the bias, according to different types of compositions for the common support between control and treatment groups, different sampling designs and different propensity score models.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de EstadísticaDepartamento de Estadística31 Colecciones de estadística general / StatisticsMontaño Rincón, Cristian Fabian (2019) Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching. Maestría thesis, Universidad Nacional de Colombia - Sede Bogotá.Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score MatchingTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMEstudios observacionalesDiseños muestralesPropensity score matchingMuestreo en dos fasesObservational studiesSampling designsPropensity score matchingTwo phase samplingORIGINALTesis_CristianMontano.pdfapplication/pdf955404https://repositorio.unal.edu.co/bitstream/unal/76683/1/Tesis_CristianMontano.pdf32adce70277dc1ae305b67b3a37da90aMD51THUMBNAILTesis_CristianMontano.pdf.jpgTesis_CristianMontano.pdf.jpgGenerated Thumbnailimage/jpeg4358https://repositorio.unal.edu.co/bitstream/unal/76683/2/Tesis_CristianMontano.pdf.jpg6c9aa4dd92ee21f2388d621a1e6ea022MD52unal/76683oai:repositorio.unal.edu.co:unal/766832024-07-14 01:06:00.052Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co

Estimación de efectos causales usando inferencia basada en el diseño para estudios observacionales que utilizan Propensity Score Matching

Publicaciones similares