Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.

A veces, debido a la vergüenza, miedo de tener alguna consecuencia personal como recibir multas, castigo o simplemente porque las personas no quieren revelar su intimidad, los encuestados en un estudio pueden negarse a participar. Por otro lado, algunas personas que responden a la encuesta podrían d...

Full description

Autores:
Mocetón Ramírez, Camilo Andrés
Tipo de recurso:
Fecha de publicación:
2017
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/62299
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/62299
http://bdigital.unal.edu.co/61328/
Palabra clave:
31 Colecciones de estadística general / Statistics
51 Matemáticas / Mathematics
Preguntas sensibles
Respuesta aleatorizada
Modelo aditivo
Anonimato
Diseños muestrales complejos
Sensitive questions
Randomized response
Additive model
Anonymity
Complex survey designs
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_38cbeed2a866be066a2949bedbfd9835
oai_identifier_str oai:repositorio.unal.edu.co:unal/62299
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.
title Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.
spellingShingle Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.
31 Colecciones de estadística general / Statistics
51 Matemáticas / Mathematics
Preguntas sensibles
Respuesta aleatorizada
Modelo aditivo
Anonimato
Diseños muestrales complejos
Sensitive questions
Randomized response
Additive model
Anonymity
Complex survey designs
title_short Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.
title_full Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.
title_fullStr Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.
title_full_unstemmed Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.
title_sort Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.
dc.creator.fl_str_mv Mocetón Ramírez, Camilo Andrés
dc.contributor.author.spa.fl_str_mv Mocetón Ramírez, Camilo Andrés
dc.contributor.spa.fl_str_mv Trujillo Oyola, Leonardo
dc.subject.ddc.spa.fl_str_mv 31 Colecciones de estadística general / Statistics
51 Matemáticas / Mathematics
topic 31 Colecciones de estadística general / Statistics
51 Matemáticas / Mathematics
Preguntas sensibles
Respuesta aleatorizada
Modelo aditivo
Anonimato
Diseños muestrales complejos
Sensitive questions
Randomized response
Additive model
Anonymity
Complex survey designs
dc.subject.proposal.spa.fl_str_mv Preguntas sensibles
Respuesta aleatorizada
Modelo aditivo
Anonimato
Diseños muestrales complejos
Sensitive questions
Randomized response
Additive model
Anonymity
Complex survey designs
description A veces, debido a la vergüenza, miedo de tener alguna consecuencia personal como recibir multas, castigo o simplemente porque las personas no quieren revelar su intimidad, los encuestados en un estudio pueden negarse a participar. Por otro lado, algunas personas que responden a la encuesta podrían dar respuestas falsas a algún tipo específico de preguntas, inclusive en estudios hechos por oficinas nacionales de estadística. Para los investigadores, en particular para los estadísticos, el primer problema se conoce como error de no respuesta y el segundo como sesgo en la respuesta. El acceso a información relacionada con una característica sensible en la población induce estos dos problemas particulares: no respuesta y sesgo en las respuestas proporcionadas. Las dos fuentes de error suelen ser un problema cuando la característica de interés a estimar corresponde a preguntas sensibles relacionadas con fenómenos como opinión sobre el aborto, violencia doméstica, eutanasia, fraude y plagio, ingresos, racismo, preferencias sexuales, evasión de impuestos, consumo de drogas, entre muchos otros. Técnicas de Respuesta Aleatorizada (TRAs) y Técnicas de Conteo de Items (TCIs) son útiles para obtener una respuesta confiable, pero también manteniendo la confidencialidad y el anonimato de los encuestados. En particular, las TRAs son diseñadas, principalmente, para estimar la prevalencia de una pregunta sensible en la población con dos respuestas posibles: sí o no. Este trabajo propone un método alternativo para estimar la prevalencia de una pregunta sensible con tres o mas categorías bajo cualquier diseño muestral complejo. Las propiedades de los estimadores propuestos son estudiadas tanto teóricamente como a través de simulaciones Monte Carlo. Una aplicación real a trabajadores administrativos de la Universidad Nacional de Colombia en Bogotá se muestra con el fin de estimar la prevalencia del acoso sexual entre ellos.
publishDate 2017
dc.date.issued.spa.fl_str_mv 2017-09-08
dc.date.accessioned.spa.fl_str_mv 2019-07-02T20:56:25Z
dc.date.available.spa.fl_str_mv 2019-07-02T20:56:25Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/62299
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/61328/
url https://repositorio.unal.edu.co/handle/unal/62299
http://bdigital.unal.edu.co/61328/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Estadística Estadística
Estadística
dc.relation.references.spa.fl_str_mv Mocetón Ramírez, Camilo Andrés (2017) Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas. Maestría thesis, Universidad Nacional de Colombia - Sede Bogotá.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/62299/1/Thesis.pdf
https://repositorio.unal.edu.co/bitstream/unal/62299/2/Thesis.pdf.jpg
bitstream.checksum.fl_str_mv 663d60c226bd3d3b4bda48381f475ebf
f9d46158e26bcdf3f5bd0e9764aa22e3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814089731755999232
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Trujillo Oyola, LeonardoMocetón Ramírez, Camilo Andrés0da1b10e-36dc-4408-9362-b8bb38474d913002019-07-02T20:56:25Z2019-07-02T20:56:25Z2017-09-08https://repositorio.unal.edu.co/handle/unal/62299http://bdigital.unal.edu.co/61328/A veces, debido a la vergüenza, miedo de tener alguna consecuencia personal como recibir multas, castigo o simplemente porque las personas no quieren revelar su intimidad, los encuestados en un estudio pueden negarse a participar. Por otro lado, algunas personas que responden a la encuesta podrían dar respuestas falsas a algún tipo específico de preguntas, inclusive en estudios hechos por oficinas nacionales de estadística. Para los investigadores, en particular para los estadísticos, el primer problema se conoce como error de no respuesta y el segundo como sesgo en la respuesta. El acceso a información relacionada con una característica sensible en la población induce estos dos problemas particulares: no respuesta y sesgo en las respuestas proporcionadas. Las dos fuentes de error suelen ser un problema cuando la característica de interés a estimar corresponde a preguntas sensibles relacionadas con fenómenos como opinión sobre el aborto, violencia doméstica, eutanasia, fraude y plagio, ingresos, racismo, preferencias sexuales, evasión de impuestos, consumo de drogas, entre muchos otros. Técnicas de Respuesta Aleatorizada (TRAs) y Técnicas de Conteo de Items (TCIs) son útiles para obtener una respuesta confiable, pero también manteniendo la confidencialidad y el anonimato de los encuestados. En particular, las TRAs son diseñadas, principalmente, para estimar la prevalencia de una pregunta sensible en la población con dos respuestas posibles: sí o no. Este trabajo propone un método alternativo para estimar la prevalencia de una pregunta sensible con tres o mas categorías bajo cualquier diseño muestral complejo. Las propiedades de los estimadores propuestos son estudiadas tanto teóricamente como a través de simulaciones Monte Carlo. Una aplicación real a trabajadores administrativos de la Universidad Nacional de Colombia en Bogotá se muestra con el fin de estimar la prevalencia del acoso sexual entre ellos.Abstract: Sometimes due to embarrassment; fear of having any personal consequences as receiving fines, punishment or simply because people does not want to reveal their intimacy, the respondents in a survey can refuse to participate. On the other hand, some people answering the survey could give false answers for some specific type of questions because they do not want to reveal the truth even in surveys from national statistical offices. For researchers and in particular for statisticians, the first problem is known as a nonresponse error and the second one is known as a bias in the response. Accessing information regarding a sensitive characteristic in the population induces these two particular problems: nonresponse and non-truthful answers. The two sources of error frequently appear to be a problem when the characteristic of interest being estimated corresponds to sensitive questions related to phenomena such as abortion, domestic violence, euthanasia, fraud and plagiarism, income, racism, sexual preferences, tax evasion, use of illegal drugs, among many others. Randomized Response Techniques (RRTs) and Item Count Techniques (ICTs) are useful in order to get a trustful answer but also keeping the confidentiality of the respondents. In particular, RRTs are mostly designed in order to estimate the prevalence of a sensitive question in the population with two possible answers: yes or no. This thesis proposes an alternative method in order to estimate the prevalence of a sensitive question with three categories or more under any complex survey design. The properties of the proposed estimators are studied both theoretically and through Monte Carlo simulations. An actual application to the staff in a public university in Bogota is shown in order to estimate the prevalence of sexual harassment among them.Maestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Estadística EstadísticaEstadísticaMocetón Ramírez, Camilo Andrés (2017) Estimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas. Maestría thesis, Universidad Nacional de Colombia - Sede Bogotá.31 Colecciones de estadística general / Statistics51 Matemáticas / MathematicsPreguntas sensiblesRespuesta aleatorizadaModelo aditivoAnonimatoDiseños muestrales complejosSensitive questionsRandomized responseAdditive modelAnonymityComplex survey designsEstimación de la prevalencia de una pregunta sensible multicategórica en poblaciones finitas.Trabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINALThesis.pdfapplication/pdf910676https://repositorio.unal.edu.co/bitstream/unal/62299/1/Thesis.pdf663d60c226bd3d3b4bda48381f475ebfMD51THUMBNAILThesis.pdf.jpgThesis.pdf.jpgGenerated Thumbnailimage/jpeg3975https://repositorio.unal.edu.co/bitstream/unal/62299/2/Thesis.pdf.jpgf9d46158e26bcdf3f5bd0e9764aa22e3MD52unal/62299oai:repositorio.unal.edu.co:unal/622992023-04-16 23:05:21.216Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co