Árboles de contraste y contrast boosting

En este trabajo se estudian la estructura y algunas de las principales aplicaciones de los árboles de contraste y el contrast boosting, introducidos por Friedman (2020). Adicionalmente, se evalúa el desempeño del contrast boosting en problemas de estimación de probabilidades condicionales y estimaci...

Full description

Autores:
Mosquera Brito, Joaquín Esteban
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
spa
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/74525
Acceso en línea:
https://hdl.handle.net/1992/74525
Palabra clave:
Estadística
Estimación no paramétrica
Clasificación binaria
Árboles de contraste
Probabilidad
Boosting
Bootstrap
Matemáticas
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
id UNIANDES2_52b5b53791707738d46b8d73ca503c00
oai_identifier_str oai:repositorio.uniandes.edu.co:1992/74525
network_acronym_str UNIANDES2
network_name_str Séneca: repositorio Uniandes
repository_id_str
dc.title.spa.fl_str_mv Árboles de contraste y contrast boosting
title Árboles de contraste y contrast boosting
spellingShingle Árboles de contraste y contrast boosting
Estadística
Estimación no paramétrica
Clasificación binaria
Árboles de contraste
Probabilidad
Boosting
Bootstrap
Matemáticas
title_short Árboles de contraste y contrast boosting
title_full Árboles de contraste y contrast boosting
title_fullStr Árboles de contraste y contrast boosting
title_full_unstemmed Árboles de contraste y contrast boosting
title_sort Árboles de contraste y contrast boosting
dc.creator.fl_str_mv Mosquera Brito, Joaquín Esteban
dc.contributor.advisor.none.fl_str_mv Quiroz Salazar, Adolfo José
dc.contributor.author.none.fl_str_mv Mosquera Brito, Joaquín Esteban
dc.contributor.jury.none.fl_str_mv Hoegele, Michael Anton
dc.subject.keyword.spa.fl_str_mv Estadística
Estimación no paramétrica
Clasificación binaria
Árboles de contraste
Probabilidad
topic Estadística
Estimación no paramétrica
Clasificación binaria
Árboles de contraste
Probabilidad
Boosting
Bootstrap
Matemáticas
dc.subject.keyword.none.fl_str_mv Boosting
Bootstrap
dc.subject.themes.spa.fl_str_mv Matemáticas
description En este trabajo se estudian la estructura y algunas de las principales aplicaciones de los árboles de contraste y el contrast boosting, introducidos por Friedman (2020). Adicionalmente, se evalúa el desempeño del contrast boosting en problemas de estimación de probabilidades condicionales y estimación de distribuciones condicionales, mediante experimentos controlados que consisten en simulaciones en las que se conoce el estado de la naturaleza. Finalmente, se estudia el algoritmo propuesto por Turnbull (1976) para estimar la función de distribución acumulativa empírica de una variable aleatoria real a partir de datos truncados y censurados, y se explica cómo este algoritmo permite utilizar contrast boosting para estimar distribuciones condicionales a partir de datos truncados y censurados.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-07-15T12:37:38Z
dc.date.available.none.fl_str_mv 2024-07-15T12:37:38Z
dc.date.issued.none.fl_str_mv 2024-05-31
dc.type.none.fl_str_mv Trabajo de grado - Pregrado
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.none.fl_str_mv Text
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/1992/74525
dc.identifier.instname.none.fl_str_mv instname:Universidad de los Andes
dc.identifier.reponame.none.fl_str_mv reponame:Repositorio Institucional Séneca
dc.identifier.repourl.none.fl_str_mv repourl:https://repositorio.uniandes.edu.co/
url https://hdl.handle.net/1992/74525
identifier_str_mv instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
repourl:https://repositorio.uniandes.edu.co/
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.references.none.fl_str_mv Breiman, L., Friedman, J., Stone, C., y Olshen, R. (1984). Classification and Regression Trees. Taylor & Francis.
Devroye, L., Györfi, L., y Lugosi, G. (1997). A Probabilistic Theory of Pattern Recognition. Stochastic Modelling and Applied Probability. Springer New York.
Efron, B. y Tibshirani, R. (1994). An Introduction to the Bootstrap. Chapman & Hall/CRC Monographs on Statistics & Applied Probability. Taylor & Francis.
Friedman, J. y Narasimhan, B. (2023). conTree: Contrast Trees and Boosting. R package version 0.3-1.
Friedman, J. H. (2001). Greedy function approximation: A gradient boosting machine. The Annals of Statistics, 29(5):1189–1232.
Friedman, J. H. (2020). Contrast trees and distribution boosting. Proceedings of the National Academy of Sciences, 117(35):21175–21184.
Turnbull, B. W. (1976). The empirical distribution function with arbitrarily grouped, censored and truncated data. Journal of the Royal Statistical Society. Series B (Methodological), 38(3):290–295.
dc.rights.uri.none.fl_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.none.fl_str_mv 42 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de los Andes
dc.publisher.program.none.fl_str_mv Matemáticas
dc.publisher.faculty.none.fl_str_mv Facultad de Ciencias
dc.publisher.department.none.fl_str_mv Departamento de Matemáticas
publisher.none.fl_str_mv Universidad de los Andes
institution Universidad de los Andes
bitstream.url.fl_str_mv https://repositorio.uniandes.edu.co/bitstreams/f266a094-96b0-4ab8-8128-57d31d8c9458/download
https://repositorio.uniandes.edu.co/bitstreams/1fb148fe-8f1d-4a11-9646-36ad36fe6f6b/download
https://repositorio.uniandes.edu.co/bitstreams/dac7ebe1-613d-4a83-9c25-96a7912a0c57/download
https://repositorio.uniandes.edu.co/bitstreams/49c65294-5d18-4327-bdf6-6c2da39bace0/download
https://repositorio.uniandes.edu.co/bitstreams/0eb4e360-11f9-4686-b587-ab54a6fbac28/download
https://repositorio.uniandes.edu.co/bitstreams/52dfe2dd-d8a1-4b48-88cd-b9ec6ff8814e/download
https://repositorio.uniandes.edu.co/bitstreams/a99a671c-45b4-4fe7-8fc3-9c32656ae401/download
bitstream.checksum.fl_str_mv c5fed4ad0443a9d50086e48f2310a545
c06c5bb87eb3fc0a6b2475ff480c9260
ae9e573a68e7f92501b6913cc846c39f
4754318e91bb985fed92c02405b0d798
f04b6fbf062483674178332dfbf44cc4
b92e40334ff15f1b2e25717367b703c4
a6dc26524205d0c583c66613368e6f8a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional Séneca
repository.mail.fl_str_mv adminrepositorio@uniandes.edu.co
_version_ 1812134045363994624
spelling Quiroz Salazar, Adolfo Josévirtual::18598-1Mosquera Brito, Joaquín EstebanHoegele, Michael Antonvirtual::18793-12024-07-15T12:37:38Z2024-07-15T12:37:38Z2024-05-31https://hdl.handle.net/1992/74525instname:Universidad de los Andesreponame:Repositorio Institucional Sénecarepourl:https://repositorio.uniandes.edu.co/En este trabajo se estudian la estructura y algunas de las principales aplicaciones de los árboles de contraste y el contrast boosting, introducidos por Friedman (2020). Adicionalmente, se evalúa el desempeño del contrast boosting en problemas de estimación de probabilidades condicionales y estimación de distribuciones condicionales, mediante experimentos controlados que consisten en simulaciones en las que se conoce el estado de la naturaleza. Finalmente, se estudia el algoritmo propuesto por Turnbull (1976) para estimar la función de distribución acumulativa empírica de una variable aleatoria real a partir de datos truncados y censurados, y se explica cómo este algoritmo permite utilizar contrast boosting para estimar distribuciones condicionales a partir de datos truncados y censurados.Pregrado42 páginasapplication/pdfspaUniversidad de los AndesMatemáticasFacultad de CienciasDepartamento de Matemáticashttps://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfinfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Árboles de contraste y contrast boostingTrabajo de grado - Pregradoinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1fTexthttp://purl.org/redcol/resource_type/TPEstadísticaEstimación no paramétricaClasificación binariaÁrboles de contrasteProbabilidadBoostingBootstrapMatemáticasBreiman, L., Friedman, J., Stone, C., y Olshen, R. (1984). Classification and Regression Trees. Taylor & Francis.Devroye, L., Györfi, L., y Lugosi, G. (1997). A Probabilistic Theory of Pattern Recognition. Stochastic Modelling and Applied Probability. Springer New York.Efron, B. y Tibshirani, R. (1994). An Introduction to the Bootstrap. Chapman & Hall/CRC Monographs on Statistics & Applied Probability. Taylor & Francis.Friedman, J. y Narasimhan, B. (2023). conTree: Contrast Trees and Boosting. R package version 0.3-1.Friedman, J. H. (2001). Greedy function approximation: A gradient boosting machine. The Annals of Statistics, 29(5):1189–1232.Friedman, J. H. (2020). Contrast trees and distribution boosting. Proceedings of the National Academy of Sciences, 117(35):21175–21184.Turnbull, B. W. (1976). The empirical distribution function with arbitrarily grouped, censored and truncated data. Journal of the Royal Statistical Society. Series B (Methodological), 38(3):290–295.202014585Publicationhttps://scholar.google.es/citations?user=qwMDh-4AAAAJvirtual::18598-10000-0003-4033-3400virtual::18598-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001497101virtual::18598-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001632250virtual::18793-1https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001632250https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=00016322501be19e5b-39c2-4d92-b44f-b9b4a48991cavirtual::18598-11be19e5b-39c2-4d92-b44f-b9b4a48991cavirtual::18598-1ec8a37d7-ebef-44bf-823c-e5eed39e7600virtual::18793-1ec8a37d7-ebef-44bf-823c-e5eed39e7600ec8a37d7-ebef-44bf-823c-e5eed39e7600ec8a37d7-ebef-44bf-823c-e5eed39e7600virtual::18793-1ORIGINALÁrboles de contraste y contrast boosting.pdfÁrboles de contraste y contrast boosting.pdfapplication/pdf560000https://repositorio.uniandes.edu.co/bitstreams/f266a094-96b0-4ab8-8128-57d31d8c9458/downloadc5fed4ad0443a9d50086e48f2310a545MD51autorizacion tesis.pdfautorizacion tesis.pdfHIDEapplication/pdf276654https://repositorio.uniandes.edu.co/bitstreams/1fb148fe-8f1d-4a11-9646-36ad36fe6f6b/downloadc06c5bb87eb3fc0a6b2475ff480c9260MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82535https://repositorio.uniandes.edu.co/bitstreams/dac7ebe1-613d-4a83-9c25-96a7912a0c57/downloadae9e573a68e7f92501b6913cc846c39fMD53TEXTÁrboles de contraste y contrast boosting.pdf.txtÁrboles de contraste y contrast boosting.pdf.txtExtracted texttext/plain51436https://repositorio.uniandes.edu.co/bitstreams/49c65294-5d18-4327-bdf6-6c2da39bace0/download4754318e91bb985fed92c02405b0d798MD54autorizacion tesis.pdf.txtautorizacion tesis.pdf.txtExtracted texttext/plain2011https://repositorio.uniandes.edu.co/bitstreams/0eb4e360-11f9-4686-b587-ab54a6fbac28/downloadf04b6fbf062483674178332dfbf44cc4MD56THUMBNAILÁrboles de contraste y contrast boosting.pdf.jpgÁrboles de contraste y contrast boosting.pdf.jpgGenerated Thumbnailimage/jpeg6493https://repositorio.uniandes.edu.co/bitstreams/52dfe2dd-d8a1-4b48-88cd-b9ec6ff8814e/downloadb92e40334ff15f1b2e25717367b703c4MD55autorizacion tesis.pdf.jpgautorizacion tesis.pdf.jpgGenerated Thumbnailimage/jpeg11011https://repositorio.uniandes.edu.co/bitstreams/a99a671c-45b4-4fe7-8fc3-9c32656ae401/downloada6dc26524205d0c583c66613368e6f8aMD571992/74525oai:repositorio.uniandes.edu.co:1992/745252024-07-16 03:13:42.208https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdfopen.accesshttps://repositorio.uniandes.edu.coRepositorio institucional Sénecaadminrepositorio@uniandes.edu.coPGgzPjxzdHJvbmc+RGVzY2FyZ28gZGUgUmVzcG9uc2FiaWxpZGFkIC0gTGljZW5jaWEgZGUgQXV0b3JpemFjacOzbjwvc3Ryb25nPjwvaDM+CjxwPjxzdHJvbmc+UG9yIGZhdm9yIGxlZXIgYXRlbnRhbWVudGUgZXN0ZSBkb2N1bWVudG8gcXVlIHBlcm1pdGUgYWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCBTw6luZWNhIHJlcHJvZHVjaXIgeSBkaXN0cmlidWlyIGxvcyByZWN1cnNvcyBkZSBpbmZvcm1hY2nDs24gZGVwb3NpdGFkb3MgbWVkaWFudGUgbGEgYXV0b3JpemFjacOzbiBkZSBsb3Mgc2lndWllbnRlcyB0w6lybWlub3M6PC9zdHJvbmc+PC9wPgo8cD5Db25jZWRhIGxhIGxpY2VuY2lhIGRlIGRlcMOzc2l0byBlc3TDoW5kYXIgc2VsZWNjaW9uYW5kbyBsYSBvcGNpw7NuIDxzdHJvbmc+J0FjZXB0YXIgbG9zIHTDqXJtaW5vcyBhbnRlcmlvcm1lbnRlIGRlc2NyaXRvcyc8L3N0cm9uZz4geSBjb250aW51YXIgZWwgcHJvY2VzbyBkZSBlbnbDrW8gbWVkaWFudGUgZWwgYm90w7NuIDxzdHJvbmc+J1NpZ3VpZW50ZScuPC9zdHJvbmc+PC9wPgo8aHI+CjxwPllvLCBlbiBtaSBjYWxpZGFkIGRlIGF1dG9yIGRlbCB0cmFiYWpvIGRlIHRlc2lzLCBtb25vZ3JhZsOtYSBvIHRyYWJham8gZGUgZ3JhZG8sIGhhZ28gZW50cmVnYSBkZWwgZWplbXBsYXIgcmVzcGVjdGl2byB5IGRlIHN1cyBhbmV4b3MgZGUgc2VyIGVsIGNhc28sIGVuIGZvcm1hdG8gZGlnaXRhbCB5L28gZWxlY3Ryw7NuaWNvIHkgYXV0b3Jpem8gYSBsYSBVbml2ZXJzaWRhZCBkZSBsb3MgQW5kZXMgcGFyYSBxdWUgcmVhbGljZSBsYSBwdWJsaWNhY2nDs24gZW4gZWwgU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBvIGVuIGN1YWxxdWllciBvdHJvIHNpc3RlbWEgbyBiYXNlIGRlIGRhdG9zIHByb3BpbyBvIGFqZW5vIGEgbGEgVW5pdmVyc2lkYWQgeSBwYXJhIHF1ZSBlbiBsb3MgdMOpcm1pbm9zIGVzdGFibGVjaWRvcyBlbiBsYSBMZXkgMjMgZGUgMTk4MiwgTGV5IDQ0IGRlIDE5OTMsIERlY2lzacOzbiBBbmRpbmEgMzUxIGRlIDE5OTMsIERlY3JldG8gNDYwIGRlIDE5OTUgeSBkZW3DoXMgbm9ybWFzIGdlbmVyYWxlcyBzb2JyZSBsYSBtYXRlcmlhLCB1dGlsaWNlIGVuIHRvZGFzIHN1cyBmb3JtYXMsIGxvcyBkZXJlY2hvcyBwYXRyaW1vbmlhbGVzIGRlIHJlcHJvZHVjY2nDs24sIGNvbXVuaWNhY2nDs24gcMO6YmxpY2EsIHRyYW5zZm9ybWFjacOzbiB5IGRpc3RyaWJ1Y2nDs24gKGFscXVpbGVyLCBwcsOpc3RhbW8gcMO6YmxpY28gZSBpbXBvcnRhY2nDs24pIHF1ZSBtZSBjb3JyZXNwb25kZW4gY29tbyBjcmVhZG9yIGRlIGxhIG9icmEgb2JqZXRvIGRlbCBwcmVzZW50ZSBkb2N1bWVudG8uPC9wPgo8cD5MYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGVtaXRlIGVuIGNhbGlkYWQgZGUgYXV0b3IgZGUgbGEgb2JyYSBvYmpldG8gZGVsIHByZXNlbnRlIGRvY3VtZW50byB5IG5vIGNvcnJlc3BvbmRlIGEgY2VzacOzbiBkZSBkZXJlY2hvcywgc2lubyBhIGxhIGF1dG9yaXphY2nDs24gZGUgdXNvIGFjYWTDqW1pY28gZGUgY29uZm9ybWlkYWQgY29uIGxvIGFudGVyaW9ybWVudGUgc2XDsWFsYWRvLiBMYSBwcmVzZW50ZSBhdXRvcml6YWNpw7NuIHNlIGhhY2UgZXh0ZW5zaXZhIG5vIHNvbG8gYSBsYXMgZmFjdWx0YWRlcyB5IGRlcmVjaG9zIGRlIHVzbyBzb2JyZSBsYSBvYnJhIGVuIGZvcm1hdG8gbyBzb3BvcnRlIG1hdGVyaWFsLCBzaW5vIHRhbWJpw6luIHBhcmEgZm9ybWF0byBlbGVjdHLDs25pY28sIHkgZW4gZ2VuZXJhbCBwYXJhIGN1YWxxdWllciBmb3JtYXRvIGNvbm9jaWRvIG8gcG9yIGNvbm9jZXIuPC9wPgo8cD5FbCBhdXRvciwgbWFuaWZpZXN0YSBxdWUgbGEgb2JyYSBvYmpldG8gZGUgbGEgcHJlc2VudGUgYXV0b3JpemFjacOzbiBlcyBvcmlnaW5hbCB5IGxhIHJlYWxpesOzIHNpbiB2aW9sYXIgbyB1c3VycGFyIGRlcmVjaG9zIGRlIGF1dG9yIGRlIHRlcmNlcm9zLCBwb3IgbG8gdGFudG8sIGxhIG9icmEgZXMgZGUgc3UgZXhjbHVzaXZhIGF1dG9yw61hIHkgdGllbmUgbGEgdGl0dWxhcmlkYWQgc29icmUgbGEgbWlzbWEuPC9wPgo8cD5FbiBjYXNvIGRlIHByZXNlbnRhcnNlIGN1YWxxdWllciByZWNsYW1hY2nDs24gbyBhY2Npw7NuIHBvciBwYXJ0ZSBkZSB1biB0ZXJjZXJvIGVuIGN1YW50byBhIGxvcyBkZXJlY2hvcyBkZSBhdXRvciBzb2JyZSBsYSBvYnJhIGVuIGN1ZXN0acOzbiwgZWwgYXV0b3IgYXN1bWlyw6EgdG9kYSBsYSByZXNwb25zYWJpbGlkYWQsIHkgc2FsZHLDoSBkZSBkZWZlbnNhIGRlIGxvcyBkZXJlY2hvcyBhcXXDrSBhdXRvcml6YWRvcywgcGFyYSB0b2RvcyBsb3MgZWZlY3RvcyBsYSBVbml2ZXJzaWRhZCBhY3TDumEgY29tbyB1biB0ZXJjZXJvIGRlIGJ1ZW5hIGZlLjwvcD4KPHA+U2kgdGllbmUgYWxndW5hIGR1ZGEgc29icmUgbGEgbGljZW5jaWEsIHBvciBmYXZvciwgY29udGFjdGUgY29uIGVsIDxhIGhyZWY9Im1haWx0bzpiaWJsaW90ZWNhQHVuaWFuZGVzLmVkdS5jbyIgdGFyZ2V0PSJfYmxhbmsiPkFkbWluaXN0cmFkb3IgZGVsIFNpc3RlbWEuPC9hPjwvcD4K