Parameter estimation in mixture models using evolutive algorithms

The mixture models are widely used in cases when there are elements that come from diverse populations, mixed in a superpopulation. i.e. the proportions of expresed genes, and the weight of colombian $100 coins, year 1994. There are two main approaches for the modelling of mixture models: the bayesi...

Full description

Autores:
Romero Ríos, Natalia
Tipo de recurso:
Fecha de publicación:
2015
Institución:
Universidad Nacional de Colombia
Repositorio:
Universidad Nacional de Colombia
Idioma:
spa
OAI Identifier:
oai:repositorio.unal.edu.co:unal/55817
Acceso en línea:
https://repositorio.unal.edu.co/handle/unal/55817
http://bdigital.unal.edu.co/51290/
Palabra clave:
51 Matemáticas / Mathematics
Mixture estimation
Statistics
Data analysis
Mixture data
Mixture estimation
Evolutive algorithms
Genetic algorithms
Estimación de mezclas
Estadística
Análisis de datos
Datos de mezclas
Algoritmos evolutivos
Algoritmos genéticos
Rights
openAccess
License
Atribución-NoComercial 4.0 Internacional
id UNACIONAL2_183fa9a112c253def514316b28e426fa
oai_identifier_str oai:repositorio.unal.edu.co:unal/55817
network_acronym_str UNACIONAL2
network_name_str Universidad Nacional de Colombia
repository_id_str
dc.title.spa.fl_str_mv Parameter estimation in mixture models using evolutive algorithms
title Parameter estimation in mixture models using evolutive algorithms
spellingShingle Parameter estimation in mixture models using evolutive algorithms
51 Matemáticas / Mathematics
Mixture estimation
Statistics
Data analysis
Mixture data
Mixture estimation
Evolutive algorithms
Genetic algorithms
Estimación de mezclas
Estadística
Análisis de datos
Datos de mezclas
Algoritmos evolutivos
Algoritmos genéticos
title_short Parameter estimation in mixture models using evolutive algorithms
title_full Parameter estimation in mixture models using evolutive algorithms
title_fullStr Parameter estimation in mixture models using evolutive algorithms
title_full_unstemmed Parameter estimation in mixture models using evolutive algorithms
title_sort Parameter estimation in mixture models using evolutive algorithms
dc.creator.fl_str_mv Romero Ríos, Natalia
dc.contributor.author.spa.fl_str_mv Romero Ríos, Natalia
dc.contributor.spa.fl_str_mv Correa Morales, Juan Carlos
dc.subject.ddc.spa.fl_str_mv 51 Matemáticas / Mathematics
topic 51 Matemáticas / Mathematics
Mixture estimation
Statistics
Data analysis
Mixture data
Mixture estimation
Evolutive algorithms
Genetic algorithms
Estimación de mezclas
Estadística
Análisis de datos
Datos de mezclas
Algoritmos evolutivos
Algoritmos genéticos
dc.subject.proposal.spa.fl_str_mv Mixture estimation
Statistics
Data analysis
Mixture data
Mixture estimation
Evolutive algorithms
Genetic algorithms
Estimación de mezclas
Estadística
Análisis de datos
Datos de mezclas
Algoritmos evolutivos
Algoritmos genéticos
description The mixture models are widely used in cases when there are elements that come from diverse populations, mixed in a superpopulation. i.e. the proportions of expresed genes, and the weight of colombian $100 coins, year 1994. There are two main approaches for the modelling of mixture models: the bayesian and the clasical method. In the bayesian approach, the data are modelated and fitted to a given distribution, for example, the Dirichlet distribution. Further, the data are clustered for the posterior analysis. The classical method is the maximum likelihood estimation, using the Expectation-Maximization (EM) algorithm. This last method needs, as initial data, the amount of populations and their proportions in the superpopulation. Often, these data are very difficult to know or measure, because of the unknown nature of the problem. For that reason, in this work we propose the use of evolutive algorithms, such as genetic algorithms, simulated annealing and taboo search, to estimate the parameters of the mixture models. We propose an algorithm for the comparison of evolutive and traditional methods, and we illustrate the use of this algorithm with a real application. We found that the evolutive algorithms are a competitive option to estimate the parameters in mixture models in the cases when the populations in the mixture follows a gamma distribution, the weights of the populations in the mixture are even and the sample size is bigger than 100 items. For the mixture of normal distributions and the estimation of the number of populations in a mixture, the traditional method is a better option than the genetic algorithm.
publishDate 2015
dc.date.issued.spa.fl_str_mv 2015-01-10
dc.date.accessioned.spa.fl_str_mv 2019-07-02T11:29:09Z
dc.date.available.spa.fl_str_mv 2019-07-02T11:29:09Z
dc.type.spa.fl_str_mv Trabajo de grado - Maestría
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/acceptedVersion
dc.type.content.spa.fl_str_mv Text
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/TM
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unal.edu.co/handle/unal/55817
dc.identifier.eprints.spa.fl_str_mv http://bdigital.unal.edu.co/51290/
url https://repositorio.unal.edu.co/handle/unal/55817
http://bdigital.unal.edu.co/51290/
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartof.spa.fl_str_mv Universidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de Estadística
Escuela de Estadística
dc.relation.references.spa.fl_str_mv Romero Ríos, Natalia (2015) Parameter estimation in mixture models using evolutive algorithms. Maestría thesis, Universidad Nacional de Colombia - Sede Medellín.
dc.rights.spa.fl_str_mv Derechos reservados - Universidad Nacional de Colombia
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.spa.fl_str_mv Atribución-NoComercial 4.0 Internacional
dc.rights.uri.spa.fl_str_mv http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv Atribución-NoComercial 4.0 Internacional
Derechos reservados - Universidad Nacional de Colombia
http://creativecommons.org/licenses/by-nc/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.mimetype.spa.fl_str_mv application/pdf
institution Universidad Nacional de Colombia
bitstream.url.fl_str_mv https://repositorio.unal.edu.co/bitstream/unal/55817/1/1128414976.2015.pdf
https://repositorio.unal.edu.co/bitstream/unal/55817/2/1128414976.2015.pdf.jpg
bitstream.checksum.fl_str_mv 4ccb112eaa55b73a451ccb4460cdc875
4b45121fd2c48d52388ce829cb9da1cb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad Nacional de Colombia
repository.mail.fl_str_mv repositorio_nal@unal.edu.co
_version_ 1814090007441309696
spelling Atribución-NoComercial 4.0 InternacionalDerechos reservados - Universidad Nacional de Colombiahttp://creativecommons.org/licenses/by-nc/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Correa Morales, Juan CarlosRomero Ríos, Natalia49f6dbf6-8d91-4223-8cb1-30af28ef6f623002019-07-02T11:29:09Z2019-07-02T11:29:09Z2015-01-10https://repositorio.unal.edu.co/handle/unal/55817http://bdigital.unal.edu.co/51290/The mixture models are widely used in cases when there are elements that come from diverse populations, mixed in a superpopulation. i.e. the proportions of expresed genes, and the weight of colombian $100 coins, year 1994. There are two main approaches for the modelling of mixture models: the bayesian and the clasical method. In the bayesian approach, the data are modelated and fitted to a given distribution, for example, the Dirichlet distribution. Further, the data are clustered for the posterior analysis. The classical method is the maximum likelihood estimation, using the Expectation-Maximization (EM) algorithm. This last method needs, as initial data, the amount of populations and their proportions in the superpopulation. Often, these data are very difficult to know or measure, because of the unknown nature of the problem. For that reason, in this work we propose the use of evolutive algorithms, such as genetic algorithms, simulated annealing and taboo search, to estimate the parameters of the mixture models. We propose an algorithm for the comparison of evolutive and traditional methods, and we illustrate the use of this algorithm with a real application. We found that the evolutive algorithms are a competitive option to estimate the parameters in mixture models in the cases when the populations in the mixture follows a gamma distribution, the weights of the populations in the mixture are even and the sample size is bigger than 100 items. For the mixture of normal distributions and the estimation of the number of populations in a mixture, the traditional method is a better option than the genetic algorithm.Resumen: Los modelos de mezclas son ampliamente usados en casos donde se tienen elementos de poblaciones diversas, unidos en una súper población. Como ejemplos de ´estos se encuentran las proporciones de genes expresados y el peso de monedas de COP$100 del año 1994. Para su modelación se han utilizado enfoques bayesianos, donde se utiliza la modelación de los datos y el ajuste a distribuciones, por ejemplo, la Dirichlet para la agrupación de los datos y su posterior análisis. Otro enfoque es el clásico, el cual se basa en la estimación con máxima verosimilitud, usando el algoritmo EM (Expectation - Maximization). Este ´ultimo necesita ´ como datos iniciales la cantidad de poblaciones existentes y sus proporciones, datos que en la vida aplicada muchas veces son desconocidos. Es por esto que se proponen los algoritmos evolutivos, como lo son los algoritmos gen éticos, simulated annealing y búsqueda tabú como métodos que pueden servir para encontrar los parámetros de estimación de los modelos de mezclas. Para el desarrollo de este estudio se desarrolló un algoritmo para la comparación de métodos evolutivos y tradicionales y se incluye un ejemplo de aplicación. Se encontró que los algoritmos evolutivos son una opción competitiva para la estimación de parámetros en distribuciones de mezclas en los casos cuando las poblaciones en la mezcla siguen una distribución gamma, los pesos en las poblaciones son balanceados y el tamaño de muestra es mayor de 100 ítems. Para las mezclas de distribuciones normales y la estimación del número de poblaciones en una mezcla, el método tradicional es una mejor opción que el algoritmo gen éticoMaestríaapplication/pdfspaUniversidad Nacional de Colombia Sede Medellín Facultad de Ciencias Escuela de EstadísticaEscuela de EstadísticaRomero Ríos, Natalia (2015) Parameter estimation in mixture models using evolutive algorithms. Maestría thesis, Universidad Nacional de Colombia - Sede Medellín.51 Matemáticas / MathematicsMixture estimationStatisticsData analysisMixture dataMixture estimationEvolutive algorithmsGenetic algorithmsEstimación de mezclasEstadísticaAnálisis de datosDatos de mezclasAlgoritmos evolutivosAlgoritmos genéticosParameter estimation in mixture models using evolutive algorithmsTrabajo de grado - Maestríainfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTexthttp://purl.org/redcol/resource_type/TMORIGINAL1128414976.2015.pdfTesis de Maestría en Ciencias - Estadísticaapplication/pdf1030047https://repositorio.unal.edu.co/bitstream/unal/55817/1/1128414976.2015.pdf4ccb112eaa55b73a451ccb4460cdc875MD51THUMBNAIL1128414976.2015.pdf.jpg1128414976.2015.pdf.jpgGenerated Thumbnailimage/jpeg3469https://repositorio.unal.edu.co/bitstream/unal/55817/2/1128414976.2015.pdf.jpg4b45121fd2c48d52388ce829cb9da1cbMD52unal/55817oai:repositorio.unal.edu.co:unal/558172024-03-20 23:10:46.976Repositorio Institucional Universidad Nacional de Colombiarepositorio_nal@unal.edu.co