Three similarity measures between one-dimensional data sets
Basadas en una distancia intervalar, se dan tres funciones para cuantificarsimilaridades entre conjuntos de datos unidimensionales mediante el uso deestadísticos de primer orden. Se usa la base de datos Glass Identificationpara ilustrar cómo esas medidas de similaridad se pueden usar para analizarun...
- Autores:
-
Gavilan, Jose M.
Morente, Francisco Velasco
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2014
- Institución:
- Universidad Nacional de Colombia
- Repositorio:
- Universidad Nacional de Colombia
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unal.edu.co:unal/49094
- Acceso en línea:
- https://repositorio.unal.edu.co/handle/unal/49094
http://bdigital.unal.edu.co/42551/
- Palabra clave:
- distancia entre intervalos
métodos del núcleo
minería de datos
tests no paramétricos
- Rights
- closedAccess
- License
- Atribución-NoComercial 4.0 Internacional
Summary: | Basadas en una distancia intervalar, se dan tres funciones para cuantificarsimilaridades entre conjuntos de datos unidimensionales mediante el uso deestadísticos de primer orden. Se usa la base de datos Glass Identificationpara ilustrar cómo esas medidas de similaridad se pueden usar para analizarun conjunto de datos antes de su clasificación y/o para excluir dimensiones.Además, se diseña un test de hipótesis no parámetrico para mostrar cómosimilaridad, basadas en muestras aleatorias de dos poblaciones, se puedenusar para decidir si esas poblaciones son idénticas. También se realizan dosanálisis comparativos con un test paramétrico y un test no paramétrico.Este nuevo test se comporta razonablemente bien en comparación con testclásicos. |
---|