Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español

Con frecuencia datos que deberían estar escritos de forma idéntica no lo están debido a errores ortográficos y tipográficos, variaciones en el orden de las palabras, uso de prefijos y sufijos, entre otros. Las técnicas fonéticas para detección de duplicados no están orientadas al idioma español, lo...

Full description

Autores:
Amón, Iván
Moreno, Francisco
Echeverri, Jaime
Tipo de recurso:
Article of journal
Fecha de publicación:
2012
Institución:
Universidad de Medellín
Repositorio:
Repositorio UDEM
Idioma:
spa
OAI Identifier:
oai:repository.udem.edu.co:11407/943
Acceso en línea:
http://hdl.handle.net/11407/943
Palabra clave:
Limpieza de datos
calidad de datos
detección de duplicados
funciones de similitud
algoritmos fonéticos.
Rights
License
http://creativecommons.org/licenses/by-nc-sa/4.0/