Identifying Sources of Human Trafficking Within Online Escort Advertisements Written in Spanish

El problema de la resolución de entidades de los anuncios de escort en línea ha sido bien estudiado utilizando marcos de extracción de información (IE) con expresiones regulares en inglés para identificar redes de trata de personas. Sin embargo, estas aproximaciones crean características ruidosas, n...

Full description

Autores:
Rodríguez Díaz, Paula
Tipo de recurso:
Fecha de publicación:
2021
Institución:
Universidad de los Andes
Repositorio:
Séneca: repositorio Uniandes
Idioma:
eng
OAI Identifier:
oai:repositorio.uniandes.edu.co:1992/53353
Acceso en línea:
http://hdl.handle.net/1992/53353
Palabra clave:
Trata de personas
Servicios de compañía
Ingeniería
Rights
openAccess
License
https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
Description
Summary:El problema de la resolución de entidades de los anuncios de escort en línea ha sido bien estudiado utilizando marcos de extracción de información (IE) con expresiones regulares en inglés para identificar redes de trata de personas. Sin embargo, estas aproximaciones crean características ruidosas, no se pueden usar directamente en anuncios de escorts escritos en otros idiomas y requieren de una alta capacidad computacional para realizar comparaciones por pares. Esta tesis propone un proceso de resolución de entidades basado en el aprendizaje por contraste y un modelo de agrupación que es capaz de identificar posibles redes de trata de personas extrayendo grupos de representaciones vectoriales de texto. El modelo propuesto se prueba en anuncios de escorts escritos en español y obtiene un AUC de 0,93 para el marco de aprendizaje por contraste, a partir del cual se puede identificar entidades posiblemente relacionadas con la trata de personas.