Identifying Sources of Human Trafficking Within Online Escort Advertisements Written in Spanish
El problema de la resolución de entidades de los anuncios de escort en línea ha sido bien estudiado utilizando marcos de extracción de información (IE) con expresiones regulares en inglés para identificar redes de trata de personas. Sin embargo, estas aproximaciones crean características ruidosas, n...
- Autores:
-
Rodríguez Díaz, Paula
- Tipo de recurso:
- Fecha de publicación:
- 2021
- Institución:
- Universidad de los Andes
- Repositorio:
- Séneca: repositorio Uniandes
- Idioma:
- eng
- OAI Identifier:
- oai:repositorio.uniandes.edu.co:1992/53353
- Acceso en línea:
- http://hdl.handle.net/1992/53353
- Palabra clave:
- Trata de personas
Servicios de compañía
Ingeniería
- Rights
- openAccess
- License
- https://repositorio.uniandes.edu.co/static/pdf/aceptacion_uso_es.pdf
Summary: | El problema de la resolución de entidades de los anuncios de escort en línea ha sido bien estudiado utilizando marcos de extracción de información (IE) con expresiones regulares en inglés para identificar redes de trata de personas. Sin embargo, estas aproximaciones crean características ruidosas, no se pueden usar directamente en anuncios de escorts escritos en otros idiomas y requieren de una alta capacidad computacional para realizar comparaciones por pares. Esta tesis propone un proceso de resolución de entidades basado en el aprendizaje por contraste y un modelo de agrupación que es capaz de identificar posibles redes de trata de personas extrayendo grupos de representaciones vectoriales de texto. El modelo propuesto se prueba en anuncios de escorts escritos en español y obtiene un AUC de 0,93 para el marco de aprendizaje por contraste, a partir del cual se puede identificar entidades posiblemente relacionadas con la trata de personas. |
---|