Extracción de contexto geográfico a partir de NLP para información de tránsito en redes sociales

Poco se ha hablado de la recuperación de información espacial de texto, en particular porque el termino “información espacial” se asocia con geometrías en forma de vectores o información de tipo raster que expresan distintas variables o fenómenos acompañados de coordenadas, pese a esto la extracción...

Full description

Autores:
Tipo de recurso:
Fecha de publicación:
2022
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
spa
OAI Identifier:
oai:repository.udistrital.edu.co:11349/33152
Acceso en línea:
http://hdl.handle.net/11349/33152
Palabra clave:
Gazzetters
Recuperación de información
Datos espaciales
Procesamiento natural del lenguaje
Máquinas de soporte vectorial
Geo codificación
Análisis espacial
Inteligencia artificial
Maestría en Ciencias de la Información y las Comunicaciones -- Tesis y disertaciones académicas
Lingüística computacional
Procesamiento natural del lenguaje
Análisis espacial (Estadística)
Inteligencia artificial
Máquinas de vectores de soporte
Recuperación de información
Recuperación de información
Spatial data
Natural language processing
Support vector machines
Geo coding
Spatial analysis
Artificial intelligence
Rights
License
CC0 1.0 Universal
Description
Summary:Poco se ha hablado de la recuperación de información espacial de texto, en particular porque el termino “información espacial” se asocia con geometrías en forma de vectores o información de tipo raster que expresan distintas variables o fenómenos acompañados de coordenadas, pese a esto la extracción de información en texto se presenta como uno de los avances más prometedores gracias al procesamiento natural del lenguaje (NLP) y en este caso se perfila como un nuevo campo de acción complementario al análisis espacial intentando extraer un evento especifico que sucede en el espacio y se plasmó en un texto. La fuente principal de texto, para esta investigación, son los compartidos en una red de colaboración como twitter, Los eventos extraídos son los que se encuentran o hacen referencia a la malla vial y que afectan la movilidad de forma recurrente o aleatoria, este último, el aleatorio, el más difícil de manejar en una ciudad cualquiera que debe monitorear el tránsito de actores viales bajo una red de sensores que intentan ver la congestión de las vías e incidencias viales. Ahora bien, estos textos fueron almacenados bajo un esquema de base de datos clasificados como incidencia vial que se pasan sobre un reconocedor de patrones de escritura que extrae la localización y posteriormente alimenta un georreferenciador que devuelve un par de coordenadas (lat, lon), la idea con estas coordenadas es convertirlas en datos compilados que dentro de un análisis espacial muestren un fenómeno de agrupamiento bajo técnicas geoestadisticas como la autocorrelación espacial, encontrando puntos calientes o puntos fríos de existencia de incidentes. Los resultados geográficamente definidos se comparan con datos de años recientes levantados por entidades oficiales de tránsito y que son publicados para el acceso libre, la comparación de patrones entre un año anterior y los extraídos con inteligencia artificial muestran comportamientos espaciales similares y la auto correlación espacial conserva cierta similitud dejando ver la utilidad de la extracción de foco geográfico que se plantea y posible complemento a fuente de datos para el manejo de la congestión vial e incidencias de tránsito.