Herramienta computacional para la traducción de la lengua de señas colombiana a texto

Según los resultados reflejados en el estudio más reciente del Instituto Nacional para Sordos (INSOR), se plantea que en Colombia no se cuenta con las suficientes herramientas políticas e institucionales para garantizar una adecuada inclusión en ámbitos laborales y académicos de aquellos que padecen...

Full description

Autores:
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
spa
OAI Identifier:
oai:repository.udistrital.edu.co:11349/30319
Acceso en línea:
http://hdl.handle.net/11349/30319
Palabra clave:
Aprendizaje profundo
Clasificación de videos
Accesibilidad
Modelo
Capas Convolucionales
Lengua de señas Colombiana
Ingeniería de Sistemas - Tesis y disertaciones académicas
Lengua de señas - Traducción e interpretación
Redes de neuronas artificiales
Enseñanza con ayuda de computadores
Aprendizaje - Aspectos tecnológicos
Deep learning
Accessibility
Video classification
Model
Convolutional layers
Colombian sign language
Rights
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
Description
Summary:Según los resultados reflejados en el estudio más reciente del Instituto Nacional para Sordos (INSOR), se plantea que en Colombia no se cuenta con las suficientes herramientas políticas e institucionales para garantizar una adecuada inclusión en ámbitos laborales y académicos de aquellos que padecen dificultades auditivas. El desarrollo constante de nuevas tecnologías desempeña un papel importante en el área de la inclusión social de las personas con diferentes discapacidades; debido a esto, el presente trabajo tiene como propósito diseñar una herramienta computacional de traducción de la lengua de señas a texto escrito, en función de la evaluación de distintos modelos basados en el concepto de deep learning con la capacidad de realizar clasificaciones sobre videos de expresiones de la lengua de señas colombiana (LSC) a partir de la implementación de cuatro diferentes arquitecturas previamente entrenadas (DenseNet, MobileNet, Inception y EfficienNet), y una personalizada con capas convoluciones de tres dimensiones (Conv 3d), con el fin de establecer cuál de los modelos es el que proporciona los mejores resultados a la hora de identificar las diferentes señas correspondientes a los 12 meses del año expresadas en LSC, e incluirla como el eje central de la herramienta de traducción. La evaluación del rendimiento mostró que el mejor modelo fue el personalizado, pues logró reconocer la mayoría de las señas con una exactitud del 79% en el conjunto de validación.