Transcripción de audio a texto sesiones municipales en planetaria
El documento aborda la problemática de la transcripción manual de sesiones municipales en Planeta Rica. Se investiga sobre el uso de herramientas de código abierto para automatizar la transcripción de audio a texto en estas sesiones, con el objetivo de mejorar la eficiencia y la precisión de este pr...
- Autores:
-
Ruiz Melendres, Jaime Andrés
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2024
- Institución:
- Universidad de Córdoba
- Repositorio:
- Repositorio Institucional Unicórdoba
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.unicordoba.edu.co:ucordoba/8428
- Acceso en línea:
- https://repositorio.unicordoba.edu.co/handle/ucordoba/8428
https://repositorio.unicordoba.edu.co/home
- Palabra clave:
- Inteligencia artificial
Audio-to-text
Transcripción
Sesiones
Whisper
Spleeter
Inteligencia artificial
Audio-to-text
Transcripción
Sesiones
Whisper
Spleeter
- Rights
- openAccess
- License
- Copyright Universidad de Córdoba, 2024
Summary: | El documento aborda la problemática de la transcripción manual de sesiones municipales en Planeta Rica. Se investiga sobre el uso de herramientas de código abierto para automatizar la transcripción de audio a texto en estas sesiones, con el objetivo de mejorar la eficiencia y la precisión de este proceso. Se destaca la importancia de la integración de modelos en el sistema para abordar diferentes aspectos y mejorar la calidad de las transcripciones. En este sentido, se mencionan dos modelos de inteligencia artificial: Whisper de OpenAI y Spleeter de Deezer. Whisper es un modelo de reconocimiento de voz de propósito general. Por otro lado, Spleeter es una herramienta de separación de pistas de audio que utiliza modelos previamente entrenados para separar las voces de cualquier pista de audio. Además, se desarrolla una arquitectura que permite la integración de estos modelos de forma automática. Esta arquitectura se basa en el uso de Python para el manejo de los modelos de inteligencia artificial, mientras que el backend de la aplicación se desarrolla con Go y el frontend con Next.js/React. Lo que permitio la automatización de las transcripciones de las sesiones del concejo municipal de Planeta Rica, mejorando la eficiencia y la precisión del proceso. |
---|