Extracción automática de metadatos como soporte para el autoarchivo de objetos digitales en repositorios

En este trabajo se propone facilitar al usuario el autoarchivo de sus objetos digitales educativos en un repositorio institucional. Para esto, se modifica el flujo de carga estándar de la plataforma DSpace, proponiendo un nuevo flujo para el depósito de objetos de modo que pueda integrarse en este p...

Full description

Autores:
Casali, Ana
Bender, Cristina
Deco, Claudia
Fontanarrosa, Santiago
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2014
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/8890
Acceso en línea:
http://hdl.handle.net/20.500.12749/8890
Palabra clave:
Innovaciones tecnológicas
Ciencia de los computadores
Desarrollo de tecnología
Ingeniería de sistemas
Investigaciones
Tecnologías de la información y las comunicaciones
TIC´s
Technological innovations
Computer science
Technology development
Systems engineering
Investigations
Information and communication technologies
ICT's
Automatic metadata extraction
Digital objects
Educational
Repositories
Load flow
Desarrollo tecnológico
Innovaciones tecnológicas
Investigaciones
Ciencias de la computación
Tecnologías de la información y la comunicación
Ingeniería de sistemas
Extracción automática de metadatos
Objetos digitales
Educativos
Repositorios
Flujo de carga
Rights
License
Derechos de autor 2014 Revista Colombiana de Computación
Description
Summary:En este trabajo se propone facilitar al usuario el autoarchivo de sus objetos digitales educativos en un repositorio institucional. Para esto, se modifica el flujo de carga estándar de la plataforma DSpace, proponiendo un nuevo flujo para el depósito de objetos de modo que pueda integrarse en este proceso un extractor de metadatos. Se presenta una arquitectura abierta de un módulo extractor automático de algunos metadatos de los documentos. Estos metadatos extraídos automáticamente son luego validados por el usuario en el proceso de descripción del objeto. Para diseñar el extractor se analizaron distintas herramientas de extracción y se optó por la combinación que arrojó mejores resultados. Este módulo se ha diseñado de modo de poder integrar otras herramientas extractoras. Se ha desarrollado un prototipo en JAVA de este asistente y se ha experimentado sobre dos corpus de documentos, uno en idioma Inglés y otro en idioma Español. En este trabajo, se presentan resultados de la extracción automática de los metadatos Palabras clave, Título y Autores, en documentos en ambos idiomas, los cuales resultan promisorios. Mediante este asistente se espera ayudar al usuario en el proceso de carga de objetos digitales educativos disminuyendo así su trabajo, y mejorando la cantidad y la calidad de los metadatos cargados.