Construcción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglish

Durante la adquisición de un idioma extranjero, la lectura representa una de las oportunidades de acercamiento al lenguaje. Sin embargo, los textos inadecuados pueden desencadenar una experiencia contraproducente para un estudiante, por ello, en los cursos regulares, los docentes utilizan su experie...

Full description

Autores:
Escobar Acevedo, Adelina
Guerrero García, Josefina
Tipo de recurso:
Article of investigation
Fecha de publicación:
2022
Institución:
Universidad Autónoma de Bucaramanga - UNAB
Repositorio:
Repositorio UNAB
Idioma:
spa
OAI Identifier:
oai:repository.unab.edu.co:20.500.12749/26580
Acceso en línea:
http://hdl.handle.net/20.500.12749/26580
https://doi.org/10.29375/25392115.4484
Palabra clave:
Selección de materiales
Métricas de lecturabilidad
Comprensión lectora
Sistemas Tutores Inteligentes
Material recommendation
Readability metrics
Reading Comprehension
Intelligent Tutor Systems
Rights
License
http://purl.org/coar/access_right/c_abf2
id UNAB2_4e828b8a6810fa01941bcf529e58e918
oai_identifier_str oai:repository.unab.edu.co:20.500.12749/26580
network_acronym_str UNAB2
network_name_str Repositorio UNAB
repository_id_str
dc.title.spa.fl_str_mv Construcción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglish
dc.title.translated.eng.fl_str_mv Content Construction for an Intelligent Tutor System in languages: a pilot study on the OneStopEnglish corpus
title Construcción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglish
spellingShingle Construcción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglish
Selección de materiales
Métricas de lecturabilidad
Comprensión lectora
Sistemas Tutores Inteligentes
Material recommendation
Readability metrics
Reading Comprehension
Intelligent Tutor Systems
title_short Construcción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglish
title_full Construcción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglish
title_fullStr Construcción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglish
title_full_unstemmed Construcción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglish
title_sort Construcción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglish
dc.creator.fl_str_mv Escobar Acevedo, Adelina
Guerrero García, Josefina
dc.contributor.author.none.fl_str_mv Escobar Acevedo, Adelina
Guerrero García, Josefina
dc.contributor.orcid.spa.fl_str_mv Escobar Acevedo, Adelina [0000-0003-0574-0932]
Guerrero García, Josefina [0000-0002-3393-610X]
dc.subject.spa.fl_str_mv Selección de materiales
Métricas de lecturabilidad
Comprensión lectora
Sistemas Tutores Inteligentes
topic Selección de materiales
Métricas de lecturabilidad
Comprensión lectora
Sistemas Tutores Inteligentes
Material recommendation
Readability metrics
Reading Comprehension
Intelligent Tutor Systems
dc.subject.keywords.eng.fl_str_mv Material recommendation
Readability metrics
Reading Comprehension
Intelligent Tutor Systems
description Durante la adquisición de un idioma extranjero, la lectura representa una de las oportunidades de acercamiento al lenguaje. Sin embargo, los textos inadecuados pueden desencadenar una experiencia contraproducente para un estudiante, por ello, en los cursos regulares, los docentes utilizan su experiencia o la de un equipo editorial para seleccionar las lecturas. En un sistema automático como en un Sistema Tutor Inteligente, es prioritario realizar recomendaciones adecuadas al perfil del alumno. No basta conocer el nivel de idioma del texto, El presente trabajo aplica herramientas para clasificar una muestra de textos extraídos del corpus OneStopEnglish conforme al Marco Común de Referencia Europeo, crea grupos temáticos con análisis semántico latente (LSA), y aplica tres métricas populares de lecturabilidad como un referente para recomendar textos a los estudiantes.
publishDate 2022
dc.date.issued.none.fl_str_mv 2022-04-18
dc.date.accessioned.none.fl_str_mv 2024-09-16T21:29:46Z
dc.date.available.none.fl_str_mv 2024-09-16T21:29:46Z
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/article
dc.type.local.spa.fl_str_mv Artículo
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/ART
format http://purl.org/coar/resource_type/c_2df8fbb1
dc.identifier.issn.spa.fl_str_mv ISSN: 1657-2831
e-ISSN: 2539-2115
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12749/26580
dc.identifier.instname.spa.fl_str_mv instname:Universidad Autónoma de Bucaramanga UNAB
dc.identifier.repourl.spa.fl_str_mv repourl:https://repository.unab.edu.co
dc.identifier.doi.none.fl_str_mv https://doi.org/10.29375/25392115.4484
identifier_str_mv ISSN: 1657-2831
e-ISSN: 2539-2115
instname:Universidad Autónoma de Bucaramanga UNAB
repourl:https://repository.unab.edu.co
url http://hdl.handle.net/20.500.12749/26580
https://doi.org/10.29375/25392115.4484
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.spa.fl_str_mv https://revistas.unab.edu.co/index.php/rcc/article/view/4484/3612
dc.relation.uri.spa.fl_str_mv https://revistas.unab.edu.co/index.php/rcc/issue/view/282
dc.relation.references.none.fl_str_mv Al-Thanyyan, S. S., & Azmi, A. M. (2021). “Automated Text Simplification: A survey”. ACM Computing Surveys, 54(2), 1–36.
Allen, L. K., Snow, E. L., & McNamara, D. S. (2015). Are you reading my mind? Modeling students’ reading comprehension skills with natural language processing techniques. ACM International Conference Proceeding Series, 16-20-Marc, 246–254. https://doi.org/10.1145/2723576.2723617
Bax, S. (2020). Text Inspector. https://textinspector.com/
Cambridge University Press. (2015). English Profile, The CEFR for English. https://www.englishprofile.org/wordlists/evp
Cárcamo Morales, B. (2020). “Readability and types of questions in Chilean EFL high school textbooks”. TESOL Journal, 11(2), 1–15.
Crossley, S., Allen, L. K., Snow, E. L., & McNamara, D. S. (2015). Pssst... textual features... there is more to automatic essay scoring than just you! Proceedings of the Fifth International Conference on Learning Analytics And Knowledge - LAK ’15, 203–207. https://doi.org/10.1145/2723576.2723595
Fiction Express Education. (2021). Fiction Express. https://en.fictionexpress.com
Graesser, A. C., McNamara, D. S., Louwerse, M. M., & Cai, Z. (2004). “Coh-Metrix : Analysis of text on cohesion and language”. Behavior Research Methods, Instruments, & Computers, 36(2), 193–202.
Graesser, A. C., McNamara, D. S., & Louwerse, M. M. (2017). Coh-Metrix. http://cohmetrix.com/
Instituto Cervantes (2002). “Marco Común Europeo de Referencia para las Lenguas: aprendizaje, enseñanza, evaluación”. Instituto Cervantes.
Landauer, T. K., McNamara, D. S., Dennis, S., & Kintsh, W. (2006). Handbook of Latent Semantic Analysis (Vol. 7, Issue 2). Routledge.
Li, H., Gobert, J., Dickler, R., & Morad, N. (2018). “Students’ Academic Language Use When Constructing Scientific Explanations in an Intelligent Tutoring System”. Conference on Artificial Intelligence in Education, 267–281. https://doi.org/10.1007/978-3-319-93843-1_20
Liu, Y. (2020). Assessing text readability and quality with language modelsAssessing text readability and quality with language models [Master Thesis]. University of Helsinki.
McCarthy, K. S., Watanabe, M., Dai, J., & McNamara, D. S. (2020). Personalized learning in iSTART: Past modifications and future design. Journal of Research on Technology in Education, 52(3), 301–321. https://doi.org/10.1080/15391523.2020.1716201
McNamara, D. S., Graesser, A. C., McCarthy, P. M., & Cai, Z. (2014). Coh-Metrix Measures of Text Readability and Easability. En Automated Evaluation of Text and Discourse with Coh-Metrix (pp. 78–95). Cambridge University Press.
Nahatame, S. (2020). Text readability and comprehension processes during L2 reading: A computational and eye-tracking investigation. Conference of the American Association for Applied Linguistics (AAAL).
Roadtogrammar (2021). Text Analyzer. http://www.roadtogrammar.com/textanalysis/
Tejada, M. Á. Z., Gallardo, C. N., Ferradá, M. C. M., & López, M. I. C. (2015). Building a Corpus of 2L English for Automatic Assessment: The CLEC Corpus. Procedia - Social and Behavioral Sciences, 198(Cilc), 515–525. https://doi.org/10.1016/j.sbspro.2015.07.474
Textcompare.org. (2021). Textcompare.org. https://www.textcompare.org/readability/
Vajjala, S., & Lucic, I. (2018). OneStopEnglish corpus: A new corpus for automatic readability assessment and text simplification. Proceedings of the Thirteenth Workshop on Innovative Use of NLP for Building Educational Applications, 297–304. https://www.aclweb.org/anthology/W18-0535/
Wilkens, R., Zilio, L., & Fairon, C. (2018). SW4ALL: a CEFR-Classified and Aligned Corpus for Language Learning. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), 365–370.
Xu, W., Callison-Burch, C., & Napoles, C. (2015). Problems in Current Text Simplification Research: New Data Can Help. Transactions of the Association for Computational Linguistics, 3, 283–297.
Zarobe, Y. R. De, & Zarobe, L. R. De (Eds.). (2019). La lectura en lengua extranjera. Ediciones Octaedro.
Zhang, R. (2016). A Coh-Metrix Analysis of Two Textbooks: Successful English for Vocational Colleges and Vocational College English (An Integrated Skills Course). US-China Foreign Language, 14(5), 351–356.
Zipf, G. K. (1949). Introduction and Orientation. Human behavior and the principle of least effort: an introduction to human ecology. Addison-Wesley Press.
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad Autónoma de Bucaramanga UNAB
dc.source.spa.fl_str_mv Vol. 23 Núm. 1 (2022): Revista Colombiana de Computación (Enero-Junio); 53-60
institution Universidad Autónoma de Bucaramanga - UNAB
bitstream.url.fl_str_mv https://repository.unab.edu.co/bitstream/20.500.12749/26580/1/Art%c3%adculo.pdf
https://repository.unab.edu.co/bitstream/20.500.12749/26580/2/license.txt
https://repository.unab.edu.co/bitstream/20.500.12749/26580/3/Art%c3%adculo.pdf.jpg
bitstream.checksum.fl_str_mv c7f5c53021d3710aed5da4259bf94b44
855f7d18ea80f5df821f7004dff2f316
5a3e794cccaf56da2dedd4bf8e6149ec
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional | Universidad Autónoma de Bucaramanga - UNAB
repository.mail.fl_str_mv repositorio@unab.edu.co
_version_ 1814277267482738688
spelling Escobar Acevedo, Adelina0a137804-ce94-45d0-bb8d-767ebdb3f6ffGuerrero García, Josefinaec2d31ce-8a99-4a54-a6e1-ba5fe08ff3b7Escobar Acevedo, Adelina [0000-0003-0574-0932]Guerrero García, Josefina [0000-0002-3393-610X]2024-09-16T21:29:46Z2024-09-16T21:29:46Z2022-04-18ISSN: 1657-2831e-ISSN: 2539-2115http://hdl.handle.net/20.500.12749/26580instname:Universidad Autónoma de Bucaramanga UNABrepourl:https://repository.unab.edu.cohttps://doi.org/10.29375/25392115.4484Durante la adquisición de un idioma extranjero, la lectura representa una de las oportunidades de acercamiento al lenguaje. Sin embargo, los textos inadecuados pueden desencadenar una experiencia contraproducente para un estudiante, por ello, en los cursos regulares, los docentes utilizan su experiencia o la de un equipo editorial para seleccionar las lecturas. En un sistema automático como en un Sistema Tutor Inteligente, es prioritario realizar recomendaciones adecuadas al perfil del alumno. No basta conocer el nivel de idioma del texto, El presente trabajo aplica herramientas para clasificar una muestra de textos extraídos del corpus OneStopEnglish conforme al Marco Común de Referencia Europeo, crea grupos temáticos con análisis semántico latente (LSA), y aplica tres métricas populares de lecturabilidad como un referente para recomendar textos a los estudiantes.During foreign language acquisition, reading represents one of the opportunities to get closer to the language. However, inappropriate texts can cause students to have a negative experience; thus, in regular courses, teachers use their experience or an editorial team to select the readings. In an automatic system, as in an Intelligent Tutor System, making recommendations appropriate to the student's profile is a priority. It is not enough to know the language level of the text. This work uses tools to classify a sample of texts from the OneStopEnglish corpus according to the Common European Framework of Reference for Languages. We create thematic groups based on Latent Semantic Analysis (LSA) and use three popular metrics of readability as a guide to suggest texts to students.application/pdfspaUniversidad Autónoma de Bucaramanga UNABhttps://revistas.unab.edu.co/index.php/rcc/article/view/4484/3612https://revistas.unab.edu.co/index.php/rcc/issue/view/282Al-Thanyyan, S. S., & Azmi, A. M. (2021). “Automated Text Simplification: A survey”. ACM Computing Surveys, 54(2), 1–36.Allen, L. K., Snow, E. L., & McNamara, D. S. (2015). Are you reading my mind? Modeling students’ reading comprehension skills with natural language processing techniques. ACM International Conference Proceeding Series, 16-20-Marc, 246–254. https://doi.org/10.1145/2723576.2723617Bax, S. (2020). Text Inspector. https://textinspector.com/Cambridge University Press. (2015). English Profile, The CEFR for English. https://www.englishprofile.org/wordlists/evpCárcamo Morales, B. (2020). “Readability and types of questions in Chilean EFL high school textbooks”. TESOL Journal, 11(2), 1–15.Crossley, S., Allen, L. K., Snow, E. L., & McNamara, D. S. (2015). Pssst... textual features... there is more to automatic essay scoring than just you! Proceedings of the Fifth International Conference on Learning Analytics And Knowledge - LAK ’15, 203–207. https://doi.org/10.1145/2723576.2723595Fiction Express Education. (2021). Fiction Express. https://en.fictionexpress.comGraesser, A. C., McNamara, D. S., Louwerse, M. M., & Cai, Z. (2004). “Coh-Metrix : Analysis of text on cohesion and language”. Behavior Research Methods, Instruments, & Computers, 36(2), 193–202.Graesser, A. C., McNamara, D. S., & Louwerse, M. M. (2017). Coh-Metrix. http://cohmetrix.com/Instituto Cervantes (2002). “Marco Común Europeo de Referencia para las Lenguas: aprendizaje, enseñanza, evaluación”. Instituto Cervantes.Landauer, T. K., McNamara, D. S., Dennis, S., & Kintsh, W. (2006). Handbook of Latent Semantic Analysis (Vol. 7, Issue 2). Routledge.Li, H., Gobert, J., Dickler, R., & Morad, N. (2018). “Students’ Academic Language Use When Constructing Scientific Explanations in an Intelligent Tutoring System”. Conference on Artificial Intelligence in Education, 267–281. https://doi.org/10.1007/978-3-319-93843-1_20Liu, Y. (2020). Assessing text readability and quality with language modelsAssessing text readability and quality with language models [Master Thesis]. University of Helsinki.McCarthy, K. S., Watanabe, M., Dai, J., & McNamara, D. S. (2020). Personalized learning in iSTART: Past modifications and future design. Journal of Research on Technology in Education, 52(3), 301–321. https://doi.org/10.1080/15391523.2020.1716201McNamara, D. S., Graesser, A. C., McCarthy, P. M., & Cai, Z. (2014). Coh-Metrix Measures of Text Readability and Easability. En Automated Evaluation of Text and Discourse with Coh-Metrix (pp. 78–95). Cambridge University Press.Nahatame, S. (2020). Text readability and comprehension processes during L2 reading: A computational and eye-tracking investigation. Conference of the American Association for Applied Linguistics (AAAL).Roadtogrammar (2021). Text Analyzer. http://www.roadtogrammar.com/textanalysis/Tejada, M. Á. Z., Gallardo, C. N., Ferradá, M. C. M., & López, M. I. C. (2015). Building a Corpus of 2L English for Automatic Assessment: The CLEC Corpus. Procedia - Social and Behavioral Sciences, 198(Cilc), 515–525. https://doi.org/10.1016/j.sbspro.2015.07.474Textcompare.org. (2021). Textcompare.org. https://www.textcompare.org/readability/Vajjala, S., & Lucic, I. (2018). OneStopEnglish corpus: A new corpus for automatic readability assessment and text simplification. Proceedings of the Thirteenth Workshop on Innovative Use of NLP for Building Educational Applications, 297–304. https://www.aclweb.org/anthology/W18-0535/Wilkens, R., Zilio, L., & Fairon, C. (2018). SW4ALL: a CEFR-Classified and Aligned Corpus for Language Learning. Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), 365–370.Xu, W., Callison-Burch, C., & Napoles, C. (2015). Problems in Current Text Simplification Research: New Data Can Help. Transactions of the Association for Computational Linguistics, 3, 283–297.Zarobe, Y. R. De, & Zarobe, L. R. De (Eds.). (2019). La lectura en lengua extranjera. Ediciones Octaedro.Zhang, R. (2016). A Coh-Metrix Analysis of Two Textbooks: Successful English for Vocational Colleges and Vocational College English (An Integrated Skills Course). US-China Foreign Language, 14(5), 351–356.Zipf, G. K. (1949). Introduction and Orientation. Human behavior and the principle of least effort: an introduction to human ecology. Addison-Wesley Press.Vol. 23 Núm. 1 (2022): Revista Colombiana de Computación (Enero-Junio); 53-60Selección de materialesMétricas de lecturabilidadComprensión lectoraSistemas Tutores InteligentesMaterial recommendationReadability metricsReading ComprehensionIntelligent Tutor SystemsConstrucción de contenido para un Sistema Tutor Inteligente en idiomas: un estudio piloto con el corpus OneStopEnglishContent Construction for an Intelligent Tutor System in languages: a pilot study on the OneStopEnglish corpusinfo:eu-repo/semantics/articleArtículohttp://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/redcol/resource_type/ARThttp://purl.org/coar/version/c_970fb48d4fbd8a85http://purl.org/coar/access_right/c_abf2ORIGINALArtículo.pdfArtículo.pdfArtículoapplication/pdf547426https://repository.unab.edu.co/bitstream/20.500.12749/26580/1/Art%c3%adculo.pdfc7f5c53021d3710aed5da4259bf94b44MD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-8347https://repository.unab.edu.co/bitstream/20.500.12749/26580/2/license.txt855f7d18ea80f5df821f7004dff2f316MD52open accessTHUMBNAILArtículo.pdf.jpgArtículo.pdf.jpgIM Thumbnailimage/jpeg9425https://repository.unab.edu.co/bitstream/20.500.12749/26580/3/Art%c3%adculo.pdf.jpg5a3e794cccaf56da2dedd4bf8e6149ecMD53open access20.500.12749/26580oai:repository.unab.edu.co:20.500.12749/265802024-09-16 22:00:27.496open accessRepositorio Institucional | Universidad Autónoma de Bucaramanga - UNABrepositorio@unab.edu.coTGEgUmV2aXN0YSBDb2xvbWJpYW5hIGRlIENvbXB1dGFjacOzbiBlcyBmaW5hbmNpYWRhIHBvciBsYSBVbml2ZXJzaWRhZCBBdXTDs25vbWEgZGUgQnVjYXJhbWFuZ2EuIEVzdGEgUmV2aXN0YSBubyBjb2JyYSB0YXNhIGRlIHN1bWlzacOzbiB5IHB1YmxpY2FjacOzbiBkZSBhcnTDrWN1bG9zLiBQcm92ZWUgYWNjZXNvIGxpYnJlIGlubWVkaWF0byBhIHN1IGNvbnRlbmlkbyBiYWpvIGVsIHByaW5jaXBpbyBkZSBxdWUgaGFjZXIgZGlzcG9uaWJsZSBncmF0dWl0YW1lbnRlIGludmVzdGlnYWNpw7NuIGFsIHDDumJsaWNvIGFwb3lhIGEgdW4gbWF5b3IgaW50ZXJjYW1iaW8gZGUgY29ub2NpbWllbnRvIGdsb2JhbC4=