Avances en el tratamiento computacional en corpus de aprendientes de español como lengua segunda y extranjera

Contenido principal del artículo

Carolina Paola Tramallino

Resumen

El presente trabajo se propone explicitar las aplicaciones y los alcances de la lingüística computacional con el objeto de revisar, particularmente, las investigaciones actuales sobre análisis y tratamiento automático en corpus de aprendientes de español como lengua segunda y extranjera. Por lo tanto, será necesario exponer qué entendemos por lingüística de corpus; qué requisitos debe cumplir la conformación de una muestra de producciones orales o escritas en el ámbito de la adquisición de lenguas; y finalmente, cuáles son los corpus de español como lengua extranjera y/o segunda lengua que se han constituido y cuentan con acceso libre. Luego de realizar un breve recorrido por la evolución del concepto de “error” en este campo investigativo, se hará referencia a los criterios que se utilizan para realizar diferentes clasificaciones de las evidencias halladas en las muestras. A continuación, se expondrán algunos emprendimientos surgidos en los últimos años, cuya finalidad es detectar y contabilizar las formas y estructuras sintácticas presentes en los corpus, mediante herramientas informáticas.

Descargas

Los datos de descargas todavía no están disponibles.

Detalles del artículo

Cómo citar
Tramallino, C. P. (2021). Avances en el tratamiento computacional en corpus de aprendientes de español como lengua segunda y extranjera. Quintú Quimün. Revista De lingüística, (5), Q051. Recuperado a partir de https://revele.uncoma.edu.ar/index.php/lingustica/article/view/3189
Sección
Dossier "Habitar la interlengua: escenarios de la enseñanza y la investigación de ELSE en Argentina"
Biografía del autor/a

Carolina Paola Tramallino, UNIVERSIDAD NACIONAL DE ROSARIO /CONICET

Doctora en Humanidades y Artes, mención en Lingüística. Jefe de Trabajos prácticos de Lingüística General I de la carrera de Letras (Facultad de Humanidades y Artes, Universidad Nacional de Rosario). Becaria posdoctoral de CONICET.

Citas

Alexopoulou, Angélica (2005). Aproximación al tratamiento del error en la clase de E/LE desde la perspectiva del análisis de errores. Estudios de Lingüística Aplicada, 23(41).

Alexopoulou, Angélica (2010). La función de la interlengua en el aprendizaje de lenguas extranjeras. Revista Nebrija de Lingüística aplicada, 9.

Alonso, Laura et al. (2005). The Sensem Project: Syntactico-Semantic Annotation of Sentences in Spanish. Proceedings of the International Conference RANLP, 39-46. Borovets, Bulgaria.

Altenberg, Bengt (2011). “Preface”. En F. Meunier et al. (eds.) A Taste for Corpora. In honour of Sylvianne Granger. Amsterdam: John Benjamins, 13-15.

Arispe, Agustín et al. (2020). Comprensión de los significados pragmáticos en hablantes de español de Argentina como lengua segunda y extranjera. Quintú Quimün. Revista de lingüística 4, 1-16.

Atserias, Jordi et al. (1997). Combining multiple methods for the automatic construction of multi-lingual WordNets. En Recent Advances in Natural Language Processing II. Selected papers from RANLP, volumen 97, página 327–338. Recuperado a partir de http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.97.5872 el 7 de septiembre de 2021.

Blanco Canales, Ana & Marta Nogueroles López (2013). Descripción Y Categorización De Errores Fónicos En Estudiantes De Español/L2. Validación De La Taxonomía De Errores AACFELE. Logos: Revista De Lingüística, Filosofía Y Literatura, 23(2), 196–225.

Bolaños Cuéllar, Sergio (2015). La lingüística de corpus: perspectivas para la investigación lingüística contemporánea. Forma y Función, 28 (1), 31-54.

Bonino, Rodolfo (2011). Una propuesta para la implantación de la morfología verbal del español. Revista INFOSUR, (5), 79-86.

Bonino, Rodolfo (2009). Presentación de la lingüística computacional en Solana, Zulema (ed). La interlengua de los aprendientes del español como L2, Rosario, Centro de Estudios de Adquisición del Lenguaje, Facultad de Humanidades y Artes, UNR, pp. 7-18

Bonino, Rodolfo & Andrea Rodrigo (2020). El análisis automático de la sílaba escrita del español mediante la herramienta NooJ en Tramallino, Carolina (Ed.) Homenaje a Zulema Solana: estudios de lingüística computacional, adquisición y enseñanza de lenguas, pp. 64-80. Recuperado a partir de: http://hdl.handle.net/2133/19502

Bustos Gisbert, José M. (1998). Análisis de errores: problemas de categorización. Revista DICENDA. Cuadernos de Filología Hispánica, (16), 11-40.

Cabrera, Anita et. al. (2014). Análisis de errores asistido por computador basado en un Corpus de Aprendientes de Español como Lengua Extranjera. Revista Signos, 47(86), 385–411.

Camacho Caballero, Luis & Rodolfo Zevallos Salazar (2020). Lingüística computacional para la revitalización y el poliglotismo. Letras (Lima), 91(134), 184-198.

Camargo Angelucci, Thalita & María I. Pozzo (2020). Ang Errors and Mistakes in Foreign Language Learning: Drawing Boundaries from the Discourse of Argentine Teachers en E. Vanderheiden y C. H. Mayer (Eds.) Mistakes, Errors and Failures across Cultures. Navigating Potentials. pp. 383-398. Cham: Springer Nature. Recuperado de: https://doi.org/10.1007/978-3-030-35574-6

Campillos Llanos, Leonardo (2014). Errores léxicos en el español oral no nativo: análisis de la interlengua basado en corpus. ELUA, 0(28), 85-124.

Cembreros Castaños, Diana (2014). Lingüística computacional aplicada a la investigación educativa: un enfoque matemático de la enseñanza de vocabulario en lengua inglesa para hispanohablantes. Tesis Doctoral UAM (Universidad Autónoma de Madrid). Recuperado a partir de <http://hdl.handle.net/10486/660767> el 13 de septiembre de 2021.

Cesto Mancera, Ana et al. (2001). Corpus para el análisis de errores de aprendices de E/LE (CORANE). En Actas del XII Congreso Internacional de ASELE: tecnologías de la información y de las comunicaciones en la enseñanza de la E/LE, Valencia, 2001, 527-534.

Corder, Pit (1971). Idiosincratic Dialects and Error Analysis. International Review of applied Linguistic 9, 149-159.

[DIWICA] Wichi-siwelelhayhilh / Diccionario wichí-castellano. Buenos Aires: INILSyT, Universidad Nacional de Formosa & IFLH, Universidad de Buenos Aires & DILA, CAICyT-CONICET, 2021. Recuperado de: el 7 de septiembre de 2021.

Fellbaum, Christiane (1998). WordNet: Anelectronic lexical database. The MIT press.

Fernández López, Sonsoles (1995). Errores e interlengua en el aprendizaje del español como Lengua extranjera. Didáctica, 7, 203-216.

Fernández López, Sonsoles (2000). Corrección de errores en la expresión oral. Carabela 47: 133-150.

Ferreira Cabrera, Anita et al. (2012). La Arquitectura de ELE-TUTOR: Un Sistema Tutorial Inteligente para el Español como Lengua Extranjera. Revista signos, 45(79), 102-131.

Ferreira Cabrera, Anita et al. (2014). Análisis de errores asistido por computador basado en un corpus de aprendientes de español como lengua extranjera. Revista signos, Valparaíso, v. 47 n. 86, p. 385-411, 2014.

Ferreira Cabrera, A. & Jéssica Elejalde Gómez (2017). Análisis de errores recurrentes en el Corpus de Aprendices de Español como Lengua Extranjera (CAELE). Revista Brasileira de Lingüística Aplicada (RBLA) 17 (3), 509-537.

Ferreira Cabrera, Anita et al. (2020). Análisis de Errores en el Corpus CAELE: estudio sobre la concordancia gramatical en el verbo SER en aprendientes francófonos y anglosajones. Revista Nebrija De Lingüística Aplicada a La Enseñanza De Lenguas, 14 (29), 76 - 99.

García Salido, Marcos (2017). Frecuencia y corrección colocacional en la producción escrita de aprendices de español ONOMÁZEIN 38, 22 – 46.

Granger, Sylviane (2002). A Bird’s-eye view of learner corpus research. In Granger, S., Hung, J., &Petch-Tyson, S. (Eds.), Computer Learner Corpora, Second Language Acquisition and Foreign Language Teaching. Philadelphia: John Benjamins Publishing Company, 3–33.

Hincapié, Diana (2018). Corpus de Aprendientes de Español como Lengua Extranjera y Segunda Lengua (CAELE/2): el componente escrito. Forma y Función, 31(2), 129-143.

Kotz Grabole, Gabriela & Anita Ferreira Cabrera. (2013). La precisión gramatical mediada por la tecnología: el análisis y tratamiento automático de errores. Literatura y lingüística, (27), 219-242.

Lavid, Julia (2005) Lenguaje y nuevas tecnologías. Nuevas perspectivas, métodos y herramientas para el lingüista del siglo XXI. Cátedra. Madrid.

Llisterri, Joaquín (2007). El español y las nuevas tecnologías. En M. Lacorte (Ed.), Lingüística aplicada del español. Madrid: Arco/Libros, pp.483-520.

Lozano, Cristóbal (2009). CEDEL2: Corpus Escrito del Español L2. En Bretones Callejas, Carmen M. et al. (eds) Applied Linguistics Now: Understanding Language and Mind. Almería: Universidad de Almería, 197-212.

MacWhinney, Brian, & Johannes Wagner (2010). Transcribing, searching and data sharing: The CLAN software and the Talk Bank data repository. Gesprächsforschung, 11, 154-173. Recuperado a partir de <https://psyling.talkbank.org/years/2010/macw-wagner.pdf> el 8 de septiembre de 2021.

MacWhinney, Brian & Catherine Snow (1985). The Child Language Data Exchange System. Journalof Child Language, 12, 271-295. Recuperado a partir de https://psyling.talkbank.org/years/1985/jcl-childes.pd el 2 de septiembre de 2021.

Miller, George A.et al. (1993). A semantic concordance. En Proceedings of the workshop on Human Language Technology, HLT ’93, página 303–308, Stroudsburg, PA, USA. Association for Computational Linguistics. ACM ID: 1075742.

Moreno Sandoval, Antonio (1998). La lingüística computacional. Introducción a los modelos simbólicos, estadísticos y biológicos. Madrid: Editorial Síntesis.

Muñoz Liceras, Juana (2009). La interlengua del español en el siglo XXI. Revista Nebrija de Lingüística Aplicada 5, 36-49.

Nemser, William (1971). Aproximative systems of foreign language learners. International Review of Applied Linguistics 9 (2):115-123. (Traducción al español: “Los sistemas aproximados de los que aprenden lenguas segundas” en J. Muñoz Liceras (comp.) (1991): La adquisición de las lenguas extranjeras. Madrid: Visor: 51-61.

Oliver González Antoni & Salvador Climent (2011). Construcción de los WordNets 3.0 para castellano y catalán mediante traducción automática de corpus anotados semánticamente. Revista Procesamiento del Lenguaje Natural, (47), 293-300.

Padró, Lluis (2011). Analizadores Multilingües en FreeLing. Linguamatica (2), 13–20. Recuperado a partir de: <http://linguamatica.com/index.php/linguamatica/article/view/115> el 11 de septiembre de 2021.

Palacios Martínez, Ignacio et al. (2019). El Corpus de Aprendices de Español (CAES) y sus aplicaciones para la enseñanza/aprendizaje del español como lengua extranjera en Blanco, Marta, Hella Olbertz y Victoria Vázquez Rozas (eds.): Corpus y construcciones. Perspectivas hispánicas. Anejo 79 de Verba, 2019, 273-303.

Parodi, Giovanni (2004). Textos de especialidad y comunidades discursivas técnico-profesionales: una aproximación basada en corpus computarizado. Revista Estudios filológicos, (39), 7-36.

Parodi, Giovanni (2008). Lingüística de corpus: una introducción al ámbito. RLA. Revista de lingüística teórica y aplicada, 46 (1), 93-119.

Payrató, Luis (2011) De profesión, lingüista. Panorama de la lingüística aplicada. Barcelona: Ariel Letras.

Pino Rodríguez, Aymé (2009). Palabras en interacción: un corpus de aprendices suecos de E/LE. A survey of corpus-based research, 2009. p. 470-487. Recuperado a partir de <https://goo.gl/XAHPR3> el 5 de abril de 2020.

Rojo, Guillermo (2002). “Sobre la lingüística basada en el análisis de corpus”. Ponencia plenaria en el XV Congreso de la ALFAL (Montevideo, 18-21de agosto de 2008). Recuperado a partir de <https://gramatica.usc.es/~grojo/Publicaciones/Lgca_corpus_lgca_espanol.pdf> el 8 de junio de 2020.

Santana Suárez, et al. (2009).Functional Disambiguation Using the Syntactic Structures Algorithm for each Functional Interpretation for Spanish Language. Lecture Notes in Computer Science. Theoretical Computer Science and General Issues. Springer. v. 5717, 1611-3349.

Santos Gargallo, Isabel (2004). El análisis de los errores en la interlengua del hablante no nativo, en J. Sánchez Lobato e I. Santos Gargallo (eds.) (2004): Vademécum para la formación de profesores. Enseñar español como segunda lengua (L2) / lengua extranjera (LE). Madrid: SGEL, 391-411.

Santos Gargallos, Isabel & Angélica Alexopolou (2021). Metaanálisis de las tesis doctorales de análisis de errores en la interlengua española a los largo de tres décadas (1991-2019). Marco ELE. Revista de Didáctica Español Lengua Extranjera, núm. 32, 2021. Recuperado de <https://www.redalyc.org/journal/921/92165031009/html/> el 14 de junio de 2020.

Selinker, Larry (1972). Interlanguage. International Review of Applied Linguistics, 10/3, 209-231, 1972.

Solana, Zulema et al. (2013). Análisis automático morfológico con las herramientas SMORPH Y NOOJ. Revista de epistemología y ciencias humanas 5, 230-256.

Torijano, Agustín (2008). El estudio de los determinantes en aprendices luso hablantes de español, DICENDA. Cuadernos de Filología Hispánica 26, 235-257.

Torruella, Joan & Joaquim Llisterri (1999). Diseño de corpus textuales y orales. En: Blecua J. M., Clavería G. Sáncez C. Toruella, J. (editores). Filología e informática, Univ. Autónoma de Barcelona, Editorial Milenio, 45-77.

Tramallino, Carolina & Romina P. Arnal (2021). Reconocimiento de sintagmas nominales construidos con indefinidos a través del sistema NooJ en corpus de español como segunda lengua. Revista IRICE, (38), 129-162. Recuperado a partir de: https://ojs.rosario-conicet.gov.ar/index.php/revistairice/article/view/1310

Tramallino, Carolina; Beltrán, Celina & Natalia Ricciardi (2021). Localización y contabilización de sufijos nominales en corpus de aprendientes de español como segunda lengua. Entrepalavras, 11 (10esp), 412-436. doi: http://dx.doi.org/10.22168/2237-6321-10esp2116