Problemática actual del procesamiento computacional anafórico: el caso de FreeLing 4.1

Resumen

En este artículo, presentamos el caso del procesamiento computacional automático de la anáfora y de la problemática que genera dicho tratamiento. Para ello, nos hemos fundamentado en el etiquetador FreeLing 4.1, y en su módulo para el tratamiento de correferentes textuales; analizando, en este caso, un corpus para la enseñanza del español a estudiantes extranjeros. Con el fin de establecer el análisis y los problemas suscitados por este analizador automático, se ha establecido una definición y una tipología anafórica propias, que surgen a partir de varias lecturas y teorías provenientes del campo de la lingüística textual. El artículo finaliza con el análisis estadístico que muestra los diferentes problemas generados en el reconocimiento de dichos tipos de anáforas y de su implicación en el posterior etiquetado de redes correferenciales.

Autores/as

Descargas

La descarga de datos todavía no está disponible.

Palabras clave

Biografía del autor/a


, Universidad de Antioquia

Estudiante de último semestre del pregrado Filología Hispánica de la Facultad de Comunicaciones de la Universidad de Antioquia. Bajo la figura de Joven Investigador del CODI para el proyecto DICEELE, ha desarrollado su tarea investigativa en el semillero de investigación “Corpus Ex Machina” en las áreas de la lingüística computacional, la lingüística de corpus y la enseñanza/aprendizaje de lenguas asistidos por computador.


, Universidad de Antioquia

Profesor de cátedra del área de lingüística, coordinador del Grupo de Estudios Sociolingüísticos y del semillero “Corpus Ex Machina” adscritos a la Facultad de Comunicaciones de la Universidad de Antioquia. PhD en Informática y Ciencias del Lenguaje (Université Grenoble Alpes, Francia). Desarrolla sus tareas de docencia e investigación en las áreas de la lingüística computacional, la lingüística de corpus, la lingüística textual y la enseñanza/aprendizaje de lenguas asistidos por computador.

Citas

Adam, J.-M. (2011). La linguistique textuelle (3ª ed.). París: Armand Colin.

Amsili, P., Denis, P., y Roussarie, L. (2005). Anaphores abstraites en français : représentation formelle. TAL, 46(1), 15-40. Recuperado de https://tal.revuesonline.com/article.jsp?articleId=8142.

Anthony, L. (2018). AntConc (Versión 3.5.8) [Programa para computadora]. Tokyo: Waseda University. Disponible en http://www.laurenceanthony.net/software/antconc/.

Baker, P., Hardie, A., y McEnery, T. (2006). A Glossary of Corpus Linguistics. Edimburgo: Edinburgh University Press.

Brezina, V. (2018). Statistics in Corpus Linguistics. Cambrigde: Cambridge University Press. doi: 10.1017/9781316410899.

Carrión, M. (2014). Resolución de anáforas que requieren conocimiento cultural con la herramienta FunGramKB. Revista de Lingüística y Lenguas Aplicadas, 9, 1-13. doi: 10.4995/rlyla.2014.2003.

Constant, M., Eryiğit, G., Monti, J., van der Plas, L., Ramisch, C., Rosner, M., y Todiraşcu, A. (2017). Multiword Expression Processing: A Survey. Computational Linguistics, 43(4), 837-892. doi: 10.1162/COLI_a_00302.

Cuenca, M. (2010). Gramática del texto. Madrid: Arco Libros.

Denber, M. (1998). Automatic Resolution of Anaphora in English. Reporte técnico de Eastman Kodak Co. Recuperado de http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.33.904&rep=rep1&type=pdf.

Depain-Delmotte, F. (1997). La notion de cohérence textuelle et le traitement de l'anaphore. Bulletin de Linguistique Appliquée et Générale, (22), 129-154.

Ferrández, A. (1998). Aproximación computacional al tratamiento de la anáfora pronominal y de tipo adjetivo mediante gramáticas de unificación de huecos (Tesis de doctorado). Universidad de Alicante, Alicante, España.

Ferrari, A. (2014). Linguistica del testo. Principi, fenomeni, strutture. Roma: Carocci.

García, M. (2011). La distinción deíxis/anáfora y su aplicación a las formas de persona del español. Revista de Filología Española, 91(1), 65-88. doi: 10.3989/rfe.2011.v91.i1.216.

Garside, R., Fligelstone, S., y Botley, S. (1997). Discourse Annotation: Anaphoric Relations in Corpora. En R. Garside, G. Leech, y A. McEnery (Eds.), Corpus Annotation: Linguistic Information from Computer Text Corpora (pp. 66-84). Londres: Longman.

Grajales, A. (2019). Problemas del tratamiento computacional de la anáfora: Análisis en un corpus para la enseñanza del Español como Lengua Extranjera (Tesis de pregrado). Universidad de Antioquia, Medellín, Colombia.

Instituto Cervantes. (2007). Plan curricular del Instituto Cervantes. Recuperado de: http://cvc.cervantes.es/ensenanza/biblioteca_ele/plan_curricular/.

Landragin, F. (2011). Une procédure d'analyse et d'annotation des chaînes de coréférence dans des textes écrits. Corpus, 10, 61-80. Recuperado de http://corpus.revues.org/2010.

Landragin, F. (2014). Anaphores et coréférences : analyse assistée par ordinateur. En M. Fossard, y M.-J. Béguelin (Eds.), Nouvelles perspectives sur l'anaphore : Points de vue linguistique, psycholinguistique et acquisitionnel (pp. 29-54). Berna: Peter Lang.

Landragin, F. (2018). Étude de la référence et de la coréférence : rôle des petits corpus et observations à partir du corpus MC4. Corpus, 18. Recuperado de: http://journals.openedition.org/corpus/3422.

Liddy, E. (1990). Anaphora in Natural Language Processing and Information Retrieval. Information Processing and Management, 26(1), 39-52. doi: 10.1016/0306-4573(90)90008-P.

Longo, L., y Todiraşcu, A. (2010). RefGen : un module d’identification des chaînes de référence dépendant du genre textuel. TALN 2010.

Lundquist, L. (2013). Lire un texte académique en français. París: Éditions Ophrys.

Manning, C., Surdeanu, M., Bauer, J., Finkel, J., Bethard, S., y McClosky, D. (2014). The Stanford CoreNLP Natural Language Processing Toolkit. En Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations (pp. 55-60). doi: 10.3115/v1/P14-5010.

Martínez-Barco, P. (2001). Resolución computacional de la anáfora en diálogos: estructura del discurso y conocimiento lingüístico (Tesis de doctorado). Universidad de Alicante, Alicante, España. Recuperada de http://hdl.handle.net/10045/1851.

McEnery, T., y Hardie, A. (2011). Corpus Linguistics. doi: 10.1017/CBO9780511981395.

Mel'čuk, I. (1988). Dependency Syntax: Theory and Practice. Nueva York: State University of New York Press.

Mitkov, R. (1999). Anaphora Resolution: The State of the Art. Reporte técnico. Recuperado de https://pdfs.semanticscholar.org/e782/00b1e3ba2a72de1ca9b9b2c5efa775151bfa.pdf.

Mitkov, R. (2001). Outstanding Issues in Anaphora Resolution. En A. Gelbukh (Ed.), Computational Linguistics and Intelligent Text Processing (pp. 110-125). Nueva York: Springer.

Mitkov, R. (2002). Anaphora Resolution. Londres: Longman.

Mitkov, R., Evans, R., Orasan, C., Ha, L., y Pekar, V. (2007). Anaphora Resolution: To What Extent Does It Help NLP Applications? En A. Branco (Ed.), Anaphora: Analysis, Algorithms and Applications. Berlín: Springer.

Molina, J. (2015). ELiTe-[FLE]2 : Un environnement d’ALAO fondé sur la linguistique textuelle, pour la formation linguistique des futurs enseignants de FLE en Colombie (Tesis de doctorado). Université Grenoble Alpes, Grenoble, Francia.

Molina, J. Grajales, A., y Pemberty, J. (2019). Hacia un dispositivo informático basado en Corpus para la Enseñanza del Español Lengua Extranjera (DICEELE). Revista Internacional de Tecnología, Conocimiento y Sociedad, 7(1), 1-13. doi: 10.18848/2474-588X/CGP/v07i01/1-13.

Morales, R. (2004). Resolución automática de la anáfora indirecta en el español (Tesis de doctorado). Instituto Politécnico Nacional, México D. F., México. Recuperada de https://tesis.ipn.mx/bitstream/handle/123456789/11287/394.pdf?sequence=1&isAllowed=y.

Navarro, B. (2007). Metodología, construcción y explotación de corpus anotados semántica y anafóricamente (Tesis de doctorado). Universidad de Alicante, Alicante, España. Recuperada de http://hdl.handle.net/10045/7736.

Olivas, O. (2006). Sistema de construcción de redes semánticas con detección de anáfora (Tesis de maestría). Instituto Politécnico Nacional, México D. F., México. Recuperada de https://tesis.ipn.mx/xmlui/handle/123456789/1189.

Peña, G. (2006). La anáfora y su funcionamiento discursivo: una aproximación contrastiva (Tesis de doctorado). Universitat de València, Valencia, España. Recuperada de http://hdl.handle.net/10550/15244.

Ruiz, M. (2012). Resolución de la anáfora correferencial con FunGramKB (Tesis de maestría). Universidad Nacional de Educación a Distancia, Madrid, España.

Saiz, M. (2002). Influencia y aplicación de papeles sintácticos e información semántica en la resolución de la anáfora pronominal en español (Tesis de doctorado). Universidad de Alicante, Alicante, España. Recuperada de http://hdl.handle.net/10045/1841.

Salguero, F. J., y Soler, F. (2010). Resolución abductiva de anáforas pronominales. En D. Fernández, E. Gómez-Caminero e I. Hernández (Eds.), Estudios de Lógica, Lenguaje y Epistemología (pp. 47-61). Sevilla: Fénix Editora.

Salmon-Alt, S. (2002). Le projet ANANAS : Annotation Anaphorique pour l’Analyse Sémantique de Corpus. TALN 2002, 163-172.

Sapena, E., Padró, L., y Turmo, J. (2013) A Constraint-Based Hypergraph Partitioning Approach to Coreference Resolution. Computational Linguistics, 39(4), 847-884. doi: 10.1162/COLI_a_00151.

Tesnière, L. (1959). Éléments de syntaxe structurale. París: Klincksieck.

Tordera, J. (2010). Lingüística computacional y anáfora (Tesis de doctorado). Universitat de València, Valencia, España. Recuperada de http://hdl.handle.net/10803/39087.

Publicado
2019-11-14
| 74 |