enero 20, 2016

«La lingüística de corpus: perspectivas para la investigación lingüística contemporánea»



Sergio Bolaños Cuéllar
«La lingüística de corpus: perspectivas para la investigación lingüística contemporánea»

Forma y Función, vol. 28, n.º 1, enero-junio del 2015

Forma y Función | Universidad Nacional de Colombia | Facultad de Ciencias Humanas | Departamento de Lingüística | Bogotá | COLOMBIA


Extracto de los apartados «Resumen» y «Conclusiones» del artículo en PDF




«La Lingüística de Corpus (LC) constituye una de las áreas de investigación de mayor desarrollo en los estudios del lenguaje. En este artículo se hace una sucinta revisión histórica al uso de los corpus, desde su confección manual en la lexicografía del siglo XVII, pasando por los estudios bíblicos y gramaticales en los siglos XVIII y XIX, hasta llegar a la primera generación de corpus electrónicos en la década de los sesenta y las generaciones posteriores. Se discute la definición del término ‘corpus’, su tipología y sus principales características. Así mismo, se muestra el potencial metodológico de la lingüística de corpus para la investigación en diversas áreas de la lingüística contemporánea, entre otras, la revisión de la traducción; la elaboración de materiales para la enseñanza de las lenguas; la diferenciación léxico-gramatical de variedades dialectales de una lengua; la elaboración de gramáticas descriptivas y el análisis sociolingüístico del discurso.

[...]

»En el sucinto recorrido realizado en este trabajo, hemos podido describir y ejemplificar algunas de las múltiples posibilidades de investigación que ofrece la lingüística de corpus tanto para la lingüística sistémica como para la lingüística aplicada.

»Así, por ejemplo, la LC resulta de gran utilidad para los docentes y los estudiantes que participan en los programas de lingüística o de aprendizaje de lenguas extranjeras.

»Se puede estudiar una gama bastante amplia y variopinta de temas de muy diversa naturaleza: desde aspectos gramaticales (por ejemplo, el uso real de los auxiliares shall y will en textos orales y escritos del inglés estadounidense, británico y de otras variedades dialectales), pasando por el análisis de la evolución de la adjetivación en español con marcación distintiva de género (por ejemplo, cuáles adjetivos aparecen en la frase nominal acompañando los términos hombre y mujer), hasta realizar análisis crítico del discurso que permita, por ejemplo, determinar la colocación verbal más frecuente en español y otras lenguas en relación con la situación de los inmigrantes que han sido desplazados de sus países de origen o que buscan mejores oportunidades laborales para ellos y sus familias en otros lugares del orbe; o se puede estudiar la percepción que genera una declaratoria de impago de la deuda externa por parte de un país como Estados Unidos frente a un país en vías de desarrollo.

»No sobra resaltar el gran potencial que tiene la lingüística de corpus para el aprendizaje de las lenguas extranjeras. Puede utilizarse como una herramienta valiosa para que, por ejemplo, los estudiantes de inglés como lengua extranjera consulten corpus de aprendices en otras latitudes y puedan contrastar si están enfrentando las mismas dificultades y la forma de superarlas. Al mismo tiempo, otra de las actividades de investigación que pueden realizar los estudiantes es corroborar si las estructuras y el léxico que aparecen en sus libros de texto efectivamente coinciden con el uso real que encuentran en los diversos corpus del inglés estadounidense o de otras variedades dialectales estándar. Es decir, contrastar la teoría gramatical y los ejemplos que la ilustran en los libros de texto con la realidad del uso de la lengua. Este gran potencial de utilización de la lingüística de corpus en los procesos de investigación en las diversas disciplinas de la lingüística sistémica (léxico, sintaxis, morfología) y las interdisciplinas del lenguaje (análisis del discurso, traducción, enseñanza de lenguas, pragmática, sociolingüística, etc.) que hemos descrito e ilustrado en este trabajo no debe llevarnos a pensar que no tiene limitaciones. McEnery et al. (2006/2008, p. 121), por ejemplo, mencionan cuatro aspectos problemáticos.

»En primer lugar, el hecho de que los corpus no suministran pruebas negativas; no nos dicen lo que es posible y lo que no es posible. Este reparo puede ser importan- te y relevante solamente si el corpus no contiene suficientes metadatos, es decir, si no se identifica con claridad el tipo y la procedencia textual, puesto que estos datos arrojan información importante sobre el grado de informalidad discursiva y, según la extensión del corpus, el grado de representatividad que tiene. El segundo reparo es más serio. Se refiere al hecho de que el corpus suministra información pero no explica lo observado. Aquí puede decirse que el investigador o el usuario del corpus parten de suposiciones o hipótesis acerca de lo que van a encontrar en el corpus. Luego, la explicación proviene de la confirmación o refutación de esa base teórica inicial. Si, por el contrario, el investigador no tiene una idea preconcebida acerca de lo que puede encontrar en el corpus y lo explora ‘ingenuamente’, lo que allí encuentre requerirá un procesamiento teórico-hipotético posterior de su parte.

»En cualquier caso, la lingüística de corpus no tiene, en principio, una pretensión explicativa, por lo tanto es inútil buscarla allí. El tercer punto parece más una constatación que un reparo y se refiere al hecho de que el uso de corpus como metodología también define los límites del estudio. Los autores citados reiteran que la utilidad del corpus en los estudios del lenguaje depende de la pregunta que se formule. Esto es cierto. Sin embargo, en el caso de estudios sobre la estructura discursiva, por ejemplo, es indudable que incluir en el corpus solamente una parte y no la totalidad de los textos limita las conclusiones que se extraigan del análisis de dicho corpus. En otras palabras, si, por ejemplo, se excluye sistemáticamente del corpus la parte final de las narrativas donde aparece la coda se perderá información estructural fundamental en dicho estudio.

»Tal como lo señalamos al comienzo de este artículo, las áreas más y mejor desarrolladas de la lingüística de corpus tienen que ver con los estudios léxicos, mediante el uso de etiquetadores (taggers) y analizadores sintácticos (parsers) (focalización local). Queda por desarrollar aún el diseño de herramientas que permitan etiquetar adecuadamente el componente semántico, pragmático y discursivo del corpus, de modo que se pueda aprehender su dimensión holística. A pesar de ello, esperamos haber podido mostrar que con las herramientas y los corpus existentes, de hecho, ya es posible realizar investigación interesante e innovadora en lingüística sistémica y del uso del lenguaje desde sus diversas aproximaciones.»






No hay comentarios:

Publicar un comentario