Terminótica y corpus electrónico

4 créditos
Asignatura obligatoria
Módulo de especialización
Código: SAH011

Presentación

Distintas herramientas de la terminótica y la lingüística de corpus contribuyen a que el traductor acceda de forma rápida y fiable a la terminología, a crear sus propias bases de datos terminológicas, a consultar grandes cantidades de texto en busca de términos, de colocaciones, de concordancias. Además, algunos programas permiten hoy día la extracción automática de términología monolingüe o multilingüe a partir de textos.

En esta materia el traductor podrá profundizar en el uso de la base de datos terminológica Multiterm y el programa de extracción de terminología de Trados, entre otras, conocer las ventajas, inconvenientes y técnicas de creación y consulta de corpus electrónicos, y crear y consultar diccionarios electrónicos.

Esta materia se compone de tres grandes campos:

  1. Diccionarios electrónicos.
  2. Lingüística de corpus aplicada a la Traducción.
  3. Extracción automática de terminología y gestión de bases de datos terminológicas.

Diccionarios electrónicos

Introducción

Esta asignatura tiene como objetivo seleccionar y explotar al máximo las posibilidades de las fuentes lexicográficas y terminológicas más relevantes disponibles en línea. Se hará especial hincapié en la evaluación de las fuentes en función de su autoría, su contenido y su relevancia.

Objetivos

  • Capacitar a los estudiantes para ser capaces de evaluar y utilizar de manera adecuada los diccionarios, glosarios y bancos de datos disponibles en línea.

Contenidos

  1. Definiciones básicas: diccionario, glosario, léxico, banco de datos terminológicos (Martínez de Sousa, 1996 y 1999).
  2. Características de los diccionarios en línea (Torruella, 2002).
  3. Evaluación de diccionarios, glosarios, bancos de datos electrónicos (siguiendo a Budin y Wright, 2001 y Palomares, 1999).
  4. Ubicación de fuentes lexicográficas y terminológicas en línea: buscadores de glosarios, JIAMCATT, etc.
  5. Tesauros: uso como herramienta terminológica multilingüe.

Metodología

La metodología es eminentemente práctica. Todas las clases se desarrollarán íntegramente en el laboratorio de traducción, que dispone de programas específicos para el desarrollo de la asignatura. Los estudiantes realizarán tareas durante las clases y también tendrán que realizar otras actividades fuera de las clases.

Evaluación

A partir de un texto especializado, identificación de diez dificultades lexicográficas o terminológicas y búsqueda de resultados en fuentes de distinto tipo (glosario, diccionario, banco de datos). Valoración de los resultados aplicando los parámetros vistos.

Bibliografía

BUDIN, G. Y S.E. WRIGHT (2001): Terminology Resources on the Internet. En WRIGHT, S.E. Y G. BUDIN (2001): Handbook of Terminology Management. Vol. 2. Amsterdam: John Benjamins.

GELPÍ, C. (1999): [en línea] Diccionarios del español en Internet. Biblio 3W. Revista Bibliográfica de Geografía y Ciencias Sociales. Universidad de Barcelona, Nº 189. http://www.ub.es/geocrit/b3w-189.htm. [Fecha de consulta: octubre 2005].

GONZALO GARCÍA, C. Y V. GARCÍA YEBRA. (2004): Manual de documentación y terminología para la traducción especializada. Madrid: Arco/Libros.

MARTÍNEZ DE SOUSA, J. (1996): Diccionario de lexicografía práctica. Barcelona: Bibliograf.

MORALA, J.R. (2002): “Nuevas tecnologías y recursos lexicográficos: fuereño”. En: CLAVERÍA, G. (2002). Filología en Internet. Barcelona: Universitat Autònoma de Barcelona. Servei de Publicacions.

PINTO, M. Y J.A. CORDÓN (1999): Técnicas documentales aplicadas a la traducción. Madrid: Síntesis.

TORRUELLA, J. (2002): “Los diccionarios en la Red”. En: CLAVERÍA, G. (2002): Filología en Internet. Barcelona: Universitat Autònoma de Barcelona. Servei de Publicacions.

Lingüística de corpus

Introducción

Uno de las principales dificultades que debe afrontar el traductor, y en concreto el traductor especializado, es el manejo y resolución de problemas terminológicos. En muchos casos, estos problemas se resuelven mediante la consulta de fuentes autorizadas que recogen información en más de una lengua. Sin embargo, en algunas ocasiones la información que proporcionan estas fuentes es insuficiente, por lo que el traductor debe desarrollar estrategias alternativas que le permitan obtener información por otros medios. Esta asignatura está dedicada a crear estas estrategias alternativas que permitan al traductor especializado obtener información terminológica, factual y lingüística a partir del análisis de corpus ad hoc.

Objetivos

  • Familiarizarse con la metodología de explotación de corpus en un entorno de traducción de textos sobre tecnología.
  • Aprender a buscar y obtener los textos necesarios para la creación de un corpus ad hoc.
  • Reconocer los diferentes elementos lingüísticos a través de los cuales se puede obtener información terminológica, factual o lingüística.
  • Deducir nuevas estrategias de explotación de corpus partiendo de la intuición lingüística.
  • Aplicar el uso de corpus generales para la resolución de problemas concretos de traducción.

Contenidos

1. Introducción a la Lingüística de corpus aplicada a la Traducción.
1.1 Qué es un corpus.
1.2 Problemas de traducción que se pueden solventar con corpus.
2. Corpus generalistas en línea.
2.1 Corpus y herramientas que se pueden consultar en línea.
2.2 Problemas de traducción que pueden resolver.
3. Creación y explotación de un corpus ad hoc.
3.1 Cuándo es necesario recurrir a un corpus ad hoc.
3.2 Cómo se compila: cuestiones de documentación.
3.3 Cómo se explota:
3.3.1 WordSmith Tools: ejemplo de gestor de corpus.
3.3.2 Presentación y desarrollo de estrategias de explotación.

Metodología

La metodología es eminentemente práctica. Todas las clases se desarrollarán íntegramente en el laboratorio de traducción, que dispone de programas específicos para el desarrollo de la asignatura. Los estudiantes realizarán tareas durante las clases y también tendrán que realizar otras actividades fuera de las clases.

Evaluación

El final de la asignatura estará dedicado a la resolución de ciertos problemas de traducción. Estos problemas se presentan en la FICHA DE EVALUACIÓN y se podrán resolver individualmente o por parejas.

Bibliografía

BALL, N. CATHERINE. Tutorial: Concordances and Corpora. Departament of Linguinstics, Georgetown University. http://www.georgetown.edu/cball/corpora/tutorial.html [Consulta: 4 de marzo de 2005]

BARBERÁ, MANUEL. Corpus based computacional linguistic resources. General: Multilingual. 28 de agosto de 2000, actualizado el 22 de enero de 2002. http://www.bmanuel.org/clr2_mp.html [Consulta: 4 de marzo de 2005].

BORIN, L. (Ed.) (2002): Parallel Corpora, Parallel Worlds: Selected Papers from a Symposium on Parallel and Comparable Corpora at Uppsala University, Sweden, 22-23 April, 1999 (Language & Computers S.). Amsterdam y Atlanta: Rodopi.

GRANGER SYLVIANE ET AL. (Eds.) (2003): Corpus-based Approaches to Contrastive Linguistics and Translation Studies (Approaches to Translation Studies S.). Amsterdam y Atlanta: Rodopi.

MCENERY, TONY Y WILSON, ANDREW (2000): Corpus Linguistics. Research Issues in Applied Linguistics. (Resumen del libro del mismo título publicado por los mismos autores, Edingourth University Press. Paul Baker, Lancaster Univ.). http://www.ling.lancs.ac.uk/monkey/ihe/linguistics/contents.htm [Consulta: 4 de marzo de 2005]

SÁNCHEZ-GIJÓN, PILAR (2004): L’ús del corpus en la traducció especialitzada: compilació de corpus ad hoc i extracció de recursos terminològics. Barcelona: IULA, UPF – Departament de Traducció, UAB.

TIEDEMANN, J. (2003): Recycling Translations: Extraction of Lexical Data from Parallel Corpora & Their Application in Natural Language Processing (Studia Linguistica Upsaliensia,1). Uppsala Universitet.

VERONIS, J. (Ed.) (2000): Parallel Text Processing: Alignment and Use of Translation Corpora (Text, Speech, & Language Technology). Kluwer Academic Publishers.

Extracción automática de terminología y Terminótica

Introducción

Distintas herramientas de la terminótica y la lingüística de corpus contribuyen a que el traductor acceda de forma rápida y fiable a la terminología, a crear sus propias bases de datos terminológicas, a consultar grandes cantidades de texto en busca de términos, de colocaciones, de concordancias. Además, algunos programas permiten hoy día la extracción automática de terminología monolingüe o multilingüe a partir de textos.

En esta asignatura el traductor podrá profundizar en el uso de la base de datos terminológica Multiterm y el programa de extracción de terminología Extraterm de SDL-Trados, conocer las ventajas, inconvenientes y técnicas de creación y consulta de corpus electrónicos, y crear y consultar diccionarios electrónicos.

Objetivos

  • Conocer los métodos y técnicas de extracción de términos.
  • Manejar programas de extracción terminológica.
  • Aprender el funcionamiento de una base de datos terminológica.
  • Manejar un programa de gestión de bases de datos terminológicas.

Contenidos:

1. Introducción a la extracción terminológica
1.1 Aspectos preliminares: glosarios y traducción
1.2 Selección datos terminológicos
2. Herramientas de análisis y extracción de términos
2.1 InfoRapid en la búsqueda de términos
2.2 Extracción, validación y gestión de terminología con Extraterm
2.3 Otras herramientas de extracción de terminología
3. Multiterm
3.1 Introducción a las bases de datos y a MultiTerm
3.2 Búsqueda terminológica
3.3 Creación y edición de una base de datos
3.4 Intercambio de datos terminológicos para la traducción

Metodología

Las clases serán eminentemente prácticas, aunque a veces serán necesarias explicaciones teóricas que apoyen los contenidos prácticos. A través de las distintas sesiones se analizarán las distintas tareas que componen el proceso de extracción, creación y gestión de terminologías. Para ello, se profundizará en el manejo de las herramientas Extraterm y SDL Multiterm mediante explicaciones y ejercicios prácticos. Los asistentes podrán trabajar los contenidos de la asignatura dentro y fuera del aula y elaborar una base de datos terminológica que podrán utilizar en su carrera profesional.

Evaluación

Forman parte de la evaluación las tareas realizadas a lo largo de toda la asignatura (50%) y un trabajo de extracción y creación de una base de datos terminológica (40%) que se realizará fuera del aula. Además, se pedirá la elaboración de una reseña sobre 2 de las obras indicadas en el apartado de bibliografía básica (10%). Se valorará la autonomía en la utilización de herramientas, la usabilidad y pertinencia de las propuestas y la participación.

Bibliografía

ALCINA CAUDET, A. (2008): «Metodología y tecnologías para la elaboración de diccionarios terminológicos onomasiológicos» en A. Alcina (ed.) Terminología y Sociedad del conocimiento. Berna: Peter Lang.

BOWKER, L. (2003): «Terminology Tools for Translators» en SOMERS, HAROLD (ed.) (2003): Computers and Translation: A Handbok for Translators. Philadelphia: John Benjamins, 49-65.

CABRÉ, M.T. (2004): «La terminología en la traducción especializada», En C. GONZALO GARCÍA y V. GARCÍA YEBRA (EDS.) Manual de documentación y terminología para la traducción especializada. Madrid: Arco Libros.

CABRÉ, M.T., R. ESTOPÀ y J. VIVALDI (2001): «Automatic term detection: A review of current systems», En BORIGAULT, D.; CH. JACQUEMIN Y M.C. L’HOMME (EDS.) Recent Advances in Computational Terminology. Amsterdam/Philadelphia: John Benjamins, 53-87.

DÜSTERBECK, B. y W. HESSER (1997): «Terminology-based Knowledge engineering in Enterprises», En WRIGHT, S.E. y G. BUDIN (eds.): Handbook of Terminology Management, vol. 2. Philadelphia: John Benjamins, 480-485.

ESTOPÀ BAGOT, R. (2000): «Extracción de terminología: elementos para la construcción de un extractor», Actas de la Escuela de Terminología de Invierno de la Universidad de Sao Paulo, Brasil: Universidad de Sao Paulo. Disponible en línea: http://www.upf.edu/pdi/dtf/rosa.estopa/docums/saopaulo.pdf

MEYER, I. (2001): «Extracting knowledge-rich contexts for terminography: A conceptual and methodological framework», En BORIGAULT, D.;

CH. JACQUEMIN Y M.C. L’HOMME (EDS.) Recent Advances in Computational Terminology. Amsterdam/Philadelphia: John Benjamins, 279-302.

SCHMITZ, K.D. (2001): «Criteria for Evaluating Terminology Databases» en WRIGHT, S.E. y G. BUDIN (eds.): Handbook of Terminology Management. Philadelphia: John Benjamins, vol. 2, 539-551.

WRIGHT, S.E. (2001): «Terminology Management Entry Structures» en WRIGHT, S.E. y G. BUDIN (eds.): Handbook of Terminology Management. Philadelphia: John Benjamins, vol. 2, 572-599.

Bibliografía para profundizar:

ALCINA CAUDET, A. y S. GAMERO PÉREZ (2002): La traducción científico-técnica y la terminología en la sociedad de la información. Castellón: Universitat Jaume I.

ARNTZ, R. y H. PICHT (1995): Introducción a la terminología. Madrid: Fundación Germán Sánchez Ruipérez.

BERNTH, A.; M. MCCORD y K. WARBURTON (2003): «Terminology Extraction for Global Content Management», Terminology, 9(1), 51-69.

CABRÉ, M.T. (1993): La terminología. Teoría, metodología, aplicaciones. Les Naus d’Empúries, Barcelona: Empúries.

GONZALO GARCÍA, C . y V. GARCÍA YEBRA (2004): Manual de documentación y terminología para la traducción especializada. Madrid: Arco Libros.

GUERRERO RAMOS, G. y M. F. PÉREZ LAGOS (eds.) (2002): Panorama actual de la terminología. Granada: Comares.

L’HOMME, M.C. (2000): Initiation à la traductique. Québec: Linguatech.

SAGER, J.C. (1993): Curso práctico sobre el procesamiento de la terminología, Fundación Germán Sánchez Ruipérez.

SOMERS, H. (ed.) (2003): Computers and Translation: A Handbook for Translators. Philadelphia: John Benjamins.
Trados specialist Guide.

Deja una respuesta