AMETRA
Ayuda a la traducción basada en memorias
de traducción.
Documentos, informes y especificaciones
AMETRA es un proyecto tecnológico de cooperación, cofinanciado por el Departamento de Industria del Gobierno Vasco, a través del INTEK.
El proyecto AMETRA se sitúa en el terreno de los sistemas
de memorias de traducción y tiene como objetivo el desarrollo de una
herramienta de Traducción Asistida por Ordenador (TAO), en la que se
combinen técnicas de Memorias de Traducción, Análisis Lingüístico
y Métodos Estadísticos.
Se plantea como continuación natural del proyecto ACOTE (2000-2001),
cuyo objeto era el desarrollo de útiles de ayuda a la traducción
(alineador de corpus bilingües y visualizador de concordancias).
Al igual que en el anterior proyecto, las lenguas tratadas serán el castellano y el euskera, y se plantea su aplicación en el ámbito de las traducciones administrativas (boletines oficiales, documentos legales, etc.).
La práctica totalidad de sistemas de ayuda a la traducción (Trados, WordFast...) se basan en comparaciones de las frases de entrada con las almacenadas en las memorias de traducción, y utilizan para ello técnicas basadas en lógica difusa, que dan como resultado las frases almacenadas en la base de datos que más se asemejan formalmente a la frase de entrada, expresando dicha similitud en porcentajes. Últimamente, algunos (principalmente, DéjàVu) han aplicado técnicas de análisis lingüístico, pero a un nivel muy superficial, para conseguir cierto tipo de segmentación inferior a la frase. Dicho análisis lingüístico se limita a las derivaciones de palabras que se puedan establecer a nivel formal, y a la etiquetación de categoría gramatical para cada una de las palabras. En ninguno de los casos se aplican técnicas de análisis estadístico orientado a los corpus y la traducción.
A consecuencia de las limitaciones de los actuales sistemas basados en memorias de traducción, el grado de insatisfacción de los traductores humanos que utilizan estos programas es alto, debido en gran medida a que el grado de similitud real entre las unidades de traducción de los textos supuestamente repetitivos es bastante menor de lo que a primera vista podría parecer.
Partiendo de la experiencia que en diversos campos poseemos los participantes en este proyecto, nuestra propuesta es la aplicación, de forma cooperante, de diversos análisis y modelos, para poder aprovechar la repetición y similitud real (no formal) de los textos para la creación de nuevas traducciones. Se propone utilizar e integrar las siguientes técnicas:
Asimismo, se integrarán también los siguientes mecanismos suplementarios:
La aplicación cooperante, en una sola herramienta, de todas esas técnicas, nos hace presuponer un avance importante en la productividad de los traductores humanos y una mejora de expectativas de cara a la traducción automática.
Entendemos este proyecto como continuación natural del proyecto ACOTE, que a su vez surgió de la necesidad planteada en diversas ocasiones por diferentes grupos de traductores de textos al euskera, de una herramienta que permita aprovechar el corpus de textos alineados disponible para facilitar la traducción de textos que generan un bajo nivel de variaciones fundamentales.
El resultado del proyecto AMETRA proporcionará las bases suficientes para la creación de un sistema de Traducción Automática Basada en Ejemplos (EBMT, Example-Based Machine Translation). Dicho objetivo de futuro supondría el paso de la Traducción Asistida por Ordenador (TAO), a la Traducción Automática (TA) para textos en cuyo ámbito existan corpus bilingües mínimamente significativos.
Adur Software Productions S.C.: Líder
Rosetta Testu Zerbitzuak, S.L.
Institut Tecnològic dInformàtica
Ametzagaiña A.I.E.: Agente tecnológico
UPV-EHU: Agente tecnológico
Enero 2002 - Diciembre 2004