El “estado del arte” de la traducción automática

Entrevista con el actual Jefe de Proyecto VICTOR Translator

VICTOR Translator es un sistema informatizado de traducción automática del inglés al español, desarrollado por MTC Soft de Granada.

¿Cuál ha sido tu papel en el desarrollo de VICTOR?
Jefe de proyecto, además de analista y programador.

¿Cuánta gente ha trabajado en el proyecto?
El análisis lingüístico es obra del promotor de la idea, un traductor profesional de la Comisión Europea con más de 25 años de experiencia.
En el desarrollo de la aplicación informática, el director de proyecto, que ha trabajado también como analista en los dos primeros años del desarrollo
y dos analistas – programadores durante todo el proceso de desarrollo de software (los diccionarios y el propio traductor).
30 alumnos y 6 profesores de la Facultad de Traducción e Interpretación de la Universidad de Granada para crear la primera versión de los diccionarios, y 6 becarios para completar y alimentar esos diccionarios.

¿Cuánto tiempo ha durado el desarrollo hasta llegar a la versión beta?
El análisis lingüístico se remonta a 10 años atrás. El primer diseño de la aplicación nos ocupó aproximadamente un año.
La creación de los diccionarios (tanto el programa como el contenido) un año. Para lanzar la versión beta del traductor desde que terminamos os diccionarios, algo más de un año.  En ambos productos seguimos trabajando.
En su conjunto podemos resumir el proyecto en 10 años, de los cuales los últimos 3 y medio los hemos dedicado al desarrollo de la aplicación.

En los últimos 3 años se ha realizado pequeños ajustes pero el trabajo principal es la ampliación de los diccionarios, que ya no es un trabajo informático sino de traductores.

¿Nos puede explicar un poco el proceso de creación de un traductor automático?  ¿Cuáles son los escollos más difíciles? ¿Cuáles fueron las sorpresas más duras que tuvisteis que sortear?
El principal trabajo para crear un traductor automático es el análisis lingüístico que el traductor ha realizado durante su trabajo.
Para nosotros lo más difícil fue convertir ese análisis lingüístico, en lenguaje natural, al lenguaje informático, es decir, a un programa informático.
El principal trabajo fue desarrollar una plataforma informática para poder convertir las subprocesos de traducción en rutinas informáticas.
Una vez creada esta plataforma la dificultad es entender esas rutinas en lenguaje natural (que son procesos mentales) y plasmarlas en líneas de código (procesos computacionales).
Nuestras sorpresas son los cambios continuos que hace el traductor de algunas fases de traducción para mejorarlas, ya que los resultados del trabajo son muy valiosos para comprobar la validez del proceso y han dado lugar a numerosos ajustes.

¿Qué es lo que hace VICTOR Translator que no hacen los demás?
Un análisis lingüístico profundo del texto alimentado por unos diccionarios muy completos, clasificados por glosarios (por temas) y que están continuamente alimentándose de nuevos conceptos, estructuras sintácticas y semánticas.

Y eso, ¿cómo se ha conseguido?
Por el análisis lingüístico inicial, por los diccionarios hechos a media para ese análisis y por la plataforma informática que hemos creado para codificar los procesos de traducción.

¿Qué tipos de clientes se prevé para VICTOR Translator? Es decir, ¿quién necesita a VICTOR?
En una primera fase, Empresas que necesiten traducir una gran cantidad de documentos orientados a un tema concreto (glosarios).
Traductores que necesiten un análisis previo del documento a traducir o un primer borrador para trabajar sobre él sin necesidad de empezar desde cero.
Más adelante, cuando vayamos creando glosarios de más temas, cualquier persona que necesite una traducción rápida y fiable.

¿VICTOR Translator tiene aplicaciones más allá de la simple traducción automática? ¿Cuáles podrían ser?
Etiquetado lingüístico de textos. Memorias de traducciones. Búsquedas semánticas. Clasificación de textos. Ayuda a los traductores.

Hay un producto derivado de VICTOR que se utiliza desde hace años para el análisis de reputación digital. Puedes verlo en www.linguabuzz.es

Me gustaría plantearle un reto a VICTOR Translator aquí mismo. ¿Sería capaz de traducir, mano a mano, tres o cuatro textos con distintos temas y grados de dificultad?
Te dejo a ti escoger los textos. Supongo que habréis hecho estas pruebas ya, ¿verdad?

Me gustaría publicar los resultados en la página web de VICTOR. Sería lo siguiente:

  • Unos párrafos originales en inglés.
  • La traducción al español de cada uno hecha por un traductor automático previo al VICTOR Translator. (Vamos, la   competencia…)
  • Las traducciones de VICTOR Translator.

Éste es un párrafo con el que hicimos la demo cuyo resultado es muy bueno.

Te doy el texto en ingles, la traducción de Google y la de VICTOR.

“Eurostat, in its press release, stated that it was not in a position to certify the
figures included in the notification of Portugal, due, among other reasons, to
shortage of information on capital injections from the Portuguese government to
public corporations,which had been treated as acquisition of shares and other
equities with no effect on the government deficit.”

Traducción de Google:

“Eurostat, en su comunicado de prensa, declaró que no estaba en condiciones de
certificar las cifras consignadas en la notificación de Portugal, debido, entre
otras razones, a la escasez de información sobre las aportaciones de capital de
que el Gobierno portugués a las empresas públicas, que había sido tratados como
la adquisición de las acciones y otras, sin efecto sobre el déficit público.”

Traducción de Victor:

“Eurostat, en su comunicado de prensa, afirmó que no estaba en condiciones de
certificar las cifras incluidas en la notificación de Portugal, debido, entre
otras razones, a la escasez de la información sobre las inyecciones de capital del
gobierno portugués para las empresas públicas, que había sido tratada como la
adquisición de las participaciones y otros valores sin efecto alguno en el déficit público.”