FIE - Portada Web Recortada

Del 23 al 26 de abril estaremos presentes en el Foro Internacional del Español que se celebrará en Madrid, en el pabellón 14 de IFEMA.

Puedes visitarnos todos los días en el stand 14B14 (junto a la «Plaza de las Letras») y probar de primera mano las características de VICTOR Translator.

Además participamos en dos actividades el jueves 23:

A las 11:30 en la mesa redonda sobre traducción:

INNOVACIÓN EMPRESARIAL EN EL SECTOR DE LA TRADUCCIÓN. BUENAS PRÁCTICAS INTERNACIONALES.

A las 18:00 en un evento sobre Big Data y contenidos digitales:

Qué es el Big Data y qué relación tiene con el lenguaje.

Nos vemos allí.

 

 

Situación actual de VICTOR Translator (abril 2015)

VICTOR Translator es un producto terminado desde el punto de vista del desarrollo del programa informático que es la parte fundamental del traductor.

Hay, no obstante, una limitación que nos impide obtener el resultado deseado cuando traducimos cualquier texto: el diccionario.

Uno de los puntos fuertes de VICTOR es su capacidad para diferenciar la traducción de una misma palabra en inglés en función del contexto, de la frase en la que se está utilizando. El diccionario de VICTOR, que cuenta ya con más de 400.000 entradas, permite «contextualizar» las palabras de una forma muy sutil. Esta ventaja tiene un inconveniente importante: para cada equivalencia de cada palabra hay que indicar el contexto en el que se aplica. El resultado es que el diccionario aún debe seguir creciendo para recoger la riqueza del idioma. No es que falten palabras, es que faltan «situaciones» posibles en las que aparecen.

Este problema se elimina cuando traducimos textos de una misma temática o glosario. Ya hay clientes que utilizan VICTOR con muy buenos resultados. Pero para textos de glosarios poco trabajados los resultados no son buenos.

Si traduce textos largos y sobre una temática recurrente, VICTOR le puede ser de gran utilidad ya. Si su temática es variada, tendrá que esperar algún tiempo hasta que completemos el diccionario con nuevos temas.

VICTOR Translator es un programa de traducción automática del inglés al español desarrollado por MTC Soft, una empresa de software con sede en Granada, por encargo de BERCA Translator, la empresa promotora del proyecto. Este nuevo producto, actualmente en fase de comercialización, pretende revolucionar el mundo de la traducción automática. ¿En que consiste esta revolución? La respuesta es sencilla: VICTOR Translator hace traducciones buenas, cosa que no ha conseguido hasta ahora ningún otro traductor del mercado.

Objetivo
Cuando BERCA Translator arrancó el proyecto de desarrollo de VICTOR, perseguían un objetivo: Conseguir una traducción fiel del texto original en inglés en un lenguaje correcto de forma que el texto obtenido solo precise unos mínimos retoques posteriores, todo ello sin intervención del usuario en el proceso de traducción.

El reto
Hasta el presente no ha habido ningún programa de traducción de textos del inglés al español que obtuviera resultados suficientemente satisfactorios. Hay diccionarios de palabras, de expresiones cortas, muy eficaces y extendidos, pero la traducción de párrafos de cierta longitud no se ha resuelto hasta ahora. Esto se debe a varios factores:

La complejidad del idioma inglés, especialmente el gran número de palabras con múltiples significados
Las diferentes raíces de ambos idiomas que conllevan grandes diferencias entre el inglés y el español, por ejemplo:
Entre las construcciones sintácticas inglesas y españolas
La utilización de expresiones que utilizan las mismas palabras combinadas de diferentes formas

Mientras que la traducción del francés, italiano o catalán al español ha quedado resuelta hace años, los traductores automáticos del inglés al español no consigue resultados fiables.

¿Por qué nadie ha conseguido un traductor del inglés al español hasta ahora?
Aquí en MTC Soft creemos que el fracaso se debe al hecho de que las empresas que lo han intentado han querido usar el mismo análisis básico para diferentes combinaciones de lenguaje de origen y destino, siendo el proceso totalmente distinto para diferentes idiomas. La mayoría de las soluciones anteriores padecían de un fondo deficiente de análisis.

VICTOR - CintaAhora sabemos que la clave de la solución depende de un nuevo enfoque desde el principio: un revolucionario análisis lingüístico completo, sistemático y exhaustivo, prestando especial atención a los errores que han cometido todos los programas anteriores, que parecían imposibles de resolver.

MTC Soft ha contado con una doble experiencia a la hora de enfocar el problema y luego solucionarla. En primer lugar contamos con una traductora profesional con 20 años de experiencia en la Comisión Europea, una gran conocedora de los problemas que encuentran cada día los traductores al utilizar el software existente. Fue esta persona la encargada de realizar el análisis del proceso de traducción y de elaborar un sistema de identificación y etiquetado de todas las palabras de un texto con sus atributos lingüísticos (sustantivo, plural, masculino…)

Una vez creado el análisis lingüístico en lenguaje natural, los programadores de MTC Soft se encargaron de “traducirlo” en un programa informático capaz de crear. de forma totalmente automática, este texto “enriquecido”, el gran reto de conseguir una traducción correcta está prácticamente superado.

Mejoras pendientes de incorporar:

  • La mayor limitación para utilizar VICTOR de forma totalmente automática es la extracción semi-automática de terminología de sectores concretos. Es un proceso lento por la enorme variedad del lenguaje que limita el uso actual a documentos extensos que justifiquen este pretratamiento previo.
  • Además están pendientes algunos pequeños ajustes en la programación para el tratamiento de ciertos casos de frases interrogativas, el género y número de los adjetivos, algunos errores con las mayúsculas, guiones, signos de enumeración…

Aunque de menor importancia, porque no afecta a la calidad, también están previstas otras mejoras:

  • Formato: negrita, subrayado, tipos de letra… De momento VICTOR sólo mantiene algunas características de los textos. El objetivo principal es la calidad del texto, no su formato, pero está previsto mejorar este aspecto y mantener la mayor parte de los atributos de los textos.
  • Formato de archivos. La versión comercial de VICTOR admite documentos en varios formatos: Word, Excel, Txt, HTML… La lista se irá ampliando con el tiempo.
  • Tratamiento de siglas. Funciona correctamente en los formatos más sencillos, pero falla en ocasiones cuando la construcción es más compleja.

La mayor limitación de VICTOR en este momento es el tamaño del diccionario. Hay más de 400.000 palabras y expresiones ya introducidas. La mayor parte corresponden al lenguaje corriente, genérico, aunque también hay varios glosarios de temáticas específicas (que se pueden ver en la página de pruebas de la traducción).

Las frases que incluyen palabras o expresiones que aun no están en el diccionario suelen dar muy mal resultado. La corrección es muy sencilla. Solo hay que introducir esa palabra o expresión para que la traducción de toda la frase cambie radicalmente.

Dada la extensión y variedad del lenguaje, el número actual de glosarios especializados es relativamente pequeño. Para clientes con un volumen elevado de documentos a traducir podemos crearle su propio diccionario personalizado en poco tiempo, incorporando su terminología específica y mejorando la calidad de las traducciones inmediatamente.

La mayor limitación de VICTOR en este momento es el tamaño del diccionario. Hay más de 400.000 palabras y expresiones ya introducidas. La mayor parte corresponden al lenguaje corriente, genérico, aunque también hay varios glosarios de temáticas específicas (que se pueden ver en la página de pruebas de la traducción).

Las frases que incluyen palabras o expresiones que aun no están en el diccionario suelen dar muy mal resultado. La corrección es muy sencilla. Solo hay que introducir esa palabra o expresión para que la traducción de toda la frase cambie radicalmente.

Dada la extensión y variedad del lenguaje, el número actual de glosarios especializados es relativamente pequeño. Para clientes con un volumen elevado de documentos a traducir podemos crearle su propio diccionario personalizado en poco tiempo, incorporando su terminología específica y mejorando la calidad de las traducciones inmediatamente.

¿Cómo funciona el VICTOR Translator cara al usuario?

VICTOR parte de un texto en inglés en formato MS Word (o compatible) y crea otro texto en español, también en Word. VICTOR se ofrece como un servicio, no como un producto (al menos de momento).

El usuario envía el documento por correo electrónico a BERCA Translator y recibe un borrador de calidad unos días después. Téngase en cuenta que para obtener un nivel de calidad satisfactorio, realizamos un pretratamiento del original que nos permite, entre otras cosas, adaptar a él nuestros diccionarios terminológicos y fraseológicos.»

Para dar por terminada la traducción hay que realizar una post-edición manual del borrador generado por VICTOR.

Con este proceso se puede ahorrar entre un 30 y un 60% del tiempo habitual para una traducción manual.

¿Puedo usar VICTOR Translator para cualquier documento?

No. Para conseguir traducciones de calidad, es necesario personalizar el diccionario de VICTOR  para recoger la terminología específica de cada tema o sector. Esto es una limitación que hace a VICTOR poco adecuado para textos cortos de temáticas cambiantes.

Sin embargo, para textos largos, o sobre una temática repetitiva, los resultados son muy buenos y se puede utilizar ya.

¿Podemos ver una muestra de cómo las traducciones hechas por VICTOR se comparan con las de otro traductor, digamos el de Google, por ejemplo?

Por supuesto que sí. El primero de los párrafos siguientes es el original en inglés. El segundo es la traducción hecha por Google. Y la tercera es de VICTOR. Creemos que la diferencia de calidad se nota.
Texto original en inglés:

In addition to providing the legal foundations for the Single Euro Payments Area initiative, the Directive introduces a new licensing regime to encourage non-banks to enter the payments market; sets common standards for terms and conditions with a focus on high levels of transparency; establishes maximum execution times for payments in Euro and other EU currencies; looks to foster the adoption of more efficient payment types; and for some Member States, introduces a shift in liability between providers and customers in the interest of consumer protection.

Traducción de Google (el mejor traductor del mercado basado en estadística):

Además de proporcionar las bases legales para la iniciativa individual Euro Payments Area , la Directiva introduce un nuevo régimen de licencias para alentar a las entidades no bancarias para entrar en el mercado de pagos ; establece normas comunes para los términos y condiciones con un enfoque en los altos niveles de transparencia; establece plazos máximos de ejecución de los pagos en euros y otras monedas de la UE ; mira para fomentar la adopción de tipos de pago más eficientes; y para algunos Estados miembros , supone un cambio en la responsabilidad de los proveedores y clientes , en interés de la protección del consumidor .

Traducción de SYSTRAN (el mejor traductor del mercado basado en reglas lingüísticas):

Además de proporcionar las fundaciones legales para la sola iniciativa euro del área de los pagos, el directorio introduce un nuevo régimen de la autorización para animar a los no-bancos que incorporen el mercado de los pagos; fija los estándares comunes para las condiciones con un foco en niveles de la transparencia; establece los tiempos de ejecución máximos para los pagos en euro y otras monedas de la UE; mira para animar la adopción de tipos más eficientes del pago; y para algunos Estados miembros, introduce un cambio en responsabilidad entre los proveedores y los clientes en el interés de la protección al consumidor.

Traducción de VICTOR:

Además de proporcionar las bases legales para la iniciativa de Zona Única de Pagos en Euros, la Directiva presenta un régimen de licencias para alentar a las entidades no bancarias a entrar en el mercado de pagos; establece normas comunes para las condiciones de crédito haciendo especial hincapié en altos niveles de transparencia; establece plazos máximos de ejecución para los pagos en euros y las otras divisas comunitarias; se propone fomentar la adopción de tipos de pago más eficientes; y para algunos Estados Miembros, invertir la responsabilidad entre los proveedores y los clientes en interés de la protección del consumidor.

Consideraciones generales sobre la calidad de las traducciones

VICTOR Translator es un programa que traduce automáticamente textos formales, bien redactados, de inglés a español. El objetivo de VICTOR no es conseguir una traducción perfecta de cualquier texto introducido. Lo es en teoría, pero no en la práctica.

VICTOR es una herramienta útil que proporcione una traducción de suficiente calidad que pueda utilizar como borrador para una edición final (por un traductor humano) o directamente para entender el contenido de un texto en inglés.

Para conseguir este nivel de calidad, VICTOR se ha desarrollado para un tipo de documentos limitado, amplio, pero con ciertas restricciones.

VICTOR traduce correctamente:

  • Documentos empresariales: folletos, manuales, guías, descripciones de productos, servicios, empresas…
  • Documentos legales: contratos, condiciones de uso, normas de seguridad, calidad…
  • Artículos técnicos, tesis, textos educativos…
  • Artículos y notas de prensa.

En general, textos descriptivos y frases completas (con sujeto, verbo y predicado)

VICTOR no traduce bien, o da peores resultados con:

  • Poesía y obras literarias en general.
  • Chats, foros… textos muy coloquiales con frases incompletas.
  • Frases con errores ortográficos o gramaticales.
  • Frases incompletas: títulos de artículos periodísticos, índices sucintos, enumeraciones…

VICTOR Translator se puede contratar ya como un servicio de traducción con un coste, muy reducido, por palabra traducida.

Puede contratarlo ahora mismo y empezar a traducir sus documentos de inglés a español, aunque recuerde que VICTOR no es eficaz para todo tipo de documentos. Es adecuado para textos largos de una misma temática.

La forma de funcionamiento, actualmente, es mediante el envío de los documentos por correo electrónico a las oficinas de BERCA Translator. Recibirá el documento en español poco tiempo después.

Se admiten documentos en varios formatos y ofrecemos la posibilidad de crear glosarios especializados para clientes de un cierto volumen.

Contacte con nosotros para estudiar su caso concreto.

LinguaBuzz en un producto derivado de VICTOR Translator. Recoge la experiencia de 8 años trabajando en procesamiento del lenguaje natural.

Al fin podrá saber qué están diciendo en Internet

Para localizar las “menciones”, las apariciones de la marca o producto en las redes sociales, blogs, foros… en Internet en definitiva, no hay otra opción que usar “palabras clave”, como hacemos cada día al buscar algo en nuestro buscador habitual. El problema, como también nos ocurre a todos diariamente, es que estas búsquedas devuelven muchos resultados erróneos o irrelevantes.

Es inevitable. El lenguaje es ambiguo, impreciso, polisémico. La mayoría Analisis de sentimentde las palabras significan varias cosas distintas. Y muchas veces aparecen en frases que nada tienen que ver con lo que realmente estoy buscando. Y las herramientas actuales de análisis de opinión no pueden evitar este problema. Son muy poco precisas porque no entienden el significado de las palabras.

Aquí es donde entra en juego LinguaBuzz y su análisis lingüístico.

LinguaBuzz es un producto derivado de un traductor automático, VICTOR Translator, desarrollado durante 8 años. Analiza y etiqueta cada palabra de cada frase y asigna las funciones gramaticales de cada una (sustantivo, verbo, adjetivo…) así como las relaciones sintácticas entre ellas: cuál es el sujeto de la frase, el objeto directo… o qué adjetivo acompaña a qué sustantivo.

Después de analizar y etiquetar todas las menciones localizadas porque contienen las “palabras clave” puedo saber las que realmente están diciendo “algo” que me interesa, descartando la “basura”, el ruido que no me interesa.

Este análisis lingüístico es lo que distingue a LinguaBuzz de los productos similares.

Sabemos de qué se habla, no solo qué palabras se usan. Es una gran diferencia.

Tras «filtrar» los resultados utilizando la información lingüística, LinguaBuzz muestra los resultados en un formato gráfico claro y sencillo de interpretar.

Además, al analizar cada frase, LinguaBuzz extrae automáticamente los «objetos» sobre los que se opina y el sentido o «Sentiment» de la opinión (positiva, negativa o neutra). Esta información se incorpora a los gráficos que me indican, no solo quién y de qué se está opinando, sino también si la opinión es positiva o negativa.

Y, todo esto, con un grado de acierto muy elevado. Ahora sí podemos utilizar estos datos para sacar conclusiones y tomar decisiones sobre nuestra estrategia de marketing.

Para qué sirve

La función más evidente de LinguaBuzz es realizar estudios de mercado utilizando los comentarios que se publican en Internet, de una forma automática, exhaustiva y precisa.

Pero hay otros muchos usos de estos informes sobre productos, marcas… o personas.

  • Análisis de mis productos en relación con los de la competencia.
  • Búsqueda de los lugares (sites en Internet) más apropiados para hacer las campañas de marketing.
  • Estudio del impacto de una campaña de marketing (on line o con medios tradicionales).
  • Segmentación de la publicidad en las redes sociales: identificación de los usuarios de Facebook, Twitter… más apropiados para ofrecerles determinados productos.
  • Identificación de trolls en las redes sociales (personas que solo escriben comentarios negativos, sobre una marca concreta o en general).

Hay muchas formas de sacar partido a la enorme cantidad de información que proporcionan los informes que genera LinguaBuzz. Consúltenos su necesidad y estudiaremos la forma de satisfacerla.

Más información en www.linguabuzz.es

Fuente: La Opinión de Granada

Víctor, el traductor más formal

Su principal novedad radica en su capacidad para ´entender´ el mensaje, fruto del trabajo de una filóloga durante una década.
CARMEN BANDERA: Su nombre es Víctor y aunque pueda parecer que se trata de una persona, en realidad es un revolucionario programa de traducción automática del inglés al español desarrollado por MTC Soft, una empresa de software con sede en Granada, por encargo de BERCA Translator, la firma promotora del proyecto.

Su principal novedad radica en su capacidad para transcribir no sólo las palabras de un texto, sino también su sentido, es decir, para ´entender´ el mensaje.»Hasta ahora nadie había creado un traductor con el nivel necesario para abarcar trabajos profesionales, y para hacerlo había que empezar de cero con un nuevo análisis del problema», señala Fernando Moreno-Torres, director de la empresa.

Ese nuevo análisis provino de una filóloga y traductora profesional con más de 20 años de experiencia en la Comisión Europea en Bruselas. Tras desarrollar un nuevo sistema durante una década, se puso en contacto con MTC Soft hace tres años y medio para la creación de las aplicaciones informáticas. El resultado acaba de ver la luz y ha tenido una excelente acogida entre traductores, académicos y empresarios. «La aportación del análisis lingüístico fue lo que posibilitó todo el proyecto,» explica Moreno-Torres, «permitiéndonos sacar un traductor netamente mejor que todos los que le habían precedido. Estamos hablando de unos resultados del orden del 95% correctos».

Hay varios puntos claves en Víctor. En primer lugar, el proceso de análisis lingüístico que convierte ´texto plano´ en ´texto enriquecido´. Es decir, el traductor somete una frase a más de 180 procesos distintos en solo unos segundos y devuelve un texto con todos sus elementos analizados y etiquetados con sus características lingüísticas. Gracias a este proceso analítico, el programa no sólo traduce palabras, sino el sentido de las palabras.

Otro de los grandes retos fue conseguir una traducción correcta al español, eligiendo las equivalencias adecuadas para cada palabra. Para ello, hubo que crear un diccionario propio con información exhaustiva de cada palabra y cómo se relacionan entre sí. «Lo que más me sorprende del diccionario es su capacidad de aprender las sutilezas del lenguaje. Cada vez el programa aprende más palabras y hay que corregir menos cosas. Sale un español casi perfecto», manifiesta Moreno-Torres. «El programa sabe distinguir las acepciones de las palabras gracias a su capacidad para aprender, por lo que se elimina esa equivalencia fuera de lugar que tanto nos fastidia de los traductores automáticos», continúa.

Víctor no está pensado para cualquier tipo de textos, no traduce el lenguaje coloquial, ya que su función es convertir al español escritos formales, escritos en un inglés correcto, como contratos, manuales, artículos técnicos, etc.

No es un software que se pueda comprar e instalar en el ordenador, sino un servicio que ofrece MTC Soft. «El cliente nos manda un texto en inglés y nosotros lo traducimos, lo revisamos (solo hasta completar su diccionario personalizado), y se lo devolvemos en español. En poco tiempo se convierte en un servicio on-line totalmente automático», apunta el director de la empresa.

El programa sólo traduce del inglés al español y no al revés, «porque el proceso no es nada simétrico». En principio, no está previsto realizar otro programa que traduzca a la inversa.

MTC Soft, fundada en Granada a principios de los 90, comenzó su trayectoria desarrollando aplicaciones de gestión para las notarías españolas, y más tarde para los registros de la propiedad. En los últimos años ha diversificado su oferta para incluir otras aplicaciones más generales, como la gestión documental o la traducción automática.