Traducción automática

De Freepedia, la enciclopedia libre.

Puedes colaborar con Wikipedia mejorando este artículo.
En la página de discusión aparecen ideas concretas sobre cómo mejorarlo.


La traducción automática consiste en convertir un texto de un idioma a otro automáticamente, por medio del ordenador. Se trata de una disciplina que ha contribuido de manera determinante al desarrollo de la lingüística computacional. Es seguramente también una de las aplicaciones informáticas que mayores recursos humanos y económicos ha recibido. El mercado ofrece en la actualidad un amplio abanico de productos y es difícil para el profano elegir el más adecuado para sus necesidades. Con todo, es importante saber que un texto producido por un sistema de traducción automática debe ser revisado con cuidado antes de darlo por válido y publicarlo. Hay veces, sin embargo, que no es necesario obtener resultados de calidad y basta con una aproximación al contenido, si lo que queremos es detectar por ejemplo información relevante o crítica.

Tabla de contenidos

La traducción como problema

La traducción es hoy en día el principal cuello de botella de la sociedad de la información y su mecanización supone un importante reto para paliar el problema de la [[comunicación translingüístla traducción. Por ejemplo, los niveles de calidad obtenidos para lenguas romances (español, portugués, catalán o gallego) son en la actualidad muy altos. Sin embargo, los resultados empeoran ostensiblemente cuanto más se alejan tipológicamente las lenguas, como es el caso de la traducción entre español e inglés. Otro factor muy influyente es el grado de especialización del sistema, atendiendo al tipo de texto y vocabulario que se va a traducir. Un sistema que se especializa en traducir partes meteorológicos, por ejemplo, no servirá para crónicas deportivas.

Traducir es una de las artes más elevadas y que más talento y dedicación requiere. No basta con sustituir una palabra por otra, sino de ser capaz de reconocer todas las palabras de una frase y la influencia que tienen las unas sobre las otras. Los lenguajes humanos constan de morfología (la forma en que se construyen las palabras a partir de pequeñas unidades provistas de significado), sintaxis (la estructura de una frase) y semántica (el significado). Hasta el texto más simple puede estar plagado de ambigüedades. También hay que considerar cuestiones de estilo y de discurso o pragmáticas. Sin embargo, hay métodos estadísticos que realizan traducciones sin reparar en cuestiones gramaticales. En la actualidad la tendencia es a integrar todo tipo de metodologías: lingüísticas, estadísticas, u otras, como las basadas en corpus.

Historia de la traducción automática

La aspiración de obtener artilugios mecánicos que sirvan para superar las barreras lingüísticas viene de antiguo. En el siglo XVII se habla de la utilización de diccionarios mecánicos (basados en códigos numéricos universales) para superar las barreras del lenguaje, dentro de un movimiento a favor de la creación de una “lengua universal” no ambigua, basada en principios lógicos y símbolos icónicos, que permitiese comunicarse a toda la humanidad. Este empeño precede por bastante tiempo a la propia existencia del ordenador. Por ello, se puede entender que desde el momento en que un ordenador estuvo disponible en la década de 1940, la traducción automática pasó a convertirse inmediatamente en una de las aplicaciones estrella de la informática.

Desde entonces, ha dado tiempo a realizar numerosos experimentos, pequeños y grandes, así como inversiones institucionales e industriales sustanciosas. Un referente obligado para conocer con más detalle la evolución de la traducción automática es el académico británico John Hutchins, cuya bibliografía puede, por suerte, ser consultada libremente en Internet. En esta breve reseña de la TA vamos a seguir el esquema simplificado de Johnatan Slocum, que aborda la historia de la TA por décadas. A sus cuatro décadas hasta 1985 vamos añadir dos más: seis décadas.

Sistemas de Traducción Automática

Se dividen en sistemas bilingües o multilingües. Los sistemas bilingües están desarrollados para un único par de lenguas. En cambio, los sistemas multilingües se desarrollaron para traducir a diversos pares de lenguas: de una única lengua origen son capaces de traducir a varias lenguas metas.

Dirección de la Traducción

Las traducciones pueden hacerse en una única dirección, por ejemplo del inglés al español; en este caso la traducción sería unidireccional. son bidireccionales aquellos que traducen de una lengua a otra y viceversa, por ejemplo del ingés al español y del español al inglés.

Grado de Automatización

Los sistemas de traducción totalmente automática, son aquellos que realizan la traducción sin intervención alguna del traductor humano (salvo en la revisión).

En los sistemas de traducción asistida la intervención del traductor humano es constante.

En los sistemas de traducción humana asistida por ordenador, el ordenador se utiliza como herramienta de ayuda al traductor, facilitándole el uso de, por ejemplo, procesadores de textos con diccionarios en línea, información gramátical y morfológica de las palabras, verificación ortográfica etc.

Enfoque

Desde el punto de vista del diseño hay tres enfoques diferentes de traducción automática. Los sistemas adoptan un determinado tipo de diseño que permite que las traducciones se desarrollen de una forma u otra, de tal forma que varía el resultado obtenido. Los diferentes sistemas son: los sitemas directos, los de transferencia y los sistemas interlingua.

Los sistemas de traducción directa, podrían equipararse con grandes diccionarios. Generalmente realizan la traducción casi palabra por palabra, ya que la información sintáctica que poseen es mínima. Por ello los resultados que ofrecen suelen ser bastante pobres.

Los sistemas de transferencia contienen además de grandes léxicos bilingües y multilingües, un amplio conocimiento sintáctico y semántico de las lenguas tratadas. Esto permite traducir palabras de una lengua a otra teniendo en cuenta además el contexto morfológico, sintáctico y semántico de la frase. Es capaz de llevar a cabo también la transferencia estructural, es decir, los cambios en el orden de elementos y en la estructura de la frase para adecuarse a la de cada lengua.

Los sistemas interlingua: Se lleva a cabo un análisis mucho más profundo de la frase. La idea detrás de este enfoque, es el crear un lenguaje artificial conocido como "interlingua", el cual comparte todas las características y hace todas las distinciones entre todos los idiomas. Para traducir entre dos diferentes idiomas, se usa un analizador para convertir el texto en idioma fuente al interlingua, y un generador que convierte el interlingua en el texto en idioma objetivo. "Aunque teóricamente se trataría del mejor enfoque de los tres, en realidad estos sistemas están en fase de laboratorio o se utilizan para aplicaciones muy restringidas, debido a los problemas prácticos que presenta el diseño y la implementación de una “interlingua” eficaz."

"Hay que tener en cuenta que no existen sistemas puros de traducción directa, de transferencia o interlingua, sino sistemas que se aproximan más a un enfoque determinado, pero que también pueden tener características de los otros sistemas."

Ventajas e inconvenientes de cada enfoque

Como hemos dicho anteriormente existen dos tipos de traducción automática: transferencia e interlingüa para traducir textos. La primera consta de tres fases: procesación, transferencia y generación. En la interlingüa no encontramos fase de transferencia. Ambas tienen sus ventajas e inconvenientes. A continuación mediante el link podemos acceder a la página ofrecida por Arturo Trujillo de la que hemos extraído la información y en la que se amplia el tema [1]

Traducción automática por transferencia: es demasiado caro para hacerlo entre más de dos lenguas, debido a que se necesitaría un módulo de transferencia específico por cada dos lenguas. Lo que como antes he dicho sería muy caro y se pude considerar su mayor ámbito de problemas. Cada lengua tiene unas estructuras semánticas y sintácticas; éstas a su vez están compuestas por otras. El problema viene cuando las estructuras en la lengua en que tenemos el texto y la lengua en la que lo queremos traducir no siguen la misma linealidad. Durante la transferencia las estructuras de una lengua deberán cambiarse a su equivalente en la lengua a la que queremos traducirla, para así, transformarla en la que sería la correcta de la nueva lengua.

Los sistemas de transferencia expresan sus relaciones mediante módulos de análisis, que a su vez pueden generar un resultado compresible a través de ellas o no. Para poder hacerlo hay que dominar las dos lenguas, ya que una misma regla puede cambiar de idioma a idioma.

Traducción automática por interlingua: parece más fácil de lo que en realidad es. La razón es que resulta pesado el mantenimiento actualización de diccionarios, analizadores y generadores. Otra de las razones de su complejidad es la representación adecuada de la interlíngüa, ya que la misma debería servir para decir cualquier cosa en cualquier idioma. Muchos expertos dicen que esto es imposible porque sería casi imposible reunir todos los conceptos que los hablantes serían capaces de expresar. Con esto me refiero a las frases hechas, que, en cada idioma cambian por ello sería casi imposible juntar todas las posibles. Además cada día nacen muchas nuevas, por ello como digo al principio resulta tan difícil su mantenimiento y actualización, nunca acabaría. Se añade a todo esto la falta de formalismo, se ha intentado un consenso mediante teorías lingüísticas, pero ninguna convence demasiado. Los formalismos prácticos de la lógica va evolucionando poco a poco, añadiendo nuevos conceptos o estructuras. Se hace difícil cuál va a ser la representación de cada palabra, dependería mucho si se analizara en un idioma o en otro, debido a que existen diferentes perspectivas de ver las palabras.

Ámbito de aplicación

Ventajas

  • La velocidad: En apenas unos segundos tenemos la traducción completa hecha de una forma que no sería posible manualmente. Pero cuidado con la calidad.
  • Facilita la comprensión: Permite acceder a contenidos en idiomas que nos son ajenos (páginas web, documentos, ayuda tecnológica, informes).
  • Ahorro: Según la utilidad que se le vaya a dar, permite reducir costes, tanto en lo que al tiempo se refiere como a la mano de obra.


Inconvenientes

  • Las traducciones que se obtienen son la mayor parte de las veces de baja calidad. Generalidad que no se aplica a sistemas especializados o para pares de lenguas tipológicamente cercanas.
  • Si la calidad es importante, la tradución debe ser revisada. Tipos de problemas más frecuentes:
    • Errores morfológicos: Nos referimos a errores sintácticos, léxicos y semánticos.
    • Errores de ambigüedad léxica: Ocurre cuando una palabra tiene más de un significado. Estos sistemas tienen pocos recursos para analizar el contexto, por lo tanto, se equivocan con frecuencia en la acepción seleccionada.
    • Errores de ambigüedad estructural: Ocurre cuando una oración tiene más de un signficado. Es lo mismo que ocurra con la ambigüedad léxica, solo que con toda una frase.
    • Errores de resolución de anáforas: Dependiendo de la lengua pueden ser distintas las referencias indirectas a una entidad mencionada de forma explícita en otro lugar del texto. Por lo tanto, se debe tener ciudado.
    • Errores de ambigüedad en el alcance de los cuantificadores: Si en ambas metas existen los mismo cuantificadores no habrá problema, en caso contrario, habrá que cambiarlo manualmente.
    • Errores de registro, estilo.
    • Desconocimiento de equivalencias canonizadas (textos legales, litúrgicos, técnicos)


Recursos de la TA

Software gratuito

  • InterNostrum
  • Traduki
  • Apertium es un motor de traducción automática de código abierto diseñado para traducir entre pares de lenguas emparentadas. Los pares de lenguas disponibles son español-catalán, pero próximamente estará disponible el par español-gallego. Apertium es uno de los motores de traducción de código abierto que se están desarrollando dentro del proyecto OpenTrad, financiado por el Ministerio de Industria, Turismo y Comercio de España, y cuya finalidad es desarrollar sistemas de traducción automática de código abierto para las lenguas de España (catalán, gallego, vasco y español).

Otros recursos:

Programas comerciales

Enlaces externos

Véase también

Bibliografía



Views
Personal tools
Herramientas
Otros idiomas