Imagen principal: Astana, la capital de Kazajstán. Cerca de la mitad de los 18 millones de habitantes del país hablan kazajo. Crédito: Alex J. Butler a través de Flickr, CC BY 2.0

Imagínese si el inglés no fuera el idioma universal de internet. ¿Qué sucede si no puede leer este artículo en línea, excepto como una versión modificada por Google Translate? ¿Y si Alexa no entendió nada de lo que le pediste? Ahora imagina que te pusiste en contacto con Google y Amazon y les pediste que agregaran inglés a sus sistemas ... y dijeron "No, gracias, hazlo tú mismo".

El dinero habla

El kazajo es un idioma que hablan alrededor de la mitad de los 18 millones de personas en Kazajstán, un vasto país en Asia Central que limita con Rusia y China, y aunque es vasto, es una población relativamente escasa, lo que puede pasar desapercibido por gigantes tecnológicos como Google.

”Como mercado comercial, Kazajstán no es realmente interesante para Google porque no genera la cantidad correcta de dinero de la publicidad.,” dice Rauan Kenzhekhanuly, fundador de la organización sin fines de lucro WikiBilim Public Foundation, quien en 2011 creó una versión en idioma kazajo de Wikipedia, un enorme acto inicial de traducción que resultó ser crítico.

Rauan Kenzhekhanuly, fundador de la Fundación Pública WikiBilim. Crédito: Jamie Carter

(Imagen: © Jamie Carter)

Desde entonces, ha sido la fuerza impulsora detrás de un intento de aumentar el kazajo en las herramientas de traducción automática en línea.. ”Es muy importante para los idiomas pequeños poder dar acceso a cualquier sitio web y traducir sitios web y artículos en su idioma.,” dice, antes de subrayar cuán endémicos son el inglés y el ruso como idioma escrito en kazajo.. ”En la universidad, incluso si estudias literatura e idioma kazajo, estarás obligado a encontrar libros de texto en ruso o inglés..”

La ambivalencia de Google hacia las culturas en los márgenes es un comportamiento bastante estándar y quizás comprensible. Hace unos años, las Islas Feroe solicitaron a Google que incluyera las Islas Feroe, hogar de solo 30,000 personas, en Google Street View, luego usó ovejas para que esto sucediera..

Perdido en la traducción

Para ser justos con Kazajstán, se han tomado medidas drásticas para encontrarse con el mundo a medio camino. Después de obtener 7.000 artículos en kazajo en Wikipedia, Kenzhekhanuly encabezó un proyecto para aumentar eso a 210.000 para complacer a Google..

”Comenzamos a comunicarnos con Google, pero explicaron que realmente no hacen nada para incorporar idiomas secundarios al servicio de Google Translate.,” él dice. ”Dijeron que depende de ti, tienes que proporcionarnos toneladas de texto, y pidieron 10,000 artículos..”

Después de superar con creces esa cifra para las traducciones espejo del kazajo al inglés (y viceversa) gracias al trabajo de 350 voluntarios en Kazajstán, el sistema de Google pudo construir sus primeras traducciones. Kazajo ahora está disponible como un simple sistema de texto a texto en Google Translate, aunque no traducirá sitios web completos, ni en kazajo hablado, ni se traducirá a través de una cámara con la aplicación Google Translate (que se usa principalmente para traducir menús).

Tan fácil como ABC

Hay un paso más drástico que Kazajstán ha dado para que su lenguaje sea más fácil de integrar en un mundo más amplio: está cambiando todo su alfabeto. Trabajar bajo la presunción de que el alfabeto cirílico ruso que se usa para escribir en kazajo es tanto una resaca del gobierno de la URSS, como una actitud desagradable para los visitantes de habla inglesa, en 2017 el gobierno anunció planes de tránsito para utilizar el alfabeto romano por completo en 2025.

El presidente de Kazajstán, Nursultan Nazarbayev, anunció el año pasado que el kazajo cambiaría al alfabeto romano. Crédito: Jamie Carter

(Imagen: © Jamie Carter)

Ya se está utilizando en las escuelas, lo cual no es sorprendente ya que el decreto dice: “Por el bien del futuro de nuestros hijos, debemos tomar esta decisión y crearla como condición de entrada para nuestra integración global más amplia..”

Revolución rusa

A pesar de las concesiones lingüísticas de Kazajstán al mundo tecnológico, los avances en la traducción automática disminuirán los problemas de traducción en un futuro muy próximo. Habiendo sido parte de la URSS durante 55 años hasta 1991, lo que Kazajstán está combatiendo en parte en términos lingüísticos es el continuo dominio nacional de la lengua rusa; lo que es irónico, porque este verano, una compañía británica fue la primera en descifrar la traducción del ruso al inglés, históricamente complicada..

”En ruso, una palabra puede tener 12 variaciones de significado, con inflexiones utilizadas en lugar de orden de palabras, pero en inglés son solo tres o cuatro y un orden de palabras fijo,” dice Mihai Vlad, vicepresidente de traducción automática en SDL en el Reino Unido. ”Así que la tecnología de traducción automática genérica no es suficiente para un idioma como el ruso; Necesitas un motor que aborde las formas específicas de fraseo..”

Astana tiene algunas de las arquitecturas más modernas del mundo, pero lucha por atraer el interés de Google y otros gigantes tecnológicos. Crédito: Jamie Carter

(Imagen: © Jamie Carter)

La solución demostró ser Neural Machine Translation (NMT), que también ha sido responsable de los recientes avances en reconocimiento de imágenes y reconocimiento de voz.. ”Lo que es diferente es la forma en que las palabras se convierten en números.,” explica Vlad. ”Cada palabra se codifica en una serie de números, y esos números se pasan a través de una red neuronal que utiliza la multiplicación de matrices, y terminas con la inclusión de palabras que esencialmente captura el significado de la palabra o la oración..”

Los idiomas latinos han demostrado ser mucho más fáciles de mapear, pero el alemán, el ruso y la mayoría de los idiomas asiáticos han requerido que NMT, esencialmente motores de mapeo de idiomas hechos a medida, sean legibles por las máquinas.

¿Qué pasa con el reconocimiento de voz??

Si tener una Wikipedia en idioma kazajo y poner el kazajo en Google Translate está ayudando a mantener el pequeño lenguaje vivo y floreciente, ¿qué pasa con Alexa, el Asistente de Google y Siri? Hasta ahora, el crecimiento global en el reconocimiento de voz ha sido en el hardware de asistente de voz, no en el software, con todos los grandes jugadores limitados en los idiomas que manejan:
Alexa: Inglés, alemán y japonés.

Asistente de Google: Inglés, francés, alemán, italiano, japonés y español.

Siri: Inglés, árabe, chino, danés, holandés, finlandés, francés, alemán, hebreo, italiano, japonés, coreano, malayo, noruego, portugués, ruso, español, sueco, tailandés y turco

”Nos encantaría ser parte de esas tecnologías, y en este momento estamos trabajando para llevar el kazajo al sistema de voz a voz.,” dice Kenzhekhanuly. Esto no es solo para que la gente en Kazajstán pueda disfrutar de tonterías novedosas como conseguir un Eco para programar los temporizadores de la cocina y preguntar sobre el clima, lo que está en juego es mucho mayor. Se trata de acceder al futuro de la tecnología..

”Si su idioma está incluido en voz a voz, tendrá acceso a las plataformas que acceden a los teléfonos inteligentes, pero también a los autos inteligentes..”

Rauan Kenzhekhanuly

”Si su idioma está incluido en voz a voz, tendrá acceso a las plataformas que acceden a los teléfonos inteligentes, pero también a los autos inteligentes.,” dice Kenzhekhanuly. Por ejemplo, los automóviles sin conductor del futuro seguramente se comunicarán con sus 'conductores' principalmente usando voz, pero si se deja en manos de los fabricantes de automóviles y las compañías de tecnología, solo se utilizarán los idiomas más grandes del mundo - chino mandarín, inglés y español. atendidos.

De vuelta en Kazajstán, continuará el trabajo para fusionar el idioma kazajo en la trama de Internet, y específicamente en Google Translate, porque Kenzhekhanuly está convencido de su importancia vital en la era moderna..

”No es perfecto, pero la belleza de la tecnología es que está mejorando constantemente.,” él dice. ”Como parte de la tecnología, no hay ninguna otra que esté más cerca de imitar al cerebro humano, y por eso es tan importante que los kazajos sean parte de ella. Estas plataformas no son solo plataformas de información, sino también plataformas lingüísticas..”

De TechRadar Siguiente serie es traído a usted en asociación con Honor