Avatar

Jeniffer Espinosa

4 junio, 2019

Google Translatotron, el primer traductor que simula tu voz

Google continúa con sus ambiciosos proyectos y desarrollos tecnológicos que buscan romper las barreras espaciales e idiomáticas, para esto el uso de la Inteligencia Artificial se ha constituido como una pieza clave al generar nuevos desafíos para los desarrolladores, quienes luego de crear los primeros traductores de audio, ahora se proponen presentar de la mano de Google el primer software capaz de imitar la voz humana al hacer la traducción de un idioma al otro, usando simplemente la voz, sin necesidad de hacer ningún tipo de conversión de texto.

El Translatotron ha sido inicialmente creado para hacer más sencilla la comunicación entre los seres humanos al lograr eliminar las limitaciones idiomáticas, presentándose como un prototipo futurista que parece sacado de un capítulo de “Black Mirror” debido a que en un futuro podría ser un instrumento de traducción simultáneo, además, su diseño combina diferentes tecnologías ya desarrolladas que hacen parte de la cotidianidad de los usuarios de Android y Google.

La herramienta tiene características únicas debido a que su funcionamiento combina en un solo proceso, lo que antes se realizaba en tres pasos independientes: el primero, en la conversión de voz a texto, el segundo, el reconocimiento automático de voz para traducir a otro idioma en una versión de texto, y finalmente la posibilidad de sintetizar texto y voz para generar audios completamente traducidos.

El diseño de Google realizaría estas funciones de manera automática y además intentando imitar la voz de la persona, evitando así los errores más comunes presentes entre el reconocimiento de voz y la traducción, permitiendo así que quien habla se familiarice con algunas palabras que no deben ser traducidas como los nombres propios, tal y como señala un artículo publicado por el ABC. El proyecto aún está en pruebas, “se basa en una red de secuencia a secuencia que procesa el audio de origen en espectrogramas- desgloses detallados de frecuencias del audio- y lo trata como un código de entrada, generando otros nuevos modelos de audio con contenido traducido para, posteriormente, convertir en idioma de destino”.

Esto permite al software generar a traducción en la voz original evitando la traducción robotizada que comúnmente conocemos, al imitar algunos detalles del timbre, tono de voz e incluso su color.

Pese a que aún no se revelaron muchos detalles de su salida al mercado, durante su presentación, Google reveló algunos ejemplo de traducción y demostró la gran capacidad del software que promete ser un avance futuro que romperá las barreras idiomáticas.

Relacionados