Avatar

Stiven Cartagena

24 septiembre, 2018

El reconocimiento de voz será el próximo gran salto tecnológico

Dentro de la inversión que la industria tecnológica está realizando en sistemas de inteligencia artificial, los sistemas autónomos y los robots son los que más titulares están protagonizando, no obstante existe otra rama que aunque pase más desapercibido muchos expertos señalan como el próximo gran éxito del futuro tecnológico. Hacemos referencia a los avances en servicios por reconocimiento de voz.

Desde el portal especializado ComScore aseguran que en el año 2020, la mitad de las búsquedas en Internet estarán hechas a través del servicio de voz. Y así aseguró Ben Gomes, jefe de búsqueda de Google, en una entrevista para The Guardian.

Gomes hace referencia a los sistemas de reconocimiento de voz se han vuelto imprescindible en países en vía de desarrollo, cuyas tasas de alfabetización son muy bajas como la India. «Estudie hindi durante 10 años, pero no sabría cómo escribirlo, por lo que la voz es mucho más fácil de usar que la mecanografía» dijo para el portal antes mencionado.

El ser humano dice aproximadamente 150 palabras por minuto, mientras que en ese tiempo solo llegaríamos a escribir 40 palabras. Aunque en Internet la prioridad es el contenido escrito, las tendencias actuales sugieren que el futuro será muy diferente.

La historia de los servicios de voz se remonta en 1784, cuando Wolfgang von Kempelen creó el primer sintetizador de voz manual. 100 años más tarde, Thomas Edison inventaría el dictáfono que, junto a otros dispositivos como el IBM Shoebox de 1962 que reconocía hasta 16 palabras básicas del inglés. Todos estos aparatos fueron las bases para que hoy se sustenten los modernos sistemas de reconocimiento de voz.

Hace apenas 10 años que las grandes compañías tecnológicas comenzaron a crear sus asistentes virtuales basados en los avances de reconocimiento de voz. Por ejemplo, el de Google se encuentra presente en más del 50% de los teléfonos en todo el mundo, aunque por su parte, Siri de Apple, Cortana de Microsoft y Alexa de Amazon, están en una batalla por ver quién ocupa el puesto número uno.

Lo que sigue a partir de ahora, es el conocimiento y entendimiento de los muchos significados que puede tener una frase y la gran variedad de palabras que podemos usar para transmitir el mismo mensaje.

«Las personas utilizan un lenguaje cuando entienden de un tema y otro cuando no lo hacen» asegura Gomes. En vez de encontrar en contenido a raíz de las palabras usadas por el usuario, el sistema debería ser capaz de buscar un rango más amplio de sinónimos. Google lleva cinco años trabajando en este avance.

Otro de los grandes retos de esta tecnología son las referencias como «él», «ella», «eso» en las oraciones. En definitiva queda todavía mucho por estudiar hasta conseguir hablar con una máquina de manera fluida.

Relacionados