En 1941 Glenn Miller puso en el mapa a Chattanooga (Tennessee) cuando interpretó el exuberante swing dedicado al tren que pasaba por la población. Chattanooga Choo Choo se convirtió nada menos que en la primera grabación en la historia en vender un millón de copias.

Ochenta años después, el congreso Project Voice trae un nuevo hito en la historia del audio que vuelve a colocar a esta tranquila y sureña localidad de la América profunda en el mapa: el llamado Voice First.

Voice First se refiere a la disrupción de la voz como la forma principal de interacción con cualquier tipo de dispositivo tecnológico, unido al desarrollo de la inteligencia artificial y al llamado Internet de las cosas. Esto en sí es una revolución. Nuestra relación con las máquinas va a ser mucho más natural, sencilla y humana. Vamos a hablar con ellas.

  • Más que asistentes virtuales

En Project Voice 2020 han dado cita los principales protagonistas de esta tendencia. Asistentes virtuales y home speakers tienen un espacio muy destacado, pero son solo dos ejemplos de las múltiples formas por las que la voz está pasando a estar en el centro. Las industrias del automóvil, de la salud, de la enseñanza, del marketing, los servicios financieros o de movilidad, el entorno del hogar… Todas ellas empiezan a verse profundamente afectadas por esta nueva relación con el usuario.

Una vez que Amazon, Google y Samsung (Bixby) crearon sus plataformas para desarrolladores, imitando lo que hizo Apple en su momento con las apps para móviles, los frutos empezaron a llegar. Lo más relevante no es la cantidad de skills o actions desarrolladas, sino la calidad y el alcance de lo que se va consiguiendo, como muestran algunos ejemplos de lo presentado en la feria.

Hasta ahora la seguridad era un gran problema en la aplicación de la voz en los servicios financieros. El software de ID Voice identifica de forma única al usuario por medio de elementos biométricos de la voz. Por ejemplo, en una demostración, el sistema distinguía perfectamente una voz real de una grabación. Pueden incorporar más capas de seguridad como elementos faciales o de comportamiento con las manos. Bajo el mantra de «esfuerzo cero de autentificación», productos como ID Voice combaten la suplantación de la identidad, el deepfake voice fraud o spoofing. Curiosamente los desarrolladores eran rusos y los comerciales americanos. Eso con Rocky no pasaba.

  • Anuncios sorpresa

En la publicidad también se prevén grandes avances. Hoy por hoy Alexa no tiene un sistema similar a Adwords , pero a nadie se le escapa que en algún momento, llegará. En el mundo de la voz solo caben una o dos respuestas a una búsqueda. Compañías como Whetstone desarrollan plataformas que interactúan en todos los dispositivos de voz, son multimodales con los usuarios, se integran con el CRM de las marcas y lanzan mensajes publicitarios a los usuarios mientras conversan con los dispositivos. Un ejemplo es el de la industria hotelera, en la que Amazon está desarrollando Alexa Hospitality. Plataformas como la de Whetstone pueden funcionar a través de la televisión, de un móvil o por supuesto de un Home Speaker. Y también lo podría hacer a través de un dispositivo colocado en un coche o en la nevera. Siempre natural para el usuario y medido en su totalidad.

En el sector educativo se están viendo enormes avances. Alexa llega a las aulas disparando la atención, el engagement y la personalización. El aprendizaje social basado en componentes emocionales es una de las claves. El equipo de Alexa4edu realiza experiencias en aulas con 4 ó 5 dispositivos por la clase, todos funcionando al mismo tiempo con diferentes grupos de alumnos de forma personalizada y basada en contenidos. Muchos skills -como Voicelets- ofrecen soluciones para profesores y alumnos y llegan al ámbito del hogar, donde ayudan a los alumnos no solo a hacer sus deberes, sino también a ser más autónomos y responsables.

Han destacado también en la feria avances en el ámbito de la inclusión y la diversidad, como las iniciativas de Women in voice o el maravilloso y emocionante Project Understood de la asociación de Síndrome de Down de Canadá y Google para conseguir que los asistentes de voz entiendan al colectivo.

  • También en salud

En el mundo de la salud, hospitales y desarrolladores se han unido para marcar la pauta. La clínica Mayo por ejemplo, ha desarrollado First Aid, su aplicación de voz para primeros auxilios de gran éxito, si bien el gran foco está en cuidado del usuario en remoto con la voz como interfaz principal entre todo tipo de dispositivos médicos, el paciente y el doctor. Servicios como Constant Companion son similares a los que pueda ofrecer el ayuntamiento de Madrid para los mayores si bien el paciente solo necesita su voz para activar todo el proceso y hay muchas funcionalidades que pueden añadirse al sistema.

Un Mercedes Benz preside la sala de exhibidores y su MBUX es uno de los más comentados. Prácticamente cada marca de coches tiene su asistente en marcha o incorpora alguno. La integración del Voice First en el automóvil transforma la manera en la que entendemos el coche. La tendencia es el coche como centro de entretenimiento. Así Drivetime crea una experiencia basada en la voz especialmente diseñada para cuando se está en el coche, con juegos y entretenimiento. Otras soluciones como What3words se centran en facilitar la geolocalización traduciendo cualquier coordenada geográfica a 3 palabras. Prueben a meter la secuencia de palabras: quedan.acudan.delicado en el buscador de Cabify y verán como les lleva al mismísimo Santiago Bernabéu.

Con las tasas de penetración disparadas y las tecnológicas invirtiendo paladas de millones, la disrupción de la voz es imparable.

Juan Corrales es CEO de Flyabit, estudio de AudioBranding y publicidad digital

Fuente: El País