¿Te parece natural la voz de Alexa o de Siri? La verdad es que aunque la tecnología avanza a pasos agigantados, hasta ahora a las voces creadas por Inteligencia artificial les faltaba un no sé qué para sentirse tan naturales como sucedía con la voz de Scarlett Johansson cuando interpretaba a Samantha, la asistente virtual del escritor Theodore Twombly, en la cinta 'Her', ¿cierto?
Pues la nueva era al estilo ‘Her’ está llegando a nuestras vidas gracias a la voz generada con la Inteligencia artificial de Sonantic, que ha logrado imitar aspectos más complejos del habla humana para hacerse más convincente, como Samantha.
La voz de Sonantic es capaz de expresar burla y coqueteo
Según explica Sonantic, la clave que hace la diferencia entre su voz, que por cierto suena como la de Scarlett Johansson, y la de Alexa o Siri es que su IA incorpora sonidos que no son directamente del habla como pequeñas exhalaciones (donde se puede burlar o reír) que le dan a su voz una mayor autenticidad.
En el video que te compartimos a continuación titulado “What’s Her Secret?” (¿Cuál es su secreto?) podrás escuchar la voz de Sonantic en la que podrás notar cómo la IA puede extender la duración de algunas palabras, reírse y agregar exhalaciones, a fin de que suene más amigable y natural con quién lo está escuchando, casi como si se tratara de una persona real.
Como puedes ver el clip muestra a una actriz y, aunque no se le ve hablar, se escucha una voz de mujer que dice estar enamorada; sin embargo, más tarde pregunta si aún sabiendo que nunca nació y nunca morirá podría ser amada (por quien la escucha). En ese momento la imagen de una joven se transforma y aparecen los comandos de voz que son interrumpidos por expresiones como “respirar” o “reir”, que la hace sonar más natural.
Una voz artificial capaz de transmitir emociones
Una de las innovaciones de la IA de Sonantic, es que además de sonar mucho más natural, el usuario tiene la posibilidad de configurar la voz eligiendo entre diversos estados de ánimo como ira, miedo, tristeza, felicidad, alegría y con su última actualización también coquetería, timidez, burlas y hasta la capacidad de jactarse.
Incluso, el usuario puede modificar el tono, la intensidad y vocalizaciones que no se pronuncian, como risas y respiraciones.
Según Zeena Qureshi, directora ejecutiva de Sonantic, su software es como un “Photoshop para voz”. La interfaz permite a los usuarios escribir el discurso que desean sintetizar, especificar el estado de ánimo de la entrega y luego seleccionar entre un elenco de voces de IA, la mayoría de las cuales se copian de actores humanos reales.
Las voces hechas con IA son cada vez más solicitadas en distintos sectores de la industria; por ejemplo, los principales clientes de la compañía son estudios de videojuegos, estudios de entretenimiento y recientemente, Sonantic se asoció con la compañía Mercedes Benz para personalizar a su asistente en el automóvil.
Sigue a Heraldo Binario en Google News, dale CLIC AQUÍ.