Black Mirror no iba desencaminada cuando aseguraba un futuro robotizado, y es que NVIDIA ha presentado su algoritmo de IA cuyo fin es humanizar el habla de los bots. Lo ha hecho en la conferencia InterSpeech y os contamos los detalles de este avance.
No es la primera vez que NVIDIA muestra atención por la voz, y así lo hizo en el GTC de 2017 donde dio a conoce una voz IA que contaba historias. Es cierto que era algo muy mejorable porque hay que prestar atención a las pausas, las entonaciones y todo lo que hacemos mientras leemos. Con Flowtron buscaba mejorarlo, pero seguía sin estar cerca de dar el resultado.
En la conferencia de InterSpeech, NVIDIA ha querido asombrar con un algoritmo de inteligencia artificial cuyo fin es mejorar la entonación de la voz del bot. Este algoritmo mejora a los actuales y lo que se quiere hacer es «humanizar» la voz para que parezca más realista.
Hemos visto cómo la IA hace milagros con las imágenes y vídeos, y es que NVIDIA ya trabajó en un proyecto con otro algoritmo sobre generar rostros humanos mediante rostros existentes, algo que recuerda a Blade Runner y los replicantes. De hecho, ya trabajó anteriormente en Flowtron, pero fracasó dicho proyecto.
Ahora nos presentan un nuevo modelo, cuyos investigadores aseguran que la voz se puede «dirigir» para replicar la voz de un actor humano. Primero, se carga la información en el modelo de IA, el cual es moldeado según las variables que queramos.
Luego, la voz IA de NVIDIA imita a la de la fuente (actor), tal y como aprendemos nosotros a hablar desde que somos pequeños. Esto otorga la posibilidad al algoritmo para enfatizar sobre ciertas palabras con el fin de que le dé más énfasis o menos a la pronunciación: voz más alta o más suave.
Este algoritmo trae la novedad de que no solo puede imitar letras, sino que puede cantar, comunicarse con personas con discapacidades de habla, pronunciar texto naturalmente en videojuegos o desarrollar aplicaciones que nos permitan a nosotros (jugadores) hablar con otros personajes IA.
¿Los dobladores y actores van a tener menos trabajo? Parece ser que sí, siempre y cuando este proyecto prospere.
Te recomendamos los mejores micrófonos del mercado
¿Qué os parece esta novedad?
CHIEFTEC acaba de presentar dos nuevas cajas para PC, Visio y Visio Air con un…
Asus ZenWiFi BT8 es un sistema Mesh Wi-Fi 7 el cual se sitúa por debajo…
Qualcomm anuncia nuevos SoC Snapdragon X, pero no se trata de una nueva generación, sino…