Software

NVIDIA crea un algoritmo IA para humanizar la entonación de la voz

Black Mirror no iba desencaminada cuando aseguraba un futuro robotizado, y es que NVIDIA ha presentado su algoritmo de IA cuyo fin es humanizar el habla de los bots. Lo ha hecho en la conferencia InterSpeech y os contamos los detalles de este avance.

No es la primera vez que NVIDIA muestra atención por la voz, y así lo hizo en el GTC de 2017 donde dio a conoce una voz IA que contaba historias. Es cierto que era algo muy mejorable porque hay que prestar atención a las pausas, las entonaciones y todo lo que hacemos mientras leemos. Con Flowtron buscaba mejorarlo, pero seguía sin estar cerca de dar el resultado.

Voces de bots más humanas, gracias al algoritmo IA de NVIDIA

En la conferencia de InterSpeech, NVIDIA ha querido asombrar con un algoritmo de inteligencia artificial cuyo fin es mejorar la entonación de la voz del bot. Este algoritmo mejora a los actuales y lo que se quiere hacer es «humanizar» la voz para que parezca más realista.

Hemos visto cómo la IA hace milagros con las imágenes y vídeos, y es que NVIDIA ya trabajó en un proyecto con otro algoritmo sobre generar rostros humanos mediante rostros existentes, algo que recuerda a Blade Runner y los replicantes. De hecho, ya trabajó anteriormente en Flowtron, pero fracasó dicho proyecto.

Ahora nos presentan un nuevo modelo, cuyos investigadores aseguran que la voz se puede «dirigir» para replicar la voz de un actor humano. Primero, se carga la información en el modelo de IA, el cual es moldeado según las variables que queramos.

Luego, la voz IA de NVIDIA imita a la de la fuente (actor), tal y como aprendemos nosotros a hablar desde que somos pequeños. Esto otorga la posibilidad al algoritmo para enfatizar sobre ciertas palabras con el fin de que le dé más énfasis o menos a la pronunciación: voz más alta o más suave.

Este algoritmo trae la novedad de que no solo puede imitar letras, sino que puede cantar, comunicarse con personas con discapacidades de habla, pronunciar texto naturalmente en videojuegos o desarrollar aplicaciones que nos permitan a nosotros (jugadores) hablar con otros personajes IA.

¿Los dobladores y actores van a tener menos trabajo? Parece ser que sí, siempre y cuando este proyecto prospere.

Te recomendamos los mejores micrófonos del mercado

¿Qué os parece esta novedad?

Recent Posts

  • Seguridad informática

Ojo con estas 4 estafas que acechan en los comentarios de YouTube

YouTube es una de las plataformas digitales más grandes y diversas del mundo, atrayendo a…

8 horas atrás
  • Smartphone

Cómo revivir un iPhone que no enciende: qué hacer antes de entrar en pánico

El iPhone es uno de los dispositivos más confiables del mercado, pero incluso los mejores…

9 horas atrás
  • Reviews

GEEKOM A6 Review en Español (Análisis completo)

En la larga lista de Mini PC que hemos analizado de GEEKOM aún faltaba el…

9 horas atrás