Software

NVIDIA crea un algoritmo IA para humanizar la entonación de la voz

Black Mirror no iba desencaminada cuando aseguraba un futuro robotizado, y es que NVIDIA ha presentado su algoritmo de IA cuyo fin es humanizar el habla de los bots. Lo ha hecho en la conferencia InterSpeech y os contamos los detalles de este avance.

No es la primera vez que NVIDIA muestra atención por la voz, y así lo hizo en el GTC de 2017 donde dio a conoce una voz IA que contaba historias. Es cierto que era algo muy mejorable porque hay que prestar atención a las pausas, las entonaciones y todo lo que hacemos mientras leemos. Con Flowtron buscaba mejorarlo, pero seguía sin estar cerca de dar el resultado.

Voces de bots más humanas, gracias al algoritmo IA de NVIDIA

En la conferencia de InterSpeech, NVIDIA ha querido asombrar con un algoritmo de inteligencia artificial cuyo fin es mejorar la entonación de la voz del bot. Este algoritmo mejora a los actuales y lo que se quiere hacer es «humanizar» la voz para que parezca más realista.

Hemos visto cómo la IA hace milagros con las imágenes y vídeos, y es que NVIDIA ya trabajó en un proyecto con otro algoritmo sobre generar rostros humanos mediante rostros existentes, algo que recuerda a Blade Runner y los replicantes. De hecho, ya trabajó anteriormente en Flowtron, pero fracasó dicho proyecto.

Ahora nos presentan un nuevo modelo, cuyos investigadores aseguran que la voz se puede «dirigir» para replicar la voz de un actor humano. Primero, se carga la información en el modelo de IA, el cual es moldeado según las variables que queramos.

Luego, la voz IA de NVIDIA imita a la de la fuente (actor), tal y como aprendemos nosotros a hablar desde que somos pequeños. Esto otorga la posibilidad al algoritmo para enfatizar sobre ciertas palabras con el fin de que le dé más énfasis o menos a la pronunciación: voz más alta o más suave.

Este algoritmo trae la novedad de que no solo puede imitar letras, sino que puede cantar, comunicarse con personas con discapacidades de habla, pronunciar texto naturalmente en videojuegos o desarrollar aplicaciones que nos permitan a nosotros (jugadores) hablar con otros personajes IA.

¿Los dobladores y actores van a tener menos trabajo? Parece ser que sí, siempre y cuando este proyecto prospere.

Te recomendamos los mejores micrófonos del mercado

¿Qué os parece esta novedad?

Recent Posts

  • Audio y multimedia

⁠Qué hacer si uno de tus AirPods deja de funcionar: soluciones prácticas

Los AirPods se han convertido en uno de los dispositivos más populares gracias a su…

2 horas atrás
  • Tarjetas gráficas

Radeon «UDNA» estará fabricado con un nodo N3E de TSMC, volverán las GPUs de gama alta

La arquitectura UDNA de próxima generación de AMD está en preparación para suceder a la…

2 horas atrás
  • Audio y multimedia

⁠Cómo optimizar la calidad de sonido en tus grabaciones de voz con un iPhone

Las grabaciones de voz se han convertido en una herramienta fundamental para profesionales, creadores de…

3 horas atrás