La nueva función de audio, disponible para usuarios de ChatGPT Plus y Teams, introduce cinco voces inspiradas en la naturaleza y mejoras en la comprensión de acentos.
OpenAI ha anunciado el lanzamiento de su Modo de Voz Avanzado (AVM) para un conjunto ampliado de clientes de pago de ChatGPT.
Esta innovadora función de audio, diseñada para hacer que la interacción con ChatGPT sea más natural, estará inicialmente disponible para los usuarios de los niveles Plus y Teams. Los clientes Enterprise y Edu comenzarán a recibir acceso la próxima semana.
Como parte de esta implementación, AVM presenta un diseño renovado: ahora es representado por una esfera animada azul, reemplazando los puntos negros animados que OpenAI mostró en su demostración de la tecnología en mayo.
Los usuarios recibirán una notificación emergente en la aplicación de ChatGPT, junto al icono de voz, cuando AVM esté disponible para ellos.
Durante la semana, el Modo de Voz Avanzado se implementará para todos los usuarios de Plus y Team en la aplicación de ChatGPT.
«Mientras esperaban pacientemente, hemos añadido Instrucciones Personalizadas, Memoria, cinco nuevas voces y mejoras en los acentos», anunció OpenAI. Una característica destacada es su capacidad para decir «Perdón por llegar tarde» en más de 50 idiomas.
Los usuarios de ChatGPT ahora pueden experimentar con cinco nuevas voces: Arbor, Maple, Sol, Spruce y Vale, elevando el total de voces disponibles a nueve, similar a la oferta de Google’s Gemini Live.
Los nombres de las voces, inspirados por la naturaleza, reflejan el objetivo de AVM de hacer que el uso de ChatGPT sea más natural.
Sin embargo, se ha eliminado la voz Sky, presentada en la actualización de primavera, tras una amenaza legal de Scarlett Johansson. La actriz alegó que la voz de Sky era sorprendentemente similar a la suya, a pesar de que OpenAI afirmó que no fue su intención.
Aún no se ha incluido en esta versión la capacidad de compartir video y pantalla que OpenAI presentó hace cuatro meses. Esta función permitiría a GPT-4o procesar simultáneamente información visual y audible, pero no se ha establecido un cronograma para su lanzamiento.
OpenAI asegura que desde la prueba alfa limitada de AVM, se han realizado mejoras significativas. La función de voz de ChatGPT ahora comprende mejor los acentos y las conversaciones son más fluidas y rápidas. Aunque durante las pruebas se encontraron fallos, la compañía afirma haber mejorado estos aspectos.
Además, OpenAI está ampliando algunas de las funciones de personalización de ChatGPT a AVM. Las Instrucciones Personalizadas permiten a los usuarios personalizar cómo responde ChatGPT, mientras que la Memoria permite al sistema recordar conversaciones para referencia futura.
Sin embargo, un portavoz de OpenAI indicó que AVM aún no está disponible en varias regiones, incluyendo la UE, el Reino Unido, Suiza, Islandia, Noruega y Liechtenstein.