La startup de voz artificial lanza GenFM, una función que transforma contenidos en podcasts multilocutor y compite directamente con Google NotebookLM, incluyendo elementos realistas como pausas y ehh.. muletillas.
ElevenLabs ha dado un paso significativo en la evolución del contenido audio generado por IA con el lanzamiento de GenFM, una nueva función disponible en su aplicación ElevenLabs Reader para iOS que permite crear podcasts conversacionales a partir de diversos tipos de contenido.
CARACTERÍSTICAS PRINCIPALES
La plataforma soporta 32 idiomas, incluyendo inglés, hindi, portugués, chino, español, francés, alemán y japonés.
Los usuarios pueden cargar videos de YouTube, textos o documentos, y la aplicación selecciona automáticamente dos voces entre más de una docena disponibles para crear una conversación natural.
«EJEM..» HUMANIZACIÓN DE LA IA
Una característica distintiva de GenFM es su enfoque en la naturalidad del diálogo.
Jack McDermott, responsable del crecimiento móvil en ElevenLabs, explicó a TechCrunch: «Debatimos sobre cuánto introducir ‘ums’, ‘ahs’, ‘mhmms’, risas y respiraciones similares a los elementos de diálogo humano. Buscamos el equilibrio correcto entre una conversación natural y la utilidad del contenido».
COMPETENCIA CON GOOGLE
Esta iniciativa surge como competencia directa a Google NotebookLM, que en septiembre introdujo la capacidad de crear conversaciones generadas por IA y posteriormente añadió opciones de personalización para sus podcasts generados artificialmente.
EXPANSIÓN INTERNACIONAL
ElevenLabs también ha anunciado una inversión de 11 millones de dólares en el ecosistema de startups polaco, con la apertura de un centro de I+D en Varsovia. Además, la empresa está expandiéndose a India, donde ya ha contratado un director comercial y está formando un equipo local.
PERSPECTIVAS FUTURAS
La compañía planea implementar más opciones de personalización y la capacidad de combinar múltiples fuentes para crear podcasts generativos, consolidando su posición en el mercado de la voz artificial y el contenido audio generado por IA.