La startup presenta un modelo de vanguardia que promete democratizar la creación de videos con inteligencia artificial, mientras asegura una ronda Serie A de U$S 28,4 millones liderada por NEA.
Genmo ha dado un paso gigante en el campo de la generación de videos con IA al presentar Mochi 1, un modelo de código abierto que establece un nuevo estándar en la industria.
La compañía, que acaba de asegurar una ronda Serie A de U$S 28,4 millones liderada por NEA, libera su tecnología bajo la licencia Apache 2.0, permitiendo su uso tanto personal como comercial.
Características Técnicas
El modelo, que cuenta con 10 mil millones de parámetros, se construyó sobre una arquitectura innovadora llamada Asymmetric Diffusion Transformer (AsymmDiT).
«Es el modelo generativo de video más grande jamás liberado en código abierto», destaca la compañía. En su versión actual, genera videos en 480p a 30 fotogramas por segundo, con una duración de hasta 5.4 segundos.
Capacidades y Rendimiento
Mochi 1 sobresale en dos aspectos críticos:
- Adherencia a instrucciones: Demuestra una excepcional alineación con las indicaciones textuales, permitiendo un control detallado sobre personajes, escenarios y acciones.
- Calidad de movimiento: Genera videos con alta coherencia temporal y dinámica de movimiento realista, simulando física avanzada incluyendo dinámica de fluidos, simulación de pelaje y cabello.
Equipo de Élite
El desarrollo está respaldado por un equipo de elite que incluye miembros clave de proyectos como DDPM, DreamFusion y Emu Video. La empresa cuenta con asesores de primer nivel como Ion Stoica (presidente ejecutivo de Databricks), Pieter Abbeel (cofundador de Covariant) y Joey Gonzalez.
Próximos Pasos
Genmo planea lanzar Mochi 1 HD antes de fin de año, que ofrecerá resolución de 720p y mayor fidelidad. También están desarrollando capacidades de conversión de imagen a video y mejoras en la controlabilidad del modelo.
Disponibilidad y Recursos
El modelo está disponible gratuitamente a través de:
- Playground en genmo.ai/play
- Pesos del modelo en HuggingFace
- Código fuente en GitHub
- APIs a través de socios seleccionados
Aplicaciones Potenciales
Las aplicaciones de Mochi 1 abarcan múltiples sectores:
- Investigación y desarrollo
- Desarrollo de productos
- Expresión creativa
- Robótica y entornos virtuales
«Nuestra misión es desbloquear el cerebro derecho de la inteligencia artificial general», declaran desde Genmo, posicionando a Mochi 1 como el primer paso hacia simuladores capaces de imaginar cualquier cosa, sea posible o imposible.