La startup francesa Mistral lanza Pixtral 12B, un modelo de IA multimodal que procesa imágenes y texto, desafiando a gigantes como OpenAI con un enfoque abierto y accesible.
La empresa emergente de inteligencia artificial Mistral, con sede en Francia, ha dado un paso significativo al presentar su primer modelo multimodal, Pixtral 12B.
Este modelo, capaz de procesar tanto imágenes como texto, se posiciona como un competidor en el creciente mercado de la inteligencia artificial, dominado por jugadores como OpenAI y Anthropic.
Un modelo robusto y accesible
Pixtral 12B, con 12 mil millones de parámetros y un tamaño de aproximadamente 24 GB, está diseñado para ejecutar tareas complejas como el etiquetado de imágenes y el conteo de objetos en fotografías.
La cantidad de parámetros de un modelo suele ser un indicador de su capacidad para resolver problemas, y en general, modelos con más parámetros rinden mejor que aquellos con menos.
Construido sobre el modelo de texto previo de Mistral, Nemo 12B, Pixtral 12B amplía sus capacidades al permitir respuestas a preguntas sobre imágenes de diversos tamaños, ya sea a través de URLs o imágenes codificadas con base64.
El modelo está disponible para descarga, ajuste y uso sin restricciones bajo una licencia Apache 2.0, a través de un enlace torrent en GitHub y en la plataforma Hugging Face.
“La licencia aplicada a Pixtral 12B es completamente abierta”, confirmó un portavoz de Mistral por correo electrónico.
Un futuro prometedor en pruebas
Aunque no se encontraron demostraciones web funcionales al momento de la publicación, Sophia Yang, jefa de relaciones con desarrolladores de Mistral, anunció en un post en X que Pixtral 12B estará disponible para pruebas en las plataformas de chatbot y API de Mistral, Le Chat y Le Plateforme, en un futuro cercano.
Desafíos legales y éticos
El origen de los datos de imagen utilizados para entrenar a Pixtral 12B no ha sido esclarecido.
La mayoría de los modelos de IA generativa, incluidos otros modelos de Mistral, se entrenan con grandes cantidades de datos públicos de la web, a menudo sujetos a derechos de autor, lo que ha generado controversias legales.
Mientras algunos vendedores de modelos argumentan que los derechos de «uso justo» les permiten recopilar cualquier dato público, muchos titulares de derechos de autor no están de acuerdo y han iniciado demandas contra grandes empresas como OpenAI y Midjourney.
Impacto financiero y estratégico
El lanzamiento de Pixtral 12B sigue a una exitosa ronda de financiación de $645 millones liderada por General Catalyst, valorando a Mistral en $6 mil millones.
Con poco más de un año de existencia, Mistral, en parte propiedad de Microsoft, se percibe como la respuesta europea a OpenAI.
La estrategia de la joven empresa ha sido liberar modelos «abiertos» gratuitos, cobrar por versiones gestionadas de esos modelos y ofrecer servicios de consultoría a clientes corporativos.
Con Pixtral 12B, Mistral no solo expande su línea de productos, sino que también fortalece su posición en el panorama global de la inteligencia artificial, destacándose por su enfoque accesible y transparente en un sector cada vez más competitivo.