La startup china DeepSeek presenta Janus-Pro 7B, un modelo multimodal que promete superar a DALL-E 3 y Stable Diffusion XL en la creación de imágenes a partir de texto.
DeepSeek, la emergente empresa tecnológica china, ha anunciado el lanzamiento de Janus-Pro 7B, un modelo de inteligencia artificial multimodal diseñado para comprender y generar imágenes. Según informes recientes, este modelo ha demostrado un rendimiento superior al de competidores establecidos como DALL-E 3 de OpenAI y Stable Diffusion XL.
Una característica distintiva de Janus-Pro 7B es su «nuevo marco autorregresivo», que desacopla la codificación visual para la interpretación y generación multimodal. Utiliza el modelo SigLIP-L como codificador y un tokenizador del conjunto LlamaGen, lo que le permite procesar y generar imágenes con mayor eficiencia.
El modelo está disponible para su descarga en la plataforma Hugging Face y se distribuye bajo una licencia MIT de software libre, permitiendo su uso y modificación incluso para fines comerciales, siempre que se mantenga el aviso de copyright original. Sin embargo, los usuarios deben aceptar la licencia de DeepSeek, que impone restricciones éticas, como la prohibición de uso militar o la generación de contenidos destinados a la desinformación.

A pesar de sus avances, Janus-Pro 7B tiene limitaciones, como la capacidad de analizar imágenes con una resolución máxima de 384 x 384 píxeles. No obstante, considerando su tamaño compacto, su rendimiento es notable, según las pruebas compartidas por la compañía.
Este lanzamiento refuerza la posición de DeepSeek en el campo de la inteligencia artificial, destacando su capacidad para mejorar tecnologías existentes y hacerlas más accesibles y funcionales para los usuarios. Con Janus-Pro 7B, la empresa busca ofrecer una herramienta eficiente para la generación de imágenes a partir de descripciones textuales, compitiendo directamente con los líderes del mercado.
La comunidad tecnológica observa con interés cómo DeepSeek continúa innovando y desafiando a competidores establecidos en el sector de la inteligencia artificial. El éxito de Janus-Pro 7B podría marcar un hito en la evolución de los modelos de generación de imágenes, ofreciendo nuevas oportunidades y desafíos en este dinámico campo.