Alibaba vuelve a tomar posición en la carrera por el control de la IA presentando dos nuevos modelos de inteligencia artificial: Qwen-VL-v2, un modelo de lenguaje visual mejorado, y Qwen-72B, un modelo de lenguaje grande (LLM) con 72 mil millones de parámetros.
El gigante tecnológico chino Alibaba Cloud (en la foto, Daniel Zhang, es el CEO de Alibaba Group y Director General de Alibaba Cloud) ha anunciado el lanzamiento de dos nuevos modelos de inteligencia artificial que prometen impulsar significativamente el campo de la IA.
Se trata de Qwen-VL-v2, una versión mejorada de su modelo de lenguaje visual, y Qwen-72B, un modelo de lenguaje grande (LLM) con una impresionante cantidad de 72 mil millones de parámetros.
Ambos modelos serán de acceso abierto, permitiendo a desarrolladores e investigadores de todo el mundo acceder y utilizarlos para crear nuevas aplicaciones.
Qwen-VL-v2: mejora sustancial de modelos de lenguaje visual
Este tipo de modelos permiten a las máquinas comprender y procesar información tanto textual como visual, lo que abre un abanico de aplicaciones, como la generación de descripciones de imágenes, el análisis de escenas y la creación de contenido multimedia interactivo.
Según el blog oficial, Qwen-VL-v2 ha obtenido resultados superiores al 80% de precisión en una serie de tareas de visión por computadora, superando a modelos anteriores en diversas pruebas de evaluación.
Esta mejora en la precisión se atribuye a un entrenamiento más exhaustivo y al uso de técnicas avanzadas de aprendizaje profundo.
Qwen-72B: un LLM con 72 mil millones de parámetros
Este desarrollo ubica a Alibaba en la primera línea de modelos de lenguaje de gran tamaño. Estos modelos son conocidos por sus capacidades avanzadas en el procesamiento de lenguaje natural, incluyendo generación de texto, traducción, resumen y respuesta a preguntas.
Contar con 72 mil millones de parámetros permite al modelo capturar y procesar información con una complejidad y sofisticación sin precedentes.
El comunicado destaca la capacidad de Qwen-72B para gestionar tareas complejas que requieren razonamiento y comprensión contextual, situándose como un fuerte competidor ante los modelos líderes del mercado.
Open Code
Ambos modelos son de acceso abierto, sin dudas un paso significativo. Tradicionalmente, las grandes empresas tecnológicas tienden a mantener sus modelos de IA como propiedad privada, limitando el acceso a un grupo selecto de desarrolladores e investigadores.
Al liberar sus modelos, Alibaba está fomentando una mayor colaboración y permitiendo que una comunidad más amplia participe en el desarrollo y la innovación en el campo de la IA.
Esta estrategia de código abierto es una apuesta estratégica para el crecimiento del ecosistema de la IA, permitiendo una mayor innovación y acelerando el avance de la tecnología.
Tanto Qwen-VL-v2 como Qwen-72B representan una inversión considerable en investigación y desarrollo. Si bien el costo preciso de desarrollo no ha sido revelado, se puede inferir que la inversión en recursos computacionales, talento humano y tiempo de desarrollo es significativa, situando a Alibaba como un actor clave que está dispuesto a invertir en IA a gran escala.
La estrategia combinada de desarrollar modelos de alto rendimiento y liberarlos bajo una licencia de acceso abierto posiciona a Alibaba como un jugador importante en la carrera global por el liderazgo en inteligencia artificial.
La apuesta por la colaboración a través del código abierto es una estrategia que podría definir el futuro del desarrollo y la aplicación de la IA.