Una nueva serie de modelos denominada OpenAI o1-preview, diseñada para abordar problemas complejos con un enfoque de razonamiento más profundo. A partir del 12 de septiembre y prometen ser un cambio significativo en campos como la ciencia, la codificación y las matemáticas.
Los nuevos modelos de OpenAI están entrenados para dedicar más tiempo al razonamiento antes de responder, lo que les permite enfrentar tareas complejas de manera similar a como lo haría un ser humano.
Durante las pruebas, estos modelos demostraron un desempeño comparable al de estudiantes de doctorado en tareas desafiantes de física, química y biología.
Un ejemplo notable es su rendimiento en el examen de calificación para la Olimpiada Internacional de Matemáticas (IMO), donde el modelo de razonamiento logró resolver correctamente el 83% de los problemas, en comparación con solo el 13% del GPT-4o.
Además, en competencias de codificación Codeforces, alcanzaron el percentil 89.
Seguridad reimaginada
Con el desarrollo de estos modelos, OpenAI ha implementado un nuevo enfoque de capacitación en seguridad que aprovecha sus capacidades de razonamiento para adherirse a las pautas de seguridad y alineación.
Esto es crucial en pruebas de seguridad donde el modelo o1-preview obtuvo una puntuación de 84 sobre 100 en sus pruebas más exigentes.
OpenAI ha fortalecido su trabajo en seguridad mediante acuerdos formales con institutos de seguridad de IA en EE.UU. y el Reino Unido, asegurando una colaboración efectiva para la investigación y evaluación de futuros modelos.
Usos potenciales
Las capacidades de razonamiento del modelo o1 son especialmente valiosas para profesionales en ciencia, codificación y matemáticas.
Por ejemplo, se pueden utilizar para anotar datos de secuenciación celular en investigación médica o generar fórmulas matemáticas complejas en física cuántica.
OpenAI o1-mini: un modelo más accesible
Junto al lanzamiento de o1-preview, OpenAI ha introducido o1-mini, un modelo más económico y rápido, ideal para desarrolladores que buscan eficiencia en codificación.
Este modelo es un 80% más barato que o1-preview, lo que lo convierte en una opción potente y rentable para aplicaciones que requieren razonamiento.
Acceso y disponibilidad
Los usuarios de ChatGPT Plus y Team podrán acceder a los modelos o1 en ChatGPT desde hoy, con límites de mensajes semanales.
Los usuarios de ChatGPT Enterprise y Edu tendrán acceso a partir de la próxima semana. Los desarrolladores calificados para el nivel 5 de uso de API pueden comenzar a prototipar con ambos modelos.
Próximos pasos
Este lanzamiento es solo un avance inicial de los modelos de razonamiento en ChatGPT y la API. OpenAI planea continuar desarrollando y lanzando modelos en la serie GPT, además de añadir funcionalidades como navegación y carga de archivos, para hacerlos más útiles.