OpenAI ha presentado gpt-oss-120b y gpt-oss-20b, dos modelos de lenguaje de código abierto bajo licencia Apache 2.0. Estos modelos, que prometen un alto rendimiento en tareas de razonamiento y uso de herramientas, marcan el retorno de OpenAI al ecosistema de modelos abiertos, siendo su primera contribución desde 2019.
gpt-oss-120b es comparable al modelo o4-mini en tareas de razonamiento y es ejecutable en una sola GPU de 80 GB, gracias a su diseño eficiente basado en mixture-of-experts (MoE). Mientras tanto, gpt-oss-20b está diseñado para dispositivos con 16 GB de memoria, superando a modelos propietarios en pruebas relacionadas con salud y matemáticas. Ambos modelos son accesibles para desarrolladores, universidades y startups con recursos medios.
Estos modelos soportan capacidades avanzadas como el razonamiento de cadena de pensamiento sin supervisión directa y funciones estructuradas para búsquedas web o ejecución de código Python. OpenAI también ha proporcionado guías para el ajuste fino y herramientas listas para usar con plataformas como Hugging Face y vLLM.
Con un fuerte enfoque en la seguridad, OpenAI ha desarrollado un protocolo para simular escenarios de uso malicioso extremo. Según Sam Altman, CEO de OpenAI, la misión es que la Inteligencia Artificial General beneficie a toda la humanidad mediante una infraestructura abierta y gratuita.
Este lanzamiento permite a desarrolladores y organizaciones ejecutar, modificar y desplegar estos modelos en sus infraestructuras sin restricciones comerciales, favoreciendo la innovación y el desarrollo en el campo de la inteligencia artificial.