8月6日,OpenAI发布了两款AI推理模型——gpt-oss-20b和gpt-oss-120b。这是自2019年开源GPT-2以来,OpenAI首次推出开源模型。
其中,gpt-oss-120b总参数1170亿,激活参数51亿,性能与OpenAI o4-mini相当,可在单张80GB显存的H100 GPU上运行,适用于生产、通用及高推理需求场景,能部署于数据中心、高端台式机和笔记本电脑。gpt-oss-20b总参数210亿,激活参数36亿,在常用基准测试中表现与OpenAI o3-mini类似,仅需16GB内存,可在多数台式机、笔记本电脑甚至手机上运行,适合低延迟、本地或专业化场景 。
两款模型采用宽松的Apache 2.0许可证,可自由用于构建,无copyleft限制或专利风险。它们还支持配置推理投入、拥有完整思维链、支持微调及智能体能力,并采用原生MXFP4量化。