OpenAI 昨日(8 月 5 日)發表開放權重模型 gpt-oss,現時已在 Hugging Face 可免費下載和使用。gpt-oss 以 Apache 2.0 授權,這亦是非牟利公司 OpenAI 在 gpt-2 之後,事隔 6 年再度推出開源模型。gpt-oss 分 gpt-oss-120b 和 gpt-oss-20b 兩個版本,前者的推理能力與 o4-mini 相近。
兩個版本僅支援文字,不能處理圖像或聲音,採用思路鏈(Chain of Thought,CoT)推理方式,源自去年 9 月推出的 o1 模型同一技術。CoT 讓生成式 AI 透過多個處理步驟回答,而不直接提供簡單的答案。
gpt-oss-120b 擁有 1,170 億參數,核心推理基準測試數據幾乎與 o4-mini 相近,而且執行硬件用配備 80GB 記憶體的 GPU 便可支援。較輕量的 gpt-oss-20b 測試結果與 o3-mini 相若,在 16GB 記憶體的電腦上可執行。
gpt-oss 的 OSS 指 Open-source series(即開源系列),不過 OpenAI 強調 gpt-oss 屬開放權重語言模型(open-weights language models)。權重對外公開,開發人員能檢視內部參數,了解模型處理數據的過程。但 OpenAI 卻不開放完整訓練數據,以避免涉及版權爭議。這與其他開源模型做法大相徑庭。OpenAI 原本在今年 3 月發表 gpt-oss,不過因安全理由多番延後。
開發人員除了在 Hugging Face 免費取得 gpt-oss,現時 AWS 的 Bedrock 和 SageMaker 平台亦有提供。由於 OpenAI 收下微軟大筆注資,之前的 GPT-3 至 OpenAI-o3 等模型是專屬授權,而且只經 API 或微軟 Azure 提供。
目前市場上有多個開源語言模型,如 Meta 的 Llama、亦有中國深度求索的 DeepSeek 和月之暗面的 kimi K2,在本機執行的市場取下一定程度的成功。OpenAI 的開放權重模型目標由美國建立的免費開放 AI 技術讓全球共享,讓美國成為創新重鎮。