OpenAI 開源模型 gpt-oss 可本機執行 對撼中國 DeepSeek、Kimi K2

Author:

Published:

- 廣告 -

OpenAI 昨日(8 月 5 日)發表開放權重模型 gpt-oss,現時已在 Hugging Face 可免費下載和使用。gpt-oss 以 Apache 2.0 授權,這亦是非牟利公司 OpenAI 在 gpt-2 之後,事隔 6 年再度推出開源模型。gpt-oss 分 gpt-oss-120b 和 gpt-oss-20b 兩個版本,前者的推理能力與 o4-mini 相近。

兩個版本僅支援文字,不能處理圖像或聲音,採用思路鏈(Chain of Thought,CoT)推理方式,源自去年 9 月推出的 o1 模型同一技術。CoT 讓生成式 AI 透過多個處理步驟回答,而不直接提供簡單的答案。

gpt-oss-120b 擁有 1,170 億參數,核心推理基準測試數據幾乎與 o4-mini 相近,而且執行硬件用配備 80GB 記憶體的 GPU 便可支援。較輕量的 gpt-oss-20b 測試結果與 o3-mini 相若,在 16GB 記憶體的電腦上可執行。

- 廣告 -

gpt-oss 的 OSS 指 Open-source series(即開源系列),不過 OpenAI 強調 gpt-oss 屬開放權重語言模型(open-weights language models)。權重對外公開,開發人員能檢視內部參數,了解模型處理數據的過程。但 OpenAI 卻不開放完整訓練數據,以避免涉及版權爭議。這與其他開源模型做法大相徑庭。OpenAI 原本在今年 3 月發表 gpt-oss,不過因安全理由多番延後。

開發人員除了在 Hugging Face 免費取得 gpt-oss,現時 AWS 的 Bedrock 和 SageMaker 平台亦有提供。由於 OpenAI 收下微軟大筆注資,之前的 GPT-3 至 OpenAI-o3 等模型是專屬授權,而且只經 API 或微軟 Azure 提供。

目前市場上有多個開源語言模型,如 Meta 的 Llama、亦有中國深度求索的 DeepSeek 和月之暗面的 kimi K2,在本機執行的市場取下一定程度的成功。OpenAI 的開放權重模型目標由美國建立的免費開放 AI 技術讓全球共享,讓美國成為創新重鎮。

- 廣告 -
Eric Chong
Eric Chong
商業・科技・創業・編輯
- 廣告 -

Related Articles

- 廣告 -

Recent Articles

- 廣告 -

最新影片

- 廣告 -