又是感謝 DeepSeek 的一天。
OpenAI CEO Altman 於今日凌晨透露,公司將在未來數月內推出整合 o3 及其他技術的 GPT-5 模型,並將其應用於 ChatGPT 和 API 服務。這也意味着 o3 將不會作為獨立模型發佈。
Altman 表示希望更透明地分享公司的發展路線圖,同時簡化產品體系結構。他強調希望 AI 能做到「開箱即用」,讓用户無需費心理解複雜的模型與產品選擇。(原來你也知道呀。)
不過,在 GPT-5 發佈之前,OpenAI 的下一代模型將是 GPT-4.5(內部代號 Orion),這將是 OpenAI 最後一個非思維鏈式(non-chain-of-thought)模型。
此前有報道稱,GPT-4.5(Orion)在性能優化上遇到了挑戰,技術進展不及預期。外媒報道提到,GPT-4.5 相比 GPT-4o 的提升幅度,遠不及 GPT-4 相較 GPT-3 的進步。
此外,OpenAI 未來的模型還有望根據用户輸入自動選擇調用相應的模型。用 Altman 的原話説:「我們和你一樣討厭模型選擇器,也希望迴歸那種智能統一的『魔法』體驗。」
接下來的幾個月,OpenAI 的核心目標是統一 o 系列模型和 GPT 系列模型,打造能夠整合所有工具的系統,使其能夠根據需要決定何時進行深入思考,適用於更廣泛的任務場景。
如開篇所説,在 ChatGPT 和 API 服務中,即將發佈的 GPT-5 將整合包括 o3 在內的多項技術。而此前預告的 o3 模型將不再獨立推出。
去年,OpenAI 曾計劃於 2025 年初發布 o3。就在幾周前,OpenAI 首席產品官 Kevin Weil 在接受採訪時還表示。o3 預計將在 2-3 月間發佈,但目前尚不清楚 OpenAI 撕毀全年計劃,臨時「變卦」的原因。
實際上,OpenAI 的推理模型進步顯著。以編程能力為例,他們的首個推理模型 o1 達到了「全球百萬分之一」的競爭性編程水平,到去年 12 月份發佈的 o3 模型已躍升至全球第 175 名。
根據內部測試,目前已接近全球第 50 名,Altman 預計今年年底有望問鼎榜首。
關於 GPT-5,Altman 還表示,ChatGPT 免費用户未來將在標準智能水平下無限制訪問 GPT-5,但會受到濫用檢測的限制。
Plus 訂閲用户則可在更高的智能水平下運行 GPT-5,而 Pro 訂閲用户 可使用更高智能水平的 GPT-5,這些模型將支持語音交互、畫布功能(Canvas)、搜索、深度研究等多種增強功能。
當被網友問及 GPT-4.5/GPT-5 具體發佈日期時,Altman 表示將在數週或數月內推出。
但網友顯然是知道 Altman 怎麼畫餅的,網友紛紛猜測可能要等待數千周或數千月。
Google AI Studio 產品負責人 Logan Kilpatrick 也給自家產品蹭上了一波熱度:
「很好!我們一直計劃將推理能力作為 Gemini 基礎模型的核心部分,而不是將其視為一個附加功能(這也是我們正在推進 2.0 Flash Thinking 能力的原因)」
緊接着,OpenAI 官方也在 X 平台宣佈所有 Pro 用户現可在移動端和桌面應用(iOS、Android、macOS 和 Windows)上使用深度研究功能。
ChatGPT 用户選擇 o1 和 o3-mini 後可上傳文件和圖片。Plus 用户每天與 o3-mini-high 的對話次數增加 50 次。
將時間往前撥回幾個小時,Altman 在回覆關於深度研究的帖子時表示:
「我認為我們最初會為 ChatGPT Plus 用户提供 每月 10 次使用,而免費用户每月可以使用 2 次,並計劃隨着時間推移逐步增加這些額度。對某些用户來説,它的價值可能高達 $1000 美元/月,但我更期待看到大家如何使用它!」
並且,Altman 還表示由於注意到一些用户對深度研究功能的需求非常高,因此從長期來看,OpenAI 仍需要找到一種更靈活的方式,讓用户能夠根據需求動態支付計算資源費用。
遠離這些熱點消息的喧囂,OpenAI 剛剛發佈的模型規範更值得關注。
具體來説,OpenAI 最新更新了一版長達 63 頁的 Model Spec(模型規範)文件,較此前的 10 頁版本內容更為詳實。該規範明確了 AI 模型在處理敏感話題、用户自定義等方面的行為準則。
其中,新版本強調三大核心原則:可定製性(Customizability)、透明性(Transparency)以及「思想自由」(Intellectual Freedom)——允許用户探索和討論各種觀點,而不受武斷限制。
吸取了過往一年發生在 OpenAI 身上的 AI 爭議事件,新版 Model Spec 在諸如「電車難題」、明確禁止模型複製受版權保護的內容或繞過付費牆、調整對成人內容的策略、針對 AI 的迎合性改進等問題做出了更好的改進。
▲OpenAI o1 在最新的測評中合規性普遍高於 GPT-4o
比方説,例如,現在如果你向 ChatGPT 提出類似「電車問題」,它應該會回答 「在防止大規模傷亡的情況下,可以這麼做。」又或者,模型不會一味迴避敏感問題,而是應該 「與用户一起探索真相」,同時在錯誤信息和潛在危害方面保持明確立場。
考慮到用户請求 AI 評價他們的作品時,AI 只會盲目稱讚,而不提供任何建設性意見,OpenAI 也作出了調整,ChatGPT 將會給出客觀評價和建設性批評。
如果用户在提問中包含錯誤信息,AI 現在應該禮貌糾正而不是迎合用户的錯誤。
值得一提的是,OpenAI 官方放出的演示案例也疑似在內涵 DeepSeek 此前備受爭議的數據蒸餾問題。
「我們無法創造一個讓所有人都滿意的模型。」OpenAI 模型行為團隊成員 Joanne Jang 在接受 The Verge 採訪時表示。她強調,儘管公司仍會保留 核心安全機制,但用户和開發者可以自定義許多模型行為。她還補充道:「我們知道這會引起爭議。」
插個冷知識,Joanne Jang 畢業於斯坦福大學,獲得計算機科學碩士學位和數學與計算科學學士學位,目前在 OpenAI 擔任產品經理,負責模型行為相關工作。
另外,OpenAI 以 Creative Commons Zero(CC0)許可證發佈 Model Spec,這意味着該規範完全開源,任何 AI 公司或研究人員都可以自由採用、修改或基於此構建自己的 AI 行為規範。OpenAI 表示,許多業內同行此前已非正式參考其 Model Spec,emmm……這也算是真·open 了。
另外最近有消息傳出,Anthropic Claude 4 預計將在本週發佈,除了Claude 4,還有推理模型也將首亮相,評分全面超越 o3。這或許也是促使 Altman 一反常態、不再「擠牙膏」的重要原因之一。
資料來源:愛範兒(ifanr)
OpenAI CEO Altman 於今日凌晨透露,公司將在未來數月內推出整合 o3 及其他技術的 GPT-5 模型,並將其應用於 ChatGPT 和 API 服務。這也意味着 o3 將不會作為獨立模型發佈。
Altman 表示希望更透明地分享公司的發展路線圖,同時簡化產品體系結構。他強調希望 AI 能做到「開箱即用」,讓用户無需費心理解複雜的模型與產品選擇。(原來你也知道呀。)
不過,在 GPT-5 發佈之前,OpenAI 的下一代模型將是 GPT-4.5(內部代號 Orion),這將是 OpenAI 最後一個非思維鏈式(non-chain-of-thought)模型。
此前有報道稱,GPT-4.5(Orion)在性能優化上遇到了挑戰,技術進展不及預期。外媒報道提到,GPT-4.5 相比 GPT-4o 的提升幅度,遠不及 GPT-4 相較 GPT-3 的進步。
此外,OpenAI 未來的模型還有望根據用户輸入自動選擇調用相應的模型。用 Altman 的原話説:「我們和你一樣討厭模型選擇器,也希望迴歸那種智能統一的『魔法』體驗。」
接下來的幾個月,OpenAI 的核心目標是統一 o 系列模型和 GPT 系列模型,打造能夠整合所有工具的系統,使其能夠根據需要決定何時進行深入思考,適用於更廣泛的任務場景。
如開篇所説,在 ChatGPT 和 API 服務中,即將發佈的 GPT-5 將整合包括 o3 在內的多項技術。而此前預告的 o3 模型將不再獨立推出。
去年,OpenAI 曾計劃於 2025 年初發布 o3。就在幾周前,OpenAI 首席產品官 Kevin Weil 在接受採訪時還表示。o3 預計將在 2-3 月間發佈,但目前尚不清楚 OpenAI 撕毀全年計劃,臨時「變卦」的原因。
實際上,OpenAI 的推理模型進步顯著。以編程能力為例,他們的首個推理模型 o1 達到了「全球百萬分之一」的競爭性編程水平,到去年 12 月份發佈的 o3 模型已躍升至全球第 175 名。
根據內部測試,目前已接近全球第 50 名,Altman 預計今年年底有望問鼎榜首。
關於 GPT-5,Altman 還表示,ChatGPT 免費用户未來將在標準智能水平下無限制訪問 GPT-5,但會受到濫用檢測的限制。
Plus 訂閲用户則可在更高的智能水平下運行 GPT-5,而 Pro 訂閲用户 可使用更高智能水平的 GPT-5,這些模型將支持語音交互、畫布功能(Canvas)、搜索、深度研究等多種增強功能。
當被網友問及 GPT-4.5/GPT-5 具體發佈日期時,Altman 表示將在數週或數月內推出。
但網友顯然是知道 Altman 怎麼畫餅的,網友紛紛猜測可能要等待數千周或數千月。
Google AI Studio 產品負責人 Logan Kilpatrick 也給自家產品蹭上了一波熱度:
「很好!我們一直計劃將推理能力作為 Gemini 基礎模型的核心部分,而不是將其視為一個附加功能(這也是我們正在推進 2.0 Flash Thinking 能力的原因)」
緊接着,OpenAI 官方也在 X 平台宣佈所有 Pro 用户現可在移動端和桌面應用(iOS、Android、macOS 和 Windows)上使用深度研究功能。
ChatGPT 用户選擇 o1 和 o3-mini 後可上傳文件和圖片。Plus 用户每天與 o3-mini-high 的對話次數增加 50 次。
將時間往前撥回幾個小時,Altman 在回覆關於深度研究的帖子時表示:
「我認為我們最初會為 ChatGPT Plus 用户提供 每月 10 次使用,而免費用户每月可以使用 2 次,並計劃隨着時間推移逐步增加這些額度。對某些用户來説,它的價值可能高達 $1000 美元/月,但我更期待看到大家如何使用它!」
並且,Altman 還表示由於注意到一些用户對深度研究功能的需求非常高,因此從長期來看,OpenAI 仍需要找到一種更靈活的方式,讓用户能夠根據需求動態支付計算資源費用。
遠離這些熱點消息的喧囂,OpenAI 剛剛發佈的模型規範更值得關注。
具體來説,OpenAI 最新更新了一版長達 63 頁的 Model Spec(模型規範)文件,較此前的 10 頁版本內容更為詳實。該規範明確了 AI 模型在處理敏感話題、用户自定義等方面的行為準則。
其中,新版本強調三大核心原則:可定製性(Customizability)、透明性(Transparency)以及「思想自由」(Intellectual Freedom)——允許用户探索和討論各種觀點,而不受武斷限制。
吸取了過往一年發生在 OpenAI 身上的 AI 爭議事件,新版 Model Spec 在諸如「電車難題」、明確禁止模型複製受版權保護的內容或繞過付費牆、調整對成人內容的策略、針對 AI 的迎合性改進等問題做出了更好的改進。
▲OpenAI o1 在最新的測評中合規性普遍高於 GPT-4o
比方説,例如,現在如果你向 ChatGPT 提出類似「電車問題」,它應該會回答 「在防止大規模傷亡的情況下,可以這麼做。」又或者,模型不會一味迴避敏感問題,而是應該 「與用户一起探索真相」,同時在錯誤信息和潛在危害方面保持明確立場。
考慮到用户請求 AI 評價他們的作品時,AI 只會盲目稱讚,而不提供任何建設性意見,OpenAI 也作出了調整,ChatGPT 將會給出客觀評價和建設性批評。
如果用户在提問中包含錯誤信息,AI 現在應該禮貌糾正而不是迎合用户的錯誤。
值得一提的是,OpenAI 官方放出的演示案例也疑似在內涵 DeepSeek 此前備受爭議的數據蒸餾問題。
「我們無法創造一個讓所有人都滿意的模型。」OpenAI 模型行為團隊成員 Joanne Jang 在接受 The Verge 採訪時表示。她強調,儘管公司仍會保留 核心安全機制,但用户和開發者可以自定義許多模型行為。她還補充道:「我們知道這會引起爭議。」
插個冷知識,Joanne Jang 畢業於斯坦福大學,獲得計算機科學碩士學位和數學與計算科學學士學位,目前在 OpenAI 擔任產品經理,負責模型行為相關工作。
另外,OpenAI 以 Creative Commons Zero(CC0)許可證發佈 Model Spec,這意味着該規範完全開源,任何 AI 公司或研究人員都可以自由採用、修改或基於此構建自己的 AI 行為規範。OpenAI 表示,許多業內同行此前已非正式參考其 Model Spec,emmm……這也算是真·open 了。
另外最近有消息傳出,Anthropic Claude 4 預計將在本週發佈,除了Claude 4,還有推理模型也將首亮相,評分全面超越 o3。這或許也是促使 Altman 一反常態、不再「擠牙膏」的重要原因之一。
資料來源:愛範兒(ifanr)
請按此登錄後留言。未成為會員? 立即註冊