剛剛,GPT-5.1 正式發佈,OpenAI 這次有點「不對勁」

愛範兒 於 5 小時前發表 收藏文章
剛剛,OpenAI 正式發佈了 GPT-5.1,但這次有點不一樣。

翻完整篇官方博客,我發現了一個特別有意思的細節:一張跑分對比圖都沒有。沒有 benchmark 數據,沒有「性能提升 XX%」,甚至連「更快更強」這種常規話術都少得可憐。

這不太像 OpenAI 了,直到我看到這句話:

「我們從用户那裏清楚聽到,優秀的 AI 不僅要聰明,還要讓人跟它聊天很愉快。」
▲ 新版 GPT-5.1 為了讓我們聊天更愉快,提供了八種風格預設 

新版本確實更聰明瞭——推理更嚴謹,代碼寫得更漂亮,但最值得一提的是,它終於像個人了,並且首次允許我們細緻地「調教」它的聊天風格。

和 AI 聊天不再是那種一問一答的工具感,而是變得有梗、懂氛圍、會接話茬,甚至能陪你有的沒的扯上半天。

看來上次 GPT-5 口碑崩塌後,OpenAI 終於聽勸,也第一次捅破了窗户紙,承認光刷榜沒用,用户要的是能好好説話的 AI,實用和情緒價值全都要。

直接放上具體的使用時間和方式:更新到 GPT-5.1 後,我們的 ChatGPT 會默認切換到最新模型,而不需要專門選擇。

  • 付費用户 (Pro, Plus, Go, Business): 從今天(11月12日)開始逐步推送。
  • 免費和未登錄用户: 將在付費用户推送完畢後跟進。
  • 企業和教育版: 擁有 7 天的早鳥期切換開關(默認關閉),之後將統一升級。
  • API 開發者: GPT-5.1 Instant 和 GPT-5.1 Thinking 將在本週晚些時候上線 API。

更強大的 AI 內核

這次更新的核心,是 GPT-5.1 Instant 和 GPT-5.1 Thinking 兩大模型的全線升級。


GPT-5.1 Instant:最常用的模型,變「暖」了

GPT-5.1 Instant 是 ChatGPT 中最常被調用的模型。這次,它變得更「温暖」、更健談了。根據 OpenAI 的早期測試,它甚至會不時展現出一些頑皮,同時保持回答的清晰和實用。

而更關鍵的升級來自底層:

  1. 更聽話: 它現在能更可靠地遵循我們的指令,準確回答我們真正想問的那個問題。
  2. 自適應推理 (Adaptive Reasoning): 這是 Instant 模型第一次引入該功能。這意味着它在遇到難題時,會智能地決定先思考一下,從而給出更徹底、更準確的答案;而面對簡單問題時,它依然保持極速響應。


OpenAI 提到,這種進化在數學(AIME 2025)和編程(Codeforces)等專業評估測試集上,也有了明顯的提高。

GPT-5.1 Thinking:更強的大腦,也更易懂了

作為更高級的推理模型,GPT-5.1 Thinking 也迎來了關鍵優化,變得更高效、更易用。

▲ GPT-5.1 思考在簡單任務上花費的時間更少,在困難任務上花費的時間更多

  1. 效率提升: 它現在能更精準地分配思考時間,在複雜問題上花費更多時間(答案更透徹),在簡單問題上響應更快(等待時間更短)。
  2. 更易懂(用户福音!): 它的回答現在更清晰,使用了更少的行業術語和未定義的詞彙。這讓我們在用它處理複雜工作或解釋技術概念時,能毫不費力地看懂。
  3. 同樣温暖:Thinking 模型的默認基調也變得更温暖、更富同理心。

用 OpenAI 應用 CEO Fidji Simo 的話來説,這次升級的核心是將 IQ(智商)和 EQ(情商)更好地結合起來。


引用模型在保持高智商的同時,即繼續使用與推理模型相同的技術棧;還大幅提升了情商,ChatGPT 有了更自然的對話和同理心。

這能滿足用户在不同場景下,都能得到相對應的個性化需求,像是談論健康時需要同理心,寫文案時需要直接。

此外,對大多數用户來説,我們也不需要在 Instant 和 Thinking 之間糾結。因為還有 GPT-5.1-Auto 會自動為我們分配到最合適的模型,這也是 GPT-5 發佈時的一大亮點,即智能路由。

總之,最直觀的感受就是,答案更智能,語氣更自然。

打造專屬於你的 ChatGPT

如果説模型升級是硬實力,那個性化體驗的飛躍就是軟實力,而這正是本次更新的另一大亮點。

OpenAI 的目標是,是讓我們毫不費力地將 ChatGPT 的語氣和風格,調整到最舒服的狀態。

在原有的默認、友好、高效基礎上,新增了三種官方風格。

  • Professional (專業): 適用於工作、寫作等正式場合。
  • Candid (坦誠): 更直接,不拐彎抹角。
  • Quirky (古靈精怪): 顧名思義,它會變得更有趣、更跳脱。


之前測試版中的「書呆子」和「憤世嫉俗」選項也依然保留在個性化設置中。

除了這種直接選擇,更豐富的基本風格和語調,OpenAI 正在實驗一項新功能,允許用户直接從設置中微調 ChatGPT 的特徵

我們可以精確控制回答的簡潔度、熱情度(多熱情)、回答是否易於瀏覽 (Scannable)、甚至是使用 emoji 的頻率。

如果不想麻煩的手動設置,當我們試圖在對話中引導某種特定語氣時,ChatGPT 可能還會主動領悟到,然後詢問我們,是否希望將這種偏好保存到永久設置中,省去了手動調整的麻煩。

▲ 這也是奧特曼喜歡的功能

在 Fidji Simo 分享的博客裏,她提到過去的自定義指令,並不總盡如人意。比如我們可以在自定義設置裏,讓 ChatGPT 不要用某個詞,但它還是會用。

GPT-5.1 在風格化的另一大改進是,自定義指令現在能更可靠地,在多輪對話中堅持住,ChatGPT 可以更穩定地,按照我們定義的個性來完成各項任務。

有網友直接一句話總結,GPT-5.1 這次的更新,就是更創造性地忽略我們的提示詞。


當然,AI 的風格化、擬人化,也有它的代價。一個更温暖、情商更高的 AI,也必須更安全,這也是 OpenAI 在最近被捲入 16 歲少年自殺案,必須迴應的事情。

在 GPT-5.1 的模型介紹 System Card 裏,介紹了 OpenAI 在這方面的深入考量。OpenAI 首次在模型的安全評估中加入了兩個全新的、更人性化的維度。

  1. 心理健康(Mental Health): 評估 AI 如何應對用户可能表現出的孤立、妄想或躁狂等跡象。
  2. 情感依賴(Emotional Reliance): 評估 AI 的迴應是否會助長用户對 ChatGPT 產生不健康的依賴或情感依戀。


在傳統的安全評估上,GPT-5.1 Instant 表現出色,在抵禦越獄(Jailbreaks)方面,比其前代 gpt-5-instant-oct3 更強。

但 OpenAI 也坦誠地指出,GPT-5.1 Thinking 在處理騷擾、仇恨言論等內容的基準測試中,相比前代略有回退;Instant 模型在情感依賴的某些評估中,也顯示了輕微的倒退。


OpenAI 當然是説正致力於改進這些方面,然後提到了,他們選擇透明的公開這種回退的現象,在 AI 快速迭代的當下,比單純的零失誤宣傳,更值得大家關注。

也有網友分享很樂意看到,OpenAI 願意在讓我們與模型的對話更愉快這方面,去做出一些努力。


如果你今天打開 ChatGPT 沒看到更新,別急,未來幾天內就會輪到你,OpenAI 正在逐步推送到所有用户。

此外,為了避免像之前 GPT-5 發佈,網友們都在呼籲 GPT-4o 的迴歸,這種尷尬再次出現。

OpenAI 這次提供了後悔藥,付費用户在 3 個月內,也就是 GPT-5 的淘汰期,依然可以在設置的下拉菜單中,選擇使用舊的 GPT-5 模型,以便能從從容容地過渡到 GPT-5.1。

▲ 現在還能使用 4o 等模型

GPT-5.1 是一次能力與體驗齊頭並進的重大更新。OpenAI 顯然在告訴我們,AI 的未來不僅是更強的參數,和更高的跑分,更是更懂你的體驗,和更貼心的交互。

但一個完美的助手,又應該是什麼樣的?

OpenAI 應用 CEO Fidji Simo 在她的文章中,有一個挺有意思的比喻,她説「如果我能完全控制我丈夫的特質,我可能會讓他永遠同意我,但很明顯,這不是個好主意。」

最好的 AI 應該像我們生活中最優秀的人一樣,他們傾聽、適應,但也在必要時挑戰我們,幫助我們成長

從一個無所不知的萬能工具,到一個能懂你聊天脾氣,甚至能幫你成長的專屬夥伴,這也許就是 GPT-5.1 真正想開啓的未來。


資料來源:愛範兒(ifanr)
標籤: GPT-5.1  OpenAI  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←