英偉達掀桌,Windows 終於迎來真 AI PC

愛範兒 於 2 天前發表 收藏文章
Windows PC 陣營,已經很久沒有遇到真正有分量的闖入者了。

▲Windows 用户 belike

過去四十年,這個市場的基本分工相對穩定:微軟定義操作系統和軟件入口,Intel 與 AMD 長期把守 x86 處理器平台,英偉達則從圖形計算出發,後來又把 AI 加速推到更高的位置。


而就在黃仁勳剛剛結束的 2026 年 COMPUTEX 主題演講上,英偉達沿着 AI 基礎設施這條主線,進入更多產業的核心環節。

除了 GPU 、AI 工廠、物理 AI 等老生常態的話題,還有被微軟和 ARM 提前預熱、打着「A new era of PC」旗號的 RTX Spark。所有產品背後,都圍繞同一個關鍵詞展開:

Agent、Agent,還是 Agent。


聯手微軟,英偉達要重新定義個人 PC

在 Agent(智能體)敍事裏,PC 被放到了一個新位置。

四十年來,Windows、開放 BIOS、芯片組、驅動、多媒體 API 一起塑造了個人計算。Windows 95 讓 PC 從企業設備變成消費電子產品,幾乎每個人都需要一台電腦。


現在,微軟和英偉達將重新定義 AI PC ,目標是要讓 PC 原生運行智能體,讓個人電腦從傳統應用入口變成個人 AI 平台。


今天推出的英偉達 RTX Spark 處理器是這套新 PC 體系的核心。


它搭載 Blackwell RTX GPU,FP4 AI 性能達到 1 petaflop;CPU 部分是與聯發科合作定製的 20 核 Grace CPU;內存為 128 GB 統一內存,並通過 NVLink C2C 提供 600 GB/s 帶寬。軟件層面,完整棧包括 CUDA、TensorRT、NVFP4、RTX Ray Tracing、DLSS、Reflex 和 G-SYNC。


在產品形態上,英偉達把 RTX Spark 放進了更接近主流 Windows PC 的尺寸裏:

筆記本厚度可做到 14 毫米,重量約 3 磅,覆蓋 14 英寸到 16 英寸機型;機身採用精密加工鋁合金,屏幕部分則配備色彩準確的 tandem OLED,並支持 NVIDIA G-SYNC,既服務創意工作,也兼顧遊戲和高幀率視覺體驗。

換言之,RTX Spark 面向的場景不只是端側語音助手或輕量辦公場景,它試圖把部分數據中心 AI 能力、遊戲圖形能力和專業創作能力,放進個人電腦形態裏。


黃仁勳説,這台電腦要運行「所有東西」。傳統 Windows 應用要能跑,CUDA 軟件棧要能跑,圖形工作流、數字生物、地震處理、天體物理、基因組學和 AI 應用也要繼續運行,它既可以連接本地模型,也可以連接雲端模型。

在現場演示視頻中,用户給出場地、草圖、風格參考和需求後,運行在 RTX Spark 上的智能體會調用 Rhino 完成建築與室內方案設計,並導入 Blender 結合 Flux 2 生成多角度渲染圖,過程中用户可隨時修改。

演示傳遞的信號不言而喻,PC 將從人手動操作軟件轉向智能體圍繞目標調度工具,而典型案例是,Adobe Photoshop、Premiere 等應用也正為 RTX Spark 優化,並通過 MCP 接入本地智能體,成為自動化工作流的一部分。


RTX Spark 只是新 PC 產品線的起點。黃仁勳還展示了三種形態:筆記本、台式機和工作站。它們共同兼容 Windows、CUDA 和 AI 軟件棧,面向的使用場景各不相同。

筆記本對應移動辦公、遊戲和創作。

它可以本地運行 Nemotron 3 Ultra,也可以連接 Claude、Codex 或其他雲端模型。台式機更像家庭裏的個人 AI 主機,可以 24 小時運行智能體,連接筆記本、顯示器、攝像頭、安防系統、家電和其他設備。


工作站面向模型開發者和智能體開發者。

DGX Station for Windows 配備 748 GB 內存、20 petaflops 算力和 8 TB 每秒內存帶寬,可以在桌面環境中運行萬億參數模型。開發者可以在本地完成模型開發、調試和測試,再部署到雲端。

黃仁勳把這一變化類比為手機變成智能手機,打電話已經不再是今天智能手機最重要的功能。他認為,10 年後的 PC 也會經歷類似變化。它會從打開應用、點擊和輸入的工具,變成家庭和個人工作流裏的 AI 超級計算機。


而我們能感受到最直接的變化,大概就是未來的 Windows 電腦,或許會是一台真正的 AI Agent 電腦。

對於想在本地跑 LLM、又需要大內存和較強 AI 算力的人來説,RTX Spark 的出現,可能會成為除 Mac 之外的另一個選項。

有用 AI 時代到來,一切為 Agent 而生

如果把過去兩年的行業變化歸納為一句話,那就是有用的 AI (useful AI)已經到來。而 Agentic AI 的第一批應用場景,正是軟件開發。


全球有 3000 萬到 4000 萬職業開發者,GitHub commit 數量也在持續增長:2023 年約 3 億,2024 年約 4 億,2025 年前幾個月達到 5 億,2026 年前幾個月接近翻了三倍。

黃仁勳藉此反駁了「AI 會減少就業崗位」的説法。在他看來,AI 提高了工程師的產出,企業反而更願意招聘更多工程師。究其原因,同樣的人力成本可以創造更高生產力,軟件開發的價值也會繼續擴大。

更深層的變化發生在應用形態上。

過去的軟件由應用、代碼和操作系統組成,但智能體時代的計算方式則換了一套流程:用户給出目標,模型理解意圖,運行環境調度流程,工具執行任務,記憶系統保存上下文,最後產出結果。
整個過程包含觀察、理解、推理、規劃、行動和工具調用。


在這個框架下,LLM 只是 Agentic 系統中的「思考模塊」。完整的智能體還需要 harness,也就是調度和編排層;需要瀏覽器、電子表格、數據庫、編譯器、CAD 軟件和數據處理引擎等工具;也需要短期記憶、長期記憶和運行環境。而這種 LLM+harness=Agent,再加工具、記憶和運行環境的模式將會是未來十年的應用基礎。

智能體成為新的應用形態後,支撐智能體運行的計算底座也要重新設計。

發佈會上,黃仁勳宣佈,英偉達下一代 AI 超級芯片平台 Vera Rubin 已進入全面投產階段。它是英偉達迄今規模最大的 POD 級平台之一,也是面向 Agentic AI 設計的新一代 AI 工廠核心系統。


Vera Rubin 由 Rubin GPU、Vera CPU、NVLink 72、BlueField、ConnectX 9、Spectrum X 以太網、存儲處理系統、安全處理系統和完整軟件棧共同組成,目標是支撐 AI 工廠級別的系統運行。

它面向的是智能體從輸入到執行的完整流程。

智能體處理提示詞、理解上下文、推理規劃、調用工具、訪問數據庫、運行代碼和檢索長期記憶時,會同時牽動 GPU、CPU、網絡、內存、存儲和安全系統,因此 Rubin GPU 負責主要計算,Vera CPU 負責調度和數據管線,BlueField 4 處理安全隔離與存儲,Spectrum X 負責大規模聯網。

Vera Rubin 之後,黃仁勳還單獨講了 Vera CPU。

在他看來,過去的 CPU 主要服務於人類用户和傳統雲計算租賃,計算資源按核心、按時間出租,響應速度以秒為單位衡量。但智能體的運行節奏完全不同:

它們會頻繁調用工具、訪問數據庫、運行代碼、檢索記憶,每一步都要求更低延遲。


這也讓 CPU 在 AI 工廠裏的角色變得更關鍵。智能體數量越多,工具調用和數據流轉越頻繁,CPU 越容易成為瓶頸。尤其是 GPU 已經成為 AI 工廠最昂貴的資產,CPU 的延遲和吞吐會直接影響 GPU 利用率,最終影響 Token 產出。

Vera CPU 的設計邏輯正在於此。

過去 CPU 為人服務,Vera CPU 則面向數量遠多於人類的智能體。它採用自研 Olympus Core,重點放在單線程性能、核心間帶寬、總帶寬和能效。它有神經分支預測器、10 路解碼引擎、大型亂序執行引擎和先進預取機制。內存部分採用 LPDDR5X,並支持多錯誤校正。


這顆 CPU 包含 88 個 Olympus 核心,使用單片網格結構連接,沒有把核心分散到多個 chiplet 上。這樣的設計減少了跨芯片通信帶來的延遲。它支持 PCI Express Gen 6,內部通信能力達到 3.6 TB 每秒,內存帶寬達到 1.2 TB 每秒。

相比 x86 CPU,Vera 在部分場景中峯值內存延遲降低 40%,智能體 sandbox 性能達到 1.8 倍,SQL 性能達到 3 倍,實時流處理性能達到 6 倍。

Agent 是新的工作負載,CPU 的角色也隨之變化。它不再只是雲計算裏可出租的通用核心,而是 AI 工廠裏調度模型、工具、內存、數據庫和安全系統的關鍵部件。

現在買電腦,是用來打造 AI 工廠

黃仁勳反覆強調,AI 的商業邏輯已經改變。過去算力常被視為成本,現在 token 是可以帶來收入的單位。只要 token 能產生收入,算力就成了生產能力。


想用 Token 賺錢,就來看看英偉達的 AI 工廠。NVIDIA DSX 是構建並運營 AI 工廠的藍圖與參考設計,基於 Omniverse,用數字孿生提前模擬 AI 工廠的佈局、電力、冷卻、網絡和系統集成。

黃仁勳提到,未來 1 GW 級 AI 工廠的投資可能達到 500 億、600 億美元,甚至進一步上升到 800 億至 1000 億美元。資本成本越高,系統上線速度、吞吐效率、可靠性和生命週期越關鍵。


引用RTX 面向我們的 GPU,DGX 面向我們的系統,而如今,DSX 則構成了整個基礎設施的核心。

而 NVIDIA DSX 這套生態系統囊括了一大批的雲服務公司和 AI 基礎設施企業,包括 CoreWeave、Nebius、Nscale、Naver Cloud 等,以及服務的客户包括 Cursor、World Labs、Revolut、Shopify、Google 等等,幫助所有的企業用户用 Token 來獲得收入。

硬件之外,企業如何真正用上智能體,是另一條線。

黃仁勳把企業構建智能體所需能力分為四類:模型、調度系統、工具與技能、運行環境。對應到產品上,就是 Nemotron、OpenShelf、CUDA X libraries 和 AI 平台。

Nemotron 3 Ultra 是此次發佈的新開放模型。它採用 SSM 狀態空間模型與 MoE 混合專家架構,目標是讓模型跑得更快、推理成本更低。


按照現場説法,相比其他開放模型如 Kimi K2.6、Qwen 3.5 和智譜 GLM 5.1,它速度提升 5 倍,整體運行成本降低約 30%。
黃仁勳還提到,Nemotron 3 Ultra 模型、訓練腳本和訓練數據都會開放,企業可以在此基礎上加入自己的行業數據和專有知識。


演講尾聲,黃仁勳把全場內容重新收回到一個核心模式:模型、harness、工具、技能和運行環境。

這套模式可以運行在雲端,也可以運行在企業本地;可以運行在 PC 上,也可以運行在汽車、機器人、衞星、通信基站、工廠和邊緣設備上。不同場景會使用不同模型、不同 harness、不同工具和不同 runtime,但計算模式是相同的。

雲端需要 Vera Rubin 和 AI 工廠。PC 需要 RTX Spark 和 Windows 智能體平台。企業需要 Nemotron、OpenShelf 和 CUDA X 工具鏈。汽車需要 Alpamayo、Hyperion 和自動駕駛 runtime。人形機器人需要 Isaac Groot、Thor、仿真和數據生成系統。

當我們把整場演講連起來看,將近兩個小時的超長髮布,黃仁勳講的主題已經超出常規新品發佈。


AI PC 和 RTX Spark 面向個人設備,把智能體帶到用户桌面和家庭。Vera Rubin 面向數據中心,承接大規模智能體負載。Vera CPU 解決智能體調用工具和訪問數據時的延遲問題。

DSX 面向 AI 工廠建設,把電力、冷卻、網絡和運維也納入系統設計。Nemotron、OpenShelf 和 CUDA X libraries 面向企業智能體開發。Cosmos 3 把智能體推進物理世界。Alpamayo 2 和 Hyperion 面向自動駕駛,Isaac Groot 則把人形機器人也放進同一套平台邏輯。

NVIDIA 過去最核心的身份是 GPU 供應商,後來變成系統公司,現在又試圖成為 AI 基礎設施公司。

黃仁勳在這場大會想講清楚的,也正是這件事:AI 競爭已經從模型擴展到一整套計算體系,覆蓋個人電腦、企業軟件、數據中心和物理設備。

文|莫崇宇、張子豪


資料來源:愛範兒(ifanr)
標籤: 英偉達  Windows  AI PC  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→