OpenAI 計劃自研 AI 芯片,以減少對英偉達的依賴

愛範兒 於 01/11/2024 發表 收藏文章
據路透社報道,OpenAI 正在與博通(Broadcom)合作開發其首款定製 AI 推理芯片,旨在處理其大規模的 AI 工作負載,特別是推理任務。

為此,OpenAI 已經組建了一支約 20 人的研發團隊,包括曾參與谷歌 Tensor 處理器項目的首席工程師在內。

消息稱博通將會幫助 OpenAI 進行芯片設計,並確保由台積電(TSMC)進行製造,預計 2026 年開始生產。

▲OpenAI 將自研 AI 芯片. 圖片來源:cnBeta

為了實現芯片供應的多元化,OpenAI 此前計劃建立芯片製作代工廠。但由於成本高昂,並且構建代工廠網絡需要大量時間,OpenAI 已經擱置了這一計劃,轉而專注於內部芯片設計

OpenAI 這一通過「定製芯片設計來管理成本和訪問 AI 服務器硬件」的戰略意味着其走上了 Meta 和 Google 等科技公司的老路,而後者作為 OpenAI 的競爭對手,已經經歷了幾代人的努力。

並且,市面上不乏成熟且廣泛部署應用的 AI 芯片,如 Google 推出的「TPU」、微軟的「Maia 100」等等。

也就是説,OpenAI 需要更多的資金才能彌補這些差距,登上牌桌。

▲微軟推出的 AI 芯片「Maia 100」. 圖片來源:techmonitor

除了滿足不斷增長的基礎設施需求,減少訓練和運行成本以外,「減少對英偉達(NVIDIA)的依賴」也是 OpenAI 的「小算盤」之一。

OpenAI 的 CEO 奧特曼(Altman)指出,之所以要「獲得更多芯片」,是因為兩個問題:為 OpenAI 軟件提供動力的先進處理器的短缺,以及為其工作和產品提供動力的硬件運行所需的「令人眼花繚亂」的成本。

他還曾公開抱怨市場資源匱乏,而 NVIDIA 主導並控制着最適合運行 AI 應用的芯片全球 80% 以上的市場。

作為英偉達圖形處理單元(GPU)的最大買家之一,OpenAI 此前幾乎完全依賴 NVIDIA GPU 進行訓練。2020 年以來,OpenAI 在微軟建造的大型超級計算機上開發了其生成式人工智能技術,這台計算機使用了 10000 個 NVIDIA GPU。

▲NVIDIA H100 GPU. 圖片來源:NVIDIA

但由於芯片短缺和供應延遲,以及訓練成本高昂的問題,OpenAI 不得不開始探索替代方案。他們計劃通過微軟的 Azure 雲平台使用 AMD 芯片進行模型訓練。

值得一提的是,AMD 在去年推出了 MI300 AI 芯片,致使其數據中心業務在一年內翻了一番。種種跡象表明,AMD 正在追趕市場領導者 NVIDIA。

▲AMD MI300 芯片. 圖片來源:AMD

此外,消息人士稱 OpenAI 仍在決定是否為其芯片設計開發或收購其他元件,並可能會聘請更多合作伙伴。

儘管「不惜一切代價構建 AGI(通用人工智能)」的 OpenAI 和號稱「下一個英偉達」的博通之間和合作很可能引起英偉達的不滿,但 OpenAI 表示「希望與仍致力於合作的芯片製造商保持良好的關係,特別是在使用其新一代 Blackwell 芯片方面」。

對此,英偉達暫時不予置評。

唯一的迴應是市場。合作消息一出,博通的股價應聲大漲,AMD 也延續了早盤漲幅。


資料來源:愛範兒(ifanr)
標籤: OpenAI  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→