蘋果 Vision Pro 和 GPT-4,開啓了「智力盈餘」時代

愛範兒 於 07/06/2023 發表 收藏文章
2023 年已經接近過半,但是還沒有什麼人説這一年是「XX 元年」,畢竟我們在樂觀時代的樂觀情緒鼓動下,已經把「AI 元年」,「VR 元年」,「元宇宙元年」,以及區塊鏈,Web3 等等技術的元年分配出去了。

與之相反,2023 年早已不屬於樂觀時代,那種火熱的樂觀情緒正在變得異常謹慎,最簡單的例子就是,OPEN AI 目前的估值還不到 300 億美元,要是在四五年前,它的估值很可能翻倍甚至更多。

當然,這一年註定還有很多其他的事情,比如智能手機行業徹底進入了下行通道,曾經被認為是出貨量下滑主因的疫情因素剔除之後,大家只能面對嚴酷的現實:大家對智能手機已經意興闌珊了。再比如阿里雲開啓史上最大規模降價,隨後騰訊雲也跟進。還有比如高通展示了在 Android 手機上本地運行的 Stable Diffusion(一種開源 AI 繪圖工具)。或者是一些和互聯網關係不大的,比如大家對於可控核聚變突然信心充足起來了……

當然,以世界之廣闊,一年之悠長,類似的新聞年年有之,只看這些,2023 年又類似於萬曆十五年那樣,不過是歷史上平平淡淡的一年。

但如果時間維度拉長,我們回看 2023 年的時候,一定有兩款產品在歷史維度上留名:已經發布的 GPT-4,和剛剛發佈的蘋果 Vision Pro 頭顯。

2023 不是任何「元年」,但因為 GPT-4 和蘋果 Vision Pro 成為極為重要的一年。

智力

實際上,GPT-4 是一個統稱:可以取代部分腦力工作的 AI 工具。

比如,微軟 Office Copilot,原本需要學習很久的 Excel 公式才可以實現的數據分析,如今只需要一句話就可以做到;原本需要一整天製作的 PPT,現在還是一句話的事兒。

▲ MidJourney 生成的圖片,玻璃反射極為逼真

再比如 AI 畫圖工具 MidJourney,可以在幾分鐘時間裏輸出質量極高的各類圖片,無論是二次元插畫風格,還是像是專業相機拍攝的以假亂真圖片。

還有 GPT-4 本身作為大語言模型以及通用人工智能的代表所呈現出來的「智力」:讓它去參加「美國高考」SAT 考試的話,它的成績可以打敗 90% 考生,分數足以讓它進入美國哈佛或者斯坦福等名校。

除此之外,現在每天還有各種各樣的 AI 工具出現,在某些方面上展現出遠超人類能力的高效。

如同 GPT-4 等大模型展現出來的「湧現」現象一樣,現在的 AI 工具也不斷地湧現出來,對於大多數人來説,不談學習和使用這些工具,光是做到知道這些工具的存在就已經不太可能了。

《漫長的季節》當中,男主角王響在鋼鐵廠開了幾十年的火車,開火車的技能讓王響手捧鐵飯碗,也享有不錯的社會地位和家庭地位。

在同樣或者更早的時期,一項並不難獲得的技能足以保證一個人在幾十年時間裏獲得安穩的工作:五六十年前的美國高中畢業生如果會用打字機或者計算器,那就可以在一家公司找到穩定 30 年的白領工作。

現在,沒有人認為依靠掌握了 Office 軟件就能在一家公司幹 30 年。

在 10 年前,我在愛範兒寫一些編譯類快訊新聞類消息,一天寫 6 條已經讓我倍感疲憊,但是如今藉助 ChatGPT 的翻譯和總結能力,一個有基本英語和語文能力的高中生,一天寫 60 條快訊新聞也不是難事。

這是一道最簡單的算術題,現在的 AI 工具並不能完全替代人,但是可以在一些工作崗位上實現「1 個人+AI=10 個人」的效果。
這種算術題並不是作為威懾的戰略武器,而是正在發生的情形,不少遊戲公司已經用 AI 進行人物原畫繪畫和場景建模。

▲ 盒馬鮮生用 MidJourney 生成的宣傳圖,能夠以假亂真

上上個月盒馬賣花促銷活動「芍藥季」的宣傳海報中,就已經用到了 MidJourney 製作不在花期的花卉圖片,如果不是特別標註,幾乎不會有人看出這是 AI 繪圖。

▲ 很多人猜測這張《王者榮耀》遊戲插畫是 AI 繪圖,人工修改完成

而不久前手遊《王者榮耀》裏的一幅插畫也引起了不少玩家和畫師的猜測:因為諸多細節上的不合理之處,讓大家懷疑這是 AI 繪圖,人工略微修改的作品。
一位遊戲大廠的市場營銷員工告訴愛範兒,類似的單幅海報插畫,給外包畫師的價格是 2-5 萬元,有特別要求的還會更貴。

當然,還有很多人,包括我自己,在進行 AI 工具測試的時候會發現,目前 AI 工具還不具備取代自己的能力,或者説沒法很好地融入到自己的工作流。但是對自己再自信的人心裏也明白,今天它不行,不過總有一天它可以,這一天也不會太久。

在多數打工人的視角看來,ChatGPT 等等 AI 工具不會讓某種工作消失,但會讓崗位需求鋭減,少數精英加 AI 的工作模式使得原本是行業平均水平左右的人面臨失業風險,而這些人又是行業的主流人羣。


始作俑者 OPEN AI 自己也發佈了報告,列舉了不少最容易被 ChatGPT 影響的職業,其中有不少曾經被認為是白領甚至是金領的職業面臨被取代的風險。

這個風險不在以後,就在現在。

前不久好萊塢編劇行業正在進行大罷工,除了抗議待遇過低,NetFlix 等僱傭方壓榨勞力之外,矛盾點還集中在 AI 創作上,這批編劇的集體訴求是「禁止使用 AI 撰寫文學材料;禁止將其作為原始材料;禁止使用作家們創作的材料訓練 AI。」

但是,代表僱傭方利益的 AMPTP(美國影視製片人聯盟)主席卻表示:

引用編劇能有一份短期工作已經是很幸運的事了。

言下之意大概是,以後或許連短期工作都找不到了。

這就是路人皆知的司馬昭之心,從僱傭方的角度來看,ChatGPT 帶來的效率提升和人力成本降低,是巨大的機遇,這也是為什麼這麼多互聯網行業的老闆熱衷於轉發各種 AI 進展到朋友圈的底層原因,他們堅信並且希望 AI 能夠降本增效。

正如經濟學家 Tyler Cowen 在《平均的終結》所表述的,哪個行業的就業人數更多,顛覆這個工種就會創造更大的商業價值。

被僱傭的打工人自然是另外的想法,降本增效,降本靠裁員,增效靠壓榨,橫豎逃不脱悲慘的命運。

▲ 約翰迪爾 CP690 摘棉機

以農業為例,愛範兒曾去巴音郭楞蒙古自治州尉犁縣看過現代農業機械如何讓幾個人就能管理數千畝的棉花田:一架農業無人機每小時可以噴灑農藥超過 150 畝的農田,相當於 60 個人的效率。一輛價值 500 多萬元的約翰迪爾 CP690 摘棉機的效率相當於 700 多個採棉工人。

可以説,過往數千年,尤其是近代農業和工業的發展,就是創造「體力盈餘」,用機器代替人力的歷史。

如果重複的體力勞動可以被機器取代,那麼重複的腦力勞動為什麼不可以?

現在看來,智力的屏障,並不比體力的屏障牢固。


智力的載體

其實把 ChatGPT 等 AI 稱為工具是有失妥當的,因為對於人類來説,工具無需智力,不需要什麼人類定義的「主觀能動性」,遵循特定的邏輯,菜刀切菜,微信聊天,Photoshop 修圖等等,我們使用工具的每一個動作,都有一個明確預期。

這種預期的典型例子就是「圖形界面,GUI」,無論是 PC、Mac 還是智能手機,都依賴於圖形界面進行操控,我們觸碰微信圖標,手機絕對不會打開微博。我們在飛書上點擊會議錄音按鈕,它絕不會打開月報彙報頁面。這是因為程序是寫死的,A 到 B 的路徑是一定且透明的。

但是對於 ChatGPT 而言,不光是我們沒法保證預期結果是明確的,更不知道我們發出的指令到 ChatGPT 輸出結果之間發生了什麼。

正如前面所説,在很多涉及到推理和理解環節,ChatGPT3.5 顯得很弱智,但是 GPT-4 則表現得像是個情智雙高的學霸。

2023 年上半年的科技新聞熱搜顯然是被 ChatGPT 霸榜的半年,其中有三個新聞熱度最高:GPT-4 發佈,基於 GPT-4 能力的微軟 Office Copilot 發佈,ChatGPT 發佈 iOS 版應用。

▲ 蘋果的 Vision Pro 頭顯

然後,就是蘋果 Vision Pro 頭顯的發佈。

之所以這款設備被如此看重,是人們在智能手機之後,孜孜不倦地尋找下一個計算平台,一度人們寄希望於智能手錶這樣的可穿戴設備,但事實證明它的定位是沒法幹活也沒法娛樂,智能手錶能在交互上做的革新乏善可陳。

▲ 數量眾多的傳感器和攝像頭,為全新交互提供了基礎

那麼,蘋果 Vision Pro 頭顯在交互上做了什麼呢?

我們操控電腦,需要鍵盤和鼠標;我們操控智能手機,需要觸摸屏幕,總有一個東西作為「介質」來連接設備和人,而在蘋果 Vision Pro 頭顯上,我們幾乎不需要這種「介質」了,手勢、眼球和嘴巴就成了主要的交互工具:

  • 手勢:代表將要執行的動作
  • 眼球:代表注意力的方向
  • 嘴巴:代表繁重的內容輸入

鍵鼠之所以精確,是因為我們點擊 F 鍵,它不會被識別為 G 鍵,但觸控屏偶有誤觸的現象,針對誤觸,很多輸入法又推出了「智能糾錯」,在我們打出類似於「zjihui」的時候,智能糾正為「zhihui」,這就是設備開始有了自己的「判斷」。

對於蘋果 Vision Pro 頭顯而言,它幾乎無時無刻都在進行「判斷」:用户這個手勢代表什麼,眼球看向哪裏,説的這句話是什麼意思?


簡言之,它需要足夠「聰明」,才能執行這樣的交互。在一些遊戲主機配件和智能手機,手勢操作,眼球追蹤,還有語音識別都不是新鮮事,但也都是錦上添花型的功能,圖個新鮮感,並不能作為主要的交互方式。

但沒有鍵鼠和觸屏的蘋果 Vision Pro 頭顯,把三者結合,既是丟了過去的包袱,也開啓了新的未來,交互的自由度和維度得到最大程度的解放,在腦機接口商用之前,人類新的人機交互方式講會以此為基礎:無需藉助「介質」,人體器官就是交互的主體。

如果到這裏,你還是覺得蘋果 Vision Pro 頭顯缺了點什麼,毫無疑問就是一個類似於 ChatGPT 這樣的大語言模型以及相關應用。

▲ 2023 年最令人震撼的場景之一:Office Copilot 自動生成 PPT

再如果一下,要是微軟牢記使命不改初心,堅持做最好的蘋果生態開發者,把 Office Copilot 留到六月,在蘋果 Vision Pro 頭顯環節進行演示,絕對要比什麼米老鼠之類的更炸裂。

哪個打工人不想在虛擬世界裏對着 Office Copilot 説一句話就能生成個 PPT,然後給老闆交差,自己接着看電影呢?

微軟把 Office Copilot 上難嗎?

一點都不難。

那麼如果 Stable Diffusion 能在驍龍旗艦手機上跑,ChatGPT 能在 iOS 上跑,那帶着一顆 M2 芯片的蘋果 Vision Pro 頭顯加上它帶來的全新交互方式,意味着它可以是,也應當是一種「智力的載體」。

如果不能理解為什麼類似於 ChatGPT 這樣的大模型是一種智力,蘋果 Vision Pro 頭顯是一種智力的載體,那麼在鼓吹「元宇宙」時代一路沉淪的 Meta,在 AIGC 時代股價連連提升,其發佈的諸多大模型都能和 VR 業務掛鈎,至少證明資本市場對其邏輯的認可,這也是佐證「智力和智力的載體」的例子。

所有 AR、VR 和 XR 從業者都期待着蘋果的「打樣」,3499 美元的售價則給其他相關產品留下了足夠的市場空間。


諸如 PICO 4 Pro 這樣輕便(597 克),性能不錯,視角和分辨率處於主流水平,搭載眼動和麪部追蹤等新技術,有了初步生態,還帶點性價比(相比於 Vision Pro)的產品預計會成為不少人的「平替」,除了價格,蘋果 Vision Pro 的上市時間和初期產量也給大家留下了不小空間。

另一個傳感器越來越多,算力越來越強,語音交互地位越來越高的「電子產品」,是汽車。

也就是前不久,理想汽車創始人李想就説:

引用智能駕駛和智能空間都已經進入大模型時代,大模型的研發和訓練是智能電動車企業的必要能力,否則只會停留在電動車的時代。

這則是另一品類殊途同歸的例子。

▲ 用最炫酷的 Vision Pro,做最枯燥的工作

智力盈餘

前不久去看廣東美術學院畢業展的時候,看到了一個廣東美術學院和騰訊合作的展區,主題是未來城市 WeCityX,在暢享未來辦公,居住,出行場景的時候,還未踏出校園的學生展現了他們充滿未來視角的展望:

  • 一個畢業設計作品是 AR 眼鏡,滿足了隨時隨地辦公的需求
  • 另一個畢業設計作品是未來工位,搭配 AR 眼鏡,可以在工位上工作,鍛鍊,休憩
  • 還有一個作品是未來出行,在無人駕駛汽車裏安排了工位,不開車可以,但得工作

更早之前,在採訪金山辦公高管的時候,我問「AI 是不是讓曾經是偽命題的移動辦公成真了?」,得到的答案是肯定的。

在手機處理表格是很多人的噩夢,在電腦上易如反掌的「把表格第三行和第八行互換位置」的操作在手機上會變得非常繁瑣,但是如果是擁有「智力」的 AI,我們只需要説出來,在任何設備上,PC、手機、平板乃至智能頭顯,其效率都是一樣的。

對於未來工作場景的設想,廣美畢業生們都預判到了一點:工作如風,常伴吾身。

為什麼會變成這樣呢?

其實是我們離信息和智力這兩個處理工作的要素越來越近了。


皮尤研究中心不久前的針對美國成年人的一項調查研究結果表明,更年輕,更高學歷和更高收入的人,使用 ChatGPT 更多。

我們沒法準確預測,這羣對 AI 持更開放態度的人,未來會因為 AI 變成什麼樣,但是「強者愈強」的馬太效應確實無處不在的。

放寬到城市維度,城市核心地產的價格漲幅,往往大於郊區;城市經濟增長和能源消耗水平也往往大於人口增長;城市經濟增長的成果大部分被收入前 10% 的羣體獲得,當然,這個羣體也會被城市增長的快節奏所裹挾,回到前面説的:工作如風,常伴吾身。

如果皮尤研究中心的報告增加一個地理緯度的話,那幾乎可以肯定,位於加州灣區或者紐約的人,相比於五大湖地區鐵鏽帶的人,更樂於使用 ChatGPT。

類似的認知領先在過往的例子比比皆是,如果在 2013 年左右成為第一批網約車司機,因為平台競爭和補貼等優惠政策,月入兩三萬很簡單。現在的情況是,長沙三亞等多地交管部門發佈預警,稱當地網約車司機數量趨於飽和,不宜作為職業選擇。

因為 ChatGPT 等 AI 工具有非常明顯的「傻逼牛逼二象性」,這使得很多人對它們的認知並不清晰。

一家公司裏面,最善於驅使他人智力的,一般是老闆和主管,這種地位和分工,亦可能形成認知上的領先,比如每次當我對 AI 工具將信將疑,使用幾次發現不過爾爾的時候,我的老闆就會用親身經歷和實踐以及結果告訴我:如果 AI 工具沒給到你要的東西,不是它不行,而是你問得不對或者不夠。
當我思考,為什麼他總是可以從 AI 那裏獲得他想要的結果時,得到的答案有兩點,一是他對 AI 的智力和知識有信心;二是他有豐富驅使其他智力的經驗。

對於大多數貢獻自己智力和體力的人來説,選擇、驅使和利用其他智力,是一個全新的命題。

在以 BAT 為代表的大型互聯網公司中,較為成功的員工可能是既聰明又勤奮的,最為成功的員工往往是再疊加一個「善於利用公司各種資源」的要素,這種資源往往就包括智力。

這種不平均自古有之,現代汽車功率大小所採用的單位「馬力」源自蒸汽動力設備的出現,蒸汽機改良者瓦特測定一匹馬一個小時可以轉動磨坊轉盤 144 圈,折算為一匹馬每秒能夠把 75 千克的水提高 1 米,即字面上的意思:一匹馬的力量。

顯然步行時候,人的力量是遠不如馬的,但古人達官貴人的馬車有三四匹馬牽引,還有時候,人是貢獻馬力的,比如給達官貴人抬轎的時候。

▲ 特斯拉 Model S

而現在最新的特斯拉 Model S Plaid 則能夠瞬間爆發出 1000 馬力的功率,這在古代是上千騎兵才有的力量,但現在一輛轎車就僅為 1-5 人服務而已。

美國學者和諮詢顧問克萊·舍基在《認知盈餘:自由時間的力量》中認為,互聯網的產生和勃興,源自於人類的認知盈餘和分享精神。因為對這本書觀點的認可,馬化騰還給這本書得中文版進行作序,他認為「認知盈餘」概念是平台型互聯網企業得以發展的時代紅利,Facebook、Twitter、維基百科和微博都是基於此。

實際上,UGC(用户貢獻內容)和 PGC(專業用户貢獻內容)的概念和「認知盈餘」一脈相承,當這一波 AI 浪潮冠以 AIGC 之名的時候,實際上印證的是 AI 能夠貢獻的「智力盈餘」幾乎是無限的。

每個人都有機會,擁有無限的「外部智力」。

對於這種新工具的認知差異,比自己步行和開特斯拉 Model S Plaid 的差異還要大得多,前者使用的不過是 0.1 馬力不到,而後者能用到 1000 馬力,前者的行進速度大概是 5KM/h,而後者可以達到 320KM/h。

在這一波 AI 浪潮中,受益最大的是英偉達,它的市值前不久一度超過了 1 萬億美元,成為首家市值超萬億的芯片公司,無論是 PC 浪潮中的英特爾,還是智能手機浪潮中的高通都未能達到這一成就。

▲ 英偉達創始人&CEO 黃仁勳
前不久英偉達創始人&CEO 黃仁勳在台大進行了演講,在結尾,他是這麼説的:

引用無論是什麼,像我們一樣全力以赴去追求它,跑吧!不要慢慢走。

不論是為了食物而奔跑,或不被他人當做食物而奔跑。你往往無法知道自己正處在哪一種情況,但無論如何,都要保持奔跑。

六七年前,我在朋友圈看到一些 AI 領域創業者預言未來的人類藉助外腦、外骨骼甚至機械植入和腦機接口,將會在智力和體力上產生巨大的差異,差異大到是物種和物種的差別。生物學上原教旨主義上的人類,或許迎來了終結。

▲ 近一期的《時代》封面

當時覺得不過是科幻場景,現在看來,ChatGPT 和智能頭顯的結合,已經趨近於外腦的雛形了。

沒有發令槍,但競速早已經開始,現在的情況是跑在最前面的人開始對擁擠在起跑線上的人開始大喊:快跑啊,不跑會被吃掉!

與我們在大學演講慣常見到的「有人年少成名,有人大器晚成,不必急躁,做你自己」之類的雞湯不同,黃仁勳的勉勵近乎於「社會達爾文主義」的弱肉強食觀點了。

至於為什麼這麼説,因為他認為,反應敏捷的企業將利用 AI 技術提升競爭力,而未能善用 AI 的企業將面臨衰退。AI 將改變每一種工作,一些工作將會被淘汰,每個組織每個人都需要學習利用 AI 的優勢。這就是為什麼這麼多 AI 從業者在高喊「平均已經終結」,人和人,組織和組織,會因為 AI 變得更不平均。

還是以汽車為例子,汽車不光是一種「體力盈餘」的象徵,擁有 1000 匹馬的力量,也會因為算力(英偉達 Thor 自動駕駛芯片擁有 2000 TFLOPS 算力)、傳感器(激光雷達、攝像頭和毫米波雷達的組合,遠超人眼的感知能力)和算法以及大模型也能產生「智力盈餘」,有智能駕駛和沒智能駕駛的汽車,已經是兩類產品。

手握方向盤的駕駛行為必將成為歷史,就像我現在一個字一個字敲擊鍵盤打出這篇文章的行為一樣。

如果你認為人可以被分為「走路的人,自己開車的人,用自動駕駛到終點的人」,那麼,人和「AI 智力」的關係,也將成為區分人羣的關鍵。

ChatGPT 和蘋果 Vision Pro 頭顯已經開啓了「智力盈餘」的時代,你可以不必擁有 Vision Pro,但必須擁有 Vision。


資料來源:愛範兒(ifanr)
標籤: Vision Pro  GPT-4  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→