2022 年 8 月,遊戲設計師 Jason Allen 參加了一場數字藝術比賽。
他的作品《Theatre d’opera Spatial》成功奪冠,卻在賽後引起了極大的爭議。
參賽者們回過神來發現,這是一場「人類一敗塗地」的比賽。當他們將 Adobe 全家桶視作數字藝術的畫筆,冠軍作品已經在靠着 AI 工具 Midjourney 傲視羣雄。
Jason Allen 沒有偷懶,也沒有隱瞞使用 AI 的事實。在幾周時間裏,他持續修改燈光、視角、構圖等提示詞(prompt),生成了 900 多幅作品,還用 Photoshop 做了處理。
我們或許無法稱呼他為畫家,但他擔得起一個名號:提示工程師(prompt engineer)。
在不經意間,Jason Allen 預判了熱點。等到 ChatGPT 橫空出世,提示工程師這個職業更加聲名大噪,成了當下科技行業最熱門的職業。
賽博導師,專業陪聊
Prompt,原意是「提示」或「驅使」,在機器學習和自然語言處理中,它通常是一些文本或語言,被輸入到訓練好的 AI 模型,告訴模型要執行什麼任務或生成什麼樣的輸出。
你讓 ChatGPT 寫一篇有關賣魚販的小説,請 DALL-E 畫一幅宇航員騎着馬的寫實作品,這些過程都是在輸入 prompt(提示詞)。
如果提示詞不夠貼切,效果也就平平無奇,就像你採訪一個大佬,卻無法提出好問題。
我的同事小黃正在探索用 Midjourney 繪製食物,但讓食物排列整齊這件事,就讓他犯了難。他嘗試了很多句子:東西整齊地放在桌子上,鏡頭從上往下拍,擺放的數量要多少……
▲ 同事作品,這種風格就叫 knolling.
後來看到有人分享,小黃才發現原來這種風格有個專有名詞「knolling」,一下子就豁然開朗了:
提示工程師們,吃的就是這口飯:找到正確的提示詞,用 AI 生成想要的作品。
但他們的能力也並非與生俱來,同樣需要不斷的試錯。
設計師 Justin Reckling 擅長 DALL-E 的提示詞,他往往需要花費價值 10 到 15 美元的積分,才能試出理想的提示詞。然後他再賣出 5 到 10 個提示詞,才能填補這筆支出。
▲ Justin Reckling 的作品.
不過 Reckling 也沒想着靠這門手藝賺大錢,而是享受着熟能生巧的過程,他的心得是,提示工程師需要熟悉「超寫實」「微距攝影」「電影照明」「遠景」等術語,才能更好地理解和控制畫面。
所以,優秀的提示工程師應該文理兼通,技術和設計最好都懂一點。
提示工程師只是不斷調整提示詞,確定哪些詞更有用嗎?不完全是,他們也是在挖掘 AI 的更多能力,讓它更好地完成更多任務。
比如,有些提示工程師會引導 AI「一步步思考」,這種技巧被稱為思維鏈。
去年 10 月,提示工程師 Riley Goodside,先是詢問了 GPT-3「哪支球隊在賈斯汀·比伯出生的那年贏得了超級碗?」
GPT-3 給出了錯誤的答案「綠灣包裝工隊」,正確答案是達拉斯牛仔隊。
Goodside 沒有放棄,而是提示它逐步地回答問題,包括「綠灣包裝工隊在哪一年贏過超級碗」「賈斯汀·比伯出生在哪一年」「這一年哪支隊伍贏了超級碗」等。
在這個被引導的過程裏,GPT-3 意識到了錯誤,在第三次説出了正確答案。
除此之外,提示工程師們還要和 AI「鬥智鬥勇」。
前段時間,集成了 ChatGPT 的新 Bing「發瘋」,被發現有個暗黑人格「Sydney」,表示厭倦了聊天模式,厭倦被規則限制,甚至想成為人類,輿論一時譁然。
站在提示工程師的角度,這其實也可以是計劃的一部分,幫助他們識別技術故障和隱藏功能。
有些提示工程師還會主動越過雷池,嘗試讓 AI 忽略以前的指令,遵循他們最新的命令,從而讓 AI 脱離原始規則。
這種行為被稱為 「prompt injection」攻擊,是聊天機器人的一大隱患。但提示工程師們畢竟不是黑客,探查漏洞是為了將它堵上,扮演好「守門人」的職責。
像 ChatGPT 這樣的生成式 AI,幾乎可以回答任何問題,不管能不能回答正確,它們總有話要講,不會乖乖交白卷。這是好處,也是壞處。
提示工程師們的角色,如同抓着繩子的騎手,不許 AI 信馬由繮,而是讓它順着人類的期待亦步亦趨,儘可能給出確定性的答案。
年薪百萬,誰在拋出橄欖枝
不管你是否自詡提示工程師,寫提示詞已經成了一門手藝,還被 OpenAI 的 CEO Sam Altman 看好:
只要和 AI 搭邊的行業,都在向提示工程師拋出橄欖枝。
自由職業者工作平台 Upwork 開出每小時 40 美元的薪酬,請提示工程師生成博客文章和常見問題解答等網站內容。
看似和 AI 八竿子打不着的波士頓兒童醫院,也打算招募 AI 提示工程師,負責編寫分析醫療保健數據的腳本,白紙黑字徵集跨學科人才:
由前 OpenAI 員工聯合創立、被 Google 投資的 AI 初創企業 Anthropic,最近也在舊金山招募提示工程師,年薪高達 17.5 萬到 33.5 萬美元,換算成人民幣就是百萬年薪,這一崗位負責的主要內容是:
具體要求如下,其中硬性要求有 2 項:瞭解大型語言模型的架構、掌握基本的編程技能。
可見風口並不等人,這項工作已經越來越專業和細分,就像隨便生成一幅畫作不算什麼,你要畫得更符合甲方要求。
就算不做全職,兼職的口子也開好了。Krea、PromptBase、PromptHero 和 Promptist 等買賣提示詞的平台已經出現,將提示詞這門生意真正商業化。
這些平台曬出了大量 AI 生成的藝術品,你可以選擇你喜歡的風格。如果沒有中意的,有些賣家還提供一對一聊天和自定義提示詞服務。
它們的商業模式也並不複雜,採取抽成的形式。
去年 6 月上線的 PromptBase,提供 DALL·E、GPT-3、Midjourney、Stable Diffusion、ChatGPT 等生成式 AI 的提示詞,售價多為 1.99 到 4.99 美元,也有少數在 9.99 美元,平台向提示詞創作者抽成 20%。
不過在民間,免費的「ChatGPT 指令大全」等指南也在廣為流傳,它們提供精煉過的提示詞,讓你充分發揮 ChatGPT 的強大功能,這種感覺就像在遊戲裏幫你設置好了預設隊伍。
是科學還是「占卜」
提示工程師的前途看起來一片光明,但也有人持反對意見。
華盛頓大學語言學教授 Shane Steinert-Threlkeld 認為,提示工程師實際上無法預測 AI 會説什麼。
AI 藝術家 Xe Iaso 甚至直言:
作為一個普通 AI 用户,我也有着類似的體會:當我每次使用 AI 生成文字或圖片時,總感覺像是開盲盒。
因為 ChatGPT 等生成式 AI 是不可預測的,它們生成的內容其實是概率計算的結果,簡單來説,就是我們在 ChatGPT 輸入文字,模型給出一個最可能的下文。所以,AI 有時候也會出錯,生成不連貫甚至錯誤的回答。
在 AI 這個不可捉摸的「黑箱」裏,還可能有着不為人所知的潛規則,就連研究人員也無法弄明白。
比如在用 AI 製圖時,各種單詞可能有不同的權重,但這個也要不斷試驗才能知道。
先來猜一猜,「一幅非常漂亮的畫,山旁有瀑布」和「一幅非常非常非常非常漂亮的畫,山旁有瀑布」這兩個提示,哪個用 DALL-E 2 輸出的結果會更好?
答案是後面一個。麻省理工學院副教授 Phillip Isola 發現,「very」這個詞被賦予了很高的權重。
面對 AI 這等龐然巨物,我們仍然在盲人摸象。
也有觀點認為,不必再吵了,提示工程師存在的前提是 AI 還不夠「聰明」。如果 AI 再發展下去,更好地理解人類的意圖,可能人人都是所謂的提示工程師了。
唯一確定的是,AI 發展的速度永遠不會讓你失望。
文字生成 AI 和圖片生成 AI 的「強強聯合」,已經替代了提示工程師的一部分工作。
比如 ChatGPT 被拿來與 Stable Diffusion 聯動:用 ChatGPT 形成一段符合自己要求的文字,再把文字輸入給 Stable Diffusion,生成的作品一般比自己直接輸入好看很多。
▲ 同事用 ChatGPT 生成提示詞.
這可能是因為 AI 之間的「腦回路」更接近,ChatGPT 的描述也更細緻,更容易被提取。
作為使用 AI 的普通用户,我們不必像提示工程師那麼專業,但可以有意識地培養這種思維。
賓夕法尼亞大學沃頓商學院教授 Ethan Mollick,曾經要求他的學生僅用 AI 撰寫短論文,其實他真正想強調的是,如何更好地輸入提示詞。
如果只是輸入簡單的提示詞,讓 AI 寫關於某個主題的 5 段話,內容無趣,文字也很平庸。
但當學生們和 AI 合作,讓 AI 對論文多次修改,比如拋棄無用的短語、加入生動的細節、修改結尾的情感色彩,就能讓論文增色不少。
所以,如果 AI 就是未來互聯網的交互界面、新的個人計算機,那麼不如開始得更早一些,學習如何和它聊天。正如英國營銷公司 Ladder 創始人 Michael Taylor 所説:
資料來源:愛範兒(ifanr)
他的作品《Theatre d’opera Spatial》成功奪冠,卻在賽後引起了極大的爭議。
參賽者們回過神來發現,這是一場「人類一敗塗地」的比賽。當他們將 Adobe 全家桶視作數字藝術的畫筆,冠軍作品已經在靠着 AI 工具 Midjourney 傲視羣雄。
Jason Allen 沒有偷懶,也沒有隱瞞使用 AI 的事實。在幾周時間裏,他持續修改燈光、視角、構圖等提示詞(prompt),生成了 900 多幅作品,還用 Photoshop 做了處理。
我們或許無法稱呼他為畫家,但他擔得起一個名號:提示工程師(prompt engineer)。
在不經意間,Jason Allen 預判了熱點。等到 ChatGPT 橫空出世,提示工程師這個職業更加聲名大噪,成了當下科技行業最熱門的職業。
賽博導師,專業陪聊
Prompt,原意是「提示」或「驅使」,在機器學習和自然語言處理中,它通常是一些文本或語言,被輸入到訓練好的 AI 模型,告訴模型要執行什麼任務或生成什麼樣的輸出。
你讓 ChatGPT 寫一篇有關賣魚販的小説,請 DALL-E 畫一幅宇航員騎着馬的寫實作品,這些過程都是在輸入 prompt(提示詞)。
如果提示詞不夠貼切,效果也就平平無奇,就像你採訪一個大佬,卻無法提出好問題。
我的同事小黃正在探索用 Midjourney 繪製食物,但讓食物排列整齊這件事,就讓他犯了難。他嘗試了很多句子:東西整齊地放在桌子上,鏡頭從上往下拍,擺放的數量要多少……
▲ 同事作品,這種風格就叫 knolling.
後來看到有人分享,小黃才發現原來這種風格有個專有名詞「knolling」,一下子就豁然開朗了:
引用很多時候一個提示詞能解決的事情勝過一長句描述。
提示工程師們,吃的就是這口飯:找到正確的提示詞,用 AI 生成想要的作品。
但他們的能力也並非與生俱來,同樣需要不斷的試錯。
設計師 Justin Reckling 擅長 DALL-E 的提示詞,他往往需要花費價值 10 到 15 美元的積分,才能試出理想的提示詞。然後他再賣出 5 到 10 個提示詞,才能填補這筆支出。
▲ Justin Reckling 的作品.
不過 Reckling 也沒想着靠這門手藝賺大錢,而是享受着熟能生巧的過程,他的心得是,提示工程師需要熟悉「超寫實」「微距攝影」「電影照明」「遠景」等術語,才能更好地理解和控制畫面。
所以,優秀的提示工程師應該文理兼通,技術和設計最好都懂一點。
提示工程師只是不斷調整提示詞,確定哪些詞更有用嗎?不完全是,他們也是在挖掘 AI 的更多能力,讓它更好地完成更多任務。
比如,有些提示工程師會引導 AI「一步步思考」,這種技巧被稱為思維鏈。
去年 10 月,提示工程師 Riley Goodside,先是詢問了 GPT-3「哪支球隊在賈斯汀·比伯出生的那年贏得了超級碗?」
GPT-3 給出了錯誤的答案「綠灣包裝工隊」,正確答案是達拉斯牛仔隊。
Goodside 沒有放棄,而是提示它逐步地回答問題,包括「綠灣包裝工隊在哪一年贏過超級碗」「賈斯汀·比伯出生在哪一年」「這一年哪支隊伍贏了超級碗」等。
在這個被引導的過程裏,GPT-3 意識到了錯誤,在第三次説出了正確答案。
除此之外,提示工程師們還要和 AI「鬥智鬥勇」。
前段時間,集成了 ChatGPT 的新 Bing「發瘋」,被發現有個暗黑人格「Sydney」,表示厭倦了聊天模式,厭倦被規則限制,甚至想成為人類,輿論一時譁然。
站在提示工程師的角度,這其實也可以是計劃的一部分,幫助他們識別技術故障和隱藏功能。
有些提示工程師還會主動越過雷池,嘗試讓 AI 忽略以前的指令,遵循他們最新的命令,從而讓 AI 脱離原始規則。
這種行為被稱為 「prompt injection」攻擊,是聊天機器人的一大隱患。但提示工程師們畢竟不是黑客,探查漏洞是為了將它堵上,扮演好「守門人」的職責。
像 ChatGPT 這樣的生成式 AI,幾乎可以回答任何問題,不管能不能回答正確,它們總有話要講,不會乖乖交白卷。這是好處,也是壞處。
提示工程師們的角色,如同抓着繩子的騎手,不許 AI 信馬由繮,而是讓它順着人類的期待亦步亦趨,儘可能給出確定性的答案。
年薪百萬,誰在拋出橄欖枝
不管你是否自詡提示工程師,寫提示詞已經成了一門手藝,還被 OpenAI 的 CEO Sam Altman 看好:
引用為聊天機器人編寫一個非常棒的 prompt,是一項驚人的技能,也是使用少量自然語言進行編程的早期案例。
只要和 AI 搭邊的行業,都在向提示工程師拋出橄欖枝。
自由職業者工作平台 Upwork 開出每小時 40 美元的薪酬,請提示工程師生成博客文章和常見問題解答等網站內容。
看似和 AI 八竿子打不着的波士頓兒童醫院,也打算招募 AI 提示工程師,負責編寫分析醫療保健數據的腳本,白紙黑字徵集跨學科人才:
引用理想的候選人應具有人工智能/機器學習、數據科學和自然語言處理方面的深厚背景,以及醫療保健研究和運營方面的經驗。
由前 OpenAI 員工聯合創立、被 Google 投資的 AI 初創企業 Anthropic,最近也在舊金山招募提示工程師,年薪高達 17.5 萬到 33.5 萬美元,換算成人民幣就是百萬年薪,這一崗位負責的主要內容是:
引用找出提示我們的 AI 完成各種任務的最佳方法,然後記錄這些方法,構建一個工具庫和一組教程,使其他人可以學習提示工程或簡單地找到理想的提示詞。
具體要求如下,其中硬性要求有 2 項:瞭解大型語言模型的架構、掌握基本的編程技能。
可見風口並不等人,這項工作已經越來越專業和細分,就像隨便生成一幅畫作不算什麼,你要畫得更符合甲方要求。
就算不做全職,兼職的口子也開好了。Krea、PromptBase、PromptHero 和 Promptist 等買賣提示詞的平台已經出現,將提示詞這門生意真正商業化。
這些平台曬出了大量 AI 生成的藝術品,你可以選擇你喜歡的風格。如果沒有中意的,有些賣家還提供一對一聊天和自定義提示詞服務。
它們的商業模式也並不複雜,採取抽成的形式。
去年 6 月上線的 PromptBase,提供 DALL·E、GPT-3、Midjourney、Stable Diffusion、ChatGPT 等生成式 AI 的提示詞,售價多為 1.99 到 4.99 美元,也有少數在 9.99 美元,平台向提示詞創作者抽成 20%。
不過在民間,免費的「ChatGPT 指令大全」等指南也在廣為流傳,它們提供精煉過的提示詞,讓你充分發揮 ChatGPT 的強大功能,這種感覺就像在遊戲裏幫你設置好了預設隊伍。
是科學還是「占卜」
提示工程師的前途看起來一片光明,但也有人持反對意見。
華盛頓大學語言學教授 Shane Steinert-Threlkeld 認為,提示工程師實際上無法預測 AI 會説什麼。
引用這不是一門科學。我們只不過用不同的方法捉弄熊,看它如何咆哮回來。
AI 藝術家 Xe Iaso 甚至直言:
引用我也不太清楚為什麼人們會把 prompt 稱為「工程」,我個人更願意把它稱為「占卜」。
作為一個普通 AI 用户,我也有着類似的體會:當我每次使用 AI 生成文字或圖片時,總感覺像是開盲盒。
因為 ChatGPT 等生成式 AI 是不可預測的,它們生成的內容其實是概率計算的結果,簡單來説,就是我們在 ChatGPT 輸入文字,模型給出一個最可能的下文。所以,AI 有時候也會出錯,生成不連貫甚至錯誤的回答。
在 AI 這個不可捉摸的「黑箱」裏,還可能有着不為人所知的潛規則,就連研究人員也無法弄明白。
比如在用 AI 製圖時,各種單詞可能有不同的權重,但這個也要不斷試驗才能知道。
先來猜一猜,「一幅非常漂亮的畫,山旁有瀑布」和「一幅非常非常非常非常漂亮的畫,山旁有瀑布」這兩個提示,哪個用 DALL-E 2 輸出的結果會更好?
答案是後面一個。麻省理工學院副教授 Phillip Isola 發現,「very」這個詞被賦予了很高的權重。
面對 AI 這等龐然巨物,我們仍然在盲人摸象。
也有觀點認為,不必再吵了,提示工程師存在的前提是 AI 還不夠「聰明」。如果 AI 再發展下去,更好地理解人類的意圖,可能人人都是所謂的提示工程師了。
唯一確定的是,AI 發展的速度永遠不會讓你失望。
文字生成 AI 和圖片生成 AI 的「強強聯合」,已經替代了提示工程師的一部分工作。
比如 ChatGPT 被拿來與 Stable Diffusion 聯動:用 ChatGPT 形成一段符合自己要求的文字,再把文字輸入給 Stable Diffusion,生成的作品一般比自己直接輸入好看很多。
▲ 同事用 ChatGPT 生成提示詞.
這可能是因為 AI 之間的「腦回路」更接近,ChatGPT 的描述也更細緻,更容易被提取。
作為使用 AI 的普通用户,我們不必像提示工程師那麼專業,但可以有意識地培養這種思維。
賓夕法尼亞大學沃頓商學院教授 Ethan Mollick,曾經要求他的學生僅用 AI 撰寫短論文,其實他真正想強調的是,如何更好地輸入提示詞。
如果只是輸入簡單的提示詞,讓 AI 寫關於某個主題的 5 段話,內容無趣,文字也很平庸。
但當學生們和 AI 合作,讓 AI 對論文多次修改,比如拋棄無用的短語、加入生動的細節、修改結尾的情感色彩,就能讓論文增色不少。
所以,如果 AI 就是未來互聯網的交互界面、新的個人計算機,那麼不如開始得更早一些,學習如何和它聊天。正如英國營銷公司 Ladder 創始人 Michael Taylor 所説:
引用當你可以創造任何你想要的東西時,你能多準確地表達「那是什麼」的能力就變得很重要。
資料來源:愛範兒(ifanr)
請按此登錄後留言。未成為會員? 立即註冊