魔改「黑神話悟空」,打敗 Midjourney,這個 AI 生圖神器讓人上頭

愛範兒 於 25/08/2024 發表 收藏文章
當 AI 文生圖比拼真實度、藝術感,Ideogram 開闢了一個刁鑽的賽道:在圖片上精準生成文字,並且字體和排版都好看。

這個需求並不小眾,一鍵生成海報、插畫,還不用 P 圖,能夠省不少事,很適合對設計一竅不通的普通人。

我們之前寫過 Ideogram 的 1.0 版本。8 月 21 日,2.0 版本來了,真實感更好了,海報更有設計感了,文字這個看家本領也更強了。


你或許從來沒有聽説過它,這是一款前 Google 員工開發的 AI 產品,缺點不少,但長板能「彎道超車」Midjourney。

指路👉https://ideogram.ai/

AI 想知道,你説的悟空,是哪個悟空

Ideogram 有個特別新手友好的功能:「魔法提示」。

你直接輸入中文提示詞,它會幫你翻譯成英文,同時幫你優化。作為一款海外產品,這樣的操作很能收買人心。

同時,Ideogram 主打五種風格:普通、寫實、設計、3D、動漫,都很好理解,所以選擇起來也不會讓人糾結。


先來個簡單的中文提示詞,「拿着金箍棒的孫悟空」,動漫風格,讓 AI 幫我翻譯和優化,看看它能自由發揮成什麼模樣。

當水靈靈的《七龍珠》版悟空出來的時候,我驚了一下,一看提示詞,AI 把孫悟空翻譯成了「Son Goku」,那就不奇怪了。


而且,也很想問問 Ideogram,是不是太明目張膽,給版權費了麼。

為了避免 AI 再誤解,再輸入提示詞的時候,我不偷懶了,強調「孫悟空」是「Sun Wukong」,不是「Son Goku」。

這次走寫實風格,並且規定了比較詳細的場景,大聖身穿鎧甲,手拿金箍棒,神情肅穆,威風凜凜,站在佛窟前,温暖的橙色調,圖片底部寫着「Black Myth: Wukong」(黑神話:悟空)。


文字沒有錯誤,大寫字母衝擊感強,佛窟的氛圍也營造了三分,但「大聖」的氣質差了點、形象返祖了點,眼神裏也沒有光。

用相同的提示詞讓 Midjourney 生成一次,文字既有錯誤又沒設計感,但稍帥一籌的「大聖」和頁遊的畫風彌補了這一點。

▲ Midjourney 生成

不甘心的我又試了 3D 風格,提示詞基本保持不變,只是把底部的文字改成了「8 月 20 日遊戲上線」。

結果,Ideogram 生成的結果很像某個國風 Q 版盲盒系列的宣傳圖,畫面處理得很乾淨,但完全不是我腦海裏的 3D 遊戲風格,還把美猴王畫出了二郎神的模樣。

並且 AI 也從中暴露了自己,雖然它對英文的文字渲染得心應手,卻對中文一竅不通,這個缺陷從 1.0 延續到了 2.0。


看來海外產品不夠理解國內的傳統文化,Ideogram 第一回合的表現有些令人失望,卻也不失趣味。
Ideogram 團隊説過,2.0 版本不輸 Flux 和 DallE。最近,Flux 真實版 LoRA 生成的 TED 演講照片因為真假難辨,騙過了不少網友的眼睛。那麼就來測測,Ideogram 生成的結果能多像照片。

▲ Flux 生成

選擇寫實風格後,我輸入了中文提示詞,TED 演講照片,幻燈片標題為「Ideogram 2.0 發佈」,上面有三個要點:「文字準確」「擅長設計」和「更真實」,女性演講者站在白板前,背景中有幾個人。


可以看出,Ideogram 的語義理解是不錯的,該有的元素都有,TED 的標誌幾乎以假亂真,演講者和觀眾的表情都很生動,頭髮和皮膚比較自然。

不過,細節處理得還不夠好,雖然要求生成的文字沒有問題,隨機出現的一些小字壞了一鍋粥,人物的手指和身體也不太對勁,但已經比之前的 1.0 版本強太多了。

至於海報設計,可以説是 Ideogram 吊打其他文生圖 AI 的「舒適區」了。

如果以票房異常火爆的《異形:奪命艦》為考題,AI 能設計出那種不可名狀的恐怖感覺嗎?

我選擇了設計風格,用提示詞描述了一下畫面的要素,並特別提及,海報底部寫上一句:「未成年觀眾謹慎觀看。」


總體的效果讓人眼前一亮,長串的文字也成功生成了,只有一處小錯誤,但特別不寫實,更像美漫的畫風,和真人電影不太相配。

我再以暑期檔爛片《紅樓夢之金玉良緣》為靈感,讓 Ideogram 生成海報,提示詞寫到的背景、裝飾物乃至人物都在其中了,再次感嘆提示詞的跟隨性真的不錯。

片名當然也寫對了,但字體像借鑑了指環王,有些齣戲,整體風格更像花木蘭動畫電影。


Ideogram 的「設計風格」偏向二次元,比較獨特,但反過來想,這也侷限了海報的使用場景。

小結一下,Ideogram 是一款很有自己特色的 AI 文生圖產品,寫實的水平和 Flux 相近,藝術感和 Midjourney 各有千秋。

▲「rainy summer」圖案

但文字生成水平獨一檔,比較適合用來生成海報、插畫、廣告、表情包、T 恤印花等。

人類評估的結果顯示,Ideogram 2.0 在提示詞對齊、整體表現和文本渲染質量方面,都比 Flux Pro 和 DALL·E 3 更好。

▲ 但這是 Ideogram 自己的説法

可玩性高又接地氣,這樣的 AI「甜品」不妨多來一些

去年 8 月 22 日,Ideogram 宣佈成立,與 2.0 發佈正好相隔一年。

創始團隊共 7 人,來自 Google Brain、加州大學伯克利分校、卡內基梅隆大學和多倫多大學,其中 4 位是 Google 文生圖擴散模型 Imagen 研究論文的作者。

這次除了發佈 2.0,Ideogram 還推出了 iOS app,國內可以直接下載,Android 版計劃稍晚發佈,從網頁到移動端,我們可以隨時隨地生成圖片了。

▲ 手機端界面

Ideogram 目前向所有用户免費開放,不過,額度非常有限,生成 5 次共 20 張照片後,Ideogram 就提醒我,10 個積分用完了,請明天再來。(當然,隔壁的 Midjourney 免費生成 25 張也沒有顯得多大氣。)


如果很少接觸文生圖,想要一款文生圖 AI 用來入門的,Ideogram 是個不錯的選擇。

輸入中文提示詞、用「魔法提示」翻譯和優化是一方面,另外,Ideogram 還有很多選項幫你生成更接近腦海所想的畫面。

提供範圍有限的選項讓用户「點擊」,相比在空白的輸入框完成「輸入」,交互起來更簡單。想要什麼圖片比例、什麼風格、什麼色調,Ideogram 都可以讓你挑選。

▲ 不同色調的「戴珍珠耳環的少女吃麥當勞」

不會寫提示詞,那也可以畫出來,讓 Ideogram 幫我們化腐朽為神奇。

我為我的糟糕畫工感到抱歉,但 AI 能夠領會意思,優化了線條和上色,還加了個背景,格調一下子上去了。有了 AI,誰不是神筆馬良。


另外,網頁版的輸入框下面,都是他人生成的作品,遇到喜歡的,我們可以查看和參考提示詞。Ideogram 表示,他們的用户在過去一年生成了超過 10 億張公開可見的圖片。

如果想要生成一個特定的對象,但又不知道怎麼寫提示詞,Ideogram 這次還推出了用文本搜索公共創作庫的功能,但這個功能目前需要會員。

▲ 搜索「cat」的結果

總而言之,Ideogram 是一款可玩性較強的文生圖產品。

它可以比較精準地生成用户所需的文字內容,並適配各種風格的圖片,就業領域很廣。

▲ Ideogram 博客

偶爾還能帶來情緒價值,以圖言志,雖然做的表情包太偏歐美互聯網的審美了。

▲「我想玩《黑神話:悟空》」表情包

Ideogram 的整體質量不差,文本功能強大,對新手友好,使用方便,交互也讓人愉悦。當 AI 工具兼具了創意、便利和分享價值,就很容易讓人上頭。

一個照着模子刻出來的世界太無聊了,洞察到很小的需求,然後將解決辦法做到行業第一,那也很有意思。

世界上有很多的產品,同時有更多的受眾,我們可以期待更多這樣的 AI「甜品」。


資料來源:愛範兒(ifanr)

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→