AI影象生成工具Imagine with Meta初體驗

AI影象生成工具Imagine with Meta初體驗

Meta 於去年年底釋出了一款新的獨立 AI 影象生成器產品。與其他人工智慧工具不同的是,該產品是以 Meta 品牌釋出的。

Imagine with Meta 是免費的,但需要注意的是,影象可能不準確或不合適。此外,它目前只在美國上市。

通過這款新產品,Meta 展示了其在人工智慧研究方面的悠久歷史,開發並開源了該領域一些最強大、最重要的工具。它也在與 Midjourney、Stable Diffusion 和 OpenAI 等大公司競爭。

Imagine 是支援 WhatsApp、Instagram 和 Facebook 影象生成功能的底層模型。它還為 Messenger 群組聊天中的全新 reimagine 功能提供動力,該功能可讓參與者共同製作人工智慧影象。

Imagine with Meta:它有何與眾不同之處?

Imagine 的工作方式與 ChatGPT 中的 DALL-E 3 或 StabilityAI 的 SDXL 1.0 等工具的最大區別在於粒度。與較早的人工智慧模型不同,Imagine 無法讓你對輸出的各個方面進行微調或控制。

你只有一個文字提示來定義你希望模型建立的影象。你可以設定變數,比如確保它以某種風格建立影象,但你不能改變影象的大小、解析度或生成的影象數量。

它根據提示為您提供了四種選擇,均為正方形格式,解析度為 1280×1280(比 DALL-E 3 稍大),且均帶有 Meta 水印。

令人印象深刻的速度

Imagine with Meta 與其他影象生成器最顯著的區別之一就是速度。它幾乎能立即生成影象,與我最近測試過的 StabilityAI 快速實時影象生成器 SDXL Turbo 的生成時間差不多。

這種快速生成可能是由於它相對較新,不像其他大公司那樣被廣泛使用。也可能是因為 Meta 專注於大規模提供人工智慧。

測試 Imagine with Meta

用 Meta Imagine為了用 Meta 測試 Imagine,我從 ChatGPT 中尋找靈感。我讓 OpenAI 的高階版聊天機器人制作了一系列提示,讓影象生成器通過測試,並測試其全部功能。

這些提示包括建立複雜多樣的場景、藝術風格、複雜的敘事元素、未來主義和幻想場景以及詳細的徽標和品牌概念。

維多利亞蒸汽朋克

AI影象生成工具Imagine with Meta初體驗

(Image: © AI generated image (Meta))

首先是一個城市景觀,特別是一個帶有蒸汽朋克風格的維多利亞城市。它需要充斥著黃銅和銅製的華麗建築,人們穿著維多利亞時代的服裝,並配有機械裝置。

它創造了一個有吸引力和引人入勝的形象,但並沒有真正滿足蒸汽朋克的要求。它看起來更像是一個典型的英國維多利亞時代的街景,空無一人的道路和商店。

水下外星人

水下外星人

(Image: © AI generated image (Meta))

接下來,我讓 Imagine 生成外星球的水下世界,要求它用大膽的色彩描繪生物發光的植物和生物。它還需要考慮到地球上並不明顯的生命多樣性,並運用陰影。

這幅作品很好地捕捉到了這一提示的超凡脫俗的本質。它描繪了前景的自然景象和遊樂場中發光的城市。唯一的問題是,它描繪了夜空中的星星,而整個場景應該是在水下深處。

走向未來

走向未來

(Image: © AI generated image (Meta))

在下一個提示中,我們前往火星。特別是一個未來的火星殖民地,那裡有圓頂的棲息地,還包括紅色星球上的沙漠景觀。我覺得這幅作品有點滑稽,但它並沒有告訴我們要建立一幅逼真的影象。

最大的問題是所有影象生成器在建立行星影象時都會遇到的一個問題–它在行星表面放置了奇怪的版本,並在天空中隨機生成了衛星。

暮色中的神話森林

暮色中的神話森林

(Image: © AI generated image (Meta))

最後生成的攝影影象是黃昏時分的神話森林。這需要 Imagine 使用 Meta 生成不同層次的光照。它必須顯示古老而巨大的樹木、森林地面上的發光蘑菇以及仙女和精靈等虛幻的生物。

這與水下外星人的形象有一些相似之處。它將樹木描繪成背景特徵,重點放在蘑菇上。它選擇的神話生物不是精靈和仙女,而是獨角獸。

文字挑戰

文字挑戰

(Image: © AI Image (Meta))

最後,我請 Imagine with Meta 為一家名為 “籃子裡的貓” 的虛構紗線銷售企業生成一個徽標。這項挑戰不僅要看它如何詮釋徽標,還要看它如何在影象中生成文字。在一般的模型中,只有 DALL-E 3 能很好地做到這一點。

它建立了一個有趣的徽標,但對文字的處理卻與 SDXL 1.0、Midjourney 或 OpenAI 的 DALL-E 先前版本相差無幾-完全不是很好。它亂碼了文字,把 “A Catt ia ana Batkett” 寫成了 “A Catt ia ana Batkett”,就像在用晦澀難懂的古老英語方言寫作一樣。不過徽標很可愛。

評論留言