iOS 相機應用程式 Photon Camera 與影像編輯軟件 Photon Enhance 的開發商 LateNiteSoft 進行一項大規模測試,透過超過 600 次影像生成,比較 OpenAI、Google 及 ByteDance 3 款主流 AI 影像編輯模型的表現。測試結果顯示現階段沒有任何單一模型能夠全面勝出,不同模型各有所長。
測試方法與對象
LateNiteSoft 選用 5 張不同類型的測試相片,包括寵物、人像、風景、汽車及產品攝影,並以多種編輯指令測試 3 款 AI 模型。測試對象包括 OpenAI 的 gpt-image-1、Google 的 gemini-2.5-flash-image (又稱 Nano Banana) 及 ByteDance 的 seedream-4-0-250828。測試於 2025 年 10 月 8 日在日本進行,使用公稱 10Gbps 光纖網絡連接。
生成速度方面 OpenAI 高品質模式平均需時 80 秒,Google Gemini 僅需 11 秒,ByteDance Seedream 則為 9 秒,速度差異明顯。
各模型表現特點
測試中以「骯髒復古相片」(Grungy vintage photo) 指令編輯貓相片時,gpt-image-1 能靈活配合指令進行編輯,但有時會過度偏離原本構圖。Nano Banana 則過度保留原始影像資訊,導致編輯效果較弱。seedream-4-0-250828 的表現介乎兩者之間。

在「套用熱力圖效果」(Apply a heat map effect) 測試中,只有 Nano Banana 未能正確呈現熱力圖風格影像。當指令為「針孔相機」(Pinhole camera) 時,Nano Banana 更出現理解偏差,在裝置左上角加入相機圖案,而非模擬針孔相機拍攝的周邊減光模糊效果。

不過當指令改為「針孔相機效果」(Pinhole camera effect) 後,Nano Banana 便能正確呈現預期風格。這反映 Google 模型對指令用詞較為敏感,需要更精確的描述。


生成比較像玻璃的風格測試(Make it look like the photo is etched in glass)中,只有 seedream-4-0-250828 模型可以造到產品像玻璃製一樣,其他都有理解不正常的問題:

如果想為物件提供金屬效果,可發現seedream-4-0-250828 模型提供了最強烈的金屬感,但其他兩個模型會相對較自然:

風格轉換與創意編輯
在藝術風格轉換方面 OpenAI 表現較佳。「套用日本浮世繪木版畫風格」(Apply a ukiyo-e Japanese woodblock print style) 測試中,只有 Nano Banana 未能呈現浮世繪風格。

「轉換為低多邊形藝術」(Transform into low poly art) 指令下,seedream-4-0-250828 呈現出最優秀效果。

在「變成泡殼包裝內的動作人偶」(Turn them into an action figure in the blister pack) 測試中,3 款模型各有特色:gpt-image-1 採用較誇張變形畫風,Nano Banana 維持原始姿勢與體型,seedream-4-0-250828 則介乎兩者之間。

開發商總結
LateNiteSoft 總結指出目前沒有萬能模型存在。gpt-image-1 最適合風格轉換或創意生成等濾鏡功能,Nano Banana 則適合真實感編輯,seedream-4-0-250828 介乎兩者之間。該公司表示正在研發「指令分類器」,自動將藝術類指令傳送至 OpenAI,真實感編輯指令則交給 Gemini 處理,以充分發揮各模型優勢。
其他測試結果可參考此網址:https://latenitesoft.com/blog/evaluating-frontier-ai-image-generation-models/
LateNiteSoft 從事 iOS 攝影相關應用程式開發已有 15 年,旗下產品包括 Camera+、Photon 及 REC 等市場領先應用程式。該公司從未接受創投資金,所有產品均需自負盈虧,因此在評估 AI 專案時特別著重成本效益。
資料來源:LateNiteSoft

Comments are closed, but trackbacks and pingbacks are open.