ChatGPT Images 2.0 硬撼 Google 超強海報製作能力處理中文,日文字更好

作者
發佈日期

2026-04-22
閱讀時間

5分鐘
字體大小

OpenAI 於 4 月 21 日發布全新圖像生成模型 ChatGPT Images 2.0，底層模型名為 gpt-image-2，是 OpenAI 旗下首個內建推理（Thinking）功能的圖像模型，能在生成前先分析構圖與準確性，再輸出結果。同日起向 ChatGPT、Codex 及 API 全線用戶開放，Enterprise 版本亦將於近日推出。

思考後再畫圖像生成邁入新階段

ChatGPT Images 2.0 最大突破在於推理能力。用戶在 ChatGPT 選擇 Thinking 或 Pro 模型後，系統會即時搜尋網上資訊，並對自身輸出進行雙重核查，才生成最終圖像。這項高階圖像生成功能面向 ChatGPT Plus、Pro 及 Business 付費用戶。OpenAI CEO Sam Altman 形容今次升級「如同從 GPT-3 一躍至 GPT-5」，並稱讚團隊「這次真的做出了精彩的東西」。

多語言文字渲染大幅提升

過往 AI 圖像模型在非拉丁文字的表現一直較弱，ChatGPT Images 2.0 在這方面取得突破性進展，支援日文、韓文、中文、印地語及孟加拉語等語言的準確渲染，文字能以自然流暢的方式呈現。模型亦能以高解像度呈現細小文字、圖示及密集構圖，海報、圖表及漫畫等包含文字的圖像，均能忠實還原預期效果。

網民 shenjuneyu 比對 ChatGPT 同 Gemini 輸出，明顯前者真實感更強：

▲ChatGPT

▲Google Gemini

單次提示最多生成 8 張一致圖像

ChatGPT Images 2.0 支援從單一提示同時生成最多 8 張圖像，並保持角色與物件的一致性。用戶過往製作漫畫連續頁面或針對不同長寬比及語言的社群媒體圖集，需要逐張生成再手動拼合，現在可一次過完成整個工作流程。模型學習數據已更新至 2025 年 12 月，API 端以 gpt-image-2 提供，Codex 用戶毋須另設 API 金鑰即可直接使用圖像生成功能。值得注意的是，API 輸出超過 2K 解像度目前仍屬 Beta 版，或出現不穩定情況。

網民 loongchih 作品：

網民 kaitolau 作品：

網民 taxi5seats 作品：

網民 sinaihk 作品：

網民 z94455 作品：

網民 joe.ontrip 作品：

網民 someonetrack 作品：

網民 jackyshin9291 作品：

原圖：

用 ChatGPT 製成海報：

資料來源：ITmedia、OpenAI

ChatGPT Images 2.0 硬撼 Google 超強海報製作能力 處理中文,日文字更好

思考後再畫 圖像生成邁入新階段

多語言文字渲染大幅提升

單次提示最多生成 8 張一致圖像

Related Posts

iOS 27 Public Beta 懶人包： 8 大必玩全新功能教學 新 Siri 用廣東話玩！

Galaxy Fold 8 Ultra 影片流出 摺痕幾近消失呈現平整畫面 加兩億像素主鏡

華為三大新品重磅登場 Pura 90s 配 2 億長焦鏡頭 輕薄平板兼新耳機同步推出

Telegram 短網址域名 t.me 被封鎖 全球 TG 短網址一夜失效

要求世界盃踢阿根廷出局 網上聯署超過 540 萬人 指 FIFA, 球證偏袒阿根廷隊

Apple M7 Ultra 傳支援 1.5TB 統一記憶體 有望本機運行一兆參數 AI 模型

國產 AI 晶片打破限制 東方算芯單靠 14 nm 製程 算力可達每秒 520 萬億次

ChatGPT Images 2.0 硬撼 Google 超強海報製作能力處理中文,日文字更好

思考後再畫圖像生成邁入新階段

iOS 27 Public Beta 懶人包： 8 大必玩全新功能教學新 Siri 用廣東話玩！

Galaxy Fold 8 Ultra 影片流出摺痕幾近消失呈現平整畫面加兩億像素主鏡

華為三大新品重磅登場 Pura 90s 配 2 億長焦鏡頭輕薄平板兼新耳機同步推出

Telegram 短網址域名 t.me 被封鎖全球 TG 短網址一夜失效

要求世界盃踢阿根廷出局網上聯署超過 540 萬人指 FIFA, 球證偏袒阿根廷隊

Apple M7 Ultra 傳支援 1.5TB 統一記憶體有望本機運行一兆參數 AI 模型

國產 AI 晶片打破限制東方算芯單靠 14 nm 製程算力可達每秒 520 萬億次