ChatGPT Images 2.0 硬撼 Google 超強海報製作能力 處理中文,日文字更好

  • 作者

  • 發佈日期

    2026-04-22

  • 閱讀時間

    5分鐘

  • 字體大小

OpenAI 於 4 月 21 日發布全新圖像生成模型 ChatGPT Images 2.0,底層模型名為 gpt-image-2,是 OpenAI 旗下首個內建推理(Thinking)功能的圖像模型,能在生成前先分析構圖與準確性,再輸出結果。同日起向 ChatGPT、Codex 及 API 全線用戶開放,Enterprise 版本亦將於近日推出。

思考後再畫 圖像生成邁入新階段

ChatGPT Images 2.0 最大突破在於推理能力。用戶在 ChatGPT 選擇 Thinking 或 Pro 模型後,系統會即時搜尋網上資訊,並對自身輸出進行雙重核查,才生成最終圖像。 這項高階圖像生成功能面向 ChatGPT Plus、Pro 及 Business 付費用戶。OpenAI CEO Sam Altman 形容今次升級「如同從 GPT-3 一躍至 GPT-5」,並稱讚團隊「這次真的做出了精彩的東西」。

多語言文字渲染大幅提升

過往 AI 圖像模型在非拉丁文字的表現一直較弱,ChatGPT Images 2.0 在這方面取得突破性進展,支援日文、韓文、中文、印地語及孟加拉語等語言的準確渲染,文字能以自然流暢的方式呈現。 模型亦能以高解像度呈現細小文字、圖示及密集構圖,海報、圖表及漫畫等包含文字的圖像,均能忠實還原預期效果。

網民 shenjuneyu 比對 ChatGPT 同 Gemini 輸出,明顯前者真實感更強:

▲ChatGPT

▲Google Gemini

單次提示最多生成 8 張一致圖像

ChatGPT Images 2.0 支援從單一提示同時生成最多 8 張圖像,並保持角色與物件的一致性。 用戶過往製作漫畫連續頁面或針對不同長寬比及語言的社群媒體圖集,需要逐張生成再手動拼合,現在可一次過完成整個工作流程。模型學習數據已更新至 2025 年 12 月,API 端以 gpt-image-2 提供,Codex 用戶毋須另設 API 金鑰即可直接使用圖像生成功能。值得注意的是,API 輸出超過 2K 解像度目前仍屬 Beta 版,或出現不穩定情況。

網民 loongchih 作品:

網民 kaitolau 作品:

網民 taxi5seats 作品:

網民 sinaihk 作品:

網民 z94455 作品:

網民 joe.ontrip 作品:

網民 someonetrack 作品:

網民 jackyshin9291 作品:

原圖:

用 ChatGPT 製成海報:

資料來源:ITmedia、OpenAI

Comments (0)
Add Comment