free web page counters

AI 繪製紐約鳥瞰圖:工程師花 4 小時僅 12 美元完成像素地圖 – unwire.hk 香港

AI 繪製紐約鳥瞰圖:工程師花 4 小時僅 12 美元完成像素地圖 – unwire.hk 香港
9

紐約工程師兼藝術家 Andy Coenen 近日推出名為「Isometric NYC」的專項計劃,利用 AI 技術創作紐約市大型等角像素藝術地圖。這幅互動式鳥瞰圖涵蓋紐約 5 大行政區,用戶能透過滑鼠拖放移動視角,並利用滾輪縮放畫面,最大放大倍數下甚至可看到自由女神像的像素細節。

 

從 Google 辦公室陽台萌生創意

Andy Coenen 在 Google 紐約第 9 大道辦公室 13 樓陽台眺望下曼哈頓時,構思出這個項目。他表示自己當時正研究 Nano Banana 和 Veo 等新模型,思考 AI 對創意未來的意義。Andy Coenen 認為關於 AI 與創意的陳腔濫調討論相當乏味,他真正關心的只有一個問題:「以前不可能做到的事,現在能做到了嗎?」

Andy Coenen 的目標是製作紐約巨型等角像素藝術地圖,藉此挑戰最新生成模型和編碼代理的極限。

▲點陣式地圖縮到最小

▲放到最大

 

技術路線:從 Nano Banana 轉向 Qwen

Andy Coenen 最初使用 Google 的 Nano Banana 模型將紐約地圖圖像轉換為像素藝術。地圖圖像源自 Google Maps Tile API,這個 API 能在單一渲染器中提供精密幾何和紋理。

 

Nano Banana 是 Gemini 原生圖像生成模型系列,支援透過文字和圖像進行對話式圖像生成與編輯。不過 Andy Coenen 發現 Nano Banana 生成的像素藝術缺乏一致性,運作速度慢,成本亦極高。

 

Andy Coenen 最終改用體積更小、速度更快且價格低廉的「Qwen/Image-Edit」模型。他預先訓練模型以確保像素藝術輸出一致,整個訓練過程花費約 4 小時和 12 美元(約港幣 HK$93.6),這個成本屬可接受範圍。

 

AI 圖像生成仍有局限

Andy Coenen 指出現有 AI 在生成文字和程式碼方面表現優秀,但圖像生成仍有很長的路要走。當委託 AI 建立軟件時,AI 能執行程式碼、讀取堆疊追蹤、檢查錯誤並自我修正,具備緊密反饋循環並理解正在建立的系統。然而圖像模型尚未達到這個水平。

 

他舉例說明,如果管理人類藝術家,只需指示「請將樹木改成這個特定風格」,他們就能實現。圖像模型確實也能做到,但無法確保每次都成功。即使是 Gemini 3 Pro 這類智能模型,也無法可靠地判斷輸出結果,例如辨識「這裡有接縫」或「這棵樹的紋理不對」。

 

Andy Coenen 表示由於圖像模型無法可靠地「看見」失敗模式,因此無法自動化品質保證流程。模型無法理解自身錯誤,迫使他放棄完全自動生成的計劃。

 

社群熱烈反應

項目推出後引起科技社群關注,有媒體引述評論形容這個項目就像《模擬城市 2000》的真實紐約 5 大行政區版本。Reddit 用戶也熱烈討論這個用 Qwen 製作的精緻等角地圖。

 

資料來源:GIGAZINE

 

 

Comments are closed, but trackbacks and pingbacks are open.