「呢個係我把聲來嘅,但唔得喎,走音喎,大佬!」錄音室內,香港配音從業員工會主席周倚天聽着一段由 AI 生成、模仿自己聲線的配音,語氣中既有驚訝,也有一點無奈。那把聲音確實像他,音色幾乎可以亂真,但他很快說只是「似」,沒有真正演戲。
由昔日不設現場收音的的港產片,到經典卡通及外語片,全靠配音員為角色提供生命力,多年來配音員為香港人留下不少經典回憶,大家最喜歡又是哪把聲音?隨着生成式 AI 聲音技術普及,配音行業正面臨前所未有考驗。事實上 AI 開始直接威脅配音員生計,尤其廣告錄音,不少公司為節省成本已棄用真人,為了了解 AI 對行業的實質衝擊,我們訪問了香港配音從業員工會主席周倚天,周倚天是金東旭及黃寅燁的常任配音員,代表作包括韓劇《三流人生》的高東萬。在動畫方面,他曾聲演《排球少年》的田中龍之介及《我的英雄學院》的死柄木弔,演繹角色情感跨度極大。

▲ 周倚天是金東旭及黃寅燁的常任配音員
廣告配音最受 AI 影響
周倚天直言 AI 近兩年迅速侵蝕廣告市場,因為廣告多求資訊清晰,對情感層次的要求不算太高。為了節省成本,不少企業已轉向使用合成人聲。
同時,AI 的衝擊已蔓延至整個後期製作鏈。周倚天提到,現時不少 AI 工具已能處理降噪、音量平衡、聲音修整,甚至生成簡單環境音效。當幕後技術崗位也被自動化取代,整個配音業的生態便更難維持。
不過,廣告市場最先受衝擊,並不代表 AI 已經真正掌握配音專業。周倚天認為,要理解真人與 AI 的差別,不能只聽音色是否相似,而要看它能否理解角色、情緒和畫面。

▲ 周倚天直言 AI 近兩年迅速侵蝕廣告市場

▲ 當幕後技術崗位也被自動化取代,整個配音業的生態便更難維持
真人配音與 AI 的距離
現時 AI 聲音技術主要分為文字轉語音(Text-to-Speech)以及仿真人聲(Voice Cloning)。前者能將大量文本自動轉化為語句,後者則能通過深度學習,精準模擬特定人物的音色與語氣。隨著演算法進步,「合成人聲」的廣東話流暢度已大幅提升,甚至能模仿人類的換氣聲。
但周倚天認為,配音員的價值從來不止於聲線本身。他說,真正的配音工作,是要在短時間內讀懂角色、理解情緒轉折,再把聲音準確放進畫面之中。角色是興奮、壓抑、慌張,還是假裝鎮定?一句對白應該在哪裏加速、哪裏收慢、哪裏多吸一口氣?判斷往往不是劇本白紙黑字寫出來,而是配音員在錄音室內即場消化、即場演繹。
「你叫 AI 開心,其實不難。」,周倚天說真正困難的是開心到甚麼程度、為甚麼開心、說話背後的情緒是否正在轉變。他認為如果操作 AI 的人本身不懂配音、不知道角色要甚麼,最後生成出來的聲音,未必會有好效果。
一個口型半秒之差 已經是另一種表演
配音另一個被外界低估的專業,是「對口型」。觀眾看戲時未必會特別留意,但配音員需要令對白長短、停頓和畫面中角色的嘴形盡量吻合。真人配音員可以因應畫面即時調整語速,在某個字前收一收、某個句尾拖一拖,甚至用半秒鐘的停頓,讓聲音重新貼合畫面。
周倚天舉例,若角色戴上口罩,或身處手術場景,配音員不會只用同一把聲音照讀對白。他們會憑經驗改變發聲位置,有時甚至直接用手遮住嘴巴,模擬聲音被物理阻隔後的質感。這種處理未必寫在劇本上,卻是令角色「活起來」的關鍵。
他認為,AI 並非完全不能處理這些細節,但問題在於調校成本。若要在電腦前逐句微調語氣、停頓、節奏與口型,花的時間可能比請真人配音員錄一次更長。

▲當劇情要求角色戴口罩或手術,周倚天說配音員甚至直接用手遮蓋嘴巴,模擬聲音被物理阻隔
實試 AI 配音:讓 AI 與真人配同一段戲
到底 AI 配音是否真的如此強大?為了實測效果,我們特別編寫了一個名為《月球上的人》的鬧劇劇本,並利用 AI 製作片段。劇情講述一名太空人身處月球表面,看著壯麗的地球美景,正想舉起手機拍照,語氣充滿敬畏。但手機卻一直無法運作,原來是因為太空服手套太厚按不到鍵,最後太空人更抱怨正趕著回太空館吃飯。

▲ 我們特別編寫了一個名為《月球上的人》的鬧劇劇本,讓周倚天和 AI 即場配音
周倚天在配音前,先在劇本上劃下幾處標記,對細節作最後修飾。他指著結尾的台詞,饒有興致地問我們:「如果將『太空館』改為『香港太空館』,加點本地元素,這樣配會不會更有趣?」

▲想細聽配音員和AI聲分別的讀者,可前往 Unwire Facebook 及 Instagram Page 觀看
當他正式開始演繹第一句對白「嘩……你絕對不會相信這裡的風景……」時,聲音立即由訪問狀態切換成角色狀態。他的節奏開始變急,語氣由困惑轉為焦躁,最後帶出近乎荒謬的喜劇感。

▲ 當他正式開始演繹第一句對白,聲音立即由訪問狀態切換成角色狀態
之後,他試聽 AI 製作的版本。AI 的音色確實有幾分像他,但他指少了角色在情緒轉折之間的「虛口」,即那些不屬於對白的反應聲,例如輕微吸氣、停頓、半聲嘆息,或是人在焦急時自然流露出的細碎聲音。
「買斷聲音」對表演者沒有意義
被問到若有公司提出購買聲紋以訓練 AI,周倚天斬釘截鐵地表示拒絕。他坦言,表演者的成功感來自於觀眾能認出那是自己的聲音與演繹;若聲線被買斷後任由機器生成,那把聲音本質上已不再屬於表演者本人,對於從事表演的人來說毫無意義。外界或會擔心,配音員在拒絕聲紋被用作 AI 訓練時,會否面臨老闆壓力。周倚天卻觀察到,業界目前相當團結,因為大家明白配音界是「命運共同體」,不希望被 AI 取代。
更令人擔心的是「偷聲」。周倚天坦言,現時偷取聲音素材的門檻極低,無論是從電視、網上影片、廣告錄音擷取片段,甚至在試音過程中收集聲音,都可能成為訓練 AI 的材料。對配音員而言,每一把聲音都是多年累積的技術與心血,一旦被未經同意使用,不只是收入受損,更是表演身份被侵奪。
香港配音業正在變成「無生態」
AI 的出現,只是壓力之一。香港配音行業本身,其實早已面對結構轉變。
隨著電視台運作模式轉變,配音員大多轉為自由身,陷入周倚天口中的「無生態」困境。根據業內非正式統計,目前全港純粹依靠配音維生的全職自由身從業員,僅餘 30 多人;若算上兼職或僅從事廣告錄音的人員,全港亦只有約 100 人左右。
配音專業並非一蹴而就,周倚天用一個「浸」字來形容專業成長的修煉。手藝沒有所謂的三年達標期,一切全看個人的悟性與能否持之以恆。他指出,要真正脫離新人的標籤,起碼需要在行業中磨練四年以上,在錄音室的環境中不斷吸收與沉澱。當配音員缺乏大公司支援,議價能力會被削弱,且面臨聲紋被盜用的法律風險。
決定權在觀眾手上
大眾的選擇其實更為關鍵。周倚天說,從來不是 AI 技術的問題,因為技術發展勢在必行;這也不是配音員願不願意繼續做的問題。決定權始終都在觀眾手中,如果觀眾覺得不再需要真人配音,認為「AI 都 OK 喎」,技術其實隨時都能取代。但戲劇中許多細微的情感,始終需要配音員傾力演繹,而非單純聲線一模一樣就能交代。
面對 AI 浪潮,一般大眾可以如何支持配音從業員?周倚天建議,多觀看由真人演繹的配音作品,用實質的支持證明專業表演的價值。另外,若在網上聽到熟悉的聲線,不妨多走一步,透過電子郵件或私訊向配音員查詢,核實該音檔是否為其本人親自配製。工會正尋求法律意見及外界協助,期望為行業守住尊嚴。
AI 可以複製一把聲音,甚至複製到令人一瞬間難以分辨真假。但一個配音員在錄音室裏,為角色多停半秒、多吸一口氣、臨場改一句對白的判斷,暫時仍不是單靠聲紋模型就能完整生成。
香港人熟悉的那些聲音,珍貴之處也許正正在此:它們不只是聲音,而是一個人在角色背後留下的表演痕跡。

▲ 周倚天建議,多觀看由真人演繹的配音作品,用實質的支持證明專業表演的價值