講客廣播電臺AI技術再進化 「即時字幕」打破語言界線

【李台源/桃園報導】誰說廣播只能用耳朵聽?客家公共傳播基金會(客傳會)所屬的講客廣播電臺,利用AI科技,實現即時客語語音轉文字。目前測試版(Beta版)已經上線,聽眾點選講客廣播電臺網站的「線上直播」,畫面就會顯示即時字幕。客傳會董事長陳邦畛表示,此突破將大幅降低收聽客語廣播節目的門檻,更替未來將客語即時轉化為英文等外國語言,開啟了一道大門。

今年8月1日開始,講客廣播電臺官網新增了客語廣播即時字幕功能,透過客家委員會合作夥伴長問科技訓練的模型,系統將會自動判斷廣播節目中的客語語音,並翻譯成華語文字,目前準確率已達7成,成為非客語母語人士收聽客語節目的重要工具。

今年8月1日開始,講客廣播電臺官網新增了客語廣播即時字幕功能(下方藍綠色字幕)。李台源攝
今年8月1日開始,講客廣播電臺官網新增了客語廣播即時字幕功能(下方藍綠色字幕)。李台源攝

陳邦畛指出,「聲音一旦成功轉換成文字,就有了被記錄、理解和學習的可能性,更有潛力被翻譯成任何國家的語言。」有了字幕輔助,聽眾不再因為聽不懂客語而卻步,只要對這個文化有興趣,就能透過文字來理解,進而增加客語的使用者、學習者與傳承者。

「語言是承載文化寶藏的關鍵。」陳邦畛認為,聲音本身承載的情感與多樣性,遠比作為「溝通公約數」的文字更豐富。透過即時字幕技術,可以更真實地記錄下客家族群的生活樣貌、思維方式與文化價值,讓外界有機會理解這個長期被忽略的群體。

陳邦畛指出,客語作為相對少數的語言,過去累積的語音資料庫不足,且於現代生活應用有脫節,因此準確度還有待提升,但如今技術實現後,希望能激發更多客語使用者完善資料庫,建立客家人的文化自信,「語言越是不同,在這個階段的價值可能越高。」

陳邦畛指出,講客廣播電臺將客語廣播同步生成字幕,聲音一旦成功轉換成文字,就有了被記錄、理解和學習的可能性。客新聞資料照
陳邦畛指出,講客廣播電臺將客語廣播同步生成字幕,聲音一旦成功轉換成文字,就有了被記錄、理解和學習的可能性。客新聞資料照

講客廣播電臺新的AI技術突破在於,台灣主流客語擁有五大腔調,現今雖然已有客語多腔調的語音文字轉語音(Text-To-Speech,TTS)系統,但都屬於離線轉換,必須將音檔上傳至伺服器運算,無法即時將客語語音內容翻譯成華語文字。

對於技術運用,講客廣播電臺工程組組長涂志豪說明,客語語音可以即時轉文字,並且呈現在電臺官網,背後是一套精密且環環相扣的技術流程。

涂志豪解釋,電臺透過網際網路音訊協定(Audio over Internet Protocol,簡稱AoIP)提供乾淨且穩定的聲音訊號,再由系統濾除雜音 、計算音量強度,並且轉換聲音格式,大幅提升傳輸效率,並讓AI更精準辨識。

系統處理後的「乾淨聲音資料」,會即時傳送至客家委員會合作夥伴長問科技所訓練的自動語音辨識(Automatic Speech Recognition,ASR)模型,將接收到的客語聲音即時轉換成文字。

涂志豪說,系統將客語聲音辨識成文字後,會再傳送回講客廣播電臺內部伺服器處理。再由這台伺服器將文字串接至官網,成為聽眾正在瀏覽的即時字幕顯示。透過一系列技術整合,講客廣播電臺將傳統的聽覺廣播,升級為兼具視覺閱讀的現代化媒體,為客語保存與傳播,寫下了嶄新一頁。

講客廣播電臺近年持續引入AI科技,包括透過「AI客語語音廣播自動生成系統」,只要將文字輸入講客廣播電臺官網編輯臺,即可生成客語音檔,並且自動整合導入講客廣播電臺AI客語最速報,以此奪下第59屆廣播金鐘獎「創新研發應用獎」。

講客廣播電臺表示,目前客語廣播即時字幕功能應用於官網線上直播節目,預計接下將會逐步應用於網路雲端AOD(Audio On Demand)隨選隨聽節目,希望持續增加客語廣播節目的可能性。講客廣播電臺也說,未來將持續透過優質節目與科技運用,展現多樣的客家真實聲音。

今年8月1日開始,講客廣播電臺官網新增了客語廣播即時字幕功能。講客廣播電臺提供
今年8月1日開始,講客廣播電臺官網新增了客語廣播即時字幕功能。講客廣播電臺提供
講客廣播電臺手機版網頁也可以收看即時字幕。講客廣播電臺提供
講客廣播電臺手機版網頁也可以收看即時字幕。講客廣播電臺提供
點開講客廣播電臺官網線上直播,即可收看即時客語字幕。李台源攝
點開講客廣播電臺官網線上直播,即可收看即時客語字幕。李台源攝