NTT 的全新「FutureVoice」軟體能夠僅憑幾秒鐘的音訊產生內部 AI 語音,支援六種語言,並加強語音權利保護。 NTT 的全新「FutureVoice」軟體能夠僅憑幾秒鐘的音訊產生內部 AI 語音,支援六種語言,並加強語音權利保護。

NTT 的全新「FutureVoice」軟體能夠僅憑幾秒鐘的音訊產生內部 AI 語音,支援六種語言,並加強語音權利保護。

NTT 的全新「FutureVoice」軟體能夠僅憑幾秒鐘的音訊產生內部 AI 語音,支援六種語言,並加強語音權利保護。

NTT Technocross 於 2025 年 11 月 27 日發布了其語音合成產品「FutureVoice」的新版本。新版本提高了 AI 語音的自然度和可重複性,並根據使用場景擴展了可選擇的 AI 語音種類。

其最大的亮點在​​於,它現在允許客戶公司自行產生原創的AI語音。先前,這項工作需要外包給NTT Technocross,但現在只需準備幾秒鐘到幾分鐘的名人或配音員的語音數據,即可在公司內部產生語音。此外,此跨語言語音合成技術現已支援法語和西班牙語,支援的語言數量擴展至六種,包括日語、英語、中文和韓語。該產品自2015年7月起上市,最新版本也已應用於NTT West的語音AI業務「VOICENCE」。

從: 文献リンク新版語音合成產品「FutureVoice」現已推出-擴展了AI語音的選擇範圍,並支援產生您自己的原創AI語音—

 - innovaTopia - (イノベトピア)
引自NTT Technocross Corporation官方新聞稿

【社論】

新版FutureVoice之所以備受關注,是因為它同時解決了「普及」人工智慧語音生成和「保護權利」這兩個看似矛盾的挑戰。以往語音生成需要外包給NTT Technocross公司,現在企業可以自行完成,進而顯著提升內容製作的彈性。

我們與NTT West旗下VOICENCE的合作尤其重要。 VOICENCE是一項保護配音演員和藝人「聲音版權」的服務,它提供了一個利用聲紋認證技術來檢測和防止未經授權使用的系統。透過將FutureVoice整合到這個生態系統中,我們正在創建一個讓版權所有者能夠安全進入AI語音領域的環境。

NTT West推出語音AI平台“VOICENCE”,該平台將配音演員的聲音作為智慧財產權進行保護。 NTT West於2025年10月27日正式推出其語音AI業務「VOICENCE」。該平台利用區塊鏈和可驗證憑證保護配音演員的聲音,並將其用作AI語音。 innovaTopia - (InnovaTopia) – …

千萬不要錯過這項支援六種語言的跨語言語音合成技術。這項技術只需幾秒鐘到幾分鐘的音訊數據,就能產生其他語言的地道發音,並於2023年在日本首次實現商業化。它能夠在保留聲優和角色原有音質的同時,實現多語言的開發,這對於將日本內容推廣到海外來說將是一大優勢。

潛在的風險在於,語音生成過於便利可能導致濫用。因此,與VOICENCE等版權管理平台整合至關重要,技術供應商也因此受到問責。未來,或許需要更先進的系統,例如利用區塊鏈技術管理語音版權。

[術語]

文字轉語音(TTS)
這項技術可以將文字資料轉換為人工語音。人工智慧技術的進步使得產生比傳統機械語音更自然、更能表達情感和語調的語音成為可能。

跨語言語音合成技術
這項技術能夠從一種語言的語音資料產生聽起來像母語人士發音的語音,同時保留說話者在另一種語言中的音質。它是透過分別處理語言訊息和說話者訊息來實現的。

DNN語音合成(深度神經網路)
這是一種語音合成方法,它使用深度神經網路(一種深度學習)從大量語音資料中學習特徵,並產生自然、富有表現力的語音。

零樣本/少樣本學習<br>這是一種學習方法,只需幾秒鐘到幾分鐘的音訊樣本即可重現說話者的聲音。以前需要長時間錄音,但這項技術大大減輕了錄音的負擔。

NTT 人體資訊實驗室
他在NTT集團旗下的一家研究所負責語音辨識和語音合成技術的研究與發展。他開發了FutureVoice的基礎技術,並持續在INTERSPEECH等國際會議上發表他的研究成果。

[參考連結]

FutureVoice 官方網站(外部連結)
NTT Technocross 官方語音合成產品頁面。內容包括產品陣容、應用案例、音訊範例等。

VOICENCE 官方網站(外部連結)
由NTT西日本公司經營的音頻品牌服務。它致力於保護語音版權,並利用人工智慧語音技術開發內容製作。

NTT 人類資訊實驗室(外部)
這是NTT人類資訊實驗室的英文網站,該實驗室從事語音辨識和語音合成的研究與開發。網站提供最新的研究主題和技術資訊。

[參考文章]

NTT West推出語音AI業務“VOICENCE”,旨在保護“語音權利”並提升“語音價值” (外部連結)。
NTT West公佈了其VOICENCE計畫的詳情,該計畫將於2025年10月27日啟動。此專案闡述如何利用公共區塊鏈和VC技術進行語音IP管理。

富有表現力的語音合成技術支持人們的日常生活(外部連結)
一篇發表在 NTT 技術期刊上的文章解釋了跨語言語音合成技術,詳細介紹了零樣本/少樣本學習的技術細節。

AI語音克隆市場規模、份額及趨勢報告,2030年(外部連結)
Grand View Research 的市場研究報告預測,全球 AI 語音克隆市場規模將達到 14.5 億美元,複合年增長率為 26.1%。

[編者註]

隨著人工智慧語音技術的日益普及,我們越來越思考自身「聲音」的價值。如果人工智慧可以複製你的聲音,你會如何使用它?可能性無窮無盡,從錄製故事朗讀給家人聽,到用多種語言傳遞訊息,無所不能。

同時,如何保護言論自由權也是一個重要議題。身為創作者和消費者,您對這項技術的未來有何期待?請在社交媒體上分享您的想法。