星期一, 25 11 月


Meta 的大規模多語言語音模型擴語音技術的應用範圍,從 100 種語言,至今已可轉換超過1,100種語言。(圖/Meta提供)

Meta 的大規模多語言語音模型擴語音技術的應用範圍,從 100 種語言,至今已可轉換超過1,100種語言。(圖/Meta提供)

臉書(Meta) 今(23)日發表一系列的 AI大規模多語言語音(Massively Multilingual Speech,簡稱 MMS),可以辨識超過4,000種口語語言,文字和語音之間的轉換也支援超過1,100種語言,不僅能夠使用偏好的語言操作、用於AR及VR,更可理解每個人的聲音。

過去最大型的語音資料庫最多僅涵蓋 100 種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta 使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如《聖經》,作為語言的文字訓練資料。

聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta 創造的資料集,蒐集超過1,100種語言的《新約聖經》有聲讀物資料集,平均為每種語言提供 32 小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4,000種語言。

Meta 將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。

Share.

Leave A Reply