您的位置: 首頁 > 新聞 > 高新技術(shù) > 新聞詳情

Meta公布全新開源AI語音壓縮技術(shù):號稱壓縮率高十倍

時間:2022-11-06 15:44:39
  • 來源:快科技
  • 作者:3DM整理
  • 編輯:newtype2001

Meta近日公布全新AI語音壓縮技術(shù)“EnCodec”,該技術(shù)號稱可以64kbps的速度壓縮比MP3格式小10倍的音頻,同時還能保證不會損失質(zhì)量。

Meta指出,壓縮技術(shù)對目前互聯(lián)網(wǎng)十分重要,借助于此用戶可以十分容易的發(fā)送高畫質(zhì)圖片、語音信息等。不過,發(fā)送這些多媒體信息需要充足的帶寬和存儲空間,尤其是在未來的時代,因此需要效果更好的壓縮技術(shù)。

Meta公布全新開源AI語音壓縮技術(shù):號稱壓縮率高十倍

據(jù)介紹,“EnCodec”AI訓(xùn)練模型涵蓋三個部分,分別為編碼器、量化器和解碼器。

Meta公布全新開源AI語音壓縮技術(shù):號稱壓縮率高十倍

編碼器可將原始數(shù)據(jù)轉(zhuǎn)換為較低影幀速率的格式,再由量化器將數(shù)據(jù)壓縮到目標(biāo)大小,最后,解碼器通過神經(jīng)網(wǎng)絡(luò)對這些數(shù)據(jù)進(jìn)行解碼。

值得一提的是,雖然此前也有人嘗試用神經(jīng)網(wǎng)絡(luò)壓縮音頻,但Meta是首個將此技術(shù)用于48kHz立體聲的團(tuán)隊。

0

玩家點評 0人參與,0條評論)

收藏
違法和不良信息舉報
分享:

熱門評論

全部評論

他們都在說 再看看
3DM自運營游戲推薦 更多+