在快速發(fā)展的播客領域,Podcastle 平臺近日宣布推出其全新的 AI 文本轉語音模型 Asyncflow v1.0。
這個新模型不僅為用戶提供了超過450種不同的 AI 語音,還向開發(fā)者開放了 API 接口,以便于他們將這一文本轉語音功能直接集成到自己的應用程序中。
在價格方面,Podcastle 的文本轉語音服務定價為每500分鐘約40美元,相比之下,競爭對手 ElevenLabs 則收取99美元。
除了文本轉語音模型外,Podcastle 的語音克隆功能也得到了升級,訓練過程由之前的需朗讀70句不同句子,縮短至現(xiàn)在僅需幾秒的錄音。
新過程利用了 Podcastle 去年推出的 Magic Dust AI 技術,顯著提高了音頻錄制質量。
在實際測試中,盡管新生成的語音聽起來稍顯機器人,但仍能較好地模仿說話者的語調。
本文內容根據(jù)網(wǎng)絡資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉載請注明,如有侵權,聯(lián)系刪除。