本文將詳細介紹PaddleSpeech 語音合成步驟,輕松打造個性化音頻。
介紹PaddleSpeech 語音合成產(chǎn)品的使用:(1)注冊登錄并進行實名認(rèn)證。
(2)在“項目”頁面中,搜索“語音合成”,選擇“【有手就行】使用自己的聲音做語音合成”。
(3)按照說明書進行操作,點擊“運行一下”按鈕。
(4)選擇運行環(huán)境,需要選擇32GB或以上的GPU環(huán)境。
(5)點擊“運行全部Cell”圖標(biāo)D,安裝試驗所器環(huán)境。
出現(xiàn)“運行時長:××秒結(jié)束時間:××××”字樣,表示安裝完成。
(6)網(wǎng)頁應(yīng)用微調(diào)訓(xùn)練。
用鼠標(biāo)雙擊左側(cè)文件“untitled.streamlit.py”。
在新頁面中,參照網(wǎng)頁應(yīng)用引導(dǎo)操作。
(7)上傳數(shù)據(jù)。
選擇格式為Wav的干聲音頻,保證聲音平穩(wěn),且單條音頻長度在2秒~10秒,超出則報錯。
(8)檢驗并標(biāo)注數(shù)據(jù)。
(9)微調(diào)模型。
輸入訓(xùn)練輪次(輪次越多,耗時越長)。
當(dāng)然,訓(xùn)練時間不是越長越好,訓(xùn)練時間過長可能導(dǎo)致過度擬合等問題。
點擊“微調(diào)訓(xùn)練”,訓(xùn)練完成后,點擊“導(dǎo)出模型”。
(10)使用合成音頻,輸入待轉(zhuǎn)換語音的文本,選擇聲碼器和剛訓(xùn)練好的模型,再制語速后,點擊“合成”。
(11)下載合成好的語音到本地。
(12)由于PaddleSpeech一個收費工具,在語音合成完成后,若沒有新任務(wù),可以停項目,防止繼續(xù)收費。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。