最近有很多優(yōu)秀的語音合成TTS工具,目前MoneyPrinterPlus已經(jīng)集成了ChatTTS和fasterWhisper。應(yīng)朋友們的要求,最近MoneyPrinterPlus也集成了GPT_SoVITS這個(gè)優(yōu)秀的語音合成工具。
今天給大家詳細(xì)講解一下,如何在MoneyPrinterPlus中使用GPT_SoVITS。
軟件準(zhǔn)備
當(dāng)然,前提條件就是你需要下載MoneyPrinterPlus軟件啦。
下載地址: https://github.com/ddean2009/MoneyPrinterPlus
用得好的朋友,不妨給個(gè)star支持一下。 在軟件v4.4版本之后,MoneyPrinterPlus已經(jīng)支持GPT_SoVITS本地TTS語音服務(wù)啦。
啟動(dòng)GPT_SoVITS
GPT_SoVITS這個(gè)工具怎么安裝這里就不多講了。
我們講下如何跟MoneyPrinterPlus進(jìn)行合作配置。
GPT_SoVITS有很多功能,包括語音訓(xùn)練,模型微調(diào),TTS語音推理,變聲等功能。
這里我們使用的是GPT_SoVITS的核心TTS語音推理功能。
首先我們啟動(dòng)GPT_SoVITS:
在1-GPT-SoVITS-TTS ---》 1C推理 ---》 開啟TTS推理webUI
[圖片上傳失敗...(image-229666-1723604668138)]
然后你就可以看到這樣的TTS推理界面:
[圖片上傳失敗...(image-9c5bed-1723604668138)]
你可以選擇參考音頻,參考文本,參考音頻的語言。
然后可以輸入要合成的文本,合成語音的類別,語速,top_k, top_p和temperature。
當(dāng)然,上面的都不重要,我們不需要通過webUI來調(diào)用GPT_SoVITS,我們需要的是通過API來和GPT_SoVITS進(jìn)行交互。
API啟動(dòng)GPT_SoVITS
如果下載的是GPT_SoVITS的集合包,那么可以直接執(zhí)行下面的命令來啟動(dòng)GPT_SoVITS的API:
啟動(dòng)api: runtime\python.exe api.py
啟動(dòng)之后,你會(huì)看到下面的內(nèi)容:
[圖片上傳失敗...(image-6df927-1723604668138)]
上面的啟動(dòng)是最簡單的啟動(dòng),沒有指定參考音頻,如果你想指定參考音頻的話,可以執(zhí)行下面的命令:
python api.py -dr "123.wav" -dt "一二三。" -dl "zh"
當(dāng)然,還有其他的一些啟動(dòng)參數(shù)如下:
`-dr` - `默認(rèn)參考音頻路徑`
`-dt` - `默認(rèn)參考音頻文本`
`-dl` - `默認(rèn)參考音頻語種, "中文","英文","日文","韓文","粵語,"zh","en","ja","ko","yue"`
`-d` - `推理設(shè)備, "cuda","cpu"`
`-a` - `綁定地址, 默認(rèn)"127.0.0.1"`
`-p` - `綁定端口, 默認(rèn)9880, 可在 config.py 中指定`
`-fp` - `覆蓋 config.py 使用全精度`
`-hp` - `覆蓋 config.py 使用半精度`
`-sm` - `流式返回模式, 默認(rèn)不啟用, "close","c", "normal","n", "keepalive","k"`
·-mt` - `返回的音頻編碼格式, 流式默認(rèn)ogg, 非流式默認(rèn)wav, "wav", "ogg", "aac"`
·-cp` - `文本切分符號(hào)設(shè)定, 默認(rèn)為空, 以",.,。"字符串的方式傳入`
`-hb` - `cnhubert路徑`
`-b` - `bert路徑`
大家可以根據(jù)需要自行選擇。
默認(rèn)情況下API會(huì)啟動(dòng)在9880端口,我們可以使用下面的命令來測試API的啟動(dòng)效果:
使用執(zhí)行參數(shù)指定的參考音頻:
GET:
`http://127.0.0.1:9880?text=先帝創(chuàng)業(yè)未半而中道崩殂,今天下三分,益州疲弊,此誠危急存亡之秋也。&text_language=zh`
POST:
```json
{
"text": "先帝創(chuàng)業(yè)未半而中道崩殂,今天下三分,益州疲弊,此誠危急存亡之秋也。",
"text_language": "zh"
}
```
配置MoneyPrinterPlus
好了,回到我們的MoneyPrinterPlus頁面。
在基本配置頁面,本地語音TTS,我們選擇GPTSoVITS, 然后輸入GPTSoVITS的地址。
[圖片上傳失敗...(image-2e861d-1723604668138)]
在AI視頻或者視頻混剪區(qū),在視頻TTS語音合成區(qū),我們選擇本地服務(wù)。
[圖片上傳失敗...(image-eddbef-1723604668138)]
這里列出來GPTsoVITS所需要的大部分參數(shù)。
你可以使用參考音頻,參考音頻文本,參考音頻語音。
然后可以條件temperature,top_P, top_K等信息。
[圖片上傳失敗...(image-8f9a68-1723604668138)]
點(diǎn)擊試聽聲音,如果你聽到合成的聲音,那么恭喜你,你的配置成功了。
同時(shí),在GPTsoVITS服務(wù)的日志文件中,你可以看到一些語音合成的進(jìn)度。
[圖片上傳失敗...(image-f862c5-1723604668138)]
總結(jié)
GPTsoVITS是一個(gè)非常強(qiáng)大的服務(wù),和MoneyPrinterPlus結(jié)合起來使用,你將會(huì)無往不利。
點(diǎn)我查看更多精彩內(nèi)容:www.flydean.com