概念
TTS 即TextToSpeech,文本轉語言,也就是所謂的語音合成技術。TTS技術對文本文件進行實時轉換,轉換時間可以秒計算。
目前國內主流的語音引擎提供商主要為科大訊飛、百度以及云知聲。
前言
由于項目中涉及到收銀金額的播報,主要是用在食堂、大排檔這類的嘈雜環境,所以需求上要滿足語速快,音量高,隊列播放。最初找到網上通過MediaPlayer播放錄制好的金額音頻文件的方案實現,[參考](https://segmentfault.com/a/1190000011407408/ [代碼]:https://github.com/javaexception/VoiceAnnouncements),但播放語速太慢,被直接pass掉。轉而考慮第三方的SDK,萬萬沒想到,原本很簡單的一個三選一的題,選來選去,成功繞過了正確答案,最終迭代了三次才選到了適合我們場景的答案。下面我總結了基于我們使用場景(各種網絡環境)得出的幾個優缺點:
提供商 | 是否提供離線 | 是否收費 | 合成質量 | 不足 |
---|---|---|---|---|
科大訊飛 | 是 | 是 | 好 | 不支持有線網,需維護隊列 |
百度 | 是 | 否 | 較好 | 離線授權易失敗,合成失敗 |
云知聲 | 是 | 否 | 一般 | 聲音不自然,需維護隊列,技術支持不給力 |
最后,結合項目復雜的使用場景,選擇了云知聲的離線TTS,外加維護一個簡單的隊列,滿足了我們的需求。網上有網友提供的一個自己封裝的工具(https://blog.csdn.net/fengyuzhengfan/article/details/45053293),封裝的不錯,拿來就可以用,而且加入了隊列維護,但唯一的不足之處,在于聲音比較小,即便音量設置成最大值,聽起來也不是很響亮,大約60分貝左右,安靜環境下沒什么問題,但我們得保持90分貝才差不多滿足,所以不做改變的話,對我來說也沒法使用,考慮到此工具類里的sdk版本比較老了,嘗試到云知聲官網down了最新的離線包,剛好音量方面做了調整,于是重新封裝了一個工具類,加入了隊列維護,并做了一些微調,音量達到了85分貝,基本滿足了我們需求(其實我們還想更大聲一點,目前只能考慮硬件上提升功放)。
好了,叨叨了太多廢話,下面我們上代碼:
package com.ing.tts;
import android.content.Context;
import android.media.AudioManager;
import com.unisound.client.SpeechConstants;
import com.unisound.client.SpeechSynthesizer;
import com.unisound.client.SpeechSynthesizerListener;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
/**
* 離線語音
*
* @author ing
* @date 2018/3/27
*/
public class SpeechUtilOffline {
public static final String appKey = "_appKey_";//經測試,離線包key和secret可不填真實的。
public static final String secret = "_secret_";
private static SpeechUtilOffline instance;
private SpeechSynthesizer mTTSPlayer;
private boolean isSpeaking = false;
private List<SpeechItem> speechList = new ArrayList<>();
private boolean released = false;
protected OfflineResource offlineResource;
private SpeechUtilOffline(Context context) {
init(context);
released = false;
}
public static SpeechUtilOffline getInstance(Context context) {
if (instance == null) {
instance = new SpeechUtilOffline(context);
}
return instance;
}
/**
* 初始化引擎
*
* @author JPH
* @date 2015-4-14 下午7:32:58
*/
private void init(final Context context) {
try {
offlineResource = new OfflineResource(context);
} catch (IOException e) {
LogUtils.e("offlineResouce failed , error msg : "+e.getMessage());
e.printStackTrace();
}
// 初始化語音合成對象
mTTSPlayer = new SpeechSynthesizer(context, appKey, secret);
// 設置本地合成
mTTSPlayer.setOption(SpeechConstants.TTS_SERVICE_MODE, SpeechConstants.TTS_SERVICE_MODE_LOCAL);
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_VOICE_PITCH, 50);//音調
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_VOICE_SPEED, 52);//語速
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_VOICE_VOLUME, 100);//音量
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_STREAM_TYPE, AudioManager.STREAM_NOTIFICATION);
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_FRONTEND_MODEL_PATH, offlineResource.getModelFilename());
// 設置后端模型
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_BACKEND_MODEL_PATH, offlineResource.getBackFilename());
// 設置回調監聽
mTTSPlayer.setTTSListener(new SpeechSynthesizerListener() {
@Override
public void onEvent(int type) {
switch (type) {
case SpeechConstants.TTS_EVENT_INIT:
// 初始化成功回調
LoggerUtils.d("onInitFinish");
break;
case SpeechConstants.TTS_EVENT_SYNTHESIZER_START:
// 開始合成回調
LoggerUtils.d("beginSynthesizer");
break;
case SpeechConstants.TTS_EVENT_SYNTHESIZER_END:
// 合成結束回調
LoggerUtils.d("endSynthesizer");
break;
case SpeechConstants.TTS_EVENT_BUFFER_BEGIN:
// 開始緩存回調
LoggerUtils.d("beginBuffer");
break;
case SpeechConstants.TTS_EVENT_BUFFER_READY:
// 緩存完畢回調
break;
case SpeechConstants.TTS_EVENT_PLAYING_START:
// 開始播放回調
LoggerUtils.d("onPlayBegin");
break;
case SpeechConstants.TTS_EVENT_PLAYING_END:
// 播放完成回調
break;
case SpeechConstants.TTS_EVENT_PAUSE:
// 暫停回調
LoggerUtils.d("pause");
break;
case SpeechConstants.TTS_EVENT_RESUME:
// 恢復回調
LoggerUtils.d("resume");
break;
case SpeechConstants.TTS_EVENT_STOP:
// 停止回調
LoggerUtils.d("stop");
break;
case SpeechConstants.TTS_EVENT_RELEASE:
// 釋放資源回調
LoggerUtils.d("release");
break;
default:
break;
}
}
@Override
public void onError(int type, String errorMSG) {
// 語音合成錯誤回調
LoggerUtils.ttsErrorLog("TTS onError __ type : "+ type +" errorMsg : " +errorMSG );
}
});
// 初始化合成引擎
mTTSPlayer.init("");
}
/**
* 停止播放
*
* @author JPH
* @date 2015-4-14 下午7:50:35
*/
public void stop() {
mTTSPlayer.stop();
}
/**
* 播放
*
* @author JPH
* @date 2015-4-14 下午7:29:24
*/
public void play(String content) {
playImmediately(content);
}
public void play(String content, PLAY_MODE playMode) {
switch (playMode) {
case QUEUED: {
playQueued(content);
break;
}
case IMMEDIATELY: {
playImmediately(content);
break;
}
}
}
private void updateSpeech() {
if (!isSpeaking) {
if (speechList.size() > 0) {
speak(speechList.remove(speechList.size() - 1).content);
}
}
}
private void speak(String content) {
mTTSPlayer.playText(content);
}
public void playQueued(String content) {
speechList.add(new SpeechItem(content, PLAY_MODE.QUEUED));
updateSpeech();
}
public void playImmediately(String content) {
speak(content);
}
/**
* 釋放資源
*
* @author JPH
* @date 2015-4-14 下午7:27:56
*/
public void release() {
// 主動釋放離線引擎
if (released) {
return;
}
if (mTTSPlayer != null) {
mTTSPlayer.stop();
mTTSPlayer.release(SpeechConstants.TTS_RELEASE_ENGINE, null);
}
instance = null;
released = true;
}
public enum PLAY_MODE {
QUEUED,
IMMEDIATELY
}
private class SpeechItem {
public String content;
public PLAY_MODE playMode;
public SpeechItem(String content, PLAY_MODE mode) {
this.content = content;
this.playMode = mode;
}
}
}
以上就是我們項目中用到的離線工具類,主要設置:
mTTSPlayer.setOption(SpeechConstants.TTS_SERVICE_MODE, SpeechConstants.TTS_SERVICE_MODE_LOCAL);//離線模式
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_VOICE_PITCH, 50);//音調
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_VOICE_SPEED, 52);//語速
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_VOICE_VOLUME, 100);//音量最大
mTTSPlayer.setOption(SpeechConstants.TTS_KEY_STREAM_TYPE, AudioManager.STREAM_NOTIFICATION);
最后一個設置項TTS_KEY_STREAM_TYPE, sdk里默認是STREAM_MUSIC也就是媒體音量,但經過分貝測試,發現在集中系統音量類型中,通知類的聲音是最大的,于是這里就選擇設置成了STREAM_NOTIFICATION模式。
另外,直接下載的sdk,提供的 asserts離線文件拷貝到本地的方法不太好用,這里我改造了一下,也就是OfflineResource.java :
package com.ing.tts;
import android.content.Context;
import android.content.res.AssetManager;
import android.util.Log;
import com.ing.tts.FileUtils;
import java.io.IOException;
import static android.content.ContentValues.TAG;
/**
* 離線語音
*
* @author ing
* @date 2018/3/27
*/
public class OfflineResource {
private AssetManager assets;
private String destPath;
private String backFilename;
private String modelFilename;
public OfflineResource(Context context) throws IOException {
this.assets = context.getAssets();
this.destPath = FileUtils.createTmpDir(context);
setOfflineVoiceType();
}
public String getModelFilename() {
return modelFilename;
}
public String getBackFilename() {
return backFilename;
}
public void setOfflineVoiceType() throws IOException {
String back = "backend_lzl";
String model = "frontend_model";
backFilename = copyAssetsFile(back);
modelFilename = copyAssetsFile(model);
}
private String copyAssetsFile(String sourceFilename) throws IOException {
String destFilename = destPath + "/" + sourceFilename;
FileUtils.copyFromAssets(assets, sourceFilename, destFilename, false);
Log.i(TAG, "Assets to sdcard successed:" + destFilename);
return destFilename;
}
}
FileUtils.java :
/**
* 創建一個臨時目錄,用于復制臨時文件,如assets目錄下的離線資源文件
* @param context
* @return
*/
public static String createTmpDir(Context context) {
String sampleDir = "/ing/tts";//這里改為你的本地路徑
String tmpDir = Environment.getExternalStorageDirectory().toString() + sampleDir;
if (!FileUtils.makeDir(tmpDir)) {
tmpDir = context.getExternalFilesDir(sampleDir).getAbsolutePath();
if (!FileUtils.makeDir(sampleDir)) {
throw new RuntimeException("create model resources dir failed :" + tmpDir);
}
}
return tmpDir;
}
/**
* assets文件2 sdcard
* @param assets
* @param source
* @param dest
* @param isCover
* @throws IOException
*/
public static void copyFromAssets(AssetManager assets, String source, String dest, boolean isCover) throws IOException {
File file = new File(dest);
if (isCover || (!isCover && !file.exists())) {
InputStream is = null;
FileOutputStream fos = null;
try {
is = assets.open(source);
String path = dest;
fos = new FileOutputStream(path);
byte[] buffer = new byte[1024];
int size = 0;
while ((size = is.read(buffer, 0, 1024)) >= 0) {
fos.write(buffer, 0, size);
}
} finally {
if (fos != null) {
try {
fos.close();
} finally {
if (is != null) {
is.close();
}
}
}
}
}
}
然后使用就很簡單了,比如:
SpeechUtilOffline.getInstance(MainActivity.this).play("收款1024元", SpeechUtilOffline.PLAY_MODE.QUEUED);
最后附上源碼下載:https://download.csdn.net/download/learner576539763/10316889