在做音視頻編輯的時候,大家關注更多的是視頻開發,熱衷于 FFmpeg、OpenGL 這些技巧,實際上音頻開發也是很重要的,甚至可以說音頻開發比視頻開發更難一點。
對音頻的常見處理就是變速、變調、混音這些,一般都是用開源庫來搞定,常見的就是 libsonic 和 libsoundtouch 兩個,當然有實力的公司會自己研發音頻算法。
本篇文章會簡單介紹 libsonic 的使用。
libsonic 獲取
libsonic 是一個支持音頻倍速播放的開源庫,并且支持大于 2 倍速的播放,它的主頁地址如下:
https://android.googlesource.com/platform/external/sonic/+/refs/heads/master/doc/index.md
可以通過該鏈接下載 libsonic 庫:
git clone git://github.com/waywardgeek/sonic.git
這個倉庫里面內容還挺全的,包含了 Java 和 C 版本的實現和使用演示,很方便做移植。
如果你只需要用到變速和音量調整,那么使用 sonic_lite.h 和 sonic_lite.c 兩個文件就行了,這里面對功能做了裁剪。
libsonic 主頁上還提供了一個 Android NDK 版本的倉庫,通過該鏈接可下載:
git clone git://github.com/waywardgeek/sonic-ndk.git
不過這個版本有的太老舊了,還是 Android.mk 的接入方式,現在都換成 CMake 接入了。
有興趣的同學可以寫一個 sonic-ndk CMake 版本的封裝庫,說不定能在 Github 上刷一波 star 呢。
libsonic 使用
libsonic 的調用接口不多,具體使用完全可以參考給的代碼演示。
以下是一個音頻倍速的使用代碼:
/* Run sonic_lite. */
static void runSonic(char* inFileName, char* outFileName, float speed, float volume) {
waveFile inFile, outFile = NULL;
// 定義輸入和輸出的 buffer
short inBuffer[SONIC_INPUT_SAMPLES], outBuffer[SONIC_INPUT_SAMPLES];
int samplesRead, samplesWritten, sampleRate, numChannels;
// 打開輸入文件,并且獲取輸入文件的相關信息
inFile = openInputWaveFile(inFileName, &sampleRate, &numChannels);
if (numChannels != 1) {
fprintf(stderr, "sonic_lite only processes mono wave files. This file has %d channels.\n",
numChannels);
exit(1);
}
if (sampleRate != SONIC_SAMPLE_RATE) {
fprintf(stderr,
"sonic_lite only processes wave files with a sample rate of %d Hz. This file uses %d\n",
SONIC_SAMPLE_RATE, sampleRate);
exit(1);
}
if (inFile == NULL) {
fprintf(stderr, "Unable to read wave file %s\n", inFileName);
exit(1);
}
// 打開輸出文件
outFile = openOutputWaveFile(outFileName, sampleRate, 1);
if (outFile == NULL) {
closeWaveFile(inFile);
fprintf(stderr, "Unable to open wave file %s for writing\n", outFileName);
exit(1);
}
// 初始化 sonic 并且設置速度 speed 和音量 volume
sonicInit();
sonicSetSpeed(speed);
sonicSetVolume(volume);
do {
// 從輸入文件中讀取 sample
samplesRead = readFromWaveFile(inFile, inBuffer, SONIC_INPUT_SAMPLES);
if (samplesRead == 0) {
sonicFlushStream();
} else {
// 將讀取的 sample 給到 sonic 中的 sonicStream
// sonicStream 會根據 speed 和 volume 做相應處理
sonicWriteShortToStream(inBuffer, samplesRead);
}
// 將 sonic 中 sonicStream 處理后的數據給到 outBuffer
// 并將 outBuffer 寫入到輸出文件中
do {
samplesWritten = sonicReadShortFromStream(outBuffer, SONIC_INPUT_SAMPLES);
if (samplesWritten > 0) {
writeToWaveFile(outFile, outBuffer, samplesWritten);
}
} while (samplesWritten > 0);
} while (samplesRead > 0);
closeWaveFile(inFile);
closeWaveFile(outFile);
}
這個代碼示例還是比較簡單易懂的。
首先是檢查輸入和輸出文件是不是有問題,這一點很基礎但也非常重要。
代碼中用到的示例文件是 wav 格式的,libsonic 倉庫中有對應的資源可以下載,不用自己滿世界找文件了。
wav 文件的讀取可以用倉庫中的 wave.c 和 wave.h 文件操作。
接下來就是從輸入文件中讀取 sample ,并交由 libsonic 處理,最后將處理好 sample 寫入到輸出文件中。
這有個概念就是:視頻的處理,我們都是說一幀一幀的,音頻就沒有幀的概念,一般都是說采樣點,比如要處理多少個采樣點之類的說法。
代碼示例中,readFromWaveFile 方法從文件中讀取 sample ,sonicWriteShortToStream 方法將 sample 交由 libsonic 處理。
libsonic 中有個 sonicStream 的結構,它用來存儲變換后的數據,這里面會根據設置的 speed 和 volume 做處理。
最后再通過 sonicReadShortFromStream 將數據從 libsonic 讀出,然后通過 writeToWaveFile 方法寫入到輸出文件中。
經過測試,以上方法確實可以實現音量調節和變速的效果,并且在變速的同時保持著原來的音調。
小結
以上就是關于 libsonic 的介紹與實踐,除了 wav 格式文件,pcm 格式數據也同樣可以做變速的。
關注公眾號 音視頻開發進階 ,在后續還會進行更新源碼分析等更多內容,敬請期待~~~