Android音頻開發之音頻基本概念
音頻
采集一般使用AudioRecod
或者MediaRecord
- 音頻采集的來源是什么?
MediaRecorder.AudioSource.MIC
一般是麥克風
- 采樣率(單位:赫茲)
每秒鐘音頻采樣點個數(8000/44100Hz),模擬信號數字化的過程,用0101來表示的數字信號
- 聲道
AudioFormat.CHANNEL_IN_MONO 單聲道,一個聲道進行采樣
AudioFormat.CHANNEL_IN_STEREO 雙聲道,兩個聲道進行采樣
- 音頻采樣精度
指定采樣的數據的格式和每次采樣的大小。
數據返回格式為 PCM
格式
每次采樣的位寬為 16bit
一般都采用這個 AudioFormat.ENCODING_PCM_16BIT(官方文檔表示,該采樣精度保證所有設備都支持
)
- 比特率
每秒傳送的比特(bit)數。單位為 bps(Bit Per Second),比特率越高,傳送數據速度越快。
采樣率x采樣大小x聲道數
每秒鐘采樣的大小=16bit(位寬) * 2(雙通道) * 44100(每次采樣的次數hz) = 1411200b=1411.2kbps
比特率越大表示單位時間內采樣的數據越多,傳輸的數據量越大。
- 常見的音頻編碼方式有哪些?
模擬音頻信號
轉換為數字信號
需要經過采樣
和量化
,量化
的過程被稱之為編碼
,根據不同的量化策略,產生了許多不同的編碼方式
,常見的編碼方式有:PCM
和ADPCM
,這些數據代表著無損
的原始數字音頻信號
,添加一些文件頭信息
,就可以存儲為WAV
文件了,它是一種由微軟和IBM聯合開發的用于音頻數字存儲的標準,可以很容易地被解析和播放。
我們在音頻開發過程中,會經常涉及到WAV文件的讀寫,以驗證采集、傳輸、接收的音頻數據的正確性
。
- 常見的音頻壓縮格式有哪些?
因為有冗余信號
,所以可以壓縮。
頻譜掩蔽效應
: 人耳所能察覺的聲音信號的頻率范圍為20Hz~20KHz
,在這個頻率范圍以外的音頻信號屬于冗余信號
。
時域掩蔽效應
: 當強音信號和弱音信號同時出現時,弱信號會聽不到,因此,弱音信號也屬于冗余信號。
下面簡單列出常見的音頻壓縮格式:
MP3,AAC,OGG,WMA,Opus,FLAC,APE,m4a,AMR,等等