G.711編碼原理

目錄

  1. 參考
  2. 概述
  3. G.711原理
  4. 總結

1. 參考

2. 概述

本文目的:
1、熟悉G711a/u兩種格式的基本原理
2、熟悉兩種壓縮算法的實現步驟及提供源碼實現

G.711是國際電信聯盟ITU-T定制出來的一套語音壓縮標準,它代表了對數PCM(logarithmic pulse-code modulation)抽樣標準,是主流的波形聲音編解碼標準,主要用于電話。

  1. 主要用脈沖編碼調制對音頻采樣,采樣率為8k每秒。它利用一個 64Kbps 未壓縮通道傳輸語音訊號。
  2. 壓縮率為1:2, 即把16位成8位。

G.711 標準下主要有兩種壓縮算法。

  1. u-law algorithm (又稱u-law, ulaw, mu-law),主要運用于北美和日本。
  2. A-law algorithm,主要運用于歐洲和世界其他地區。特別設計用來方便計算機處理的。

G.711將14bit(uLaw)或者13bit(aLaw)采樣的PCM數據編碼成8bit的數據流,播放的時候在將此8bit的數據還原成14bit或者13bit進行播放,不同于MPEG這種對于整體或者一段數據進行考慮再進行編解碼的做法,G711是波形編解碼算法,就是一個sample對應一個編碼,所以壓縮比固定為:

  • 8/14 = 57% (uLaw)
  • 8/13 = 62% (aLaw)

3. G.711原理

G.711是將語音模擬信號進行一種非線性量化, 詳細的資料可以在ITU 上下到相關的spec 。下面主要列出一些性能參數:
G.711(PCM方式)

  • 采樣率:8kHz
  • 信息量:64kbps/channel
  • 理論延遲:0.125msec
  • 品質:MOS值4.10

算法原理:
A-law的公式如下,一般采用A=87.6


image

畫出圖來則是如下圖,用x表示輸入的采樣值,F(x)表示通過A-law變換后的采樣值,y是對F(x)進行量化后的采樣值。

image

由此可見

  • 在輸入的x為高值的時候,F(x)的變化是緩慢的,有較大范圍的x對應的F(x)最終被量化為同一個y,精度較低。
  • 相反在低聲強區域,也就是x為低值的時候,F(x)的變化很劇烈,有較少的不同x對應的F(x)被量化為同一個y。意思就是說在聲音比較小的區域,精度較高。

對應反量化公式(即上面函數的反函數):

image

3.1 G.711A(A-LAW)壓縮十三折線法

G.711A輸入的是13位(S16的高13位),這種格式是經過特別設計的,便于數字設備進行快速運算。

  1. 取符號位并取反得到s。
  2. 獲取強度位eee,獲取方法如下圖所示
  3. 獲取高位樣本位wxyz
  4. 組合為seeewxyz,將seeewxyz逢偶數為取補數。

A-law如下表計算。

  • 第一列是采樣點,共13bit,最高位為符號位。
  • 對于前兩行,折線斜率均為1/2,跟負半段的相應區域位于同一段折線上。
  • 對于3到8行,斜率分別是1/4到1/128,共6段折線。
  • 總共13段折線,這就是所謂的A-law十三段折線法。
image

示例:

輸入pcm數據為1234,二進制對應為(0000 0100 1101 0010)
二進制變換下排列組合方式(0 00001 0011 010010)
1、獲取符號位最高位為0,取反,s=1
2、獲取強度位00001,查表,編碼制應該是eee=011
3、獲取高位樣本wxyz=0011
4、組合為10110011,逢偶數為取反為11100110,得到E6

#define SIGN_BIT    (0x80)      /* Sign bit for a A-law byte. */
#define QUANT_MASK  (0xf)       /* Quantization field mask. */
#define NSEGS       (8)     /* Number of A-law segments. */
#define SEG_SHIFT   (4)     /* Left shift for segment number. */
#define SEG_MASK    (0x70)      /* Segment field mask. */
static int seg_aend[8] = {0x1F, 0x3F, 0x7F, 0xFF,
                0x1FF, 0x3FF, 0x7FF, 0xFFF};
static int seg_uend[8] = {0x3F, 0x7F, 0xFF, 0x1FF,
                0x3FF, 0x7FF, 0xFFF, 0x1FFF};
 
static int search(
    int val,    /* changed from "short" *drago* */
    int *   table,
    int size)   /* changed from "short" *drago* */
{
    int i;      /* changed from "short" *drago* */
 
    for (i = 0; i < size; i++) {
        if (val <= *table++)
            return (i);
    }
    return (size);
}
 
int linear2alaw(int pcm_val)        /* 2's complement (16-bit range) */
                                        /* changed from "short" *drago* */
{
    int     mask;   /* changed from "short" *drago* */
    int     seg;    /* changed from "short" *drago* */
    int     aval;
 
    pcm_val = pcm_val >> 3;//這里右移3位,因為采樣值是16bit,而A-law是13bit,存儲在高13位上,低3位被舍棄
 
 
    if (pcm_val >= 0) {
        mask = 0xD5;        /* sign (7th) bit = 1 二進制的11010101*/
    } else {
        mask = 0x55;        /* sign bit = 0  二進制的01010101*/
        pcm_val = -pcm_val - 1; //負數轉換為正數計算
    }
 
    /* Convert the scaled magnitude to segment number. */
    seg = search(pcm_val, seg_aend, 8); //查找采樣值對應哪一段折線
 
    /* Combine the sign, segment, and quantization bits. */
 
    if (seg >= 8)       /* out of range, return maximum value. */
        return (0x7F ^ mask);
    else {
//以下按照表格第一二列進行處理,低4位是數據,5~7位是指數,最高位是符號
        aval = seg << SEG_SHIFT;
        if (seg < 2)
            aval |= (pcm_val >> 1) & QUANT_MASK;
        else
            aval |= (pcm_val >> seg) & QUANT_MASK;
        return (aval ^ mask);
    }
}

int alaw2linear(int a_val)      
{
    int     t;      /* changed from "short" *drago* */
    int     seg;    /* changed from "short" *drago* */
 
    a_val ^= 0x55; //異或操作把mask還原
 
    t = (a_val & QUANT_MASK) << 4;//取低4位,即表中的abcd值,然后左移4位變成abcd0000
    seg = ((unsigned)a_val & SEG_MASK) >> SEG_SHIFT; //取中間3位,指數部分
    switch (seg) {
    case 0: //表中第一行,abcd0000 -> abcd1000
        t += 8;
        break;
    case 1: //表中第二行,abcd0000 -> 1abcd1000
        t += 0x108;
        break;
    default://表中其他行,abcd0000 -> 1abcd1000 的基礎上繼續左移(按照表格第二三列進行處理)
        t += 0x108;
        t <<= seg - 1;
    }
    return ((a_val & SIGN_BIT) ? t : -t);
}

3.2 G.711u(u-law)

使用在北美和日本,輸入的是14位,編碼算法就是查表,計算出:基礎值+平均偏移值

μ-law的公式如下,μ取值一般為255


image
image

相應的μ-law的計算方法如下表

image
image

示例:
輸入pcm數據為1234
1、取得范圍值,查表得 +2014 to +991 in 16 intervals of 64
2、得到基礎值為0xA0
3、得到間隔數為64
4、得到區間基本值2014
5、當前值1234和區間基本值差異2014-1234=780
6、偏移值=780/間隔數=780/64,取整得到12
7、輸出為0xA0+12=0xAC

#define BIAS        (0x84)      /* Bias for linear code. 線性碼偏移值*/
#define CLIP            8159    //最大量化級數量
 
int linear2ulaw( int    pcm_val)    /* 2's complement (16-bit range) */
{
    int     mask;
    int     seg;
    int     uval;
 
    /* Get the sign and the magnitude of the value. */
    pcm_val = pcm_val >> 2;
    if (pcm_val < 0) {
        pcm_val = -pcm_val;
        mask = 0x7F;
    } else {
        mask = 0xFF;
    }
        if ( pcm_val > CLIP ) pcm_val = CLIP;       /* clip the magnitude 削波*/
    pcm_val += (BIAS >> 2);
 
    /* Convert the scaled magnitude to segment number. */
    seg = search(pcm_val, seg_uend, 8);
 
    /*
     * Combine the sign, segment, quantization bits;
     * and complement the code word.
     */
    if (seg >= 8)       /* out of range, return maximum value. */
        return (0x7F ^ mask);
    else {
        uval = (seg << 4) | ((pcm_val >> (seg + 1)) & 0xF);
        return (uval ^ mask);
    }
 
}
 
int ulaw2linear( int    u_val)
{
    int t;
 
    /* Complement to obtain normal u-law value. */
    u_val = ~u_val;
 
    /*
     * Extract and bias the quantization bits. Then
     * shift up by the segment number and subtract out the bias.
     */
    t = ((u_val & QUANT_MASK) << 3) + BIAS;
    t <<= (u_val & SEG_MASK) >> SEG_SHIFT;
 
    return ((u_val & SIGN_BIT) ? (BIAS - t) : (t - BIAS));
}

3.2 A-law和u-law對比

A-law和u-law畫在同一個坐標軸中就能發現A-law在低強度信號下,精度要稍微高一些。


image

實際應用中,我們確實可以用浮點數計算的方式把F(x)結果計算出來,然后進行量化,但是這樣一來計算量會比較大,實際上對于A-law(A=87.6時),是采用13折線近似的方式來計算的,而μ-law(μ=255時)則是15段折線近似的方式。

4. 總結

G711盡管是一種非常古老的話音編碼算法,原理和計算也比較簡單,但是其中用到的一些基本原理同樣在其他編碼算法中得到了應用,對其進行深入的了解有助于更好的理解其他的算法。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。