使用AVAsset轉換音頻格式

關鍵詞


AVAsset MP3 PCM 格式 音頻 采樣 AVAssetReader AVAssetWriter 輸出 轉換

本文所有示例代碼或Demo可以在此獲取:https://github.com/WillieWangWei/SampleCode_MP3ToPCM

如果本文對你有所幫助,請給個Star??

概述


本文僅講解所用技術的基本概念以及將MP3轉成PCM格式的實際應用,其他格式的相互轉換可以修改示例代碼實現。關于AVAsset的其他使用場景可以參考這里,音頻相關的內容可以參考這里

首先了解一些概念:

AVAsset

它包含于AVFoundation,是一個不可變的抽象類,用來代表一個音視頻媒體。一個AVAsset實例可能包含著一個或多個用來播放或處理的軌道,包含但不限于音頻、視頻、文本以及相關說明。但它并不是媒體資源本身,可以將它理解為時基媒體的容器。

AVAssetReader

我們可以使用一個AVAssetReader實例從一個AVAsset的實例中獲取媒體數據。

AVAssetReaderAudioMixOutput

它是AVAssetReaderOutput的一個子類,我們可以將一個AVAssetReaderAudioMixOutput的實例綁定到一個AVAssetReader實例上,從而得到這個AVAssetReader實例的asset的音頻采樣數據。

AVAssetWriter

我們可以使用一個AVAssetWriter實例將媒體數據寫入一個新的文件,并為其指定類型。

AVAssetWriterInput

我們可以將一個AVAssetWriterInput的實例綁定到一個AVAssetWriter實例上,從而將媒體采樣包裝成CMSampleBuffer對象或者元數據集合,然后添加到輸出文件的單一通道上。

PCM

模擬音頻信號經模數轉換(A/D變換)直接形成的二進制序列,PCM就是錄制聲音時保存的最原始的聲音數據格式。
WAV格式的音頻其實就是給PCM數據流加上一段header數據。而WAV格式有時候之所以被稱為無損格式,就是因為它保存的是原始PCM數據(也跟采樣率比特率有關)。常見音頻格式比如MP3AAC等等,為了節約占用空間都進行有損壓縮。

代碼


這里列舉兩種應用場景:

  1. PCM數據寫入磁盤保存成文件。
  2. PCM數據轉成NSDate保存在內存中。

這兩種場景都需要先讀取MP3的數據,然后創建AVAssetReaderAVAssetReaderAudioMixOutput實例,所以前半部分的處理邏輯的一樣的。

通用邏輯

0.導入頭文件

import AVFoundation

1.創建AVAsset實例

func readMp3File() -> AVAsset? {
    
    guard let filePath = Bundle.main.path(forResource: "trust you", ofType: "mp3") else { return nil }
    let fileURL = URL(fileURLWithPath: filePath)
    let asset = AVAsset(url: fileURL)
    
    return asset
}

2.創建AVAssetReader實例

func initAssetReader(asset: AVAsset) -> AVAssetReader? {
    
    let assetReader: AVAssetReader
    
    do {
        assetReader = try AVAssetReader(asset: asset)
        
    } catch {
        
        print(error)
        return nil
    }
    
    return assetReader
}

3.配置轉碼參數

var channelLayout = AudioChannelLayout()
memset(&channelLayout, 0, MemoryLayout<AudioChannelLayout>.size)
channelLayout.mChannelLayoutTag = kAudioChannelLayoutTag_Stereo

let outputSettings = [
    AVFormatIDKey : kAudioFormatLinearPCM,    // 音頻格式
    AVSampleRateKey : 44100.0,    // 采樣率
    AVNumberOfChannelsKey : 2,    // 通道數 1 || 2
    AVChannelLayoutKey : Data.init(bytes: &channelLayout, count: MemoryLayout<AudioChannelLayout>.size),  // 聲音效果(立體聲)
    AVLinearPCMBitDepthKey : 16,  // 音頻的每個樣點的位數
    AVLinearPCMIsNonInterleaved : false,  // 音頻采樣是否非交錯
    AVLinearPCMIsFloatKey : false,    // 采樣信號是否浮點數
    AVLinearPCMIsBigEndianKey : false // 音頻采用高位優先的記錄格式
    ] as [String : Any]

4.創建AVAssetReaderAudioMixOutput實例并綁定到assetReader上

let readerAudioMixOutput = AVAssetReaderAudioMixOutput(audioTracks: asset.tracks, audioSettings: nil)

if !assetReader.canAdd(readerAudioMixOutput) {
    
    print("can't add readerAudioMixOutput")
    return
}

assetReader.add(readerAudioMixOutput)

接來下兩種場景的處理邏輯就不一樣了,請注意區分。

保存成文件

5.創建一個AVAssetWriter實例

func initAssetWriter() -> AVAssetWriter? {
    
    let assetWriter: AVAssetWriter
    guard let outPutPath = NSSearchPathForDirectoriesInDomains(.documentDirectory, .userDomainMask, true).first else { return nil }

    // 這里的擴展名'.wav'只是標記了文件的打開方式,實際的編碼封裝格式由assetWriter的fileType決定
    let fullPath = outPutPath + "outPut.wav"
    let outPutURL = URL(fileURLWithPath: fullPath)
    
    do {
        assetWriter = try AVAssetWriter(outputURL: outPutURL, fileType: AVFileTypeWAVE)
    } catch {
        
        print(error)
        return nil
    }
    
    return assetWriter
}

6.創建AVAssetWriterInput實例并綁定到assetWriter上

if !assetWriter.canApply(outputSettings: outputSettings, forMediaType: AVMediaTypeAudio) {
    
    print("can't apply outputSettings")
    return
}

let writerInput = AVAssetWriterInput(mediaType: AVMediaTypeAudio, outputSettings: outputSettings)

// 是否讓媒體數據保持實時。在此不需要開啟
writerInput.expectsMediaDataInRealTime = false

if !assetWriter.canAdd(writerInput) {
    
    print("can't add writerInput")
    return
}

assetWriter.add(writerInput)

7.啟動轉碼

assetReader.startReading()
assetWriter.startWriting()

// 開啟session
guard let track = asset.tracks.first else { return }
let startTime = CMTime(seconds: 0, preferredTimescale: track.naturalTimeScale)
assetWriter.startSession(atSourceTime: startTime)

let mediaInputQueue = DispatchQueue(label: "mediaInputQueue")
writerInput.requestMediaDataWhenReady(on: mediaInputQueue, using: {
    
    while writerInput.isReadyForMoreMediaData {
        
        if let nextBuffer = readerAudioMixOutput.copyNextSampleBuffer() {
            writerInput.append(nextBuffer)
            
        } else {
            
            writerInput.markAsFinished()
            assetReader.cancelReading()
            assetWriter.finishWriting(completionHandler: {
                print("write complete")
            })
            break
        }
    }
})
轉成NSDate

5.啟動轉碼

assetReader.startReading()
var PCMData = Data()

while let nextBuffer = readerAudioMixOutput.copyNextSampleBuffer() {
    
    var audioBufferList = AudioBufferList()
    var blockBuffer: CMBlockBuffer?
    
    // CMSampleBuffer 轉 Data
    CMSampleBufferGetAudioBufferListWithRetainedBlockBuffer(nextBuffer,
                                                            nil,
                                                            &audioBufferList,
                                                            MemoryLayout<AudioBufferList>.size,
                                                            nil,
                                                            nil,
                                                            0,
                                                            &blockBuffer)
    
    let audioBuffer = audioBufferList.mBuffers
    guard let frame = audioBuffer.mData else { continue }
    
    PCMData.append(frame.assumingMemoryBound(to: UInt8.self), count: Int(audioBuffer.mDataByteSize))
    blockBuffer = nil
}

print("write complete")

注意問題


性能問題

轉碼是個很占用CPU資源的計算過程。
具體完成一個轉碼過程的時間取決于文件時長、轉碼配置、設備性能等多個條件。這是一個典型的耗時操作,務必要做好線程優化。另外,可以根據業務邏輯間歇調用readerAudioMixOutput.copyNextSampleBuffer()及后續操作,降低CPU開銷峰值。

內存管理

以本文將MP3轉成PCM的代碼為例,一個時長4分半左右的MP3對應的PCM數據在55MB左右,這些數據占用了大量的內存或磁盤空間,注意釋放。你可以通過改變轉碼配置參數outputSettings來調整輸出數據的大小。
在轉碼過程中,CMSampleBufferRefCMBlockBufferRef的對象在使用后需要調用CFRelease銷毀,以防內存泄漏。

其他格式的轉換

邏輯是一樣的,你可以修改讀取和輸出的參數實現。注意處理的格式必須是AVFoundation所包含的,可以參考AudioFormatID這個類以及AVMediaFormat.hFile format UTIs。更多音頻處理請參考Apple Developer Library :AVFoundation或第三方框架。

在macOS上轉換格式

macOS上可以使用一個強大的音視頻庫FFmpeg,它可以幫助你快速轉碼出需要的音頻格式作為調試素材。
macOS上編譯FFmpeg請看這里
MP3轉換成PCM的命令:

ffmpeg mp3 => pcm    ffmpeg -i xxx.mp3 -f s16le -ar 44100 -ac 2  xxx.pcm

總結


本文提供了將MP3轉成PCM的一種實現,中間涉及了一些音頻AVFoundationCoreMedia的知識,這里就不展開了,有問題的同學可以在文章下留言討論。

本文所有示例代碼或Demo可以在此獲取:https://github.com/WillieWangWei/SampleCode_MP3ToPCM

如果本文對你有所幫助,請給個Star??

參考資料:
Apple Developer Library :AVFoundation
http://msching.github.io/blog/2014/07/07/audio-in-ios/

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,501評論 6 544
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,673評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,610評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,939評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,668評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 56,004評論 1 329
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,001評論 3 449
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,173評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,705評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,426評論 3 359
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,656評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,139評論 5 364
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,833評論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,247評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,580評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,371評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,621評論 2 380

推薦閱讀更多精彩內容