? ? 今天群里進了一批人,有一位在群里提出了疑問,"現在H.264 H.265都已經是行業的標準,視頻編解碼算法還有什么值得做的事情么?".其實這個問題我一直都在思考中,也引領著我的職業方面的規劃。我答應過他,說今天晚上說說我的想法,分享一下我個人對未來音視頻領域的展望。
? ? 首先我先來一個總結。從我從業的10來年的it行業,其中音視頻行業占了大頭,大概8年的時間在這個領域深耕積累。音視頻行業也從軟到強,從粗到細。音視頻也逐步的應用于各個行業,以安防,視訊行業為最,尤其最近幾年興起的直播熱潮,又將app的直播推到的風投上。 對音視頻各個指標的要求,迅速的拉大資源跟需求的矛盾。十年前,基本上不用考慮的計算能力到現在對計算能力的極度要求。對畫面的質量的要求也變得高起來,對時延關注比之前任何時候都嚴,豐富的終端系統,豐富的網絡環境,豐富的業務需求對音視頻有提出挑戰。
? ? 其實總體上而言,音視頻的需求如下:較高的壓縮比,較高的畫面聲音質量,較低的延遲,較小的系統資源的要求,更加靈活的適應網絡終端的環境能力。自從h264標準發布之后,基本上都在這個上面有考慮。而hevc也是以h264的基礎上面加以擴展,極少有全新的創新。因此個人認為h264的視頻框架將一直的使用,應該不會有太大的改變。以后的視頻領域將超高清化,智能化。音視頻將一個整體的解決方案的方式來提供。這個解決方案包括音視頻前端,音視頻編解碼,媒體存儲轉發功能,音視頻后處理。音視頻渲染。每一個步驟都可以用一個適配軟件來組成,因為它是跨越系統多個層次,多個方面。通過這個適配軟件,我們將提供給上層一致完備的服務接口。
? ? ? 第1方面,隨著視覺科學以及聽覺科學的發展,將逐步的改變一下細節方面,比如他們的量化參數。他們的視覺冗余以及對錯誤屏蔽效果能力應用。
? ? 第2方面,數學方面在音視頻編解碼方面的應用。尤其是小波理論在局部有效性對音視頻的分級有很大的利好。線性代數跟概率這這個方面也將大有可為。
? ?第3個方面應該是gpu以及多核方面的應用。由于計算能力超越當前的計算容量,而且采用全新的工程方法來滿足需求。
? ?第4個方面軟件組件架構的發展。比如d3d與ddraw,opengl跟vunkan。通過對比。大家都支持上層的開發人員要越來越要感知底層的水平。也就是說整個軟件系統將打破各個邊界,聰本身的高內聚變成了高耦合。
其實我們渴望總希望一套解決方案可以完美的解決所有的需求。可惜的是,音視頻行業至今沒有一套如此沒有的解決方案。如今我們通過對業務的分析,來加權音視頻各個的需求點。從而找到合理的平衡點。。相信之后的一段時間內,以業務為主的音視頻的需求分析還占主導角色吧,個人覺得。暫時到這里吧。歇筆先。