對于當前的智能手機,SoC的重要性不言而喻。作為當前安卓陣營中最先進的平臺,驍龍835在目前已經推出的旗艦機上有著:快且不熱的優(yōu)秀體驗。從許多媒體的評價來看,驍龍835平臺可以稱得上近幾年綜合體驗最為出色的一款處理器。因此,我們本期的機情觀察室,就來看看驍龍835的深度性能究竟處于怎樣的水平。
在驍龍835之前,驍龍?zhí)幚砥鞫急环Q為SoC(系統(tǒng)級芯片),而到了這一代則改名為“Platform”(平臺),其用意在于高通對于移動計算平臺的整個布局,而非單獨的CPU、GPU等電器元件。驍龍835采用三星10nm FinFETLPE工藝,當前半導體工藝能達到量產的最高水準,不過此次采用的是LPE工藝,不排除高通會在后續(xù)升級一個LPP工藝的版本,類似驍龍820/821一樣。另外,根據高通官方的說法,驍龍835上采用30億顆晶體管,逼近iPhone7上采用的A10 Fusion 33億的數量,這也是高通處理器距離iPhone自主設計的A系列最近的一次。因此也帶來了良好的使用體驗。
通過這個表格,我們可以看到驍龍835采用Kryo280架構,八核心設計,最高主頻為2.45GHz,小核為1.9GHz,GPU為Adreno 540,主頻為710GHz,整個芯片封裝尺寸減小35%。而根據高通公司的數據,驍龍835功耗降低了25%(比驍龍801降低了50%)。此外,在驍龍835平臺中,還集成了雙14位Spectra 180 ISP、Hexagon 690 DSP、X16 Modem??梢钥吹?,相比于其它家的SoC,高通在SoC上覆蓋到更多的計算區(qū)域,將處理器打造成智能手機的全面管家,通過“人無我有、人有我優(yōu)”的概念,全面進駐到各區(qū)域。在筆者看來,這也是高通在這一代將移動處理器改名為“平臺”的原因。
CPU性能測試:
在驍龍820上,高通首次打造出64位自研的Kryo架構,其獨特的架構對于浮點IPC的運算有著非常不錯的性能,但在整數IPC的運算方面則還不如ARM官方的A57架構,并且在功耗方面也并不夠優(yōu)秀。因此高通在驍龍835上采用全新的Kryo 280架構,盡管同名為Kryo,但此“Kryo非彼Kryo”,Kryo280并非常規(guī)升級的產物,而是采用全新架構。
簡單來說,Kryo280采用八核心類似BigLittle架構,采用四顆性能大核+四顆效率小核,不過Kryo280最具特色的,還是其成為第一個采用ARM新架構之上重新設計的架構,“Built on ARM Cortex Technology”這項技術允許供應商重新根據自己的需求修改公版架構,比如廠商可以應自己需求去定制指令窗口大小以增加IPC,但類似解碼器寬度或者是執(zhí)行管道這種則超出了修改范圍。這種半定制設計可以使得廠商能夠將自己的產品與ARM公版區(qū)別開來,同時也可以省去重新開發(fā)的架構所需的時間和費用。盡管我們并不知道高通的Kryo280是基于哪個公版進行的修改,但兩個CPU集群確實都是采用了半定制設計。并且高通宣稱,其內存控制器也是自己設計的。
在GeekBench4的單線程整數跑分測試中,可以看到驍龍835相比前代的821基本上是六四開的贏面。盡管在整數IPC方面有所長進,但在Canny(邊緣檢測)、JPGE、PDF渲染方面均輸給了821,有趣的是,在之前我們麒麟960的性能測試中,也是這幾項輸給了驍龍821,而這些整數測試的成績大多依靠L1、L2緩存,因此ANANDTECH推測,可能Kryo280就是基于ARM A73公版半定制化。另外,驍龍835在GeekBench4其它子項目的成績都與麒麟960比較接近,這也并非是主頻或測試方法可以干預的。因此說明,即便通過BoC修改的半定制架構,可修改的幅度也比較有限。
而在GeekBench4單線程整數運算(加入頻率)測試中,用上表整體整數除以頻率,可以更直接的比較不同架構間的IPC??梢钥吹?,Kryo280與A73架構成績還是比較接近,其整數IPC比A72高出6%,比A57高出14%,不過與驍龍821相比,則高出22%。
而在浮點運算中,令我們非常意外的是Kryo280的竟然全面落后驍龍821。按筆者的猜測,Kryo的浮點運算一直是其強項,而到了Kryo280,并沒有采用全自主設計,而BoC可改動的幅度又小,因此才出現了這種情況。不過可以看到,Kryo280與麒麟960的A73成績比較相當。
在之前麒麟960測試A73時,考慮到A73的NEON執(zhí)行單元與A72相比并沒有改變,而降低了特殊指令的延遲,當時猜測有些測試項目受到A73解碼器寬度的變化。因此,麒麟960的A73與驍龍835的Kryo280都顯示出了相比A72減少了L2緩存的讀/寫帶寬(以及較低的L1寫入帶寬),這也可能對性能造成影響。
而將頻率計算進去,Kryo280則悲劇的敗給驍龍821 23%,不知道高通究竟是因為妥協(xié)的結果還是自己設計思路上的改變。兩年前高通在研發(fā)Kryo時,就考慮到未來的新工作所需的變化,因此將更多的工作由GPU或DSP來提高效率,因此也可以接受犧牲一些浮點運算來節(jié)省面積或功耗。
內存測試方面,Kryo280、A73、A72和A57內核都有2個地址生成單元(AGU),但A72和A57可以使用專門的AGU進行加載和儲存操作,Kryo280和A73的每個AGU都進行加載和儲存同時進行。因此,對于A73架構,這樣的策略相當于減少了內存延遲,并且增加內存帶寬。
而對于Kryo280來說,相比麒麟960還甚至增加了11%,對比驍龍821和810都有所增加。但并沒有A72到A73升級幅度大,因為在驍龍821的Kryo中,就已經可以做到單個AGU同時進行加載和儲存,只不過之前的內存延遲更高而已。
系統(tǒng)性能測試:
▲總分
直到目前,我們可以初步認為驍龍835的Kryo280相當于一個BigLittle組合的半定制A53+A73 CPU內核,其整數與浮點運算都接近于麒麟960.而像PCMark這樣系統(tǒng)級的測試,其中就包括了調用安卓標準的API接口來強調CPU、GPU、RAM以及NAND儲存的實際工作負載。但我們都知道,手機系統(tǒng)的體驗不僅僅取決于硬件性能,還取決于廠家對其系統(tǒng)的優(yōu)化,包括程序的優(yōu)先級以及動態(tài)電壓頻率調整的策略,以控制手機的發(fā)熱等問題。不過這并不妨礙我們看到驍龍835的原型測試機在PCMark排名第一,超越了Mate9的麒麟960,并且比驍龍821還領先了23%。
▲網頁測試
網頁測試,驍龍835的原型機表現良好,超過Mate9 10%,并且超過驍龍821 34%。不過尷尬的是采用驍龍820/821的機器全部落后于麒麟960、麒麟950,看起來還是有些悲劇。
▲寫入測試
在寫入操作時(包括對PDF文件的處理和加密),內存測試以及將文件讀取和寫入閃存時,會在CPU的大核上有所要求。因此這個測試會產生一些多變的結果。比如樂Pro3會比S7 Edge快40%,而驍龍835則與Mate9之間差異很小,不過對比驍龍821的產品,還是體現出吊打級的優(yōu)勢。
▲數據操作
數據操作測試中,主要測試的是整數工作負載,用于測量從多種不同文件類型中分析數據所需的時間,然后與動圖表交互記錄幀率。驍龍835的原型機與Mate9在此相差無幾,不過也是唯二沖上5000分的,對其它821的機器又是一頓吊打。。。
▲視頻編輯測試
視頻編輯測試:采用OpenGL ES 2.0著色器提供視頻效果進行視頻編輯測試,對系統(tǒng)來說屬于比較輕量級的測試。在測試中,我們發(fā)現GPU基本處于空閑狀態(tài),大多數情況下都由CPU的小核心完成。因此可以看到,基本上每款產品的成績都差不多。
▲照片編輯測試
照片編輯測試則是采用多種照片的效果和濾鏡來測試CPU和GPU,由于Adreno GPU上強大的ALU性能,驍龍835和驍龍820/821則位居前列。Adreno 540又一次吊打了Mali T系列和G71。
在Kraken 1.1測試中(使用Chrome、Safari、IE),iPhone表現最好,不過這也并不足以證明蘋果A系列芯片與安卓其它SoC之間的差異,因為它們分別采用不同的瀏覽器。而iPhone性能優(yōu)勢很大一部分來自Safari的JavaScrip引擎。
而驍龍835的原型機與其它使用Chrome的手機相比,在Kraken測試中與驍龍821的產品并沒有太大差別,在JetSteam中與Mate9相近,而在WebXPRT 2015測試中,則大幅度領先驍龍820/821的產品。
GPU性能測試:
GPU方面,此次驍龍835采用Adreno 540,與之前驍龍821的Adreno 530架構基本相同,并且對ALU以及文件寄存器進行了一些優(yōu)化,并且通過改進深度過濾器來減少每個像素的工作量,進一步提高性能和降低功耗。為此,高通官方宣稱Adreno 540的3D渲染相比530提高25%,GPU的主頻峰值也達到710MHz,相比Adreno 530提升了14%。
GFXBench的霸王龍測試是一款基于OpenGL ES 2.0的游戲模擬測試,我們看到驍龍835的原型機與iPhone7 Plus、Mate9都達到60幀的成績,不過Mate9與iPhone7 Plus都為1080P屏幕,而驍龍835的原型機則是第一款達到這樣成績的2K分辨率的產品。
而在離屏(固定以1080P分辨率渲染)測試中,驍龍835的性能則超過了iPhone7 Plus與Mate 9,甚至比驍龍820提升了25%,與高通官方宣稱的一致。
在GFXBench的高性能Car chase測試模擬了現代渲染管道,其中包含OpenGL ES 3.1以及安卓擴展包,主要是考驗ALU性能。在這一測試中,驍龍835吃了分辨率的虧,成績落后于一加3T以及Mate9。而當離屏狀態(tài)下,則重回第一。一般來說,廠商的PPT多少都有些夸大的意味,而在GPU部分,高通則確實做到了他們PPT中所承諾的提升,甚至在離屏測試中比Mate9的Mali G71 mp8還要強大。而Mali G71則是基于ARM最新的Bifrost架構,主頻甚至到了960MHz至1037MHz。
在3DMark中Sling Shot Extreme測試中,采用安卓上的OpenGL ES 3.1或iOS上的Metal,通過2K分辨率來進行渲染來強調GPU和內存的性能。在于A10、Exynos 8890,麒麟960以及驍龍820,幾乎當前所有頂尖處理器在一起評比,因此驍龍835在總分測試中排名第一、圖形測試中iPhone 7 Plus高10%,比820和8890版的S7高了24%,這樣的成績還是非常有意義的。
在第二個測試中強調了GPU著色器的性能,因此我們可以看到Adreno 540有了明顯的提升,相比Adreno 530的S7提升34%,超過了Mate 9的G71 50%,高通在ALU以及文件寄存器上的提升看到了效果。物理測試主要是在CPU上運行,并且受SoC內存管理器隨機訪問的嚴重影響,因此盡管CPU表現接近,但驍龍835還是比Mate9快了14%。而或許是由于驍龍835的內存管理比麒麟960的內存延遲更低而帶寬更寬。
Basemark ES 3.1測試模擬了安卓OpenGL ES 3.1和iOS上的Metal,包括了許多后期處理、粒子和照明效果,但不像GFXBench 4.0 Car Chase測試中的計算。
在Vulkan被加入到基準測試中之前,安卓設備大多依賴OpenGL,使得對比運行Metal的圖形API的iPhone處于很大的劣勢。使得驍龍835比iPhone7 Plus落后73%。而在Basemark ES 3.1測試中,ARM的Mali GPU居然超過了Adreno,Exynos 8890的Mali-T880 MP12比驍龍820的Adreno 530快15%,而麒麟960的Mali-G71MP8在屏幕測試中比S835的Adreno 540快25%。而驍龍835則比Pixel XL提升了40%。
所有的游戲模擬測試,都展現出Adreno 540優(yōu)秀的ALU性能。因此我們測試驍龍835在GFXBench中合成的ALU測試,不過奇怪的是提升的微架構相比820并沒有多少用。在表格中,驍龍835相比于驍龍820/821的提升都與主頻對應。
功耗測試:
功耗方面,通過測試驍龍820以及驍龍835兩款原型機,驍龍820的平均功耗為4.6W,而驍龍835則降至3.56W,功耗降低了23%。不過在實際使用中,不同用戶有不同的使用場景,因此這個結論暫時也只能當做參考。
總結:
如今的手機SoC包含了CPU、GPU、高性能DSP、低功率DSP、ISP、Modem、固定功能模塊(音頻、視頻解碼),在這么多電器元件中,CPU,GPU和內存性能這些都很容易測試。但能導致SoC設計中有較大差異的部分,比如DSP,ISP和其他方面的測試則并不容易,而恰好,這些則是高通的強項。
在測試中,我們猜測驍龍835的Kryo280架構可以看成一個A53+A73的半定制架構,Kryo280的大核的整數與浮點IPC與麒麟960中的A73非常接近,而與驍龍821相比之下,整數運算有了明顯提升,浮點運算則全面落后,但總體來說,進步大于落后。在測試中,毫無疑問,相比驍龍821,驍龍835有著更好的體驗。盡管測試數據都是基于高通原型機,而在筆者實際體驗量產版的驍龍835(小米6)一段時間后,感覺高通驍龍835確實有著不錯的使用體驗:穩(wěn)定流暢且不熱。而給筆者最大的感覺則是相比于驍龍820,驍龍835幾乎能有“看得見般”體驗的提升。對于當前性能逐漸“擠牙膏”的智能手機,此次驍龍835確實表現非常不錯。