聯系浦光
廣州市荔灣區浣花路109號東鵬德寶大廈8068室
電話:020-81600100
公司動態
揭秘華為麒麟 970:性能升級是其次,人工智能才是絕招
2017-09-04 16:10:06

來源:極客公園

1.jpg 

  華為消費者業務 CEO 余承東在德國的 IFA 電子展的官方論壇上做了主題演講,正式發布了華為的新一代移動計算芯片——麒麟 970。

  作為一款為手機設計的系統級芯片(System On Chip,即 SoC),麒麟 970 包含了所有同類產品該有的部件,比如 CPU、GPU、ISP、DSP、通訊基帶,但麒麟 970 又多了一個所有同類產品都沒有的東西——一顆為人工智能運算專門設計的 NPU。

  下面我們就 SoC 的各個部件出發,全面地了解一下麒麟 970。

  CPU、GPU:重點是降功耗

  如果你是一個非??粗厥只?SoC 的 CPU、GPU 極限表現的‘性能黨’,麒麟 970 可能不會讓你太興奮。

  CPU 方面,麒麟 970 的參數相比麒麟 960 基本沒有任何變化,依然是 8 顆核心,其中 4 顆為高性能的 ARM 公版 A73 架構,最高主頻 2.4GHz(麒麟 960 是 2.36GHz),4 顆位低功耗的 ARM 公版 A53 架構,最高主頻 1.8GHz(麒麟 960 是 1.84GHz)。

  有些遺憾的是,麒麟 970 并沒有用上 ARM 在今年 5 月發布的新一代 Cortex-A75、Cortex-A55 架構以及為 AI 相關運算優化的 DynamiIQ 設計(麒麟 970 選擇了另一種方法來提高 AI 運算)。當然了,考慮到 A75 和 A55 的發布時間、設計的復雜程度,麒麟 970 沒用上也是可以理解的。

2.jpg 

  在發布會上,余承東并沒有透露麒麟 970 的 CPU 性能相比 960 的變化,只是表示麒麟 970 的能耗比提升了 20%(主要得益于全新的 10 納米制程)。至于實際的性能表現,不出意外的話,麒麟 970 應該和麒麟 960 處于同一段位,不會有非常明顯的提升。

  當然,橫向來看的話,麒麟 970 的 CPU 性能沒提升其實不是什么大問題。從 GeekBench 4 等跑分軟件的得分上看,麒麟 960 的分數和高通驍龍 835、三星 Exynos 8895 基本處于同一水準,明顯強于聯發科 Helio X30。因此,即使麒麟 970 的 CPU 性能不變,也依然是 Android 陣營里移動 SoC 的頂級水準,只是不再像麒麟 960 發布時那么領先。

  相比起 CPU 上的保守,麒麟 970 在 GPU 上的‘誠意’要顯得更足一些。

  首先,麒麟 970 則用上了 ARM 在今年 5 月剛剛發布的 Mali-G72 架構,理論性能相比麒麟 960 上的 Mali-G71 有所提升(ARM 的官方說法是相比 G71 性能提高 20%,功耗比提升 25%)。此外,在核心數上,麒麟 970 的 GPU 也從麒麟 960 的 8 核增加到了 12 核。

3.jpg 

  實際性能上,余承東表示,相比起麒麟 960,麒麟 970 的性能有 20% 的提升,并且能效比提升了 50%。

  照理說,由于麒麟 970 的 GPU 核心架構比麒麟 960 更先進,核心數還多了 50%,并且制程更先進,GPU 性能提升的幅度應該遠不止 20%。之所以出現這種情況,很可能是華為將麒麟 970 的 GPU 主頻壓得比較低,從而更好地降低功耗(于是就有了提升幅度高達 50% 的能效比)。不出意外,麒麟 960 上出現的 GPU‘滿血跑’時功耗感人的情況,麒麟 970 上不會再出現。

  通訊基帶:比‘千兆 LTE’更快

  作為一家通訊行業有著多年積累的公司,華為海思在通訊基帶上有著深厚的‘家底’,特別是去年的麒麟 960,直接在 SoC 中集成了支持 LTE Cat.12/13 的 Balong 750 基帶(最大下行速度 600Mbps,上行 150Mbps),并且支持 CDMA 網絡,絲毫不遜色同期的高通驍龍 820、821。

4.jpg 

  在今年的麒麟 970 上,華為海思更進一步,直接大跨步到了 LTE Cat.18,最高下載速度飆到了 1.2Gbps(4x4 MIMO,3CC CA,256QAM),也就是比之前業界最快、驍龍 835 和 Exynos 8895‘千兆 LTE’還要再快上 200Mbps。

5.jpg 

  麒麟 970 還終于支持了在同時使用兩張 SIM 卡時,主副卡同時用 4G(上一代麒麟 960 的副卡只能支持 3G)。此外,麒麟 970 還特別針對高鐵時的使用做了優化,信號更穩定,減少掉線。

  不過話還是要說回來,雖然麒麟 970 的通訊基帶的確是厲害,但和驍龍 835、Exynos 8895 等支持千兆 LTE 的 SoC 一樣,普通用戶想要真正體驗到這種超高速 LTE 網絡,還得過上相當一段時間。

  一方面,超高速 LTE 網絡需要運營商的支持,雖然目前全球不少運營商(包括中國聯通)已經開始了千兆級 LTE 的測試,但距離大規模商用還仍需時日。另一方面,在手機端,除了需要 SoC 自身的基帶支持,如果要支持千兆級的 LTE,手機廠商還必須在手機的天線設計上投入額外的精力,以搭載驍龍 835 的手機為例,在目前上市的眾多驍龍 835 手機中,真正能支持到千兆 LTE 的只有三星 Galaxy S8、HTC U11 等少數國際品牌機型的部分型號。

  ISP、DSP、Codec、協處理器

  ISP 的全稱是 Image Signal Processor(圖像信號處理器),主要功能是處理相機傳感器中收集到的數據。

6.jpg 

  麒麟 970 的 ISP 主要是一些‘常規升級’,依然是雙核設計,擁有更快的速度,更快地對焦,更優秀的降噪效果,并且對運動圖像的捕捉做了優化。不過相比起單純的 ISP 升級,NPU 對相機體驗的提升可能會更大(下文會詳說)。

7.jpg 

  在 DSP、配套 Codec 等方面,麒麟 970 也有所提升,其中配套的音頻 Codec 可以支持 32bit/384k 的音頻解碼,過去幾代華為高端機(Mate、P 系列)上表現乏善可陳的內放音質,有望在麒麟 970 這代產品上獲得明顯的提升,當然前提是 Mate 10 和 P11 系列還能保留 3.5 毫米耳機插孔。

  另外,麒麟 970 依然搭載了 i7 協處理器(和牙膏廠的 i7 沒啥關系),而 inSE(integrated secure element)和 TEE 安全引擎,在麒麟 970 上也都在。

  在總線架構上,不出意外的話,麒麟 970 采用的應該是和 960 相同的 CCI-550。

  10 納米制程,比驍龍 835 還多的 55 億個晶體管

  制程上,不出意外,麒麟 970 用上了臺積電(TSMC)最新的 10 納米工藝,這應該是繼蘋果 A10X、聯發科 Helio X30 之后,第三款采用臺積電 10 納米制程的移動 SoC。

  通常來說,在芯片晶體管數量相同的情況下,更先進的制程可以降低芯片的核心面積,有助于降低成本,并且更加有效地控制發熱和功耗。

8.jpg 

  在發布會上,余承東也表示,臺積電的 10 納米制程可以降低 20% 的能耗,將芯片核心面積縮小 40%。

  不過有趣的是,麒麟 970 的核心面積并沒有因為制程的進步而縮小,反而比麒麟 960 還要略大,這是因為麒麟 970 集成了高達 55 億個晶體管,比麒麟 960 多出了 15 億。

  55 億個晶體管是什么概念呢?大家可以參考幾個數字。

  Intel 在 2014 年發布的擁有 18 個核心的至強 E5 CPU,也才內置了 55.6 億個晶體管。在更具對比價值的移動 SoC 中,以‘堆料’著稱的蘋果 A10 擁有 33 億個晶體管,高通驍龍 835 擁有 31 億個。

  需要說明的是,雖然晶體管數量對性能有一定的影響,并且通常是越多越好,但在芯片工藝、架構不同的情況下,我們是無法簡單地用晶體管數量來判斷性能的,尤其是在內部部件眾多的移動 SoC 中。

  NPU:首款內置在手機 SoC 中的人工智能芯片

  終于到了麒麟 970 最特別的部分——NPU。

  NPU 的全稱是 Neural-network Processing Unit,也就是神經網絡處理單元。關于這顆 NPU 的功能,大家可以簡單理解為專門高效地進行 AI 相關計算定制的處理器,就像 GPU 之于圖形處理相關的計算,ISP 之于成像相關的計算。

  傳統的 CPU(包括 x86 和 ARM)和 GPU 也是可以用來做深度學習計算的,但由于它們本身并不是專門為深度學習定制的,效率并不高。而麒麟 970 的這顆 NPU 采用了來自寒武紀(Cambricon)的 IP,專門為深度學習而定制,FP16 性能達到了 1.92 TFLOP,差不多是麒麟 960 的 3 倍(0.6 TFLOP 左右)。

  在發布會上,余承東展示了一張在進行 AI 運算時,NPU 和 CPU、GPU 的對比。

9.jpg 

  可以看到,性能上,NPU 是 CPU 的 25 倍,GPU 的 6.25 倍(25/4),能效比上,NPU 更是達到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。

  另外,在華為內部的測試中,麒麟 970 的 NPU 每分鐘可以識別出 2005 張照片,而不使用 NPU 的話則每分鐘只能識別 97 張(這個速度應該是用 CPU 進行計算的),優勢同樣巨大。

  至于這顆 NPU 具體能實現哪些特別的功能,我們還需要等到 Mate 10、Mate 10 Pro 上來揭曉。在發布會上,余承東提到了一些 NPU 在拍照方面的應用。

10.jpg 

  具體到拍照中,NPU 可以幫助手機更精準和快速地識別拍攝場景,讓手機選擇最合適的圖像處理算法,在雙攝背景虛化時,讓手機對邊緣虛化的處理更準確,還有最近很火的 AR 相機,NPU 可顯著提高渲染的速度,降低功耗。

  再比如說,有了 NPU 之后,手機可以將語音和語義識別的部分工作轉移到手機本地,提高語音和語義識別的表現,提高手機中語音交互應用(比如語音輸入法、智能語音助手)的體驗。

11.jpg 

  值得一體的是,在發布會上,余承東還展示了‘開放移動 AI 平臺(Open Mobile AI Platform)’,為 app 開發者提供了包括開發者網站和社區支持、開發套件以及自家的 app 分發商店在內的‘全套’服務,吸引開發者開發可以調用 NPU 性能的 app。

  不過這里有個問題,這一套方案只是針對搭載麒麟 970 的華為手機的,并不是一個開放的平臺,這意味著開發者即使寫出來能調用 NPU 來實現某些強大功能的 app,也只能運行在僅有的幾款華為手機上(短期內應該只有即將發布的 Mate 10 和 Mate 10 Pro)。

  至于未來華為能吸引多少開發者來利用 NPU 開發支持自家 AI 平臺的 app,現在來看還是個未知數,但至少在接下來的幾個月內,恐怕更多地需要依靠華為自己的軟件工程師來開發相應的 app。

  當手機 SoC 遇到 AI

  對于喜歡折騰手機的用戶來說,手機 SoC 的性能可能永遠都沒有‘過剩’的那一天,不過對于更多的‘普通用戶’來說,隨著過去幾年里 SoC 整體性能的不斷提升,新款 SoC 在性能上帶來的體驗加成正在變得越來越小。在 5G 時代到來之前,在移動 VR 和 AR 應用取得突破之前,這種情況很可能會一直持續下去。

12.jpg 

  在麒麟 970 上,華為探索了另外一種思路:在傳統的手機 SoC 上,額外增加一顆專門為 AI 相關運算定制的芯片(NPU),讓手機本身具備 AI 能力,完成一些和 AI 相關的應用。

  至于這顆 NPU 到底能有多大的意義,我們至少還需要等到 10 月 16 日發布 Mate 10 和 Mate 10 Pro 后才能作出判斷,但可以確定的是,在 AI 席卷整個科技圈的浪潮中,麒麟 970 在 AI 上的探索只是一個開始。

13.jpg 

  今年 5 月,ARM 在發布新一代 CPU 架構 Cortex-A75 和 A55 時,重點強調了提高 AI 運算能力的 DynamIQ 設計。今年 7 月,高通開放了自家的神經處理引擎(Neural Processing Engine,NPE)的 SDK,幫助開發者使用驍龍 SoC 進行 AI 相關的運算。

  或許到明年這個時候,當我們在討論移動 SoC 的時候,AI 芯片就會像 CPU、GPU 那樣,成為智能手機中一個‘常規’的組成部分。

大乐透走势图2000期走势图1 www.mkobas.com.cn       2015  privacy policy       粵ICP備17108987號
地址:廣州市荔灣區浣花路109號東鵬德寶大廈8068室   電話:81600100 EMAIL: [email protected]