在中國人的觀念里,"10" 這個數(shù)字象征著完美,十全十美是對于人或事物的最高評價。
10,對于英特爾來說同樣重要。10nm 關系著英特爾在半導體芯片行業(yè)未來能否更進一步,10 代酷睿也關系到英特爾能否正面迎接來自競爭對手、來自輿論的壓力。而將 10nm 與 10 代酷睿聯(lián)系在一起,能夠做到十全十美呢?
接下來,讓我們通過對英特爾 10nm IceLake 10 代酷睿處理器技術細節(jié)解析,來找找答案。
英特爾酷睿架構(gòu)回顧
在 10nm 制程之前,英特爾嚴格遵循摩爾定律以及 Tick-Tock 戰(zhàn)略,通過制程工藝與架構(gòu)技術迭代來穩(wěn)步推進 PC 半導體制程技術與性能的發(fā)展。65nm 到 45nm 用時 2 年,45nm 到 32nm 用時 3 年,32nm 到 22nm 用時 2 年,22nm 到 14nm 同樣用時 2 年,然而在 14nm 到 10nm 推進過程中,英特爾卻經(jīng)歷了更久的時間—— 4 年。
隨著制程工藝不斷演進,相關技術迭代速度也逐漸放緩。光刻機技術、晶體管技術、新材料等諸多領域的研發(fā)速度放緩,加之英特爾對 10nm 制程額外看重,希望通過 10nm 技術積累為 10nm 到 7nm 制程演進做鋪墊,因此耗費了更久的時間。
10nm IceLake 晶圓
不過,時間終究是推動歷史前行的車輪,英特爾 10nm 制程工藝,以及英特爾第 10 代酷睿處理器,即將與我們見面!
一、10nm IceLake 制程架構(gòu)特性解析
首先我們需要弄清楚兩個問題:
其一,英特爾 10nm 制程工藝代號為 IceLake,但架構(gòu)名稱不再用 IceLake 來統(tǒng)一命名,其架構(gòu)名稱為 Sunny Cove。
其二,英特爾 10nm IceLake 處理器正式落地之后,沒有意外的話,首批將全部是移動級處理器,也就是 U 系列或 Y 系列處理器,暫時沒有桌面級處理器,這也意味著英特爾第九代酷睿沒有 U/Y 系列低電壓處理器,同時新的桌面級處理器很可能依舊是 14nm 制程,此前曝光代號為 Comet Lake。
接下來我們看看 10nm 制程架構(gòu)的詳細特性:
首先來看 IceLake 平臺。全新的 10nm IceLake 平臺在性能表現(xiàn)上借助了 AI 功能,支持 DL Boost、支持 Dynamic Tuning 機器學習,它能夠動態(tài)地分配 GPU 與 CPU 的負載與功耗,雖然并非 10nm 平臺新技術,但對于 IceLake 處理器的性能表現(xiàn)有明顯的幫助。
此外,10nm IceLake 平臺全面支持雷電 3 接口、Wi-Fi 6 無線通信模塊、4K 60FPS HDR 視頻播放、更快的、更高質(zhì)量的 HEVC 編碼,并借助全新的 GEN 11 核顯,支持 1080 分辨率電競游戲的流暢運行。
IceLake 平臺特性
在新特性方面,10nm IceLake 平臺具備以下幾點:
一,全新的 Sunny Cove 微架構(gòu);
TIPS:以下是關于 Sunny Cove 微架構(gòu)技術特性的分析
Sunny Cove 微架構(gòu)主要聚焦在 ST 單核性能、全新 ISA 及并行性三個方面的優(yōu)化和改進,Sunny Cove 微架構(gòu)主要解決以下四個問題:
其一、增強的微架構(gòu),可并行執(zhí)行更多操作。
其二、可降低延遲的新算法。
其三、增加關鍵緩沖區(qū)和緩存的大小,可優(yōu)化以數(shù)據(jù)為中心的工作負載。
其四、針對特定用例和算法的架構(gòu)擴展。例如,提升加密性能的新指令,如矢量 AES 和 SHA-NI,以及壓縮 / 解壓縮等其它關鍵用例。
對于處理器來說,IPC 強弱與 CPU 性能有直接關系。英特爾在 Sunny Cove 微架構(gòu) IPC 性能提升方式上給出了三個字:更深(deeper)、更寬(wider)、更智能(smarter)。
更深方面,Sunny Cove 微架構(gòu)表現(xiàn)在 L1 容量的增加,從 32KB 增加到 48KB,而且 L2 緩存、uop、TLB 緩存都更大;
更寬主要體現(xiàn)在執(zhí)行管線上,Sunny Cove 微架構(gòu)分配單元從 4 個增加到 5 個,執(zhí)行接口從 8 個增加到 10 個,L1 Store 帶寬翻倍。
而想要讓更深、更寬發(fā)揮出應用的實力,那么就需要有更好的算法。Sunny Cove 的 smarte 就是為此而設計。英特爾研究院院長宋繼強在解答這個問題時主要提及兩個方面,其一是提高分支預測精度,其二是減少延遲。另外英特爾還為 Sunny Cove 微架構(gòu)配置了加密解密指令集,并在 AI、存儲、網(wǎng)絡、矢量等方面進行全方位改進。因此對于 PC 用戶來說,無論是消費級還是服務器用戶,Sunny Cove 微架構(gòu)帶來的變化要比 10nm 這個制程節(jié)點數(shù)據(jù)更有意義。
Sunny Cove 微架構(gòu)示意圖
二,高帶寬、低延遲特性;
三,全新的內(nèi)存控制器,支持 LP4/x-3733 和 DDR4-3200 高速內(nèi)存;
四,搭載性能更強,最高擁有 64EU、1TFLOP 運算能力的 GEN 11 核芯顯卡;
五,支持 10bit 4K 60FPS、10bit 8K 30FPS 視頻編碼;
六,支持 5K 60FPS 或 4K 120FPS、DP 1.4 以及 BT.2020 色域
七,高達 16MP 圖像處理器單元。
從新特性來看,10nm IceLake 平臺的主要升級點除了新架構(gòu)之外,最重要的是提升了圖形、顯示部分的性能表現(xiàn)。
10nm 制程工藝新特性及芯片架構(gòu)示意
10nm IceLake 將 PCH 封裝到一個芯片上,而 PCH 芯片則由 14nm 制程工藝打造。集成 Wi-Fi 6 GIG+ 和新的電源管理,整合 802.11ax,并能夠更好的控制 CPU 和 PCH 的能耗和功耗。
PCH 采用 14nm 工藝打造
此外,Audio DSP 是英特爾第 8 代酷睿時候就具備的功能,它的主要作用是支持低功耗下的語音喚醒。而相對于 8 代酷睿來說,英特爾對 10 代酷睿的 Audio DSP 做了進一步優(yōu)化,在功耗表現(xiàn)更好。另外在 I/O 接口方面沒有新的變化。
二、10 代酷睿處理器封裝規(guī)格與基本參數(shù)
了解了制程架構(gòu)相關信息之后,我們來看看英特爾 10 代酷睿的相關規(guī)格。
首先來看處理器封裝規(guī)格。英特爾 10 代酷睿針對 9W 和 15W 功耗處理器進行了不同規(guī)格的封裝,9W 處理器芯片規(guī)格為 26.5 × 18.5 × 1.0mm,針腳間距 0.43mm;15W 芯片規(guī)格為 50 × 25 × 1.3mm,針腳間距 0.65mm。二者均采用 BGA 封裝,插槽規(guī)格分別為 1526 和 1377。
處理器封裝規(guī)格
兩種尺寸的 10 代酷睿芯片
英特爾 10 代酷睿首批產(chǎn)品擁有酷睿 i3、酷睿 i5 以及酷睿 i7 三個型號,沒有酷睿 i9。TDP 主要為 9W、15W、28W,采用 4 核 8 線程,緩存為 8MB,最高頻率 4.1GHz。
其中,英特爾酷睿 i3 全部、以及酷睿 i5 絕大部分處理器顯卡為 UHD 核顯,酷睿 i5 極少數(shù)型號以及酷睿 i7 最高支持英特爾 Iris Plus 核顯,且最高支持 64EU 銳炬核顯。
此外前面也提到了,10 代酷睿支持 LP4/x-3733 以及 DDR4-3200 規(guī)格高速內(nèi)存條。
英特爾 10 代酷睿基本參數(shù)
TIPS:關于基本參數(shù)的分析
從基本參數(shù)來看,英特爾 10 代酷睿在核心數(shù)上與第 8 代酷睿相比沒有變化,TDP 基本保持一致。9W 主要放在 Y 系列上,相對 8 代酷睿的 Amber Lake Y 系列 7W TDP 來說,略有提升;15W 主要放在 U 系列處理器上,與 8 代酷睿相比保持不變。
不過細心的朋友可能發(fā)現(xiàn)了,英特爾 10 代酷睿頻率有所下降,Max Turbo 最高到 4.1GHz,這可能會導致英特爾 10 代酷睿在跑分上與 8 代酷睿相比提升較少。
另外,之所以降低頻率,主要原因是一部分 TDP 分配給了 GEN 11 核顯,為了平衡功耗,降低主頻是必須去做的妥協(xié)。
三、GEN 11 核顯規(guī)格分析
GEN 11 核顯是英特爾 10 代酷睿非常重要的一個新要素。在年初的 CES 上,英特爾透露了 GEN 11 核顯的基本信息。在架構(gòu)層面,英特爾 GEN 11 核顯最高集成 64 個執(zhí)行單元(EU),而第 9 代核顯只有 24 個。它們分為四個區(qū)塊 ( slice ) ,各有兩個媒體取樣器、一個 PixelFE、載入 / 存儲單元,每個區(qū)塊又細分為兩個子區(qū)塊 ( sub-slice ) ,都有自己的指令緩存、3D 取樣器。
GEN 11 核顯架構(gòu)渲染圖
英特爾對 EU 內(nèi)的 FPU 浮點單元進行了重新設計,不過 FP16 單精度浮點性能沒有變化,同時每個 EU 繼續(xù)支持七個線程,共 512 個并發(fā)流水線,同時重新設計了內(nèi)存界面,三級緩存增大至 3MB。
Iris Plus 最大能達到 64EU
另外 GEN 11 核顯支持 Adaptive Sync(適應性同步)技術,相對于 NVIDIA G-Sync 來說成本更低。
伴隨 GEN 11 核顯而來的,還有全新的顯卡控制界面。該界面除了針對顯卡的各項調(diào)試功能之外,還支持超過 40 款游戲的入庫和快捷啟動。同時我認為,全新的顯卡界面也是在為英特爾 Xe 獨顯做準備。
全新的顯卡控制面板
Command Center 細節(jié)
TIPS:關于 GEN 11 核顯更多信息
其實除了最大的 64EU 規(guī)格,再向下也有 32EU 規(guī)格核顯,主要放在酷睿 i3 和低端的酷睿 i5 處理器上。
Iris Plus 也是 10 代酷睿的一大亮點,64EU 主要放在酷睿 i7 處理器上。另外,高端的酷睿 i5 處理器和酷睿 i7 處理器也會搭載 Iris 核顯。
此外,顯卡主頻提升到了 1.1GHz
四、10nm IceLake 創(chuàng)新生態(tài)解讀
與以往新制程平臺單純聚焦處理器芯片不同,英特爾 10nm IceLake 更強調(diào)整個創(chuàng)新生態(tài)。因此在 10nm IceLake 處理器、GEN 11 核顯之外,Wi-Fi 6 GIG+、Optane H10 混合固態(tài)盤、Thunderbolt 3 擴展以及 AI 層面的性能、功耗輔助等,應該與處理器放在一起去看,這才是一個完整的 10nm IceLake。
首先來說 Thunderbolt 3。
3 月初,英特爾宣布向 USB Promoter Group 開放 Thunderbolt 協(xié)議規(guī)范,從這一刻開始,無論是 PC 設備、平板設備,還是任何形式的外接擴展設備,都可以免版稅的形式構(gòu)建兼容 Thunderbolt 標準的芯片。與此同時,USB Promoter Group 宣稱將發(fā)布基于 Thunderbolt 協(xié)議的 USB 4 規(guī)范。
這意味著,在該標準協(xié)議框架下,USB 4 物理連接器將與 Thunderbolt 3 和 TYPE-C 相同,帶寬方面得到提升,達到 40Gbps,這與 Thunderbolt 3 接口一致,也就是說,USB 4 規(guī)范將兼容 Thunderbolt 3。
雷電 3 接口功能強大
Thunderbolt 3 是目前最強的物理接口,雙向帶寬達到 40Gbps,是現(xiàn)有速度最快的 USB TYPE-C 3.1 Gen 2 接口的四倍,且雷電 3 接口支持 4K 60fps 視頻傳輸,支持 100W PD 協(xié)議供電,支持外接桌面級顯卡,因此可以說是目前最為強大的接口擴展標準。
現(xiàn)有的雷電平臺架構(gòu)
全新的雷電平臺架構(gòu),主要優(yōu)化了 CPU 和 PCH 通路,使其具備更高的效率
在 10nm IceLake 平臺上,英特爾對 Thunderbolt 3 架構(gòu)做了新的優(yōu)化,對比上面兩張架構(gòu)圖,其實大家可以很明顯的看出以往和現(xiàn)在雷電平臺架構(gòu)的差異。主要就是優(yōu)化了 CPU、PCH 到接口物理層的結(jié)構(gòu),使得數(shù)據(jù)傳輸效率更高,延遲更低。
同時,英特爾在 10nm IceLake 平臺上直接植入 ThunderBolt 3,包括入門級的酷睿 i3 平臺。
Wi-Fi 6 GIG+ 也是英特爾 10nm IceLake 的重要組成部分。
目前,Wi-Fi 5 為 802.11AC 標準,QAM 最高為 256;Wi-Fi 6 為 802.11AX 標準,QAM 最高為 1024。擁有更快的響應速度、更強的穩(wěn)定性和更快的速度。延遲降低 75%、覆蓋范圍提升 4 倍,支持更多設備的穩(wěn)定連接。
性能方面,160MHz 頻寬 Wi-Fi 6 GIG+ 最高可以做到 1.68G 傳輸速度,相對于 80MHz 頻寬標準的 2 × 2 Wi-Fi 6 有 3 倍的速度優(yōu)勢。同時相對于 80MHz 頻寬標準 2 × 2 AC 而言,速度提升 40%。
標準 2 × 2 AC 與 AX 速率對比
英特爾 Wi-Fi 6 無線網(wǎng)卡擁有兩種規(guī)格,采用了全新的設計,如下:
兩種規(guī)格的 Wi-Fi 6 模塊
左側(cè)是基于 14nm 制程打造 2230 規(guī)格無線網(wǎng)卡,右側(cè)是基于 28nm 制程打造的 1216 規(guī)格網(wǎng)卡。
總體來說,英特爾 Wi-Fi 6 具有以下兩大明顯優(yōu)勢:
其一,支持多設備連接,更穩(wěn)定;
其二,對延時有更好的管理和控制。
年初 CES,英特爾公布了全新的傲騰 H10 混合固態(tài)盤,相對于以往的 Optane Memory 來說,傲騰 H10 混合固態(tài)盤主要在于把 Optane Memory 與英特爾 QLC 固態(tài)硬盤整合在了一起。因此將 Optane Memory 的非易失性存儲特性以及低延遲、快速響應、性能一致性等特點。與英特爾 QLC 3D NAND 技術的高單元密度、低成本特性,很好的結(jié)合在了一起。
傲騰混合式固態(tài)盤特性
作為 10nm IceLake 生態(tài)上的重要一環(huán),英特爾傲騰 H10 混合式固態(tài)盤,可將文檔打開速度提高 2 倍;多任務處理狀態(tài)下,游戲啟動速度提高 60%;媒體文件打開速度提高 90%。相對于普通 NAND 固態(tài)硬盤而言,傲騰混合式固態(tài)盤擁有更快的速度、更好的性能。與獨立的 TLC 3D NAND 固態(tài)盤系統(tǒng)相比,英特爾傲騰混合式固態(tài)盤不僅能夠更快地訪問常用應用和文件,還能加速后臺活動的響應。
傲騰 H10 混合固態(tài)盤擁有三種規(guī)格:16GB(英特爾傲騰內(nèi)存)+256GB(存儲)、32GB(英特爾傲騰內(nèi)存)+512GB(存儲)、32GB(英特爾傲騰內(nèi)存)+1TB 存儲。
五、10nm IceLake 性能標準
目前,英特爾 10nm IceLake 只是處在發(fā)布狀態(tài),產(chǎn)品還未正式落地,不過 10nm 整體進程的推進速度應該有所加快。所以在性能層面,目前我們只能通過英特爾的官方數(shù)據(jù)來窺知一二。
英特爾在發(fā)布 10nm IceLake 處理器與 GEN 11 核顯的同時,特意強調(diào)了 1080P 電競游戲的流暢運行。通過下面圖標可見,搭載 Intel Iris Plus 核顯的 10 代酷睿處理器能夠在相應的畫質(zhì)模式下,較為流暢的運行一些常見的電競游戲,如 CS:GO、彩虹六號、坦克世界、堡壘之夜等,相對于現(xiàn)階段 8 代酷睿的 UHD 620 核顯來說,圖形性能提升還是比較大的。
1080P 電競游戲運行幀數(shù)
在處理器性能上,英特爾目前只給出了 15W 單線程的表現(xiàn),從下圖可見,10 代酷睿性能提升接近 1.5 倍,大概為 1.48 倍左右。如果以相鄰代數(shù)性能提升倍數(shù)做參考的話,性能提升幅度不算很大。
15W 單線程性能
IPC 是處理器性能的重要指標。Sunny Cove 微架構(gòu)為 10 代酷睿帶來了 18% 的 IPC 性能提升,相對于 SkyLake 微架構(gòu)有 1.4 倍的提升。另外這里需要說明的是,英特爾給出的 IPC 提升 18% 數(shù)據(jù)是通過 5 個 Benchmark 測試出來的結(jié)果,18% 是一個平均下來的水平線。
另外,結(jié)合單線程 1.48 倍性能以及之前提到的主頻來看,其實可以看出英特爾 10 代酷睿為了保證 GEN 11 核顯的性能,因此將 CPU 與 GPU 之間的功耗分配做了一定的平衡。
IPC 提升 18%
此外,10 代酷睿在引入 AI 加速之后,能夠更好的動態(tài)控制能耗和功耗,智能化的挑選最優(yōu)核去做高負載任務,給處理器核心效率(注意是核心效率)帶來不小的提升。
英特爾 AI 加速有三個層面:一是 CPU 通過深度學習降低延時;二是也可以用 GPU 來進行智能的應用加速;三是擁有更好的性能表現(xiàn)。
TIPS:關于英特爾 AI 加速功能的說明
英特爾 AI 加速功能主要是通過 AI 技術,分析并判斷出哪些核心處于最優(yōu)狀態(tài),在高負載任務時會優(yōu)先選擇這些核心來承擔負載。
而以往英特爾加速功能是隨機選擇核心來承擔負載,這些核心可能并未處在最優(yōu)狀態(tài),所以有可能造成效率的滯后。
DL Boost AI 加速
六、結(jié)語
英特爾 10nm 制程工藝可謂是 " 千呼萬喚始出來 ",而英特爾第 10 代酷睿又是第一代 10nm 制程落地的產(chǎn)品,所以其重要性不言而喻。無論是關注這個領域的普通消費者,還是行業(yè)內(nèi)的合作伙伴,亦或是競爭對手都在盯著英特爾 10 代酷睿,其最終表現(xiàn)究竟如何,還是需要產(chǎn)品上市之后再做檢驗。
英特爾 10 代酷睿
不過,英特爾通過 10 代酷睿給業(yè)界帶來了一個新的信號,即生態(tài)化、平臺級的創(chuàng)新或?qū)⒅鲗磥?PC 產(chǎn)業(yè)的方向。
伴隨 10 代酷睿處理器,英特爾還帶來了新的無線網(wǎng)絡技術、新的存儲技術、新的 AI 技術、更強大的圖形技術以及最先進的接口技術,這些技術將為基于 10 代酷睿平臺打造的 PC 產(chǎn)品帶來全方位的體驗,而不僅僅是局限在處理器一個部件上的比拼。
其實對于占比極大的普通消費者來說,處理器計算能力已經(jīng)足夠滿足 90% 以上的應用需求。相反,存儲瓶頸、接口瓶頸、網(wǎng)絡瓶頸卻在影響著我們的體驗、制約著效率的提升,Wi-Fi 6、Thunderbolt 3、Optane H10 正式解放這些瓶頸的關鍵所在,相比一味提升處理器性能,全方位的提升才能帶給我們體驗更好、更全面的設備,這才是英特爾 10nm、10 代酷睿的價值所在。
【來源:中關村在線】