酷睿Ultra發佈詳解:標配NPU,新核顯遊戲幀率提升3倍!

就在今天,醞釀已久的英特爾酷睿Ultra系列處理器正式發佈,標誌着英特爾消費級產品正式進入Intel 4製程工藝,並且首次採用分離式模塊和3D封裝,是英特爾有史以來效能最高的處理器產品,同時處理器還將核顯更換成了Xe-LPG的Arc GPU,核顯性能提升兩倍,首次加入NPU模塊,加速筆記本AI性能表現,將AI PC全面普適化。

在這些諸多新技術Buff疊加的前提下,基於酷睿Ultra系列的新品和DEMO也集體亮相於2023英特爾新品發佈會暨AI技術創新派對上。現在,就讓我們花點時間,深度瞭解酷睿Ultra。

H與U兩大陣營

按照慣例讓我們先奉上首發的全套陣營。

可以看到首發陣營包括H系列(28W)、U系列(15W)的Core Ultra 7和Core Ultra 5,而在2024年第一季度,則會推出最高階的Core Ultra 9 185H以及兩款U系列產品。從整體上來看產品型號簡化了許多。按照英特爾的說法,這基本上是規劃中所有Meteor Lake型號的產品,不會在增加更多版本,比如之前的H45在這一代是不存在的。

因此可以認爲Core Ultra 7和Core Ultra 5是未來一段時間筆記本的主打陣營,Core Ultra 9在覈心數量上沒有變化,僅在功耗和頻率上有所提升,對於大多數主打高性能輕薄本的產品而言,首發的Core Ultra 7 165H就已經代表着未來旗艦級輕薄本的方向。

Core Ultra H最高擁有6個P-Core和8個E-Core,以及在SOC Tile中用於省電的LP E-Core,因此共計16個核心22個線程,最高5.1GHz,TDP 28W,最高功耗看情況可至64W、115W。Core Ultra H將標配Arc GPU核顯,核顯架構來自於Xe-LPG,Core Ultra 7包含8個Xe-LPG核心,Core Ultra 5包含7個。

Core Ultra U系列則統一使用2個P-Core,8個E-Core,2個LP E-Core設計,共計12個核心14線程,最高頻率4.9GHz,TDP 15W,最高功耗57W。不過Core Ultra U核顯並非來自Arc,而是沿用上一代架構Xe-LP的Iris Xe。

在內存支持上,上述所有產品內存頻率最高支持到64GB LPDDR5/x-7467,或者96GB DDR5-5600,並配備2個基於第三代引擎的NPU,用於在低功耗狀態下加速筆記本的AI性能。由於英特爾xPU架構的特殊性,AI加速其實會同時調用CPU、iGPU、NPU同時進行,用於解決不同場景的AI加速問題。

由於在SOC Tile中爲了省電而引入了2個LP E-Core核心,因此線程的具體調度會由Windows 11參考英特爾硬件線程調度器(Intel Thread Director,ITD)的中間層進行,因此筆記本出廠的系統版本也應該是Windows 11 22H2以後版本,否則就會按照傳統的核心分配,效率會低很多。

在擴展上,Core Ultra支持Thunderbolt 4、Wi-Fi 6E,同時還可以通過英特爾的獨立芯片實現Wi-Fi 7和Thunderbolt 5的支持。

P-Core與E-Core的跨越

Core Ultra對P-Core與E-Core的微架構都進行了較大幅度改變,其中P-Core由Golden Cove升級到了Redwood Cove,E-Core由Gracemont升級到了Crestmont,兩者構成的計算模塊均是基於Intel 4進程所打造的消費級產品架構,相對前幾代產品在電源效率上有很大的提升,並且結合3D Foveros獲得更好的效能優化效果。

雖然英特爾沒有提及Redwood Cove與Crestmont的細節,但從最終成品來看Redwood Cove確實帶來了明顯的代際IPC收益提升,並且Redwood Cove核心本身也增加了緩存和內存帶寬,性能監控單元得以加強,用於解決不同工況下的核心調度問題。

相對應的,Crestmont也提升了IPC表現,並通過矢量神經網絡指令(VNNI)實現E-Core對AI應用場景的加速。同樣,Crestmont也使用了增強的核心調度單元,包括LP E-Core同樣也是使用了完整的Crestmont架構,以解決SOC Tile中的不那麼密集的工作負載。

從整體而言,P-Core與E-Core主要圍繞提升IPC性能、分支預測能力,增強版Intel Thread Director調度器,提升緩存和內存帶寬進行的。

而從結論上看,Core Ultra在多線程與單線程上的處理能力都有不錯的表現。以Core Ultra 7 165H爲例,SPECrate2017_int_base多線程相對AMD Ryzen 7 7840U性能提升11%,相對Core i7-1370P提升8%。同時英特爾也不忘拿最近發佈的高通驍龍8cx Gen 3進行對比,差距不是一點半點了。

在單線程中,SPECrate2017_int_base單線程性能則依然是Core i7-1370P強勢,但Core Ultra 7 165H相對AMD Ryzen 7 7840U和高通驍龍8cx Gen 3都有很好的表現。

多線程帶來的收益還是非常明顯的,如果進行實際應用對比,無論是UL Procyon Video Editing,PugetBench for Premiere Pro和PugetBench for Lightroom,Core Ultra 7 165H相對AMD Ryzen 7 7840U和Core i7-1370P提升還是非常明顯的。

核顯進階

核顯Xe-LPG是Core Ultra的另一個飛躍,它同樣屬於Arc GPU體系,對應的獨顯架構稱爲Xe-HPG。相對於之前Xe-LP架構的Iris Xe,每瓦性能提升2倍。

之前在做架構分析的時候我們有提過,Core Ultra的GPU Tile是基於臺積電N5節點設計的,與AMD和NVIDIA的GPU製程節點處於相同一代。Xe-LPG的特點是給核顯帶來許多獨顯中才有的特性,比如8個Xe內核中包括128個矢量引擎,8個採樣器,4個像素後端,8個光線追蹤單元等等。

其中16個矢量引擎總線寬度爲256-bit,每個內核配備192KB L1共享緩存,每個矢量引擎在每個時鐘支持16個FP32或者32個FP16計算,64個INT8計算,並共享1個FP64端口。同時Xe-LPG也是對DX12進行優化的,引入獨顯上纔有的無序採樣(Out of Order Samplng,OoOS)。

另外,由於藉助Foveros 3D封裝技術,媒體引擎和顯示引擎不在GPU Tile中,而是分配到了SOC Tile內,以實現更好的能效表現。在編碼支持方面,除了常見的H.265、H.264之外,Xe-LPG也增加了對AV1 encode支持,最高可以支持到8K 10bit HDR。顯示引擎則是最高支持4路顯示輸出,以及HDMI 2.1、DP 2.1、eDP 1.4b等規範。

另外Xe-LPG還支持DP4A AI指令集,用於AI加速計算。同時也基於AI特性支持XeSS超採樣,可以給遊戲帶來更好的流暢度和清晰度。

這裏英特爾也列舉一些遊戲案例。包括相對Core i7-1370P在《博德之門3》中有100%的幀率提升,《生化危機8》、《無主之地3》、《CS2》、《英雄聯盟》、《PUBG》中都有顯著的性能提升。

英特爾給輕薄本選取了18款遊戲,Core Ultra 7 165H相對AMD Ryzen 7 7840U提升有16%。

順帶英特爾也強調了基於XeSS超採樣技術,通過AI加速XeSS在不改變硬件條件的前提下降低了渲染時間和渲染分辨率,從而獲得更高的幀率,並且可以保持原畫質甚至更好。

從實際遊戲過程來看,提升幅度最高可以達50%以上,再加上Arc GPU,相對上一代處理器的幀率提升大概有3倍。

AI PC將成標配

在英特爾酷睿Ultra中參與AI性能加速並非只有NPU一個模組,而是CPU、GPU、NPU三個硬件構成的XPU共同分配任務,總算力可以達到34 TeraOPS,這也是酷睿Ultra推動AI PC加速普及的重要原因。預計在2025年前,全球會出貨超過1億臺AI PC。合作涉及100家ISV合作伙伴,覆蓋300餘項AI加速功能,AI應用將會得到更大範圍的推廣。

在AI加速分工上,VNNI用來做加速AI工作負載處理,其中CPU啓動速度最快,用來應對語音控制、識別等需要延遲低的AI應用場景。NPU用於低功耗AI計算,比如長時間視頻通話時的背景模糊,會由CPU轉給NPU執行。GPU則是最耗電的,但是在推動諸如Stable Diffusion這樣對AI加速要求高的場景中充當主力。

而憑藉着OpenVINO的優勢,酷睿Ultra也是當下支持AI計算類型最廣的產品。與此同時,英特爾的AI加速在對業內的模型、應用有很廣泛的加持,比如Stable Diffusion、Microsoft 365、LLaMA、ChatGLM等等,在筆記本上就可以直接運行。

與此同時,英特爾也宣佈LLaMa2-7B已經能夠在酷睿Ultra上本地運行,這裏的7B中B代表Billion,即70億個參數模型。

Evo進階

在推進AI PC的同時,英特爾Evo認證平臺也進一步升級,認證範圍也更爲廣泛,如果一臺筆記本帶有Evo標籤,通常也意味着在性能、體驗、智能化與便攜上都有較好的表現。

在Meteor Lake Evo體系中,主要圍繞快速連接、快速喚醒、性能、AI表現、電池續航、快速充電、外形創新進行。例如筆記本的快速喚醒方式,人臉識別、指紋識別、手機靠近後藍牙喚醒都是Evo快速連接的考覈範圍。

在性能方面除了要求使用酷睿Ultra 5、7、9處理器之外,使用英特爾銳炫或者第三方獨顯也會成爲加分項。另外筆記本系統除了要支持最新的Windows系同時,還需要搭配英特爾自適應技術,通過機器學習讓筆記本在實際使用過程中增強優化。

而在搭載NPU之後,Evo對AI性能,續航能力也有了更高的要求。同時標配Wi-Fi 6E級別以上的模塊,雷電4接口,甚至5G都將會是加分項。

最後一個則是對筆記本的體驗和外形都有更高的要求。比如時候鍵盤、觸控板的規格,筆記本厚度核顯版本不能超過15mm,獨顯版本不能超過20mm,攝像頭分辨率應該大於1080p 30FPS,支持人臉識別等等。英特爾特別強調了通過VCX對攝像頭鏡頭和品質都有了更嚴苛的量化標準,讓全新的Evo平臺在視頻通話方面有更好的表現。

這裏以馬上要發佈的戴爾靈越13Pro爲例,不僅使用了英特爾酷睿Ultra處理器,獲得英特爾Evo認證,13英寸機身厚度控制在了14.35mm,重量1.25kg,並在設計上使用了窄邊框和下沉式轉軸設計,提供全尺寸背光鍵盤。

而在性能上,戴爾靈越13Pro可以帶動160 億參數量的大語言模型運行,支持英特爾所構建的BigDL-LLM庫,能夠很好的對市面上主流的大模型離線運算。同時還配備AI降噪、AI語音輸入、AI背景虛化、AI修圖和視頻編輯等功能。

在接口上,戴爾靈越13Pro還標配了Thunderbolt 4接口,9小時的續航時間,300nit亮度的16:10且支持DC調光的屏幕。重點是靈越13Pro系列在價格定位上本身就很親民,相信正式開賣之後是個不錯的升級選擇。

與此同時,英特爾還增強了爾多設備協同技術Intel Unison,將支持範圍擴展到更多系統,包括Andorid、iOS,筆記本與手機之間的文件、相冊共享,並且增加了名爲Universal Control的功能,可以通過一個鼠標控制不同的屏幕和設備。

對應的,Evo認證工作也擴展到了鼠標、鍵盤、藍牙耳機、聽力輔助器、雷電Dock、顯示屏、存儲器、無線接入點等等。

寫在最後:輕薄本新發力

可以預見在未來一段時間內,筆記本GPU升級速度趨於平和,而基於CPU打造的輕薄本將成爲發力的重點。英特爾已經與35家以上的OEM廠商展開合作,並計劃推出230款以上的Meteor Lake產品,在性能上相對友商略勝一籌,同時NPU與CPU、Arc GPU組合使用展現出了更好的性能調配和AI能力,Intel 4製程與Foveros 3D封裝技術已然開始發力。

這是一場更關乎於移動工作、內容創作、AI加速的發佈會,正如酷睿Ultra的改名一樣,輕薄筆記本設計也很快來到一個全面轉型的臨界點。相信我們很快就能買到更多個性出衆、體驗友好的智能便攜輕薄筆記本了。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com