酷睿Ultra發佈詳解：標配NPU，新核顯遊戲幀率提升3倍！

就在今天，醞釀已久的英特爾酷睿Ultra系列處理器正式發佈，標誌着英特爾消費級產品正式進入Intel 4製程工藝，並且首次採用分離式模塊和3D封裝，是英特爾有史以來效能最高的處理器產品，同時處理器還將核顯更換成了Xe-LPG的Arc GPU，核顯性能提升兩倍，首次加入NPU模塊，加速筆記本AI性能表現，將AI PC全面普適化。

在這些諸多新技術Buff疊加的前提下，基於酷睿Ultra系列的新品和DEMO也集體亮相於2023英特爾新品發佈會暨AI技術創新派對上。現在，就讓我們花點時間，深度瞭解酷睿Ultra。

H與U兩大陣營

按照慣例讓我們先奉上首發的全套陣營。

可以看到首發陣營包括H系列（28W）、U系列（15W）的Core Ultra 7和Core Ultra 5，而在2024年第一季度，則會推出最高階的Core Ultra 9 185H以及兩款U系列產品。從整體上來看產品型號簡化了許多。按照英特爾的說法，這基本上是規劃中所有Meteor Lake型號的產品，不會在增加更多版本，比如之前的H45在這一代是不存在的。

因此可以認爲Core Ultra 7和Core Ultra 5是未來一段時間筆記本的主打陣營，Core Ultra 9在覈心數量上沒有變化，僅在功耗和頻率上有所提升，對於大多數主打高性能輕薄本的產品而言，首發的Core Ultra 7 165H就已經代表着未來旗艦級輕薄本的方向。

Core Ultra H最高擁有6個P-Core和8個E-Core，以及在SOC Tile中用於省電的LP E-Core，因此共計16個核心22個線程，最高5.1GHz，TDP 28W，最高功耗看情況可至64W、115W。Core Ultra H將標配Arc GPU核顯，核顯架構來自於Xe-LPG，Core Ultra 7包含8個Xe-LPG核心，Core Ultra 5包含7個。

Core Ultra U系列則統一使用2個P-Core，8個E-Core，2個LP E-Core設計，共計12個核心14線程，最高頻率4.9GHz，TDP 15W，最高功耗57W。不過Core Ultra U核顯並非來自Arc，而是沿用上一代架構Xe-LP的Iris Xe。

在內存支持上，上述所有產品內存頻率最高支持到64GB LPDDR5/x-7467，或者96GB DDR5-5600，並配備2個基於第三代引擎的NPU，用於在低功耗狀態下加速筆記本的AI性能。由於英特爾xPU架構的特殊性，AI加速其實會同時調用CPU、iGPU、NPU同時進行，用於解決不同場景的AI加速問題。

由於在SOC Tile中爲了省電而引入了2個LP E-Core核心，因此線程的具體調度會由Windows 11參考英特爾硬件線程調度器（Intel Thread Director，ITD）的中間層進行，因此筆記本出廠的系統版本也應該是Windows 11 22H2以後版本，否則就會按照傳統的核心分配，效率會低很多。

在擴展上，Core Ultra支持Thunderbolt 4、Wi-Fi 6E，同時還可以通過英特爾的獨立芯片實現Wi-Fi 7和Thunderbolt 5的支持。

P-Core與E-Core的跨越

Core Ultra對P-Core與E-Core的微架構都進行了較大幅度改變，其中P-Core由Golden Cove升級到了Redwood Cove，E-Core由Gracemont升級到了Crestmont，兩者構成的計算模塊均是基於Intel 4進程所打造的消費級產品架構，相對前幾代產品在電源效率上有很大的提升，並且結合3D Foveros獲得更好的效能優化效果。

雖然英特爾沒有提及Redwood Cove與Crestmont的細節，但從最終成品來看Redwood Cove確實帶來了明顯的代際IPC收益提升，並且Redwood Cove核心本身也增加了緩存和內存帶寬，性能監控單元得以加強，用於解決不同工況下的核心調度問題。

相對應的，Crestmont也提升了IPC表現，並通過矢量神經網絡指令（VNNI）實現E-Core對AI應用場景的加速。同樣，Crestmont也使用了增強的核心調度單元，包括LP E-Core同樣也是使用了完整的Crestmont架構，以解決SOC Tile中的不那麼密集的工作負載。

從整體而言，P-Core與E-Core主要圍繞提升IPC性能、分支預測能力，增強版Intel Thread Director調度器，提升緩存和內存帶寬進行的。

而從結論上看，Core Ultra在多線程與單線程上的處理能力都有不錯的表現。以Core Ultra 7 165H爲例，SPECrate2017_int_base多線程相對AMD Ryzen 7 7840U性能提升11%，相對Core i7-1370P提升8%。同時英特爾也不忘拿最近發佈的高通驍龍8cx Gen 3進行對比，差距不是一點半點了。

在單線程中，SPECrate2017_int_base單線程性能則依然是Core i7-1370P強勢，但Core Ultra 7 165H相對AMD Ryzen 7 7840U和高通驍龍8cx Gen 3都有很好的表現。

多線程帶來的收益還是非常明顯的，如果進行實際應用對比，無論是UL Procyon Video Editing，PugetBench for Premiere Pro和PugetBench for Lightroom，Core Ultra 7 165H相對AMD Ryzen 7 7840U和Core i7-1370P提升還是非常明顯的。

核顯進階

核顯Xe-LPG是Core Ultra的另一個飛躍，它同樣屬於Arc GPU體系，對應的獨顯架構稱爲Xe-HPG。相對於之前Xe-LP架構的Iris Xe，每瓦性能提升2倍。

之前在做架構分析的時候我們有提過，Core Ultra的GPU Tile是基於臺積電N5節點設計的，與AMD和NVIDIA的GPU製程節點處於相同一代。Xe-LPG的特點是給核顯帶來許多獨顯中才有的特性，比如8個Xe內核中包括128個矢量引擎，8個採樣器，4個像素後端，8個光線追蹤單元等等。

其中16個矢量引擎總線寬度爲256-bit，每個內核配備192KB L1共享緩存，每個矢量引擎在每個時鐘支持16個FP32或者32個FP16計算，64個INT8計算，並共享1個FP64端口。同時Xe-LPG也是對DX12進行優化的，引入獨顯上纔有的無序採樣（Out of Order Samplng，OoOS）。

另外，由於藉助Foveros 3D封裝技術，媒體引擎和顯示引擎不在GPU Tile中，而是分配到了SOC Tile內，以實現更好的能效表現。在編碼支持方面，除了常見的H.265、H.264之外，Xe-LPG也增加了對AV1 encode支持，最高可以支持到8K 10bit HDR。顯示引擎則是最高支持4路顯示輸出，以及HDMI 2.1、DP 2.1、eDP 1.4b等規範。

另外Xe-LPG還支持DP4A AI指令集，用於AI加速計算。同時也基於AI特性支持XeSS超採樣，可以給遊戲帶來更好的流暢度和清晰度。

這裏英特爾也列舉一些遊戲案例。包括相對Core i7-1370P在《博德之門3》中有100%的幀率提升，《生化危機8》、《無主之地3》、《CS2》、《英雄聯盟》、《PUBG》中都有顯著的性能提升。

英特爾給輕薄本選取了18款遊戲，Core Ultra 7 165H相對AMD Ryzen 7 7840U提升有16%。

順帶英特爾也強調了基於XeSS超採樣技術，通過AI加速XeSS在不改變硬件條件的前提下降低了渲染時間和渲染分辨率，從而獲得更高的幀率，並且可以保持原畫質甚至更好。

從實際遊戲過程來看，提升幅度最高可以達50%以上，再加上Arc GPU，相對上一代處理器的幀率提升大概有3倍。

AI PC將成標配

在英特爾酷睿Ultra中參與AI性能加速並非只有NPU一個模組，而是CPU、GPU、NPU三個硬件構成的XPU共同分配任務，總算力可以達到34 TeraOPS，這也是酷睿Ultra推動AI PC加速普及的重要原因。預計在2025年前，全球會出貨超過1億臺AI PC。合作涉及100家ISV合作伙伴，覆蓋300餘項AI加速功能，AI應用將會得到更大範圍的推廣。

在AI加速分工上，VNNI用來做加速AI工作負載處理，其中CPU啓動速度最快，用來應對語音控制、識別等需要延遲低的AI應用場景。NPU用於低功耗AI計算，比如長時間視頻通話時的背景模糊，會由CPU轉給NPU執行。GPU則是最耗電的，但是在推動諸如Stable Diffusion這樣對AI加速要求高的場景中充當主力。

而憑藉着OpenVINO的優勢，酷睿Ultra也是當下支持AI計算類型最廣的產品。與此同時，英特爾的AI加速在對業內的模型、應用有很廣泛的加持，比如Stable Diffusion、Microsoft 365、LLaMA、ChatGLM等等，在筆記本上就可以直接運行。

與此同時，英特爾也宣佈LLaMa2-7B已經能夠在酷睿Ultra上本地運行，這裏的7B中B代表Billion，即70億個參數模型。

Evo進階

在推進AI PC的同時，英特爾Evo認證平臺也進一步升級，認證範圍也更爲廣泛，如果一臺筆記本帶有Evo標籤，通常也意味着在性能、體驗、智能化與便攜上都有較好的表現。

在Meteor Lake Evo體系中，主要圍繞快速連接、快速喚醒、性能、AI表現、電池續航、快速充電、外形創新進行。例如筆記本的快速喚醒方式，人臉識別、指紋識別、手機靠近後藍牙喚醒都是Evo快速連接的考覈範圍。

在性能方面除了要求使用酷睿Ultra 5、7、9處理器之外，使用英特爾銳炫或者第三方獨顯也會成爲加分項。另外筆記本系統除了要支持最新的Windows系同時，還需要搭配英特爾自適應技術，通過機器學習讓筆記本在實際使用過程中增強優化。

而在搭載NPU之後，Evo對AI性能，續航能力也有了更高的要求。同時標配Wi-Fi 6E級別以上的模塊，雷電4接口，甚至5G都將會是加分項。

最後一個則是對筆記本的體驗和外形都有更高的要求。比如時候鍵盤、觸控板的規格，筆記本厚度核顯版本不能超過15mm，獨顯版本不能超過20mm，攝像頭分辨率應該大於1080p 30FPS，支持人臉識別等等。英特爾特別強調了通過VCX對攝像頭鏡頭和品質都有了更嚴苛的量化標準，讓全新的Evo平臺在視頻通話方面有更好的表現。

這裏以馬上要發佈的戴爾靈越13Pro爲例，不僅使用了英特爾酷睿Ultra處理器，獲得英特爾Evo認證，13英寸機身厚度控制在了14.35mm，重量1.25kg，並在設計上使用了窄邊框和下沉式轉軸設計，提供全尺寸背光鍵盤。

而在性能上，戴爾靈越13Pro可以帶動160 億參數量的大語言模型運行，支持英特爾所構建的BigDL-LLM庫，能夠很好的對市面上主流的大模型離線運算。同時還配備AI降噪、AI語音輸入、AI背景虛化、AI修圖和視頻編輯等功能。

在接口上，戴爾靈越13Pro還標配了Thunderbolt 4接口，9小時的續航時間，300nit亮度的16:10且支持DC調光的屏幕。重點是靈越13Pro系列在價格定位上本身就很親民，相信正式開賣之後是個不錯的升級選擇。

與此同時，英特爾還增強了爾多設備協同技術Intel Unison，將支持範圍擴展到更多系統，包括Andorid、iOS，筆記本與手機之間的文件、相冊共享，並且增加了名爲Universal Control的功能，可以通過一個鼠標控制不同的屏幕和設備。

對應的，Evo認證工作也擴展到了鼠標、鍵盤、藍牙耳機、聽力輔助器、雷電Dock、顯示屏、存儲器、無線接入點等等。

寫在最後：輕薄本新發力

可以預見在未來一段時間內，筆記本GPU升級速度趨於平和，而基於CPU打造的輕薄本將成爲發力的重點。英特爾已經與35家以上的OEM廠商展開合作，並計劃推出230款以上的Meteor Lake產品，在性能上相對友商略勝一籌，同時NPU與CPU、Arc GPU組合使用展現出了更好的性能調配和AI能力，Intel 4製程與Foveros 3D封裝技術已然開始發力。