在AI領域一路高歌猛進的NVIDIA,在CES 2026上也沒有忘記將注意力放在遊戲上。黃仁勳CES 2026特別演講過後,筆者有幸參觀了GeForce RTX新技術展示區,一整套遊戲新技術組合拳着實帶勁,比如DLSS 4.5動態多幀生成最高可以將幀率提升6倍,G-SYNC Pulsar顯示器也終於蓄勢待發,圍繞RTX AI PC構建出的創作生態也展現出了全新可能,趁着現場體驗,不妨讓我們直觀的感受一下GeForce RTX給PC帶來的更多可能性。
![]()
DLSS 4.5:遊戲幀率暴增6倍
DLSS 4.5帶來的最重要的更新之一是第二代Transformer和DLSS 4.5 超分辨率模型。它的工作方式在AI服務器集羣上將畫質訓練提升至16K分辨率下開啓路徑追蹤畫質作爲最終參考幀,針對遊戲新增700+小時的錄像訓練,並重點採集高運動、高對比、粒子密集的場景,確保畫質提升有更多可能性。
![]()
同時DLSS 4.5也首次引入大模型訓練中常見的反向標註方式,通過人工和AI的方式找到原來模型訓練中鬼影、撕裂、閃爍的反向樣本,然後針對性進行訓練,以避免DLSS開啓後可能產生的不真實感。
這些DLSS 4.5的訓練都是在H100上通過FP8精度訓練超過六週完成的。由於FP8只能在Blackwell,也就是GeForce RTX 50系列GPU上實現,GeForce RTX 40以前的GPU在運行DLSS 4.5的時候則會使用FP16完成,在畫質相同的前提下,GeForce RTX 50系列無疑更有優勢。
![]()
在幀生成過程中,Transformer 模型會把前後4幀的運動矢量、深度、粗糙輻照度一起送進注意力,提前預測遮擋,進而將鬼影可能性降低42%。同時還會在1/4分辨率下運行一次邊緣檢測,進而補償幾何邊緣可能出現的損失,讓抗鋸齒AA質量提升0.8 dB LPIPS。與此同時,粒子/透明支路有所增強,避免火焰、雨水、UI因爲開啓DLSS之後被抹掉,最顯著的例子就是火焰迸發出的火星得意保留。
在提前溝通會上,NVIDIA展示了《心靈殺手Remastered》手電筒高速會動時候殘影情況,原本會出現至少3層殘影的手電筒光照現在降低到了1層。《天國:拯救2》中木紋桌面上的抖動完全靜止。《奪寶奇兵:古老之圈》中鐵欄的斷裂情況概率顯著降低。
![]()
![]()
即將發佈的《影之刃零》也同樣會在新技術中受益,由於《影之刃零》注重細膩的雨水渲染場景氣氛,傳統方式會模糊雨滴的細節,讓畫面產生模糊感,DLSS 4.5中的第二代Transformer 模型很好解決了這個問題,在大幅提升幀率的同時,還能獲得更爲細膩和清晰的沉浸感,顯然也是玩家最願意見到的。
![]()
得益於FP8加持,第二代Transformer模型可以幫助Blackwell GPU在不增加任何能耗的前提下提升相應速度,例如140W GeForce RTX 5080 Laptop GPU筆記本獲得更好的畫質和幀率後,功耗沒有任何提升。
在這個基礎上,引入6x的Dynamic Multi-Frame Generation動態多幀生成變得順理成章。以往的幀生成是按照原生幀和生成幀的固定比例完成的,比如DLSS 3的1:1,即1幀原幀,1幀生成幀,DLSS 4的1:3,即1幀原幀,3幀生成幀。在動態多幀生成下,幀生成變成了0-5幀隨機調整,這樣做的目的是讓幀生成永遠喫滿顯示器VRR上限。
![]()
比如顯示器有240Hz刷新率,那麼動態多幀生成就會泡在240FPS,沒必要運算出更多的幀率,即浪費GPU資源,還增加系統延遲。
NVIDIA在啓動中埋入了2ms爲單位的檢測動作,即每2ms查看GPU佔用率,幀時間抖動情況,顯示器實時刷新率,根據實際情況做出調整。根據這三個變量實時調整,在16.7ms內就能完成0到5幀生成的來回切換,做到6x動態多幀生成。
![]()
配合第二代Transformer,幀生成會先做1/4分辨率的全局運動判斷,然後向上逆採樣,進而節省顯存帶寬。在技術上還增加了遮擋置信圖,主要是防止UI、十字準心、血條在幀生成狀態下閃爍的問題。
在現場《黑神話:悟空》體驗中,最高特效開啓DLSS 4.5後,會自動將遊戲幀率匹配到4K 240Hz顯示器的上限,可以看到右側成功開啓了6x多幀生成,且系統延遲沒有降低。將幀率維持在顯示器上限另一個好處就是不會浪費額外幀率計算的功耗,對於節能而言更有效果。
![]()
事實上現場展示的GeForce RTX 50系列Laptop GPU就使用了類似的結束,在《賽博朋克2077》中,開啓DLSS 4.5不僅獲得了更好的畫質,同時也沒有超額消耗GPU資源,能夠確保筆記本更容易低發熱、風扇安靜的前提下運行。
![]()
G-SYNC Pulsar蓄勢待發
NVIDIA G-SYNC Pulsar定位高端電競顯示器認證,即把NVIDIA G-SYNC算法和協議一次性做到27英寸電競顯示器中,從而獲得360Hz高刷、1000Hz感知運動清晰度,提供環境光感應,並且能夠直接檢測Reflex延遲。首發的四款產品型號包括:
– AOC AGON PRO AG276QSG2
– Acer Predator XB273U F5
– ASUS ROG STRIX XG27AQNGV
– MSI MPG 272QRF X36
![]()
不過NVIDIA G-SYNC Pulsar顯示器並非第一次發佈,此前NVIDIA已經公佈了技術白皮書和Project Pulsar計劃,這次G-SYNC Pulsar顯示器終於算是開售,並與時俱進增加Ambient Adaptive環境光傳感器、Reflex Analyzer USB-C等細節。
現場用《守望先鋒2》和《紀元117:羅馬和平》進行了對比。由於NVIDIA G-SYNC Pulsar顯示器可變頻率背光頻閃技術,實現超過1000Hz的有效動態清晰度,大幅提升動態畫面的清晰度和可見性,即使是同樣的幀率,仍然可以直觀感受到G-SYNC Pulsar有着更爲明顯的清晰度,敵人和畫面移動更爲清晰流暢。
![]()
![]()
RTX Remix Logic:一步到位加個氛圍
RTX Remix的使用邏輯是在原遊戲的基礎上,通過全局替換的方式給經典老遊戲換上高清材質、模型和光追效果。RTX Remix Logic則是更進一步,相當於在渲染管線上增加了一條無代碼的事件總線,讓遊戲畫面可以隨着遊戲中的變量,比如主角血條、關卡、開關、NPC狀態等隨時變換,這些動作在RTX Remix上都是需要創作者手動一個一個調整的,現在可以一步到位了。
![]()
這個過程的實現原理是Remix Runtime把DirectX 8和DirectX 9 Draw Call攔截到USD場景圖中,將超過30種遊戲事件註冊成命名信號,隨後依靠邏輯層Node-Graph UI綁定到超過900種圖形參數中做匹配。比如天氣中的體積霧密度、散射顏色,材質的粗糙度、自發光強度,後處理中的曝光、色散、暗角等。
最後RTX Remix Logic可以在渲染層將節點編譯成USD層棧,實時Hot-Reload,0.3 ms內完成切換,無需重啓關卡,對於Modder而言,所見即所得的遊戲重置體驗,五一是很酸爽的。
![]()
這意味着整個過程中,創作者即使不會C++語言,Modder也能做到隨着劇情需要切換光追天氣變化,並且創作節點可以隨時複用,可以直接將RTX Remix Logic的文件複製給其他遊戲關卡或者遊戲,實現同樣的效果。在SDK的生態中,社區已經準備好了Blender和Substance插件,這個過程可以一鍵導入。
NVIDIA計劃將RTX Remix Logic在1月份的Remix 2025.1 SDK中添加,並且已經給50位《半衰期2 RTX》創作者提前內測,後續會在GitHub中同步開源示例節點圖。NVIDIA在現場也提供了《半衰期2 RTX》演示DEMO,比如推開門後檢測到事件,遊戲環境中的體積霧、冷色調體積光線、落葉粒子瞬間切換到冬季預設。
![]()
遊戲中敵人靠近但尚未進入主角視野,也會出發隱藏敵人事件,RTX Remix Logic隨即做出對應的Paranoia濾鏡效果,包括脈衝暗角、色差強度隨距離線性提升,UI血條邊緣同步閃爍。
![]()
當玩家在《半衰期2 RTX》遊戲中啓動機器,引發MachineActivate事件,時間軸節點依次拉高粒子速率、屏幕泛白、最終核爆閃屏,敵人角色被同步消滅的着色器也隨之被觸發。
![]()
RTX AI:3分鐘內生成4K視頻
NVIDIA ACE也迎來了全面升級,可以在本地運行14B大模型,並且支持RAG檢索實時獨擋。整個功能鏈路在本地實現,無需聯網,但需要6GB的常駐顯存,如果後期使用FP4量化之後,可以壓縮到3.8GB左右。
NVIDIA ACE可以做到根據遊戲實時狀態進行RAG檢索,以現場展示的《全面戰爭:法老》爲例,新版的NVIDIA ACE會把每個回合中的經濟、外交、兵力、科技樹情況導入向量庫進行判斷,整個過程只需要80ms不到的延遲。
![]()
比如玩家問遊戲中爲什麼忽然產生叛亂,NVIDIA ACE主導的遊戲顧問會以自然語言的形式總結原因,並且提供對應的決策。或者玩家提出下一步的方向,讓遊戲顧問根據玩家希望的方向指定遊戲中的策略,確保遊戲順利進行。有意思的是,NVIDIA ACE還可以根據遊戲場景切換到不同的角色,比如在扮演埃及國王的時候,遊戲顧問是埃及祭司,還會發出法老腔音色給遊戲產生沉浸感。
![]()
這一套NVIDIA ACE至少需要GeForce RTX 4070 8GB以上的顯存才能進行,NVIDIA也推薦12GB顯存以上保證遊戲體驗。首發將支持中文、英語、日語和德語,後續語種會在2026 Q2後追加。
![]()
隨着NVFP4和NVFP8量化付諸實踐,模型體積還可以降低60%,顯存需求也同步降低40%到60%,並且支持Tensor Core原生指令,不再依賴於Hopper或者Blackwell GPU中的專屬硬件,這也是NVIDIA近期技術發展趨勢之一。
在現場NVIDIA展示通過PyTorch-CUDA形式將FLUX.1生成速度提升3.7倍,並且在顯存用滿之後,自動切換到DDR5內存,FLUX.2 87GB在本地AI PC上完成4K圖生圖也完全沒有問題。
![]()
NVIDIA描述了這一套升級組合拳帶來的可能性,創作者可以通過文本Qwen SLM直接生場景描述,然後利用Trellis 3D建立基礎模型並通過Blender手動調整需要的擺放位置。隨後通過FLUX Image直接完成4K起始幀和結束幀。並通過LTX-2模型完成720p的視頻輸出,最後通過RTX Video Super-Resolution將視頻分辨率提升至4K。
![]()
如果通過GeForce RTX 4090在FP 16上運行,上述一套工作至少需要8分鐘,但通過GeForce RTX 5090 FP4,現在只需要3分鐘就能完成了。NVIDIA表示FLUX.1/2 NVFP4、LTX-2模型會在發佈活動結束後同步在HuggingFace 和ComfyUI上線,RTX 視頻超分辨率則會在2月份融入到ComfyUI中。
重點是這一套功能都是免費的,所有功能都是基於GeForce RTX 50系列GPU實現,從而獲得效率最大化。
![]()
DGX Spark:性能瞬秒M4 MAX
在演示現場,我們也看到了近期剛剛開賣的NVIDIA DGX Spark。
NVIDIA將DGX Spark定位一款緊湊型 AI 超級計算機,它可以獨立使用,也可以作爲家用服務器中的一員,通過PC、MAC或者其他設備訪問使用,定製化Linus平臺意味着對模型的廣闊兼容性,也使得家裏任何設備都有機會擁有AI加速的超級算力。
![]()
在CES 2026上,NVIDIA發佈了Spark的重大AI性能更新,使其相較於不到三個月前首次發佈時,最高可獲得高達2.6倍的性能提升。在展示區,工作人員通過使用旗艦款MacBook Pro M4 MAX筆記本與NVIDIA DGX Spark進行性能比較。
通過ComfyUI動態調節一段4K高清視頻,將視頻中的綠色跑車調成紅色。兩者同時開始運行。NVIDIA DGX Spark利用NVFP4的優勢在數秒內就完成了顏色切換,同樣的操作在頂配的MacBook Pro M4 MAX上運行超過三分鐘,差距非常大。
![]()
有意思的是,現場展示的NVIDIA DGX Spark利用旁邊的MacBook Pro即可直接訪問,省略大量的調試和部署成本,足以一窺Spark的便利性。
![]()
寫在最後:
無論是將14B模型的NVIDIA ACE塞入遊戲顧問中,讓遊戲體驗獲得深入的一對一指導,再或者3分鐘內從無到有生成一整套高規格的4K視頻,不發佈任何新硬件的前提下,GeForce RTX 50系列的AI含金量依然在持續提升。
![]()
![]()
對於N卡用戶而言,軟件和技術的免費升級也已經成爲日常顯卡增值的一部分,雖然CES 2026沒有發佈新款的消費級GPU,但一波迅猛的軟件升級,對於已經配好GeForce RTX 50系列AI PC的同學而言,顯然已經賺翻了。
![]()
![]()
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com
