AI時代2K高幀遊戲新甜品,RTX 4070 SUPER FE首測

在RTX 20時代,NVIDIA首次在常規產品線的基礎上推出了SUPER系列GPU,包括RTX 2060 SUPER、RTX 2070 SUPER和RTX 2080 SUPER,並獲得了玩家一致的好評。首批RTX 20 SUPER GPU被譽爲NVIDIA GPU發展史上的經典之作,而SUPER這個稱號也成爲了高性價比的代名詞。雖說在RTX 30時代SUPER系列並沒有出現,但在前不久的CES2024展會上,NVIDIA終於正式發佈了三款RTX 40 SUPER顯卡,爲這一經典系列帶來了新生力量,其中的RTX 4070 SUPER則首先迎來了性能解禁。


2K高幀遊戲精準卡位,性價比進一步提升

RTX 4070 SUPER當然也採用了Ada Lovelace架構,在之前測試中,我們已經針對Ada Lovelace架構進行了非常詳細的介紹,有興趣的玩家可以直接查閱我們的文章進行了解,這裏就不再贅述。

玩家最關心的,當然是RTX 4070 SUPER的規格與現有的兩款RTX 4070系列GPU相比有何變化。從官方給出的規格來看,RTX 4070 SUPER核心代號爲AD104-350,剛好定位在RTX 4070 Ti的AD104-400和RTX 4070的AD104-250之間,且更接近RTX 4070 Ti,由此大家也可以預估到同樣源自AD104的它實際性能可能會更接近RTX 4070 Ti。詳細規格部分,RTX 4070 SUPER擁有5個GPC和80個光柵單元,與RTX 4070 Ti相同,而TPC數量縮減了兩個,流處理器單元也縮減了4個,對應的CUDA數量縮減了512個,因此規模大約相當於RTX 4070 Ti的93%。相對RTX 4070來講,RTX 4070 SUPER GPU部分的提升就比較明顯了,除了加速頻率之外,各項規格都有明顯增加,如果單從CUDA規模來看,大約提升了22%。顯存部分,RTX 4070 SUPER與RTX 4070 Ti、RTX 4070完全相同,都是192bit/12GB GDDR6X,頻率也一樣。功率部分,官方給出的RTX 4070 SUPER平均遊戲功率爲200W,位於RTX 4070 Ti與RTX 4070之間,整板功率爲220W,更接近RTX 4070,考慮到規格提升的幅度,這個能效比也是非常出色的。

此外,和上代的RTX 3070相比,RTX 4070 SUPER的規格更是飛躍式升級,不但RT Cores和Tensor Cores全面升級,CUDA數量更是暴增,二級緩存甚至增加了11倍,顯存容量與頻率也突飛猛進,已經不可同日而語。當然,畢竟從RTX 3070到RTX 4070 SUPER已經是迭代升級,有這樣的升級幅度也是情理之中。

綜合來看,RTX 4070 SUPER的規格超過了RTX 4070 Ti的93%,4899元的首發價卻僅爲前者的75%,相對RTX 4070的規格大約提升了22%,首發價僅高了2%,可以說性價比確實是非常給力的,看來NVIDIA確實很有決心要再現SUPER系列性價比神話,對於還在使用RTX 3070的老用戶來說確實是個升級的好選擇。


不光有新GPU,這次NVIDIA也升級了黑科技

2023年裏,NVIDIA對DLSS進行了升級,全新的DLSS 3.5不但相對DLSS 3增加了5倍的訓練數據量,還帶來了光線重建技術,可以進一步改善光追遊戲的圖像質量,配合超分辨率、深度學習抗鋸齒、幀生成、Reflex爲玩家帶來更高的遊戲幀率、更好的視覺效果與更低的操作延遲。同時,DLSS 3.5也能提升實時3D創作的圖像質量,提升專業3D創作者的工作效率,例如D5渲染器、Chaos Vantage和NVIDIA Omniverse都將對光線重建技術提供支持。

隨着各大廠商都在AI方面開始發力,2024註定是AI生態圈野蠻生長之年,作爲AI PC時代開拓者的NVIDIA顯然要繼續保持領軍地位。RTX 40系列GPU通過RT Core、CUDA Core和Tensor Core三大核心實現了全新的Hybrid AI加速,可以提供更加全面的AI加速功能和更高的AI加速效率,從而創造出更多強大的AI應用方式。

在CES2024發佈會上,NVIDIA展示了與Convai聯合推出的新版NVIDIA Kairos ACE DEMO,同時宣佈推出適用於 NVIDIA Audio2Face(A2F)和 NVIDIA Riva自動語音識別(ASR)的ACE Production Microservices。新的AI NPC演示DEMO在之前單個NPC的基礎上增加了一名女性NPC,玩家可以通過語言與兩名AI NPC進行互動,而AI NPC也會根據玩家的語言給出相應的反應,如此一來可以在未來的遊戲中大幅增加遊戲的沉浸感與自由度,帶給玩家真正屬於AI PC時代的遊戲體驗——當然,NVIDIA ACE也非常適合用來打造數字虛擬人物。

NVIDIA ACE在遊戲中工作時,語音轉文字、遊戲引擎運算、語音與嘴型同步這些環節都是通過本地的RTX GPU來完成的,因此玩家要體驗到真正的AI遊戲,一塊強悍的RTX 40系列GPU是必不可少的。

目前NVIDIA ACE已經開放給遊戲與軟件開發商使用,除了Convai之外,還有Charisma.AI、Inworld、米哈遊、網易遊戲、掌趣科技、騰訊遊戲、育碧和UneeQ等等知名廠商在積極迎接NVIDIA ACE,也許不久的未來大家就能在熱門的遊戲大作中與真正的AI NPC互動了。

NVIDIA還更新了RTX REMIX的信息,之前的測試中我們已經介紹過,RTX REMIX可以用來重置經典老遊戲,給老遊戲加入RTX與AI功能,從而爲玩家帶來更佳的遊戲體驗。RTX REMIX將在1月22日開啓BETA測試,未來我們將會看到衆多經典遊戲的RTX重製版,這的確非常值得期待。

AI生產力應用方面,NVIDIA Picasso爲iStock生成式AI工具提供了強大的功能,從NVIDIA官方演示視頻可以看到,我們可以通過輸入提示詞的方式在圖片中增加物體、重置元素、擴展畫面內容,讓圖片編輯和製造變得非常容易與高效,大大提升了設計師的工作效率。

視頻推流應用部分,NVIDIA與Twitch合作推出了基於GeForce GPU強大編碼能力的增強版推流工具,可以同時實現五路不同分辨率與幀率推流,並保證最高的推流質量。這對於有多路推流需求的玩家與主播來講也是非常實用的功能,而且在未來NVIDIA也會和更多的視頻網站合作,讓更多的用戶享受到此項功能。

CES 2024發佈會上,NVIDIA還發布了全新的G-SYNC PULSAR技術,此項技術融合了可變刷新率(VRR)和低動態模糊技術(ULMB)的優勢,可以大幅提升遊戲流暢度和高速運動畫面的清晰度,給玩家帶來更好的電競遊戲體驗。首批採用此技術的ROG Swift PG27系列顯示器將會在2024年內上市。

當然,要享受到NVIDIA這些最新的黑科技,一塊強力的RTX 40系列GPU是少不了的,接下來就讓我們一起走近這款來自NVIDIA的GeForce RTX 4070 SUPER Founders Edition。


GeForce RTX 4070 SUPER Founders Edition圖賞

RTX 4070 SUPER FE版從外觀設計來看與RTX 4070完全相同,但中框的顏色從RTX 4070 FE的銀灰色變成了黑色,如此一來RTX 4060 FE、RTX 4070 FE和RTX 4070 SUPER FE的中框顏色剛好是銀白、銀灰和黑色從淺到深,代表性能從低到高的排序。此外,我們也注意到顯卡上RTX 4070 SUPER的字樣從RTX 4070 FE的白字印刷方式改成了陰刻方式,質感更加強烈。此外,RTX 4070 SUPER也採用了16Pin輔助供電接口,視頻接口方面也和RTX 4070 FE一樣是3個DisplayPort和1個HDMI,散熱系統方面,也是和RTX 4070 FE相同的家族式雙面風扇設計。那麼,接下來就是大家最關心的實戰測試環節。


性能實測:2K遊戲性能給力,AI出圖也是高效利器

測試平臺

·處理器:Intel Core i9 14900K

·內存:芝奇DDR5 6000 16GB×2

·主板:華碩ROG MAXIMUS Z790 HERO

·顯卡:GeForce RTX 4070 SUPER Founders Edition

GeForce RTX 4070 Ti Founders Edition

GeForce RTX 4070 Founders Edition

·硬盤:WD_BLACK SN850X 2TB

·電源:華碩ROG雷神1000W

·操作系統:Windows 11專業版22H2

·基準性能測試

首先是基準性能測試。在針對DX11的FireStrike系列測試中,RTX 4070 SUPER領先RTX 4070的幅度十分明顯,分辨率越高,優勢越大,4K下甚至領先23%之多;而相對RTX 4070 Ti來看,FHD下達到了它96%的性能,4K下也有它92%的水平。在針對DX12的TimeSpy系列測試中,RTX 4070 SUPER領先RTX 4070大約17%~18%,達到了RTX 4070 Ti大約91%的性能。DXR和Port Royal光追性能與DLSS測試部分的情況也差不多是如此,RTX 4070 SUPER綜合領先RTX 4070 大約17%~21%,達到RTX 4070 Ti大約91%~94%的性能。

總的來說,RTX 4070 SUPER的性能非常接近RTX 4070 Ti,而相對RTX 4070的提升則非常明顯。如果和RTX 3070比較的話,RTX 4070 SUPER在DX11和DX12項目中都做到了平均50%的綜合性能提升,而在光追項目中最高領先幅度更是高達91%,開啓DLSS 3模式下直接領先一倍,這個提升幅度完全有理由讓還在使用不支持DLSS 3幀生成的RTX 3070老玩家升級了。

·光柵化遊戲性能

RTX 4070 SUPER的官方定位是2K高幀率遊戲利器,從光柵化遊戲測試的情況來看,它確實可以在2K極限畫質下實現極高的流暢度,多數遊戲都達到了一百多甚至兩百多的幀率,體驗相當出色。2K分辨率下,RTX 4070 SUPER平均領先RTX 4070大約17%,達到RTX 4070 Ti大約92%的水平;4K分辨率下RTX 4070 SUPER平均領先RTX 4070 大約18%,達到RTX 4070 Ti大約91%的水平。雖說RTX 4070 SUPER定位2K高幀率遊戲應用,但我們可以看到在4K分辨率極限畫質下,它也可以讓大部分遊戲大作保持平均60fps以上的流暢幀率。總的來說RTX 4070 SUPER的光柵化遊戲性能表現與3DMark基準測試的情況比較符合,非常接近RTX 4070 Ti的水平,領先RTX 4070的幅度十分明顯。

·光追與DLSS遊戲性能

光追和DLSS顯然是RTX GPU的絕技,在DLSS的支持下,即便是在遊戲大作中打開最高畫質下的光追特效,RTX 4070 SUPER也能提供相當流暢的幀率,2K分辨率下輕鬆HOLD住所有光追遊戲大作,4K分辨率下也能讓大部分光追遊戲達到流暢運行的水平。從實測來看,RTX 4070 SUPER在2K和4K分辨率下都平均領先了RTX 4070大約15%,達到了RTX 4070 Ti的90%~92%。

▲在《心靈殺手2》中開啓DLSS 3.5新增的光線重建技術之後,水面反光的細節度明顯增加

包含幀生成功能的DLSS 3是讓RTX 4070 SUPER性能飆升的超強黑科技,目前已經有很多遊戲大作都添加了對DLSS 3的支持,而支持DLSS 3.5(新增光線重建技術)的遊戲大作數量也在逐漸增加中。從實測來看,和2K極限畫質未開DLSS相比,開啓DLSS 3之後RTX 4070 SUPER的幀率提升幅度非常大,在《心靈殺手2》中甚至提升了166%之多,在《賽博朋克2077》中也提升了149%,其他遊戲也有33%到91%的提升,可見DLSS 3在提升遊戲幀率方面的效果非常給力,相當於讓顯卡性能免費提升了幾個檔次。此外,光線重建也帶來了更好的畫面效果,可以看到,在《心靈殺手2》中開啓光線重建技術之後,水面反光的細節度明顯增加。

▲開啓DLSS 3.5之後可以看到橫樑上已經幾乎沒有噪點

▲開啓DLSS 3.5之後桌面上已經看不到噪點

其實DLSS 3.5除了可以在遊戲中大顯威力之外,在3D設計等生產力軟件中也能大幅提升效率和畫面質量。例如D5渲染器就提供了對DLSS 3.5的支持,包括了光線重建、超分辨率縮放和幀生成功能。從實測來看,在開啓DLSS 3.5之後,RTX 4070 SUPER的效率提升幅度高達375%,同時渲染出來的畫面噪點明顯降低,因此強烈推薦設計師用戶打開對DLSS 3.5的支持,享受最完美的渲染效率與效果。

DLSS 3(包含Reflex)除了可以大幅提升遊戲幀率,還可以降低幀延遲和操作延遲,提升玩家操控的響應速度。從FrameView監測的PCL延遲來看,開啓DLSS 3後,絕大部分遊戲的延遲都大幅下降,流暢度明顯增加,效果非常顯著。

總的來說,從整個遊戲實測的彙總情況來看,RTX 4070 SUPER的表現更接近RTX 4070 Ti,差距僅有幾個百分點,而相對RTX 4070來講,RTX 4070 SUPER的遊戲性能提升非常明顯,大約有10%~20%的幅度。考慮到RTX 4070 SUPER首發價僅比RTX 4070高了100元,加價幅度僅有2%,因此RTX 4070 SUPER的性價比可謂是暴漲。

此外,大家也可以看到,RTX 4070 SUPER在2K極限畫質設置下可以輕鬆HOLD住主流光追遊戲大作,加上DLSS之後更是可以達到極高的遊戲幀率,確實稱得上是2K高幀率遊戲利器。

當然,就算是把分辨率提升到4K,RTX 4070 SUPER也能搞定大部分遊戲大作,達到平均60fps以上的流暢幀率,酌情降低一點畫質設定的話,達到百幀以上也是完全可以的。因此,對於中高端遊戲玩家來講,RTX 4070 SUPER確實算得上是性價比極高的選擇。

而對於RTX 3070老用戶來講,RTX 4070 SUPER不但帶來了大約50%的綜合性能提升,還提供了RTX 3070沒有的DLSS 3幀生成功能,在支持DLSS 3的遊戲中提升幅度可以實現翻倍,確實是非常值得升級的選擇。

·視頻/圖片編輯與3D渲染

RTX 4070 SUPER擁有多達12GB顯存,還有NVIDIA STUDIO加持,很顯然除了玩遊戲給力之外也是一款能夠大幅提升工作效率的生產力工具。從測試來看,在Blender、V-Ray和Octane的3D渲染輸出項目中,RTX 4070 SUPER相對RTX 4070的領先幅度大約爲11%~21%,比較符合基準性能的差異。在達芬奇Prores422HQ視頻編碼測試中,RTX 4070 SUPER與RTX 4070表現幾乎相同,畢竟它們擁有相同的視頻編解碼器版本與數量。PugetBench for Premiere Pro 2024視頻剪輯綜合測試中,3款RTX 4070系列GPU總分表現比較接近,RTX 4070 SUPER領先RTX 4070大約3%。PugetBench for Photoshop 2024綜合測試三款GPU的總分表現也比較接近,RTX 4070 SUPER同樣平均領先RTX 4070大約3%。

綜合來看,對於有3D設計、視頻/圖片編輯的專業用戶來講,RTX 4070 SUPER可以提供比RTX 4070更高的工作效率,特別是在3D設計類應用中,優勢更加明顯。

·AIGC性能測試

▲在Stable Diffusion中使用NVIDIA TensorRT優化的Unet以大幅提升RTX 40 GPU的出圖效率

使用GPU來實現本地AIGC可以說是當下極爲火熱的應用,特別是Stable Diffusion出圖,已經算得上是非常普及的全民級AI應用了。當然,NVIDIA GPU一直以來對Stable Diffusion的支持都非常到位,不但兼容性完美,還可以提供當下遙遙領先的計算性能。現在NVIDIA還推出了NVIDIA TensorRT,可以讓NVIDIA GPU更高效地運行已經訓練好的神經網絡。從NVIDIA給出的官方參考數據來看,通過TensorRT優化,RTX 40系列GPU的Stable Diffusion出圖效率提升幅度甚至最高可以接近兩倍。

RTX 4070 SUPER擁有12GB大容量顯存,算力也相當出色,確實非常適合用來完成Stable Diffusion本地出圖任務。這裏我們選用Stable Diffusion Automatic1111 WebUI來對RTX 4070 SUPER的出圖效率進行測試,並同時考查在使用NVIDIA TensorRT優化之後,出圖效率會有多大幅度的提升。

首先是Stable Diffusion的基準測試,使用了NVIDIA官方推薦的標準設置:採樣方式爲Euler a、採樣步數爲50、CFG Scale爲7.5、每批次出圖數爲2、批次爲10,最後統計每分鐘出圖數量。從表中可以看到,RTX 4070 SUPER每分鐘出圖數量達到10.43張,非常接近RTX 4070 Ti的10.71張,比RTX 4070則快了約15%。當然,要是和Core i9 13900K相比的話,RTX 4070 SUPER出圖效率是它的133倍。

接下來我們使用NVIDIA TensorRT分別對Stable Diffusion XL和Stable Diffusion V1.5的模型進行了優化,由此來對比優化前後RTX 4070 SUPER出圖效率的變化。在使用Stable Diffusion V1.5的模型時,我們分別選用了512×512、768×768的出圖分辨率,而在使用Stable Diffusion XL模型時選用了1024×1024的出圖分辨率(與訓練模型的圖片分辨率相同),考慮到RTX 4070 SUPER的12GB顯存容量,這個出圖分辨率也是NVIDIA推薦的尺寸。其他參數方面,採樣方式爲Euler a、採樣步數爲50、CFG Scale爲7、每批次出圖數爲1、批次爲10。

在使用NVIDIA TensorRT優化後,RTX 4070 SUPER在Stable Diffusion V1.5的512×512出圖測試中提升幅度超過116%,768×768出圖測試中提升幅度接近170%。Stable Diffusion XL出圖測試中,提升幅度也高達146%,可見NVIDIA TensorRT效果相當給力,非常值得使用。

從Stable Diffusion測試可以看到,RTX 4070 SUPER可以提供相當不錯的AI計算效率,依靠12GB大顯存也可以輕鬆完成Stable Diffusion XL的1024×1024高分辨率出圖,並且還可以通過NVIDIA TensorRT進一步巨幅提升出圖效率,可謂是當下性價比極高的AIGC工作利器。

當然,衆所周知,NVIDIA在AIGC領域保持着絕對的領導者地位,生態環境無可匹敵,“玩AI必須選擇NVIDIA GPU”已經是業界和用戶的共識。而NVIDIA爲RTX 4070 SUPER也注入了強大的AI計算能力,可以輕鬆應對所有支持GPU AI加速的應用(包括AI圖片處理、AI視頻製作、AI文字工具,以及各種支持AI功能的專業設計工具),爲設計師用戶、企業辦公用戶提供了高效且高性價比的解決方案。

·遊戲功率實測

從前面的規格參數可以看到,RTX 4070 SUPER的平均遊戲功率可以控制在200W的水平。從我們用NVIDIA FrameView工具監測的情況來看,5款遊戲大作中RTX 4070 SUPER的平均遊戲功率最高211W,最低166W,綜合平均下來爲195.4W,差不多等於用RTX 3060的功率實現了與RTX 3090相當的性能,不得不說RTX 40系GPU的能效比表現實在是太優秀了。


總結:SUPER經典+SUPER性價比,2K高幀遊戲上佳之選

最後來簡單總結一下。從GPU規格來看,RTX 4070 SUPER非常接近RTX 4070 Ti,相對RTX 4070有着顯著的升級,而從各種遊戲與3D渲染類生產力工具的性能對比來看,RTX 4070 SUPER也確實非常接近RTX 4070 Ti,僅有幾個百分點的差距,而相對RTX 4070的升級幅度則達到了10%~20%,首發價僅比RTX 4070高出100元,性價比算得上是暴增了。從絕對性能來看,RTX 4070 SUPER確實可以在2K極限畫質下輕鬆搞定各種光追遊戲大作,提供足夠流暢的低延遲高幀率體驗,甚至在4K分辨率下也能搞定大部分遊戲,特別適合中高端遊戲玩家選擇。

此外,DLSS 3/3.5也爲RTX 4070 SUPER帶來了免費的巨幅遊戲幀率與畫質提升,像是《賽博朋克2077》和《心靈殺手2》的幀率提升甚至分別高達149%和166%。而DLSS 3.5新增的光線重建技術更是大幅提升了畫面渲染精度,爲玩家帶來了更出色的視覺體驗。目前支持DLSS 3的遊戲大作已經非常多,而未來的遊戲大作也普遍會提供對DLSS 3/3.5的支持,這也使得RTX 4070 SUPER的購買價值進一步劇增。

此外,DLSS 3/3.5不光在遊戲中大展拳腳,很多3D設計工具軟件也提供了對它的支持,例如D5渲染器,在開啓DLSS 3.5之後,不但效率大增,渲染畫面的降噪效果也提升明顯。未來也會有更多的生產力工具提供對DLSS 3.5的支持,因此對於設計師用戶來講,擁有RTX 40系列GPU就是享受這些先進功能、提升工作效率與質量的前提。

專業設計方面,RTX 4070 SUPER本身就具備十分接近RTX 4070 Ti的計算能力,而12GB GDDR6X大顯存也在各種生產力工具中佔據優勢。更重要的是,各種主流生產力工具都針對NVIDIA GPU的黑科技進行了優化,CUDA生態環境無與倫比,這也讓RTX 4070 SUPER成爲了設計師用戶的高性價比之選。此外,在AIGC方面,NVIDIA TensorRT巨幅提升了RTX 40 GPU在Stable Diffusion中的出圖速度,讓選擇RTX 4070 SUPER來完成AI出圖任務的用戶獲得了免費的效率提升,進一步鞏固了RTX 40 GPU作爲首選AI加速工具的霸主地位。

總的來說,RTX 4070 SUPER作爲新一代SUPER系列GPU的先鋒,確實重現了當年SUPER系列GPU的經典,也擁有SUPER級別的超高性價比,非常值得中高端遊戲玩家與AI用戶選擇。

英偉達GeForce RTX 40 Super系列現已上市,請到京東DIY Super超能年貨節上選購GeForce RTX 4070 Super/80 Super 公版和合作夥伴顯卡。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com