GeForce RTX 4080 SUPER評測:性價比的超級進化,遊戲與AI很能打

在歷經GeForce RTX 4070 SUPER、GeForce RTX 4070 Ti SUPER首發評測之後,SUPER的性價比愈發坐實,就差一款旗艦級定位的SUPER來給NVIDIA這次GeForce RTX GPU SUPER更新畫上句號,而這個重任落在了GeForce RTX 4080 SUPER身上。

從定位和參數上看,GeForce RTX 4080 SUPER就已經相當能打,不僅比GeForce RTX 4080最初定價還便宜了200美元,官方8099元的起售價更爲親民,在性能上也一步到位,摸到了AD103的天花板。是的,GeForce RTX 4080 SUPER如果再向前提升一點點,就真的可以歸入RTX 4090系列了。

玩笑歸玩笑,GeForce RTX 4080 SUPER展現出的性價比再次讓我們感受到了NVIDIA對SUPER系列升級下足了本錢,這也意味着這塊GPU在生成式AI、DLSS和光線追蹤遊戲、內容創作上有更強勁的戰鬥力。

那麼事實是否真的如此?現在就讓我們奉上NVIDIA GeForce RTX 4080 SUPER Founders Edition首發評測。

AD103的終極進化

GeForce RTX 4080 SUPER最讓人印象深刻的就是這塊代號AD103-400-A1核心。我們知道AD103保留了所有AD102的主要功能,並使用源自於臺積電4N定製工藝的Ada Lovelace架構,擁有459億個晶體管,核心面積379mm²。

在Ada Lovelace架構中,GPU中包含了若干個GPC(Graphics Processing Clusters,圖形處理集羣),GPC下包含若干個TPC(Texture Processing Clusters,紋理處理簇),若干個流式多處理器(Streaming Multiprocessors,SM),再往下就是CUDA、RT Core、Tensor Core等等。每個GPC之間包含的TPC數量相等,當GPU進行定位區分的時候再進行GPC、TPC的物理屏蔽實現。

完整的AD103包含7個GPC,但每個GPC包含的TPC並不相同。如下圖所示,在6個GPC各擁有6組TPC的同時,還有1個GPC僅有4組TPC。比如,在RTX 40系列發佈時,GeForce RTX 4080是通過屏蔽1組TPC實現的。

有意思的地方來了,同樣採用AD103的GeForce RTX 4080 SUPER顯然不會再做任何核心配置上的讓步,光從核心代號AD103-400-A1就知道這塊GPU並不簡單。是的,GeForce RTX 4080 SUPER即是完整的AD103,包含10,240個CUDA核心、80個RT Core、320個Tensor Core、320個紋理單元和112個ROPs。在內存子系統上則總共包含10,240KB L1緩存,20,480KB寄存器堆,以及65,536KB的L2緩存。

不過需要注意,相對專業級GPU的3個第八代NVENC和3個第五代NVDEC配置, GeForce RTX 4080 SUPER編碼器配置爲2個第八代NVENC和1個第五代NVDEC,以此做出區分,這是消費級GPU常規操作,對遊戲性能和AI加速性能影響不大。

不僅如此, GeForce RTX 4080 SUPER的Boost頻率也來到了2.55GHz,搭配256-bit的16GB GDDR6X,顯存帶寬來到736GB/s,TGP則仍然和RTX 4080持平,爲320W。值得一提的還有不做刪減的64MB L2緩存,這比GeForce RTX 3080的5MB L2緩存提升了12.8倍,這讓遊戲中的這讓光線追蹤,尤其是路徑追蹤從中獲得巨大收益。所搭配的第三代RT Core、第四代Tensor Core,更是能更好的發揮出L2緩存的效果。

至此,CES2024上發佈的三款GeForce RTX SUPER發佈完畢,這裏不妨讓我們用RTX 4080做對比,大致規格對比如下。

黑色裝甲參上

SUPER版本的Founders Edition最大的不同是用作加固的黑色中框變成了深黑色,一下子顯得高級了很多。不過在整體設計思路上變化不大,主要依靠錯位風扇搭配異形PCB的對稱設計,以此改善GPU的散熱情況。

在材質選擇上,GeForce RTX 4080 SUPER Founders Edition講究一體成型,散熱鰭片由99%鋁合金打造,結合重量輕、剛性可靠、導熱性好的特點。同時散熱鰭片再度加厚,變成了三槽位設計,邊框末端的支架孔被隱藏在磁吸的擋板下,僅憑指甲就能撬開,而復原的時候只需要將貼片放回,磁力便會自動吸附。

在風扇選擇上,GeForce RTX 40系列Founders Edition基本將扇葉直徑提升到116mm,在全速運作的時候,每分鐘產生的氣流足以充滿3.5個籃球。並且風扇葉片由增強型玻璃纖維組成,具有彈性,搭配動態軸承可以獲得更好的靜謐性。

風扇下面則是使用了6熱管搭配散熱鰭片的設計,供電則繼續使用了最新的16pin(12VHPWR)接口,機包裝配送了3x8pin轉接線,TGP是320W。

在實際遊戲測試中,GeForce RTX 4080 SUPER Founders Edition表現出的效能特別高,4K遊戲環境中,功耗普遍都被控制在了250W以下。

接口設計則包括了3個DisplayPort 1.4a和1個HDMI 2.1接口。

在壓力測試中,GeForce RTX 4080 SUPER Founders Edition的GPU溫度和表面溫度都不高。比如GPU溫度僅在58℃,紅外線檢測可以看到整個外殼都處在相當清涼的狀態。

開啓SUPER戰鬥力

現在讓我們進入測試環節,測試平臺包括了Core i9-14900K、ROG MAXIMUS Z790 DARK HERO、G.SKILL Trident Z5 DDR5-7200 16GBx2,並配以1250W電源作爲支持。

在基礎性能測試中,主要參考檢測DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal。可以看到GeForce RTX 4080 SUPER比RTX 4070 Ti SUPER提升有20%左右,而如果對比上一代的RTX 3080,提升幅度最高70%。

因此如果使用DLSS 2及以前的常規遊戲,GeForce RTX 4080 SUPER在4K最高畫質下,相對RTX 3080 Ti提升幅度起步45%,最高可達80%。而用GeForce RTX 4080 SUPER對比GeForce RTX 2080 SUPER,提升就相當誇張了,可以從150%到250%。

GeForce RTX 40系列帶來的DLSS 3和DLSS 3.5技術纔是重頭戲,由於第四代Tensor Core性能提升幅度巨大,並輔以光流加速器(Optical Flow Acceleration,OFA)與DLSS相結合的辦法,構建出了一個更爲立體的分析方式,讓GPU實際執行過程壓縮到原本的 1/8。

DLSS 3.5則是一套基於AI的算法,讓畫質和幀率同時提升的解決方案,同時包含DLSS幀生成(FG)與光線重建(RR, Ray Reconstruction)技術搭配,再加上超分辨率(Super Resolution)、DLAA、幀生成(Frame Generation)多種技術融合。

如果用RTX 3090作爲比較就會發現,即便是擁有24GB顯存加持,RTX 3090無論4K還是8K分辨率,在畫面流暢度上都弱於GeForce RTX 4080 SUPER。

而在DLSS 3以後版本的遊戲中,GeForce RTX 4080 SUPER的戰鬥力就體現出來了。這裏我們直接開啓4K最高畫質,開啓光線追蹤或者路徑追蹤。可以看到,GeForce RTX 4080 SUPER對比RTX 3080 Ti提升幅度最高可以從60%到200%以上,而對比RTX 2080 SUPER,最高超過800%,當然是因爲GPU無法推動導致的,而從普遍的結果而言,GeForce RTX 4080 SUPER相對RTX 2080 SUPER提升300%上下不成問題。

甚至DLSS 3與Reflex的融合,也讓GeForce RTX 4080 SUPER在競技類遊戲中有更驚人的表現。特別是在1080p分辨率下,《無畏契約》《反恐精英2》等遊戲都獲得了300FPS以上幀率,並通過Reflex將系統延遲降低到了10ms以下。

這裏我們用開啓DLSS 3.5的《賽博朋克2077》進行畫質對比,可以看到在DLSS 3.5光線重建加持下溼漉的倒影變得清晰自然,同時物體邊緣在暗影中仍然會提現出光反射效果,重點這是在獲得更高幀率前提下實現的。

AI與創作都很能打

接下來是AI測試環節。GeForce RTX 4080 SUPER搭配16GB GDDR6X對生成式AI而言提供了巨大的進步。這裏我們不妨以Stable Diffusion XL作爲參考,Stable Diffusion XL本身運行需要依靠Transformer變換器和卷積神經網絡實現,這兩者均需要GPU進行大規模並行計算,這無疑是NVIDIA最擅長的事情。也正因爲如此,近幾年AI的飛速發展,很大程度上就是NVIDIA GPU技術發展所推進的。

這裏選擇的Stable Diffusion XL在模型體量上相當Stable Diffusion 1.5擴大了3倍,從而導致計算的數據量提升,但也帶來了更好的畫質。這裏以Stable Diffusion Web UI + TensorRT進行配置,用更短的語言描述生成10張分辨率爲768x768的星際航行圖片,每次運算1張圖片,即總共執行10次,採樣步數設置爲50。

文字描述部分爲:epic space battle over a water planet, many ships, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting。通過記錄時間,推算出每分鐘推算圖片效率,參考公式爲60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute。

GeForce RTX 4080 SUPER輕鬆超過近期參與評測的一衆GPU,哪怕是對比同顯存的RTX 4070 Ti SUPER,也有超過25%的性能提升,提升幅度相當明顯。這意味着利用GeForce RTX 4080 SUPER就已經可以很好的進行本地AI部署,無論是現在的文生圖加速、圖生圖,乃至視頻生成,或者大語言模型加速,GeForce RTX 4080 SUPER都已經提供了相當充實的算力基礎。

與此同時,國產軟件D5渲染器還對DLSS 3.5 AI加速提供了支持。由於DLSS 3.5使用了比DLSS 3多5倍的數據訓練,因此也可以更好的識別光線追蹤效果,在時間、空間數據中做出更合理的判斷,從而實現高效率的擴展。

實際測試的Minimalist Villa 1場景中,GeForce RTX 4080 SUPER一下子讓D5渲染器的運行程度變得極爲流暢,輕鬆超過了60FPS的流暢度,就算相比一週前的RTX 4070 Ti SUPER也提升了35%以上。

不僅如此,DLSS 3.5的加入還讓場景發生了質變。當DLSS 3.5關閉後,地面的反光變得非常粗糙,左側的玻璃也喪失了折射效果與通透性,同時幀率也降低到了不到原來的一半。

最後一項AI測試,則是利用ON1 Resize AI 2022對圖片分辨率進行提升。可以看到GeForce RTX 4080 SUPER用最短的時間完成了照片的分辨率提升,相對RTX 3080節省了一半的時間。

海量的CUDA Core和RT Core同樣也是GeForce RTX 4080 SUPER的強項。在V-Ray 5 Benchmark中,會分別對CUDA Core和RTX進行檢測,藉助更多的CUDA Core數量,GeForce RTX 4080 SUPER無論CUDA性能還是光線追蹤都有很強勁的表現,相對RTX 3080提升60%。

另外一個Octane Render RTX則是用來測試GPU的光線追蹤性能表現,在複雜場景下考驗GPU每秒產生的樣本率,提升幅度很高,GeForce RTX 4080 SUPER比RTX 3080提升了50%。

另外Blender Benchmark引入的Moster、Junkshop、Classroom三個參考場景,GeForce RTX 4080 SUPER相對RTX 3080提升最高超過80%。

在專業軟件創作環節,我們引用了SPECviewperf 2020作爲參考,這是一款專門考驗OpenGL和Direct X API下運行的系統的3D圖形性能,軟件包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。GeForce RTX 4080 SUPER能夠做到相對RTX 3080在專業應用領域,從50%到將近90%的幀率提升。

寫在最後:定義SUPER天花板

GeForce RTX 4080 SUPER厲害的地方在於,用相對RTX 4080更便宜定價策略就達成了當前SUPER天花板的成就,滿配的AD103 GPU沒有讓人失望,在相對RTX 4080功耗沒有提升的狀態下,戰鬥力表現驚人,在4K分辨率下DLSS 3遊戲的表現。

事實上,GeForce RTX 4080 SUPER已經是一款可以特效拉滿,在4K分辨率下流暢運行所有大作的GPU,你要做的就是進入遊戲,由遊戲的檢測系統自動調整最高配置,或者手動將畫質滑塊拉到頭,體驗上玩遊戲從不看畫質設置的人生巔峯,這時候8099元的定價就會顯得特別划算。

在遊戲之外,GeForce RTX 4080 SUPER也展現出了自己全能的地位,無論用Stable Diffusion XL加速生成式AI,用DLSS 3.5加速D5渲染器,或者海量的CUDA Core加速3dsmax、CATIA等專業軟件,或者換上NVIDIA Studio驅動,接入NVIDIA Omniverse的元宇宙。

GeForce RTX 4080 SUPER所加持的PC可以輕易變成全能型選手,就算你是專業的藝術創作、設計、遊戲開發人員,也可以從這塊GPU或者專業應用加速的暢快感。特別是GeForce RTX 4080 SUPER與16GB GDDR6X大顯存配合下的卓越AI表現,可以讓用戶不再給在線的AI服務付費,依靠GeForce RTX 4080 SUPER的本地AI性能,輕鬆實現文生圖、視頻生成、大語言模型加速,爲即將到來的本地化AI時代提供充分的算力基礎。

而這款代表着當下SUPER系列最高天花板的產品,也很好的詮釋了性價比。如果你想獲得充足的AI性能,並以4K最高畫質流暢運行3A大作,還想輕鬆應對視頻、圖像或是專業軟件工作,那麼GeForce RTX 4080 SUPER就是現在最合適的那一款GPU。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com