DLSS 4顯神威,RTX 5090 D信仰卡皇降臨 ROG 夜神 RTX 5090 D測評

採用全新Blackwell架構的RTX 5090 D終於在1月24日正式迎來性能解禁時間點。華碩全新打造的ASTRAL夜神系列發燒級遊戲顯卡也在第一時間加入了RTX 5090 D的型號,其中的ROG ASTRAL夜神RTX5090 D O32G GAMING(以下簡稱RTX 5090 D夜神),則堪稱比ROG STRIX系列更高端的信仰級旗艦神器。

RTX 5090 D官方規格介紹

▲RTX 5090 D採用GB202芯片(上圖),在此基礎上減少了一部分SM單元和編解碼器

RTX 50系採用了全新打造的Blackwell架構,有關Blackwell架構的技術解析請參考我們之前的文章(),這裏就不再贅述,而是直接進入GPU規格介紹環節。

RTX 5090 D GPU採用GB202芯片,這款GPU芯片面積高達744mm²,相對上代RTX 4090 D的AD202芯片增加了大約22%,CUDA單元數量提升了49%,升級幅度非常可觀。

由於新架構改進了設計,RTX 5090 D內置的第四代RT Core和第五代Tensor Core相對上代RTX 4090 D巨幅提升,算力升級幅度分別達到了87%和102%。考慮到Blackwell整體設計思路就是面向AI渲染和新的DLSS 4黑科技,所以這樣的升級也完全合理。

傳統的紋理單元和光柵單元方面,RTX 5090 D相對RTX 4090 D分別提升了49%和9%。顯存部分,RTX 5090 D是全球首款使用GDDR7的GPU,顯存位寬更是達到了512bit,傳輸速率提升到28Gbps,因此顯存帶寬相對RTX 4090 D增加了78%,不管是對於高分辨率光追遊戲還是AIGC應用,顯存系統的大幅升級都會帶來更多的收益。

視頻編解碼器方面,RTX 5090 D搭載了三個第九代編碼器和兩個第六代解碼器,相對RTX 4090 D的兩個第八代編碼器和一個第五代解碼器來講也是巨幅升級。而且RTX 5090 D增加了對H.265/10bit/4:2:2格式視頻編解碼的支持,實用性也大大增加。

RTX 5090 D官方給出的整板功率爲575W,配備16Pin輔助供電,而像RTX 5090 D夜神這樣的超公版,則會將功率上限升級到600W,從而提供更強的性能。

接下來就讓我們一起看看RTX 5090 D夜神顯卡實物。

ROG ASTRAL夜神RTX5090 D O32G GAMING圖賞

ROG ASTRAL夜神RTX5090 D O32G GAMING採用了全新的ROG Astral系列外觀設計,靈感源自廣袤無垠、美輪美奐的宇宙,彰顯對探索與開拓新邊界的不懈追求。從整體視覺來看,相對之前的ROG STRIX系列顯得更加沉穩大氣,定位也更高。

ROG ASTRAL 夜神 RTX5090 D創新使用了四風扇設計,除了正面三個軸流風扇之外,還在背面進氣格柵位置添加了一個風扇,提升20%氣流和風壓,帶來更好的散熱效果。此外,顯卡還搭載了華碩專利真空腔均熱板、MaxContact鏡面直觸技術、3.8槽散熱片、相變GPU導熱墊,爲RTX 5090 D提供強大的散熱支援。

用料部分,ROG ASTRAL 夜神 RTX5090 D配備了80A晶體管,比標準規格高出35%的功率支持,大幅增強了供電穩定性和超頻潛力。顯卡還使用了保護性電路塗層,採用全自動化製程,有效提升了顯卡的可靠性和耐用度。因此,它的整板功率上限高達600W,相比公版的575W規格更高,GPU頻率也提升到了2580 MHz,高於公版的2410 MHz,性能自然也高於公版。

此外,ROG ASTRAL 夜神 RTX5090 D還配備了超硬的金屬外殼,採用壓鑄金屬框架、護蓋、背板和304不鏽鋼I/O擋板,配備顯卡支架,讓顯卡的防護能力達到超高的水準。

在顯卡頂部,可以看到顯卡提供了雙FanConnect II風扇接口,可以將機箱風扇直接連接到顯卡上,根據CPU和GPU溫度來調節風扇轉速,改善整個機箱的散熱環境。

顯卡配備16pin輔助供電接口,同時還提供了雙BIOS開關,可以在靜音模式和性能模式之間快速切換,滿足玩家不同的使用需求。

個性化方面,顯卡當然支持AURA SYNC神光同步,而且在頂部提供了一條燈帶,視覺效果酷炫而不過分張揚。

接口部分,顯卡提供了三個DP 2.1b和兩個HDMI 2.1b,最多可以支持四屏輸出。

接下來,讓我們看看它在測試中的實戰表現。

實戰測試:DLSS 4威力驚人,4K幀率暴增數百

測試平臺

顯卡:ROG ASTRAL 夜神 RTX5090 D

處理器:銳龍7 9800X3D

內存:佰維DDR5 6000(C28) 16GB×2

主板:ROG CROSSHAIR X870E HERO

硬盤:WD_BLACK SN850X 2TB

電源:ROG雷神Ⅱ1600W

操作系統:Windows 11專業版24H2

測試平臺部分,我們選擇了銳龍7 9800X3D,將處理器部分的瓶頸效應控制在最小,同時還使用上代的RTX 4090 D與之進行對比。此外,考慮到RTX 5090 D的定位和發燒級玩家實際的使用環境,我們本次遊戲實測都使用4K分辨率。

DLSS 4應用與遊戲測試

▲DLSS 4可以讓遊戲幀率暴增數倍,同時提供更好的畫質,讓4K遊戲也能達到電競級幾百幀的流暢度

本次RTX 50系最大的升級就是帶來了DLSS 4,在全新Transformer模型加持下,DLSS 4不但能夠提供更好的畫質和效率,還能通過多幀生成技術巨幅提升遊戲幀率,讓4K遊戲大作能夠實現像電競網遊那樣數百幀的超高流暢度。因此,我們決定先來看看DLSS 4遊戲測試的情況。

首發宣佈支持DLSS 4的遊戲與應用有75款,到目前爲止已經有一部分隨着RTX 5090 FE的性能解禁更新了對DLSS 4的支持補丁。當然,由於我們測試在此時間之前已經完成,所以使用的是NVIDIA提供的幾個遊戲的DLSS 4測試分支。在原生支持DLSS 4的遊戲中,我們可以選擇多幀生成的倍率(4×、3×、2×),而在非原生支持DLSS 4的部分遊戲中,我們也可以通過NVIDIA APP來設置使用的模型(新的Transformer或者上代的CNN)與多幀生成倍率。

在3DMark新增的DLSS 4測試中,開啓4×多幀生成的RTX 5090 D領先只支持2×幀生成(DLSS 3)的RTX 4090 D的幅度高達162%。同時,我們也可以看到,開啓4×幀生成之後,RTX 5090 D的幀率相對原生幀率提升了449%,相對RTX 4090 D的原生幀率提升幅度更是高達714%,可見DLSS 4的多幀生成效果確實非常給力。

▲RTX 5090 D在4K極限光追畫質設置下的《賽博朋克2077》中開啓DLSS 4 和多幀生成

在《賽博朋克2077》的DLSS 4測試分支版本中,我們可以詳細比較RTX 5090 D使用Transformer模型的DLSS 4模式不同倍率幀生成設置下的幀率,也可以比較CNN和Transformer模型同在2×幀生成下的效率(使用CNN模型的DLSS 3只支持2×幀生成)。在DLSS 4模式下,啓用4×、3×和2×幀生成,RTX 5090 D的幀率相對原生分別提升746%、571%和377%。同時,使用Transformer模型實現2×幀生成相對DLSS 3的CNN模型也有7%的幀率提升。RTX 4090 D在《賽博朋克2077》中只能選擇使用CNN模型的DLSS 3模式,因此只支持2×幀生成,而擁有4×幀生成的RTX 5090 D幀率比它高160%,相對它的原生幀率更是提升了誇張的1038%。

▲RTX 5090 D在4K極限光追畫質設置下的《霍格沃茲之遺》中開啓DLSS 4 和多幀生成

《霍格沃茲之遺》的測試分支中,4×幀生成和3×幀生成使用了Transformer模型,在2×幀生成模式下,則使用了CNN模型。RTX 5090 D使用DLSS 4和4×幀生成,相對原生的幀率提升了309%,3×提升了195%,使用上代的DLSS 3 + 2×幀生成模式提升了97%。和RTX 4090 D的DLSS 3 + 2×幀生成相比,最高提升幅度達到了108%,和RTX 4090 D原生幀率比,提升幅度最高432%。此外,從我們的測試來看,使用4×幀生成的渲染延遲與平均PC延遲與2×幀生成相比並沒有明顯變化,所以大家完全不用擔心這個問題。

▲RTX 5090 D在《漫威爭鋒》中使用Override模式開啓DLSS 4和多幀生成

《漫威爭鋒》可以在NVIDIA APP中使用Override模式來開啓DLSS 4和多幀生成。在 4×/3×幀生成模式下,RTX 5090 D的幀率相對於原生分別提升了289%和217%,而在2×幀生成模式下,使用Transformer模型相對CNN模型也提升了6%。RTX 5090 D採用4×幀生成的幀率相對採用DLSS 3 + 2×幀生成的RTX 4090 D提升了137%,和原生比更是提升了419%。延遲部分,可以看到RTX 5090 D在幾種幀生成比例下的渲染延遲與PC延遲差別都很小,可見對於玩家來講直接啓用DLSS 4的4×幀生成無疑是獲得高幀率和流暢操作的最佳選擇。

▲RTX 5090 D在D5渲染器中使用Override模式開啓DLSS 4和多幀生成也可以大幅提升預覽幀率

DLSS 4在3D渲染類生產力軟件中也能大幅提升預覽效率,目前D5渲染器可以通過Override模式來支持DLSS 4和多幀生成。開啓DLSS 4和4×幀生成,RTX 5090 D的幀率相比原生(關閉超分辨率、光線重建和幀生成)提升了291%,比DLSS 3和2×幀生成模式的RTX 4090 D提升了207%,比它的原生幀率提升了561%。可以說這對於設計師用戶來說堪稱史詩級的體驗升級。

基準性能測試

前面DLSS 4的測試成績確實讓我們非常驚喜,而接下來我們繼續從基準測試項目來了解RTX 5090 D在規模提升之後相對上代的常規理論性能提升。

3DMark的DX11和DX12光柵化渲染測試項目中,RTX 5090 D相對RTX 4090 D的優勢都超過了35%,在DX12項目中的優勢更高一些,最高甚至可達44%。在DX12U和光追項目(SpeedWay和Port Royal)中,RTX 5090 D的優勢更大,最高的項目提升了57%,新的光追單元效率確實更高。綜合傳統基準性能部分的成績來看,RTX 5090 D平均領先RTX 4090 D的幅度大約爲44%。

常規遊戲性能測試

接下來我們看看4K極限畫質設定下光柵化遊戲性能的表現。RTX 5090 D相對RTX 4090 D的平均幀率提升幅度從24%到59%不等,平均提升幅度大約爲35%,其中《賽博朋克2077》《永劫無間》提升幅度都非常驚人,都超過了50%。而在影響遊戲流暢度的1% Low幀方面,RTX 5090 D在《博德之門3》中甚至領先了RTX 4090 D大約60%,綜合全部遊戲平均領先的幅度是34%。

光追與DLSS遊戲測試

在打開光追和DLSS(CNN模型)的主流3A遊戲中,RTX 5090 D相對RTX 4090 D的平均幀優勢大約在16%~39%,平均升級幅度大約爲29%。1% Low幀部分,RTX 5090 D相對RTX 4090 D的領先幅度最高達39%,平均領先21%。可見無論是絕對幀率還是遊戲平滑度,RTX 5090 D都是大幅超越上代RTX 4090 D的存在。

生產力性能測試

RTX 5090 D提供了更多的CUDA單元和更爲強大的32GB/512bit/GDDR7顯存,因此在各種3D設計工具軟件中也會提供更高的執行效率。從測試結果來看,RTX 5090 D在Blender中相對RTX 4090 D有32%~45%的提升;在V-Ray GPU RTX渲染中有37%的提升;在SPECView2020V3.1中的平均提升幅度則爲12%。由此可見,對於經常要用到3D設計工具的用戶來講,RTX 5090 D相對上代提升巨大,是更加高效的升級選擇。此外,RTX 5090 D新增了對4:2:2/10bit格式視頻編解碼的支持,我們使用Davinci Resolve 19 + Voukoder進行了編碼測試對比,有明顯的提升。

▲RTX 5090 D在剪映中可以同時流暢解碼5條H.265/4:2:2/10bit視頻不掉幀,而銳龍9 9950X這樣的旗艦U在面對這樣的解碼需求時也會嚴重卡頓

RTX 5090 D在視頻解碼方面同樣十分強大,它配備的兩個第六代解碼器在剪映中可以同時流暢解碼5條H.265/4:2:2/10bit視頻不掉幀。但如果用CPU解碼,就算是擁有16核32線程的銳龍9 9950X也會出現嚴重卡頓。可見對於視頻剪輯師來說,RTX 5090 D新一代的編解碼器確實會帶來更高的工作效率。

AI性能測試

▲RTX 5090 D在UL Procyon的AI出圖測試中使用FLUX.1模型/FP4精度設置,顯存佔用大約20GB,比FP8模式降低了5GB左右,效率也高出大約70%

Blackwell架構的一大革新就是內置的第五代Tensor Core支持FP4精度的計算,相對Ada架構的Tensor Core性能提升了一倍。我們這裏使用UL Procyon的AI生圖測試來考查RTX 5090 D的在FP8和FP4精度下的AI性能。

從測試來看,同樣使用FLUX.1模型生成1024×1024的圖片,RTX 5090 D在FP4下的出圖速度相當於FP8模式下的170%,顯存佔用也減少了20%左右。RTX 4090 D不支持FP4模式,所以從FP8模式切換到FP4模式出圖時間幾乎增加了一倍。RTX 5090 D在FP4模式下出圖速度大約比RTX 4090 D快了413%。由此可見,對於需要快速AI出圖、且對精度要求並不苛刻的用戶來講,支持FP4精度的RTX 5090 D無疑是高效神器。

功率與溫度表現

▲RTX 5090 D夜神滿載考機整板功率600W,GPU溫度在66℃左右,風扇噪聲也控制得很好

我們對RTX 5090 D夜神進行滿載考機測試,可以看到這時候整板功率達到了600W上限,GPU功率則保持在230W水平。得益於3.8槽的四風扇散熱器,RTX 5090 D夜神的GPU考機溫度僅有66℃左右,噪聲也控制得很好,達到了旗艦風冷顯卡中的頂級水平,即便發燒級玩家長時間高強度玩遊戲或AI創作,也不用擔心過熱的問題。

04總結:信仰卡皇,嚐鮮DLSS 4與AI渲染的終極選擇

Blackwell架構從硬件層面完成了從傳統渲染時代到AI渲染時代的進化,突破了製造工藝、功率等硬件條件帶來的性能瓶頸,爲業界指明瞭GPU設計的方向。毫無疑問,未來的GPU完全擁抱AI是不可阻擋的趨勢,NVIDIA在這方面是沒有爭議的領軍者,整套生態圈的優勢無可匹敵。

以Blackewell架構爲基礎,RTX 5090 D帶來了一系列基於AI技術的新功能,爲玩家提供了更加極致的遊戲體驗。RTX 50系GPU獨享採用Transformer新模型的DLSS 4以及多幀生成技術,不但可以讓遊戲幀率暴增數倍,還可以實現比DLSS 3更好的畫質,這對於發燒級玩家來說確實擁有不可抵擋的吸引力。

在AI和生產力方面,RTX 5090 D新增對FP4精度的優化支持,能夠提供更快的AI計算速度(也爲AI渲染提供了強大的硬件基礎),同時它還擁有當前最高規格的32GB/512bit/GDDR7顯存配置,對於AIGC用戶來講是當下最高效的工具。此外,它還內置了3×第九代編碼器和2×第六代解碼器,新增支持4:2:2/10bit編解碼,對於視頻剪輯用戶來說也能大幅提升工作效率。此外,在3D設計方面,RTX 5090 D也提供了遠超上代RTX 4090 D的性能。綜上所述,對於追求極致效率的設計師用戶來講,RTX 5090 D是目前毫無爭議的頂配之選。

RTX 5090 D夜神作爲RTX 5090 D中的信仰級旗艦代表作,擁有600W的頂級性能釋放能力,配備強大的3.8槽四風扇散熱系統,擁有全新打造、霸氣十足、堅固無比的旗艦外觀,確實堪稱專爲發燒級玩家和高端設計師用戶打造的信仰級卡皇。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com