索泰GeForce RTX 4090 D TRINITY評測:AI天花板,遊戲無敵手

在衆所周知的原因推動下,想要以理想的價格買到GeForce RTX 4090已然不太現實,所幸黃氏刀法着實精準,用GeForce RTX 4090 D實現了合規與性能之間的新平衡點。並且由於沒有Founders Edition版本,國內發售的重任落到了幾家AIC品牌上,作爲NVIDIA好基友的索泰自然是其中之一。

手握GeForce RTX 4090 D GPU的索泰自然不會閒着,索泰GeForce RTX 4090 D PGF、索泰GeForce RTX 4090 D AMP AIRO、索泰GeForce RTX 4090 D天啓、索泰GeForce RTX 4090 D TRINITY 月白上齊一套,其中索泰GeForce RTX 4090 D TRINITY 月白不僅上架電商,在衆友商定價中,也是頗具性價比的一款。

那麼GeForce RTX 4090 D的表現究竟如何?評測就此奉上。

AD102的新篇章

與GeForce RTX 4090所使用的AD102-300-A1不同,索泰GeForce RTX 4090 D TRINITY 月白採用的GPU型號爲AD102-250-A1。兩款GPU均源自相同的AD102,並以此爲基礎向下屏蔽單元,實現不同的性能定位。

從整體上看,完整的AD102包含了12個圖形處理集羣(Graphics Processing Clusters,GPC),72個紋理處理簇(Texture Processing Clusters,TPC),144個流式多處理器(Streaming Multiprocessors,SM),以及搭配了12個32-bit控制器的顯存接口,共計384-bit。

同時每個GPC獨立使用1個光柵引擎(Raster Engine,RE),6個TPC,2個光柵處理分區(Raster Operations partitions)。其中每個光柵處理分區包含8個光柵處理單元(Raster Operations,ROP),因此總共16個ROP。

每個TPC下包含2個流式多處理器(Streaming Multiprocessors,SM)。從Maxwell架構開始,SM之下細分出了處理塊(Sub-Core)概念,AD102中每個SM包含4個處理塊,每個處理塊包含1個64KB寄存器堆,1個L0指令緩存,1個Warp調度器,1個調度單元,4個加載/存儲單元,1個特殊功能單元(Special Function Unit,SFU)用於執行超越函數指令(比如正弦、餘弦、倒數、平方根等)和圖形差值算法指令。包含16個專門用於FP32的CUDA Core,16個可以在FP32和INT32之間切換的CUDA Core,因此共計32個CUDA。

此外每個SM還包含1個第三代RT Core,4個第四代Tensor Core,4個紋理單元(Texture Units),256KB寄存器堆,以及可根據需求進行配置的128KB L1共享緩存。

有意思的是,你會發現無論GeForce RTX 4090還是GeForce RTX 4090 D其實都沒有用到完整的AD102核心,而是通過禁用GPC或者TPC的數量從而實現不同的定位。而GeForce RTX 4090 D相當於在GeForce RTX 4090的基礎上再屏蔽1組GPC實現。

因此索泰GeForce RTX 4090 D TRINITY 月白總共包含57個TPC,114個SM,14592個CUDA Core,456個第四代Tensor Core,114個第三代RT Core。大致對比如下:

可以看到在顯存配置和GPU頻率上,GeForce RTX 4090 D沒有做出刪減,同樣保持了24GB GDDR6X 384-bit顯存,等效21Gbps頻率,1008GB/s的顯存帶寬。另外L2緩存容量也維持在了72MB,GPU頻率2.52GHz。大容量顯存和L2緩存的配置,都仍然能夠給後續的遊戲,特別是AI加速性能提供優秀的基礎。

在72MB超大L2緩存的加持下,第三代RT Core和第四代Tenor Core作爲提升遊戲特效性能的主力也有了更多的用武之地。其中,第三代RT Core不僅可以通過L2緩存在路徑追蹤從中獲得巨大收益,本身相對第二代RT Core也提升了射線/三角形求交測試吞吐量,並引入透明度微圖引擎(Opacity Micro-Map,OMM)和位移式微型網面引擎(Displaced Micro-Mesh,DMM)。

第四代Tenor Core則是當下火熱的DLSS 3以及開始普及的DLSS 3.5的重要組成部分。這是一套利用光流加速器實現像素級的測量,並通過雲端的夜以繼日的尋找提升高質量圖像的途徑,這使得GPU擺脫了渲染重建高分辨率方法,讓渲染工作大幅度減少,以兩幀爲例,DLSS 3會承擔起第一幀的3/4的工作和第二幀的所有工作,實際上GPU只需要完成其中的1/8的渲染即可,從而節省了大量的計算資源。

而接下來的DLSS 3.5則能同時包含DLSS幀生成(FG)與光線重建(RR, Ray Reconstruction)技術搭配,再加上超分辨率(Super Resolution)、DLAA、幀生成(Frame Generation)多種技術融合。最終構建出一套高效的運行方式,但所有的前提都依靠第四代Tenor Core和光流加速器配合實現的。

此外,索泰GeForce RTX 4090 D TRINITY 月白還包括第八代NVENC和第五代NVDEC編解碼器對媒體提供支持,從而在諸如AV1編解碼加速上獲得更好的體驗。

全副武裝的TRINITY

讓我們把焦點放回顯卡本身,索泰GeForce RTX 4090 D TRINITY提供了月白和黑色兩種顏色可選,在散熱上主要選擇了IceStorm 3.0散熱系統,優化了空氣散熱效能,並支持SPECTRA 2.0 ARGB燈效。

其中IceStorm 3.0散熱系統提升了散熱效能,提供了3個110mm的盾鱗2.0風扇,在提升扇葉面積的同時,也優化了每一片扇葉的曲率和鱗狀仿生條紋,從而實現提升風扇風量、風壓和風流的效果。

風扇下方提供了一塊大面積VC均熱板覆蓋GPU核心,以實現快速導熱至熱管陣列。表面拋光工藝可進一步減少與GPU接觸間隙,使導熱效率更高。而顯卡本身的厚度也達到了3.5個槽位,原因在於內置加厚、加高的鍍鎳散熱鰭片模組,從而實現更好的導熱能力。

另外熱管部分也進行了升級,增加熱管壁厚度和內壁脈絡狀導液溝槽,升級替換更高導熱係數的導熱介質,加大冷凝液與熱管內壁接觸面積的同時,進一步加快冷凝液導熱循環。

索泰採用的背板、散熱器多點分佈安裝的方式,讓結構得以加強。並使用了鋁合金加固骨骼結構件形式,確保PCB均勻受力,減少彎曲。另外合金背板本身也提升了顯卡的靜電防護能力。

GPU背面則使用了加固和背板裸露的形式,科技感拉滿。同時支架沒有上保修貼,也方便顯卡後期的改裝。

因此在壓力測試下,索泰GeForce RTX 4090 D TRINITY 月白的GPU可以保持再65℃左右的清涼狀態。如果用紅外線檢測,在室溫22℃的環境中,也可以看到整張顯卡的發熱量不高,長時間高負荷工作是沒有問題的。

SPECTRA 2.0 ARGB燈效系統本身支持1600萬色ARGB和多種燈效模式,並且可以通過軟件調節變換預設燈效。

有意思的是,在索泰GeForce RTX 4090 D TRINITY 月白電源後方還提供了一個5V 3pin的RGB接口,還可以給通過顯卡製造RGB同步效果,做到在遊戲中即刻感受到隨時變換的RGB氛圍。

在周邊配件上,索泰GeForce RTX 4090 D TRINITY 月白則顯得比較簡約,包括紙質說明文檔、1個二次元立牌,1個顯卡支架和1根RGB同步線,以及1根16pin(12VHPWR)轉8pin x4的電源線。

除了使用16pin(12VHPWR)電源口,顯示接口包括3個DisplayPort 1.4a和1個HDMI 2.1接口。

實踐見真章

現在讓我們進入實戰環節。測試平臺包括了Core i9-14900K、ROG MAXIMUS Z790 DARK HERO、G.SKILL Trident Z5 DDR5-7200 16GBx2,並配以1250W電源作爲支持。

在基礎性能測試中,主要參考檢測DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal。能顧看到索泰GeForce RTX 4090 D TRINITY 月白表現是非常強勁的,相對RTX 4080 SUPER可以有20%乃至30%的性能提升,距離RTX 4090只有3%到6%的差距。

在常規的DLSS 2遊戲中,索泰GeForce RTX 4090 D TRINITY 月白自然也表現出了強勁的戰鬥力,在4K分辨率最高畫質並且開啓光線追蹤的前提下,提升超過30%以上。相對RTX 3080 Ti性能則超過110%乃至更多了。

前面提到,GeForce RTX 40系列帶來的DLSS 3和DLSS 3.5技術纔是將遊戲體驗拉開差距的一套算法。如果用3DMark DLSS 3 Feature作爲比較,就會看到明顯的提升差距,索泰GeForce RTX 4090 D TRINITY 月白表現非常突出,在8K分辨率下也能輕鬆達到97FPS以上,這是絕大多數GPU不敢想象的。

因此在DLSS 3遊戲中,索泰GeForce RTX 4090 D TRINITY 月白的戰鬥力立馬就展現出來了,相對RTX 4080 SUPER提升有35%到40%,而相對RTX 3080 Ti提升120%以上,最高可以超過300%。

同時DLSS 3.5也帶來了更好的畫質表現,得益於光線重建(RR, Ray Reconstruction)加入,遊戲畫面得到更明顯的提升。比如在《賽博朋克2077》畫面進行對比,無論是車燈在地面的漫反射,還是遠處的霓虹燈光,在DLSS 3.5光線重建加持下獲得更爲自然的效果,重點這是在獲得更高幀率前提下實現的。

另外索泰GeForce RTX 4090 D TRINITY 月白帶來的DLSS 3本身也融合了Reflex技術,可以更有效的降低遊戲時候的系統響應延遲。比如在1080p分辨率下,索泰GeForce RTX 4090 D TRINITY 月白能夠讓《CS2》、《APEX英雄》等競技遊戲獲得遠高於顯示器刷新率的幀率同時,還將系統延遲降低到10ms以下,這也是GeForce RTX 40的傳統藝能了。

AI與創作一把手

毋庸置疑,了24GB GDDR6X 384-bit顯存的索泰GeForce RTX 4090 D TRINITY 月白厲害的地方還在於內容創作和生成式AI上的表現。例如近段時間火熱的Stable Diffusion XL本身運行需要依靠Transformer變換器和卷積神經網絡實現,這兩者均需要GPU進行大規模並行計算,這無疑是NVIDIA最擅長的事情。也正因爲如此,近幾年AI的飛速發展,很大程度上就是NVIDIA GPU技術發展所推進的。

其中Stable Diffusion XL在模型體量上相當Stable Diffusion 1.5擴大了3倍,從而導致計算的數據量提升,但也帶來了更好的畫質。這裏以Stable Diffusion Web UI + TensorRT進行配置,用更短的語言描述生成10張分辨率爲768x768的星際航行圖片,每次運算1張圖片,即總共執行10次,採樣步數設置爲50。

文字描述部分爲:epic space battle over a water planet, many ships, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting。通過記錄時間,推算出每分鐘推算圖片效率,參考公式爲60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute。

得益於更大的內存,索泰GeForce RTX 4090 D TRINITY 月白領先幅度是其他GPU無法比擬的,哪怕是RTX 4080 SUPER也能有翻倍的提升,並且與RTX 4090相當接近。

而就在最近,UL Benchmark旗下的Procyon正式在AI Image Generation Benchmark子項中加入了Stable Diffusion 1.5和Stable Diffusion XL支持,測試過程有效避免了初次運行時的數據干擾,讓實際測試性能變得更具有參考性。

可以看到索泰GeForce RTX 4090 D TRINITY 月白在AI Image Generation Benchmark的Stable Diffusion 1.5和Stable Diffusion XL基準測試下,戰鬥力是非常驚人的。Stable Diffusion 1.5(FP16)可以做到1.299s/image,Stable Diffusion XL(FP16)則可以做到11.535s/image,也就是在短短數秒內就可以完成一張文生圖,並且整體評分與RTX 4090差距不大,同時比RTX 4080 SUPER,RTX 4070 Ti SUPER都拉出了明顯的距離。

同樣,DLSS 3.5也已經作爲AI加速部分應用於專業軟件中,D5渲染器已經率先展開了支持。DLSS 3.5在D5渲染器中比DLSS 3多出了5倍的訓練量,因此也可以更好的識別光線追蹤效果,在時間、空間數據中做出更合理的判斷,從而實現高效率的擴展。

這裏不妨讓我們做一下效果對比,窗戶上的光斑自然度,以及噪點控制,DLSS 3.5下都給予了更好的畫質。

同時DLSS 3.5也給D5渲染器帶來了更流暢的幀率。索泰GeForce RTX 4090 D TRINITY 月白可以輕鬆在複雜的建築場景中以高於75FPS的幀率運行。這意味着就算是高負荷的渲染場景,索泰GeForce RTX 4090 D TRINITY 月白也能給予類似於遊戲的順暢感。

AI加速的另一個應用是利用ON1 Resize AI 2022對圖片分辨率進行提升,這裏使用五個場景進行測試並記錄平均時間。也可以看到索泰GeForce RTX 4090 D TRINITY 月白節省了更多的AI推算時間,比RTX 4080 SUPER快上12%左右。

然後是傳統的內容創作環節。Blender Benchmark引入的Moster、Junkshop、Classroom三個參考場景中,索泰GeForce RTX 4090 D TRINITY 月白可以相對RTX 4080 SUPER提升20%到30%。

同樣在V-Ray 5 Benchmark中,分別對CUDA Core和RTX進行檢測,藉助更多的CUDA Core數量,索泰GeForce RTX 4090 D TRINITY 月白的領先幅度也近乎是翻倍的。

Octane Render RTX則是用來測試GPU的光線追蹤性能表現,在複雜場景下考驗GPU每秒產生的樣本率,索泰GeForce RTX 4090 D TRINITY 月白相對RTX 4080 SUPER的領先幅度也達到了30%。

SPECviewperf用來考驗OpenGL和Direct X API的3D圖形性能,測試場景包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。索泰GeForce RTX 4090 D TRINITY 月白已經能夠輕鬆應付所有專業軟件的運行,大顯存和海量CUDA起到了絕對性的優勢。

寫在最後:旗艦級優選

憑藉着強勁的性能,索泰GeForce RTX 4090 D TRINITY 月白給人留下了頗爲深刻的印象。特別是在RTX 4090難以購買的現況下,索泰GeForce RTX 4090 D TRINITY 月白已經能夠很好的充當替代品,雖然在理論數據上相差在3%到6%之間,但從實際的遊戲、AI創作感受來看,體感差別不大。

重點在於,索泰GeForce RTX 4090 D TRINITY 月白並沒有在技術上做任何刪減,同樣是基於性能金字塔頂端的Ada Lovelace的AD102 GPU打造,支持最新的DLSS 3.5和更高效能的路徑追蹤特效,超大的顯存不做任何刪減,維持住了最高水平的單卡AI性能,甚至實際功耗還要比RTX 4090低一些。

同時索泰一如既往優質的做工讓索泰GeForce RTX 4090 D TRINITY 月白的散熱表現、個性化都表現的非常出色,並且在一衆RTX 4090 D中維持着較低的售價,比較之下,性價比已然凸顯。如果你是一個性能控、AI重度用戶、影音工作者,不要猶豫,索泰GeForce RTX 4090 D TRINITY 月白就是很好的選擇之一,特別是搭配Core i9-14900K,大容量DDR5內存,配合4TB SSD以上存儲空間,想必也會成爲每一個電競男生今年的終極夢想。

特別是在未來新品更新還有很長一段時間,價格日趨穩定的情況下,一步到位上到頂配,興許纔是最具性價比的解決方案之一。如果你已經攢好了錢,那麼不必由於,在RTX 4090 D中,索泰GeForce RTX 4090 D TRINITY 月白確實是非常值得考慮的那一款。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com