GeForce RTX 4070 Ti SUPER評測:坐實SUPER性價比,AI效能新突破

在今年更新的SUPER陣營中,GeForce RTX 4070 Ti SUPER可能是最特別的存在。這是GeForce RTX有史以來第一款同時擁有Ti和SUPER尾綴的GPU,相當於比RTX 4070在性能加強之後,再來個猛料,最終造就了眼前這款性能威力加強版的產品。

在NVIDIA的宣傳中,SUPER確實也承擔着類似的定義,它更注重於原本基礎型號的性價比增強,也無疑是替代原型號的理想選擇。從紙面參數來看,GeForce RTX 4070 Ti SUPER確實做到了。例如AD104核心已至上線,那麼就更換成更強的AD103,CUDA核心數量猛增至8448,第四代Tensor Core和第三代RT Core數量也隨之增長,已經有了直逼RTX 4080的意味。

當下的時間點GPU顯然開始承擔起了更多的工作,不僅要利用DLSS 3.5技術在遊戲中完成AI加速以實現更高幀率,同時還要承擔生成式AI創作的主要戰力,特別是對於遊戲主播、UP主、圖形工作者而言,視頻串流、圖片與視頻創作、建模與渲染等場景利用GPU完成加速也已是常態。

那麼首次採用了Ti SUPER尾綴的GeForce RTX 4070 Ti SUPER能否承擔起這樣的責任?這一次我們將選用影馳GeForce RTX 4070 Ti SUPER大將作爲參考,奉上GeForce RTX 4070 Ti SUPER的首發評測。

核心代號:AD103-275

與GeForce RTX 4080的AD103-300核心代號不同,GeForce RTX 4070 Ti SUPER啓用了全新的AD103-275代號,同樣源自於臺積電4N定製工藝的Ada Lovelace,並且保留了旗艦產品的所有功能,以第三代RT Core、第四代Tensor Core、CUDA Core等核心搭建出當前定位下應有的性能。

我們已經知道,Ada Lovelace架構GPU中包含了若干個GPC(Graphics Processing Clusters,圖形處理集羣),GPC下包含若干個TPC(Texture Processing Clusters,紋理處理簇),再往下就是SM、CUDA、RT Core、Tensor Core等等。每個GPC之間包含的TPC數量相等,當GPU進行定位區分的時候再進行GPC、TPC的物理屏蔽實現。

但完整的AD103就有點不一樣,雖然包含7個GPC,但每個GPC包含的TPC並不相同。如下圖所示,在6個GPC各擁有6組TPC的同時,還有1個GPC僅有4組TPC。擁有459億個晶體管組成,包含7個GPC,40個TPC、80個SM,以及8個32-bit內存控制器。

因此AD103的上限是10,240個CUDA核心、80個RT Core、320個Tensor Core、320個紋理單元和112個ROPs。在內存子系統上則總共包含10,240KB L1緩存,20,480KB寄存器堆,以及65,536KB的L2緩存。

作爲AD103的新晉選手,GeForce RTX 4070 Ti SUPER的定位會低於GeForce RTX 4080,因此在設計上屏蔽了1組GPC,或者6組TPC,最終用獲得了33組TPC,66個SM,264個第四代Tensor Core,66個第三代RT Core,以及8448個CUDA Core,96個ROP和264個紋理單元。

有意思的是,GeForce RTX 4070 Ti SUPER在L2緩存上與GeForce RTX 4070 SUPER相同,即48MB,官方定義的GPU頻率則與GeForce RTX 4070 Ti相同,爲2610MHz,總功耗維持在285W。

顯存設定上則相對RTX 4070系列有所突破,使用了16GB GDDR6X,顯存頻率10500 MHz (21 Gbps),但擁有265-bit位寬,帶寬672GB/s。

48MB L2緩存意味着擁有相對RTX 3070 Ti 12倍的提升,可給予光線追蹤和路徑追蹤更強的性能表現,16GB GDDR6X 256-bit則代表在AI性能加速上也有了更多空間,從而幫助GeForce RTX 4070 Ti SUPER完成性價比進階。

影馳大將參上

這一次GeForce RTX 4070 Ti SUPER沒有推出Founders Edition公版,影馳GeForce RTX 4070 Ti SUPER大將成爲了我們評測的第一選擇。作爲與公版看齊的產品,影馳GeForce RTX 4070 Ti SUPER大將在用料上下足了功夫,從3槽位與RTX 4080的身形就能看得出來。

雖然身材變寬了,但影馳GeForce RTX 4070 Ti SUPER大將仍然爲塞入標準機箱進行了諸多考量,比如不含擋板長度爲321mm,不容易頂到機箱前段,同時仍然保持3風扇配置。

將系列的設計語言在GPU中也是獨樹一幟,異型結構的星烽散熱器擁有不錯的辨識度。這是一套包含了金屬外殼、金屬壓鑄件加強框架的多維散熱體系,比如芯片、顯存與供電部分均全面覆蓋,使用了8*Φ6mm複合熱管,緻密鰭片與迴流焊接工藝,合金背板尾端的大開孔透氣一個不少。

同時三風扇直徑均爲92mm,支持自動啓停。即便是壓力測試,影馳GeForce RTX 4070 Ti SUPER仍然能保持很好的靜謐性。例如在壓力測試半小時的狀態下,GPU溫度在55℃左右,紅外線可以看到溫度主要集中在靠近GPU部分的散熱片處。

值得強調GeForce RTX 4070 Ti SUPER本身的TGP僅有285W,低於GeForce RTX 4080的320W,在2K分辨率遊戲測試中我們可以看到功耗普遍維持在200W左右,在低功耗的狀態下就能滿足2K高幀率顯示器的要求。

除此之外,影馳也自帶了Xtreme Tuner魔盤軟件對GPU進行超頻、燈控調整、溫度監控操作,甚至可以嘗試一把手動超頻。

而在12VHPWR供電口左側,也專門設立了一個ARGB同步線接口,支持AURORA SYNC PRO ARGB燈效,並且能與四大主板廠商保持ARGB燈效同步。講道理,影馳GeForce RTX 4070 Ti SUPER大將也很好的發揮了3槽優勢,顯卡尾端的GALAX Logo不僅很大,RGB起來也非常帶勁,色彩過度非常自然,能夠輕鬆與主板、主機風扇RGB打成一片。

在接口上,影馳GeForce RTX 4070 Ti SUPER大將提供了3個DisplayPort 1.4a,1個HDMI 2.1a接口。

跑分不能停

現在讓我們進入基準測試環節,測試平臺包括了Core i9-14900K、ROG MAXIMUS Z790 DARK HERO、G.SKILL Trident Z5 DDR5-7200 16GBx2,並配以Thermaltake TPI RGB PLUS 1250W電源作爲支持。

在基礎性能測試中,主要參考檢測DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal。

這裏可以看到GeForce RTX 4070 Ti SUPER相對RTX 4070 Ti提升在6%到16%之間,相對RTX 4070提升則有40%以上,如果是相對上一代的RTX 3070 Ti,提升幅度就會相當誇張,達到70%。同時這個成績距離RTX 4080大約有10%左右的性能差距。

在發佈較早的遊戲測試中這裏我們將分辨率設置成2K最高畫質,由於遊戲的限制無法開啓DLSS 3以後版本,但即便如此,GeForce RTX 4070 Ti SUPER釋放出來的性能已經能夠超過RTX 3090 20%甚至50%,相對RTX 3070則可以有50%到100%提升,RTX 2070更是不在話下,最高提升超過200%。

只有DLSS 2版本的遊戲測試顯然是不夠的。特別是DLSS 3和DLSS 3.5以後版本在GeForce RTX 40系列上的應用,讓GeForce RTX 4070 Ti SUPER的效率得到進一步的提升。這得益於第四代Tensor Core性能提升幅度巨大,並輔以光流加速器(Optical Flow Acceleration,OFA)與DLSS相結合的辦法,構建出了一個更爲立體的分析方式,讓GPU實際執行過程壓縮到原本的 1/8,更多的工作由DLSS 3及以後的版本完成。

而DLSS 3.5更近一步,它是一套基於AI,讓畫質和幀率同時提升的解決方案,同時包含DLSS幀生成(FG)與光線重建(RR, Ray Reconstruction)技術搭配,再加上超分辨率(Super Resolution)、DLAA、幀生成(Frame Generation)多種技術融合,讓遊戲效率表現更爲突出。

因此DLSS 3和DLSS 3.5帶來的畫面質感得以進一步提升,例如《賽博朋克2077》中霓虹燈在玻璃質感下的穿透性,以及雨後地面更爲清晰的反光,都是DLSS 3.5配合光線重建所帶來的畫質提升。

與此同時,遊戲幀率也大幅提升,如果讓GeForce RTX 4070 Ti SUPER與RTX 3090進行對比,幀率提升可以從20%到100%,而對比RTX 3070,提升幅度最高可以到300%,對比RTX 2070提升幅度則可以達到500%甚至更高,主要原因是RTX 2070在部分遊戲場景中幀率只有個位數。

DLSS 3.5帶來的另一個好處就是融合了Reflex技術讓遊戲響應速度進一步提升,特別對於競技類遊戲而言,更低的系統延遲意味着更高的操作準確率,這裏我們用GeForce RTX 4070 Ti SUPER對數款遊戲進行測試,可以看到部分遊戲的延遲甚至可以降低到10ms以下。

AI更爽了

GeForce RTX 4070 Ti SUPER擁有的16GB GDDR6X可以進一步提升AI體驗。這裏以Stable Diffusion生成式圖像創作爲例,最新版本的Stable Diffusion XL在模型體量上相當Stable Diffusion 1.5擴大了3倍,從而導致計算的數據量提升,但也帶來了更好的畫質。

Stable Diffusion XL作爲一套深度學習模型,可以通過簡單的文字語義實現高質量的圖像生成,擅長生成高分辨率圖像、文本到圖像轉換場景,適合藝術創作、設計、遊戲開發、廣告領域的用戶。同時Stable Diffusion XL本身運行需要依靠Transformer變換器和卷積神經網絡實現,這兩者均需要GPU進行大規模並行計算,這無疑是NVIDIA最擅長的事情。也正因爲如此,近幾年AI的飛速發展,很大程度上就是NVIDIA GPU技術發展所推進的。

老規矩,這裏我們以Stable Diffusion Web UI + TensorRT進行配置,用更短的語言描述生成10張分辨率爲768x768的星際航行圖片,每次運算1張圖片,即總共執行10次,採樣步數設置爲50。

文字描述部分參考如下:

epic space battle over a water planet, many ships, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting

這裏我們通過記錄時間,推算出每分鐘推算圖片效率,參考公式爲60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute。通過對比可以看出,GeForce RTX 4070 Ti SUPER有很強的AI性能表現,比RTX 4060高出61%,甚至比RTX 4070 Ti也高出28%。

與此同時,我們也用Stable Diffusion SDXL與Stable Diffusion 1.5進行對比,就知道3倍的模型量是多麼重要了。

Stable Diffusion SDXL


Stable Diffusion 1.5

AI加速的另一個應用是利用ON1 Resize AI 2022對圖片分辨率進行提升,這裏使用五個場景進行測試並記錄平均時間。

DLSS 3.5作爲AI加速的一部分也已經開始在專業應用中付諸實踐,D5渲染器便是其中之一。在D5渲染器中,DLSS 3.5使用了比DLSS 3多5倍的數據訓練,因此也可以更好的識別光線追蹤效果,在時間、空間數據中做出更合理的判斷,從而實現高效率的擴展。

在軟件中開啓DLSS 3.5的方法也很簡單,只需要在菜單中找到DLSS 3.5選項,勾選所有的子選項即可。這時候我們就能在畫面發現質的變化。例如當DLSS 3.5關閉後,洗漱池水龍頭失去光澤,或是遠處玻璃噪點變得異常多。

在幀率上,GeForce RTX 4070 Ti SUPER也給足了暢快感,不僅相對GeForce RTX 4070 SUPER提供10%的性能提升,相對RTX 3070提升幅度達到270%。

創作一把抓

AI加速也僅僅是GeForce RTX 4070 Ti SUPER創作功能中的一部分,得益於NVIDIA在各行業中的影響力,圍繞CUDA Core、RT Core打造的專業應用也已經在實際上影響着各行業使用專業軟件的體驗。SPECviewperf就是很好的例子,這是一款專門考驗OpenGL和Direct X API下運行的系統的3D圖形性能,軟件包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。

最左側的GeForce RTX 4070 Ti SUPER提升幅度是非常多的,相對RTX 4070提升可以達到20%到30%之間,相對RTX 3070 Ti提升可以從50%起跳到100%。

V-Ray 5 Benchmark中,會分別對CUDA Core和RTX進行檢測,藉助更多的CUDA Core數量,GeForce RTX 4070 Ti SUPER的RTX性能表現提升了290%,相對RTX 4070也提升了50%以上。

Octane Render RTX則是用來測試GPU的光線追蹤性能表現,在複雜場景下考驗GPU每秒產生的樣本率,GeForce RTX 4070 Ti SUPER提升幅度也相當明顯。

Blender Benchmark引入了Moster、Junkshop、Classroom三個參考場景,GeForce RTX 4070 Ti SUPER相對RTX 3090提升25%,相對RTX 3070 Ti提升超過80%。

寫在最後:進階的性價比

這一次,NVIDIA用更高階的GPU,以及Ti加SUPER疊雙層BUFF的方式給我們展示了更多可能性。與GeForce RTX 4070 SUPER類似,GeForce RTX 4070 Ti SUPER的性能提升令人滿意,更多的CUDA Core、第四代Tensor Core與第三代RT Core讓專業應用、3A遊戲都獲得了質的提升。

重要的是,16GB GDDR6X搭配強悍的AD103 GPU給AI創作帶來了更多空間,無論是Stable Diffusion SDXL這樣的生成式AI創作,還是DLSS 3.5加速的D5渲染器,GeForce RTX 4070 Ti SUPER都一步到位給予了順暢的體驗。這意味着GeForce RTX 4070 Ti SUPER不僅適合遊戲發燒友,對於從事藝術創作、設計、遊戲開發、廣告的用戶而言,這款GPU的推出也更具有意義。

在AI、創作、遊戲樣樣精通的前提下,6499元定價的GeForce RTX 4070 Ti SUPER透着濃厚的性價比。

特別是像影馳GeForce RTX 4070 Ti SUPER大將這般,在遵循官方定價的前提下給予散熱、ARGB同步、定製軟件調教等深度化體驗,也讓GeForce RTX 4070 Ti SUPER更進一步。如果你已經在爲錯過第一批GeForce RTX 40系列GPU而後悔,現在不要猶豫,可以預見在未來一段時間內,SUPER將成爲GeForce RTX 40系列性價比的代名詞,直接下單準沒錯。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com