GeForce RTX 4070 Ti SUPER評測：坐實SUPER性價比，AI效能新突破

在今年更新的SUPER陣營中，GeForce RTX 4070 Ti SUPER可能是最特別的存在。這是GeForce RTX有史以來第一款同時擁有Ti和SUPER尾綴的GPU，相當於比RTX 4070在性能加強之後，再來個猛料，最終造就了眼前這款性能威力加強版的產品。

在NVIDIA的宣傳中，SUPER確實也承擔着類似的定義，它更注重於原本基礎型號的性價比增強，也無疑是替代原型號的理想選擇。從紙面參數來看，GeForce RTX 4070 Ti SUPER確實做到了。例如AD104核心已至上線，那麼就更換成更強的AD103，CUDA核心數量猛增至8448，第四代Tensor Core和第三代RT Core數量也隨之增長，已經有了直逼RTX 4080的意味。

當下的時間點GPU顯然開始承擔起了更多的工作，不僅要利用DLSS 3.5技術在遊戲中完成AI加速以實現更高幀率，同時還要承擔生成式AI創作的主要戰力，特別是對於遊戲主播、UP主、圖形工作者而言，視頻串流、圖片與視頻創作、建模與渲染等場景利用GPU完成加速也已是常態。

那麼首次採用了Ti SUPER尾綴的GeForce RTX 4070 Ti SUPER能否承擔起這樣的責任？這一次我們將選用影馳GeForce RTX 4070 Ti SUPER大將作爲參考，奉上GeForce RTX 4070 Ti SUPER的首發評測。

核心代號：AD103-275

與GeForce RTX 4080的AD103-300核心代號不同，GeForce RTX 4070 Ti SUPER啓用了全新的AD103-275代號，同樣源自於臺積電4N定製工藝的Ada Lovelace，並且保留了旗艦產品的所有功能，以第三代RT Core、第四代Tensor Core、CUDA Core等核心搭建出當前定位下應有的性能。

我們已經知道，Ada Lovelace架構GPU中包含了若干個GPC（Graphics Processing Clusters，圖形處理集羣），GPC下包含若干個TPC（Texture Processing Clusters，紋理處理簇），再往下就是SM、CUDA、RT Core、Tensor Core等等。每個GPC之間包含的TPC數量相等，當GPU進行定位區分的時候再進行GPC、TPC的物理屏蔽實現。

但完整的AD103就有點不一樣，雖然包含7個GPC，但每個GPC包含的TPC並不相同。如下圖所示，在6個GPC各擁有6組TPC的同時，還有1個GPC僅有4組TPC。擁有459億個晶體管組成，包含7個GPC，40個TPC、80個SM，以及8個32-bit內存控制器。

因此AD103的上限是10,240個CUDA核心、80個RT Core、320個Tensor Core、320個紋理單元和112個ROPs。在內存子系統上則總共包含10,240KB L1緩存，20,480KB寄存器堆，以及65,536KB的L2緩存。

作爲AD103的新晉選手，GeForce RTX 4070 Ti SUPER的定位會低於GeForce RTX 4080，因此在設計上屏蔽了1組GPC，或者6組TPC，最終用獲得了33組TPC，66個SM，264個第四代Tensor Core，66個第三代RT Core，以及8448個CUDA Core，96個ROP和264個紋理單元。

有意思的是，GeForce RTX 4070 Ti SUPER在L2緩存上與GeForce RTX 4070 SUPER相同，即48MB，官方定義的GPU頻率則與GeForce RTX 4070 Ti相同，爲2610MHz，總功耗維持在285W。

顯存設定上則相對RTX 4070系列有所突破，使用了16GB GDDR6X，顯存頻率10500 MHz (21 Gbps)，但擁有265-bit位寬，帶寬672GB/s。

48MB L2緩存意味着擁有相對RTX 3070 Ti 12倍的提升，可給予光線追蹤和路徑追蹤更強的性能表現，16GB GDDR6X 256-bit則代表在AI性能加速上也有了更多空間，從而幫助GeForce RTX 4070 Ti SUPER完成性價比進階。

影馳大將參上

這一次GeForce RTX 4070 Ti SUPER沒有推出Founders Edition公版，影馳GeForce RTX 4070 Ti SUPER大將成爲了我們評測的第一選擇。作爲與公版看齊的產品，影馳GeForce RTX 4070 Ti SUPER大將在用料上下足了功夫，從3槽位與RTX 4080的身形就能看得出來。

雖然身材變寬了，但影馳GeForce RTX 4070 Ti SUPER大將仍然爲塞入標準機箱進行了諸多考量，比如不含擋板長度爲321mm，不容易頂到機箱前段，同時仍然保持3風扇配置。

將系列的設計語言在GPU中也是獨樹一幟，異型結構的星烽散熱器擁有不錯的辨識度。這是一套包含了金屬外殼、金屬壓鑄件加強框架的多維散熱體系，比如芯片、顯存與供電部分均全面覆蓋，使用了8*Φ6mm複合熱管，緻密鰭片與迴流焊接工藝，合金背板尾端的大開孔透氣一個不少。

同時三風扇直徑均爲92mm，支持自動啓停。即便是壓力測試，影馳GeForce RTX 4070 Ti SUPER仍然能保持很好的靜謐性。例如在壓力測試半小時的狀態下，GPU溫度在55℃左右，紅外線可以看到溫度主要集中在靠近GPU部分的散熱片處。

值得強調GeForce RTX 4070 Ti SUPER本身的TGP僅有285W，低於GeForce RTX 4080的320W，在2K分辨率遊戲測試中我們可以看到功耗普遍維持在200W左右，在低功耗的狀態下就能滿足2K高幀率顯示器的要求。

除此之外，影馳也自帶了Xtreme Tuner魔盤軟件對GPU進行超頻、燈控調整、溫度監控操作，甚至可以嘗試一把手動超頻。

而在12VHPWR供電口左側，也專門設立了一個ARGB同步線接口，支持AURORA SYNC PRO ARGB燈效，並且能與四大主板廠商保持ARGB燈效同步。講道理，影馳GeForce RTX 4070 Ti SUPER大將也很好的發揮了3槽優勢，顯卡尾端的GALAX Logo不僅很大，RGB起來也非常帶勁，色彩過度非常自然，能夠輕鬆與主板、主機風扇RGB打成一片。

在接口上，影馳GeForce RTX 4070 Ti SUPER大將提供了3個DisplayPort 1.4a，1個HDMI 2.1a接口。

跑分不能停

現在讓我們進入基準測試環節，測試平臺包括了Core i9-14900K、ROG MAXIMUS Z790 DARK HERO、G.SKILL Trident Z5 DDR5-7200 16GBx2，並配以Thermaltake TPI RGB PLUS 1250W電源作爲支持。

在基礎性能測試中，主要參考檢測DirectX 11和DirectX 12性能的3DMark Time Spy，3DMark Time Spy Extreme，3DMark Fire Strike Extreme，3DMark Fire Strike Ultra，Port Royal。

這裏可以看到GeForce RTX 4070 Ti SUPER相對RTX 4070 Ti提升在6%到16%之間，相對RTX 4070提升則有40%以上，如果是相對上一代的RTX 3070 Ti，提升幅度就會相當誇張，達到70%。同時這個成績距離RTX 4080大約有10%左右的性能差距。

在發佈較早的遊戲測試中這裏我們將分辨率設置成2K最高畫質，由於遊戲的限制無法開啓DLSS 3以後版本，但即便如此，GeForce RTX 4070 Ti SUPER釋放出來的性能已經能夠超過RTX 3090 20%甚至50%，相對RTX 3070則可以有50%到100%提升，RTX 2070更是不在話下，最高提升超過200%。

只有DLSS 2版本的遊戲測試顯然是不夠的。特別是DLSS 3和DLSS 3.5以後版本在GeForce RTX 40系列上的應用，讓GeForce RTX 4070 Ti SUPER的效率得到進一步的提升。這得益於第四代Tensor Core性能提升幅度巨大，並輔以光流加速器（Optical Flow Acceleration，OFA）與DLSS相結合的辦法，構建出了一個更爲立體的分析方式，讓GPU實際執行過程壓縮到原本的 1/8，更多的工作由DLSS 3及以後的版本完成。

而DLSS 3.5更近一步，它是一套基於AI，讓畫質和幀率同時提升的解決方案，同時包含DLSS幀生成（FG）與光線重建（RR, Ray Reconstruction）技術搭配，再加上超分辨率（Super Resolution）、DLAA、幀生成（Frame Generation）多種技術融合，讓遊戲效率表現更爲突出。

因此DLSS 3和DLSS 3.5帶來的畫面質感得以進一步提升，例如《賽博朋克2077》中霓虹燈在玻璃質感下的穿透性，以及雨後地面更爲清晰的反光，都是DLSS 3.5配合光線重建所帶來的畫質提升。

與此同時，遊戲幀率也大幅提升，如果讓GeForce RTX 4070 Ti SUPER與RTX 3090進行對比，幀率提升可以從20%到100%，而對比RTX 3070，提升幅度最高可以到300%，對比RTX 2070提升幅度則可以達到500%甚至更高，主要原因是RTX 2070在部分遊戲場景中幀率只有個位數。

DLSS 3.5帶來的另一個好處就是融合了Reflex技術讓遊戲響應速度進一步提升，特別對於競技類遊戲而言，更低的系統延遲意味着更高的操作準確率，這裏我們用GeForce RTX 4070 Ti SUPER對數款遊戲進行測試，可以看到部分遊戲的延遲甚至可以降低到10ms以下。

AI更爽了

GeForce RTX 4070 Ti SUPER擁有的16GB GDDR6X可以進一步提升AI體驗。這裏以Stable Diffusion生成式圖像創作爲例，最新版本的Stable Diffusion XL在模型體量上相當Stable Diffusion 1.5擴大了3倍，從而導致計算的數據量提升，但也帶來了更好的畫質。

Stable Diffusion XL作爲一套深度學習模型，可以通過簡單的文字語義實現高質量的圖像生成，擅長生成高分辨率圖像、文本到圖像轉換場景，適合藝術創作、設計、遊戲開發、廣告領域的用戶。同時Stable Diffusion XL本身運行需要依靠Transformer變換器和卷積神經網絡實現，這兩者均需要GPU進行大規模並行計算，這無疑是NVIDIA最擅長的事情。也正因爲如此，近幾年AI的飛速發展，很大程度上就是NVIDIA GPU技術發展所推進的。

老規矩，這裏我們以Stable Diffusion Web UI + TensorRT進行配置，用更短的語言描述生成10張分辨率爲768x768的星際航行圖片，每次運算1張圖片，即總共執行10次，採樣步數設置爲50。

文字描述部分參考如下：

epic space battle over a water planet, many ships, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting

這裏我們通過記錄時間，推算出每分鐘推算圖片效率，參考公式爲60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute。通過對比可以看出，GeForce RTX 4070 Ti SUPER有很強的AI性能表現，比RTX 4060高出61%，甚至比RTX 4070 Ti也高出28%。

與此同時，我們也用Stable Diffusion SDXL與Stable Diffusion 1.5進行對比，就知道3倍的模型量是多麼重要了。

Stable Diffusion SDXL

Stable Diffusion 1.5

AI加速的另一個應用是利用ON1 Resize AI 2022對圖片分辨率進行提升，這裏使用五個場景進行測試並記錄平均時間。

DLSS 3.5作爲AI加速的一部分也已經開始在專業應用中付諸實踐，D5渲染器便是其中之一。在D5渲染器中，DLSS 3.5使用了比DLSS 3多5倍的數據訓練，因此也可以更好的識別光線追蹤效果，在時間、空間數據中做出更合理的判斷，從而實現高效率的擴展。

在軟件中開啓DLSS 3.5的方法也很簡單，只需要在菜單中找到DLSS 3.5選項，勾選所有的子選項即可。這時候我們就能在畫面發現質的變化。例如當DLSS 3.5關閉後，洗漱池水龍頭失去光澤，或是遠處玻璃噪點變得異常多。

在幀率上，GeForce RTX 4070 Ti SUPER也給足了暢快感，不僅相對GeForce RTX 4070 SUPER提供10%的性能提升，相對RTX 3070提升幅度達到270%。

創作一把抓

AI加速也僅僅是GeForce RTX 4070 Ti SUPER創作功能中的一部分，得益於NVIDIA在各行業中的影響力，圍繞CUDA Core、RT Core打造的專業應用也已經在實際上影響着各行業使用專業軟件的體驗。SPECviewperf就是很好的例子，這是一款專門考驗OpenGL和Direct X API下運行的系統的3D圖形性能，軟件包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。

最左側的GeForce RTX 4070 Ti SUPER提升幅度是非常多的，相對RTX 4070提升可以達到20%到30%之間，相對RTX 3070 Ti提升可以從50%起跳到100%。

V-Ray 5 Benchmark中，會分別對CUDA Core和RTX進行檢測，藉助更多的CUDA Core數量，GeForce RTX 4070 Ti SUPER的RTX性能表現提升了290%，相對RTX 4070也提升了50%以上。

Octane Render RTX則是用來測試GPU的光線追蹤性能表現，在複雜場景下考驗GPU每秒產生的樣本率，GeForce RTX 4070 Ti SUPER提升幅度也相當明顯。

Blender Benchmark引入了Moster、Junkshop、Classroom三個參考場景，GeForce RTX 4070 Ti SUPER相對RTX 3090提升25%，相對RTX 3070 Ti提升超過80%。

寫在最後：進階的性價比

這一次，NVIDIA用更高階的GPU，以及Ti加SUPER疊雙層BUFF的方式給我們展示了更多可能性。與GeForce RTX 4070 SUPER類似，GeForce RTX 4070 Ti SUPER的性能提升令人滿意，更多的CUDA Core、第四代Tensor Core與第三代RT Core讓專業應用、3A遊戲都獲得了質的提升。

重要的是，16GB GDDR6X搭配強悍的AD103 GPU給AI創作帶來了更多空間，無論是Stable Diffusion SDXL這樣的生成式AI創作，還是DLSS 3.5加速的D5渲染器，GeForce RTX 4070 Ti SUPER都一步到位給予了順暢的體驗。這意味着GeForce RTX 4070 Ti SUPER不僅適合遊戲發燒友，對於從事藝術創作、設計、遊戲開發、廣告的用戶而言，這款GPU的推出也更具有意義。

在AI、創作、遊戲樣樣精通的前提下，6499元定價的GeForce RTX 4070 Ti SUPER透着濃厚的性價比。

特別是像影馳GeForce RTX 4070 Ti SUPER大將這般，在遵循官方定價的前提下給予散熱、ARGB同步、定製軟件調教等深度化體驗，也讓GeForce RTX 4070 Ti SUPER更進一步。如果你已經在爲錯過第一批GeForce RTX 40系列GPU而後悔，現在不要猶豫，可以預見在未來一段時間內，SUPER將成爲GeForce RTX 40系列性價比的代名詞，直接下單準沒錯。