西數SN8100深度測試:成也蕭何敗也蕭何,激進的nCache 4.0雙刃劍

前言

大家好,我是飄雷。

隨着PCIe 5.0時代的全面到來,我已經陸續測試了十幾款PCIe 5.0 SSD,不過西部數據和SK海力士這兩家存儲原廠的PCIe 5.0旗艦產品卻一直沒機會上手體驗。

前段時間趁着雙11大促的好價,我終於忍不住出手,花1299元拿下了這條備受關注的西部數據 WD_BLACK SN8100 2TB。

之所以說它備受關注,不僅因爲它是目前消費級SSD中的旗艦產品之一,更因爲其採用的nCache 4.0緩存策略在玩家羣體中引發了不小的爭議。

有人說它是跑分神器,也有人質疑它是面子工程。那麼,SN8100這款旗艦盤的真實表現究竟如何?是神優化還是反向升級?今天我們就通過詳細的測試來一探究竟。

產品解析

西數SN8100目前提供了1TB、2TB和4TB三種容量,尚未和三星9100 Pro、金士頓FURY Renegade G5似的推出8TB超大容量版本。

從表格中可以看到,SN8100順序讀取最高可達14900 MB/s,順序寫入最高達到14000 MB/s

與此同時最大4K隨機讀取性能達到了2300 KIOPS,最大4K隨機寫入性能達到了2400 KIOPS

所以僅從紙面參數上來看,SN8100是目前在售消費級SSD中最高的水平,估計有很多入手SN8100的朋友就是被這個參數吸引的吧。

包裝方面還是熟悉黑色紙盒,與此前我測試過的SN850X、SN7100如出一轍。

這塊盤是從京東的西部數據官方旗艦店入手,包裝背面右下角貼了一張紙質合格標籤,不清楚其他渠道入手有沒有。

取出SN8100 2TB,正面只有一張貼紙,不過主控位置露出了半個腦袋。

背面看一下,已經打上了閃迪新修改過的半邊拉塊的LOGO:

因爲這塊盤在測試完成後還準備出掉回血,所以我自己就不揭開貼紙了,找 @homolab 要了一張照片給大家看一下:

SN8100的主控其實就是我們熟悉的慧榮SM2508,採用6nm製程、8通道設計、FCBGA封裝方式,表面爲鍍鎳工藝,對散熱比較友好。慧榮SM2508集成了4個Arm Cortex-R8高性能核心和1個Cortex-M0低功耗核心,最高支持3600 MT/s的NAND接口速率,金士頓FURY Renegade G5、Crucial T710等今年多款PCIe 5.0有緩旗艦SSD上都在用它。

NAND方面,SN8100 2TB與金士頓FURY Renegade G5一樣,也搭載了鎧俠和閃迪合資共同開發製造的BiCS8顆粒,且爲1Tb大die。

BiCS8堆疊層數不算高,只有218L,不過憑藉類似YMTC Xtacking的CPA(CMOS Directly Bonded to Array,CMOS直接鍵合存儲單元陣列)架構,接口速度最高可以達到3600 MT/s,存儲密度達到了18.3Gb/mm²,處於業界領先水平。

DRAM方面,SN8100 2TB採用的是美光的DDR4顆粒,容量爲2GB。這一點倒是和金士頓FURY Renegade G5和Crucial T710不一樣,西數沒使用常用的低功耗LPDDR4顆粒,這一點不知道是不是基於成本考慮的。

接下來通電上機,通過CrystalDiskInfo查看S.M.A.R.T信息。可見其支持NVMe 2.0協議標準,並且預留了一部分二級OP,可用容量爲2000.3 GB(10進制)。

接下來查看更詳細的S.M.A.R.T信息,SN8100提供了1個溫度傳感器,並且溫度牆是十分激進,分別爲90℃94℃

功耗方面,SN8100默認給了5個檔位,其中Power State 0功耗僅爲8W,這算是喫到NAND與主控的先進製程紅利了。

由於二進制與十進制的單位換算差異,SN8100 2TB在Windows中的實際可用容量爲1863 GiB。這並非廠家虛標,而是消費級固態硬盤普遍存在的容量顯示差異。

接下來咱們就開始正式進入測試階段吧。

測試平臺

本次測試使用的測試平臺配置如下:

  • CPU:Intel i9-14900K

  • 主板:AORUS Z790 XTREME X

  • 內存:DDR5-8000 16GB x2

  • 系統盤:Intel傲騰900P 480GB

  • 系統:Windows 11專業版 23H2、Ubuntu 24.04 LTS

這裏提前說明一下,在對SSD進行測試時,測試結果受硬件平臺的影響會比較明顯,並非所有SSD都能在每臺電腦上都能跑到官方標稱參數。不少網友在評論區曾經提到過,在筆記本電腦上測試同一款SSD,結果與我在臺式PC上測出的有差異,這就是一個典型表現。

另外,SSD的性能除了會受到CPU主頻和單核性能影響以外,整個平臺的PCIe MPS(Maximum Payload Size,有效載荷)也會對測試結果產生影響——正常來講,MPS越大,數據包傳輸效率越高,帶寬上限更大,但相應的延遲也會增加

目前,一般只有AMD平臺才能支持512字節MPS,Intel平臺只支持256字節MPS。

所以在CrystalDiskMark等一些軟件的測試過程中,受Intel平臺所限,SN8100的順序讀寫參數無法跑到官方標註的水平,想要解決這個問題,就得換用AMD平臺來進行測試了。

不過AMD處理器在SSD低隊列下的讀寫性能一向不佳,所以個人還是習慣使用主要Intel平臺來進行測試,這裏請大家知悉。

基礎性能測試

1.CrystalDiskMark

使用CrystalDiskMark對SN8100進行測速,可以看到這款SSD的順序讀取速度爲14288.35 MB/s,順序寫入速度爲13531.51 MB/s,雖然沒有達到官方標稱數據,不過這是因爲已經達到了我這套硬件平臺的PCIe 5.0 x4通道帶寬上限了

Q1T1 4K隨機讀取速度方面,SN8100達到了驚人的138.94 MB/s,這基本是我目前測過所有NAND SSD中最強的水平。

不過不要激動,首先這個項目是基於SLC Cache加速的表現,並不能代表實際使用時能持續達到的性能;其次,其他同樣採用慧榮SM2508的旗艦PCIe 5.0 SSD在該項目中一般都不會超過120 MB/s,SN8100爲何這麼強?

實際上這是西數獨家的混合SLC緩存算法——nCache 4.0的功勞。nCache 4.0方案能夠更智能地將隨機小文件數據駐留在SLC模式的緩存區,甚至利用DRAM緩存進行更激進的元數據映射。這使得在測試軟件進行4K讀取操作時,數據往往能直接從響應最快的緩存層級中被命中,而非必須去慢速的TLC區域搜尋。

換句話說,這是專門爲了針對更高的紙面測試成績而進行的特別調校,可以理解爲面子工程。但有利也有弊,SN8100採用這個方案,也會爲之付出相當的代價,這一點我們在後面會詳細敘述。

在Q32T16 4K隨機讀寫性能方面,SN8100 2TB分別達到了2199 KIOPS、1842 KIOPS的成績,這也是被測試平臺所限,沒有跑滿官方標稱性能。

爲了更直觀地爲大家展示Intel和AMD平臺的差距,我將SN8100 2TB放到借來的AMD 7600X+華碩B850吹雪平臺上再次測試。可以看到,這次就突破了Intel平臺的限制,順序讀取速度爲14960.11 MB/s,順序寫入速度爲14122.88 MB/s均超過了官方標稱參數

2.PCMARK 10完整系統盤基準測試

在PCMARK 10完整系統盤基準測試中,SN8100 2TB拿到了7737分,是我測試過的PCIe 5.0 SSD中最高水平,只能說這個用來跑分特供向的nCache 4.0方案確實是擅長做面子工程。

3.3DMark存儲基準測試

在3DMark存儲基準測試中,SN8100 2TB拿到了7991分,同樣是我測試過的PCIe 5.0 SSD中的第一名,說實話我很擔心這種爲了跑分好看而進行專門調校的做法會影響到整個存儲行業的風氣。

4.SPECworkstation 3.1

SPEC Workstation是一款衡量專業工作站平臺性能的綜合測試軟件,其測試特點是負載很大,對SSD混合讀寫性能要求也很高。同時這款軟件中有專門針對存儲設備進行測試的模塊,可以模擬高負載生產力場景對SSD進行高壓測試,尤其對SSD混合讀寫性能要求更高。

說句實話,這項測試對消費級SSD要求過高,更適合企業級SSD,畢竟普通用戶基本用不到這種高負載場景。不過想必也會有不少用戶購買PCIe 5.0 SSD就是爲了用作生產力工具的,所以這裏還是來看看錶現吧。

測試結果顯示,SN8100 2TB在SPEC Workstation 3.1中取得了71.79分的總成績,略遜色於金士頓FURY Renegade G5 4TB。

專業向進階測試

1.全盤寫入曲線分析

爲了深入探索SN8100 2TB的SLC緩存方案,這裏我們對其進行RAW格式下的全盤範圍順序寫入測試(128KB,Q32T1),並以曲線圖的形式爲大家展示。

從下圖中可以看到,整體寫入曲線呈現3段式,而且第3段曲線的波動特別明顯,而寫入一整遍全盤的平均速度爲2816 MiB/s

接下來我們來詳細分析下這條寫入曲線,還是很有意思的。

首先可以確定的是SN8100 2TB採用的是全盤模擬方案,第一段全速寫入佔用的SLC Cache容量約爲627.8 GiB左右,正好是全部可用空間(1863 GiB)的1/3。

而出緩後的第二段平直曲線就很有意思了,這一段的寫入量是174.4 GiB左右,平均寫入速度是3770 MiB/s左右,和使用類似硬件方案的金士頓FURY Renegade G5 4TB的TLC直寫速度也相當接近。

而波動最大的第三段,平均寫入速度爲1868 MiB左右,但是上下波動極大,低至不到800 MiB/s,高至3292 MiB/s。

那麼現在有趣的問題來了:

作爲一款全盤模擬SSD,SN8100在第一段寫入過程中就耗盡了所有可用容量(1863 GIB)模擬而來的SLC Cache,按照諸如SN850X之類全盤模擬SSD的典型表現來說,本應直接進入速度較慢的垃圾回收階段,也即呈現兩段式曲線結構。

那SN8100爲何又有三段式曲線?它這第二段的平直寫入曲線又是咋回事?

2.長時寫入測試

爲了進一步分析這個問題,我又使用FIO 3.36對SN8100 2TB進行了兩倍全盤容量的128K Q32T1順序寫入,記錄到的曲線如下:

在這張寫入曲線圖中,第2段和第4段的寫入曲線引起了我的警惕。它們的平均寫入速度非常巧合均爲3770 MiB/s左右。

而好基友、存儲區知名主包 @homolab 在介紹nCache 4.0時提到,SN8100沒有所謂廣義上的TLC直寫的過程,而是在寫滿SLC Cache後,依然會“一邊給SLC寫入,一邊往TLC區塊裏面釋放”,直到乾淨的剩餘塊消耗完了後(第2段),進入REW讀改寫的爆炸階段(第3段)。

按這個說法,SN8100在出緩後“一邊給SLC寫入,一邊往TLC區塊裏面釋放”,WriteBack的過程會同時甩出髒塊和乾淨塊,當落入乾淨塊時寫入速度較高,落入髒塊時需要進行擦寫,速度較慢。

那麼讓我想不明白的問題來了,在這個過程中,第2段曲線所代表的“乾淨的剩餘塊”從何而來?

同樣是已經出緩,SN8100是如何控制先挑選乾淨塊落入,從而形成第2段平直曲線的?難道第2段是WriteBack,第3段就不是了?

有沒有可能SN8100這第2段其實就是直寫呢還是說homolab參考的nCache 4.0早期技術文檔,已經無法完全代表技術迭代後的SN8100?

懷着這個疑問,我詳細檢查了順序寫入過程中的日誌。

根據日誌顯示,SN8100 2TB在出緩時,已經寫入了627.8 GiB左右,此時用於模擬SLC Cache的容量爲628*3≈1883.4 GiB,已經超出了其在Windows中可用的1863 GiB,連少量一級OP都已經參與模擬了。

而第2段曲線過程中的寫入量爲174.7 GiB左右,174.7+1883.4≈2058 GiB,正好和SN8100 2TB的2048 GiB的生產容量相近。

如果假設第2段曲線是在SLC Cache耗盡後,主控調用了OP空間來進行TLC直寫,那似乎能解釋得通。

如果這個假設成立的話,那第4段曲線與第2段的速度大致相同,就說得過去了——當SLC Cache內被寫滿的數據全部完成了垃圾回收,結束了第3段的劇烈波動後,在兩種可能的情況下,都能使得第4段曲線寫入速度達到TLC直寫性能上限:

  • 1.該階段和Crucial T710或者TiPro9000一樣,不用先寫入SLC Cache,直接執行TLC直寫流程,所展示的就是正常的直寫速度。

  • 2.如果nCache 4.0在這裏還是要先寫入SLC Cache再讀出的話,由於此前已被佔滿的Cache空間已經全部整理完畢,此時硬盤內部的3個動作(接收主機數據、讀取 SLC、寫入 TLC)在全速運轉中取得了平衡,達到了NAND顆粒物理吞吐的上限,同樣能顯示TLC直寫速度。

關於這個假設,我在前幾天發佈了一篇單獨的貼子來討論,結果還真有網友提醒我,有一種說法是,SN8100確實是全程都會先寫入SLC Cache,只不過在寫入壓力太大時,從pSLC寫到TLC的過程中,由於片上管理的緣故,能卡出近似直寫的效果,這似乎也能解釋第二段平直曲線的效果。

不過我還是覺得第二段的寫入量實在過於巧合,所以依然抱有懷疑態度,這裏再次請了解詳情的朋友在評論區指教。

當然不管是哪種假設,我們根據第4段的曲線都基本可以確定的是,SN8100 2TB的真實TLC直寫性能應該就在3770 MiB/s左右

3.SLC緩外4K隨機讀取性能

關於SLC Cache緩外隨機讀取性能的重要性,咱們已經說過很多次了。

簡單來說,SSD在低隊列下的隨機讀取性能,是影響我們日常使用電腦時是否流暢的關鍵指標之一,比如我們在進行開機、打開軟件、加載圖片縮略圖等操作時,都會用到隨機讀取操作。

由於SLC Cache機制會對保存其中的數據提供更加精簡、準確的FTL映射,而使用CDM這些軟件測試時,會有先寫入測試文件——再進行測試的過程,測試成績實際是基於SLC Cache加速後的水平,不夠準確。

事實上,我們日常使用電腦時,打開軟件或者加載遊戲等操作,所訪問的基本都是已經被挪出SLC Cache外區域內的數據,示意圖如下:

所以爲了貼近實際,有必要排除SLC Cache的影響後,再對SSD隨機讀取速度進行測試。

由於SSD的真實工作負載非常複雜,是各種粒度、各種隊列、各種讀寫比例的混沌系統,所以咱們在測試時很難覆蓋所有場景。

一般來說,會通過觀察4KB小粒度的隨機讀取性能來管中窺豹,對SSD進行初步的評估。

對於除西數/閃迪以外的其他品牌SSD來說,我們爲了確保SSD已經完成對SLC Cache的垃圾回收過程,會先以128KB QD32順序寫入填盤2遍後,再進行15分鐘的Q1T1 4K隨機讀取測試,最終測得SLC緩外4K隨機讀取速度。

但是nCache 4.0的獨特機制會導致一個問題,它的SLC Cache內始終是有數據的,使用正常流程很難完全排除Cache的加速作用導致的變量,所以這裏使用IOMeter來排除影響,獲得了以下曲線:

從上圖中可以看到,SN8100 2TB的4K隨機緩外讀取速度其實在66.96 MiB/s左右,這在一衆採用SM2508主控的PCIe 5.0 SSD中算是平平無奇,一點都沒有nCache 4.0加持下那種神擋殺神的狂暴表現了,只能說泯然衆人矣。

4.FOB狀態混合隨機讀寫

Windows翔一樣的I/O引擎和文件資源管理機制會限制SSD的性能發揮,所以爲了展示SSD主控和固件在最佳工況下的性能,這裏在Ubuntu 24.04中,使用FIO 3.36腳本再對SN8100 2TB進行了一遍更加完整的,不同隊列深度、不同混合讀寫方案下的測試。

這個項目主要是爲了衡量SSD主控的性能上限,所以在測試前,會確保SSD處於FOB狀態,並且不排除隨機讀取請求命中SSD內部DRAM的情況。

將相關測試結果整理成下圖的表格,大家可以拿來和其他SSD參考對比。

如果覺得表格數據太枯燥的話,也可以參考下面幾張更加直觀的對比曲線圖。

5.ezFIO穩態測試

如果說剛纔FOB狀態下的理論性能測試,代表的是一塊SSD在理想工況下的性能上限,那Steady State穩態中的性能,則代表SSD在極度髒盤、極度重負載場景下的性能下限

對於絕大部分消費級SSD來說,實際我們日常使用時是不會進入穩態場景的,只有專門用在服務器上的企業級SSD纔會考量穩態性能。

不過對於SN8100這種消費級旗艦有緩SSD來說,玩家們普遍對其抱有更高的期望,所以這裏就嘗試壓榨它們的性能,在Ubuntu系統中引入了ezFIO測試項目,繼續深挖它在極限工況下的性能細節。

ezFIO測試主要分爲順序和隨機兩大項內容,爲了確保SSD進入穩態,在測試開始前會有兩次全盤容量順序寫入+兩次全盤容量隨機寫入的預處理流程,之後進行不同粒度、不同隊列深度的隨機讀寫測試,整個測試流程耗時極長,負載強度極大。

在ezFIO的測試中,SN8100 2TB在7讀3寫長時間混合測試中的表現極爲出人意料,平均IOPS倒是挺高,達到了152504,但是變異係數(可以理解爲數據離散程度)真的沒眼看:

如果說同樣採用SM2508主控的金士頓FURY Renegade G5、Crucial T710等消費級SSD產品,變異係數能低至5%左右,算是能勉強進入穩態的話,那SN8100高達93.51%的變異係數就真的有點鬧了。

這個誇張的離散程度意味着SN8100和穩態完全無緣,後續的一系列本應基於穩態下的測試結果基本完全沒有橫向對比的參考價值。

這樣的數據就算做解析也沒啥意義,所以把圖片貼出來,大家看個樂呵就行了。

6.功耗測試

關於SSD的測試,除了溫度之外,還有一項重要內容是觀察其功耗。

雖然對於臺式機用戶來說,這點功耗帶來的電費不值一提,但另外一個重點是,功耗水平可以在某種程度上側面反映SSD的發熱情況——畢竟後者測試起來是真的麻煩,即便有熱電偶溫度計等設備,但是考慮到探頭固定和過熱降速等因素,也很難排除變量干擾。

這裏我拜託好基友 @WittmanARC 定製了一張M.2 SSD功耗測試卡,雖然功能上不如Quarch之類的商用功耗分析平臺,但也能一用了。

對SN8100 2TB進行RAW格式下的全盤範圍順序讀取測試(128KB,Q32T1)過程中,記錄到的寫入速度和實時功耗的圖表如下所示:

緩內高速寫入的功耗,要比Crucial T710 2TB明顯更低:

但同時整體的能耗比方面的表現感覺不如致態TiPro9000 2TB:

總結

以上就是本期關於西數SN8100 2TB的完整測試報告了,寫到最後,需要做總結評價的時候,可着實讓我有點爲難。

首先在硬件配置方面,除了不知爲何沒有用低功耗的LPDDR4顆粒外,SN8100一點問題都沒有,用上了目前的旗艦主控SM2508,也用上了最好的NAND顆粒之一BICS8。

而更重要的是固件方面,SN8100在性能表現上極爲鮮明優缺點都依託nCache 4.0這套方案而來。

最直接的優點是,包括SN8100在內的nCache 4.0方案產品,在面子工程上做的特別好,在像CrystalDiskMark、3DMark、PCMark 10等常用測試軟件中的測試成績都特別高,基本可以認爲是跑針對跑分進行了特別調校。

同時全盤模擬方案對於寫入負載不太大的用戶來說其實也挺實用,能提供儘可能多的加速區間。

第三個優點是,nCache 4.0對於寫入SLC Cache的數據調用也會更積極,只不過考慮到正常用戶長時間使用SSD時,又不會只從SLC Cache內讀取數據,所以其實感覺這一點其實也談不上啥實用性。

而在表面成績優秀的同時,nCache 4.0方案也給SN8100帶來了不少缺點。

第一個缺點,這種全盤模擬+寫入數據始終要全過一遍SLC Cache的模式,會在大容量寫入的時候,帶來更高的寫入放大效應,不太適合經常有大容量、重負載寫入需求的用戶。

這個應該很好理解吧,畢竟如致態TiPro9000、金士頓G5這類產品,一方面SLC Cache不是全盤模擬,另一方面在一次性寫很多數據時,寫滿Cache後直接就進入TLC直寫階段了,寫入放大效應要比nCache 4.0方案小得多。

第二個缺點,SN8100在面對大容量寫入時也會有劇烈的波動,導致全盤的平均寫入速度會比較低,堪稱和三星9100 Pro有異曲同工之妙——三星是主動穩定的低速,西數是神經質一樣忽高忽低。

第三個缺點,就是nCache 4.0方案導致SN8100這塊盤無法進入穩態了。

雖然我和homolab觀點不同,一直認爲消費級SSD實在沒啥必要追求進穩態,並且更推薦大家入手DRAM less無緩SSD。但是在使用同款SM2508主控的情況下,別家競品都能實現5%不到的變異係數,SN8100你直接來個93.51%,一點都穩不下來,這個差距已經大到讓人沒法忽視了——這是用DRAM based的方案做到了DRAM less的效果啊……

對家庭用戶、遊戲用戶來說,SSD不能進穩態其實並沒有啥明顯影響,不過如果你想在服務器或者工作站中,用它幹一些寫入較多的重負載工作的話,那我覺得這塊盤不太合適。

最後總結一下吧,SN8100這款SSD,硬件方案很好,跑分成績也很好,家用和遊戲場景下性能挺棒,是旗艦產品該有的樣子。

唯獨需要注意的是,成也蕭何敗也蕭何,在享受nCache 4.0的優點時,還要考慮它的一些缺點你是否能接受。

我不能說nCache 4.0是個不好的方案,畢竟它的特色是如此突出。

只是就我自己而言,我不太喜歡這種劍走偏鋒的方案,倒不是用起來有啥問題,單純就是心理因素,更喜歡穩妥一些的消費級SSD。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com