DeepSeek翻車了?V3.1內容輸出中會憑空出現“極”字

近期,DeepSeek發佈的最新V3.1模型在開發者社區中引發關注。據多位開發者在實際測試中反饋,該模型在進行代碼生成等任務時,其輸出結果中會隨機、無規律地插入“極”、“極”或“extreme”等與上下文無關的特定字符。

不只是國內,在Reddit上也是討論聲一片。

值得注意的是,這種情況也並非只出現在通過第三方平臺或API調用,甚至官網也同樣存在這個問題。這就說明的確是ds那邊的問題,而非外部接口或應用配置問題。

總之,這是一個非常嚴重的問題,直接導致ds3.1無法從事編程或結構輸出等高敏感工作。

有大佬分析了可能的原因:

簡單來說,就是差一錯誤。

某個程序員在處理大量的文本數據時,可能想寫一個程序,自動把一些重複、囉嗦的段落用省略號(……)來代替,以清理數據。

於是他告訴程序:“當你檢測到重複內容時,就插入我們字典裏編號爲 2576 的那個符號(也就是省略號)”。

但是,這個程序員在寫代碼的時候也許是不小心,或者因爲計算方式的差異(比如一個從0開始數,一個從1開始數),他寫的指令變成了:“插入編號爲2576+1的符號”。

程序非常聽話,於是就把所有原本應該放省略號的地方,全都錯誤地放上了字典裏編號爲 2577 的符號——也就是 “極”。

最後,這個有問題的程序處理了海量的文本,製造出了一大堆在各種奇怪地方都插入了“極”字的髒數據。 然後,這些數據又被當做學習資料餵給了ds3.1這個模型進行訓練。

AI在學習了這些海量的、被污染的資料後,就形成了一種錯誤的認知。它認爲在很多情況下,隨機地插入一個“極”字是正常的、合理的行爲。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com