DeepSeek翻车了?V3.1内容输出中会凭空出现“极”字

近期,DeepSeek发布的最新V3.1模型在开发者社区中引发关注。据多位开发者在实际测试中反馈,该模型在进行代码生成等任务时,其输出结果中会随机、无规律地插入“极”、“極”或“extreme”等与上下文无关的特定字符。

不只是国内,在Reddit上也是讨论声一片。

值得注意的是,这种情况也并非只出现在通过第三方平台或API调用,甚至官网也同样存在这个问题。这就说明的确是ds那边的问题,而非外部接口或应用配置问题。

总之,这是一个非常严重的问题,直接导致ds3.1无法从事编程或结构输出等高敏感工作。

有大佬分析了可能的原因:

简单来说,就是差一错误。

某个程序员在处理大量的文本数据时,可能想写一个程序,自动把一些重复、啰嗦的段落用省略号(……)来代替,以清理数据。

于是他告诉程序:“当你检测到重复内容时,就插入我们字典里编号为 2576 的那个符号(也就是省略号)”。

但是,这个程序员在写代码的时候也许是不小心,或者因为计算方式的差异(比如一个从0开始数,一个从1开始数),他写的指令变成了:“插入编号为2576+1的符号”。

程序非常听话,于是就把所有原本应该放省略号的地方,全都错误地放上了字典里编号为 2577 的符号——也就是 “极”。

最后,这个有问题的程序处理了海量的文本,制造出了一大堆在各种奇怪地方都插入了“极”字的脏数据。 然后,这些数据又被当做学习资料喂给了ds3.1这个模型进行训练。

AI在学习了这些海量的、被污染的资料后,就形成了一种错误的认知。它认为在很多情况下,随机地插入一个“极”字是正常的、合理的行为。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com