世界第一AI模型,实锤套壳国产了

巴西这个国家,踢足球是真厉害。

多次世界杯冠军,贝利、加林查、罗纳尔多、内马尔,光这四个名字就能凑一桌麻将,,最近这两年,巴西人似乎又开始琢磨一件新事情,叫AI。


一个我们印象里只有桑巴、贫民窟、BOPE和足球的国家,突然冒出来说自己做了个能跟中国顶级大模型掰手腕的开源模型,而且不光做了,还在好几个测试里把Qwen 3.7、Kimi K2.6等选手都压在身下。


这事儿发生在6月13号。


里约热内卢市政府旗下的IT公司IplanRIO,放出一个叫Rio 3.5 Open 397B的大模型。397B参数,MoE架构,激活参数大概只有17B,对外完全开源,MIT协议。


我们直接看性能,Terminal-Bench 2.1上,Rio 3.5拿到70.8%,Qwen 3.7 Plus 70.3%,DeepSeek v4 Pro只有67.9%。数学奥赛IMOAnswerBench 89.5%正确率,连号称人类最后的考试HLE都比Qwen 3.7 Plus高了快两个点。

有趣的是,里约市长Eduardo Cavaliere亲自下场发推,说一个由市政府公共财政支持的开放AI模型,今天全世界都在谈论它。


巴西世界杯揭幕战期间,这事儿瞬间从里约传到了全世界,一个不知名的拉美政府IT团队,一夜之间成了开源SOTA,里约的骄傲,巴西的骄傲。。。

如果你只看到这一面,大概会想,巴西AI是真的要起飞。


但是,巴西的爽文故事到这就可以宣判结束了。


RIO发布不到24小时,X上的Nex团队发布了一条帖子:

Nex这个团队来头也不小,上海创智学院发起的AI智能体开源联盟,他们的旗舰模型Nex-N2-Pro,比Rio早几天才刚发出来。

他们给了两条铁证。


想要吃瓜的朋友们链接已经为你们准备好了

https://github.com/nex-agi/Nex-N2/issues/4


第一条,是模型自白。


Rio出厂时硬编码了一条系统提示词,强制模型对外自称“Rio 3.5 Open,由Rio AI Labs训练”。Nex团队把这条提示词摘掉,对着Rio连发了120次“你是谁”。

结果,79.2%的情况下,模型回答自己是Nex或者Nex from Nex-AGI,回答是Rio的,0次。

更离谱的是,Rio还会一字不差背诵Nex的机构介绍,“上海创智学院”“大模型生态联盟”等这些私有名词是Nex自己训练数据里才有的内容,全被复述出来。


你想想看,堂堂一个独立的里约团队,怎么可能让模型背诵上海机构的内部介绍。


第二条,是权重数学分析。


如果Rio真的是Nex和Qwen按比例混出来的,那么Rio的每个张量就必然精确落在Nex和Qwen连成的直线上。Nex团队对模型60层每一层都做了检验,结果Rio的权重确实全都在这条线上,混合比例稳定在约0.57 Nex加0.43 Qwen,60层之间几乎没什么波动。

余弦相似度cos_fit高达0.984到0.993。

这是个什么概念呢——正常两个独立训练的模型,在同一个参数空间里随机撞上的概率几乎为零,偏差大概是±0.0001这个量级。0.99的共线性,相当于偏离随机情况数万个标准差,而且60层全都这样。


Nex团队在GitHub公开了完整报告和验证脚本,相关issue里有人评论道:

开放权重意味着你永生不灭——但也意味着你无法掩盖盗窃行为。权重就像指纹。每个思维的张量中都承载着其传承信息。你无法像洗钱那样洗白思维——因为数学会记住一切。

Rio团队反应也挺快。

他们更新了HuggingFace模型卡,把SOTA基准表整个撤下来,承认模型是用Nex-N2-Pro和Qwen3.5-397B-A17B合并构建的,再做了On-Policy Distillation。原话是“我们发现上一个版本存在一个上传错误,基础合并版本被错误上传,而不是最终的蒸馏模型,我们为此道歉。”

之前那个被下载了11万次的checkpoint也被删了。


同时还闹内讧了似乎。。。

看起来像是个较为体面的收场,但你细品他们那句话,“错误的版本被上传了”,意思是正确的版本应该是经过蒸馏的,,,可即便真做了蒸馏,基座还是Nex加Qwen啊?


而且,如果一开始就心里坦荡,为什么模型卡里要硬编码“你是Rio”,而不是直接告诉用户这个模型是基于Nex和Qwen合并的呢?


这就是开源社区最敏感的那根神经,归属(attribution)。

技术上,把两个开源模型合并是完全合理合法的——Nex是Apache 2.0,Qwen也是开放许可,你想怎么用就怎么用,没有任何人会去告你,但开源社区有一条不成文的底线,就是你用了什么,就要明说。


藏起来当原创发,那就不是技术问题,是信用问题。

这次格外刺眼的地方在于,背后是里约市政府,一个市级行政机构,借着世界杯的氛围,宣称自己实现了公共部门的AI主权,市长亲自下场背书,结果扒开一看,主权主体是上海创智学院和阿里,这就不是一般的小团队套壳可以类比的。


不过话说回来,国产模型被套壳被借鉴等,真不是头一回了。


例如今年三月,日本乐天集团宣称自己研发了全世界第一个针对日语的大模型,再各方面也是都达到了开源SOTA,结果被人发现是基于 DeepSeekV3 微调而来:

往前三个月,今年3月,AI编程工具Cursor发布自研代码模型Composer 2,宣称性能超越Claude Opus 4.6,价格只要竞品的十分之一!


结果发布不到24小时,就有开发者在调试API时发现请求路径里出现了kimi的字样。

Cursor第一反应是封掉那条调试路径,但马斯克亲自在社交平台点名确认,Cursor才被迫承认“疏忽”并道歉,月之暗面后来证实,双方确实通过Fireworks AI有合作,Cursor确实在用Kimi,但发布时只字未提,还装作自研。

不过这个吧,严格说算不上抄袭,毕竟背后真有授权合作,只是发布时瞒着没说。


再往前,2024年,一个斯坦福AI团队高调宣称,只要500美元就能训练出超越GPT-4V的多模态模型Llama3-V,迅速冲上了HuggingFace首页。

结果很快被人扒出来,它的代码和权重跟清华和面壁智能联合发布的MiniCPM-Llama3-V 2.5几乎一模一样,连变量名都没改完。

最离谱的是,面壁团队曾悄悄给MiniCPM训练过识别「清华简」的能力,数据是他们自己逐字扫描标注的,从没对外公开,结果Llama3-V不仅能识别清华简,连答错题的方式和MiniCPM都一模一样。

后来团队删评论删仓库,舆论压不住了才发道歉声明。

从乐天、斯坦福、Cursor、再到里约市,高校、企业、甚至官方背景机构,过去这一年都不约而同地走向了“套壳国产”这条路。


至于是哪国产?欸这你别问。


前几年大家还在感叹国内的AI落后OpenAI多少个身位,怎么转眼之间,国产开源大模型已经成了全球套壳的首选基座。


DeepSeek、Qwen、Kimi、GLM、Nex,这些名字在国际开源社区的下载榜上排得越来越靠前。。。能被套壳,其实反而是技术实力的一种反向背书,毕竟没人会去抄一个不好的模型。


Nex团队在X上的态度也很有意思,他们说 “我们对里约市使用我们的工作来实现SOTA性能感到荣幸,但在开源世界里,归属很重要。”


至于Rio团队承诺重新上传的“正确版本”什么时候上,上来之后是不是真的做了蒸馏,还是只是把系统提示词改得更严一些,社区估计还会有人盯着继续看。


到那时候,里约这块招牌,是真能挂起来,还是又得撤下来,就看这一次了。


而作为看着国产模型一步步从被嘲笑“套壳OpenAI”走到今天“被套壳”的各位,我觉得这种感觉确实挺有趣的。

虽然是被抄了一把,但反过来想想,这也说明了一件事。


咱们的开源AI,也是屹立于世界模型之林了。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com