DeepSeek正式推出V4系列預覽版,包括旗艦DeepSeek-V4-Pro(1.6T總參數,49B激活)和輕量DeepSeek-V4-Flash(284B總參數,13B激活),均支持100萬token超長上下文。
採用混合注意力(CSA+HCA)、mHC連接和Muon優化器,在32T+高質量token上預訓練,後訓練通過GRPO實現領域專家獨立培育與統一集成。
Pro-Max在編碼、推理、Agent任務上達到開源SOTA,逼近頂級閉源模型;Flash-Max在更大思考預算下性能接近Pro。
目前,模型已在Hugging Face全量開源(MIT許可),API定價也較爲親民(Pro輸入緩存命中僅$0.145/M)。
社區已開始大規模測試與部署。
![]()
![]()
![]()
![]()
![]()
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com
