晚點團隊最近發了一篇關於 DeepSeek 的深度報道,信息量很大,我來幫大家捋一捋。
先說人事變動。DeepSeek 確實走了幾個核心成員:第一代大語言模型的核心作者王炳宣被騰訊挖走了,R1 的核心作者郭達雅也正式離職,可能去某大廠,還有做 OCR 的魏浩然、做多模態的阮翀也先後離開。但文章也強調了,走的是少數,更多人選擇留下來。
再說 V4。其實早在今年 1 月,V4 的小參數版本就已經給到一些開源社區做適配了,原本最樂觀的預期是春節前後發佈,但現在看起來可能要到 4 月。
然後聊聊梁文鋒這個人,挺有意思的。不到 30 歲就財富自由,生活極其簡單,好多天穿同一件衣服,在杭州長期住酒店,在北京租房住。他幾乎不社交,不參加團建,年底大團建只在講話時露面,講完就走。有個小故事特別能說明他的風格:MiniMax 的創始人閆俊傑約他喫飯,到了之後看到一個穿 T 恤的小哥,以爲是助理,結果對方上來就問了半小時技術問題,閆俊傑問"梁總什麼時候來",對方說"我就是梁文鋒"。
組織方面,DeepSeek 可能是全球唯一一個"不卷"的頂級 AI 實驗室。不打卡,沒有明確的績效考覈和截止時間,多數人下午六七點就下班了。梁文鋒的邏輯是:一個人每天能高質量輸出的時間就 6 到 8 小時,加班加出來的昏庸判斷反而浪費算力。整個研究團隊 100 多人,只有梁文鋒和研究員兩個層級,極度扁平。團隊成員超七成是本碩,超七成不到 30 歲。
關於方向選擇,梁文鋒的路線跟行業主流有明顯差異。他沒有重押多模態生成,覺得那不是智能的主線。在 Agent 方向上投入也相對剋制。他更看重三件事:一是極致的效率優化,用更少的算力做出更多的智能;二是基於國產生態做大模型,包括適配國產 GPU;三是做一些別人不願意試的"原創式創新",比如 OCR 系列、持續學習、仿生人腦的探索,甚至招了神經科學和腦科學的顧問。
當然,挑戰也很現實。DeepSeek 之前沒融過資,員工手裏的期權沒有明確標價,而外面的公司開出的薪資翻兩三倍都不稀奇,有的甚至給八位數總包。智譜、MiniMax 上市股價高漲,也讓內部成員對自己手中期權的價值產生更多疑問。梁文鋒已經開始想辦法給公司估值,給團隊更確定的預期。
最後一個信號值得關注:DeepSeek 最近的招聘啓事裏,第一次出現了 Agent 方向的"模型策略產品經理"崗位,要求熟悉 Claude Code、OpenClaw、Manus 等產品。這意味着 DeepSeek 接下來大概率會在 Agent 產品上有更多動作。
總的來說,DeepSeek 依然是那個追求獨特目標、敢於走不同路線的團隊,只是在外部競爭加劇的環境下,它也在學着適應和調整。正如文章最後說的:低頭做事的人不一定能在浮躁的市場裏笑到最後,但只有更多這樣的公司出現,中國科技纔有從"復刻"到領跑的可能。(來自@默庵·超級個體)
原文鏈接:《V4 發佈前的 DeepSeek:特質、組織和梁文鋒的獨特目標》
https://www.latepost.com/news/dj_detail?id=3489
![]()
![]()
強烈推薦
看片自由!一個播放器搞定主流雲盤:原畫質播放,還能刮削海報牆
![]()
昨日精選
真●懶人福利工具!只要一個空格鍵,秒預覽200+Windows文檔格式
15年收藏,吐血分享!AIMP1000+枚皮膚,113個關聯圖標,94個拓展
![]()
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com
