晚點團隊：V4 發佈前的 DeepSeek：特質、組織和梁文鋒的獨特目標

晚點團隊最近發了一篇關於 DeepSeek 的深度報道，信息量很大，我來幫大家捋一捋。

先說人事變動。DeepSeek 確實走了幾個核心成員：第一代大語言模型的核心作者王炳宣被騰訊挖走了，R1 的核心作者郭達雅也正式離職，可能去某大廠，還有做 OCR 的魏浩然、做多模態的阮翀也先後離開。但文章也強調了，走的是少數，更多人選擇留下來。

再說 V4。其實早在今年 1 月，V4 的小參數版本就已經給到一些開源社區做適配了，原本最樂觀的預期是春節前後發佈，但現在看起來可能要到 4 月。

然後聊聊梁文鋒這個人，挺有意思的。不到 30 歲就財富自由，生活極其簡單，好多天穿同一件衣服，在杭州長期住酒店，在北京租房住。他幾乎不社交，不參加團建，年底大團建只在講話時露面，講完就走。有個小故事特別能說明他的風格：MiniMax 的創始人閆俊傑約他喫飯，到了之後看到一個穿 T 恤的小哥，以爲是助理，結果對方上來就問了半小時技術問題，閆俊傑問"梁總什麼時候來"，對方說"我就是梁文鋒"。

組織方面，DeepSeek 可能是全球唯一一個"不卷"的頂級 AI 實驗室。不打卡，沒有明確的績效考覈和截止時間，多數人下午六七點就下班了。梁文鋒的邏輯是：一個人每天能高質量輸出的時間就 6 到 8 小時，加班加出來的昏庸判斷反而浪費算力。整個研究團隊 100 多人，只有梁文鋒和研究員兩個層級，極度扁平。團隊成員超七成是本碩，超七成不到 30 歲。

關於方向選擇，梁文鋒的路線跟行業主流有明顯差異。他沒有重押多模態生成，覺得那不是智能的主線。在 Agent 方向上投入也相對剋制。他更看重三件事：一是極致的效率優化，用更少的算力做出更多的智能；二是基於國產生態做大模型，包括適配國產 GPU；三是做一些別人不願意試的"原創式創新"，比如 OCR 系列、持續學習、仿生人腦的探索，甚至招了神經科學和腦科學的顧問。

當然，挑戰也很現實。DeepSeek 之前沒融過資，員工手裏的期權沒有明確標價，而外面的公司開出的薪資翻兩三倍都不稀奇，有的甚至給八位數總包。智譜、MiniMax 上市股價高漲，也讓內部成員對自己手中期權的價值產生更多疑問。梁文鋒已經開始想辦法給公司估值，給團隊更確定的預期。

最後一個信號值得關注：DeepSeek 最近的招聘啓事裏，第一次出現了 Agent 方向的"模型策略產品經理"崗位，要求熟悉 Claude Code、OpenClaw、Manus 等產品。這意味着 DeepSeek 接下來大概率會在 Agent 產品上有更多動作。

總的來說，DeepSeek 依然是那個追求獨特目標、敢於走不同路線的團隊，只是在外部競爭加劇的環境下，它也在學着適應和調整。正如文章最後說的：低頭做事的人不一定能在浮躁的市場裏笑到最後，但只有更多這樣的公司出現，中國科技纔有從"復刻"到領跑的可能。（來自@默庵·超級個體）

原文鏈接：《V4 發佈前的 DeepSeek：特質、組織和梁文鋒的獨特目標》

https://www.latepost.com/news/dj_detail?id=3489