百度集團副總裁吳甜：文心大模型 3.5 能力已經超出 ChatGPT 3.5

7 月 19 日消息，“新版本文心一言的能力已經超出 ChatGPT 3.5，這也是在我們國內開展相關技術工作重要的里程碑。”百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜向網易科技等媒體表示。

她介紹，IDC 最新發布的《AI 大模型技術能力評估報告，2023》顯示，百度文心大模型 3.5 拿下 12 項指標的 7 個滿分，綜合評分第一，算法模型第一，行業覆蓋第一。

據悉，IDC 評估報告圍繞產品技術、服務生態以及行業應用三大維度，考察大模型的 10 餘項指標，國內主流大模型包括百度、阿里、騰訊、華爲、科大訊飛、360、商湯等 14 家廠商參與了本次評估。報告結果顯示，百度文心在模型能力、工具平臺、生態佈局以及行業覆蓋上優勢明顯，並已提前進入商業化落地探索階段。

吳甜介紹，百度自 2019 年開始深耕預訓練模型研發，先後發佈知識增強文心繫列模型。前不久，百度正式發佈文心大模型 3.5 版本，進一步在基礎模型、知識增強、檢索增強等多項核心技術上取得創新，新版本在各項能力上均有明顯提升。

具體而言，她表示文心大模型取得“第一”得益於百度“芯片-框架-模型-應用”四層技術棧優勢、知識增強的核心特色和繁榮的大模型生態三大優勢。尤其是百度擁有自研的深度學**臺飛槳有力支撐了大模型的高效訓練和推理。飛槳與文心的協同優化，讓文心大模型 3.5 最新版本的模型效果提升 50%，訓練速度提升 2 倍，推理速度提升 30 倍。

在大模型生態方面，她介紹，百度文心已形成企業、教育、社區三位一體的生態體系。最新數據顯示，百度有超過 750 萬開發者基礎，20 萬企業生態基礎，多層次開展大模型人才培訓、企業賦能、開發者運營。百度還設立了 10 億創投基金鼓勵大模型創意、繁榮大模型生態。

她直言，目前大模型產業化仍面臨着巨大的挑戰，總結起來有三方面：首先是大模型的體積確實很大，帶來的訓練難度高、成本高；第二是對算力規模要求非常大，性能要求非常高；第三在於數據規模也很大，收集、挖掘、建設、篩選、清洗這些數據，本身也是非常大的大工程。“大模型平臺是價格昂貴的大算力系統，其實完全不需要存在大量的大模型，對於應用者來說也不需要每個應用都進行大模型的開發。”

至於“百模大戰”的終局是怎樣的？吳甜談到，“過去短短几個月時間，大量新的大模型出現，但這是個階段現象，未來各個企業和機構會逐漸找到自己的定位，下一步會走向自己細分的方向，終局只會集中在少量的幾個大模型，但依託幾個少量大模型，會有非常廣泛的應用生態出現。”