更快、更準、更強大!Gemini 3.1 Flash Live來了!

朋友們,Gemini 3.1 Flash Live來了!


通常來講,一般Gemini App裏內置的某個功能性更新,是不足以成爲一個新聞的。


但是今天的Gemini 3.1 Flash Live可不一樣。

你從Google官方的陣仗就能看出來:多個官號同時發推介紹,甚至就連傳奇人物德米斯(Google DeepMind創始人、曾領導開發AlphaGo,諾獎得主)也親自撰寫帖子(還置頂了)介紹了Gemini 3.1 Flash Live。

這次更新主要圍繞更低的對話延遲、更自然的對話、更好的識別能力。


在音高、語速、聲學細節的捕捉上明顯提升。


以前在嘈雜環境裏,比如開車時旁邊有交通聲,或者家裏開着電視,Gemini Live經常被幹擾,那麼現在它能更好過濾無關聲音,把重點放在你的聲音上。

而且這次更新不像早期Gemini那樣只針對美國市場,這次更新它直接覆蓋90+種語言,當然其中也包括了中文。


我自己也立馬打開手上的Gemini App的Live功能試了試,真實感受下來,真不錯。

我和它聊了幾句,發現延遲明顯降低,停頓少了很多,對話流暢度直接上了一個臺階。識別能力也更強,不管我說快還是慢,它都能跟上。


特別有意思的一點是,Live的中文對話原本是灣灣腔訓練的,我直接跟它說“希望你講話更加自然,像標準普通話”。


結果它真的把腔調給糾正,後面幾句聽起來就順耳多了(我知道他沒有切換語言,就硬靠腔調糾正),,這點讓我挺意外的。

除了延遲和自然度,我個人還發現Live的信息搜索能力和理解能力有了相當幅度的加強。


這裏我就用昨天不少玩家應該知道的新聞,羅技中國的營銷重大失誤事件來測試了一下其能力(G502Hero、G604用戶喫瓜)。

我簡單問了一句“你知道昨天關於羅技中國的道歉事件嗎?”它立馬就理解我在講什麼,並且大致告訴我了這件事的前因後果,沒有出現以前那種“對不起我不太清楚”的情況。

安全方面這次也沒落下。

官方博客中有相關的細節,我詢問了 Live,Live 自己也提到:“生成的音頻帶水印。是的,你聽說的是真的。作爲安全措施的一部分,我生成的音頻帶有水印,這是一種叫SynthID的技術,人耳聽不出來,但可以用來檢測這些音頻是不是由Google AI生成的。這主要是爲了保證透明度,防止誤導信息。”

Gemini 3.1 Flash Live把實時語音交互從“可用”真正推向了“自然可靠”。


開發者現在通過Gemini Live API就能快速構建語音優先的agent,企業版也已經接入Customer Experience場景。

對普通用戶來說,Search Live擴展到200多個國家和地區,日常使用會更方便。


這次升級讓Gemini Live在長時對話中上下文保持時間提升到此前兩倍,動態調整答案長度和語氣,長腦暴場景終於不會卡殼了(我後面又試着連續聊了十分鐘左右,快結束時問剛開始的內容還能記起來)。


最後,Gemini 3.1 Flash Live 大概率會成爲Google語音AI的又一個重要里程碑。


它讓手機上的AI對話更接近真人,各種基礎問題也做得更紮實。


希望後續迭代能繼續保持這種務實風格,讓更多人真正感受到AI在日常溝通裏的便利。


AI語音交互的門檻正在快速降低,下一步誰能把體驗做得更好,誰就可能在消費者端佔得先機。


Gemini 3.1 Flash Live 這一步,走得穩當,也走得及時。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com