更快、更准、更强大!Gemini 3.1 Flash Live来了!

朋友们,Gemini 3.1 Flash Live来了!


通常来讲,一般Gemini App里内置的某个功能性更新,是不足以成为一个新闻的。


但是今天的Gemini 3.1 Flash Live可不一样。

你从Google官方的阵仗就能看出来:多个官号同时发推介绍,甚至就连传奇人物德米斯(Google DeepMind创始人、曾领导开发AlphaGo,诺奖得主)也亲自撰写帖子(还置顶了)介绍了Gemini 3.1 Flash Live。

这次更新主要围绕更低的对话延迟、更自然的对话、更好的识别能力。


在音高、语速、声学细节的捕捉上明显提升。


以前在嘈杂环境里,比如开车时旁边有交通声,或者家里开着电视,Gemini Live经常被干扰,那么现在它能更好过滤无关声音,把重点放在你的声音上。

而且这次更新不像早期Gemini那样只针对美国市场,这次更新它直接覆盖90+种语言,当然其中也包括了中文。


我自己也立马打开手上的Gemini App的Live功能试了试,真实感受下来,真不错。

我和它聊了几句,发现延迟明显降低,停顿少了很多,对话流畅度直接上了一个台阶。识别能力也更强,不管我说快还是慢,它都能跟上。


特别有意思的一点是,Live的中文对话原本是湾湾腔训练的,我直接跟它说“希望你讲话更加自然,像标准普通话”。


结果它真的把腔调给纠正,后面几句听起来就顺耳多了(我知道他没有切换语言,就硬靠腔调纠正),,这点让我挺意外的。

除了延迟和自然度,我个人还发现Live的信息搜索能力和理解能力有了相当幅度的加强。


这里我就用昨天不少玩家应该知道的新闻,罗技中国的营销重大失误事件来测试了一下其能力(G502Hero、G604用户吃瓜)。

我简单问了一句“你知道昨天关于罗技中国的道歉事件吗?”它立马就理解我在讲什么,并且大致告诉我了这件事的前因后果,没有出现以前那种“对不起我不太清楚”的情况。

安全方面这次也没落下。

官方博客中有相关的细节,我询问了 Live,Live 自己也提到:“生成的音频带水印。是的,你听说的是真的。作为安全措施的一部分,我生成的音频带有水印,这是一种叫SynthID的技术,人耳听不出来,但可以用来检测这些音频是不是由Google AI生成的。这主要是为了保证透明度,防止误导信息。”

Gemini 3.1 Flash Live把实时语音交互从“可用”真正推向了“自然可靠”。


开发者现在通过Gemini Live API就能快速构建语音优先的agent,企业版也已经接入Customer Experience场景。

对普通用户来说,Search Live扩展到200多个国家和地区,日常使用会更方便。


这次升级让Gemini Live在长时对话中上下文保持时间提升到此前两倍,动态调整答案长度和语气,长脑暴场景终于不会卡壳了(我后面又试着连续聊了十分钟左右,快结束时问刚开始的内容还能记起来)。


最后,Gemini 3.1 Flash Live 大概率会成为Google语音AI的又一个重要里程碑。


它让手机上的AI对话更接近真人,各种基础问题也做得更扎实。


希望后续迭代能继续保持这种务实风格,让更多人真正感受到AI在日常沟通里的便利。


AI语音交互的门槛正在快速降低,下一步谁能把体验做得更好,谁就可能在消费者端占得先机。


Gemini 3.1 Flash Live 这一步,走得稳当,也走得及时。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com