谷歌Gemini预告片展示惊艳语音视频交互能力
创始人
2024-05-14 19:33:18
0

原标题:谷歌Gemini预告片展示惊艳语音视频交互能力

IT之家 5 月 14 日消息,人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。

这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。

整个对话过程自然流畅,Gemini 还会询问用户注意到的细节,成功识别出了该活动为谷歌 I / O 开发者大会,并进行了简要介绍。

谷歌发布该预告片的时机非常巧妙,恰好在 OpenAI 有关 ChatGPT 的发布会前几个小时,OpenAI 在此发布会上推出了全新的ChatGPT-4o 大模型,其理解和对话的流畅性以及连贯性方面都达到了无与伦比的水平。

虽然过去的一些演示视频让外界对这类内容持有一定的怀疑态度,但今天展示的案例无疑证实了人工智能聊天机器人可以无缝集成语音和视频输入。这种多模态能力,加上非常自然的对话流,让我们仿佛看到了未来人工智能交互的一瞥。

谷歌 I / O 大会主题演讲将于明天凌晨 1 点举行,届时IT之家将第一时间带来相关报道。

相关内容

热门资讯

泰安港以降本提质增效 激活现代... 烟波浩渺的东平湖畔,千吨货轮鸣笛靠岸,无人堆取料机精准取料,满载煤炭的驳船有序驶离码头——在兖矿泰安...
“全链条”培育助力产业工人由“... 近日,在重庆市垫江县高安镇,一场紧张的“空中清障战”悄然打响。国网重庆垫江供电公司输电运检工王浩名,...
东方医院面向全球开源通用医学基... 11月18日上午,同济大学、同济大学附属东方医院宣布面向全球开源通用医学基座模型Med-Go-32B...
原创 英... 前言 别再盯着英特尔CPU落后的事儿嚼舌根了,现在这公司靠“先进封装”玩出了新花样! 苹果、高通都...
合肥打造“全域场景创新之城” 11月7日,安徽省合肥市高新区发出最新一批征集创新应用场景机会和场景能力的通知,聚焦人工智能产业和量...
从“治理”到“智理”:数智孪生... 来源:朗迪锋 智慧城市的兴起,标志着城市管理模式的重大转变。这些高度精细的虚拟模型,为城市规划、基础...
百度三季度营收312亿,首次披... 11月18日晚,百度发布2025年第三季度财报。财报显示,公司季度总营收312亿元,同比下降7%,环...
超级文旅日科技感拉满 机器人成太极高手 机器狗跳跃转圈 超级文旅日科技感拉满 湖北日报讯 (记者王晶、通讯员李红伟)12...
荣耀ROBOT PHONE明年... 在上个月的荣耀 Magic8 系列暨MagicOS10 发布会上,荣耀 Magic8 AI 概念版手...
十分钟了解!hhpoker视频... 十分钟了解!hhpoker视频巡查真的假的(透视)外挂透视辅助十(确实真的是有挂)1、该软件可以轻松...