OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话
创始人
2024-12-13 09:02:03
0

本文作者:李丹

来源:硬AI

OpenAI为期12个工作日的新产品和技术发布活动出了新王炸:在首次公开演示将近七个月后,OpenAI正式面向广大付费用户推出ChatGPT类人高级人工智能(AI)语音助手的新功能,实时视频对话。

美东时间12月12日周四,OpenAI宣布,在ChatGPT的移动端应用程序App中,上线ChatGPT高级语音模式Advanced Voice的视频和共享屏幕功能。Advanced Voice由OpenAI的多模态模型GPT-4o支持。

OpenAI的研究员在直播中演示了任何运用新功能,点击ChatGPT 聊天栏旁边的语音图标,然后点击左下角的视频图标,就可以启动视频对话。如果想共享屏幕,手机用户要点击打开一个有三个喧嚣的菜单,选择其中的“共享屏幕”(Share Screen)。

在和ChatGPT的视频对话中,OpenAI研究员提问,研究员先让GPT看到并和现场的OpenAI工作人员分别打过招呼,然后问GPT,现场谁的打扮最像圣诞老人,谁像圣诞老人的驯鹿,GPT均作出准确而回答。研究员演示了,给GPT转发一个短信内容及图片,让GPT建议如何回复对方的短信。

研究员还演示了,利用Advanced Voice的新功能让GPT帮忙校对或者通过GPT学习新东西。比如找出一些制作手冲咖啡的咖啡壶、过滤杯等工具,向GPT展示并询问如何使用这些工具,在操作时,让GPT评价做得如何,并给出建议。

OpenAI表示,大多数ChatGPT Plus和 Pro套餐的订阅用户以及所有Team用户都将可以在今后几天内通过ChatGPT的App访问周四推出的新功能,预计欧盟、瑞士、冰岛、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用户也将很快可以运用新功能。ChatGPT的企业版和教育版Enterprise和Edu将于明年1月上线新功能。

同时OpenAI宣布,在Advanced Voice这一高级语音模式中,新增了“限时”的圣诞老人声音作为“节日特供”,有效期持续到明年1月初,在全球范围内,所有移动、网络和桌面App用户都可选用,它可通过 ChatGPT 中的雪花图标访问。

OpenAI原计划6月末向一小批Plus计划用户推出该语音模式,6月又宣布推迟一个月发布,以便确保该功能安全有效地处理来自数百万用户的请求。当时OpenAI称,计划今年秋季让所有Plus用户都可以访问该功能,确切的时间表取决于是否达到内部对安全性和可靠性的高标准。

7月末,OpenAI对有限的部分付费Plus用户推出高级语音模式下的ChatGPT,称语音模式无法模仿他人的说话方式,且增加了新的过滤器,保证软件能够发现并拒绝某些生成音乐或其他形式受版权保护音频的请求。当时上线的语音模式缺少5月OpenAI展示过的不少功能,比如计算机视觉功能,类似于本周四OpenAI宣布将要推出的视频对话答问。

相关内容

热门资讯

腾讯大模型研发架构升级,Ope... OpenAI前研究员姚顺雨入职腾讯。12月17日,腾讯官宣升级大模型研发架构,新成立AI Infra...
AI+生物制造 看浙江科技“新... 近日,由省科学技术厅、省经信厅等部门指导,省高新技术企业协会等单位共同开展的“浙江省科技新小龙探访和...
国际影视院校联合会2025年会... 近日,国际影视院校联合会2025年会于墨西哥闭幕,中国传媒大学作为联合会亚太区域(CILECT As...
巨头宣布破产,将成中国代工厂子... 懒人家庭直接锁死扫地机器人! 实现家务躺平自由 近年来 越来越多的家庭 入手了扫地机器人 iRob...
“十四五”期间,贵州建成全国领... 12月17日,贵州省政府新闻办举行贵州省“十四五”时期数字经济发展成就新闻发布会。 发言人答 记者问...
从6G原型样机到新基建工程,中... 近日,我国6G研发与工程化进程再迎重要进展。 中国移动正式发布“中国移动6G传输系统原型样机1.0”...
从主轴“转”向太空,昊志机电精... 来源:滚动播报 (来源:财闻) 精密技术叩开商业航天大门,昊志机电锚定蓝海新市场。 2025年12...
原创 中... 在过去的几天里,泰国与柬埔寨之间的冲突似乎愈演愈烈,战场的硝烟已经超出了人们的预期,深刻影响了两国的...
以“新”破圈 以“质”增效 今年以来,克拉玛依石化公司(以下简称“克石化公司”)以科技创新为引领,持续深化“减油增特”和“双碳三...
“十五五”如何加快推进农业现代... 封面新闻记者 陈远扬 一天前,资阳雁江区委六届十一次全会召开。12月17日,当地召开新闻发布会,解读...