OpenAI很快推出多模式人工智能助理:既能交谈,也可识物
创始人
2024-05-13 10:18:20
0

原标题:OpenAI很快推出多模式人工智能助理:既能交谈,也可识物

鞭牛士报道,5月12日消息,据The Information报道, OpenAI 已经向一些客户展示了一种新的多模式人工智能模型,该模型既可以与你交谈,也可以识别物体。

该媒体援引未透露姓名的消息人士的话说,这可能是该公司计划周一展示的一部分。

据报道,与现有的单独转录和文本转语音模型相比,新模型可以更快、更准确地解释图像和音频。

The Information写道,它显然能够帮助客户服务代理更好地理解呼叫者的语调,或者他们是否在讽刺,并且理论上,该模型可以帮助学生学习数学或翻译现实世界的手势。

该媒体的消息来源称,该模型在回答某些类型的问题方面可以超越 GPT-4 Turbo,但仍然容易出错。

开发人员 Ananay Arora 发布了上述通话相关代码的屏幕截图,他表示 OpenAI 也可能正在准备新的内置 ChatGPT 功能来拨打电话。

Arora 还发现了OpenAI 已配置用于实时音频和视频通信的服务器的证据。

如果下周公布的话,这一切都不是 GPT-5。首席执行官 Sam Altman明确否认其即将发布的公告与被认为比 GPT-4 “实质上更好”的模型有任何关系。该信息称 GPT-5 可能会在今年年底公开发布。

奥特曼还表示,该公司不会宣布推出新的人工智能搜索引擎。

但如果The Information 的报道属实,那么谷歌 I/O 开发者大会的进展仍可能会受到一些影响。谷歌一直在测试使用人工智能打电话。传闻中的项目之一是名为Pixie的多模式 Google Assistant 替代品,它可以通过设备的摄像头查看物体,并执行诸如指示购买地点或提供如何使用它们的说明等操作。

无论 OpenAI 计划发布什么内容,它都计划于周一上午 10 点(太平洋时间)/下午 1 点(东部时间)在其网站上进行直播。

相关内容

热门资讯

张小龙10年前就预判了Agen... 文 | 罗超频道 这几天关于微信AI的传言和讨论越来越多,给人一种呼之欲出的感觉,也让自媒体圈迎来...
顶流企业扎堆落地!无锡在具身智... 6月11日,2026长三角机器人及自动化展览会暨无锡具身智能机器人产业链伙伴大会正式启幕。这场由中国...
深圳国产芯片新进展!深智城集团... 近日,市属国企深智城集团旗下深圳市智城算网科技有限公司联合多家高校及研究机构,成功完成1.6万亿参数...
大众点评宣布加大真实内容生态投... 当前,随着AI创作工具进一步普及,AI生成内容泛滥,各类种草帖越来越精美,但也越来越雷同。特别是在吃...
兆易创新推出光模块专用MCU新... IT之家 6 月 12 日消息,兆易创新 (GigaDevice) 本月 10 日宣布推出 GD32...
原创 杨... 《神雕侠侣》中,那主角杨过堪称是万人迷一般的存在,只要是与他接触过的女子,都不免会被他迷得晕头转向,...
济南九宸赋买了会保值吗?克而瑞... 九宸赋售楼处官方咨询电话:0531-85999999,由开发商统一认证,案场销售团队直接接听,可咨询...
气温和体感温度为何不同?气象因... 今天来说说气温。相比降水,气温与我们的关系似乎更为密切。因为降水不会天天出现在你的生活中,缺席个把月...
厦门如何抢跑AI影视赛道? 近日,厦门影视产业的数智化布局落子频频。先是由厦门软投与厦门大学电影学院共建的“未来视听·人工智能实...
安克创新CEO阳萌预言“充电宝... 每经记者:陈鹏丽 每经编辑:杜宇 “充电宝这个品类,不但一定不会变成千亿元级品类产品,它大概率过几年...