OpenAI很快推出多模式人工智能助理:既能交谈,也可识物
创始人
2024-05-13 10:18:20
0

原标题:OpenAI很快推出多模式人工智能助理:既能交谈,也可识物

鞭牛士报道,5月12日消息,据The Information报道, OpenAI 已经向一些客户展示了一种新的多模式人工智能模型,该模型既可以与你交谈,也可以识别物体。

该媒体援引未透露姓名的消息人士的话说,这可能是该公司计划周一展示的一部分。

据报道,与现有的单独转录和文本转语音模型相比,新模型可以更快、更准确地解释图像和音频。

The Information写道,它显然能够帮助客户服务代理更好地理解呼叫者的语调,或者他们是否在讽刺,并且理论上,该模型可以帮助学生学习数学或翻译现实世界的手势。

该媒体的消息来源称,该模型在回答某些类型的问题方面可以超越 GPT-4 Turbo,但仍然容易出错。

开发人员 Ananay Arora 发布了上述通话相关代码的屏幕截图,他表示 OpenAI 也可能正在准备新的内置 ChatGPT 功能来拨打电话。

Arora 还发现了OpenAI 已配置用于实时音频和视频通信的服务器的证据。

如果下周公布的话,这一切都不是 GPT-5。首席执行官 Sam Altman明确否认其即将发布的公告与被认为比 GPT-4 “实质上更好”的模型有任何关系。该信息称 GPT-5 可能会在今年年底公开发布。

奥特曼还表示,该公司不会宣布推出新的人工智能搜索引擎。

但如果The Information 的报道属实,那么谷歌 I/O 开发者大会的进展仍可能会受到一些影响。谷歌一直在测试使用人工智能打电话。传闻中的项目之一是名为Pixie的多模式 Google Assistant 替代品,它可以通过设备的摄像头查看物体,并执行诸如指示购买地点或提供如何使用它们的说明等操作。

无论 OpenAI 计划发布什么内容,它都计划于周一上午 10 点(太平洋时间)/下午 1 点(东部时间)在其网站上进行直播。

相关内容

热门资讯

伊朗称捣毁多个与美以有关的“恐... 7月4日消息,当地时间4日获悉,伊朗情报部发表声明称,伊朗安全部门近日捣毁4个与美国和以色列情报机构...
巴基斯坦一检查站遭汽车炸弹袭击... 7月4日消息,巴基斯坦官方消息人士4日说,该国西南部俾路支省一个海岸警卫队检查站3日遭到汽车炸弹袭击...
佛得角首都机票搜索量暴增近30... 7月4日消息,美加墨世界杯1/16决赛,阿根廷队3比2艰难击败佛得角队,“黑马”佛得角再次收获了全世...
泽连斯基证实打击俄圣彼得堡附近... 7月4日消息,当地时间4日,乌克兰总统泽连斯基在社交媒体发文证实,乌方于当日凌晨发起远程打击行动,击...
涉留神峪煤矿事故,国家矿山安全... 7月4日消息,据山西省纪委监委网站,国家矿山安全监察局山西局监察执法八处2人被查。国家矿山安全监察局...
俄称拦截23架飞向莫斯科的乌无... 7月4日消息,俄罗斯莫斯科市长索比亚宁自当地时间7月3日夜间起,在社交媒体多次发布通报。通报称,截至...
暑运前三天,全国铁路累计发送旅... 7月4日消息,铁路暑运自7月1日启动,来自国铁集团的最新数据显示,暑运前三天,也就是7月1日至3日,...
《数据产权登记工作指引(试行)... 7月4日消息,《数据产权登记工作指引(试行)》印发,将促进数据安全合规高效流通使用。国家数据管理部门...
首款神经动力学芯片问世,有助于... 7月4日消息,北京大学集成电路学院教授杨玉超团队联合中国科学院上海微系统与信息技术研究所研究员宋志棠...
豆包:智能体功能将于7月15日... 7月4日消息,据豆包平台消息,由于产品功能调整,智能体功能将于2026年7月15日下线。功能下线后,...