OpenAI很快推出多模式人工智能助理:既能交谈,也可识物
创始人
2024-05-13 10:18:20
0

原标题:OpenAI很快推出多模式人工智能助理:既能交谈,也可识物

鞭牛士报道,5月12日消息,据The Information报道, OpenAI 已经向一些客户展示了一种新的多模式人工智能模型,该模型既可以与你交谈,也可以识别物体。

该媒体援引未透露姓名的消息人士的话说,这可能是该公司计划周一展示的一部分。

据报道,与现有的单独转录和文本转语音模型相比,新模型可以更快、更准确地解释图像和音频。

The Information写道,它显然能够帮助客户服务代理更好地理解呼叫者的语调,或者他们是否在讽刺,并且理论上,该模型可以帮助学生学习数学或翻译现实世界的手势。

该媒体的消息来源称,该模型在回答某些类型的问题方面可以超越 GPT-4 Turbo,但仍然容易出错。

开发人员 Ananay Arora 发布了上述通话相关代码的屏幕截图,他表示 OpenAI 也可能正在准备新的内置 ChatGPT 功能来拨打电话。

Arora 还发现了OpenAI 已配置用于实时音频和视频通信的服务器的证据。

如果下周公布的话,这一切都不是 GPT-5。首席执行官 Sam Altman明确否认其即将发布的公告与被认为比 GPT-4 “实质上更好”的模型有任何关系。该信息称 GPT-5 可能会在今年年底公开发布。

奥特曼还表示,该公司不会宣布推出新的人工智能搜索引擎。

但如果The Information 的报道属实,那么谷歌 I/O 开发者大会的进展仍可能会受到一些影响。谷歌一直在测试使用人工智能打电话。传闻中的项目之一是名为Pixie的多模式 Google Assistant 替代品,它可以通过设备的摄像头查看物体,并执行诸如指示购买地点或提供如何使用它们的说明等操作。

无论 OpenAI 计划发布什么内容,它都计划于周一上午 10 点(太平洋时间)/下午 1 点(东部时间)在其网站上进行直播。

相关内容

热门资讯

诺奖实验室开源重磅成果,助力深... 11月16日,在第27届中国国际高新技术成果交易会(简称“高交会”)上,依托图灵奖得主大卫·帕特森教...
成都高新区携50项硬核成果亮相... 第二十七届中国国际高新技术成果交易会 (简称“高交会”)正在深圳举办。 其中, 不乏成都高新区企业、...
2025迪拜航展明日开展,C9... 11月17日至21日,2025迪拜航展将举办。航展期间,来自中国的C919大型客机、无人机等都将集中...
高海拔宇宙线观测站“拉索”首次... 11月16日,封面新闻记者从中国科学院获悉,位于四川省稻城县的高海拔宇宙线观测站“拉索”(LHAAS...
聚焦淮安科技型企业转型!解锁A... 在人工智能重塑产业格局的关键时期,淮安科技型企业如何抓住技术红利实现突围?近日,科特勒奖、阿里金麦奖...
小鼠、斑马鱼等空间站第九批科学... 来源:市场资讯 (来源:澎湃新闻) 澎湃新闻从中国科学院空间应用中心了解到,11月14日,中国空间站...
金钼股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示金钼股份(601958)新获得一项实用新型专利授权,专利名为“...
【解局】中国连发留学预警与赴日... 【环球时报-环球网报道 记者 邢晓婧】日本首相高市早苗近日在国会公然发表涉台错误言论,粗暴干涉中国内...
透视苹果版!德普之星透视辅助软... 透视苹果版!德普之星透视辅助软件下载(透视)切实真的有挂(详细辅助教你教程)1、玩家可以在德普之星透...
辅助透视!aapoker透视怎... 辅助透视!aapoker透视怎么用(透视)详细辅助可靠技巧(一直有挂);一、aapoker透视怎么用...