商汤科技发布“日日新5o”大模型,实现实时流式多模态交互
创始人
2024-07-08 09:20:54
0

7月6日上午,在2024世界人工智能大会期间,商汤科技正式发布了其最新的“日日新5o”大模型。这一模型在交互体验上对标GPT-4o,通过整合跨模态信息,实现了基于声音、文本、图像和视频等多种形式的全新AI交互模式,即实时的流式多模态交互。

“日日新5o”大模型展现了强大的多模态识别和理解能力。例如,当工作人员仅是与它打个招呼时,它就能自动识别出工作人员脖子佩戴的胸卡带子上的字眼,并判断出现场就是世界人工智能大会会场。同时,它还能在这个场景下表示“可以好好学习”,显示出对环境的理解和适应性。对于可爱的小狗玩偶,“日日新5o”也能准确描述其外貌、表情以及重要穿戴,进一步证明了其在多模态交互方面的实力。

此外,“日日新5o”大模型在实时交互方面也表现出色。随便翻开一本书的任何一页,它都能自动进行介绍,而不仅仅是简单的OCR识别文字。它能够识别图文并给出易于理解的总结,真正实现了实时交互的目标。

相关内容

热门资讯

沪游观察|游戏作品如何能在st... 本文图片均来自80LV。 随着Steam平台的竞争日益激烈,愿望单(wishlists)已成为业内研...
假如外贸报价有段位,你在哪个段... 做外贸的,谁还没被报价折磨过几回? 报高了,客户原地消失;报低了,自己纯纯白忙;报得刚刚好还要被硬生...
朱之文翻红,年轻人为何会重新喜... 朱之文又火了。 从“南天门大将军”到“鲁西南现金王”,从音乐节现场到短视频平台热榜,今年春天,这位1...
美股集体杀跌,油价大涨!A股接... 朋友们,大家好!最近国际大事不少,资本市场出现波动。我们一起来关注国内外市场最新消息↓ 6月11日,...
原创 淮... "六十万打赢八十万",这句话我从小听到大,一直当成定论。后来真去抠数字,才发现没那么简单。 八十万这...
湖南一医院近期接诊10余例“空... 近年来,夏天越来越热,高温天数不断增多,热浪也迟迟不退。在这种天气下,空调几乎成了“续命神器”。 但...
原创 美... 当地时间6月10日,以色列总理办公室放出一则消息,措辞很简短,分量却很重:总理内塔尼亚胡与美国总统特...
销量仅为丰田四成,比亚迪为何敢... 事件: 6月9日,在比亚迪2025年股东大会上,比亚迪董事长兼总裁王传福表示,在国内、国外双轮驱动下...
长剧IP做短剧,为何总在两头不... 文 | 犀牛娱乐,作者|小福,编辑|朴芳 最近又有一批“长改短”上线了。 前有短剧版《特工王妃楚乔...