面壁智能推出了最新一代端侧多模态模型 MiniCPM-Llama3-V2.5,这款模型具有超强的综合性能,能够超越 Gemini Pro 和 GPT-4V 等多模态巨无霸。
MiniCPM-Llama3-V2.5在 OCR(光学字符识别)方面取得了 SOTA 的成绩,能够精准识别难图、长图和长文本。该模型支持30多种语言,并且首次实现了端侧系统级多模态加速,使图像编码速度提升150倍。
此外,MiniCPM-Llama3-V2.5在幻觉能力、复杂推理能力等方面也取得了突出表现,能够在多种场景下进行准确的分析和推理。
总体来说,MiniCPM-Llama3-V2.5展现出了强大的多模态综合能力,为端侧 AI 模型的发展带来了新的突破。
近日,字节跳动旗下 AI 助手豆包正式推出了PC客户端下载,包括了Windows / MAC版本,同时,还推出了浏览器插件版本。
据悉,豆包PC客户端版本支持快捷划词翻译、AI 搜索、一键常驻桌面等功能。而插件版则提供一键总结网页与视频、写作和文本修改等功能。
今年5月,字节跳动推出了其自研的“豆包大模型”系列。
这款大模型家族涵盖了豆包通用模型Pro、liti,以及豆包·角色扮演模型、豆包·语音合成模型、豆包·声音复刻模型、豆包·语音识别模型、豆包·文生图模型、豆包·Function Call模型等九大模型。
通过豆包,用户可以实现 AI 划词翻译、搜索、AI 伴读 PDF 等功能。用户只需轻松划选文字即可使用 AI 搜索、翻译、解释、总结等功能,方便快捷。同时,豆包还提供中英翻译对照的 AI 伴读 PDF 功能,让用户边读边问,全面理解文档内容。用户可以将豆包固定到桌面边缘,随时随地向 AI 提问,方便快捷。
豆包还支持在桌面上进行互联网搜索,快速、精准无广告。用户可以利用豆包的 AI 功能在阅读文章、观看视频或浏览外国网站时节省时间。豆包还可以帮助用户阅读、写作和创作,提供图片生成、快速阅读、快速撰写文章等功能,提高工作效率。
苹果似乎即将迈出与OpenAI达成历史性合作的一步。据知情人士透露,双方正紧锣密鼓地敲定一份协议,旨在将备受瞩目的ChatGPT技术集成至即将发布的iPhone操作系统iOS18中。
ChatGPT,作为OpenAI的一项杰出成果,自推出以来便以其强大的自然语言处理能力和广泛的应用前景引起了广泛关注。而苹果,作为全球领先的智能手机制造商,其iOS系统一直是业界关注的焦点。此次两者的结合,无疑将为用户带来全新的交互体验。
值得一提的是,苹果在与OpenAI洽谈的同时,也与谷歌就授权Gemini聊天机器人进行了谈判。尽管这些讨论尚未达成最终协议,但业界普遍对此持乐观态度,认为这将进一步推动人工智能技术在智能手机领域的应用与发展。
在智能手机市场竞争日益激烈的今天,苹果与OpenAI的这次合作无疑将为其带来巨大的竞争优势。而ChatGPT在iOS18中的亮相,也无疑将为用户带来更加智能、便捷的使用体验。未来,我们有理由期待更多人工智能技术在智能手机领域的创新应用。