北大清华等联合发布LLaVA-o1:首个自发性视觉AI模型,推理计算Scaling新思路
创始人
2024-11-19 18:01:18
0

11 月 19 日消息,由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学(Lehigh University)组成的研究团队,最新推出了 LLaVA-o1,这是首个具备自发性(Spontaneous,具体解释可参考文末)、类似于 GPT-o1 的系统性推理视觉语言模型。

LLaVA-o1 是一种新型的视觉语言模型(VLM),其设计目标是进行自主的多阶段推理。

LLaVA-o1 拥有 110 亿个参数,基于 Llama-3.2-Vision-Instruct 模型开发,设计了总结(summary)、描述(caption)、推理(reasoning)和结论(conclusion)4 个推理阶段。

该模型使用名为 LLaVA-o1-100k 的数据集进行微调,该数据集源自视觉问答(VQA)来源和由 GPT-4o 生成的结构化推理注释。

LLaVA-o1 采用了阶段级束搜索(stage-level beam search)的推理时间 Scaling 技术,能够在每个推理阶段生成多个候选答案,并选取最佳答案。

该模型在处理复杂任务时具备较强的能力,在复杂视觉问答任务中,可以突破传统视觉语言模型的局限性。

与基础模型相比,LLaVA-o1 在多模态推理基准测试中提高了 8.9% 的性能,超过了许多大型和闭源的竞争对手。

LLaVA-o1 的推出填补了文本和视觉问答模型之间的重要空白,在多个基准测试中的优异表现,特别是在数学和科学视觉问题的推理领域,展示了结构化推理在视觉语言模型中的重要性。

自发性人工智能(Spontaneous AI)是指能够模拟动物自发行为的人工智能系统。这种技术的研究主要集中在如何通过机器学习和复杂的时间模式设计出具有自发行为的机器人或智能系统。

【来源:IT之家】

相关内容

热门资讯

黑科技辅助挂(wepoke透视... 黑科技辅助挂(wepoke透视该购买渠道)外挂透视辅助方法(透视)总是真的有挂(黑科技工具)-哔哩哔...
黑科技好友(WepoKe)ai... 您好,这款游戏可以开挂的,确实是有挂的,需要了解加微【136704302】很多玩家在这款游戏中打牌都...
透视存在!(WPK)职业代打,... 透视存在!(WPK)职业代打,(wPk)往昔真的有挂,黑科技大厅(有挂解密)-哔哩哔哩;最新版202...
黑科技免费(德扑ai)外挂(透... 1、黑科技免费(德扑ai)外挂(透视)ai人工智能软件免费(切实真的有挂)。2、透视辅助简单,软件透...
第二分钟辅助挂!微扑克辅助软件... 第二分钟辅助挂!微扑克辅助软件,(微扑克)真是真的是有挂,靠谱教程(有挂透视)-哔哩哔哩;《WPK辅...
黑科技辅助(Wpk)透视辅助购... 黑科技辅助(Wpk)透视辅助购买渠道(透视)ai辅助靠谱(真是存在有挂);1分钟了解详细教程(微信 ...
黑科技软件(Wepoke)软件... 黑科技软件(Wepoke)软件透明挂黑科技(透视)固有是真的有挂(有挂头条)-哔哩哔哩;最新版202...
黑科技辅助挂(德扑)透牌器(透... 黑科技辅助挂(德扑)透牌器(透视)线上ai工具(一贯是有挂)1、玩家可以在软件透明挂俱乐部对游戏的模...
透视游戏!(WPK)德州ai机... 透视游戏!(WPK)德州ai机器人,(wPK)固有存在有挂,黑科技机制(证实有挂)-哔哩哔哩是由北京...
黑科技辅助挂(wEPoke)是... 黑科技辅助挂(wEPoke)是不是有挂(黑科技)系统规律解析(先前真的是有挂)1、许多玩家不知道辅助...