2024年多模态大模型(MLLMs)轻量化方法研究现状和展望报告
创始人
2024-12-19 11:06:51
0

今天分享的是:2024年多模态大模型(MLLMs)轻量化方法研究现状和展望报告

报告共计:14页

《2024年多模态大模型(MLLMs)轻量化方法研究现状和展望报告》由中国移动研究院业务研究所发布。报告指出,MLLMs在多任务中性能卓越,但庞大的规模和高昂成本限制了其应用,因此轻量化研究意义重大。

1. MLLMs概述

- 定义:融合大语言模型与多模态处理能力,能理解和生成多种模态数据,执行跨模态任务。

- 轻量化原因:高资源需求限制开发和部署,如训练耗时久、推理资源消耗大等,且云端运行模式存在问题,边缘设备应用受限。

2. 轻量化方法研究现状

- 三个核心模块优化

- 视觉编码器:多选用预训练模型,占总参数比例小,优化效果不如语言模型显著,常沿用大规模模型中的编码器。

- 预训练大语言模型:一是直接用小型轻量化模型,如phi2 - 2.7B等;二是采用模型压缩技术,如量化、剪枝等。

- 视觉 - 语言投影器:包括基于注意力、CNN、Mamba和混合结构四种轻量化方式。

- 视觉token压缩

- 多视图输入:输入高分辨率图像的低分辨率全局视图和局部视图。

- token处理:采用适应性视觉token减少方法。

- 多尺度信息融合:利用多尺度图像信息提取视觉特征。

- 视频特定方法:如VideoLLaVA将视觉表示统一到语言特征空间。

- 高效的结构:包括专家混合模型、Mamba和推理加速三个方向。

3. 展望

- 突破多模态信息处理局限,处理更多元模态标记。

- 扩展输入输出模态,适应更多样化输入类型。

- 发展可在边缘部署的轻量化模型,推动智能设备发展。

以下为报告节选内容

相关内容

热门资讯

宇树科技专利侵权案一审判决:未... 9月30日消息,据了解,针对此前宇树科技被杭州露韦美日化有限公司诉侵害发明专利权一案,浙江省杭州市中...
日本朝日集团遭网络攻击,部分业... 9月30日消息,日本知名酿造企业朝日集团近日被黑客攻击,引发网络故障,对公司在日本国内的物流运输及客...
逾六成私募选择重仓过节,投资主... 9月30日消息,国庆长假临近,私募基金的仓位选择及其对节后行情的研判,备受市场关注。私募排排网最新调...
上市公司实施员工持股计划金额已... 9月30日消息,随着上市公司市值管理的意识加强,员工持股计划逐渐获得更多公司青睐。今年以来,上市公司...
投资收益率达8.1%,2024... 9月30日消息,全国社会保障基金理事会9月30日发布的全国社会保障基金2024年度报告显示,2024...
AI眼镜加速走向大众市场,两大... 9月30日消息,今年以来,智能(AI)眼镜行业迎来爆发式增长。巨头新品迭出,出货量高速增长,叠加AI...
社保基金会:2024年获取了A... 9月30日消息,全国社会保障基金理事会全国社会保障基金2024年度报告发布。受国内国际多重因素影响,...
WTI原油跌3% 9月29日消息,国际油价跌幅扩大,WTI原油跌3%,报63.73美元/桶;布伦特原油跌1.9%,报6...
国家税务总局:平台企业不得以任... 9月29日消息,随着互联网平台企业将于10月1日起首次正式报送平台内经营者和从业人员的身份信息、收入...
汇绿生态:拟购买武汉钧恒科技剩... 9月29日消息,汇绿生态公告称,公司拟通过发行股份及支付现金的方式向彭开盛等7名交易对方购买其合计持...