2024年多模态大模型(MLLMs)轻量化方法研究现状和展望报告
创始人
2024-12-19 11:06:51
0

今天分享的是:2024年多模态大模型(MLLMs)轻量化方法研究现状和展望报告

报告共计:14页

《2024年多模态大模型(MLLMs)轻量化方法研究现状和展望报告》由中国移动研究院业务研究所发布。报告指出,MLLMs在多任务中性能卓越,但庞大的规模和高昂成本限制了其应用,因此轻量化研究意义重大。

1. MLLMs概述

- 定义:融合大语言模型与多模态处理能力,能理解和生成多种模态数据,执行跨模态任务。

- 轻量化原因:高资源需求限制开发和部署,如训练耗时久、推理资源消耗大等,且云端运行模式存在问题,边缘设备应用受限。

2. 轻量化方法研究现状

- 三个核心模块优化

- 视觉编码器:多选用预训练模型,占总参数比例小,优化效果不如语言模型显著,常沿用大规模模型中的编码器。

- 预训练大语言模型:一是直接用小型轻量化模型,如phi2 - 2.7B等;二是采用模型压缩技术,如量化、剪枝等。

- 视觉 - 语言投影器:包括基于注意力、CNN、Mamba和混合结构四种轻量化方式。

- 视觉token压缩

- 多视图输入:输入高分辨率图像的低分辨率全局视图和局部视图。

- token处理:采用适应性视觉token减少方法。

- 多尺度信息融合:利用多尺度图像信息提取视觉特征。

- 视频特定方法:如VideoLLaVA将视觉表示统一到语言特征空间。

- 高效的结构:包括专家混合模型、Mamba和推理加速三个方向。

3. 展望

- 突破多模态信息处理局限,处理更多元模态标记。

- 扩展输入输出模态,适应更多样化输入类型。

- 发展可在边缘部署的轻量化模型,推动智能设备发展。

以下为报告节选内容

相关内容

热门资讯

亲中亲俄的匈牙利,为何还没被踢... 匈牙利政府最近在拒绝跟随欧盟干涉中国内政的问题上表现出了独立的立场。这种做法让人不禁回忆起匈牙利首都...
全球首台!“超碳一号”成功商运 近日 全球首台 商用超临界二氧化碳发电机组“超碳一号” 在贵州六盘水成功商运 标志着我国在超临界二氧...
电动自行车保险为何“遇冷”?解... “电动自行车还能买保险?”已经骑了几年电动自行车的市民高先生有些诧异:“我就知道机动车要上交强险,还...
360复盘快手事件:一场精心策... 今日,360数字安全官方账号发文复盘快手直播事故,称这是一场精心策划的AI化攻击。 360数字安全指...
我国新一代光计算芯片研究获突破... 从一句话生成一张图,到几秒钟生成一段视频,生成式人工智能正在走向更复杂的真实世界应用。模型越大、分辨...
南京区域导航失灵,原因公布 12月19日下午,南京卫星协会微信公号发布“关于12月17日南京区域导航信号异常情况的技术性探讨分析...
冬季如何预防一氧化碳中毒?湖北... 极目新闻通讯员 鄂应宣 岁末年关,天气渐冷,各类取暖设备使用频繁,一氧化碳中毒事件也进入易发、多发期...
红绿灯不工作Waymo自动驾驶... 科技巨头谷歌母公司Alphabet旗下自动驾驶出租车公司Waymo史无前例地大规模宕机。 当地时间1...
Win11学院:如何在2622... IT之家 12 月 23 日消息,科技媒体 NeoWin 昨日(12 月 22 日)发布博文,报道称...
知识分子为何都不怎么“爱国”? 读书人的精神家园 一辈子的读书、思考 一辈子的智慧追寻 文:舒生 “爱国”一词,在公共话语中常常是...