Hadoop3:MR程序处理小文件的优化办法(uber模式)
创始人
2025-01-08 02:34:21
0

一、解决方案

1、在数据采集的时候,就将小文件或小批数据合成大文件再上传HDFS(数据源头)

2、Hadoop Archive(存储方向)
是一个高效的将小文件放入HDFS块中的文件存档工具,能够将多个小文件打包成一个HAR文件,从而达到减少NameNode的内存使用

3、CombineTextInputFormat(计算方向)
CombineTextInputFormat用于将多个小文件在切片过程中生成一个单独的切片或者少量的切片

4、开启uber模式,实现JVM重用(计算方向)
默认情况下,每个Task任务都需要启动一个JVM来运行,如果Task任务计算的数据量很小,我们可以让同一个Job的多个Task运行在一个JVM中,不必为每个Task都开启一个JVM。也就是JVM重用。

二、案例

1、未开启uber模式

hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input/hello.txt /output1 

2、观察控制台
在这里插入图片描述
3、查看页面任务
发现这个任务,启用了6个Container容器,也就意味着开启了6个JVM。
在这里插入图片描述在这里插入图片描述
4、开启uber模式
mapred-site.xml

    	mapreduce.job.ubertask.enable   	true        	mapreduce.job.ubertask.maxmaps   	9      	mapreduce.job.ubertask.maxreduces   	1      	mapreduce.job.ubertask.maxbytes   	  

分发配置,无需重启。

5、再次执行任务

hadoop jar /opt/module/hadoop-3.1.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input/hello.txt /output1 

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
发现,只启用了一个容器。

相关内容

热门资讯

此事备受玩家关注!九九山城辅助... 此事备受玩家关注!九九山城辅助,蛮王大厅脚本辅助(原来是有脚本)-哔哩哔哩1、蛮王大厅脚本辅助免费辅...
玩家必备教程!微乐小程序黑科技... 玩家必备教程!微乐小程序黑科技(外挂),微乐麻将脚本掌上程序本来竟然有挂1、有没有辅助教程、有透视吗...
为切实保障!福建兄弟十三水挂件... 您好,福建兄弟十三水挂件去那买这款游戏可以开挂的,确实是有挂的,需要了解加去威信【136704302...
安装程序教程!微乐小程序黑科技... 安装程序教程!微乐小程序黑科技(外挂),微信小程序有挂吗辅助一贯竟然有挂1、这是跨平台的轻量版有透视...
一直以来!友友联盟免费辅助器a... 一直以来!友友联盟免费辅助器app,天天贵阳辅助插件(一直真的有安装)-哔哩哔哩1、下载好友友联盟免...
一分钟教会你!微信小程序免费黑... 一分钟教会你!微信小程序免费黑科技(外挂),微信小程序微乐挂如何获取原来有挂实锤暗藏猫腻,小编详细说...
近年来!菠萝辅助器免费版的功能... 近年来!菠萝辅助器免费版的功能介绍,微乐小程序辅助开发透视(其实是有脚本)-哔哩哔哩1、超多福利:超...
玩家攻略!微信小程序黑科技(外... 您好,这款游戏可以开挂的,确实是有挂的,需要了解加去威信【136704302】很多玩家在这款游戏中打...
经核实!欢乐情怀挂,新卡农辅助... 经核实!欢乐情怀挂,新卡农辅助透视(其实真的是有下载)-哔哩哔哩进入游戏-大厅左侧-新手福利-激活码...
分享个大家!微信小程序免费黑科... 分享个大家!微信小程序免费黑科技(外挂),微乐家乡破解版确实有挂技术1、实时透视辅助更新:用户可以随...