打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
快速为CDH版本HADOOP安装配置Lzo和Snappy压缩 – lxw的大数据田地

注:本文针对的是使用命令行安装和配置CDH Hadoop,如果你使用RPM或者ClouderaManager,基本可以忽略此文。

Hadoop在计算和存储过程中,支持对文件进行压缩,可以使用hadoop checknative命令来查看:

其中,像zlib、lz4、bzip2,会使用系统库,那么需要在Hadoop所在机器上先安装这些。

Snappy和Lzo,需要单独安装配置,CDH版本的hadoop,已经为每一个版本及操作系统编译好了Snappy和Lzo库(RPM),可以通过RPM来获得。


 

http://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/5.8.3/RPMS/x86_64/

Snappy库可以从上面链接中的Hadoop RPM包中获取,注意:需要找到正确的操作系统及cdh版本,我使用的操作系统为centos 7,cdh5.8.3.


http://archive.cloudera.com/gplextras5/redhat/7/x86_64/gplextras/5.8.3/RPMS/x86_64/

Lzo库及jar包,可以从上面的链接中获得,仍然需要注意你的操作系统版本和cdh版本。


 

RPM包下载好之后,使用下面的命令安装:

rpm -ivh hadoop-2.6.0+cdh5.8.3+1718-1.cdh5.8.3.p0.7.el6.x86_64.rpm –nodeps
rpm -ivh hadoop-lzo-0.4.15+cdh5.8.3+0-1.cdh5.8.3.p0.7.el7.x86_64.rpm –nodeps

安装后的路径一般会在/usr/lib/hadoop/

也可使用rpm -ql hadoop-2.6.0+cdh5.8.3+1718-1.cdh5.8.3.p0.7.el6.x86_64来查询安装路径。


## 备份和拷贝native库目录:

cd $HADOOP_HOME/lib
mv native native-bak
cp -r /usr/lib/hadoop/lib/native $HADOOP_HOME/lib/

## 拷贝lzo jar包:

cp /usr/lib/hadoop/lib/hadoop-lzo-0.4.15-cdh5.8.3.jar $HADOOP_HOME/share/hadoop/common/lib/


拷贝完后,需要先卸载掉前面安装的两个包:

rpm -e hadoop-lzo-0.4.15+cdh5.8.3+0-1.cdh5.8.3.p0.7.el7.x86_64 –nodeps
rpm -e hadoop-2.6.0+cdh5.8.3+1718-1.cdh5.8.3.p0.7.el6.x86_64 –nodeps


检查 hadoop checknative:


 

OK了,将更新后的$HADOOP_HOME/lib/native以及$HADOOP_HOME/share/hadoop/common/lib/hadoop-lzo-0.4.15-cdh5.8.3.jar分发至集群所有节点;
重启集群。

 

如果觉得本博客对您有帮助,请 赞助作者

转载请注明:lxw的大数据田地 » 快速为CDH版本HADOOP安装配置Lzo和Snappy压缩

喜欢 (6)
分享 (0)
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
CDH5安装lzo
Hbase支持snappy压缩格式
MapReduce学习(九):常见压缩算法简介
利用cloudera hadoop 中的libhdfs和fuse-dfs将hdfs中的文件挂载到本地硬盘
Impala之04-Impala 如何使用 Hadoop 文件格式【译】
rpm安装软件时提示warning: *.rpm: Header V3 RSA/SHA25...
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服