博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
创建本地yum软件源,为本地Package安装Cloudera Manager、Cloudera Hadoop及Impala做准备...
阅读量:5076 次
发布时间:2019-06-12

本文共 7299 字,大约阅读时间需要 24 分钟。

一、包管理工具及CentOS的yum

1、包管理工具如何发现可以用的包

包管理工具依赖一系列软件源,工具下载源的信息存储在配置文件中,其位置随某包管理工具不同而变化

  • 使用yum的RedHat/CentOS存储在:/etc/yum.repos.d
  • 使用apt-get的Debian/Ubuntu在:/etc/apt/apt.conf (额外的源采用*.list文件指定,存储在/etc/apt/sources.list.d目录下)

例如在,CentOS下面:

[root@lemon ~]# ls -l /etc/yum.repos.d/total 24-rw-r--r--. 1 root root 1926 Feb 25 00:57 CentOS-Base.repo-rw-r--r--. 1 root root  638 Feb 25 00:57 CentOS-Debuginfo.repo-rw-r--r--. 1 root root  630 Feb 25 00:57 CentOS-Media.repo-rw-r--r--. 1 root root 3664 Feb 25 00:57 CentOS-Vault.repodrwxr-xr-x  3 root root 4096 Jun 12 23:37 cloudera-cdh4-rw-r--r--  1 root root  231 Jun 12 23:36 clouder-cdh4.repo

上述每个.repo文件对应着一个或者多个软件源,下面CentOS-Base.repo的片段说明,该文件定义了两个软件源,一个是Base,一个是Upadate。镜像列表参数指向一系列可以下载软件源的网址。

#………[base]name=CentOS-$releasever - Basemirrorlist=http://mirrorlist.centos.org/?release=$releasever&arch=$basearch&repo=os#baseurl=http://mirror.centos.org/centos/$releasever/os/$basearch/gpgcheck=1gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-6#released updates [updates]name=CentOS-$releasever - Updatesmirrorlist=http://mirrorlist.centos.org/?release=$releasever&arch=$basearch&repo=updates#baseurl=http://mirror.centos.org/centos/$releasever/updates/$basearch/gpgcheck=1gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-6#………

在CentOS下面可以使用:yum repolist  查看系统中启用的软件源。CentOS有如下软件源列表:

[root@lemon ~]# yum repolistLoaded plugins: fastestmirror, refresh-packagekit, securityLoading mirror speeds from cached hostfile * base: mirror01.idc.hinet.net * extras: mirror01.idc.hinet.net * updates: ftp.stu.edu.twrepo id                repo name                                               statusbase                   CentOS-6 - Base                                         6,381cloudera-cdh4          Cloudera's Distribution for Hadoop, Version 4              97extras                 CentOS-6 - Extras                                          12updates                CentOS-6 - Updates                                        805repolist: 7,295

二、创建自己的yum软件源(以Cloudera Hadoop的安装为例)

自定义软件源,给不能联网或者网络不畅的计算机安装软件提供了便利,使得待安装软件的主机可以使用本地的软件源完成安装。下面讲述如何创建本地包软件源,并指示本地主机直接使用。简要概括起来如下:将下载的RPM包放到本地主机的某一个目录下,接着完成创createrepo(创建软件源的工作),然后在网站上发布这一软件源。

1、下载Cloudera Manager安装文件

Cloudera Manager的可以从如下网址获得:

这里选择Cloudera Manager 最新版4.6.0.1

2、下载相关的CM安装所需要的RPM包

下载网址为:

下载全部的7个rmp包,如下图所示:

 3、创建软件源

将下载好的rpm文件拷贝到制定目录,如:/home/admin/RPMS中

[root@lemon RPMS]# lscloudera-manager-agent-4.5.2-1.cm452.p0.327.x86_64.rpmcloudera-manager-daemons-4.5.2-1.cm452.p0.327.x86_64.rpmcloudera-manager-parcel-4.5.2-4.5.2-1.cm452.p0.327.x86_64.rpmcloudera-manager-server-4.5.2-1.cm452.p0.327.x86_64.rpmcloudera-manager-server-db-4.5.2-1.cm452.p0.327.x86_64.rpmenterprise-debuginfo-4.5.2-1.cm452.p0.327.x86_64.rpmjdk-6u31-linux-amd64.rpm

创建软件源的主机没有安装createrepo,可以通过shell命令yum install createrepo安装。

当在包含文件的目录下运行如下创建命令:

[root@lemon RPMS]# createrepo .

程序也会创建一个repodata目录,该目录包含一些描述软件源的xml文件。如下所示:

[root@lemon RPMS]# createrepo .Spawning worker 0 with 7 pkgsWorkers FinishedGathering worker resultsSaving Primary metadataSaving file lists metadataSaving other metadataGenerating sqlite DBsSqlite DBs complete[root@lemon RPMS]# lscloudera-manager-agent-4.5.2-1.cm452.p0.327.x86_64.rpmcloudera-manager-daemons-4.5.2-1.cm452.p0.327.x86_64.rpmcloudera-manager-parcel-4.5.2-4.5.2-1.cm452.p0.327.x86_64.rpmcloudera-manager-server-4.5.2-1.cm452.p0.327.x86_64.rpmcloudera-manager-server-db-4.5.2-1.cm452.p0.327.x86_64.rpmenterprise-debuginfo-4.5.2-1.cm452.p0.327.x86_64.rpmjdk-6u31-linux-amd64.rpmrepodata[root@lemon RPMS]# cd repodata/[root@lemon repodata]# lsother.xml.gzother.sqlite.bz2filelists.sqlite.bz2primary.xml.gzfilelists.xml.gzprimary.sqlite.bz2repomd.xml

此命令之后,RPM包就会加入到本地的软件源中。

4、安装Apache httpd web服务器

如果你已经安装了一个web服务器,可以略过此步,如果未安装可以通过如下shell命令安装

[root@lemon ~]$ yum install httpd

安装完毕后,启动httpd服务

[root@lemon ~]$ service httpd start

5、发布软件源文件

将文件复制/移动到WEB服务器的根目录下,Linux下面默认是/var/www/html目录,

[root@lemon ~]$ mv /home/admin/RPMS /var/www/html [root@lemon ~]$ chmod -R ugo+rx /var/www/html/RPMS

并更改文件权限,使用户、同组、其他组都可以读/执行文件。

访问测试文件首页是否正常显示各文件的索引,通常要关闭selinux(重启生效),该yum软件源才能访问。

如果不能访问,出现403错误(在实体机上常见),即you don't have permission to access / on this server(Apache Server权限访问问题),则需要在/etc/httpd/httpd.conf中添加如下配置:

Options Indexes MultiViews FollowSymLinks AllowOverride None Order allow,deny Allow from all
Alias /CDH4-RPMS/ "/var/www/html/CDH4-RPMS/"
Options Indexes MultiViews FollowSymLinks AllowOverride None Order allow,deny Allow from all
Alias /CM4-RPMS/ "/var/www/html/CM4-RPMS/"
Options Indexes MultiViews FollowSymLinks AllowOverride None Order allow,deny Allow from all
Alias /IMPALA-RPMS/ "/var/www/html/IMPALA-RPMS/"
Options Indexes MultiViews FollowSymLinks AllowOverride None Order allow,deny Allow from all

 

6、更改客户端配置,使其能够找到该软件源

在客户端新建如下格式的文件,内容如下所示:

[myrepo] name=myrepo baseurl=http://hostname/RPMS enabled=1 gpgcheck=0

主机名是刚才所建立的软件源的主机名。将文件命名为myrepo.repo,并将文件放到/etc/yum.repos.d目录下,即最终结果为/etc/yum.repos.d/myrepo.repo

这里的客户端指的是使用本地源的主机,(即待安装的不能联网的哪些主机)。

注意:/etc/yum.repos.d目录下仅仅保留自己创建的本地库,否则其他的库因为不能联网,会报错的,使得安装退出。本例中,仅仅保留myrepo.repo。

在CM的集群配置页面,设定好本地源后,会有相应的解析,找到本地的源。其中cloudera-manager.repo

cloudera-cdh4.repo、cloudera-impala.repo解析后新建的,原来自己配的源的名字分别是cm4repo.repo、cdh4repo.repo、impalarepo.repo(实际应用中发现,最好将名字命名为cloudera-manager.repo、cloudera-cdh4.repo、cloudera-impala.repo, 否则会可能出现无法解析错误,即cloudera-manager-installer-bin还是会向cloudera的官网去找)。

解析后的内容如下:

[root@lemon yum.repos.d]# cat cloudera-cdh4.repo[cloudera-cdh4]name = Cloudera CDH, Version (Custom)baseurl = http://192.168.2.171/CDH4-RPMSgpgcheck = 0[root@lemon yum.repos.d]# cat cloudera-impala.repo[cloudera-impala]name = Impala, Version (Custom)baseurl = http://192.168.2.171/impalagpgcheck = 0[root@lemon yum.repos.d]# cat cloudera-manager.repo[cloudera-manager]name = Cloudera Manager, Version 4.6.0baseurl = http://192.168.2.171/RPMSgpgcheck = 0

安装的时候也可能会出现如下错误:

Resolving Dependencies--> Running transaction check---> Package cloudera-manager-server-db.x86_64 0:4.6.0-1.cm460.p0.140 will be installed--> Processing Dependency: postgresql-server >= 8.0 for package: cloudera-manager-server-db-4.6.0-1.cm460.p0.140.x86_64--> Finished Dependency ResolutionError: Package: cloudera-manager-server-db-4.6.0-1.cm460.p0.140.x86_64 (cm4repo)           Requires: postgresql-server >= 8.0 You could try using --skip-broken to work around the problem You could try running: rpm -Va --nofiles --nodigest

所以,这个时候要安装postgresql-server8.4 或者是9.0(要求8.0及其以上),这个安装比较麻烦,需要解决各种依赖库。

postgresql说明:

postgresql包含许多不同的包,包括第三方类库,通常安装最重要的包即可(能满足大部分应用需求)。这些包如下:

  • postgresql - 客户端类库及二进制文件
  • postgresql-server - 核心的数据库服务器
  • postgresql-contrib - 附加的供应组件
  • postgresql-devel - 用户C语言开发的类库和头文件
  • pgadmin3 - 数据库图像化管理工具第三版

9.0版本的rpm包具体下载地址为:

备注:研究发现缺少包这些问题是由虚拟机造成的,虚拟机安装的时候是默认安装,省去了里面很大一部分的包,比如虚拟机安装的时候不带jdk、postgresql数据库、mysql数据库,而这些都是在实体机安装的时候所没有的问题,所以实践很重要!在实体机下面缺少postgresql数据库所造成的问题根本就不存在!

7、使用本地类库安装CM

CM安装必须通过package方式,而CDH、Impala可以通过package、parcel方式安装。

安装程序默认从网络下载程序包安装,如果你已经配置好了本地软件源,并将本机(客户端)做了识别配置,

只需要在安装的时候添加参数(--skip_repo_package=1),shell命令如下:

$ sudo ./cloudera-manager-installer.bin --skip_repo_package=1

详细的安装步骤及过程,详见

 

 备注:CM包下载地址:

    CDH包下载地址:

    IMPALA包下载地址:

另外下载时候要注意,如果X86_64同级目录还有noarch目录,且里面也有文件的时候也要一并下载,不然使用本地软件源的时候提示部分文件找不到。

 

转载于:https://www.cnblogs.com/shudonghe/p/3142796.html

你可能感兴趣的文章
hdu 4547(LCA)
查看>>
某app的安全性分析过程
查看>>
常量优化机制
查看>>
UIVIEW圆角和边框设置
查看>>
pcb过孔盖油
查看>>
两天笔记
查看>>
对TCP/IP协议的一些看法(10):TCP协议(2)
查看>>
IE下window.onresize被多次执行的解决
查看>>
多选框全选js
查看>>
Python学习第四天
查看>>
121. Best Time to Buy and Sell Stock(动态规划)
查看>>
oracle 修改表的sql语句
查看>>
OpenNI2安装
查看>>
[Leetcode] Valid Parentheses
查看>>
[8.1] Triple Step
查看>>
JAVA网络编程
查看>>
《DSP using MATLAB》示例Example7.4
查看>>
tcp断开过程
查看>>
手机工作平台的搭建
查看>>
[CareerCup] 9.8 Represent N Cents 组成N分钱
查看>>