[工学]hadoop实战手册入门资料内容摘要:
/name value /property /configuration conf/: configuration property name/name value1/value /property /configuration conf/: configuration property name/name valuelocalhost:9001/value /property /configuration 北京宽连十方数字技术有限公司 公开 内部公开 √ 机密 绝密 免密码 ssh设置 现在确认能否不输入口令就用 ssh 登录 localhost: $ ssh localhost 如果不输入口令就无法用 ssh登陆 localhost,执行下面的命令: $ sshkeygen t dsa P 39。 39。 f ~/.ssh/id_dsa $ cat ~/.ssh/ ~/.ssh/authorized_keys 执行 首先使用 hadoop 命令对 Hadoop File System (HDFS) 进行格式化。 首先,请求 namenode 对 DFS 文件系统进行格式化。 在安装过程中完成了这个步骤,但是了解是否需要生成干净的文件系统是有用的。 [hadoop@TEST085 ]$ bin/hadoop namenode –format 注: 在确认请求之后,文件系统进行格式化并返回一些信息 : 11/07/12 17:47:12 INFO : STARTUP_MSG: /************************************************************ STARTUP_MSG: Starting NameNode STARTUP_MSG: host = TEST085/ STARTUP_MSG: args = [format] STARTUP_MSG: version = STARTUP_MSG: build = r 1099333。 piled by 39。 oom39。 on Wed May 4 07:57:50 PDT 2020 ************************************************************/ 11/07/12 17:47:12 INFO : VM type = 32bit 11/07/12 17:47:12 INFO : 2% max memory = MB 11/07/12 17:47:12 INFO : capacity = 2^22 = 4194304 entries 11/07/12 17:47:12 INFO : remended=4194304, actual=4194304 北京宽连十方数字技术有限公司 公开 内部公开 √ 机密 绝密 11/07/12 17:47:13 INFO : fsOwner=hadoop 11/07/12 17:47:13 INFO : supergroup=supergroup 11/07/12 17:47:13 INFO : isPermissionEnabled=true 11/07/12 17:47:13 INFO : =100 11/07/12 17:47:13 INFO : isAccessTokenEnabled=false accessKeyUpdateInterval=0 min(s), accessTokenLifetime=0 min(s) 11/07/12 17:47:13 INFO : Caching file names occuring more than 10 times 11/07/12 17:47:13 INFO : Image file of size 112 saved in 0 seconds. 11/07/12 17:47:13 INFO : Storage directory /tmp/hadoophadoop/dfs/name has been successfully formatted. 11/07/12 17:47:13 INFO : SHUTDOWN_MSG: /************************************************************ SHUTDOWN_MSG: Shutting down NameNode at TEST085/ ************************************************************/ 接下来,启动 Hadoop 守护进程。 启动 Hadoop 守护进程: [hadoop@TEST085 ]$ bin/ 注: 1) Hadoop 守护进程的日志写入到 ${HADOOP_LOG_DIR} 目录 (默认是 ${HADOOP_HOME}/logs) 2) 启动 hadoop,但 ssh 端口不是默认的 22 怎么样。 好在它可以配置。 在conf/ 里改下。 如: export HADOOP_SSH_OPTS=p 1234 浏览 NameNode 和 JobTracker 的网络接口,它们的地址默认为: NameNode JobTracker 将输入文件拷贝到分布式文件系统: $ bin/hadoop fs put conf input 北京宽连十方数字技术有限公司 公开 内部公开 √ 机密 绝密 运行发行版提供的示例程序: $ bin/hadoop jar grep input output 39。 dfs[az.]+39。 查看输出文件: 将输出文件从分布式文件系统拷贝到本地文件系统查看: $ bin/hadoop fs get output output $ cat output/* 或者 在分布式文件系统上查看输出文件: $ bin/hadoop fs cat output/* 完成全 部操作后,停止守护进程: $ bin/ Hadoop 在这个伪分布式配置中启动 5 个守护进程: namenode、 secondarynamenode、datanode、 jobtracker 和 tasktracker。 在启动每个守护进程时,会看到一些相关信息(指出存储日志的位置)。 每个守护进程都在后台运行。 图 1 说明完成启动之后伪分布式配置的架构。 图 1. 伪分布式 Hadoop 配置 4 Hadoop集群搭建 过程 手记 参考: 北京宽连十方数字技术有限公司 公开 内部公开 √ 机密 绝密 先用了 三台服务器作了 hadoop 集群的部署测试 , 服务 器有 (下面简称85) , (下面简称 160), (下面简称 254), 架构规化如下 : 1) 85 作为 NameNode, SecondaryNameNode, JobTracker; 2) 160 和 254 作为 DataNode,TaskTracker 免密码 SSH设置 打通 ssh,让 85 免登陆到 160, 254。 打通 过程如下: 1) 名称节点 85 和数据节点 ( 160, 254) 各自创建用户 hadoop,使用相同的密码。 2) 以 hadoop 用户名登陆名称节点 ( 85) 执行 sshkeygen t rsa 然后一路回车,完毕后生成文件 .ssh/,把这个文件复制到当前位置,命名为authorized_keys;然后执行命令 ssh ,如果不需要密码则直接登陆进去的话,就达到要求;否则需检查 authorized_keys 的权限,看是否为 644( rwrr)。 3) 接下来,同样也 hadoop 用户登陆数据节点服务器 ( 160, 254) ,创建 .ssh 目录,并给与 600 权限( chmod 600 .ssh)。 再把名称服务器上的 authorized_keys 复制到目录数据节点( 160, 254) ./ssh,注意权限和目录结构跟名称节点保持一致,然后再从名称节点用 ssh 登陆数据节点,如果不需要密码能登陆成功,则 ssh 的配置结束。 Hadoop软件安装 以 hadoop 用户登陆 , 将安装软件解压到集群内的所有机器上 , 编辑 conf/文件,至少需要将 JAVA_HOME 设置为 Java 安装根路径 (安装过程参考“ 3 hadoop 的单机部署 ”)。 我们用 HADOOP_HOME指 定 安装的根路径。 通常 集群里的所有机器的 HADOOP_HOME路径相同 ,安装路径定为: /home/hadoop/ 1) 进行 JDK 和内存占用配置: conf/ 需要修改的内容 : The java implementation to use. Required. export JAVA_HOME=/usr/local/java 修改成你自己 jdk 安装的目录 The maximum amount of heap to use, in MB. Default is 1000. export HADOOP_HEAPSIZE=200 根据你的内存大小调整 2) 修改 masters 和 slaves 配置 北京宽连十方数字技术有限公司 公开 内部公开 √ 机密 绝密 修改文件 /usr/local/hadoop/conf/slaves及 /usr/local/hadoop/conf/masters,把数据节点的主机名加到 slaves、名称节点主机名加到 masters。 可以加多个,每行一个。 注意主机名需要在每个服务器的 /etc/hosts映射好。 [hadoop@TEST085 ]$ vi conf/slaves [hadoop@TEST085 ]$ vi conf/master Master(85)配置 85 为 master 结点 ,则 85 的配置文件如下 : hadoop 在 版本,配置文件由以前的 文件变成三个配置文件 ,hdfs ,。 内 在的原因是因为 hadoop 代码量越来越宠大,拆解成三个大的分支进行独立开发,配置文件也独立 了。 下面是三个配置文件示例: [ conf] cat ?xml version=? ?xmlstylesheet type=text/xsl href=? ! Put sitespecific property overrides in this file. configuration property name/name value /property /configuration [ conf] cat ?xml version=? ?xmlstylesheet type=text/xsl href=? ! Put sitespecific property overrides in this file. configuration property 北京宽连十方数字技术有限公司 公开 内部公开 √ 机密 绝密 name/name value3/value descriptionDefault block replication. The actual number of replications can be specified when the file is created. The default is used if replication is not specified in create time. /description /property /configuration [ conf] cat ?xml version=? ?xmlstylesheet type=text/xsl href=? ! Put sitespecific property overrides in this file. configuration property name/name value:9001/value /property /configuration 设置系统环境 ,以方便执行 hadoop命令 在 /home/hadoop/ .bashrc加入 export HADOOP_HOME=/root/hadoop/hadoop export HADOOP_CONF_DIR=$HADOOP_HOME/conf export PATH=/root/hadoop/hadoop/bin:$PATH Slave(60,245上 )配置 在 Slave(60,245上 )上的配置文件如下 ( ): [ conf] cat。[工学]hadoop实战手册入门资料
相关推荐
2/8+3/8 或 3/8+2/8 7/8拍 =2/8+2/8+3/8 或 2/8+3/8+2/8 或 3/8+2/8+2/8 如《小白菜》是 2/4+3/4 组成的 5/4拍。 《卖布谣》两种组合,前 14小节是 3/4+2/4,后 5 小节为 2/4+3/4。 57页。 四、变换拍子。 在乐曲中各种拍子交替出现叫 “ 变换拍子 ”。 这类乐曲很普遍,就是一首乐曲中采用了好 几种拍子 例 25
用公款大吃大喝、挥霍浪费;利用职权谋取个人私利和贪污受贿等问题。 (五)对外投资和重大建设项目投资的管理和效益情况。 (六)与财政、财务收支有关的内部控制制度建立和执行情况。 (七)其他需要审计的事项。 五、审计实施步骤及时间安排 审计实施时间为 200年月日至月日。 (一)审前准备(月日至月日) 审计组接到审计任务后,应及时起草并经局领导签发,打印通知书,提前 3
可分为( )。 A、河砂 B、海砂 C、山砂 D、石屑。 天然石材。 包括:( )。 A、毛石; B、料石; C、饰面石材; D、色石渣; E、石子。 影响木材强度的主要因素为( )。 A、含水率; B、温度; C、荷载作用时间; D、木材的缺陷。 钢材品质均匀致密,( )强度都很高。 A、抗拉; B、抗压; C、抗弯; D、抗剪切。 按施工工艺不同,又分为( )等。 A、喷射混凝土; B
三 、主要内容 建立志愿服务双向机制。 根据志愿者专业知识水平,社会志愿者走进医院提供志愿服务,医务人员志愿者走入基层开展志愿服务。 ㈠为门急诊患者提供包括导医、导诊、预约诊疗、排队、咨询、解释、护送、取药、陪同检查、取送检查检验报告单、费用查询、健康教育、投诉等服务。 ㈡为住院患者提供一般生活护理、沟通交流、陪同检查、咨 询、费用查询、健康教育、陪护、阅读报刊杂志、投诉
”视频培训班,并组织本部门和前台部门 5 人组到视频会现场参加培训,为下一步扎实开展信贷业务授信执行工作奠定良好基础。 二是精心组织召开贷后管理例会。 2020年 6 月 24 日,组织召开贷后管理例会,对西王集团有限公司、山东滨化集团股份有限公司的贷后管理定期分析报告进行了集中审议,查找风险点、议定工作措施、落实措施执行责 任人。 贷后管理例会的成功召开
确 定党员责任区职责。 学校党支部结合学校教育教学具体要求和需要提供的各项服务项目,综合分析,梳理归类,制定党员责任区职责,并推出示范责任区评选条例,指定各责任区签订创建目标责任书 4. 加强公示与反馈。 通过党员活动室、学校公示栏或召开党员会议、制作党员服务名片等形式,公布责任区党员定岗情况,接受群众监督。 5. 认真开展创建活动。 按照实施计划和党组织的活动安排,创造性地开展各项服务活动