加入收藏 | 设为首页 | 会员中心 | 我要投稿 源码门户网 (https://www.92codes.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 网站设计 > 教程 > 正文

Hadoop大数据通用处理平台

发布时间:2019-03-17 16:14:13 所属栏目:教程 来源:Java的小本家
导读:副标题#e# Hadoop是一款开源的大数据通用处理平台,其提供了分布式存储和分布式离线计算,,适合大规模数据、流式数据(写一次,读多次),不适合低延时的访问、大量的小文件以及频繁修改的文件。 *Hadoop由HDFS、YARN、MapReduce组成。 如果想学习Java工程化

4.配置YARN(yarn-site.xml)

  1. <configuration> 
  2.  <!-- 配置Reduce取数据的方式是shuffle(随机) --> 
  3.  <property> 
  4.  <name>yarn.nodemanager.aux-services</name> 
  5.  <value>mapreduce_shuffle</value> 
  6.  </property> 
  7. </configuration> 

5.配置MapReduce(mapred-site.xml)

  1. <configuration>  
  2.  <!-- 让MapReduce任务使用YARN进行调度 -->  
  3.  <property>  
  4.  <name>mapreduce.framework.name</name>  
  5.  <value>yarn</value>  
  6.  </property>  
  7. </configuration> 

6.配置SSH

由于在启动hdfs、yarn时都需要对用户的身份进行验证,因此可以配置SSH设置免密码登录。

  1. //生成秘钥 
  2. ssh-keygen -t rsa  
  3. //复制秘钥到本机 
  4. ssh-copy-id 192.168.1.80 

3.3 启动HDFS

1.格式化NameNode

Hadoop大数据通用处理平台

2.启动HDFS,将会启动NameNode、DataNode、SecondaryNameNode三个进程,可以通过jps命令进行查看。

Hadoop大数据通用处理平台

*若启动时出现错误,则可以进入logs目录查看相应的日志文件。

当HDFS启动完毕后,可以访问http://localhost:50070进入HDFS的可视化管理界面,可以在此页面中监控整个HDFS集群的状况并且进行文件的上传以及下载。

*进入HDFS监控页面下载文件时,会将请求重定向,重定向后的地址的主机名为NameNode的主机名,因此客户端本地的host文件中需要配置NameNode主机名与IP的映射关系。

3.4 启动YARN

Hadoop大数据通用处理平台

(编辑:源码门户网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读