博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
快速掌握阿里云 E-MapReduce
阅读量:5756 次
发布时间:2019-06-18

本文共 1589 字,大约阅读时间需要 5 分钟。

hot3.png

阿里云 Elastic MapReduce(E-MapReduce)是运行在阿里云平台上的一种大数据处理的系统解决方案。E-MapReduce 构建于阿里云云服务器 ECS 上,基于开源的 Apache Hadoop 和 Apache Spark,让用户可以方便地使用Hadoop和Spark生态系统中的其他周边系统(如 Apache Hive、Apache Pig、HBase 等)来分析和处理自己的数据。不仅如此,用户还可以通过E-MapReduce将数据非常方便的导出和导入到阿里云其他的云数据存储系统和数据库系统中,如阿里云 OSS、阿里云 RDS 等。

课程链接:

E-MapReduce 的用途:

当用户想要使用 Hadoop、Spark 等分布式处理系统的时候,通常需要经历如下的步骤:

  1. 评估业务特点
  2. 选择机器类型
  3. 采购机器
  4. 准备硬件环境
  5. 安装操作系统
  6. 部署 Hadoop 和 Spark 等 app
  7. 启动集群
  8. 编写应用程序
  9. 运行作业
  10. 获取数据等一系列的步骤

在这些流程中,真正跟用户的应用逻辑相关的是从第8步才开始,第1-7步的各项工作都是前期的准备工作,通常这个前期工作都非常冗长繁琐。而 E-MapReduce 提供了集群管理工具的集成解决方案,如主机选型、环境部署、集群搭建、集群配置、集群运行、作业配置、作业运行、集群管理、性能监控等。

通过使用 E-MapReduce,用户可以从集群构建各种繁琐的采购、准备、运维等工作中解放出来,只关心自己应用程序的处理逻辑即可。此外,E-MapReduce 还给用户提供了灵活的搭配组合方式,用户可以根据自己的业务特点选择不同的集群服务。例如,如果用户的需求是对数据进行日常统计和简单的批量运算,则可以只选择在 E-MapReduce 中运行 Hadoop 服务;而如果用户还需要流式计算和实时计算的需求,则可以在 Hadoop 服务基础上再加入 Spark 服务。

E-MapReduce 的组成:

E-MapReduce 最核心也是用户直接面对的组件是集群。一个 E-MapReduce 集群是由一个或多个阿里云 ECS instance 组成的 Hadoop 和 Spark 集群。以 Hadoop 为例,在每一个 ECS instance 上,通常都运行了一些 daemon 进程(如 namenode、datanode、resoucemanager 和 nodemanager),这些 daemon 进程就组成了 Hadoop 集群。运行 namenode 和 resourcemanager 的节点被称为 master 节点,而运行 datanode 和 nodemanager 的节点被称为 slave 节点。

例如,下图表示了一个包含1个 master 节点和3个 slave 节点的 E-MapReduce 集群:

产品架构:

从上图可以看出,E-MapReduce 集群基于 Hadoop 的生态环境来搭建,同时可以跟阿里云的对象存储服务(OSS),云数据库(RDS)等云服务进行无缝数据交换,方便您将数据在多个系统之间进行共享和传输,以满足不同业务类型的访问需要。

 

 

2018双11阿里云培训认证爆款清单发布,80余款商品0元起。

查看清单  > 

 

活动三大值得买:
1. 热门Clouder在线技能认证1折起,更有日常售价99元人工智能训练师认证0元免费领,我们的目标是让更多技术爱好者体验人工智能的魅力~
2.阿里云大学明星学习产品——云学院全年最低折扣价
3.ACP认证首次参与双11活动,云计算、大数据、云安全ACP认证购买即送等额学习资源包

详情点击:

 

更多精品课程:

阿里云大学官网()

转载于:https://my.oschina.net/u/3637633/blog/2873685

你可能感兴趣的文章
@Transient注解输出空间位置属性
查看>>
Ansible-playbook 条件判断when、pause(学习笔记二十三)
查看>>
深度学习的NLP工具
查看>>
arch下定时备份数据库
查看>>
head first python(第六章)–学习笔记
查看>>
Java LinkedHashMap工作原理及实现
查看>>
hadoop hive hbase 入门学习 (一)
查看>>
【一碗鸡汤】人生的六度发展方式
查看>>
zabbix自定义KEYUserParameter
查看>>
JavaScript—获取参数(23)
查看>>
通过Groovy来消除代码噪声
查看>>
NutzBoot v2.3.3.v20190329 支持 Fescar 分布式事务
查看>>
Java File
查看>>
Guns 旗舰版 2.2 发布,更简洁的管理系统
查看>>
人民广场怎么走? 地铁换乘算法的实现 MikeTech | MikeTech
查看>>
人工智能实战小程序之准备工作
查看>>
HTML样式编辑
查看>>
微软语言包实现汉字转拼音
查看>>
以太坊系列之十七: 使用web3进行合约部署调用以及监听
查看>>
zabbix 监控zgent自定义KEY脚本监控进程
查看>>