温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

MapReduce的特性有哪些

发布时间:2021-06-18 14:52:34 来源:亿速云 阅读:147 作者:Leah 栏目:大数据

本篇文章给大家分享的是有关MapReduce的特性有哪些,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

计数器
  • 作用:计数器是收集作业统计信息的有效手段之一,用于质量控制或应用级统计。计数器还可辅助诊断系统故障。

  • 任务计数器

  • 文件系统计数器

  • FileInputFormat 计数器

  • FileOutputFormat计数器

  • 作业计数器

    • 作业计数器由application master维护,因此无需在网络间传输数据

  • 用户定义的java计数器

  • 用户定义的Streaming 计数器

排序
  • 部分排序

    • 许多应用并不强求待处理的文件全局有序

  • 全排序

    • 思路:首先,创建一系列排好序的文件 其次 串联这些文件 最后生成一个全局排序的文件。主要思路是使用一个partitioner来描述输出的全局排序

连接
  • MapReduce 能够执行大型数据集间的“连接”操作

  • map端连接

  • reduce 端连接 更常用

边数据分布
  • 是作业所需的额外的只读数据,已辅助处理主数据集

  • 利用JobConf来配置作业

  • 分布式缓存

以上就是MapReduce的特性有哪些,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI