#

大数据

  • 大数据--流量埋点基础(一)

    什么是流量流量是用户与网站交互产生的点击流数据的反应 是业务与用户的营销接触点,是业务红利的入口 流量数据通过用户行为反应营销漏斗过程。流量基本指标介绍数量指标(页面浏览量、访次、

    作者:ilisa2015
    2020-05-29 04:27:02
  • spark-一些参数优化

    Spark程序优化所需要关注的几个关键点——最主要的是数据序列化和内存优化 spark 设置相关参数问题1:reduce task数目不合适解决方法:需根据实际情况调节默认配置,调整方式是修改参数sp

    作者:鲸落大叔
    2020-05-28 22:04:08
  • MapReduce程序之combiner规约

    [toc] MapReduce程序之combiner规约 前言 前面的wordcount程序,shuffle阶段的数据都是<hello, [1, 1, 1]>这种类型的(

    作者:xpleaf
    2020-05-28 21:51:28
  • MySQL DBA基本知识点梳理和查询优化

    本文主要是总结了工作中一些常用的操作,以及不合理的操作,在对慢查询进行优化时收集的一些有用的资料和信息,本文适合有MySQL基础的开发人员。 一、索引相关 索引基数:基数是数据列所包含的不同值的数量。

    作者:白金大数据
    2020-05-28 18:11:18
  • 大数据分析处理系统容量和系统计算能力

    正文与事务处理应用相比,大数据服务属于分析处理应用,由于两者的数据处理特点不同,因此容量估算方法也有一定的区别。大数据服务通常要经过数据ETL、数据存储、数据分析、数据展示、数据开放的过程,因此在计算

    作者:鸽子
    2020-05-28 16:55:40
  • 大数据科学新发展展望:不得不知的四大趋势

    从2012年开始,几乎人人(至少是互联网界)言必称大数据,似乎不和大数据沾点边都不好意思和别人聊天。从2016年开始,大数据系统逐步开始在企业中进入部署阶段,大数据的炒作逐渐散去,随之而来的是应用的蓬

    作者:a大数据
    2020-05-28 16:40:45
  • 大数据采集工具flume各种采集方案案例

    以下是整理flume的各种采集方式 代码直接用 一、sou

    作者:wx5d370d556f15a
    2020-05-28 13:04:12
  • 以MapReduce编程五步走为基础,说MapReduce工作原理

    在之前的Hadoop是什么中已经说过MapReduce采用了分而治之的思想,MapReduce主要分为两部分,一部分是Map——分,一部分是Reduce——合 MapReduce全过程的数据都是以键值

    作者:鲸落大叔
    2020-05-27 04:42:00
  • 分布式计算框架MapReduce

    MapReduce概述 MapReduce源自Google的MapReduce论文,论文发表于2004年12月。Hadoop MapReduce可以说是Google MapReduce的一个开源实现。

    作者:ZeroOne01
    2020-05-27 00:27:34
  • Hadoop单节点环境配置

    1、配置环境1.1、软件包sun jdk  或 openjdk: 1.7 1.2、安装必须软件包:# yum install ssh rsync# rpm -ivh&nb

    作者:bzm200584
    2020-05-26 09:39:08