#

大数据

  • spark-sql case when 问题

    SELECT CASE (pmod(datediff(f0.`4168388__c_0`,'1970-01-04'),7)+1)  WHEN '1' THEN '星期日' WHEN '2'

    作者:去买大白兔
    2020-07-24 10:29:36
  • 大数据和海量数据有什么区别与联系

    本篇文章给大家分享的是有关大数据和海量数据有什么区别与联系,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。”大数据”包含”海量数据”的含义

    作者:Leah
    2020-07-24 09:14:16
  • kafka作为流式处理的上一层,为什么吞吐量那么大?

    Kafka为什么速度快、吞吐量大 Kafka是大数据领域无处不在的消息中间件,目前广泛使用在企业内部的实时数据管道,并帮助企业构建自己的流计算应用程序。Kafka虽然是基于磁盘做的数据存储,但却具有高

    作者:Stitch_x
    2020-07-23 20:24:02
  • Flume数据采集之常见集群配置案例

    [TOC] 非集群配置 这种情况非集群配置方式,比较简单,可以直接参考我整理的《Flume笔记整理》,其基本结构图如下: Flume集群之多个Agent一个source 结构说明 结构图如下: 说

    作者:xpleaf
    2020-07-23 19:58:43
  • Hive笔记整理(二)

    [TOC] Hive笔记整理(二) Hive中表的分类 managed_table—受控表、管理表、内部表 表中的数据的生命周期/存在与否,受到了表结构的影响,当表结构被删除的,表中的数据随之一并被

    作者:xpleaf
    2020-07-23 19:46:18
  • Elasticsearch搜索调优权威指南 (1/3)

    英文原文:https://qbox.io/blog/elasticsearch-search-tuning-5-0-ultimate-guide 作者:Adam Vanderbush 译者:杨振

    作者:vivo互联网
    2020-07-23 15:42:05
  • 大数据之---hadoop常用命令大全终极篇

    软件环境 RHEL6.8 hadoop2.8.1 apache-maven-3.3.9findbugs-1.3.9 protobuf-2.5.0.tar.gz jdk-8u45(操作环境root安装启

    作者:ycwyong
    2020-07-23 15:13:56
  • 大数据智能营销系统的作用

    目前,全国各类行业都为寻找客户源而每天孜孜不倦的进行各种方法和渠道来推销自己的产品和技术。 您正在创业,但是您不知道在国内芸芸众生、多如牛毛的企业、商铺、工厂等各类行业中如何能够凸显出我自己的价值,今

    作者:tepuyanku
    2020-07-23 15:13:40
  • Spark SQL笔记整理(一):Spark SQL整体背景介绍

    [TOC] 基本概述 1、Spark 1.0版本以后,Spark官方推出了Spark SQL。其实最早使用的,都是Hadoop自己的Hive查询引擎;比如MR2,我们底层都是运行的MR2模型,底层都

    作者:xpleaf
    2020-07-23 13:24:11
  • hadoop 源码包编译

    一:系统需求与软件包 二:系统环境初始化 三:hadoop 源代码编译 一:系统需求与软件包 系统 CentOS6.4x64 192.168.3.1 master.hadoop.com

    作者:flyfish225
    2020-07-23 12:33:33