#

大数据

  • EonStor GSe Pro 1000详解攻略(五)内功深厚:提升性能的数据服务

    最大800GB的SSD缓存池 缓存是一个透明保存数据的组件,以便将来可以更高效的处理数据请求,是存储的核心组成部分之一,特别适合读密集型的应用。由于控制器的内存容量有限,SSD缓存能够利用高速的SSD

    作者:吾与
    2020-08-30 07:14:04
  • 支付宝和蚂蚁花呗的技术架构及实践

    每年“双11”都是一场电商盛会,消费者狂欢日。今年双11的意义尤为重大,它已经发展成为全世界电商和消费者都参与进来的盛宴。而对技术人员来说,双十一无疑已经成为一场大考,考量的角度是整体架构、基础中间件

    作者:chajiuke王超
    2020-08-30 01:12:03
  • 撕掉普通程序员的标签,这才是真正的大数据工程师

    问你个问题:你是不是曾无数次下定决心要做大数据工作,但因为不知如何开始而放弃?是不是曾经去面试过大数据工作,但因为没有经验缕缕碰壁?你在公司里表现很好,布置的任务总是能又好又快的完成,但两年来你的工资

    作者:15878367337
    2020-08-28 16:12:44
  • hadoop大数据研发平台

    一.开发平台:•Hadoop是Apache软件基金会旗下的一个开源分布式计算平台•以分布式文件系统(Hadoop Distributed File Syste, HDFS)和MapReduce为核心的

    作者:北京云港
    2020-08-28 11:29:02
  • EonStor GSi:媒资管理的完美存储

    媒体娱乐(M&E)行业的大多数存储用户(例如,电影制片厂、视频制作公司)都在使用媒体资产管理(MAM)应用程序。MAM应用程序主要的用途,是让媒体素材从采集到分发的全过程,全部由用户完全管理,形成保存

    作者:吾与
    2020-08-24 19:42:47
  • hive表开启lastAccessTime参数

    1.hive-site.xml 的 Hive 服务高级配置代码段(安全阀)中添加2个参数: hive.security.authorization.sqlstd.confwhitelist=hive.

    作者:choulanlan
    2020-08-22 18:49:06
  • MongoDB副本集的常用操作及原理

    下面的操作主要分为两个部分: 修改节点状态 主要包括: 将Primary节点降级为Secondary节点冻结Secondary节点强制Secondary节点进入维护模式2. 修改副本集的配置 添加

    作者:gzhilong
    2020-08-22 14:10:38
  • Impala隐藏的惊天秘密

    元数据作为大数据的源泉,有着非常重要的作用。可在Impala中却隐藏着一个秘密?和元数据有着颇深的渊源,我们一起来追溯!一、Impala体系结构(1)每个slave节点运行一个Impala进程,和HD

    作者:caosheng03
    2020-08-22 13:20:19
  • 深度解析数据挖掘关联规则Apriori算法

    01、关联规则挖掘背景和基本概念如下所示的数据集,表中的每一行代表一次购买清单,注意我们只关心记录出现与否,不关心某条记录购买了几次,如购买十盒牛奶也只计一次。数据记录的所有项的集合称为总项集,上表中

    作者:Hjiangxue
    2020-08-22 08:01:16
  • Spark基础

    官方文档:spark.apache.org/docs/latest   Spark背景    MapReduce局限性:    1>) 繁杂            map/reduce (map

    作者:ycwyong
    2020-08-22 02:12:32