#

大数据

  • 学习大数据必须了解的大数据开发课程大纲

    大数据开发最核心的课程就是Hadoop框架,几乎可以说Hadoop就是大数据开发。这个框架就类似于Java应用开发的SSH/SSM框架,都是Apache基金会或者其他Java开源社区团体的能人牛人开发

    作者:a大数据
    2020-07-20 18:13:17
  • ELK大数据分析课程

    ELK大数据分析课程文档出自:广通学院    版本:1.0  QQ:430696786   微信号:winlone 官方资料:be

    作者:广通学院
    2020-07-20 15:27:23
  • Flume自定义Source

    模拟编写了一个Flume 1.7中TAILDIR的功能实现,通过手动控制文件的读取位置来达到对文件的读写,防止flume挂了之后重复消费的情况。以下是代码实现,仅做参考,生产上直接用TAILDIR读取

    作者:兴趣e族
    2020-07-20 15:01:34
  • Giraph源码分析(六)——Edge 分析

    1.在Vertex类中,顶点的存储方式采用邻接表形式。每个顶点有 VertexId、VertexValue、OutgoingEdges和Halt,boolean型的halt变量用于记录顶点的状态,fa

    作者:数澜
    2020-07-20 13:47:53
  • 宜信开源|详解PaaS平台LAIN的功能和架构

    【技术沙龙002期】数据中台:宜信敏捷数据中台建设实践|宜信技术沙龙 将于5月23日晚8点线上直播,点击报名 LAIN是宜信公司大数据创新中心开发的开源PaaS平台。在金融的场景下,LAIN 是为解放

    作者:宜信技术
    2020-07-20 12:54:48
  • python计算IV值及使用

    更多大数据分析、建模等内容请关注公众号《bigdatamodeling》 在对变量分箱后,需要计算变量的重要性,IV是评估变量区分度或重要性的统计量之一,python计算IV值的代码如下: def C

    作者:佛曰可说
    2020-07-20 12:18:20
  • 旅游研究院大数据挖掘与分析科研平台建设方案

    一. 背景 一.1 数据挖掘和大数据分析行业背景和发展趋势 移动互联网、电子商务以及社交媒体的快速发展使得企业需要面临的数据量成指数增长。根据 IDC 《数字宇宙》(Digital Universe)

    作者:guxiaodou002
    2020-07-20 11:57:06
  • 大数据生态之zookeeper(shell使用)

    进入zk的客户端:zkCli.sh -server hadoop01:2181  查看znode子节点内容: ls / 创建znode节点:create /zookeeper/node1 ‘内容

    作者:原生zzy
    2020-07-20 11:20:40
  • 大数据服务之数据管理

    数据管理过程主要包括:数据转换、数据关联、数据丰富、数据操作以及数据保持。 数据转换就是将数据从一种形式变换为另一种形式,通过形式的变化,使得数据更便于分析利用。比如在数据采集阶段导入的原始数据,需要

    作者:易仔阿克
    2020-07-20 06:19:34
  • GS和Xsan、StorNext,存储在影视业的又一段佳话

    工作室和影视公司需要快速可靠的文件系统,用于高清剪辑、录制、播放视频/音频。Infortrend EonStor GS产品线经过精心打磨、可以与行业领先的Xsan和StorNext文件系统配合使用,满

    作者:吾与
    2020-07-20 02:33:43