#

大数据

  • 数据挖掘入门必看的几个问题

    要将庞大的数据转换成为有用的信息,必须先有效率地收集信息。 随着科技的进步,功能完善的数据库系统就成了最好的收集数据的工具。如何做好数据挖掘NO.1 Data Mining 和统计分析有什么不同?硬要

    作者:Hjiangxue
    2020-07-15 10:42:54
  • 深度链接对社会化营销有哪些价值和作用?

    社交网络时代,微信、微博等社交软件被广泛应用于我们的生活,大部分的非社交软件都添加了社区分享功能,比如说爱奇艺的泡泡社区,互联网社交化的发展趋势,也影响着营销界,社会化营销也因此变成了营销推广中的一个

    作者:MobService
    2020-07-15 07:55:10
  • spark2.x由浅入深深到底系列七之RDD python api详解一

    学习spark任何技术之前,请先正确理解spark,可以参考:正确理解spark以下对RDD的三种创建方式、单类型RDD基本的transformation api、采样Api以及pipe操作进行了py

    作者:tangweiqun
    2020-07-15 05:16:11
  • HDFS 实验 (三) hadoop节点配置

    vi /etc/hosts添加节点dns信息192.168.209.157 node1192.168.209.158 node2192.168.209.159 node3vi /etc/profile

    作者:pcdog
    2020-07-15 00:54:47
  • 大数据技术扫盲,你必须会的这些点

    虽说人生没有白走的路,新的一年来到,会的还是原来的知识,人的身价就摆在那里,无论怎么折腾,也不会拿到更好的offer。所以在年轻还有拼劲的时候多学学知识,寻找自身的不足,查漏补缺非常重要。**今天小编

    作者:a大数据
    2020-07-15 00:03:32
  • 大数据分析技术与实战之 Spark Streaming

    Spark是基于内存的大数据综合处理引擎,具有优秀的作业调度机制和快速的分布式计算能力,使其能够更加高效地进行迭代计算,因此Spark能够在一定程度上实现大数据的流式处理。随着信息技术的迅猛发展,数据

    作者:首席数据师
    2020-07-14 20:39:46
  • Install CDH5.11 on CentOS 7

    ##1)Environment initialization Note:At least three nodes,  the Master&

    作者:jinyan2049
    2020-07-14 19:36:09
  • Spark笔记整理(四):Spark RDD算子实战

    [TOC] Spark算子概述 RDD:弹性分布式数据集,是一种特殊集合、支持多种来源、有容错机制、可以被缓存、支持并行操作,一个RDD代表多个分区里的数据集。 RDD有两种操作算子: T

    作者:xpleaf
    2020-07-14 14:31:14
  • 大数据需要学习什么?

    大数据需要学习什么?很多人问过我这个问题。每一次回答完都觉得自己讲得太片面了,总是没有一个合适的契机去好好总结这些内容,直到开始写这篇东西。大数据是近五年兴起的行业,发展迅速,很多技术经过这些年的迭代

    作者:白金大数据
    2020-07-14 13:10:36
  • MapReduce的思想

    项目实战案例:搜狗日志查询分析 数据: 一、电商大数据平台整体架构1、大数据(Hadoop、Spark、Hive)都是一种数据仓库的实现方式核心问题:数据存储、数据计算什么是数据仓库?传统的解决大数据

    作者:哈斗篷
    2020-07-14 12:48:28