D3是什么 全称是(Data-Driven Documents),一个被数据驱动的文档 简单点,是一个JavaScript函数库,使用它主要用来做数据可视化。 D3 是一个开源项目,作者是纽约时报的工
Infortrend为企业提供全方位数据安全保护,通过多重技术将数据风险降到最低,保证业务不间断的进行。远程复制• 可以远程备份数据,因此当本地数据发生损坏时,可以从异地备份的数据恢复到本地•
1、partition数目 spark的输入可能以多个文件的形式存储在HDFS上,每个File都包含了很多块,称为Block。 当Spark读取这些文件作为输入时,会根据具体数据格式对应的InputF
学习spark任何技术之前,请先正确理解spark,可以参考:正确理解spark以下对RDD的三种创建方式、单类型RDD基本的transformation api、采样Api以及pipe操作进行了ja
[toc] MapReduce之Job工具类开发 在MapReduce程序写Mapper和Reducer的驱动程序时,有很多代码都是重复性代码,因此可以将其提取出来写成一个工具类,后面再写MapRe
夏凯卡内基梅隆大学计算机系毕业,曾供职于Evernote数据团队和微软Bing.com搜索引擎广告部门。回国后作为早期成员加入小红书,先后从事大数据,用户增长,项目和团队管理等工作。 我最初
近期开始大数据的学习,在学习之前给给自己定义了一个大数据学习路线大数据技术学习路线指南一、Hadoop入门,了解什么是Hadoop1、Hadoop产生背景2、Hadoop在大数据、云计算中的位置和关系
HTTP Proxy Demo 代码 1、Python #! -*- encoding:utf-8 -*- import requests # 要访问的目标页面 targetUrl = "http
好程序员大数据教程分享Scala系列之Option_偏函数_StringOption类型在Scala中Option类型样例类用来表示可能存在或也可能不存在的值(Option的子类有Some和None)
随着企业数据的日久累计,企业生产的数据无论从数量空间还是从维度层次上都日益繁杂。面对大量数据,管理层常常望洋兴叹:要么企业自产的大量数据不能有效利用,无法提供决策依据;要么数据展示模式繁杂晦涩,无法快