#

科技

  • 关于Kafka的其他一些内容,堆积情况,retention,auto.offset.reset

    producer是线程安全的,多线程分享共用一个producer比用多个 producer整体上要快 如果你想了解大数据的学习路线,想学习大数据知识以及需要免费的学习资料可以加群:784789432.

    作者:鲸落大叔
    2020-08-06 13:34:39
  • 云计算拥有这8个特点你知道吗?

    云计算是指通过将计算分布在大量的分布式计算机上,而不是在本地计算机或远程服务器上,企业数据中心将更像是在Internet上运行。这使得企业能够将资源切换到需要的应用上,根据需要访问计算机和存储系统。这

    作者:zywx2019
    2020-07-28 10:38:28
  • InfoBeat赋能移动应用,助推业务增长

    随着计算机处理能力日益强大,大数据带来的价值成倍攀升。大数据优化资源配置,提高人们的决策能力,驱动着“信息社会”向“智能社会”过渡。利用大数据做好互联网产品的精细化运营,这种思路相信大家都是认可的,那

    作者:InfoBeat
    2020-07-27 16:12:35
  • Yarn中的Map和Reduce的优化

    通过Hive执行的批次任务处理失败,Spark中报的错误日志如下: [plain] view plain copyERROR : Failed to monitor Job[ 3] with exce

    作者:鲸落大叔
    2020-07-06 15:05:11
  • 构建自己的Docker镜像

    Container 转成Image(不推荐)通过centos的image创建一个容器,修改容器内的内容docker image lsdocker run -it centosyum install -

    作者:鲸落大叔
    2020-07-01 11:33:03
  • 大数据的真正价值在哪里?你get到了吗?

    信息爆炸这个词,想必对于大家来说,已经没有多少新鲜感了,而信息爆炸所引发的大数据,却日益成为了企业的宠儿,越来越多的企业也逐步认识到了大数据的重要性,但是大部分企业往往只看表面,盲目跟风,大量收集数据

    作者:鲸落大叔
    2020-06-13 12:54:07
  • 大数据spark中ml与mllib 的区别你分清了吗?

    大数据学习过程中一个重要的环节就是spark,但是在spark中有很多的知识点,很多人都傻傻分不清楚,其中,最易搞混的就是ml与mllib的区别,所以我们不妨来详细的了解一下二者的区别。 如果你

    作者:鲸落大叔
    2020-06-07 08:46:28
  • spark-一些参数优化

    Spark程序优化所需要关注的几个关键点——最主要的是数据序列化和内存优化 spark 设置相关参数问题1:reduce task数目不合适解决方法:需根据实际情况调节默认配置,调整方式是修改参数sp

    作者:鲸落大叔
    2020-05-28 22:04:08
  • 以MapReduce编程五步走为基础,说MapReduce工作原理

    在之前的Hadoop是什么中已经说过MapReduce采用了分而治之的思想,MapReduce主要分为两部分,一部分是Map——分,一部分是Reduce——合 MapReduce全过程的数据都是以键值

    作者:鲸落大叔
    2020-05-27 04:42:00