温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

Flink核心概念是什么

发布时间:2021-11-16 16:48:32 来源:亿速云 阅读:110 作者:iii 栏目:大数据

这篇文章主要介绍“Flink核心概念是什么”,在日常操作中,相信很多人在Flink核心概念是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Flink核心概念是什么”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

    Flink程序是在分布式集合上实现转换的常规程序(例如filtering, mapping, updating state, joining, grouping, defining windows, aggregating)。集合最初是从sources上创建,这些源包括:本地文件, kafka topics, 内存集合等。结果通过sink返回,sink可以将数据写入文件中(分布式)或者终端输出(命令行)。Flink可以运行在不同环境下,例如可以嵌入到其他程序中运行,也可以在单机运行,此外Flink可以在本地JVM中运行,也可以在分布式集群中运行。

    有有界数据源也有无界数据源,可以使用批处理和流处理,使用批处理时使用DataSet API ,使用流处理时使用DataStream API。

Flink编程模型

第一步:获取执行环境,批处理与流处理不同

第二步:获取数据,socket、文本、kafka

第三步:transform

第四步:sink 到哪里去

第五步:触发执行。

Lazy Evaluation 延迟执行

All Flink programs are executed lazily: When the program’s main method is executed, the data loading and transformations do not happen directly. Rather, each operation is created and added to the program’s plan. The operations are actually executed when the execution is explicitly triggered by an execute() call on the execution environment. Whether the program is executed locally or on a cluster depends on the type of execution environment.
The lazy evaluation lets you construct sophisticated programs that Flink executes as one holistically planned unit.

 上面的意思是说:当主函数被执行时,数据加载和transformation不会马上执行。每一个操作会被添加到程序的执行计划中,相当于仅仅是记下来了。当这些"执行操作"被显式触发时(例如调用execute()时),才会真正执行操作。

这种延迟执行方式可以让我们构建非常复杂的应用程序,Flink将一些执行操作作为整体去执行。方便我们去优化。

到此,关于“Flink核心概念是什么”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注亿速云网站,小编会继续努力为大家带来更多实用的文章!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI