大数据培训Flink 流奈何来处分 API

大数据培训Flink 流奈何来处分 API
更新时间：2023-03-11 12:06 发布者：admin

　　创建一个执行环境，表示当前执行程序的上下文。如果程序是独立调用的，则此方法返回本地执行环境；如果从命令行客户端调用程序以提交到集群，则此方法返回此集群的执行环境，也就是说，getExecutionEnvironment 会根据查询运行的方式决定返回什么样的运行环境，是最常用的一种创建执行环境的方式。

　　如果没有设置并行度，会以 flink-conf.yaml 中的配置为准，默认是 1。

　　返回集群执行环境，将 Jar 提交到远程服务器。需要在调用时指定 JobManager的 IP 和端口号，并指定要在集群中运行的 Jar 包。

　　更多 Java –大数据 –前端 –python 人工智能资料下载，可百度访问：尚硅谷官网

　　除了以上的 source 数据来源，我们还可以自定义 source。需要做的，只是传入一个 SourceFunction 就可以。具体调用如下：

　　我们希望可以随机生成传感器数据，MySensorSource 具体的代码实现如下：

　　DataStream → KeyedStream：逻辑地将一个流拆分成不相交的分区，每个分区包含具有相同 key 的元素，在内部以 hash 的形式实现的。

　　KeyedStream → DataStream：一个分组数据流的聚合操作，合并当前的元素和上次聚合的结果，产生一个新的值，返回的流中包含每一次聚合的结果，而不是只返回最后一次聚合的最终结果。

　　更多 Java –大数据 –前端 –python 人工智能资料下载，可百度访问：尚硅谷官网

　　DataStream,DataStream → ConnectedStreams：连接两个保持他们类型的数据流，两个数据流被 Connect 之后，只是被放在了一个同一个流中，内部依然保持各自的数据和形式不发生任何变化，两个流相互独立。

　　1． Union 之前两个流的类型必须是一样，Connect 可以不一样，在之后的 coMap中再去调整成为一样的。

　　Flink 流应用程序处理的是以数据对象表示的事件流。所以在 Flink 内部，我们需要能够处理这些对象。它们需要被序列化和反序列化，以便通过网络传送它们；

　　或者从状态后端、检查点和保存点读取它们。为了有效地做到这一点，Flink 需要明确知道应用程序所处理的数据类型。Flink 使用类型信息的概念来表示数据类型，并为每个数据类型生成特定的序列化器、反序列化器和比较器。

　　Flink 还具有一个类型提取系统，该系统分析函数的输入和返回类型，以自动获取类型信息，从而获得序列化器和反序列化器。但是，在某些情况下，例如 lambda函数或泛型类型，需要显式地提供类型信息，才能使应用程序正常工作或提高其性能。

　　Flink 支持 Java 和 Scala 中所有常见数据类型。使用最广泛的类型有以下几种。

　　更多 Java –大数据 –前端 –python 人工智能资料下载，可百度访问：尚硅谷官网

　　Flink 暴露了所有 udf 函数的接口(实现方式为接口或者抽象类)。例如

　　“富函数”是 DataStream API 提供的一个函数类的接口，所有 Flink 函数类都有其 Rich 版本。它与常规函数的不同在于，可以获取运行环境的上下文，并拥有一些生命周期方法，所以可以实现更复杂的功能。

　　Rich Function 有一个生命周期的概念。典型的生命周期方法有：

　　 close()方法是生命周期中的最后一个调用的方法，做一些清理工作。

　　Flink 没有类似于 spark 中 foreach 方法，让用户进行迭代的操作。虽有对外的输出操作都要利用 Sink 完成。最后通过类似如下方式完成整个任务最终输出操作。

　　官方提供了一部分的框架的 sink。除此以外，需要用户自定义实现 sink。

上一篇：尊龙d88.comapp竞赛 2020美赛竞赛时代更新大众能够遴选分歧时代下一篇：Common App再添42个新成员！ 返回尊龙d88.comapp

大数据培训Flink 流奈何来处分 API
更新时间：2023-03-11 12:06 发布者：admin

联系我们

行业新闻

公司新闻

大数据培训Flink 流奈何来处分 API 更新时间：2023-03-11 12:06 发布者：admin

联系我们

行业新闻

公司新闻

大数据培训Flink 流奈何来处分 API
更新时间：2023-03-11 12:06 发布者：admin