# flink **Repository Path**: jkh95/flink ## Basic Information - **Project Name**: flink - **Description**: 学习多易的flink - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2023-09-19 - **Last Updated**: 2025-06-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Flink ## 1.流、批的区别 批数据:我们见得最多,就是有头有尾,一批一批数据,数据量的大小已知,数据就这么多了。 流数据:源源不断,有头没尾,流数据没法去统计,因为数据是源源不断的,但是可以统计一片段一片段的(比如,统计今天的数据,最近1分钟的数据)。这么可以近似的看成“批处理”。所以实时流式计算的Flink也支持 流批一体。 ## 2.Flink的UI 使用webui代码启动即可 ```java Configuration configuration = new Configuration(); configuration.setInteger("rest.port",8822); StreamExecutionEnvironment env = StreamExecutionEnvironment.createLocalEnvironmentWithWebUI(configuration); ``` ![image-20231205230116965](../assets/image-20231205230116965.png) 里面会有一个并行度 ![image-20231205230205218](../assets/image-20231205230205218.png) source、transform、sink都有自己的模块,都有并行度 - source的话,我是继承的非并行的source,所以是1 - transform、sink我没有手动设置`streamEnv.setParallelism(1);`所以,你电脑有多少,它用多少,但是一般transform、sink会在一个块儿里,这按区分下来是因为我设置了`.disableChaining()`。代码可以参考`_10_KafkaSinkOperator_Demo1.java`