# flink

**Repository Path**: jkh95/flink

## Basic Information

- **Project Name**: flink
- **Description**: 学习多易的flink
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 0
- **Created**: 2023-09-19
- **Last Updated**: 2025-06-15

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# Flink

## 1.流、批的区别

批数据：我们见得最多，就是有头有尾，一批一批数据，数据量的大小已知，数据就这么多了。

流数据：源源不断，有头没尾，流数据没法去统计，因为数据是源源不断的，但是可以统计一片段一片段的（比如，统计今天的数据，最近1分钟的数据）。这么可以近似的看成“批处理”。所以实时流式计算的Flink也支持 流批一体。

## 2.Flink的UI

使用webui代码启动即可

```java
Configuration configuration = new Configuration();
configuration.setInteger("rest.port",8822);
StreamExecutionEnvironment env = StreamExecutionEnvironment.createLocalEnvironmentWithWebUI(configuration);
```

![image-20231205230116965](../assets/image-20231205230116965.png)

里面会有一个并行度

![image-20231205230205218](../assets/image-20231205230205218.png)

source、transform、sink都有自己的模块，都有并行度

- source的话，我是继承的非并行的source，所以是1
- transform、sink我没有手动设置`streamEnv.setParallelism(1);`所以，你电脑有多少，它用多少，但是一般transform、sink会在一个块儿里，这按区分下来是因为我设置了`.disableChaining()`。代码可以参考`_10_KafkaSinkOperator_Demo1.java`