本文档是 Apache Flink 的旧版本。建议访问
最新的稳定版本
。
v1.11
Home
Try Flink
Local Installation
基于 DataStream API 实现欺诈检测
基于 Table API 实现实时报表
Python API
Flink 运维操场
实践练习
概览
DataStream API 简介
数据管道 & ETL
流式分析
事件驱动应用
容错处理
概念透析
概览
有状态流处理
及时流处理
Flink 架构
词汇表
应用开发
DataStream API
概览
Event Time
概览
Generating Timestamps / Watermarks
Pre-defined Timestamp Extractors / Watermark Emitters
状态与容错
概览
Working with State
Broadcast State 模式
Checkpointing
Queryable State
State Backends
状态数据结构升级
自定义状态序列化
用户自定义函数
算子
概览
窗口
Joining
Process Function
异步 I/O
Data Sources
Side Outputs
Handling Application Parameters
测试
实验功能
Scala API Extensions
Java Lambda 表达式
Project Configuration
DataSet API
概览
Transformations
迭代
Zipping Elements
Hadoop 兼容
本地执行
集群执行
Batch 示例
Table API & SQL
概览
概念与通用 API
流式概念
概览
动态表 (Dynamic Table)
时间属性
Joins in Continuous Queries
时态表(Temporal Tables)
模式检测
Query Configuration
数据类型
Table API
SQL
概览
查询语句
CREATE 语句
DROP 语句
ALTER 语句
INSERT 语句
SQL Hints
DESCRIBE 语句
EXPLAIN 语句
USE 语句
SHOW 语句
函数
概览
系统(内置)函数
自定义函数
模块
Catalogs
SQL 客户端
Hive 集成
概览
HiveCatalog
Hive Dialect
Hive Read & Write
Hive Streaming
Hive 函数
配置
Performance Tuning
流式聚合
User-defined Sources & Sinks
Python API
环境安装
Table API 教程
Table API用户指南
Python Table API简介
TableEnvironment
Operations
数据类型
系统(内置)函数
自定义函数
普通自定义函数(UDF)
向量化自定义函数
PyFlink Table 和 Pandas DataFrame 互转
依赖管理
SQL
Catalogs
指标
配置
Connectors
环境变量
常见问题
数据类型以及序列化
概览
自定义序列化器
管理执行
执行配置
程序打包
并行执行
Execution Plans
Task 故障恢复
API 迁移指南
Libraries
事件处理 (CEP)
State Processor API
图计算: Gelly
概览
Graph API
Iterative Graph Processing
Library Methods
Graph Algorithms
Graph Generators
Bipartite Graph
Connectors
DataStream Connectors
概览
容错保证
Kafka
Cassandra
Kinesis
Elasticsearch
Hadoop FileSystem
Streaming File Sink
RabbitMQ
NiFi
Google Cloud PubSub
Twitter
JDBC
Table & SQL Connectors
概览
Formats
概览
CSV
JSON
Avro
Debezium
Canal
Parquet
Orc
Kafka
JDBC
Elasticsearch
FileSystem
HBase
DataGen
Print
BlackHole
DataSet Connectors
部署与运维
集群与部署
概览
Local Cluster
独立集群
YARN
Mesos
Docker
Kubernetes
Native Kubernetes
Hadoop 集成
高可用 (HA)
状态与容错
Checkpoints
Savepoints
State Backends
大状态与 Checkpoint 调优
配置参数
内存配置
配置 Flink 进程的内存
配置 TaskManager 内存
配置 JobManager 内存
调优指南
常见问题
升级指南
生产就绪情况核对清单
CLI
Python REPL
Scala REPL
扩展资源
Kerberos
SSL 设置
文件系统
概览
通用配置
Amazon S3
阿里云 OSS
Azure Blob 存储
升级应用程序和 Flink 版本
Plugins
调试和监控
指标
日志
History Server
监控 Checkpoint
监控反压
监控 REST API
调试窗口与事件时间
调试类加载
应用程序分析
Flink 开发
导入 Flink 到 IDE 中
从源码构建 Flink
内幕
作业调度
Task 生命周期
文件系统
Javadocs
Scaladocs
Pythondocs
Project Page
Go
选择文档版本
v1.10
v1.9
v1.8
v1.7
v1.6
v1.5
v1.4
v1.3
v1.2
v1.1
v1.0
English
应用开发
DataStream API
状态与容错
状态与容错
本文档是 Apache Flink 的旧版本。建议访问
最新的稳定版本
。
你将在本节中了解到 Flink 提供的用于编写有状态程序的 API,想了解更多有状态流处理的概念,请查看
有状态的流处理
Back to top
接下来看什么?
Working with State
: 描述了如何在 Flink 应用程序中使用状态,以及不同类型的状态。
The Broadcast State 模式
: 描述了如何将广播流和非广播流进行连接从而交换数据。
Checkpointing
: 介绍了如何开启和配置 checkpoint,以实现状态容错。
Queryable State
: 介绍了如何从外围访问 Flink 的状态。
状态数据结构升级
: 介绍了状态数据结构升级相关的内容。
Managed State 的自定义序列化器
: 介绍了如何实现自定义的序列化器,尤其是如何支持状态数据结构升级。
Back to top