当前位置: 首页 > news >正文

flink学习-容错机制

checkpoint(检查点)

在flink中最重要的容错机制,就是checkpoint机制,使用checkpoint可以将之前某个时间点的所有的状态进行保存,这个存档就是checkpoint。

检查点的保存

周期性存储保存,间隔时间可以由用户进行指定。
保存时间点应该是整体处理完某一条数据处理完,将这个时间点的状态保存下来。

检查点恢复状态

当发生故障时,需要找到最近一次成功保存的检查点进行数据恢复。

检查点算法

在flink中,采用Channdy-Lamport 算法的分布式快照,可以在不暂停流处理的前提下,经状态备份保存到检查点。
借鉴水位线设计,插入一个特殊数据结构,表示触发检查保存的时间点,算子遇到后就对当前算子内状态进行持久化保存。
在JobManager中有个『检查点协查器』,用以专门协调处理检查点的相关工作。
分布式快照算法
barrier对齐的精准一次
barrier对齐的至少一次
非barrier对齐的精准一次

checkpoint 常用配置

主要是在设置检查点时需要设置周期,已经模式(例如采用精准一次)
超时时间(默认10分钟)
指定检查存储路径
最大checkpoint并发数
最小等待时间间隔
最小等待间隔(上一轮checkpoint结束到下一轮checkpoint开始间的间隔)
取消作业时,checkpoint的数据是否保留在外部系统
允许checkpoint连续失败的次数
非对齐检查点设置后将会自动设置为精准一次。

保存点用途

整体上看可以将保存点看做程序临时保存使用:
版本管理和归档存储
更新Flink版本
更新应用程序
调整并行度
暂停应用程序

状态一致性

状态一致性部分主要分为三种级别
最多一次(At-Most-Once)
至少一次(At-Least-Once)
精准一次(Exactly-Once)
采用两阶段提交可以用来解决分布式场景下的事务,1、上一次检查点完成后,barrier后续的数据开始进行预提交;2、当新的检查点完成时,各个节点进行正式提交。

相关文章:

  • PyMuPDF 操作手册 - 01 从PDF中提取文本
  • el-date-picker 有效时间精确到时分秒 且给有效时间添加标记
  • Ubuntu 22.04 下 CURL(C++) 实现分块上传/下载文件源码
  • 学习笔记——交通安全分析05
  • leetcode45 跳跃游戏II
  • 使用Python进行音频处理
  • k8s学习笔记(一)
  • 【AI】消融实验ablation study
  • Zookeeper 集群节点故障剔除、切换、恢复原理
  • CFD笔记
  • 【ai】tx2-nx:搭配torch的torchvision
  • MySQL之复制(七)
  • RPM命令和YUM命令
  • fastadmin多语言切换设置
  • Python里引用了time包后,不能再命名time变量了吗?
  • 【402天】跃迁之路——程序员高效学习方法论探索系列(实验阶段159-2018.03.14)...
  • Android组件 - 收藏集 - 掘金
  • angular2 简述
  • iOS小技巧之UIImagePickerController实现头像选择
  • JSONP原理
  • k8s 面向应用开发者的基础命令
  • Mysql优化
  • nfs客户端进程变D,延伸linux的lock
  • PHP面试之三:MySQL数据库
  • seaborn 安装成功 + ImportError: DLL load failed: 找不到指定的模块 问题解决
  • Webpack 4 学习01(基础配置)
  • 不上全站https的网站你们就等着被恶心死吧
  • 第13期 DApp 榜单 :来,吃我这波安利
  • 电商搜索引擎的架构设计和性能优化
  • 延迟脚本的方式
  • 一起来学SpringBoot | 第三篇:SpringBoot日志配置
  • 应用生命周期终极 DevOps 工具包
  • HanLP分词命名实体提取详解
  • RDS-Mysql 物理备份恢复到本地数据库上
  • Spring Batch JSON 支持
  • 积累各种好的链接
  • 说说我为什么看好Spring Cloud Alibaba
  • ​2020 年大前端技术趋势解读
  • ​HTTP与HTTPS:网络通信的安全卫士
  • ​数据结构之初始二叉树(3)
  • !$boo在php中什么意思,php前戏
  • # 利刃出鞘_Tomcat 核心原理解析(七)
  • #Js篇:单线程模式同步任务异步任务任务队列事件循环setTimeout() setInterval()
  • #我与Java虚拟机的故事#连载02:“小蓝”陪伴的日日夜夜
  • (4)logging(日志模块)
  • (c语言版)滑动窗口 给定一个字符串,只包含字母和数字,按要求找出字符串中的最长(连续)子串的长度
  • (Redis使用系列) SpirngBoot中关于Redis的值的各种方式的存储与取出 三
  • (STM32笔记)九、RCC时钟树与时钟 第二部分
  • (二)构建dubbo分布式平台-平台功能导图
  • (三十)Flask之wtforms库【剖析源码上篇】
  • (十七)、Mac 安装k8s
  • (自用)网络编程
  • ****** 二 ******、软设笔记【数据结构】-KMP算法、树、二叉树
  • ****Linux下Mysql的安装和配置
  • .NET 2.0中新增的一些TryGet,TryParse等方法