当前位置: 首页 > news >正文

Flink+Spark相关记录

Flink+Spark相关记录


  • FlinkSQL

  • Flink Streaming的一些点
  • 覆写RichSource、RichSink、RichMap
    1.Source自动负载均衡,CDC源端加入一个全局调控的节点监控流量流速
    2.Sink并发写入
    3.Map与Iterator与增量迭代等用法
  • 关于Checkpoint几个用法
    1.提交Commit至目的端数据库
    2.UnalignedCheckpoint与ChandyLamport与ChangeLog存增量快照
    3.Buffer写盘
    4.ckp与record共抢一把锁,独占writeBuffer(1.16版本),ckp禁止太快
    5.State写盘+broadcast+JVM+keyState+operatorState+并行度自动扩缩容时恢复

Spark记录

  • groupByKey
  • reduceByKey
  • combineByKey(createCombiner+mergeValue+mergeCombiner)
  • aggregate(n)(seqOp,combOp)
  • 关于ByKey和Join不一定会产生shuffle,先设置好new HashPartition或Custom或Range、之后直接forward不需要shuffle
  • Driver产生一个DAG
    1.一个DAG里的一个节点=>一个RDD
    2.一个RDD=>多个分区
    3.一个分区=>一个Task
    ===>一个DAG有多个RDD,一个RDD有多个Task
    ===>也就是DAG控制多个弹性数据集流转

  • JVM与堆外内存
  • JVM里的StorageMemory(读RDD用)和ExecutionMemory(shuffle/agg/join用)
  • 关于合理设计Block->TaskPartition大小,(4G-200M)*0.5,又因为动态可以弹性,可直接3.8G
  • Spark设置cache和persist缓存级别(每个分区的都会cache,cache务必保证100%否则重算)
  • 对于Flink又有一个slot(JVM)里运行多个算子,所以可以考虑slot内数据总量和资源消耗整体分析
  • 关于Executor add后很久才执行,说明任务调度拥堵
  • 堆外内存

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • RepLKNet架构详解
  • Tensorflow 兼容性测试-opencloudos
  • java中init()函数(JAVA基础)
  • Node.js的学习2——内置模块(一)
  • 【Vue】- Vue应用
  • Java重修笔记 第五十七天 坦克大战(七)多线程基础 - 编程练习
  • Sitecore 定时任务使用介绍
  • udp聊天室
  • 深度学习的关键数据结构——张量解释
  • 【ArcGIS】栅格计算器原理及案例介绍
  • MS SQL Server 实战 排查多列之间的值是否重复
  • HTB-Lame(msf利用)
  • 数学建模笔记—— 多目标规划
  • Xcode报错:No exact matches in reference to static method ‘buildExpression‘
  • 微服务之间远程调用实现思路
  • 分享的文章《人生如棋》
  • 2017-09-12 前端日报
  • create-react-app做的留言板
  • Druid 在有赞的实践
  • es6--symbol
  • Java 实战开发之spring、logback配置及chrome开发神器(六)
  • java8-模拟hadoop
  • Java面向对象及其三大特征
  • Vue2 SSR 的优化之旅
  • 读懂package.json -- 依赖管理
  • 关于Android中设置闹钟的相对比较完善的解决方案
  • 实习面试笔记
  • 微服务核心架构梳理
  • 限制Java线程池运行线程以及等待线程数量的策略
  • 用 vue 组件自定义 v-model, 实现一个 Tab 组件。
  • # 利刃出鞘_Tomcat 核心原理解析(七)
  • # 详解 JS 中的事件循环、宏/微任务、Primise对象、定时器函数,以及其在工作中的应用和注意事项
  • #android不同版本废弃api,新api。
  • ( 10 )MySQL中的外键
  • (7)svelte 教程: Props(属性)
  • (Forward) Music Player: From UI Proposal to Code
  • (NSDate) 时间 (time )比较
  • (zz)子曾经曰过:先有司,赦小过,举贤才
  • (二)WCF的Binding模型
  • (考研湖科大教书匠计算机网络)第一章概述-第五节1:计算机网络体系结构之分层思想和举例
  • (排序详解之 堆排序)
  • (强烈推荐)移动端音视频从零到上手(上)
  • (三)Kafka离线安装 - ZooKeeper开机自启
  • (十七)devops持续集成开发——使用jenkins流水线pipeline方式发布一个微服务项目
  • (贪心) LeetCode 45. 跳跃游戏 II
  • (限时免费)震惊!流落人间的haproxy宝典被找到了!一切玄妙尽在此处!
  • (转)【Hibernate总结系列】使用举例
  • (转)h264中avc和flv数据的解析
  • (转)Oracle存储过程编写经验和优化措施
  • (转)用.Net的File控件上传文件的解决方案
  • .bat文件调用java类的main方法
  • .net core 使用js,.net core 使用javascript,在.net core项目中怎么使用javascript
  • .NET Reactor简单使用教程
  • .net 中viewstate的原理和使用
  • @Transient注解