当前位置: 首页 > news >正文

flume配置----a1.sources.r1.positionFile=xxxx.json

positionFile 的作用和用途

  1. 记录读取位置
    positionFile 记录了 Flume 读取文件的当前位置(偏移量),确保在 Flume 重启或崩溃后,能够从上次读取的位置继续读取文件,而不是重新开始读取。这在处理大文件或长时间运行的日志文件时尤其重要。
  2. 断点续传
    通过记录偏移量,Flume 可以在任何时候停止并重新启动,而不会丢失数据或重复处理数据。这对于需要高可靠性的数据传输场景非常有用。
  3. 多文件处理
    当 Flume 监控多个文件时,positionFile 会记录每个文件的偏移量和状态。这样即使多个文件同时被写入,也能确保每个文件的数据都能正确处理。
  4. positionFile 的结构
    positionFile 通常是一个 JSON 文件,记录了每个文件的路径、偏移量、时间戳等信息。
  5. 总结

    positionFile 在 Flume 中用于记录文件的读取进度,实现断点续传,确保数据传输的可靠性和连续性。通过合理配置和管理 positionFile,可以有效避免数据丢失和重复读取的问题,是 Flume 数据处理过程中非常重要的一个环节。以下是一个单数据源多出口案例(无写入hdfs阶段):

# 添加内容如下
a1.sources = r1
a1.channels = c1 c2
a1.sinks = k1 k2a1.sources.r1.type = TAILDIR
a1.sources.r1.filegroups = f1
a1.sources.r1.filegroups.f1 = /opt/data/ceshi.log
a1.sources.r1.positionFile = /opt/installs/flume1.9/job/x3.json# 将数据流复制给所有channel
a1.sources.r1.selector.type = replicatinga1.channels.c1.type = memory
a1.channels.c2.type = memorya1.sinks.k1.type = avro
a1.sinks.k1.hostname = hadoop10
a1.sinks.k1.port = 4141a1.sinks.k2.type = avro
a1.sinks.k2.hostname = hadoop10
a1.sinks.k2.port = 4142a1.sources.r1.channels = c1 c2
a1.sinks.k1.channel = c1
a1.sinks.k2.channel = c2

相关文章:

  • mysql如何创建并执行事件?
  • Mysql union语句
  • Bagging与Boosting的应用与优势
  • 计算机网络期末复习
  • 【设计模式-12】代理模式的代码实现及使用场景
  • 【SpringBoot】94、SpringBoot中使用MyBatis-Plus实现数据权限管理
  • 上海交通大学、中科大 开源镜像站停止 Docker Hub 仓库镜像支持后的可用替代源
  • springboot宠物领养系统-计算机毕业设计源码07863
  • python2.7pip报错:UnicodeDecodeError: ‘ascii‘ codec can‘t decode
  • 运维监控系统
  • 大数据安全经典面试题及回答(上)
  • 2024 年最新 windows 操作系统部署安装 redis 数据库详细教程(更新中)
  • 第二十一篇——信道:信息通道的容量有边界嘛?
  • 成员变量和for循环里面的变量不冲突原因
  • Java 桥接模式(Bridge Pattern)是设计模式中的一种结构型设计模式,桥接模式的核心思想是将抽象与实现解耦
  • 2017-09-12 前端日报
  • Android交互
  • C++11: atomic 头文件
  • download使用浅析
  • javascript 哈希表
  • Java知识点总结(JavaIO-打印流)
  • PAT A1050
  • react 代码优化(一) ——事件处理
  • Spark RDD学习: aggregate函数
  • Yeoman_Bower_Grunt
  • 从零到一:用Phaser.js写意地开发小游戏(Chapter 3 - 加载游戏资源)
  • 基于Android乐音识别(2)
  • 前端代码风格自动化系列(二)之Commitlint
  • 前端技术周刊 2019-01-14:客户端存储
  • 适配mpvue平台的的微信小程序日历组件mpvue-calendar
  • hi-nginx-1.3.4编译安装
  • UI设计初学者应该如何入门?
  • 智能情侣枕Pillow Talk,倾听彼此的心跳
  • #图像处理
  • #在 README.md 中生成项目目录结构
  • (2)(2.4) TerraRanger Tower/Tower EVO(360度)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第2章第五节(日期和时间)
  • (floyd+补集) poj 3275
  • (MonoGame从入门到放弃-1) MonoGame环境搭建
  • (NSDate) 时间 (time )比较
  • (附源码)ssm基于web技术的医务志愿者管理系统 毕业设计 100910
  • (附源码)ssm考生评分系统 毕业设计 071114
  • (附源码)计算机毕业设计SSM教师教学质量评价系统
  • (六)Flink 窗口计算
  • (十八)三元表达式和列表解析
  • (一)【Jmeter】JDK及Jmeter的安装部署及简单配置
  • (原創) 系統分析和系統設計有什麼差別? (OO)
  • (转)winform之ListView
  • (转)为C# Windows服务添加安装程序
  • .NET Core WebAPI中使用Log4net 日志级别分类并记录到数据库
  • .NET Remoting Basic(10)-创建不同宿主的客户端与服务器端
  • .Net6使用WebSocket与前端进行通信
  • .net安装_还在用第三方安装.NET?Win10自带.NET3.5安装
  • .NET实现之(自动更新)
  • .Net转Java自学之路—基础巩固篇十三(集合)