当前位置: 首页 > news >正文

伯克利开源 Confluo,吞吐量是 Kafka 的 4 到 10 倍

近日伯克利 RISE Lab 开源了一个多数据流实时分布式分析系统 Confluo,它既是一个网络监控和诊断框架,也可以作为时序数据库和发布订阅消息系统。

源码地址:https://github.com/ucbrise/confluo

当下,类似基于终端主机的网络监控系统、IoT 设备传感器程序等应用,其后端的服务器每秒都可以捕获数千万个数据点。这些数据被用于在线查询,实现可视化与监控,或者用于离线查询,进行故障分析和系统优化。

这样的使用场景下,就需要实时监控和分析工具支持,这些工具通常支持高吞吐量数据提取、低延迟在线查询和低开销的离线查询。

虽然目前已经存在一些用于高吞吐量数据提取的数据结构,它们可以支持丰富的在线和离线查询,但是高吞吐量与查询能力目前来看还是互斥的。

在从多个数据流提取数据时,查询需要更新多个数据结构,包括原始数据、聚合统计信息和物化视图。但是用于支持这些查询的数据结构往往具有较高的更新开销,而且无法维持大多数应用程序所需的数据提取速率。

而另一方面,可以维持高数据提取速率的数据结构往往只支持非常简单的查询。

Confluo 正是为了应对这种情况而产生的,它是一个致力于同时实现高吞吐量数据提取和富有表现力的离线/在线查询的系统。

Confluo 性能强悍,支持:

  • 来自多个数据流的数百万个数据点的高吞吐量并发写入

  • 毫秒级的在线查询

  • 使用最少 CPU 资源的 ad-hoc 查询

不同场景下对 Confluo 进行性能测试,结果显示:

  • 作为一个网络监控和诊断框架,Confluo 能够在单核上以线路速率(10Gbps 链路)执行数千个触发器和数十个过滤器。

  • 作为一个时序数据库,与其它诸如 CorfuDB、TimescaleDB 和 BTrDB 等先进的时序数据库相比,Confluo 的吞吐量提高了 2 到 20 倍,写入延迟降低了 2 至 10 倍,时间区间查询延迟降低了 5 至 20 倍。

  • 作为一个发布订阅消息系统,Confluo 的吐量是 Kafka 的 4 到 10 倍。

更详细的分析:https://rise.cs.berkeley.edu/blog/confluo-millisecond-level-queries-on-large-scale-streaming-data

转载于:https://www.cnblogs.com/zengxlf/p/10586548.html

相关文章:

  • 第八周编程总结
  • 枚举类的基本使用
  • rsync 数据备份+cron+mailx案例
  • Sublime插件:Terminal
  • centos下安装nginx
  • poi读取Excel模板并修改模板内容与动态的增加行
  • Siri shortcuts 指北
  • day15生成器面试题和内置函数
  • idea debug
  • 关于XML文件
  • SQL自动流水号函数
  • NOI2018屠龙勇士(扩展CRT + splay(multiset))
  • 4 Redis 配置文件介绍
  • 定时任务Cron常用表达式与在线生成器
  • str()函数
  • Apache Zeppelin在Apache Trafodion上的可视化
  • Docker 笔记(1):介绍、镜像、容器及其基本操作
  • Git 使用集
  • Laravel 实践之路: 数据库迁移与数据填充
  • linux学习笔记
  • MySQL常见的两种存储引擎:MyISAM与InnoDB的爱恨情仇
  • OSS Web直传 (文件图片)
  • PV统计优化设计
  • SpiderData 2019年2月23日 DApp数据排行榜
  • Web Storage相关
  • Webpack 4 学习01(基础配置)
  • 阿里研究院入选中国企业智库系统影响力榜
  • 安装python包到指定虚拟环境
  • 好的网址,关于.net 4.0 ,vs 2010
  • 快速体验 Sentinel 集群限流功能,只需简单几步
  • 聊聊flink的BlobWriter
  • 实战:基于Spring Boot快速开发RESTful风格API接口
  • 手写双向链表LinkedList的几个常用功能
  • 跳前端坑前,先看看这个!!
  • 微信开放平台全网发布【失败】的几点排查方法
  • PostgreSQL 快速给指定表每个字段创建索引 - 1
  • 选择阿里云数据库HBase版十大理由
  • ​LeetCode解法汇总518. 零钱兑换 II
  • (10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】
  • (2)MFC+openGL单文档框架glFrame
  • (附表设计)不是我吹!超级全面的权限系统设计方案面世了
  • (一)C语言之入门:使用Visual Studio Community 2022运行hello world
  • (转)Oracle 9i 数据库设计指引全集(1)
  • * CIL library *(* CIL module *) : error LNK2005: _DllMain@12 already defined in mfcs120u.lib(dllmodu
  • .net 简单实现MD5
  • .NET 中什么样的类是可使用 await 异步等待的?
  • .Net开发笔记(二十)创建一个需要授权的第三方组件
  • .net利用SQLBulkCopy进行数据库之间的大批量数据传递
  • @RequestBody与@ResponseBody的使用
  • @TableLogic注解说明,以及对增删改查的影响
  • [ Linux 长征路第五篇 ] make/Makefile Linux项目自动化创建工具
  • [2024最新教程]地表最强AGI:Claude 3注册账号/登录账号/访问方法,小白教程包教包会
  • [8-23]知识梳理:文件系统、Bash基础特性、目录管理、文件管理、文本查看编辑处理...
  • [C#]扩展方法
  • [Contiki系列论文之2]WSN的自适应通信架构