当前位置: 首页 > news >正文

Databricks 收购 Tabular 的意义:数据开放框架的胜利

Databricks 宣布收购 Tabular,这是一个由 Apache Iceberg 的原始创建者开发的数据平台,在数据分析行业引发了涟漪。此次收购凸显了开放框架在数据领域日益增长的重要性,预示着数据管理、分析和 AI/ML 计划领域的创新、协作和可访问性的新时代。MinIO 一直是 Apache Iceberg 的粉丝,并且与 Tabulal 的团队关系密切。我们已经写了许多关于这项技术如何与高性能对象存储一起工作的基础文章。在下一章中,我们为他们感到兴奋。

开放框架的兴起

开放框架彻底改变了我们处理数据的方式。与将用户锁定在特定平台和工具中的专有系统不同,开放框架提供了灵活性、互操作性和透明度。它们使组织能够利用可用的最佳工具,集成各种数据源,并定制解决方案以满足特定需求,而不受供应商限制的限制。

虽然有些人可能会质疑 Databricks 收购 Tabular 背后的动机,特别是考虑到收购是在 Snowflake 的年度用户大会上宣布的,当时有传言称 Snowflake 本身正在谈判收购 Tabular,但 Databricks 确实拥有开源的诚意,可以为 Iceberg 和更广泛的社区做出积极贡献。这是通过他们对表格的投资来实现的,也许更重要的是,通过有效地雇用冰山格式的创建者。Databricks 历来是开源技术的坚定拥护者,收购 Tabular 符合其培养开放数据生态系统的使命。

虽然我们支持开放框架的任何扩展,无论是物质的还是意识形态的,但组织可以从这场非常公开的战斗中吸取什么教训?至少,很明显,开放表格式是现代数据基础设施的基石。在考虑未来时,组织应专注于能够有效利用这些强大格式的工具和技术。

开放框架在现代数据湖中的作用

现代数据湖作为集中式存储库,用于存储大量结构化和非结构化数据,为高级分析和 AI 计划提供所需的灵活性。显然,为了在 AI 用例中发挥作用,现代数据湖必须建立在高性能、弹性和可扩展的存储之上。

将开放框架集成到这些面向未来的数据湖中具有变革性,因为它增强了它们已经内置的可扩展性、灵活性和互操作性。开放框架使组织能够避免供应商锁定(尤其是在主要供应商急于支持 Iceberg 的情况下),并提供与各种数据源和分析工具轻松集成的灵活性,以及与各种数据源和分析工具轻松集成的灵活性。这两项功能对于构建强大、面向未来的数据基础架构至关重要。

随着 Apache Iceberg、Apache Hudi 和 Delta Lake 等开放框架的兴起,现代数据湖在打破数据孤岛、实现数据访问民主化以及促进更具协作性和创新性的数据生态系统方面的作用得到了强调。以下是这些好处的细分。

增强互操作性和灵活性

开放框架的主要优势之一是它们能够增强互操作性。在当今数据驱动的世界中,组织通常依靠无数的工具和平台来收集、存储、分析和可视化数据。开放框架充当桥梁,允许这些不同的系统无缝通信。

当开放框架部署在 MinIO 上时,用户会放大这种固有的互操作性和灵活性。现代数据湖中的这种强大组合可确保您的数据可以在您需要的任何地方高效访问、管理和处理:私有云、公共云、colos 或边缘。归根结底,运营灵活性并非易事。

通过协作推动创新

开放框架在协作中茁壮成长。就其本质而言,开源项目邀请全球开发人员、研究人员和数据科学家社区做出贡献。这种协作方法可以加速创新,因为可以快速开发、测试和实施新的想法和解决方案。事实是,开源催生了开源,尤其是在人工智能领域。在数据驱动创新的时代,比以往任何时候都更清楚,数据基础设施的未来是开源的。

实现数据访问的民主化

也许开放框架最深远的影响是它们在数据访问民主化方面的作用。通过降低进入门槛,开源工具使各种规模和预算的组织能够利用数据的力量。这种民主化对于创造公平的竞争环境和确保即使是小企业也能在数据驱动的经济中竞争至关重要。

只要有开放框架,这种民主化就是正确的,但对于像MinIO这样建立在开源对象存储上的基础设施来说尤其如此。这种简单易用和部署的基础架构进一步降低了成本和复杂性,使更广泛的组织能够使用强大的数据存储以及 AI 和分析功能。借助 MinIO 和开放式框架,您可以事半功倍。

把它带回家

展望未来,很明显,开放、协作和可访问性原则将继续推动数据环境的发展。Databricks 收购 Tabular 的战略举措凸显了这一驱动力。通过拥抱和投资开放框架,您的组织不仅可以增强其平台,还可以倡导数据比以往任何时候都更易于访问、互操作和创新的未来。这些原则对于构建真正成功的 AI 计划至关重要。

不要落后于自己的基础架构,而是使用 Iceberg 或 Hudi 等开放格式以及世界上最快的对象存储软件开始构建组织自己的现代数据湖。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 安全防御---防火墙实验1
  • 医疗器械FDA |FDA网络安全测试具体内容
  • 初识Laravel(Laravel的项目搭建)
  • 基于随机森林与XGBoost模型的机器故障关键因素分析
  • linux系统php开机自启动 phpfpm
  • Tomcat的安全配置
  • 运营商二三要素是什么?有什么意义
  • 打开excel时弹出stdole32.tlb
  • webpack terser-webpack-plugin 不打包注释及log
  • 几种不同的方式禁止IP访问网站(PHP、Nginx、Apache设置方法)
  • 大模型时代的目标检测
  • Android14系统应用统一裁剪方案
  • B站学习Java路线
  • AWS S3 基本概念
  • 分享浏览器被hao123网页劫持,去除劫持的方式
  • 自己简单写的 事件订阅机制
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • Angular 响应式表单之下拉框
  • CentOS 7 防火墙操作
  • conda常用的命令
  • emacs初体验
  • FineReport中如何实现自动滚屏效果
  • JavaScript服务器推送技术之 WebSocket
  • JS专题之继承
  • Python打包系统简单入门
  • python学习笔记 - ThreadLocal
  • Python中eval与exec的使用及区别
  • SpiderData 2019年2月25日 DApp数据排行榜
  • vue从入门到进阶:计算属性computed与侦听器watch(三)
  • 测试开发系类之接口自动化测试
  • 关键词挖掘技术哪家强(一)基于node.js技术开发一个关键字查询工具
  • 聊聊redis的数据结构的应用
  • 前端面试之CSS3新特性
  • 入口文件开始,分析Vue源码实现
  • 使用iElevator.js模拟segmentfault的文章标题导航
  • 小程序滚动组件,左边导航栏与右边内容联动效果实现
  • 转载:[译] 内容加速黑科技趣谈
  • media数据库操作,可以进行增删改查,实现回收站,隐私照片功能 SharedPreferences存储地址:
  • Mac 上flink的安装与启动
  • 阿里云服务器购买完整流程
  • 长三角G60科创走廊智能驾驶产业联盟揭牌成立,近80家企业助力智能驾驶行业发展 ...
  • ​【原创】基于SSM的酒店预约管理系统(酒店管理系统毕业设计)
  • ​软考-高级-系统架构设计师教程(清华第2版)【第1章-绪论-思维导图】​
  • # 数仓建模:如何构建主题宽表模型?
  • (13)Latex:基于ΤΕΧ的自动排版系统——写论文必备
  • (31)对象的克隆
  • (八)Docker网络跨主机通讯vxlan和vlan
  • (二)基于wpr_simulation 的Ros机器人运动控制,gazebo仿真
  • (机器学习-深度学习快速入门)第一章第一节:Python环境和数据分析
  • (考研湖科大教书匠计算机网络)第一章概述-第五节1:计算机网络体系结构之分层思想和举例
  • (未解决)jmeter报错之“请在微信客户端打开链接”
  • (五)IO流之ByteArrayInput/OutputStream
  • (一)springboot2.7.6集成activit5.23.0之集成引擎
  • (转)自己动手搭建Nginx+memcache+xdebug+php运行环境绿色版 For windows版
  • .aanva