当前位置: 首页 > news >正文

为数据赋予超能力,阿里云重磅推出Serverless数据分析引擎-Data Lake Analyti

阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics,Data Lake Analytics,帮助更多不具备分析能力的存储服务,赋予其分析的能力。

从生活中的购物交易,到工业上的生产制造,再到社交网络媒体信息、企业化管理决策等等,大数据成为当前经济社会最重要的前进方向之一。越来越多的企业在面临数据以指数级成倍增长的时候,第一选择存储服务来存储数据,那在人人高喊数据为王的时代,如果数据仅仅被存储起来,而不加以分析,那数据的超能力也将毫无意义。

拥抱分析能力迫在眉睫

很多企业用户选择阿里云对象存储服务OSS或者表格存储(Table Store)来存储数据,作为面向海量数据、极低成本、高度灵活的存储平台,云上客户存储了大量的流水数据、日志数据、监控数据等,然而这些数据今天不具备低成本、灵活高效的分析能力。OSS和Table Store不但存储了大量的历史数据,而且新数据每日剧增。

以往客户需要分析OSS数据,需要临时将数据导入各种事先购买或者部署好的分析引擎,分析完再将数据删除、释放分析引擎的资源,链路长,耗时耗力极其不便,也不利于节省成本。

1

如果客户使用Hadoop等传统的MR解决方案,虽然存储和计算分离,但是考虑到资源复用,往往需要在购买的ECS或者物理机上既部署存储节点又要部署计算节点,存储和计算无法做到真正的按需各自扩展。而开源Greenplum等传统的MPP数据库,更是存储和计算一体化,存储和计算分别按需扩展更是无法支撑。

而Serverless化数据分析引擎-Data Lake Analytics弥补了以上痛点。无需ETL,就可使用标准 SQL、现有的商业智能 (BI) 和ETL工具,以极低成本与高效地轻松分析与集成在阿里云OSS、Table Store数据源的数据。
Data Lake Analytics四大特性为数据分析保驾护航
2

Data Lake Analytics使得更多异构数据源具备融合分析的能力。不仅支持联合OSS和Table Store进行数据分析,后续也会支持对接更多的数据源接入,Serverless,意味着客户使用分析服务无需购买或者管理服务器,升级透明,Data Lake Analytics基于ECS、ESS轻松做到弹性伸缩服务,能让业务真正做到按需扩存储、计算资源,按使用量付费分析,不分析只需要拥有存储成本,整个方案成本极低。

不仅如此,Data Lake Analytics支持SQL 2003标准、丰富的内置函数支持,可以像使用数据库一样做访问OSS文件或者其他数据源。支持标准JDBC/ODBC, 应用程序轻松集成。在交互式能力上,Data Lake Analytics通过高效智能优化器,新一代分析引擎XIHE, 全面融合MPP+DAG技术使得查询性能非常出色,具备真正的可交互式分析能力。

打破传统,多场景适用
场景一:数据提取平台
某客户有大量的数据在OSS上,每天开发者要处理大量的临时取数的需求,客户最终基于OSS + Data Lake Analytics做到廉价可扩展的数据提取平台。整个方案如下:
3

客户端通过报表工具生成各种提取数据的SQL,报表工具将SQL发送至Data Lake Analytics, Data Lake Analytics则直接去分析OSS数据,然后将分析后的结果返回给报表工具。OSS的10TB的存储每月费用在1200元左右,Data Lake Analytics则是完全按照查询使用量来付费(目前处于公测免费阶段),从而实现了一个完全自助化、极其廉价的可持续扩展的数据提取平台。

场景二:DB冷数据分析和快速恢复

4

为降低rds的成本,客户不定期的有大量的历史库数据通过DBS备份至OSS,针对历史归档的业务数据,偶尔可能有少量的分析需求,此时通过Data Lake Analytics即可轻松满足。此外,客户若发现在线库的业务数据需要利用OSS归档数据做订正,以往做法是先购买一个超大规格的RDS, 然后将OSS备份恢复至RDS,将用来做订正的数据查询出来。有了Data Lake Analytics后,就可以轻松的通过Data Lake Analytics直接查询到OSS的数据用做订正,非常便捷,成本同时降低了很多。Data Lake Analytics提供端到端的数据安全访问保障,支持OSS的安全角色访问和表级别的用户授权,实现用户数据的安全隔离。

场景三:能源电池数据分析平台
客户有大量电池数据,需要天级别仅分析一次蓄电池的数据,来分析电池的使用寿命,以决定是否提前做报废。客户通过将电池数据批量上传至OSS,通过Data Lake Analytics每日分析一次,OSS 10TB月均存储成本约1200元,Data Lake Analytics则按照查询数据量计费(目前公测期间不收费),成本极具优势。

5

云上目前OSS、Table Store等存储有大量的业务数据急需分析能力,而Data Lake Analytics的出现则很好的满足了这一需求。对于云上中小企业来说,可以选择用最廉价的存储来搭配最普惠灵活的的分析能力。阿里云Data Lake Analytics正是最普惠灵活的分析能力的实践者,目前公测期间免费试用,欢迎大家前来体验.
PC端请戳链接体验公测:https://www.aliyun.com/product/datalakeanalytics

转载于:https://blog.51cto.com/13927391/2164987

相关文章:

  • android 自定义view
  • 自己手撸一个符合Promise/A+的Promise
  • Zookeeper分布式集群原理与功能
  • 体积减少80%!释放webpack tree-shaking的真正潜力
  • CentOS7上Docker安装与卸载
  • webpack4.0各个击破(9)—— karma篇
  • day62:mysql主从配置
  • 网站服务器监控指标和日志收集
  • 从荣耀小米扎堆“滑盖全面屏”,看国产手机的“取巧”式创新
  • Dubbo配置方式详解
  • Python爬虫学习笔记(五)——XPath的使用
  • OSSEC安全监控环境搭建(docker+yum)安装
  • MySQL事务隔离级别、锁信息
  • 洛谷P2261 [CQOI2007]余数求和
  • Office 365发送超大附件
  • Asm.js的简单介绍
  • Consul Config 使用Git做版本控制的实现
  • echarts的各种常用效果展示
  • eclipse的离线汉化
  • EOS是什么
  • gulp 教程
  • java概述
  • js数组之filter
  • puppeteer stop redirect 的正确姿势及 net::ERR_FAILED 的解决
  • WebSocket使用
  • 包装类对象
  • 大整数乘法-表格法
  • 多线程事务回滚
  • 记录:CentOS7.2配置LNMP环境记录
  • 开发基于以太坊智能合约的DApp
  • 使用阿里云发布分布式网站,开发时候应该注意什么?
  • 赢得Docker挑战最佳实践
  • ​批处理文件中的errorlevel用法
  • #、%和$符号在OGNL表达式中经常出现
  • #include
  • %@ page import=%的用法
  • (二十一)devops持续集成开发——使用jenkins的Docker Pipeline插件完成docker项目的pipeline流水线发布
  • (附源码)计算机毕业设计SSM疫情下的学生出入管理系统
  • (六)什么是Vite——热更新时vite、webpack做了什么
  • (续)使用Django搭建一个完整的项目(Centos7+Nginx)
  • ***详解账号泄露:全球约1亿用户已泄露
  • *Algs4-1.5.25随机网格的倍率测试-(未读懂题)
  • .net core 6 集成和使用 mongodb
  • .NET DataGridView数据绑定说明
  • .net oracle 连接超时_Mysql连接数据库异常汇总【必收藏】
  • .NET Project Open Day(2011.11.13)
  • .NetCore 如何动态路由
  • .sh文件怎么运行_创建优化的Go镜像文件以及踩过的坑
  • [ C++ ] STL_vector -- 迭代器失效问题
  • [ CTF ] WriteUp- 2022年第三届“网鼎杯”网络安全大赛(朱雀组)
  • [Android]Android P(9) WIFI学习笔记 - 扫描 (1)
  • [Android]常见的数据传递方式
  • [AutoSar]BSW_Com07 CAN报文接收流程的函数调用
  • [BUG]Datax写入数据到psql报不能序列化特殊字符
  • [BUUCTF NewStarCTF 2023 公开赛道] week3 crypto/pwn