当前位置: 首页 > news >正文

使用MaxCompute搭建社交好友推荐系统

关于使用MaxCompute的详细内容:

Apsara Clouder大数据专项技能认证:使用MaxCompute搭建社交好友推荐系统

Apsara Clouder大数据专项技能认证:使用MaxCompute搭建社交好友推荐系统

本认证可以帮助学员了解如何使用阿里云大数据计算服务快速搭建企业级的社交好友推荐系统,掌握使用云端相关大数据服务进行开发和测试的能力。

大数据计算服务(MaxCompute,原名 ODPS)是一种快速、完全托管的 GB/TB/PB 级数据仓库解决方案。MaxCompute 为您提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决海量数据计算问题,有效降低企业成本,并保障数据安全。

同时,DataWorks 和 MaxCompute 关系紧密,DataWorks 为 MaxCompute 提供了一站式的数据同步,任务开发,数据工作流开发,数据管理和数据运维等功能,详情请参见 DataWorks(原大数据开发套件)。

MaxCompute 主要服务于批量结构化数据的存储和计算,可以提供海量数据仓库的解决方案以及针对大数据的分析建模服务。随着社会数据收集手段的不断丰富及完善,越来越多的行业数据被积累下来。数据规模已经增长到了传统软件行业无法承载的海量数据(百 GB、TB 乃至 PB)级别。

在分析海量数据场景下,由于单台服务器的处理能力限制,数据分析者通常采用分布式计算模式。但分布式的计算模型对数据分析人员提出了较高的要求,且不易维护。使用分布式模型,数据分析人员不仅需要了解业务需求,同时还需要熟悉底层计算模型。MaxCompute 的目的是为您提供一种便捷的分析处理海量数据的手段,您可以不必关心分布式计算细节,便可达到分析大数据的目的。

MaxCompute 已经在阿里巴巴集团内部得到大规模应用,例如:大型互联网企业的数据仓库和 BI 分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。 产品优势

大规模计算存储

MaxCompute 适用于 100GB 以上规模的存储及计算需求,最大可达 EB 级别。

多种计算模型

MaxCompute 支持 SQL、MapReduce、Graph 等计算类型及 MPI 迭代类算法。

强数据安全

MaxCompute 已稳定支撑阿里全部离线分析业务7年以上,提供多层沙箱防护及监控。

低成本

与企业自建私有云相比,MaxCompute 的计算存储更高效,可以降低 20%-30% 的采购成本。

功能概述

数据通道

支持批量、历史数据通道 TUNNEL 是 MaxCompute 为您提供的数据传输服务,提供高并发的离线数据上传下载服务。支持每天 TB/PB 级别的数据导入导出,特别适合于全量数据或历史数据的批量导入。Tunnel 提供 Java 编程接口供您使用,并且在 MaxCompute 的客户端工具中,有对应的命令实现本地文件与服务数据的互通。

实时、增量数据通道 针对实时数据上传的场景,MaxCompute 提供了延迟低、使用方便的 DataHub 服务,特别适用于增量数据的导入。DataHub 还支持多种数据传输插件,例如:Logstash、Flume、Fluentd、Sqoop 等,同时支持日志服务 Log Service 中的 日志数据一键投递至 MaxCompute,进而使用 DataWorks 进行日志分析和挖掘。

阿里云大学官网(阿里云大学 - 官方网站,云生态下的创新人才工场)

相关文章:

  • C 标准库 - stdio.h
  • [LeetCode] Verify Preorder Sequence in Binary Search Tree 验证二叉搜索树的先序序列
  • linux学习笔记四
  • 如何优雅地为Struts2的action加监控日志
  • Oracle12C_____处理数据库01033连接错误问题.sql
  • Mac 10.12安装远程桌面工具TeamViewer
  • NGUI_Toggle
  • dubbo源码—dubbo简介
  • 浏览器缓存机制分析
  • centos7部署redis
  • Code First开发系列之领域建模和管理实体关系
  • ImageMagick 打水印支持透明度设置
  • 吴颖二:12.19 年关将在翻仓已“迫不及待”你准备好了吗
  • 第二天个人总结
  • SQL Server复制入门(一)----复制简介
  • CentOS学习笔记 - 12. Nginx搭建Centos7.5远程repo
  • IE报vuex requires a Promise polyfill in this browser问题解决
  • JavaScript 一些 DOM 的知识点
  • Java深入 - 深入理解Java集合
  • js如何打印object对象
  • Python - 闭包Closure
  • Python3爬取英雄联盟英雄皮肤大图
  • Python学习笔记 字符串拼接
  • REST架构的思考
  • 表单中readonly的input等标签,禁止光标进入(focus)的几种方式
  • 产品三维模型在线预览
  • 从重复到重用
  • 得到一个数组中任意X个元素的所有组合 即C(n,m)
  • 等保2.0 | 几维安全发布等保检测、等保加固专版 加速企业等保合规
  • 蓝海存储开关机注意事项总结
  • 入门级的git使用指北
  • 它承受着该等级不该有的简单, leetcode 564 寻找最近的回文数
  • 一个6年java程序员的工作感悟,写给还在迷茫的你
  • Nginx实现动静分离
  • 国内唯一,阿里云入选全球区块链云服务报告,领先AWS、Google ...
  • 交换综合实验一
  • #Linux(权限管理)
  • #我与Java虚拟机的故事#连载09:面试大厂逃不过的JVM
  • $.ajax()参数及用法
  • (C#)if (this == null)?你在逗我,this 怎么可能为 null!用 IL 编译和反编译看穿一切
  • (C语言)逆序输出字符串
  • (function(){})()的分步解析
  • (LeetCode C++)盛最多水的容器
  • (八)Docker网络跨主机通讯vxlan和vlan
  • (八)光盘的挂载与解挂、挂载CentOS镜像、rpm安装软件详细学习笔记
  • (附源码)springboot家庭财务分析系统 毕业设计641323
  • (附源码)计算机毕业设计ssm本地美食推荐平台
  • (附源码)计算机毕业设计ssm电影分享网站
  • *Algs4-1.5.25随机网格的倍率测试-(未读懂题)
  • .[backups@airmail.cc].faust勒索病毒的最新威胁:如何恢复您的数据?
  • .htaccess配置重写url引擎
  • .NET Core WebAPI中使用Log4net 日志级别分类并记录到数据库
  • .NET 应用架构指导 V2 学习笔记(一) 软件架构的关键原则
  • .NET成年了,然后呢?
  • .NET学习教程二——.net基础定义+VS常用设置