当前位置: 首页 > news >正文

创建Cloudhbase维表

创建 Cloudhbase 维表

维表的 Query 语法详见: 维表 JOIN 文档

示例

 
  
  1. CREATE TABLE hbase (
  2. `key` varchar,
  3. `name` varchar,
  4. PRIMARY KEY (`key`), -- hbase 中的 row key 字段
  5. PERIOD FOR SYSTEM_TIME --维表标识。
  6. ) with (
  7. TYPE = 'cloudhbase',
  8. zkQuorum = 'xxx',
  9. columnFamily = 'xxx',
  10. tableName = 'dim_seo'
  11. );

注意:声明维表时,必须要指名主键。维表JOIN的时候,ON的条件必须包含所有主键的等值条件。Cloudhbase中的主键即rowkey。

WITH参数

参数注释说明备注
zkQuorumCloudhbase集群配置的zk地址,是以(,)分隔的主机列表。可以在hbase-site.xml文件中找到hbase.zookeeper.quorum相关配置。
zkNodeParent集群配置在zk上的路径可以在hbase-site.xml文件中找到hbase.zookeeper.quorum相关配置。
tableNamehbase 表名
columnFamily列族名目前只支持插入同一列族。
userName用户名
password密码无 
maxRetryTimes最大尝试次数默认10次
partitionedJoin设置为true之后会在用joinKey做partition,将数据分发到join节点,提高缓存命中率可选,默认关闭
shuffleEmptyKey设置为true之后遇到空key会随机往下游做shuffle,否则往0号下游发建议打开

Cache 参数

参数注释说明备注
cache缓存策略默认 None, 可选 LRUALL
cacheSize缓存大小当选择 LRU 缓存策略后,可以设置缓存大小,默认 10000 行。
cacheTTLMs缓存超时时间,单位毫秒。当选择 LRU 缓存策略后,可以设置缓存失效的超时时间,默认不过期。当选择 ALL 策略,则为缓存reload 的间隔时间,默认不重新加载。
cacheReloadTimeBlackList ALL Cache 时启用,更新时间黑名单,防止在此时间内做cache 更新(如双11场景)。可选,默认空,格式为2017-10-24 14:00 -> 2017-10-24 15:00, 2017-11-10 23:30 -> 2017-11-11 08:00。用逗号(,)来分隔多个黑名单,用箭头(->)来分割黑名单的起始结束时间。
cacheScanLimit ALL Cache 时启用,load全量HBase数据,服务端一次RPC返回给客户端的行数。可选,默认100条

目前RDS/DRDS提供如下三种缓存策略。

  • None:无缓存。
  • LRU:最近使用策略缓存。需要配置相关参数:缓存大小(cacheSize)和 缓存超时时间(cacheTTLMs)。
  • ALL:全量缓存策略。在Job运行前会将远程表中所有数据load到内存中,之后所有的维表查询都会通过 cache进行。cache命中不到则不存在,并在缓存过期后重新加载一遍全量缓存。全量缓存策略适合远程表数据量小、miss key多的场景。全量缓存相关配置:缓存更新间隔(cacheTTLMs),更新时间黑名单(cacheReloadTimeBlackList)。

    注意:因为会异步reload,使用cache all的时候,需要将维表JOIN的节点增加一些内存,增加的内存大小为远程表两倍的数据量。

本文转自实时计算——创建Cloudhbase维表

相关文章:

  • 新项目流程--安装yii框架
  • 我写的Angular相关的文章
  • 给Python新人练手准备的两个简单案例
  • js中的 substr方法与substring方法 不同
  • 程序猿生存指南-13 再见老潘
  • 小程序获取unionId以及手机号
  • 一道小编程题(自用)
  • eclipse中类和方法添加作者日期说明
  • Mongodb网页图形化管理工具,基于Spring Boot2.0,前端采用layerUI实现
  • 【小坑】awvs安装出现:database service cannot be started错误
  • 离散傅里叶级数的最高频率和频率分辨率
  • React 折腾记 - (7) 基于React+Antd封装聊天记录(用到React的memo,lazy, Suspense这些)
  • linux配置 数据库主从同步
  • 二进制生成最小子集
  • Python实现BT种子转化为磁力链接【实战】
  • 2018天猫双11|这就是阿里云!不止有新技术,更有温暖的社会力量
  • CAP理论的例子讲解
  • css属性的继承、初识值、计算值、当前值、应用值
  • es6要点
  • export和import的用法总结
  • js写一个简单的选项卡
  • MySQL-事务管理(基础)
  • React的组件模式
  • Redis的resp协议
  • Spring Boot MyBatis配置多种数据库
  • vue2.0项目引入element-ui
  • 机器学习学习笔记一
  • 将 Measurements 和 Units 应用到物理学
  • 聊聊redis的数据结构的应用
  • 适配mpvue平台的的微信小程序日历组件mpvue-calendar
  • 中文输入法与React文本输入框的问题与解决方案
  • 长三角G60科创走廊智能驾驶产业联盟揭牌成立,近80家企业助力智能驾驶行业发展 ...
  • 关于Android全面屏虚拟导航栏的适配总结
  • 专访Pony.ai 楼天城:自动驾驶已经走过了“从0到1”,“规模”是行业的分水岭| 自动驾驶这十年 ...
  • #单片机(TB6600驱动42步进电机)
  • (¥1011)-(一千零一拾一元整)输出
  • (01)ORB-SLAM2源码无死角解析-(56) 闭环线程→计算Sim3:理论推导(1)求解s,t
  • (C语言)字符分类函数
  • (第一天)包装对象、作用域、创建对象
  • (附源码)spring boot网络空间安全实验教学示范中心网站 毕业设计 111454
  • (附源码)springboot 房产中介系统 毕业设计 312341
  • (一)spring cloud微服务分布式云架构 - Spring Cloud简介
  • (转)MVC3 类型“System.Web.Mvc.ModelClientValidationRule”同时存在
  • .NET delegate 委托 、 Event 事件
  • .net on S60 ---- Net60 1.1发布 支持VS2008以及新的特性
  • .NET 编写一个可以异步等待循环中任何一个部分的 Awaiter
  • .NET 依赖注入和配置系统
  • .net 中viewstate的原理和使用
  • .Net8 Blazor 尝鲜
  • .NET分布式缓存Memcached从入门到实战
  • .NET简谈设计模式之(单件模式)
  • .NET开源快速、强大、免费的电子表格组件
  • .NET值类型变量“活”在哪?
  • .vimrc php,修改home目录下的.vimrc文件,vim配置php高亮显示
  • :“Failed to access IIS metabase”解决方法