当前位置: 首页 > news >正文

ZStack--级联框架

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

 

云中的资源相互都有关系。操作一个资源通常会引发连锁反应;例如,当删除一个集群的时候,是非常合理地去删除属于该集群的所有主机并停止所有在这些主机上运行的虚拟机。传统的IaaS软件要么硬编码连锁反应,要么简单地禁止这些操作,例如,禁止用户删除有虚拟机运行的集群。ZStack提供一个级联框架,用以散布本来只对一个资源的操作到所有相关的资源。资源可以通过实现一个简单的扩展点以加入级联框架,使得资源的业务逻辑与框架解耦。

 

动机

云中的资源多多少少都彼此依赖;例如,一个主机是一个集群的子资源,一个主存储是一个集群的兄弟资源,L3网络是一个区域的后裔资源。资源之间的关系可以被描述为一个有向图:

http://zstack.org/images/blogs/scalability/cascade1.png

 

上图,我们展示了ZStack的主要资源;不同的IaaS软件可能使用不同的术语,上图主要是想让你有一个粗略的概念。由上图所暗示的,当对资源进行操作时,不仅仅是目标资源,相关资源也将受到影响;例如,当删除一个区域时,比较理想的是属于区域的集群、主机、主存储、L2网络等资源也同时被删除。为了处理这个问题,IaaS软件必须满足级联(cascading)操作的需求。

 

问题

大多数IaaS软件很少考虑级联操作。它们要么硬编码业务逻辑,例如,你需要显式删除一个将要被删除帐户的所有资源;要么直接不允许这种操作,例如,当你试图删除一个IP地址范围时,抛出一个错误信息“仍有VM使用在这个IP范围中的IP”。这两种方法都会带来很多麻烦。对硬编码而言,它使软件不能灵活的添加新的资源,因为你必须修改现有的代码来添加级联操作,例如,修改删除帐户的代码使得账户删除时,新资源也被删除。对于完全没有责任感的错误信息,用户要么去做无聊的工作,例如,在删除一个IP范围之前,手动删除100个虚拟机;要么摧毁现有的一切,然后从零开始,例如,重新部署整个云。

避免误操作不是借口:有些人可能会声称不允许级联删除是慎重考虑的结果,因为用户可能会误操作,误操作可能带来灾难性的后果;例如,错误地删除区域会导致损失掉所有虚拟机。然而,这种说法只是一个错误的借口,并且是一种为用户做决定的自作聪明。你能想象吗,当你为了删除一个区域必须手动删除10,000个虚拟机,因为软件认为你可能会做错事,所以迫使你枯燥的重复10,000次任务确认?一个好的软件应该为用户提供选择,并让他们做出决定。在我们的例子中,IaaS软件应该在进行到最后删除之前警告用户,还有10,000台虚拟机在运行;但一旦用户承认他们需要这么做,软件就应该这么做。

 

级联框架

ZStack通过一个级联框架解决这一问题;顾名思义,级联框架允许一个操作能从一个资源级联到其他资源。为了解耦整个架构,这个级联框架被作为一个单独的组件创造出来,资源可以按意愿加入框架。要加入框架,资源所需要做的全部事情就是实现一个扩展点CascadeExtensionPoint(在我们的例子中AbstractAsyncCascadeExtension是一个实现CascadeExtensionPoint的类):

class VmCascadeExtension extends AbstractAsyncCascadeExtension {

    @Override

    public void asyncCascade(CascadeAction action, Completion completion) {

        if (/* this is from deleting Primary Storage*/) {

            /* delete VMs that have root volumes on the primary storage*/

        } else if (/*this is from deleting L3 Network*/) {

            /* stop VMs that have nics on the L3 network, and remove those nics */

        } else if (/* this is from deleting IP range*/) {

            /* stop VMs that have nics whose IP is in the IP range */

        } else if (/* this is from deleting host*/) {

            /* stop VMs that run on the host */

        }

 

        completion.success();

    }

 

    @Override

    public List<String> getEdgeNames() {

        return Arrays.asList(

                PrimaryStorageVO.class.getSimpleName(),

                L3NetworkVO.class.getSimpleName(),

                IpRangeVO.class.getSimpleName(),

                HostVO.class.getSimpleName()

        );

    }

 

    @Override

    public String getCascadeResourceName() {

        return VmInstanceVO.class.getSimpleName();

    }

 

    @Override

    public CascadeAction createActionForChildResource(CascadeAction action) {

        return convertContextToVmRelatedContext(action);

    }

}

getCascadeResourceName()方法返回该资源的名称(VmInstance);getEdgeNames()方法返回一个和资源直接关联的资源名列表,在我们的例子中返回主存储、L3网络、IpRange和主机;所以如果删除操作在这些edge resources或其上游资源(如区域)上发生时,该操作将被级联至在getEdgeNames()方法中声明了这些资源的扩展。级联扩展可以在asyncCascade() 中采取行动,并获取必须的信息比如操作码(如删除),根发起者(如区域,下文将很快给出解释),作为操作来源的父发起者(如主机,将很快给出解释)和操作上下文(例如,哪台主机正在被删除)。由于资源的关系是一个可能有环路的有向图,级联框架将把图压扁成一棵树,并把环路变为分支。例如,删除区域的操作将最终创建以下树(一部分):

 

http://zstack.org/images/blogs/scalability/cascade2.png

注:如你所见,删除区域操作将多次级联到虚拟机的级联扩展;这是刻意的,因为级联扩展通常依赖于父发起者去决定该采取什么行动;在这个例子中,虚拟机的父发起者为主存储、主机、L3网络和IP范围;然而,对于不同的父发起者,扩展可能会采取不同的行动;例如,如果父发起者为主存储并且操作码为delete,该扩展将摧毁所有根云盘在该主存储的虚拟机;但如果父发起者是主机,扩展将会只停止在那台主机上的虚拟机,因为这些虚拟机稍后就可以在其他主机上启动。考虑到ZStack没有产生冲突的级联操作,例如,不会有一个操作导致虚拟机在路径A启动而在路径B停止,所以级联操作从不同路径进行多次延伸是没有问题的。

当级联一个操作时,该框架从该操作被应用的root issuer开始;在上述删除区域的示例中,zone是根发起者;那么框架将从根发起者遍历树,并调用扩展的createActionForChildResource()方法为每一条路径上的每一个扩展创建上下文;一旦所有上下文创建成功,该框架将再次遍历树,不过是从叶子节点到根,并调用每个扩展的asyncCascade()方法;一个扩展可以依靠父发起者去决定应该做哪些操作,父发起者在getEdgeNames()方法中以资源名的方式声明;例如,如果父发行者是主机,则停止虚拟机;如果父发行者是主存储,则删除虚拟机。

http://zstack.org/images/blogs/scalability/cascade3.png

这两个阶段的遍历保证,一个操作(例如删除)将只会被应用到根发起者,在所有下游资源都做完一些合适的操作后。例如,一个区域只在所有子孙资源都被删除后才能被删除。

由于并不是所有的操作都需要级联,一个资源可以在它需要的时候直接调用CascadeFacade.asyncCascade()

 

总结

在这篇文章中,我们演示了ZStack的级联框架,这是一个强大的工具,用于扩散操作而不需要硬编码。ZStack用很多方式使用了它,除了我们在文中提到的以外,一些操作,如卸载主存储(这将停止将被卸载的集群中的所有虚拟机),卸载L2网络(这将停止将被卸载的集群中的所有虚拟机)都是以这种方式实现的。有了它的帮助,管理员可以快速尝试不同的云部署而无需担心不方便;你可以只删除你的部署的一部分并重新创建一个新的,而不需要仅因为你在一个设计错误的L2网络上创建了许多虚拟机,就重新部署整个云(举个例子)。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

转载于:https://my.oschina.net/u/2448318/blog/3004927

相关文章:

  • 关于安卓通过webservice访问数据库问题
  • 从上万监控到实时示警 浙江绍兴餐饮迎智能“食代”
  • win8.1 virtualbox 安装centos7注意事项
  • Java虚拟机在执行程序时内存划分的区域都有哪些?
  • 常见MQTT服务器搭建与试用
  • glutBitmapCharacter及glBitmap在ATI显卡下无法正常显示的原因初探
  • 俄罗斯“光影魔术”展亮相上海科技馆
  • AsyncTasLoader不进行加载操作的原因及解决方法
  • 一文详解Python字符串条件判断方法
  • 前端 CSS 规范
  • SpringBoot 实战 (三) | 配置文件详解
  • 搜索分词---产生新词的公式
  • ORA-22813 ORA-06512
  • MySQL 服务启动y异常: 本地无法启动MySQL服务,报的错误:1067,进程意外终止---解决...
  • Swift—UITextField的基本用法
  • [iOS]Core Data浅析一 -- 启用Core Data
  • [译]CSS 居中(Center)方法大合集
  • ES6--对象的扩展
  • JAVA并发编程--1.基础概念
  • nfs客户端进程变D,延伸linux的lock
  • overflow: hidden IE7无效
  • PHP面试之三:MySQL数据库
  • TCP拥塞控制
  • ⭐ Unity 开发bug —— 打包后shader失效或者bug (我这里用Shader做两张图片的合并发现了问题)
  • 关于字符编码你应该知道的事情
  • 计算机在识别图像时“看到”了什么?
  • 马上搞懂 GeoJSON
  • 融云开发漫谈:你是否了解Go语言并发编程的第一要义?
  • 入手阿里云新服务器的部署NODE
  • 使用common-codec进行md5加密
  • 移动端 h5开发相关内容总结(三)
  • 策略 : 一文教你成为人工智能(AI)领域专家
  • 回归生活:清理微信公众号
  • ​第20课 在Android Native开发中加入新的C++类
  • #ifdef 的技巧用法
  • #经典论文 异质山坡的物理模型 2 有效导水率
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • (39)STM32——FLASH闪存
  • (70min)字节暑假实习二面(已挂)
  • (C语言)深入理解指针2之野指针与传值与传址与assert断言
  • (delphi11最新学习资料) Object Pascal 学习笔记---第2章第五节(日期和时间)
  • (zz)子曾经曰过:先有司,赦小过,举贤才
  • (附源码)springboot太原学院贫困生申请管理系统 毕业设计 101517
  • (四)Controller接口控制器详解(三)
  • (心得)获取一个数二进制序列中所有的偶数位和奇数位, 分别输出二进制序列。
  • (原創) 如何優化ThinkPad X61開機速度? (NB) (ThinkPad) (X61) (OS) (Windows)
  • .bat批处理(一):@echo off
  • .gitignore文件—git忽略文件
  • .net core 3.0 linux,.NET Core 3.0 的新增功能
  • .NET Framework .NET Core与 .NET 的区别
  • .Net MVC + EF搭建学生管理系统
  • .NET 编写一个可以异步等待循环中任何一个部分的 Awaiter
  • .NET8.0 AOT 经验分享 FreeSql/FreeRedis/FreeScheduler 均已通过测试
  • .net之微信企业号开发(一) 所使用的环境与工具以及准备工作
  • .vollhavhelp-V-XXXXXXXX勒索病毒的最新威胁:如何恢复您的数据?