当前位置：首页 > news >正文

【研究任务】热迁移方式——pre-copy、post-copy和x-multifd

news 来源：原创 2024/5/6 2:39:13

Postcopy

先把虚拟机现有的CPU state, registers and, optionally, non-pageable memory（内存中不会进行交换或者移动的内存）等信息传输到目的服务器，不管dirty page，并迅速把虚拟机在目的服务器启动起来。同时，源服务器也会动态的把剩余的memory推送到目的服务器上。但是当虚拟机运行调用到还没传输过来的memory时，会触发page-fault.

postcopy基于userfault机制，可以在用户空间中通过文件描述符fd获得page fault信息。当虚拟机在目的服务器上调用到这些还未传输完成的内存时，userfaultfd可以到源服务器上把这些内存信息取出，并传输到目的服务器上，让虚拟机继续运行。

图片.png

使用postcopy不会受虚机对内存io的压力影响，但迁移完成后如果内存io压力大，会频繁调用userfault，这就会对服务器带宽带来压力，造成虚机性能下降。

x-multifd

x-multifd就是使用多个fd来传输文件

x-multifd-channels：在迁移时，使用多少个channels进行并行传输，也是用于迁移的sockets的数量，默认为2.

x-multifd-page-count：会将多少张pages一并发给一个thread，默认值为16.

Pre-copy

预拷贝内存（Pre-copy）通过一个循环，将内存数据发送至目的主机VM，循环第一轮发送所有内存数据，接下来每一轮发送上一轮预拷贝过程中的脏页。最后一轮是停机拷贝阶段，源主机被挂起，停止内存更新，将脏页整体拷贝到目的主机vm上。

对于更新速度非常快的内存部分，每次循环过程都会变脏，需要重复 pre-copy，同时也导致循环次数非常多，迁移的时间变长。针对这种情况，KVM 虚拟机建立了三个原则：集中原则，一个循环内的 dirty pages 小于等于 50；不扩散原则，一个循环内传输的 dirty pages 少于新产生的；有限循环原则，循环次数必须少于 30。在实现上，就是采取了以下措施：

有限循环：循环次数和效果受到控制，对每轮 pre-copy 的效果进行计算，若 pre-copy 对于减少不一致内存数量的效果不显著，或者循环次数超过了上限，循环将中止，进入停机拷贝阶段。
在被迁移 VM 的内核设置一个内存访问的监控模块。在内存 pre-copy 过程中，VM 的一个进程在一个被调度运行的期间，被限制最多执行 40 次内存写操作。这个措施直接限制了 pre-copy 过程中内存变脏的速度，其代价是对 VM 上的进程运行进行了一定的限制。

KVM 的预拷贝在线迁移过程详解：

系统验证目标服务器的存储器和网络设置是否正确，并预保留目标服务器虚拟机的资源。

1. 源服务器和目标服务器简图

图片.png

当虚拟机还在源服务器上运转时，第一个循环内将全部内存镜像复制到目标服务器上。在这个过程中，KVM 依然会监视内存的任何变化。

2. 内存镜像复制示意图

图片.png

以后的循环中，检查上一个循环中内存是否发生了变化。假如发生了变化，那么 VMM 会将发生变化的内存页即 dirty pages 重新复制到目标服务器中，并覆盖掉先前的内存页。在这个阶段，VMM 依然会继续监视内存的变化情况。

3. 进行有变化的内存复制

图片.png

VMM 会持续这样的内存复制循环。随着循环次数的增加，所需要复制的 dirty pages 就会明显减少，而复制所耗费的时间就会逐渐变短，那么内存就有可能没有足够的时间发生变化。最后，当源服务器与目标服务器之间的差异达到一定标准时，内存复制操作才会结束，同时暂停源系统。

4. 所需复制的数据在减少

图片.png

在源系统和目标系统都停机的情况下，将最后一个循环的 dirty-pages 和源系统设备的工作状态复制到目标服务器。

5. 状态信息的复制

图片.png

然后，将存储从源系统上解锁，并锁定在目标系统上。启动目标服务器，并与存储资源和网络资源相连接。

6. 停止源服务器，启动目标服务器

图片.png

转载于:https://blog.51cto.com/12814931/2158857

相关文章：

创建用于自定义SharePoint解决方案部署的Visual Studio项目

JavaScript中的对象个人分享

Python数据结构

Discuz!X3.1 全新安装图文教程

关于Solr的使用总结的心得体会

paip.语义分析--单字词形容词表180个

vue格式化快捷键设置

jQuery学习——克隆

IBM WebSphere MQ介绍安装以及配置服务详解

思维导图—你不知道的JavaScript中卷

C# 类相同属性赋值

MVC验证

UVa10305 拓扑排序

专科程序员与本科程序员之间有什么区别？

HTTP协议

Django 博客开发教程 8 - 博客文章详情页

JS正则表达式精简教程（JavaScript RegExp 对象）

js作用域和this的理解

Laravel 中的一个后期静态绑定

LeetCode算法系列_0891_子序列宽度之和

mac修复ab及siege安装

Quartz实现数据同步 | 从0开始构建SpringCloud微服务(3)

Twitter赢在开放，三年创造奇迹

vue 配置sass、scss全局变量

vue-router的history模式发布配置

vue中实现单选

爱情北京女病人

对话：中国为什么有前途/ 写给中国的经济学

猴子数据域名防封接口降低小说被封的风险

软件开发学习的5大技巧，你知道吗？

使用权重正则化较少模型过拟合

事件委托的小应用

适配mpvue平台的的微信小程序日历组件mpvue-calendar

手写一个CommonJS打包工具（一）

Semaphore

如何用纯 CSS 创作一个货车 loader

【已解决】npm install卡主不动的情况

Base64转换成图片,android studio build乱码,找不到okio.ByteString接腾讯人脸识别

VRRP 虚拟路由冗余协议（华为）

卜东波研究员：高观点下的少儿计算思维

二进制运算符：（与运算）、|（或运算）、~（取反运算）、^（异或运算）、位移运算符

决定德拉瓦州地区版图的关键历史事件

软考-高级-信息系统项目管理师教程第四版【第23章-组织通用管理-思维导图】

#### go map 底层结构 ####

#include

%@ page import=%的用法

(done) NLP “bag-of-words“ 方法（带有二元分类和多元分类两个例子）词袋模型、BoW

(poj1.2.1)1970(筛选法模拟)

（八）Docker网络跨主机通讯vxlan和vlan

（非本人原创）史记·柴静列传(r4笔记第65天)

（介绍与使用）物联网NodeMCUESP8266（ESP-12F）连接新版onenet mqtt协议实现上传数据（温湿度）和下发指令（控制LED灯）

（经验分享）作为一名普通本科计算机专业学生，我大学四年到底走了多少弯路

（深度全面解析）ChatGPT的重大更新给创业者带来了哪些红利机会

（算法）Travel Information Center

(一)为什么要选择C++