当前位置: 首页 > news >正文

Elasticsearch ES数据迁移方法及注意事项

Elastic数据迁移方法及注意事项

需求

ES集群Cluster_A里的数据(某个索引或某几个索引),需要迁移到另外一个ES集群Cluster_B中。

环境

Linux:Centos7 / Centos6.5/ Centos6.4
Elastic:5.2.0

总结的方法

  1. 查询并导出数据

  2. 拷贝ES物理目录/文件

  3. ES快照数据备份和恢复

迁移方法

分别进行以上方法的详细介绍:

查询并导出数据

理论

通过ES提供的查询API,写各种程序,把数据导出csv,或者把数据查询出来,直接入库到新的ES集群中。

实践

#coding=utf-8
 
import os
import sys
import pyes
 
 
index_list = [
    ["index_A", "type_A"],
    ["index_B", "type_B"],
    ["index_C", "type_C"],
]
 
 
ES_URL = "http://192.168.1.1:9200/"
NEW_ES_URL = "http://192.168.2.1:8200/"
 
def main():
    for _index, _type in index_list:
        conn = pyes.es.ES(ES_URL)
        search = pyes.query.MatchAllQuery().search(bulk_read=10000)
        hits = conn.search(search, _index, _type, scan=True, scroll="30m", model=lambda _,hit: hit)
         
        conn2 = pyes.es.ES(NEW_ES_URL)
        count = 0 
        for hit in hits:
            conn2.index(hit['_source'], _index, _type, hit['_id'], bulk=True)
            count += 1
            if count % 10000 == 0:
                print count
                conn2.flush()
        conn2.flush()
        conn2 = None
 
        conn = None
 
 
if __name__ == '__main__':
    main()

注意事项

  1. 需要安装python的pyes模块,注意pyes的版本,此处的版本为:pyes.0.20.1

  2. 用了查询ES的scroll方式,也有一种直接通过ES的DSL查询语句用分页from和size查询,但是ES的分页查询到了千万级别之后,from就会慢的出奇,甚至报错,不信的同学去尝试吧,等着功亏一篑….

  3. 客户现场的数据级别是物理存储大概在5T(一个副本),条数大概1百亿。现场使用该方法亲测之后,未解决ES迁移的问题。pyes在约到后面查询越慢,最后ES报错……

总结

  1. 百万、千万级别条数的数据,可以尝试该方法。

拷贝ES物理目录/文件

理论

ES的文件存在磁盘中,把物理文件一模一样拷贝一份到新的集群环境中,达到数据迁移的效果。

实践

1. 找到ES的存储目录,一般可以到elasticsearch.yml中找到path.data的配置
 
2. 集群下一般会有多个节点,所以ES的存储目录也就有多个
 
 
3. 一般ES的存储目录下,会存储一个集群名字一样的文件夹,需要拷贝的就是这个文件夹.
 
 
4. 环境如下:
旧集群:
集群名字:Cluster_A
分片数:6
机器A:一个节点 192.168.1.1
node0  数据存储目录:/opt/data1,/opt/data2
机器B:三个节点 192.168.1.2
node1  数据存储目录:/opt/data1,/opt/data2
node2  数据存储目录:/opt/data3,/opt/data4
node3  数据存储目录:/opt/data5,/opt/data6
 
新的集群:
集群名字:Cluster_A
分片数:6
机器A:一个节点 192.168.2.1
node0  数据存储目录:/opt/data1,/opt/data2
机器B:三个节点 192.168.2.2
node1  数据存储目录:/opt/data1,/opt/data2
node2  数据存储目录:/opt/data3,/opt/data4
node3  数据存储目录:/opt/data5,/opt/data6
 
 
5. 迁移代码如下:
新集群机器A:192.168.2.1如下操作

scp –r root@192.168.1.1:/opt/data1/Cluster_A /opt/data1/
scp –r root@192.168.1.1:/opt/data2/Cluster_A /opt/data2/

 
新集群机器B:192.168.2.2如下操作

scp –r root@192.168.1.2:/opt/data1/Cluster_A /opt/data1/
scp –r root@192.168.1.2:/opt/data2/Cluster_A /opt/data2/
scp –r root@192.168.1.2:/opt/data3/Cluster_A /opt/data3/
scp –r root@192.168.1.2:/opt/data4/Cluster_A /opt/data4/
scp –r root@192.168.1.2:/opt/data5/Cluster_A /opt/data5/
scp –r root@192.168.1.2:/opt/data6/Cluster_A /opt/data6/

ES快照数据备份和恢复

理论

使用ES官网提供的快照备份方法,将旧集群ES的索引进行备份,拷贝备份出来的所有文件,在新的集群中进行恢复。

官网写的非常简单:先创建仓库(repository),再往仓库里添加一个快照(snapshot),查看备份状态,That’s all。但是实践需要麻烦很多了。

实践

1. 旧的集群备份出来的东西,需要拷贝到新集群机器上。解决两个问题:一是旧集群没有足够的空间存储这些东西;二是反正备份出来都需要拷贝到新的集群中。此处想到一个方法,将新集群机器的目录远程Mount到旧集群机器上。
 
 
2. 挂载目录,2.1)和2.2)可以任选一种方式
 
 
3. 使用sshfs进行挂载:

// 在每台机器上安装sshfs
yum install fuse sshfs
 
// 每台机器上创建Mount共享目录
mkdir /opt/backup_es
 
// 旧集群的每台机器上挂载共享目录(分别挂载了新机器的/opt/data07目录到/opt/backup_es)
sshfs root@192.168.2.1:/opt/data07 /opt/backup_es -o allow_other
sshfs root@192.168.2.2:/opt/data07 /opt/backup_es -o allow_other
 
// 测试运行ES的用户是否有对共享目录的写权限
sudo -u elastic touch /opt/backup_es
 
// 在旧机器上将共享目录的权限付给ES的运行用户
chown elastic:elastic -R /opt/backup_es

 
2. 使用Mount nfs进行挂载:

// 在新集群的机器上(192.168.2.1, 192.168.2.2)添加共享的文件夹和客户端可以访问的IP地址
vi /etc/exports
/opt/data07 192.168.1.1(rw,no_root_squash)
/opt/data07 192.168.1.2(rw,no_root_squash)
 
// 查看共享文件夹和
exportfs -rv
 
// 重启启动新集群机器的NFS服务
services nfs restart
 
// 旧集群的每台机器上创建共享目录
mkdir /opt/backup_es
 
// 旧集群机器上进行Mount挂载
mount -t nfs 192.168.2.1:/opt/data07 /opt/backup_es
mount -t nfs 192.168.2.2:/opt/data07 /opt/backup_es
 
// 在旧机器上将共享目录的权限付给ES的运行用户
chown elastic:elastic -R /opt/backup_es

 
3. 创建ES仓库

// 创建ES仓库my_backup
http://192.168.1.1:9200/_plugin/head/的复合查询,通过PUT进行发送请求:
PUT _snapshot/my_backup 
{
    "type": "fs", 
    "settings": {
        "location": "/opt/backup_es",
        "compress": true
    }
}
 
// 查看仓库的状态
http://192.168.1.1:9200/_snapshot

 
4. 创建快照备份

// 针对具体的index创建快照备份(可以指定1个快照1个索引,或1个快照多个索引)
// 后面会依据快照的名称来进行恢复
http://192.168.1.1:9200/
PUT _snapshot/my_backup/snapshot_name_A
{
    "indices": "index_A, index_B"
}

成功之后,备份已经异步开始了。
 
 
5. 查看备份的状态

// 查看备份状态
http://192.168.1.1:9200/_snapshot/my_backup/snapshot_name_A/_status

细心的同学会看到ES会同时进行几个分片的备份,而且显示备份的数据情况。
有心的同学会看到,旧集群上共享的两个目录/opt/backup_es会均分备份出来的数据。这一点ES还是比较强大的,赞一个。应该还可以指定多个目录(作者没有试过,但是应该也是OK的,这样就可以挂载多个目录,解决磁盘空间不足的问题了)
 
 
6. 最后,就是等,直至所有的的备份都完成。
备份完成后,查看旧集群每台机器的/opt/backup_es目录,查看备份出的东东。
取消挂载
 
 
7. 在新集群中恢复

// 在新集群每台机器上将共享目录的权限付给ES的运行用户
chown elastic:elastic -R /opt/data07
 
// 停止ES,设置elasticsearch.yml的参数
    path.repo: /opt/data07
 
// 启动ES,在新集群创建仓库
http://192.168.2.1:9200/_plugin/head/的复合查询,通过PUT进行发送请求:
PUT _snapshot/my_backup 
{
    "type": "fs", 
    "settings": {
        "location": "/opt/data07",
        "compress": true
    }
}

 
8. 在新集群中恢复数据

// 使用RESTful API进行备份的恢复
http://192.168.1.1:9200/
POST
_snapshot/my_backup/snapshot_name_A/_restore
 
// 查看恢复的状态
http://192.168.1.1:9200/
GET
_snapshot/my_backup/snapshot_name_A/_status

 
9. 等,直至恢复完成。

注意事项

  1. 索引很大,需要有足够的空间存储备份出来的数据,挂载磁盘和设置path.repo来解决该问题。

  2. 在简历仓库的时候,会报错,找不到快照目录/opt/backup_es
    需要在elasticsearch.yml中设置path.repo: /opt/backup_es

  3. 挂载的磁盘需要赋权限,让ES的用户能读写。Sshfs的时候加上 -oallow_other;Mount的时候需要对目录进行赋权限chown

  4. Mount nfs的时候需要注意配置:vi /etc/exports

    /opt/data07192.168.1.1(rw,no_root_squash)
    /opt/data07192.168.1.2(rw,no_root_squash)

  5. 新集群中如果有索引和备份出来的索引有冲突(索引已存在),恢复不成功。
    解决:可以将旧的索引重命名,然后导入新集群中。导入成功后,将两个索引建立一个别名。

  6. 恢复期间,整个集群会变成红色(集群不可用),最好半夜的时候进行。

相关文章:

  • OPENSQL 2022.9.1
  • Redis集群研究和实践(基于redis 3.2.5)(一)
  • 初等数论总结
  • React(9)-组件引用传递(高级应用)
  • Flink在Window上的开发环境搭建
  • elasticsearch ES新增字段并赋初始值
  • DOM--预加载和懒加载
  • HCIA网络课程第七周作业
  • Nacos2.1.1 github下载zip太慢解决方法及资源分享
  • 集群外Prometheus 集群 k8s
  • 《Python编程:从入门到实战》学习笔记 第4章 操作列表
  • Linux当中如何隐藏和查看进程
  • 【C++ Primer Plus】第6章 分支语句和逻辑运算符
  • 案例分享 | 建筑师灵活用工平台产品规划设计
  • 基于springboot+vue的大学生交友活动管理网站 elementui
  • 【comparator, comparable】小总结
  • CSS 提示工具(Tooltip)
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • Docker容器管理
  • javascript数组去重/查找/插入/删除
  • js学习笔记
  • Netty源码解析1-Buffer
  • Python利用正则抓取网页内容保存到本地
  • React-Native - 收藏集 - 掘金
  • ⭐ Unity 开发bug —— 打包后shader失效或者bug (我这里用Shader做两张图片的合并发现了问题)
  • 大快搜索数据爬虫技术实例安装教学篇
  • 解决iview多表头动态更改列元素发生的错误
  • 马上搞懂 GeoJSON
  • 世界上最简单的无等待算法(getAndIncrement)
  • 问题之ssh中Host key verification failed的解决
  • 优秀架构师必须掌握的架构思维
  • # 数据结构
  • $NOIp2018$劝退记
  • (1)Nginx简介和安装教程
  • (BFS)hdoj2377-Bus Pass
  • (JS基础)String 类型
  • (ZT)出版业改革:该死的死,该生的生
  • (ZT)薛涌:谈贫说富
  • (亲测成功)在centos7.5上安装kvm,通过VNC远程连接并创建多台ubuntu虚拟机(ubuntu server版本)...
  • (十五)使用Nexus创建Maven私服
  • .htaccess 强制https 单独排除某个目录
  • .NET 3.0 Framework已经被添加到WindowUpdate
  • .Net 4.0并行库实用性演练
  • .NET Core MongoDB数据仓储和工作单元模式封装
  • .net 托管代码与非托管代码
  • .Net7 环境安装配置
  • .NetCore Flurl.Http 升级到4.0后 https 无法建立SSL连接
  • .net反编译的九款神器
  • @SentinelResource详解
  • [2016.7.test1] T2 偷天换日 [codevs 1163 访问艺术馆(类似)]
  • [C#]C# OpenVINO部署yolov8图像分类模型
  • [delphi]保证程序只运行一个实例
  • [Flutter]WindowsPlatform上运行遇到的问题总结
  • [IT生活推荐]大家一起来玩游戏喽,来的都进!
  • [LeetCode] 148. Sort List 链表排序