当前位置: 首页 > news >正文

Alluxio Enterprise AI on K8s FIO 测试教程

Alluxio Enterprise AI on K8s FIO 测试视频教程

视频为Alluxio Enterprise AI on K8s FIO测试视频教程。fio是业内常用的磁盘与文件系统性能测试工具,下面内容将通过文字方式介绍Alluxio on k8s 进行fio测试的教程。

1. 测试环境

  • 虚拟机规格:ecs.g3i.16xlarge,包含 64 vCPU、256GB 内存、140GB 磁盘(极速型 SSD FlexPL)。带宽等详细数据见实例规格。
  • Alluxio 版本:3.2-5.2.1
  • Alluxio Operator 版本:1.3.0

2. 测试环境准备

确保已经在云端kubernetes集群上搭建了Alluxio集群,集群中已启动以下pod,集群部署和启动方式详见《Alluxio on K8s部署教程》

  • 1 个 Coordinator pod

  • 2 个 Worker pod

  • 1 个 FUSE pod

    • 在业务pod启动时被自动拉起,和业务pod被分配在同一个node
  • 1 个业务pod

    • 启动方式:见FUSE-based POSIX API,下文也有启动yaml文件示例。启动视频教程见《Alluxio on K8s 部署教程》视频11分30秒处

2.1 集群配置

下面是alluxio集群的yaml文件配置内容。

注意1:etcd需要配置storageClass字段。不同云厂商的容器服务提供不同的storage class类型。如何配置,详见《Alluxio on K8s 部署教程》和Alluxio on K8s FAQ。如果不清楚当前云厂商容器服务的storage class类型,请执行kubectl get sc查看。如果您只是进行部署验证,同时当前没有方便的 storage class 供集群使用,您可以关闭 etcd 的 persistence 配置,如下。注意该配置无法适用于生产,仅供验证测试使用。

etcd:persistence:enabled: false

注意2:集群的默认配置会部署1个 coordinator、2 个 worker、1 套 3 节点 etcd,同时启动 pvc 的 pod 过程中会自动创建 fuse 相关 pod,请谨慎配置这些相关 pod 的 request 资源,以免相应 pod 无法调度成功。

apiVersion: k8s-operator.alluxio.com/v1
kind: AlluxioCluster
metadata:name: alluxio
spec:image: k8s-alluxio-cn-beijing.cr.volces.com/alluxio-test/alluxio-enterpriseimageTag: AI-3.2-5.2.1user: 0group: 0worker:count: 2resources:limits:cpu: "16"memory: "32Gi"requests:cpu: "0"memory: "512Mi"jvmOptions:- "-Xmx16g"- "-Xms16g"- "-XX:MaxDirectMemorySize=12g"fuse:type: csiresources:requests:cpu: "0"memory: "2Gi"limits:cpu: "32"memory: "16Gi"jvmOptions:- "-Xms24g"- "-Xmx24g"- "-XX:MaxDirectMemorySize=16g"etcd:enabled: truereplicaCount: 1persistence:storageClass: ebs-ssdsize: 30Giimage:registry: k8s-alluxio-cn-beijing.cr.volces.comrepository: alluxio-test/etcdtag: 3.5.9-debian-11-r24volumePermissions:image:registry: k8s-alluxio-cn-beijing.cr.volces.comrepository: alluxio-test/os-shelltag: 11-debian-11-r2alluxio-monitor:enabled: trueprometheus:imageInfo:image: k8s-alluxio-cn-beijing.cr.volces.com/alluxio-test/prometheusimageTag: v2.52.0grafana:imageInfo:image: k8s-alluxio-cn-beijing.cr.volces.com/alluxio-test/grafanaimageTag: 11.1.0-ubuntupagestore:quota: 10Gi

2.2 业务pod环境配置

下面是业务pod的yaml文件配置内容。此处yaml文件的image字段可以任意指定一个镜像。如果是国内用户,确保指定的镜像可以被集群拉取到即可。

apiVersion: v1
kind: Pod
metadata:name: fuse-test-0labels:app: alluxio
spec:containers:- image: k8s-alluxio-cn-beijing.cr.volces.com/alluxio-test/grafana:11.1.0-ubuntuimagePullPolicy: IfNotPresentname: fuse-testcommand: ["/bin/sh", "-c"]args:- sleep infinityvolumeMounts:- mountPath: /dataname: alluxio-pvcmountPropagation: HostToContainersecurityContext:runAsUser: 0runAsGroup: 0volumes:- name: alluxio-pvcpersistentVolumeClaim:claimName: alluxio-alluxio-csi-fuse-pvcnodeSelector:kubernetes.io/hostname: 172.31.16.6

如果fuse pod和worker pod被分配到了同一个node,那么数据并不会通过网络传输,会导致测试结果不准确。为了保证fuse pod与worker pod分配在不同的node,请使用最后两行来指定一个node,在其上分配fuse pod和业务pod。此处填入的值为kubectl get node看到的node name。此处为将该pod分配到名为172.31.16.6的node。

在业务pod上进行 fio 测试之前,需要进行以下配置:

  1. 更新并安装依赖:

    apt-get update && apt install -y libaio-dev fio openssh-server
    
  2. 启动 SSH 服务:

    service ssh start
    
  3. 配置免密登录,使业务pod可以免密登录到宿主机,便于清理 Kernel 缓存。

3. 测试流程

使用 fio 对 Alluxio 文件系统进行读操作的性能测试,具体步骤如下:

3.1 准备数据

首先,登陆进任意一个woker pod,使用 Alluxio 的 job 命令将测试数据加载到 Worker 节点上。例如,此处的测试数据为tos://tos-k8s-alluxio-test/5G,其为通过dd命令生成并上传的一个5GB大小的文件:

alluxio job load --path tos://tos-k8s-alluxio-test/5G --submit
alluxio job load --path tos://tos-k8s-alluxio-test/5G --progress

使用--submit提交数据load命令,使用--progress查看数据load进度。当--progress返回Job State: SUCCEEDED时,说明测试数据已经load完成,接下来通过alluxio-fuse的读操作都是热读。

3.2(重要)在每次测试前清理 Kernel Cache

在执行每次测试前,都需要清除 Kernel Cache,避免Linux kernel cache对测试结果的干扰。使用以下命令在宿主机上清除Kernel Cache:

sudo sh -c 'sync; echo 3 > /proc/sys/vm/drop_caches'

3.3 执行顺序热读测试

3.3.1 -bs=4K 顺序热读

使用以下命令测试 4K 顺序热读性能:

fio -iodepth=1 -rw=read -ioengine=libaio -bs=4K -numjobs=1 -group_reporting -size=5G -filename=/data/tos/5G -name=read_test --readonly -direct=1 --invalidate=1
3.3.2 -bs=256K 顺序热读

清除 Kernel Cache后,使用以下命令测试 256K 顺序热读性能:

fio -iodepth=1 -rw=read -ioengine=libaio -bs=256K -numjobs=1 -group_reporting -size=5G -filename=/data/tos/5G -name=read_test --readonly -direct=1 --invalidate=1

3.4 执行随机热读测试

3.4.1 -bs=4K 随机热读

再次清理 Kernel Cache后,执行 4K 随机热读测试:

fio -iodepth=1 -rw=randread -ioengine=libaio -bs=4K -numjobs=1 -group_reporting -size=5G -filename=/data/tos/5G -name=read_test --readonly -direct=1 --invalidate=1
3.4.2 -bs=256K 随机热读

清理 Kernel Cache后,执行 256K 随机热读测试:

fio -iodepth=1 -rw=randread -ioengine=libaio -bs=256K -numjobs=1 -group_reporting -size=5G -filename=/data/tos/5G -name=read_test --readonly -direct=1 --invalidate=1

通过以上步骤,能够评估 Alluxio 文件系统在不同读写场景下的性能表现,并得到相应的数据支持。

视频中的实际测试结果显示,当batch size为256k,顺序热读场景下,fio 单线程读吞吐可达2924MB/s。增大线程数(numjobs)到32,64,可以得到更高的fio测试性能。关于更多测试结果,请点击官网性能测试。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 2024年中国研究生数学建模竞赛ABCDEF题【附带解题思路代码+结果】
  • 【RPA私教课:UIPath】RPA 赋能科技企业,登录时验证码自动截取
  • 详解npm源及其使用方法
  • 【农信网-注册/登录安全分析报告】
  • Parallels Desktop 20破解版(Mac虚拟机) v20.0.0 for Mac 最新商业版(支持M系列)
  • Linux介绍;Linux安装;Linux常见错误
  • 【云安全】云服务安全攻防
  • Android 签名、空包签名 、jarsigner、apksigner
  • 【二级C语言考试】自定义数据类型
  • Gin渲染
  • CSS01-语法规范、基础选择器
  • 使用ESP8266和OLED屏幕实现一个小型电脑性能监控
  • Spring Boot-热部署问题
  • C语言中值传递
  • java通过org.eclipse.milo实现OPCUA客户端进行连接和订阅
  • avalon2.2的VM生成过程
  • k8s如何管理Pod
  • Lsb图片隐写
  • macOS 中 shell 创建文件夹及文件并 VS Code 打开
  • Making An Indicator With Pure CSS
  • 包装类对象
  • 将 Measurements 和 Units 应用到物理学
  • 老板让我十分钟上手nx-admin
  • 如何胜任知名企业的商业数据分析师?
  • 写给高年级小学生看的《Bash 指南》
  • 正则学习笔记
  • 新年再起“裁员潮”,“钢铁侠”马斯克要一举裁掉SpaceX 600余名员工 ...
  • ​​快速排序(四)——挖坑法,前后指针法与非递归
  • #Linux(Source Insight安装及工程建立)
  • $.ajax中的eval及dataType
  • ( 用例图)定义了系统的功能需求,它是从系统的外部看系统功能,并不描述系统内部对功能的具体实现
  • ()、[]、{}、(())、[[]]等各种括号的使用
  • (1)Map集合 (2)异常机制 (3)File类 (4)I/O流
  • (1)安装hadoop之虚拟机准备(配置IP与主机名)
  • (2022 CVPR) Unbiased Teacher v2
  • (读书笔记)Javascript高级程序设计---ECMAScript基础
  • (附源码)springboot家庭财务分析系统 毕业设计641323
  • (附源码)ssm高校社团管理系统 毕业设计 234162
  • (论文阅读30/100)Convolutional Pose Machines
  • (贪心 + 双指针) LeetCode 455. 分发饼干
  • (转)linux自定义开机启动服务和chkconfig使用方法
  • (轉貼)《OOD启思录》:61条面向对象设计的经验原则 (OO)
  • (自用)网络编程
  • .Family_物联网
  • .gitignore文件---让git自动忽略指定文件
  • .helper勒索病毒的最新威胁:如何恢复您的数据?
  • .NET 5.0正式发布,有什么功能特性(翻译)
  • .NET C# 使用GDAL读取FileGDB要素类
  • .NET Core实战项目之CMS 第十二章 开发篇-Dapper封装CURD及仓储代码生成器实现
  • .NET 项目中发送电子邮件异步处理和错误机制的解决方案
  • .NET国产化改造探索(三)、银河麒麟安装.NET 8环境
  • .NET开发不可不知、不可不用的辅助类(三)(报表导出---终结版)
  • .NET框架
  • @data注解_一枚 架构师 也不会用的Lombok注解,相见恨晚
  • [ C++ ] 类和对象( 下 )