当前位置: 首页 > news >正文

FATE Board 执行流程探索

背景介绍

FATE Board 是 FATE 提供的一个工程,用于给 FATE 提供可视化能力,方便在联邦学习训练中实时查看执行状态,更好地定位执行中遇到的问题。

查看 FATE 架构可以看到 FATE Board 是建立在 MySQL 和 FATE Flow Server 的基础上的,看起来数据来源是来自于这两者。FATE Flow Server 在之前的文章 中已经介绍过,FATE 中隐私计算的主要调度流程都是实现在这个服务中。

请添加图片描述

FATE Board 代码仓库地址 https://github.com/FederatedAI/FATE-Board, 本文的探索基于 v1.11.1,后续版本可能有所不同

FATE Board 实现探索

FATE Board 工程中包含前端与后端的实现,前端是基于 Vue 实现的,后端则是基于 Java 实现。本文在探索时主要基于两个场景串联了一下完整的流程,分别是主页面的 job 列表页,以及 job 日志详情,通过查看完整的调用链路,对 FATE Board 建立基础的认识。

Job 列表页

请添加图片描述

通过 Chrome 调试模式查看对应的请求,即可比较容易发现获取 job 列表数据对应的请求为 /job/query/page/new , 通过对应的接口路径全局搜索可以发现后端的实现为 src/main/java/com/webank/ai/fate/board/controller/JobManagerController.java 中的 queryPagedJob() 方法,对应的代码实现如下:

public PageBean<Map<String, Object>> queryPagedJobs(PagedJobQO pagedJobQO) {String jobId = pagedJobQO.getJobId();FlowJobQO flowJobQO = new FlowJobQO();if (jobId != null && 0 != jobId.trim().length()) {flowJobQO.setJob_id(pagedJobQO.getJobId());}// 构造请求参数 ...// 实际获取数据Map<String, Object> jobMap = getJobMap(flowJobQO);// ... 冗长的业务处理
}

可以看到的真正的数据获取部分基本就是直接调用 getJobMap() ,对应的实现如下所示:

private Map<String, Object> getJobMap(Object query) {result = flowFeign.post(Dict.URL_JOB_QUERY, JSON.toJSONString(query));// ... 冗长的结果转换
}

实际的获取是通过一次 HTTP 请求获取到,对应的请求地址为 /v1/job/list/job,看情况应该是调用 FATE Flow Server 获取的,在 FATE-Flow 中看到的对应的接口,处于路径 FATE-Flow/python/fate_flow/apps/job_app.py 中的 list_job(),实际的实现就是一次简单的数据库查询,不再进一步展开。

Job 日志

请添加图片描述

通过 chrome 调试模式看到实际获取 Job 日志是通过 websocket 获取的,请求的地址为 /log/new/202307260855242117390/host/8889/default,目前来看日志的获取和 job 列表的获取存在一些差异

依旧利用请求地址搜索对应的代码实现,可以确认后端对应的实现路径为 src/main/java/com/webank/ai/fate/board/websocket/LogWebSocketController.java 中的 LogWebSocketController 类实现,对于 websocket 的服务端,消息处理都是在 onMessage 实现的,我们可以看到对应的代码实现如下:

@OnMessage
public void onMessage(String message,Session session,@PathParam("jobId") String jobId,@PathParam("role") String role,@PathParam("partyId") String partyId,@PathParam("componentId") String componentId) throws Exception {synchronized (session) {LogQuery logQuery = JSON.parseObject(message, LogQuery.class);// 根据类型主要包含 logSize 和 logCat,其中 logSize 用于获取日志行数,logCat 获取日志内容if (logQuery.getType().equals(LogTypeEnum.LOG_SIZE.boardValue)) {logSize(session, jobId, role, partyId, componentId, logQuery);} else {logCat(session, jobId, role, partyId, componentId, logQuery);}}
}

可以看到的通过路径获取 jobId, role, partyId, componentId 的参数,然后调用 logSize()logCat() 执行实际的处理,我们主要关注日志内容的获取,可以看到 logCat() 对应的实现如下所示:

private void logCat(Session session, String jobId, String role, String partyId, String componentId, LogQuery logQuery) {// 构造请求FlowLogCatReq flowLogCatReq = new FlowLogCatReq();flowLogCatReq.setJob_id(jobId);flowLogCatReq.setLog_type(Dict.logTypeMap.get(logQuery.getType()));flowLogCatReq.setRole(role);flowLogCatReq.setParty_id(Integer.valueOf(partyId));flowLogCatReq.setComponent_name(componentId);flowLogCatReq.setInstance_id(logQuery.getInstanceId());flowLogCatReq.setBegin(logQuery.getBegin());flowLogCatReq.setEnd(logQuery.getEnd());// 实际获取数据FlowResponse<List<FlowLogCatResp>> resultFlow = flowLogFeign.logCat(flowLogCatReq);// 构造响应数据LogContentResponse logContentResponse = new LogContentResponse();logContentResponse.setType(logQuery.getType());logContentResponse.setData(resultFlow.getData().stream().map(LogContentResponse.LogContent::fromFlowContent).collect(Collectors.toList()));try {session.getBasicRemote().sendText(JSON.toJSONString(logContentResponse));} catch (IOException e) {e.printStackTrace();logger.error("websocket send error: {}", logContentResponse);}
}

根据最核心的数据获取是调用 flowLogFeign.logCat() ,对应的实现:

@FeignClient(url = RouteTargeter.URL_PLACE_HOLDER + "/v1/log", name = "flowLogFeign", configuration = FeignRequestInterceptor.class)
public interface FlowLogFeign {// 构造 http 请求@RequestMapping(value = "/cat", method = RequestMethod.POST)FlowResponse<List<FlowLogCatResp>> logCat(FlowLogCatReq request);@RequestMapping(value = "/size", method = RequestMethod.POST)FlowResponse<FlowLogSizeResp> logSize(FlowLogSizeReq request);
}

最后兜了一圈,看起来还是转换了一次网络请求,看起来还是发送给了 FATE Flow Server,追踪 FATE-Flow 工程中的对应实现,可以看到对应的网络请求位于 FATE-Flow/python/fate_flow/apps/log_app.py 路径下,具体的实现位于 FATE-Flow/python/fate_flow/utils/log_sharing_utils.py 中的 cat_log() 方法中,实现如下:

def cat_log(self, begin, end):line_list = []log_path = self.get_log_file_path()if begin and end:cmd = f"cat {log_path} | tail -n +{begin}| head -n {end-begin+1}"elif begin:cmd = f"cat {log_path} | tail -n +{begin}"elif end:cmd = f"cat {log_path} | head -n {end}"else:cmd = f"cat {log_path}"lines = self.execute(cmd)if lines:line_list = []line_num = begin if begin else 1for line in lines.split("\n"):line = replace_ip(line)line_list.append({"line_num": line_num, "content": line})line_num += 1return line_list

可以看到最终就是调用系统的 cat 命令,最终文件对应的内容,整体实现简单直接。

总结

通过对 FATE-Board 两个请求的调用链路的跟踪,可以对 FATE-Board 工程有了一些了解,看起来 FATE-Board 是建立在 FATE-Flow 基础上的一个简单可视化,使用的能力基本都是通过 FATE-Flow 提供,而 FATE-Board 仅仅提供必要的数据包装与前端的展示呈现,过程简单清晰。后续如果希望了解 FATE-Board 对应的可视化的能力范围,直接查看 FATE-Flow 对应提供的接口即可

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • SpringBoot依赖之Spring Boot DevTools热部署开发增效工具
  • 编写测试用例的常用方法总结
  • Web安全:SQL注入实战测试.(扫描 + 测试)
  • 【MySQL 15】使用 C/C++ 连接数据库
  • java实现ocr功能(Tesseract OCR)
  • skywalking接入nginx
  • window上部署kafka3.6.1,并配置sasl认证
  • python从入门到精通:数据可视化-图形开发
  • 【Android】使用 ADB 查看 Android 设备的 CPU 使用率
  • 以“更好的”价值主张,五粮特曲打响双节动销
  • WordPress美化节日灯笼插件,适合春节的时候使用
  • 前端(Vue)tagsView(子标签页视图切换) 原理及通用解决方案
  • Leetcode 第 408 场周赛题解
  • 数据结构之最短路径
  • 在Mac上打开UE4Editor
  • android 一些 utils
  • Fastjson的基本使用方法大全
  • Java,console输出实时的转向GUI textbox
  • Java-详解HashMap
  • Linux中的硬链接与软链接
  • PAT A1092
  • 多线程事务回滚
  • 番外篇1:在Windows环境下安装JDK
  • 基于组件的设计工作流与界面抽象
  • 利用jquery编写加法运算验证码
  • 马上搞懂 GeoJSON
  • 如何在GitHub上创建个人博客
  • # 详解 JS 中的事件循环、宏/微任务、Primise对象、定时器函数,以及其在工作中的应用和注意事项
  • #{}和${}的区别是什么 -- java面试
  • #多叉树深度遍历_结合深度学习的视频编码方法--帧内预测
  • #微信小程序:微信小程序常见的配置传值
  • %check_box% in rails :coditions={:has_many , :through}
  • (007)XHTML文档之标题——h1~h6
  • (2)MFC+openGL单文档框架glFrame
  • (笔试题)合法字符串
  • (附源码)spring boot儿童教育管理系统 毕业设计 281442
  • (附源码)springboot 房产中介系统 毕业设计 312341
  • (三)centos7案例实战—vmware虚拟机硬盘挂载与卸载
  • (实战篇)如何缓存数据
  • (数位dp) 算法竞赛入门到进阶 书本题集
  • (算法)硬币问题
  • (转)负载均衡,回话保持,cookie
  • .bat批处理(六):替换字符串中匹配的子串
  • .jks文件(JAVA KeyStore)
  • .Net Core 生成管理员权限的应用程序
  • .Net Core 中间件验签
  • .Net Core和.Net Standard直观理解
  • .net 托管代码与非托管代码
  • .net 重复调用webservice_Java RMI 远程调用详解,优劣势说明
  • /3GB和/USERVA开关
  • /boot 内存空间不够
  • /etc/fstab和/etc/mtab的区别
  • [ C++ ] STL---stack与queue
  • [ 渗透工具篇 ] 一篇文章让你掌握神奇的shuize -- 信息收集自动化工具
  • [.NET 即时通信SignalR] 认识SignalR (一)