当前位置: 首页 > news >正文

先进制造aps专题二十五 openai的ai大模型设计也使用了aps用的并行遗传算法

openai的ai大模型设计是不是很神秘?

其实不神秘,看国内最新的一个团队招人

新型研究机构,AI团队招收ai大模型算子搜索、大模型训练与推理算法

ai大模型算子搜索:方向:算子辅助搜索工具的实现与开发、群体遗传算法研发、并行遗传算法研发,要求:Python/C++实现,优化、计算数学、遗传进化计算相关专业

ai大模型训练与推理算法:方向:LLM参数高效算法、幻觉抑制算法、反学习(unlearning)算法研发,要求:Pytorch深度学习/大模型训练经验,计算机、数学、EE相关专业


也就是ai大模型的算法模型研发就两块,一个就是模型的最优化算子设计,这要用并行遗传算法来搜索,不是靠人想,第二块就是训练的算法,前训练算法和后训练算法,这个靠人想

————

ibm一个做生产排程aps优化算法的,后来去openai搞ai大模型,估计就是干大模型算子搜素这个,用并行遗传算法搜索最佳的算子设计,比如几层,每层的参数(国内的免费生产排程软件isuperaps也是用并行遗传算法优化)

openai现在跑出来那么多核心员工,技术早就不保密了,估计这个团队就是按openai的模式搞

也就是说,openai的大模型的参数算子设计,其实也是并行遗传算法用超算搜索出来的

做法基本就是,先搞一个初始的算子设计,比如几层,每层多少参数,然后准备一个小规模的训练集,比如100g的训练集,和对应的测试集,先对初始算子的算法模型用100g的小规模训练集训练,测试集得分60分,然后对每个算子,用并行遗传算法搜素,对搜索出来的新算子的算法模型用100g的小规模训练集训练,测试集得分65分,这样反复的优化搜索,最后得到一个测试集得分最高的最优的算子

再对这个最优算子的算法模型,用15t 的大数据集训练,得到正式发布的模型(gpt3,gpt3.5,gpt4,gpt5)

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 互联网全景消息(1)之RabbitMq基础入门
  • 一文看懂智能终端密码模块
  • ElasticSearch索引和搜索词匹配的一些细节
  • 企业级环境部署:在 Linux 服务器上如何搭建和部署 Python 环境?
  • Vue+ElementUI+Electron环境搭建及程序打包
  • 广电数安 未来已展 | 天空卫士亮相BIRTV2024
  • 探索音视频SDK在软件集成与私有化部署中的技术难题与解决策略
  • Gartner首次发布AI代码助手魔力象限,阿里云进入挑战者象限,通义灵码产品能力全面领先
  • 解锁 QLExpress:高效数据处理的神器
  • springboot嵌入式数据库实践-H2内嵌数据库(文件、内存)
  • 服务器机房与数据中心的区别?
  • linux 杀死所有 python进程的命令
  • nginx反向代理,负载均衡,动静分离
  • Linux下TCP编程
  • 编成笔记-atan2函数学习分析
  • ES6指北【2】—— 箭头函数
  • android百种动画侧滑库、步骤视图、TextView效果、社交、搜房、K线图等源码
  • angular2 简述
  • co模块的前端实现
  • FineReport中如何实现自动滚屏效果
  • Java Agent 学习笔记
  • JavaScript DOM 10 - 滚动
  • JavaScript实现分页效果
  • Just for fun——迅速写完快速排序
  • Mybatis初体验
  • OpenStack安装流程(juno版)- 添加网络服务(neutron)- controller节点
  • React+TypeScript入门
  • Redis字符串类型内部编码剖析
  • Sublime Text 2/3 绑定Eclipse快捷键
  • 开源中国专访:Chameleon原理首发,其它跨多端统一框架都是假的?
  • 区块链技术特点之去中心化特性
  • 为视图添加丝滑的水波纹
  • 从如何停掉 Promise 链说起
  • 京东物流联手山西图灵打造智能供应链,让阅读更有趣 ...
  • ​二进制运算符:(与运算)、|(或运算)、~(取反运算)、^(异或运算)、位移运算符​
  • # 利刃出鞘_Tomcat 核心原理解析(七)
  • ######## golang各章节终篇索引 ########
  • (1)(1.13) SiK无线电高级配置(六)
  • (173)FPGA约束:单周期时序分析或默认时序分析
  • (2)STL算法之元素计数
  • (a /b)*c的值
  • (C11) 泛型表达式
  • (HAL库版)freeRTOS移植STMF103
  • (Java岗)秋招打卡!一本学历拿下美团、阿里、快手、米哈游offer
  • (八十八)VFL语言初步 - 实现布局
  • (编译到47%失败)to be deleted
  • (附源码)springboot 个人网页的网站 毕业设计031623
  • (附源码)springboot青少年公共卫生教育平台 毕业设计 643214
  • (接口封装)
  • (七)理解angular中的module和injector,即依赖注入
  • (十)【Jmeter】线程(Threads(Users))之jp@gc - Stepping Thread Group (deprecated)
  • (十八)SpringBoot之发送QQ邮件
  • (算法设计与分析)第一章算法概述-习题
  • (转)Linux整合apache和tomcat构建Web服务器
  • (转)Unity3DUnity3D在android下调试