当前位置: 首页 > news >正文

大模型学习笔记 - LLM 之 LLaMA系列(待更新)

  • LLaMA 系列
    • LLaMA 概述
      • LLaMA-1
      • LLaMA-2
      • LLaMA-3

LLaMA 概述

LLaMA: Open and Efficient Foundation Language Models
Llama 2: Open Foundation and Fine-Tuned Chat Models (LLama2 & LLama2-Chat)
LLama 3 | LLama 3.1

LLaMA-1

涉及到的基础知识点:

  1. pre-normalization. RSMNorm。
  2. SwiGLU activation function [PaLM].
  3. Rotary Embeddings [GPTNeo].Rotary positional embeddings (RoPE),
  4. FlashAttention

LLaMA-2

涉及到的基础知识点:

  1. groupAttention
  2. RLHF(PPO,拒绝采样)

LLama2:
我们还将预训练语料库的大小增加了 40%,增加了模型的上下文长度,并采用分组查询注意力(Ainslie et al., 2023)。我们正在发布具有 7B、13B 和 70B 参数的 Llama 2 变体。

LLama2Chat:
Llama 2-Chat 的训练:这个过程始于使用公开可用的在线源对 Llama 2 进行预训练。接下来,我们通过应用监督微调来创建 Llama 2-Chat 的初始版本。随后,使用带有人类反馈 (RLHF) 方法的强化学习迭代地改进模型,特别是通过拒绝采样近端策略优化 (PPO)。在 RLHF 阶段,迭代奖励建模数据与模型增强并行的累积对于确保奖励模型保持在分布内至关重要。

在这里插入图片描述

LLaMA-3

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 缺失ffmpeg.dll要用什么修复方法?快速恢复丢失的ffmpeg.dll文件
  • C++基础面试题 | C和C++的区别?
  • 【小趴菜前端学习日记3】
  • 【速览】计算机网络(更新中)
  • 使用VRoid Studio二次元建模,创建专属于自己的二次元卡通人物模型,创建完全免费开源且属于自己VRM模型
  • css 宫格样式内容上下结构
  • 井盖异动传感器:为城市安全加码
  • 电机启动对单片机重启的影响
  • 【Android】Android AOP 编程框架
  • Openvino2024.3版部署YOLO (C++)
  • 【高级IO-4】I/O多路转接 之 epoll(概念及代码实例)
  • P1801 黑匣子
  • 【Docker】以思源笔记为例,谈谈什么是端到端加密
  • 计算机网络参考模型
  • WPF-实现多语言的静态(需重启)与动态切换(不用重启)
  • 【刷算法】求1+2+3+...+n
  • Angular js 常用指令ng-if、ng-class、ng-option、ng-value、ng-click是如何使用的?
  • Fastjson的基本使用方法大全
  • Javascript基础之Array数组API
  • Java新版本的开发已正式进入轨道,版本号18.3
  • Lsb图片隐写
  • mysql外键的使用
  • Spring Cloud Alibaba迁移指南(一):一行代码从 Hystrix 迁移到 Sentinel
  • Zsh 开发指南(第十四篇 文件读写)
  • 安装python包到指定虚拟环境
  • 从零开始在ubuntu上搭建node开发环境
  • 近期前端发展计划
  • 开年巨制!千人千面回放技术让你“看到”Flutter用户侧问题
  • 看域名解析域名安全对SEO的影响
  • 类orAPI - 收藏集 - 掘金
  • 浅谈JavaScript的面向对象和它的封装、继承、多态
  • 如何打造100亿SDK累计覆盖量的大数据系统
  • 设计模式 开闭原则
  • 深入浅出webpack学习(1)--核心概念
  • 微服务框架lagom
  • 一道闭包题引发的思考
  • k8s使用glusterfs实现动态持久化存储
  • 大数据全解:定义、价值及挑战
  • ​ubuntu下安装kvm虚拟机
  • ​无人机石油管道巡检方案新亮点:灵活准确又高效
  • # SpringBoot 如何让指定的Bean先加载
  • # 数论-逆元
  • #使用清华镜像源 安装/更新 指定版本tensorflow
  • (14)目标检测_SSD训练代码基于pytorch搭建代码
  • (C语言)fread与fwrite详解
  • (C语言)字符分类函数
  • (c语言版)滑动窗口 给定一个字符串,只包含字母和数字,按要求找出字符串中的最长(连续)子串的长度
  • (web自动化测试+python)1
  • (zhuan) 一些RL的文献(及笔记)
  • (第61天)多租户架构(CDB/PDB)
  • (附源码)ssm高校升本考试管理系统 毕业设计 201631
  • (离散数学)逻辑连接词
  • (十六)Flask之蓝图
  • (十七)devops持续集成开发——使用jenkins流水线pipeline方式发布一个微服务项目
  • (十五)使用Nexus创建Maven私服