当前位置: 首页 > news >正文

2023春季李宏毅机器学习笔记 03 :机器如何生成文句

资料

  • 课程主页:https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.php
  • Github:https://github.com/Fafa-DL/Lhy_Machine_Learning
  • B站课程:https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800

一、大语言模型的两种期待和使用

BERT:专才

  • 简介:BERT是一个语言模型,对其进行改造(加外挂+微调参数),成为不同领域的专才(BERT只会进行文字填空,无法像GTP一样写出句子说话)
  • 本质:文字填空
  • 发展:专才 (单一任务完成度优秀,eg:专用于翻译的模型)
  • 使用方式:
    • (1)加外挂Head:
      在这里插入图片描述

    • (2)Fintune(微调参数):在这里插入图片描述

    • (3)Adapter(局部微调):在这里插入图片描述
      在这里插入图片描述

GPT:通才

  • 简介: 机器要学会读题目叙述Instruction Learning或题目范例In-context Learning
  • 本质:文字接龙
  • 发展:通才(只要重新设计Prompt,即可快速开发新功能不用写程式,eg:)
  • 使用方式:见二
    • Instruction Learning
    • In-context Learning
    • Chain of Thought (CoT) Prompting

相关文章:

  • 【实用技巧】Windows 电脑向iPhone或iPad传输视频方法1:无线传输
  • 杨中科 ASP.NET Core 中的依赖注入的使用
  • 寒假前端第一次作业
  • 模型\视图一般步骤:为什么经常要用“选择模型”QItemSelectionModel?
  • Android 事件分发介绍
  • scala 安装和创建项目
  • 代码随想录算法训练营Day20 | 40.组合总和||、39.组合总和、131.分割回文串
  • 图片分类的脚本
  • 【设计模式】创建型模式之单例模式(Golang实现)
  • LLM漫谈(二)| QAnything支持任意格式文件或数据库的本地知识库问答系统
  • 穷举vs暴搜vs深搜vs回溯vs剪枝
  • React.Children.map 和 js 的 map 有什么区别?
  • H5的3D游戏开源框架
  • Linux 常用指令汇总
  • onreadystatechange事件详解
  • [译]前端离线指南(上)
  • 【Amaple教程】5. 插件
  • 【译】React性能工程(下) -- 深入研究React性能调试
  • Bootstrap JS插件Alert源码分析
  • C++类的相互关联
  • centos安装java运行环境jdk+tomcat
  • flutter的key在widget list的作用以及必要性
  • iOS仿今日头条、壁纸应用、筛选分类、三方微博、颜色填充等源码
  • JavaScript 无符号位移运算符 三个大于号 的使用方法
  • JS笔记四:作用域、变量(函数)提升
  • JS实现简单的MVC模式开发小游戏
  • js作用域和this的理解
  • 基于阿里云移动推送的移动应用推送模式最佳实践
  • 经典排序算法及其 Java 实现
  • 聊聊redis的数据结构的应用
  • 排序算法学习笔记
  • 设计模式 开闭原则
  • 深入浅出webpack学习(1)--核心概念
  • 算法-插入排序
  • 通过npm或yarn自动生成vue组件
  • 微信小程序:实现悬浮返回和分享按钮
  • 微信支付JSAPI,实测!终极方案
  • 在 Chrome DevTools 中调试 JavaScript 入门
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • ​如何在iOS手机上查看应用日志
  • !$boo在php中什么意思,php前戏
  • #define与typedef区别
  • #if #elif #endif
  • #我与Java虚拟机的故事#连载04:一本让自己没面子的书
  • (ISPRS,2023)深度语义-视觉对齐用于zero-shot遥感图像场景分类
  • (javascript)再说document.body.scrollTop的使用问题
  • (附源码)ssm航空客运订票系统 毕业设计 141612
  • (十二)springboot实战——SSE服务推送事件案例实现
  • (转)使用VMware vSphere标准交换机设置网络连接
  • ****** 二 ******、软设笔记【数据结构】-KMP算法、树、二叉树
  • .bat批处理(四):路径相关%cd%和%~dp0的区别
  • .Net CF下精确的计时器
  • .NET Core 成都线下面基会拉开序幕
  • .NET Core 实现 Redis 批量查询指定格式的Key
  • .net mvc部分视图