当前位置: 首页 > news >正文

ChatGPT学习第一周

📖 学习目标

  • 掌握ChatGPT基础知识
    • 理解ChatGPT的基本功能和工作原理。
    • 认识到ChatGPT在日常生活和业务中的潜在应用。
  • 了解AI和机器学习的基本概念
    • 获取人工智能(AI)和机器学习(ML)的初步了解。
    • 理解这些技术是如何支撑ChatGPT的。

✍️ 学习活动

学习资料

  • 《ChatGPT在做什么…为什么它能做到?》—斯蒂芬·沃尔夫勒姆
  • 《三分钟看懂ChatGPT》—量子位智库·火线报告
  • 《ChatGPT学习手册》----飞书——大国
  • 《ChatGPT开启AIGC产业生态新时代 新风口•新生态•新变革•新机遇》—前瞻产业研究院联合发布
  • 《终于有人把chatGPT说清楚了——全网最深入浅出的chatGPT原理科普,包你看懂》—B站——新石器公园
  • 《ChatGPT原理是什么?技术小白能看懂的ChatGPT原理介绍 - AI 绘画每日一帖》—知乎——倒立的BOB

学习笔记

ChatGPT基础知识
ChatGPT的基本功能和工作原理
  • ChatGPT的定义
      ChatGPT (Chat Generative Pre-trained Transformer)是由OpenAI公司基于GPT模型(采用了Transformer架构的深度学习语言模型)研发的一款人工智能聊天机器人,它能够回答问题、进行对话、生成文本和提供有关各种主题的信息。
  • ChatGPT的发展历史
      ChatGPT的发展历史如下图所示。
    在这里插入图片描述
  • ChatGPT的系统应用介绍
    ChatGPT首页
    • ChatGPT-3.5系统应用页面
      在这里插入图片描述
    • ChatGPT-3.5功能介绍
      • 输入框:文本输入框,允许输入自然语言进行对话请求。
      • 信息发送:将输入框中的信息发送给聊天机器人,聊天机器人根据GPT模型按照语料库中的数据信息(语料库中信息截止日期是2022年1月)以及上下文内容,进行应答请求,应答内容格式为自然语言和代码块。
      • 模型切换:若未充值升级,则无法切换模型。
      • 新增聊天对话:不继续当前对话进程,重新增加一个聊天对话。
      • 我的:包含了退出登录、设置和自定义指令等三个功能操作。设置为系统设置,包含了主题和语言的设置、聊天对话的管理、数据的权限管理;自定义指令的作用是根据自身的偏好定义ChatGPT的响应。
      • 提示词:参考提示词,用于指导用户更好的与ChatGPT进行对话沟通。
    • ChatGPT 4.0应用页面
      在这里插入图片描述
    • ChatGPT-4功能介绍
      • 选择附件:允许你选择本地文件(如文本、图像等)进行对话输入处理的内容。
      • 输入框:文本输入框,允许输入自然语言和Python代码进行对话请求,其中输入Python代码时可执行对应代码并反馈结果。
      • 信息发送:将输入框中的信息发送给聊天机器人,聊天机器人根据GPT模型按照联网搜索、语料库中的数据信息(语料库中信息截止日期是2023年4月)以及上下文内容,进行应答请求,应答内容格式为自然语言、代码块、图片(文本生成图像功能依赖的是DALL·E3系统)、word文档、pdf文档等。
      • 模型切换:若已充值升级,可以选择的对话模型有:GPT-4、GPT-3.5和Plugins,Plugins是ChatGPT插件模式,通过调用第三方插件增强 ChatGPT 的功能并允许其执行更加广泛的操作。
      • 新增聊天对话:不继续当前对话进程,重新增加一个聊天对话。
      • GPTs:为ChatGPT应用商店,应用商店包含用户分享的各类根据特定需求创建的GPT模型,可以通过这个功能使用别人分享的GPT应用,同时也可以去创建自己的GPT应用。
      • 我的:包含了退出登录、Plus用户设置&Beta、自定义指令、我的GPTs和我的套餐等五个功能操作。其中Plus用户设置&Beta为系统设置,包含了主题和语言的设置、聊天对话的管理、插件启用管理、数据的权限管理和GPTs构建者简介设置;自定义指令的作用是根据自身的偏好定义ChatGPT的响应;我的GPTs的作用是展示自己创建的ChatGPT应用清单和提供创建GPTs的入口。
      • 提示词:参考提示词,用于指导用户更好的与ChatGPT进行对话沟通。
  • ChatGPT模型原理
      ChatGPT的核心技术是通过一种叫做人工反馈强化学习的方法来工作的。这个过程大致是这样的:有一些人,我们称他们为标注人员,会像真正的用户一样和ChatGPT聊天。他们会产生很多聊天的样本,然后对ChatGPT的回复进行评分,选出好的回答。这些评分会被用来教ChatGPT如何更好地回答问题。简单来说,ChatGPT会通过观察人类是如何评价它的回答的,并且还会学习如何在不同情况下作出最好的回应。这个过程会不断重复,以此来不断改进ChatGPT的表现。
    在这里插入图片描述
ChatGPT的应用场景
  • 日常学习生活
      OpenAI官方提供的ChatGPT用法参考,如下图所示。
    在这里插入图片描述
  • 商业应用
    • 客户服务与支持:公司使用ChatGPT来提升客户服务体验,通过自动化聊天机器人回答常见问题、解决问题或提供即时帮助,减少了客户等待时间并提高了服务效率。
    • 个性化推荐系统:在线零售商和内容提供商利用ChatGPT来分析用户的兴趣和行为,提供个性化的产品推荐或内容,增强用户体验和满意度。
    • 教育与培训:教育机构和在线学习平台使用ChatGPT来创建互动的学习体验,提供定制化的教学和辅导,帮助学生在学习过程中获得即时反馈和支持。
    • 语言翻译与通讯:企业利用ChatGPT提供即时翻译服务,帮助跨国团队和个人克服语言障碍,促进更流畅的国际交流和合作。
    • 健康咨询:一些健康科技公司将ChatGPT集成到他们的平台上,提供初步的健康咨询和信息,帮助用户了解常见病症和健康问题,但强调不能替代专业医疗建议。
    • 企业自动化:公司通过ChatGPT自动化内部流程,如自动化报告生成、数据分析解释和内部帮助台服务,提高工作效率和减少人力资源成本。
AI和机器学习的初步了解
AI和机器学习的基本概念
  • 人工智能(AI)
      AI,全称Artificial Intelligence,人工智能。人工智能是计算机科学的一个分支,它致力于创建能够执行通常需要人类智能才能完成的任务的系统。这包括理解自然语言、识别图像、解决问题和学习。AI系统能够通过分析数据和识别模式来模仿人类的思考过程和决策能力。
  • AIGC
      AIGC是指由AI自动创作生成的内容( AI Generated Content),即AI接收到人下达的任务指令,通过处理人的自然语言,自动生成图片、视频、音频等。AIGC是AI大模型,特别是自然语言处理模型的一种重要应用;ChatGPT则是AIGC在聊天对话场景的一个具体应用。
  • 机器学习(ML)
      机器学习是AI的一个子集,关注的是如何使计算机系统利用算法和统计模型,从数据中学习和改进其任务执行的能力,而无需进行明确的编程。机器学习模型通过分析大量数据,自动识别数据中的模式和关联性,从而学会执行特定任务。
AI和机器学习对ChatGPT的作用

  AI和机器学习提供了理论基础和技术手段,使ChatGPT能够理解和生成自然语言,进行有意义的对话。以下是这些技术是如何支持ChatGPT的:

  • 深度学习:深度学习使得计算机能够通过神经网络处理复杂的数据结构,这是ChatGPT理解和生成自然语言的基础。变换器模型利用自注意力机制,有效地处理序列数据(如文本),捕捉长距离依赖关系,这对于语言理解和生成至关重要。
  • 预训练与微调:ChatGPT首先在大量文本数据上进行预训练,学习语言的基本结构和模式。之后,通过人工反馈强化学习(RLHF)等技术进行微调,提高其在特定任务(如回答问题、写作或对话)上的性能。这种预训练和微调的结合使ChatGPT能够广泛适用于多种语言任务。
  • 人工反馈:ChatGPT利用来自人类标注者的反馈进行学习和改进。这些标注者通过对聊天机器人的回答进行排名和打分,帮助模型了解哪些类型的回答是更优的,从而调整其生成答案的策略。
  • 迭代学习:通过不断的迭代学习,ChatGPT能够从人类评价和环境反馈中学习,逐步提高其理解和生成自然语言的能力。这种持续的学习和调整过程使ChatGPT能够更好地模仿人类的对话方式,提供更准确和自然的回答。

相关文章:

  • SQL、Hive中的SQL和Spark中的SQL三者联系与区别
  • 基于STM32CubeMX的GPIO配置和代码生成教程
  • 力扣精选算法100道—— 连续数组(前缀和专题)
  • LabVIEW风力发电机在线监测
  • 嵌入式学习之Linux入门篇笔记——9,Linux权限管理
  • C#静态数组删除数组元素不改变数组长度 vs 动态数组删除数组元素改变数组长度
  • 2024.2.6
  • 艺术创作和生活的关系
  • Docker引擎不同的日志驱动配置以及通过Filebeat采集容器日志的两种解决方案
  • Vue + Element UI el-table + sortablejs 行、列拖拽排序
  • SQL世界之命令语句Ⅲ
  • C语言--------指针(1)
  • [技术杂谈]如何下载vscode历史版本
  • 使用Pillow来生成简单的红包封面
  • freertos 源码分析五 任务调度一
  • [NodeJS] 关于Buffer
  • CSS选择器——伪元素选择器之处理父元素高度及外边距溢出
  • Git同步原始仓库到Fork仓库中
  • JavaWeb(学习笔记二)
  • Java到底能干嘛?
  • js中的正则表达式入门
  • LeetCode541. Reverse String II -- 按步长反转字符串
  • oldjun 检测网站的经验
  • PAT A1092
  • QQ浏览器x5内核的兼容性问题
  • Redis在Web项目中的应用与实践
  • SpringCloud(第 039 篇)链接Mysql数据库,通过JpaRepository编写数据库访问
  • 关于Android中设置闹钟的相对比较完善的解决方案
  • 海量大数据大屏分析展示一步到位:DataWorks数据服务+MaxCompute Lightning对接DataV最佳实践...
  • 记一次删除Git记录中的大文件的过程
  • 前端每日实战:70# 视频演示如何用纯 CSS 创作一只徘徊的果冻怪兽
  • 前嗅ForeSpider采集配置界面介绍
  • 浅谈JavaScript的面向对象和它的封装、继承、多态
  • 如何用Ubuntu和Xen来设置Kubernetes?
  • 软件开发学习的5大技巧,你知道吗?
  • 使用 5W1H 写出高可读的 Git Commit Message
  • 学习ES6 变量的解构赋值
  • 在Mac OS X上安装 Ruby运行环境
  • 白色的风信子
  • ​决定德拉瓦州地区版图的关键历史事件
  • ​学习一下,什么是预包装食品?​
  • #我与Java虚拟机的故事#连载06:收获颇多的经典之作
  • $(selector).each()和$.each()的区别
  • (14)目标检测_SSD训练代码基于pytorch搭建代码
  • (附源码)spring boot基于Java的电影院售票与管理系统毕业设计 011449
  • (九十四)函数和二维数组
  • (十六)一篇文章学会Java的常用API
  • (完整代码)R语言中利用SVM-RFE机器学习算法筛选关键因子
  • (学习日记)2024.01.09
  • . NET自动找可写目录
  • .net 提取注释生成API文档 帮助文档
  • .net生成的类,跨工程调用显示注释
  • @modelattribute注解用postman测试怎么传参_接口测试之问题挖掘
  • @property python知乎_Python3基础之:property
  • []sim300 GPRS数据收发程序