当前位置: 首页 > news >正文

书生.浦江大模型实战训练营——(四)书生·浦语大模型全链路开源开放体系

最近在学习书生.浦江大模型实战训练营,所有课程都免费,以关卡的形式学习,也比较有意思,提供免费的算力实战,真的很不错(无广)!欢迎大家一起学习,打开LLM探索大门:邀请连接,PS,邀请有算力哈哈

任务

观看本关卡的视频与官网后,写下关于书生大模型全链路开源开放体系的笔记。

书生·浦语大模型全链路开源开放体系

  • 一、体系概述
  • 二、发展历程
  • 三、最新版本特性:书生·浦语大模型2.5

视频时长约30分钟,内容涵盖了书生·浦语大模型的全链路开发体系及其关键技术,学到的东西很多。接下来我会继续研究知识图谱、检索增强生成以及基于图神经网络的长文本处理,期待大家一起交流!以下是对此视频内容的详细总结。

一、体系概述

书生·浦语大模型全链路开源开放体系旨在构建一个包括数据收集、模型训练、微调、评测以及AI应用部署的完整生态。通过开源代码和项目,推动了人工智能的普及与实际应用,使得研究者和开发者能更高效地利用和开发基于大模型的应用。

在这里插入图片描述

二、发展历程

  1. 开源开放体系的建立:书生·浦语大模型自始便重视开源,通过发布开源项目吸引了众多开发者和研究者的参与。这种开放的形式加快了模型的迭代与优化。

  2. 数据收集与整理:该模型在数据驱动的过程中,采用多种数据生成方式,包括基于规则、模型以及反馈的数据生成。这提高了数据的多样性,增强了模型的推理能力及短期记忆。

  3. 反馈机制的引入:引入相似度对齐与基于反馈的强化训练后,模型在理解用户需求方面的表现有所提升,进而提高了准确性和用户满意度。

在这里插入图片描述

三、最新版本特性:书生·浦语大模型2.5

  1. 性能提升:在最新版本的书生·浦语大模型2.5中,推理能力和短期记忆等方面得到了显著提升,从而在处理复杂问题时更快速且准确。

  2. Label LLM项目开源:为了简化数据标注过程,书生团队开源了Label LLM项目,提供了高效的数据标注解决方案,进而促进后续模型的训练和优化。

  3. 性能评测体系:视频中的性能天梯展示了通过各种评测工具对模型进行实时性能监测和比较的方法,为模型的持续优化提供了依据。

在这里插入图片描述

以下是一段简单的internLM推理代码示例:

import torch
from transformers import AutoTokenizer, AutoModelForCausalLMmodel_name_or_path = "/root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b"tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True, device_map='cuda:0')
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='cuda:0')
model = model.eval()system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""messages = [(system_prompt, '')]print("=============Welcome to InternLM chatbot, type 'exit' to exit.=============")while True:input_text = input("\nUser  >>> ")input_text = input_text.replace(' ', '')if input_text == "exit":breaklength = 0for response, _ in model.stream_chat(tokenizer, input_text, messages):if response is not None:print(response[length:], flush=True, end="")length = len(response)

希望这些内容能对大家理解书生·浦语大模型有所帮助!

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • JavaScript高阶笔记总结第三天:(JavaScript高阶完结)
  • JavaScript中的字符串与数字转换
  • 人工智能GPU算力评估分析
  • Unity动画模块 之 Animation
  • Gradle相关的语法
  • 官宣|Apache Flink 1.20 发布公告
  • linux系统编程:缓冲区,文件io(19)
  • 【Linux】快速入门系列(四) —— Linux实用操作
  • 【LeetCode】452.用最少数量的箭引发气球
  • C++ 适配器 stack
  • 加强混合工作时代的组织网络安全态势
  • Feign的优化
  • https跟http有什么区别?
  • 《剑指offer》题目 C++详细题解
  • 代码随想录算法训练营 | 贪心算法 part04
  • [PHP内核探索]PHP中的哈希表
  • canvas 绘制双线技巧
  • chrome扩展demo1-小时钟
  • CSS魔法堂:Absolute Positioning就这个样
  • happypack两次报错的问题
  • JavaScript 奇技淫巧
  • js 实现textarea输入字数提示
  • Linux各目录及每个目录的详细介绍
  • MyEclipse 8.0 GA 搭建 Struts2 + Spring2 + Hibernate3 (测试)
  • MySQL主从复制读写分离及奇怪的问题
  • Terraform入门 - 3. 变更基础设施
  • unity如何实现一个固定宽度的orthagraphic相机
  • VirtualBox 安装过程中出现 Running VMs found 错误的解决过程
  • 设计模式 开闭原则
  • 实习面试笔记
  • 实战:基于Spring Boot快速开发RESTful风格API接口
  • 首页查询功能的一次实现过程
  • 验证码识别技术——15分钟带你突破各种复杂不定长验证码
  • “十年磨一剑”--有赞的HBase平台实践和应用之路 ...
  • 曜石科技宣布获得千万级天使轮投资,全方面布局电竞产业链 ...
  • #### go map 底层结构 ####
  • $ is not function   和JQUERY 命名 冲突的解说 Jquer问题 (
  • (13)DroneCAN 适配器节点(一)
  • (2024,Vision-LSTM,ViL,xLSTM,ViT,ViM,双向扫描)xLSTM 作为通用视觉骨干
  • (3)STL算法之搜索
  • (C#)获取字符编码的类
  • (SERIES12)DM性能优化
  • (编译到47%失败)to be deleted
  • (超详细)2-YOLOV5改进-添加SimAM注意力机制
  • (二)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (附源码)小程序 交通违法举报系统 毕业设计 242045
  • (力扣)循环队列的实现与详解(C语言)
  • (十六)一篇文章学会Java的常用API
  • .chm格式文件如何阅读
  • .NET C# 配置 Options
  • .NET C#版本和.NET版本以及VS版本的对应关系
  • .NET CF命令行调试器MDbg入门(四) Attaching to Processes
  • .NET CORE 2.0发布后没有 VIEWS视图页面文件
  • .net core 6 集成 elasticsearch 并 使用分词器
  • .net core使用ef 6