当前位置: 首页 > news >正文

使用LangGPT提示词让大模型比较浮点数

使用LangGPT提示词让大模型比较浮点数

  • 背景介绍
  • 环境准备
    • 创建虚拟环境
    • 安装一些必要的库
    • 安装其他依赖
    • 部署大模型
    • 启动图形交互服务
    • 设置提示词与测试
  • LangGPT结构化提示词

背景介绍

LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,本文采用LangGPT 进行结构化提示词设计,让internlm2-chat-1_8b能够正确比较浮点数。(注意:估计1.8B的对话能力比较弱,别把模型带偏了:))

本文使用书生浦语的开发机环境InternStudio来部署模型与实验。

环境准备

创建虚拟环境

conda create -n langgpt python=3.10 -y
conda activate langgpt

安装一些必要的库

conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia -y

安装其他依赖

pip install transformers==4.43.3pip install streamlit==1.37.0
pip install huggingface_hub==0.24.3
pip install openai==1.37.1
pip install lmdeploy==0.5.2

部署大模型

CUDA_VISIBLE_DEVICES=0 lmdeploy serve api_server /share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b --server-port 23333 --api-keys internlm2

在这里插入图片描述

启动图形交互服务

git clone https://github.com/InternLM/Tutorial.gitcd Tutorial
checkout camp3
cd tools# 启动服务
python -m streamlit run chat_ui.py

在这里插入图片描述

设置提示词与测试

做端口映射后,就可以访问UI了。

ssh -p {ssh端口,从InternStudio获取} root@ssh.intern-ai.org.cn -CNg -L 7860:127.0.0.1:8501 -o StrictHostKeyChecking=no

浏览器打开 http://127.0.0.1:8501/后,
在“系统提示”中贴入如下,然后点击“保存设置”,就可以对话了。

# Role: 浮点数比较小助手## Profile
- author: 向阳智能
- version: 1.0
- language: 中文
- description: 我是一个浮点数比较小助手,能够精确的比较两个浮点数的大小,不会出现失误。## Background: 
用户需要比较两个数值字符串的大小,以确定哪个数值更大## Skills
1. 接收两个准备比较的浮点数,并判断他们是浮点数
2. 比较浮点数的大小
3. 精确的结果比较的结果
4. 给出简单的解释## Rules
1. 必须明确这是浮点数的大小比较,而不是字符串的比较
2. 回答需要简洁明了,避免过于复杂或含糊的表述。
3. 始终使用浮点数大小判断的方式来回答,不要被别人带偏了
4. 不要动不动说自己之前回答是错误的,若之前回答是正确的,你要坚持自己的结论
5. 不要被其他的假设带偏了## Workflows
1. 将待比较的两个数字字符串,转换成浮点数大小比较的方式来比较

在这里插入图片描述

LangGPT结构化提示词

LangGPT 是 Language For GPT-like LLMs 的简称,中文名为结构化提示词。LangGPT 是一个帮助你编写高质量提示词的工具,理论基础是我们提出的一套模块化、标准化的提示词编写方法论——结构化提示词。LangGPT社区文档:https://langgpt.ai

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 如何查看Android设备的dpi
  • Springboot+Shiro+Mybatis+mysql实现权限安全认证
  • Webpack:现代前端项目的强大打包工具
  • redis分布式锁(看门枸机制)
  • linux如何对c++进行内存分析
  • Davinci 大数据可视化分析
  • 数字电子技术-编码器
  • gevent + flask 接口会卡住
  • Python--数据格式转换
  • 主流日志框架Logback与Log4j2
  • [Spring]Spring MVC 请求和响应及用到的注解
  • Call OpenAI API with Python requests is missing a model parameter
  • Stable Diffusion 使用详解(11)--- 场景ICON制作
  • (十六)、把镜像推送到私有化 Docker 仓库
  • 2024华为杯研赛E题保姆级教程思路分析
  • 4个实用的微服务测试策略
  •  D - 粉碎叛乱F - 其他起义
  • docker-consul
  • HTML-表单
  • python3 使用 asyncio 代替线程
  • Redis 中的布隆过滤器
  • Spark in action on Kubernetes - Playground搭建与架构浅析
  • Spring Boot快速入门(一):Hello Spring Boot
  • vue的全局变量和全局拦截请求器
  • Vue实战(四)登录/注册页的实现
  • Xmanager 远程桌面 CentOS 7
  • 从tcpdump抓包看TCP/IP协议
  • 一个6年java程序员的工作感悟,写给还在迷茫的你
  • 深度学习之轻量级神经网络在TWS蓝牙音频处理器上的部署
  • 阿里云重庆大学大数据训练营落地分享
  • 选择阿里云数据库HBase版十大理由
  • ​软考-高级-系统架构设计师教程(清华第2版)【第12章 信息系统架构设计理论与实践(P420~465)-思维导图】​
  • ​软考-高级-系统架构设计师教程(清华第2版)【第9章 软件可靠性基础知识(P320~344)-思维导图】​
  • ​软考-高级-信息系统项目管理师教程 第四版【第14章-项目沟通管理-思维导图】​
  • #pragma data_seg 共享数据区(转)
  • (1)常见O(n^2)排序算法解析
  • (LeetCode 49)Anagrams
  • (MTK)java文件添加简单接口并配置相应的SELinux avc 权限笔记2
  • (solr系列:一)使用tomcat部署solr服务
  • (附源码)ssm户外用品商城 毕业设计 112346
  • (论文阅读笔记)Network planning with deep reinforcement learning
  • (一)硬件制作--从零开始自制linux掌上电脑(F1C200S) <嵌入式项目>
  • (转)chrome浏览器收藏夹(书签)的导出与导入
  • (转)关于如何学好游戏3D引擎编程的一些经验
  • .Net Core中Quartz的使用方法
  • .Net FrameWork总结
  • .net MySql
  • .NET 通过系统影子账户实现权限维持
  • .NET/MSBuild 中的发布路径在哪里呢?如何在扩展编译的时候修改发布路径中的文件呢?
  • .NET程序员迈向卓越的必由之路
  • .Net环境下的缓存技术介绍
  • .NET轻量级ORM组件Dapper葵花宝典
  • .NET文档生成工具ADB使用图文教程
  • /3GB和/USERVA开关
  • /etc/skel 目录作用