当前位置: 首页 > news >正文

LLAMA3==shenzhi-wang/Llama3-8B-Chinese-Chat。windows安装不使用ollama

创建环境:

conda create -n llama3_env python=3.10
conda activate llama3_env
conda install pytorch torchvision torchaudio cudatoolkit=11.7 -c pytorch

安装Hugging Face的Transformers库:

pip install transformers sentencepiece
下载模型

https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat/tree/main

编写代码调用

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer# 检查CUDA是否可用,并设置设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")print(torch.cuda.is_available())
print(device)# 加载模型和tokenizer
model_name = "F:\\ollama_models\\Llama3-8B-Chinese-Chat"
model = AutoModelForCausalLM.from_pretrained(model_name).to(device)
tokenizer = AutoTokenizer.from_pretrained(model_name)# 编写推理函数
# def generate_text(prompt):
#     inputs = tokenizer(prompt, return_tensors="pt").to(device)
#     outputs = model.generate(inputs['input_ids'], max_length=100)
#     return tokenizer.decode(outputs[0], skip_special_tokens=True)
#
# # 示例使用
# prompt = "写一首诗吧,以春天为主题"
# print(generate_text(prompt))messages = [{"role": "user", "content": "写一首诗吧"},
]input_ids = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt"
).to(model.device)outputs = model.generate(input_ids,max_new_tokens=8192,do_sample=True,temperature=0.6,top_p=0.9,
)
response = outputs[0][input_ids.shape[-1]:]
print(tokenizer.decode(response, skip_special_tokens=True))

非常慢,大概用了一两分钟回答一个问题。

还是老实用ollama跑qwen吧

相关文章:

  • day21二叉树part07|530.二叉搜索树的最小绝对差 501.二叉搜索树中的众数 236. 二叉树的最近公共祖先
  • 【网络运维的重要性】
  • 学习C++编程入门:时间、方法及经验分享
  • Unix环境高级编程--7-进程环境--7.1-7.2main函数-7.3进程退出
  • 人工智能初识
  • DOS学习-目录与文件应用操作经典案例-del
  • 2024年3月电子学会青少年软件编程 中小学生Python编程等级考试一级真题解析(选择题)
  • Flutter 中的 NestedScrollViewViewport 小部件:全面指南
  • 【Linux】Linux基本指令2
  • 哈希表练习题(2024/5/29)
  • 汇舟问卷:国外问卷调一天900
  • 数据结构(一)顺序表
  • HTML-JavaWeb
  • 一致性hash算法原理图和负载均衡原理-urlhash与least_conn案例
  • 开源博客项目Blog .NET Core源码学习(27:App.Hosting项目结构分析-15)
  • [数据结构]链表的实现在PHP中
  • 《Javascript高级程序设计 (第三版)》第五章 引用类型
  • 10个确保微服务与容器安全的最佳实践
  • Django 博客开发教程 16 - 统计文章阅读量
  • Linux链接文件
  • nodejs调试方法
  • Perseus-BERT——业内性能极致优化的BERT训练方案
  • sublime配置文件
  • 设计模式(12)迭代器模式(讲解+应用)
  • 手机app有了短信验证码还有没必要有图片验证码?
  • 协程
  • 优化 Vue 项目编译文件大小
  • 回归生活:清理微信公众号
  • ​学习一下,什么是预包装食品?​
  • # Apache SeaTunnel 究竟是什么?
  • #[Composer学习笔记]Part1:安装composer并通过composer创建一个项目
  • #if和#ifdef区别
  • #Js篇:单线程模式同步任务异步任务任务队列事件循环setTimeout() setInterval()
  • $.proxy和$.extend
  • (solr系列:一)使用tomcat部署solr服务
  • (二)换源+apt-get基础配置+搜狗拼音
  • (更新)A股上市公司华证ESG评级得分稳健性校验ESG得分年均值中位数(2009-2023年.12)
  • (教学思路 C#之类三)方法参数类型(ref、out、parmas)
  • (七)微服务分布式云架构spring cloud - common-service 项目构建过程
  • (四)鸿鹄云架构一服务注册中心
  • (一) storm的集群安装与配置
  • (原創) 如何動態建立二維陣列(多維陣列)? (.NET) (C#)
  • ***微信公众号支付+微信H5支付+微信扫码支付+小程序支付+APP微信支付解决方案总结...
  • **Java有哪些悲观锁的实现_乐观锁、悲观锁、Redis分布式锁和Zookeeper分布式锁的实现以及流程原理...
  • .DFS.
  • .FileZilla的使用和主动模式被动模式介绍
  • .NET NPOI导出Excel详解
  • .NET 线程 Thread 进程 Process、线程池 pool、Invoke、begininvoke、异步回调
  • .NET(C#、VB)APP开发——Smobiler平台控件介绍:Bluetooth组件
  • .NET开源项目介绍及资源推荐:数据持久层 (微软MVP写作)
  • @ConfigurationProperties注解对数据的自动封装
  • @ModelAttribute使用详解
  • [ Linux Audio 篇 ] 音频开发入门基础知识
  • [2024最新教程]地表最强AGI:Claude 3注册账号/登录账号/访问方法,小白教程包教包会
  • [Angular] 笔记 18:Angular Router