当前位置: 首页 > news >正文

dockerfile之vllm大模型镜像构建

基础镜像:nvidia/cuda:11.8.0-devel-ubuntu22.04
cuda:11.8
python:3.11
torch:2.1.2

构建命令:

sudo docker build -t vllm:v1 .

dockerfile内容:

FROM nvidia/cuda:11.8.0-devel-ubuntu22.04# 定义VLLM_VERSION变量并赋值
ARG VLLM_VERSION=0.4.0.post1# 设置 metadata
LABEL maintainer="None"
LABEL version=${VLLM_VERSION}
LABEL description=${VLLM_VERSION}"+cu118'# 设置 minconda 的环境变量
ENV PATH="/root/miniconda3/bin:$PATH"
ARG PATH="/root/miniconda3/bin:$PATH"# 更改默认 shell && 设置 DNS && 设置 apt 清华源 && 安装 wget, unzip, vim, screen, curl
RUN rm /bin/sh && ln -s /bin/bash /bin/sh && \mv /etc/apt/sources.list /etc/apt/sources.list.bak && \echo "deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse" > /etc/apt/sources.list && \echo "deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse" >> /etc/apt/sources.list && \echo "deb https://mirnors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse" >> /etc/apt/sources.list && \echo "deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse" >> /etc/apt/sources.list && \apt-get update && \apt-get install -y wget unzip vim screen curl# 安装 miniconda
RUN mkdir -p ~/miniconda3 && \wget https://repo.anaconda.com/miniconda/Miniconda3-py311_24.1.2-0-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh && \bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3 && \rm -rf ~/miniconda3/miniconda.sh && \~/miniconda3/bin/conda init bash && \conda --version && \python -V#设置 pip 清华源并安装 vLLM, fschat, openai35
ARG PYTHON_VERSION=311
RUN ~/miniconda3/bin/python -m pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple && \~/miniconda3/bin/python -m pip install https://github.com/vllm-project/vllm/releases/download/v${VLLM_VERSION}/vllm-${VLLM_VERSION}+cu118-cp${PYTHON_VERSION}-cp${PYTHON_VERSION}-manylinux1_x86_64.whl && \~/miniconda3/bin/python -m pip uninstall torch -y && \~/miniconda3/bin/python -m pip install torch==2.1.2 --index-url https://download.pytorch.org/whl/cu118 && \# ~/miniconda3/bin/python -m pip uninstall cupy-cuda12x -y && \# ~/miniconda3/bin/python -m pip install cupy-cuda11x==12.1 && \~/miniconda3/bin/python -m pip uninstall xformers -y && \~/miniconda3/bin/python -m pip install xformers==v0.0.23.post1 --index-url https://download.pytorch.org/whl/cu118 && \~/miniconda3/bin/python -m pip install "fschat[model_worker,webui]"==0.2.36 && \~/miniconda3/bin/python -m pip install openai# 清理 pip 缓存
RUN ~/miniconda3/bin/python -m pip cache purge

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Go语言加Vue3零基础入门全栈班10 Go语言+gRPC用户微服务项目实战 2024年07月31日 课程笔记
  • Hugging Face下载模型
  • 技术详解:视频美颜SDK与直播美颜插件开发指南
  • XQuery 术语
  • 使用Spring Security实现Java应用的安全管理
  • 视频美颜SDK与直播插件的实现原理及优化方案详解
  • qt-声明
  • C语言菜鸟入门·数据结构·链表超详细解析
  • Google Earth Engine(GEE)——逐月筛选影像,并给影像集合添加新的属性
  • Vue3详细介绍,正则采集器所用前端框架
  • 代码随想录27期|Python|Day37|56.合并区间|738.单调递增的数字
  • SSM项目学习:用xml配置文件或注解开发实现控制反转和依赖注入
  • 调度系统之Oozie
  • 【Flutter 自定义字体】等宽字体等
  • 《2024华数杯》C题第四问 模型建立+优化算法
  • 自己简单写的 事件订阅机制
  • 《用数据讲故事》作者Cole N. Knaflic:消除一切无效的图表
  • 【159天】尚学堂高琪Java300集视频精华笔记(128)
  • 【Under-the-hood-ReactJS-Part0】React源码解读
  • 2017年终总结、随想
  • 77. Combinations
  • Cumulo 的 ClojureScript 模块已经成型
  • iOS | NSProxy
  • Java,console输出实时的转向GUI textbox
  • JavaWeb(学习笔记二)
  • JS创建对象模式及其对象原型链探究(一):Object模式
  • python大佬养成计划----difflib模块
  • Spring Security中异常上抛机制及对于转型处理的一些感悟
  • SQLServer插入数据
  • tweak 支持第三方库
  • 电商搜索引擎的架构设计和性能优化
  • 分布式事物理论与实践
  • 将 Measurements 和 Units 应用到物理学
  • 聊聊sentinel的DegradeSlot
  • 体验javascript之美-第五课 匿名函数自执行和闭包是一回事儿吗?
  • 详解移动APP与web APP的区别
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • #VERDI# 关于如何查看FSM状态机的方法
  • (1)(1.9) MSP (version 4.2)
  • (C语言)编写程序将一个4×4的数组进行顺时针旋转90度后输出。
  • (C语言)逆序输出字符串
  • (TipsTricks)用客户端模板精简JavaScript代码
  • (独孤九剑)--文件系统
  • (附源码)计算机毕业设计ssm本地美食推荐平台
  • (附源码)计算机毕业设计ssm电影分享网站
  • (三)Kafka离线安装 - ZooKeeper开机自启
  • (四)Android布局类型(线性布局LinearLayout)
  • (一)基于IDEA的JAVA基础1
  • (原)记一次CentOS7 磁盘空间大小异常的解决过程
  • (转)Android中使用ormlite实现持久化(一)--HelloOrmLite
  • (轉)JSON.stringify 语法实例讲解
  • ***汇编语言 实验16 编写包含多个功能子程序的中断例程
  • .“空心村”成因分析及解决对策122344
  • .gitignore文件使用
  • .NET 6 在已知拓扑路径的情况下使用 Dijkstra,A*算法搜索最短路径