当前位置: 首页 > news >正文

docker部署本地词向量模型

开源项目:GitHub - huggingface/text-embeddings-inference: A blazing fast inference solution for text embeddings models

1. 下载词向量模型

参考我的另一篇博客:langchain 加载本地词向量模型

2. 部署词向量模型

就三行命令

model=/data/BAAI/bge-m3
volume=/home/project/text_embedding/models
docker run -p 8082:80 -v $volume:/data --pull always ghcr.io/huggingface/text-embeddings-inference:cpu-1.5 --model-id $model

会先去下载 docker 镜像,然后运行容器。我这里下载的是 cpu 版本的 docker 镜像,其他硬件环境的 docker 镜像参考:https://huggingface.co/docs/text-embeddings-inference/supported_models

特别要强调的是:model 的路径可不是随便写的。在我的这个例子中,启动 docker 时,映射的路径是$volume:/data,因此 model 的路径必须以/data 开头,不然的话是找不到模型的。

我的模型存放路径:/home/project/text_embedding/models/BAAI/bge-m3,大家可以参考我的路径来调整 model 和 volume 变量的值。

3. 调用词向量模型

使用 REST API 调用,可调用的 API 参考:Text Embeddings Inference API

curl 127.0.0.1:8082/embed \-X POST \-d '{"inputs":"What is Deep Learning?"}' \-H 'Content-Type: application/json'

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Django学习(二)
  • Linux_实现UDP网络通信
  • 详解 @RequestHeader 注解在 Spring Boot 中的使用
  • 学生党如何挑选高性价比蓝牙耳机?四款天花板级蓝牙耳机推荐
  • 在C++里如何释放内存的时候不调用对象的析构函数?
  • Final Draft for Mac v13.1.0激活版:专业剧本写作软件
  • 【Python】基础学习技能提升代码样例2:小功能块
  • UE5C++中,NewObject<>()和CreateDefaultSubobject<>()的区别
  • 网络通信---UDP
  • C语言 写一个函数days,实现某日在本年中是第几天计算。
  • c++中grpc简单使用---函数介绍及其代码演示
  • 如何处理selenium Webdriver中的文本框?
  • Linux环境docker部署Firefox结合内网穿透远程使用浏览器测试
  • SpringBoot 日志
  • C:图案打印
  • ----------
  • hexo+github搭建个人博客
  • 2017前端实习生面试总结
  • input实现文字超出省略号功能
  • JS实现简单的MVC模式开发小游戏
  • Material Design
  • Python socket服务器端、客户端传送信息
  • SegmentFault 技术周刊 Vol.27 - Git 学习宝典:程序员走江湖必备
  • web标准化(下)
  • Windows Containers 大冒险: 容器网络
  • windows下如何用phpstorm同步测试服务器
  • 从零开始的无人驾驶 1
  • 分布式任务队列Celery
  • 关于for循环的简单归纳
  • 算法-插入排序
  • 我的业余项目总结
  • 写代码的正确姿势
  • mysql面试题分组并合并列
  • 交换综合实验一
  • ​​​​​​​GitLab 之 GitLab-Runner 安装,配置与问题汇总
  • ​html.parser --- 简单的 HTML 和 XHTML 解析器​
  • ​数据链路层——流量控制可靠传输机制 ​
  • #includecmath
  • (Matalb时序预测)PSO-BP粒子群算法优化BP神经网络的多维时序回归预测
  • (pojstep1.3.1)1017(构造法模拟)
  • (rabbitmq的高级特性)消息可靠性
  • (读书笔记)Javascript高级程序设计---ECMAScript基础
  • (二)Kafka离线安装 - Zookeeper下载及安装
  • (附源码)python房屋租赁管理系统 毕业设计 745613
  • (附源码)spring boot北京冬奥会志愿者报名系统 毕业设计 150947
  • (附源码)springboot优课在线教学系统 毕业设计 081251
  • (十三)Java springcloud B2B2C o2o多用户商城 springcloud架构 - SSO单点登录之OAuth2.0 根据token获取用户信息(4)...
  • (转)IIS6 ASP 0251超过响应缓冲区限制错误的解决方法
  • (转)四层和七层负载均衡的区别
  • . NET自动找可写目录
  • .NET 应用启用与禁用自动生成绑定重定向 (bindingRedirect),解决不同版本 dll 的依赖问题
  • .Net 执行Linux下多行shell命令方法
  • .NET/C# 使窗口永不获得焦点
  • .NET/C# 在代码中测量代码执行耗时的建议(比较系统性能计数器和系统时间)
  • .NET编程——利用C#调用海康机器人工业相机SDK实现回调取图与软触发取图【含免费源码】