当前位置: 首页 > news >正文

大模型应用_PrivateGPT

https://github.com/imartinez/privateGPT

1 功能

  • 整体功能,想解决什么问题
    搭建完整的 RAG 系统,与 FastGPT相比,界面比较简单。但是底层支持比较丰富,可用于知识库的完全本地部署,包含大模型和向量库。适用于保密级别比较高,或者完全不想使用收费模型和服务的情况。
  • 当前解决了什么问题,哪些问题解决不了
    PrivateGPT 提供了整体转换、入库、存储、匹配、合成答案,图形界面的解决方案,并提供图形界面用于检索操作。
    RAG 所面对的问题,比如不够准确,多文档组合生成答案这些问题,需要进一步细化工具,似乎不能通过架构来解决。另外,由于多数本地部署的模型效果与 ChatGPT 差距比较大,这里只是看到了本地部署的架构和实现的可能性,部署后用户是否能接受其效果,还待验证。
  • 提供哪些功能点,其中哪些是刚需
    核心功能是通过简单的操作,实现对本地文件的检索和问答,功能相对单一。
  • 用户使用难度,操作逻辑是否过于复杂
    整体工具链使用了poetry构建,安装相对方便。但由于包含了深度学习库,肯定比一般项目复杂很多,安装时间长,占空间大。
    Dockerfile如果写得有一点问题(频繁更新,难免有错),就会面临至少部分内容重新下载打包的问题。另外,由于可插拔的选项比较多,还需要用户进一步设置。

2 技术栈

  • 技术栈是什么:
    • PrivateGPT 不是一个用大量代码实现具体功能的项目,相反,它尽量使用现有工具,主要提供架构,组织现有方法,以实现功能。
  • 现有底层工具消化了哪些常用功能
    • llamaindex 文档的转换和管理
    • pytorch & cuda 本地支持深度学习模型,因此image也较大
    • sentence-transformers 文本匹配
    • FastAPI 后端框架
    • Chroma 向量数据库
    • Qdrant 向量数据库
    • Gradio 界面由Gradio实现,有效降低了程序的复杂度
    • fern 管理文档
    • 使用 poetry 管理项目
  • 代码分析(使用cloc工具统计)
    • 代码 3.2M,主要为 Python 代码,共 2733 行
    • local 版本 image 大小为 6.34G,external 版本为 5.68G
    • 核心代码在:private_gpt/private_gpt/ 目录下
  • 使用场景
    • 完全本地化的知识库

3 商业模式

相对简单的项目,代码主要在架构和调用其它工具,依赖 llama-index,并实现了扩展,如支持几个主流向量数库,后面可能接入更多模型和向量库。可作为一种集成的方案,或者支持各种组件插拔的 Hub 使用。

4 使用

4.1 安装
  • 下载项目
$ git clone https://github.com/imartinez/privateGPT
$ cd privateGPT
  • 修改配置文件
vi settings.yaml

建议第一次运行时将 llm 设置为 openai,整体调通后,再使用本地 llm 下载模型;否则太过复杂,不容易定位问题。

  • 修改 Dockerfile.local(我build时报错)
RUN addgroup worker
RUN adduser --ingroup worker --system worker
  • 构建 local 环境
$ docker build . -f Dockerfile.local --build-arg HTTP_PROXY=xxx --build-arg HTTPS_PROXY=xxx -t private-gpt
  • 细节请见文档:https://docs.privategpt.dev/installation
4.2 运行

如果直接执行失败,建议以root用户启动bash进行调试

$ docker run --rm -p 8080:8080 -e OPENAI_API_KEY=xxx -e HTTP_PROXY=xxx -e HTTPS_PROXY=xxx --entrypoint bash -u 0 -it private-gpt
$ .venv/bin/python -m private_gpt

在localhost 8080 端口可打开 gradio 应用

4.3 使用感受

gradio 主要用作 demo,实现功能比较简单,比如上传文档后无法删除,文本切块大小和模型的对应关系需要提前设置。

5 资源

文档
全面了解 PrivateGPT:中文技巧和功能实测

相关文章:

  • 面试题:vue3获取dom的方式
  • springboot(ssm房屋交易平台 房屋租赁系统Java系统
  • 逻辑回归代价函数
  • 【超图】SuperMap iClient3D for WebGL/WebGPU ——暴雪
  • C# WPF上位机开发(动态添加控件)
  • 【NTN 卫星通信】Starlink,费用、服务、市场(二)
  • JavaSE第7篇:封装
  • 使用ffmpeg命令进行视频格式转换
  • 单片机的低功耗模式介绍
  • Spring-整合MyBatis
  • 程序人生15年人生感悟
  • 代码随想录算法训练营第37天|● 738.单调递增的数字 ● 968.监控二叉树 ● 总结
  • 计算机网络 第四章(网络层)【下】
  • Java 内存模型(JMM)探寻原理,深度讲解
  • Android hwcomposer服务启动流程
  • -------------------- 第二讲-------- 第一节------在此给出链表的基本操作
  • 实现windows 窗体的自己画,网上摘抄的,学习了
  • 【挥舞JS】JS实现继承,封装一个extends方法
  • 〔开发系列〕一次关于小程序开发的深度总结
  • Android系统模拟器绘制实现概述
  • axios请求、和返回数据拦截,统一请求报错提示_012
  • interface和setter,getter
  • jdbc就是这么简单
  • Logstash 参考指南(目录)
  • Meteor的表单提交:Form
  • Mysql5.6主从复制
  • python docx文档转html页面
  • SAP云平台运行环境Cloud Foundry和Neo的区别
  • Synchronized 关键字使用、底层原理、JDK1.6 之后的底层优化以及 和ReenTrantLock 的对比...
  • 从零开始的webpack生活-0x009:FilesLoader装载文件
  • 复习Javascript专题(四):js中的深浅拷贝
  • 更好理解的面向对象的Javascript 1 —— 动态类型和多态
  • 基于webpack 的 vue 多页架构
  • 力扣(LeetCode)965
  • 猫头鹰的深夜翻译:Java 2D Graphics, 简单的仿射变换
  • 移动端高清、多屏适配方案
  • #Js篇:单线程模式同步任务异步任务任务队列事件循环setTimeout() setInterval()
  • #每日一题合集#牛客JZ23-JZ33
  • $().each和$.each的区别
  • (01)ORB-SLAM2源码无死角解析-(66) BA优化(g2o)→闭环线程:Optimizer::GlobalBundleAdjustemnt→全局优化
  • (Repost) Getting Genode with TrustZone on the i.MX
  • (阿里云万网)-域名注册购买实名流程
  • (创新)基于VMD-CNN-BiLSTM的电力负荷预测—代码+数据
  • (第27天)Oracle 数据泵转换分区表
  • (二)PySpark3:SparkSQL编程
  • (附源码)spring boot智能服药提醒app 毕业设计 102151
  • (附源码)springboot优课在线教学系统 毕业设计 081251
  • (离散数学)逻辑连接词
  • (转)IOS中获取各种文件的目录路径的方法
  • (转载)虚幻引擎3--【UnrealScript教程】章节一:20.location和rotation
  • ****三次握手和四次挥手
  • *setTimeout实现text输入在用户停顿时才调用事件!*
  • .NET Compact Framework 多线程环境下的UI异步刷新
  • .NET Core WebAPI中使用swagger版本控制,添加注释
  • .NET 线程 Thread 进程 Process、线程池 pool、Invoke、begininvoke、异步回调