当前位置: 首页 > news >正文

GPT-Crawler一键爬虫构建GPTs知识库

GPT-Crawler一键爬虫构建GPTs知识库

  • 写在最前面
  • 安装node.js
  • 安装GPT-Crawler
  • 启动爬虫
  • 结合 OpenAI
    • 自定义 assistant
    • 自定义 GPTs(笔者用的这个)
  • 总结

写在最前面

GPT-Crawler一键爬虫构建GPTs知识库
能够爬取网站数据,构建GPTs的知识库,项目依赖node.js环境,接下来我们按步骤来安装,非常简单

参考:https://zhuanlan.zhihu.com/p/668700619

安装node.js

Node.js下载地址:https://nodejs.org/en
下载20.10.0版本即可,下载后一路默认安装

在这里插入图片描述

安装完成后在命令行输入node -v,显示版本则安装成功

在这里插入图片描述

安装GPT-Crawler

项目地址:https://github.com/BuilderIO/gpt-crawler
这个项目能爬取网站数据,生成用于创建GPTs的知识库文件
打开项目地址后,点击【Code】,下载压缩文件,保存到电脑本地解压

VSCode官网下载:https://code.visualstudio.com/Download

用VSCode编码工具打开,
或者点开VSCode,左上角文件,点击打开文件夹,地址选择解压的地址

切换到项目目录(例如我的是C:\Users\Yu\Desktop\gpt-crawler-main\gpt-crawler-main>),右键,选择在集成终端中打开
输入npm install,把项目依赖包进行安装

在这里插入图片描述

启动爬虫

npm start

日志输出下面这些为正常:

在这里插入图片描述

最后程序会在项目根目录输出文件output.json,这就是我们需要的文件。
输出的文件就在该目录下
点开看一下,很完美

在这里插入图片描述

结合 OpenAI

这步需要一个 OpenAI 账户,我们需要将生成的文件上传给 OpenAI。

自定义 assistant

选择 assistant 的优势是,我们可以使用 OpenAI 提供的 assistant API,集成到自己的系统中。

操作步骤:
1、进入自定义 Assistants 页面https://platform.openai.com/assistants
2、创建一个 Assistant
3、添加上面生成的output.json文件
4、配置其他选项

上传配置完点击保存,然后开始测试:

自定义 GPTs(笔者用的这个)

自定义 GPTs 和上面的操作类似,大家自行体验。GPTs 需要大家付费 Plus,并且官方似乎还没有提供 GPTs 的 API 可用。

总结

GPT Crawler 项目能让我们只做简单的配置,即可自定义自己的知识库。结合 OpenAI 的 API,能够做很多的事情。大家自行体验。

相关文章:

  • 吉他初学者学习网站搭建系列(5)——如何做一个在线节拍器
  • Android:BackStackRecord
  • error转string
  • uniapp使用vue-i18n国际化多国语言
  • 记录 | CUDA编程中使用#ifdef指令控制生成CPU和GPU代码
  • [足式机器人]Part2 Dr. CAN学习笔记-数学基础Ch0-3线性化Linearization
  • CoreDNS实战(九)-性能压测
  • IDEA连接Redis注意事项
  • Arduino项目式编程教学第三章——红外遥控灯
  • CSS单位vmin、vmax
  • 【JMeter】BeanShell了解基础知识
  • C/C++---------------LeetCode第118. 杨辉三角
  • RT-Thread Studio文件消失不见或被排除构建
  • 【唐山海德教育】职称评审需要什么条件呢?
  • 2-- 简要介绍 Kubernetes
  • python3.6+scrapy+mysql 爬虫实战
  • [NodeJS] 关于Buffer
  • 【JavaScript】通过闭包创建具有私有属性的实例对象
  • 2019.2.20 c++ 知识梳理
  • angular组件开发
  • css系列之关于字体的事
  • Javascript基础之Array数组API
  • Java精华积累:初学者都应该搞懂的问题
  • vue从创建到完整的饿了么(18)购物车详细信息的展示与删除
  • Vue--数据传输
  • 安装python包到指定虚拟环境
  • 如何进阶一名有竞争力的程序员?
  • 数组的操作
  • 用jQuery怎么做到前后端分离
  • 怎样选择前端框架
  • 3月7日云栖精选夜读 | RSA 2019安全大会:企业资产管理成行业新风向标,云上安全占绝对优势 ...
  • 长三角G60科创走廊智能驾驶产业联盟揭牌成立,近80家企业助力智能驾驶行业发展 ...
  • (12)Linux 常见的三种进程状态
  • (173)FPGA约束:单周期时序分析或默认时序分析
  • (C语言)fread与fwrite详解
  • (windows2012共享文件夹和防火墙设置
  • (二)pulsar安装在独立的docker中,python测试
  • (四)库存超卖案例实战——优化redis分布式锁
  • (算法)Travel Information Center
  • (一)Neo4j下载安装以及初次使用
  • (转)重识new
  • (转载)Linux 多线程条件变量同步
  • * 论文笔记 【Wide Deep Learning for Recommender Systems】
  • .cn根服务器被攻击之后
  • .java 指数平滑_转载:二次指数平滑法求预测值的Java代码
  • .Net MVC + EF搭建学生管理系统
  • @GetMapping和@RequestMapping的区别
  • [AIGC 大数据基础]hive浅谈
  • [BZOJ 3680]吊打XXX(模拟退火)
  • [CF407E]k-d-sequence
  • [Codeforces] number theory (R1600) Part.11
  • [Django 0-1] Core.Email 模块
  • [Django 0-1] Core.Handlers 模块
  • [Django开源学习 1]django-vue-admin
  • [IE编程] IE中使网页元素进入编辑模式