当前位置: 首页 > news >正文

利用AI大语言模型和Langchain开发智能车算法训练知识库(上篇)

今天小李哥将介绍亚马逊云科技的Jupyter Notebook机器学习托管服务Amazon SageMaker上,通过AI大语言模型、向量知识库和LangChain Agent,创建用于AI 智能车模型训练的RAG问答知识库。整个项目的架构图如下:

本系列共分为上下两篇。在上篇内容中,我将分享该知识库的GitHub项目开源代码,大家可以自行下载学习和测试使用。并带大家在亚马逊云科技平台的Jupyter Notebook里部署项目搭建该知识库。也欢迎大家继续关注本系列下篇,我们将利用AI生成训练和测试数据集,以及利用Stable Diffusion图像生成模型评估智能车模型性能。

方案所需基础知识

什么是Amazon SageMaker?

Amazon SageMaker 是亚马逊云科技提供的一项全托管机器学习服务,帮助开发者和数据科学家轻松构建、训练和部署机器学习模型。SageMaker 提供了全套的工具和基础设施支持,用户无需管理底层的服务器和环境,即可快速处理从数据准备到模型训练再到部署的完整机器学习流程。

SageMaker 提供了灵活的开发环境,支持多种常用的机器学习框架,如 TensorFlow、PyTorch 等,同时也支持用户自定义的算法和模型。无论是使用预训练模型还是从头开始训练,SageMaker 都能够提供高效的分布式训练能力,并通过自动调优(如超参数优化)提升模型的精度。

关于LangChain?

LangChain Agent 是围绕大语言模型(LLM)作为其核心引擎构建的 AI 系统,可实现超越文本生成的能力。Agent 将 LLM 的自然语言优势与规划、记忆和工具使用等附加组件相结合。规划允许 Agent 将复杂目标分解为可管理的子任务。记忆提供短期的上下文学习和长期知识存储,以便快速检索。工具使用使 Agent 能够通过调用 API、利用搜索引擎、执行代码等来收集信息和采取行动。

精心设计的提示通过编码角色、指令、权限和上下文来塑造 Agent 行为。这使开发人员能够为各种应用程序定制 Agent,如对话助手、工作流自动化、模拟和科学发现。LLM Agent 的主要优势包括自然语言理解、推理和自主任务完成。然而,在有限的上下文大小、不可靠的自然语言接口以及长期规划困难等方面仍然存在挑战。

推理和行动 (ReAct) Agent框架

本实验中使用的 Agent 使用一种称为 ReAct 的技术。ReAct(推理和行动)是一种新的范式,它结合了语言模型在推理和行动能力方面的进步,使它们能够解决复杂的语言推理和决策任务。使用 ReAct,语言模型可以生成推理跟踪来创建、维护和调整高级计划,并采取行动从外部源(如 API 和知识库)中获取额外信息。

ReAct 的主要优点是推理和行动之间的协同作用。推理允许模型推导和更新计划,而行动使收集额外信息以支持推理成为可能。这有助于解决仅推理方法中的幻觉和错误级联等问题。与仅推理和仅行动的基线相比,ReAct 已被证明在多跳问答、事实检查和交互式决策等任务上实现了更优越的性能。

本实践包括的内容

1. 创建运行Jupyter Notebook的计算资源服务器

2. 分享利用AI大语言模型和Langchain构建智能车算法训练知识库的GitHub源代码

3. 在Jupyter Notebook中运行代码创建向量数据库、LangChain Agent,并利用Bedrock上的大语言模型构建RAG知识库,用于智能车模型算法训练相关问题的查询

项目实操步骤

部署云资源

1. 首先我们登录亚马逊云科技控制台,进入Sagemaker服务主页

2. 在左侧菜单栏中点击Notebook, 点击Create Notebook Instances创建计算实例,用于运行Jupyter Notebook服务器

3. 为Instance命名为”DeepRacerLab“,选择实例类型为”ml.t2.medium“,将磁盘容量设置为64GB

4. 为Jupyter Instance分配必要IAM权限,并开启Root Access,这样用户在Jupyter服务器中运行命令时会以root用户权限运行。

 5. 同时我们可以在创建服务器时自动添加Github项目代码,我们如图添加项目url:”https://github.com/jeremypedersen/deepracer-genai“,该项目包括了利用Amazon Bedrock上的大模型和LangChain构建DeepRacer "智能 Agent" 的模型文件和 notebooks

6. 添加完全部参数后,点击”Create notebook instance“创建运行Jupyter Notebook的计算服务器

打开Jupyter Notebook控制台

7. 当刚创建的Notebook实例的状态变为”InService“后,在SageMaker Instance页面中点击“Open JupyterLab”:

 8. 打开后就会在网页中弹出Jupyter Notebook控制台界面

开始运行代码创建知识库

9. 在左侧文件列表中打开文件:”00_deepracer_model_evaluation.ipynb“

 10. 打开文件后,会提示选择运行代码的内核,我们选择 conda_python3

11.  最后按照Jupyter Notebook里的步骤依次运行就可以创建RAG知识库了!

以上就是利用亚马逊云科技AI大语言模型和Langchain开发智能车算法训练知识库上篇内容。欢迎大家关注小李哥的亚马逊云科技AI服务深入调研系列,关注小李哥未来不要错过更多国际前沿的AWS云开发/云架构方案。 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • UE引擎工具链
  • SealSuite 一站式 IT 管理与办公安全解决方案,助力出海企业夯实数字化底座
  • 【生日视频制作】海上绿色摩托艇汽车艇车身AE模板修改文字软件生成器教程特效素材【AE模板】
  • OpenCV颜色空间转换(1)颜色空间转换函数cvtColor()的使用
  • 单元测试 Mock不Mock?
  • P7072 [CSP-J2020] 直播获奖
  • 解决Metasploit调用Nessus报错问题
  • Kafka【十三】消费者消费消息的偏移量
  • 使用LLaMA-Factory快速训练自己的专用大模型
  • 在 Windows 环境下实现免密登录 Linux 服务器
  • Spring之Bean的生命周期 2024-9-6 19:47
  • 水晶连连看 - 无限版软件操作说明书
  • 分布式光伏的优势
  • 深度学习从入门到精通——yolov3算法介绍
  • K8s中pod控制器
  • 《Javascript数据结构和算法》笔记-「字典和散列表」
  • 【108天】Java——《Head First Java》笔记(第1-4章)
  • Android单元测试 - 几个重要问题
  • extract-text-webpack-plugin用法
  • nodejs:开发并发布一个nodejs包
  • PHP 使用 Swoole - TaskWorker 实现异步操作 Mysql
  • python docx文档转html页面
  • Quartz初级教程
  • Quartz实现数据同步 | 从0开始构建SpringCloud微服务(3)
  • Spark VS Hadoop:两大大数据分析系统深度解读
  • SpiderData 2019年2月23日 DApp数据排行榜
  • Vue 2.3、2.4 知识点小结
  • Vue.js 移动端适配之 vw 解决方案
  • vue2.0开发聊天程序(四) 完整体验一次Vue开发(下)
  • 读懂package.json -- 依赖管理
  • 反思总结然后整装待发
  • 欢迎参加第二届中国游戏开发者大会
  • 利用阿里云 OSS 搭建私有 Docker 仓库
  • 那些被忽略的 JavaScript 数组方法细节
  • 前端之Sass/Scss实战笔记
  • 三分钟教你同步 Visual Studio Code 设置
  • 算法之不定期更新(一)(2018-04-12)
  • 小程序01:wepy框架整合iview webapp UI
  • Oracle Portal 11g Diagnostics using Remote Diagnostic Agent (RDA) [ID 1059805.
  • 阿里云IoT边缘计算助力企业零改造实现远程运维 ...
  • ​经​纬​恒​润​二​面​​三​七​互​娱​一​面​​元​象​二​面​
  • ​数据链路层——流量控制可靠传输机制 ​
  • #### golang中【堆】的使用及底层 ####
  • #考研#计算机文化知识1(局域网及网络互联)
  • (k8s中)docker netty OOM问题记录
  • (pojstep1.1.1)poj 1298(直叙式模拟)
  • (二)丶RabbitMQ的六大核心
  • (回溯) LeetCode 40. 组合总和II
  • (回溯) LeetCode 46. 全排列
  • (每日持续更新)信息系统项目管理(第四版)(高级项目管理)考试重点整理 第13章 项目资源管理(七)
  • (三分钟)速览传统边缘检测算子
  • (十一)图像的罗伯特梯度锐化
  • (四)Linux Shell编程——输入输出重定向
  • (四)进入MySQL 【事务】
  • (一)项目实践-利用Appdesigner制作目标跟踪仿真软件