当前位置: 首页 > news >正文

AI大眼萌探索 AI 新世界:Ollama 使用指南【1】

在人工智能的浪潮中,Ollama 的出现无疑为 Windows 用户带来了一场革命。这款工具平台以其开创性的功能,简化了 AI 模型的开发与应用,让每一位爱好者都能轻松驾驭 AI 的强大力量。大家好,我是AI大眼萌,今天我们将带大家了解这款工具平台。

🤖 什么是 Ollama?

Ollama 不仅仅是一个 AI 和 ML (Machine Learning)工具平台,它是技术社区中的一股清流,以其直观高效的工具,让 AI 模型的开发变得触手可及。无论是资深专家还是新手,都能在 Ollama 上找到自己的舞台。

🌟Ollama优势

在 AI 工具的海洋中,Ollama 以其独特优势脱颖而出:

  • 🔧 自动硬件加速:智能识别并利用最优硬件资源,简化配置,提升效率。
  • 🚫 无需虚拟化:告别复杂环境配置,直接投身于 AI 项目的开发。
  • 📚 接入丰富模型库:从 Lamma3到 qwen2,Ollama 的模型库应有尽有。
  • 🔗 Ollama 的常驻 API:简化 AI 功能与项目对接,提升工作效率。

🛠️ Ollama Windows使用指南

下面是如何在 Windows 上使用 Ollama 的详细指南:

步骤 1:下载与安装

  • 访问 Ollama Windows Preview页面,下载安装程序。

  • 双击运行,一键安装。
    在这里插入图片描述

步骤 2:启动与模型获取

  • 启动 Ollama

    Usage:ollama [flags]ollama [command]
    Available Commands:serve       Start ollamacreate      Create a model from a Modelfileshow        Show information for a modelrun         Run a modelpull        Pull a model from a registrypush        Push a model to a registrylist        List modelsps          List running modelscp          Copy a modelrm          Remove a modelhelp        Help about any command启动ollama服务:   ollama serve
    
  • 使用命令行加载模型,开始你的 AI 之旅。

    ollama run [modelname]
    ollama run gemma:2b
    

    在这里插入图片描述

执行以上命令后,Ollama 将开始初始化,并自动从 Ollama 模型库中拉取并加载所选模型。一旦准备就绪,就可以向它发送指令,它会利用所选模型来进行理解和回应。

在这里插入图片描述

  • 记得将modelname名称换成要运行的模型名称,常用的有:
ModelParametersSizeDownload
Qwen2 7B7B4.5Gollama run qwen:7b
Qwen2 72B72B41Gollama run qwen:72b
Llama 38B4.7GBollama run llama3
Llama 370B40GBollama run llama3:70b
Phi 3 Mini3.8B2.3GBollama run phi3
Phi 3 Medium14B7.9GBollama run phi3:medium
Gemma2B1.4GBollama run gemma:2b
Gemma7B4.8GBollama run gemma:7b
Mistral7B4.1GBollama run mistral
Moondream 21.4B829MBollama run moondream
Neural Chat7B4.1GBollama run neural-chat
Starling7B4.1GBollama run starling-lm
Code Llama7B3.8GBollama run codellama
Llama 2 Uncensored7B3.8GBollama run llama2-uncensored
LLaVA7B4.5GBollama run llava
Solar10.7B6.1GBollama run solar

模型存储在哪里?如需更换地点,可以参考环境配置章节

  • macOS: ~/.ollama/models
  • Linux: /usr/share/ollama/.ollama/models
  • Windows: C:\Users\%username%\.ollama\models

步骤 3:模型应用

在这里插入图片描述

步骤 4:API 连接

将 AI 功能整合到你的应用中,Ollama API 是关键。

默认端口为11434

在这里插入图片描述

Ollama Linux 使用指南

步骤 1:下载与安装

curl -fsSL https://ollama.com/install.sh | sh

在这里插入图片描述

步骤 2:启动与模型获取

ollama serve
ollama run [modelname]

在这里插入图片描述

步骤 3与4: 与之前一致。

Ollama 环境变量设置

在Linux上设置环境变量

如果Ollama作为systemd服务运行,通过systemctl设置环境变量:

  1. 使用systemctl edit ollama.service命令编辑systemd服务,将打开一个编辑器。

  2. 对每个环境变量,在[Service]部分添加一行Environment:

  3. [Service]

    Environment="OLLAMA_HOST=:8000" #要更改侦听地址和端口,可以环境变量:

  4. 保存并退出。

  5. 重新加载systemd并重启Ollama:

systemctl daemon-reload
systemctl restart ollama

在Windows上设置环境变量

在Windows上,Ollama会继承您的用户和系统环境变量。

1. 首先通过任务栏图标退出Ollama,
2. 从控制面板编辑系统环境变量,
3. 为OLLAMA_HOST、OLLAMA_MODELS等编辑或新建变量。a、要更改侦听地址和端口,可以添加以下环境变量:变量名:OLLAMA_HOST变量值(端口)::8000b、要更为debug模式,可以添加以下环境变量:变量名:OLLAMA_DEBUG变量值(端口):1  c、模型存储位置要更为指定路径变量名:OLLAMA_MODELS变量值(端口):指定的路径 
4. 点击OK/Apply保存,

使用代理服务器访问Ollama?

Ollama运行一个HTTP服务器,可以通过代理服务器,比如Nginx,进行公开。具体操作方法是配置代理转发请求,并可选设置所需的头部(如果不在网络上公开Ollama)。例如,使用Nginx配置如下:

  server {listen 80;server_name 192.168.70.1;  location / {proxy_pass http://localhost:11434;proxy_set_header Host localhost:11434;}}

使用python调用ollama

1、安装依赖库

pip install ollama langchain_community langchain  

2、测试代码

import ollama 
response =ollama.chat(model='qwen2:7b',messages=[{'role':'user','content':'中国的首都在哪里'},
])
print(response['message']['content'])

在这里插入图片描述

3、简单的人机交互界面

import ollama 
def get_completion(prompt):response =ollama.chat(model='qwen2:7b',messages=[{'role':'user','content':prompt},])return response['message']['content'].strip()while True:user_input = input("你: ")if user_input.lower() == '退出':print("聊天结束。")breakprint("\n机器人: 正在处理你的请求...")response = get_completion(user_input)print("机器人:", response)

结语

通过本教程,我们学习了 Ollama的简单安装与使用,让我们一起探索、实践、创新!
如果您发现这篇文章对您有所启发或帮助, 请不吝赐赞,为我【点赞】、【转发】、【关注】,带你一起玩转AI !

全网ID|AI大眼萌

相关文章:

  • windows下mysql修改 my.ini的datadir后 `Access denied`
  • Pentest Muse:一款专为网络安全人员设计的AI助手
  • C语言经典例题-19
  • 民生银行信用卡中心金融科技24届春招面经
  • 日期工具类:获取 当前周 | 上一周 | 下一周 的第一天(周一)和最后一天(周天)
  • sherpa-onnx说话人识别+语音识别自动开启(VAD)+语音识别Python API
  • Win11下安装VS2022失败的解决办法
  • Java编程小练习题目
  • 外包IT运维解决方案
  • CATO原理中的数学与魔术(十四)——流程设计思路与升华
  • 强化学习中的自我博弈(self-play)
  • 数据库精选题(三)(SQL语言精选题)(按语句类型分类)
  • 解决 uniapp h5 页面在私有企微iOS平台 间歇性调用uni api不成功问题(uni.previewImage为例)。
  • uniapp实现幻灯功能方法及代码
  • springboot 搭建一个 测试redis 集群连通性demo
  • #Java异常处理
  • 10个最佳ES6特性 ES7与ES8的特性
  • css布局,左右固定中间自适应实现
  • extjs4学习之配置
  • Hibernate最全面试题
  • JAVA_NIO系列——Channel和Buffer详解
  • Js基础知识(四) - js运行原理与机制
  • MyEclipse 8.0 GA 搭建 Struts2 + Spring2 + Hibernate3 (测试)
  • Redash本地开发环境搭建
  • Redis学习笔记 - pipline(流水线、管道)
  • Spark in action on Kubernetes - Playground搭建与架构浅析
  • springboot_database项目介绍
  • 从 Android Sample ApiDemos 中学习 android.animation API 的用法
  • 道格拉斯-普克 抽稀算法 附javascript实现
  • 构造函数(constructor)与原型链(prototype)关系
  • 关于Android中设置闹钟的相对比较完善的解决方案
  • 将 Measurements 和 Units 应用到物理学
  • 每天一个设计模式之命令模式
  • 浅谈JavaScript的面向对象和它的封装、继承、多态
  • 突破自己的技术思维
  • 微信小程序:实现悬浮返回和分享按钮
  • 用quicker-worker.js轻松跑一个大数据遍历
  • elasticsearch-head插件安装
  • 说说我为什么看好Spring Cloud Alibaba
  • 昨天1024程序员节,我故意写了个死循环~
  • #!/usr/bin/python与#!/usr/bin/env python的区别
  • #Java第九次作业--输入输出流和文件操作
  • #我与Java虚拟机的故事#连载10: 如何在阿里、腾讯、百度、及字节跳动等公司面试中脱颖而出...
  • #职场发展#其他
  • (1)Android开发优化---------UI优化
  • (十五)Flask覆写wsgi_app函数实现自定义中间件
  • (未解决)jmeter报错之“请在微信客户端打开链接”
  • ***linux下安装xampp,XAMPP目录结构(阿里云安装xampp)
  • ..thread“main“ com.fasterxml.jackson.databind.JsonMappingException: Jackson version is too old 2.3.1
  • .bat批处理(九):替换带有等号=的字符串的子串
  • .NET C# 使用 SetWindowsHookEx 监听鼠标或键盘消息以及此方法的坑
  • .net core 6 集成和使用 mongodb
  • .net SqlSugarHelper
  • .NET 读取 JSON格式的数据
  • .net实现头像缩放截取功能 -----转载自accp教程网