当前位置：首页 > news >正文

大模型学习起步的经验分享

news 来源：原创 2024/9/20 14:29:31

我来聊聊这一年来的学习实践经验：

一、前期准备

首先就是显卡的问题，如果有条件，最好买一块，显卡的显存24GB起步，不要低于这个标准，这是目前不断演进的LLM流行版本的最低标准了。

显卡就是NVIDIA显卡，说白了就是为了cuda，有钱4090，没钱二手3090，不要对AMD显卡心存侥幸。

不要考虑耗电问题，绝大多数时间的耗电是空调引起的。

当然了，如果兜里没有那么多银两，也不必过于担心，就先从商用模型开始，首推智谱清言的开放平台，其次deepseek，通义千问，价格低，完全是补贴价，也非常不错。完全没必要为文心一言交智商税。

如果有能耐，claude、gpt4的智力输出肯定效果是最好的，但老美这点很恶心，怕我们进步。使用成本也较高，20刀一个月（聊天和API分开算）。

但是，对于学习实验，这两个头牌模型也不是啥必须品。

二、模型与API

以上是前置条件，下来具体怎么做，我接着说：

如果有显卡，其实主要可以学到是本地大模型的部署体验和微调。

对于模型的API调用，对于学习者并不用担心是商用模型还是本地模型，其实大家都有自己的专有接口，同时也都支持OpenAI API接口为标准。用OpenAI API接口，对于以后的程序来说更通用，学习成本也更低。例如：

添加图片注释，不超过 140 字（可选）

上述这段代码就是一个很简单的调用OpenAI API接口的例子，但已经跟OpenAI的GPT4没有什么关系了。

如果我们使用xinfernece_这组参数，那么我们就是通过Xinference服务（一会儿讲）提供的OpenAI接口来调用本地部署的LLM——glm4-chat（90亿参数）开源模型。

默认我们使用了zhipu_这组参数，那么我们就是通过互联网访问智谱开放平台提供的glm-4-0520（千亿参数）商用模型。

看起来是不是很简单。

三、大模型技术栈

接着我们说说大模型学习的体系：

LLM（本地 & 商用）->(推理 & 微调 & 提示词 ) -> (RAG & Tools) -> (workflow & Agent)。

我们可以根据上述的技术栈一步步向上开始学习。也就是说从最底层的大模型本体，到推理服务、微调训练和提示词能力，再到RAG检索增强或工具集增强，最后是AI工作流和智能体。当然了知识图谱、AI搜索也在凑大模型的热闹。

说说LLM本地化部署，目前看，比较适合单卡（24GB）推理的本地大模型有GLM4-9B、Qwen2-7B、deepseek，首推还是GLM4-9B，可能未来会推出的Qwen2.5也不可小觑，LLama3 8B不是太建议使用，主要还是中文能力真的不咋地，如果用到生产，真不知道对齐的怎么样，会不会胡说。

LLM本地部署最好的方案是使用推理框架，基本上就是两个中选择一个，Ollama或者Xinference，Ollama部署简单，但让给我推荐，我只会是Xinference，一方面是国内团队，更新速度快，另一方面就是支持的模型特别丰富。

推理框架的好处就是统一化了API接口，就是上面例子中看到的OpenAI API接口，那么你部署什么模型都一样去调用。