当前位置: 首页 > news >正文

开源大模型源代码

开源大模型的源代码可以在多个平台上找到,以下是一些知名的开源大模型及其源代码的获取方式:

1. **艾伦人工智能研究所的开放大语言模型(Open Language Model,OLMo)**:
   - 提供了完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。
   - 包含了一个高达3T token的预训练开源语料库,以及产生这些训练数据的代码。
   - 提供了四个不同架构、优化器和训练硬件体系下的7B大小的模型,以及一个1B大小的模型,所有模型都在至少2T token上进行了训练。
   - 提供了用于模型推理的代码、训练过程的各项指标以及训练日志<searchIndex index="1" />。

2. **BERT**:
   - BERT项目的源代码可以在GitHub上找到,地址为:https://github.com/google-research/bert#fine-tuning-with-bert<searchIndex index="2" />。

3. **ELMo**:
   - ELMO的源代码可以在GitHub上找到,地址为:https://github.com/allenai/allennlp<searchIndex index="2" />。

4. **蚂蚁集团的CodeFuse**:
   - CodeFuse是一个代码大模型,已经开源,可以在HuggingFace下载模型。
   - 开源内容包括代码框架、模型等,其中模型包括CodeFuse-13B、CodeFuse-CodeLlaMa34B-MFT两个大模型。

5. **DeepSeek Coder**:
   - DeepSeek Coder是一个智能代码助手,可以在Hugging Face和GitHub上开源。
   - 在国际权威数据集的测试中表现出色<searchIndex index="3" />。

6. **LLaMA**:
   - LLaMA的源码可以在transformers仓库中找到,地址为:https://github.com/huggingface/transformers<searchIndex index="4" />。

请注意,获取开源大模型的源代码时,需要遵守相应的许可协议,并在使用时引用原始来源。同时,由于开源项目的更新和维护可能会发生变化,建议直接访问上述提供的链接以获取最新的源代码和相关信息。

相关文章:

  • chap5 CNN
  • 使用 Vue 3 和 vue-print-nb 插件实现复杂申请表的打印
  • 大宋咨询(深圳车主满意度调查)如何开展汽车展会观众满意度问卷调查
  • JVM思维导图
  • java配置文件解析yml/xml/properties文件
  • 成绩发布小程序哪个好用?
  • 【Word】调整列表符号与后续文本的间距
  • 【Linux】常见命令:fping的介绍和用法举例
  • 线程思维导图
  • 【JS重点知识02】栈、堆与数据类型 关系
  • 【前端视野下的数据库概念探秘】——信息化人员必备知识面试宝典:解码“视图”与“游标”
  • Ollama+OpenWebUI+Phi3本地大模型入门
  • 安卓手机在开发者模式下 打开wifi调试功能的相关 adb 命令
  • vue canvas绘制信令图二、
  • Crosslink-NX器件应用连载(10): 图像输入并通过HDMI输出
  • 【node学习】协程
  • 2019.2.20 c++ 知识梳理
  • canvas实际项目操作,包含:线条,圆形,扇形,图片绘制,图片圆角遮罩,矩形,弧形文字...
  • CEF与代理
  • ES6语法详解(一)
  • javascript面向对象之创建对象
  • Octave 入门
  • PHP变量
  • Redis中的lru算法实现
  • tensorflow学习笔记3——MNIST应用篇
  • 排序(1):冒泡排序
  • 如何使用 OAuth 2.0 将 LinkedIn 集成入 iOS 应用
  • 吴恩达Deep Learning课程练习题参考答案——R语言版
  • 学习笔记:对象,原型和继承(1)
  • 1.Ext JS 建立web开发工程
  • 阿里云API、SDK和CLI应用实践方案
  • 翻译 | The Principles of OOD 面向对象设计原则
  • 如何在招聘中考核.NET架构师
  • 智能情侣枕Pillow Talk,倾听彼此的心跳
  • ​十个常见的 Python 脚本 (详细介绍 + 代码举例)
  • #100天计划# 2013年9月29日
  • #AngularJS#$sce.trustAsResourceUrl
  • $(selector).each()和$.each()的区别
  • (02)Unity使用在线AI大模型(调用Python)
  • (java)关于Thread的挂起和恢复
  • (LLM) 很笨
  • (初研) Sentence-embedding fine-tune notebook
  • (附源码)spring boot儿童教育管理系统 毕业设计 281442
  • (附源码)ssm考试题库管理系统 毕业设计 069043
  • (论文阅读31/100)Stacked hourglass networks for human pose estimation
  • (十八)devops持续集成开发——使用docker安装部署jenkins流水线服务
  • (转)shell中括号的特殊用法 linux if多条件判断
  • (转)拼包函数及网络封包的异常处理(含代码)
  • ***测试-HTTP方法
  • ***汇编语言 实验16 编写包含多个功能子程序的中断例程
  • ./indexer: error while loading shared libraries: libmysqlclient.so.18: cannot open shared object fil
  • .net core使用EPPlus设置Excel的页眉和页脚
  • .net 逐行读取大文本文件_如何使用 Java 灵活读取 Excel 内容 ?
  • .net6 core Worker Service项目,使用Exchange Web Services (EWS) 分页获取电子邮件收件箱列表,邮件信息字段
  • /*在DataTable中更新、删除数据*/