当前位置: 首页 > news >正文

【AIGC半月报】AIGC大模型启元:2024.09(上)

【AIGC半月报】AIGC大模型启元:2024.09(上)

    • (1) OCR-2.0(旷视科技)
    • (2) MiniCPM 3.0(面壁智能)
    • (3) RAGLAB(RAG框架)
    • (4) Reflection 70B(HyperWrite)

(1) OCR-2.0(旷视科技)

2024.09.05 来自清华和旷视的研究团队提出了一个通用的OCR-2.0模型,其结构比OCR-1.0系统更简单,更专注于纯粹的OCR任务,并且具有更优越的性能。OCR-2.0将各种泛OCR任务集成到一个模型中,是模型设计、数据工程和应用场景中一个有价值的研究方向。团队推出GOT(General OCR Theory)模型的特点如下:

  • 模型能力:模型能够处理各种OCR任务中的上述所有类型的“字符”。
  • 参数规模:拥有5.8亿参数。
  • 端到端设计:是一个统一且优雅的端到端模型,包含高压缩编码器和长上下文解码器。
  • 输入支持:支持处理常用的场景和文档风格的图像,包括幻灯片和整页样式。
  • 输出灵活:能够通过简单的提示生成纯文本或格式化结果(如markdown、tikz、smiles、kern)。
  • 交互式OCR:具备交互式OCR功能,支持通过坐标或颜色引导的区域级识别。
  • 适应性:为GOT适配了动态分辨率和多页OCR技术,增强了模型的实用性。

推荐文章: 迈向OCR-2.0新时代:通过统一的端到端模型,实现文本、数学公式、表格、图表及乐谱等内容的精确处理,同时支持场景和文档风格等

(2) MiniCPM 3.0(面壁智能)

2024.09.05 端侧 ChatGPT 时刻到来!
旗舰端侧模型面壁「小钢炮」系列进化为全新 MiniCPM 3.0 基座模型,再次以小博大,以 4B 参数,带来超越 GPT-3.5 的性能,强得不像端侧模型。并且,量化后仅 2GB 内存,端侧友好。
这还是一款瑞士军刀般全面开挂的基座模型,一口气带来:

  • 无限长文本,榜单性能超越 Kimi,超长文本也不崩;
  • 性能比肩 GPT-4o 的端侧最强 Function Calling;
  • 超强 RAG 外挂三件套,中文检索第一、生成超 Llama3-8B。

推荐文章: 小模型杀疯了!仅4B参数性能超GPT-3.5!无限长文本性能超Kimi
模型地址: https://github.com/OpenBMB/MiniCPM

(3) RAGLAB(RAG框架)

2024.09.05 大型语言模型 (LLM) 在对话、推理和知识保留方面表现出色,但仍面临幻觉和知识实时更新等挑战。为解决这些问题,研究者采用检索增强生成 (RAG) 技术,但 RAG 的发展受限于缺乏算法比较和开源工具的透明度。为此,我们推出 RAGLAB,一个模块化、研究导向的开源库,重现 6 种算法并构建全面研究生态。借助 RAGLAB,我们在 10 个基准上公平对比 6 种算法,助力研究人员高效评估和创新算法。
RAGLAB 重现了六种已发表的 RAG 算法,分别是 Naive RAG、RRR、ITER-RETGEN、Self-ASK、Active RAG 和 Self-RAG。这些算法有诸多相似之处,每个高级的 RAG 算法本质上都是对 Naive RAG 的改进。
RAGALB 的设计理念源自 HuggingFace Transformer 库。用户只需从 Transformer 库中定义他们的模型,然后就能使用generate()方法进行推理。
RAGALB 将每个 RAG 算法实现为一个不同的类。每个算法类中的两个关键方法是init()和infer()。init()方法用于设置参数和加载生成器,而infer()方法实现算法的推理过程。

推荐文章: RAGLAB:又来一个RAG框架,还是模块化的
论文地址: https://arxiv.org/abs/2408.11381

(4) Reflection 70B(HyperWrite)

2024.09.06 快速更迭的开源大模型领域,又出现了新王:Reflection 70B。
横扫 MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了 GPT-4o,还击败了 405B 的 Llama 3.1。
这个新模型 Reflection 70B,来自 AI 写作初创公司 HyperWrite。Reflection 70B 的底层模型建立在 Meta 的 Llama 3.1 70B Instruct 上,并使用原始的 Llama chat 格式,确保了与现有工具和 pipeline 的兼容性。
Reflection 70B 已在多个基准测试中经过严格测试,包括 MMLU 和 HumanEval。测试结果表明, Reflection 的表现始终优于 Meta 的 Llama 系列,并与 GPT-4o 等全球顶尖的商用模型展开了激烈竞争。

推荐文章: 刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错
Hugging Face: https://huggingface.co/mattshumer/Reflection-70B
试用网址: https://reflection-playground-production.up.railway.app/

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 探究零工市场小程序如何改变传统兼职模式
  • vscode安装使用plantuml插件
  • 集成电路学习:什么是SDK软件开发工具包
  • vivado 添加多循环路径
  • 滑动窗口——632. 最小区间
  • 【原创】edge-tts与基于mpv的edge-playback,使命令行和Python的Text To Speech唾手可得
  • 学习计算机网络
  • Flowable学习笔记
  • NISP 一级 —— 考证笔记合集
  • ISO26262和Aspice之间的关联
  • TulingMember进销存系统
  • 2409atl,atl3.0到7.0的变化
  • 828华为云征文|Flexus云服务器X实例快速部署在线测评平台,适用各种信息学教学
  • EvoSuite使用总结
  • 【重学 MySQL】十四、显示表结构
  • Java 网络编程(2):UDP 的使用
  • Javascript弹出层-初探
  • Java读取Properties文件的六种方法
  • Java深入 - 深入理解Java集合
  • JS函数式编程 数组部分风格 ES6版
  • Linux后台研发超实用命令总结
  • miaov-React 最佳入门
  • Python 使用 Tornado 框架实现 WebHook 自动部署 Git 项目
  • Rancher-k8s加速安装文档
  • React-flux杂记
  • Spring Security中异常上抛机制及对于转型处理的一些感悟
  • SQLServer之创建显式事务
  • Sublime Text 2/3 绑定Eclipse快捷键
  • vue总结
  • 给github项目添加CI badge
  • 函数式编程与面向对象编程[4]:Scala的类型关联Type Alias
  • 前端学习笔记之原型——一张图说明`prototype`和`__proto__`的区别
  • 微服务入门【系列视频课程】
  • 学习笔记:对象,原型和继承(1)
  • 浅谈sql中的in与not in,exists与not exists的区别
  • 昨天1024程序员节,我故意写了个死循环~
  • ​queue --- 一个同步的队列类​
  • ​ssh-keyscan命令--Linux命令应用大词典729个命令解读
  • #android不同版本废弃api,新api。
  • #pragma预处理命令
  • (02)Hive SQL编译成MapReduce任务的过程
  • (16)UiBot:智能化软件机器人(以头歌抓取课程数据为例)
  • (CVPRW,2024)可学习的提示:遥感领域小样本语义分割
  • (C语言)strcpy与strcpy详解,与模拟实现
  • (Python第六天)文件处理
  • (vue)页面文件上传获取:action地址
  • (翻译)Quartz官方教程——第一课:Quartz入门
  • (附源码)spring boot北京冬奥会志愿者报名系统 毕业设计 150947
  • (附源码)spring boot公选课在线选课系统 毕业设计 142011
  • ***微信公众号支付+微信H5支付+微信扫码支付+小程序支付+APP微信支付解决方案总结...
  • .helper勒索病毒的最新威胁:如何恢复您的数据?
  • .NET Framework 4.6.2改进了WPF和安全性
  • .Net Web项目创建比较不错的参考文章
  • .NET/C# 解压 Zip 文件时出现异常:System.IO.InvalidDataException: 找不到中央目录结尾记录。
  • .NET单元测试使用AutoFixture按需填充的方法总结