当前位置: 首页 > news >正文

大模型日报 2024-08-24

大模型日报

2024-08-24

大模型资讯

大模型产品

大模型论文

  1. RuleAlign:提升LLM诊断能力的规则对齐框架
  • 摘要: RuleAlign框架通过对齐诊断规则,提升GPT-4等大语言模型的诊断能力。实验结果证明该方法有效,展示了LLM作为AI医生的潜力。
  1. MuMA-ToM:多模态多智能体心智理论模型
  • 摘要: MuMA-ToM是首个评估多模态多智能体心智理论的基准,验证了LIMP模型在复杂社交场景中的优越性能。
  1. Jamba-1.5: 混合Transformer-Mamba模型
  • 摘要: Jamba-1.5是基于混合Transformer-Mamba架构的大型语言模型,具有高吞吐量和低内存使用,支持256K上下文长度。
  1. ssProp: 高效卷积神经网络训练方法
  • 摘要: 提出一种通用节能卷积模块,通过通道稀疏性和梯度选择调度器减少40%计算量,降低能耗和碳足迹。
  1. MedS-Bench: 医疗大模型评估与构建
  • 摘要: 本文提出MedS-Bench基准,评估6种大模型在11项临床任务中的表现,并开发了MedS-Ins数据集提升模型性能。
  1. MEDCO: 基于多代理系统的医学教育助手
  • 摘要: MEDCO通过模拟真实医疗环境,结合多代理系统,提升医学教育中的互动性和多学科协作,显著改善学生学习表现。
  1. GenderCARE: 大型语言模型性别偏见评估与减缓框架
  • 摘要: GenderCARE框架通过创新标准和技术,评估与减少大型语言模型中的性别偏见,涵盖多样性和包容性。
  1. Vintern-1B: 高效越南语多模态大模型
  • 摘要: Vintern-1B结合Qwen2-0.5B语言模型与InternViT-300M视觉模型,优化越南语OCR、文档提取及问答任务。
  1. 时序序列感知模型在少样本动作识别中的应用
  • 摘要: 本文提出了一种新颖的时序序列感知模型(TSAM)用于少样本动作识别,结合空间和时序动态信息。实验结果表明,该方法在五个数据集上均设立了新基准。

大模型开源项目

  1. QuivrHQ: 开源RAG框架
  • 摘要: QuivrHQ是一个开源的RAG框架,支持使用Langchain和GPT等技术构建生产力助手,能高效检索和生成内容。
  1. 微软Phi-3小型语言模型指南
  • 摘要: Phi-3是微软开发的开源AI模型家族,具备高性价比,超越同类和更大模型,适用于语言、推理、编码和数学等领域。
  1. VILA: 多图像视觉语言模型
  • 摘要: VILA是一个多图像视觉语言模型,提供训练、推理和评估方案,可从云端部署到边缘设备(如Jetson Orin和笔记本电脑)。
  1. deepset-ai: 可定制的LLM应用框架
  • 摘要: deepset-ai是一个LLM编排框架,适用于构建RAG、问答、语义搜索和对话代理聊天机器人,支持高级检索方法。

以上就是20240824的大模型日报,很高兴为你服务!

本文由 mdnice 多平台发布

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 初识数据库
  • PG_RMAN 部署与使用
  • GB28181协议设备为何越来越受青睐?
  • 五、Centos7-安装Jenkins
  • ECMAScript性能优化技巧于陷阱
  • 前端手写源码系列(一)—— 手写防抖和节流
  • vue前端实现登录页面的验证码(新手版)
  • 基于x86 平台opencv的图像采集和seetaface6的人脸跟踪功能
  • OpenAI推出新功能:GPT-4o正式上线微调功能,限时免费!
  • TinaSDKV2.0 自定义系统开发
  • C++动态规划(背包问题)
  • Kubernetes(k8s)中部署WordPress
  • 在 Java 中使用泛型时遇到的问题,,无法正确将响应数据映射为需要的数据
  • 【微信小程序】导入项目
  • SEO之网站结构优化(十三-网站地图)
  • CSS 提示工具(Tooltip)
  • Druid 在有赞的实践
  • emacs初体验
  • Git同步原始仓库到Fork仓库中
  • Gradle 5.0 正式版发布
  • HTTP中GET与POST的区别 99%的错误认识
  • Js基础知识(一) - 变量
  • laravel 用artisan创建自己的模板
  • nginx 配置多 域名 + 多 https
  • Python 使用 Tornado 框架实现 WebHook 自动部署 Git 项目
  • Redis中的lru算法实现
  • 动态规划入门(以爬楼梯为例)
  • 力扣(LeetCode)56
  • 前端面试之闭包
  • 如何利用MongoDB打造TOP榜小程序
  • 微信小程序开发问题汇总
  • 小李飞刀:SQL题目刷起来!
  • 深度学习之轻量级神经网络在TWS蓝牙音频处理器上的部署
  • 400多位云计算专家和开发者,加入了同一个组织 ...
  • 移动端高清、多屏适配方案
  • ​iOS安全加固方法及实现
  • ​直流电和交流电有什么区别为什么这个时候又要变成直流电呢?交流转换到直流(整流器)直流变交流(逆变器)​
  • ## 临床数据 两两比较 加显著性boxplot加显著性
  • #laravel部署安装报错loadFactoriesFrom是undefined method #
  • #免费 苹果M系芯片Macbook电脑MacOS使用Bash脚本写入(读写)NTFS硬盘教程
  • #在 README.md 中生成项目目录结构
  • $.proxy和$.extend
  • ()、[]、{}、(())、[[]]命令替换
  • (~_~)
  • (1) caustics\
  • (C++17) std算法之执行策略 execution
  • (DenseNet)Densely Connected Convolutional Networks--Gao Huang
  • (Forward) Music Player: From UI Proposal to Code
  • (八)五种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (非本人原创)我们工作到底是为了什么?​——HP大中华区总裁孙振耀退休感言(r4笔记第60天)...
  • (分享)自己整理的一些简单awk实用语句
  • (回溯) LeetCode 40. 组合总和II
  • (六)激光线扫描-三维重建
  • (终章)[图像识别]13.OpenCV案例 自定义训练集分类器物体检测
  • .NET Core 项目指定SDK版本