当前位置: 首页 > news >正文

VLM 系列——phi3.5-Vision——论文解读

一、概述

1、是什么

    论文全称《Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone》 是一系列大型语言模型(LLM) & 多模态大型语言模型(MLLM)。其中LLM包括phi-3-mini 3.8B、phi-3-small 7B、phi-3-medium 14B,phi-3-mini可以轻松地在现代手机上本地进行推理;多模态模型包括phi-3-vision(基于phi-3-mini & CLIP ViT-L/14) 4.2B。本文重点介绍多模态的phi-3-mini模型,该模型能够处理包括文本、图像在内的多种数据类型,具备图片描述、单图文问答、 多图问对话、视频理解对话 、json格式、高清OCR解析和表格理解(代码编写和debug、函数调用论文暂时未提)。注意因为基座模型主要使用英文训练,所以论文提到并且实测对中文图像识别和对话效果一般。

2、亮点

   目前端侧多模态模型中算很小的一个。(最近又出了一个mini monkey2.8B)

   在此版本中,模型具备了多帧图像理解和推理能力,这基于宝贵的客户

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Python Excel 操作全面总结
  • 气膜体育馆:学校体育设施的全新选择—轻空间
  • mac/windows 软件推荐
  • win11+vscode+Flutter 开发环境配置
  • Python OpenCV 入门指南
  • 八月二十九日(day 39)docker6
  • 个人笔记总结
  • ClickHousez中如何定时清理过期数据库?
  • Akka-集群
  • H264编码
  • 深度学习速通系列:贝叶思和SVM
  • 通过自定义注解、反射和AOP在Spring Boot中动态修改请求参数
  • Android运行时权限详解
  • 低通滤波器
  • Hive/Spark小文件解决方案(企业级实战)–参数和SQL优化
  • 《深入 React 技术栈》
  • 【个人向】《HTTP图解》阅后小结
  • git 常用命令
  • Java IO学习笔记一
  • Laravel5.4 Queues队列学习
  • LintCode 31. partitionArray 数组划分
  • Linux链接文件
  • node.js
  • 关于for循环的简单归纳
  • 关于Java中分层中遇到的一些问题
  • 机器学习中为什么要做归一化normalization
  • 前端 CSS : 5# 纯 CSS 实现24小时超市
  • 区块链共识机制优缺点对比都是什么
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • ​​​【收录 Hello 算法】9.4 小结
  • ​HTTP与HTTPS:网络通信的安全卫士
  • ​如何防止网络攻击?
  • # Swust 12th acm 邀请赛# [ K ] 三角形判定 [题解]
  • #我与Java虚拟机的故事#连载11: JVM学习之路
  • (1)安装hadoop之虚拟机准备(配置IP与主机名)
  • (附源码)ssm教师工作量核算统计系统 毕业设计 162307
  • (附源码)计算机毕业设计ssm基于B_S的汽车售后服务管理系统
  • (算法)Game
  • (文章复现)基于主从博弈的售电商多元零售套餐设计与多级市场购电策略
  • (一)springboot2.7.6集成activit5.23.0之集成引擎
  • (转)ObjectiveC 深浅拷贝学习
  • *算法训练(leetcode)第四十天 | 647. 回文子串、516. 最长回文子序列
  • .net 4.0发布后不能正常显示图片问题
  • .net core MVC 通过 Filters 过滤器拦截请求及响应内容
  • .net core 微服务_.NET Core 3.0中用 Code-First 方式创建 gRPC 服务与客户端
  • .net core使用ef 6
  • .Net mvc总结
  • .net(C#)中String.Format如何使用
  • .net8.0与halcon编程环境构建
  • .net的socket示例
  • .NET与 java通用的3DES加密解密方法
  • .net中生成excel后调整宽度
  • @Async注解的坑,小心
  • @Autowired多个相同类型bean装配问题
  • @data注解_一枚 架构师 也不会用的Lombok注解,相见恨晚