当前位置: 首页 > news >正文

Fréchet Inception Distance(FID)原理

原理概述:

FID 的核心思想是通过比较真实图像和生成图像在 Inception 模型特征空间中的分布差异,来评估生成模型的性能。它假设从真实数据和生成数据中提取的特征都近似服从高斯分布。

具体步骤:

  1. 特征提取:使用预训练的 Inception 模型分别对真实图像和生成图像进行处理,得到各自的特征向量。

  2. 计算均值和协方差

    • 对于真实图像的特征向量集合,计算其均值向量 μ r e a l \mu_{real} μreal 和协方差矩阵 Σ r e a l \Sigma_{real} Σreal
    • 对于生成图像的特征向量集合,计算其均值向量 μ g e n \mu_{gen} μgen 和协方差矩阵 Σ g e n \Sigma_{gen} Σgen
  3. 计算 Fréchet 距离

FID 定义为两个多元高斯分布(分别由真实图像特征和生成图像特征的均值和协方差描述)之间的 Fréchet 距离。其计算公式为:
在这里插入图片描述

其中:

  • μ 1 \mu_1 μ1 μ 2 \mu_2 μ2 分别是两个分布的均值向量。
  • Σ 1 \Sigma_1 Σ1 Σ 2 \Sigma_2 Σ2 分别是两个分布的协方差矩阵。
  • ∣ ∣ ⋅ ∣ ∣ ||\cdot|| ∣∣∣∣ 表示欧几里得范数。
  • T r Tr Tr 表示矩阵的迹。
  • Σ 1 1 / 2 \Sigma_1^{1/2} Σ11/2 表示 Σ 1 \Sigma_1 Σ1 的平方根矩阵。

原理解释:

  • ∣ ∣ μ 1 − μ 2 ∣ ∣ 2 ||\mu_1 - \mu_2||^2 ∣∣μ1μ22 这一项衡量了两个分布均值之间的差异,反映了生成图像和真实图像在特征空间中的中心位置的偏离程度。
  • T r ( Σ 1 + Σ 2 − 2 ( Σ 1 1 / 2 Σ 2 Σ 1 1 / 2 ) 1 / 2 ) Tr(\Sigma_1 + \Sigma_2 - 2(\Sigma_1^{1/2}\Sigma_2\Sigma_1^{1/2})^{1/2}) Tr(Σ1+Σ22(Σ11/2Σ2Σ11/2)1/2) 这一项则考虑了两个分布的协方差结构差异,反映了生成图像和真实图像在特征空间中的散布和相关性的不同。

综上所述,FID 综合考虑了均值和协方差的差异,从而给出一个数值来量化生成图像的特征分布与真实图像的特征分布的相似度。较小的 FID 值表示生成图像的特征分布更接近真实图像,意味着生成模型的性能更好。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Mysql中的锁机制详解
  • 屏幕像素初步认识
  • 网站如何针对不同的DDOS进行防御?
  • 步进电机基本知识
  • 前端框架的演变与选择
  • P7492 [传智杯 #3 决赛] 序列
  • 未能启动xxx.vmx文件
  • Excel 将行和列转置的两种方法
  • Python 数据分析— Pandas 基本操作(中)
  • pikachu文件包含漏洞靶场(本地文件包含+远程文件包含关卡)
  • 维信小程序禁止截屏/录屏
  • sqlalchemy简单使用
  • 统一NLP和目标检测的DETR(一)——self attention、encoder、decoder
  • Android14音频进阶之定制ramdisk文件系统init服务(八十三)
  • Java Web —— 扩展(Maven高级)
  • 2017届校招提前批面试回顾
  • CentOS7 安装JDK
  • JS 面试题总结
  • MySQL的数据类型
  • windows下如何用phpstorm同步测试服务器
  • 分享几个不错的工具
  • 服务器从安装到部署全过程(二)
  • 什么是Javascript函数节流?
  • 使用agvtool更改app version/build
  • 详解移动APP与web APP的区别
  • 优秀架构师必须掌握的架构思维
  • 【运维趟坑回忆录 开篇】初入初创, 一脸懵
  • 回归生活:清理微信公众号
  • ​一、什么是射频识别?二、射频识别系统组成及工作原理三、射频识别系统分类四、RFID与物联网​
  • !!java web学习笔记(一到五)
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • (11)MATLAB PCA+SVM 人脸识别
  • (Java数据结构)ArrayList
  • (深度全面解析)ChatGPT的重大更新给创业者带来了哪些红利机会
  • (十一)手动添加用户和文件的特殊权限
  • (四) Graphivz 颜色选择
  • (五十)第 7 章 图(有向图的十字链表存储)
  • (一)使用Mybatis实现在student数据库中插入一个学生信息
  • (转)C#开发微信门户及应用(1)--开始使用微信接口
  • .DFS.
  • .equal()和==的区别 怎样判断字符串为空问题: Illegal invoke-super to void nio.file.AccessDeniedException
  • .net core Swagger 过滤部分Api
  • .net core使用ef 6
  • .NET 常见的偏门问题
  • .NET 设计模式—简单工厂(Simple Factory Pattern)
  • @RequestMapping处理请求异常
  • @RequestParam @RequestBody @PathVariable 等参数绑定注解详解
  • @Transactional 竟也能解决分布式事务?
  • [100天算法】-x 的平方根(day 61)
  • [AI 大模型] Meta LLaMA-2
  • [C#学习笔记]注释
  • [C++]指针与结构体
  • [c语言]小课堂 day2
  • [dart学习]第四篇:函数
  • [Effective C++读书笔记]0012_复制对象时勿忘其每一部分