当前位置: 首页 > news >正文

caffe源码 全连接层

图示全连接层

 

  • 如上图所示,该全链接层输入n * 4,输出为n * 2,n为batch
  • 该层有两个参数W和B,W为系数,B为偏置项
  • 该层的函数为F(x) = W*x + B,则W为4 * 2的矩阵,B 为 1 * 2 的矩阵

从公式理解全连接层

假设第N层为全连接层,输入为Xn,输出为Xn+1,其他与该层无关的信息可以忽略

  • 该层公式有Xn+1 = Fn(Xn) = W * Xn + B

前向传播

  • 已知Xn,Xn+1 = W * Xn + B, 为前向传播

反向传播

反响传播这里需要求两个梯度,loss 对 W的梯度 和 loss 对 B 的梯度,

  • loss 对 W 的梯度
    • 具体公式如下:image
  • loss 对 B 的梯度
    • 具体公式如下:image
  • 上面两个梯度都用到了loss 对 该层输出的梯度,所以在这层应该把loss 对该层输入的梯度传递到上一层。
    • 具体公式如下:image

caffe中innerproduct的代码

前向传播

这一步在代码里面分为两步:

  • Xn+1 = W * Xn,如下图:
    • image
  • Xn+1 = Xn+1 + B,如下图:
    • image
  • 和上面推导的一样

反向传播

这里需要求三个梯度,loss 对 W的梯度 ,loss 对 B的梯度, loss 对 Xn的梯度

  • loss 对 W 的梯度
    • 公式:image
    • 代码: image
    • 以上公式和推导的公式有点区别,后面加多loss 对W 的梯度,实现的是累积梯度
  • loss 对 B 的梯度
    • 公式:image
    • 代码:image
    • 以上公式和推导的公式有点区别,后面加多loss 对B 的梯度,实现的是累积梯度
  • loss 对 Xn 的梯度,:
    • 公式: image
    • 代码:image
    • 公式和推导的并无区别

转载于:https://www.cnblogs.com/ERKE/p/7630301.html

相关文章:

  • [Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子
  • 使用SQLite做本地数据缓存的思考
  • 与Brian Goetz聊Java的模式匹配
  • 感叹人生
  • Flash Builder 4.7 正式版下载、破解
  • 苹果开发者账号的区别,发布方式In-House和Ad Hoc区别
  • Safari on Windows已可良好支持中文!
  • chrome 图片助手下载
  • 智能社官网顶部导航实现demo
  • Azure Stack运维工具Azure Stack Tools的使用及实战
  • 2015年灾害脆弱性分析报告
  • iOS:延迟加载和上拉刷新/下拉加载的实现
  • Jetty总览
  • JS数据类型的转换规则
  • BusyBox ifup udhcpc后台运行
  • 【React系列】如何构建React应用程序
  • Android优雅地处理按钮重复点击
  • CSS 专业技巧
  • ES6--对象的扩展
  • ES6系列(二)变量的解构赋值
  • github从入门到放弃(1)
  • JS学习笔记——闭包
  • oschina
  • PHP 的 SAPI 是个什么东西
  • React 快速上手 - 06 容器组件、展示组件、操作组件
  • webpack入门学习手记(二)
  • 短视频宝贝=慢?阿里巴巴工程师这样秒开短视频
  • 机器学习学习笔记一
  • 简单数学运算程序(不定期更新)
  • 适配iPhoneX、iPhoneXs、iPhoneXs Max、iPhoneXr 屏幕尺寸及安全区域
  • 我有几个粽子,和一个故事
  • 怎么把视频里的音乐提取出来
  • 《码出高效》学习笔记与书中错误记录
  • #、%和$符号在OGNL表达式中经常出现
  • #define用法
  • #LLM入门|Prompt#2.3_对查询任务进行分类|意图分析_Classification
  • #pragma data_seg 共享数据区(转)
  • $.ajax()
  • (C语言)逆序输出字符串
  • (Matlab)遗传算法优化的BP神经网络实现回归预测
  • (八)Docker网络跨主机通讯vxlan和vlan
  • (三)c52学习之旅-点亮LED灯
  • (转)负载均衡,回话保持,cookie
  • (轉貼) 寄發紅帖基本原則(教育部禮儀司頒布) (雜項)
  • (最优化理论与方法)第二章最优化所需基础知识-第三节:重要凸集举例
  • *p=a是把a的值赋给p,p=a是把a的地址赋给p。
  • .Net mvc总结
  • .NET 常见的偏门问题
  • .NET教程 - 字符串 编码 正则表达式(String Encoding Regular Express)
  • .NET是什么
  • @Conditional注解详解
  • @synthesize和@dynamic分别有什么作用?
  • [ SNOI 2013 ] Quare
  • [ 网络基础篇 ] MAP 迈普交换机常用命令详解
  • [Apio2012]dispatching 左偏树