当前位置: 首页 > news >正文

深度学习和神经网络_神经网络与深度学习

非线性的世界

我们的世界是一个非线性的世界,我们能否让机器来学习现实中很多复杂的问题呢?从人类大脑结构中受到的启发,人们开始在一定程度上模拟大脑的结构。既然大脑能够理解这个世界,那人工神经网络应该也是可以的。

17bbeaa5da4248206186fa6cf039e990.png

timg

神经网络

简单的感知机属于线性模型,而通过嵌套多个神经网络层和增加神经元就可以解决很多复杂的问题。

整个神经网络模型包含了三要素:线性变换、非线性变换和线性决策。线性与非线性变换实际上就是坐标变换,将信息聚合到其他空间中。从线性到非线性属于特征变换,将某种特征转成另外一种特征。而多层神经网络就是做表征学习。

从数学上看,神经网络的嵌套就是多个函数嵌套,通过复杂的函数嵌套关系来描述特征关系。

684240a6e5ec83080bc62757870ae458.png

image

学习复杂关系

现实中存在很多复杂关系的事物,于是需要构建复杂的边界才能描述它们。那么要怎么来学习这些边界呢?我们可以把每个神经元看成一个简单边界描述,通过引入一个隐层,很多神经元就能描述很复杂的边界,即取很多神经元边界的交集。

fdc44a69432bd432692c7d55e03af426.png

timg (1)

超大浅层网络

既然引入一个隐层就能描述任意复杂的连续边界,那么是不是我们就可以说对任何复杂关系都只需要使用浅层网络就行呢?不管多复杂的关系,我增加神经元便是了,最终构建一个超大浅层网络来描述任意复杂关系。

9b182c076af45e807f75d794628aa0da.png

深度网络

超大浅层网络看似无敌,但它会引入维度灾难。超大浅层网络其实是将低纬度的特征表征到超高维度空间中,这样做将需要足够大的数据量才能进行学习。除此之外,还将会导致过拟合问题。

所以可以朝深度方向改进,将网络拆成更多层数,这样每一层都抽象不同的特征,也就是每一层抽象的程度都不相同。越往后的信息越抽象,就像人类对信息的处理,越靠近感官的信息越具体。比如看到一本书,眼睛最初看到的是书名和书的大小颜色等信息。往后处理,可能思考的是这本书的主题之类的信息。

总的来说,我们希望得到一个低纬度却能很好表示复杂关系的网络。

a1d62a1c18a5c291973679d0f4ee2526.png

相关文章:

  • oracle 不同用户 关联表_【DB笔试面试517】在Oracle中,什么是临时表?它有哪些分类?有关临时表需要注意什么?...
  • small用于不连续数组_左神直通BAT算法之找出B中不属于A的数
  • python接口自动化测试报告_python接口自动化(二十八)--html测试 报告——下(详解)...
  • python对键和值有没有类型限制_python基础之-数据类型
  • python编程小白变大神_零基础Python,从小白到大神的方法全在这了!
  • 如果表不存在则创建_当创建一个文件的时候,操作系统发生了什么
  • 胖终端和瘦终端的区别_企业级无线覆盖与家庭级无线覆盖的区别与发展趋势
  • pythonnode js结合_Node js 和 python 混合编程之JSON入参的区别 如何转换js对象使其能在python脚本中作为python 字典直接使用...
  • sql 统计每月入职离职人数_说离职就离职,他们就不害怕失业吗,为什么90后的离职率那么高...
  • redis 端口_基础架构之Redis
  • python check module_Python 的 module 机制(重要)
  • springboot技术架构图_阿里技术专家告诉你:如何画出优秀的架构图
  • python嗅探m3u8_python通过m3u8下载视频
  • 安装python3.6.1的步骤_在Linux上安装Python3.6.1
  • python单词按字典序输出_python – 我可以通过匹配键作为前缀在字典中保留新单词...
  • Cookie 在前端中的实践
  • Django 博客开发教程 8 - 博客文章详情页
  • ECS应用管理最佳实践
  • nfs客户端进程变D,延伸linux的lock
  • php面试题 汇集2
  • SwizzleMethod 黑魔法
  • vue 配置sass、scss全局变量
  • vuex 笔记整理
  • webpack4 一点通
  • 表单中readonly的input等标签,禁止光标进入(focus)的几种方式
  • -- 查询加强-- 使用如何where子句进行筛选,% _ like的使用
  • 对超线程几个不同角度的解释
  • 机器人定位导航技术 激光SLAM与视觉SLAM谁更胜一筹?
  • 聊聊hikari连接池的leakDetectionThreshold
  • 前端每日实战 2018 年 7 月份项目汇总(共 29 个项目)
  • 前端面试之闭包
  • 如何设计一个微型分布式架构?
  • 思考 CSS 架构
  • 算法之不定期更新(一)(2018-04-12)
  • 交换综合实验一
  • # 飞书APP集成平台-数字化落地
  • #{} 和 ${}区别
  • #NOIP 2014# day.1 生活大爆炸版 石头剪刀布
  • $.type 怎么精确判断对象类型的 --(源码学习2)
  • (39)STM32——FLASH闪存
  • (solr系列:一)使用tomcat部署solr服务
  • (附源码)springboot宠物管理系统 毕业设计 121654
  • (附源码)ssm航空客运订票系统 毕业设计 141612
  • (附源码)ssm基于jsp高校选课系统 毕业设计 291627
  • (四)鸿鹄云架构一服务注册中心
  • (原創) 系統分析和系統設計有什麼差別? (OO)
  • (转)Android学习系列(31)--App自动化之使用Ant编译项目多渠道打包
  • (转)ObjectiveC 深浅拷贝学习
  • (转)负载均衡,回话保持,cookie
  • (转)人的集合论——移山之道
  • (转载)在C#用WM_COPYDATA消息来实现两个进程之间传递数据
  • *p++,*(p++),*++p,(*p)++区别?
  • ./configure,make,make install的作用(转)
  • .dwp和.webpart的区别
  • .net core IResultFilter 的 OnResultExecuted和OnResultExecuting的区别