当前位置: 首页 > news >正文

【深度学习】—— 神经网络介绍

神经网络介绍

本系列主要是吴恩达深度学习系列视频的笔记,传送门:https://www.coursera.org/deeplearning-ai

目录

  • 神经网络介绍
    • 神经网络的应用
    • 深度学习兴起的原因

神经网络,全称人工神经网络(Artificial Neural Network,ANN),是一种受生物神经系统结构和功能启发的计算模型,专为复杂信息处理而设计。这个概念试图模仿人脑中神经元网络的组织方式来解决计算问题,尤其是在模式识别、分类、预测和决策制定等方面表现出色。

神经网络广泛应用于图像识别、自然语言处理、语音识别、推荐系统、金融预测等领域,是现代人工智能和机器学习技术的核心组件之一。

神经网络的应用

神经网络广泛应用于图像识别、自然语言处理、语音识别、推荐系统、金融预测等领域,是现代人工智能和机器学习技术的核心组件之一。

如今应用深度学习获利最多的一个领域,就是在线广告。这也许不是最鼓舞人心的,但真的很赚钱。具体就是通过在网站上输入一个广告的相关信息,因为也输入了用户的信息,于是网站就会考虑是否向你展示广告。神经网络已经非常擅长预测你是否会点开这个广告,通过向用户展示最有可能点开的广告,这就是神经 网络在很多家公司难以置信地提高获利的一种应用。因为有了这种向你展示你最有可能点击的广告的能力,而这一点击的行为的改变会直接影响到一些大型的在线广告公司的收入。

计算机视觉在过去的几年里也取得了长足的进步,这也多亏了深度学习。你可以输入一个图像,然后想输出一个索引,范围从 1到 1000来试着告诉你这张照片,它可能是,比方说, 1000个不同的图像中的任何一个,所以你可能会选择用它来给照片打标签。

深度学习最近在语音识别方面的进步也是非常令人兴奋的,你现在可以将音频片段输入神经网络,然后让它输出文本记录。得益于深度学习,机器翻译也有很大的发展。你可以利用神经网络输入英语句子,接着输出一个中文句子。

在自动驾驶技术中,你可以输入一幅图像,就好像一个信息雷达展示汽车前方有什么,据此,你可以训练一个神经网络,来告诉汽车在马路上面具体的位置,这就是神经网络在自动驾驶系统中的一个关键成分。

深度学习兴起的原因

深度学习和神经网络之前的基础技术理念已经存在大概几十年了,为什么它们现在才突然流行起来呢?

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

上面的这张图片中,横轴为数据量,纵轴为表现结果,红线为传统的机器学习模型,在数据量小的时候效果非常明显,但是在数据量变大的时候,效果提升变得不那么明显,上面的几种能够在数据量增大后依然保证效果提升即为神经网络,且神经网络规模越大,效果越好。

在之前的历史中,我们的数据量通常都很小,甚至达不到传统机器学习的瓶颈,所以只用机器学习就可以达到很好的效果。而前几年,随着大数据时代的到来,我们得到的数据量都十分巨大,数远超过机器学习算法能够高效发挥它们优势的规模,是大数据技术的成熟推动了神经网络的应用。

如果你想要获得较高的性能体现,那么你有两个条件要完成,第一个是你需要训练一个规模足够大的神经网络,以发挥数据规模量巨大的优点;另外,你的数据量需要能够达到传统机器学习的瓶颈位置,你需要很多的数据。因此我们经常说规模一直在推动深度学习的进步,这里的规模指的也同时是神经网络的规模。

在最近这几年,我们也见证了算法方面的极大创新。许多算法方面的创新,一直是在尝试着使得神经网络运行的更快。比如最常用到的ReLu函数替代sigmoid函数作为激活函数,关于ReLu函数的细节,我会在后面为你进行详细地讲解。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 倩女幽魂手游攻略:云手机自动搬砖辅助教程!
  • VueRouter3学习笔记
  • 【求助】ansible synchronize 问题
  • 【玩转C语言】第四讲--->操作符与循环语句
  • 未来AI大模型的发展趋势
  • MySQL之查询性能优化(十三)
  • 如何使用共享GPU平台搭建LLAMA3环境(LLaMA-Factory)
  • 【云原生】Kubernetes----RBAC用户资源权限
  • 适用于 Windows 的 8 大数据恢复软件
  • 地图商家数据怎么查看?揭秘采集软件工作原理!
  • Rust 实战丨SSE(Server-Sent Events)
  • 深度学习的点云分割
  • 【JS封装-工具函数】强化编程实践:精选JavaScript函数封装集锦-关于工具函数 (如深度克隆、浅拷贝、递归、防抖和节流等)
  • 【Python】使用 SQLObject orm 库快速将接口数据存入数据库
  • 家族企业如何找到合适的人才
  • hexo+github搭建个人博客
  • 4月23日世界读书日 网络营销论坛推荐《正在爆发的营销革命》
  • AWS实战 - 利用IAM对S3做访问控制
  • co模块的前端实现
  • Java 内存分配及垃圾回收机制初探
  • Java教程_软件开发基础
  • Rancher如何对接Ceph-RBD块存储
  • V4L2视频输入框架概述
  • VUE es6技巧写法(持续更新中~~~)
  • XML已死 ?
  • 阿里云爬虫风险管理产品商业化,为云端流量保驾护航
  • 安装python包到指定虚拟环境
  • 从tcpdump抓包看TCP/IP协议
  • 对象管理器(defineProperty)学习笔记
  • 检测对象或数组
  • 智能合约Solidity教程-事件和日志(一)
  • puppet连载22:define用法
  • Salesforce和SAP Netweaver里数据库表的元数据设计
  • 阿里云服务器如何修改远程端口?
  • # 数论-逆元
  • ###51单片机学习(2)-----如何通过C语言运用延时函数设计LED流水灯
  • (+4)2.2UML建模图
  • (007)XHTML文档之标题——h1~h6
  • (1)常见O(n^2)排序算法解析
  • (9)目标检测_SSD的原理
  • (poj1.3.2)1791(构造法模拟)
  • (Qt) 默认QtWidget应用包含什么?
  • (安全基本功)磁盘MBR,分区表,活动分区,引导扇区。。。详解与区别
  • (附源码)python旅游推荐系统 毕业设计 250623
  • (附源码)ssm考试题库管理系统 毕业设计 069043
  • (附源码)计算机毕业设计SSM智慧停车系统
  • (蓝桥杯每日一题)love
  • (小白学Java)Java简介和基本配置
  • (一)硬件制作--从零开始自制linux掌上电脑(F1C200S) <嵌入式项目>
  • (最完美)小米手机6X的Usb调试模式在哪里打开的流程
  • .equal()和==的区别 怎样判断字符串为空问题: Illegal invoke-super to void nio.file.AccessDeniedException
  • .NET CORE 3.1 集成JWT鉴权和授权2
  • .net framework profiles /.net framework 配置
  • .net 托管代码与非托管代码
  • .NET 中 GetProcess 相关方法的性能