当前位置: 首页 > news >正文

计算机在识别图像时“看到”了什么?

图像识别技术近来进步飞速。去年,微软和谷歌展示了能比人类更准确地识别图像的系统。

这些进步得益于一个叫做深度学习的技术,它涉及将数据通过模拟神经元的网络,以培养该网络在未来过滤数据(更多信息见“Teaching Machines to Understand Us”)。深度学习就是你可以使用关键字搜索存储在谷歌的照片(更多信息),Facebook 能识别你照片中你朋友的原因。 在图像识别上使用深度学习也使得机器人和自动驾驶汽车更有可行性,它甚至可以彻底改变医学(更多信息)。

图片描述

图像识别技术的能力和灵活性来自于, 当人工神经网络收到很多图像和图像类别的信息时,它可以自动计算出来重要的视觉特征。在深度学习中使用的神经网络被布置成不同的层,数据一层一层根据顺序通过。在训练过程中,在神经网络中的不同的层成为专门识别不同类型的视觉特征的网络层。图像识别中使用的神经网络类型,被称为卷积网,受到了动物的视觉皮层方面研究的启发。

“这些神经网络相比传统的计算机视觉方法,是一个巨大的飞跃,因为它们直接从数据中得出结果。”马修·蔡勒,Clarifai(Clarifai 提供了包括 buzzfeed 在内的公司组织和搜索照片和视频的服务) 的 CEO 说。程序员们曾经需要写出寻找视觉特征所需的数学程序,然而这些程序并不能创造出很多有用的产品。

当蔡勒还是一个研究生的时候, 他在纽约大学与罗博·宏泰合作开发了一种可视化神经网络运作的方法。在这个链接中的幻灯片中的图像将带你来到这个深度学习网络的内部,这个用了130万张照片训练过,打败了人类的图像识别神经网络。该网络识别了 1000 个截然不同的物件,包括蚊帐和蚊子,而幻灯片上显示了每个图像中最强烈的激活神经元网络的一个网络层的视觉特征。

原文链接:https://www.technologyreview.com/s/60111...

相关文章:

  • 基于SpringBoot和Redis实现短信验证码功能
  • iOS设计模式 - 外观
  • 大厂面试题:你知道JUC中的Semaphore、CyclicBarrier、CountDownLatch吗
  • 勤能补挫-简单But易错的JSCSS问题总结
  • Java16都快上线了,你该不会连Java8的特性都不会用吧?
  • ubuntu 更改密码
  • 从考研失败到最具成长力员工,这个2020就像过山车一样
  • 解析MySQL权限表
  • 图解Mysql索引的数据结构!看不懂你来找我
  • 如何用Java写一个规范的http接口?
  • Getting started with Java EE 8 MVC(1)
  • 产品经理问我:手动创建线程不香吗,为什么非要用线程池呢?
  • 将桌面上的硬盘移除
  • 白话Mysql的锁和事务隔离级别!死锁、间隙锁你都知道吗?
  • Jquery datatables 使用方法
  • ES6指北【2】—— 箭头函数
  • 【跃迁之路】【477天】刻意练习系列236(2018.05.28)
  • django开发-定时任务的使用
  • Javascript编码规范
  • JavaScript设计模式之工厂模式
  • Java多态
  • Linux后台研发超实用命令总结
  • Making An Indicator With Pure CSS
  • scrapy学习之路4(itemloder的使用)
  • WordPress 获取当前文章下的所有附件/获取指定ID文章的附件(图片、文件、视频)...
  • 力扣(LeetCode)22
  • 模型微调
  • 前端每日实战 2018 年 7 月份项目汇总(共 29 个项目)
  • 区块链将重新定义世界
  • 与 ConTeXt MkIV 官方文档的接驳
  • 最简单的无缝轮播
  • 阿里云服务器购买完整流程
  • ​ubuntu下安装kvm虚拟机
  • #define,static,const,三种常量的区别
  • #include<初见C语言之指针(5)>
  • (4)事件处理——(7)简单事件(Simple events)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第5章第5节(delphi中的指针)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第8章第5节(封闭类和Final方法)
  • (Git) gitignore基础使用
  • (附源码)springboot车辆管理系统 毕业设计 031034
  • (牛客腾讯思维编程题)编码编码分组打印下标题目分析
  • (七)Knockout 创建自定义绑定
  • (四)模仿学习-完成后台管理页面查询
  • (转)es进行聚合操作时提示Fielddata is disabled on text fields by default
  • (轉貼) VS2005 快捷键 (初級) (.NET) (Visual Studio)
  • .net 前台table如何加一列下拉框_如何用Word编辑参考文献
  • .Net下的签名与混淆
  • /var/log/cvslog 太大
  • ?.的用法
  • @Transactional 详解
  • @Transactional注解下,循环取序列的值,但得到的值都相同的问题
  • [ vulhub漏洞复现篇 ] Jetty WEB-INF 文件读取复现CVE-2021-34429
  • [20170713] 无法访问SQL Server
  • [20190401]关于semtimedop函数调用.txt
  • [Android]如何调试Native memory crash issue