当前位置: 首页 > news >正文

学倦乱语

输入一个样本x,对样本x提取k个特征,根据这k个特征对x进行分类。
布隆过滤器:输入一个样本x,对x求k个哈希值,根据这k个哈希值对x进行分类:包含或者不包含。

机器学习中的样本集,必然是样本数远远大于类别数。
哈希,就是映射,就是函数。
函数就是在集合之间建立联系。
集合就是一个包含很多点的空间。
一切分类器最终都是若干个数字映射成若干个数字,终究是用数字描述的空间。
样本空间的容量必然大于类别空间的容量。
从样本空间到类别空间相当于压缩、哈希。

将N个布隆过滤器组合起来,就得到了一个神经网络一样的东西,它的输出有N个,这N个0、1值就可以表示类别的二进制表示。

对于包含N个类别的样本集,如果用one-hot方式,那就需要N个输出单元,如果使用二进制表示,那就可以只需要log2(N)个输出单元。
也可以训练log2N个神经网络,每个神经网络都输出一个值:0~1之间的数值。这样就越发像将若干个布隆过滤器拼起来了。

围棋、象棋关键也是一个分类器,即:将一个局面判为胜、负、和三种状态的分类器。棋的局面是天文数字,无法将这些样本集全部保存下来,但可以用另一种方式来“存储”这个样本集:函数。

描述事物的变化,就用到函数。
描述函数有两种方式:描点法,解析式法。
描点法需要大量的点,解析式法只要函数形式一固定,就只需要知道解析式的几个参数就够了。
所有的分类器都是固定的函数形式,它们学习的过程就是寻找参数的过程。
描点法在数据量小时比较直观。
解析式法给人以无限想象空间。
描点法是授人以鱼,解析式法是授人以渔。
给我一堆点,我只得到了这些点。给我一个解析式,我能够求出无数个点来。

描述简谐振动有两种方法:

  • 描述它的运动形式:y=sin(x)
  • 描述小球的受力形式:F=k*(dx)

描述事物的外在形式与描述事物的内在机理,二者一直都是描述事物的两种方式。
黑盒子与白盒子。把事物看做黑盒子,自己推断它的内部构造,这就是描点法。把事物看成白盒子,弄清原理,自然就可以推导出它的输出是怎样的。
这也是学习的两种方法。有的人不爱追求原理,甘当“调包侠”; 有的人追求底层,非看源码、懂原理心里才踏实。
先弄懂事物的外在形式,心里自然会对事物有一个直观的认识,并且可以推测事物的内部构造,进而明白事物的原理。
剑宗与气宗,招式与心法,外功与内力。

相关文章:

  • MongoDB分布式存储的MapReduce并行查询
  • CentOS6.x安装nginx1.12.1
  • 【JDK1.8】JDK1.8集合源码阅读——TreeMap(二)
  • jstat 监控调整GC很好用
  • $(document).ready(function(){}), $().ready(function(){})和$(function(){})三者区别
  • RegexOptions.Compiled真的是性能杀手么?
  • Android 从服务器获取时间戳转换为年月日
  • java uuid第一次性能
  • 精度计算-大数乘小数
  • C#~异步编程再续~await与async引起的w3wp.exe崩溃-问题友好的解决
  • Android 中文API (68) —— BluetoothClass.Service
  • 一加3T解锁OEM、刷入TWRP、第三方ROM以及ROOT
  • Binlog中最容易踩到的坑
  • 图解HashMap(二)
  • 安装编译bind
  • [NodeJS] 关于Buffer
  • [译]Python中的类属性与实例属性的区别
  • 【JavaScript】通过闭包创建具有私有属性的实例对象
  • 【许晓笛】 EOS 智能合约案例解析(3)
  • ComponentOne 2017 V2版本正式发布
  • in typeof instanceof ===这些运算符有什么作用
  • Laravel 中的一个后期静态绑定
  • Laravel5.4 Queues队列学习
  • SpiderData 2019年2月16日 DApp数据排行榜
  • Web标准制定过程
  • 安卓应用性能调试和优化经验分享
  • 从0到1:PostCSS 插件开发最佳实践
  • 关于使用markdown的方法(引自CSDN教程)
  • 前端每日实战 2018 年 7 月份项目汇总(共 29 个项目)
  • 容器服务kubernetes弹性伸缩高级用法
  • 融云开发漫谈:你是否了解Go语言并发编程的第一要义?
  • 三分钟教你同步 Visual Studio Code 设置
  • 微信小程序上拉加载:onReachBottom详解+设置触发距离
  • 我看到的前端
  • 携程小程序初体验
  • 《天龙八部3D》Unity技术方案揭秘
  • ​​​​​​​sokit v1.3抓手机应用socket数据包: Socket是传输控制层协议,WebSocket是应用层协议。
  • ​草莓熊python turtle绘图代码(玫瑰花版)附源代码
  • #{}和${}的区别是什么 -- java面试
  • #mysql 8.0 踩坑日记
  • (4)STL算法之比较
  • (poj1.3.2)1791(构造法模拟)
  • (二)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (二十一)devops持续集成开发——使用jenkins的Docker Pipeline插件完成docker项目的pipeline流水线发布
  • (附源码)springboot掌上博客系统 毕业设计063131
  • (离散数学)逻辑连接词
  • (万字长文)Spring的核心知识尽揽其中
  • (转载)从 Java 代码到 Java 堆
  • (自适应手机端)响应式新闻博客知识类pbootcms网站模板 自媒体运营博客网站源码下载
  • .“空心村”成因分析及解决对策122344
  • .bat文件调用java类的main方法
  • .NET 4.0网络开发入门之旅-- 我在“网” 中央(下)
  • .NET CORE使用Redis分布式锁续命(续期)问题
  • .net core使用RPC方式进行高效的HTTP服务访问
  • .net 提取注释生成API文档 帮助文档