当前位置: 首页 > news >正文

机器学习---学习首页

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

逐步完善中…

1.数学

  1. 偏差与方差
  2. 拉格朗日
  3. 核函数
  4. 凸优化
  5. 协方差矩阵
  6. Hessian矩阵
  7. CDF(累计分布函数)
  8. 高斯概率密度函数
  9. 中心极限定理

2.机器学习

Java 机器学习 工具 & 库


1.处理小数据效果好
2.深度学习—大数据,超过500w;图像,语言方面效果奇好


  • SVD

  • 最小二乘法

  • 梯度下降法
  • 局部加权回归

    1.最大似然估计
    2.logistic回归
    3.感知器的初步—logistic的简化情节

  • 牛顿法

    1.介绍了牛顿方法
    2.广义线性模型
    3.多项式分布,softmax回归

  • 高斯判别分析

    1.高斯判别
    2.朴素贝叶斯

  • EM

  • 隐马尔可夫模型
  • 决策树向量机

决策树算法介绍及应用

  • K近邻
  • 支持向量机
  • PageRank
  • 强化学习
  • LDA
  • PCA
  • pLSA
  • LSI
  • ICA
  • 最大熵模型
  • 条件随机场
  • 最大熵隐马尔可夫模型
  • Gradient Boosting
  • K-Means
  • 贝叶斯逻辑斯蒂克回归
  • 关联规则挖掘
  • 随机森林

3.信息论

  1. 压缩率很高的数据结构
  2. 信息熵与信息增益
  3. 数据压缩原理
  4. 香农游戏
  5. 二维码原理

4.深度学习

机器学习的一个分支
各种编程语言的深度学习库整理
深度学习如何入门(知乎)
Elephas:Apache Spark上的Keras深度学习框架


  1. 感知器
  2. 反向传播算法
  3. 自动编码器
  4. 栈式自编码器
  5. 微调多层自编码算法
  6. 深度信息网络
  7. softmax回归
  8. 白化
  9. 池化
  10. 受限玻尔兹曼机
  11. 稀疏编码
  12. 递归神经网络
  13. 卷积神经网络—图像识别,语音识别,,.
  14. 前馈神经网络

5.全文检索

  1. 搜索建索引过程
  2. 搜索评分过程
  3. 搜索查询分析器
  4. Rocchio相关反馈算法
  5. 向量空间模型
  6. BM25基于概率的搜索评分
  7. Lucene源码分析
  8. solrcloud
  9. Solr空间搜索原理
  10. GeoHash算法
  11. 地理空间距离计算原理
  12. WAND检索算法
  13. 智能化信息检索模型
  14. Kullback-Leibler距离/相关熵
  15. 交叉熵

6.计算广告

  1. 正文广告
  2. 上下文广告
  3. 显示广告
  4. 合约广告
  5. 竞价广告
  6. 搜索广告
  7. 受众定向
  8. 竞价广告的定价机制
  9. eCPM估计
  10. 广义第二高价
  11. 精准人群定向
  12. 实时竞价
  13. 广告交易平台
  14. 需求方平台(DSP)程序购买
  15. 广告有效性原理
  16. 二部图匹配算法
  17. HWM算法
  18. 点击流挖掘
  19. 广告系统的一些商业模式
  20. 实时反作弊
  21. CTR点击预测
  22. 架构

7.自然语言处理


  • NLTK

  1. N-gram语言模型
  2. 词共现/TFIDF
  3. 噪声信道模型
  4. 统计分类模型
  5. 语义相关性
  6. 基于HMM的词性标注
  7. 统计语言模型的评价方法
  8. 扩充转移网络
  9. 动态规划算法
  10. 最小编辑距离
  11. 浅层句法分析技术
  12. 知识库的构建
  13. 命名实体识别
  14. 未登陆词识别
  15. 语言模型结构设计
  16. 树邻近语法
  17. 文本建模
  18. 随机上下文无关文法
  19. 概率上下文文法
  20. 同义词自动构建(词共现,基于浅层语法分析)
  21. 文本分类技术

8.架构

  1. OOP
  2. 聊天系统/实时高效信息系统架构与源码
  3. Bloom Filter 过滤器
  4. 分布式时钟(逻辑时钟) 同步技术
  5. SCALA
  6. Netty
  7. Jetty
  8. 一致性Hash
  9. 分布式基本组建
  10. 原子广播

9.爬虫

  1. 爬虫原理
  2. 分布式架构
  3. 通用爬虫
  4. 主题爬虫
  5. Nutch
  6. Xpath
  7. 网页去重
  8. URL去重

10.应用

  1. 人脸识别
  2. 垃圾邮件分类
  3. 文本聚类
  4. 语音合成(分解)
  5. 语音识别
  6. 手写识别
  7. 推荐系统
  8. 文档主题分析
  9. 二进制权限系统
  10. 搜索引擎关键字智能提示
  11. 最小敏感局部hash算法
  12. Simrank
  13. 手写输入法
  14. 为文本生成关键词和摘要
  15. 拼音缩写提取
  16. 汉字转拼音/拼音转汉字
  17. 机器翻译
  18. 自动提取标签
  19. 图片提取标题
  20. 文字生成图像
  21. 问答系统

11.Github中的开源项目

值得mark的11个开源机器学习项目


1.scikit-learn Github:scikit-learn
2.Shogun
Github:shogun
3.Accord Framework/AForge.net
Github:Accord Framework/AForge.net
4.Mahout
5.MLlib
6.H2O
Github:H2O
7.Cloudera Oryx
8.GoLearn
9.Weka
10.CUDA-convnet
11.ConvNetJS
Github:ConvNetJS

12.个人收集网址

  • Microsoft Research
  • 机器学习温和指南
  • 从零实现来理解机器学习算法:书籍推荐及障碍的克服
  • 伯乐在线—机器学习
  • Coursera
  • 台湾机器学习课程
  • 机器学习之开源库大总结
  • 推荐!国外程序员整理的机器学习资源大全
  • 机器学习经典书籍
  • 机器学习经典论文/survey合集
  • 人工智能和机器学习领域有哪些有趣的开源项目
  • 机器学习该怎么入门(知乎回答)
  • 整理:深度学习 vs 机器学习 vs 模式识别

13.机器学习需要了解的人物

1.吴恩达

2.中国大牛组

  • 周志华
    个人主页
  • 杨强
    个人主页
  • 李建中 —分布式数据库
  • 唐杰 —图挖掘
    个人主页
  • 张钹
  • 刘铁岩
    个人主页
  • 王海峰 —信息检索,NPL,机器翻译
    个人主页
  • 何晓飞 — 多媒体处理,图像检索,流型学习
    个人主页
  • 朱军
  • 吴军
    个人主页
  • 张栋
    个人主页
  • 戴文渊
    个人主页
  • 李航—华为诺亚方舟实验室
    华为诺亚方舟实验室

《中国大牛组》资源来源于小木虫
小木虫


14.会议论文收集

15.书籍

1.PRML—Pattern Recognition And Machine Learning
豆瓣


版权声明:本文为博主原创文章,未经博主允许不得转载。

转载于:https://my.oschina.net/juedaiyuer/blog/512447

相关文章:

  • Javascript和OCX的结合历程
  • 解析微信开发之搜索歌曲
  • rhel 6.5 x86_64 配置centos yum源
  • C/C++连接MySql数据库
  • 【转】【Linux】 临界区,互斥量,信号量,事件的区别
  • LA 2038 Strategic game(最小点覆盖,树形dp,二分匹配)
  • VMWare下虚拟机NAT共享方式上网的配置说明
  • hadoop中遇到的问题。
  • Android基础小技术点:Android ListView设置背景图片及分割线、周边距
  • 结构体
  • zabbix vfs.fs.discovery过滤
  • 主键生成
  • RDVTabBarController--可自由定制的iOS底部导航控件
  • 智能园区报修系统可行性分析
  • 堆排序学习笔记及堆排序算法的python实现
  • [译] React v16.8: 含有Hooks的版本
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • 【跃迁之路】【463天】刻意练习系列222(2018.05.14)
  • 77. Combinations
  • Android 架构优化~MVP 架构改造
  • CentOS7简单部署NFS
  • conda常用的命令
  • Cookie 在前端中的实践
  • CSS魔法堂:Absolute Positioning就这个样
  • CSS相对定位
  • dva中组件的懒加载
  • extract-text-webpack-plugin用法
  • Java,console输出实时的转向GUI textbox
  • Javascript弹出层-初探
  • Java比较器对数组,集合排序
  • node入门
  • 可能是历史上最全的CC0版权可以免费商用的图片网站
  • 前端技术周刊 2018-12-10:前端自动化测试
  • 如何实现 font-size 的响应式
  • 如何邀请好友注册您的网站(模拟百度网盘)
  • 算法系列——算法入门之递归分而治之思想的实现
  • 网络应用优化——时延与带宽
  • AI算硅基生命吗,为什么?
  • ​二进制运算符:(与运算)、|(或运算)、~(取反运算)、^(异或运算)、位移运算符​
  • (1)虚拟机的安装与使用,linux系统安装
  • (C++17) std算法之执行策略 execution
  • (c语言)strcpy函数用法
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (pytorch进阶之路)CLIP模型 实现图像多模态检索任务
  • (层次遍历)104. 二叉树的最大深度
  • (二)PySpark3:SparkSQL编程
  • (非本人原创)我们工作到底是为了什么?​——HP大中华区总裁孙振耀退休感言(r4笔记第60天)...
  • (附源码)ssm高校升本考试管理系统 毕业设计 201631
  • (每日持续更新)jdk api之StringBufferInputStream基础、应用、实战
  • (强烈推荐)移动端音视频从零到上手(下)
  • (译)计算距离、方位和更多经纬度之间的点
  • (转)微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计算机视觉与语言理解)...
  • ***监测系统的构建(chkrootkit )
  • ***通过什么方式***网吧
  • *2 echo、printf、mkdir命令的应用