当前位置: 首页 > news >正文

新书推荐 | 数据流机器学习:MOA实例

新书推荐

《数据流机器学习:MOA实例》

点击上图了解及购买

精彩地介绍数据流分析,并使用免费开源软件框架MOA展示最前沿方法。

编辑推荐

  1. 介绍大数据挖掘和实时分析中使用的算法和技术,并用热门的免费开源软件框架MOA进行了展示。

  2. 重点介绍数据流的挖掘和知识发现,强调适用于高速数据流的数据分析技巧。

  3. 理论与实践结合,含配套习题。

内容简介

这本书首先简要介绍了机器学习的主题,涵盖了大数据挖掘、数据流挖掘的基本方法,以及一个简单的MOA示例。接下来进行更详细的讨论,其中有关于草图技术、变更、分类、集成方法、回归、聚类和频繁模式挖掘的章节。这些章节中的大部分内容包括练习、基于MOA的实验,或者两者都有。最后,本书讨论了MOA软件,涵盖了MOA图形用户界面、命令行、其API的使用以及MOA中新方法的开发。对于那些想要使用数据流挖掘作为工具的读者、数据流挖掘的研究人员,以及想要为MOA创建新算法的程序员来说,这本书将是一个重要的参考。

本书分成三个部分。第一部分简要地介绍大数据流挖掘,包含三章。前两章介绍大数据流及其基本挖掘方法。后一章是MOA上手指南,读者可以作为参考,自行探索MOA。第二部分详细地展现了数据流挖掘中的常见问题和重要算法。由于涉及的知识面广阔,本书优先讲解MOA中已涵盖的算法。该部分第一章提到了sketch技巧,本书认为数据流挖掘领域人员很有必要对该技巧加以了解。大部分章节含有一套练习题或MOA上手教程,或两者兼具。第三部分全篇讲解MOA,从用户界面开始,到命令行和API,最后讲解如何实现新方法。

作者简介

Albert Bifet是巴黎高等电信学院的计算机科学教授,数据、智能和图形组的负责人,他的研究兴趣主要集中在人工智能、大数据科学和数据流的机器学习方面。

Richard Gavaldà是加泰罗尼亚理工大学的计算机科学教授。

Geoffrey Holmes是怀卡托大学的计算机科学系主任和教授。

Bernhard Pfahringer是奥克兰大学的计算机科学教授。

目录

译者序

前言

第一部分 概述

第1章 简介 2

1.1 大数据 2

1.1.1 工具:开源革命 4

1.1.2 大数据带来的挑战 4

1.2 实时分析 6

1.2.1 数据流 6

1.2.2 时间和内存 6

1.2.3 应用一览 6

1.3 关于本书 7

第2章 大数据流挖掘 8

2.1 算法 8

2.2 分类算法 9

2.2.1 如何在数据流中评估分类器 10

2.2.2 多数类分类器 11

2.2.3 无变化分类器 11

2.2.4 惰性分类器 11

2.2.5 朴素贝叶斯分类器 12

2.2.6 决策树分类器 12

2.2.7 集成分类器 13

2.3 回归算法 13

2.4 聚类算法 14

2.5 频繁模式挖掘 14

第3章 MOA的实际操作介绍 16

3.1 入门开始 16

3.2 分类模型的图形用户界面 18

3.3 用命令行操作 23

第二部分 数据流挖掘

第4章 数据流和Sketch数据结构 26

4.1 背景知识:近似算法 27

4.2 集中不等式 28

4.3 取样 30

4.4 统计总数 31

4.5 去重统计 32

4.5.1 线性计数 33

4.5.2 科恩对数计数器 33

4.5.3 Flajolet-Martin计数器和HyperLogLog算法 34

4.5.4 应用:图论的计算距离函数 36

4.5.5 讨论:对数与线性 37

4.6 频率问题 37

4.6.1 SpaceSaving sketch 38

4.6.2 CM-Sketch算法 40

4.6.3 CountSketch算法 42

4.6.4 时刻计算 44

4.7 滑动窗口的指数矩形图 45

4.8 分布式sketch计算的可合并性 47

4.9 一些技术方面的讨论和其他资料 48

4.9.1 哈希函数 48

4.9.2 创建(, )近似算法 49

4.9.3 其他sketch技术 49

4.10 练习 50

第5章 处理变化 52

5.1 数据流中变化的定义 52

5.2 评估器 56

5.2.1 滑动窗口和线性评估器 57

5.2.2 指数加权移动平均评估器 57

5.2.3 单维度卡尔曼滤波器 58

5.3 变化探测 58

5.3.1 评估变化探测 59

5.3.2 CUSUM测试和Page-Hinkley测试 59

5.3.3 统计测试 60

5.3.4 漂移探测法 61

5.3.5 自适应滑动窗口算法 62

5.4 与其他Sketch和多维数据结合 64

5.5 练习 64

第6章 分类 66

6.1 分类器评估 67

6.1.1 误差估算 68

6.1.2 分布评估 69

6.1.3 性能的评估测量 70

6.1.4 统计显著性 72

6.1.5 测量挖掘成本 73

6.2 基线分类器 73

6.2.1 多数类 73

6.2.2 无变化分类器 74

6.2.3 朴素贝叶斯 74

6.2.4 多项式朴素贝叶斯 77

6.3 决策树 78

6.3.1 估算切分标准 79

6.3.2 Hoeffding决策树 80

6.3.3 CVFDT 82

6.3.4 VFDTc和UFFT 83

6.3.5 Hoeffding适应树 84

6.4 处理数字属性 85

6.4.1 VFML 85

6.4.2 穷举二叉树 86

6.4.3 Greenwald和 Khanna的分位数摘要 86

6.4.4 高斯近似 87

6.5 感知器模型 88

6.6 惰性学习 89

6.7 多标签分类器 89

6.8 主动学习 91

6.8.1 随机策略 92

6.8.2 固定不确定策略 93

6.8.3 可变不确定策略 93

6.8.4 随机不确定策略 94

6.9 概念演变 94

6.10 MOA实战操作 95

第7章 集成方法 99

7.1 准确率加权集成 99

7.2 加权多数算法 100

7.3 堆叠算法 102

7.4 装袋算法 102

7.4.1 在线装袋算法 103

7.4.2 装袋算法如何应对数据流变化 103

7.4.3 杠杆装袋算法 103

7.5 提升算法 104

7.6 Hoeffding树集成算法 105

7.6.1 Hoeffding选项树算法 105

7.6.2 随机森林算法 105

7.6.3 有限的Hoeffding树的感知器堆叠 106

7.6.4 自适应大小的Hoeffding树算法 107

7.7 重复性概念 107

7.8 MOA实战操作 108

第8章 回归 110

8.1 什么是回归 110

8.2 如何评估回归 111

8.3 感知器学习 112

8.4 惰性学习 112

8.5 决策树学习 112

8.6 决策规则 113

8.7 MOA中的回归 114

第9章 聚类 115

9.1 聚类的评估方法 116

9.2 k-means算法 117

9.3 BIRCH、BICO和CluStream 118

9.4 基于密度的方法:DBSCAN和Den-Stream 120

9.5 ClusTree 121

9.6 StreamKM++:核心集 122

9.7 延伸阅读 123

9.8 MOA实战操作 124

第10章 频繁模式挖掘 127

10.1 什么是模式挖掘 127

10.1.1 模式的定义和例子 127

10.1.2 频繁模式挖掘的批量算法 129

10.1.3 闭合模式和最大模式 131

10.2 数据流中频繁模式挖掘的方法 131

10.3 如何在数据流中进行频繁项集挖掘 134

10.3.1 简化为高频繁项 134

10.3.2 Moment算法 135

10.3.3 频繁模式数据流算法 135

10.3.4 IncMine算法 136

10.4 数据流的频繁子图挖掘 137

10.4.1 WinGraphMiner框架 138

10.4.2 AdaGraphMiner框架 139

10.5 延伸阅读 140

10.6 练习 141

第三部分 MOA软件

第11章 MOA及其软件体系 144

11.1 MOA架构 145

11.2 安装 145

11.3 MOA的近期发展 145

11.4 MOA扩展包 146

11.5 ADAMS优化 147

11.6 MEKA优化 149

11.7 OpenML环境 150

11.8 StreamDM软件 150

11.9 Streams工具 151

11.10 Apache SAMOA 流媒体ML库 151

第12章 图形用户界面 154

12.1 初识图形用户界面 154

12.2 分类和回归 154

12.2.1 主要任务一览 156

12.2.2 数据源和数据生成器 157

12.2.3 贝叶斯分类器一览 160

12.2.4 决策树一览 160

12.2.5 元分类器(集成)一览 161

12.2.6 函数分类器一览 162

12.2.7 漂移分类器一览 162

12.2.8 主动学习分类器 163

12.3 聚类 163

12.3.1 数据源和数据生成器 163

12.3.2 数据流聚类算法一览 163

12.3.3 如何进行可视化和数据分析 164

第13章 用命令行操作 166

13.1 给分类和回归创建学习任务 166

13.2 给分类和回归创建评估任务 167

13.3 给分类和回归创建学习与评估任务 167

13.4 两种分类器的对比 168

第14章 调用API 170

14.1 MOA对象 170

14.2 选项 170

14.3 示例:先序评估 173

第15章 在MOA中开发新的方法 175

15.1 MOA中的主要类 175

15.2 创建新的分类器 176

15.3 编译分类器 183

15.4 MOA中的良好编程方法 183

参考文献 185

你与世界

只差一个

公众号

相关文章:

  • #我与Java虚拟机的故事#连载10: 如何在阿里、腾讯、百度、及字节跳动等公司面试中脱颖而出...
  • 2020大风口!什么是图神经网络?有什么用?终于有人讲明白了
  • #我与Java虚拟机的故事#连载11: JVM学习之路
  • #我与Java虚拟机的故事#连载12:一本书带我深入Java领域
  • 机器学习入门必读:6种简单实用算法及学习曲线、思维导图
  • 什么是折线图?怎样用Python绘制?怎么用?终于有人讲明白了
  • #我与Java虚拟机的故事#连载13:有这本书就够了
  • 小程序三周年:超8000亿交易额,商业生态正当时
  • #我与Java虚拟机的故事#连载14:挑战高薪面试必看
  • 新手学Python, 如何从入门到入土变为从入门到快速上车?
  • #我与Java虚拟机的故事#连载15:完整阅读的第一本技术书籍
  • 沿用70多年的经典数据可视化方法,如何用Python实现?
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • 学AI哪家强?2019全球排行清华第1,北大第2
  • #我与Java虚拟机的故事#连载17:我的Java技术水平有了一个本质的提升
  • 分享的文章《人生如棋》
  • [译] 怎样写一个基础的编译器
  • Docker容器管理
  • flutter的key在widget list的作用以及必要性
  • JavaScript设计模式与开发实践系列之策略模式
  • JWT究竟是什么呢?
  • LeetCode541. Reverse String II -- 按步长反转字符串
  • Vim 折腾记
  • Vue2.0 实现互斥
  • Zepto.js源码学习之二
  • 不用申请服务号就可以开发微信支付/支付宝/QQ钱包支付!附:直接可用的代码+demo...
  • 排序算法学习笔记
  • 线上 python http server profile 实践
  • 小程序上传图片到七牛云(支持多张上传,预览,删除)
  • 再次简单明了总结flex布局,一看就懂...
  • 主流的CSS水平和垂直居中技术大全
  • Play Store发现SimBad恶意软件,1.5亿Android用户成受害者 ...
  • 教程:使用iPhone相机和openCV来完成3D重建(第一部分) ...
  • ​​快速排序(四)——挖坑法,前后指针法与非递归
  • #DBA杂记1
  • #pragma 指令
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • (C#)Windows Shell 外壳编程系列9 - QueryInfo 扩展提示
  • (Demo分享)利用原生JavaScript-随机数-实现做一个烟花案例
  • (webRTC、RecordRTC):navigator.mediaDevices undefined
  • (十七)Flask之大型项目目录结构示例【二扣蓝图】
  • (一)Thymeleaf用法——Thymeleaf简介
  • . ./ bash dash source 这五种执行shell脚本方式 区别
  • .form文件_SSM框架文件上传篇
  • .net core webapi 大文件上传到wwwroot文件夹
  • .NET/C# 项目如何优雅地设置条件编译符号?
  • // an array of int
  • /usr/bin/env: node: No such file or directory
  • [16/N]论得趣
  • [2018/11/18] Java数据结构(2) 简单排序 冒泡排序 选择排序 插入排序
  • [AIGC] 如何建立和优化你的工作流?
  • [AS3]URLLoader+URLRequest+JPGEncoder实现BitmapData图片数据保存
  • [Big Data - Kafka] kafka学习笔记:知识点整理
  • [BUUCTF 2018]Online Tool
  • [C++打怪升级]--学习总目录