当前位置: 首页 > news >正文

Weka

         Weka是一款数据挖掘开源软件,由新西兰怀卡托大学开发的智能分析系统(Waikato Environment for Knowledge Analysis)。Weka同时也是一种只在新西兰生存的鸟,它不会飞,但是拥有好奇的天性。

         Weka是用Java写成的,安装需要jdk,它可以运行于几乎所有的操作平台,包括Linux,Windows等操作系统。

         Weka平台提供一个统一界面,汇集了当今最经典的机器学习算法及数据预处理工具。做为知识获取的完整系统,包括了数据输入、预处理、知识获取、模式评估等环节,以及对数据及学习结果的可视化操作。并且可以通过对不同的学习方法所得出的结果进行比较,找出解决当前问题的最佳算法。Weka集成了数据挖掘任务相关的机器学习算法。这些算法可以直接应用于数据集,或者你也可以自己编写Java代码调用它们。Weka包含各种用于数据预处理、分类、回归、聚类、关联规则以及可视化的工具。它也非常适合用于开发新的机器学习方法。

        2005年8月,在第11届ACM SIGKDD国际会议上,怀卡托大学的Weka小组荣获了数据挖掘和知识探索领域的最高服务奖,Weka系统得到了广泛的认可,被誉为数据挖掘和机器学习历史上的里程碑,是现今最完备的数据挖掘工具之一(已有11年的发展历史)

 

       Weka存储数据的格式是ARFF(Attribute-RelationFile Format)文件,这是一种ASCII文本文件

 

 

Weka界面

  • Explorer,WEKA中进行数据探索的软件环境。
  • Experimenter,针对基于不同数据集的不同机器学习方法进行实验和统计测试,大规模性能比较
  • KnowledgeFlow,功能和Explorer类似,但是使用拖拽的方式进行操作,同时它还支持增量学习。
  • Workbench,包含了其他应用的组合,可供用户选择使用。为其他的界面提供了统一的操作接口
  • SimpleCLI,一个简易的命令行接口,可以在不支持命令行的操作系统中直接调用Weka命令。

 

Weka数据

Weka与许多数据分析软件一样,Weka所处理的数据集是一个二维的表格.

 Weka处理的数据表格中,一个横行称为一个实例(Instance),竖行代表一个属性(Arrtibute),数据表格称为一个数据集,在weka看来,呈现了属性之间的一种关系(Relation)

 

ARFF文件示例

数据集中的每一个属性都有它对应的“@attribute”语句,来定义它的属性名称和数据类型

 

 

Explorer

Explorer是Weka的主要图形用户界面,包括预处理、分类、聚类、关联、属性选择以及可视化。

 

 

区域4,可以看到当前的特征、样本信息,并提供了特征选择和删除的功能。在区域4用鼠标选择单个特征后,

区域5将显示该特征的信息。包括最小值、最大值、期望和标准差。

区域6提供了可视化功能,选择特征后,该区域将显示特征值在各个区间的分布情况,不同的类别标签以不同的颜色显示。

 

 

 

 

https://blog.csdn.net/qq_38549200/article/details/82668179

https://www.bilibili.com/video/BV134411J7S5?p=1

相关文章:

  • Weka(一)——Data preparation in Weka(Iris鸢尾花数据集)
  • 数据挖掘与数据分析(一)—— 数据仓库(数据集市、ETL过程)
  • 数据挖掘与数据分析(二)—— 探索性数据分析EDA(单因子与对比分析) 可视化 (1) —— 集中趋势 离中趋势 数据分布(偏态系数峰态系数正态分布三大分布)抽样理论(误差精度)
  • 二叉排序树BST(二叉查找树) 二叉平衡树AVL 红黑树
  • B树 B+树
  • Node-Red(一)——简介与安装
  • 数据挖掘与数据分析(四)—— 预处理理论(1) —— 特征工程 Feature Engineering
  • representation learning 表示学习/表征学习
  • Darknet 轻量级深度学习训练框架
  • cfg文件
  • 双向循环神经网络(BiRNN)MNIST手写体识别(tensorflow)
  • 双向循环神经网络(BiRNN)
  • MIPS
  • FPGA
  • Verilog硬件描述语言
  • [PHP内核探索]PHP中的哈希表
  • [ 一起学React系列 -- 8 ] React中的文件上传
  • __proto__ 和 prototype的关系
  • 5、React组件事件详解
  • CoolViewPager:即刻刷新,自定义边缘效果颜色,双向自动循环,内置垂直切换效果,想要的都在这里...
  • css选择器
  • Docker: 容器互访的三种方式
  • ECMAScript6(0):ES6简明参考手册
  • ES6 学习笔记(一)let,const和解构赋值
  • Java,console输出实时的转向GUI textbox
  • java2019面试题北京
  • JavaScript 一些 DOM 的知识点
  • Javascript编码规范
  • Laravel 实践之路: 数据库迁移与数据填充
  • Linux gpio口使用方法
  • miniui datagrid 的客户端分页解决方案 - CS结合
  • oschina
  • PHP 7 修改了什么呢 -- 2
  • php中curl和soap方式请求服务超时问题
  • unity如何实现一个固定宽度的orthagraphic相机
  • 从重复到重用
  • 仿天猫超市收藏抛物线动画工具库
  • 聊聊spring cloud的LoadBalancerAutoConfiguration
  • 十年未变!安全,谁之责?(下)
  • 一个项目push到多个远程Git仓库
  •  一套莫尔斯电报听写、翻译系统
  • 7行Python代码的人脸识别
  • ​520就是要宠粉,你的心头书我买单
  • ​MPV,汽车产品里一个特殊品类的进化过程
  • # Maven错误Error executing Maven
  • #鸿蒙生态创新中心#揭幕仪式在深圳湾科技生态园举行
  • (1)(1.11) SiK Radio v2(一)
  • (C++)八皇后问题
  • (SpringBoot)第二章:Spring创建和使用
  • (八)五种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (论文阅读22/100)Learning a Deep Compact Image Representation for Visual Tracking
  • (免费领源码)Python#MySQL图书馆管理系统071718-计算机毕业设计项目选题推荐
  • (原創) 如何優化ThinkPad X61開機速度? (NB) (ThinkPad) (X61) (OS) (Windows)
  • *(长期更新)软考网络工程师学习笔记——Section 22 无线局域网
  • ***检测工具之RKHunter AIDE