平均聚类系数_模糊数学笔记:五、模糊聚类
![9eb87fb4ba0ba8cb6301fe9dbf8a69ed.png](https://img-blog.csdnimg.cn/img_convert/9eb87fb4ba0ba8cb6301fe9dbf8a69ed.png)
模糊聚类分析是模糊数学中应用最为广泛的方法之一。近年来也涌现出了多种不同的模糊聚类方法,本文直接从其操作流程出发,介绍模糊聚类分析的主要内容。
1、一般流程
![5c7a6d77fc8852e4f14d56351846623a.png](https://img-blog.csdnimg.cn/img_convert/5c7a6d77fc8852e4f14d56351846623a.png)
2、数据预处理方法
这一过程通常是将数据压缩到区间
- 平移-标准差变换
其中,
- 平移-极差变换
3、相似关系的建立方法
相似关系建立主要分为:相似系数法、距离法和主观评分法,其中前2者使用最多。
第一类:相似系数法
- 数量积法
其中
若存在
- 夹角余弦法:
- 相关系数法:
其中
- 指数相似系数法
- 最大最小法
- 算术平均最小法
- 几何平均最小法
第二类:距离法
- 绝对值倒数法
- 绝对值指数法
- 绝对值减数法
其中
- 海明距离
- 欧式距离
- 切比雪夫距离
第三类:主观判别法
这类方法是最为简单的一类,首先由专家打分,给出所有关系的值,再对专家的意见进行加权求和即可。
用上述方法生成一个矩阵
4、动态聚类的方法I-传递闭包法
- 传递闭包法:
- 求出模糊相似矩阵
的传递闭包
;
- 按
由大到小进行聚类, 这里
是传递闭包中的元素,由大到小排列即可
- 画出动态聚类图
- 求出模糊相似矩阵
- 传递闭包法举例:
设有5组数据:
先对其进行归一化处理,得到特性矩阵(每一行对应一组数据):
通过两次合成,得到其传递闭包:
对所有元素排序,容易得到:
因此依次取
-
时:
被分成 5 类:
-
时:
被分成 4 类:
-
时:
被分成 3 类:
-
时:
被分成 2 类:
-
时:
被分成 1 类:
5、动态聚类的方法II-直接聚类法
- 直接聚类法:
直接聚类法实际上与传递闭包法只有一个区别:即不用计算传递闭包,而是直接由相似矩阵进行聚类。
- 例:
仍以上例数据为基础,直接根据相似矩阵给出
类似传递闭包的方法,此时仍然要考虑
-
时:
被分成 2 类:
也就是说,实际上
6、小结
模糊聚类的操作步骤内容丰富,但其主干框架实际上只有几个关键的步骤,即本文开头的那副图。其中最关键的地方在于具体的聚类方法。
通过上述两个例子的对比,可以看到这两类方法各有优缺点:
- 传递闭包:
- 优点:由传递闭包进行聚类时不会出现重复的聚类,在考虑聚类水平时操作简单
- 缺点:需要计算传递闭包,也就是在继续聚类之前需要额外的操作
- 直接聚类:
- 优点:不需要计算传递闭包,手工操作更加简单
- 缺点:由于相似矩阵本身不一定具有传递性,因此聚类过程中可能会出现较多的重复聚类的情况
那么自然地,在具体的问题中应根据实际情况选择更有优势的方法。