当前位置: 首页 > news >正文

【人工智能】机器学习 -- 决策树(乳腺肿瘤数)

目录

一、使用Python开发工具,运行对iris数据进行分类的例子程序dtree.py,熟悉sklearn机器实习开源库。

二、登录https://archive-beta.ics.uci.edu/

三、使用sklearn机器学习开源库,使用决策树对breast-cancer-wisconsin.data进行分类。

1. Python代码

2. 运行截图


一、使用Python开发工具,运行对iris数据进行分类的例子程序dtree.py,熟悉sklearn机器实习开源库。

导入相应的库并运行dtree.py,由于sklearn库里面已经有iris数据了,故不需要另外下载。

1. dtree.py

# import inline
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn import tree
import matplotlib# %matplotlib inline# 生成所有测试样本点
def make_meshgrid(x, y, h=.02):x_min, x_max = x.min() - 1, x.max() + 1y_min, y_max = y.min() - 1, y.max() + 1xx, yy = np.meshgrid(np.arange(x_min, x_max, h),np.arange(y_min, y_max, h))return xx, yy# 对测试样本进行预测,并显示
def plot_test_results(ax, clf, xx, yy, **params):Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])Z = Z.reshape(xx.shape)ax.contourf(xx, yy, Z, **params)# 载入iris数据集
iris = datasets.load_iris()
# 只使用前面连个特征
X = iris.data[:, :2]
# 样本标签值
y = iris.target# 创建并训练决策树
clf = tree.DecisionTreeClassifier()
clf.fit(X, y)# 打印决策树
tree.plot_tree(clf)title = 'DecisionTreeClassifier'fig, ax = plt.subplots(figsize=(5, 5))
plt.subplots_adjust(wspace=0.4, hspace=0.4)X0, X1 = X[:, 0], X[:, 1]
# 生成所有测试样本点
xx, yy = make_meshgrid(X0, X1)# 显示测试样本的分类结果
plot_test_results(ax, clf, xx, yy, cmap=plt.cm.coolwarm, alpha=0.8)
# 显示训练样本
ax.scatter(X0, X1, c=y, cmap=plt.cm.coolwarm, s=20, edgecolors='k')
ax.set_xlim(xx.min(), xx.max())  # 设置x轴坐标的范围,范围由测试样本的最小和最大值确定
ax.set_ylim(yy.min(), yy.max())  # 设置y轴坐标的范围
ax.set_xlabel('x1')  # 设置x轴的标签为'x1'
ax.set_ylabel('x2')  # 设置y轴的标签为'x2'
ax.set_xticks(())  # 将x轴的刻度设置为空,即不显示刻度
ax.set_yticks(())  # 将y轴的刻度设置为空,即不显示刻度
ax.set_title(title)  # 设置图形的标题为title变量的值
plt.show()

2. 运行截图

二、登录https://archive-beta.ics.uci.edu/

可以查看提供的各类公共数据源,找到Breast Cancer Wisconsin (Original)数据并下载。

也可以直接输入网址:

https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/

下载wisconsin提供的乳腺肿瘤数breast-cancer-wisconsin.data(已经处理好的数据)和breast-cancer-wisconsin.names(对数据的说明,可以用写字体打开)

在我上传的资源可以免费下载!!解压即可用!!【在本文置顶

下载后的数据如下:

三、使用sklearn机器学习开源库,使用决策树对breast-cancer-wisconsin.data进行分类。

Sklearn库里面已经有乳腺癌数据了,直接加载数据集。

1. Python代码

2. 运行截图

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • java面试题,有synchronized锁,threadlocal、数据可以设置默认值、把redis中的json转为对象
  • 使用内网穿透工具 frp 发布内网 web 站点
  • WebGoC题解(13) 狐猬编程:GoC L4 结业测试 第4题 找木柴
  • 自动驾驶---视觉Transformer的应用
  • 工具(linux)
  • 判断用户输入IP的合法性判断输入IP与本机IP是否在同一网段C++QT
  • 【中项】系统集成项目管理工程师-第4章 信息系统架构-4.3应用架构
  • (7) cmake 编译C++程序(二)
  • PyTorch 深度学习实践-循环神经网络(高级篇)
  • React--Redux
  • 多维时序 | Transformer+BiLSTM多变量时间序列预测(Python)
  • HAL库源码移植与使用之RTC时钟
  • 时间和空间复杂度
  • Docker、containerd、CRI-O 和 runc 之间的区别
  • 第1关 -- Linux 基础知识
  • JS 中的深拷贝与浅拷贝
  • 【翻译】babel对TC39装饰器草案的实现
  • - C#编程大幅提高OUTLOOK的邮件搜索能力!
  • ES6简单总结(搭配简单的讲解和小案例)
  • JavaScript 一些 DOM 的知识点
  • Joomla 2.x, 3.x useful code cheatsheet
  • Linux快速复制或删除大量小文件
  • ReactNative开发常用的三方模块
  • STAR法则
  • vue从入门到进阶:计算属性computed与侦听器watch(三)
  • 编写高质量JavaScript代码之并发
  • 湖南卫视:中国白领因网络偷菜成当代最寂寞的人?
  • 解析带emoji和链接的聊天系统消息
  • 盘点那些不知名却常用的 Git 操作
  • 七牛云假注销小指南
  • 前端技术周刊 2019-01-14:客户端存储
  • 扫描识别控件Dynamic Web TWAIN v12.2发布,改进SSL证书
  • 世界编程语言排行榜2008年06月(ActionScript 挺进20强)
  • 用Visual Studio开发以太坊智能合约
  • #QT(一种朴素的计算器实现方法)
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • $NOIp2018$劝退记
  • (145)光线追踪距离场柔和阴影
  • (aiohttp-asyncio-FFmpeg-Docker-SRS)实现异步摄像头转码服务器
  • (非本人原创)我们工作到底是为了什么?​——HP大中华区总裁孙振耀退休感言(r4笔记第60天)...
  • (分布式缓存)Redis分片集群
  • (附源码)springboot太原学院贫困生申请管理系统 毕业设计 101517
  • (附源码)ssm教材管理系统 毕业设计 011229
  • (亲测有效)推荐2024最新的免费漫画软件app,无广告,聚合全网资源!
  • (十六)Flask之蓝图
  • .NET Core SkiaSharp 替代 System.Drawing.Common 的一些用法
  • .net core webapi Startup 注入ConfigurePrimaryHttpMessageHandler
  • .NET Remoting学习笔记(三)信道
  • .netcore 6.0/7.0项目迁移至.netcore 8.0 注意事项
  • .NET未来路在何方?
  • .Net下的签名与混淆
  • ?
  • @ComponentScan比较
  • @data注解_一枚 架构师 也不会用的Lombok注解,相见恨晚
  • @vue/cli 3.x+引入jQuery