当前位置: 首页 > news >正文

iris数据_Python数据分析01-Iris鸢尾花数据集

13c77ca29ba663684b51e47ad9ea6e82.png

0. 项目背景:

好久没碰代码了,今天开始重新捡起Python。首先对环境做个简单的介绍:

Python环境:Python3.7 编译器:Pycharm Community

具体怎么配环境我就不细说了,因为是以前配的环境。

这次主要是使用matplotlib和bubbleplot这两个package来对iris数据集进行数据可视化,

iris的官方下载链接:http://archive.ics.uci.edu/ml/datasets/Iris

不过这里的iris是data格式,我们的项目会使用csv格式,需要iris.csv的朋友可以私信找我要。

Iris数据集简介:鸢尾属(拉丁学名:Iris L.), 单子叶植物纲, 鸢尾科多年生草本植物, 开的花大而美丽, 观赏价值很高. 鸢尾属约300种, Iris数据集中包含了其中的三种: 山鸢尾(Setosa), 杂色鸢尾(Versicolour), 维吉尼亚鸢尾(Virginica), 每种50个数据, 共含150个数据. 在每个数据包含四个属性: 花萼长度,花萼宽度,花瓣长度,花瓣宽度, 可通过这四个属性预测鸢尾花卉属于 (山鸢尾, 杂色鸢尾, 维吉尼亚鸢尾) 哪一类(之后会上线机器学习项目!期待吧!).

  1. 项目过程

作为高度封装的语言,Python的方便快捷来自那些超级好用的包们,因此在本次项目过程也会大量地使用一些package,但是不知道Pycharm抽什么风,直接用编译器下载这些包往往会出现超时的问题,所以在这里推荐大家使用清华镜像下载,也就是直接在cmd里运行下面这句话+包名:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple numpy

这里就是下载numpy的举例,大家可以随意下载需要的包。

接下来就是怒写代码了,话不多说先贴一波代码:

from 

到这里为止我们成功地导入了Iris数据集,然后我们使用绚丽的bubbly来展示数据,这个数据集有6列,6个特征,这里设置x,y,z轴,气泡,气泡大小,气泡颜色分别代表6列

from 

然后!!!

Tada!我们的图就出来了!想起了以前用R跑出来的图,那叫一个丑,这个图也太好看了!

ad48c374583b4388520af453c1b1f724.png

展示完图,我们来说说遇到的两个小问题。

首先是,在file的开头我的第一行代码是:

from __future__ import division

之所以把它放第一行,是因为它的前面不能跟任何注释,否则会报错。

其次就是原本我的代码中有:

from plotly.offline import init_notebook_mode, iplot init_notebook_mode()

使用了iplot,然而报了这样的错:

ImportError: `iplot` can only run inside an IPython Notebook.

参考了https://stackoverflow.com/questions/53978924/importerror-iplot-can-only-run-inside-an-ipython-notebook

5261e00b54a8a6ee8d35c53096637334.png

从名字看,感谢这位斯拉夫大兄弟,我去掉了iplot改用plot,语句变为文中的代码,轻松解决!

2. 项目总结

第一个项目,很简单,参照了很多前人写的代码,没啥总结的,大家一起进步吧!

参考链接:

https://www.kaggle.com/benhamner/python-data-visualizations​www.kaggle.com 「已注销」:Python数据可视化, 看这一篇就够了​zhuanlan.zhihu.com
2593f404449f48407aa24327fe39cf82.png
Iris数据集实战 - Star_Zhao - 博客园​www.cnblogs.com
ab0c8e541f1609af3b8706c65bd50e16.png

作者:钴铬氢气

06/08/2020

相关文章:

  • java 文件预览_自建MinIO对象存储(三):上传、下载、预览
  • js内置对象_JS 原型与原型链
  • 交叉验证python代码_python机器学习,交叉验证
  • onvif摄像头软件_海康POE录像机添加POE网络摄像头
  • python给两个列表排序方法_对python实现合并两个排序链表的方法详解
  • python opencv压缩图片_OpenCV Python 缩放图片
  • mac cad石材填充图案_这些石材装饰细节处理,你做到位了吗?
  • python逻辑_python逻辑题
  • python语言求素数_用python判断一个数是否是素数的方法
  • 统计高于平均分的人数python_python3 下载 以及 练习1
  • cv::imread导致段错误_OGG启动报错:不能创建共享内存段
  • opengl场景代码_实战篇使用Native OpenGL渲染Unity场景
  • python中dtype是object是什么意思_python – Pandas:将dtype’object’转换为int
  • 人脸比对软件_开源推荐 | 可实现门禁、AI测温敏捷开发的人脸识别应用套件
  • coursera python证书_IBM数据科学证书 | 你想要的一站式新手入门课!
  • 【JavaScript】通过闭包创建具有私有属性的实例对象
  • AzureCon上微软宣布了哪些容器相关的重磅消息
  • CentOS6 编译安装 redis-3.2.3
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • Django 博客开发教程 8 - 博客文章详情页
  • JavaScript 奇技淫巧
  • leetcode-27. Remove Element
  • SOFAMosn配置模型
  • swift基础之_对象 实例方法 对象方法。
  • 第三十一到第三十三天:我是精明的小卖家(一)
  • 记一次用 NodeJs 实现模拟登录的思路
  • 聚簇索引和非聚簇索引
  • 数组的操作
  • NLPIR智能语义技术让大数据挖掘更简单
  • 数据库巡检项
  • # 执行时间 统计mysql_一文说尽 MySQL 优化原理
  • #传输# #传输数据判断#
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • $.ajax中的eval及dataType
  • ${ }的特别功能
  • (C语言)字符分类函数
  • (pytorch进阶之路)扩散概率模型
  • (十八)三元表达式和列表解析
  • (四)linux文件内容查看
  • (续)使用Django搭建一个完整的项目(Centos7+Nginx)
  • (一)pytest自动化测试框架之生成测试报告(mac系统)
  • (已更新)关于Visual Studio 2019安装时VS installer无法下载文件,进度条为0,显示网络有问题的解决办法
  • (转)LINQ之路
  • (转)Mysql的优化设置
  • .bat批处理(九):替换带有等号=的字符串的子串
  • .NET Compact Framework 多线程环境下的UI异步刷新
  • .net core 客户端缓存、服务器端响应缓存、服务器内存缓存
  • .net 托管代码与非托管代码
  • .Net(C#)自定义WinForm控件之小结篇
  • .net程序集学习心得
  • .NET委托:一个关于C#的睡前故事
  • .NET下ASPX编程的几个小问题
  • /etc/sudoer文件配置简析
  • /etc/X11/xorg.conf 文件被误改后进不了图形化界面
  • @EnableWebMvc介绍和使用详细demo