当前位置: 首页 > news >正文

Python学习笔记:Jupyter Notebook快速入门案例:学习时间与成绩的关系

Python学习笔记:Jupyter Notebook快速入门案例:学习时间与成绩的关系

源教程地址:https://www.bilibili.com/video/BV1Q4411H7fJ?p=2&vd_source=cdfd0a0810bcc0bcdbcf373dafdf6a82
是对新手很友好的入门教程,操作简单,容易上手

Jupyter Notebook常用快捷键:
在这里插入图片描述
导入库

import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline 

在这里插入图片描述
导入数据并且查看

dataset =pd.read_csv('D:\StudyFiles\Jupyter\zihaopython-master\dataForJupyter\studentScores/studentscores.csv')
dataset.head(10)

在这里插入图片描述
查看数据类型,二维表格
在这里插入图片描述

dataset.shape
dataset.columns

查看数据信息
在这里插入图片描述

dataset.info()
dataset.describe()

提取数据特征
在这里插入图片描述

feature_columns=['Hours']
label_column=['Scores']
features=dataset[feature_columns]
label=dataset[label_column]

这里我感觉是和R语言类似,head(),tail()表示正序/逆序的前几个,一般有个默认值,R语言好像是6,这里看起来是5(即调用这俩函数的时候找出这组数据的最前5个或者最后5个)
在这里插入图片描述

features.head()
type(features)
label.tail()

在这里插入图片描述

label.head(3)

把提出的feature和label的值分别赋予X、Y

X=features.values
Y=label.values

在这里插入图片描述
输出X和Y的值看一下
这里使用的是一个很常用的办法,把拿到的二维表格数据分开成了俩个一维数组

X
Y

在这里插入图片描述
拆分训练集和测试集:
在这里插入图片描述

from sklearn.model_selection import train_test_split
X_train,X_test,Y_train,Y_test=train_test_split(X,Y,test_size=1/4,random_state=0)
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor=regressor.fit(X_train,Y_train)
Y_pred = regressor.predict(X_test)

将得到的结果可视化:
训练集:

#散点图:红色表示训练集的点
plt.scatter(X_train,Y_train,color='red')
#线图:蓝色线表示由训练集训练出的线性回归模型
plt.plot(X_train,regressor.predict(X_train),color='blue')
plt.show()

红点是训练集的数据,根据现有数据,得到一个蓝线作为模型
在这里插入图片描述
测试集:
测试集得到的蓝线来看是否在训练集还适用,发现基本上能跟红点对上,而且红点大多均匀分布两侧,则说明这个模型比较成功
在这里插入图片描述

#散点图:红色点表示测试集的点
plt.scatter(X_test,Y_test,color='red')
#线图:蓝色线表示对测试集进行预测的结果
plt.plot(X_test,regressor.predict(X_test),color='blue')
plt.show()

最后是一些笔记:
在这里插入图片描述

另外,导出转PDF的时候直接选择“浏览器——打印”比安装那俩软件更加方便快捷,我安装完搜出来需要的俩软件之后,还是老样子Interval Server Error……但是看浏览器打印很方便效果也不错就没管了。
在这里插入图片描述
效果如图,PDF我也会上传CSDN
在这里插入图片描述

相关文章:

  • 嵌入式软件工程师面试题(三)
  • K8S搭建共享存储(以MySQL例)
  • 【C++】类和对象(中篇)(万字)
  • 虹科教您 | 虹科TSN配置软件RELY-TSN-Configurator基本操作指南
  • 【python基础】super是啥,你会用吗?
  • 反向传播和其他微分算法
  • 爆肝撸了个“羊了个羊”通关助手
  • Flutter快学快用17 打包发布:Flutter 应用,你离线上运营只差最后一步
  • 效果超强!基于Prompt Learning、检索思路实现文本分类,开源数据增强、可信增强技术
  • 第五次线上面试总结(2022.9.21 二面)
  • 多容器SSM整合
  • 如何用架构的思维为云原生做减法?
  • 程序员面试必备软技能,值得收藏!
  • IDEA社区版(Community Edition)创建Springboot-Web项目,Java
  • 全能赛道、热门方向、稀缺数据,“嬴彻-清华AIR杯”自动驾驶技术大赛火热开赛中
  • Asm.js的简单介绍
  • extjs4学习之配置
  • JS基础之数据类型、对象、原型、原型链、继承
  • LeetCode29.两数相除 JavaScript
  • Nodejs和JavaWeb协助开发
  • spring cloud gateway 源码解析(4)跨域问题处理
  • springMvc学习笔记(2)
  • thinkphp5.1 easywechat4 微信第三方开放平台
  • Webpack入门之遇到的那些坑,系列示例Demo
  • 蓝海存储开关机注意事项总结
  • 前端
  • 前端之Sass/Scss实战笔记
  • 前嗅ForeSpider中数据浏览界面介绍
  • Android开发者必备:推荐一款助力开发的开源APP
  • 小白应该如何快速入门阿里云服务器,新手使用ECS的方法 ...
  • ​决定德拉瓦州地区版图的关键历史事件
  • #android不同版本废弃api,新api。
  • #单片机(TB6600驱动42步进电机)
  • #多叉树深度遍历_结合深度学习的视频编码方法--帧内预测
  • #每天一道面试题# 什么是MySQL的回表查询
  • ( )的作用是将计算机中的信息传送给用户,计算机应用基础 吉大15春学期《计算机应用基础》在线作业二及答案...
  • (1)(1.13) SiK无线电高级配置(五)
  • (C语言)编写程序将一个4×4的数组进行顺时针旋转90度后输出。
  • (补)B+树一些思想
  • (二)hibernate配置管理
  • (附源码)spring boot基于Java的电影院售票与管理系统毕业设计 011449
  • (附源码)springboot“微印象”在线打印预约系统 毕业设计 061642
  • (规划)24届春招和25届暑假实习路线准备规划
  • (排序详解之 堆排序)
  • (淘宝无限适配)手机端rem布局详解(转载非原创)
  • (转)JAVA中的堆栈
  • .NET Core实战项目之CMS 第十二章 开发篇-Dapper封装CURD及仓储代码生成器实现
  • .Net MVC + EF搭建学生管理系统
  • .NET 中选择合适的文件打开模式(CreateNew, Create, Open, OpenOrCreate, Truncate, Append)
  • .NET高级面试指南专题十一【 设计模式介绍,为什么要用设计模式】
  • .NET轻量级ORM组件Dapper葵花宝典
  • [AX]AX2012开发新特性-禁止表或者表字段
  • [BZOJ] 2044: 三维导弹拦截
  • [bzoj1006]: [HNOI2008]神奇的国度(最大势算法)
  • [C# 网络编程系列]专题六:UDP编程