当前位置: 首页 > news >正文

简单线性回归分析

这是学习笔记的第 1999 篇文章


  最近看了下线性回归的内容,还是很有感触的。也通过统计学的这样一个思维来回视原来片面的理解方式。

    我们不是无限放大统计学的重要性,而是需要通过统计学的学习明白,统计学其实不是科学,而是一种科学技术。 

我们可以通过一个小的例子来做下分析,这个例子参考了如下的链接:

https://blog.csdn.net/tmb8z9vdm66wh68vx1/article/details/79544739

整个案例是使用R语言实现的,通过测试也发现了彼此之间的一些问题和欠缺,而对于我们分析来说,确实是一种很便捷的工具。

我们假设身高和体重是具有相关关系,那么我们可以逐步的完善下面的信息数。

初始化数据:

> age=18:29 

>  height=c(76.1,77,78.1,78.2,78.8,79.7,79.9,81.1,81.2,81.8,82.8,83.5)

通过这两个结果集,我们可以得到相关的散点图。

> plot(age,height,main = "身高与年龄散点图")

可以看到这些散点之间还是具有一定的线性关系,而且数据也存在一些误差的情况。

640?wx_fmt=png

建立回归方程,来继续分析

> lm.reg <- lm(height~age) 

输出的结果如下:

> lm.reg

Call:

lm(formula = height ~ age)

Coefficients:

(Intercept)          age  

     64.928        0.635  

画出拟合的线性回归线

>  abline(lm.reg) 

640?wx_fmt=png

其中对于数据的分析,我们分成两种方式:方差分析和T检验。

方差分析主要是针对整个模型的,而t检验是关于回归系数的

#模型方差分析

> anova(lm.reg) 

Analysis of Variance Table

Response: height

          Df Sum Sq Mean Sq F value    Pr(>F)    

age        1 57.655  57.655  879.99 4.428e-11 ***

Residuals 10  0.655   0.066                      

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

由于P<0.05,于是在α=0.05水平下,本例的回归系数有统计学意义,身高和年龄存在直线回归关系。

回归系数的T检验

>  summary(lm.reg) 

Call:

lm(formula = height ~ age)

Residuals:

     Min       1Q   Median       3Q      Max 

-0.27238 -0.24248 -0.02762  0.16014  0.47238 

Coefficients:

            Estimate Std. Error t value Pr(>|t|)    

(Intercept)  64.9283     0.5084  127.71  < 2e-16 ***

age           0.6350     0.0214   29.66 4.43e-11 ***

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.256 on 10 degrees of freedom

Multiple R-squared:  0.9888,    Adjusted R-squared:  0.9876 

F-statistic:   880 on 1 and 10 DF,  p-value: 4.428e-11

由于P<0.05,于是在α=0.05水平下,本例的回归系数有统计学意义,身高和年龄存在回归关系。

相关链接:

640?

相关文章:

  • 2000天带给我的回忆
  • 建模能力是进阶的必备技能
  • 推荐几个统计数据的网站
  • 相关分析的简单示例
  • 一些用户画像数据
  • 使用Shell脚本来解析MySQL元数据变化
  • 初来北京几年的精神状态
  • 磨刀不误砍柴工-流程梳理
  • 一个MySQL连接问题的优化过程
  • 认知的偏差
  • 迁移到MySQL的架构演进(一)
  • K-Means算法原理和简单测试
  • 如何让你的工作能够大量输出
  • 数据生命周期管理的初步实现
  • MySQL分布式高可用的一个补充
  • [译]如何构建服务器端web组件,为何要构建?
  • 【面试系列】之二:关于js原型
  • 08.Android之View事件问题
  • 2017 年终总结 —— 在路上
  • angular2开源库收集
  • C++11: atomic 头文件
  • es6
  • Git学习与使用心得(1)—— 初始化
  • Java面向对象及其三大特征
  • laravel with 查询列表限制条数
  • Octave 入门
  • REST架构的思考
  • win10下安装mysql5.7
  • 百度贴吧爬虫node+vue baidu_tieba_crawler
  • 如何借助 NoSQL 提高 JPA 应用性能
  • 如何实现 font-size 的响应式
  • 提醒我喝水chrome插件开发指南
  • 听说你叫Java(二)–Servlet请求
  • 微服务框架lagom
  • 微信公众号开发小记——5.python微信红包
  • 用 Swift 编写面向协议的视图
  • 中国人寿如何基于容器搭建金融PaaS云平台
  • Java数据解析之JSON
  • Java总结 - String - 这篇请使劲喷我
  • 仓管云——企业云erp功能有哪些?
  • 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源 ...
  • ​软考-高级-系统架构设计师教程(清华第2版)【第12章 信息系统架构设计理论与实践(P420~465)-思维导图】​
  • ​一文看懂数据清洗:缺失值、异常值和重复值的处理
  • #QT(一种朴素的计算器实现方法)
  • $con= MySQL有关填空题_2015年计算机二级考试《MySQL》提高练习题(10)
  • (java)关于Thread的挂起和恢复
  • (pt可视化)利用torch的make_grid进行张量可视化
  • (八)光盘的挂载与解挂、挂载CentOS镜像、rpm安装软件详细学习笔记
  • (二)Eureka服务搭建,服务注册,服务发现
  • (二)linux使用docker容器运行mysql
  • (附源码)小程序 交通违法举报系统 毕业设计 242045
  • (十五)使用Nexus创建Maven私服
  • (五)关系数据库标准语言SQL
  • (转)Groupon前传:从10个月的失败作品修改,1个月找到成功
  • (自用)learnOpenGL学习总结-高级OpenGL-抗锯齿