当前位置: 首页 > news >正文

数据分析中的统计学基础及Python具体实现【数据分析】

各位大佬好 ,这里是阿川的博客,祝您变得更强

在这里插入图片描述 个人主页:在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力在这里插入图片描述

阿川水平有限,如有错误,欢迎大佬指正在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Python 初阶
Python–语言基础与由来介绍
Python–注意事项
Python–语句与众所周知
数据清洗前 基本技能
数据分析—技术栈和开发环境搭建
数据分析—Numpy和Pandas库基本用法及实例
统计学基础前 必看
数据分析—三前奏:获取/ 读取/ 评估数据
数据分析—数据清洗操作及众所周知
数据分析—数据整理操作及众所周知

目录

  • 统计学概述
  • 数值数据分析维度
    • 偏态解释

数据分析与统计学不可分割

统计学概述

统计学主要是描述和推断

  • 描述

    • 分类数据
      • 有限数量的类别的数据
        • 定序
          • 顺序
            • 例如金银铜三枚奖牌,金大于大于
        • 定类
          • 例如猫的种类,不能说有顺序
  • 请添加图片描述

    • 数值数据
      • 可进行数学运算和统计分析计算有意义的数据
        • 连续
          • 例如1~2之间区间有很多连续的数字
        • 离散
          • 只能以整数或自然数为单位的数据

图2

数值数据分析维度

数值数据是数据分析的重点,分析维度主要从三个方面来分析

  • 集中趋势
    • 数据集中分布在哪里

在这里插入图片描述

  • mean平均数

请添加图片描述

  • median中位数

请添加图片描述

  • mode众数

请添加图片描述

  • 离散趋势
    • 数据偏离中心分布在哪里

在这里插入图片描述

  • max-min极差

请添加图片描述

  • var/std 方差/标准差

请添加图片描述

  • quantile(0.75)- quantile(0.25)四分位距

    • 四分位距是将数据按顺序,按四等分分好并排序,处于三个分割点位置的数值就是四分位数-
    • 表示中间一半数值的离散程度
      • 越大说明数据越分散
      • 越小说明数据越集中

在这里插入图片描述

请添加图片描述

  • 分布形状

在这里插入图片描述

  • 可以看出数据的偏态、峰度、异常值
  • 分布形状主要是指直方图
    plot 表示画图
    • kind参数具体什么形状
      • hist表示直方图

请添加图片描述

偏态解释

直方图一般为正态分布(平均值、中位数、众数差不多都位于中央

请添加图片描述

偏态(平均数、中位数、众数偏离中央

  • 正偏态即右偏态

  • 负偏态及左偏态

请添加图片描述请添加图片描述

注意一下直方图

  • 数据量小,分布形状较不明显
  • 数据量大,分布形状较明显

好的,到此为止啦,祝您变得更强

在这里插入图片描述
想说的话

实不相瞒,写的每篇博客都要写三四个小时(加上自己学习和纸质笔记,共五六小时吧),很累希望大佬支持

在这里插入图片描述

道阻且长 行则将至

个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

相关文章:

  • 全栈工程师之路 — 从零到精通Spring Boot -1
  • 手机和WINDOWS电脑蓝牙连接后怎样放歌,无法选择媒体音频 蓝牙媒体音频勾选不上
  • linux系统使用达梦数据库
  • 小牛翻译API详解:功能、优势介绍及案例实战(附完整代码)
  • python怎么下载numpy
  • BGP基础实验
  • 使用Python实现深度学习模型:Transformer模型
  • 亚马逊新品如何快速吸引流量?自养号测评助卖家一臂之力
  • C++ | Leetcode C++题解之第129题求根节点到叶节点数字之和
  • 深入TypeScript中Promise的高级用法:高级技巧与避坑指南
  • 1000Base-T协议解读
  • MyBatis总结(2)- MyBatis实现原理(一)
  • python绘制piper三线图
  • 如何更精准定位你的Facebook广告受众?
  • 【GD32F303红枫派使用手册】第九节 RTC-万年历实验
  • 【css3】浏览器内核及其兼容性
  • 03Go 类型总结
  • ES6之路之模块详解
  • exif信息对照
  • Protobuf3语言指南
  • 关于Java中分层中遇到的一些问题
  • 简析gRPC client 连接管理
  • 紧急通知:《观止-微软》请在经管柜购买!
  • 前嗅ForeSpider中数据浏览界面介绍
  • 如何优雅的使用vue+Dcloud(Hbuild)开发混合app
  • 使用docker-compose进行多节点部署
  • 使用前端开发工具包WijmoJS - 创建自定义DropDownTree控件(包含源代码)
  • 小试R空间处理新库sf
  •  一套莫尔斯电报听写、翻译系统
  • 在 Chrome DevTools 中调试 JavaScript 入门
  • ​​​【收录 Hello 算法】9.4 小结
  • ​Base64转换成图片,android studio build乱码,找不到okio.ByteString接腾讯人脸识别
  • # 20155222 2016-2017-2 《Java程序设计》第5周学习总结
  • ### Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException
  • (1/2)敏捷实践指南 Agile Practice Guide ([美] Project Management institute 著)
  • (14)目标检测_SSD训练代码基于pytorch搭建代码
  • (39)STM32——FLASH闪存
  • (4)事件处理——(6)给.ready()回调函数传递一个参数(Passing an argument to the .ready() callback)...
  • (echarts)echarts使用时重新加载数据之前的数据存留在图上的问题
  • (第30天)二叉树阶段总结
  • (附源码)计算机毕业设计SSM智能化管理的仓库管理
  • (附源码)流浪动物保护平台的设计与实现 毕业设计 161154
  • (黑马出品_高级篇_01)SpringCloud+RabbitMQ+Docker+Redis+搜索+分布式
  • (企业 / 公司项目)前端使用pingyin-pro将汉字转成拼音
  • (四)Tiki-taka算法(TTA)求解无人机三维路径规划研究(MATLAB)
  • (转) Face-Resources
  • (转)socket Aio demo
  • (转)用.Net的File控件上传文件的解决方案
  • .DFS.
  • .NET 6 在已知拓扑路径的情况下使用 Dijkstra,A*算法搜索最短路径
  • .NET Core 网络数据采集 -- 使用AngleSharp做html解析
  • .NET Micro Framework 4.2 beta 源码探析
  • .NET NPOI导出Excel详解
  • .net 提取注释生成API文档 帮助文档
  • .net和php怎么连接,php和apache之间如何连接