当前位置: 首页 > news >正文

数据分析——基础

目录

一、什么是数据分析

1、什么是数据

2、数据类型

3、数据分析

3.1 数据分析概念

3.2 数据分析要结合的维度

3.3 数据分析的目的

二、数据分析流程

三、数据呈现形式

1、柱状图

2、折线图

3、柱线图 

4、饼图

5、漏斗图 

6、雷达图

7、散点图 

8、桑基图

四、数据分析的几种常见方法

1、趋势分析

2、对比分析

2.1 环比 

2.2 同比

3、细分分析 

五、数据产品结构 


一、什么是数据分析

1、什么是数据

        是对客观事物的性质、状态以及相互关系等进行记载的组合。不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等。

  • 运营数据 

        AARRR模型又称海盗模型,指的是一款产品在运营阶段的各个生命周期,主要有五个阶段:拉新(获取)、激活、留存、付费(转化)、传播(推荐),可以指导产品运营和用户增长。 

        运营常见数据指标: 

  1. 拉新:对于APP:下载量、安装量、打开量、注册量        对于网站:访问量、注册量  ..        通常以日、周、月为周期来统计以上指标的新增
  2. 活跃:基础活跃数据:日活、周活、月活/每日、每周和每月的访问次数       深入活跃数据:停留时长、跳出率          可以针对整个APP的数据,也可以针对某个模块或某个页面的数据
  3. 留存:基础留存数据:次日留存、7日留存、月留存       深入留存数据:不同价值层次用户的留存
  4. 转化:产品核心业务或指定业务的转化数据      电商产品的转化指标:订单转化率(每日新增用户的下单转化率、总用户的下单转化率、下单/支付的用户转化率、不同流量路径的转化率等)、客单价、GMV(商品交易总额)         内容产品的转化指标:发布转化率、互动行为转化率等           社交产品的转化指标:社交行为的转化率、充值行为的转化率等          在线教育产品转化指标:学习相关行为的转化率
  5. 传播:指用户自发传播的数量    邀请成功的用户占总用户的比例被邀请的注册用户在总注册用户的比例

  • 独立页面数据
  1. PV(访问量 Page View):用户每打开一个页面就被记录一次,用户多次打开同一界面,浏览量值累计
  2. UV(访客数 Unique Visitor):一天内同一访客多次访问只计算一个访客
  3. 访问时长:用户在该页面停留的时间
  4. 跳出率:只浏览了一个页面便离开网站的访问次数占总的访问量的百分比       

2、数据类型

  • 业务数据:产品的整体业务数据,比如订单量、发文数量、活跃用户数量等,跟产品的具体某个页面和用户具体的行为无关
  • 行为数据:统计的是用户在特定页面或特定功能上的行为数据,比如某个按钮的点击情况
  • 第三方数据:通过API接口获得的数据,比如物流信息

3、数据分析

3.1 数据分析概念

        通过收集数据提取出有用的数据,利用合理的方法进行分析,总结出相应的结论

3.2 数据分析要结合的维度

  • 角色 (产品、运营、市场)

  • 时间(历史、当下、未来)

  • 范围(产品全局、功能模块、类型划分)

  • 类型(活跃度、订单转化率)

3.3 数据分析的目的

        发现问题、解决问题、验证问题是否有效解决

二、数据分析流程

  1. 明确目标(分析什么数据)
  2. 梳理业务(数据涉及到产品的哪些模块、页面和功能)
  3. 数据采集(通过业务数据统计、埋点数据统计的方式来获得相应数据)
  4. 数据整理(将得到的数据整理在后台,涉及数据清洗)    
  5. 数据分析(通过不同维度来分析数据)
  6. 数据呈现(将数据以不同的报表形式呈现出来)

数据清洗: 去除'脏数据’(不完整数据、错误数据、几余数据),对数据进行知识发现及质量管理,根据标准定义存储在数据仓中。

三、数据呈现形式

         数据可视化:旨在借助于图形化手段,清晰有效地传达与沟通数据信息。(柱状图、折线图、散点图、饼图、雷达图)

1、柱状图

  • 适用场景:数据的分类对比,适合固定维度分布,但不适用于分类过多的情况
  • 适用数据:区域分布、月度分布
  • 设计时常见的问题:①名称显示:内容名称过长时采用倾斜或省略 ②最小刻度:纵坐标往往不是从0开始,而是从最小刻度开始

2、折线图

  •  适用场景:随时间变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势
  • 适用数据:活跃度、用户数,PV\UA......

3、柱线图 

        折线图与柱状图结合对比。 

4、饼图

  • 适用场景:了解数据分布情况,不适用分类过多的情况 
  • 适用数据:用户分布、类型分布
  • 设计时常见的问题:①显示上限:内容过多会显示不过来,可将较少的内容合并为"其他" ②显示区间:可按照不同区间显示内容

5、漏斗图 

  • 适用场景:表示某个环节业务量与上一环节之间的差异,适用有固定流程并且环节较多的分析,可以直观地显示转化率和流失率

  • 适用数据:整体留存、转化分析

6、雷达图

  • 适用场景:了解同类别的不同属性的综合情况,以及比较不同类别的相同属性差异
  • 使用数据:用户画像、内容画像 

7、散点图 

  • 适用场景:因变量随自变量而变化的大致趋势,存在大量数据点,结果更精准,数据量小的时候会比较混乱
  • 适用数据:优劣分布 

8、桑基图

  • 适用场景:表示不同页面(模块)的流量转化,适用对用户路径进行分析
  • 适用数据:用户转化分析

四、数据分析的几种常见方法

1、趋势分析

        趋势分析适用于产品核心指标的长期跟踪,如:活跃度、点击率等。需要明确数据的变化,以及对变化原因进行分析。

当数据出现异常,一般从3个角度查找问题:

  1. 技术层面:是否统计出错,或者产品出bug
  2. 产品层面:是否出现重要功能变更,导致数据异常变化
  3. 运营层面:是否运营措施有重大变更,导致数据异常变化  

2、对比分析

        对比分析,就是给孤立的数据一个合理的参考系,否则孤立的数据毫无意义。一般而言,对比数据时数据的基本面,比如行业的情况,全站的情况等。(对比分析要控制变量)

2.1 环比 

        本期统计数据与上期数据对比

2.2 同比

        本期统计数据与上一年度对应期间数据对比

3、细分分析 

        在得到一些初步结论时,需要进一步细拆,因为在一些综合指标的使用过程中,会抹杀一些关键的数据细节,而指标本身的变化,也需要分析变化产生的原因。这里的细分要进行多维度的细拆。最常用的维度是5W2H分析方法

五、数据产品结构 

数据产品结构 :

第三方产品与数据后台关系: 

 

 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • cowrie部署中遇到的坑
  • sqlite3 相关知识
  • 【佳学基因检测】在bagisto中,grouped products(同组产品)和bundled products(打包产品)有什么不同?
  • Nvidia GPU benchmark压力测试工具
  • 003: Visual Studio 配置 VTK 开发环境的方法与比较
  • Qt工程实践_06_Qt MSVC2O17编译器下的程序添加VS2017生成的动态链接库方法
  • Windows用户取消共享文件夹密码方法(Method for Windows Users to Cancel Shared Folder Password)
  • 科研绘图系列:R语言柱状图分布(histogram plot)
  • Mybatis【分页插件,缓存,一级缓存,二级缓存,常见缓存面试题】
  • 重头开始嵌入式第三十四天(数据库二)
  • html备忘录
  • IDEA 2024最新软件下载
  • 【全网最全】2024年数学建模国赛C题超详细保奖思路+可视化图表+成品论文+matlab/python代码等(后续会更新
  • Elastic Stack--ELFK实例与Dashboard界面
  • docker实战基础四(如何在容器中调试和排查运行问题)
  • “寒冬”下的金三银四跳槽季来了,帮你客观分析一下局面
  • 78. Subsets
  • Codepen 每日精选(2018-3-25)
  • Django 博客开发教程 8 - 博客文章详情页
  • Node项目之评分系统(二)- 数据库设计
  • React 快速上手 - 06 容器组件、展示组件、操作组件
  • spring-boot List转Page
  • 搭建gitbook 和 访问权限认证
  • 关于使用markdown的方法(引自CSDN教程)
  • 机器学习中为什么要做归一化normalization
  • 开源中国专访:Chameleon原理首发,其它跨多端统一框架都是假的?
  • 模型微调
  • 我建了一个叫Hello World的项目
  • 在Docker Swarm上部署Apache Storm:第1部分
  • 在Mac OS X上安装 Ruby运行环境
  • Linux权限管理(week1_day5)--技术流ken
  • 浅谈sql中的in与not in,exists与not exists的区别
  • ​Java基础复习笔记 第16章:网络编程
  • ​LeetCode解法汇总2670. 找出不同元素数目差数组
  • # 数据结构
  • ###C语言程序设计-----C语言学习(3)#
  • (Java企业 / 公司项目)点赞业务系统设计-批量查询点赞状态(二)
  • (Matalb时序预测)PSO-BP粒子群算法优化BP神经网络的多维时序回归预测
  • (二)WCF的Binding模型
  • (附源码)ssm基于web技术的医务志愿者管理系统 毕业设计 100910
  • (蓝桥杯每日一题)平方末尾及补充(常用的字符串函数功能)
  • (论文阅读11/100)Fast R-CNN
  • (免费分享)基于springboot,vue疗养中心管理系统
  • (三分钟)速览传统边缘检测算子
  • (十六)视图变换 正交投影 透视投影
  • (实战篇)如何缓存数据
  • (图文详解)小程序AppID申请以及在Hbuilderx中运行
  • (源码分析)springsecurity认证授权
  • (转载)Linux网络编程入门
  • *算法训练(leetcode)第三十九天 | 115. 不同的子序列、583. 两个字符串的删除操作、72. 编辑距离
  • .net core 的缓存方案
  • .NET MAUI Sqlite程序应用-数据库配置(一)
  • .net 发送邮件
  • .net 开发怎么实现前后端分离_前后端分离:分离式开发和一体式发布
  • .netcore 6.0/7.0项目迁移至.netcore 8.0 注意事项