当前位置: 首页 > news >正文

交叉分析方法与实现

import pandas as pd
import numpy as np
import scipy.stats as ss
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv("./data/HR.csv")
#获得以department分组后的索引值的数组dict
dp_indices = df.groupby("department").indices 
sales_values = df["left"].iloc[dp_indices["sales"]].values
technical_values = df["left"].iloc[dp_indices["technical"]].values
print(ss.ttest_ind(sales_values,technical_values)[1])

dp_keys = list(dp_indices.keys())
dp_t_mat = np.zeros([len(dp_keys),len(dp_keys)])
for i in range(len(dp_keys)):
    for j in range(len(dp_keys)):
        p_value = ss.ttest_ind(df["left"].iloc[dp_indices[dp_keys[i]]].values,
                              df["left"].iloc[dp_indices[dp_keys[j]]].values)[1]
        dp_t_mat[i][j] = p_value
sns.heatmap(dp_t_mat,xticklabels=dp_keys,yticklabels=dp_keys)
plt.show()
img_46b64192502fc4005c397749948cf270.png
颜色越深的地方t值越接近于0,也就代表颜色越深的地方,二者的离职率是有显著差异的,而颜色淡的地方代表离职率没有显著差异


piv_tb = pd.pivot_table(df,values="left",index=["promotion_last_5years","salary"],
                       columns=["Work_accident"],aggfunc=np.mean)
print(piv_tb)
img_4016b545f48de7108200a0174cd24156.png
sns.heatmap(piv_tb,vmin=0,vmax=1)
plt.show()
img_4b684e9b2a237b4cc569fb41cce59666.png

相关文章:

  • 不拥抱doucment.write
  • py 的 第 33 天
  • [Vue CLI 3] 配置解析之 css.extract
  • 如何实现360度的手游安全防护?网易云易盾专家分享最新实践
  • 读入优化摸板
  • 有用的生活有关的website
  • 安卓学习阶段的回顾整理
  • ACM-ICPC 2018 焦作赛区网络预赛 A Magic Mirror(签到)
  • Python - 闭包Closure
  • 什么是注入点
  • 网易云易盾关于极验所述问题的致歉和说明
  • workflow的简介
  • Navicat Premium
  • 在python中安装basemap
  • 开拓创新,这才是该做的事情
  • Angularjs之国际化
  • co模块的前端实现
  • Create React App 使用
  • Java-详解HashMap
  • jdbc就是这么简单
  • MyEclipse 8.0 GA 搭建 Struts2 + Spring2 + Hibernate3 (测试)
  • Redis中的lru算法实现
  • tensorflow学习笔记3——MNIST应用篇
  • vue和cordova项目整合打包,并实现vue调用android的相机的demo
  • 从PHP迁移至Golang - 基础篇
  • 分布式熔断降级平台aegis
  • 马上搞懂 GeoJSON
  • 区块链技术特点之去中心化特性
  • 使用common-codec进行md5加密
  • 数据仓库的几种建模方法
  • !!java web学习笔记(一到五)
  • #Linux(Source Insight安装及工程建立)
  • (003)SlickEdit Unity的补全
  • (3)llvm ir转换过程
  • (3)nginx 配置(nginx.conf)
  • (4.10~4.16)
  • (solr系列:一)使用tomcat部署solr服务
  • (二)JAVA使用POI操作excel
  • (附源码)spring boot球鞋文化交流论坛 毕业设计 141436
  • (转)JAVA中的堆栈
  • .form文件_SSM框架文件上传篇
  • .NET Remoting学习笔记(三)信道
  • .NET Standard、.NET Framework 、.NET Core三者的关系与区别?
  • .NET/C# 异常处理:写一个空的 try 块代码,而把重要代码写到 finally 中(Constrained Execution Regions)
  • .NET/C# 在代码中测量代码执行耗时的建议(比较系统性能计数器和系统时间)
  • .NetCore实践篇:分布式监控Zipkin持久化之殇
  • .net获取当前url各种属性(文件名、参数、域名 等)的方法
  • /var/lib/dpkg/lock 锁定问题
  • :O)修改linux硬件时间
  • @DateTimeFormat 和 @JsonFormat 注解详解
  • [ JavaScript ] JSON方法
  • []T 还是 []*T, 这是一个问题
  • [20160902]rm -rf的惨案.txt
  • [BUUCTF 2018]Online Tool(特详解)
  • [BUUCTF]-PWN:wustctf2020_number_game解析(补码,整数漏洞)