当前位置: 首页 > news >正文

使用Python分析北京积分落户数据,分析完我陷入了深思

这是学习笔记的第 2183 篇文章

读完需要

9

分钟

速读仅需5分钟

北京积分落户制是北京市政协建议推行积分落户政策,以科技贡献、专业技能、在京时间等指标为考核项,计算非京籍人才的“积分”,积分达标即可落户北京。也给了我们一众北漂希望,毕竟随着时间的增长,有些不太明显的问题会逐步摆在我们面前,从幼儿园开始到走入社会的教育,是让我们尤其关注的层面,积分落户算是开了一个口子,在现在大多数城市完全开放户籍政策,相比算是开放中的高冷了。

2016年8月11日,北京市积分落户管理办法(试行)发布。本市积分落户自2017年1月1日起施行,每年申请一次。

2018年4月11日,发布《北京市积分落户操作管理细则》,4月16日将正式开放在线系统,接受社会申报。

2018年将为首批通过积分获得落户资格的申请人办理落户手续。2018年8月1日,北京市首批积分落户数据核查阶段已结束。用人单位和申请人可登录积分落户在线申报系统查看申报数据初核结果。

10月23日起,正式开办北京市常住户口积分落户手续。2019年5月16日,市人力社保局发布消息,北京市2019年积分落户申报工作将于5月22日正式启动,申报期60天。

目前官方公布的数据为2018年的积分落户数据,通过对数据的分析,可以了解整体的比例和分布情况。

今天使用Python实现做了下数据分析,结合pandas, numpy, matplotlib, pyecharts等插件通过可视化的方式进行数据统计分析,以柱状图,饼图,地图,表格等形式展示数据的分布情况。

直接给出测试过程。

1   环境配置

   

Python

版本:3.8

插件

pandas

numpy

matplotlib

pyecharts

2   分数分布

   

2.1 分数按照5分为粒度进行统计

 

2.2 分数整体饼图统计

绝大多数的比例集中在90-95分,95~100分的区段次之,如果想得到更细粒度的数据,可以使用饼图查看。

 

其中,

90~95分的比例占到了55.6%

95~100分的比例占到了29.2%

100~105分的比例占到了10.8%

105分以上的比例占用不到5%

2.3 分数按照1分为粒度统计

在此基础上进行信息下钻,积分粒度按照1分来计算,可以看到90~91分的区段人数最多,90分压线的有300人左右。

 

年龄分布

   

3.1 细分年龄层次饼图

 

从饼图分布来看,

40~45岁的落户比例较高,为50.5%

35~40岁的落户比例次之,为42.2%

30~35岁的落户比例极低,为2.7%左右

45~50岁的落户比例较低,为4.3%

55~60岁的落户比例更低,为0.2%左右

3.2 细分年龄层次按照1岁为粒度进行统计

 

其中37~44岁为积分落户人数覆盖范围最多的年龄段,30~35岁的区段还是极少的比例。

公司分布

   

4.1 按照公司进行统计

公司情况如下:

北京华为数字技术有限公司

137

中央电视台

73

北京首钢建设集团有限公司

57

百度在线网络技术(北京)有限公司

55

联想(北京)有限公司

48

中国民生银行股份有限公司

40

北京外企人力资源服务有限公司

40

国际商业机器(中国)投资有限公司

39

中国国际技术智力合作有限公司

29

华为技术有限公司北京研究所

27

爱立信(中国)通信有限公司

26

腾讯科技(北京)有限公司

24

北京阿里巴巴云计算技术有限公司

23

中国石油天然气股份有限公司管道北京输油气分公司

20

用友软件股份有限公司

20

中铁建工集团有限公司

19

微软(中国)有限公司

17

中信银行股份有限公司

17

中煤建设集团工程有限公司

17

甲骨文(中国)软件系统有限公司

16

西门子(中国)有限公司

16

北京市京才实业开发总公司

16

中国光大银行股份有限公司

16

中铁电气化局集团有限公司

15

中铁三局集团第四工程有限公司

15

行业集中在华为,百度,爱立信,联想等公司,包括一些大型央企。

省份分布

   

5.1省份分布如下表所示:

河北

894

辽宁

484

山东

445

黑龙江

444

内蒙古

340

山西

316

吉林

309

河南

309

湖北

290

天津

239

四川

225

湖南

210

江苏

210

陕西

207

江西

191

安徽

184

甘肃

109

北京

97

浙江

90

新疆

80

福建

79

宁夏

51

广西

44

贵州

40

广东

37

青海

34

云南

31

上海

18

海南

10

西藏

1

重庆

1

其中河北,辽宁,山东,黑龙江占据较高比例,地域和北京有直接联系,而重庆,西藏,海南,云南的比例较低,上海主观猜测因为城市自身竞争力原因也处于末尾。

而且让我有些奇怪的是有些已经是北京户口了,怎么还要申请北京户口?

5.2 省份数据地图分布

 

QQ群号:763628645

QQ群二维码如下, 添加请注明:姓名+地区+职位,否则不予通过

订阅我的微信公众号“杨建荣的学习笔记”,第一时间免费收到文章更新。别忘了加星标,以免错过新推送提示。

7

   

近期热文

你可能也会对以下话题感兴趣。点击链接就可以查看。

  • MySQL的主键命名挺任性,就这么定了

  • 华裔教授发现二次方程极简解法,我默默的做了下验算

  • 回答:我不小心把公司的数据库给删了,该不该离职?

  • 迁移到MySQL的业务架构演进实战

  • 数据库修改密码风险高,如何保证业务持续,这几种密码双活方案可以参考

  • MySQL业务双活的初步设计方案

  • 如何优化MySQL千万级大表,我写了6000字的解读

  • 一道经典的MySQL面试题,答案出现三次反转

  • 业务双活的数据切换思路设计(下)

  • 业务双活的数据切换思路设计(一)

  • MySQL中的主键和rowid,看似简单,其实有一些使用陷阱需要注意

  • 小白学MySQL要多久?我整理了10多个问题的答案

8

   

转载热文

你可能也会对以下话题感兴趣,文章来源于转载,点击链接就可以查看。

  • 去IOE or Not?

  • 拉里·佩奇(Larry Page)的伟大归来

  • 《吊打面试官》系列-Redis基础

  • 唯一ID生成算法剖析,看看这篇就够了

  • 关于大数据运维能力的一些思考

  • DBA菜鸟的进化简史:不忘初心,记工作中踩过的三个坑

  • 美女主持直播,被突发意外打断!湾区网友却高喊: 我懂!超甜

相关文章:

  • 私有云MySQL多租户权限的初版设计
  • 关于中间件服务的配置管理,分为5个阶段
  • 一个诡异的MySQL慢日志问题
  • 关于MySQL中insert ignore,insert on duplicate和replace into,你可能没想过区别
  • 你可能不了解的《唐诗三百首》
  • 趣头条基于ClickHouse玩转每天1000亿数据量
  • 疏通厨房水槽的感悟
  • 《生活中的魔法数学》读后感
  • 《唐诗三百首》中的童年记录
  • 关于远程办公的一些思考
  • 从Oracle新特性看数据库发展
  • 用Python对2019年二手房价格进行数据分析
  • 一则慢日志监控误报的问题分析
  • MySQL备份失败,一波三折的问题分析和处理
  • 重启大法带给我的思考,原来不是简单的重启
  • 【Linux系统编程】快速查找errno错误码信息
  • 【翻译】Mashape是如何管理15000个API和微服务的(三)
  • js继承的实现方法
  • JS字符串转数字方法总结
  • magento2项目上线注意事项
  • Netty 框架总结「ChannelHandler 及 EventLoop」
  • ViewService——一种保证客户端与服务端同步的方法
  • 阿里云Kubernetes容器服务上体验Knative
  • 复杂数据处理
  • 给自己的博客网站加上酷炫的初音未来音乐游戏?
  • 构建二叉树进行数值数组的去重及优化
  • 经典排序算法及其 Java 实现
  • 浏览器缓存机制分析
  • 前端代码风格自动化系列(二)之Commitlint
  • 王永庆:技术创新改变教育未来
  • 微信端页面使用-webkit-box和绝对定位时,元素上移的问题
  • 微信小程序开发问题汇总
  • 新手搭建网站的主要流程
  • ​​​​​​​​​​​​​​Γ函数
  • # 睡眠3秒_床上这样睡觉的人,睡眠质量多半不好
  • #includecmath
  • #宝哥教你#查看jquery绑定的事件函数
  • $.ajax()
  • (BFS)hdoj2377-Bus Pass
  • (二)JAVA使用POI操作excel
  • (附源码)ssm高校志愿者服务系统 毕业设计 011648
  • (附源码)计算机毕业设计SSM基于健身房管理系统
  • (附源码)小程序 交通违法举报系统 毕业设计 242045
  • (机器学习-深度学习快速入门)第一章第一节:Python环境和数据分析
  • (剑指Offer)面试题41:和为s的连续正数序列
  • (免费领源码)Java#ssm#MySQL 创意商城03663-计算机毕业设计项目选题推荐
  • (提供数据集下载)基于大语言模型LangChain与ChatGLM3-6B本地知识库调优:数据集优化、参数调整、Prompt提示词优化实战
  • .mkp勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET 依赖注入和配置系统
  • .NET8.0 AOT 经验分享 FreeSql/FreeRedis/FreeScheduler 均已通过测试
  • .Net多线程总结
  • /bin/bash^M: bad interpreter: No such file ordirectory
  • ::什么意思
  • :如何用SQL脚本保存存储过程返回的结果集
  • @Transactional 竟也能解决分布式事务?