当前位置: 首页 > news >正文

自选择问题和处理效应模型

这里写目录标题

  • 自选择问题和处理效应模型
        • Tobit 模型假定
        • Heckman过程
        • 逆米歇尔比率推导过程
        • 逆米希尔比率推导过程
        • 自选择问题
        • 典型事实分析一定要列出来的
        • 关于OLS,Heckman-2sls,Heckman三种模型的估计结果对比
        • Heckman两阶段算逆米希尔比率分解
  • 处理效应模型

自选择问题和处理效应模型

在这里插入图片描述
在这里插入图片描述

  • DGP
    在这里插入图片描述
    在这里插入图片描述
  • 注意:
    这里的概率密度超过了1,这是正常的。概率密度的三原则,
  • 1是大于等于0;
  • 2是积分等于1;
  • 对于连续型随机变量,给定一个具体的x值,f(x)并不是该事件发生的概率。而是f(x)描述了在x处的概率密度,即随机变量取值落在x附近单位长度内的概率。

在这里插入图片描述

在这里插入图片描述
Tobit模型的适用数据

  • 简言之,y值有大部分是0(占比还不小),如果直接估计或者删除估计,都是有偏的。那么使用Tobit。
    在这里插入图片描述
  • 观察统计特征的代码
    在这里插入图片描述
    在这里插入图片描述
  • 下面是理论部分
Tobit 模型假定

在这里插入图片描述

  • P ( y i = 0 ∣ x i ) P(y_i=0|x_i) P(yi=0∣xi)
    在这里插入图片描述
    在这里插入图片描述
  • 这里的示性函数应该是 I y i > 0 I_{y_i>0} Iyi>0
    在这里插入图片描述
    结论
  • 如果用y和截断后的y去reg,都会低估参数值

在这里插入图片描述

h tobit的帮助命令
在这里插入图片描述

  • 几种模型的对比
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 数据是不是随机缺失还是非随机缺失 问题很大

  • 随机缺失,可以直接扔掉,非随机缺失,不能直接扔掉

  • 非随机缺失,缺失背后的原因很重要–【模仿学霸表象的学习】
    在这里插入图片描述

处理效应的随机和非随机
给的例子

  • 随机下:1000个样本,抓阄选取400个当实验对象。
  • 非随机下:1000个样本,按照一定条件(LEV ROE CG),有条件的充当实验对象。
    在这里插入图片描述
    自选择:
    若果在模型中有一个D(虚拟变量),那么一定要考虑取1(实验组),是不是随机选出来的?
Heckman过程

这里面有很多理解的点
但是最重要的:

  • 预设的模型,因为各种原因,可能会遗漏变量

在这里插入图片描述
在这里插入图片描述

逆米歇尔比率推导过程

在这里插入图片描述

逆米希尔比率推导过程

在这里插入图片描述
注意 λ ( − c ) \lambda(-c) λ(c)

在这里插入图片描述
在这里插入图片描述

  • 推广
  • 其实就是一个换元,将z换成 u / σ u/\sigma u/σ
    在这里插入图片描述
  • 读到这里,就解释了为什么逆米希尔比率可以代替“补丁”
    在这里插入图片描述
自选择问题

一定有两个方程

  • 选择方程-样本被观测到的条件
    i f z i r + γ i > 0 y c a n b e o b s e r v e d if \space \space \space z_ir+\gamma_i>0 \space \space y \space can \space be \space observed if   zir+γi>0  y can be observed
    i f z i r + γ i < 0 y c a n ′ t b e o b s e r v e d if \space z_ir+\gamma_i<0 \space \space \space y \space can't \space be \space observed if zir+γi<0   y cant be observed

  • 结果方程-构建的X对Y的影响方程

y i = x i β + u i y_i=x_i\beta+u_i yi=xiβ+ui

如果还看不懂 下面是著名的书籍
在这里插入图片描述

典型事实分析一定要列出来的

在这里插入图片描述

关于OLS,Heckman-2sls,Heckman三种模型的估计结果对比

在这里插入图片描述
在这里插入图片描述

Heckman两阶段算逆米希尔比率分解

在这里插入图片描述

内容小结:
在这里插入图片描述

Heckman Correction,又称两阶段方法)。赫克曼矫正法分两个步骤进行:第一步骤,研究者根据管理学理论设计出一个计算企业披露R&D投入概率的模型,而该模型的统计估计结果可以用来预测每个个体的概率;第二步骤,研究者将这些被预测个体概率合并为一个额外的解释变量,与其他控制变量等变量一起来矫正自选择问题。这个比率叫逆米尔斯比率,inverse Mills ration, imr,也就是说,在第一步计算出imr,在第二步把imr当作一个控制变量。

以企业R&D投入问题为例,假设全样本是1000家公司,其中800家公司披露了其R&D投入。

第一阶段的模型,是一个包括全样本(1000家)的Probit模型,用来估计一家公司是否会披露其R&D投入的概率。这里的因变量是二元的,表示是否披露R&D投入;自变量是一些会影响是否披露R&D的外生变量,比如其他收入营业收入,杠杆率,公司规模,所属行业等等。然后根据这个Probit模型,为每一个样本计算出imr,imr作用是为每一个样本计算出一个用于修正样本选择偏差的值。

第二阶段,在原来的回归方程,也就是原来只有800家公司的样本的方程假如imr作为控制变量,其他都不变,然后估计出回归参数。这时不管imr显著不显著都不重要,imr显著说明样本选择偏差的确影响了你最初模型的估计,这正表明了使用Heckman两步法纠正样本选择偏差的必要性。imr不显著说明原模型不存在严重的样本选择偏差,这时Heckman第二步得到的结果应该与原模型得到的结果差不多。(关于imr的显著性是否说明样本选择偏差存在目前还有争议,不过imr不是关注的变量)。第二步关注的对象是核心解释变量是否显著。只要核心解释变量显著,就说明结果稳健。

*描述性统计数据
sum age educ married children wage*简单的ols模型,存在选择性偏误
reg wage educ age
est store OLS*第一种方法  heckman maximum likelihood
heckman wage educ age, select(married children educ age) //默认最大似然估计  
est store HeckMLE*第二种方法  heckman two-step  all-in-one 不可以进行cluster调整
heckman wage educ age, select(married children educ age) twostep  
est store Heck2s*第二种方法  heckman two-step  step-by-step 可以进行cluster调整
probit work married children educ age
est store First  
predict y_hat, xb
gen pdf = normalden(y_hat)  //概率密度函数
gen cdf = normal(y_hat)     //累积分布函数
gen imr = pdf/cdf           //计算逆米尔斯比率
reg  wage educ age imr if work == 1  //女性工作子样本
est store Second
vif  //方差膨胀因子*对比结果
local m "OLS HeckMLE Heck2s First Second"  
esttab `m', mtitle(`m') nogap compress pr2 ar2

代码来源:
https://bbs.pinggu.org/thread-10568456-1-1.html

如果你觉得你的样本与大的样本有一些区别,就可以用Heckman方程纠偏。

在这里插入图片描述

处理效应模型

这是的y变成了0-1,
同时,mills “补丁”也有区别
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【Linux修行路】信号的产生
  • 性能测试的复习3-jmeter的断言、参数化、提取器
  • Apache Pulsar 与 Kafka Streams
  • Java后端开发(十六)-- JavaBean对象拷贝工具类:运用反射机制,实现对象的深拷贝
  • 速盾:cdn海外加速服务是什么?
  • 3C电子胶黏剂在手机制造方面有哪些关键的应用
  • 2024年9月12日(k8s环境及测试 常用命令)
  • springboot系列--yaml配置文件使用
  • spring项目整合log4j2日志框架(含log4j无法打印出日志的情况,含解决办法)
  • 数据结构算法——排序算法
  • 【计算机毕业设计】微信小程序的美甲店铺座位预约系统
  • 小程序面试题七
  • 图论篇--代码随想录算法训练营第五十六天打卡| 108. 冗余连接,109. 冗余连接II
  • PHP一键约课高效健身智能健身管理系统小程序源码
  • 线性规划及其MATLAB实现
  • 《Java编程思想》读书笔记-对象导论
  • 2017前端实习生面试总结
  • ES6语法详解(一)
  • java多线程
  • JS实现简单的MVC模式开发小游戏
  • nginx 配置多 域名 + 多 https
  • Nginx 通过 Lua + Redis 实现动态封禁 IP
  • node.js
  • puppeteer stop redirect 的正确姿势及 net::ERR_FAILED 的解决
  • Sass Day-01
  • supervisor 永不挂掉的进程 安装以及使用
  • 阿里云购买磁盘后挂载
  • 关于使用markdown的方法(引自CSDN教程)
  • 海量大数据大屏分析展示一步到位:DataWorks数据服务+MaxCompute Lightning对接DataV最佳实践...
  • 提升用户体验的利器——使用Vue-Occupy实现占位效果
  • 小程序测试方案初探
  • 原生 js 实现移动端 Touch 滑动反弹
  • nb
  • 如何通过报表单元格右键控制报表跳转到不同链接地址 ...
  • ​草莓熊python turtle绘图代码(玫瑰花版)附源代码
  • #HarmonyOS:Web组件的使用
  • #基础#使用Jupyter进行Notebook的转换 .ipynb文件导出为.md文件
  • (2020)Java后端开发----(面试题和笔试题)
  • (Java岗)秋招打卡!一本学历拿下美团、阿里、快手、米哈游offer
  • (Pytorch框架)神经网络输出维度调试,做出我们自己的网络来!!(详细教程~)
  • (接口自动化)Python3操作MySQL数据库
  • (一)、软硬件全开源智能手表,与手机互联,标配多表盘,功能丰富(ZSWatch-Zephyr)
  • (转)树状数组
  • .NET Core WebAPI中使用Log4net 日志级别分类并记录到数据库
  • .NetCore发布到IIS
  • @ 代码随想录算法训练营第8周(C语言)|Day57(动态规划)
  • @private @protected @public
  • [⑧ADRV902x]: Digital Pre-Distortion (DPD)学习笔记
  • [AI 大模型] 百度 文心一言
  • [android]-如何在向服务器发送request时附加已保存的cookie数据
  • [Android实例] 保持屏幕长亮的两种方法 [转]
  • [C# 基础知识系列]专题十六:Linq介绍
  • [C++] vector对比list deque的引出
  • [CP_AUTOSAR]_系统服务_DEM模块(一)功能及模块间依赖关系介绍
  • [C语言]-基础知识点梳理-文件管理