当前位置：文档之家› 倾向匹配评分法

倾向匹配评分法

倾向得分匹配法介绍

倾向得分匹配法介绍本研究主要考察政府对企业研究开发补贴的影响，由于传统的模型例如采用普通最小二乘法（OLS）估计的多元线性模型难以有效地解决可能存在的样本选择性偏差和遗漏关键变量所造成的内生性这两个关键性问题。因此，本研究主要采用倾向得分匹配法（propensity score matching，PSM）对政府对企业研究开发的补贴与企业发展水平的实证关系进行稳健性的因果推断。一、模型构建 1、政府补贴的二值分类指标倾向得分匹配法方法的理论框架是基于“反事实推断模型”，即假定任何因果分析的研究对象都存在可以观测到的和未被观测到的两种结果。以本研究为例，根据建模的需要，首先将样本企业分为两种类型，比较样本企业在“受到补贴” 与“没有受到补贴”这两种状态下是否存在系统性差异。一类是获得政府在研究开发方面给予补贴的企业，即处理组（T，treatment group）；另一类是没有获得政府补贴的企业，即为控制组（C，control group），由此建立二元虚拟变量 D s={0，1}。当D s=1时，表示该企业S获得了政府补贴；当D s=0时，表示该企业S为参照组，没有获得政府补贴。 2、倾向得分匹配估计（PSM）根据倾向得分匹配法方法的估计思路，假设lnincome表示企业发展水平的结果变量，lnincome1表示获得政府补贴的企业发展水平，lnincome0表示未获得政府补贴的企业发展水平。根据Rubin反事实估计的设定要求，本研究将获得政府补贴对企业发展水平影响的参照组平均处理效应（ATT）、控制组平均处理效应（ATU）和平均处理效应（ATE）分别定义为公式（1）-（3）。 ATT=E[(lnincome1- lnincome0) | X, subside=1] （1） ATU= E[(lnincome1- lnincome0) | X, subside=0] （2） ATE=E[(lnincome1- lnincome0) | X] （3）

倾向得分匹配-知乎

倾向得分匹配(Propensity Score Matching) 的通俗解析及在Stata里的运用徐惟能· 2 年前倾向得分匹配法是一种研究方法，它在研究某项治疗、政策、或者其他事件的影响因素上很常见。对于经济、金融学领域来说，比如需要研究某个劳动者接受某种高等教育对其收入的影响，或者比如研究某个企业运用了某项管理层激励措施以后对企业业绩的影响。如果我们简单地将是否执行了某项事件作为虚拟变量，而对总体进行回归的话，参数估计就会产生偏误，因为在这样的情况下，我们只观察到了某一个对象他因为发生了某一事件后产生的表现，并且拿这种表现去和另一些没有发生这件事情的其他对象去做比较。这样的比较显然是不科学的，因为比较的基础并不同。通俗地说，我们真正要做的是考虑，如果拿小明来说，小明读了研究生和小明没有读研究生，他的收入会差多少？可是小明已经读了研究生，我怎么才能估计出他要是不读研究生，他的收入会是多少呢？于是，我们引入“倾向得分匹配”这样一种研究方法。英文叫Propensity Score Matching。这种方法能让我们从一大堆没有读研究生的人群中（也就是我们的总体样本的一个子集），对每个人读研究生的概率进行估计，然后选出和小明具有非常相似的去读研究生的概率，可是没有去读的同学小刚——作为小明的对照，然后再来看他们的区别。当样本中的每个研究生”小明“都找到了匹配的非研究生”小刚“，我们便能对这两组样本进行比较研究了。 1. 所以第一步，我们要对总体样本执行probit或者logit模型，然后估计出每一个观测对象读研究生的概率是多少。以probit模型为例，在stata中，执行以下命令： probit [dependent var] [independent var] 其中，[dependent var]是一个0或1的二进制变量，1代表该对象读了研究生，否则是0。 2. 对每一个观测值，我们根据估计出来的probit模型，算出他读研究生的概率是多少。Stata中，执行如下命令： predictpscore, p 其中，pscore是定义的记录每个观测对象概率的变量名称。

倾向得分匹配法(PSM)举例及stata实现

倾向得分匹配法（PSM ）举例及stata 实现 ——读书笔记【例】培训对工资的效应1 政策背景：国家支持工作示范项目（National Supported Work,NSW ）研究目的：检验接受该项目（培训）与不接受该项目（培训）对工资的影响。基本思想：分析接受培训组（处理组，treatment group ）接受培训行为与不接受培训行为在工资表现上的差异。但是，现实可以观测到的是处理组接受培训的事实，而处理组没有接受培训会怎样是不可能观测到的，这种状态也成为反事实（counterfactual ）。匹配法就是为了解决这种不可观测事实的方法。在倾向得分匹配方法（Propensity Score Matching ）中，根据处理指示变量将样本分为两个组，一是处理组，在本例中就是在NSW 实施后接受培训的组；二是对照组（comparison group ），在本例中就是在NSW 实施后不接受培训的组。倾向得分匹配方法的基本思想是，在处理组和对照组样本通过一定的方式匹配后，在其他条件完全相同的情况下，通过接受培训的组（处理组）与不接受培训的组（对照组）在工资表现上的差异来判断接受培训的行为与工资之间的因果关系。变量定义：变量定义 TREAT * 处理指示变量，1表示接受培训（处理组），0表示没有接受培训（对照组） AGE 年龄（年） EDUC 受教育年数（年） BLACK 种族虚拟变量，黑人时，1BLACK = HSIP 民族虚拟变量，西班牙人时，=1HSIP MARR 婚姻状况虚拟变量，已婚，1MARR = 74RE 1974年实际工资（1982年美元） 75RE 1975年实际工资 78RE 1978年实际工资 74U 当在1974年失业，741U = 75U 当在1975年失业，751U = NODEGREE 当12EDUC <时，1NODEGREE =，否则为0 AGESQ AGE AGE × 1 本例选自Cameron&Trivedi 《微观计量经济学：方法与应用》（中译本，上海财经大学出版社，2010）pp794-800 所有数据及程序均来自于本书的配套网站（https://www.doczj.com/doc/185025796.html,/mmabook/mmaprograms.html ）。本文是末学向两位善知识Cameron 和Trivedi 的教材恭敬学习后整理的读书笔记，没有任何创意，只是简化整理一番而已，整理中难免错谬之处，敬请指正，不胜感激。末学联系方式houhh1125@https://www.doczj.com/doc/185025796.html,