好有意思,因果识别竟然什么学科都抛出来, 因果识别 就是建立一个逻辑关系。无非就是在所有事物中找出与目标相关联的因素,因素中存在直接发生效用的就是因果。 这东西国外论文不可能说清楚,看汉语或汉字,根据汉语的词性来归类是最简单的方法。 如果你想问的是统计概率或是量化中的要素关联权重的识别问题,那个不属于因果,属于归纳汇总的逻辑方向。
因果有几个基本的特征,第一个,单一要素构成,既一个原因匹配一个结果,多个因素构成一个结局是统计,一个事物包含多少个要素是量化,是否发生判断发生等是概率,单纯的因果只有1对1,不能有两个原因导致1个结果。人类社会行为全部是从结果去找原因,而并非是找寻结果答案。
如某日某地发现一尸体,这是最现实的状况,这里只有结果没有原因,结果是人死了,然后叠加要素来判断原因,自杀还是他杀,这个是最简单的因果状态,一个结果由一个原因所致,死是一个状态的表现,所以一般具有状态表述性的词语都具有结果性质。 那么不可能没有原因的死掉一个人,就算是猝死那也得是在患有相关疾病的情况下。所以怎么死的就是死的原因,这个是核心逻辑,如果是被杀,那么被谁杀和动机就属于引发核心的本质逻辑的原因逻辑,也就是一件事物是在核心的本质逻辑之上又叠加了其他的逻辑所组合成的整体而切均为必然性质。
凡是带有主观目地性的词语大都具备原因要素,动词居多,像生活中最长碰到的语言逻辑会出现这种问题,你你又没喝酒为什么去厕所?去厕所是对结果的一种表述,就以小便来说,问题就不是建立在同一逻辑关系上,小便是因为尿急而不是因为喝酒,喝水也会尿急,而尿急的原因也不是喝酒或喝水,酒水只是说明,跟厕所的用意一样,原因是你喝了。所以喝东西到去小便是两层逻辑,而如果是去厕所又包含了对小便的说明,又含有逻辑。以上是比较基础的逻辑因果关系。
首先大家应该一下子就能想到,计量经济学首先有两个大的门派,微观计量和宏观计量。前者一般从微观个体出发,后者更多应用时间序列数据。当然,宏观经济学用到的方法,除了计量经济学的估计和识别之外,还有校准,这个我不是很熟,就不多说了。
而无论是哪个门派,下面又有很多宗派。比如在宏观计量里面,传统的matching moment、MLE和现在非常流行的Bayesian显然是两个不同的宗派。而在微观计量里面,则区分了structural-form和reduced-form两个宗派。
题主问的是因果识别,那我们就先来说一下不同门派、宗派之间因果识别的差别。
首先说我最不擅长的宏观计量。宏观方面,最popular的概念应该是格兰杰因果了。但是,相信大家都听说过,格兰杰因果不是真的因果。格兰杰意义上的因果仅仅是看滞后的变量能不能预测当期的变量,这里面问题就很多了。在这一领域,传统的方法是VAR,以及相应的VECM等,格兰杰因果也是在这个框架里面的东西。但是如果真的想要识别因果,特别是有当期影响的时候,就需要用SVAR了。
微观计量呢?微观计量的因果识别好玩的多。结构和简约两个门派总在相互竞争中不断发展新的想法。两者的区别在于,结构模型有有力的理论模型作为支撑,目的是估计模型的结构参数。而简约派则是避开复杂的经济理论建模和结构参数的估计,通过使用自然实验、工具变量等方法直接找到想要的参数(这个有点像唯识宗给你丝丝分析宇宙人生,而禅宗则是明心见性,直指人心)。
在举例子之前,我先总结一下以上答案提到的方法:
OLS、实验:最基本的办法,除非有理论支撑,或者数据来自与实验数据,一般会失败。
IV:当存在内生性的时候普遍的解决办法,很多方法,比如RD、LATE都可以看作是IV
DID:自然实验,实验组和控制组有共同趋势
RD:自然实验,外生的断点
以上的这几个方法都是reduced-form最经常用的。其中OLS和IV因为太general,所以structural model也会大量使用(在structural模型里面,IV经常是系统内部就可以找到的)。当然,对于structural model中足够复杂的模型,MLE、GMM以及许许多多其他估计方法都是非常多的。
为了更直观的给大家说清楚两个宗派的差别,我举个例子,如何识别peer effects。这套文献说白了就是想要看人和人之间的交互影响,比如你努力学习会不会影响到你的朋友也努力学习。





