1、异质性(Heteroskedastic)如何准确识别自变量X对因变量Y的作用?考虑到影响Y的因素有很多,不仅包括X,也包括其他因素(也即非观测因素)。
2、为逻辑清晰起见,我们简单把非观测因素的作用归结为Z。
3、如果X的值变化了,Z的值也随之变动,此时你观测到的Y的变动,到底是X引起的,还是Z引起的?说不清楚。
(资料图片)
4、所以,逻辑上来讲,只有在Z不变的情况下,X变了,Y也变了,你才可以说,Y的变动确实是X引起的,因为此时其他因素Z是保持不变的,也就是我们通常说的“其他因素不变”。
5、那么,其他因素Z不变,如果其作用被吸收进误差项(因为既然Z是非观测因素,缺乏有效测量数据,那么你在计量经济模型中是只考虑X的),其在统计上的表现之一就是误差项的方差应该保持不变(当然还有其他统计上的表现,方差不变只是“其他条件不变”这一前提的统计表现之一)。
6、因为误差项是随机因素成分,其方差不应随X的变化而表现出系统性的差别。
7、当把Z的效应纳入误差项后,如果Z是随X变化的(就是不同的X,其他因素Z也不同),那么这样的误差项当然就表现出“异方差”了。
8、从另一个角度来说,同方差假设给统计推断带来便利,因为你要估计的方差数大大减少了。
9、不管X取何值,误差项的条件方差都是一样的,否则X每取一个值,你都要去估计一个条件方差,重复测量数据还勉强可以做到,一般的横截面数据是不可能估计出这么多的误差方差的。
10、研究的样本的重要属性上总是存在差异(Heteroskedasticity),比如人和人之间的消费习惯可能大相径庭,这样你记录1000个人10年的月消费数据,即便他们收入流和资产完全相同,消费流也可能截然不同。
11、在统计性质上,这种不同表现为异方差。
12、所以在计量模型上,横截面数据和面板数据经常出现,也可以说总会存在异质性问题。
本文分享完毕,希望对大家有所帮助。
关键词: