离散型调节变量——该如何设定模型?

发布时间:2020-03-17 阅读 254

编译: 曾颖娴 (中山大学)
E-mail: 18819442774@163.com

Stata连享会   主页 || 视频 || 推文

连享会 - Stata 暑期班

线上直播 9 天:2020.7.28-8.7
主讲嘉宾:连玉君 (中山大学) | 江艇 (中国人民大学)
课程主页https://gitee.com/arlionn/PX | 微信版

Source: Benjamin Ferland. 2018. The Alternative Specification of Interaction Models With a Discrete Modifying Variable . The Political Methodologist.


目录


离散型调节变量——该如何设定模型?

自从 Brambor,Clark 和 Golder (2006) (以下简称 BCG ) 在《Political Analysis》中发表文章以来,我们对交互模型有了更深的理解,现在大多数实证学者也已经整合了正确执行和解释交互模型的工具。其中,BCG 的主要建议之一是在进行模型设定的时候,将交互作用的所有构成项都包含在模型中。

然而,BCG 也在其论文的公式 (7) 中指出,当一个调节变量 (Z) 是离散型变量时,进行模型设定时可以从交互模型中去掉某些构成项,此时的模型设定 (后文简称「替代设定」) 和原有的设定方法 (后文简称「标准设定」) 是等价的。

遗憾的是,这种「替代设定」方式并没有得到学术界的广泛认可。因此,本文的目的在于详细说明二者等价的原因,并提供一些实际的例子。

在下一部分,我将展示关于模型设定的 BCG 「标准设定」和「替代设定」的等价性。然后,我提供了在实际情况下应用这两种方法的简短示例—— Adams et al. (2006) 的研究《小众政党与主流政党有本质区别吗?》,通过示例的结果分析可以发现,进行模型设定时,无论是使用 BCG 提出的标准方法还是替代方法,都可以得到相同的结果。

总的来说,虽然两种模型设定的方法的效果是相同的,但是在解释回归结果方面,这两种模型设定的方法各有一些优势。

  • 标准设定」的优点是可以在回归结果中直接显示变量 X 对变量 Y 的边际效应的差异在调节变量 Z 的各个类别之间是否具有统计显著性。
  • 替代设定」的主要优点是可以在回归结果中直接显示变量 X 在调节变量 Z 的每个类别下的边际效应。因此,研究人员可以根据他们想要展示和强调的结果在两个等价的模型设定的方法之间进行选择。

简言之,简言之,「标准设定」可以显示「系数差异」,而「替代设定」则有助于显示系数的原始数值。

1. 模型设定的标准方法和替代方法之间的等价性

这里,我以一个因变量 Y 为例,它受到连续变量 X 和虚拟变量 D 交互作用的影响。我先展示两种模型设定方式,进而说明他们的关系和区别。

1.1 标准设定

BCG 的「标准设定」要求在模型中同时放入 XD 和交乘项 XD (后文简写为 XD) ,即:

其中,X 是连续变量,D 是虚拟变量。当 D=0 时 X 的边际效应 (Y/X) 等于 b2 ,而当 D=1 时 X 的边际效应则等于 b2b3

1.2 替代设定

BCG (参见等式 7 ) 和 Wright (1976) 提到的模型设定的替代方法是将虚拟变量 D 视为两个虚拟变量:原始变量 D (等于 0 和 1) 以及 D 的反面 D0 (当 D=0 时为 1,当 D=1 时为 0)。例如,如果 D 是一个虚拟变量,其中 1 代表民主国家,0 代表专制国家,那么 D0 则是一个相反的虚拟变量,其中 1 代表专制国家, 0 代表民主国家。因此,D+D0=1 并且 D0=1D

模型设定的替代方法如下: 将 X 分别与 D 和 D0 相乘得到新的交乘项 XD 和 XD0,其次将这两个交乘项和虚拟变量 D 或 D0 中的其中一个虚拟变量纳入模型中。

需要说明的是,由于 DD0 以及常数项这三者是完全共线性的,因此在模型中放入常数项后,只需包含 D 或 D0 的其中一个。同理,由于模型中已经包含两个交乘项:XD 和 XD0,我们也无需再放入 X 本身了。

因此,替代方法如下式:

等式 (2) 可以改写为:

由 (3) 式可以发现,进行模型设定时也可以不创建 D0 ,而只需将 X 乘以 (1D)。在 (2) 式和 (3) 式中,当 D=0 时 (即当 D0 =1 时) X 的边际效应等于 a3 , 而当 D=1 时 X 的边际效应由 a2 给出。

1.3 简单对比

替代设定」的主要优点是可以从回归结果中直接得到离散型调节变量 D 的每个类别对 X 的边际效应及其相关的标准误。而「标准设定」则无法直接得到这些结果,它仅能直接提供这些结果中的一个 (即 b2,当 D=0 时 X 的边际效应)。

因此,若使用「替代设定」,当 D=1 时,我们需要将 b2 和 b3 相加以获得 X 的边际效应。在 Stata 中,可以使用命令 lincom (lincom _b[coef1] + _b [coef1]) 得到这个结果。

然而,「替代设定」的优点也同时是它的缺点:其回归结果没有表明当 D=0 时和 D=1 时 X 的边际效应之间的差异是否具有统计显著性。而这则是「标准设定」的优点,它可以在回归结果中提供此信息。如果在等式(1) 中,系数 b3 具有统计显著性,则表明当 D=1 时, X 的边际效应在统计上与 D=0 时 X 的边际效应是不同的。如果要用替代方法设定的模型的结果来回答这个问题,我们必须检验 a2 和 a3 的等价性。在 Stata 中,使用命令 test (test _b [coef1] = _b [coef2]) 或 lincom (lincom _b [coef1] - _b [coef2]) 可以达到这个检验目的。

综合而言,我们也可以在论文中同时呈现两种设定两种设定下的结果,以便读者可以一目了然地看到系数之间的关系。

无论离散型变量是名义变量还是有序变量,这种模型设定的替代方法都可以推广到具有多个类别的离散型变量,方法步骤是一样的。

  • 首先,我们需要为离散型调节变量的每个类别创建一个虚拟变量。
  • 然后,我们将 X 与每一个虚拟变量中的每一个相乘得到相应的交互项。
  • 最后,在模型中包含虚拟变量 D 或 D0、得到的所有交互项项和其他所有构成项 (除了 X)。

通过这种方法进行模型设定,研究人员可以直接估计 X 在离散型调节变量的不同值上的实质影响的大小。

2. 文献重现:小众政党与主流政党有本质区别吗?

在本节中,我通过重现 Adams et al. 2006 年发表在《American Journal of Political Science》上的文章《小众政党与主流政党有本质区别吗?》的实证结果,比较了交互模型设定的标准方法和替代方法的结果。

问题背景

这篇文章主要研究了两个问题。首先,作者研究了主流政党在调整政策方案方面是否比小众政党更能响应公共舆论的转移。其次,基于这一预测,他们研究了在调节其政策立场时,小众政党是否会比主流政党在选举中受到更多惩罚。这里,我只重现了他们与第一个问题相关的模型。

Adams et al. (2006) 对七个发达民主国家(意大利、英国、希腊、卢森堡、丹麦、荷兰和西班牙) 在 1976-1998 年间的数据进行了假设检验,并且使用 Comparative Manifesto Project ( CMP) 的数据衡量政党在左右意识形态层面上的政策立场。欧盟民意调查 (Eurobarometer) 被用于根据相应的左右意识形态维度来定位受访者。舆论是所有受访者自我定义的平均水平。最后,作者将共产主义、绿党和民族主义政党编码为一个虚拟变量——小众政党。

模型设定和实证结果

在表 1 中,我研究了政党对舆论的反应,并介绍了模型设定的两种方法的结果。Adams et al. (2006) 采用常见的标准方法进行模型设定,将变量舆论转移 (publicopinionshift) 与虚拟变量小众政党 (nicheparty) 进行交互得到交乘项。因变量是一方政党左右立场的变化。因此,Adams et al. (2006) 设定了一个动态模型。在该模型中,他们评估舆论的变化是否会影响两次选举之间政党立场的变化。模型里包括了对国家的固定影响和一些控制变量(详细解释见原文)。由此,得到的模型设定如下:

在表 1 的第 (1) 列中,我展示了与 Adams et al. (2006) 文章中表 1 中公布的结果相同的结果。其中,第 (1) 列的结果支持了作者的观点,即小众政党对舆论转移的反应不如主流政党。舆论转移 (publicopinionshift) 的系数(0.97) 在统计上显著为正,表明当舆论向左转变时,主流政党 (小众政党 nicheparty =0) 会相应向左调整政策立场。舆论转移与小众政党的交互项 (publicopinionshift×nicheparty) 的系数 (-1.52) 表明,面对舆论转移,小众政党调整其政策立场的反应低于主流政党1.52个百分点,并且该差异具有统计学意义(p<0.01)。

在表 1 的第 (2) 列中,我展示了使用替代方法进行模型设定的结果。生成主流政党 (mainstreamparty) 的变量后分别将小众政党(nicheparty)、主流政党 (mainstreamparty) 与舆论转移 (publicopinionshift) 进行交互得到交乘项,纳入模型后,模型展示如下:

这里,主流政党 (mainstreamparty) 等于(1 -小众政党(nicheparty) )。

我们可以发现,其实第 (1) 和 (2) 列中的结果在数学上是等价的,两列中的控制变量的系数完全相同。然而,两个模型的结果在对交互效应的解释效果上却是存在差异的。 一方面,在第 (2) 列中,主流政党-舆论转移 (publicopinionshiftmainstreamparty) 系数为 0.97,等于第 (1) 列中舆论转移 (publicopinionshift) 的系数。这是因为第 (2) 列中主流政党-舆论转移 (publicopinionshiftmainstreamparty) 的系数表明舆论转移对主流政党立场的影响,正如第 (1) 栏中舆论转移 (publicopinionshift) 的系数代表的含义是一样的。

另一方面,第 (2) 列中小众政党-舆论转移系数 (publicopinionshiftnicheparty) 等于 0.55,在5%水平上具有统计显著性。这表明当舆论向左转变时,小众政党向右调整其政策立场。当使用标准方法进行模型设定时,则未能直接显示这个结果,正如第 (1) 列所示。当使用标准方法进行模型设定时,要想得到小众政党与舆论转移的交互作用的系数,必须 将舆论转移 (publicopinionshift) 的系数和舆论转移与小众政党交乘项 (publicopinionshift×nicheparty) 系数相加以获得边际效应。如表中结果可知,第 (1) 列中舆论转移 (publicopinionshift) 的系数和舆论转移与小众政党交乘项 (publicopinionshift×nicheparty) 系数之和,即 0.97+(1.52)=0.55,这与第 (2) 列中小众政党-舆论转移 (publicopinionshiftnicheparty) 的系数相等。

在第 (2) 栏中,Wald 检验表明,小众政党-舆论转移 (publicopinionshiftnicheparty) 和主流政党-舆论转移 (publicopinionshiftmainstreamparty) 的边际效应的差异在1%水平上具有统计显著性,正如第 (1) 列中舆论转移与小众政党交乘项 (publicopinionshift×nicheparty) 的系数显示的那样。

总体而言,当交互模型中的调节变量是离散型变量时,研究人员可以使用两种不同的方法进行模型设定:BCG 标准方法(包含交互的所有构成项) 和替代方法(不明确包含交互的所有构成项)。这两种方法在解释交互效应方面都有其优势。其中,替代方法的优点是对于离散型调节变量 Z 的每个类别,可以直接显示自变量 X 对 Y 的边际效应。另一方面, BCG 标准方法的优点是直接呈现 X 对 Y 在离散型调节变量 Z 每个类别下的边际效应的差异是否在统计上显著)。但是,研究人员在两种模型中均需要进行额外的检验,使用替代方法时需要验证边际效应的差异是否在统计上显著,使用常见的标准方法时则需要分别计算离散型调节变量每个类别下的实际边际效应。

3. Stata 范例

使用 数据 c10interaction.dta (http://www.stata-press.com/data/agis4/c10interaction.dta) , 研究收入 inc 与性别 male 和受教育年限 educ 之间的关系,其中,关于性别 male 的衡量,当为女性时,male =1,当为男性时,male =0。

标准设定

. use http://www.stata-press.com/data/agis4/c10interaction.dta, clear
. egen mis = rowmiss(_all)
. drop if mis
. gen educXmale= educ*male
. reg inc male educ educXmale


      Source |       SS           df       MS      Number of obs   =       120
-------------+----------------------------------   F(3, 116)       =     34.89
       Model |  122604.719         3  40868.2397   Prob > F        =    0.0000
    Residual |  135875.281       116  1171.33863   R-squared       =    0.4743
-------------+----------------------------------   Adj R-squared   =    0.4607
       Total |      258480       119  2172.10084   Root MSE        =    34.225

------------------------------------------------------------------------------
         inc |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        male |  -91.88539   26.27242    -3.50   0.001    -143.9212   -39.84954
        educ |   3.602369   1.388076     2.60   0.011     .8531092    6.351628
   educXmale |   8.196446   1.885263     4.35   0.000     4.462445    11.93045
       _cons |   16.84834   19.07279     0.88   0.379    -20.92773     54.6244
------------------------------------------------------------------------------

. regfit

inc = 16.848 - 91.885*male + 3.602*educ + 8.196*educXmale
      (0.88)    (-3.50)      (2.60)       (4.35)
N  = 120, R2 = 0.4743, adj-R2 = 0.4607

. lincom educ + educXmale

 ( 1)  educ + educXmale = 0

------------------------------------------------------------------------------
         inc |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         (1) |   11.79881    1.27572     9.25   0.000      9.27209    14.32554
------------------------------------------------------------------------------

由上述标准方法的回归结果可知,当是男性( male =0) 时,受教育年限对收入的边际效应为 3.602 (即为 educ 的系数) ;当是女性( male =1) 时,受教育年限对收入的边际效应为 11.799 (即为 educ 的系数 3.602 加上 educXmale 的系数8.196, 3.602+8.196=11.799) ,并且边际效应具有显著性。

替代设定

use http://www.stata-press.com/data/agis4/c10interaction.dta
egen mis = rowmiss(_all)
drop if mis
gen Male = 1-male
gen educXmale= educ*male
gen educXMale= educ*Male
reg inc male educXmale educXMale

      Source |       SS           df       MS      Number of obs   =       120
-------------+----------------------------------   F(3, 116)       =     34.89
       Model |  122604.719         3  40868.2397   Prob > F        =    0.0000
    Residual |  135875.281       116  1171.33863   R-squared       =    0.4743
-------------+----------------------------------   Adj R-squared   =    0.4607
       Total |      258480       119  2172.10084   Root MSE        =    34.225

------------------------------------------------------------------------------
         inc |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        male |  -91.88539   26.27242    -3.50   0.001    -143.9212   -39.84954
   educXmale |   11.79881    1.27572     9.25   0.000      9.27209    14.32554
   educXMale |   3.602369   1.388076     2.60   0.011     .8531092    6.351628
       _cons |   16.84834   19.07279     0.88   0.379    -20.92773     54.6244
------------------------------------------------------------------------------
regfit
inc = 16.848 - 91.885*male +11.799*educXmale + 3.602*educXMale
      (0.88)    (-3.50)          (9.25)            (2.60)
N  = 120, R2 =0.4743, adj-R2 = 0.4607

test educXmale=educXMale

 ( 1)  educXmale - educXMale = 0

       F(  1,   116) =   18.90
            Prob > F =    0.0000

由上述替代方法的回归结果可知,当是男性( male =0,Male =1) 时,受教育年限对收入的边际效应为3.602 (即为 educXMale 的系数) ;当是女性( male =1,Male =0) 时,受教育年限对收入的边际效应为 11.799 (即为 educXmale 的系数 ) ,且两者边际效应的差异在1%水平上具有统计显著性。

由此范例可知,当交互模型中的调节变量是离散型变量时,模型设定的标准方法和替代方法均可用以检验分析其交互作用,其中,常见的标准设定方法可以直接体现 educinc 在 调节变量 male 下的边际效应是否具有显著性, (从范例的标准模型设定的结果表格中可以直接获取 educXmale 的系数8.196 在1%水平上具有统计显著性) ,而替代设定方法则可以直接显示对于调节变量的各个类别 maleMaleeducinc 的边际效应 (即是范例中的 educXmaleeducXMale 的系数)。

参考文献

  • Adams, James, Michael Clark, Lawrence Ezrow and Garrett Glasgow. 2006. "Are Niche Parties Fundamentally Different from Mainstream Parties? The Causes and the Electoral Consequences of Western European Parties' Policy Shifts, 1976-1998." American Journal of Political Science 50 (3) : 513–529. [[Link]]https://onlinelibrary.wiley.xilesou.top/doi/abs/10.1111/j.1540-5907.2006.00199.x()
  • Brambor, Thomas, William Roberts Clark and Matt Golder. 2006. "Understanding Interaction Models: Improving Empirical Analyses." Political Analysis 14: 63–82. [Link]
  • Wright, Gerald C. 1976. "Linear Models for Evaluating Conditional Relationships." American Journal of Political Science 2: 349–373. [Link]

连享会 - 文本分析与爬虫 - 专题视频

主讲嘉宾:司继春 || 游万海

连享会-文本分析与爬虫-专题视频教程
连享会-文本分析与爬虫-专题视频教程

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
Stata暑期班 连玉君
江艇
线上直播 9 天
2020.7.28-8.7
效率分析-专题 连玉君
鲁晓东
张 宁
视频-TFP-SFA-DEA
已上线,3天
文本分析/爬虫 游万海
司继春
视频-文本分析与爬虫
已上线,4天
空间计量系列 范巧 空间全局模型, 空间权重矩阵
空间动态面板, 空间DID
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:
    • 课程, 直播, 视频, 客服, 模型设定, 研究设计, 暑期班
    • stata, plus,Profile, 手册, SJ, 外部命令, profile, mata, 绘图, 编程, 数据, 可视化
    • DID,RDD, PSM,IV,DID, DDD, 合成控制法,内生性, 事件研究, 交乘, 平方项, 缺失值, 离群值, 缩尾, R2, 乱码, 结果
    • Probit, Logit, tobit, MLE, GMM, DEA, Bootstrap, bs, MC, TFP, 面板, 直击面板数据, 动态面板, VAR, 生存分析, 分位数
    • 空间, 空间计量, 连老师, 直播, 爬虫, 文本, 正则, python
    • Markdown, Markdown幻灯片, marp, 工具, 软件, Sai2, gInk, Annotator, 手写批注, 盈余管理, 特斯拉, 甲壳虫, 论文重现, 易懂教程, 码云, 教程, 知乎

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……


扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD