Mlogit模型Stata代码及解读案例

目录
案例说明
案例介绍
案例合理性
Stata处理操作过程
变量设定
模型估计
模型检验
检验系数的显著性
组间无差异检验
拟合优度
预测概率值

案例说明

案例介绍

人们的期望工作回报可能受受教育程度、家庭经济状况等因素的影响，根据2015CGSS(CHINA GENERAL SOCIAL SURVEY）调查数据，将期望工作回报分为11种选择：高收入、工作有长期保障、社会声望和尊重、较大的职权、满足个人兴趣、有升迁机会、工作时间短、拓宽个人的社会关系、能为大众和社会服务、发挥个人才智且有成就感、自己可自由运用的时间多。那么受教育程度和家庭经济状况对期望工作回报的选择有什么影响呢？

案例合理性

该案例符合MLOGIT模型的使用条件。该案例属于多类别选择问题，且解释变量不随方案而变，排除条件LOGIT模型，则可以用MLOGIT模型解释该案例（MLOGIT模型广泛用于确定个体偏好概率以及选择类别的决策规则，主要用于处理类别选择问题）

Stata处理操作过程

变量设定

（1）被解释变量Y：
工作期望回报: 1=高收入；2=工作有长期保障；3=社会声望和尊重；4=较大的职权；5=满足个人兴趣；6=有升迁机会；7=工作时间短；8=拓宽个人的社会关系；9=能为大众和社会服务；10=发挥个人才智且有成就感；11=自己可自由运用的时间多。
（2）解释变量X
① edu1(受教育程度) 0=未受过教育；1=小学及以下；2=初中；3=高中；4=大学专科；5=本科及以上；
② Fes（家庭经济状况） 1=远低于平均水平；2=低于平均水平；3=平均水平；4=高于平均水平；5=远高于平均水平。

模型估计

代码及结果

模型结果解读

在输出结果中，ITERATION LOG显示了多项 LOGIT 模型的收敛速度，经过4次迭代后我们得到MLE 估计量。输出结果中的对数似然值 (LOG LIKELIHOOD=-14971.63) ,可用于嵌套模型的比较。
这里计算出的似然比统计量LRCHI2(20)=551.35是评估模型拟合程度的指标，检验了除常数项外所有变量的联合显著性，PROB > CHI2 = 0.0000表明与仅包含常数项的模型相比，该模型从整体而言具有更好的拟合优度。
实质上，MLOGIT模型可视为工作期望回报变量中的11种选择分别与“高收入”这一选择两两配对后构成的多个二元 LOGIT 模型实施联合估计。
MLOGIT是分析的目标选择与作为比较基准的参照之间的比较。MLOGIT中LOG-ODDS是选择某一个方案与基准组的对比。
回归结果中回归系数Β_IJ的解读以变量edu1为例：
的意思是变量edu1每增加一个单位，个体期望工作有长期保障相对于期望有高收入的胜算比对数 ( LOG-ODDS ) 将增加0.0028。
的意思是变量edu1每增加一个单位，个体期望社会声望和尊重相对于期望有高收入的胜算比对数 ( LOG-ODDS ) 将增加0.1062。
的意思是变量edu1每增加一个单位，个体期望有较大的职权相对于期望有高收入的胜算比对数 ( LOG-ODDS ) 将增加 0.00517。
其他的回归系数以此类推。

使用MLOGIT模型，只能获得各组类别相对于基准组（1=高收入）的估计系数( LOG-ODDS ),实际意义并不容易解释，而通常将其指数化得到胜算比（ODDS），即，指工作中期望得到某种回报的概率与期望高收入的概率的比值。胜算比(ODDS)也被称为相对风险(RELATIVE RISK)，经济含义是解释变量变化一个单位所引起的某类选择相对于基准组选择胜算比的变化。Stata代码及结果如下：

模型检验

需要检验以下几个内容：A.要检验某个变量是否显著，需要联合检验J - 1的系数是否同时不为0; B.要检验所有变量在两个组别之间的影响是否有显著差异，需要同时检验K个回归系数的联合显著性。C.在某些情况下，解释变量对两个甚至多个组别的影响具有相近的效果，我们便可以通过合并这些组别，以便得到更为有效的估计结果。此时，需要进行“无差异检验”。

检验系数的显著性

WALD检验可以通过WALD检验估计系数的显著性。可以采取TEST命令。以edu1为例，检验 edu1是否对个体工作期望回报产生影响，可以执行以下命令：

可以看出，结果显示非常显著，说明edu1的系数不同时为0，edu1对个体工作期望回报产生影响显著。LR检验我们也可以采用LR检验来检验edu1是否对工作期望回报有显著影响，可执行以下命令：

结果显示，EDU1对工作期望回报有显著影响。

组间无差异检验

如果所有解释变量整体上对第M种选择和第N种选择之间的胜算比没有显著影响，我们便称，对于模型中的变量，M和N是无差异的。第M种选择和第N种选择无差异对应如下原假设：

在某些情况下，解释变量对两个甚至多个组别的影响具有相近的效果。因此需要进行“组间无差异检验”。这一检验也可以通过 WALD 检验和 LR 检验实现。WALD检验
（1）检验“工作有长期保障”与基准组“高收入”是否满足无差异假设H0，可执行以下命令：

显然，我们可以拒绝无差异假设H0。结果显示，“工作有长期保障”与基准组“高收入”有差别。（2）当待检验的两个组别都不是基准组时，可以用TEST[G1=G2],例如要检验“工作有长期保障”和“社会声望和尊重”两个组别是否存在差异，可执行如下命令：

结果显示拒绝原假设，表明“工作有长期保障”和“社会声望和尊重”两个组别存在差异。

拟合优度

MLOGIT命令的默认输出结果为 MCFADDENS’R2。MCFADDEN’S R2也称为似然比指数，其基本思想在于比较仅包含常数项的模型和包含所有解释变量的模型之间的对数似然值的相对大小,分别记为L(MINTERCEPT)和L(M FULL)。定义如下：

该值越大表明模型的拟合程度越高。我们也可以采用FITSTAT命令列示其他衡量模型拟合优度的统计量。

我们在STATA中计算的PSEUDO R2=0.0181便是。随着解释变量增加，R_{M C F}^{2}值也会增加。

预测概率值

在给定某个解释变量的前提下，我们可以采用列表的方式来呈现预测概率值。例如我们想比较不同受教育程度对个体的不同工作回报期望的预测概率，可以采用PRTAB命令：

这里，选项OUTCOME(1)指定了我们要分析的是第一种工作期望回报“高收入”。可见，随着教育程度的提高，期望从工作中获得高收入的可能性在降低。同理，要分析受教育程度对“工作有长期保障”、“满足个人兴趣”、“有升迁机会”、“发挥个人才智且有成就感”选择概率的影响，可以通过设定选项：outcome(n),以n=2为例：

综上，可以得出结论：群体受教育程度越高，越期望从工作中获得“发挥个人才智且有成就感”、“有升迁机会”、“满足个人兴趣”等精神回报；受教育程度越低，在工作中更倾向于获得“高收入”、“工作有长期保障”等物质回报。

本文由：谭淑张懿萌蒋金容朱冰清等整理

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。