logistic回归中该怎样选择‘变量选择方法’

如果研究X对于Y的影响,Y为定量数据则可以使用线性回归分析 。
如果Y是定类数据,此时则需要使用Logit(logistic)回归分析 。Logit回归共分为三种,分别是二元Logit(Logistic)回归、多分类Logit(Logistic)回归,有序Logit(Logistic)回归(也称Oridinal回归),此三个方法的区别在于因变量Y的数据类型 。如下表:

logistic回归中该怎样选择‘变量选择方法’

文章插图
如果是有序Logit(logistic)回归,其因变量Y为定类且有序,即因变量的属性类别上为类别数据,但是类别之前可以对比大小,比如“不幸福,比较幸福和十分幸福”这是三种类别,但同时此三种类别可以对比大小,数字越大代表越幸福(此类数据也称有序数据) 。如果因变量为此类数据时,则需要使用有序logit回归分析 。
如果X非常多(比如超过10个),此时可以先对定类的X与Y进行卡方分析,对定量的X与Y进行方差分析,先看有没有差异关系,将最终有差异关系的X放入有序Logit回归模型中,这样X会较少,并且X与Y均有差异关系,也更可能有影响关系,此时有序Logit回归模型的预测准确率会更高 。
【logistic回归中该怎样选择‘变量选择方法’】

    推荐阅读