回归分析通常是指用一个或者多个输入X(称为自变量,解释变量或者预测变量)来预测输出Y(称为因变量,响应变量或者结果变量)的一种方法
连续型变量:如人的身高,每天的运动小时数
类别型变量:
无序类别变量:如性别,职业
有序类别变量:如运动强度(低,中,高),成绩(优,良,中,差)
回归模型
用一个连续型的解释变量预测一个连续型的响应变量
比如:用广告投入金额去预测销售收入金额
销售收入=b+a*广告投入
用一个连续型的解释变量预测一个连续型的响应变量,模型的关系是n阶多项式
比如:用广告投入金额去预测销售收入金额
销售收入=b+a1*广告投入+a2*广告投入^2
用两个或多个连续型的解释变量预测一个连续型的响应变量
比如:用风速和当日辐照值去预测光伏电站的发电效率PR
发电效率PR=b+a1*风速+a2*当日辐照值
PR的多元回归曲面图
用两个或多个连续型的解释变量预测一个连续型的响应变量,模型的关系是n阶多项式和交叉乘积项
比如:用广告投入金额和研发投入金额去预测销售收入金额
销售收入=b+a1*广告投入+a2*研发投入+a11*广告投入^2+a22*研发投入^2+a12*广告投入*研发投入
用一个或者多个解释变量预测多个响应变量
用一个或多个解释变量预测一个类别型响应变量
注:Logistic回归的解释变量可以是连续型变量,也可以是类别型变量;响应变量是类别型变量
比如:广告的点击率预估问题(二分类问题),图像识别问题(多分类问题)
用一个或多个解释变量预测一个代表频数的变量
用一个或多个解释变量预测一个事件(死亡,失败或者旧病复发)发生的时间
回归模型总结
参考文献
《R语言实战》Robert I. Kabacoff
联系客服