这篇文章主要为大家展示了“使用R语言与多元线性回归分析计算的示例”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“使用R语言与多元线性回归分析计算的示例”这篇文章吧。
例 6.9 某大型牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格,广告投入等之间的关系,从而预测出在不同价格和广告费用下销售量。为此,销售部门的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以及周期其他厂家生产同类牙膏的市场平均销售价格,如表6.4所示。
试根据这些数据建立一个数学模型,分析牙膏销售量与其他因素的关系,为制订价格策略和广告投入策略提供数量依据。
由于牙膏是生活的必需品,对于大多数顾客来说,在购买同类牙膏时,更多的会关心不同品牌之间的价格差,而不是它们的价格本身。因此,在研究各个因素对销售量的影响时,用价格差代替公司销售价格和其他厂家平均价格更为合适。
模型的建立与求解
记牙膏销售量为Y,价格差为X1,公司的广告费为X2,假设基本模型为线性模型:
输入数据,调用R软件中的lm()函数求解,并用summary()显示计算结果(程序名:exam0609.R)
计算结果通过线性回归系数检验和回归方程检验,由此得到销售量与价格差与广告费之间的关系为:
为进一步分析回归模型,我们画出y与x1和y与x2散点图。从散点图上可以看出,对于y与x1,用直线拟合较好。而对于y与x2,则用二次曲线拟合较好,如下图:
绘制x1与y的散点图和回归直线
绘制x2与y的散点图和回归曲线
其中 I(X2^2),表示模型中X2的平方项,及X22,从上图中,将销售量模型改为:
似乎更合理,我们做相应的回归分析:
此时,我们发现,模型残差的标准差Residual standard error有所下降,相关系数的平方Multiple R-squared有所上升,这说明模型修正的是合理的。但同时也出现了一个问题,就是对于β2的P-值>0.05。为进一步分析,做β的区间估计。
如上错误出现????!!!!直接引用结果如下:
β2的区间估计为[ –7.49886317, 0.1076898 ],它包含了0,也就是说,β2的值可能为0. 因此,去掉X2的一次项,在进行分析:
此模型虽然通过了F检验和T检验,但与上一模型对比来看,Residual standard error上升,Multiple R-squared下降。这又是此模型的不足之处。
在做进一步的修正,考虑X1和X2交互作用,及模型为:
模型通过T检验和F检验,并且Residual standard error减少,Multiple R-squared增加。因此,最终模型选为:
以上是“使用R语言与多元线性回归分析计算的示例”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。