LINEST函数

引子:本文的部分内容摘自Excel函数官方文档,涉及到数理统计学,有很多统计专业术语,有点复杂,有兴趣的朋友可以慢慢研究 。
LINEST函数返回线性回归方程的参数 。

LINEST函数

文章插图
图1
直线的公式为:y=mx+b
或者为:
LINEST函数

文章插图
其中,m为直线的斜率,b为截距 。
LINEST函数返回的数组为:
LINEST函数

文章插图
什么情况下使用LINEST函数?
LINEST函数通过使用最小二乘法计算与现有数据最佳拟合的直线,来计算某直线的统计值,返回描述此直线的数组 。它能够计算斜率、截距、斜率标准差、截距标准差、判定系数、自由度、F统计、y标准差、回归平方和、残差平方和 。
已知直线的x值和y值,求斜率和截距
根据1月至6月的销售额,估算第9个月的销售额
为一个x变量求10个统计数字
为两个x变量求统计数字
LINEST函数语法
LEN函数有4个参数,其语法如下:
LEN(known_y’s,known_x’s,const,stats)
known_y’s: 必需,满足线性拟合直线y=mx+b的一组已知的y值 。如果known_y’s对应的单元格区域在单独一列中,则known_x’s的每一列被视为一个独立的变量 。如果known_y’s对应的单元格区域在单独一行中,则known_x’s的每一行被视为一个独立的变量 。
known_x’s:可选,满足线性拟合直线y=mx+b的一组已知的x值 。Known_x’s对应的单元格区域可以包含一组或多组变量,如果仅使用一个变量,那么只要known_x’s和known_y’s具有相同的维数,则它们可以是任何形状的区域;如果用到多个变量,则known_y’s必须为向量(即必须为一行或一列) 。如果省略known_x’s,则假设该数组为{1,2,3,…},其大小与known_y’s相同 。
const:可选,逻辑值,用于指定是否将常量b设置为0 。如果const为TRUE或省略,则b按正常计算 。如果const为FALSE,那么b将被设为0并调整m值使y=mx 。
stats:可选,逻辑值,用于指定是否返回附加回归统计值 。如果stats为FALSE或者省略,则LINEST函数只返回系数m和常量b 。如果stats为TRUE,则LINEST函数返回附加回归统计值,此时返回的数组为:
LINEST函数

文章插图
其中,{se1,se2,…,sen}为系数m1,m2,…,mn的标准误差值 。Seb为常量b的标准误差值(当const为FALSE时,seb=#N/A) 。r2为判定系数,y的估计算与实际值之比,范围在0到1之间,若为1,则样本有很好的相关性,y的估计值与实际值之间没有差别,相反,如果判定系数为0,则回归公式不能用来预测y值 。Sey为y估计值的标准误差 。F为F统计或F观察值,使用F统计可以判断因变量和自变量之间是否偶尔发生过可观察到的关系 。df为自由度,用于在统计表上查找F临界值,将从表中相到的值与LINEST函数返回的F统计值进行比较可以确定模型的置信区间 。Ssreg为回归平方和 。Ssresid为残差平方和 。
回归分析时,Excel会计算每一点的y的估计值和实际值的平方差,这些平方差称为残差平方和ssresid 。然后,Excel会计算总平方和(sstotal) 。当参数const为TRUE或被省略时,总平方和是y 的实际值和平均值的平方差之和;当参数const为FALSE时,总平方和是y的实际值的平方和(不需要从每个y值中减去平均值) 。回归平方和(ssreg)可通过公式ssreg=sstotal-ssresid计算出来 。残差平方和与总平方和的比值越小,判定系数r2的值就越大 。r2是用来判断从回归分析求得的公式是否足以说明变量之间关系的指示器,r2=ssreg/sstotal 。

推荐阅读