复判定系数及R
2=1-SSE/SST(其中SSE为
残差平方和,SST为总平方和)是用来说明因变量的变动中可以用自变量来解释的比例。它可以反映模型的好坏,但由于随着自变量的增加,SSE只会减少,不会变大,而对给定的一组变量观察值来说SST却总是恒定不变,故变量引进模型只会导致R
2增大而不会缩小,这极易使人产生错觉,似乎自变量越多越好。其结果是过多引进一些效率不高的自变量。而统计量1-((n-1)/(n-p-1)
.(SSE/SST))称为
调整的复判定系数,当自变量增加,SSE减小时,其自由度n-p-1就变小,这样调整的复判定系数就不会象R
2那样自变量越多越大,从而可能避免引进过多的不必要的自变量,使自变量的选择更合理
。