如何找到R数据帧列的平方偏差总和?
偏差的平方和是每个值与平均值之间的差异平方的总和。要找到此值,我们需要在R平台中创建公式。例如,如果我们有一个名为df的数据框,其中包含一列x,则可以通过使用sum((df$x-mean(df$x))^2)计算x的平方差之和。
例1
考虑以下数据帧-
set.seed(1021) x1<−letters[1:20] x2<−rpois(20,5) df1<−data.frame(x1,x2) df1输出结果
x1 x2 1 a 4 2 b 2 3 c 2 4 d 4 5 e 4 6 f 6 7 g 4 8 h 4 9 i 8 10 j 4 11 k 4 12 l 3 13 m 6 14 n 3 15 o 7 16 p 0 17 q 2 18 r 8 19 s 3 20 t 5
在df1中找到列x2的平方偏差的总和-
示例
sum((df1$x2−mean(df1$x2))^2)输出结果
[1] 80.55
例2
y1<−1:20 y2<−rnorm(20,2525,301.2) df2<−data.frame(y1,y2) df2输出结果
y1 y2 1 1 2643.340 2 2 2682.804 3 3 2555.982 4 4 2906.473 5 5 1771.400 6 6 2763.651 7 7 2818.183 8 8 3184.697 9 9 2731.398 10 10 2530.297 11 11 2361.374 12 12 2534.605 13 13 2266.180 14 14 2237.827 15 15 3178.079 16 16 2761.979 17 17 2224.662 18 18 2351.776 19 19 2200.108 20 20 2067.530
在df2中找到y2列的平方偏差平方和-
示例
sum((df2$y2−mean(df2$y2))^2)输出结果
[1] 2464370