请问各位怎么理解方差?

2018 年 10 月 20 日
 JCZ2MkKb5S8ZX9pq

忽然脑子有点混,想讨论下。

假设案例

所以我考虑的方法是这样的:

然后有几个疑问

PS

一些代码就觉得自己数学底子差,不少公式查了都看不大懂。
有什么补数学基础的东西可以看嘛?

3742 次点击
所在节点    程序员
19 条回复
ryd994
2018 年 10 月 20 日
Baymaxbowen
2018 年 10 月 20 日
张宇的高等数学 36 讲
ytterbium
2018 年 10 月 20 日
取绝对值是一阶范数。想做数据分析画箱线图是不是更好
kx5d62Jn1J9MjoXP
2018 年 10 月 20 日
为什么是平方而不是绝对值, 为什么不用中值, 都是因为好算吧
byaiu
2018 年 10 月 20 日
聚类可能比较方便
JCZ2MkKb5S8ZX9pq
2018 年 10 月 20 日
@ssynhtn 我后来想想,绝对值和平方值的区别。
其中一点是,平方值能 **放大远端的数据** 。
但伴随的问题是,碰到小于 1 的时候,效果就反了。

中值可能也是会影响结果。
比如咱们 10 个码农和 1 个马云,计算财富方差。
按中值的话就是 10 个码农的方差很小+1 个马云方差很大。
按平均值的话,就是 10 个码农方差很大+1 个马云方差很大。
在这个特例下,平均值求出来的,可能更接近期望结论。
yidinghe
2018 年 10 月 20 日
简单的办法就是按照用户在房间内打赏的量倒排即可。
JCZ2MkKb5S8ZX9pq
2018 年 10 月 20 日
@ryd994 第一次听说这词,不过其中几个方法倒是经常用到。
alixali
2018 年 10 月 20 日
在这里的付费都是正值,有中位数和平均值,根据两个的数比较,也是大致可以判断分布的是不是有偏的,和对应偏离程度啊。
JCZ2MkKb5S8ZX9pq
2018 年 10 月 20 日
@alixali 也是个思路 不过我也就是举例 主要问题还是怎么理解方差
alixali
2018 年 10 月 20 日
我看统计上也只是说用来衡量分布的离散程度,或者是一个簇类的紧密程度吧,也不知道对不对。。
JCZ2MkKb5S8ZX9pq
2018 年 10 月 20 日
而且如果是纯平方和,再开个根号,还能理解为多个维度中的距离。
比如
(x^2 + y^2)^0.5 = 二维平面原点到点的距离
(x^2 + y^2 + z^2)^0.5 = 三维空间原点到点的距离
这样可以扩展到 N。

但除以 N 或 N-1 放在这里又很难解释。
而且标准差直接开根号,等于对分母也开了根号,还是觉得有点别扭啊。
newton108
2018 年 10 月 21 日
几何意义:demean 之后标准差是这个 r.v. 在希伯特空间中的 norm.
知道这个有啥用?
mingl0280
2018 年 10 月 21 日
你这不就是搞了个标准分数做统计么……
enenaaa
2018 年 10 月 21 日
概率论和数理统计
JCZ2MkKb5S8ZX9pq
2018 年 10 月 21 日
@newton108 我有点晕 我查查哈
l00t
2018 年 10 月 22 日
不理解,直接用。

从小学第一次接触到方差的概念开始就没理解过。我也觉得绝对值就足够了,方差不知道有啥意义。
alixali
2018 年 10 月 22 日
@JCZ2MkKb5S8ZX9pq 正好今天看到一个有关无偏估计的解释,这里用到 n-1 也可能是为了得到无偏的数值。实际上上面那个公式的是 n/n-1。
JCZ2MkKb5S8ZX9pq
2018 年 10 月 22 日
@alixali 嗯 用 N-1 是爲了無偏 這點我理解

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/499459

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX