一次性看懂期望和均值的联系与区别

一、前言 前言 - 荒原之梦

概率统计中的期望和均值是否相等?期望和均值之间存在着怎样的联系与区别?在本文中,「荒原之梦考研数学」将为同学们讲解明白这一问题。

二、正文 正文 - 荒原之梦

随机变量和样本观测值的区别

在阅读本文接下来的内容之前,读者们需要首先清楚随机变量和样本观测值之间的区别——

简单地来说,随机变量的具体取值就是样本的观测值,详细阐述可以参考「荒原之梦考研数学」的《图解随机变量和样本观测值的联系与区别》这篇文章。

期望的定义

首先,我们来看看期望的定义:

  1. 若 $X_{i}$ 为离散型随机变量,$p_{i}$ 为每个随机变量发生的概率,且 $\sum_{i}^{\infty} X_{i} \cdot p_{i}$ 收敛,则总体 $X$ 的数学期望 $\mathrm{E} (X)$ $=$ $\sum_{i}^{\infty} X_{i} \cdot \textcolor{orange}{p_{i}}$;
  2. 若 $X$ 为连续型随机变量,$f(X)$ 为 $X$ 的概率密度函数,且 $\int_{- \infty}^{+ \infty} X \cdot f(X) \mathrm{~d} X$ 收敛,则总体 $X$ 的数学期望 $\mathrm{E} (X)$ $=$ $\int_{- \infty}^{+ \infty} X \cdot \textcolor{orange}{f(X)} \mathrm{~d} X$.

均值的定义

接着,我们来看一看均值的定义:

若 $x_{1}$, $x_{2}$, $\cdots$, $x_{n}$ 为样本的观测值,则样本均值为:

$$
\bar{x} = \frac{1}{n} \left( x_{1} + x_{2} + \cdots + x_{n} \right)
$$

期望和均值的联系

也就是说,对总体中一部分样本求出来的均值只是样本均值 $\bar{x}$, 但如果我们能对总体 $X$ 的所有随机变量对应的取值做一个平均,则这个均值,就是总体的期望 $\mathbf{E}(X)$.

然而,在很多概率事件中,我们事实上无法穷尽随机变量所有的取值,只能取得总体中的一部分样本,并对样本做均值计算——

不过,如果我们可以取得很大量的样本,那么,根据大数定理,所得的样本均值就可以看作是总体的期望,即:

$$
\boxed{
\bar{x} \textcolor{lightgreen}{ \leadsto } \textcolor{black}{\colorbox{lightgreen}{大数定理}} \textcolor{lightgreen}{ \leadsto } \mathbf{E} (X) = \begin{cases}
\sum_{i}^{\infty} X_{i} \cdot \textcolor{orange}{p_{i}} \\ \\
\int_{- \infty}^{+ \infty} X \cdot \textcolor{orange}{f(X)} \mathrm{~d} X
\end{cases}
}
$$

为什么?

那么,为什么在大量随机试验中,均值就相当于期望呢?

首先,从数学的定义上来说,期望的计算公式和均值的计算公式其实是等效的。

例如,我们有如下的离散型样本值:

$$
\textcolor{yellow}{
1, \quad 2, \quad 3, \quad 2, \quad 2, \quad 1
}
$$

观察可知,其中涉及三个随机变量 $\textcolor{violet}{1}$, $\textcolor{violet}{2}$, $\textcolor{violet}{3}$, 每个随机变量发生的频次(概率)为:

$$
\begin{aligned}
& \textcolor{violet}{1} \rightarrow p(1) = \textcolor{pink}{ \frac{1}{3} } \\ \\
& \textcolor{violet}{2} \rightarrow p(2) = \textcolor{pink}{ \frac{1}{2} } \\ \\
& \textcolor{violet}{3} \rightarrow p(3) = \textcolor{pink}{ \frac{1}{6} }
\end{aligned}
$$

于是,按照期望的计算方式,我们有:

$$
\textcolor{violet}{1} \times \textcolor{pink}{\frac{1}{3}} + \textcolor{violet}{2} \times \textcolor{pink}{\frac{1}{2}} + \textcolor{violet}{3} \times \textcolor{pink}{\frac{1}{6}} = \textcolor{springgreen}{ \frac{11}{6} }
$$

而按照均值的计算方式,也同样有:

$$
\frac{1}{6} \left( \textcolor{yellow}{1} + \textcolor{yellow}{2} + \textcolor{yellow}{3} + \textcolor{yellow}{2} + \textcolor{yellow}{2} + \textcolor{yellow}{1} \right) = \textcolor{springgreen}{ \frac{11}{6} }
$$

对于连续型随机变量,仍然具有类似上述的原理。

荒原之梦网
荒原之梦网

当然,所谓“期望”就是样本的取值最可能落在的位置(虽然样本值可能不一定刚好落在期望上,甚至永远不可能落在期望上,比如六面骰子点数的期望是 $\frac{1}{6} \left( 1 + 2 + 3 + 4 + 5 + 6 \right)$ $=$ $3.5$, 而我们知道,骰子并没有哪个面有 $3.5$ 个点。)。

所以,如果从自然世界的角度来说,为什么大量样本的均值可以被看作期望?

因为,

例如,自然世界中的大部分概率规律都近似符合正态分布,而在正态分布中,大部分样本点都会落在其期望 $\mu$ 的附近:

一次性看懂期望和均值的联系与区别 | 荒原之梦考研数学 | 图 01. 正态分布示意图. | Source Author: Ainali; Permission by CC-BY-SA 3.0 license; Modify by zhaokaifeng.com.
图 01. 正态分布 $X$ $\sim$ $N (\mu, \sigma^{2})$ 的示意图.

所以,期望所指向的是一种最平衡的状态,这也是所有随机变量最可能落在的地方。


荒原之梦考研数学思维导图
荒原之梦考研数学思维导图

高等数学箭头 - 荒原之梦

涵盖高等数学基础概念、解题技巧等内容,图文并茂,计算过程清晰严谨。

线性代数箭头 - 荒原之梦

以独特的视角解析线性代数,让繁复的知识变得直观明了。

特别专题箭头 - 荒原之梦

通过专题的形式对数学知识结构做必要的补充,使所学知识更加连贯坚实。

荒原之梦考研数学网 | 让考场上没有难做的数学题!

荒原之梦网全部内容均为原创,提供了涵盖考研数学基础知识、考研数学真题、考研数学练习题和计算机科学等方面,大量精心研发的学习资源。

豫 ICP 备 17023611 号-1 | 公网安备 - 荒原之梦 豫公网安备 41142502000132 号 | SiteMap
Copyright © 2017-2024 ZhaoKaifeng.com 版权所有 All Rights Reserved.

Copyright © 2024   zhaokaifeng.com   All Rights Reserved.
豫ICP备17023611号-1
 豫公网安备41142502000132号

荒原之梦 自豪地采用WordPress