经验分布函数的图形化理解

一、前言 前言 - 荒原之梦

是考研数学大纲中的一个“冷门”知识点,考察频次较低。但是,对于考研的学子们来说,再“冷门”的知识点,我们都要认真学习。

在本文中,「荒原之梦考研数学」将结合离散型随机变量的分布函数和直观形象的示意图,让同学们快速理解什么是“ ”。

二、解析 解析 - 荒原之梦

一般情况下,我们对于随机变量 X 整体的分布函数 F 是难以准确知道的,所以,在实际应用中就引入了 (Empirical Distribution Function)。

所谓“ ”就是将从总体中抽取到的 n 个样本的观测值出现的频率,近似看作随机变量 X 发生的概率——样本的观测值就是“ ”中的“ ”。

无论随机变量 X 是连续型随机变量还是离散型随机变量,都可以有 。事实上, 与离散型随机变量的分布函数在形式上几乎是完全一致的,因为,即便 X 是连续型随机变量,我们在其中抽取的样本也是离散的。

下面,我们就通过对比的方式,借助离散型随机变量的分布函数,来理解

离散型随机变量的分布函数

假设离散型随机变量 X 的分布律如下:

X123
P121613

将上面的分布律绘制到 XP 坐标系中,就可以得到如图 01 所示的分布密度柱状图:

经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 01. 分布密度柱状图.
图 01. 分布密度柱状图.

接下来,根据上面的信息,分段进行分析。

  1. x<1 的时候,很显然没有包含任何变量,于是,此时的概率 P{x<1} = 0, 如图 02 所示:
经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 02. $x < 1$ 时的概率.
图 02. x<1 时的概率.
  1. 1x<2 的时候,包含了一个随机变量 1, 于是,此时的概率 P{1x<2} = 12, 如图 03 所示:
经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 03. $1 \leqslant x < 2$ 时的概率.
图 03. 1x<2 时的概率.
  1. 2x<3 的时候,包含了两个随机变量 12, 于是,此时的概率 P{2x<3} = 12 + 16 = 23, 如图 04 所示:
经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 04. $2 \leqslant  x < 3$ 时的概率.
图 04. 2x<3 时的概率.
  1. x3 的时候,包含了全部三个随机变量 1, 23, 于是,此时的概率 P{x3} = 1, 如图 05 所示:
经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 05. $x \geqslant 3$ 时的概率.
图 05. x3 时的概率.

于是,我们可以得到这组离散型随机变量的概率分布函数:

F(x)={0,x<112,1x<223,2x<31,x3

如果我们将上面的概率分布函数绘制到 xF 坐标系中,就可以得到如图 06 所示的分布函数柱状图:

经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 06. 分布函数柱状图.
图 06. 分布函数柱状图.

经验分布函数

假如我们从总体中取出来了 8 个样本,这些样本的观测值分别为:

X={300,100,200,300,300,100,000,300}

则通过对上面样本观测值的统计可知:

  • 观测值 000 出现了 1 次;
  • 观测值 100 出现了 2 次;
  • 观测值 200 出现了 1 次;
  • 观测值 300 出现了 4 次;

于是:

X000100200300
频次18141812

如果我们将样本出现的的“频次”看作其“概率”,并用 P^ 表示,则可以在 XP^ 坐标系中,得到如图 07 所示的分布密度柱状图:

经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 07. 分布密度柱状图.
图 07. 分布密度柱状图.

如果我们把上面的柱状图用线条连接起来,就会看到类似连续型随机变量的分布密度函数图像(如果我们有很多这样的观测值,那么,所得到的图像会越来越接近总体的分布密度函数图像):

经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 08. 分布密度柱状图与分布密度函数图像之间的联系.
图 08. 分布密度柱状图与分布密度函数图像之间的联系.

接下来,根据上面的信息,分段进行分析。

  1. x<000 的时候,很显然没有包含任何随机变量的观测值,于是,此时的概率 P{x<000} = 0, 如图 09 所示:
经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 09. $x < 000$ 时的概率.
图 09. x<000 时的概率.
  1. 000x<100 的时候,包含了一个随机变量 000, 于是,此时的概率 P{000x<100} = 18, 如图 10 所示:
经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 10. $000 \leqslant < x < 100$ 时的概率.
图 10. 000⩽<x<100 时的概率.
  1. 100x<200 的时候,包含了两个随机变量 000100, 于是,此时的概率 P{100x<200} = 18 + 14 = 38, 如图 11 所示:
经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 11. $100 \leqslant x < 200$ 时的概率.
图 11. 100x<200 时的概率.
  1. 200x<300 的时候,包含了三个随机变量 000, 100200, 于是,此时的概率 P{200x<300} = 18 + 14 + 18 = 12, 如图 12 所示:
经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 12. $200 \leqslant x < 300$ 时的概率.
图 12. 200x<300 时的概率.
  1. x300 的时候,包含了四个随机变量 000, 100, 200300, 于是,此时的概率 P{x300} = 18 + 14 + 18 + 12 = 1, 如图 13 所示:
经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 13. $x \geqslant 300$ 时的概率.
图 13. x300 时的概率.

于是可知,对应的 为:

F^8(x)={0,x<00018,000x<10038,100x<20012,200x<3001,x300

将上面的 绘制到 xF^8(x) 坐标系中,则如图 14 所示:

经验分布函数的图形化理解 | 荒原之梦考研数学 | 图 14. 经验分布函数柱状图.
图 14. 经验分布函数柱状图.

应用例题

题目

某食品厂生产瓶装饮料,现从生产线上随机抽取 4 瓶饮料,称得其净重(单位:g) 为:356, 352, 346, 352, 请写出该样本的

解析

首先,将抽取的 4 瓶饮料的净重数据(即“样本观测值”)按照从小到大的顺序进行排列,这样才能方便我们接下来确定 各部分的区间:

346,352,352,356

接着,对样本观测值的出现频次进行统计,不同数值的样本出现的次数和频次如下表所示:

样本346352356
次数121
频次141214

综上,该样本的 F^4(x) 为:

F^4(x)={0,x<34614,346x<35234,352x<3561,x356


荒原之梦考研数学思维导图
荒原之梦考研数学思维导图

高等数学箭头 - 荒原之梦

涵盖高等数学基础概念、解题技巧等内容,图文并茂,计算过程清晰严谨。

线性代数箭头 - 荒原之梦

以独特的视角解析线性代数,让繁复的知识变得直观明了。

特别专题箭头 - 荒原之梦

通过专题的形式对数学知识结构做必要的补充,使所学知识更加连贯坚实。

荒原之梦考研数学网 | 让考场上没有难做的数学题!

荒原之梦网全部内容均为原创,提供了涵盖考研数学基础知识、考研数学真题、考研数学练习题和计算机科学等方面,大量精心研发的学习资源。

豫 ICP 备 17023611 号-1 | 公网安备 - 荒原之梦 豫公网安备 41142502000132 号 | SiteMap
Copyright © 2017-2024 ZhaoKaifeng.com 版权所有 All Rights Reserved.

Copyright © 2024   zhaokaifeng.com   All Rights Reserved.
豫ICP备17023611号-1
 豫公网安备41142502000132号

荒原之梦 自豪地采用WordPress