2.1.3 随机变量的统一表示_机器学习教程（微课视频版）-QQ阅读男生武侠网

上QQ阅读APP看书，第一时间看更新

2.1.3　随机变量的统一表示

离散和连续随机变量尽管不同，但基本公式是相同的，例如全概率公式和条件概率公式等形式上是一致的，但求边际分布时，离散用求和，连续用积分，这种区别在后续很多应用中都是类似的。为了减少符号类型，尽管都用函数形式p（x），对离散随机变量，其表示X=x的概率值，但对连续随机变量来讲，其表示X=x的概率密度值，因为连续随机变量X=x的概率是无穷小量，故需要用概率密度表示。在机器学习中，遇到的对象既可能是离散的，也可能是连续的，均用p（x）表示其概率函数。

可以通过引入冲激函数δ（x），将取值连续和取值离散的随机变量统一用概率密度函数表示。对于离散随机变量X，其只可能取{x₁，x₂，…，x_K}集合中的值，若P（X=x_i）=p_i，其概率密度函数可表示为

这里δ（x）称为冲激函数，是一个广义函数，由狄拉克给出的定义为

其最基本的性质为抽取性质，即f（t）δ（t）=f（0）δ（t），这里f（t）在t=0处连续，以及积分抽取性质。

例2.1.3　用X表示投一个硬币，仅取0、1值分别表示正面和反面，若两面出现概率相等，这是最简单的离散随机变量，利用冲激函数将概率密度函数写为

p（x）=0.5δ（x）+0.5δ（x-1）

对于离散随机变量，可以使用2.1.1节的概率函数表示，也可以使用冲激函数表示的概率密度函数表示。

本周热推：

脑机穿越：脑机接口改变人类未来大型语言模型实战指南：应用实践与场景落地一本书读懂大模型：技术创新、商业应用与产业变革生产系统仿真：Plant Simulation应用教程 ChatGPT原理与架构：大模型的预训练、迁移和中间件编程