1.1 概率、几率及期望
在统计学里,概率(Probability)和几率(Odds)是两个很基础的概念,用来描述某件事情发生的可能性,但是两者又有实质性区别。期望就更为重要了,本章我们先弄清基础理论中的基础概念。
1.1.1 概念及定义
概率描述的是某事件A发生的次数与所有事件发生的次数之比。公式为
图1-2
概率P是一个0~1的实数,P=0表示一定不会发生,P=1表示一定会发生。
几率(Odds)指的是事件发生的概率与事件不发生的概率之比。公式为
以掷骰子为例,如图1-2所示。掷出点数是6的概率为,出现其他点数的概率为,根据几率的计算公式,可以得到掷出点数为6这一事件的几率为
更通俗的解释:平均来看,掷出6点的成功概率和失败概率之比为1:5。和概率论中的其他概念一样,几率也是在赌博中产生的一个概念。假设甲乙二人掷骰子对赌,若甲出1块钱赌掷6点,乙需要投注5块钱才能保证公平。
为什么这里要把这两个概念单独讲下呢,一是为了进行一个清晰的区分;二是因为几率涉及两个概率的比较,在类似逻辑回归等分类模型中扮演着重要的角色。
1.1.2 概率和几率的关系
为了直观地比较两者之间的关系,表1-1展示了概率0.01~0.99与几率及Logit的数据对应关系。
表1-1
注意
(1)当概率P=0.5时,几率等于1(等分)。
(2)概率P的变化范围是[0,1],而几率的变化范围是[0,+∞)。
(3)为了让几率的值也能够以0为中心点,可以对几率取自然对数,也就是将概率P从范围[0,1]映射到(-∞,+∞)。几率的对数称为Logit(即逻辑回归模型中的Logit,逻辑回归模型将在第2部分详细讲解)。
把表1-1的内容在笛卡儿坐标系中进行展示。可以直观地看到一条规律的曲线,而且以坐标(0.5,0)沿纵轴反对称,如图1-3和图1-4所示。
Logit的一个很重要的特性就是没有上限和下限——这为建模带来了极大的方便。同时可以看到在P=0.5时,Logit=0。我们将会在逻辑回归中学习Logit的使用。
1.1.3 期望值
图1-3
图1-4
喜欢玩德州扑克的朋友,在看一些教学视频时,经常听到一句话:“如果想在德州扑克中长期盈利,那么一定要选择+EV的决策”,这里的EV就是Expected Value,也就是期望值。
对于期望值可以简单理解为:在长期游戏过程中,某个行为平均每次带来的收益。
+EV也就是期望值大于0,说明这个行为在长期游戏中能获得收益。
-EV也就是期望值小于0,说明这个行为在长期游戏中损失筹码。
一个简单的EV计算公式如图1-5所示,即
EV=Win%×Win$-Lost%×Lost$
其中,Win%为获胜概率;Win$为获胜时的收益(钱);Lost%为失败概率;Lost$为失败时的损失(钱)。
图1-5
为简单起见,下面用抛硬币的例子进行说明。如果抛到人像面,将赢3元。如果抛到数字面,将损失1元。
利用上面的公式:EV=50%×3-50%×1=1,也就是说,长期情况下玩家在这个游戏中平均每次赢1元。需要注意的是,这个EV值必须要用“长期”这个限定条件,不能单次计算。也就是说,期望值永远关注的是长期结果,而不是短期。
上面是用一个简单事件的两种可能性作为例子,那么如果这种事件有很多种可能性时,平均如何来表示呢?表示的方法就是每一种事件的概率乘以对应事件的结果,然后进行累加(加权平均)。
E(x)=∑P(x)×x
比如拿掷骰子来说,如果掷出几点就可以赢几块钱的话,因为每个点被掷出的概率是1/6,所以最终的数学期望是:,在掷了无数次后,每一次投掷收到的钱平均是3.5元,最终总的钱数是3.5×次数。
如果x是连续变量,那么把∑变成积分符号∫即可。
总结一下:期望值是对随机变量(随机变量的定义见1.2节内容)中心位置的一种度量。是试验中每次可能的结果乘以其结果的概率的总和。期望值亦是随机变量概率的平均值。特别需要记住的是“长期”这个条件。
期望值会用在很多地方,比如信息论里面的信息熵(见第3讲)等。