几何分布
在概率论和统计学中,几何分布(英语:Geometric distribution)指的是以下两种离散型机率分布中的一种:
在伯努利试验中,得到一次成功所需要的试验次数
X
{\displaystyle X}
。
X
{\displaystyle X}
的值域是{ 1, 2, 3, ... }几何分布
概率质量函数
累积分布函数参数
0
<
p
≤
1
{\displaystyle 0
成功概率(实)
0
<
p
≤
1
{\displaystyle 0
成功概率(实)支撑集
k
∈
{
1
,
2
,
3
,
…
}
{\displaystyle k\in \{1,2,3,\dots \}\!}
k
∈
{
0
,
1
,
2
,
3
,
…
}
{\displaystyle k\in \{0,1,2,3,\dots \}\!}
概率质量函数(pmf)
(
1
−
p
)
k
−
1
p
{\displaystyle (1-p)^{k-1}\,p\!}
(
1
−
p
)
k
p
{\displaystyle (1-p)^{k}\,p\!}
累积分布函数 (cdf)
1
−
(
1
−
p
)
k
{\displaystyle 1-(1-p)^{k}\!}
1
−
(
1
−
p
)
k
+
1
{\displaystyle 1-(1-p)^{k+1}\!}
期望值
1
p
{\displaystyle {\frac {1}{p}}\!}
1
−
p
p
{\displaystyle {\frac {1-p}{p}}\!}
中位数
⌈
−
1
log
2
(
1
−
p
)
⌉
{\displaystyle \left\lceil {\frac {-1}{\log _{2}(1-p)}}\right\rceil \!}
(如果
−
1
/
log
2
(
1
−
p
)
{\displaystyle -1/\log _{2}(1-p)}
是整数,则中位数不唯一)
⌈
−
1
log
2
(
1
−
p
)
⌉
−
1
{\displaystyle \left\lceil {\frac {-1}{\log _{2}(1-p)}}\right\rceil \!-1}
(如果
−
1
/
log
2
(
1
−
p
)
{\displaystyle -1/\log _{2}(1-p)}
是整数,则中位数不唯一)众数
1
{\displaystyle 1}
0
{\displaystyle 0}
方差
1
−
p
p
2
{\displaystyle {\frac {1-p}{p^{2}}}\!}
1
−
p
p
2
{\displaystyle {\frac {1-p}{p^{2}}}\!}
偏度
2
−
p
1
−
p
{\displaystyle {\frac {2-p}{\sqrt {1-p}}}\!}
2
−
p
1
−
p
{\displaystyle {\frac {2-p}{\sqrt {1-p}}}\!}
超值峰度
6
+
p
2
1
−
p
{\displaystyle 6+{\frac {p^{2}}{1-p}}\!}
6
+
p
2
1
−
p
{\displaystyle 6+{\frac {p^{2}}{1-p}}\!}
熵
−
(
1
−
p
)
log
2
(
1
−
p
)
−
p
log
2
p
p
{\displaystyle {\tfrac {-(1-p)\log _{2}(1-p)-p\log _{2}p}{p}}\!}
−
(
1
−
p
)
log
2
(
1
−
p
)
−
p
log
2
p
p
{\displaystyle {\tfrac {-(1-p)\log _{2}(1-p)-p\log _{2}p}{p}}\!}
动差生成函数 (mgf)
p
e
t
1
−
(
1
−
p
)
e
t
{\displaystyle {\frac {pe^{t}}{1-(1-p)e^{t}}}\!}
, for
t
<
−
ln
(
1
−
p
)
{\displaystyle t<-\ln(1-p)\!}
p
1
−
(
1
−
p
)
e
t
{\displaystyle {\frac {p}{1-(1-p)e^{t}}}\!}
特征函数
p
e
i
t
1
−
(
1
−
p
)
e
i
t
{\displaystyle {\frac {pe^{it}}{1-(1-p)\,e^{it}}}\!}
p
1
−
(
1
−
p
)
e
i
t
{\displaystyle {\frac {p}{1-(1-p)\,e^{it}}}\!}
在得到第一次成功之前所经历的失败次数
Y
=
X
−
1
{\displaystyle Y=X-1}
。Y的值域是{ 0, 1, 2, 3, ... }
实际使用中指的是哪一个取决于惯例和使用方便。
这两种分布不应该混淆。前一种形式(
X
{\displaystyle X}
的分布)经常被称作shifted geometric distribution;但是,为了避免歧义,最好明确地说明取值范围。
如果每次试验的成功概率是
p
{\displaystyle p}
,那么
k
{\displaystyle k}
次试验中,第
k
{\displaystyle k}
次才得到成功的概率是,
Pr
(
X
=
k
)
=
(
1
−
p
)
k
−
1
p
{\displaystyle \Pr(X=k)=(1-p)^{k-1}\,p\,}
其中
k
=
1
,
2
,
3
,
…
{\displaystyle k=1,2,3,\ldots }
.
上式描述的是取得一次成功所需要的试验次数。而另一种形式,也就是第一次成功之前所失败的次数,可以写为,
Pr
(
Y
=
k
)
=
(
1
−
p
)
k
p
{\displaystyle \Pr(Y=k)=(1-p)^{k}\,p\,}
其中
k
=
0
,
1
,
2
,
3
,
…
{\displaystyle k=0,1,2,3,\ldots }
两种情况产生的序列都是几何数列。这是几何分布的名字来源。
比如,假设不停地掷骰子,直到得到1。投掷次数是随机分布的,取值范围是无穷集合{ 1, 2, 3, ... },并且是一个
p
=
1
6
{\displaystyle p={\frac {1}{6}}}
的几何分布。
目录
1 性质
2 记号
3 用途
4 参见