打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
为什么电话呼叫次数服从泊松分布?
(公众号:数据科学CLUB),
作者为复旦大学在读硕士。

(图片来自网络)

生活中我们已经非常习惯使用电话呼叫中心服务:110/119/120、银行客服热线、114挪车、快递公司等各类热线,为保证服务效率的同时节约成本,如何配置最适合的客服资源?这里,我们来讨论一下泊松分布在电话呼叫中心资源配置中的应用。

什么是泊松分布

Poisson分布(法语:loi de Poisson,英语:Poisson distribution,译名有泊松分布、普阿松分布、卜瓦松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等),是一种统计与概率学里常见到的离散机率分布(discrete probability distribution),由法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年时发表。

泊松分布适合于描述单位时间内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数等等。

若随机变量X取0和一切正整数值,在n次独立试验中出现的次数x恰为k次的概率P(X=k)=(k=0,1,…,n),式中λ是一个大于0的参数,此概率分布称为泊松分布。它的期望值为E(x)=np,方差为D(x) = λ。当n很大,且在一次试验中出现的概率P很小时,泊松分布近似二项分布。


泊松分布使用范围

Poisson分布主要用于描述在单位时间(空间)中稀有事件的发生数。即需满足以下四个条件:

1、给定区域内的特定事件产生的次数,可以是根据时间,长度,面积来定义;
2、各段相等区域内的特定事件产生的概率是一样的;
3、各区域内,事件发生的概率是相互独立的;
4、当给定区域变得非常小时,两次以上事件发生的概率趋向于0。
例如:
1、放射性物质在单位时间内的放射次数;
2、在单位容积充分摇匀的水中的细菌数;
3、野外单位空间中的某种昆虫数等。

泊松分布的期望和方差
由泊松分布知E[N(t) − N(t0)] = D[N(t) − N(t0)] = λ(t − t0)
特别的,令t_0=0.
由于假设N(0)=0,故可推知泊松过程的均值函数和方差函数分别为E[N(t)] = λt,D[N(t)] = λt,
泊松过程的强度λ(常数)等于单位长时间间隔内出现的质点数目的期望值。
即对泊松分布有:E(X) = D(X) = λ

泊松分布的特征
1、泊松分布是一种描述和分析稀有事件的概率分布。要观察到这类事件,样本含量n必须很大。
2、λ是泊松分布所依赖的唯一参数。λ值愈小,分布愈偏倚,随着λ的增大,分布趋于对称。
3、当λ = 20时,分布泊松接近于正态分布;当λ = 50时,可以认为泊松分布呈正态分布。在实际工作中,当时就可以用正态分布来近似地处理泊松分布的问题。

接下来,我们将以如下顺序展开:
  • 假设条件
  • 求解
  • 泊松过程的模拟

假设条件

假设电话呼叫次数具有下面的三个性质:
1.平稳性
中来到的呼叫数只与时间间隔长度t有关而与时间起点无关.若以记在长度为t的时间区间中来到k个呼叫的概率
2.独立增量性(无后效性)
内来到k个呼叫这一事件与时刻以前发生的事件独立。
换言之,在对时刻以前的事件发生情况所作的任何假定之下,计算出来的在内发生k个呼叫的条件概率都等于同一事件的无条件概率.独立增量性表明在互不相交的时间区间内过程进行的相互独立性.
3.普通性
在充分小的时间间隔中,最多来到一个呼叫。即,若记
应有
,即
普通性表明,在同一时间瞬间来两个或两个以上呼叫实际上是不可能的.

求解

,考虑中来到k个呼叫的概率,由独立增量性及全概率公式
特别地表示在长度为t的时间间隔中没有来呼叫的概率,
因此它关于t单调下降,故可设
其中a≥0,若a=0,则,这说明在不管怎么短的时间间隔内都要来呼叫,因此在有限时间间隔中要来无穷多个呼叫,这种情形不在我们的考虑之列.此外,因是概率,故应有.,而当a=1时,,这表明永不来呼叫,也不是我们感兴趣的情形,所以应有0<a<1,从而存在,使
因此当时,我们有
所以 
因此
,得
由于已知,故有
,可解得
这正是泊松分布,参数为. 在随机过程理论中,这里所得的结果及所用的方法将被大大推广.

泊松过程的模拟


模拟泊松过程
  • 给定时间,求发生次数

  • 给定发生次数,求所需时间

  • 非齐时泊松过程


import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from scipy import stats
from tqdm import tqdm, trange
sns.set()
sns.set_context('talk')
sns.set_style('ticks')

模拟泊松过程

给定时间,求发生次数


# rate = 1    # the rate of possion process

time = 10    # the total time of a path of possion process
interval = 0.001
plt.figure(figsize=(1510))
k = 0
for rate in (1/2125):
    k += 1
    plt.subplot(22, k)
    lambda_ = rate * interval    # the parameter of possion distribution

    x = np.arange(0, time, interval)
    y = np.cumsum(np.random.poisson(lambda_, size=int(time/interval)).clip(01))
    for i in np.unique(y):
        where = np.where(y == i)
        plt.plot(x[where], y[where], c='r')
    sns.despine()
    plt.title(f'A path of possion process with rate $\lambda={rate}$', fontdict={'fontsize':15})
plt.suptitle('Possion Process With Different Rate', y=1, fontsize=20)
# plt.savefig('p1.png', dpi=400)
plt.show()

给定发生次数,求所需时间

size = 10
plt.figure(figsize=(1510))
k = 0
for rate in (0.5125):
    k += 1
    plt.subplot(22, k)
    sample = np.random.exponential(1/rate, size=size)
    time = np.cumsum(sample)
    for i in range(size-1):
        plt.plot((time[i], time[i+1]), (i, i), c='r')
    sns.despine()
    plt.title(f'A path of possion process with rate $\lambda={rate}$', fontdict={'fontsize':15})

plt.suptitle('Possion Process With Different Rate', y=1, fontsize=20)
# plt.savefig('p2.png', dpi=400)
plt.show()

非齐时泊松过程

考虑强度函数    的非齐时泊松过程
rate = lambda x: 2 * x
m = lambda x: x ** 2
time = 10    # the total time of a path of possion process
interval = 0.0001
plt.figure(figsize=(95.5))    
x = np.arange(0, time, interval)
tmp = [np.random.poisson(rate(i) * interval) for i in x]
y = np.cumsum([np.random.poisson(rate(i) * interval, size=1).clip(01for i in x])
for i in np.unique(y):
    where = np.where(y == i)
    plt.plot(x[where], y[where], c='r')
plt.title('A path of possion process with rate $\lambda(x)=2x$', fontdict={'fontsize':15})
sns.despine();plt.show()

由此,我们可以根据已知的电话呼叫中心历史数据,得到相关重要统计特征,并对未来一定时期内的接入电话数量进行预测。特别是在某些特定时期,如双11电商狂欢节、舆情或严重故障等突发应急情况,泊松分布的应用将为预案设置提供重要、精准的数字依据


 About us 




统计学公众号  
传递知识,沉淀思维

如需帮助,请回复 123,或者联系小D老师微信:pekingdata

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
数据科学中的常见的6种概率分布(Python实现)
原创 | 一文读懂泊松分布,指数分布和伽马分布
机器学习中统计概率分布大全(Python代码)
常见分布及其概率分布图
基本概率分布图的绘制
如何使用excel中的POISSON函数求指定事件出现次数的泊松分布
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服