Stima non parametrica della probabilità di perdita in - UniFI

Stima non parametrica della probabilità di perdita
in sistemi a coda in tempo discreto,
con applicazioni in telecomunicazioni
A non-parametric Estimate of Cell Loss Probability in discrete time
Queueing Models, with applications to Telecommunication
Pier Luigi Conti
Università di Bologna. Via Belle Arti, 41 Bologna. e-mail: [email protected]
Livia De Giovanni
Università del Molise. Via F. De Sanctis, Campobasso. e-mail: [email protected]
Abstract: in this paper a discrete-time GI/G/1 (General Independent arrivals/General
service times/single server) queueing model is considered, useful for performance
evaluation of ATM (Asynchronous Transfer Mode) systems. The attention is focused on
the tail probability of the waiting time experienced by the information units (ATM cells)
in a waiting room (buffer). In fact, it is equivalent to the overflow probability, and hence
closely related to the cell loss probability. A non-parametric estimate of an upper bound
of the waiting time tail probability is defined and evaluated on real data in
telecommunication. Asymptotic and bootstrap confidence intervals are also studied.
Parole chiave: non-parametric estimate, queueing models, telecommunication.
1. Introduzione
L’ATM (Asynchronous Transfer Mode) è una tecnica di trasferimento delle
informazioni concepita per reti multiservizio ad alta velocità, adatta anche al trasporto
del protocollo IP (Internet Protocol). Celle di dimensione fissa, contenenti un'etichetta
identificativa, condividono un collegamento fisico e sono instradate da sorgente a
destinazione attraverso nodi ATM. Questi trasferiscono celle dai collegamenti di
ingresso a quelli di uscita, e sono dotati di buffer per memorizzare le celle che
richiedono trasmissione contemporanea sullo stesso collegamento. La Qualità di
Servizio offerta dalla rete è espressa dalla probabilità di perdita di cella, definita con
riferimento ad un buffer di dimensione finita come la “frazione di lungo periodo di celle
scartate”. Come sua approssimazione è utilizzata la probabilità di overflow (probabilità
che il numero di celle in un buffer di dimensione infinita superi una data soglia).
Obiettivo di questo lavoro è l’inferenza statistica sulla probabilità di overflow in un
sistema a coda di tipo GI/G/1 in tempo discreto. Per tale problema non esistono in
letteratura (Roberts et al. (1996)) risultati riguardanti la distribuzione della variabile
aleatoria tempo di attesa (la cui probabilità di coda è equivalente alla probabilità di
overflow). Viene fornita una stima non parametrica ed intervalli di confidenza asintotici
e bootstrap per un upper bound della probabilità di coda derivato da Kobayashi (1983).
E’ anche presentata una applicazione a dati reali raccolti da Telecom Italia.
2. Il Modello e problemi statistici
In un modello a coda GI/G/1, sia Ti l’i-mo tempo inter-arrivo, e Si il corrispondente
tempo di servizio. Siano poi f(k)=P(Ti=k), g(k)=P(Si=k) (k1) le distribuzioni dei tempi
inter-arrivo e dei tempi di servizio, con funzioni generatrici delle probabilità (f.g.p.):

F ( z) 
z

k
G( z ) 
f (k ) ;
k 1
z
k
g( k )
(1)
k 1
Le funzioni generatrici delle probabilità si assumono soddisfare le seguenti condizioni:
Condizione 1. (Ti; i1) e (Si; i1) sono due successioni di vriabili aleatorie (v.a.) i.i.d..
Entrambe le f.g.p. F(z) e G(z) hanno raggio di convergenza maggiore di 1. Di
conseguenza esistono i valori medi E[Ti] =F’(1), E[Si]=G’(1).
Condizione 2. Detto RG il raggio di convergenza della serie G(z), si ha lim G( z )   .
z  RG
Condizione 3. Il coefficiente di carico =G’(1)/F’(1) è strettamente minore di 1.
La validità di tali condizioni assicura l’esistenza di una distribuzione di equilibrio per il
tempo di attesa (Kobayashi (1983)). Indicando con Wi la v.a. “tempo di attesa
sperimentato dall’i-mo cliente”, esiste cioè per ogni intero positivo k il limite seguente:
w( k )  lim P(Wi  k )
i 
(2)
mentre la probabilità in equilibrio di un tempo di attesa maggiore di k è indicata con:

AW ( k ) 
 w( j )
k 1
(3)
j  k 1
La probabilità di overflow per un buffer di dimensione k è pari a AW(k). Data la difficoltà
di calcolare AW(k) con la tecnica di Wiener-Hopf (Grassman (1989)), per la costruzione
di stime si ricorre al seguente upper bound proposto da Kobayashi (1983):
W(k) z0-(k+1)
(4)
con z0 unica radice maggiore di 1 dell’equazione H(z)=F(z-1)G(z)=0.
La stima della distribuzione del tempo di attesa è stata affrontata o per processi di arrivo
geometrici (Conti (1998)) o per processi di arrivo e servizio generali, ma con
distribuzioni continue (Pitts (1994)). Tali risultati non si adattano al problema in esame.
3. Risultati asintotici, intervalli di confidenza Bootstrap, applicazioni
Assumiamo che (Ti; i1) e (Si; i1) siano due successioni di v.a. i.i.d. definite su un
comune spazio di probabilità (, F, P). Un campione di numerosità n è composto da due
sequenze finite di tempi inter-arrivo T1,..., Tn e di servizio S1,..., Sn. In questa sezione
vengono proposte stime puntuali e di intervallo per l’upper bound z0-(k+1). L’idea di base
consiste nello stimare dapprima F(z) e G(z) con le corrispondenti f.g.p. empiriche:

Fn ( z ) 


Gn ( z ) 
z k f n (k ) ;
k 1
z
k
gn ( k )
(5)
k 1
dove (I A() denota l’indicatore dell’insieme A):
n
f n (k )  n
1
I
k 1
n
{ k } ( Ti
) ;
gn ( k )  n
1
I
k 1
{ k } ( Si
)
e nell’utilizzare come stima di z0-(k+1) la corrispondente soluzione campionaria.
Formalmente sia zn la più grande radice positiva dell’equazione Hn(z)=Fn(z-1)Gn(z)=0:

1
zn  
unica radice  1 di H n ( z )  1

se Fn' (1)  Gn' (1)
altrimenti
(6)
Valgono i risultati che seguono, le cui dimostrazioni sono in Conti et al. (1999).
.c .
 z 0 .
Teorema 1. Sotto le Condizioni 1-3, per n che tende ad infinito risulta z n q
Il Teorema 1 suggerisce zn-(k+1) come stimatore consistente di z0-(k+1). Sotto ulteriori
ipotesi è possibile provare risultati utili per la costruzione di intervalli di confidenza,
enunciati nei Teoremi 2 e 3 seguenti.
Teorema 2. Sotto le Condizioni 1-3, e assumendo che G(z02)<, la successione di v.a.
n (zn - z0) tende in distribuzione ad una normale N(0,) con media zero e varianza
 =H’(z0)-2 {F(z0-1)2 (G(z02) - G(z0) 2) + G(z0)2 (F(z0-2) - F(z0-1)2)} per n tendente a
infinito.
Come conseguenza del Teorema 2 ed utilizzando il delta method si ha che la
successione di v.a. n (zn-(k+1) - z0-(k+1)) converge in distribuzione ad una normale con
media zero e varianza  2 =(k+1)2/z02(k+2).
Dal Teorema 2 si ottiene la seguente stima consistente di  2 :
 n2 =((k+1)2/zn2(k+2))Hn’(zn)-2{Fn(zn-1)2(Gn(zn2)-Gn(zn)2)+Gn(zn)2(Fn(zn-2)-Fn(zn-1)2)}
Come conseguenza si ha il Teorema 3, risultato principale della sezione.
Teorema 3. Sotto le Condizioni 1-3, e assumendo che G(z02)<, la successione di v.a.
{ n (zn-(k+1) - z0-(k+1))/n} tende in distribuzione ad una normale standard.
Indicando con q il quantile di ordine  della distribuzione normale standard, dal
Teorema 3 si ottiene il seguente intervallo di confidenza di ampiezza (1-):
[max(0, (zn-(k+1) – q/2  n  n ), min(1, zn-(k+1) + q/2  n  n )]
(7)
A causa della impossibilità dell’approssimazione normale di tener conto di una
eventuale asimmetria della distribuzione di n (zn-(k+1) - z0-(k+1)), sono stati studiati anche
intervalli di confidenza bootstrap per z0-(k+1). Detto KS=max(S1,.., Sn) e KT=max(T1,..,
Tn), l’intervallo di confidenza bootstrap si ottiene generando mn campioni di tempi di
servizio (S*1,j...S*n,j, j=,.. mn) ed mn campioni di tempi inter-arrivo (T*1,j...T*n,j, j=,.. mn)
da due distribuzioni multinomiali MNS e MNT assumenti valori (1, .., KS) e (1, .., KT) con
probabilità fn(1),.., fn(KS) and fn(1),.., fn(KT), rispettivamente. Si dimostra che l’intervallo
di confidenza bootstrap basato sulle mn quantità V*n,j= n (z*n,j-(k+1) – z0-(k+1)), con z*n,j la
più grande radice reale positiva dell’equazione Hn,j(z)=Fn,j(z-1)Gn,j(z)=0 si comporta
asintoticamente come l’intervallo di confidenza (7).
L’analisi di dati reali - arrivi di celle ATM relativi a due diverse applicazioni utilizzanti
come tecnica di trasporto IP su ATM - ha fornito per un valore di =0.8, dimensioni del
buffer k=100 e k=500, livelli di confidenza =1% e =5% i valori descritti in Tabella
1. Essi mostrano che gli intervalli di confidenza bootstrap, anche se asintoticamente
equivalenti a quelli basati sull’approssimazione normale, sono in grado di meglio
approssimarne i quantili in caso di asimmetria della distribuzione di zn-(k+1).
=5%
=1%
Intervalli di confidenza asintotici per z0-(k+1)
k=100
k=500
0.0000 ; 4.7345*10-4
0.0000 ; 2.8334*10-18
0.0000 ; 5.6248*10-4
0.0000 ; 3.6234*10-18
Intervalli di confidenza bootstrap per z0-(k+1)
k=100
4.1088*10-5 ; 7.6091*10-4
2.2178*10-5 ; 1.3076*10-3
k=500
1.7469*10-22; 3.7947*10-16
8.2028*10-24; 4.9726*10-15
Tabella 1: Confronto tra intervalli di confidenza asintotici e bootstrap
Riferimenti bibliografici
Conti, P.L. (1998) Large Sample Bayesian Analysis for Geo/G/1 Discrete-Time
Queueing Models. In fase di pubblicazione su The Annals of Statistics.
Conti, P.L., De Giovanni L. (1999) Queueing Models and Statistical Analysis for ATM
Based Systems. Sottoposto a rivista per la pubblicazione.
Grassmann, W.K, Jain J.L. (1989) Numerical Solutions of the waiting time distribution
of the arithmetic GI/G/1 queue. Operations Research, 37, 141-150.
Kobayashi, H. (1983) Discrete Time Queueing Systems. In G.Louchard, G. Latouche
(Eds): Probability Theory and Computer Science. Academic Press, New York.
Pitts, S.M. (1994) Non parametric estimation of the stationary waiting time distribution
function for the GI/G/1 queue. The Annals of Statistics, 22, 1428-1446.
Roberts J., Mocci U., Virtamo J. (1996) Broadband Network Teletraffic. Springer
Verlag, Berlin.