Stima non parametrica della probabilità di perdita in sistemi a coda in tempo discreto, con applicazioni in telecomunicazioni A non-parametric Estimate of Cell Loss Probability in discrete time Queueing Models, with applications to Telecommunication Pier Luigi Conti Università di Bologna. Via Belle Arti, 41 Bologna. e-mail: [email protected] Livia De Giovanni Università del Molise. Via F. De Sanctis, Campobasso. e-mail: [email protected] Abstract: in this paper a discrete-time GI/G/1 (General Independent arrivals/General service times/single server) queueing model is considered, useful for performance evaluation of ATM (Asynchronous Transfer Mode) systems. The attention is focused on the tail probability of the waiting time experienced by the information units (ATM cells) in a waiting room (buffer). In fact, it is equivalent to the overflow probability, and hence closely related to the cell loss probability. A non-parametric estimate of an upper bound of the waiting time tail probability is defined and evaluated on real data in telecommunication. Asymptotic and bootstrap confidence intervals are also studied. Parole chiave: non-parametric estimate, queueing models, telecommunication. 1. Introduzione L’ATM (Asynchronous Transfer Mode) è una tecnica di trasferimento delle informazioni concepita per reti multiservizio ad alta velocità, adatta anche al trasporto del protocollo IP (Internet Protocol). Celle di dimensione fissa, contenenti un'etichetta identificativa, condividono un collegamento fisico e sono instradate da sorgente a destinazione attraverso nodi ATM. Questi trasferiscono celle dai collegamenti di ingresso a quelli di uscita, e sono dotati di buffer per memorizzare le celle che richiedono trasmissione contemporanea sullo stesso collegamento. La Qualità di Servizio offerta dalla rete è espressa dalla probabilità di perdita di cella, definita con riferimento ad un buffer di dimensione finita come la “frazione di lungo periodo di celle scartate”. Come sua approssimazione è utilizzata la probabilità di overflow (probabilità che il numero di celle in un buffer di dimensione infinita superi una data soglia). Obiettivo di questo lavoro è l’inferenza statistica sulla probabilità di overflow in un sistema a coda di tipo GI/G/1 in tempo discreto. Per tale problema non esistono in letteratura (Roberts et al. (1996)) risultati riguardanti la distribuzione della variabile aleatoria tempo di attesa (la cui probabilità di coda è equivalente alla probabilità di overflow). Viene fornita una stima non parametrica ed intervalli di confidenza asintotici e bootstrap per un upper bound della probabilità di coda derivato da Kobayashi (1983). E’ anche presentata una applicazione a dati reali raccolti da Telecom Italia. 2. Il Modello e problemi statistici In un modello a coda GI/G/1, sia Ti l’i-mo tempo inter-arrivo, e Si il corrispondente tempo di servizio. Siano poi f(k)=P(Ti=k), g(k)=P(Si=k) (k1) le distribuzioni dei tempi inter-arrivo e dei tempi di servizio, con funzioni generatrici delle probabilità (f.g.p.): F ( z) z k G( z ) f (k ) ; k 1 z k g( k ) (1) k 1 Le funzioni generatrici delle probabilità si assumono soddisfare le seguenti condizioni: Condizione 1. (Ti; i1) e (Si; i1) sono due successioni di vriabili aleatorie (v.a.) i.i.d.. Entrambe le f.g.p. F(z) e G(z) hanno raggio di convergenza maggiore di 1. Di conseguenza esistono i valori medi E[Ti] =F’(1), E[Si]=G’(1). Condizione 2. Detto RG il raggio di convergenza della serie G(z), si ha lim G( z ) . z RG Condizione 3. Il coefficiente di carico =G’(1)/F’(1) è strettamente minore di 1. La validità di tali condizioni assicura l’esistenza di una distribuzione di equilibrio per il tempo di attesa (Kobayashi (1983)). Indicando con Wi la v.a. “tempo di attesa sperimentato dall’i-mo cliente”, esiste cioè per ogni intero positivo k il limite seguente: w( k ) lim P(Wi k ) i (2) mentre la probabilità in equilibrio di un tempo di attesa maggiore di k è indicata con: AW ( k ) w( j ) k 1 (3) j k 1 La probabilità di overflow per un buffer di dimensione k è pari a AW(k). Data la difficoltà di calcolare AW(k) con la tecnica di Wiener-Hopf (Grassman (1989)), per la costruzione di stime si ricorre al seguente upper bound proposto da Kobayashi (1983): W(k) z0-(k+1) (4) con z0 unica radice maggiore di 1 dell’equazione H(z)=F(z-1)G(z)=0. La stima della distribuzione del tempo di attesa è stata affrontata o per processi di arrivo geometrici (Conti (1998)) o per processi di arrivo e servizio generali, ma con distribuzioni continue (Pitts (1994)). Tali risultati non si adattano al problema in esame. 3. Risultati asintotici, intervalli di confidenza Bootstrap, applicazioni Assumiamo che (Ti; i1) e (Si; i1) siano due successioni di v.a. i.i.d. definite su un comune spazio di probabilità (, F, P). Un campione di numerosità n è composto da due sequenze finite di tempi inter-arrivo T1,..., Tn e di servizio S1,..., Sn. In questa sezione vengono proposte stime puntuali e di intervallo per l’upper bound z0-(k+1). L’idea di base consiste nello stimare dapprima F(z) e G(z) con le corrispondenti f.g.p. empiriche: Fn ( z ) Gn ( z ) z k f n (k ) ; k 1 z k gn ( k ) (5) k 1 dove (I A() denota l’indicatore dell’insieme A): n f n (k ) n 1 I k 1 n { k } ( Ti ) ; gn ( k ) n 1 I k 1 { k } ( Si ) e nell’utilizzare come stima di z0-(k+1) la corrispondente soluzione campionaria. Formalmente sia zn la più grande radice positiva dell’equazione Hn(z)=Fn(z-1)Gn(z)=0: 1 zn unica radice 1 di H n ( z ) 1 se Fn' (1) Gn' (1) altrimenti (6) Valgono i risultati che seguono, le cui dimostrazioni sono in Conti et al. (1999). .c . z 0 . Teorema 1. Sotto le Condizioni 1-3, per n che tende ad infinito risulta z n q Il Teorema 1 suggerisce zn-(k+1) come stimatore consistente di z0-(k+1). Sotto ulteriori ipotesi è possibile provare risultati utili per la costruzione di intervalli di confidenza, enunciati nei Teoremi 2 e 3 seguenti. Teorema 2. Sotto le Condizioni 1-3, e assumendo che G(z02)<, la successione di v.a. n (zn - z0) tende in distribuzione ad una normale N(0,) con media zero e varianza =H’(z0)-2 {F(z0-1)2 (G(z02) - G(z0) 2) + G(z0)2 (F(z0-2) - F(z0-1)2)} per n tendente a infinito. Come conseguenza del Teorema 2 ed utilizzando il delta method si ha che la successione di v.a. n (zn-(k+1) - z0-(k+1)) converge in distribuzione ad una normale con media zero e varianza 2 =(k+1)2/z02(k+2). Dal Teorema 2 si ottiene la seguente stima consistente di 2 : n2 =((k+1)2/zn2(k+2))Hn’(zn)-2{Fn(zn-1)2(Gn(zn2)-Gn(zn)2)+Gn(zn)2(Fn(zn-2)-Fn(zn-1)2)} Come conseguenza si ha il Teorema 3, risultato principale della sezione. Teorema 3. Sotto le Condizioni 1-3, e assumendo che G(z02)<, la successione di v.a. { n (zn-(k+1) - z0-(k+1))/n} tende in distribuzione ad una normale standard. Indicando con q il quantile di ordine della distribuzione normale standard, dal Teorema 3 si ottiene il seguente intervallo di confidenza di ampiezza (1-): [max(0, (zn-(k+1) – q/2 n n ), min(1, zn-(k+1) + q/2 n n )] (7) A causa della impossibilità dell’approssimazione normale di tener conto di una eventuale asimmetria della distribuzione di n (zn-(k+1) - z0-(k+1)), sono stati studiati anche intervalli di confidenza bootstrap per z0-(k+1). Detto KS=max(S1,.., Sn) e KT=max(T1,.., Tn), l’intervallo di confidenza bootstrap si ottiene generando mn campioni di tempi di servizio (S*1,j...S*n,j, j=,.. mn) ed mn campioni di tempi inter-arrivo (T*1,j...T*n,j, j=,.. mn) da due distribuzioni multinomiali MNS e MNT assumenti valori (1, .., KS) e (1, .., KT) con probabilità fn(1),.., fn(KS) and fn(1),.., fn(KT), rispettivamente. Si dimostra che l’intervallo di confidenza bootstrap basato sulle mn quantità V*n,j= n (z*n,j-(k+1) – z0-(k+1)), con z*n,j la più grande radice reale positiva dell’equazione Hn,j(z)=Fn,j(z-1)Gn,j(z)=0 si comporta asintoticamente come l’intervallo di confidenza (7). L’analisi di dati reali - arrivi di celle ATM relativi a due diverse applicazioni utilizzanti come tecnica di trasporto IP su ATM - ha fornito per un valore di =0.8, dimensioni del buffer k=100 e k=500, livelli di confidenza =1% e =5% i valori descritti in Tabella 1. Essi mostrano che gli intervalli di confidenza bootstrap, anche se asintoticamente equivalenti a quelli basati sull’approssimazione normale, sono in grado di meglio approssimarne i quantili in caso di asimmetria della distribuzione di zn-(k+1). =5% =1% Intervalli di confidenza asintotici per z0-(k+1) k=100 k=500 0.0000 ; 4.7345*10-4 0.0000 ; 2.8334*10-18 0.0000 ; 5.6248*10-4 0.0000 ; 3.6234*10-18 Intervalli di confidenza bootstrap per z0-(k+1) k=100 4.1088*10-5 ; 7.6091*10-4 2.2178*10-5 ; 1.3076*10-3 k=500 1.7469*10-22; 3.7947*10-16 8.2028*10-24; 4.9726*10-15 Tabella 1: Confronto tra intervalli di confidenza asintotici e bootstrap Riferimenti bibliografici Conti, P.L. (1998) Large Sample Bayesian Analysis for Geo/G/1 Discrete-Time Queueing Models. In fase di pubblicazione su The Annals of Statistics. Conti, P.L., De Giovanni L. (1999) Queueing Models and Statistical Analysis for ATM Based Systems. Sottoposto a rivista per la pubblicazione. Grassmann, W.K, Jain J.L. (1989) Numerical Solutions of the waiting time distribution of the arithmetic GI/G/1 queue. Operations Research, 37, 141-150. Kobayashi, H. (1983) Discrete Time Queueing Systems. In G.Louchard, G. Latouche (Eds): Probability Theory and Computer Science. Academic Press, New York. Pitts, S.M. (1994) Non parametric estimation of the stationary waiting time distribution function for the GI/G/1 queue. The Annals of Statistics, 22, 1428-1446. Roberts J., Mocci U., Virtamo J. (1996) Broadband Network Teletraffic. Springer Verlag, Berlin.