b-tagging - Istituto Nazionale di Fisica Nucleare

Università degli Studi di Milano
Facoltà di Scienze Matematiche, Fisiche e Naturali
Laurea Triennale in Fisica
Tracciamento di particelle
cariche e tecniche di selezione di
particelle con vita media
relativamente lunga (b-tagging)
Relatore:
Prof. Francesco RAGUSA
Correlatore:
Dott. Attilio ANDREAZZA
Federico Meloni
Matricola N. 689768
Codice PACS: 14.65.-q
Anno Accademico 2007/2008
Indice
1 Introduzione
3
2 Tracking
5
2.1 Moto di una particella carica in un campo magnetico . . .
6
2.1.1 Fit lineare . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.2 Fit quadratico . . . . . . . . . . . . . . . . . . . . . . 14
2.2 Errori nel tracking . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.1 Allineamento . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.2 Scattering Multiplo . . . . . . . . . . . . . . . . . . . 16
3 b-tagging
19
3.1 Lifetime tagging . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1.1 Determinazione e segno del parametro di impatto . 24
3.1.2 Probabilità di vita media . . . . . . . . . . . . . . . . 26
3.2 Migliorare il filtro: combinazione di più variabili . . . . . . 28
4 Simulazione
30
4.1 Ricostruzione di Mtop . . . . . . . . . . . . . . . . . . . . . . 32
4.2 Parametrizzazione del fondo . . . . . . . . . . . . . . . . . . 36
4.3 Simulazione della misura . . . . . . . . . . . . . . . . . . . 41
4.4 Efficienza b-tagging . . . . . . . . . . . . . . . . . . . . . . . 46
5 Conclusioni
48
2
Capitolo 1
Introduzione
Tutte le ricerche in fisica delle particelle si basano su esperimenti in cui
è necessario rivelare e tracciare la traiettoria delle particelle al fine di
misurarne le quantità caratteristiche quali ad esempio energia, quantità di moto e carica. Nel primo capitolo di questo lavoro si prenderanno
in considerazione le tecniche di ricostruzione della traiettoria a partire
da una serie di misure di posizione all’interno di un rivelatore in cui
è presente un campo magnetico noto e verranno esaminate le fonti di
errore nella misura, siano esse di origine statistica o sistematica.
Nel secondo capitolo si passa alla trattazione di un utilizzo specifico
del tracciamento delle particelle: il b-tagging.
Le particelle contenenti quark b sono caratterizzate da una serie di
qualità che ne rendono possibile l’identificazione: esse hanno una vita media relativamente lunga (dell’ordine di 10−12 secondi), hanno una
grande massa, hanno la tendenza a decadere in un grande numero di
particelle figlie comprendenti dei leptoni con grande quantità di moto
trasversa.
L’utilizzo del b-tagging nei moderni esperimenti è molto importante e
rientra in molti campi di ricerca: ad esempio se il bosone di Higgs dovesse esistere e avesse massa sufficientemente piccola, ci si aspetta di
trovare dei quark b nei suoi prodotti di decadimento; allo stesso modo il
quark b è presente nella maggioranza dei decadimenti del quark top e
rappresenta un candidato ideale per tutte le misure della fisica del top.
3
Un altro campo di ricerca dove il b-tagging è naturalmente necessario è
quello della fisica dello stesso quark b come ad esempio le ricerche sulla
violazione di CP.
La trattazione prenderà in considerazione la principale caratteristica
discriminante, ossia la vita media.
Il terzo ed ultimo capitolo del lavoro presenterà i risultati di una simulazione montecarlo realizzata utilizzando C++ e ROOT inerente la
ricostruzione della massa del quark top a partire da un decadimento
tt → W + W − b b → q q 0 l νl b b, una misura che è stata realizzata da
CDF II a Tevatron. Saranno presentati i risultati della simulazione con
il b-tagging attivo e disattivato e si confronteranno le misure così ricostruite.
In un secondo momento si effettuerà un test di coerenza tra i risultati
ottenuti con un numero di eventi simile a quello reale (∼ 60) e la simulazione montecarlo stessa. Infine si analizzeranno gli effetti dell’efficienza
dell’algoritmo di b-tagging sull’andamento della misura.
4
Capitolo 2
Tracking
Lo studio delle collisioni e dei decadimenti a livello nucleare e particellare si basa sull’utilizzo di strumenti in grado di rivelare e misurare i
prodotti di queste interazioni.
Gli esperimenti attualmente in corso e futuri si basano sull’utilizzo di
sofisticati sistemi elettronici in grado di selezionare automaticamente
i segnali rilasciati dai prodotti delle interazioni sotto studio all’interno
dei rivelatori e di maneggiare enormi quantità di dati per ricostruire
l’evento.
In questo capitolo saranno esaminati i principi che stanno alla base
della ricostruzione della traiettoria di una particella all’interno di un
rivelatore.
Una breve introduzione al fenomeno fisico del moto di una particella carica in un campo magnetico precederà la presentazione del formalismo
matematico del fit richiesto per ricavare l’equazione della traiettoria.
Benchè idealmente il rivelatore dovrebbe effettuare le misure senza
alterare in maniera misurabile lo stato delle particelle che lo attraversano, questa situazione non è sempre realistica: al termine della trattazione del fit si prenderà dunque in considerazione il problema degli errori
nella ricostruzione della traiettoria, siano essi generati dal procedimento del fit, da problemi di calibrazione-assemblaggio o dall’interazione tra
particella e materiale del rivelatore.
5
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
2.1
Moto di una particella carica in un campo
magnetico
Il moto di una particella immersa in un campo magnetico è soggetto alla
forza di Lorentz, data da
F = qv × B
(2.1)
Come si può osservare dalla sua formula, la forza è sempre perpendicolare sia alla velocità che alla direzione del campo B che la genera:
particelle ferme o in moto secondo una direzione parallela al campo B
non ne risentiranno.
La principale conseguenza di questa proprietà della forza di Lorentz
è che essa non compie lavoro sulla particella, lasciandone inalterata
l’energia e permette pertanto di fare una misura non distruttiva della quantità di moto di una particella.
Al contrario dell’energia, la direzione del moto della particella viene
cambiata dalla forza e, nel caso di un campo magnetico uniforme, produce una traiettoria elicoidale.
La presenza di un campo magnetico rende immediatamente distinguibili le cariche delle particelle coinvolte: cariche positive e negative
vengono deflesse in versi opposti, mentre le particelle neutre non risentono della forza e quindi conservano la loro originaria direzione di
emissione.
Si ha dunque che una particella di quantità di moto p e carica q
in un campo magnetico costante nel tempo B(r) si muove secondo una
traiettoria determinata dell’equazione differenziale
q dr
d2 r
=
B(r)
ds2
p ds
(2.2)
dove s è una coordinata locale data dallo spazio percorso sulla traiettoria che semplifica la trattazione dei problemi dal momento che il modulo
della velocità è costante.
Nel caso di un campo magnetico uniforme questa coincide con un’elica.
A partire da questa legge, attraverso la misura accurata di una traiettoria in un campo magnetico noto (anche nel caso in cui il campo magnetico non sia uniforme) è possibile ricavare la quantità di moto della
6
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
particella. I rivelatori che si utilizzano nei collisori hanno quasi sempre
un campo magnetico generato da un solenoide con l’asse coincidente con
la direzione dei fasci; risulta pertanto conveniente utilizzare un sistema
di coordinate cilindrico e scomporre la traiettoria della particella in due
piani: ρ − Φ (ortogonale al campo B) e ρ − z (contentente B).
Figura 2.1: Angolo di dip λ e parametro d’impatto d nel piano ρ − z
Supponendo B uniforme, nel piano ρ − z la traiettoria è spesso approssimabile con una linea retta dalla quale è possibile ricavare l’angolo λ
detto angolo di dip ed il parametro d’impatto, come mostrato in fig. 2.1.
Il parametro d’impatto è definito come la distanza minima della traiettoria dall’origine del sistema di riferimento che usualmente coincide
con il punto di interazione. Nel piano ρ − Φ la traiettoria è un arco di
circonferenza da cui si misura la quantità di moto trasversa.
Un parametro molto importante da cui è possibile risalire alla quantità di moto totale della particella è la sagitta dell’arco percorso nel piano ρ − Φ, illustrata nella fig. 2.2. Dato un arco di circonferenza (di rag-
Figura 2.2: Sagitta s per un arco di circonferenza di raggio R e lunghezza L
gio R e lunghezza L) la sagitta dell’arco è legata al raggio dalle seguenti
7
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
relazioni
2α =
L
R
(2.3)
L2
α2
=
(2.4)
2
8R
Misurando la sagitta e l’angolo di dip λ è possibile risalire al raggio di
s = R(1 − cosα) ' R
curvatura e alla quantità di moto totale sfruttando
(2.5)
pt = pcosλ = 0.3BR
p=
pt
0.3BR
=
cosλ
cosλ
(2.6)
Una ricostruzione precisa della traiettoria della particella è necessaria
per un’accurata determinazione di queste due grandezze.
Figura 2.3: Misura della sagitta tramite tre misure di posizione yi
Prendiamo ora in considerazione l’andamento dell’errore sulla quantità
di moto ricavata dalla misura della sagitta calcolata a partire da tre
misure di posizione y1 , y2 e y3 , come mostrato in fig. 2.3. L’espressione
della sagitta e del suo errore sono quindi
y1 + y2
s = y3 −
2
r
δs =
3
δy
2
(2.7)
L’errore sul raggio di curvatura è legato all’errore sulla sagitta da:
r
L2 δR
3
| δs |=
=
δy
(2.8)
8R R
2
8
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
Sostituendo in questa espressione la relazione tra errore sul raggio di
curvatura ed errore sulla quantità di moto della particella
R=
p
0.3B
si ottiene
δp
=
p
δp
δR
=
p
R
√
96R
δy
L2
(2.9)
(2.10)
Sostituendo ora al raggio R la sua espressione in termini di quantità di
moto
√
96p
δp
=
δy
p
0.3BL2
(2.11)
si giunge alla relazione finale
√
96
δp
=
δy
2
p
0.3BL2
(2.12)
Il risultato ottenuto evidenzia come l’errore sulla quantità di moto
sia proporzionale alla quantità di moto stessa e all’errore sulla misura delle coordinate dei rivelatori di tracciamento. Va inoltre messa in
evidenza la forte dipendenza dalla lunghezza della traiettoria misurata, che dipende dall’inverso del quadrato: questa analisi approssimata
della ricostruzione della quantità di moto fornisce già delle importanti
indicazioni sul tipo di rivelatore necessario per ottimizzarne la misura.
Nella prossima sezione i risultati appena ottenuti verranno confrontati
con quelli derivanti da una trattazione più completa, che prenda in esame più di tre punti sulla traiettoria e consenta l’attribuzione di errori
diversi e correlati per effettuare il fit delle traiettorie.
Passiamo quindi alla trattazione matematica della ricostruzione della traiettoria in questi due piani ponendo particolare attenzione agli
errori.
9
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
2.1.1
Fit lineare
Abbiamo già notato che la proiezione della traiettoria sul piano ρ−z (che
contiene il campo magnetico B) è spesso approssimabile con una retta e
pertanto per la sua ricostruzione è sufficiente utilizzare un fit lineare.
Per la ricostruzione della traiettoria occorre scegliere un sistema di riferimento e supponiamo di fare N+1 misure di posizione yn della particella
durante il suo moto (da ora in poi utilizzeremo y al posto di ρ per semplificare la notazione).
Al fine di semplificare la trattazione del problema ogni misura sarà effettuata da un rivelatore posto in una posizione zn nota. Gli errori σn saranno tutti scorrelati e descritti pertanto da una matrice di covarianza
diagonale.
Il metodo per trovare la miglior retta y = a + bz passante per i punti
misurati consiste nel minimizzare la funzione
2
χ =
N
X
(yn − a − bzn )2
(2.13)
σn2
n=0
Il minimo della funzione si ottiene per
a=
Sy Szz − Sz Syz
D
b=
S1 Syz − Sz Sy
D
(2.14)
avendo definito
S1 =
N
N
N
X
X
X
1
yn
zn
S
=
S
=
y
z
σn2
σn2
σn2
n=0
n=0
Syz =
N
X
yn zn
n=0
σn2
Szz
n=0
N
X
zn2
=
σn2
(2.15)
n=0
D = S1 Szz − Sz Sz
(2.16)
Il problema può essere formulato anche utilizzando un formalismo
matriciale utile per compattezza, rapidità di adattamento a problemi
simili e la possibilità di essere utilizzato in un programma per elaboratore.
Nel caso della retta possiamo esprimere la relazione fra tutte le
10
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
previsioni del modello come
  
 
f0
a + bz0
1
  
 
 
 
f =
 · · ·  =  · · ·  = · · ·
fN
a + bzN
1
z0

" #
 a
· · ·
 b = Ap
zN
(2.17)

y0

 

Le misure sono rappresentate da un vettore colonna Y = 
 · · ·  e gli
yN
elementi della matrice di covarianza sono dati, in generale, da Vij =
h(yi − hyi i) (yj − hyj i)i
La funzione da minimizzare χ2 diviene χ2 = (Y − Ap)T W (Y − Ap)
con W = V −1 e il χ2 risulta minimo per ξ ∗ = (AT W A)−1 AT W Y .
Analizziamo ora l’errore sui parametri a (intercetta) e b (pendenza)
ricavati dal fit, sotto l’ulteriore ipotesi di disporre di rivelatori equispaziati e di errori di misura uguali σn = σ.
Chiamiamo L = zN − z0 e zc =
zN +z0
2
rispettivamente la lunghezza del
rivelatore ed il suo centro.
La matrice di covarianza (calcolata in z = 0) è data da
#
"
"
#
σa2 cab
1 Szz −Sz
=
D −Sz S1
cab σb2
(2.18)
E’ possibile esprimere in forma finita le quantità S
N +1
zc
Sz = (N + 1) 2
2
σ
σ
N + 1 N + 2 L2
=
+ zc2
σ2
N 12
S1 =
Szz
(2.19)
L2 (N + 1)2 (N + 2)
(2.20)
12σ 2
N
da cui si ricavano gli errori sui parametri a e b della retta ricostruita.
N zc2
σ2
2
σa = 1 + 12
(2.21)
N + 2 L2 N + 1
D=
σb2 = 12
N
σ2
(N + 2)L2 N + 1
(2.22)
Gli errori su entrambi i parametri sono quindi linearmente dipen√
denti dall’errore di misura σ e inversamente proporzionali a N + 1;
11
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
inoltre l’errore sul parametro b è inversamente proporzionale alla lunghezza L.
Si osserva che σa aumenta linearmente con la distanza del centro
del rivelatore zc dall’origine del sistema di riferimento scelto: questa
dipendenza dell’errore sull’intercetta richiede un approfondimento. Per
capire meglio calcoliamo gli errori del fit nel caso in cui l’origine del
sistema di riferimento sia posta al centro della traiettoria (zc = 0).
Ci si pone quindi nel nuovo sistema di riferimento e si ricalcolano σa e
σb
N +1
Sz = 0
σ2 N + 1 N + 2 L2
=
σ2
N 12
(2.23)
L2 (N + 1)2 (N + 2)
12σ 2
N
(2.24)
S1 =
Szz
D=
I nuovi errori calcolati sono:
σa2 =
σb2 = 12
σ2
N +1
N
σ2
(N + 2)L2 N + 1
(2.25)
(2.26)
Tuttavia questo risultato non deve portare a credere che l’errore sull’estrapolazione all’origine del sistema di riferimento iniziale sia diminuito: infatti il nuovo errore σa trovato si riferisce adesso ad un punto
differente che si trova ad una distanza zc da quello del caso precedente. Attraverso la propagazione degli errori 1 si ottiene infatti il risultato
originario:
f (−zc ) = a − bzc
σ−zc
2
σ−z
= σa2 + zc2 σb2
c
σ2
N zc2
= 1 + 12
N + 2 L2 N + 1
(2.27)
(2.28)
(2.29)
Da questa semplice discussione, emergono alcune importanti indicazioni sulle caratteristiche che dovrebbe possedere l’apparato di misura:
1
nel caso in cui l’origine sia al centro della traittoria la matrice di covarianza e’
diagonale
12
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
per ridurre l’errore sul parametro di impatto (cioè l’estrapolazione in
z = −zc ) si può agire tenendo conto dei fattori da cui esso dipende.
In primo luogo l’errore dipende dall’incertezza sulla misura della posizione: per ottimizzare la precisione sul parametro d’impatto occorre
utilizzare dei rivelatori con errore di misura più piccolo possibile (tipicamente rivelatori al silicio).
In secondo luogo, il fattore dipendente dall’errore sulla pendenza può
essere migliorato utilizzando un rivelatore più lungo possibile e quindi
un rivelatore di grandi dimensioni.
Infine la dipendenza dalla distanza tra il punto di interazione (punto di
estrapolazione a −zc ) e il centro dell’apparato di misura può essere mitigata utilizzando un rivelatore più vicino possibile al vertice primario
della traiettoria che si vuole misurare.
Il bisogno di una misura molto precisa e vicina al vertice primario viene conciliata con il bisogno di un rivelatore di grandi dimensioni (limitato normalmente dal costo) attraverso l’utilizzo accoppiato di
due tipi di rivelatore: un rivelatore di vertice di dimensioni ridotte, ma
molto preciso (L = 10cm, σ = 5µm) ed all’esterno un rivelatore centrale di dimensioni molto più grandi, con costi minori ma che garantisce
comunque una misura della pendenza con elevata precisione.
13
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
2.1.2
Fit quadratico
Il procedimento di fit quadratico viene utilizzato per ricostruire l’equazione di una traiettoria circolare sotto l’ipotesi che la particella sia dotata di una quantità di moto non troppo piccola: nel caso in esame ci si
pone nel piano ρ − Φ (perpendicolare a B).
Come visto precedentemente, la traiettoria della particella in questo
piano è un cerchio di raggio R
(y − y0 )2 + (x − x0 )2 = R2
(2.30)
Se la quantità di moto della particella non è troppo piccola, il raggio di
curvatura sarà abbastanza grande da poter utilizzare l’approssimazione:
y = y0 +
p
R2 − (x − x0 )2 '
(x − x0 )2
)=
2R2
x2
x0
1 2
= (y0 + R + 0 ) + x −
x
2R
R
2R
' y0 + R(1 −
(2.31)
La traiettoria risulta quindi approssimata da una parabola di equazione y = a + bx + cx2 .
I parametri a e b mantengono il loro significato di intercetta e pendenza nell’origine come nel caso del fit lineare, mentre c contiene le informazioni sul raggio di curvatura e quindi la quantità di moto della
particella.
Per la ricostruzione della traiettoria occorrono gli stessi elementi utilizzati per il caso lineare (un sistema di riferimento e N+1 misure di
posizione). In completa analogia con il caso precedente la miglior parabola y = a + bx + cx2 passante per i punti misurati viene identificata
minimizzando la funzione
2
χ =
N
X
(yn − a − bxn − cx2 )2
n
σn2
n=0
(2.32)
Il formalismo matriciale è perfettamente adattabile all’aumento delle
dimensioni del problema ricorrendo ai medesimi strumenti utilizzati nel
caso del fit lineare.
14
2.1. MOTO DI UNA PARTICELLA CARICA IN UN CAMPO
MAGNETICO
La funzione χ2 avrà ancora il suo minimo in ξ ∗ = (AT W A)−1 AT W Y , ma
in questo caso ξ sarà un vettore colonna di 3 elementi mentre le matrici
A e W saranno rispettivamente (N + 1) × 3 e (N + 1) × (N + 1).
Le formule dettagliate possono essere trovate nel lavoro di Gluckstern
[5].
Analizziamo ora gli errori statistici del fit quadratico: gli errori sui
parametri a e b conservano gli andamenti già evidenziati con il fit lineare, mentre il calcolo dell’errore sul parametro c porta alla seguente
relazione:
σc =
σp
CN
L2
(2.33)
dove CN è un coefficiente dipendente dal numero di misure di posizione
effettuate (N ).
Ricordiamo l’espressione del parametro c e come il suo errore si traduce
in un errore sul raggio della traiettoria
c=
1
2R
σc =
1
δR
2R2
(2.34)
Siamo interessati a ricavare l’errore sulla quantità di moto calcolata a
partire dal parametro c: ricordando la relazione che lega la quantità di
moto al raggio di curvatura R e al campo magnetico B e sostituendola
nell’espressione di σ 2 c si ricava:
σ p
δp
=
4CN
p2
0.3BL2
(2.35)
Si ritrovano quindi nell’espressione dell’errore gli andamenti già evidenziati nella discussione svolta per il calcolo della quantità di moto a
partire dalla sagitta, uniti alla dipendenza dal numero di misure.
Anche nel caso del fit quadratico si osserva come in generale sia importante avere un rivelatore di grandi dimensioni (e quindi grande L) per
ridurre gli errori sulla quantità di moto e sulla pendenza.
15
2.2. ERRORI NEL TRACKING
2.2
Errori nel tracking
Oltre agli errori già messi in evidenza e legati all’errore statistico sulle
singole misure, un sistema di tracking è normalmente soggetto ad altri
errori sia di natura sistematica sia di natura statistica.
In questa sezione viene analizzata la principale fonte di errore sistematico nel tracking dovuta a imprecisioni nell’assemblaggio del rivelatore.
Inoltre viene trattato l’errore introdotto dall’interazione tra le particelle
tracciate e i materiali che devono attraversare (scattering multiplo).
2.2.1
Allineamento
Una fonte di errore sistematico può essere individuata nell’errata conoscenza della reale posizione dei diversi rivelatori di tracciamento.
Ponendoci nella situazione utilizzata per la trattazione dell’errore
sul fit, si osserva che se il rivelatore k-esimo è traslato rispetto agli altri
rivelatori di una quantità δ, la misura di yk ne risulterà sistematicamente influenzata: yk → yk + δ.
L’errore sistematico sulla misura della posizione yk andrà quindi ad influenzare tutti i parametri del fit distorcendone la ricostruzione.
Un altro possibile errore di allineamento potrebbe essere dovuto alla rotazione di uno dei piani di misura rispetto agli altri, falsando allo stesso
tempo sia la misura di yk che di xk .
Questo genere di errori sistematici, che vengono individuati attraverso un processo di taratura del rivelatore, può essere corretto semplicemente attraverso l’inserimento di un termine correttivo nell’algoritmo
di fit delle traiettorie.
2.2.2
Scattering Multiplo
Un’ulteriore fonte di errore nelle misure è dovuta alla presenza dello
scattering multiplo della particella con il materiale del rivelatore.
Una particella di momento p e carica unitaria che attraversa un materiale, caratterizzato dalla lunghezza di radiazione X0 , per un percorso
di lunghezza L viene deflessa più volte dallo scattering Coulombiano do-
16
2.2. ERRORI NEL TRACKING
vuto ai nuclei.
Si tiene conto complessivamente delle numerose interazioni coulombiane introducendo un angolo di deflessione complessivo θp cui e’ soggetta
la particella dopo avere attraversato un spessore X di materiale.
0.0136 2 1
2
(2.36)
hθp i =
pβ
X0
La proiezione di questo angolo su un qualsiasi piano contenente la direzione originaria ha distribuzione quasi gaussiana (differente per le
lunghe code con l’andamento di sin−4 2θ ) data da
1
1
P (θp ) = q
exp − 2 θp2
2hθp i
2πhθp2 i
(2.37)
L’effetto ha una dipendenza inversa dal momento p e, causando una
deflessione casuale delle particelle che attraversano il materiale, introduce una forte correlazione tra le misure di posizione lungo la traiettoria
descritta.
Negli esperimenti con collisori i vertici secondari dovuti al decadimento di particelle con vita media breve sono contenuti all’interno della beam pipe e per particelle di piccola quantità di moto la precisione
del parametro d’impatto dipende principalmente dal materiale e dallo
spessore della beam pipe e del primo strato di rivelatori. Per particelle
dotate di grande quantità di moto, l’effetto dello scattering multiplo è
invece trascurabile.
Approfondiamo l’effetto che lo scattering multiplo ha sulla ricostruzione delle quantità misurate a partire dalla traiettoria di una particella
nel caso in cui lo scattering multiplo non sia trascurabile.
Per tenere conto dello scattering multiplo occorrerebbe cambiare la funzione χ2 modificando gli errori e soprattutto introducendo le correlazioni tra le misure che vengono introdotte. Il calcolo si trova nel lavoro di
Gluckstern già citato e ne riportiamo il risultato.
r
0.0136 1
4CN
δp
'
(2.38)
p
β 0.3B X0 L
Si osserva dunque come la dipendenza inversa dell’errore da L si in√
debolisce ( L e non più L2 ).
17
2.2. ERRORI NEL TRACKING
Allo stesso modo la dipendenza inversa da L viene eliminata dall’espressione dell’errore sulla pendenza, mentre l’errore sul parametro di impatto (intercetta) acquista una dipendenza lineare da L con l’effetto di
rendere determinante l’effetto dello scattering multiplo sulla ricostruzione del vertice primario da cui hanno origine le particelle con piccola
quantità di moto.
18
Capitolo 3
b-tagging
Come già anticipato, lo studio del quark b è uno dei campi di ricerca di
primo piano nella fisica delle particelle.
Per questo motivo è necessario disporre di un metodo affidabile per distinguere gli eventi contenenti i quark b, mantentendo nel contempo il
fondo il più limitato possibile. L’efficienza dell’algoritmo e l’eliminazione del fondo sono quindi di capitale importanza in queste ricerche.
Uno dei campi di ricerca attuali più importanti in cui il b-tagging sarà
necessario è la ricerca del bosone di Higgs: se quest’ultimo fosse dotato
di una massa sufficientemente piccola, il quark b dovrebbe essere uno
dei principali prodotti del suo decadimento.
Ulteriori campi di applicazione del b-tagging sono la fisica del quark top
(di cui il quark b è uno dei principali prodotti di decadimento) e la fisica
del b stesso (come ad esempio la violazione di CP).
Gli adroni contenenti il quark b si distinguono dalle altre particelle
per molti aspetti: sono dotati di vita media relativamente lunga, hanno
una grande massa, tendono a decadere in un grande numero di particelle figlie tra cui ci sono dei leptoni con grande quantità di moto trasversa. Tutti questi elementi possono essere utilizzati in un algoritmo di
b-tagging per selezionare con maggiore precisione gli eventi contenenti
quark b.
Al termine del capitolo si prenderà in considerazione la combinazione
di più variabili nell’algoritmo di selezione, trattando le difficoltà che è
19
possibile incontrare in un’operazione del genere.
Nella prossima sezione verrà trattato il principale metodo di identificazione di un adrone b, ossia la misura della vita media.
20
3.1. LIFETIME TAGGING
3.1
Lifetime tagging
Ai fini della loro identificazione, la più importante proprietà degli adroni
b è la loro vita media: si tratta di una grandezza misurabile in maniera
relativamente semplice attraverso la misura del parametro di impatto.
Il parametro d’impatto d è definito come la minima distanza fra il punto
dell’interazione primaria e la traiettoria della particella, come mostrato
nella fig. 3.1.
Figura 3.1: Parametro d’impatto d per un generico sistema di riferimento con
origine O diversa dal vertice primario dell’interazione PV
La vita media di un adrone b è di circa 1.6 × 10−12 s: questo corrisponde
ad una traiettoria di circa 3mm (per γ ∼ 10) che quando viene estrapolata verso il vertice primario dell’interazione non passa esattamente per
esso, ma si discosta per un parametro di impatto di circa 500µm .
Questa affermazione merita un’approfondimento: considerando il decadimento di una particella in due particelle figlie che si muovono a
velocità prossime a c nel sistema di riferimento del centro di massa e
compiendo misure su di esse nel sistema di riferimento del laboratorio
ci si potrebbe aspettare un effetto relativistico di contrazione delle distanze per il parametro di impatto, ma non è così.
Il parametro di impatto d, come illustrato nella fig. 3.2, è legato alla
21
3.1. LIFETIME TAGGING
Figura 3.2: Rappresentazione del parametro d’impatto d, della lunghezza di
volo L e dell’angolo θ nel caso del decadimento di un adrone b
generato nel vertice primario PV
lunghezza di volo L e all’angolo θ da
d = Ltanθ
(3.1)
sviluppando tanθ al primo ordine si ottiene
d = Lθ = γcτ θ
(3.2)
L’angolo θ può essere stimato assumendo che la quantità di moto trasversa sia circa mB /2.
Otteniamo:
θ=
pt
'
p
mB
2
pB
2
=
1
1
'
γβ
γ
(3.3)
d = cτ
si vede quindi che il parametro di impatto d non viene alterato da effetti
relativistici. I parametri di impatto sono la variabile principale su cui si
basa il b-tagging: per ogni traiettoria compresa in un evento misurato,
il parametro d’impatto e la risoluzione della misura vengono combinate
in un’unica variabile
d
σ
(significanza del parametro d’impatto) che indica
la probabilità che ha la traiettoria presa in esame di provenire direttamente dal vertice primario dell’interazione.
22
3.1. LIFETIME TAGGING
Per eventi privi di particelle a vita media lunga ci si aspetterebbe una
distribuzione piatta tra 0 e 1, mentre in presenza di adroni b c’è una
prevalenza di valori vicini allo 0.
23
3.1. LIFETIME TAGGING
3.1.1
Determinazione e segno del parametro di impatto
Per determinare il parametro di impatto di una particella occorre per
prima cosa ricostruire la posizione del vertice primario dell’interazione.
In un esperimento di collisione il vertice primario viene determinato
a partire da un insieme di traiettorie selezionate con l’aggiunta di un
vincolo dato dalla posizone della zona di intersezione tra i due fasci incidenti.
La posizione del vertice primario è quindi ottenuta minimizzando la
funzione
χ2 =
X (dn )2
n
σn2
+
X (V sp − Vi )2
i
2
i
(σisp )
(3.4)
dove la prima somma è riferita ai parametri d’impatto dn delle n tracce
utilizzate per la ricostruzione del vertice primario divisi per il proprio
errore σn , mentre la seconda somma corrisponde al vincolo sulla posizione dei fasci incidenti: se il vertice ricostruito a partire dalle tracce
misurate cade al di fuori della zona indicata da Visp e σisp (misurata periodicamente utilizzando tutti gli eventi registrati in un intervallo di
tempo T di circa 15 minuti e considerata costante in questo intervallo di
tempo), questo termine ne terrà conto.
Le tracce da inserire nel fit del vertice primario vengono selezionate imponendo dei limiti attraverso una applicazione iterativa di algoritmi di
selezione.
Ad esempio, nell’esperimento DELPHI a LEP, per il calcolo del vertice primario si richiedeva che le tracce fossero composte da almeno un
certo numero di misure. Successivamente la funzione χ2 veniva calcolata facendo uso di tutte le tracce disponibili e ricalcolata in un secondo
momento utilizzando a turno tutte le tracce meno quella i-esima: se la
differenza χ2 − χ2i massima eccedeva una soglia predefinita, la traccia
i veniva scartata e il procedimento ripetuto finchè non ci fossero state
più tracce da scartare.
Siccome il vertice primario è utilizzato nella definizione del parametro d’impatto, occorre tener conto del fatto che queste due grandezze
24
3.1. LIFETIME TAGGING
presenteranno una correlazione nel momento del computo degli errori
sulle rispettive grandezze.
Un utile espediente per ridurre il fondo nelle misure che si basano
sul tagging di vita media consiste nel definire un segno del parametro
d’impatto: per farlo occorre conoscere il percorso della particella con vita lunga.
Nel caso più semplice questo è approssimato dalla direzione del getto
al quale appartiene la particella: questa direzione viene definita con l’identificazione di un vertice secondario e l’assegnazione di un verso dal
vertice primario al secondario.
Per determinare il segno del paramentro di impatto viene calcolato il
punto con minore distanza tra la traccia ed il getto della particella a vita media lunga: se il punto si trova a monte (seguendo la direzione del
getto) del vertice primario viene attribuito un segno negativo al parametro d’impatto, altrimenti il segno sarà positivo.
Con questo metodo viene assegnato un segno positivo al parametro d’impatto delle tracce provenienti dal decadimento di particelle con vita media lunga, mentre le tracce provenienti direttamente dal vertice primario (e per le quali l’eventuale parametro d’impatto è solo il risultato di
errori di misura) avranno segni ugualmente distribuiti tra positivi e negativi.
Nel caso del b-tagging si utilizzano solo le tracce con parametro d’impatto positivo, ottenendo in questo modo una riduzione del fondo del
50%.
25
3.1. LIFETIME TAGGING
3.1.2
Probabilità di vita media
Per ogni traccia misurata è possibile definire un parametro S (significanza del parametro d’impatto)
S=
d
σ
(3.5)
dove d è il parametro di impatto (munito di segno come descritto nel paragrafo precedente) e σ la sua incertezza, che tiene conto della misura
del parametro di impatto di ogni traccia rispetto alla sua precisione.
Figura 3.3: Possibile distribuzione della significanza S in presenza di
particelle a vita media relativamente lunga
In figura è mostrata una possibile distribuzione della significanza; si noti che la distribuzione è asimmetrica. La parte relativa a valori negativi
della significanza è dovuta a tracce provenienti dal vertice primario che
hanno un parametro d’impatto causato da errori di misura. La parte
relativa a valori positivi contiene sia le tracce provenienti dal vertice
primario sia le tracce provenienti dal decadimento di particelle con vita media lunga. Lo studio della regione di sinistra della distribuzione
26
3.1. LIFETIME TAGGING
permette pertanto di “misurare” la funzione distribuzione f (S) della significanza del parametro d’impatto. Utilizzando questa funzione è possibile definire per ogni traccia una probabilità P (S 0 ) di avere modulo di
S maggiore di S 0 .
0
Z
∞
f (S)dS
P (S ) =
(3.6)
S0
Prendendo in considerazione la distribuzione di P (S 0 ) si osserva che,
per definizione, le tracce provenienti dal vertice primario hanno una distribuzione piatta tra 0 e 1; la presenza di un picco per valori piccoli di
P (S 0 ) rivela la presenza di particelle a vita media lunga che posseggono
parametri d’impatto (e quindi valori di S) maggiori.
La costruzione di P (S 0 ) è molto utile poichè permette una calibrazione
dell’apparato di misura a partire dai dati sperimentali e quindi indipendente dalle simulazioni. In questo modo è possibile mettere in evidenza
delle eventuali discrepanze tra le misure e le simulazioni, permettendo
una riduzione dell’errore sistematico.
E’ possibile quindi definire, per un insieme di N tracce, una probabilità di vita media a partire dalle P (S 0 ) delle singole tracce nel seguente
modo:
PN = Π ·
N
−1
X
j=0
(−logΠ)j
j!
(3.7)
dove
Π=
N
Y
P (S i )
(3.8)
i=1
Il significato di PN è analogo a quello di P (S 0 ): corrisponde alla probabilità che un insieme di N tracce abbia prodotto delle loro probabilità
superiore al valore osservato. La probabilità di vita media varia tra 0 e 1
per ogni insieme di N tracce scorrelate provenienti dal vertice primario,
mentre la presenza di particelle a vita media lunga viene evidenziata
dalla presenza di un picco in corrispondenza di valori bassi di PN .
Anche in questo caso è possibile analizzare il fondo utilizzando le tracce
con parametro S negativo: la distribuzione osservata sarà piatta a me-
27
3.2. MIGLIORARE IL FILTRO: COMBINAZIONE DI PIÙ VARIABILI
no di un piccolo picco vicino allo zero dovuto a particelle con vita media
lunga a cui è stato associato un segno errato.
3.2
Migliorare il filtro: combinazione di più variabili
Il b-tagging basato sulle sole informazioni derivanti dalla vita media è
sufficiente per i bisogni di molte applicazioni in fisica, tuttavia essa non
è l’unico parametro sensibile alla presenza di un quark b.
La resa dell’algoritmo di b-tagging può essere significativamente migliorata includendo ulteriori variabili discriminanti: ad esempio c’è una
probabilità abbastanza alta che tra i prodotti di decadimento di un adrone b sia incluso un elettrone o un muone dotato di grande quantità di
moto trasversa (1 GeV/c o più) rispetto all’asse del getto b.
Presa singolarmente, la presenza di un leptone con grande quantità di
moto avrebbe un’efficienza molto bassa, ma si dimostra molto utile per
raffinare i risultati dell’algoritmo di b-tagging se combinata con la misura del parametro d’impatto.
Un’ulteriore variabile che è possibile sfruttare per l’identificazione è la
massa invariante associata ad un vertice secondario: questa variabile
è molto sensibile al sapore del getto, ad esempio la massa dovuta alla
presenza di un quark c è limitata dal mesone D che ha massa di circa 1.8GeV/c2 , mentre nel caso del quark b questa può arrivare anche a
5GeV/c2 .
Anche la quantità di moto trasversa associata al vertice secondario (che
nel caso di quark b sarà maggiore) e la rapidità di ogni traiettoria associata al vertice secondario (le rapidità associate al decadimento di un
mesone B sono normalmente più piccole di quelle associate ad un mesone D per via della maggiore massa) sono esempi di variabili che è
possibile prendere in considerazione per formare un algoritmo combinato.
Il metodo di combinazione delle variabili ha una massima efficienza
quando non sono presenti correlazioni tra le variabili prese in esame:
28
3.2. MIGLIORARE IL FILTRO: COMBINAZIONE DI PIÙ VARIABILI
per questo nella scelta delle variabili discriminanti è necessario fare attenzione alle possibili correlazioni sussistenti tra di esse, che potrebbero
falsare i risultati dell’algoritmo di b-tagging se non venissero prese in
considerazione.
29
Capitolo 4
Simulazione
Al fine di osservare quali sono gli effetti dell’utilizzo delle tecniche di
b-tagging in una misura sperimentale, si è fatto ricorso ad una simulazione montecarlo, realizzata utilizzando il linguaggio C++ con l’ausilio
di ROOT, che ricostruisce l’esperimento per la misura della massa del
quark top Mtop fatta dal rivelatore CDF II presso Tevatron al Fermilab.
Gli obiettivi della simulazione sono studiare il miglioramento delle misure con l’abbattimento del fondo dovuto all’utilizzo del b-tagging e studiare i risultati della misura in funzione dell’efficienza dell’algoritmo di
b-tagging.
La ricostruzione della massa del quark top viene effettuata studiando il canale leptone + getti dell’interazione di una coppia costituita da
un quark top e la sua antiparticella, come mostrato in fig. 4.1:
tt → W + W − b b → q q 0 l νl b b
questo canale di decadimento è caratterizzato da un singolo leptone con
grande quantità di moto trasversa, dell’energia mancante dovuta alla
presenza del neutrino nel decadimento del bosone W, e da quattro getti:
due provenienti dal decadimento andronico di uno dei due bosoni W e
altri due dovuti ai quark bottom provenienti dal decadimento dei quark
top.
Nella simulazione si assumono i due quark t e t in quiete nel sistema
di riferimento del laboratorio. Il valore vero assunto per la massa del
quark top è di 175Gev/c2 .
30
Figura 4.1: Diagramma di Feynman del decadimento studiato nella simulazione
Nella macro della simulazione sono state inserite le condizioni utilizzate in CDF II per l’accettazione di una serie di tracce rappresentanti
l’evento cercato: si tratta di limitazioni sull’energia e la pseudorapidità delle particelle tracciate che vengono inserite per tenere conto delle
caratteristiche fisiche del rivelatore, come zone cieche, e utilizzate per
diminuire le possibilità di commettere errori nel riconoscimento delle
particelle.
In particolare si richiede che il leptone proveniente dal decadimento
del bosone W abbia energia trasversa ET ≥ 20 GeV e pseudorapidità
| η |≤ 1.0. Si richiede inoltre che i getti adronici (contenenti quark b
o derivanti dal decadimento di uno dei due bosoni W) abbiano energia
trasversa ET ≥ 15 GeV e pseudorapidità | η |≤ 2.0 e inoltre che l’energia mancante, dovuta all’impossibilità di effettuare misure sul neutrino
(prodotto di decadimento di un W) che è una particella scarsamente interagente, sia E > 20 GeV.
Le macro di ROOT utilizzate per le simulazioni sono disponibili su internet all’indirizzo:
http://atlas-pixel.mi.infn.it/Particelle2/eserciziROOT/Mtopebtagging
31
4.1. RICOSTRUZIONE DI MT OP
4.1
Ricostruzione di Mtop
Prima di procedere con l’analisi del fondo combinatorio, si effettua una
prima ricostruzione “ingenua” della massa del quark top: infatti con i
dati simulati è possibile associare correttamente i getti e le particelle
rivelate ai due quark top e si può pertanto calcolare la loro massa invariante senza compiere errori.
La figura 4.2 mostra la distribuzione di massa invariante così ottenuta.
Figura 4.2: Istogramma della distribuzione della massa invariante in caso di
segnale puro
La distribuzione ottenuta è gaussiana e una volta fittata risulta avere
valore medio di 173.2 ± 0.1 GeV/c2 : la stima molto accurata del valore
centrale e del suo errore è frutto della grande statistica propria della simulazione che non è tipicamente raggiungibile da un esperimento reale,
dove i dati sperimentali sono disponibili in quantità molto limitate. Si
osserva inoltre che la simulazione dell’esperimento comporta fin da questo momento una sottostima sistematica della massa del quark top.
32
4.1. RICOSTRUZIONE DI MT OP
Per procedere con il confronto si effettua una simulazione completa e
quindi comprendente anche il fondo combinatorio; inoltre, inizialmente,
supponiamo di non avere a disposizione alcun algortimo di b-tagging.
Figura 4.3: Istogramma della distribuzione della massa invariante di tutte le
combinazioni in assenza di b-tagging
Il fondo ottenuto è dovuto all’incapacità di riconoscere quali siano i getti
derivanti dal decadimento del quark top: mentre il leptone è facilmente
riconoscibile, senza l’utilizzo del b-tagging non è possibile suddividere
le particelle e i getti in due gruppi che corrispondono senza ambiguità
ai due quark top.
Poichè il decadimento che si vuole studiare ha come prodotti finali tre
getti adronici (uno contenente il quark b e due derivanti dal decadimento del bosone W) e il rivelatore non permette l’identificazione di alcuno di essi, per procedere con l’analisi della distribuzione per la massa
del quark top si prendono in considerazione, a turno, tutte le possibili
combinazioni di tre getti sui quattro disponibili. Le combinazioni sono:
• b + q + q 0 che è quella corretta che si vorrebbe isolare
33
4.1. RICOSTRUZIONE DI MT OP
• b + q + q 0 che prende in considerazione entrambi i getti provenienti
dal decadimento del bosone W ma li associa al quark b sbagliato
• b + b + q in cui si considerano due quark b e uno dei due getti del
decadimento del bosone W
• b + b + q 0 analoga alla precedente
Il peso delle combinazioni sbagliate è quindi tre volte superiore a quello
del segnale del top puro e, se non si considera adeguatamente questa
distorsione, si commette un grande errore sulla massa ricostruita. La
distribuzione della massa invariante di tutte le combinazioni è mostrata
in figura 4.3.
Il picco della distribuzione risulta essere intorno ai 170 GeV/c2 .
Inoltre è opportuno notare come, nel momento dell’elaborazione dei dati
sperimentali, dovendo calcolare tutte le possibili combinazioni dei getti
il tempo necessario per portare a termine l’analisi tenda ad essere molto
più lungo di un analisi in cui si distinguono i diversi elementi.
34
4.1. RICOSTRUZIONE DI MT OP
Come ultimo caso si simula ora nuovamente l’esperimento completo ma questa volta si suppone di disporre di un algoritmo di b-tagging
(supponendo un’efficienza del 100%): il rivelatore permette di distinguere i getti b da quelli derivanti dal decadimento del bosone W.
La conseguenza diretta di questa capacità è una drastica riduzione del
fondo: ci si aspetta che questo sia ancora presente, ma sia dovuto solamente alla combinazione comprendente il getto b errato.
Figura 4.4: Istogramma della distribuzione della massa invariante delle due
combinazioni che è possibile individuare con l’utilizzo di b-tagging
Si nota che, come aspettato, è ancora presente un fondo, ma esso rispetto al caso precedente ha un peso ridotto ad un terzo. La posizione del
picco è intorno ai 170 GeV/c2 . Tuttavia per un’accurata determinazione
della massa è indispensabile avere una parametrizzazione della forma
del fondo. Questo è l’oggetto dello studio fatto nel paragrafo successivo.
35
4.2. PARAMETRIZZAZIONE DEL FONDO
4.2
Parametrizzazione del fondo
Per trattare correttamente la distribuzione della massa del quark top
è opportuno studiare la distribuzione della massa invariante di tutte le
combinazioni errate. Il metodo montecarlo ci permette di studiare separatamente le singole combinazioni.
In questo caso le distribuzioni sono tre e corrispondono alle diverse combinazioni precedentemente elencate osservando che le due combinazioni
comprendenti entrambi i getti con quark b hanno uguale distribuzione
perciò possono essere studiate insieme.
La distribuzione del segnale puro è già stata presentata, perciò si
procede con l’analisi della distribuzione dei fondi.
Prendiamo in considerazione il fondo dovuto alle combinazioni comprendenti entrambi i getti b (b + b + q e b + b + q 0 ): questo fondo corrisponde
alla componente che viene eliminata quando si utilizza un algoritmo di
b-tagging nella misura.
Figura 4.5: Istogramma della distribuzione del fondo combinatorio dovuto
alle combinazioni comprendenti entrambi i getti b
36
4.2. PARAMETRIZZAZIONE DEL FONDO
La distribuzione ottenuta è mostrata nella fig. 4.5: per il fit utilizziamo
una parametrizzazione del tipo:
y = p0 exp − p3 q 5 + p4 q 4 + p5 q 3 + p6 q 2 + p7 q
dove
q=
(4.1)
x − p1
p2
(4.2)
Il polinomio di quinto grado contenuto nell’esponenziale è necessario
per ottenere la curva asimmetrica descritta dalla distribuzione.
Il fit della funzione restituisce una curva che presenta un massimo per
180 ± 3 GeV/c2 : riportiamo sintenticamente tutti i parametri che descrivono la forma della curva che saranno successivamente utilizzati per il
fit della distribuzione totale.
Parametro
p1
p2
p3
p4
p5
p6
p7
Valore
180
1150
50000
50000
9300
780
0
Passiamo ora all’analisi del fondo che non può essere eliminato tramite
l’utilizzo del b-tagging, cioè quello dovuto alla combinazione comprendente il getto b sbagliato.
Anche per questo fondo, illustrato nella fig. 4.6, si è utilizzata una parametrizzazione del tipo precedente, ed il procedimento di fit ha restituito
una curva che presenta un massimo per 164 ± 1 GeV/c2 . Riportiamo
anche per questo fondo i parametri di forma della curva.
Parametro
p1
p2
p3
p4
p5
p6
p7
Valore
164
260
1000
980
320
80
7
A questo punto si dispone di tutti gli elementi necessari per descrivere
le componenti della distribuzione completa, perciò si procede con il fit
della simulazione completa (ripetuta anche questa volta nei due casi di
b-tagging attivo e disattivato) comprendente la somma delle parametrizzazioni precedentemente ottenute.
37
4.2. PARAMETRIZZAZIONE DEL FONDO
Figura 4.6: Istogramma della distribuzione del fondo combinatorio comprendente il getto b sbagliato
38
4.2. PARAMETRIZZAZIONE DEL FONDO
Poichè sono presenti molti parametri, per ridurre la possibilità di
errori sistematici del fit dovuti alle correlazioni presenti tra di essi, si
sono fissati tutti i parametri che definiscono la “forma” delle componenti
della distribuzione lasciando invece libero di variare un parametro di
scala per la determinazione della presenza del fondo.
Questo espediente permette di utilizzare la stessa parametrizzazione
totale per entrambe le simulazioni.
Applichiamo quindi la nostra parametrizzazione alla distribuzione
realizzata senza b-tagging; i risultati sono mostrati in fig. 4.7.
Figura 4.7: Istogramma con fit in assenza di b-tagging. Sono state riportate le
distribuzioni dei fondi combinatori: il fondo dovuto alle combinazioni con due getti b (curva blu) e quello dovuto alle combinazioni
con il getto b sbagliato (curva rossa)
Con questa parametrizzazione il valore della massa Mtop è di 172.4 ± 0.3
GeV/c2 .
39
4.2. PARAMETRIZZAZIONE DEL FONDO
Passiamo ora al fit della distribuzione realizzata utilizzando il btagging e i cui risultati sono mostrati in fig. 4.8.
Figura 4.8: Istogramma con fit in presenza di b-tagging. E’ stata riportata la
distribuzione del fondo combinatorio dovuto alle combinazioni con
il getto b sbagliato (curva rossa)
L’aver utilizzato la stessa parametrizzazione totale per entrambe le curve ci permette di avere una fonte di controllo aggiuntiva sulla bontà
del fit: poichè la componente di fondo dovuta alle combinazioni con due
getti b è assente ci si aspetta che il parametro di scala corrispondente
sia tanto più piccolo quanto meglio la parametrizzazione permette una
buona distinzione tra i due fondi. Il parametro risulta effettivamente
essere pari a 5 ± 2, corrispondente all’1% del restante fondo (caratterizzato da un parametro di scala pari a 363 ± 4).
Con questa parametrizzazione il valore della massa Mtop è di 173.1 ± 0.2
GeV/c2 .
40
4.3. SIMULAZIONE DELLA MISURA
4.3
Simulazione della misura
Vogliamo ora simulare un esperimento con una quantità di eventi analoga a quella disponibile nell’esperimento CDF II, cioè circa 60 eventi,
e confrontare il valore ricostruito per la massa invariante del quark top
con i risultati di una simulazione con grande statistica.
Simuliamo due esperimenti di circa 60 eventi con b-tagging attivo e disattivato.
Figura 4.9: Mtop senza b-tagging
Nella fig. 4.9 si riporta un esempio di risultato ottenuto applicando le
parametrizzazioni precedentemente studiate ad un campione statistico ristretto. Nel caso di un esperimento privo di b-tagging la massa
invariante ricostruita è di 174.5 ± 3.1 GeV/c2 .
41
4.3. SIMULAZIONE DELLA MISURA
Figura 4.10: Mtop con b-tagging
Nella fig. 4.10 si riporta un esempio di risultato ottenuto nel caso di un esperimento che fa utilizzo di b-tagging: la massa invariante
ricostruita è di 173.1 ± 2, 2 GeV/c2 .
Ci si chiede ora se il passaggio da una simulazione con pochi eventi
ad una a grande statistica comporti una distorsione nel risultato ottentuto.
Per effettuare quest’analisi si confronta la stima di Mtop risultante da
una simulazione montecarlo con 40000 eventi e le stime risultanti da
1000 simulazioni da 60 eventi realizzando un istogramma della diffei −M
renza Mtop
top dove Mtop è la stima ottenuta dalla simulazione da
i
40000 eventi (173.1 ± 0.1 GeV/c2 ) e Mtop
la stima della simulazione i-
esima. Eventuali effetti di distorsione saranno messi in evidenza da
uno spostamento del valore centrale dell’istogramma dallo zero.
42
4.3. SIMULAZIONE DELLA MISURA
i
− Mtop in assenza di b-tagging
Figura 4.11: Istogramma della deviazione Mtop
La distribuzione delle deviazioni dal valore stimato Mtop nel caso di
misure compiute senza l’utilizzo del b-tagging è riporta nella fig. 4.11.
La distribuzione è centrata intorno a −0.73 GeV/c2 con RMS 4.22 GeV/c2 .
43
4.3. SIMULAZIONE DELLA MISURA
i
− Mtop in presenza di
Figura 4.12: Istogramma della deviazione Mtop
b-tagging
Nel caso di misure compiute utilizzando il b-tagging la distribuzione
delle deviazioni, mostrata in fig. 4.12, ha valore centrale −0.05 GeV/c2
con RMS 4.35 GeV/c2 .
In entrambi i casi la deviazione dal valore stimato ad alta statistica
è compatibile con la deviazione nulla aspettata, anche se, nel caso in
cui non si fa uso del b-tagging, la presenza del fondo combinatorio aggiuntivo genera un piccolo effetto di sovrastima della massa invariante
ricostruita.
Questo risultato conferma la validità e la coerenza delle parametrizzazioni e delle previsioni sviluppate attraverso le simulazioni ad alta
statistica con l’analisi effettuabile sui risultati di una misura reale.
Occorre sottolineare che benchè i risultati ottenuti con differenti
campioni statistici siano perfettamente coerenti, sia la simulazione ad
alta statistica che la media di molte simulazioni portano ad una stima sistematicamente inferiore al valore vero assegnato alla massa del
44
4.3. SIMULAZIONE DELLA MISURA
quark top che rimane però compreso all’interno di 1σ in ogni simulazione reale.
45
4.4. EFFICIENZA B-TAGGING
4.4
Efficienza b-tagging
L’ultima analisi che si vuole effettuare sui risultati della simulazione
riguarda lo studio dell’effetto di un algoritmo di b-tagging con efficienza
diversa dal 100% sulla stima della massa del quark top.
Saranno considerati due possibili fonti di errore che possano peggiorare l’efficienza dell’algoritmo di b-tagging: la prima fonte è dovuta alla
possibilità che un getto b non venga riconosciuto come tale e quindi non
sia conteggiato nell’analisi dei dati, mentre la seconda fonte di errore
è considera la possibilità che un evento di fondo sia identificato come
getto contenente quark b.
Le efficienze utilizzate per la simulazione corrispondono a quelle indicate nell’articolo di Abulencia et al. [4] per la misura compiuta da CDF II
a Tevatron cioè, per un evento in cui almeno un getto viene riconosciuto
come contenente un quark b, del 60% per il riconoscimento di eventi di
segnale e del 90% per l’abbattimento del fondo.
A partire da questi valori è possibile stimare la probabilità b che ha
un getto b di essere riconosciuto correttamente e la probabilità f che
un evento di fondo possa essere identificato come segnale attraverso un
semplice calcolo.
1 − (1 − b )2 = 0, 6
(4.3)
b = 36, 8%
(1 − f )4 = 0, 9
(4.4)
f = 2, 6%
Con questi livelli di efficienza, le simulazioni non presentano discostamenti apprezzabili dalle stime precedentemente ottenute, tuttavia la simulazione che prende in considerazione l’efficienza reale del b-tagging
può essere utilizzata per una stima accurata dell’effettiva riduzione del
fondo nella misura.
Su una simulazione di 19.822 eventi che hanno superato le condizioni
definite all’inizio del capitolo, il rapporto η tra segnale (7.165 eventi) e
46
4.4. EFFICIENZA B-TAGGING
fondo (8.204 eventi) risulta essere
η=
segnale
= 0, 87
f ondo
(4.5)
che è molto vicino ad 1 (condizione che si avrebbe con un’efficienza di
b-tagging del 100%).
Al contrario, se non si disponesse di alcun sistema di b-tagging il rapporto η risulterebbe uguale a 0, 33.
Il confronto delle misure ottenute mostra come l’utilizzo di un algoritmo di b-tagging presenti il vantaggio di migliorare fortemente il
rapporto tra segnale e fondo che risulta quasi triplicato. Le principali
conseguenze di questo miglioramento sono la possibilità di distinguere
dal fondo anche dei segnali, che altrimenti potrebbero essere parzialmente oscurati, e la riduzione dell’errore sistematico che si commette
nel prendere in considerazione le combinazioni di getti errate.
47
Capitolo 5
Conclusioni
In questa tesi si è affrontato il problema del tracking di particelle cariche all’interno di un rivelatore. Sono stati discussi in dettaglio gli errori
statistici sulla determinazione della quantità di moto di una particella
e sul parametro d’impatto.
Si sono messi in evidenza due importanti fonti di errore nella ricostruzione della traiettoria (errori sistematici dovuti alla conoscenza del rivelatore e scattering multiplo).
Sono state messe in luce le caratteristiche generali che deve possedere
un rivelatore per ottimizzare le misure di posizione e quantità di moto
di una particella cioè disporre di un rivelatore di vertice molto preciso
per consentire un’agevole ricostruzione della traiettoria verso l’origine
(punto di interazione) e di un rivelatore centrale di grandi dimensioni
per sfruttare la dipendenza inversa dell’errore dalla distanza percorsa
all’interno del rivelatore.
E’ stato presentato il problema del b-tagging soffermandosi su una
variabile discriminante, la vita media, che attraverso misure di parametri d’impatto garantisce un’ottima selezione degli eventi permettendo nel contempo una taratura del rivelatore indipendente dalle simulazioni attraverso l’utilizzo di una parte di misure in cui si è certi siano
presenti solo componenti di fondo grazie all’utilizzo della significanza
del parametro d’impatto con segno.
Per ultima cosa, con l’ausilio della simulazione si è mostrato come,
48
attraverso l’utilizzo del b-tagging in una misura di interesse attuale
sia possibile migliorare notevolmente il rapporto tra segnale e fondo
attraverso l’abbattimento di quest’ultimo.
49
Bibliografia
[1] P. Abreu et al., “b-tagging in DELPHI at LEP”, The European
Physical Journal C, Vol.32, pp. 185-208, 2004.
[2] F. Ragusa and L. Rolandi, “Tracking at LHC”, New Journal of
Physics, Vol.9, 2007.
[3] F. Ragusa, “An introduction to charged particles tracking”, Italo
Hellenic School of Physics 2006.
[4] A. Abulencia et al., “Measurement of the top quark mass with the
dynamical likelihood method using lepton plus jets events with b√
tags in p − p collisions at s = 1.96 TeV”, Physical review, Vol.73,
2006.
[5] R.L. Gluckstern, “Uncertainties in track momentum and direction, due to multiple scattering and measurements errors”, Nuclear
Instruments and Methods, Vol.24, pp. 381, 1963.
50