Está en la página 1de 15

Optimizaci

on en la Identificaci
on de Electrones en la
regi
on Forward del detector ATLAS
Reporte Final
Camilo A. Rojas P.

Universidad Antonio Nari


no,
Experimental High Energy Physics Group
(Presentado, 17 de Febrero de 2016)

Resumen
El detector ATLAS del LHC, donde se hacen colisionar dos haces de protones a altas energas, tiene
una regi
on llamada Forward; que se encuentra en los laterales y cercano al haz de protones donde la
configuraci
on para la detecci
on es diferente a la parte central del detector en la cual no se ha podido
obtener una alta eficiencia en la identificacion de los electrones, por lo cual, se realizo una optimizaci
on sobre la eficiencia en la identificacion de electrones sobre esta region del detector, de manera que
realizando una serie de cortes sobre las variables que permiten identificar los electrones en esta regi
on
se puede mejorar la eficiencia en la identificacion. Algunas de estas variables dependen del n
umero de
colisiones que ocurren por evento y pueden afectar la eficiencia medida. Los resultados mostraron una
mejor eficiencia en la identificaci
on en particular para los datos simulados, mientras que para los datos
del detector en el 2015, se debe mejorar la seleccion de electrones usados para medir la eficiencia.
Palabras Claves: Electrones forward, n
umero de vertices primarios (npv), Eficiencia de identificaci
on,
ATLAS, LHC.

1.

Introducci
on

Esencialmente ATLAS tiene un detector interno que logra interactuar con partculas cargadas, registrando as la traza de la particular desde el punto de colision (vertice primario), despues la partcula
dispersada pasa por un calormetro electromagnetico (EMC), donde electrones, positrones y fotones depositan su energa, mientras que las partculas hadronicas lo hacen en un calormetro hadronico posterior
(HC), los muones son detectados en la parte mas externa con un espectrometro muonico y el sistema
magnetico permite curvar la trayectoria de partculas cargadas. Se pueden considerar dos regiones principales de detecci
on en ATLAS; una regi
on central que corresponde a || < 2,5 y una region Forward , que
corresponde a las tapas del detector y cubre 2,5 < || < 4,9 1 . Esta region forward difiere esencialmente de
la parte central, en que no tiene un detector interno que permita asociar una traza a la energa depositada
*
1

carojaspac.cern@gmail.com
es la pseudorapidez, una coordenada espacial que se relaciona con el a
ngulo de dispersi
on, como = ln(tan /2)

Reporte Final - Opt. Electrones Forward

INTRODUCCION

en los calormetros [2]. Por otro lado la resolucion de los calormetros en la region forward es mucho
menor comparado con los calormetros centrales lo cual plantea una gran dificultad en la identificaci
on
de electrones en esta regi
on del detector. Una descripcion mas detallada del funcionamiento del detector
se presenta en la referencia [2].
La region forward del detector tambien se divide en dos partes; un calormetro electromagnetico
(EMEC) en la regi
on 2,5 < || < 3,16 y un calormetro forward mas interno (FCal) que cubre la regi
on
3,1 < || < 4,9, donde la energa y densidad de partculas es muy alto. Este calormetro ayuda considerablemente en la reconstrucci
on de la energa transversal faltante ET y la identificacion y medicion de jets
(partculas hadr
onicas) dispersados en la region forward [3].
En el proyecto se planteo realizar estudios que permitieran optimizar la eficiencia en la detecci
on
de electrones dispersados en la regi
on Forward (electrones forward; angulos bajos de dispersi
on;

2,5 < || < 4,9 0,8 < < 10 ). Este


estudio se ve justificado dado que los electrones forward
pueden estar bajo un espacio de fase que no es accesible con electrones centrales (angulos altos de dispersion; || < 2,5 > 10 ), adicional a esto, este tipo de electrones han sido utilizados para an
alisis
como la obtenci
on del
angulo de mezcla debil [1] y tambien contribuyen en el analisis de calibraci
on del
detector usando canales como el decaimiento del boson Z.
La optimizaci
on de los electrones forward tambien se ve justificada teniendo en cuenta que el LHC
entra en la segunda etapa (LHC Run-II) del proyecto en la cual se espera alcanzar una energa al centro
de masa de 14 TeV, y por tanto las condiciones cinematicas de los electrones que seran detectados pueden
variar con respecto a los an
alisis anteriores. El detector ha tenido algunas modificaciones en su configuracion y se ha incluido una nueva capa de deteccion en la parte mas interna del detector (Innermost B-Layer
IBL) [5], lo cual podra modificar los parametros de identificacion en los electrones.
En estudios anteriores que utilizar
on datos de 2011 y 2012 se establecio que la eficiencia en la identificacion de electrones dependa del n
umero de vertices primarios (npv o pileup)[7], de igual manera este
trabajo se concentra en la optimizaci
on de la eficiencia en la identificacion de los electrones forward en
funcion del pileup manteniendo una buena relacion de se
nal a ruido. Esta optimizacion se hizo mediante
tecnicas multivariadas (usando el paquete TMVA; Toolkit for MultiVariate Analysis) para separaci
on
de variables aplicadas sobre la distribuci
on de algunas variables de identificacion que permitan subir la
eficiencia de identificaci
on.
En la seccion 3.1, se presentan los resultados de la optimizacion en la identificacion de electrones
forward usando una muestra de datos simulados de 2014, y en la seccion 3.2, los resultados obtenidos,
utilizando datos 2015 y datos simulados (MC15). Estos resultados se obtuvieron con pares de electr
on
+
- positron que provienen del decaimiento de un boson Z (Z ee ), cuya reconstruccion de la masa
invariante se hizo mediante el metodo de Tag & Probe (que se explicara brevemente en la seccion 2.2).

Reporte Final - Opt. Electrones Forward

2.

ELECTRONES FORWARD

Electrones Forward

2.1.

Variables de identificaci
on para la regi
on forward

A diferencia de las variables de identificacion en la region central donde se usan variables que esencialmente dependen de la energa depositada y la calidad de la traza asociada, en la region forward la
identificacion de electrones se debe a la diferencia en la forma del deposito de energa en el calormetro
(shower shape), donde los dep
ositos electromagneticos usualmente son mas compactos, empiezan antes
y presentan una densidad de energa mayor y dado que no hay traza no se puede hacer distinci
on entre
electrones y fotones. Para cada celda del calormetro se pueden obtener 7 parametros de identificaci
on.
Las variables se definen en base al promedio aritmetico del CaloCluster : [4]

hxn i =

1
Enorm

Ei xni ,

(1)

{i|Ei >0}

ri = | ( ~xi ~c ) ~s |
i = ( ~xi ~c ) ~s
donde; ri , es la distancia de la celda i-esima (~xi ) desde el eje del deposito (~s) (distancia lateral), y i ,
la distancia de la celda i-esima desde el centro del deposito (~c) a lo largo del eje del deposito (distancia
longitudinal), como se muestra en la figura 1.

Figura 1: Variables de identificacion para el CaloCluster


Las 7 variables de identificaci
on para la region de forward son:
3

Reporte Final - Opt. Electrones Forward

SecondR - hr2 i

ELECTRONES FORWARD

- Se define el segundo momento en r como la media cuadratica de la distancia lateral.

SecondLambda - h2 i
longitudinal.

- Se define el segundo momento en como la media cuadratica de la distancia

CenterLambda - center
del detector sobre el eje.
FracMax - fmax

- Se define como la distancia del centro del deposito desde la parte frontal

- Se define como la fraccion de energa depositada en la celda de mayor energa.

Density - = E/V

- Se define la densidad energetica como la densidad de energa.

Lateral - Lat - Se define Lateral como el segundo momento en r normalizado.


Lat =
Longitudinal - Long

lat2 = hr2 i|r=0 , latmax = hr2 i|r=4 cm

- Se define Longitudinal como el segundo momento en normalizado.

Long =

2.2.

lat2
,
lat2 + latmax

long2
,
long2 + longmax

long2 = h2 i|=0 , longmax = h2 i|=10 cm

M
etodo de Tag & Probe

Para hacer el c
alculo de la eficiencia se necesita una muestra que contenga electrones en todo el rango
de , en especial en la regi
on forward para el presente estudio. Esta muestra debe estar relativamente
limpia de ruido en el caso de usar una muestra de datos; para lograr esto, se debe usar un metodo que
genere una muestra de electrones, como el metodo de Tag & Probe. Este metodo basicamente usa un
canal de decaimiento que genere un par electron - positron y reconstruye la masa invariante dielectrica a
partir de su momentum transversal, por lo cual se pueden usar los canales de decaimiento; J/P si ee+
o Z ee+ , este u
ltimo se us
o para el proyecto.
De todo los eventos se selecciona un candidato a electron que sea detectado en la region central y con
algunos criterios de identificaci
on, al cual se le asocia un segundo electron que se usa para la medida de
la eficiencia, en este caso en la regi
on forward, adicional a otros parametros de identificacion. El primero
se considera el electr
on Tag y el segundo, el electron Probe (de prueba), juntos deben reconstruir la
masa invariante dielectrica del Z (Mee ). Cada combinacion posible de electrones tipo Tag y tipo Probe en
un mismo evento debe ser considerado. De esta manera, el par seleccionado tiene una alta probabilidad
de ser realmente un par de electrones de un decaimiento Z [7].
Los criterios de selecci
on durante el proyecto para el metodo de Tag & Probe en el marco de los
electrones forward fueron:
Al menos un vertice primario con al menos 3 trazas
Electrones candidatos con PT > 20 GeV,
4

Reporte Final - Opt. Electrones Forward

DE LA IDENTIFICACION

OPTIMIZACION

Electrones tipo Tag con; PT > 20 GeV, || < 2,47, identificacion con corte Tight
Electrones Tag en la regi
on crack (1,37 < || < 1,52) se excluyen
Electrones tipo Probe con: PT > 25 GeV, and || region forward
Masa invariante dielectrica: 66 < Mee < 116 GeV

3.

Optimizaci
on de la Identificaci
on

Para el trabajo de optimizaci


on se uso el paquete de TMVA (Toolkit MultiVariate Analysis), que viene
como una herramienta en el marco inform
atico para analisis de datos ROOT. TMVA dispone de distintos
metodos de optimizaci
on que permiten separar una variable de otras en un conjunto de datos. Para el
proyecto se utiliz
o el metodo de cortes rectangulares, que en realidad no es un metodo multivariado si no
uno univariado que se aplica varias veces sobre la variable a optimizar [6].
TMVA desarrolla autom
aticamente la optimizacion generando el valor de corte en la variable, dado un
valor de eficiencia para se
nal y maximizando el rechazo de ruido. El programa debe recibir una muestra
de se
nal y de ruido, ya sea que tenga cortes o no en las variables, para hacer el calculo de la optimizaci
on [6].
Las variables que se optimizaron para la identificacion de electrones retrodispersados, son Lateral y
Longitudinal, las cuales tienen una dependencia con el n
umero de vertices primarios (como se mencion
o
en la introducci
on), de manera tal que la identificacion no se vea afectada en gran medida por el valor de
corte en las variables de identificaci
on y tener as una eficiencia relativamente constante.

Figura 2: Eficiencia de identificaci


on usando el menu inicial sin optimizar, (a, izquierda) se
nal y (b,
derecha) ruido
La optimizaci
on se hizo sobre muestras de MC14 y datos 2015, y se optimizo por separado la regi
on
de EMEC y FCal. Tambien se optimiz
o por separado el n
umero de vertices primarios (pileup) donde se
establecio distintos intervalos y se optimiz
o sobre cada nivel de identificacion (Loose, Medium, Tight), los
cuales permiten tener una identificaci
on con ajuste mayor o menor, mediante los cortes en las ID variables.

Reporte Final - Opt. Electrones Forward

DE LA IDENTIFICACION

OPTIMIZACION

La eficiencia global de identificaci


on que resulta con los cortes obtenidos en los analisis anteriores
usando datos 2012, se muestra en las gr
aficas (2.a) se
nal y (2.b) ruido:

3.1.

Optimizaci
on MC14

Los eventos en las muestras de MonteCarlo fueron simuladas con ParticleGenerator y Pythia8. Las
muestras que se utilizaron para la optimizacion son datos a 13 TeV con electrones en la region forward
para la se
nal y jets (partculas hadr
onicas) para el ruido, con una configuracion asimetrica sobre la coordenada cilndrica phi (). Se tom
o esta configuracion dado que al analizar la eficiencia de identificaci
on
con las distintas configuraciones, no presentaban gran diferencia entre ellas.

Figura 3: Distribuci
on del pileup; (a, izquierda) 4 intervalos, (b, derecha) 5 intervalos

Figura 4: Eficiencia de la identificaci


on tras la optimizacion en mc14 con 4 intervalos en el pileup; (a,
izquierda) se
nal y (b, derecha) ruido
Otro parametro que se revis
o fue la division del rango sobre el n
umero de vertices primarios (pileup).
Se observo que los cortes sobre las variables de identificacion se realizan sobre 4 intervalos que cubren
toda la distribuci
on del pileup. Esta distribucion tiene una forma de campana y el u
ltimo intervalo cubre
tanto el pico como la cola derecha (como se muestra en la graf. 3.a), lo cual no es conveniente, por lo
6

Reporte Final - Opt. Electrones Forward

DE LA IDENTIFICACION

OPTIMIZACION

que se presenta una propuesta de cambiar el n


umero de divisiones a 5 intervalos que cubran de manera
independiente las colas y el pico. Para mantener la optimizacion de las otras variables se dividio el u
ltimo
intervalo en dos como se muestra en la gr
afica (3.b).
Sobre las muestras de MC14 se realizaron distintas optimizaciones. Inicialmente se ejecuto sobre 500
files de la muestra y se hizo la optimizaci
on a container level (sin hacer cortes en las variables de identificacion), se obtuvieron cortes para distintos niveles de eficiencia. Finalmente se hizo la optimizaci
on
sobre 2000 files de la muestra tomando los cortes optimizados asociados a un nivel de eficiencia de 95 %,
usando los cortes en las variables para los archivos de entrada del codigo TMVA.

Figura 5: Eficiencia de la identificaci


on tras la optimizacion en mc14 con 5 intervalos en el pileup; (a,
izquierda) se
nal y (b, derecha) ruido
Como se muestra en la gr
afica (4.a), la eficiencia para la se
nal se encuentra por debajo de 85 % y para
el caso de Loose y Medium se mantiene relativamente constante pero para Tight la eficiencia baja considerablemente y no se mantiene constante en funcion del pileup. Sin embargo para el caso del rechazo de
ruido (Background rejection, gr
afica 4.b) la eficiencia baja considerablemente y se estabiliza, de manera
que se obtiene una mejor relaci
on de se
nal a ruido, como se muestra en la grafica 6 y en la tabla 2, en los
anexos.
Los resultados de la optimizaci
on para el caso de usar los 5 intervalos en la distribucion del pileup se
presentan en las gr
aficas (5.a,b). Los cortes obtenidos para las variables optimizadas; Lateral y Longitudinal se presentan en la Tabla 1 en el anexo A, las demas variables mantuvieron el mismo valor de corte
en el cuarto y quinto intervalo. La relaci
on de se
nal a ruido para el caso de 5 intervalos tambien es mejor
en comparacion con la configuraci
on antes de la optimizacion.
Dado que la eficiencia en la se
nal tiene muy poco margen para subir y tiene una cada incluso tras
la optimizacion. Se analiz
o la eficiencia en funcion del pileup por cada variables enmascarando una de ellas.
Como se puede ver en las gr
aficas (7.a,b,c), s se enmascara (omitir los cortes de identificaci
on sobre
esta variable) la variable Lateral, la eficiencia de identificacion sube considerablemente, esto sucede solo
7

Reporte Final - Opt. Electrones Forward

DE LA IDENTIFICACION

OPTIMIZACION

Figura 6: Relaci
on se
nal a ruido tras la optimizacion en mc14 con 4 intervalos en el pileup (a, izquierda)
y 5 intervalos en el pileup (b, derecha)

Figura 7: Eficiencia de la identificaci


on con analisis de enmascarado por variable. (a), izquierda - arriba:
loose, (b), derecha - arriba: medium y (c), abajo: tight
en este caso; tanto con la se
nal como con el ruido, de manera que sin hacer cortes en Lateral se puede

Reporte Final - Opt. Electrones Forward

DE LA IDENTIFICACION

OPTIMIZACION

subir la eficiencia, incluso por encima del men


u inicial antes de optimizar.

Figura 8: Gr
afica 2D de densidad de entradas, para cada una de las variables de identificaci
on
Otro analisis que puede afectar los resultados en la eficiencia de la identificacion es la dependencia
con el pileup de variables de identificaci
on adicional a las dos variables que se optimizaron. Se hizo un
grafico 2D que muestra la densidad de entradas en funcion del valor de la variable y el n
umero de verti9

Reporte Final - Opt. Electrones Forward

DE LA IDENTIFICACION

OPTIMIZACION

ces primarios, para as ajustar a un perfil linear. Los resultados que se muestran en las graficas (8.a-f),
corresponden a la regi
on de FCal, aplicando la identificacion Tight.
En las graficas de correlaci
on se hizo el ajuste lineal de perfil entre 6 y 22 npv, y tomando la relaci
on
porcentual entre la pendiente y el rango total de la variable se observa que las variables con mayor
dependencia en el pileup son Lateral, Longitudinal y SecondLambda.

3.2.

Optimizaci
on data 2015 y MC15

Para el caso de datos 2015 tambien se uso la metodologa de Tag & Probe, tomando los electrones tipo
Probe en la regi
on forward, sin embargo en este caso se usaron las mismas muestras para modelar tanto
la se
nal como el ruido haciendo una ventana en la reconstruccion de la masa invariante de manera que
la se
nal se ajusta a los eventos que reconstruyen la masa invariante del Z entre 80 y 100 MeV y el resto
para modelar el ruido. Los par
ametros de seleccion son los mismos que se indicaron en la seccion 2.2, con
diferencia en la reconstrucci
on de la masa invariante dielectrica para la se
nal y para el ruido:
selecci
on - se
nal: Masa invariante: 80 < Mee < 100 GeV.
selecci
on inversa - ruido: Masa invariante: Mee < 80 GeV || 100 GeV < Mee .
Para el caso de los datos simulados, solo se tomo muestras de MC15 de se
nal, dado que no se pudo
obtener una muestra apropiada de MC15 que modelara el ruido. Las muestras utilizadas corresponden a
13 TeV:
Al igual que en el caso de las muestras de MC14 tambien existe una division en 4 intervalos sobre
la distribucion del pileup como se muestra en la grafica (9.a). Tambien se presenta una propuesta para
cubrir la distribuci
on del n
umero de vertices primarios con 5 intervalos, como se muestra en la grafica (9.b).

Figura 9: Distribuci
on del pileup para la muestra de datos 2015 ; (a, izquierda) 4 intervalos y (b, derecha)
5 intervalos
La eficiencia global en la identificaci
on sobre las muestras de datos, tras la optimizacion es mucho mas

10

Reporte Final - Opt. Electrones Forward

DE LA IDENTIFICACION

OPTIMIZACION

baja en comparaci
on con las obtenidas para las muestras de MC14, esto se debe a que las muestras de
datos no logran modelar la se
nal de manera clara y limpia de ruido, como se observa en la distribuci
on
de las variables de identificaci
on Lateral y Longitudinal. En la grafica se puede observar que a
un la distribucion sigue contaminada con ruido (graficas 10.a-d).

Figura 10: Distribuci


on de las variables Lateral y Longitudinal, comparando se
nal y ruido. (a, izq - arriba)
Lateral EMEC, (b, der - arriba) Lateral FCAL, (c, izq - abajo) Longitudinal EMEC y (d, der - abajo)
Longitudinal FCAL
Las graficas que muestran la eficiencia de identificacion para se
nal y ruido sobre las muestras de datos,
se presentan en las figuras (11.a,b), mientras la relacion de se
nal a ruido se muestra en la grafica (13),
donde se observa que la relaci
on baja considerablemente para cada intervalo. Los cortes obtenidos para
Lateral y Longitudinal tras la optimizaci
on se presentan en la Tabla 1, en los anexos.
Los resultados obtenidos para la eficiencia sobre la muestra de MC15, se muestra en la grafica (12),
donde se observa que la eficiencia es mas alta que en el caso de los datos.

11

Reporte Final - Opt. Electrones Forward

DE LA IDENTIFICACION

OPTIMIZACION

Figura 11: Eficiencia de la identificaci


on tras la optimizacion en datos 2015; (a, izquierda) se
nal y (b,
derecha) ruido

Figura 12: Eficiencia de la identificacion tras la optimizacion en datos 2015 sobre MC15

Figura 13: Relacion se


nal a ruido tras la optimizacion en datos 2015

12

Reporte Final - Opt. Electrones Forward

4.

CONCLUSIONES

Conclusiones
Como resultado de la optimizaci
on se obtuvieron cortes en las variables Lateral y Longitudinal que
permiten tener una mejor relaci
on de se
nal a ruido en comparacion con los cortes usados en 2012.
La eficiencia obtenida para las muestras de datos 2015 muestran una considerable subida con respecto a la identificaci
on antes de la optimizacion, sin embargo es posible que se deba mas a la selecci
on
para la se
nal y el ruido que a la optimizacion
Para el caso de los datos simulados MC14 la eficiencia se ve afectada en gran medida por los cortes en
Lateral, sin importar si estan o no optimizados, de manera que se debe revisar como se implementa
esta variable en el codigo de selecci
on.
Se debe considerar hacer una optimizacion considerando las demas variables de identificaci
on, en
particular SecondLambda que tiene gran dependencia con el pileup, como se mostro en la secci
on 3.1.
en las graficas de correlaci
on. Adicional a esto se debe considerar usar otros metodos de optimizaci
on
en TMVA.
Para mejorar la eficiencia en la identificacion sobre los datos 2015 se debe poder modelar de manera
muy precisa el ruido para poder ajustarlo a los datos y restarlo en su totalidad de la se
nal de manera
que se obtenga una mejor optimizacion.

13

Reporte Final - Opt. Electrones Forward

REFERENCIAS

Referencias
[1] Measurement of the forward-backward asymmetry of Z/ bosons decaying into electron and muon

pairs with the ATLAS detector at s = 7 TeV. Technical Report ATLAS-CONF-2013-043, CERN,
Geneva, Apr 2013.
[2] The ATLAS Collaboration. The atlas experiment at the cern large hadron collider. Journal of
Instrumentation, 3(08):S08003, 2008.
[3] Dag Gillberg and the ATLAS Liquid Argon Calorimeter Group. Performance of the atlas forward
calorimeters in first lhc data. Journal of Physics: Conference Series, 293(1):012041, 2011.
[4] Sven Menke. Calo cluster moments, June 2012.
[5] H. Pernegger. The pixel detector of the atlas experiment for lhc run-2. Journal of Instrumentation,
10(06):C06012, 2015.
[6] Frederik Tegenfeldt. TMVA - Toolkit for multivariate data analysis with ROOT. PHYSTAT-LHC
2007. Jun 2007.
[7] C Zimmermann. Optimized electron identification with the forward calorimeters of the ATLAS detector for the 2012 data. Technical Report ATL-COM-PHYS-2013-1589, CERN, Geneva, Dec 2013.

14

Reporte Final - Opt. Electrones Forward

TABLA DE CORTES OPTIMIZADOS

ANEXOS
A.

Tabla de cortes optimizados


Cuadro 1: Cortes optimizados para Lateral y Longitudinal

Cuadro 2: cociente entre la eficiencia de la se


nal con el ruido para cada intervalo, antes y desp
ues de la
optimizacion. 4 intervalos (izquierda), 5 intervalos (derecha)

15

También podría gustarte