Está en la página 1de 30

Caracterización de las Cargas de trabajo

Contenido

• Representatividad de un modelo de
carga.
• Agrupamiento (clustering).
• Acceso a servidores web.

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


¿Qué se estudiará en la unidad?
En esta unidad se estudiará el tratamiento de las
peticiones al sistema, a fin de crear modelos que
permitan su replicación, para facilitar el
dimensionamiento y posterior evaluación de
rendimiento. Se parte de la definición de los
términos básicos para el desarrollo del tema.
¿Qué es la carga de trabajo?
Workload
Conjunto de las demandas a que está sometido un sistema
informático por su entorno, durante un período de tiempo dado.

Peticiones al Respuestas
sistema del sistema

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Representatividad de la carga
Para las evaluaciones de rendimiento de
un sistema informático, es indispensable
la identificación correcta de la carga de
trabajo, ya que, permitirá ofrecer
resultados fiables

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Tipos de carga de trabajo al evaluar
La carga debe ser representativa del comportamiento del sistema

carga a que se somete un


carga sistema informático
de mientras se realiza una
prueba medición de rendimiento
(test workload)

carga a que se somete carga


un sistema informático
durante su operación
real

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


La carga de trabajo según el aspecto a evaluar
Tres (3)´áreas en las que se pueden realizar las evaluaciones de rendimiento

consumo de recursos
se conocen como del sistema durante la
unidades naturales o de programas, comandos, carga, p.e. uso de CPU,
predicción natural (p.e. peticiones operaciones de disco,
usuarios, clientes) ocupación de
memoria, etc.

recursos
negocio (usuario) funcional (software)
(hardware)

cargas de trabajo

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


¿ Por qué caracterizar la carga de trabajo ?
La carga real de trabajo de un sistema informático usualmente no es repetible, varía con
el tiempo e interacciona con el sistema por lo que resulta difícil reproducirla

se
carga real Modelo
construye

difícil obtener una carga idéntica en un representación de la carga


entorno real real

La caracterización de la carga es la construcción de un modelo que


represente la carga real del sistema informático

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Modelos de carga de trabajo
Un modelo de carga debe ser representativo y compacto
se construyen no usan componentes básicos
Los modelos naturales

Los modelos
artificiales o sintéticos
usando de la carga real de trabajo
componentes modelos ejecutables, p.e.
básicos de la carga benchmarks, que son programas
real o utilizando que cargan al sistema con un
trazas de la trabajo similar al que quieren
ejecución de la reproducir
carga real
modelos no ejecutables que
describen una serie de valores
paramétricos que reproducen el
mismo uso del sistema que la
carga real

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Proceso para caracterizar la carga de trabajo
3-Elección de los
1-Establecimiento 2-Identificación de
parámetros
del objetivo del los componentes
característicos de
estudio de carga básicos de la carga
los componentes

6-Cálculo de los
4-Recolección de 5-Fraccionamiento
parámetros de
datos la carga de trabajo
clase

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Características de los componentes de la
carga de trabajo
1. La intensidad de la carga
2. Las
demandas de
Cantidad de los distintos
Cantidad de tipos de
Frecuencia de procesos o
clientes y
llegada de
tiempo de
trazas de servicios en
trabajos
reflexión
ejecución los distintos
simultáneas recursos

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


¿Qué tomar en consideración al recopilar los
datos para caracterizar la carga?
Identificación de las ventanas temporales en las que se
realizarán las medidas

Seguimiento y medición a las actividades del sistema durante


la ventanas temporales definidas

Asignación de valores a los parámetros de caracterización de


cada componente de la carga

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Fraccionamiento de la carga de trabajo
La carga se divide en clases de trabajos homogéneos

División de la carga de Atributos para


carga de trabajo trabajo en series de fraccionar una
clases con componentes carga de trabajo
homogéneos
• Uso de recursos (tiempo de CPU, tiempo de E/S,…)
La carga es una
• Aplicaciones (MB transmitidos por www, ftp,
colección telnet,…)
heterogénea de • Objetos utilizados (porcentaje de acceso a HTML,
componentes gif, mpeg, pdf, …)
• Situación geográfica de los usuarios
• Características funcionales, unidades
organizacionales, modo de uso…

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


¿Cómo se pueden obtener las clases?
Algunas técnicas recomendadas

Técnicas Utilización de medias

Especificación de la dispersión

Histogramas de uno o múltiples parámetros

Análisis de componentes principales

Modelos markovianos

Agrupamiento (clustering).

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


La técnica que se estudiará para la
caracterización de las cargas de trabajo
es la de agrupamiento, con el uso de
distancias euclidianas
El agrupamiento como técnica para caracterizar
las cargas de trabajo (clustering)
dependiendo que son lo más tiempo de
del propósito similares posibles. procesador
para el que se Una medida de utilizado
haya construido similitud es la cantidad de
el modelo distancia entre los operaciones de
seleccionan

ejemplo
los parámetros se

parámetros por
valores numéricos entrada/salida

trabajos
se agrupan
de un conjunto de
parámetros memoria
(distancia necesaria
euclidiana)

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Agrupamiento por distancias euclidianas
1-Se definen las 2-Se recopilan los datos 3-Se representa cada petición
características por tipo de petición como un punto (centroide)
básicas, de las (cluster) y sus cuyas coordenadas son sus
peticiones al sistema características características

4-Se calculan la
5-Se selecciona 6-Se calculan las
distancia euclidiana 7.Se regresa al punto
la menor coordenadas del nuevo
de cada punto 4, repitiendo hasta
distancia centroide agrupado, como
(centroide) con obtener la cantidad de
euclidiana, para la semi-suma de las
respecto a los cluster que se
agrupar esos coordenadas de los
centroides de los establezcan
centroides centroides que se agrupan
otros cluster

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


¿Cómo se calcula la distancia
euclidiana?
Sean dos puntos A y B, que se les denominará “centroides” cuyas
coordenadas son

𝐴 𝑋𝑎 , 𝑌𝑎 , … . 𝑍𝑎 𝐵(𝑋𝑏 , 𝑌𝑏 , … . 𝑍𝑏 )

𝐷𝑒𝑢𝑐𝑙𝑖𝑑𝑖𝑎𝑛𝑎 = (𝑋𝑎 −𝑋𝑏 ) 2 + (𝑌𝑎 −𝑌𝑏 )2 + ⋯ (𝑍𝑎 −𝑍𝑏 ) 2

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Ejemplo de agrupamiento por distancias euclidianas
Sean los siguientes datos las características promedio para un conjunto de
peticiones de una aplicación web que han sido clasificadas según el tamaño
del documento y la cantidad de accesos que deben realizarse para las
consultas
Promedios
Cantidad de
Tipo documento Tamaño (KB)
accesos
1 1,08 2,45
2 2,18 1,45
3 0,7 2,47
Cluster 4 1,4 2,09
5 0,85 2,41
6 0,6 2,38
7 1,54 1,88
Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Ejemplo de agrupamiento por distancias euclidianas
Acceso a servidores web • En este caso se tratan de documentos
que deben ser procesados por un
Tipos de documentos servidor web, para los que se han
3 definido dos (2) parámetros o
3 1
características: tamaño y cantidad de
Cantidad de accesos

2,5 4
2
6 5 7 accesos.
1,5
2 • Al graficar los datos se encuentran
que son siete (7) cluster representados
1
por cada punto (centroide).
0,5
• Se procede a calcular las distancias
0
0 0,5 1 1,5 2 2,5
euclidianas, por ejemplo para 1-2
Tamaño del documento
euclidiana(1  2)  (1,08  2,18)  (2,45  1,45)  1,49 2 2

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Ejemplo de agrupamiento por distancias euclidianas
Acceso a servidores web
• Se busca la menor distancia y se fusionan esas clases, calculando el centroide de
las clases fusionadas 3-6 como el punto medio de sus coordenadas

Cluster 1 2 3 4 5 6 7
1 0,00 1,49 0,38 0,48 0,23 0,49 0,73
2 0,00 1,80 1,01 1,64 1,83 0,77
3 0,00 0,80 0,16 0,13 1,03
4 0,00 0,64 0,85 0,25
5 0,00 0,25 0,87
6 0,00 1,06
7 0,00

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Ejemplo de agrupamiento por distancias euclidianas
Acceso a servidores web
• La nueva tabla con la fusión de las clases 3 y 6 es:

Promedios Promedios

Cantidad de Cantidad de
Documento Tamaño (KB) Documento Tamaño (KB)
accesos accesos

1 1,08 2,45 1 1,08 2,45


2 2,18 1,45 2 2,18 1,45
3 0,7 2,47 3-6 0,65 2,425
4 1,4 2,09 4 1,4 2,09
5 0,85 2,41 5 0,85 2,41
6 0,6 2,38 7 1,54 1,88
7 1,54 1,88
Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Ejemplo de agrupamiento por distancias euclidianas
Acceso a servidores web
6. Se calculan nuevamente las distancias euclidianas ente cada centroide de un cluster
y los demás centroides, se construye la matriz nuevamente. Se busca la menor
distancia y se fusionan esas clases, calculando el centroide de las clases fusionadas
3-6-5 como el punto medio de sus coordenadas

Cluster 1 2 3-6 4 5 7
1 0,00 1,49 0,43 0,48 0,23 0,73
2 0,00 1,81 1,01 1,64 0,77
3-6 0,00 0,82 0,20 1,04
4 0,00 0,64 0,25
5 0,00 0,87
7 0,00

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Ejemplo de agrupamiento por distancias euclidianas
Acceso a servidores web
• La nueva tabla con la fusión de las clases 3-6 y 5 es:

Promedios Promedios

Cantidad de Cantidad de
Documento Tamaño (KB) Documento Tamaño (KB)
accesos accesos

1 1,08 2,45 1 1,08 2,45


2 2,18 1,45 2 2,18 1,45
3-6 0,65 2,425 3-6-5 0,75 2,4175
4 1,4 2,09 4 1,4 2,09
5 0,85 2,41 7 1,54 1,88
7 1,54 1,88

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Ejemplo de agrupamiento por distancias euclidianas
Acceso a servidores web
• La tabla final luego de realizar las iteraciones quedaría:

Promedios

Cantidad de
Documento Tamaño (KB)
accesos
Promedios
1-3-5-6 0,91 2,43
2 2,18 1,45 Cantidad de
Documento Cluster Tamaño (KB)
4-7 1,47 1,98 accesos

Pequeño 1-3-5-6 0,91 2,43


Mediano 4-7 1,47 1,98
Grande 2 2,18 1,45

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Representación gráfica de los agrupamientos
Dendogramas

Un dendrograma es una gráfico en forma


de árbol que organiza y agrupa los cluster
o grupos según su similitud; en el caso que
estudiado; el criterio de agrupamiento sería
la mínima distancias euclidianas (existen
otros tipos)

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Representación gráfica de los agrupamientos
Dendogramas

Para el caso de las distancias euclidianas, se


representa en dos (2) ejes perpendiculares, en el
vertical se coloca la medida de similitud
(distancia euclidiana) y el eje horizontal los
vecinos más próximos en distancias. Allí se
puede apreciar de forma visual las agrupaciones,
iniciando desde los valores más pequeños.

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Dendograma

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


Ejemplo de agrupamiento por distancias euclidianas
Otras forma de representación gráfica de los parámetros seleccionados

Una de las muchas formas de Características de los documentos


representación gráfica es a través Gráfica radial
Tamaño (KB) Cantidad de accesos
de los gráficos radiales 1
2,5
En los vértices se colocan las 7
2
2
1,5
clases, en este caso los siete (7) 1
cluster correspondientes a los "tipo 0,5
de documento", luego desde el 0

centro se trazan ejes radiales a 6 3

cada vértice, estando graduado


para representar el valor del 5 4
parámetro que se desea referir.

Evaluación y modelado del rendimiento de los sistemas informáticos. Xavier Molero, Pearson Prentice Hall, Madrid 2004

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez


María Carolina Vásquez

Evaluación de Sistemas Informáticos Prof. María Carolina Vásquez

También podría gustarte