Está en la página 1de 18

Los Histogramas

➢ El Histograma es una forma de representación


de datos que permite analizar fácilmente el
comportamiento de una población, ya sea
per se, o por medio de una muestra.

➢ Un Histograma se define como un conjunto de


barras horizontales o verticales en las cuales
cada columna representa largo o ancho
proporcional al número de observaciones
realizadas

Histograma simple

✓ Representa los
intervalos de clase
en el eje de abcisas
(eje horizontal) y las
frecuencias relativas,
en el eje de
ordenadas (eje
vertical)

1
Frecuencia acumulada

Histograma de una variable en dos situaciones


distintas.

2
Histograma (cont)

Que obtenemos de un histograma


➢ Muestra grandes cantidades de datos difíciles
de interpretar en una tabla.
➢ Muestra la frecuencia relativa de los datos
➢ Revela el centrado, variación y forma de la
distribución de los datos.
➢ Permite observar de manera inmediata la forma
de la distribución de los datos.
➢ Proporciona información útil para predecir el
comportamiento del proceso.
➢ Permite comparar al proceso con las
necesidades de los clientes.

3
Principios para la construcción de una
distribución de frecuencias
1. Determinación del número de intervalos de
clase.
 Se recomienda entre 5 y 20
 Menos de 50 de 5 a 7
 De 50 a 100 de 6 a 10
 De 100 a 250 de 7 a 12
 Más de 250 de 10 a 20
 Muy pocos  Perdida de información
 Demasiados  Desperdicios blancos

2. Determinación del tamaño de intervalos.


Cant.Mayor Cant.Menor
Longitud de intervalo 
No. intervalos deseados

Principios para la construcción de una


distribución de frecuencias (cont.)

3. Determinación de las fronteras de clase


 El primero y el último intervalo deben contener todos
los datos

 Ningún dato debe coincidir con una frontera

4. Marca de clase

Limite superior  Limite inferior


Marca de Clase 
2

4
Relación de Costo – Beneficio de 25 acciones en
el mercado de valores.

20.5 14.3 17.0


15.4 22.1 11.8
16.9 15.6 9.2
13.4 5.4 12.6
8.8 23.3 9.9
19.5 19.2 28.6
12.7 20.8 18.4
7.8 24.1 16.8
15.9

29  5 24
Longitud de intervalo   4
6 6

9  5.01
Marca de clase   1.995  2.0
2

Marca de clase Fronteras de clase Conteo Frecuencia

7 5.01-9.00 111 3

11 9.01-13.00 11111 5

15 13.01-17.00 11111 111 8

19 17.01-21.00 11111 5

23 21.01-25.00 111 3

27 25.01-29.00 1 1

5
Histograma
valor de acciones en el mercado

10
8
8
frecuencia

6 5 5
Serie1
4 3 3

2 1

0
71 11
2 15
3 19
4 23
5 27
6
valor

Curva de Frecuencia Acumulada

Puede partir de:


- Distribución de Frecuencias
- Frecuencia Relativa
- Distribución de porcentaje

Marca de Clase Frecuencia Frecuencia Acumulada


7 3 3
11 5 8
15 8 16
19 5 21
23 3 24
27 1 00

6
Curva de Frecuencia Acumulada
30
frecuencia acumulada 24 25
25
21
20
16
15 Serie1

10 8

5 3

0
71 11
2 15
3 19
4 23
5 27
6
Marca de clase

Problemas de la
representación de datos
1. Subjetividad en la selección de clases o límites y
fronteras de clase.
2. Comparación entre dos conjuntos de datos.
3. Construcción de gráficas de distribución de
frecuencia con intervalos de clase distintos.
4. Distribución de frecuencias con clases abiertas.
5. Diferencias entre limitantes de clase y fronteras de
clase.

7
MEDIDAS IMPORTANTES EN
LOS HISTOGRAMAS
➢ Medidas de Tendencia
Central
• Media
• Mediana
• Moda
➢ Medidas de Dispersión
• Varianza
• Desviación estándar
➢ Medidas de Forma
• Sesgo
• Curtosis

Medidas de Tendencia Central


➢ Media n

x 1
 i

  16

8
Propiedades de la media
La suma de las desviaciones alrededor de la media es cero

 x    0
n

1
i1

• La suma de los cuadrados de las desviaciones en torno a la


media es un mínimo.
2

 x     Mínimo
n

1
i1

• Se puede emplear para calcular una cantidad total de la


población
TOTAL  n 

n  Tamaño de la población

  Media de la muestra

Mediana

➢ Es la observación que esta en el centro cuando las


observaciones se ordenan en orden creciente.

➢ Si la observación es par, la mediana es el valor medio.

➢ En el ejemplo la mediana ocupa el lugar 13.


5.4 13.4 18.4
7.8 14.3 19.2
8.8 15.4 19.4
9.2 15.6 20.5
9.9 15.9 20.8
11.8 16.8 22.1
12.6 16.9 22.3
12.7 17.0 24.1
28.6

9
Características de la Mediana
➢ Su valor se afecta por el número de observaciones, no
de la magnitud.

➢ Cualquier valor de la muestra tomado al azar es casi


seguro que sea distinto a la mediana.

➢ La suma de las diferencias absolutas en torno a la


mediana es un mínimo.

x
i1
i  Mediana  mínimo

Características de la Moda
Puede o no existir en una muestra
(variables continuas)

Puede existir mas de una Moda

Es la única medida de tendencia central


que se puede usar con datos cualitativos.

10
Moda
➢ El valor que ocurre con mayor frecuencia

Marca de Clase Frecuencia


7 3
11 5
15 8
19 5
24 3
27 1

➢ Relación empírica entre Media, Mediana y


Moda:
MEDIA – MODA = 3 (MEDIA-MEDIANA)

Diversas modas
Distribución sin moda
Distribución unimodal

3.5
10
3
2.5 8
frecuencia

frecuencia

2 6
Serie1
1.5 Serie1
1 4
0.5 2
0
0
1 2 3 4 5 6 7
1 2 3 4 5 6 7
marca de clase
Marca de clase

Distribución bimodal Distribución multimodal

7 10
6
8
Frecuencia

5
frecuencia

4 6
Serie1 Serie1
3 4
2
2
1
0 0
1 2 3 4 5 6 7 1 2 3 4 5 6 7
marca de clase Marca de clase

11
Colocando la Moda para una Relaciones entre la Media (),
distribución de frecuencias Mediana (Md) y Moda (Mo).

La Moda Mo

Md

(a) Distribución Simétrica

Medidas de Dispersión
➢ La VARIANZA de una muestra, dada por el símbolo S 2 y
mide el promedio del cuadrado de las diferencias entre
cada observación.

S 
2
n
x  
i
2

i1 n 1
➢ La DESVIACIÓN ESTÁNDAR es la raíz cuadrada de la
varianza.

n
x  
2

S  i1
i

n 1

12
Regla Empírica: Considerando distribución
normal

2    2

± 1 Contiene 68% de las observaciones


± 2 Contiene 95% de las observaciones
± 3 Contiene casi todas las observaciones

Medidas de Forma
Asimetría

Esta dispersión se mide a través del sesgo.

Cuando la asimetría es a la derecha es positiva y hay


mas probabilidades de obtener resultados por encima de
la media.

Cuando la asimetría es a la izquierda la mayor


incidencia de datos esta por debajo de la media.

13
Formas de simetría de una curva de
distribución de frecuencias

Curva Asimétrica a la Izquierda Curva Asimétrica a la Derecha

Medición del Sesgo (m3):


 x  
n
3
1
m3  i1

n
n n n n

x 3
x  x 
2



2 3
i i i
m3  i1
 i1
   i1 i1

n n n n n n

m3 > 0 Derecha
m3 < 0 Izquierda
m3 = 0 Normal

Aproximación al SESGO:

SESGO 
MEDIA  MODA

MEDIA  MEDIANA  3

DESVIACIÓN ESTANDAR DESVIACIÓN ESTÁNDAR

14
Curtosis ( m4 )
➢ Serefiere a la agudeza o apuntalamiento
de la distribución con relación a la normal:
4

 x  
n

i
m4  i1

n n n
4 x i  xi3 6 xi2
3 x 
    i
4 2 4
x x
m4 i
 i1
 i1
 i1 i

n n n n n n

La Curtosis en el análisis de curvas de


distribución de Frecuencias

Mesocurtica Platicurtica

Leptocurtica

15
Coeficiente de Curtosis (B2)
m
B2  42
m2
Si (B2-3)=0 Normal

Si (B2-3)>0 Leptocúrtica

Si (B2-3)<0 Platicútica

Momentos de una distribución


r x1r  xr2  ....xrn  xr
mr    
n n

m1   media
n
 x  
2

m2  varianza
n

m3  
x  3 sesgo
+ a la derecha

n - a la izquierda

 x  
4

m4  curtosis > 3 leptocúrtica


n
= 3 normal
< 3 platicúrtica

16
Interpretación de los histogramas
➢ Centrado. Estamos dando de más o de
menos.
➢ Variación.- Se encuentra dentro de los
límites.
➢ Forma. ¿Tiene muchos picos? Podría ser
que se están mezclando dos problemas.
➢ Capacidad del Proceso. Cumple esta
distribución con las exigencias del
mercado o de la norma.

Ejemplo
➢ En un proceso químico
para la producción de un
fármaco se usaron dos
reactores, A y B. Los
clientes se han quejado
de que hay mucha
variación en los lotes y
los dueños creen que hay
problemas con algún
reactor, por lo que se
tomaron los siguientes
datos:

17
Tabla de datos de los Reactores
N° Reactor x N° Reactor x N° Reactor x N° Reactor x

1.0 A 84.9 26.0 B 86.2 51.0 B 86.6 76.0 B 85.4

2.0 A 83.8 27.0 B 87.2 52.0 B 87.0 77.0 B 84.6

3.0 B 86.2 28.0 A 83.0 53.0 B 86.7 78.0 A 83.9

4.0 B 85.7 29.0 B 86.3 54.0 A 84.9 79.0 A 83.2

5.0 A 83.9 30.0 A 83.9 55.0 A 83.7 80.0 B 85.7

6.0 B 86.4 31.0 A 83.5 56.0 B 84.7 81.0 B 86.9

7.0 B 86.8 32.0 B 84.1 57.0 A 85.1 82.0 A 84.0

8.0 B 87.0 33.0 B 84.7 58.0 B 85.4 83.0 B 85.7

9.0 A 83.8 34.0 A 85.3 59.0 A 84.4 84.0 A 84.3

10.0 B 86.0 35.0 A 84.5 60.0 A 84.2 85.0 B 86.0


Longitud del Intervalo =
88.5 – 82.5 = 0.5 11.0 B 86.3 36.0 A 84.5 61.0 B 85.8 86.0 A 83.6

12.0 A 83.0 37.0 B 86.2 62.0 A 85.1 87.0 B 86.0


12 13.0 A 83.5 38.0 A 84.1 63.0 A 84.4 88.0 A 83.6

14.0 A 82.7 39.0 A 83.2 64.0 A 83.8 89.0 B 86.5

15.0 B 85.2 40.0 B 86.2 65.0 B 87.0 90.0 B 87.6

16.0 B 86.7 41.0 A 82.9 66.0 B 86.9 91.0 A 84.7

17.0 A 83.1 42.0 A 83.8 67.0 B 85.5 92.0 A 85.1

18.0 B 85.9 43.0 A 83.7 68.0 A 83.7 93.0 A 83.8


Marca de Clase = 19.0 B 87.5 44.0 B 86.6 69.0 B 86.0 94.0 B 86.6

82.51 + 83.00 = 82.75 20.0 A 83.8 45.0 B 85.7 70.0 A 84.5 95.0 B 86.7

21.0 B 87.5 46.0 A 82.9 71.0 B 87.9 96.0 A 84.3


2
22.0 A 84.4 47.0 B 86.9 72.0 A 82.7 97.0 A 83.7

23.0 A 83.4 48.0 B 86.1 73.0 A 84.2 98.0 B 84.9

24.0 A 84.3 49.0 B 86.0 74.0 A 83.9 99.0 B 85.8

25.0 B 86.1 50.0 A 83.8 75.0 B 85.5 100.0 A 84.1

84.9 83.0 83.8 84.2 83.9

83.8 83.9 84.9 83.9 83.2

83.9 83.5 83.7 83.4 84.0


REACTOR B

83.8 85.3 85.1 84.3 84.3

86.2 85.9 86.6 84.7 85.4


83.0 84.5 84.4 83.7 84.7

85.7 87.5 85.7 85.4 84.6


83.5 84.5 84.2 82.9 85.1

86.4 86.1 86.9 85.8 85.7


82.7 84.1 85.1 84.5 83.8

86.8 86.2 86.1 87.0 86.9


83.1 83.2 84.4 82.7 84.3
87.0 87.2 86.0 86.9 86.0
83.8 82.9 83.8 83.6 83.7
86.0 86.3 86.6 85.5 86.0
84.4 83.8 83.7 83.6 84.1
86.3 84.1 87.0 86.0 86.6

REACTOR A 85.2 84.7 86.7 85.7 86.7

86.7 86.2 87.9 86.5 84.9

87.5 86.2 85.5 87.6 85.8

18

También podría gustarte