Está en la página 1de 37

1-1

DESCRIPCIÓN DE LOS DATOS


DISTRIBUCIONES DE FRECUENCIAS,
REPRESENTACIONES GRÁFICAS,
MEDIDAS DE UBICACIÓN Y MEDIDAS
DE DISPERSIÓN

PATRICIO ORTEGA
1-1

OBJETIVOS

 Organizar los datos en una distribución de frecuencias.


 Presentar datos mediante gráficos de líneas, de barras y circulares.
 Calcular e interpretar la amplitud de variación, la desviación
media, la variancia, y la desviación estándar de los datos
originales.
 Calcular y entender el coeficiente de variación.
2-2

Distribución de frecuencias

 Distribución de frecuencias: agrupamiento de datos en


categorías que muestran el número de observaciones en
cada categoría mutuamente excluyente.

Histograma de NOTAS /50


4

3
Frecuencia

0
25 26 27 28 29 30 31
NOTAS /50
2-4

Distribución de frecuencias
 Marca de clase (punto medio): punto que divide a la clase en
dos partes iguales. Es el promedio entre los límites superior
e inferior de la clase.

 Intervalo de clase: para una distribución de frecuencias que


tiene clases del mismo tamaño, el intervalo de clase se
obtiene restando el límite inferior de una clase del límite
inferior de la siguiente.
2-5

EJEMPLO

 Dr. Tillman es el director de la escuela de


administración y desea determinar cuánto estudian
los alumnos en ella.
Selecciona una muestra aleatoria de 30 estudiantes y
determina el número de horas por semana que estudia
cada uno:
15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5,
20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8,
17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2,
12.9, 27.1, 16.6.
2-6

EJEMPLO
Organice los datos en una distribución de frecuencias.
Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15.
El intervalo de clase es 5 (13 - 8).

Horas de estudio Frecuencia, f


8-12 1
13-17 12
18-22 10
23-27 5
28-32 1
33-37 1
2-7

Sugerencias para elaborar


una distribución de frecuencias

 Los intervalos de clase usados en la distribución de


frecuencias deben ser iguales.

 Determine un intervalo de clase sugerido con la fórmula:

i = (valor más alto - valor más bajo)/número de clases.


2-8

Sugerencias para elaborar


una distribución de frecuencias
 Use el intervalo de clase calculado sugerido para
construir la distribución de frecuencias.

Nota: este es un intervalo de clase sugerido; si el intervalo


de clase calculado es 97, puede ser mejor usar 100.

 Cuente el número de valores en cada clase.


2-9

Distribución de frecuencia relativa


 La frecuencia relativa de una clase se obtiene dividiendo la
frecuencia de clase entre la frecuencia total.

Horas Frecuencia, Frecuencia


f relativa
8-12 1 1/30=.0333

13-17 12 12/30=.400

18-22 10 10/30=.333

23-27 5 5/30=.1667

28-32 1 1/30=.0333

33-37 1 1/30=.0333

TOTAL 30 30/30=1
T
2-12

Presentación gráfica de una


distribución de frecuencias
 Las tres formas de gráficas más usadas son
histogramas, polígonos de frecuencia y distribuciones
de frecuencias acumuladas (ojiva).

 Histograma: gráfica donde las clases se marcan en el


eje horizontal y las frecuencias de clase en el eje
vertical. Las frecuencias de clase se representan por
las alturas de las barras y éstas se trazan adyacentes
entre sí.
2-13

Presentación gráfica de una


distribución de frecuencias
 Un polígono de frecuencias consiste en segmentos de
línea que conectan los puntos formados por el punto
medio de la clase y la frecuencia de clase.

 Una distribución de frecuencias acumulada (ojiva) se usa


para determinar cuántos o qué proporción de los valores
de los datos es menor o mayor que cierto valor.
2-14

Histograma para las horas de estudio

14
12
Frecuencia

10
8
6
4
2
0
10 15 20 25 30 35
Horas de estudio
2-15

Polígono de frecuencias para las horas


de estudio
14
12
10
Frecuencia

8
6
4
2
0
10 15 20 25 30 35
Horas de estudio
2-16

Distribución de frecuencias acumuladas


menor que para las horas de estudio
35
30
25
Frecuencia

20
15
10
5
0
10 15 20 25 30 35
Horas de estudio
2-19

Gráfica de barras para los datos de


desempleados
10000

# desempleados/100 000
8900 8900
8200
8000 7300
6700
5400 Atlanta
6000
Boston
4000 Chicago
Los Angeles
2000 New York
0 Washington
1 2 3 4 5 6
Ciudades
2-22

Gráfica cicular para tipos de zapatos

Asics
Reebok
Otros
Nike
Adidas
Reebok
Adidas Asics
Otros
Nike
3-2

Media de la población
 Para datos no agrupados, la media de la población es la
suma de todos los valores en ella dividida entre el total de
valores en la población:

  X / N
donde µ representa la media de la población.
 N es el número total de elementos en la población.
 X representa cualquier valor en particular.
  indica la operación de sumar.
3-3

EJEMPLO

 Parámetro: una característica de una población.


La familia Kiers posee cuatro carros. Los datos son las
millas recorridas por cada uno:
56 000, 23 000, 42 000 y 73 000. Encuentre el promedio
de millas de los cuatro carros.

Esto es (56 000 + 23 000 + 42 000 + 73 000)/4 = 48 500


3-4

Media de una muestra


 Para datos no agrupados, la media de una muestra es la
suma de todos los valores divididos entre el número total de
los mismos:

X  X / n
 donde X denota la media muestral.
 n es el número total de valores en la muestra.
3-5

EJEMPLO
Una muestra de cinco ejecutivos recibió la siguiente
cantidad en bonos el año pasado:
$14 000, $15 000, $17 000, $16 000 y $15 000.
Encuentre el promedio en bonos para los cinco ejecutivos.

Como estos valores representan la muestra de 5 ejecutivos,


la media de la muestra es:

(14 000 + 15 000 + 17 000 + 16 000 + 15 000) / 5 = $15 400.


3-6

Propiedades de la media aritmética


 Todo conjunto de datos de nivel de intervalo y de nivel de
razón tiene un valor medio.
 Al evaluar la media se incluyen todos los valores.
 Un conjunto de valores sólo tiene una media.
 La cantidad de datos a evaluar rara vez afecta la media.
 La media es la única medida de ubicación donde la suma
de las desviaciones de cada valor con respecto a la media,
siempre es cero.
3-8

Media ponderada

 La media ponderada de un conjunto de números X1, X2,


..., Xn, con las ponderaciones correspondientes w1, w2,
...,wn, se calcula con la fórmula:

Xw  ( w1 X 1  w2 X 2  ...  wn X n ) /( w1  w2  ... wn )
Xw   ( w * X ) / w
3-9

EJEMPLO
 Durante un periodo de una hora en una tarde calurosa de un
sábado, el cantinero Chris sirvió cincuenta bebidas.
Calcule la media ponderada de los precios de las bebidas.
(Precio ($), cantidad vendida):
($0.50, 5), ($0.75, 15), ($0.90, 15), ($1.10, 15).

La media ponderada es: $(.50 x 5 + .75 x 15 + .90 x 15 + 1.10 x


15) / (5 + 15 + 15 + 15) = $43.75/50 = $0.875
3-10

Mediana
 Mediana: es el punto medio de los valores después de
ordenarlos de menor a mayor, o de mayor a menor. La
misma cantidad de valores se encuentra por arriba de la
mediana que por debajo de ella.

Nota: para un conjunto con un número par de números, la


mediana será el promedio aritmético de los dos números
medios.
3-11

EJEMPLO
Calcule la mediana para los siguientes datos.
 La edad de una muestra de cinco estudiantes es: 21, 25,
19, 20 y 22.
Al ordenar los datos de manera ascendente quedan: 19, 20,
21, 22, 25.
La mediana es 21.
 La altura, en pulgadas, de cuatro jugadores de basquetbol
es 76, 73, 80 y 75.
Al ordenar los datos de manera ascendente quedan: 73, 75,
76, 80.
La mediana es 75.5.
3-12

Propiedades de la mediana

 La mediana es única para cada conjunto de datos.


 No se ve afectada por valores muy grandes o muy
pequeños, y por lo tanto es una medida valiosa de
tendencia central cuando ocurren.
 Puede obtenerse para datos de nivel de razón, de
intervalo y ordinal.
 Puede calcularse para una distribución de frecuencias con
una clase de extremo abierto, si la mediana no se
encuentra en una de estas clases.
3-13

Moda
 La moda es el valor de la observación que aparece con
más frecuencia.

EJEMPLO: las calificaciones de un examen de diez


estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87. Como
la calificación 81 es la que más ocurre, la calificación modal
es 81.
EJEMPLO: Talla de calzado
EJEMPLO: Color de ojos
4-3

Desviación media

 Desviación media: media aritmética de los valores


absolutos de las desviaciones respecto a la media
aritmética.

XX
MD 
n
4-4

EJEMPLO

 Los pesos de una muestra de cajas con libros en una


librería son (en lb) 103, 97, 101, 106 y 103.
X = 510/5 = 102 lb
 = 1 + 5 + 1 + 4 + 1 = 12
MD = 12/5 = 2.4
Por lo común los pesos de las cajas están a 2.4 lb del
peso medio de 102 lb.
4-5

Variancia de la población

 La varianza de la población para datos no agrupados es la


media aritmética de las desviaciones cuadráticas respecto
a la media de la población.

( X   ) 2

 
2
N
4-6

EJEMPLO

 Las edades de la familia Dunn son 2, 18, 34, y 42 años.


¿Cuál es la variancia de la población?

  X / N  96 / 4  24

 2  ( X   ) 2 / N  944 / 4  236
4-7

Variancia poblacional

 Una fórmula alternativa para la variancia poblacional


es:

X 2
X 2
 2
 ( )
N N
4-8

Desviación estándar poblacional

 La desviación estándar poblacional () es la raíz


cuadrada de la variancia de la población.

Para el EJEMPLO 2, la desviación estándar poblacional es


15.19 (raíz cuadrada de 230.81).
4-9

Variancia muestral

 La variancia muestral estima la variancia de la


población.

Σ ( X X ) 2
Fórmula conceptual = S 2 =
n 1
( ΣX ) 2
ΣX 2
Fórmula operativa = S 2 = n
n 1
4-15

Interpretación y usos de la deviación


estándar
 Regla empírica: para una distribución de frecuencias
simétrica de campana:

Cerca de 68% de las observaciones estará dentro de ±1 de la


media ().
Cerca de 95% de las observaciones estará dentro de ±2 de la
media ().
Alrededor de 99.7% estará dentro de ±3 de la media ().
Curva en forma de campana que muestra la relación entre  y 

3 2 1  1 2 3


4-17

Dispersión relativa

 El coeficiente de variación es la razón de la desviación


estándar a la media aritmética, expresada como
porcentaje:

s
CV  (100%)
X

También podría gustarte