Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Variable : Es la característica de una población que presenta valores diferentes cuando son
observados o medidos, a través del tiempo
Ejemplos : La vida útil en años de un computador
El número de supermercados en una ciudad
El estado civil de las personas
Parámetro : Es una medida que se obtiene de las observaciones de los elementos de una
población
Estadístico : Es una medida que se obtiene de las observaciones de los elementos de una
muestra
Variables
Ejemplo : Encuesta realizada a 120 alumnos de primer año sobre su deporte favorito
Deporte fi
Atletismo 28
Ciclismo 24
Football 43
Rugby 12
Volley-ball 13
Total 120
Re corrido R
Amplitud ( i ) = N º de clases =
K
6. Límites reales de clase ( Lri – Lrs ) : Como los verdaderos valores de los datos a
veces suelen aproximarse es necesario este tipo de límite, que se obtiene calculando
el promedio entre el límite superior de una clase y el límite inferior de la clase
siguiente.
ra
11. Frecuencia relativa acumulada de clase ( f i ) : Indica el grado de importancia de
cada frecuencia acumulada de clase, referida a la muestra realizada. Se obtiene al
dividir la frecuencia acumulada de clase por el número total de datos :
fi fi
f i ra , en forma fraccional ; f i ra · 100 , en forma porcentual
N N
Ejercicio
i) Determinar : a) 10 intervalos
b) límites de clase
c) marcas de clase
d) frecuencias de clase
e) frecuencias acumuladas “ menor que ”
f) frecuencias relativas en porcentaje
g) frecuencias relativas acumuladas en porcentaje “ mayor que ”
i Li - Ls xi fi fi a < fi a > fi r f i ra
ii) a) 2 b) 29 c) 42,5 % d) 13
MEDIA ARITMÉTICA
x1 x 2 x n n
x
Media muestral: x i ; n tamaño de la muestra
n i 1 n
x1 x 2 x n n
x
Media poblacional: i ; N tamaño de la población
N i 1 N
Ejemplo: Calcular la media aritmética de los siguientes datos relacionados con las notas de
test en Estadística obtenidas por un cierto alumno:
45,80,56,35,25,90
45 80 56 35 25 90
x 55,17 55 , por lo tanto el promedio de test es de 55 puntos.
6
x1 f i x 2 f 2 x k f k k
x f
x i i
f1 f 2 f k i 1 n
Ejemplo: Calcular la media aritmética para el peso de 40 trabajadores, según tabla adjunta:
Peso (Kg) xi fi xi f i
55-62 58,5 5 292,5
63-70 66,5 15 997,5
71-78 74,5 12 894
79-86 82,5 5 412,5
87-94 90,5 2 271,5
Total 40 2868
5
xi f i 2868
x 71,7 72 ; el peso promedio de los 40 trabajadores es de 72 Kilos.
i 1 n 40
x : x1 x 2 x 3 x n
valores : a a a a
a a a a na
x a
n n
Propiedad 2: La media aritmética de una variable más una constante es igual a la media
aritmética de la variable más la constante.
x : x1 x2 x3 xn
y : x1 c x2 c x3 c xn c
n
yi
y
i 1 n
x i c
x1 c x2 c xn c
y i 1
n n
x1 x2 x3 xn nc
n
n
xi nc
n
i 1 n
xc
Propiedad 3: La media aritmética de una variable por una constante es igual al producto de
la constante por la media de la variable.
x : x1 x2 x3 xn
xi c x2 c xn c
z
n
c x1 x2 xn
n
cx
MEDIANA
a) Mediana para datos no agrupados: se deben ordenar los datos de forma creciente o
decreciente. Para muestras de un número impar de observaciones, la mediana es el
dato que queda en el centro de dicha ordenación y para muestras con número par de
observaciones la mediana es el promedio de los datos centrales.
Ejemplos:
1) Para muestra con número impar de datos.
Datos:4,7,5,6,3,2,7
Datos ordenados:2,3,4,5,6,7,7 Me 5
n
fi
a
Me Lri 2 i
fi
Duración fi fi a
350-399 4 4
400-449 6 10
450-499 9 19
500-549 20 39
550-599 31 70
600-649 80 150
650-699 42 192
700-749 10 202
750-799 8 210
800-849 2 212
Total 212
n
El intervalo donde se encuentra la Mediana es aquel en el cual: f i a , en este caso
2
n 212
106 fi a 106 150 6to intervalo
2 2
106 70
a 50 Me 599,5 50
80
f i a 70 Me 622 horas
f i 80
Lri 599,5
MODA
1) Datos: 2,4,5,6,7,7,8,7,6 Mo 7
3) Datos: 1,1,3,1,1,2,2,4,2,3,2,5,6 Mo 1 y 2
d1
Mo Lri i
d1 d 2
Donde : Lri límite real inferior del intervalo que contiene a la moda
d1 diferencia entre la frecuencia absoluta del intervalo de la moda y el intervalo anterior
d 2 diferencia entre la frecuencia absoluta del intervalo de la moda y el intervalo posterior
i amplitud del intervalo
Duración fi fi a
350-399 4 4
400-449 6 10
450-499 9 19
500-549 80 99
550-599 31 130
600-649 20 150
650-699 42 192
700-749 10 202
750-799 8 210
800-849 2 212
total 212
71
Mo 499,5 50
Mayor frecuencia.80 71 49
Mo 529,08 horas
d1 80 9 71
d 2 80 31 49
Lri 499,5
a 50
MEDIDAS DE DISPERSIÓN
RANGO
Indica el número de valores que toma la variable. El rango es la diferencia entre el valor
máximo y el valor mínimo de un conjunto de datos.
R x max x min
Si los datos están agrupados en una tabla de frecuencia, el recorrido es la diferencia entre el
límite superior del último intervalo y el límite inferior del primer intervalo.
R Lmax Lmin
Ejemplo:
1) Sea el siguiente conjunto de datos:
12 15 17 23 25 28
x max 28 x min 12 R 28 12 16
x i x
DM i 1
n
Ejemplo: Obtener la desviación media para los datos 5,7,8,10,16
5 7 8 10 16
x 9,2
5
5 9,2 7 9,2 8 9,2 10 9,2 16 9,2
DM
5
15,2
DM
5
DM 3,04
x i x
DM i 1
; donde xi es la marca de clase
n
Ejemplo: determine la desviación media de los siguientes datos agrupados:
Peso (Kg) fi
60-62 5
63-65 18
Para hacer los cálculos 66-68 42 construimos:
69-71 27
Peso (Kg) xi fi
72-74 xi f i 8 xi x x i x f i
60-62 61 5Total 305 100
6,45 32,25
63-65 64 18 1152 3,45 62,10
66-68 67 42 2814 0,45 18,90
69-71 70 27 1890 2,55 68,85
72-74 73 8 584 5,55 44,40
Total 100 6745 226,5
6745
x 67,45 226,5
100 DM 2,265
100
Dos medidas de dispersión que se utilizan con frecuencia y que si toman en consideración
la forma en que se distribuyen los valores son la varianza y su raíz cuadrada, la desviación
estándar. Estas medidas establecen la forma en que los valores fluctúan con respecto a la
media.
VARIANZA
La varianza se define como el promedio aritmético de las diferencias entre cada uno de los
valores del conjunto de datos y al media aritmética del conjunto elevadas al cuadrado.
Su símbolo es S 2 si estamos trabajando con una muestra y 2 si estamos trabajando con
una población.
a) Varianza muestral para datos no agrupados:
n 2
x i x
S
2 i 1
; donde xi representa los datos de la muestra.
n 1
Ejemplo: Determine la varianza del siguiente conjunto de datos:
25 12 23 28 17 15
25 12 23 28 17 15
x 20
6
S2
25 20 2 12 20 2 23 20 2 28 20 2 17 20 2 15 20 2
6 1
196
S2
5
S 39,2 (en unidades al cuadrado)
2
x x fi
2
i
S2 i 1
; donde xi es la marca de clase
n 1
Edades(años) fi
15-20 2
21-26 7
27-32 8
33-38 5
39-44 4
Total 26
Edades(años) xi fi xi f i x i x
2
x i x f i
2
779,0
x 29,96
26
1290,4616
S2 51,618 (en años 2 )
25
DESVIACIÓN TÍPICA O DESVIACIÓN ESTÁNDAR
Es la raíz cuadrada positiva de la varianza. Su símbolo es S si se está trabajando con
una muestra y es si se está trabajando con una población.
a) desviación estándar muestral para datos no agrupados
n
x x
2
i
S i 1
; donde xi representa los datos de la muestra.
n 1
Ejemplo: Para el conjunto de datos 25,12,23,28,17,15 donde se obtuvo que su varianza
era S 2 39,2 tendremos entonces que su desviación estándar es:
S 39,2 6,26 (unidades)
x x f i
2
i
S i 1
; donde xi representa la marca de clase.
n 1
Ejemplo: Para el ejemplo de los datos tabulados sobre las edades de 26 personas se obtuvo
como varianza S 2 51,618; luego su desviación estándar será:
Edades(años) fi
15-20 2
21-26 7
27-32 8
33-38 5
39-44 4
Total 26
CRITERIO DE HOMOGENEIDAD
Una distribución se considera homogenea, si la desviación estándar se encuentra entre la
quinta y la cuarta parte del rango. Si no es así, entonces se considera que la muestra es
heterogénea.
a) Para la muestra de datos: 25,12,23,28,17,15
R 28 12 16 S 6,26
R R
5 , 4 3,2;4,0
S 3,2;4,0
Por lo tanto la muestra es heterogénea
Edades(años) fi
15-20 2
21-26 7
27-32 8
33-38 5
39-44 4
Total 26
R 44 15 29 (años) S 6,26
R R
4 , 5 5,8;7,25
S 5,28;7,25
Observaciones:
1) Cuanto más separados o dispersos estén los datos, es decir, para muestras
heterogéneas, tanto mayores serán el rango, la varianza y la desviación estándar.
2) Si los datos están más concentrados, es decir, para muestras homogéneas, tanto
menores serán el rango, la varianza y la desviación estándar.
3) Si todas las observaciones son iguales (de manera que no haya variación en los
datos), el rango, la varianza y la desviación estándar serán iguales a cero.
EJERCICIOS
1) En una industria dos operarios en 7 días de trabajo, son capaces de producir, por día,
y en forma individual la siguiente cantidad de árboles para fresa de 205 mm de
longitud por 300 mm de diámetro.
Determine:
a) Rango del operario A y del operario B
b) Varianza del operario B
c) Desviación estándar de ambos operarios
d) ¿Son las muestras homogéneas?
2) Se hace una encuesta entre 100 personas acerca del número de horas diarias que se
dedican a ver televisión, obteniéndose la siguiente información.
Nº horas fi
0-1 30
2-3 20
4-5 15
6-7 32
8-9 1
10-11 2
Total 100
5) Las notas de un estudiante en sus certámenes han sido 84,91,72,68,87 y 78. Hallar
la desviación estándar. ¿Son homogéneas las notas?
Estatura fi
1,65-1,69 6
1,70-1,74 12
1,75-1,79 30
1,80-1,84 22
1,85-1,89 8
1,90-1,94 2
Total 80
Obtener las medidas de dispersión (Rango, varianza y desviación estándar) tanto para
los hombres como para las mujeres. Determine además si las muestras son homogéneas
o no.
Solución
a) RA 6 RB 6
b) S A 4,67
2
1)
c) S A 2,16 S B 2,06
d) ambas muestras no son homogéneas
2) S 2 7,19 S 2,68
3) S 0,9
4) S 2 37,67
7)
Medida de dispersión Hombre Mujer
R 39 39
S 2
64,03 67,68
S 8 8,23