Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Recogida de datos.
Análisis de datos.
Obtención de conclusiones.
Conceptos de Estadística
Población
Una p o b l a c i ó n es el conjunto de todos los elementos a los que se somete a un estudio estadístico.
Individuo
Muestra
Muestreo
El m u e s t r e o es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa
de la población.
Valor
Un v a l o r es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una
moneda al aire 5 veces obtenemos dos valores: cara y cruz.
Dato
Un d a t o es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al
aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
Variables estadísticas
Variable cualitativa
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable cuantitativa
Variable discreta
Variable continua
Tipos de frecuencia
Frecuencia absoluta
Se representa por f i .
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
Frecuencia relativa
Frecuencia acumulada
La f r e c u e n c i a a c u m u l a d a es la s u m a d e l a s f r e c u e n c i a s a b s o l u t a s de todos los v a l o r e s
i n f e r i o r e s o i g u a l e s al v a l o r considerado.
Se representa por F i .
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el
recuento y en la tercera anotamos la frecuencia absoluta.
xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032
28 II 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
34 I 1 31 0.032 1
31 1
La d i s t r i b u c i ó n d e f r e c u e n c i a s a g r u p a d a s o t a b l a c o n d a t o s a g r u p a d o s se emplea si las
v a r i a b l e s toman un n ú m e r o g r a n d e d e v a l o r e s o la v a r i a b l e e s c o n t i n u a .
Se a g r u p a n los v a l o r e s en i n t e r v a l o s que tengan la m i s m a a m p l i t u d denominados c l a s e s . A cada
c l a s e se le asigna su f r e c u e n c i a c o r r e s p o n d i e n t e .
Límites de la clase
Amplitud de la clase
La a m p l i t u d d e l a c l a s e es la d i f e r e n c i a entre el l í m i t e s u p e r i o r e i n f e r i o r de la c l a s e .
Marca de clase
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32,
35, 28, 38, 41, 48, 15, 32, 13.
1º se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de
intervalos de queramos poner.
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite
superior no pertenece intervalo, se cuenta en el siguiente intervalo.
ci fi Fi ni Ni
40 1
Diagrama de sectores
Ejemplo
En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica
ningún deporte.
Alumnos Ángulo
Baloncesto 12 144°
Natación 3 36°
Fútbol 9 108°
Total 30 360°
Diagrama de barras
Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguíneo ha dado el
siguiente resultado:
Grupo
fi
sanguíneo
A 6
B 4
AB 1
0 9
20
Histograma
Ejemplo
ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
65
Histograma de frecuencias acumuladas
Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas pr un
grupo de 50 alumnos.
fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
También se puede realizar trazando los p u n t o s que representan las f r e c u e n c i a s y uniéndolos mediante
segmentos.
Ejemplo
Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:
Hora Temperatura
6 7º
9 12°
12 14°
15 11°
18 12°
21 10°
24 8°
ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
65
Polígono de frecuencias acumuladas
La m o d a es el v a l o r que tiene m a y o r f r e c u e n c i a a b s o l u t a .
Se representa por M o .
H a l l a r la m o d a de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 M o = 4
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9M o = 1 , 5 , 9
2, 2, 3, 3, 6, 6, 9, 9
0, 1, 3, 3, 5, 5, 7, 8M o = 4
a i es la amplitud de la clase.
fi
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
Mediana
La m e d i a n a se representa por M e .
Cálculo de la mediana
1 O r d e n a m o s los d a t o s de m e n o r a m a y o r .
2, 3, 4, 4, 5, 5, 5, 6, 6M e = 5
a i es la amplitud de la clase.
La m e d i a n a es i n d e p e n d i e n t e de las a m p l i t u d e s de los i n t e r v a l o s .
Ejemplo
fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
100
100 / 2 = 50
es el símbolo de la m e d i a a r i t m é t i c a .
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. C a l c u l a l a
puntuación media.
xi fi xi · fi
[10, 20) 15 1 15
[30,40) 35 10 350
[50, 60 55 8 440
[60,70) 65 4 260
42 1 820
Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
2 La m e d i a a r i t m é t i c a de los c u a d r a d o s de las d e s v i a c i o n e s de los valores de la variable con respecto a
un n ú m e r o cualquiera se hace m í n i m a cuando dicho n ú m e r o coincide con la m e d i a a r i t m é t i c a .
2 La m e d i a es i n d e p e n d i e n t e de las a m p l i t u d e s de los i n t e r v a l o s .
Cuartiles
Q 2 coincide con la m e d i a n a .
1 O r d e n a m o s los d a t o s de m e n o r a m a y o r .
2, 5, 3, 6, 7, 4, 9
Número par de datos
2, 5, 3, 4, 6, 7, 1, 9
Ejercicio de cuartiles
C a l c u l a r l o s c u a r t i l e s de la distribución de la tabla:
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Deciles
Los d e c i l e s dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
Ejercicio de deciles
C a l c u l a r l o s d e c i l e s de la distribución de la tabla:
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Percentiles
Los p e r c e n t i l e s dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
C a l c u l a r e l p e r c e n t i l 3 5 y 6 0 de la distribución de la tabla:
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Percentil 35
Percentil 60
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética.
Di = x - x
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
Ejemplo
9, 3, 8, 8, 9, 8, 9, 18
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:
Ejemplo
xi fi xi · fi |x - x| |x - x| · fi
21 457.5 98.57
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución
estadística.
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las
anteriores.
Ejercicios de varianza
9, 3, 8, 8, 9, 8, 9, 18
xi fi xi · fi xi2 · fi
42 1 820 88 050
Propiedades de la varianza
1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de
dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la
varianza total.
1 La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2 En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al
cuadrado.
Desviación típica
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
9, 3, 8, 8, 9, 8, 9, 18
Calcular la desviación típica de la distribución de la tabla:
xi fi xi · fi xi2 · fi
42 1 820 88 050
1 La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la desviación típica no varía.
3 Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho
número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede
calcular la desviación típica total.
1 La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas.
2 En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica.
3 Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media.
Coeficiente de variación
El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que sus
medias sean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí.
Ejercicio
Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?
La primera distribución presenta mayor dispersión.
Puntuaciones típicas
Puntuaciones diferenciales
Las puntuaciones diferenciales resultan de restarles a las puntuaciones directas la media aritmética.
xi = X i − X
Puntuaciones típicas
Las puntuaciones típicas son el resultado de dividir las puntuaciones diferenciales entre la desviación típica. Este
proceso se llama tipificación.
Las puntuaciones típicas son adimensionales, es decir, son independientes de las unidades utilizadas.
Las puntuaciones típicas se utilizan para comparar las puntuaciones obtenidas en distintas distribuciones.
Ejemplo
En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 54.4 kg. Las
desviaciones típicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de José es de 70 kg y el de Ana es
65 kg. ¿Cuál de ellos puede, dentro del grupo de alumnos de su sexo, considerarse más grueso?