Está en la página 1de 115

ESTADISTICA

Objetivo:
- Leer e interpretar información de tablas y gráficos
- Recopilar y comunicar información utilizando los
procedimientos
más adecuados a la característica de lo que se va a informar.
90
80
70
60
50 Este
40 Oeste
30 Norte
20
10
0
1er trim. 2do trim. 3er trim. 4to trim.
Actividad Nº 1
“Información en la vida
diaria”
 Trabajar en grupo, analizando la lámina entregada

a) ¿Qué título tiene la información analizada?


b) ¿De qué se trata la información? Explique
c) Utiliza gráficos o tablas explicativas?
d) Si se utiliza gráficos, ¿Son los más adecuados para
representar la información o utilizaría otro? ¿Por qué?
e) ¿Considera que los gráficos o tablas son necesarios
en una información? ¿Por qué?
f) ¿En qué caso se utiliza un gráfico de barra, lineal o circular?
g) Diseñe nuevamente la información de la lámina, como a
a ustedes les gustaría que apareciera publicada.
¿Qué es Estadística?
Es la ciencia encargada de recoger, clasificar, describir y analizar
datos numéricos que sirvan para deducir conclusiones y tomar
decisiones a partir de estos análisis.
La Estadística se divide en dos grandes
grupos:
 Estadística descriptiva o deductiva:
Se ocupa de la recolección, organización y representación de datos en
forma coherente.
 Estadística inductiva o inferencial:
Se ocupa de interpretar los datos recogidos y obtener conclusiones a
partir de ellas.
¿ Qué es una población?
Población o Universo: Es el conjunto de todos los individuos u
objetos que poseen alguna característica común observable.
Una población puede ser finita o infinita.
Ejemplo:
- La población consistente en la fabricación de refrigeradores, en una empresa
determinada, en un día determinado, es finita.
- La población formada por todos los posibles sucesos (caras o sellos en tiradas
sucesivas de una moneda es infinita.
- La población formada por los Números Naturales es infinito
- La población formada por el número de alumnos de un colegio determinado, en un
año determinado es finito.
¿Qué es una muestra?
Muestra: es un subconjunto de la población. Es una parte de ella.
Se dice que una muestra es representativa de la población, cuando
corresponde más o menos al 20% de ella. Y se pueden deducir importantes
conclusiones acerca de ésta, a partir del análisis de la misma.

Ejemplo:
Población: Padres de los alumnos de un colegio
Muestra: Padres de los alumnos de Décimo año
La muestra se puede elegir en forma aleatoria, estratificada o
mixta
¿Qué es una variable?
Una variable es la característica o atributo a observar.
El conjunto de valores asignados a la variable se llama dato o dominio de la
variable.
Las variables pueden ser continuas o discretas.

Variable continua es aquella que puede tomar cualquier valor


entre dos valores dados, es decir, en un rango determinado.
Ejemplo:
La estatura de los alumnos de un cuarto básico es continua, porque pueden medir
1,40 m 1,42 m 1,408 m etc
Variables discreta son aquellas que toman un valor entero

Ejemplo:
El número de hijos de una familia es discreta, porque puede
haber 1, 2, 3, ....etc. hijos

Ejercicios

 Decir de las variables siguientes cuáles representan datos


discretos o datos continuos.
 Número de fresas vendidas cada día en un mercado.

Respt: Discreta
 Temperaturas registradas cada media hora en un laboratorio.
Respt: Continua

 Período de duración de efecto de inyecciones producidas por una


empresa determinada
Respt: Continua
 Censos anuales del colegio de profesores.
Respt: Discreta
 Número de billetes de 10.000 circulando en CR
Respt: Discreta
 Pulgadas de precipitación de lluvia en una ciudad durante varios meses
del año.
Respt: Continua
 Alumnos matriculados en el CTPBI, en los últimos cinco años.
Respt: Discreta

 Dar el dominio de cada una de las siguientes variables y decir si


son continuas o discretas.
 Número de litros de agua en una máquina de lavar.
Dominio : cualquier valor de cero litros a la capacidad de la
máquina ( 12,3 12,005 12,0047 etc)
Variable : Continua

 Número de libros en un estante de librería.


Dominio : 0, 1, 2, 3, ........ Hasta el mayor número de libros
que puedan entrar en el estante.
Variable : Discreta
 Suma de puntos obtenidos en el lanzamiento de un par
de
dados
Dominio : 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Variable : Discreta
 Tiempo de vuelo de un proyectil
Dominio : De cero en adelante ( 5 5,3 5.045 etc)
Variable : Continua
 Estado civil de un individuo
Dominio : Casado, soltero, viudo
Variable : Discreta
 Velocidad de un automóvil en kilómetros por hora.
Dominio : De 0 en adelante ( 120 120,8 120,04 etc)
Variable : Continua
Distribuciones de frecuencias
Toma de datos: Es la obtención de una colección de los mismos que no han sido
ordenados numéricamente.
Ejemplo: Conjunto de alturas de 100 estudiantes, sacados de una
lista alfabética de una Universidad.

Ordenación: Es una colocación de los datos numéricos tomados,


en orden creciente o decreciente de magnitud.
Ejemplo:
32 , 45, 100, 120 , 145, 186, 198, 200 ( ordenación creciente )
200, 198, 186, 145, 120, 100, 45, 32 ( ordenación decreciente)
Al recoger información se obtiene un gran número de datos,
que conviene presentar en forma resumida en una tabla llamada
distribución de frecuencias.

Frecuencia absoluta: es el número de veces que se


repite un valor de la variable.
Ejemplo:
Los siguientes datos son las calificaciones obtenidas, en la
asignatura de Matemática, por un grupo de 30 alumnos:
7–3–5–4–3–4–5–6–5–7–3–2–6–5–4–6–
3 - 4 – 5 – 2 - 7 – 4 – 5 – 7 – 6 – 5 – 4 – 2 –3 - 1
Variable Estadística Frecuencia absoluta
Calificación Nº de alumnos
1 1
2 3
3 5
4 6
5 7
6 4
7 4
Frecuencia acumulada hasta un valor determinado: es el número
de observaciones menor o igual al valor considerado.
Se obtiene sumando sucesivamente las frecuencias absolutas.

Ejemplo:
Variable estadística Frecuencia absoluta Frecuencia acumulada
Calificación Nº de alumnos -------------
1 1 1

2 3 4
3 5 9
4 6 15
5 7 22
6 4 26
7 4 30
Frecuencia relativa: es el cociente entre la frecuencia absoluta
y el número total de individuos de la muestra

Variable estadística Frecuencia absoluta Frecuencia relativa


Calificación Nº de alumnos -----------
1 1 1 / 30
2 3 3 / 30
3 5 5 / 30
4 6 6 / 30
5 7 7 / 30
6 4 4 / 30
7 4 4 / 30

NOTA: La suma de las frecuencias relativas es igual a 1


Ej. 1 / 30 + 3 / 30 + 5 / 30 + 6 / 30 + 7 / 30 + 4 / 30 + 4 / 30 = 30 / 30
= 1
Frecuencia relativa porcentual: Es la frecuencia
relativa expresada en porcentajes.

Variable estadística Frecuencia absoluta Frecuencia relativa porcentual


Calificación Nº de alumnos -----------
1 1 ( 1 / 30 ) • 100
2 3 ( 3 / 30 ) • 100
3 5 ( 5 / 30 ) • 100
4 6 ( 6 / 30 ) • 100
5 7 ( 7 / 30 ) • 100
6 4 ( 4 / 30 ) • 100
7 4 ( 4 / 30 ) • 100

NOTA: La suma de las frecuencias relativas porcentuales es el


100%
Ejercicios
 Los siguientes datos son las calificaciones de un grupo de 27
alumnos en la asignatura de matemática:
5 6 5 7 4 2 3 5 4 6 7 5 4 6 5 4 5 6
4 3 4 6 7 5 4 5 6
a) Construya una tabla de distribución de frecuencias
b) ¿Cuántos alumnos tienen nota inferior a 5?
c) ¿Qué porcentaje de alumnos tiene nota 4?
d) ¿Cuántos alumnos tiene nota 6?
e) ¿Qué porcentaje de alumnos tiene nota superior o igual a 4?
Respuesta
Calificación frecuencia Frecuencia Frecuencia Frec. relat.
acumulada relativa porcentual
2 1 1 1 / 27 = 0,037 3,7
3 2 3 2 / 27 = 0,074 7,4
4 7 10 7 / 27 = 0,259 25,9
5 8 18 8 / 27 = 0,296 29,6
6 6 24 6 / 27 = 0,222 22,2
7 3 27 3 / 27 = 0,111 11,1

b) 10 alumnos tienen nota inferior a 5,0


c) El 25,9% de los alumnos tiene nota 4,0
d) 6 alumnos tienen nota 6,0
e) El 88,8% de los alumnos tiene nota igual o superior a 4,0
 Una encuesta realizada a alumnos de Cuarto Medio acerca
de su futura profesión, indica lo siguiente:

Variable F. absoluta a) Completar la tabla con frecuencia


profesión Nº de alumnos acumulada, relativa y relativa
Ingeniería 10
porcentual.
Medicina 6
b) ¿Cuántos alumnos fueron encuestados?
Economía 12
c) ¿Cuál es la profesión que tiene mayor
Periodismo 8

Derecho 5
preferencia?
Arquitectura 9
d) ¿Qué porcentaje de alumnos prefiere
Otras 10 arquitectura?
e) ¿Qué porcentaje de alumnos prefiere
medicina?
Respuesta
Profesión Frecuencia F. acumulada F. relativa F. relat. %
Ingeniería 10 10 10 / 60 = 0,166 16,6
Medicina 6 16 6 / 60 = 0,100 10,0
Economía 12 28 12 / 60 = 0,200 20,0
Periodismo 8 36 8 / 60 = 0,133 13,3
Derecho 5 41 5 / 60 = 0,083 8.3
Arquitectura 9 50 9 / 60 = 0,150 15,0
Otros 10 60 10 / 60 = 0,166 16,6

b) 60 alumnos fueron encuestados


c) Economía es la profesión con mayor frecuencia
d) El 15% de los alumnos prefiere Arquitectura
e) El 10% de los alumnos prefiere Medicina
 En una muestra de 40 familias, el número de hijos se
distribuye según la tabla:
a) Completa la tabla con frecuencia
acumulada, relativa y relativa
Variable F. absoluta porcentual.
Nº de hijos Nº de familiasb) ¿Cuántas familias tienen menos de
1 2
4 hijos?
c) ¿Cuántas familias tienen 5 hijos?
2 8
d) ¿Cuál es la frecuencia relativa de las
3 12 familias que tienen 2 hijos?
4 14 e) ¿Qué porcentaje de familias tiene 6
5 3 hijos?
f) ¿Qué fracción representan las familias
6 1
con 2 hijos?
g) ¿Qué fracción representan las familias
con 4 hijos?
Respuesta
Nº hijos Frecuencia F. acumulada F, relativa Frec. Relat. %
1 2 2 2 / 40 = 0,05 5
2 8 10 8 / 40 = 0,20 20
3 12 22 12 / 40 = 0,30 30
4 14 36 14 / 40 = 0,35 35
5 3 39 3 / 40 = 0,075 7,5
6 1 40 1 / 40 = 0,025 2,5

b) 22 familias tienen menos de 4 hijos


c) 3 familias tienen 5 hijos
d) La frecuencia relativa de familias con 2 hijos es de 0,20
e) El 2,5% de las familias tiene 6 hijos
f) 1 / 5 de las familias tienen 2 hijos
g) 7 / 20 de las familias tienen 4 hijos
Medidas de tendencia central en
valores no agrupados.
Son valores representativos de la totalidad de los datos.
Su cálculo permite analizar los datos en torno a un valor
central.

Los valores centrales más usados son:


 Media aritmética o Promedio
 Mediana
Moda.
Media aritmética ( X )

 Media aritmética: corresponde al promedio de los valores.


Se simboliza por X

La media aritmética se obtiene sumando los valores de la variable


dividido por el número total de valores.

En forma General :
X = x1 + x2 + x3 +....xn
n
Ejemplo:
Determinar el promedio de notas de un alumno, en la
asignatura
de Productividad y Calidad.

Las notas son: 3- 5 - 7 - 6 - 4 - 5 - 3 - 5 - 4 - 5 - 3 - 4

X = 3 + 5 + 7 + 6 + 4 +5 + 3 +5 + 4 + 5 + 3 + 4 = 54 = 4,5
12 12

Luego, el promedio de notas del alumno es


4,5
La media aritmética ponderada es otra forma de calcular el
promedio, utilizando la tabla de distribución de frecuencias.
Ejemplo: Se debe multiplicar cada valor con su
Notas Frecuencias frecuencia.
3 3 3 • 3 = 9 4 • 3 = 12 5 • 4 = 20
4 3 6•1=6 7•1=7
5 4 Se suman los productos:
6 1 9 + 12 + 20 + 6 + 7 = 54
7 1
La suma del producto se divide por el
total de datos:
54 : 12 = 4,5
Luego,
X = 4,5
Mediana ( Me )
Es el valor de la variable que deja igual número de valores antes y
después de él en una distribución de frecuencias
Según el número de valores de la variable se distinguen dos casos:
 Si el número de valores es impar, la mediana coincide con el
valor central.
Ejemplo: 5 – 8 – 9 – 11 – 12 – 13 – 15
Luego, la mediana es el 11

NOTA: los valores deben estar ordenados. Puede ser en forma


creciente o decreciente
 Si el número de valores es par, la mediana es el promedio
aritmético de los dos valores centrales.
Ejemplo:
2 – 3 – 5 – 6 – 8 – 9 – 11 – 12

El calculo sería: ( 6 + 8 ) : 2 = 14 : 2 = 7

Luego, la mediana es 7
Moda ( Mo )
Es el valor de la variable que tiene mayor frecuencia
Ejemplo:

Variable F. absoluta La moda es 4 hijos, porque tiene


Nº de hijos Nº de familias mayor frecuencia, que es del 14
1 2 familias.
2 8
3 12
4 14
5 3
6 1
Ejercicios
 Las calificaciones de un estudiante del CTPBI, en seis pruebas,
fueron 84, 91, 72, 68, 87 y 78. Hallar el promedio de sus notas.
Respuesta:
X = 84 + 91 + 72 + 68 + 87 + 78 = 480 = 80
6 6

Luego, el estudiante tiene promedio 80

 Diez medidas de diámetro de un cilindro fueron registradas como:


3,88 4,09 3,92 3,97 4,02 3,95 4,03 3,92 3,98 y 4,06
Respuesta:

X = 3,88 + 4,09 + 3,92 + 3,97 + 4,02 + 3,95 + 4,03 + 3,92 +3,98 +4 ,06
10
= 39,82 = 3,98 Luego, la media aritmética es 3,98
10
Calcular el salario medio semanal de 65 empleados
Salario Frecuencia
$ 55.000 8
$ 65.000 10
$ 75.000 16
$ 85.000 14
$ 95.000 10
$ 105.000 7
Respuesta

Salario ( x) Frecuencia F•X


$ 55.000 8 $ 440.000
$ 65.000 10 $ 650.000
$ 75.000 16 $ 1.200.000
$ 85.000 14 $ 1.190.000
$ 95.000 10 $ 950.000
$ 105.000 7 $ 735.000

X = 440.000 + 650.000+ 1.200.000 + 1.190.000 + 950.000 + 735.000


65
Luego, el sueldo promedio es
= 5.165.000 = 79.461,538 $ 79.461,5
65
 Las calificaciones de un estudiante del CTBI, en seis
pruebas, fueron 84, 91, 72, 68, 87 y 78. Hallar la mediana
de sus calificaciones

Respuesta:
Se deben ordenar las calificaciones: 68 72 78 84 87 91
Luego, la mediana es 78 + 84 = 162 = 81
2 2

 Hallar la moda de los siguientes números: 3, 5, 2, 6, 5, 9, 5,


2, 8.
Respuesta:
La moda es el número 5, ya que su frecuencia es mayor
Representación gráfica de la información
 Gráfico lineal o de segmentos:
Se utiliza especialmente para representar datos numéricos de
situaciones que ocurren en períodos sucesivos.
35
30
25
Temperatura

20
15
10
5
0
Lunes Martes Miércoles Jueves Viernes Sábado Domingo
 Gráfico de Barra: Permite hacer comparaciones mediante
barras paralelas colocadas en forma vertical u horizontal entre dos ejes
perpendiculares.

90
80
70
60
50
40 Matematica
30 Lenguaje
20
10
0
1er 2do 3er 4to
trim. trim. trim. trim.
 Gráfico circular: Consiste en un círculo dividido en sectores que
representan las frecuencias relativas porcentuales de una distribución

Los 360 grados del círculo se dividen proporcionalmente al


porcentaje correspondiente de cada frecuencia.

4to trim.1er trim.


13% 13%
2do trim.
17%

3er trim.
57%

1er trim. 2do trim. 3er trim. 4to trim.


Distribución de frecuencias con datos
agrupados

 Rango: Es la diferencia entre el mayor valor y el


menor de ellos.
Ejemplo:
Si la estatura del alumno más alto de un curso es 1,92 m
y la del menor es 1,68 m, entonces el rango de estos datos es:
1,92 m – 1,68 m = 0,24 m = 24 cm.

 Clases o intervalos: En la ordenación de datos muy


numerosos, es usual presentarlos agrupados y ordenados en
clases o categorías.
Ejemplo:
En un grupo de 50 alumnos se registraron los siguientes
puntajes en una prueba:

61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
79 83 75 67 72 83 83 84 84 67 71 87 80
77 64 77 82 83 85 79 72 83 83 87
Para ordenarlos y agruparlos, se establecen los intervalos
que se usarán, determinando el rango de los datos.
Dato mayor: 88 Dato menor: 61 Rango: 88 – 61 = 27
De acuerdo con el rango y teniendo en cuenta la cantidad de
datos, se forman los intervalos.
Si quisiéramos formar 6 intervalos, se tiene que dividir el rango
con la cantidad deseada.
27 : 6 = 4, 5 se aproxima a 5 ( amplitud aparente del intervalo)

Intervalo de puntajes Frecuencias


60 – 64 5 El intervalo 60 – 64 es un
65 – 69 5 símbolo para representar
70 – 74 8 a la clase respectiva
57 – 79 12 Los valores 60 y 64 son
80 – 84 16 los límites aparentes de
85 – 89 4 la clase.
Los límites reales de una clase se obtienen calculando el
promedio entre el límite aparente superior de una clase y el límite aparente
inferior de la clase siguiente.

Ejemplo: Calcular los límites reales de la clase 70 – 74


Lri = 69  70 =
139
= 69,5 Límite real inferior
2 2
Lrs = 74  75 =
149 = 75,5 Límite real
2 2 superior
 Tamaño o amplitud de una clase: Corresponde a la diferencia
entre su límite real superior y el límite real inferior.
Ejemplo:
75,5 – 69,5 = 5 Su amplitud es igual a 5
NOTA: Todas las clases tienen igual tamaño.
 Marca de clase: Es el punto medio de un intervalo de
clase.

Ejemplo.
Intervalo Marca de clase
60 – 64 62
65 – 69 67
70 – 74 72

 Frecuencia total: Es la suma de las frecuencias absolutas


de todas las clases.
Ejemplo: Frecuencia total
Intervalo Frecuencia
12 + 11 + 10 = 33
1–5 12
6 – 10 11
11 -15 10
Ejercicios
 Dado los siguientes puntajes, determinar:
61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
79 83 75 67 72 83 83 84 84 67 71 87 80
77 64 77 82 83 85 79 72 83 83 87

a) Determinar seis intervalos


b) Determinar el límite real superior e inferior de cada clase
c) Determinar la marca de clase de cada intervalo
d) Determinar la frecuencia absoluta
Respuesta
Se debe determinar el rango: Pje mayor – Pje menor:
88 – 61 = 27
Luego, 27 : 6 = 4,5 se aproxima a 5 la amplitud del intervalo

Intervalo Lri - Lrs Marca de clase Frecuencia


60 – 64 59,5 – 64,5 62 5
65 – 69 64,5 – 69,5 67 5
70 – 74 69,5 – 74,5 72 8
75 – 79 74,5 – 79,5 77 12
80 – 84 79,5 – 84,5 82 16
85 – 89 84,5 – 89,5 87 4
 Ordena los siguientes datos de menor a mayor y calcula
su rango: 3,22 2,92 3,01 4,48 5,06 4,31 2,98 3,07

Respuesta:
Ordenado: 2,92 2,98 3,01 3,07 3,22 4,31 4,48 5,06
Rango: 5,06 – 2,92 = 2,14

 La siguiente distribución de frecuencias corresponde a los


salarios de los empleados de una fábrica:
Salarios ( $ ) Frecuencia
50.000 – 54.999 7

55.000 – 59.999 18
60.000 – 64.999 32
65.000 – 69.999 45
70.000 – 74.999 52
75.000 – 79.999 28
80.000 – 84.999 16
85.000 – 89.999 8
a) Calcula los límites reales del tercer intervalo

Respuesta:
Lri = 59.999 + 60.000 = 59.999,5
2
Lrs = 64.999 + 65.000 = 64.999,5
2
b) Calcula el tamaño de los intervalos
Respuesta: Lrs – Lri = amplitud
64.999,5 - 59.999,5 = 5000
c) Determina el límite aparente inferior del séptimo intervalo
Respuesta:
[80.000 – 84.999] Límite aparente inferior: 80.000
d) Determina el límite real superior del segundo
intervalo
Respuesta:
[55.000 – 59.999] Lrs = 59.999 + 60.000 = 59.999,5
2
e) Escribe en orden la marca de clase
Respuesta:
Salarios ( $ ) Marca de clase
50.000 – 54.999 52.499,5

55.000 – 59.999 57.499,5


60.000 – 64.999 62.499,5
65.000 – 69.999 67.499,5
70.000 – 74.999 72.499,5
75.000 – 79.999 77.499,5
80.000 – 84.999 82.499,5
85.000 – 89.999 87.499,5
f) Determina la frecuencia
acumulada.
Respuesta:
Salarios ( $ ) Frecuencia acum
50.000 – 54.999 7
55.000 – 59.999 25
60.000 – 64.999 57
65.000 – 69.999 102
70.000 – 74.999 154
75.000 – 79.999 182
80.000 – 84.999 198
85.000 – 89.999 206
g) Determinar la frecuencia relativa

Respuesta:
Salarios ( $ ) Frecuencia relativa
50.000 – 54.999 7 / 206 = 0,033
55.000 – 59.999 18 / 206 = 0,087
60.000 – 64.999 32 / 206 = 0,155
65.000 – 69.999 45 / 206 = 0,218
70.000 – 74.999 52 / 206 = 0,252
75.000 – 79.999 28 / 206 = 0,135
80.000 – 84.999 16 / 206 = 0,077
85.000 – 89.999 8 / 206 = 0,038
h) Determinar la frecuencia relativa
porcentual
Respuesta:
Salarios ( $ ) Frecuencia relativa %
50.000 – 54.999 3,3
55.000 – 59.999 8.7
60.000 – 64.999 15,5
65.000 – 69.999 21,8
70.000 – 74.999 25,2
75.000 – 79.999 13,5
80.000 – 84.999 7,7
85.000 – 89.999 3,8
Ejercicio
Después de medir las alturas de 40 alumnos de un curso,
resultaron los siguientes valores de la variable:
154 178 150 166 182 175 163 175 150 162
155 155 161 165 160 159 160 168 165 162
163 155 157 161 162 155 167 164 162 158
158 163 166 167 156 164 170 176 172 160

a) Determina el rango
Respuesta:
182 - 150 = 32
b) Determina 8 intervalos:

Respuesta: El rango es 32. Luego, 32 : 7= 4,5 (5 amplitud )

Intervalo c) Determinar la frecuencia


150 – 154
155 – 159
Respuesta:
160 – 164 Intervalo Frecuencia
165 – 169 150 – 154 4
170 – 174 155 – 159 8
175 – 179 160 – 164 14
180 – 184 165 – 169 7
170 – 174 2
175 – 179 4
180 – 184 1
d) Determinar la marca de clase de los intervalos

Respuesta:
Intervalo M de C
e) Determinar el límite
150 – 154 152 real inferior del tercer
155 – 159
160 – 164
157
162
intervalo
165 – 169 167
Respuesta:
170 – 174 172
175 – 179 177 Lri = 159 + 160 = 159,5
180 – 184 182 2

f) Determinar el límite real superior del quinto intervalo


Respuesta:
Lrs = 174 + 175 = 174,5
2
g) Determinar la frecuencia acumulada

Respuesta:
h) Determinar la frecuencia
Intervalo F. acum
150 – 154 4 relativa porcentual
155 – 159 12 Respuesta:
160 – 164 26
165 – 169 33 Intervalo F. Relat %
170 – 174 35
150 – 154 10
175 – 179 39
155 – 159 20
180 – 184 40
160 – 164 35
165 – 169 17,5
170 – 174 5
175 – 179 10
180 – 184 2,5
i) ¿Cuántos alumnos miden menos de 160 ?

Respuesta: 12 alumnos miden menos de 160


j) ¿Qué porcentaje de alumnos mide entre 170 y
174 ?
Respuesta: El 5% de los alumnos miden entre 170 y
174
k) ¿Qué porcentaje de alumnos mide entre 160 y 174 ?
Respuesta: El 57,5 % de los alumnos mide entre 160 y
174
l) ¿Cuál es la frecuencia
total ?
Respuesta: n =
40
m) ¿Cuál es la amplitud del
intervalo ? c = Lrs – Lri = 159,5 - 154,5 = 5
Respuesta:
Medidas de tendencia central en datos
agrupados
 Media aritmética: Se suma el producto de la marca de clase
con la frecuencia y se divide por la frecuencia total.
En forma general : X =  f • x
 f

Ejemplo:
Intervalo Frecuencia Marca de clase f • x
X = 3805
60 – 64 5 62 310
65 – 69 5 67 335
50
70 – 74 8 72 576
75 – 79 12 77 924 X = 76,1
80 – 84 16 82 1312
85 – 89 4 87 348
Mediana: Es calcular un valor que separa al conjunto en
dos grupos de igual cantidad.

Para calcular la mediana se ocupa la siguiente formula:

Me = L i m + (n/2 – f( acum. ant ) ) • c


fm

L i m = límite real inferior del intervalo mediano ( primer intervalo


cuya frecuencia acumulada es igual o mayor que n/2 )
n / 2 = mitad de la frecuencia total
f( acum. ant ) = frecuencia acumulada del intervalo anterior al
intervalo mediano
c = amplitud del intervalo
f m = frecuencia absoluta del intervalo mediano
Ejemplo
Hallar la mediana de los pesos de 40 estudiantes, dado en la
siguiente tabla de distribución
Intervalo Frecuencia F acum
118 – 126 3 3
n / 2 = 40 / 2 = 20
127 – 135 5 8
L i m = 144 + 145 = 144,5
136 – 144 9 17
145 – 153 12 29
2
154 – 162 5 34 f ( acum. ant ) = 17
163 – 171 4 38
172 – 180 2 40
c = 144,5 + 153,5 = 9
n = 40 f m = 12

M e = 144,5 + ( 20 – 17 ) • 9 = 144,5 + 3 • 9 = 144,5 + 27 = 146,75


12 12 12
Ejemplo 2
Las edades de los obreros que trabajan en una empresa constructora,
se distribuyen como sigue:
n / 2 = 180 / 2 = 90 c=5
Edad Frecuencia F acum
18 – 22 15 15 L i m = 32 + 33 = 32,5
23 – 27 26 41 2
28 – 32 30 71 f( acum ant) = 71 f m = 38
33 – 37 38 109
38 – 42 32 141
Me = L i m + (n/2 - f(acum ant)) • c
43 – 47 20 161
48 – 52 12 173
fm
53 – 57 7 180
= 32,5 + ( 90 - 71) • 5
38
n = 180 = 32,5 + 19 • 5 = 32,5 + 2,5
38
Me = 35
Moda
Cuando los datos están agrupados en intervalos, la moda
corresponde a la marca de clase del intervalo de mayor
frecuencia
Ejemplo: La tabla de distribución muestra el número de horas
que un grupo de jóvenes dedica a ver televisión diariamente.
Horas frecuencia
0–2 25 El intervalo modal es [3 - 5]
3–5 35 Luego, se dice que la moda es su marca
6–8 25 de clase.
9 – 11 10
M de C = 3 + 5 = 4 Mo = 4 horas
12 - 14 5
2
Representación gráfica en datos agrupados
Histograma: Es un gráfico de barras verticales que sirve para
representar los datos de una distribución de frecuencias
en la cual los valores de la variable están agrupados en
intervalos.

El histograma tiene la siguiente característica:


Las bases de las barras o rectángulos están sobre el eje horizontal y
su ancho ( longitud sobre el eje) es igual al tamaño de los intervalos
de clase.
Ejemplo:
Esta tabla de distribución de frecuencias indica las edades de
los
alumnos que asisten a clases
f de Inglés.
Edad frecuencia
5–7 8
8 – 10 10 10
11 – 13 7 8
14 – 16 5 6
17 – 19 4 4
2
Eje x = intervalos I
Eje y = frecuencia 5- 7 8-10 11-13 14-16 17-19
Polígono de frecuencia
Es la modalidad de un gráfico de datos que se origina al unir
los puntos medios de los lados superiores de las barras de un
histograma. f

El punto medio 10 •
de cada intervalo 8 •
es la marca de •
6
clase •
4 •
2
x
6 9 12 15 18
¡ Puff……!

Ejercicio
Dada la tabla de distribución de edades de un grupo de padres
cuyos hijos están en primer año de universidad.
Hallar: a) media aritmética b) Mediana c) Moda
Edad frecuencia a) Media aritmética
45 – 48 2 Edad f x f•x
49 – 52 5 45 – 48 2 46,5 93
53 – 56 12 49 – 52 5 50,5 252,5
57 – 60 8 53 – 56 12 54,5 654
61 – 64 5 57 – 60 8 58,5 468
61 – 64 5 62,5 312,5

X =  f • x = 1780 = 55,625
n 32
b) Mediana

Edad f F acum n / 2 = 32 / 2 = 16
45 – 48 2 2
49 – 52 5 7
L i m = 52 + 53 = 52,5
53 – 56 12 19 2
57 – 60 8 27
f (acum ant) = 7
61 – 64 5 32
n = 32 c = 56,5 - 52,5 = 4
f m = 12
Me = 52,5 + ( 16 – 7 ) • 4 = 52,5 + 9 • 4 = 55,5
12 12
c)
: Moda:
El intervalo modal es [53 - 56] . Luego. La moda es su marca
de clase: 53 + 56 = 54,5
2
* Construye una tabla de distribución de frecuencias de
datos
agrupados en intervalos de clase. Considera como limite
inferior del primer intervalo = 10 y c = 10
El puntaje obtenido por 130 alumnos en una prueba de biología
es el siguiente:

12 45 53 85 23 91 34 56 65 70 72 74 86
95 32 45 56 58 33 49 55 70 66 62 64 55
83 26 34 72 60 64 72 80 58 98 50 20 35
76 68 90 99 56 48 56 68 82 40 92 38 56
84 66 78 74 25 15 48 50 66 49 53 83 91
42 64 72 54 89 92 28 34 40 56 64 68 63
35 56 66 38 82 78 74 90 85 66 70 72 58
66 80 80 95 96 99 94 40 42 58 65 67 81
90 50 48 52 62 70 80 93 45 36 49 81 73
56 38 51 23 90 84 96 75 38 28 36 83 29
Respuesta:

Intervalo M. de Clase frecuencia F. acum. F. Relat F. Relat.%


10 – 19 14,5 2 2 0,015 1,5
20 – 29 24,5 8 10 0,061 6,1
30 – 39 34,5 13 23 0,100 10,0
40 – 49 44,5 14 37 0,107 10,7
50 – 59 54,5 22 59 0,169 16,9
60 – 69 64,5 20 79 0,153 15,3
70 – 79 74,5 17 96 0,130 13,0
80 – 89 84,5 17 113 0,130 13,0
90 - 99 94,5 17 130 0,130 13,0
De acuerdo con la tabla anterior, responder las siguientes
preguntas:

a) ¿Cuántos alumnos obtuvieron entre 30 y 49 puntos?


Respuesta: Hay 27 alumnos

b) ¿Cuántos alumnos obtuvieron entre 60 y 89 puntos?


Respuesta: Hay 54 alumnos

c) ¿Cuántos alumnos obtuvieron entre 40 y 99 puntos?


Respuesta: Hay 107 alumnos
d) ¿Qué porcentaje de alumnos obtuvieron entre 30 y 49 puntos?

Respuesta: El 20,7 % de los alumnos

e) ¿Qué porcentaje de alumnos obtuvo entre 50 y 59 puntos?

Respuesta: el 16,9 % de alumnos

f) ¿Cuántos alumnos obtuvieron menos de 60 puntos?

Respuesta: 59 alumnos
g) ¿Cuántos alumnos obtuvieron menos de 30
puntos?
Respuesta: 10 alumnos

h) ¿Cuántos alumnos obtuvieron 50 o más


puntos?
Respuesta: 93 alumnos
i) ¿Cuántos alumnos obtuvieron 70 o más puntos?
Respuesta: 51 alumnos

j) ¿Qué porcentaje de alumnos obtuvo menos de 20 puntos?

Respuesta: 1,5 % de los alumnos


k) ¿Cuál es la marca de clase que representa al intervalo de
mayor frecuencia?

Respuesta: la marca de clase de mayor frecuencia es 54,5

l) ¿Cuál es el límite aparente superior del tercer intervalo?

Respuesta: 39

m) ¿Cuál es el límite real inferior del quinto intervalo?

Respuesta: 49,5

n) ¿Cuál es la amplitud del intervalo?

Respuesta: c = 10
n) Calcula la media aritmética:

Respuesta:
Intervalo M. de Clase frecuencia f • x
10 – 19 14,5 2 29 X = f•x
20 – 29 24,5 8 196 n
30 – 39 34,5 13 448,5
40 – 49 44,5 14 623
50 – 59 54,5 22 1199
X = 8095
60 – 69 64,5 20 1290 130
70 – 79 74,5 17 1266,5
80 – 89 84,5 17 1436,5
90 - 99 94,5 17 1606,5
X = 62,26
n = 130
ñ) Calcula la mediana:

Respuesta:
n / 2 = 130 / 2 = 65
Intervalo frecuencia F. acum.
10 – 19 2 2 L i m = 59,5 c = 10
20 – 29 8 10
30 – 39 13 23
f(acum. ant) = 59
40 – 49 14 37 f m = 20
50 – 59 22 59
60 – 69 20 79
Me = 59,5 + ( 65 – 59 ) • 10
70 – 79 17 96
80 – 89 17 113
20
90 - 99 17 130
Me = 59,5 + 6 • 10
n = 130 20
Me = 59,5 + 3 = 62,5
o) Calcular el intervalo modal y la moda :

Respuesta:
El intervalo modal es [50 - 59] porque tiene la mayor
frecuencia , que es 22.

La moda corresponde a la marca de clase de ese intervalo.

Luego, Mo = 50 + 59 = 54,5
2
a+b=c

Ejercicios
 Calcular el rango entre. 3,22 2,93 3.01 4,48 5,06 4.31
2,98 3,07
Repuesta: 5,06 - 2,98 = 2,08

 El siguiente cuadro muestra el consumo anual en Chile de


kilogramos de carne de bovino per cápita.
Año 1984 1985 1986 1987 1988 1989 1990 1991 1992 1996

Consumo 17,0 15,0 14,7 14,0 15,6 17,3 18,5 18,1 17,6 20,0

a) Calcular el consumo promedio desde 1986 hasta 1992


Respuesta: X = 115,8 = 16,54
7
b) Calcular el consumo promedio de los 10 años?

Respuesta: X = 1678 = 16,78


10
 La siguiente tabla representa las medidas de una pieza de
motores

Intervalo Frecuencia
Dibuja en un mismo gráfico el
100 – 109 4 histograma y el polígono de
110 – 119 17 frecuencias.
120 – 129 29
130 – 139 18
140 – 149 10
150 – 159 5
160 – 169 2
Respuesta:
f

29 •

18
• •
10 •
4 • •

104,5 114,5 124,5 134,5 144,5 154,5 164,5 Marca de clase
 Dado las siguientes frecuencias, calcular la
mediana,
la moda y la media aritmética
6 - 7 - 7 - 3 - 4 - 1 - 7 - 5
Respuesta:

Me : Para calcular la mediana se deben ordenar las frecuencias:


1 - 3 - 4 - 5 - 6 - 7 - 7 - 7
Luego, 5 + 6 = 11 = 5,5 Me = 5,5
2
Mo = La moda es 7 , porque es la frecuencia que más se repite

X = 6 + 7 + 7 + 3 + 4 + 1 + 7 + 5 = 40 = 5
8 8
 Las notas obtenidas por 45 alumnos en una prueba
de
Estadística son:
Notas Frecuencia
Determinar : Mo, Me y X
1 1 Respuesta:
2 4
Me = Como n / 2 = 45 / 2 = 22,5
3 5
Luego. la mediana es 5 , pues es el primer
4 6
valor de la variable cuya f(acum.) es igual o
5 9
mayor que 22,5
6 12
7 8

X = 1•1 + 2 • 4 + 3 • 5 + 4 • 6 + 5 • 9 + 6 • 12 + 7 • 8 = 221 = 4,9


45 45
Mo = La moda es 6 pues es el valor que tiene mayor
frecuencia
Percentiles, Deciles y Cuartiles

La mediana de un conjunto de datos ordenados, es el valor que los separa en dos


partes iguales.

Existen otros valores típicos que dividen a un conjunto de datos


numéricos en una cierta cantidad de partes iguales; éstos son: Percentiles,
Deciles y Cuartiles.

P50 = 52 % = Me
Percentiles
Los percentiles de una distribución de datos numéricos son
los 99 valores que la dividen en 100 partes iguales.

Los percentiles se designan por: P1 , P2 , P3 , .............P99


Se lee: P1 = percentil 1 P2 = percentil 2 ............etc.

0 P1 P2 P3 ........................................................P99.
Ejemplo:
• En la distribución de notas de un grupo de alumnos, el
P45 es una nota de referencia que permite afirmar que el
45 % de esos alumnos obtuvo esa nota o una menor.
El cálculo de percentiles se hace de la misma forma como se
obtiene la mediana, en una distribución.

Ejemplo: Considerar la distribución de frecuencias de


los
212 puntajes
Puntaje
de P:A:A:
frecuencia
para calcular
Frec. Acum.
P45 .
Respuesta:
350 – 399 4 4 Se calcula el 45% de 212:
400 – 449 6 10
212 = 100% x = 212 • 45
450 – 499 9 19
500 – 549 20 39
x 45 % 100
550 – 599 31 70 x = 95,4
600 – 649 80 150
650 – 699 42 192 La frecuencia acumulada 95,4 se
700 – 749 10 202 encuentra en la clase 600 - 649
750 – 799 8 210
800 – 849 2 212
L r i p = 599 + 600 = 599,5 f (acum. ant) = 70
2 c = 50 f p = 80

P45 = L r i p + [ % - f (acum. ant)] • c


fp
( 95,4 – 70 ) • 50
P45 = 599,5 +
80
= 599,5 + 15,875
= 615,375

Este valor significa que el 45 % de los alumnos obtuvo


puntajes menores o iguales a 615,3.
 Considerar la misma distribución anterior para
calcular
P8.
Respuesta:

Calcular el 8 % de 212: 212 = 100 % x = 212 • 8 = 16,96


x 8% 100

Este valor de la frecuencia acumulada se encuentra en la clase


450 – 499
L r i p = 449 + 450 = 449,5 F(acum. ant) = 10 c = 50 f p = 9
2
P8 = 449,5 + ( 16,96 – 10) • 50
9
= 449,5 + 38,66
= 488,16
Ejercicio de percentil
Dada la tabla de distribución, determinar qué porcentaje de los
alumnos obtuvieron entre 400 y 600 puntos.
Puntaje frecuencia Frec. Acum.
350 – 399 4 4 Respuesta:
400 – 449 6 10
450 – 499 9 19 400 puntos corresponde a un
500 – 549 20 39 percentil que se desconoce, por
550 – 599 31 70
lo que se simboliza por Px .
600 – 649 80 150
650 – 699 42 192
700 – 749 10 202
Además se sabe que corresponde
750 – 799 8 210 al segundo intervalo, y que su
800 – 849 2 212 L r i p = 399,5
El % buscado es: x • 212 F(acum. ant) = 4
100
fp= 6 c = 50
212
x. 4
Px = 399,5 + 100 • 50
6
400 = 399,5 + 2,12 x  4 .50
6
2,12 x  4
400 – 399,5 = .50
6
0,5 • 6 = 2,12 x – 4
50
0,06 + 4 = 2,12 x
4,06 =x 1,9 % = x
2,12
600 puntos corresponde a un percentil desconocido, por lo
que se simboliza por Py

Además se sabe que está ubicado en el sexto intervalo, y que


su L r i p = 599,5 f(acum. ant) = 70 f p = 80 c = 50
212
El % buscado es x •
100
212 La diferencia entre
y.  70
Entonces: Py = 599,5 + 100 .50 ambos porcentajes
80
y.
212
 70
corresponde al
600 – 599,5 = 100 .50 porcentaje pedido.
80
0,5 • 80 = 2,12 y - 70 33,3 – 1,9 = 31,4 %
50
0,8 + 70 = y y = 33,3 %
2,12
Calcular qué porcentaje de los 212 alumnos tuvieron
resultados entre 620 y 680 puntos.

Respuesta:
620 puntos corresponde a un percentil que se desconoce y se designa
por Px. 212
x.  70
Entonces, Px = 599,5 + 100 • 50
80
80
620 = 599,5 +
.50
2,12 x  70

2,12 x  70
620 – 599,5 = .50
80

20,5 • 80 = 2,12x – 70 x = 48,4 %


50
680 puntos corresponde a un percentil que se desconoce y se
designa por Py.

42
100 .50
Py = 649,5 + y.
212
 150

42
680 = 649,5 +
.50
2,12 y  150

( 680 – 649,5 ) • 42 = 2,12y - 150 x = 82,8 %


50

Así, la diferencia entre ambos porcentajes corresponde al porcentaje


de alumnos que tienen entre 620 y 680 puntos.
82,8 % - 48,4 % = 34,4 = 34,4 % de los alumnos
Deciles
Los deciles de una distribución de datos numéricos son los 9
valores que la dividen en 10 partes iguales.

Los deciles se designan por D1 , D2 , D3 , ...........D9

Se leen: Decil 1 , decil 2 .......decil 9

0 D1 D2 D3 D4 D5 D6 D7 D8 D9
Para calcular deciles, se hace de la misma forma que los
percentiles.
Ejemplo: Considerar la siguiente tabla de distribución para
calcular D3
Puntaje frecuencia Frec. Acum.
350 – 399 4 4
400 – 449 6 10
450 – 499 9 19 Para calcular el tercer decil (D3)
500 – 549 20 39 se tiene que tener en cuenta que
550 – 599 31 70
corresponde al 30 % inferior
600 – 649 80 150
650 – 699 42 192
de los datos de la distribución.
700 – 749 10 202
750 – 799 8 210
800 – 849 2 212
Se calcula el 30% de 212 212 = 100%
x 30% x = 63,6

Esta cantidad de datos corresponde a la clase 550 – 599


L r i = 549 + 550 = 549,5 f(acum. ante) = 39 c = 50
2 f d = 31

D3 = 549,5 + ( 63,6 – 39 ) • 50
31
= 549.5 + 39,6

= 589,1

El 30 % de los 212 alumnos tiene un puntaje igual o menor que


589,1 puntos.
 Calcular el D7
Respuesta:

El 70% de 212 = 148,4 f(acum. ant) = 70 f d = 80 c = 50


El límite real inferior de la clase 600 – 649 es 599,5
148,4  70
D7 = 599,5 + .50
80
D7 = 599,5 + 49

D7 = 648,5 puntos

NOTA: Se ha calculado D3 y D7 , entonces se puede concluir que


el 40% de los 212 alumnos obtuvo entre 589,2 y 648,5
puntos.
Cuartiles
Los Cuartiles de una distribución de datos numéricos son los
tres valores que la dividen en 4 partes iguales
Los cuartiles se designan por: Q1 , Q2 y Q3

Q1 Q2 Q3
Q1 es el primer cuartil y corresponde al 25% inferior
Q2 es el segundo cuartil y corresponde al 50% inferior
Q3 es el tercer cuartil y corresponde al 75% inferior
Los cuartiles se calculan de la misma forma que los
percentiles
y los deciles.
 Calcular el tercer cuartil, de la siguiente distribución

Respuesta:
Puntaje frecuencia Frec. Acum. El 75% de 212 = 159
350 – 399 4 4
400 – 449 6 10 L r i q = 649,5 c = 50
450 – 499 9 19 f(acum. ant) = 150 f q = 42
500 – 549 20 39
550 – 599 31 70 159  150
Q3 = 649,5 + .50
600 – 649 80 150 42
650 – 699 42 192
700 – 749 10 202 Q3 = 649,5 + 10,7
750 – 799 8 210
800 – 849 2 212
Q3 = 660,2

El 75% de los alumnos tiene un puntaje igual o inferior a 660,2 puntos,


lo que significa que el 25% de ellos tiene un puntaje igual o superior
a 660,2
 Un curso rindió una prueba de Matemática, ¿Qué se
puede
decir del resultado, si se sabe que en la distribución de las
notas se obtuvo: Q2 = 5,8 y Q3 = 6,5 ?
Respuesta:
Es conveniente ver la situación en forma gráfica:

5,8 6,5 25%


50%

Se puede afirmar que:


* El 50% del curso obtuvo una calificación superior a 5,8

* El 25% mejor preparado logró notas superiores al 6,5


Medidas de dispersión

Al grado en que los datos numéricos tienden a extenderse


alrededor de un valor medio se le llama variación o
dispersión
Las medidas de dispersión más utilizadas son:

* Rango

* Desviación media

* Desviación típica o estándar.


Rango
El rango de un conjunto de datos numéricos es la diferencia
entre el mayor y el menor de ellos.
Ejemplo:
Un alumno obtuvo las siguientes notas parciales en
Matemática:
2 - 3,9 - 5 - 5,9 - 6,2
El rango es 4,2 ya que es la diferencia entre 6,2 y 2
¿Qué significado tiene el rango de notas 4,2 respecto de
las
notas de otro alumno cuyo rango es 2,1?
En el primer caso las notas están más dispersas que en el
segundo. No se sabe en que caso son mejores; para
determinarlo es necesario más información.
Desviación Media
La desviación de un puntaje x con respecto a la media
aritmética x está dada por la diferencia d = x - x
Ejemplo:
Un alumno obtuvo las siguientes notas en la asignatura de
Biología: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la desviación
de ellas.
Respuesta:
Primero se debe calcular el promedio.
x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6
5 5
Ahora se calcula la diferencia de cada nota con el promedio

d = 3,9 – 4,6 = - 0,7 d = 2 – 4,6 = - 2,6


d = 5 – 4,6 = 0,4 d = 6,2 – 4,6 = 1,6
d = 5,9 – 4,6 = 1,3

NOTA: La suma de las desviaciones de todos los datos con


respecto a la media aritmética es igual a cero.

Ejemplo:
-0,7 + 0,4 + 1,3 + -2,6 + 1,6 = 0
La desviación media de n datos numéricos x1, x2, ......xn
es la media aritmética de los valores absolutos de las
desviaciones de todos los datos con respecto a su
promedio.
Se designa por DM n = frecuencia total

DM = |x1 – x | + |x2 – x | +.........|xn – x |


n

Ejemplo:

DM = |-2,6 | + |-0,7 | + |0,4 | + |1,3 | + |1,6 | = 6,6 = 1,3


5 5

El valor 1,3 es la desviación media de todas las notas dadas.


 Un alumno obtuvo las siguientes calificaciones en la
asignatura de Inglés: 3,2 - 6 - 6,8 - 4,3 - 2,9 -
5,7
Calcular la desviación media de las notas.
Respuesta:

x = 3,2 + 6 + 6,8 + 4,3 + 2,9 + 5,7 = 28,5 = 4,8


6 6
| 3,2 – 4,8 | = 1,6 | 6 – 4,8 | = 1,2 | 6,8 – 4,8 | = 2
| 4,3 – 4,8 | = 0,5 | 2,9 – 4,8 | = 1,9 | 5,7 – 4,8 | = 0,9

Luego, DM = 1,6 + 1,2 + 2 + 0,5 + 1,9 + 0,9 = 8,1 = 1,3


6 6
El valor 1,3 es la desviación media de todas las notas dadas.
Desviación media en datos agrupados
La siguiente tabla muestra los puntajes obtenidos en P.A.A.
con un promedio de 614 puntos. Calcular la desviación
media. • Primero se debe sacar
Puntajes Frecuencia x |x–x| f • |x – x |
350 – 399 4 374,5 239.5 958 la marca de clase.
400 – 449 6 424,5 189.5 1137
450 – 499 9 474,5 139.5 1255.5
• Se debe obtener la
500 – 549 20 524.5 89.5 1790 desviación |x – x |
550 – 599 31 574.5 39.5 1224.5
600 – 649 80 624.5 10.5 840
• Se realiza el producto de la
650 – 699 42 674.5 60.5 2541 frecuencia con la desviación
724.5 1105
700 – 749
750 – 799
10
8 774.5
110.5
1284
• Se obtiene la
160.5
800 – 849 2 824.5 210.5 421 sumatoria
212 del productola frecuencia
*Considerar
12556
total.
Con todos los datos se aplica la fórmula de la desviación media

DM =  f • | x – x | DM = 12556 = 59,2 puntos


n 212

Se puede decir que los puntajes se desvían, en promedio, 59,2


puntos con respecto a la media.
Hay que considerar que algunos puntajes son inferiores a ella
y otros superiores.

Si los puntajes estuvieran más agrupados en torno al promedio,


es decir, menos dispersos, el valor de DM sería menor.
Calcular la DM de la siguiente distribución que
representa
las horas diarias dedicadas al estudio de 20 alumnos

d) Frecuencia total
Horas Frecuencia x f•x |x–x| f • |x – x |
e) x = 95 = 4,7
0–2 5 1 5 3,7 18,5
20
3–5 7 4 28 0,7 4,9 * Determinar | x – x |
6–8 6 7 42 2,3 13,8 * Determinar f • |x – x |
9 - 11 2 10 20 5,3 10,6 * Obtener  f • | x – x |
20 95 47,8
Respuesta: * Finalmente se determina la DM
* Determinar el promedio
DM = 47,8 = 2,3
a) Obtener la marca de clase 20
b) Multiplicar f • x Las horas diarias se desvían en 2,3
c) Obtener  f • x puntos con respecto a la media.
 Calcula la desviación media de las medidas de una pieza
de motores, dada por la siguiente tabla:

Intervalo frecuencia x x•f |x–x | f•|x–x| * Sumatoria del producto


100 – 109 4 104,5 418 24,2 96,8
110 – 119 17 114,5 1946,5 14,2 241,4
DM = 923 = 10,8
120 – 129 29 124,5 3610,5 4,2 121,8
130 – 139 18 134,5 5,8 104,4
85
2421
140 – 149 10 144,5 1445 15,8 158
150 – 159 5 154,5 772,5 25,8 129 Las medidas se desvían
160 – 169 2 164,5 329 35,8 71,6 en promedio de 10,8
85 10942.5 923 puntos con respecto a
Respuesta: la media.
* Marca de clase (x) *Se calcula | x – x
|
* x = 10942,5 = 128,7 * Se calcula f • | x – x |
85
Desviación típica o estándar

La desviación típica se simboliza por la letra S


La desviación típica o estándar expresa el grado de dispersión
de los datos con respecto al promedio y corresponde a la raíz
cuadrada de la media del cuadrado de las desviaciones de dichos
datos con respecto a su media aritmética.
En forma
general: n
k 1

S=
x)  k  (x
2
 k n
Ejercicios
 Calcular la desviación típica de las siguientes notas de
Matemática: 2,0 - 3,9 - 5,0 - 5,9 - 6,2

Respuesta:
* Primero se debe obtener el promedio
x = 2,0 + 3,9 + 5,0 + 5,9 + 6,2 = 4,6
5
* Se calcula la desviación típica

S= ( 2  4,6 ) 2
 (3,9  4, 6 ) 2
 (5  4, 6 ) 2
 (5,9  4, 6 ) 2
 ( 6, 2  4, 6 ) 2

5
6,7  0,4  0,1  1,6  2,5 11,3
S= =
5 5

= 2,2 = 1,4
Luego, la desviación típica de las notas es 1,4 con respecto
al promedio
Si de estas notas descartáramos el 2, la nota más alejada del
promedio, entonces la desviación típica sería S = 1,04 ;
este
valor es menor que 1,4.
Las notas consideradas, sin la nota 2, tendrían una
dispersión
menor, es decir, estarían más centradas.
 Calcular la desviación típica de las siguientes
notas:
5,2 - 4,9 - 5 - 5,1 - 5,2 - 5,3 - 4,9 - 5,2
Respuesta:
* Se obtiene el promedio x = 5,1

*S= 0,1  0,2  0,1  0  0,1  0,2  0,2  0,1


2 2 2 2 2 2 2 2

8
0,16
8
S= 0,01  0,04  0,01  0  0,01  0,04  0,04  0,01 = 8

S= 0,02 = 0,1
Este valor es considerablemente menor que el ejercicio anterior. Se
debe a que los datos son más homogéneos que en la otra distribución,
presentan escasa dispersión con respecto al promedio.
Desviación típica en datos agrupados
Calcular la S de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos, con un
promedio de 4,7
*  f •| x – x | 2
Horas Frecuencia x |x–x| |x–x|
2
f •| x – x |
2

0–2 5 1 3,7 13,69 68,45 * Se calcula S


3–5 7 4 0,7 0,49 3,43
159,8
6–8 6 7 2,3 5,29 31,74 S=
9 - 11 2 10 5,3 56,18
20
28,09

159,8 S= 7,9
• Primero se debe sacar la marca de clase.
* Determinar las desviaciones S= 2,8
* Obtener la desviación al cuadrado
* Producto de la frecuencia con la desviación al cuadrado.
La siguiente tabla muestra los puntajes obtenidos en P.A.A.
con un promedio de 614 puntos. Calcular la desviación típica

Puntajes Frecuencia x |x–x| f • | x – x |2 1407973


| x – x |2 S=
350 – 399 4 374.5 239.5 57360.25 229441 212
400 – 449 6 424.5 189.5 35910.25 215461.5
450 – 499 9 474.5 139.5 19460.25 175142.25
= 6641.3
500 – 549 20 524.5 89.5 8010.25 160205
550 – 599 31 574.5 39.5 1560.25 48367.75
= 81,4
600 – 649 80 624.5 10.5 8820
110.25
650 – 699 42 674.5 60.5 3660.25 153730.5
Entonces,
700 – 749 10 724.5
110.5 12210.25 122102.5 S = 81,4
774.5
750 – 799 8 160.5 25760.25 206082
800 – 849 2 824.5 210.5 44310.25 88620.5

1407973
* Calcular marca de clase * determinar f • |x – x |2
* Calcular las desviaciones * Determinar la sumatoria del producto
* Determinar las desviaciones al cuadrado
 La siguiente tabla muestra el número de brazadas dadas
por 100 nadadores en la prueba de 200 m crol. Calcular S

9845
Brazadas frecuencia x f•x |x–x| |x–x|2 F •|x – x |2
S=
200 – 204 8 202 1616 16.9 285.61 2284.88 100
205 – 209 12 207 2484 11.9 141.61 1699.32
210 – 214 15 212 3180 6.9 47.61 714.15
S = 98,45
215 – 219 18 217 3906 1.9 3.61 64.98
220 – 224 16 222 3552 3.1 9.61 153.76
225 – 229 14 227 3178 8.1 65.61 918.54 S = 9,9
230 – 234 10 232 2320 13.1 171.61 1716.1
235 – 239 7 237 1659 18.1 327.61 2293.27
Las brazadas
21895 9845 están a 9,9
Respuesta: puntos con
21895
* Promedio d) x = = 218.9 respecto al
100
a) Marca de * Calcular las desviaciones promedio
clase
b) f • x * Desviaciones al cuadrado *  del producto
c)  f • x * f • | x – x |2
Varianza
La varianza de un conjunto de datos se define como el cuadrado
de la desviación típica
Se simboliza por S2

k n 
 ( x  x ) 2

S2 = k 1
n

El cálculo de la varianza es similar a la desviación típica


Un alumno obtuvo las siguientes notas en la asignatura de
Biología: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la varianza
de ellas.
Respuesta:
Primero se debe calcular el promedio.
x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6
5 5
* Calcular las desviaciones
|3,9 – 4,6 | = 0,7 | 2 – 4.6 | = 2,6 | 5 – 4,6 | = 0,4
| 6,2 – 4,6 | = 1,6 | 5,9 – 4,6 | = 1,3

* Calcular las desviaciones al cuadrado


0,72 = 0,49 2,62 = 6,76 0,42 = 0,16 1,62 = 2,56 1,32 = 1,69
* Calcular S2
S2 = 0,49 + 6,76 + 0,16 + 2,56 + 1,69 = 11,66 = 2,3
5
Calcular la Varianza de la siguiente distribución que representa
las horas diarias dedicadas al estudio de 20 alumnos, con un
promedio de 4,7

Horas Frecuencia x |x–x| | x – x | 2 f •| x – x | 2 * f •| x – x | 2


0–2 5 1 3,7 13,69 68,45

3–5 7 4 0,7 0,49 3,43 * Se calcula S2


6–8 6 7 2,3 5,29 31,74
159,8
9 - 11 2 10 5,3 28,09 56,18 S =
2
20
159,8
S2 = 7,9
• Primero se debe sacar la marca de clase.
* Determinar las desviaciones Luego, la varianza es
7,9
* Obtener la desviación al
cuadrado
* Producto de la frecuencia con la desviación al cuadrado.

También podría gustarte