Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual de Estadísticas, Santo Tomás
Manual de Estadísticas, Santo Tomás
ESTADÍSTICA
¿Qué es la Estadística?
* Empírica (comprobable).
Las Variables
Una variable es una propiedad que puede variar y cuya variación es susceptible de
medirse u observarse.
Ejemplo:
Variable: Sexo
Variable: Edad
CUALITATIVAS CUANTITATIVAS
* Para cada uno hay una formula. Ejemplo en la Cuantitativa puedo sacar promedios, en la cualitativa no.
CUALITATIVAS CUANTITATIVAS
Ejercicio en Clases:
16.646.949-0 20 a) Valparaíso
10.947.833-3 33 b) Marga-Marga
18.938.745-0 96 c) San Antonio
76 d) Los Andes
26 e) San Felipe
32 f) otro
Cualitativa, ordinal (tiene Cuantitativa, continua, Cualitativa, nominal.
un orden) razón.
Continua, porque hay
meses y días asociado a
los años (no es un numero
entero).
4
¿Cuál es su sexo?
1) Hombre
2) Mujer
“N” = Total
Sexo Ni
Mujer 15
Hombre 12
Total (N) 27
Sexo Ni Pi % = Pi * 100
Mujer 15 15/27= 0.6 60%
Hombre 12 12/27= 0.4 40%
Total (N) 27 27/27= 1 100%
La frecuencia relativa es Pi, para lograr el Pi debo dividir el “Ni” (Frecuencia absoluta) con
el “N” total y anotarlo al lado.
Para lograr el porcentaje, debo tener el resultado de “Pi” y multiplicarlo por 100.
El “Pi” en la última tabla siempre debe terminar en 1 y 1*100= 100% de los casos.
5
* Esta tabla me sirve para analizar una variable cualitativa nominal. Con esta variable llego hasta acá en la tabla (hasta el
Pi *100) y puedo hacer un grafico “pero nada más”, no puedo hacer la siguiente tabla con la variable cualitativa nominal.
* Con la variable cualitativa ordinal (que viene más abajo) puedo avanzar más en la tabla como se muestra a
continuación.
Son las frecuencias que se van acumulando (sumando) en cada categoría, desde arriba
hacia abajo.
%a: Porcentaje Acumulado: Mismos pasos anteriores pero con la tabla de porcentaje.
6
EJERCICIO EN CLASES
a) Sin Escolaridad.
b) Educación Básica
c) Educación Media
d) Educación Superior.
acaabbaabcccbbdbbbcbbbcbbcbdbb
a) 5
b) 16
c) 7
d) 2
Escolaridad Ni Pi (Ni/N) % (Pi*100) Nia Pia %a
* Siempre trabajar con 3 decimales, en caso de por ejemplo obtener este resultado:
0.16666666 (infinito), el “tercer decimal”, si es mayor a 5, aproximarlo, en este ejemplo
quedaría 0.167.- Otro ejemplo 1.77777777, 0.178.
120
100
80
60
110
40 62,15%
67
20 37,85%
0
Femenino Masculino
GRAFICO DE SECTORES:
Un grafico representa el 100% de los casos lo que a 360°. Ideal para variables cualitativas
o de pocas categorías.
Masculino 62%
Femenino 38%
Masculino: Femenino:
100% = 360° 100% = 360%
62% = X 38% = X
X = 223° X = 127°
* Se multiplica 62*360 y se divide por 100, * Se multiplica 38*260 y se divide por 100,
así se obtiene el resultado de X. así se obtiene el resultado de X.
Género
137 Femenino
223
Masculino
* Otra fórmula: La “torta” siempre es 3.6 (dividir 360/100), como la torta siempre va a ser
3.6 de inmediato lo multiplico.
PICTOGRAMAS:
TABLA DE CONTINGENCIA:
Sexo Si No Total
donante
Hombre 10 15 25
Mujer 18 12 30
Total 28 27 55
DONANTES
30
25
20
15 Si
No
10
0
Hombre Mujer
10
ESTADÍSTICA
Ejemplo:
Ejemplo: (67 - 2) + 1 = 66
i = AT/N° de intervalo.
Ejemplo: 66/5 = 13,2 = 14 Siempre debemos subir a un entero, nuestro ancho va a ser
14.
Al Li se le suma (i – 1) = 15.-
13
Entonces Li= 2 y Ls = 15
Li Ls
2 15
16 29
30 43
44 57
58 71
Li Ls Ni Pi % Nia Pia %a
2 15 25 0.581 58.1% 25 0.581 58.1
16 29 5 0.116 11.6% 30 0.697 69.7
30 43 6 0.140 14% 36 0.837 83.7
44 57 5 0.116 11.6% 41 0.953 95.3
58 71 2 0.047 4.7% 43 1 100
N 43 1 100%
52,23 – 67,8 – 45,32 – 77,2 – 76,59 – 65,73 – 82 – 65,68 – 71,45 – 60,7 – 48,25 – 59,85 –
63,27 – 57,5 – 68,3 – 73,2 – 55,74.
i = AT/N° de intervalos.
Ejemplo: 36,69/3 = 12,23 = 13 Nuevamente a numero entero para que no me falte en el intervalo.
Li Ls Ni Pi % Nia Pia %a
N 17 1 100%
Variable continua
Limites reales
Se repite el Ls con el Li siguiente.
* Si sale un numero que está en ambos limites (Li – Ls) no se cuenta 2 veces, solo se
suma en el intervalo del Li.
14
EJERCICIO EN CLASES
Li Ls Ni Pi % Nia Pia %a
N 18 1 100
15
CLASE N°5
Tallo Hoja
1 6
4 0
12 2
100 1
3-10-3-20-34-45-8-5-7-35-6-56-45-45-7-19-12-34-67-8-7-6-12-34-6-18-38-6-65-54-43-2-4-
24-17-15-13-7-8-8-5-7-9.-
2-3-3-4-5-5-6-6-6-6-7-7-7-7-7-8-8-8-8-9-10-12-12-13-15-17-18-19-20-24-34-34-34-35-38-
43-45-45-45-54-56-65-67.-
Tallo Hoja
0 2-3-3-4-5-5-6-6-6-6-7-7-7-7-7-8-8-8-8-9
1 0-2-2-3-5-7-8-9
2 0-4
3 4-4-4-5-8
4 3-5-5-5
5 4-6
6 5-7
16
HISTOGRAMA
MEDIA ARITMÉTICA
FÓRMULAS MEDIA:
X = ∑ NiMc
Li – Ls Ni Mc (Li+Ls/2) Ni * Mc
2-4 4 3 12
5-7 3 6 18
8 - 10 2 9 18
N9 48/9 = 5,3 (la
media)
∑ = Sumatoria
X = Promedio
Xi = Sumatorio de casos.
Mc = Marca de Clases
X = ∑ Xi
N
Ejemplo: 4 + 5 + 5 + 10 = 24 / 4 = promedio = 6 (es por ejemplo cuando saco el promedio
de mi nota, sumo todas y después las divido).
EJERCICIO EN CLASES
Li – Ls Ni Mc (Li + Ls / 2) Ni * Mc
273,99 – 439,99 5 356,99 1784,95
439,99 – 605,99 7 522,99 3660,93
605,99 – 771,99 6 688,99 4133.94
N 18 9579,82 / 18 =
532,212 (la media)
FORMULA MODA
Mo = Li + i d1
d1 + d2
Li = Limite real inferior del intervalo modal (si es límite aparente se le resta 0.5.
* Los limites reales son los límites de la variable continua, a los limites reales se les debe dejar tal como están. A los que
se les resta el 0.5 son a las Variables Discretas (números enteros).
d1 = Diferencia (resta) entre la frecuencia absoluta del intervalo modal y del intervalo
anterior.
d2 = Diferencia (resta) entre la frecuencia absoluta del intervalo modal y del intervalo
posterior.
20
Ejemplo:
Li – Ls Ni
2–4 4
5-7 3
8 - 10 2
N 9
Mo = Li + i d1
d1 + d2
Mo = 1,5 + 3 4
4+1
Mo = 1,5 + 3 4/5
Mo = 1,5 + 3 * 0.8
Mo = 1,5 + 2,4
Mo = 3.9 = La moda es 3.9.
21
FORMULA MEDIANA
La Mediana indica donde está el dato central (la mitad). El 50% menor a ese dato y el 50%
mayor a ese dato.
1.- Identificar el intervalo donde se encuentra la Mediana. N/2. Debo mirar en la Nia.
Me = Li + i N - Nia¯¹
Ni 2
Li = Limite real inferior del intervalo de la mediana. Al límite aparente (variable discreta) se
le resta 0.5. Si la variable es continua se deja igual.
Li – Ls Ni Nia
2–4 4 4
5–7 3 7
8 - 10 2 9
N 9
La mediana es 9/2 = 4,5.- La mediana está en el segundo intervalo, con ese voy a
trabajar (intervalo mediana). Se busca donde el 4,5 alcance en la Nia.
Formula:
Me = Li + i N - Nia¯¹
Ni 2
Me = 4,5 + 3 9–4
3 2
Me = 4,5 + 1 * 0.5
Me = 4,5 + 0,5
Ejercicio:
Beneficios Estatales que tienen los Adultos Mayores. Calcule Moda y Mediana.
Li – Ls Ni
1–5 29
6 – 10 28
11 - 15 6
N 63
La variable es discreta
Moda
El rojo es mi Intervalo Modal porque tiene más Ni (más casos). Se trabaja con el NI
Moda:
Mo = Li + i d1
d1 + d2
Li= 0.5. (La variable es discreta, por lo tanto es Límite aparente, le resto 0.5).
i = 5 (Ls – Li +1) porque la variable es discreta. Para la variable continua solo (Ls-Li),
no le resto el 1.
d1= 29. No le resté nada porque arriba no hay nada es 0. Recordar que en la Moda es
el Ni.
d2= 1. Resta del 29 y 28 (Ni).
Mo = 0.5 + 5 29
29 + 1
Mo = 0.5 + 5 29
30
Mo = 0,5 + 5 * 0.967
Mo = 0,5 + 4,835
Mo = 5.335 = LA MODA.
La mayoría de los adultos mayores tienen en promedio 5 beneficios estatales. Como
la variable es discreta, debo responder así. Cierro el decimal porque la variable es
discreta.
24
Li – Ls Ni Nia
1–5 29 29
6 – 10 28 57
11 - 15 6 63
N 63
Me = Li + i N - Nia¯¹
Ni 2
Li= 5.5. Límite inferior de la Mediana. Si es variable discreta resto 0,5.
i = 5. (Ls – Li + 1).
Ni = 28. Frecuencia absoluta “Ni” del intervalo de la mediana.
Nia¯¹ = 29. Frecuencia Acumulada “Nia” del intervalo anterior de la mediana.
Me = 5.5 + 5 63 – 29
28 2
Me= 5,5 + 0.179 31.5 – 29
Me = 5,5 + 0, 448
El 50% de los adultos tienen menos de 6 beneficios estatales y el otro 50% tiene más
de 6 beneficios.
25
Li – Ls Ni Mc Ni * Mc
1–5 26 3 78
5–9 25 7 175
9 – 13 22 11 242
13 – 17 14 15 210
17 – 21 8 19 152
N 95 857/95=0,921
La media
La variable es continua.
LA MEDIA ES 0,921.
MODA:
Mo = Li + i d1
d1 + d2
Buscar el intervalo modal, donde está el Ni más alto.
Li= 1. Es límite real porque la variable es continua, si fuera discreta se le resta 0.5.
i = 4 (Ls – Li). La variable es continua, no se le resta nada.
d1 = 26. No hay con que restarlo arriba.
d2 = 1.- Resta de 26 – 25.
Mo = 1 + 4 26
26 + 1
Mo = 1 + 4 26/27
Mo = 1 + 4 * 0.963
Mo = 1 + 3,852
Mo = 4,852.- La mayoría de los hijos tiene 4,852 años.- Se deja en decimal porque la
variable es continua.
26
LA MEDIANA
Para calcular la mediana de datos no agrupados, inevitablemente debo agruparlos
en intervalos.
Fórmula para elaborar intervalos de variables “discretas”.
AT :(15 – 1) + 1
14 + 1 = 15
i : 15/3 = 5
Ls = Li + (5-1)
1 + 4 = 5 (limite superior del Primer intervalo)
La Mediana:
Li – Ls Ni Nia
1-5 14 14
6 – 10 4 18
11 - 15 2 20
N 20
Me = 0.5 + 5 20 - 0
14 2
Me = 0.5 + 5 20
14 2
Me = 0,5 + 0.357 * 10
Me = 0,5 + 3.57
Me = 4,07 = 4 porque la variable es discreta.
El 50% de las personas tiene bajo 4 miembros por hogar y el otro 50% tiene sobre 4
miembros por hogar.
28
Pk = Li + i K*N - Nia¯¹
Esta fórmula se usa cuando
Ni 100 se da el porcentaje
(percentil) y se necesita
sacar el valor exacto dentro
del intervalo.
Li = Limite real inferior del intervalo del percentil (restar 0,5 si es aparente).
N = Total de casos.
EJEMPLO:
N° de Novios Ni Nia % %a
1–3 20 20 10 10
4–6 40 60 20 30
7–9 80 140 40 70
10 – 12 40 180 20 90
13 – 15 20 200 10 100
N 200 100
Fórmula:
Pk = Li + i K*N - Nia¯¹
Ni 100
N° de Novios Ni Nia % %a
1–3 20 20 10 10
4–6 40 60 20 30
7–9 80 140 40 70
10 – 12 40 180 20 90
13 – 15 20 200 10 100
N 200 100
* Todo lo demás sacar igual al anterior, pero esta vez del intervalo de casos.
K= 11 – 9,5 * 40 + 140
3 * 100
200
K= 1,5 * 40 + 140
3 * 100
200
K= 0,5 * 40 + 140
200 * 100
K = 20 * 140
200 * 100
31
K = 160 * 100
20
K = 0,8 * 100
K = 80%
Respuesta: Las personas que han tenido “hasta” 11 novios corresponden al 80% del
total (mirar en %a).
Li – Ls Ni Nia % %a
1–5 26 26 27,4 27,4
5–9 25 51 26,3 53,7
9 – 13 22 73 23,2 76,9
13 – 17 14 87 14,7 91,6
17 - 21 8 95 8,4 100
N 95 100
Pk = Li + i K*N - Nia¯¹
Ni 100
Pk = 9 + 4 60 * 95 – 51
22 100
Pk = 9 + 4 5700 - 51
22 100
Pk = 9 + 0,182 57 – 51
Pk = 9 + 0,182 * 6
Pk = 9 + 1,092
Pk = 10,092 años.
El 60% de los hijos tiene “hasta” 10,092 años.
32
Li – Ls Ni Nia % %a
1–5 26 26 27,4 27,4
5–9 25 51 26,3 53,7
9 – 13 22 73 23,2 76,9
13 – 17 14 87 14,7 91,6
17 - 21 8 95 8,4 100
N 95 100
K= X – Li Ni + Nia¯¹
i * 100
N
K= 18 – 17 8 + 87
4 * 100
95
K = 0,25 * 8 + 87 * 100
95
K = 2 + 87 * 100
95
K = 89 * 100
95
K = 0,937 * 100
K = 93,7%
Los hijos que tienen hasta 18 años corresponden al 93,7% de los casos.
33
MEDIDAS DE VARIABILIDAD
20 – 18 – 20 – 18 22 – 16 – 16 – 22
EL RANGO
MAX – MIN
14 – 15 – 16 – 16 – 17 – 20
20 – 14 = 6 (Rango).
34
X X-X
9 9–6=3 3² = 9
7 7–6=1 1²= 1
6 6–6=0 0² = 0
6 6–6=0 0² = 0
5 5 -6=1 1² = 0
4 4–6=2 2² = 4
3 3–6=3 3² = 9
∑= 24
* Acá no hay números negativos, los que salgan negativos, hay que cambiarlos a
POSITIVOS. Ejemplo en este caso 5 – 6 = -1.- Debo transformarlo a 1.
∑ = 24.-
∑( ̅)
S= √
35
S= √
S=√
Se interpreta como: “Las edades de los casos se desvían, en promedio 1,852 años,
respecto a la media.
La desviación no debería ser más del 20% de la media o sino representaría una alta
dispersión y escasa representatividad de la media.
Para verificar si la desviación está dentro del 20% o es mayor, hay que hacer lo siguiente:
X=6
20% = 1,2 años. La desviación típica debería haber sido como máximo 1,2 años por lo
tanto, no es representativo, porque 1,852 es más que 1,2.- NO REPRESENTATIVO.
Para lograr el 20% se debe multiplicar la media por 0,2.- 6 * 0,2 = 1,2.
DESVIACIÓN TÍPICA
Li – Ls Ni Mc Ni * Mc Mc² Ni * (Mc²)
7–9 5 8 40 64 320
10 - 12 4 11 44 121 484
13 - 15 6 14 84 196 1176
16 – 18 2 17 34 289 578
N 17 202 / 17 = ∑= 2558.
11,882 (la Sumatoria
media) de todos los
Ni * Mc²
* Nota: La media la profesora la redondeó a 12, ya que quiere que trabajemos con
números enteros y en la prueba ella nos dará la media.
Al hacer la tabla anterior ya tenemos todo listo, es sólo traspasar los datos a la fórmula por
eso debemos saber bien como hacerla para después solo traspasar los datos.
S= √∑ ̅̅̅
S=√
S=√
S=√ Varianza
X = 12.
S = 2,544
Ojo: Para lograr el 20%. Debo multiplicar el promedio (la media) por 0,2.- 12 * 0,2 = 2,4.-
X = 800.000.-
S = 350.000.-
20% = 160.000.-
COEFICIENTE DE VARIACION
Grupo A: Grupo B:
Promedio = 4,3 Promedio = 4,3
Desviación típica de 2,5 Desviación típica de 1,2.
CV= 58,1 CV= 27,9
Fórmula:
CV = S * 100
EJERCICIOS EN CLASES
Li - Ls Ni Mc Mc * Ni Mc² Ni * (Mc²)
1–5 26 3 78 9 234
5–9 25 7 175 49 1225
9 – 13 22 11 242 121 2662
13 – 17 14 15 210 225 3150
17 - 21 8 19 152 361 2888
N 95 857 / 95 = ∑ = 10159.
9,021 La media
S √∑ ̅̅̅
S= √
S=√
S=√ Varianza
S= = Desviación típica.
X=9
S = 5,093.-
CV = S * 100
CV = 5,093 * 100
CV = 56,6
41
GUIA EN CLASES
X ̅ X²
3,4 1,6 2,56
3,6 1,4 1,96
4,3 0,7 0,49
4,4 0,6 0,36
4,5 0,5 0,25
4,5 0,5 0,25
4,8 0,2 0,04
4,9 0,1 0,01
4,9 0,1 0,01
4,9 0,1 0,01
5,0 0 0
5,0 0 0
5,1 0,1 0,01
5,4 0,4 0,16
5,5 0,5 0,25
6,5 1,5 2,25
6,6 1,6 2,56
∑ = 11,17
∑( ̅)
S= √
S=√
42
S=√
̅=5
S = 0,811
20% = 1
Es representativa.
2.- Frente a los problemas de obesidad en los escolares, se procedió a consultar por
los pesos de un grupo de alumnos de 5° básico, obteniendo la siguiente
distribución.
a) Calcule la desviación típica.
b) ¿Qué porcentaje de escolares pesa hasta 50 Kg?
c) El 75% de los escolares ¿Hasta qué peso tienen?
RANGO = 3,2
* Profesora da promedio de 43.
Desviación típica:
Fórmula para datos AGRUPADOS.
√∑ ̅̅̅
43
S=√
S=√
S=√
S = 8,925 Desviación típica.
Calcular el 20%
̅ = 43
S = 8,925
20% = 8,6
No es representativo.
K= 50-45,6 13 + 35
10 * 100
53
K = 0,44 * 13 + 35 * 100
53
K = 5,72 + 35 * 100
53
K = 40,72 * 100
53
K = 0,768 * 100 = 76,8%
Los escolares que pesan hasta 50 kilos corresponden al 76,8% de los casos.
44
Pk = Li + i K*N - Nia¯¹
Ni 100
Pk = 45,6 + 10 75 * 53 - 35
13 100
Pk = 45,6 + 0,769 39,75 – 35
Pk = 45,6 + 0,769 * 4,75
Pk = 45,6 + 3,653
Pk = 49,253.-
El 75% de los escolares pesa hasta 49,253 kilos.
S = 3450,004
20% = 9356,174
El promedio es representativo.-
45