Está en la página 1de 45

1

ESTADÍSTICA

¿Qué es la Estadística?

Procedimientos para clasificar, calcular, analizar y resumir información numérica que se


obtiene de manera sistemática.

Proporcionan información empírica para la toma de decisiones.

* Conseguir los números de manera estructurada, ordenada.

* Empírica (comprobable).

* Tomar buenas decisiones para intervenir en lo social.

Fenómenos Determinístico y No Determinístico

Fenómenos Determinístico: Siempre se conoce el resultado, porque hay una respuesta


posible (no hay más opciones).

Fenómenos no Determinístico: Son aquellos aleatorios o de aza, no se pueden anticipar


sus efectos o resultados. (Estadística).

Las Variables

Una variable es una propiedad que puede variar y cuya variación es susceptible de
medirse u observarse.

Ejemplo:

Variable: Sexo

Valores de la variable: a) Mujer b) Hombre.

Variable: Edad

Valores de la variable: 20, 30, 40, 50 años


2

Clasificación de las variables:

1° Criterio: Según su naturaleza.

CUALITATIVAS CUANTITATIVAS

El número es artificial El número es real


Es solo para codificar, nombrar, ordenar. Las variables se expresan mediante
cantidades numéricas.
Ejemplo: Estado Civil. Ejemplo: N° de dormitorios: 1, 2, 3 …
1) Soltera
2) Casada
3) Divorciada

* Para cada uno hay una formula. Ejemplo en la Cuantitativa puedo sacar promedios, en la cualitativa no.

* Cualitativas: Son identificatorios.

2° Criterio: Según sus valores (solo para cuantitativas).

DISCRETA O CATEGÓRICA CONTINUA

Sus valores no admiten fraccionamiento Variables que en sus valores pueden


(números enteros) tener números decimales o fracciones.
Ejemplo: Cantidad de miembros de la Ejemplo: Peso, talla, ingresos.
familia
3

3° Criterio: Nivel de Medición de la Variable:

CUALITATIVAS CUANTITATIVAS

Nominales Ordinales Intervalar Razón


Los valores no tienen Las Categorías Por lo general son El cero es real, es decir
orden ni jerarquía mantienen un orden y respuestas abiertas. que el cero implica
jerarquía. ausencia de esa
variable
El número para Nivel Educacional: El cero es arbitrario, es Esta clasificación es
categorizar es solo 1) Sin escolaridad. decir, es un valor más, más común para las
identificatorio. 2) Pre-básica. no implica que haya ciencias sociales.
3) Básica. ausencia de la variable.
4) Media Se puede hacer
5) Superior operaciones
aritméticas básicas
Ejemplo Ejemplo: 0° La Ejemplo: 0, no tiene
Sexo 1) mujer temperatura, existe hijos
2)Hombre hace frio.

Estado Civil: 1) Soltero


2) Casado

Ejercicio en Clases:

Clasifique las variables según los 3 criterios vistos.

RUT EDAD PROVINCIA

16.646.949-0 20 a) Valparaíso
10.947.833-3 33 b) Marga-Marga
18.938.745-0 96 c) San Antonio
76 d) Los Andes
26 e) San Felipe
32 f) otro
Cualitativa, ordinal (tiene Cuantitativa, continua, Cualitativa, nominal.
un orden) razón.
Continua, porque hay
meses y días asociado a
los años (no es un numero
entero).
4

Aplicando un cuestionario a 27 personas obtengo los siguientes datos:

¿Cuál es su sexo?

1) Hombre

2) Mujer

“N” = Total

FRECUENCIA ABSOLUTA “Ni”:

Es la cantidad de casos “por cada categoría”.

Sexo Ni
Mujer 15
Hombre 12
Total (N) 27

* Es la frecuencia que existe por cada categoría

* Conteo de casos por cada una de las categorías.

* “N”: Significa población, en este caso el total.

FRECUENCIA RELATIVA (Pi = Ni/N):

Es la proporción de la frecuencia absoluta con respecto al tamaño de la muestra.

Sexo Ni Pi % = Pi * 100
Mujer 15 15/27= 0.6 60%
Hombre 12 12/27= 0.4 40%
Total (N) 27 27/27= 1 100%

La frecuencia relativa es Pi, para lograr el Pi debo dividir el “Ni” (Frecuencia absoluta) con
el “N” total y anotarlo al lado.

Para lograr el porcentaje, debo tener el resultado de “Pi” y multiplicarlo por 100.

Pi = Ni/N divido cada “Ni” por el total “N”.

El “Pi” en la última tabla siempre debe terminar en 1 y 1*100= 100% de los casos.
5

* Esta tabla me sirve para analizar una variable cualitativa nominal. Con esta variable llego hasta acá en la tabla (hasta el
Pi *100) y puedo hacer un grafico “pero nada más”, no puedo hacer la siguiente tabla con la variable cualitativa nominal.

* Con la variable cualitativa ordinal (que viene más abajo) puedo avanzar más en la tabla como se muestra a
continuación.

FRECUENCIA ACUMULADA NIA:

Son las frecuencias que se van acumulando (sumando) en cada categoría, desde arriba
hacia abajo.

Se ocupa cuando hay una “Variable Cualitativa Ordinal”.

Asistencia Ni Pi % (Pi*100) Nia Pia %a

Nunca 20 20/60=0.3 30% 20 0.3 30%


A veces 30 30/60=0.5 50% 50 0.8 80%
Siempre 10 10/60=0.2 20% 60 1 100%
Total (N) 60 60/60= 1 100%

Nia “Frecuencia absoluta acumulada”: Implica acumular la categoría. Se obtiene por


ejemplo en la primera tabla de Nia poner el numero de Ni en este caso 20, luego ese 20, lo
sumo por el “Ni” que viene a continuación en este caso es 30, me da resultado 50, que
pongo en la segunda fila de la tabla “Nia”, luego a ese resultado, le sumo el de la tercera
fila del “Ni”, en este caso 10. Entonces 50+10 es 60, ese resultado lo pongo en la tercera
fila de “Nia” Y ESO ES.

Pia “Frecuencia relativa Acumulada”: En la primera tabla de “Pia” copio el resultado de


la primera tabla de “Pi”, en este caso 0.3, a este número le sumo el resultado de la
segunda tabla de “Pi”, en este caso 0.5, como resultado me da 0.8 que pego en la
segunda tabla de “Pia”, a este 0.8 le sumo el resultado que sigue de la tabla de “Pia”, 0.2 y
el resultado de 0.8+0.2 es 1. (Siempre debe dar 1).

%a: Porcentaje Acumulado: Mismos pasos anteriores pero con la tabla de porcentaje.
6

EJERCICIO EN CLASES

Frente a la variable: “Nivel de Escolaridad”.

a) Sin Escolaridad.

b) Educación Básica

c) Educación Media

d) Educación Superior.

Aplico un cuestionario a 30 personas obteniendo los siguientes resultados.

acaabbaabcccbbdbbbcbbbcbbcbdbb
a) 5
b) 16
c) 7
d) 2
Escolaridad Ni Pi (Ni/N) % (Pi*100) Nia Pia %a

Sin escolaridad 5 5/30= 0.167 16.7% 5 0.167 16.7%


Ed. Básica 16 16/30=0.533 53.3% 21 0.7 70
Ed.Media 7 7/30=0.233 23.3% 28 0.933 93.3%
Ed.Superior 2 2/30=0.067 6.7% 30 1 100
Total (N) 30 1 100%

* Siempre trabajar con 3 decimales, en caso de por ejemplo obtener este resultado:
0.16666666 (infinito), el “tercer decimal”, si es mayor a 5, aproximarlo, en este ejemplo
quedaría 0.167.- Otro ejemplo 1.77777777, 0.178.

Si por ejemplo quedara 0.33333333, es 0.33, ya que el decimal infinito es menor a 5.


7

Grafico de Barras o Diagrama de Barras:

Corresponde a barras rectangulares proporcionales a su frecuencia. Idealmente se usa


para variables nominales y ordinales.

Ejemplo de Gráfico de Barras (ideal para variables cualitativas).

120

100

80

60
110

40 62,15%
67

20 37,85%

0
Femenino Masculino

* Al ser variables cualitativas las barras deben ser separadas.


8

GRAFICO DE SECTORES:

Un grafico representa el 100% de los casos lo que a 360°. Ideal para variables cualitativas
o de pocas categorías.

Masculino 62%
Femenino 38%
Masculino: Femenino:
100% = 360° 100% = 360%
62% = X 38% = X
X = 223° X = 127°
* Se multiplica 62*360 y se divide por 100, * Se multiplica 38*260 y se divide por 100,
así se obtiene el resultado de X. así se obtiene el resultado de X.

Género
137 Femenino
223
Masculino

* Otra fórmula: La “torta” siempre es 3.6 (dividir 360/100), como la torta siempre va a ser
3.6 de inmediato lo multiplico.

Ejemplo de lo anterior 3.6*62= 223 (hombre) 3.6*38= 137 (mujer)

PICTOGRAMAS:

Se utilizan proporcionados a la frecuencia. Generalmente se emplea para representar


variables cualitativas.
9

TABLA DE CONTINGENCIA:

Puede ser para cualquier variable.

Sexo Si No Total
donante
Hombre 10 15 25
Mujer 18 12 30
Total 28 27 55

DONANTES
30

25

20

15 Si
No
10

0
Hombre Mujer
10

ESTADÍSTICA

TABLA DE FRECUENCIA PARA VARIABLE DISCRETA:

Elaboración de Intervalos (para datos numéricos no agrupados).

Ejemplo:

Cantidad de votantes en cada Junta de Vecinos de una provincia.

3-10- 3-20-35-45-8-5-7-35-6-56-45-45-7-19-12-34-67-8-7-6 -12- 34- 6- 18- 38- 6- 18- 38- 6-


65- 54- 43-2-4-24-17-15-13-7-8-8-5-7-9

AT= Amplitud Total

1.- Determinar la amplitud Total:

AT= (máxima – mínima) + 1 unidad

Ejemplo: (67 - 2) + 1 = 66

2.- Determinar el ancho del intervalo:

i = AT/N° de intervalo.

Ejemplo: 66/5 = 13,2 = 14 Siempre debemos subir a un entero, nuestro ancho va a ser
14.

3.- Confeccionar los Intervalos:

Para el primer intervalo

Límite Inferior (Li) = el valor mínimo. En este caso 2.

Al Li se le suma (i – 1) = 15.-

13

Entonces Li= 2 y Ls = 15

La distancia entre cada uno es 13.


11

Variable Discreta, limites aparentes (porque son números enteros).

Li Ls
2 15
16 29
30 43
44 57
58 71

Ahora confecciono Tabla:

Li Ls Ni Pi % Nia Pia %a
2 15 25 0.581 58.1% 25 0.581 58.1
16 29 5 0.116 11.6% 30 0.697 69.7
30 43 6 0.140 14% 36 0.837 83.7
44 57 5 0.116 11.6% 41 0.953 95.3
58 71 2 0.047 4.7% 43 1 100
N 43 1 100%

Se puede graficar en Gráfico de Barras y de Sectores (igual que las cualitativas).


12

TABLA DE FRECUENCIA PARA VARIABLE “CONTINUA”

Elaboración de intervalos para datos numéricos no agrupados.

Ejemplo peso en adolescentes:

52,23 – 67,8 – 45,32 – 77,2 – 76,59 – 65,73 – 82 – 65,68 – 71,45 – 60,7 – 48,25 – 59,85 –
63,27 – 57,5 – 68,3 – 73,2 – 55,74.

1.- Determinar la amplitud total: Unidad Le sumo


1 entero 1
AT = (máxima – mínima) + 1 unidad 1 decimal 0,1
2 decimales 0,01
AT = (82 - 45,32) + 0,01 = 36,69 3 decimales 0,001
*El decimal depende de cuantos decimales me den en la información, en este ejemplo el
mayores decimales no sobrepasan los 2.

2.- Determinar el ancho de los intervalos:

i = AT/N° de intervalos.

Ejemplo: 36,69/3 = 12,23 = 13 Nuevamente a numero entero para que no me falte en el intervalo.

3.- Confeccionar los Intervalos:

Para el primer intervalo

Límite inferior: mínimo, en este ejemplo 45,32.

Límite superior: mínimo + i (no se resta 1 como el anterior).

Entonces: Ls = 45,32 + 13 = 58,32.-


13

Ahora confecciono la tabla:

Li Ls Ni Pi % Nia Pia %a

45,32 58,32 5 0.294 29.4% 5 0.294 29.4%

58,32 71,32 7 0.412 41,2% 12 0.706 70.6%

71,32 84,32 5 0.294 29,4% 17 1 100%

N 17 1 100%

Variable continua
Limites reales
Se repite el Ls con el Li siguiente.
* Si sale un numero que está en ambos limites (Li – Ls) no se cuenta 2 veces, solo se
suma en el intervalo del Li.
14

EJERCICIO EN CLASES

Con las siguientes observaciones respecto al porcentaje PSU de un grupo de estudiantes.


455,0 – 770,56 – 345,6 – 654,8 – 450,3 – 273,99 – 457,89 – 636,90 – 688,7 – 623,8 –
545,8 – 432,1 – 564,9 – 345,9 – 657,8 – 456,6 – 456,34 – 348,98.-
Clasifique la Variable: Cuantitativa continua.
Elabore una tabla de frecuencia con 3 intervalos.
¿Qué porcentaje tiene entre 439,99 y 605,99 puntos? Respuesta 66.7%

1.- Determinar la amplitud total:


AT = (máxima – mínima) + 1 unidad.
(770,56 – 273,99) + 0,01 = 496,58.- AT

2.- Determinar el número de intervalos:


i = AT/N°
i = 496,58 / 3 = 165,527 = 166.- i.

3.- Confeccionar los intervalos.


Li: 273,99
Ls: (mínimo + i) = 439,99
Ahora a elaborar la tabla:

Li Ls Ni Pi % Nia Pia %a

273,99 439,99 5 0,278 27,8% 5 0.278 27.8%

439,99 605.99 7 0.389 38,9% 12 0.667 66.7%

605,99 771,99 6 0.333 33.3 18 1 100%

N 18 1 100
15

CLASE N°5

Segmento de tallo y hoja.

Polígono de frecuencia e Histograma.

Ejemplo: 16 – 40 – 122 – 1001.

La última unidad es la hoja. La profe va a determinar el punto de corte en este caso en


unidad.

Tallo Hoja
1 6
4 0
12 2
100 1

ESQUEMA DE TALLO Y HOJA

Cantidad de votantes por Junta de Vecinos:

3-10-3-20-34-45-8-5-7-35-6-56-45-45-7-19-12-34-67-8-7-6-12-34-6-18-38-6-65-54-43-2-4-
24-17-15-13-7-8-8-5-7-9.-

1.- Ordenar las observaciones de menor a mayor.

2.- Elegimos un número de dígitos a la derecha (hojas). Ejemplo 1 digito.

3.- Separamos el número y lo que antecede el tallo.

2-3-3-4-5-5-6-6-6-6-7-7-7-7-7-8-8-8-8-9-10-12-12-13-15-17-18-19-20-24-34-34-34-35-38-
43-45-45-45-54-56-65-67.-

Tallo Hoja
0 2-3-3-4-5-5-6-6-6-6-7-7-7-7-7-8-8-8-8-9
1 0-2-2-3-5-7-8-9
2 0-4
3 4-4-4-5-8
4 3-5-5-5
5 4-6
6 5-7
16

HISTOGRAMA

Sirve para variables numéricas (cuantitativas) continuas.

En el eje vertical se encuentran las frecuencias y en el horizontal las categorías


(generalmente en intervalos)

Cuando se unen los puntos medios (marca de clase) es un polígono de frecuencia.

Grafico ideal para variables cuantitativas continuas.

Van pegadas, porque son variables continuas.

El polígono de frecuencia se logra cuando marco el punto medio de la barra.


17

MEDIA ARITMÉTICA

FÓRMULAS MEDIA:

1.- Media para datos agrupados:

X = ∑ NiMc

Li – Ls Ni Mc (Li+Ls/2) Ni * Mc
2-4 4 3 12
5-7 3 6 18
8 - 10 2 9 18
N9 48/9 = 5,3 (la
media)

∑ = Sumatoria

X = Promedio

Xi = Sumatorio de casos.

Mc = Marca de Clases

* La media y el promedio aritmético es lo mismo.

* Se le llama datos agrupados porque están ordenados en intervalos.

* El Mc es el punto medio, es como el promedio del intervalo.

Para hacer la tabla:


Debo tener listos los intervalos con el Ni. El Mc es la suma de Li + Ls / 2. Por cada
intervalo. Luego la segunda tabla debo multiplicar el Ni * Mc y el total dividirlo por el N.
18

Media para datos NO agrupados:

X = ∑ Xi
N
Ejemplo: 4 + 5 + 5 + 10 = 24 / 4 = promedio = 6 (es por ejemplo cuando saco el promedio
de mi nota, sumo todas y después las divido).

* Depende de la variable si dejo decimal.


* Si tengo muchos casos debo hacer intervalos.

EJERCICIO EN CLASES

Li – Ls Ni Mc (Li + Ls / 2) Ni * Mc
273,99 – 439,99 5 356,99 1784,95
439,99 – 605,99 7 522,99 3660,93
605,99 – 771,99 6 688,99 4133.94
N 18 9579,82 / 18 =
532,212 (la media)

* Resultado final con 3 dígitos.


19

FORMULA MODA

 Para datos no agrupados “es el valor que más se repite”.


 Para datos agrupados:

Mo = Li + i d1

d1 + d2

1.- Buscar el Intervalo Modal: Donde está el Ni más alto.

Li = Limite real inferior del intervalo modal (si es límite aparente se le resta 0.5.

* Los limites reales son los límites de la variable continua, a los limites reales se les debe dejar tal como están. A los que
se les resta el 0.5 son a las Variables Discretas (números enteros).

i = Ancho del intervalo. Ls – Li +1 (para variable discreta).

d1 = Diferencia (resta) entre la frecuencia absoluta del intervalo modal y del intervalo
anterior.

d2 = Diferencia (resta) entre la frecuencia absoluta del intervalo modal y del intervalo
posterior.
20

Ejemplo:

Li – Ls Ni
2–4 4
5-7 3
8 - 10 2
N 9

Li = 1,5. Le resté 0.5 ya que la variable es discreta.


i = 3. (Ls – Li + 1) o “con las manos” en las variables discretas parto con el mismo numero
2-3-4 = 3 (hay 3 números).
d1 = 4. Se toma el Ni del intervalo modal y se le resta el anterior intervalo. En este caso no
hay por eso pongo el mismo.
d2 = 4 – 3 = 1. Se le resta el intervalo de abajo del modal.

AHORA CONFECCIONO LA MODA:

Mo = Li + i d1
d1 + d2

Mo = 1,5 + 3 4
4+1
Mo = 1,5 + 3 4/5
Mo = 1,5 + 3 * 0.8
Mo = 1,5 + 2,4
Mo = 3.9 = La moda es 3.9.
21

FORMULA MEDIANA

La Mediana indica donde está el dato central (la mitad). El 50% menor a ese dato y el 50%
mayor a ese dato.

1.- Identificar el intervalo donde se encuentra la Mediana. N/2. Debo mirar en la Nia.

Fórmula para datos agrupados:

Me = Li + i N - Nia¯¹

Ni 2

Li = Limite real inferior del intervalo de la mediana. Al límite aparente (variable discreta) se
le resta 0.5. Si la variable es continua se deja igual.

i = Ancho del intervalo.

Ni = Frecuencia absoluta del intervalo de la Mediana.

N/2 = Total de casos dividido por 2.

Nia ¯¹ = Frecuencia acumulada anterior al intervalo de la Mediana.

* En datos no agrupados se busca el 50% en Nia (deben estar ordenados de menor a


mayor).
22

Ejemplo: Variable discreta

Li – Ls Ni Nia
2–4 4 4
5–7 3 7
8 - 10 2 9
N 9

La mediana es 9/2 = 4,5.- La mediana está en el segundo intervalo, con ese voy a
trabajar (intervalo mediana). Se busca donde el 4,5 alcance en la Nia.

Li= 4,5. Le resté 0.5 al 5, ya que la variable es discreta.

i = 3. Ls – Li + 1. La variable es discreta así que puedo hacer esa fórmula.

Ni = 3. Frecuencia absoluta del intervalo de la mediana.

N/2 = 4.5. Total de casos dividido por 2.

Nia¯¹= 4. Frecuencia acumulada (Nia) anterior a mi intervalo mediana.

Formula:

Me = Li + i N - Nia¯¹
Ni 2

Me = 4,5 + 3 9–4

3 2

Me= 4,5 + 3 4,5 -4

Me = 4,5 + 1 * 0.5

Me = 4,5 + 0,5

Me = 5.- La mediana es 5.-


23

Ejercicio:
Beneficios Estatales que tienen los Adultos Mayores. Calcule Moda y Mediana.

Li – Ls Ni
1–5 29
6 – 10 28
11 - 15 6
N 63

La variable es discreta
Moda
El rojo es mi Intervalo Modal porque tiene más Ni (más casos). Se trabaja con el NI
Moda:
Mo = Li + i d1
d1 + d2

Li= 0.5. (La variable es discreta, por lo tanto es Límite aparente, le resto 0.5).
i = 5 (Ls – Li +1) porque la variable es discreta. Para la variable continua solo (Ls-Li),
no le resto el 1.
d1= 29. No le resté nada porque arriba no hay nada es 0. Recordar que en la Moda es
el Ni.
d2= 1. Resta del 29 y 28 (Ni).

Mo = 0.5 + 5 29
29 + 1
Mo = 0.5 + 5 29
30
Mo = 0,5 + 5 * 0.967
Mo = 0,5 + 4,835
Mo = 5.335 = LA MODA.
La mayoría de los adultos mayores tienen en promedio 5 beneficios estatales. Como
la variable es discreta, debo responder así. Cierro el decimal porque la variable es
discreta.
24

Ahora calculo la MEDIANA de la misma tabla anterior. Debo sacar el Nia.

Li – Ls Ni Nia
1–5 29 29
6 – 10 28 57
11 - 15 6 63
N 63

1.- Identificar el Intervalo donde se encuentra la mediana. Esto se logra dividiendo el


N/2. En este caso da como resultado 31.5. Que debo buscarlo en el Nia.

Me = Li + i N - Nia¯¹
Ni 2
Li= 5.5. Límite inferior de la Mediana. Si es variable discreta resto 0,5.
i = 5. (Ls – Li + 1).
Ni = 28. Frecuencia absoluta “Ni” del intervalo de la mediana.
Nia¯¹ = 29. Frecuencia Acumulada “Nia” del intervalo anterior de la mediana.

Me = 5.5 + 5 63 – 29
28 2
Me= 5,5 + 0.179 31.5 – 29

Me = 5,5 + 0,179 * 2,5

Me = 5,5 + 0, 448

Me = 5,948.- La Mediana es igual a 6 porque la variable es discreta.

El 50% de los adultos tienen menos de 6 beneficios estatales y el otro 50% tiene más
de 6 beneficios.
25

GUIA DE TRABAJO EN CLASES

En base a las observaciones de edades de los hijos de mujeres temporeras de la ciudad


de Rinconada. Calcule e interprete la MEDIA Y LA MODA.

Li – Ls Ni Mc Ni * Mc
1–5 26 3 78
5–9 25 7 175
9 – 13 22 11 242
13 – 17 14 15 210
17 – 21 8 19 152
N 95 857/95=0,921
La media

La variable es continua.

LA MEDIA ES 0,921.

MODA:
Mo = Li + i d1
d1 + d2
Buscar el intervalo modal, donde está el Ni más alto.
Li= 1. Es límite real porque la variable es continua, si fuera discreta se le resta 0.5.
i = 4 (Ls – Li). La variable es continua, no se le resta nada.
d1 = 26. No hay con que restarlo arriba.
d2 = 1.- Resta de 26 – 25.

Mo = 1 + 4 26
26 + 1
Mo = 1 + 4 26/27
Mo = 1 + 4 * 0.963
Mo = 1 + 3,852
Mo = 4,852.- La mayoría de los hijos tiene 4,852 años.- Se deja en decimal porque la
variable es continua.
26

2.- En base a las siguientes observaciones de cantidad de miembros por hogar de


las mujeres temporeras de la ciudad de Rinconada, calcule e interprete la media y la
mediana.
2-1-3-4-1-10-15-12-2-4-3-4-5-4-3-8-7-6-5-3
La media:
102 / 20 = 5.1= 5 LA MEDIA. Como la variable es discreta. Debo decir que el
promedio de miembros por hogar de las temporeras de la ciudad de Rinconada en
5.- Debo cerrar la variable porque es discreta.

LA MEDIANA
Para calcular la mediana de datos no agrupados, inevitablemente debo agruparlos
en intervalos.
Fórmula para elaborar intervalos de variables “discretas”.
AT :(15 – 1) + 1
14 + 1 = 15
i : 15/3 = 5
Ls = Li + (5-1)
1 + 4 = 5 (limite superior del Primer intervalo)
La Mediana:

Li – Ls Ni Nia
1-5 14 14
6 – 10 4 18
11 - 15 2 20
N 20

Lo primero que debo hacer es N/2 es 10. Y buscar la mediana en la “Nia”


Me = Li + i N - Nia¯¹
Ni 2
27

Li= 0,5. Como la variable es discreta le resto 0.5.


i = 5. Como la variable es discreta es Ls – Li + 1.
Ni = 14. Frecuencia absoluta (Ni) del intervalo de la mediana.
N/2 = 10. Total de casos dividido por 2.
Nia¯¹ = 0. Arriba de la frecuencia acumulada del intervalo de la mediana NO HAY NADA,
por lo tanto es 0. OJO no confundir, no es como la moda que se restan, acá se copia la
frecuencia acumulada anterior.

Me = 0.5 + 5 20 - 0
14 2
Me = 0.5 + 5 20
14 2
Me = 0,5 + 0.357 * 10
Me = 0,5 + 3.57
Me = 4,07 = 4 porque la variable es discreta.

El 50% de las personas tiene bajo 4 miembros por hogar y el otro 50% tiene sobre 4
miembros por hogar.
28

FORMULA PERCENTILES (PORCENTAJES)

Pk = Li + i K*N - Nia¯¹
Esta fórmula se usa cuando
Ni 100 se da el porcentaje
(percentil) y se necesita
sacar el valor exacto dentro
del intervalo.

1° es buscar el intervalo donde está el percentil (se busca en %a).

K = Esto es el percentil (porcentaje) que me dan.

El resto de la fórmula es igual a la Mediana.

Li = Limite real inferior del intervalo del percentil (restar 0,5 si es aparente).

i = Ancho del intervalo.

Ni = Frecuencia absoluta del intervalo del percentil.

N = Total de casos.

Nia¯¹ = Frecuencia absoluta anterior a la del percentil.


29

EJEMPLO:

¿Cuántos novios ha tenido el 38% de los casos?

N° de Novios Ni Nia % %a
1–3 20 20 10 10
4–6 40 60 20 30
7–9 80 140 40 70
10 – 12 40 180 20 90
13 – 15 20 200 10 100
N 200 100

* El 38% debo buscar donde me alcanza en el porcentaje acumulado (%a).

Fórmula:

Pk = Li + i K*N - Nia¯¹

Ni 100

Li = 6,5 (limite aparente del intervalo del porcentaje


i = 3 Ancho del intervalo, variable discreta (Ls – Li + 1).
Ni = 80, del intervalo del porcentaje.
K = 38. Porcentaje que me dan.-
N = 200, número de casos.
Nia¯¹ = 60. Frecuencia acumulada anterior al intervalo percentil.

P38 = 6,5 + 3 38 * 200 - 60


80 100
P38 = 6,5 + 3 7600 - 60
80 100

P38 = 6,5 + 0,038 76 – 60


P38 = 6,5 + 0,038 * 16
P38 = 6,5 + 0,608

P38 = 7,108 = 7 Debo dejar numero entero porque la variable es discreta.

Respuesta: El 38% de los casos ha tenido “hasta” 7 novios.-


30

Esta fórmula sirve cuando


K= X – Li Ni + Nia¯¹
nos dan el valor (dato exacto)
i * 100 y necesitamos sacar el
porcentaje.
N

N° de Novios Ni Nia % %a
1–3 20 20 10 10
4–6 40 60 20 30
7–9 80 140 40 70
10 – 12 40 180 20 90
13 – 15 20 200 10 100
N 200 100

¿QUÉ PORCENTAJE DE CASOS HA TENIDO HASTA 11 NOVIOS?

1° Se ubica el intervalo donde está el valor que me interesa en “LOS INTERVALOS”.

X = 11 (valor que me dan).

* Todo lo demás sacar igual al anterior, pero esta vez del intervalo de casos.

K= 11 – 9,5 * 40 + 140
3 * 100
200
K= 1,5 * 40 + 140
3 * 100
200
K= 0,5 * 40 + 140
200 * 100
K = 20 * 140
200 * 100
31

K = 160 * 100
20
K = 0,8 * 100
K = 80%
Respuesta: Las personas que han tenido “hasta” 11 novios corresponden al 80% del
total (mirar en %a).

Ejercitación en base a edades de los hijos de mujeres temporeras de la ciudad de


Rinconada.-

Li – Ls Ni Nia % %a
1–5 26 26 27,4 27,4
5–9 25 51 26,3 53,7
9 – 13 22 73 23,2 76,9
13 – 17 14 87 14,7 91,6
17 - 21 8 95 8,4 100
N 95 100

¿Hasta qué edad tiene el 60% de los hijos?

Pk = Li + i K*N - Nia¯¹

Ni 100

Pk = 9 + 4 60 * 95 – 51
22 100
Pk = 9 + 4 5700 - 51
22 100
Pk = 9 + 0,182 57 – 51
Pk = 9 + 0,182 * 6
Pk = 9 + 1,092
Pk = 10,092 años.
El 60% de los hijos tiene “hasta” 10,092 años.
32

Los hijos que tienen 18 años ¿En qué porcentaje se encuentran?

Li – Ls Ni Nia % %a
1–5 26 26 27,4 27,4
5–9 25 51 26,3 53,7
9 – 13 22 73 23,2 76,9
13 – 17 14 87 14,7 91,6
17 - 21 8 95 8,4 100
N 95 100

K= X – Li Ni + Nia¯¹
i * 100
N

K= 18 – 17 8 + 87

4 * 100

95

K = 0,25 * 8 + 87 * 100

95

K = 2 + 87 * 100

95

K = 89 * 100

95

K = 0,937 * 100

K = 93,7%

Los hijos que tienen hasta 18 años corresponden al 93,7% de los casos.
33

MEDIDAS DE VARIABILIDAD

Indican la dispersión de los datos en la escala de medición.

Población A: Promedio 19 Población B: Promedio 19

20 – 18 – 20 – 18 22 – 16 – 16 – 22

 Menor dispersión.  Mayor dispersión


 Menor variabilidad  Mayor variabilidad
 Mayor homogeneidad  Mayor heterogeneidad.

* Cuando hay tendencia central debemos acompañarlo de una medida de variabilidad.

* Cuando saco promedio debo sacar medidas de variabilidad.

EL RANGO

Es la diferencia entre la puntuación mayor y la puntuación menor.

MAX – MIN

14 – 15 – 16 – 16 – 17 – 20

20 – 14 = 6 (Rango).
34

LA DESVIACION ESTANDAR O DESVIACION TIPICA

 Para datos NO AGRUPADOS:

1.- Se calcula la media (promedio) para la variable. En este ejemplo 6 años.


2.- Se determina la desviación de cada dato con respecto a la media.
3.- Se eleva al cuadrado cada desviación.
La media de este caso es 5,7. Pero la Profesora quiere que trabajemos Números enteros
en este ejemplo por lo tanto la MEDIA ES 6.

X X-X
9 9–6=3 3² = 9
7 7–6=1 1²= 1
6 6–6=0 0² = 0
6 6–6=0 0² = 0
5 5 -6=1 1² = 0
4 4–6=2 2² = 4
3 3–6=3 3² = 9
∑= 24

* Acá no hay números negativos, los que salgan negativos, hay que cambiarlos a
POSITIVOS. Ejemplo en este caso 5 – 6 = -1.- Debo transformarlo a 1.

* Siempre la desviación típica va acompañado a la media.

4.- Se obtiene la sumatoria de las desviaciones elevadas al cuadrado.

∑ = 24.-

5.- Se aplica la formula.

∑( ̅)
S= √
35

S= √

S=√

Hasta acá se llama “Varianza”. Cuando aun no aplico raíz cuadrada.

7.- Luego saco la raíz cuadrada.

S=√ = 1,852.- Esta es la desviación típica.

Se interpreta como: “Las edades de los casos se desvían, en promedio 1,852 años,
respecto a la media.

La desviación no debería ser más del 20% de la media o sino representaría una alta
dispersión y escasa representatividad de la media.

Para verificar si la desviación está dentro del 20% o es mayor, hay que hacer lo siguiente:

X=6

S = 1,852 años (desviación típica).

20% = 1,2 años. La desviación típica debería haber sido como máximo 1,2 años por lo
tanto, no es representativo, porque 1,852 es más que 1,2.- NO REPRESENTATIVO.

Para lograr el 20% se debe multiplicar la media por 0,2.- 6 * 0,2 = 1,2.

Hay que sacar el 20% al promedio SIEMPRE.


36

DESVIACIÓN TÍPICA

Para DATOS AGRUPADOS:

1.- Se obtiene la marca de clase de cada intervalo.


2.- Se calcula Ni * Mc.-
3.- Se obtiene la marca de clase elevada al cuadrado Mc².
4.- Se multiplica Ni * Mc².
5.- Se calcula la media (para datos agrupados). En el siguiente ejemplo 12.
6.- Se eleva la media al cuadrado. Ejemplo 12² = 144.-
7.- Se aplica la formula.

Li – Ls Ni Mc Ni * Mc Mc² Ni * (Mc²)
7–9 5 8 40 64 320
10 - 12 4 11 44 121 484
13 - 15 6 14 84 196 1176
16 – 18 2 17 34 289 578
N 17 202 / 17 = ∑= 2558.
11,882 (la Sumatoria
media) de todos los
Ni * Mc²

* Nota: La media la profesora la redondeó a 12, ya que quiere que trabajemos con
números enteros y en la prueba ella nos dará la media.

Al hacer la tabla anterior ya tenemos todo listo, es sólo traspasar los datos a la fórmula por
eso debemos saber bien como hacerla para después solo traspasar los datos.

* Tener presente que el que el promedio X se eleva al cuadrado para traspasar a la


fórmula, en este caso 12² = 12 * 12 = 144
37

Desviación Típica para datos agrupados:

S= √∑ ̅̅̅

S=√

S=√

S=√ Varianza

S = 2, 544 = DESVIACIÓN TIPICA.

Ahora debo calcular el 20% para verificar si es representativa.

X = 12.

S = 2,544

20% = 2,4.- No es representativo, es disperso.

Ojo: Para lograr el 20%. Debo multiplicar el promedio (la media) por 0,2.- 12 * 0,2 = 2,4.-

Ejemplo dado en clases:

Se supone que los chilenos en promedio tenemos un sueldo de $800.000.-

X = 800.000.-

S = 350.000.-

20% = 160.000.-

No es representativo porque no debería pasar los 160.000.- y en este caso es casi el


doble (350.000.-)
38

COEFICIENTE DE VARIACION

Me sirve para comparar 2 grupos (cual es el más representativo).

Calcule la variabilidad relativa de unos datos con respecto a otros.

Grupo A: Grupo B:
Promedio = 4,3 Promedio = 4,3
Desviación típica de 2,5 Desviación típica de 1,2.
CV= 58,1 CV= 27,9

CV = 2,5 * 100 CV = 1,2 * 100


4,3 4,3
CV = 58,1 CV = 27,9

Fórmula:

CV = S * 100

La distribución del grupo B es más representativo porque tiene menor coeficiente de


variabilidad (el de menor valor es SIEMPRE el más representativo).
39

EJERCICIOS EN CLASES

En base a edades de los hijos de las temporeras de la ciudad de Rinconada.

Li - Ls Ni Mc Mc * Ni Mc² Ni * (Mc²)
1–5 26 3 78 9 234
5–9 25 7 175 49 1225
9 – 13 22 11 242 121 2662
13 – 17 14 15 210 225 3150
17 - 21 8 19 152 361 2888
N 95 857 / 95 = ∑ = 10159.
9,021 La media

* Nota: La profesora pide trabajar con la media de 9 (entero).

¿Cuál es la desviación típica de este grupo?

1.- Calcular la media, y elevarla al cuadrado. 9² = 81.-

S √∑ ̅̅̅

S= √

S=√

S=√ Varianza

S= = Desviación típica.

X=9

S = 5,093.-

20% = 1,8.- NO ES REPRESENTATIVO.


40

Calcular el Coeficiente de variación.

* Sólo para aprender, ya que no hay otra muestra para compararla.

CV = S * 100

CV = 5,093 * 100

CV = 56,6
41

GUIA EN CLASES

1.- En una encuesta para determinar el rendimiento académico de los alumnos de


Aiep Viña del Mar, se les consultó por el promedio de notas obtenidos el 1°
semestre. Frente a las siguientes notas calcule e interprete: MEDIA, RANGO Y
DESVIACION TIPICA.

Datos no agrupados, por lo tanto se hace esta tabla:

Profesora pide trabajar con media de 5.-

X ̅ X²
3,4 1,6 2,56
3,6 1,4 1,96
4,3 0,7 0,49
4,4 0,6 0,36
4,5 0,5 0,25
4,5 0,5 0,25
4,8 0,2 0,04
4,9 0,1 0,01
4,9 0,1 0,01
4,9 0,1 0,01
5,0 0 0
5,0 0 0
5,1 0,1 0,01
5,4 0,4 0,16
5,5 0,5 0,25
6,5 1,5 2,25
6,6 1,6 2,56
∑ = 11,17

Fórmula para datos NO AGRUPADOS:

∑( ̅)
S= √

S=√
42

S=√

S = 0,811 Desviación típica.

Ahora debo calcular el 20%.

̅=5

S = 0,811

20% = 1

Es representativa.

2.- Frente a los problemas de obesidad en los escolares, se procedió a consultar por
los pesos de un grupo de alumnos de 5° básico, obteniendo la siguiente
distribución.
a) Calcule la desviación típica.
b) ¿Qué porcentaje de escolares pesa hasta 50 Kg?
c) El 75% de los escolares ¿Hasta qué peso tienen?
RANGO = 3,2
* Profesora da promedio de 43.

Li – Ls Ni Nia % %a Mc Ni * Mc Mc² Ni * Mc²


25,6 – 35,6 10 10 18,9 18,9 30,6 306 936,36 9363,6
35,6 – 45,6 25 35 47,2 66,1 40,6 1015 1648,36 41209
45,6 – 55,6 13 48 24,5 90,6 50,6 657,8 2560,36 33284,68
55,6 – 65,6 5 53 9,4 100 60,6 303 3672,36 18361,8
N 53 100 ∑=102219,08

Desviación típica:
Fórmula para datos AGRUPADOS.

√∑ ̅̅̅
43

S=√

S=√

S=√
S = 8,925 Desviación típica.

Calcular el 20%
̅ = 43

S = 8,925
20% = 8,6
No es representativo.

b) ¿Qué porcentaje de escolares pesa hasta 50 Kg?


K= X – Li Ni + Nia¯¹
i * 100
N

K= 50-45,6 13 + 35
10 * 100
53
K = 0,44 * 13 + 35 * 100
53
K = 5,72 + 35 * 100
53
K = 40,72 * 100
53
K = 0,768 * 100 = 76,8%

Los escolares que pesan hasta 50 kilos corresponden al 76,8% de los casos.
44

c) El 75% de los escolares ¿Hasta qué peso tienen?

Pk = Li + i K*N - Nia¯¹

Ni 100

Pk = 45,6 + 10 75 * 53 - 35
13 100
Pk = 45,6 + 0,769 39,75 – 35
Pk = 45,6 + 0,769 * 4,75
Pk = 45,6 + 3,653
Pk = 49,253.-
El 75% de los escolares pesa hasta 49,253 kilos.

3.- En relación a la variable ingreso per cápita.

Valparaíso Viña del Mar Quilpué


Promedio $46780,87 $255600,9 $120987
Desviación Típica $3450,004 $70089,87 35008,98

a) ¿Es representativo el promedio de ingreso per cápita en la ciudad de Valparaíso?


̅ = 46780,87

S = 3450,004
20% = 9356,174
El promedio es representativo.-
45

b) ¿Cuál de las 3 comunas tiene la distribución más representativa?

Valparaíso Viña del Mar Quilpué

CV = 3450,004 * 100 CV = 70089,87 * 100 CV = 35008,98 * 100


46780,87 255600,9 120987

CV = 0,074 * 100 CV= 0,274 * 100 CV = 0,289 * 100


CV = 7,4 CV = 27,4 CV= 28,9

Valparaíso tiene la distribución más representativa.

También podría gustarte