Está en la página 1de 78

ESTADÍSTICA

APLICADA

CLASE EN LÍNEA 1 – MÓDULO 1

Dra. Marlene Mercedes Astudillo


Vicente.
ESTADÍSTICA E INVESTIGACIÓN CIENTÍFICA.

Según Spiegel la estadística


"estudia los métodos científicos para recoger, organizar, resumir
y analizar datos, así como para sacar conclusiones válidas y
tomar decisiones razonables basadas en tal análisis".
ESTADÍSTICA
Recolecta, organiza, resume y
presenta los datos en forma
informativa

INFERNCIA DEL
RESULTADO

MUESTRA

DESCRIPTIVA

POBLACIÓN

INFERENCIAL Efectúa estimaciones


hipótesis y predicciones.
Universo

Población

Muestra

UNIDAD DE ANÁLISIS
TIPOS DE VARIABLE
Según la funcionalidad que tienen en la investigación, pueden ser:

• Es una variable cuyos valores


dependen de los valores que tome
DEPENDIENTE otra variable. Se representa en el eje
de ordenadas (y).

• Es una variable que su valor no


depende de otra variable. La variable
INDEPENDIENTE independiente suele representarse en
las gráficas en el eje de abscisas (x).

EJEMPLO:
En un estudio estadístico realizado en un distrito de Lima, se intenta dar a conocer que las personas que cumplen los
protocolos de seguridad tienen menos posibilidades de contagiarse con el COVID-19
EJEMPLO
En un estudio estadístico realizado en un distrito de Lima, se intenta dar a conocer que las
personas mayores de 18 años que cumplen los protocolos de seguridad tienen menos
posibilidades de contagiarse con el COVID-19.
Se considera como:
➢ Variable independiente: ………........................………………………
➢ Variable dependiente: …………………………………………………….
➢ Variable interviniente: ............................................................

CAUSA EFECTO

Variable independiente Variable interviniente Variable dependiente


VARIABLES CUALITATIVAS - CUANTITATIVAS
Según su medición existen dos tipos de variables:

•Sexo
Cualitativas •Modelo de zapatillas deportivas
 •Distrito en que vive
 (modalidad) •Deporte preferido

 •Número de hermanos
 •Núm.de aprobados en la 10 evaluación
Variables  Discretas •Núm de libros leídos trimestralmente
  •Num. de llamadas telefónicas diarias
Cuantitativas 
 
 (números)  •Tiempo diario delante del televisor
  •Tiempo de estudio
Continuas •Altura
•Peso
•Tiempo empleado en llamadas
Escalas de Medición

• Escala Nominal

 Escala Ordinal

 Escala de Intervalo

 Escala de Razón
• Escala Nominal: • Escala Ordinal:
Está asociada a variables Los valores de la variable que tienen un
cualitativitas, no se pueden ORDEN con un nivel específico, pero no
hacer operaciones se pueden hacer operaciones aritméticas
aritméticas entre sus entre ellas.
valores, pues éstos son
únicamente ETIQUETAS.
Ejemplo:
Ejemplo: sexo, código Pésimo – Malo – Regular – Bueno –
postal, número telefónico, Excelente
número al correr en un
maratón, deporte favorito, Primaria – Secundaria – Bachiller –
carrera a estudiar, etc. Licenciatura-Maestría-Doctorado

ETIQUETAS ORDEN
• Escala de Intervalo:
• Escala de Razón:
En ella existe un orden entre
los valores de la variable y La magnitud tiene SENTIDO
además una NOCIÓN DE FÍSICO, existe el cero
DISTANCIA aunque no se absoluto, existe orden, se
puedan realizar operaciones. puede determinar cuántas
El cero o punto de inicio no es veces es mayor uno que
único, es más bien un punto otro.
de referencia.

Ejemplo: Escalas de Ejemplo: peso, estatura,


temperatura, la edad de la edad, distancia, dinero, etc.
Tierra, la línea del tiempo de la
humanidad.
ORGANIZACIÓN DE LOS DATOS

• Una vez ordenados los datos, se acomodan en la


“Tabla de distribución de frecuencias o tabla de
frecuencias”.
• La tabla es básicamente una tabla de valores x,y,
dónde “x” representa el dato e “y” representa la
frecuencia.
• La frecuencia es el número de veces que
aparece cada dato.
• Hay dos clases de tablas de frecuencias:
• Para datos NO agrupados.
• Para datos agrupados.
TABLA DE FRECUENCIAS PARA DATOS NO AGRUPADOS
Clínicas

• EJEMPLO

Variable Frecuencia
Ricardo Palma IIII
Internacional IIIIII
San Pablo I III
Maison de San té IIII
Anglo Americana II
Cayetano Heredia IIII
San Felipe
I
FRECUENCIA ABSOLUTA
• Está formada por dos columnas: una para la variable
“xi” y la otra para su frecuencia “f”, a esta frecuencia
se le llama frecuencia absoluta o frecuencia
observada.
Xi f

Ricardo Palma 4
Internacional 7
San Pablo 3
Maison de San té 4
Anglo Americana 2
Cayetano Heredia 4
San Felipe 1
FRECUENCIA RELATIVA
4/25
xi f h F
• Por lo regular, se agregan
dos columnas: la de la Ricardo Palma 4 0,16 4
frecuencia relativa “h” y la Internacional 0,28 11
de la frecuencia 7
acumulada “H”. San Pablo 3 0,12 14

• La frecuencia relativa se Maison de San té 4 0,16 18


obtiene mediante el Siempre es
Anglo Americana 2 0,08 20
cociente de la frecuencia y el número
total de
el número total de datos, Cayetano Heredia 4 0,16 24 datos
esto es h = f/n.
San Felipe 1 0,04 25
• La frecuencia acumulada
se obtiene sumando las
Total ∑25 ∑1
frecuencias anteriores a
las frecuencias de un dato Siempre es 1

dado.
TABLA DE FRECUENCIAS PARA DATOS NO AGRUPADOS

xi f h F H %
Ricardo Palma 4 0,16 4 0,16 16%
Internacional 7 0,28 11 0,44 28%

San Pablo 3 0,12 14 0,56 12%


Maison de San té 4 0,16 18 0,72 16%

Anglo Americana 2 0,08 20 0,80 8%

Cayetano Heredia 4 0,16 24 0,96 16%

San Felipe 1 0,04 25 1 4%

Total 25 1 100%
GRÁFICO CIRCULAR
Ejemplo Clínicas

Color Frecuencia Conteo 4%


Ricardo Palma IIII 4 16% 16%
Internacional I I I I II 7 8%
San Pablo III 3 28%
16%
Maison de San té 4
IIII 12%
Anglo Americana II 2
Cayetano
Heredia
IIII 4 Recuerda:
San Felipe I 1 1% = 3,6º
100/25 = 4%
4%x 4 = 16%
4%x7 = 28%
GRÁFICO DE BARRAS
• La gráfica de barras se traza similar al Histograma,
sólo que las barras se dibujan separadas unas de
otras.
• La escala en el eje “x” es para mostrar categorías o
intervalos de números NO consecutivos.

60
Frecuencia absoluta

50

40

30

20

10

0
PERRO PAJARO
CONEJOS HAMSTER GATO
Excedrin Panadol Aspirina Ibuprofeno
PARA DATOS AGRUPADOS
• En ocasiones es conveniente acomodar los datos en
pequeños grupos de igual tamaño, llamados intervalos de
clase.
Límite inferior Límite superior

Intervalo de clase
38 – 42
43 – 47
Intervalos de clase.
48 – 52
53 – 57
58 – 62
63 – 67
MARCA DE CLASE
• Es el punto medio, se simboliza “xi”, se obtiene con:

Marca de clase = Límite inferior + límite superior


Límite inferior 2 Lím inf + Lim sup
Límite superior
2
Intervalo de clase Marca de clase “xi”
38 – 42 40
43 – 47 45 MARCA DE
48 – 52 50 CLASE

53 – 57 55
58 – 62 60
63 – 67 65
AMPLITUD ( A )
El tamaño del intervalo se obtiene siguiendo el siguiente
procedimiento:
1.) Para el número de clases o intervalos( K ), se utiliza las
siguiente fórmula:
 K = 1 + 3.3 log (n)
 Donde K = número aproximado de clases
 n = número de datos.
2.) Para el Rango ( R ), se utiliza las siguiente fórmula:
 R = dato mayor - el dato menor.
3.) Amplitud de los intervalos ( A ), se utiliza las siguiente fórmula:
A=R/ K
EJEMPLO
Los puntajes de un examen de ingreso a la universidad realizado
por 40 alumnos son los siguientes:
110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108,
109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108,
96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.

El menor de los El mayor de los


datos datos
Paso 1. Determinamos el rango (R) de variación de los datos que
se define como
R = Xmax – Xmin,
donde Xmax es el dato máximo y Xmin es el dato mínimo.
Para el ejemplo
Xmax = 140
Xmin = 90 entonces

R = 140 – 90 = 50
Paso 2. Determinamos el número de intervalos o clases k.
Una forma de hacerlo es con la Regla de Sturges, donde:
k = 1 + 3.3 log (n) ;
Para el ejemplo se tiene n = 40 datos, sustituyendo
k = 1 + 3.3 log (40) = 1 + 3.3 (1.602) =
= 1 + 5.28 = 6.28
la cual se redondea al entero superior, k = 7.
Paso 3. Calculamos la amplitud de clase (A), que
corresponde a la cantidad de datos que van en cada
clase, dividiendo el rango R entre el numero de clases k:

A=R/K
A = 50 / 7 = 7,14
se redondea al entero siguiente

A = 8.
Paso 4. Construimos los intervalos o clases, como la variable
es cuantitativa discreta los intervalos o clases son cerrados, es
decir de la forma [Li, Ls].
Para formar las clases comenzaremos con los limites
inferiores:
· En la primer clase tomamos
Li = Xmin ( el dato mas pequeño) en este caso 90.
Ls= Li + A - 1 = 90 + 8-1 = 97 Si los intervalos son cerrados.
[90; 97]
Paso 5: Construimos la tabla de distribución de frecuencias
INTERVALOS DE CLASE MARCA DE CLASE
Xi
[ 90 – 97]
[ 98 – 105]
[ 106 – 113 ]
[ 114– 121]
[ 122 – 129]
[ 130 – 137]
[ 138 – 145]
TOTAL
Paso 6: hallamos la Marca de clase (Xi): corresponde al punto
medio del intervalo, Para nuestro ejemplo obtendríamos las
siguientes marcas de clase:
INTERVALOS DE CLASE XI

[ 90 – 97] 93,5 90 + 97 = 93,5


2
[ 98 – 105] 101,5
98 +105
[ 106 – 113 ] 109,5 2
= 101,5
[ 114– 121] 117,5
[ 122 – 129] 125,5
[ 130 – 137] 133,5
[ 138 – 145] 141,5
TOTAL
Paso 7: Se halla la frecuencia absoluta es decir se
contabiliza cuantos datos hay en cada intervalo este dato será
f = frecuencia absoluta
INTERVALOS XI f
DE CLASE

[ 90 – 97] 93,5 7
[ 98 – 105] 101,5 9
[ 106 – 113 ] 109,5 13
[ 114– 121] 117,5 3
[ 122 – 129] 125,5 4
[ 130 – 137] 133,5 3
[ 138 – 145] 141,5 1
TOTAL 40
Se hace el conteo
Paso 8: Se halla la frecuencia relativa ( h ) es decir se
divide la frecuencia absoluta entre el total de datos

INTERVALOS DE XI f h
7/40
CLASE
[ 90 – 97] 93,5 7 0,175
9/40
[ 98 – 105] 101,5 9 0,225
[ 106 – 113 ] 109,5 13 0,325 13/4
[ 114– 121] 117,5 3 0,075 0
[ 122 – 129] 125,5 4 0,100
[ 130 – 137] 133,5 3 0,075
[ 138 – 145] 141,5 1 0,025
TOTAL 40 1
Paso 9: Se halla la frecuencia porcentual (% ) es decir se
multiplica la frecuencia relativa por 100

INTERVALOS DE XI f h %
0,175x10
CLASE
0
[ 90 – 97] 93,5 7 0,175 17,5
[ 98 – 105] 101,5 9 0,225 22,5
[ 106 – 113 ] 109,5 13 0,325 32,5
[ 114– 121] 117,5 3 0,075 7,5
[ 122 – 129] 125,5 4 0,100 10,0
[ 130 – 137] 133,5 3 0,075 7,5
[ 138 – 145] 141,5 1 0,025 2,5
TOTAL 40 1 100
Paso 10: Se agregan las columnas
Frecuencia absoluta acumulada = F Frecuencia relativa acumulada = H
Frecuencia porcentual acumulada = %a
Intervalo de clase “xi” f F h H % %a

[ 90 – 97] 93,5 7 7 0,175 0,175 17,5 17,5


[ 98 – 105] 101,5 9 16 0,225 0,400 22,5 40
[ 106 – 113 ] 109,5 13 29 0,325 0,725 32,5 72,5
[ 114– 121] 117,5 3 32 0,075 0,800 7,5 80
[ 122 – 129] 125,5 4 36 0,100 0,900 10 90
[ 130 – 137] 133,5 3 39 0,075 0,975 7,5 97,5
[ 138 – 145] 141,5 1 40 0,025 1,000 2,5 100
Gráfica de Datos Agrupados

• Polígono de Frecuencias
• Histograma
14
60

12
50

10
40

8 30

6 20

4 10

2 0

0
0,95 2,95 4,95
Histograma 14

12

10
• Es la representación gráfica de 8

6
los datos mediante una sucesión 4

de rectángulos. 2

0
0,95 2,95 4,95

• Está formado por rectángulos cuya anchura


representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
• En el eje “x” estarán los límites verdaderos, los
puntos medios y en el eje “y” las frecuencias.
Histograma
9 Intervalo de Punto medio “xi” f
8 clase

7 38 – 42 40 2
6 43 – 47 45 4
5
f 48 – 52 50 8
4
3 53 – 57 55 5

2 58 – 62 60 3
1 63 - 68 65 3
0
35 40 45 50 55 60 65 Total 25

xi
Polígono de Frecuencias
• Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes a
la frecuencia de cada una de las clases.
60

• El eje “x” representa el dato “xi” 50

40

y el eje “y” las frecuencias. 30

20

10

0
9 Polígono de Frecuencias
Interval Punto f
8
o de medio
7
clase “xi”
6
38 – 42 40 2
5
43 – 47 45 4 f
4
48 – 52 50 8 3

53 – 57 55 5 2

58 – 62 60 3 1

0
63- 68 65 3 35 40 45 50 55 60 65 70
xi
Total 25
MEDIDAS DE RESUMEN.

MEDIDAS DE
MEDIDAS DE MEDIDAS DE MEDIDAS DE
TENDENCIA
DISPERSIÓN POSICIÓN RELATIVA FORMA
CENTRAL

Media aritmética Varianza Cuartiles Asimetría


Mediana Desviación típica Deciles Apuntamiento
Moda Percentiles
MEDIDAS DE FORMA

ASIMETRÍA APUNTAMIENTO
MEDIDAS TENDENCIA CENTRAL

MODA

Agrupados cualitativa

Es el dato que se repite con


mas frecuencia.

No agrupados cuantitativa

2 modas = Bimodal
PARA DATOS NO AGRUPADOS

Xi f
Para calcular la moda para
Ricardo Palma 4
datos no agrupados, se busca
Internacional 7 el dato con mayor frecuencia
San Pablo 3
Maison de San té 4
Anglo Americana 2 En este caso la moda es la
Cayetano Heredia 4
Clínica Internacional.
San Felipe 1
PARA DATOS AGRUPADOS

Para calcular la moda de n datos tabulados por


intervalos, primero se determina el intervalo que
contiene a la moda, esto es, el intervalo que tiene la
mayor frecuencia (intervalo modal). Luego se utiliza la
fórmula:
 d1 
M o = Li +  A
 d1 + d 2 

donde:
Li es el límite inferior del intervalo modal.
d1= fi - fi-1
d2= fi - fi+1
A= amplitud del intervalo modal
EJEMPLO
La siguiente tabla muestra la edad de 40 personas de una comunidad:

Marca de Frecuencias Frecuencias


Intervalo
clase acumuladas
mi fi hi Fi Hi

 4, 10 7 1 0,025 1 0.025


10, 16 13 3 0,075 4 0.100
16, 22 19 6 0,150 10 0.250
22, 28 25 12 0,300 22 0.550
28, 34 31 11 0,275 33 0.825
34, 40 37 5 0,125 38 0.950
40, 46 43 2 0,050 40 1.000
40 1,000
El intervalo donde se encuentra la mayor frecuencia
es el cuarto intervalo
 d1 
M o = Li +  A
Entonces:Li = 22  d1 + d 2 
d1= fi - fi-1 = 12 – 6 = 6
d2= fi - fi+1 = 12 – 11= 1
A=6
Calculando la moda:

Mo= 22 + 6 6 =
6+1
Mo= 22 + 0,86 x 6 =

Mo= 22 + 5,16= Mo= 27,16


MEDIA

Agrupados
Es el promedio aritmético de
los valores de la variable.
cuantitativa

No agrupados

x .
MUESTRA POBLACIÓN
MEDIA PARA DATOS NO AGRUPADOS

Sea x1, x2, .... ,xn los valores que toma una variable
cuantitativa X, entonces la media aritmética se
determina mediante:

x1 + x 2 + ....... + x n
media =
n
X ∑ Xi
= n
Ejemplo

Si las notas en el curso de introducción a la


computación de 10 alumnos son : 14, 18, 12,
16, 14, 15, 16, 18, 10, 12
14 + 18 + 12 + 16 + 14 + 15 + 16 + 18 + 10 + 12
x=
10

x = 14,5

Respuesta: La nota promedio es 14,5


MEDIA ARITMETICA PONDERADA

• La media aritmética de los valores x1, x2, x3, .........., xk ponderada


por los pesos
w1, w2, w3, ........ wk es el número.

w1x1 + w 2 x 2 + .........+ w k x k
x=
w1 + w 2 + ..........+ w k
Ejemplo
Si un alumno el semestre pasado obtuvo 11 en Física 2 y su peso
es cinco, 13 en el curso Lengua de peso cuatro y 16 en cálculo 2
de peso 3, ¿ cuál fue su promedio ?

11(5) + 13(4) + 16(3)


x=
5+4+3
x = 12,92
Media aritmética en la tabla de
distribución de frecuencias
• Si los n valores de una variable estadística discreta X se clasifican en k
valores distintos x1, x2, x3, .........., xk con frecuencias absolutas respectivas
f1, f2, f3, ......, fk, entonces su media aritmética es el número:

X = ∑ fi . Xi
n
f1 x 1 + f 2 x 2 + .........+ f k x k
x=
f1 + f 2 + ..........+ f k
Ejemplo
En un estudio de edades de estudiantes de Derecho se obtuvo
la siguiente tabla de distribución:
Determina la edad promedio.

x f
16 5
_ 5(16) + 10(17) + 6(18) + 4(19) + 2( 20)
17 10
x=
18 6
5 + 10 + 6 + 4 + 2
19 4
20 2 _
total 26 x = 30 + 170 + 108 + 76 + 40
26
_
x = 18,23 años
Media para datos agrupados
Marca de Frecuencias Frecuencias
Intervalo
clase acumuladas
xi fi hi Fi Hi
 4, 10 7 1 0,025 1 0.025
10, 16 13 3 0,075 4 0.100
16, 22 19 6 0,150 10 0.250
22, 28 25 12 0,300 22 0.550
28, 34 31 11 0,275 33 0.825
34, 40 37 5 0,125 38 0.950
40, 46 43 2 0,050 40 1.000
40 1,000
MEDIANA

Agrupados
Es el valor que queda en la
parte central de un grupo de cuantitativa
observaciones arreglados en
orden de magnitud.

No agrupados
Para datos no agrupados
La mediana de un conjunto de datos
EJEMPLO es el valor que se encuentra al

• Calcular la mediana en los siguientes datos:


medio de la distribución ordenada
(en forma ascendente o
descendente). Cuando se tiene
• Para el número de datos impares mediana uno sabe que es la misma
cantidad de datos que se encuentra
por encima de dicha mediana que
1º Se ordenan los datos en orden ascendente: por debajo.

10 – 12 – 17 – 18 - 20 – 23 – 25 Me = 18

• Calcular la mediana en los siguientes datos:


• Para el número de datos impares
1º Se ordenan los datos en orden ascendente:
10 – 12 – 17 – 18 - 20 – 23 – 25 - 28
Me = 18 + 20 = 38 = 19
2 2
Para datos agrupados
Para calcular la mediana para datos agrupados considerando las frecuencias absolutas, en primer lugar se
encuentra el intervalo donde se encuentra la mediana, este se encontrará en el primer intervalo cuya frecuencia
absoluta acumulada contiene a la mitad de la muestra.
Luego se utiliza la fórmula:

Donde:

n
Li =Es el límite inferior del intervalo de

− Fi−1
la mediana
n = Número de datos observados

Me = Li + 2 A
Fi-1= Frecuencia acumulada absoluta del
intervalo
fi inmediatamente anterior al
intervalo de la mediana
fi = Frecuencia absoluta del intervalo
de la mediana
A = Amplitud del intervalo de la
mediana
Ejemplo: La siguiente tabla muestra la inversión anual de 40 clínicas , hallar la mediana.

Marca de Frecuencias Frecuencias


Intervalo
clase acumuladas
Xi fi hi Fi Hi

 4, 10 7 1 0,025 1 0.025


10, 16 13 3 0,075 4 0.100
16, 22 19 6 0,150 10 0.250
22, 28 25 12 0,300 22 0.550
28, 34 31 11 0,275 33 0.825
34, 40 37 5 0,125 38 0.950
40, 46 43 2 0,050 40 1.000
40 1,000
• Si son 40 datos, la mediana se encuentra entre el dato 20 y 21.
• El intervalo donde se encuentra n/2 es el número
cuatro, luego:
• Li= 22; n = 40; Fi-1 =10; fi =12; A= 6
• Por tanto
40
− 10
n Me = 22 + 2
− Fi−1 6
Me = Li + 2 A
12
fi Me = 27
MEDIDAS DE DISPERSIÓN

RANGO ( R )
VARIANZA (σ 2 ó 2
S)

DESVIACIÓN TÍPICA (σ ó S)
EJEMPLO 10
13
La siguiente tabla representa la
RANGO pérdida de peso en libras, de
22
26
un grupo de personas que se 16
 El Rango corresponde a la sometieron a un tratamiento 23
distancia entre el puntaje 35
mayor (llamado valor
durante el último año 53
máximo) y el puntaje Valor Máximo: 60 17
menor (llamado valor 32
mínimo) Valor Mínimo: 10 41
35

Rango = XMax – XMin 24


Rango = XMax – XMin 23

= 60 - 10 27
16
= 50 20
60
48
DESVIACION ESTANDAR Y VARIANZA DE UNA
POBLACIÓN PARA DATOS NO AGRUPADOS

Desviación Varianza: La media


Estándar o Típica: aritmética de las
Indica cómo se desviaciones cuadradas
dispersan los datos con de la media.
respecto a la media
Varianza: Corresponde a
Desviación Estándar: la Desviación Estándar al
Corresponde a la Raíz cuadrado
Cuadrada de la Varianza

   (X - )2

 = 2 =
N
LA DESVIACIÓN ESTÁNDAR

Es la medida de dispersión más común, que indica qué tan


dispersos están los datos con respecto a la media. ... La
desviación estándar se puede utilizar para establecer un
valor de referencia para estimar la variación general de un
proceso. Cuando existe una dispersión pequeña se dice
que los datos están dispersos o acumulados cercanamente
respecto a un valor central, en este caso el dato central es
un valor muy representativo. En el caso que la dispersión
sea grande el valor central no es muy confiable.
EJEMPLO PARA DATOS NO AGRUPADOS
• Calcular varianza y desviación estándar para los siguientes puntajes
de una población.
• 10 – 12 – 17 – 18 - 23 x=16
Nº x x-x (x - x)2
1 10 -6 36
VARIANZA
2 12 -4 16
3 17 1 1 MEDIA
4 18 2 4
5 23 7 49  
=  (X -X)2
∑ 80 106
N

 =
 2 DESVIACIÓN
ESTÁNDAR
σ2 =
106
σ = √21,2 σ =4,6 σ2= 5
21,2
VARIANZA Y DESVIACIÓN ESTÁNDAR
EN MUESTRAS

Varianza en Muestras (s2)


(X - X)2
s2 = n-1
Desviación Estándar en Muestras (s)

s= s 2
VARIANZA Y DESVIACIÓN ESTÁNDAR PARA
DATOS AGRUPADOS
Ejemplo
Una encuesta realizada a una muestra de estudiantes de
Estadística aplicada, para conocer el número de horas que
navegan semanalmente en internet, arrojo los siguientes
datos de la tabla:
INTERVALO f

[0-10[ 2 Calcular:
[10-20[ 3 Varianza
[20-30[ 3 Desviación estándar
[30-40[ 7
[40-50[ 5
Xi f Xi .f Xi - X (Xi – X )2 f (Xi – X)2

[0-10[ 2
[10-20[ 3
[20-30[ 3
[30-40[ 7
[40-50[ 5

1er paso 3er paso

2do
Xi f Xi .f Xi - X (Xi – X )2 f (Xi – X)2 paso

[0-10[ 5 2 10 -25 625 1250 X = ∑ Xi .f


n
[10-20[ 15 3 45 -15 225 675 X = 600
20
[20-30[ 25 3 75 -5 25 75
X= 30
[30-40[ 35 7 245 5 25 175
[40-50[ 45 5 225 15 225 1125
∑ 20 600 3300

4to paso 3300 = 3300 =


173,68
20 – 1 19
5to paso 173,68 =
MEDIDAS DE POSICIÓN
RELATIVA

CUARTILES

DECILES

PERCENTILES
CUARTILES.

Los cuartiles son los tres valores de la variable que


dividen a un conjunto de datos ordenados en
cuatro partes iguales.

Q1= 25% Q3=75%


Q2=50%
MEDIANA
CALCULO DE LOS CUARTILES.

PASO 1: Ordenamos los datos de menor a mayor.


Se presentan 2 casos:
- Para datos pares
- Para datos impares

PASO 2: Buscamos el lugar que ocupa cada


cuartil mediante la expresión:
NÚMERO IMPAR DE DATOS.

2, 3, 4, 5, 6, 7, 9

Q1 Q2 Q3
NÚMERO PAR DE DATOS.

1, 2, 3, 4, 5, 6, 7, 9

Q1 Q2 Q3
CALCULO DE LOS CUARTILES PARA DATOS
AGRUPADOS

En primer lugar buscamos la clase donde se


encuentra ,

en la tabla de las frecuencias acumuladas.


Donde:
Li = Es el límite inferior de la clase donde se encuentra
el cuartil.
N= Es la suma de las frecuencias absolutas.
Fi-1= Es la frecuencia acumulada anterior a la clase
del cuartil.
ai = Es la amplitud de la clase.
EJEMPLO.
fi Fi

[50, 60) 8 8
[60, 70) 10 18
Hallar el
cuartil 1
[70, 80) 16 34
Cuartil 2 [80, 90) 14 48
Cuartil 3 [90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
CALCULO DEL PRIMER CUARTIL

k.N = 1 x 65 = 16,25
4 4

Se busca en la tabla donde se


encuentra 16,25.

Observamos que Li = 60
Fi-1 = 8
Q1 = 60 + 16.25 – 8 x 10 = 68.25
fi = 10
ai = 10
10
CALCULO DEL SEGUNDO CUARTIL

k.N = 2 x 65 = 32,5
4 4
Se busca en la tabla donde se
encuentra 32,5.

Observamos que Li = 70
Fi-1 = 18 Q2 = 70 + 32.5 – 18 x 10 = 79.06
fi = 16
16
ai = 10
CALCULO DEL TERCER
CUARTIL

k.N = 3 x 65 = 48,75
4 4
Se busca en la tabla donde
se encuentra 48,75.

Observamos que Li = 60
Fi-1 = 48
fi = 10 Q3 = 90 + 48,75 – 48 x 10 = 90.75
ai = 10 10
Muchas Gracias

También podría gustarte