Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sesion 2 Estadistica
Sesion 2 Estadistica
ESTADÍSTICA DESCRIPTIVA
DATOS AGRUPADOS
Rango: Diferencia entre el dato mayor y el menor para el ejemplo de la introducción (trabajadores de Coca Cola) el
rango es igual a $50,000 - $4,000 = $46,000
Intervalo: Número de grupos en que se va a agrupar la información, se recomienda que sean no menos de 5 ni más de
10.
Tamaño del intervalo: El tamaño del intervalo es la diferencia entre el límite superior e inferior de la clase.
Marca de clase: La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo
para el cálculo de algunos parámetros.
FORMULARIO
MEDIDAS DE TENDENCIA CENTRAL.
Media Aritmética X = ∑ fx
n
Mediana n
Md = Li + 2 - FA anterior c
f
Moda Mo = Li + ∆1 c
∆1 + ∆2
x = Media aritmética
∑ = Sumatoria
f = frecuencia
n = Total de datos
x = Dato a analizar
Md = Mediana
Li = Límite inferior del intervalo de la mediana o moda
FA anterior = Frecuencia acumulada anterior al intervalo de la mediana
C = Tamaño del intervalo
∆1 = Mayor frecuencia menos frecuencia anterior
∆2 = Mayor frecuencia menos frecuencia posterior
MEDIDAS DE DISPERSIÓN
Desviación Estándar
S = ∑f(x – x )2
n
Varianza
S2 = ∑f(x – x )2
n
S = Desviación estándar
S2= Varianza
x = Media aritmética
∑ = Sumatoria
f = frecuencia
n = Total de datos
x = Dato a analizar
MEDIDAS POSICIONALES. Son aquellas que como su nombre lo dice dependen de suposición, se utilizan para
seccionar la información además de establecer intervalos de confianza de forma más puntual.
CUARTILES: Medida posicional que divide en 4 partes iguales una serie de datos
n
Q1 = L i + 4 - FA anterior c
f
n
Q1 = Li + 4 - FA anterior c
f
DECILES: Medida posicional que divide en 10 partes iguales una serie de datos
n
D1 = Li + 10 - FA anterior c
f
3n
D3 = Li + 10 - FA anterior c
f
8n
D8 = Li + 10 - FA anterior c
F
PERCENTILES: Medida posicional que divide en 100 partes iguales una serie de datos
n
P1 = Li + 100 - FA anterior c
f
17n
D17 = Li + 100 - FA anterior c
f
98n
D98 = Li + 100 - FA anterior c
Qn = Cuartil
Dn = Decil
Pn = Percentil
n = Total de datos
Li = Límite inferior del intervalo de la mediana o moda
FA anterior = Frecuencia acumulada anterior al intervalo de la mediana
C = Tamaño del intervalo
3 7 10 32 15 27 23 12 15 18
33 35 38 22 33 36 23 22 25 22
46 36 27 32 35 20 33 32 15 16
18 41 43 42 44 42 15 22 23 25
33 35 44 23 15 28 28 15 48 22
Primer paso: Se ordenan de menor a mayor
3 7 10 12 15 15 15 15 15 15
16 18 18 20 22 22 22 22 22 23
23 23 23 25 25 27 27 28 28 32
32 32 33 33 33 33 35 35 35 36
36 38 41 42 42 43 44 44 46 48
Segundo paso: Se obtiene el rango con la diferencia entre las personas de mayor y menor edad.
Rango = 48 – 3 = 45
Tercer paso: Se toma la decisión para determinar el número de intervalos que tendrá la agrupación de
la información (se recomienda entre 6 y 10) para este problema vamos a utilizar 6 intervalos; por lo
tanto se divide el rango entre el número de intervalos.
Para 6 intervalos = 45 = 7.5 Por lo tanto el tamaño de cada
6 intervalo va ser igual a 7.5
Cuarto paso: Se elabora la tabla de frecuencias tomando en el dato menor de la muestra (3 años) como
el límite inferior del primer intervalo y se obtiene el límite superior sumando el tamaño del intervalo y
para pasar de un intervalo a otro se aumenta una centésima
Frecuencia
Marca de Frecuencia Frecuencia
Intervalo Li Ls Frecuencia relativa Porcentaje Grados
clase Acumulada relativa
acumulada
A 3.00 10.50 3 6.75 3 0.06 0.06 6% 21.6º
B 10.51 18.01 10 14.26 13 0.20 0.26 20% 72º
C 18.02 25.52 12 21.77 25 0.24 0.50 24% 86.4º
D 25.53 33.03 11 29.28 36 0.22 0.72 22% 79.2º
E 33.04 40.54 6 36.79 42 0.12 0.84 12% 43.2º
F 40.55 48.05 8 44.30 50 0.16 1.00 16% 57.6º
50 1.00 100% 360°
Llenado de la tabla de frecuencias para datos agrupados
Límites (inferior y superior): Se coloca el límite inferior (dato menor) y se suma el tamaño del intervalo para
obtener el límite superior, para pasar al siguiente intervalo se suma una centésima y se repite el proceso hasta
llegar al último intervalo.
Frecuencia: Se cuenta el número de datos que quedan ubicados en cada intervalo.
Marca de Clase: Es el punto medio de cada intervalo, se obtiene sumando el límite inferior con el límite
superior y dividiendo el resultado entre 2.
Frecuencia acumulada: Se coloca la primer frecuencia y se le suma la segunda, al resultado se le suma la de
la tercera y así sucesivamente hasta llegar a la última frecuencia, para comprobar la sumatoria debe ser igual
a cantidad total de datos.
Frecuencia Relativa: Se obtiene dividiendo cada frecuencia entre el total de datos el primero 3/50 es igual
0.06, el segundo 9/50 es igual a 0.18 y así sucesivamente hasta llegar en este caso a la última calificación.
Frecuencia Relativa Acumulada: Se coloca la primer frecuencia relativa y se le suma la segunda, al resultado
se le suma la de la tercera y así sucesivamente hasta la última calificación (diez), para comprobar el resultado
la última frecuencia relativa acumulada debe ser igual a 1
Porcentaje: Es el resultado de multiplicar la frecuencia relativa por 100.
Grados. Se obtiene multiplicando la frecuencia relativa por 360
12 12
11
10 10
8 8
6 6
4
3
2
0
A B C D E F
b) Polígono de frecuencias
14
12
12 11
10
10
8
8
6
6
4 3
2
0
A B C D E F
c) Pastel
8
3 10
11 12
A B C D E F
N 50
Md = Li + 2 - FA anterior c = 18.02 + 2 - 13 7.5 = 18.02 + 12 7.5 = 25.52
F 12 12
∆1 = 12 – 10 = 2
∆2 = 12 – 11 = 1
a) Varianza S2 = ∑f(x – x )2
N
S2=3(6.75–26.42)2+10(14.26–26.42)2+12(21.77–26.42)2+11(29.28–26.42)2+6(36.79–26.42)2+8(44.30–26.42)2 =6191.6
50 50
= 123.83
b). Desviación Estándar
S = ∑f(x – x )2 = 123.83 = 11.12
N
V. Medidas posicionales
Cuartiles
Cuartil 1 Primero se ubica el intervalo que tiene al que pertenece el cuartil Q 1 (cuarta parte de 50 =12.5) en la
frecuencia acumulada como se indica a continuación.
N 50
Q1 = Li + 4 - FA anterior c = 10.51 + 4 - 3 7.5 = 10.51 + 12.5 - 3 7.5 = 15.385
F 10 10
Cuartil 3 Primero se ubica el intervalo que tiene al que pertenece el cuartil Q3 (tres cuartas parte de 50 =37.5) en
la frecuencia acumulada como se indica a continuación.
Deciles: Dividen en 10 partes iguales a la serie de información existen 10 pero para nuestro caso
vamos a calcular sólo 4, indicando la formula correspondiente.
Decil 1 Primero se ubica el intervalo que tiene al que pertenece el cuartil D 1 (décima parte de 50 =5) en la
frecuencia acumulada como se indica a continuación.
N 50
D1 = Li + 10 - FA anterior c = 10.51 + 10 - 3 7.5 = 10.51 + 5 - 3 7.5 = 12.01
F 10 10
Decil 3 Primero se ubica el intervalo que tiene al que pertenece el decil D 3 (tres décimas partes de 50 =15) en la
frecuencia acumulada como se indica a continuación.
3N 150
D3 = Li + 10 - FA anterior c = 18.02 + 10 - 13 7.5 = 18.02 + 15 - 13 7.5 = 19.27
f 12 12
Decil 7 Primero se ubica el intervalo que tiene al que pertenece el decil D 1 (7 décimas partes de 50 =35) en la
frecuencia acumulada como se indica a continuación.
7N 350
D7 = Li + 10 - FA anterior c = 25.53 + 10 - 25 7.5 = 25.53 + 35 - 25 7.5 = 32.34
F 11 11
Decil 9 Primero se ubica el intervalo que tiene al que pertenece el decil D 9 (nueve décimas partes de 50 =45) en la
frecuencia acumulada como se indica a continuación.
9N 450
D9 = Li + 10 - FA anterior c = 40.55 + 10 - 42 7.5 = 40.55 + 45 - 42 7.5 = 43.36
f 8 8
Percentiles: Dividen en 100 partes iguales a la serie de información existen 100 pero para nuestro
caso vamos a calcular sólo 4, indicando la formula correspondiente.
Percentil 1 Primero se ubica el intervalo que tiene al que pertenece el percentil P 1 (Centésima parte de 50 =0.5)
en la frecuencia acumulada como se indica a continuación.
N 50
P1 = Li + 100 - FA anterior c = 3.00 + 100 - 0 7.5 = 3.00 + 0.5 - 0 7.5 = 4.25
F 3 3
Percentil Primero se ubica el intervalo que tiene al que pertenece el percentil P 18 (dieciocho centésimas
18
en la frecuencia acumulada como se indica a continuación.
partes de 50 =15)
A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen
18N 900
P18 = Li + 100 - FA anterior c = 10.51 + 100 - 3 7.5 = 10.51 + 9 - 3 7.5 = 15.01
f 10 10
Percentil 85 Primero se ubica el intervalo que tiene al que pertenece el percentil P 85 (85 centésimas partes de
50 =42.5) en la frecuencia acumulada como se indica a continuación.
A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen
85n 4250
P85 = Li + 100 - FA anterior c = 40.55 + 100 - 42 7.5 = 40.55 + 42.5 - 42 7.5 = 41.018
F 8 8
Percentil 98 Primero se ubica el intervalo que tiene al que pertenece el percentil P 98 (noventa y ocho partes de
50 =49) en la frecuencia acumulada como se indica a continuación.
A partir de la ubicación se identifican los elementos de la fórmula y se sustituyen
ACTIVIDAD 2
Elabora completo el análisis estadístico de la información que se encuentra en la tabla
encontrando:
1. Tabla de Frecuencias
2. Gráficas Estadísticas
a) Histograma
b) Polígono de Frecuencias
c) Gráfica de Pastel
3. Medidas de Tendencia Central
a) Media Aritmética
b) Mediana
c) Moda
4. Medidas de Dispersión
a) Media Aritmética
b) Mediana
5. Medidas Posicionales
a) Cuartiles 1 y 3
b) Deciles 1, 3, 8 y 9
c) Percentiles 1, 27, 88 y 98
De la siguiente información
Estatura (medida en cm.) de una muestra de 200 estudiantes de una escuela que incluye
desde kínder hasta preparatoria
Frecuencia
Marca de Frecuencia Frecuencia
Intervalo Li Ls Frecuencia relativa Porcentaje
clase acumulada relativa
acumulada
A 120 130 20
B 131 141 25
C 142 152 50
D 153 163 60
E 164 174 30
F 175 185 15
200