Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 1 - 4
Unidad 1 - 4
Educacional
Dr. Joel Elvys Alanya Beltran
Unidad 1
Temas Objetivo
Entender los conceptos de
Definiciones básicas población, muestra y unidad
estadística.
Gráficas
Interpretar
Estadística Inferencial
La estadística se soporta en un conjunto de herramientas Se encarga de realizar generalizaciones hacia toda la
que se utilizan para obtener respuestas a preguntas población, utilizando la información proporcionada a
relevantes sobre los datos. partir de una muestra.
¿Qué es una población?
Población de autos
fabricados
¿Qué es una muestra?
Población: N
Muestra: n
Población
Muestra Es un subconjunto de
elementos de la
población en estudio
Población: N
Muestra: n
Unidad
Es el elemento u
objeto indivisible de
la población que será
analizado
Ejemplo 1:
¿Esta muestra es
representativa?
Características de la muestra
Dos de las características importantes de la muestra es que sea representativa y aleatoria.
Representativa Aleatoria
La muestra debe reflejar los
elementos de la población, una Cada elemento o unidad de la
buena muestra debe darnos muestra debe ser elegido
información de toda la población completamente al azar.
Se realiza un sondeo preliminar para ver cual es el candidato municipal por el cual votarán los
habitantes de Lima Metropolitana en las próximas elecciones, con este fin entrevistan a 3500
electores de la ciudad. La pregunta es la siguiente: ¿Por quién votará en las próximas elecciones
municipales?. ¿Cuál es la población, muestra y la unidad estadística?
Población
Contar !!!
Discretas Números o
Cuantitativas valores enteros
(Numéricas)
Continuas Medir !!!
Números decimales
Variables
Clasificar!!!
Nominales Valores no numéricos,
Cualitativas el orden es indistinto
Discretas Continuas
Son aquellas que resultan de la operación de Son aquellas que resultan cuando se mide alguna
contar, las variables discretas suelen tomar característica; pueden asumir un número
valores enteros. incontable de valores.
Número de hijos en una familia: 0, 1, 2, 3, 4, 5, 6 Estatura de los alumnos de 5to 1.54 cm, 1.65 cm,
de secundaria: 1.45 cm, 1.68 cm
………..
Tiempo de espera en la cola de 1.4 hrs, 2 hrs,
Número de estudiantes por colegio: 100, 250, 300, 500 un banco: 2.6 hrs, 3.2 hrs
Número de autos que pasan por 0, 10, 20, 45, 68 Salarios de los empleados de S / 950, S / 1050.6,
una avenida en 1 hora: una fábrica: S/ 1250.5 , S/ 1830.2
Variables Cualitativas
Estas variables expresan una cualidad, característica o atributo, no pueden ser medidas por números, se
clasifican en nominales y ordinales
Nominales Ordinales
Son aquellas cuyas respuestas se presentan en Son aquellas que agrupan a los elementos en
categoría sin implicar orden entre ellas. categorías ordenadas, para establecer relaciones
comparativas.
5 25 5/25 1 20%
Total 25 1
Tablas de frecuencias
Ejemplo 1: Tenemos las respuestas de un grupo de estudiantes de 1 ciclo de Educación, a quienes se les pidió que
marquen la imagen de la red social que más usan. Con los resultados obtenidos, construir una tabla de frecuencias:
5 25 0.2 1 20%
Total 25 1 100%
Tablas de frecuencias
Podemos usar la tabla de frecuencias cuando tenemos variables discretas con pocos valores.
Ejemplo 2: Una universidad realizó un experimento sobre el coeficiente intelectual (C.I.) de sus estudiantes, para lo
cual aplicó un examen de C.I. a un grupo de 20 estudiantes, con los resultados construir la tabla de frecuencias.
5 20% 20%
12%
Este gráfico circular nos ayuda a
Twiter representar porcentajes o
Total 25 100% Whatsapp proporciones.
32% Instagram
Facebook
36%
Gráficos principales
Gráfico de Pareto
Tabla de frecuencias 10
100%
100%
88%
9 90%
Ordenamos las categorías por
8 80%
frecuencia absoluta de mayor a menor. 7
68%
70%
6 60%
Red Social 𝑓𝑖 %𝑓𝑟𝑖 %𝐴𝑐𝑢𝑚
5 50%
36%
9 36% 36% 4 40%
3 30%
2 20%
8 32% 68% 1 10%
9 8 5 3
0 0%
Instagram WhatsApp Facebook Twiter
5 20% 88%
3 12% 100% Es una herramienta que muestra en una sola vista los gráficos de barras y
líneas, los datos se ordenan por categoría de mayor a menor y se visualiza
Total 25 100% el porcentaje o frecuencia porcentual acumulada por cada categoría o
valor observado.
Definiciones de la tabla de frecuencias: Ejemplo 1: Se tienen registrados la estatura de 100 niños, los cuales
se han agrupado en los siguientes intervalos:
𝑘 = 1 + 3.3log(n)
Ordenamos los datos de menor a mayor
4 Determinar la amplitud de la clase o intervalo:
60.0 61.3 61.4 61.4 61.5 61.7 62.0 62.0 62.1 62.1 𝐴 = 𝑅/𝑘
62.3 63.0 63.5 63.9 64.0 64.1 64.6 65.0 65.2 65.3
65.5 65.7 65.8 65.9 66.5 67.3 67.3 67.4 67.4 67.5 5 Hallar el limite inferior y limite superior de cada
67.8 67.8 68.0 68.1 68.5 69.3 69.4 69.7 69.8 70.6 intervalo y la marca de clase.
71.9 72.3 72.4 72.5 72.7 73.5 73.6 73.7 74.0 74.0
6 Hallar la frecuencia absoluta, acumulada, relativa y otras
columnas vistas en la tabla de frecuencia
Tablas de frecuencias para datos agrupados
Pasos para elaborar la tabla de frecuencias para datos agrupados:
𝑥 𝑚𝑖𝑛
1 𝑛 = 50 60.0 61.3 61.4 61.4 61.5 61.7 62.0 62.0 62.1 62.1
62.3 63.0 63.5 63.9 64.0 64.1 64.6 65.0 65.2 65.3
65.5 65.7 65.8 65.9 66.5 67.3 67.3 67.4 67.4 67.5
2 𝑅 = 𝑥 𝑚𝑎𝑥 − 𝑥 𝑚𝑖𝑛 = 74 − 60 = 14
67.8 67.8 68.0 68.1 68.5 69.3 69.4 69.7 69.8 70.6
71.9 72.3 72.4 72.5 72.7 73.5 73.6 73.7 74.0 74.0
Calculamos el número de intervalos usando la Regla
3
de Sturges: 𝑥 𝑚𝑎𝑥
𝑘 = 1 + 3.3log 50 = 6.6 ≈ 7
Clase Marca 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝐹𝑟𝑖 %𝑓𝑟𝑖
4 Determinar la amplitud de la clase o intervalo:
[ 60 - 62 > 61 6 6 0.12 0.12 12%
𝑅 14
𝐴= = =2 [ 62 - 64 > 63 8 14 0.16 0.28 16%
𝑘 7
[ 64 - 66 > 65 10 24 0.20 0.48 20%
Hallar el limite inferior y limite superior de cada
5 [ 66 - 68 > 67 8 32 0.16 0.64 16%
intervalo y la marca de clase.
Limite inferior
𝐴=2 Limite superior [ 68 – 70 > 69 7 39 0.14 0.78 14%
[ 70 – 72 > 71 6 45 0.12 0.90 12%
60 61 62
Hallar la frecuencia absoluta, acumulada, relativa, [ 72 – 74 ] 73 5 50 0.10 1 10%
6
relativa acumulada y frecuencia porcentual Total 50 1 100%
Gráficos principales
Tabla de frecuencias Histograma de frecuencias absolutas - Pesos
12
Clase 𝑓𝑖 𝑓𝑟𝑖 %𝑓𝑟𝑖 10
10
[ 60 - 62 > 6 0.12 12% 8 8
8 7
[ 62 - 64 > 8 0.16 16% 6 6
[ 64 - 66 > 10 0.20 20% 6 5
Características Media
Mediana Moda
Resume un conjunto de datos de forma que
podamos tener un panorama general
MEDIA
σ 𝑛𝑖 =1 𝑓𝑖 𝑥𝑖 𝑓1 𝑥1 + 𝑓2 𝑥2 + 𝑓3 𝑥3 + ⋯ . +𝑓𝑛 𝑥𝑛
𝑥ҧ = =
𝑛 𝑛
𝟏130
𝑋ത= = 11,30 ≈ 11
𝟏𝟎𝟎
Menos sensible que la media Para datos no agrupados Mediana es el valor central si n es impar
a la variación de las La mediana es el dato que se encuentra a la mitad de la Ejm1: n=5 17
puntuaciones lista. 10 12 13 15
𝑀0 : 𝑅𝑒𝑝𝑟𝑒𝑠𝑒𝑚𝑡𝑎 𝑙𝑎 𝑚𝑜𝑑𝑎
No es afectada por valores muy altos o
muy bajos.
Forma de cálculo
Frecuencia
- Primero se saca un cuadro de frecuencias de cada valor NSE
fi
-Se identifica como moda el valor que se repite con más A 3
Se puede usar también cuando tenemos frecuencia.
datos numéricos Ejm: La nota más B 5
frecuente (moda) C 4
Total 12
𝑀0 = 𝑁𝑆𝐸 𝐵
MEDIA
Forma de cálculo
σ 𝑛𝑖 =1 𝑥𝑖𝑝𝑖 𝑥1 𝑝1 + 𝑥2 𝑝2 + 𝑥3 𝑝3 + ⋯ . +𝑥𝑛 𝑝𝑛
𝑥ҧ = 𝑝 =
σ 𝑖 =1 𝑝𝑖 𝑝1 + 𝑝2 + 𝑝3 + ⋯ + 𝑝𝑛
𝟏36
𝑋ത= = 15,28 ≈ 15
8,9
Para el ejemplo:
𝐿𝑖 : 5
Algunos autores usan la •Se identifica como frecuencia inferior inmediata al intervalo anterior al
△ 1 : (27-15)=12
que se encuentra la moda.
Forma de cálculo siguiente fórmula: △ 2 : (27-21)=5
•Se identifica como frecuencia inferior inmediata al intervalo anterior al
-Primero se saca un 𝑀0 = 𝐿𝑖 + (△
△1
)*C que se encuentra la moda C: (9-5)=4
1 +△ 2
cuadro de frecuencias de
12
cada rango 𝐿𝑖 : Límite inferior de la clase modal 𝑀0 = 5 + ( )*4 =7,82 ≈8
△ 1 : Diferencia entre la frecuencia modal y la frecuencia inferior inmediata 12+5
-Se identifica como moda △ 2 : Diferencia entre la frecuencia modal y la frecuencia superior inmediata
el rango que presenta del intervalo que contiene la moda De todas las notas, la nota más frecuente
más cantidad de casos C: Amplitud en el salón de clases es 8
¿Qué es una medida de posición?
Características Percentil
Características
La medidas de posición se
llaman en general cuantiles, 25% 25% 25% 25%
una de ellas son los cuartiles
los cuales van a dividir los 𝑄1: 𝑃𝑟𝑖𝑚𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 25%
datos en 4 partes iguales: 𝐸𝑗𝑒𝑚𝑝𝑙𝑜
𝑄2: 𝑆𝑒𝑔𝑢𝑛𝑑𝑜 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 50% De un total de 100 alumnos del C.E 001, se obtuvo información de la talla de los
alumnos del 5to de secundaria, obteniéndose los siguientes cuartiles
𝑄3: 𝑇𝑒𝑟𝑐𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 75%
Para definir un rango de
posición es Cuartiles • 𝐷𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑎𝑙𝑢𝑚𝑛𝑜𝑠 𝑑𝑒𝑙 𝐶. 𝐸 001, 𝑠𝑒 𝑝𝑢𝑒𝑑𝑒 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑒𝑙 25%
necesario ordenar primero la Q1 1,51 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑡𝑖𝑒𝑛𝑒𝑛 𝑢𝑛𝑎 𝑡𝑎𝑙𝑙𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 1,51
variable de menor a mayor. Q2 1,62 • Del total de alumnos del C.E 001, se puede afirmar que el 50% de
Q3 1,68 los alumnos tienen una talla menor que 1,62.
Q4 1,75 • Del total de alumnos del C.E 001, se puede afirmar que el 75% de
los alumnos tienen una talla menor que 1,68.
DECIL
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
(mediana)
Características
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
Para los deciles, tomaremos
el total de los datos divididos
en 10 partes iguales, por D1: 𝑃𝑟𝑖𝑚𝑒𝑟 𝑑𝑒𝑐𝑖𝑙 (𝑎𝑔𝑟𝑢𝑝𝑎 10% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠) Ejemplo
tanto, existirán 10 deciles que De un total de 100 alumnos del C.E 001, se obtuvo información
representan el 100%. D2: 𝑆𝑒𝑔𝑢𝑛𝑑𝑜 𝑑𝑒𝑐𝑖𝑙 (𝑎𝑔𝑟𝑢𝑝𝑎 20% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠) de la talla de los alumnos del 5to de secundaria, obteniéndose
los siguientes deciles
D3: 𝑇𝑒𝑟𝑐𝑒𝑟 𝑑𝑒𝑐𝑖𝑙 (𝑎𝑔𝑟𝑢𝑝𝑎 30% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠)
Deciles • 𝐷𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑎𝑙𝑢𝑚𝑛𝑜𝑠 𝑑𝑒𝑙 𝐶. 𝐸 001, 𝑠𝑒 𝑝𝑢𝑒𝑑𝑒 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑒𝑙 20%
𝐷4: 𝐶𝑢𝑎𝑟𝑡𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 40% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑡𝑖𝑒𝑛𝑒𝑛 𝑢𝑛𝑎 𝑡𝑎𝑙𝑙𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 1,59
Para definir un rango de D1 1,47
• Del total de alumnos del C.E 001, se puede afirmar que el
posición es necesario ordenar 𝐷5: 𝑄𝑢𝑖𝑛𝑡𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 50% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 D2 1,59
50% de los alumnos tienen una talla menor que 1,62.
primero la variable de menor D3 1,60
a mayor. 𝐷6: 𝑆𝑒𝑥𝑡𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 60% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 D4 1,61
𝐷7: 𝑆é𝑝𝑡𝑖𝑚𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 70% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 D5 1,62
𝐷8: 𝑂𝑐𝑡𝑎𝑣𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 80% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠
𝐷9: 𝑁𝑜𝑣𝑒𝑛𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 90% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠
𝐷10: 𝐷é𝑐𝑖𝑚𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 100% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠
¿Qué es una medida de dispersión?
Características Rango
Mes Porcentaje
Mes 1 44.347
Mes 2 12.445 M ÁXIM O 47.699
Mes 1
Mes 2
Mes 3
Mes 4
Mes 5
Mes 6
Mes 7
Mes 8
Mes 9
Mes 10
Mes 11
Mes 12
Mes 13
Mes 14
Mes 15
Mes 16
Mes 17
Mes 18
Mes 19
Mes 20
Mes 21
Mes 22
Mes 23
Mes 24
x → Es la variable sobre la que se pretende Mes 21 37.327
σ 𝑁𝑖 =1(𝑥𝑖 − 𝑥1 − 𝑥ҧ
+ (𝑥
2
2
− 𝑥ҧ)2+(𝑥
3 − 𝑥ҧ)2+ ⋯𝑁. +(𝑥
𝜎2 = 𝑥ҧ)2 𝜎2
=
𝑁 −
2
𝑥ҧ) que se debe calcular tal que:
𝑁 Obtendremos
X → Variable sobre la que se pretenden 1500 − 1500 2 + (1200 − 1500)2+(1700 − 1500)2+(1300 − 1500)2+(1800 − 1500)2
calcular la varianza 𝜎2 =
5
xi → Observación número i de la variable
X. i puede tomará valores entre 1 y n. 𝜎 2 = 52000 El resultado es de 52.000 euros al cuadrado.
N → Número de observaciones. Es importante recordar que siempre que calculamos la varianza tenemos las unidades de medida al
x̄ → Es la media de la variable X cuadrado. Para pasarlo a euros, en este caso tendríamos que realizar la desviación típica. El resultado
aproximado sería de 228 euros.
𝜎 = 228 Esto quiere decir que, la diferencia entre los salarios de las distintas personas será de 228 euros.
COEFICIENTE DE VARIACIÓN
o En caso se multiplicara por 100 los resultados pueden interpretarse a
partir de la siguiente tabla
Rango Interpretación
Características
0≤CV≤10% Variabilidad muy baja
10≤CV≤25% Baja variabilidad
𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚
𝐴𝑠 = 0 𝐴𝑠 > 0 𝐴𝑠 < 0
MEDIDAS DE DISTRIBUCIÓN
ASIMETRÍA
o El concepto de asimetría de una distribución de datos o valores, indica la
deformación horizontal de dichos datos.
Asimetría: Esta medida nos permite identificar si los
datos se distribuyen de forma uniforme alrededor del
punto central (Media aritmética)
3(𝑥ҧ 𝑥ҧ 𝑥ҧ
𝐴𝑠 = − 𝑥
)𝑠 𝑥
𝐴𝑠 = 0 ⇒ 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒𝑠 𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎
𝐴𝑠 > 0 ⇒ 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑜 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠
ҧ
𝑎𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 (𝑠𝑒𝑠𝑔𝑎𝑑𝑎 𝑎 𝑙𝑎 𝑑𝑒𝑟𝑒𝑐ℎ𝑎)
𝐴𝑠 < 0 ⇒ 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑜 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠
𝑎𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 (𝑠𝑒𝑠𝑔𝑎𝑑𝑎 𝑎 𝑙𝑎 𝑑𝑒𝑟𝑒𝑐ℎ𝑎)
MEDIDAS DE DISTRIBUCIÓN
Cuando la distribución de los datos cuenta con un coeficiente de asimetría (As =±0.5) y un
coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva Normal.
CURTOSIS
Ubicación • Distancia donde vive el estudiante con respecto al C.E (Lejos/ Cerca)
Número de hermanos en el
• Número de hermanos donde vive el estudiante (0-3)
hogar
SPSS