Está en la página 1de 52

Seminario de Estadística aplicada a la Investigación

Educacional
Dr. Joel Elvys Alanya Beltran
Unidad 1

Temas Objetivo
Entender los conceptos de
Definiciones básicas población, muestra y unidad
estadística.

Reconocer los tipos de variables


Tipos de variables
en un estudio de investigación

Reconocer los tipos de análisis a


Organización de datos
partir de cuadros y gráficos
¿Qué es la estadística?

¿Cuáles son las horas punta


Estadística !!!
del metropolitano?

¿Saben cuántos videos de


YouTube se visualizan en 1
minuto?

¿Cuál es la mejor marca


de celular?
¿Cuántos niños y
adolescentes
abandonaron la escuela en
estos 2 últimos años
después de la pandemia?
¿Cuántos partidos ganados
tiene mi equipo favorito?
¿Qué es la estadística?
La estadística es la ciencia que se encarga: Estadística Descriptiva
Es una fotografía instantánea de lo que está
Recolectar pasando en ese momento.

Gráficas

Describir Estadística Organizar


Medidas de resumen

Interpretar
Estadística Inferencial
La estadística se soporta en un conjunto de herramientas Se encarga de realizar generalizaciones hacia toda la
que se utilizan para obtener respuestas a preguntas población, utilizando la información proporcionada a
relevantes sobre los datos. partir de una muestra.
¿Qué es una población?

Es el conjunto total de elementos


(finita o infinita) que poseen al menos
una característica en común. También
es llamada universo

Población de habitantes Población de perros del


de un país distrito de Los Olivos

Población de autos
fabricados
¿Qué es una muestra?
Población: N
Muestra: n

Población

Muestra Es un subconjunto de
elementos de la
población en estudio

➢ La selección y el estudio de una muestra, tiene por objetivo la extracción de


conclusiones que sean válidas para la población del cual se obtuvo dicha muestra
¿Qué es la unidad estadística elemental?

Población: N
Muestra: n
Unidad
Es el elemento u
objeto indivisible de
la población que será
analizado
Ejemplo 1:

Imagina la población de la UNMSM:

✓ ¿Cuántos alumnos son?


✓ ¿Incluye los que están de vacaciones?
✓ ¿Los que están de intercambio?

La población es difícil de definir, una


muestra en cambio es más fácil.
Ejemplo 1:

Podemos entrar al comedor de la


universidad y buscar a 60 alumnos.

Entonces eso sería una muestra de la


población de los alumnos de la
universidad.

¿Esta muestra es
representativa?
Características de la muestra
Dos de las características importantes de la muestra es que sea representativa y aleatoria.

Representativa Aleatoria
La muestra debe reflejar los
elementos de la población, una Cada elemento o unidad de la
buena muestra debe darnos muestra debe ser elegido
información de toda la población completamente al azar.

¿En el ejemplo 1, la muestra es representativa y aleatoria?


Si entramos al comedor de la universidad no estamos eligiendo al azar, ya
que estamos eligiendo a alumnos que estaban en ese momento en el
comedor.
¿Es representativa?, ¿qué pasa con aquellos que nunca van al comedor?, la
muestra no es representativa.

¿Cómo nos aseguramos que la muestra sea representativa y


aleatoria?
Pedir accesos a la base de datos de la UNMSM y escoger un número de
estudiantes al azar.
Ejemplo 2:

Se realiza un sondeo preliminar para ver cual es el candidato municipal por el cual votarán los
habitantes de Lima Metropolitana en las próximas elecciones, con este fin entrevistan a 3500
electores de la ciudad. La pregunta es la siguiente: ¿Por quién votará en las próximas elecciones
municipales?. ¿Cuál es la población, muestra y la unidad estadística?

Población

Población: Los habitantes de Lima Metropolitana con derecho a voto.

Muestra: Serian los 3500 electores que forman parte de la población.


Muestra
Unidad: Cada habitante de la ciudad de Lima con derecho a voto.
▪ Variable y tipos de variables
▪ Parámetro y estadístico
¿Qué es una variable?
Población: N
Muestra: n
Unidad
La variable es una
característica de la
población que se va a
investigar y que puede
tomar diferentes valores

500 alumnos de 5to


de secundaria de Lima Ejemplos:
Metropolitana
✓ Altura del estudiante
✓ Número de horas que dedica a
Población de alumnos de 5to de estudiar matemática en la semana
secundaria de Lima Metropolitana ✓ Color favorito del estudiante
✓ Frecuencia de uso de redes sociales
Tipos de variables
Las variables se clasifican de la siguiente forma:

Contar !!!
Discretas Números o
Cuantitativas valores enteros

(Numéricas)
Continuas Medir !!!
Números decimales

Variables
Clasificar!!!
Nominales Valores no numéricos,
Cualitativas el orden es indistinto

(Categóricas) Jerarquizar !!!


Ordinales Valores no numéricos,
existe un orden
Variables Cuantitativas
Cuando el valor de la variable es expresada por una cantidad o número, con ellas se pueden realizar
operaciones aritméticas, se dividen en discretas y continuas.

Discretas Continuas
Son aquellas que resultan de la operación de Son aquellas que resultan cuando se mide alguna
contar, las variables discretas suelen tomar característica; pueden asumir un número
valores enteros. incontable de valores.

Número de hijos en una familia: 0, 1, 2, 3, 4, 5, 6 Estatura de los alumnos de 5to 1.54 cm, 1.65 cm,
de secundaria: 1.45 cm, 1.68 cm
………..
Tiempo de espera en la cola de 1.4 hrs, 2 hrs,
Número de estudiantes por colegio: 100, 250, 300, 500 un banco: 2.6 hrs, 3.2 hrs
Número de autos que pasan por 0, 10, 20, 45, 68 Salarios de los empleados de S / 950, S / 1050.6,
una avenida en 1 hora: una fábrica: S/ 1250.5 , S/ 1830.2
Variables Cualitativas
Estas variables expresan una cualidad, característica o atributo, no pueden ser medidas por números, se
clasifican en nominales y ordinales

Nominales Ordinales
Son aquellas cuyas respuestas se presentan en Son aquellas que agrupan a los elementos en
categoría sin implicar orden entre ellas. categorías ordenadas, para establecer relaciones
comparativas.

Género del estudiante: femenino masculino Grado de instrucción:


Primaria < Secundaria < Superior
Color de automóviles fabricados:
Frecuencia de uso de redes sociales:
R ara vez < Semanalmente < Diariamente
amarillo rojo negro verde azul
Satisfacción con la enseñanza online:
Profesión:
Nada S atisfecho Poco satisfecho S atisfecho
Muy S atisfecho Totalmentesatisfecho

doctor policía profesor periodista chef


Parámetro y Estadístico
Población
Muestra
Media muestral: 𝑥ҧ
Media poblacional: 𝜇 Desviación típica: S

Desviación típica: 𝜎 Proporción muestral: 𝑝


Proporción poblacional: p El estadístico o estadígrafo
es una medida resumen
que describe una
El parámetro es una
característica de la
medida resumen que
muestra
describe una
característica de toda la
Población.
Tablas de frecuencias
La tabla de frecuencias o distribución de frecuencias es una tabla que muestra como se agrupan o distribuyen
los datos, indicando el número de elementos por categoría o valor observado. Toma la siguiente forma:

1 Variable: Son los diferentes valores o categorías que toma 1 3 4 5 6 7


la variable a estudiar.

2 𝒏 : Número total de observaciones o elementos


Variable 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝐹𝑟𝑖 %𝑓𝑟𝑖
Frecuencia absoluta (𝑓𝑖 ) : Número de veces que aparece Categoría 1 𝑓1 𝐹1 𝑓𝑟1 𝐹𝑟1 100 ∗ 𝑓𝑟1
3 ese valor o categoría en el conjunto de elementos.
Categoría 2 𝑓2 𝐹2 𝑓𝑟2 𝐹𝑟2 100 ∗ 𝑓𝑟2
Frecuencia acumulada (𝐹𝑖) : Hasta cierto valor o categoría .
4 especifica, es la suma de las frecuencias absolutas de las
.
.
categorías anteriores incluyendo esa misma categoría. Categoría m 𝑓𝑚 𝐹𝑚 = 𝑛 𝑓𝑟𝑚 𝐹𝑟𝑚 = 1 100 ∗ 𝑓𝑟𝑚
5 Frecuencia relativa (𝑓𝑟𝑖) : Es la proporción de elementos 1
Total 𝑛
que pertenecen a una categoría o clase.
𝑚
Frecuencia relativa acumulada (𝐹𝑟𝑖): Es la suma de
6 frecuencias relativas. Se calcula también dividiendo la 2 𝑛 = ෍ 𝑓𝑖 = 𝑓1 + 𝑓2 + … + 𝑓𝑚
frecuencia acumulada entre el número de elementos. 𝑖 =1

7 Frecuencia porcentual (%𝑓𝑟𝑖 ): porcentaje de elementos 5 𝑓𝑟𝑖 = 𝑓𝑖 /𝑛


que pertenecen a una categoría o clase
Tablas de frecuencias
Ejemplo 1: Tenemos las respuestas de un grupo de estudiantes de 1 ciclo de Educación, a quienes se les pidió que
marquen la imagen de la red social que más usan. Con los resultados obtenidos, construir una tabla de frecuencias:

Red Social 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝐹𝑟𝑖 %𝑓𝑟𝑖

3 3 3/25 0.12 12%

8 11 8/25 0.44 32%

9 20 9/25 0.8 36%

5 25 5/25 1 20%

Total 25 1
Tablas de frecuencias
Ejemplo 1: Tenemos las respuestas de un grupo de estudiantes de 1 ciclo de Educación, a quienes se les pidió que
marquen la imagen de la red social que más usan. Con los resultados obtenidos, construir una tabla de frecuencias:

Red Social 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝐹𝑟𝑖 %𝑓𝑟𝑖

3 3 0.12 0.12 12%

8 11 0.32 0.44 32%

9 20 0.36 0.8 36%

5 25 0.2 1 20%

Total 25 1 100%
Tablas de frecuencias
Podemos usar la tabla de frecuencias cuando tenemos variables discretas con pocos valores.
Ejemplo 2: Una universidad realizó un experimento sobre el coeficiente intelectual (C.I.) de sus estudiantes, para lo
cual aplicó un examen de C.I. a un grupo de 20 estudiantes, con los resultados construir la tabla de frecuencias.

119, 109, 124, 119, 106, 112, C. I. 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝐹𝑟𝑖 %𝑓𝑟𝑖


112, 112, 112, 109, 112, 124,
109, 109, 109, 106, 124, 112, 106 3 3 0.15 0.15 15%
112, 106
109 5 8 0.25 0.4 25%
Ordenamos los datos de menor a mayor
112 7 15 0.35 0.75 35%
106, 106, 106, 109, 109, 109,
109, 109, 112, 112, 112, 112, 119 2 17 0.1 0.85 10%
112, 112, 112, 119, 119, 124,
124, 124 124 3 20 0.15 1 15%
Total 20 1 100%
Gráficos principales
Redes Sociales Gráficos de barras
10

8 9 Nos ayuda a visualizar el número


Tabla de frecuencias 8
de veces que se repite cada
6
categoría o valor observado. Se
Red Social 𝑓𝑖 %𝑓𝑟𝑖 4 5 utiliza para representar variables
2 3 cualitativas o cuantitativas
3 12%
discretas (con pocos valores).
0
Twiter Whatsapp Instagram Facebook
8 32%

9 36% % Uso de redes sociales Gráficos de sectores o pastel

5 20% 20%
12%
Este gráfico circular nos ayuda a
Twiter representar porcentajes o
Total 25 100% Whatsapp proporciones.
32% Instagram
Facebook
36%
Gráficos principales
Gráfico de Pareto
Tabla de frecuencias 10
100%
100%
88%
9 90%
Ordenamos las categorías por
8 80%
frecuencia absoluta de mayor a menor. 7
68%
70%
6 60%
Red Social 𝑓𝑖 %𝑓𝑟𝑖 %𝐴𝑐𝑢𝑚
5 50%
36%
9 36% 36% 4 40%
3 30%
2 20%
8 32% 68% 1 10%
9 8 5 3
0 0%
Instagram WhatsApp Facebook Twiter
5 20% 88%

3 12% 100% Es una herramienta que muestra en una sola vista los gráficos de barras y
líneas, los datos se ordenan por categoría de mayor a menor y se visualiza
Total 25 100% el porcentaje o frecuencia porcentual acumulada por cada categoría o
valor observado.

En el gráfico observamos que hasta el 68% de los estudiantes de 1er ciclo


de Educación usan más Instagram y WhatsApp.
Tablas de frecuencias para datos agrupados
Cuando la variable de estudio toma un gran número de valores o cuando la variable es de tipo continua,
trabajamos con la tabla de frecuencias en donde es necesario agrupar la información en intervalos.

Definiciones de la tabla de frecuencias: Ejemplo 1: Se tienen registrados la estatura de 100 niños, los cuales
se han agrupado en los siguientes intervalos:

1 Clases: Son los grupos o intervalos en que se divide el 1 3


conjunto de datos
Clase Marca 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝐹𝑟𝑖 %𝑓𝑟𝑖
2 Rango (R): diferencia entre el máximo y mínimo valor
de un conjunto de datos [1.25-1.29> 1.27 𝑓1 𝐹1 𝑓𝑟1 𝐹𝑟1 100 ∗ 𝑓𝑟1
[1.29-1.33> 1.31 𝑓2 𝐹2 𝑓𝑟2 𝐹𝑟2 100 ∗ 𝑓𝑟2
3 Marca de clase: Es el punto medio de cada intervalo.
[1.33-1.37> 1.35
Amplitud de intervalo (A): es diferencia entre el límite [1.37-1.41> 1.39
4 superior y límite inferior
[1.41- 1.45> 1.43 𝑓𝑚 𝐹𝑚 = 𝑛 𝑓𝑟𝑚 𝐹𝑟𝑚 = 1 100 ∗ 𝑓𝑟𝑚
Total 𝑛 1

2 𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 = 1.45 − 1.25 = 0.2 4 𝐴 = 0.04


Tablas de frecuencias para datos agrupados
Pasos para elaborar la tabla de frecuencias para datos agrupados:

Ejemplo 2: Se tienen registrados los pesos en kg de 50 personas: 1 Identificar el número de datos: 𝑛

2 Calcular el rango de los datos: 𝑅 = 𝑥 𝑚𝑎𝑥 − 𝑥 𝑚𝑖𝑛


65.0 61.4 63.5 63.9 62.0 69.8 62.3 64.6 67.3 72.5
67.4 62.0 61.5 69.3 67.3 65.3 62.0 62.0 69.4 73.5 Hallar el número de intervalos: No existe un consenso
71.9 63.9 74.0 63.0 65.9 61.5 67.3 69.4 74.0 74.0 3 para determinar un número intervalo, como regla
63.5 63.9 73.5 72.5 65.0 63.0 65.2 66.5 61.4 69.8
61.4 68.0 70.6 67.4 73.5 64.6 71.9 68.1 74.0 72.4
frecuente se recomienda usar la Regla de Sturges:

𝑘 = 1 + 3.3log(n)
Ordenamos los datos de menor a mayor
4 Determinar la amplitud de la clase o intervalo:
60.0 61.3 61.4 61.4 61.5 61.7 62.0 62.0 62.1 62.1 𝐴 = 𝑅/𝑘
62.3 63.0 63.5 63.9 64.0 64.1 64.6 65.0 65.2 65.3
65.5 65.7 65.8 65.9 66.5 67.3 67.3 67.4 67.4 67.5 5 Hallar el limite inferior y limite superior de cada
67.8 67.8 68.0 68.1 68.5 69.3 69.4 69.7 69.8 70.6 intervalo y la marca de clase.
71.9 72.3 72.4 72.5 72.7 73.5 73.6 73.7 74.0 74.0
6 Hallar la frecuencia absoluta, acumulada, relativa y otras
columnas vistas en la tabla de frecuencia
Tablas de frecuencias para datos agrupados
Pasos para elaborar la tabla de frecuencias para datos agrupados:
𝑥 𝑚𝑖𝑛
1 𝑛 = 50 60.0 61.3 61.4 61.4 61.5 61.7 62.0 62.0 62.1 62.1
62.3 63.0 63.5 63.9 64.0 64.1 64.6 65.0 65.2 65.3
65.5 65.7 65.8 65.9 66.5 67.3 67.3 67.4 67.4 67.5
2 𝑅 = 𝑥 𝑚𝑎𝑥 − 𝑥 𝑚𝑖𝑛 = 74 − 60 = 14
67.8 67.8 68.0 68.1 68.5 69.3 69.4 69.7 69.8 70.6
71.9 72.3 72.4 72.5 72.7 73.5 73.6 73.7 74.0 74.0
Calculamos el número de intervalos usando la Regla
3
de Sturges: 𝑥 𝑚𝑎𝑥
𝑘 = 1 + 3.3log 50 = 6.6 ≈ 7
Clase Marca 𝑓𝑖 𝐹𝑖 𝑓𝑟𝑖 𝐹𝑟𝑖 %𝑓𝑟𝑖
4 Determinar la amplitud de la clase o intervalo:
[ 60 - 62 > 61 6 6 0.12 0.12 12%
𝑅 14
𝐴= = =2 [ 62 - 64 > 63 8 14 0.16 0.28 16%
𝑘 7
[ 64 - 66 > 65 10 24 0.20 0.48 20%
Hallar el limite inferior y limite superior de cada
5 [ 66 - 68 > 67 8 32 0.16 0.64 16%
intervalo y la marca de clase.
Limite inferior
𝐴=2 Limite superior [ 68 – 70 > 69 7 39 0.14 0.78 14%
[ 70 – 72 > 71 6 45 0.12 0.90 12%
60 61 62
Hallar la frecuencia absoluta, acumulada, relativa, [ 72 – 74 ] 73 5 50 0.10 1 10%
6
relativa acumulada y frecuencia porcentual Total 50 1 100%
Gráficos principales
Tabla de frecuencias Histograma de frecuencias absolutas - Pesos
12
Clase 𝑓𝑖 𝑓𝑟𝑖 %𝑓𝑟𝑖 10
10
[ 60 - 62 > 6 0.12 12% 8 8
8 7
[ 62 - 64 > 8 0.16 16% 6 6
[ 64 - 66 > 10 0.20 20% 6 5

[ 66 - 68 > 8 0.16 16% 4


[ 68 – 70 > 7 0.14 14% 2
[ 70 – 72 > 6 0.12 12%
0
[ 72 – 74 ] 5 0.10 10% [ 60 - 62 > [ 62 - 64 > [ 64 - 66 > [ 66 - 68 > [ 68 - 70 > [ 70 - 72 > [ 72 - 74 ]
Total 50 1 100%
Histograma de % frecuencias relativa - Pesos
Histograma de frecuencias 25%
20%
Este gráfico es muy similar al gráfico de barras, sin 20%
16% 16%
embargo en el histograma las barras deben ir uno al lado 15% 14%
12% 12%
de las otras, sin que haya un espacio que los separe. 10%
10%

Se usa para representar gráficamente las frecuencias 5%


absolutas o relativas de variables cuantitativos continuos
0%
agrupados en clases. [ 60 - 62 > [ 62 - 64 > [ 64 - 66 > [ 66 - 68 > [ 68 - 70 > [ 70 - 72 > [ 72 - 74 ]
Temas Objetivo
Medidas de tendencia Calcular las medidas de
central tendencia central,
posición, dispersión y
medias de asimetría.
Medidas de posición
Explicar las características
Medidas de dispersión y usos en la investigación

Ver problemas prácticos


Medidas de asimetría con el uso de R y SPSS
¿Qué es una medida de tendencia central?

Características Media

Se encargan de resumir información de un


conjunto de datos numéricos

Se llaman medidas de tendencia central porque


generalmente la acumulación más alta de datos Medida de
se encuentra en los valores intermedios
tendencia
central
Nos facilita información sobre la serie de datos
que estamos analizando

Mediana Moda
Resume un conjunto de datos de forma que
podamos tener un panorama general
MEDIA

o La media es un resumen de los valores observados en un único valor asociado a valor


localizado en el centro.
Características o Es la medida más común para una variable numérica.

Para datos no agrupados N: número de observaciones o personas


Es sensible a la variación de los datos Es la suma de los valores divididos entre el total de x: variable talla
valores

No se puede calcular si algún intervalo


es de límite abierto 𝛍 : Representa la media poblacional

𝒙: Representa la media muestral

No se recomienda utilizar si los valores Forma de cálculo


presenta valores extremos
σ𝑛 𝑥
𝑖=1 𝑥 + 𝑥𝑖 + 𝑥1 + ⋯ . +𝑥2
𝑥ҧ = =
𝑛 3 𝑛 𝑛
MEDIA

Para datos agrupados en tablas de frecuencias


Su cálculo se da como la multiplicación de la variable por Notas Frecuencia fi fi Mi
la frecuencia respectiva (f), luego se obtiene la suma de
todos estos productos y luego a este valor se lo divide
para el número de elementos (n). . 5 10 50
7 20 140
fi : Representa la frecuencia o número de casos con
una característica 10 40 400
n: Representa la cantidad de elementos 17 20 340
20 10 200
Forma de cálculo
Total 100 1130

σ 𝑛𝑖 =1 𝑓𝑖 𝑥𝑖 𝑓1 𝑥1 + 𝑓2 𝑥2 + 𝑓3 𝑥3 + ⋯ . +𝑓𝑛 𝑥𝑛
𝑥ҧ = =
𝑛 𝑛
𝟏130
𝑋ത= = 11,30 ≈ 11
𝟏𝟎𝟎

La nota promedio es 11 en el salón de clases


MEDIANA

o La mediana representa la posición central de la variable que separa la mitad superior


y la mitad inferior de las observaciones
Características o La cantidad de datos que queda por debajo y por arriba de la mediana son iguales.

Menos sensible que la media Para datos no agrupados Mediana es el valor central si n es impar
a la variación de las La mediana es el dato que se encuentra a la mitad de la Ejm1: n=5 17
puntuaciones lista. 10 12 13 15

Se puede calcular aunque


algún intervalo carezca de
𝑥෤: Representa la mediana Es el valor promedio de los valores centrales,
límites
cuando n es par
Ejm2: n=6
Más representativa que la
Forma de cálculo
media cuando hay presencia
17 40
de valores extremos 𝑥෤= 𝑥𝑛 +1 10 12 13 15
2 Nota: Es importante ordenar los datos
previamente.
𝐸𝑗𝑚1: 𝑥෤= 𝑥𝑛 +1 = 𝑥5+1 = 𝑥3 = 13
2 2
Ejm2: 𝑥෤=(13+15)/2=14
MODA
• Indica el valor que más se repite, o la clase que posee mayor frecuencia.
• En el caso de que dos valores presenten la misma frecuencia, decimos que
existe un conjunto de datos bimodal. Para más de dos modas
Características hablaremos de un conjunto de datos multimodal.

Es mayormente usada para datos


categóricos por ejemplo: Nivel Para datos no agrupados Mediana es el valor central si n es impar
socioeconómico Ejm1: n=5
Se procede a hacer un conteo de casos por cada valor
de la variable de interés

𝑀0 : 𝑅𝑒𝑝𝑟𝑒𝑠𝑒𝑚𝑡𝑎 𝑙𝑎 𝑚𝑜𝑑𝑎
No es afectada por valores muy altos o
muy bajos.
Forma de cálculo
Frecuencia
- Primero se saca un cuadro de frecuencias de cada valor NSE
fi
-Se identifica como moda el valor que se repite con más A 3
Se puede usar también cuando tenemos frecuencia.
datos numéricos Ejm: La nota más B 5
frecuente (moda) C 4
Total 12

𝑀0 = 𝑁𝑆𝐸 𝐵
MEDIA

Para datos agrupados con intervalos Rango notas Marca de clase


Frecuencia fi fi Mi
Su cálculo se da como la sumatoria del (Clases) Mi
producto de la frecuencia por la marca de clase .
[0-4] 15 2 (0+4)/2 30 15x2

fi : Representa la frecuencia o número de casos con [5-9] 27 7 (5+9)/2 189 27x7

una característica [10-14] 21 12 (10+14)/2 252 21x12


Mi: Representa la marca de clase (valor promedio de los [15-17] 32 16 (15+17)/2 512 32x16
rangos inferior y superior de cada intervalo)
[18-20] 5 19 (18+20)/2 95 5x19
Forma de cálculo Total 100 1078
σ 𝑛𝑖 =1 𝑓𝑖 𝑥𝑖 𝑀𝑖
𝑥ҧ =
𝑛
𝑓1𝑥1𝑀1 + 𝑓2𝑥2𝑀2 + 𝑓3𝑥3𝑀3 + ⋯ . +𝑓𝑛𝑥𝑛𝑀𝑛
=
𝑛 𝟏𝟎𝟕𝟖
𝑋ത= = 10,78 ≈ 11
𝟏𝟎𝟎

La nota promedio es 11 en el salón de clases


MEDIA PONDERADA

Para datos agrupados en tablas de frecuencias


%
Cuando los números 𝑥1 , 𝑥2 , … . . , 𝑥𝑛 se les asocian ciertos Participación Notas 𝑥𝑖 𝑝𝒊
factores peso (o pesos) 𝑝1, 𝑝2, 𝑝3, … , 𝑝𝑛 dependientes de Alumnos
en clase
la relevancia asignada a cada número, en tal caso se
requiere calcular la media aritmética ponderada
1 4,2 17 71,4
2 3,5 14 49
pi : pesos asignados a cada categoría
3 1,2 13 15,6
Total 8,9 136

Forma de cálculo
σ 𝑛𝑖 =1 𝑥𝑖𝑝𝑖 𝑥1 𝑝1 + 𝑥2 𝑝2 + 𝑥3 𝑝3 + ⋯ . +𝑥𝑛 𝑝𝑛
𝑥ҧ = 𝑝 =
σ 𝑖 =1 𝑝𝑖 𝑝1 + 𝑝2 + 𝑝3 + ⋯ + 𝑝𝑛
𝟏36
𝑋ത= = 15,28 ≈ 15
8,9

La nota promedio ponderada es 15 en el salón de


clases
MEDIANA
Para datos agrupados en intervalos (Por interpolación)
Primero se calcula n/2 y después se averigua el intervalo
en el que está la mediana, este intervalo recibe el Frecuencia
nombre de intervalo o clase de la mediana. Para Frecuencia
Rango Marca Frecuencia relativa
averiguar el intervalo en el que está la mediana se Frecuencia relativa
aconseja calcular la frecuencia acumulada notas de clase acumulada acumulada
fi fa
(Clases) Mi fa Ha

[0-4] 2 15 15 15/100=0,15 0,15


fa: Representa la frecuencia acumulada
[5-9] 7 27 15+27=42 27/100=0,27 0,42
[10-14] 12 21 42+21=63 21/100=0,21 0,63
[15-17] 16 32 32+63=95 32/100=0,32 0,95
Forma de cálculo
[18-20] 19 5 95+5=100 5/100=0,05 1
𝑛 100
- Primero se calcula = = 50
2 2 Total 100
-Se identifica en que frecuencia acumulada se Entre las clases 7 y 12 se encuentra el punto que divide en dos partes iguales la cantidad de
encuentra el valor n/2, para identificar las clases
datos
asociadas. Le falta 0,08 para llegar al 50% de los datos
- Interpola los datos para encontrar la mediana Clase Ha
5 0,21 Para llegar al 50% de los
12 0,63 datos, a la clase 7 debemos
Incremento 0,08
7 0,42 incrementarle 1,90.
𝑥෤= 7+1,9=8,9
Diferencia 5 0,21
5𝑥 0,08 0,4
Incremento = = = 1,90
0,21 0,21
MODA
Rango Marca
Frecuencia
notas de clase
Para datos agrupados fi
(Clases) Mi
Se procede a hacer un conteo de casos por cada rango [0-4] 2 15 La moda de las notas en el
salón de clases corresponden a
[5-9] 7 27
los alumnos que tienen entre 5
[10-14] 12 21 y 9 de nota en la evaluación.
[15-17] 16 12
[18-20] 19 5
𝑀0 : 𝑅𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑙𝑎 𝑚𝑜𝑑𝑎

Para el ejemplo:
𝐿𝑖 : 5
Algunos autores usan la •Se identifica como frecuencia inferior inmediata al intervalo anterior al
△ 1 : (27-15)=12
que se encuentra la moda.
Forma de cálculo siguiente fórmula: △ 2 : (27-21)=5
•Se identifica como frecuencia inferior inmediata al intervalo anterior al
-Primero se saca un 𝑀0 = 𝐿𝑖 + (△
△1
)*C que se encuentra la moda C: (9-5)=4
1 +△ 2
cuadro de frecuencias de
12
cada rango 𝐿𝑖 : Límite inferior de la clase modal 𝑀0 = 5 + ( )*4 =7,82 ≈8
△ 1 : Diferencia entre la frecuencia modal y la frecuencia inferior inmediata 12+5
-Se identifica como moda △ 2 : Diferencia entre la frecuencia modal y la frecuencia superior inmediata
el rango que presenta del intervalo que contiene la moda De todas las notas, la nota más frecuente
más cantidad de casos C: Amplitud en el salón de clases es 8
¿Qué es una medida de posición?

Características Percentil

Se trata de medidas que dan cuenta


de una determinada posición
dentro de la distribución de unos
datos Medidas
de
posición
Resumen en un solo número la
posición o localización de la
distribución de los datos Cuartil Decil
PERCENTIL

P25 P50 P75 P100

Características

Representan los valores de la 25% 25% 25% 25%


variable que están por debajo
de un porcentaje, el cual
puede ser de 1% al 100% 𝐸𝑗𝑒𝑚𝑝𝑙𝑜
De un total de 100 alumnos del C.E 001, se obtuvo información de la talla de
los alumnos del 5to de secundaria, obteniéndose los siguientes percentiles

• 𝐷𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑎𝑙𝑢𝑚𝑛𝑜𝑠 𝑑𝑒𝑙 𝐶. 𝐸 001, 𝑠𝑒 𝑝𝑢𝑒𝑑𝑒 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑒𝑙 5%


Percentil 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑡𝑖𝑒𝑛𝑒𝑛 𝑢𝑛𝑎 𝑡𝑎𝑙𝑙𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 1,48
Notación: Pk P5 1,48 • Del total de alumnos del C.E 001, se puede afirmar que el 50% de
P25 1,51 los alumnos tienen una talla menor que 1,62.
P50 1,62 • Del total de alumnos del C.E 001, se puede afirmar que el 75% de
los alumnos tienen una talla menor que 1,68.
P75 1,68
• Del total de alumnos del C.E 001, se puede afirmar que el 100% de
P100 1,75
los alumnos tienen una talla menor que 1,75
CUARTIL

Q1:25% Q2: 50% Q3:75%


(mediana)
Características

La medidas de posición se
llaman en general cuantiles, 25% 25% 25% 25%
una de ellas son los cuartiles
los cuales van a dividir los 𝑄1: 𝑃𝑟𝑖𝑚𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 25%
datos en 4 partes iguales: 𝐸𝑗𝑒𝑚𝑝𝑙𝑜
𝑄2: 𝑆𝑒𝑔𝑢𝑛𝑑𝑜 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 50% De un total de 100 alumnos del C.E 001, se obtuvo información de la talla de los
alumnos del 5to de secundaria, obteniéndose los siguientes cuartiles
𝑄3: 𝑇𝑒𝑟𝑐𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 75%
Para definir un rango de
posición es Cuartiles • 𝐷𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑎𝑙𝑢𝑚𝑛𝑜𝑠 𝑑𝑒𝑙 𝐶. 𝐸 001, 𝑠𝑒 𝑝𝑢𝑒𝑑𝑒 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑒𝑙 25%
necesario ordenar primero la Q1 1,51 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑡𝑖𝑒𝑛𝑒𝑛 𝑢𝑛𝑎 𝑡𝑎𝑙𝑙𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 1,51
variable de menor a mayor. Q2 1,62 • Del total de alumnos del C.E 001, se puede afirmar que el 50% de
Q3 1,68 los alumnos tienen una talla menor que 1,62.
Q4 1,75 • Del total de alumnos del C.E 001, se puede afirmar que el 75% de
los alumnos tienen una talla menor que 1,68.
DECIL
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
(mediana)

Características
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
Para los deciles, tomaremos
el total de los datos divididos
en 10 partes iguales, por D1: 𝑃𝑟𝑖𝑚𝑒𝑟 𝑑𝑒𝑐𝑖𝑙 (𝑎𝑔𝑟𝑢𝑝𝑎 10% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠) Ejemplo
tanto, existirán 10 deciles que De un total de 100 alumnos del C.E 001, se obtuvo información
representan el 100%. D2: 𝑆𝑒𝑔𝑢𝑛𝑑𝑜 𝑑𝑒𝑐𝑖𝑙 (𝑎𝑔𝑟𝑢𝑝𝑎 20% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠) de la talla de los alumnos del 5to de secundaria, obteniéndose
los siguientes deciles
D3: 𝑇𝑒𝑟𝑐𝑒𝑟 𝑑𝑒𝑐𝑖𝑙 (𝑎𝑔𝑟𝑢𝑝𝑎 30% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠)
Deciles • 𝐷𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑎𝑙𝑢𝑚𝑛𝑜𝑠 𝑑𝑒𝑙 𝐶. 𝐸 001, 𝑠𝑒 𝑝𝑢𝑒𝑑𝑒 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑞𝑢𝑒 𝑒𝑙 20%
𝐷4: 𝐶𝑢𝑎𝑟𝑡𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 40% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑡𝑖𝑒𝑛𝑒𝑛 𝑢𝑛𝑎 𝑡𝑎𝑙𝑙𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑎 1,59
Para definir un rango de D1 1,47
• Del total de alumnos del C.E 001, se puede afirmar que el
posición es necesario ordenar 𝐷5: 𝑄𝑢𝑖𝑛𝑡𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 50% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 D2 1,59
50% de los alumnos tienen una talla menor que 1,62.
primero la variable de menor D3 1,60
a mayor. 𝐷6: 𝑆𝑒𝑥𝑡𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 60% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 D4 1,61
𝐷7: 𝑆é𝑝𝑡𝑖𝑚𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 70% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 D5 1,62
𝐷8: 𝑂𝑐𝑡𝑎𝑣𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 80% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠
𝐷9: 𝑁𝑜𝑣𝑒𝑛𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 90% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠
𝐷10: 𝐷é𝑐𝑖𝑚𝑜 𝑑𝑒𝑐𝑖𝑙 𝑎𝑔𝑟𝑢𝑝𝑎 100% 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠
¿Qué es una medida de dispersión?

Características Rango

Las medidas de dispersión son


números que indican si una variable Principales
se mueve mucho, poco, más o Coeficiente
medidas Desviación
de
menos que otra variación de estándar
dispersión

Resumen en un solo número la


posición o localización de la
distribución de los datos Varianza
RANGO
Ejemplo
En los últimos 2 años se ha establecido un registro mensual del porcentaje de
participación de las instituciones educativas en las competencias matemáticas en el
distrito del Callao. Entre otras muchas métricas, se pide que se calcule el rango del
Características porcentaje de participación en matemáticas.

Mes Porcentaje
Mes 1 44.347
Mes 2 12.445 M ÁXIM O 47.699

Mes 3 26.880 M ÍN IM O 10.124


El rango es un valor Mes 4 23.366 RANGO 37.575
numérico que indica la Mes 5 42.464
Mes 6 15.480
diferencia entre el valor Mes 7 21.562 Porcentaje de participación en matemáticas
máximo y el mínimo de una Mes 8 11.625 60.000
Mes 9 39.496
población o muestra Mes 10 39.402 50.000
Máximo 47.699
estadística. Mes 11 47.699
Mes 12 44.315 40.000 Rango:
Mes 13 29.581 37,575
Mes 14 44.320
30.000
R = Máxx – Mínx
Mes 15 35.264
20.000
R → Es el rango. Mes 16 10.124
Máx → Es el valor máximo de la muestra o Mes 17 43.520
10.000 Mínimo 10.124
población. Mes 18 26.360
Mín → Es el valor mínimo de la muestra o Mes 19 19.534 0
población estadística. Mes 20 30.755

Mes 1
Mes 2
Mes 3
Mes 4
Mes 5
Mes 6
Mes 7
Mes 8
Mes 9
Mes 10
Mes 11
Mes 12
Mes 13
Mes 14
Mes 15
Mes 16
Mes 17
Mes 18
Mes 19
Mes 20
Mes 21
Mes 22
Mes 23
Mes 24
x → Es la variable sobre la que se pretende Mes 21 37.327

calcular esta medida. Mes 22 15.832


Mes 23 33.919
Mes 24 29.498
EjemploRango.xls
VARIANZA
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con un
salario diferente:
La varianza es una medida de
dispersión que representa la • Juan: 1500 euros
variabilidad de una serie de datos • Pepe: 1200 euros
respecto a su media. Formalmente se • José: 1700 euros
calcula como la suma de los residuos al • Miguel: 1300 euros
cuadrado divididos entre el total de • Mateo: 1800 euros
observaciones.
La media del salario, la cual necesitamos para nuestro cálculo, es de
La raíz cuadrada de la varianza es la
((1500 + 1200 + 1700 + 1300 + 1800) /5) =1500 euros.
desviación 𝜎
Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:

σ 𝑁𝑖 =1(𝑥𝑖 − 𝑥1 − 𝑥ҧ
+ (𝑥
2
2
− 𝑥ҧ)2+(𝑥
3 − 𝑥ҧ)2+ ⋯𝑁. +(𝑥
𝜎2 = 𝑥ҧ)2 𝜎2
=
𝑁 −
2
𝑥ҧ) que se debe calcular tal que:
𝑁 Obtendremos
X → Variable sobre la que se pretenden 1500 − 1500 2 + (1200 − 1500)2+(1700 − 1500)2+(1300 − 1500)2+(1800 − 1500)2
calcular la varianza 𝜎2 =
5
xi → Observación número i de la variable
X. i puede tomará valores entre 1 y n. 𝜎 2 = 52000 El resultado es de 52.000 euros al cuadrado.
N → Número de observaciones. Es importante recordar que siempre que calculamos la varianza tenemos las unidades de medida al
x̄ → Es la media de la variable X cuadrado. Para pasarlo a euros, en este caso tendríamos que realizar la desviación típica. El resultado
aproximado sería de 228 euros.
𝜎 = 228 Esto quiere decir que, la diferencia entre los salarios de las distintas personas será de 228 euros.
COEFICIENTE DE VARIACIÓN
o En caso se multiplicara por 100 los resultados pueden interpretarse a
partir de la siguiente tabla

Rango Interpretación
Características
0≤CV≤10% Variabilidad muy baja
10≤CV≤25% Baja variabilidad

Su cálculo se obtiene de dividir la desviación 25≤CV≤40% Variabilidad moderada


típica entre el valor absoluto de la media del
conjunto y por lo general se expresa en
porcentaje para su mejor comprensión. 40≤CV≤50% Alta variabilidad
Con esta medida de dispersión se mide la
variabilidaden porcentaje de un conjunto de CV>50% Variabilidad muy alta
datos con métricas diferentes.

Muestra la variación relativa a la


media
o En caso no se multiplicara por 100 los resultados pueden interpretarse a
Es usado también para comparar 2 o más
grupos
partir de la siguiente tabla

Para la población se utiliza la fórmula Rango Interpretación


siguiente:
𝜎 0≤CV≤0.01 Variabilidad muy baja
𝐶𝑉 = *100%
|𝑋| 0.1≤CV≤0.25 Baja variabilidad
Para la muestra se utiliza la fórmula siguiente:
𝑆 0.25≤CV≤0.40 Variabilidad moderada
𝐶𝑉 = *100%
|𝑥ഥ|
0.40≤CV≤0.50 Alta variabilidad

CV>0.50 Variabilidad muy alta


ASIMETRÍA
El equilibrio simétrico se presenta cuando al segmentar o dividir un todo en dos partes, la composición de la mitad es igual a la otra mitad.

Es decir la asimetría corresponde a la desigualdad entre las dos partes de un todo.

𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚

Es el grado en que la forma de la


distribución de los datos no es simétrica
𝑥ҧ 𝑥ҧ 𝑥ҧ
COLA COLA
COLA COLA

𝐴𝑠 = 0 𝐴𝑠 > 0 𝐴𝑠 < 0
MEDIDAS DE DISTRIBUCIÓN
ASIMETRÍA
o El concepto de asimetría de una distribución de datos o valores, indica la
deformación horizontal de dichos datos.
Asimetría: Esta medida nos permite identificar si los
datos se distribuyen de forma uniforme alrededor del
punto central (Media aritmética)

Una distribución es simétrica cuando su mediana, su


moda y su media aritmética coinciden y es 0.

Entre las medidas más usuales tenemos el


coeficiente de asimetría de Pearson

3(𝑥ҧ 𝑥ҧ 𝑥ҧ
𝐴𝑠 = − 𝑥෤
)𝑠 𝑥
𝐴𝑠 = 0 ⇒ 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒𝑠 𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎
𝐴𝑠 > 0 ⇒ 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑜 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠
ҧ
𝑎𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 (𝑠𝑒𝑠𝑔𝑎𝑑𝑎 𝑎 𝑙𝑎 𝑑𝑒𝑟𝑒𝑐ℎ𝑎)
𝐴𝑠 < 0 ⇒ 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑜 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠
𝑎𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 (𝑠𝑒𝑠𝑔𝑎𝑑𝑎 𝑎 𝑙𝑎 𝑑𝑒𝑟𝑒𝑐ℎ𝑎)
MEDIDAS DE DISTRIBUCIÓN
Cuando la distribución de los datos cuenta con un coeficiente de asimetría (As =±0.5) y un
coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva Normal.
CURTOSIS

Curtosis: El término proviene del griego “kurtos” que


significa arqueado, por lo tanto la curtosis señala el
El coeficiente de curtosis permitirá
Si los datos están muy concentrados hacia la
grado de apuntamiento o achatamiento de la media, la distribución es leptocúrtica (curtosis
evaluar si la distribución de los
distribución, como se ve en la siguiente figura:
(distribución normal).
datos se aproximan o no a una mayor a 0).
normal
Se puede calcular utilizando la
siguiente fórmula:
σ (𝑥 𝑖 −𝑥ҧ)4 ∗
𝑔2 = 1 -3 Si los datos están muy dispersos, la
( 𝑓𝑖
distribución es platicúrtica (curtosis menor
σ(𝑥𝑖−𝑥ҧ)2∗𝑓𝑖)2
Donde: a 0).
𝑥𝑖 : Cada uno de los datos
𝑥ҧ: Es la media de los datos
𝑓𝑖: Es la frecuencia de cada valor
Posee una concentración moderada de
valores alrededor de la media
Indica que tan apuntada o achatada se encuentra una
distribución respecto a un comportamiento normal

Donde (g2) representa el coeficiente de curtosis


Recordemos

Escala de Frecuencias Medidas de Medidas de Medidas de Gráficos


medida posición dispersión distribución
Nominal Sí Moda No No Sectores y
barras
Ordinal Sí Moda No No Sectores,
barras y
áreas
Escala No Media, Sí Sí Histograma,
mediana áreas y
,moda dispersión
Aplicación
El archivo ProgramaEstudiantil. csv contiene datos de un grupo de estudiantes de un C. E. P de primaria y secundaria .
Los datos registrados, tienen la particularidad de tener información situacional de los alumnos condicion familiar .
El programa estudiantil tiene el objetivo de procurar el éxito y permanencia escolar del grupo de adolescentes, en las
etapas de primaria y secundaria a través de una beca estudiantil que cubra el 50% de los costos mensuales.
(Variables)
Calificaciones • Nivel de calificación del último trimestre (1:bajo, 2:medio, 3:alto)

Uso tecnológico • Cuenta con laptop o PC (1:Si / 0:No)

Vivienda • El tipo de vivienda donde reside el estudiante. (Propia / Alquilada)

Situación familiar • Padres separados (1:Si / 0: No)

Ubicación • Distancia donde vive el estudiante con respecto al C.E (Lejos/ Cerca)

Número de hermanos en el
• Número de hermanos donde vive el estudiante (0-3)
hogar

Ingresos mensuales en el hogar • Sueldo neto mensual en el hogar

Es importante que los estudiantes cuenten con el SPSS y R STUDIO instalado


Aplicación
𝐶𝑎𝑙𝑐𝑢𝑙𝑒 𝑙𝑎𝑠 siguientes 𝑚𝑒𝑑𝑖𝑑𝑎𝑠 estadísticas mencionadas en la sesión para los Ingresos mensuales en el hogar de los estudiantes e interprete
los resultados.
SPSS
R

• Del total de hogares de los 1,000 estudiantes, el promedio de ingresos en el


hogar es de 1,600,37 soles con una desviación de 384,721 soles.
• El ingreso mensual del hogar que más se repite en los hogares de los
estudiantes es de 1,500 soles.
• El 50% de los hogares de los estudiantes tienen un ingreso mensual menor a
1,500 soles.
• El ingreso mensual más bajo en los hogares es de 933 soles y el más alto de
2,967 soles.
• El 25% de los hogares de los estudiantes tienen un ingreso mensual menor a
1,327 soles.
• La asimetría es positiva >0 y la curtosis cercano a 0, por lo que podemos
afirmar que la distribución no cumple los criterios de normalidad
Aplicación R

SPSS

También podría gustarte