Documentos de Académico
Documentos de Profesional
Documentos de Cultura
investigación
Administración de negocios
Bienvenidos
Estadística Aplicada a la
Investigación
José Luis Tuesta Chávez | Docente
fjtuesta@zegelipae.pe
2023 - I
ADMINISTRACIÓN DE NEGOCIOS V CICLO
Estadística aplicada a la Investigación
IL 2: MEDIDAS DE CENTRALIZACIÓN Y DISPERSIÓN.
Calcula e interpreta las medidas de tendencia central y de
dispersión.
Tema:
• Medidas de tendencia Central
• Medidas de Dispersión
6 5/07/2023
Media Aritmética
k
i=1(fi ∙ xi )
Solución Los 100 conductores tienen una edad
promedio 37 años.
x=
n
Marca Frecuencia
Intervalo de
Frecuencia
Absoluta
2° Hallando la
[Li – Ls> clase
Absoluta
(fi)
Acumulada xi.fi media
1° Construir la (xi) (Fi)
aritmética.
[16 – 25> 20,5 44 44 902
tabla de
[25 – 34> 29,5 15 59 442,5
Distribución de
[34 – 43> 38,5 11 70 423,5
Frecuencias, [43 – 52> 47,5 9 79 427,5
sólo con los 3688
[52 – 61> 56,5 5 84 282,5 𝑥ҧ =
100
datos [61 – 70> 65,5 3 87 196,5
necesarios. 𝑥ҧ = 36,88
[70 – 79> 74,5 8 95 596
[79 – 88] 83,5 5 100 417,5
7 5/07/2023
Se ubicará el intervalo [LI - LS] n
− Fm−1
Solución donde se ubique el
correspondiente a n/2. Dicho
intervalo tiene una Fm
valor
Me = LI + A 2
fm
• Ubicamos la
clase mediana,
que contiene a la
Marca Frecuencia mediana, para
Frecuencia
Intervalo de Absoluta
[Li – Ls> clase
Absoluta
(fi)
Acumulada xi.fi esto hallamos:
(xi) (Fi)
[16 – 25> 20,5 44 44 902 𝑛 100
= = 50
[25 – 34> 29,5 15 59 442,5 2 2
3° Hallando
[34 – 43> 38,5 11 70 423,5
la mediana. [43 – 52> 47,5 9 79 427,5
• Reemplazamos
en la fórmula:
[52 – 61> 56,5 5 84 282,5
100
[61 – 70> 65,5 3 87 196,5 −44
2
[70 – 79> 74,5 8 95 596 𝑀𝑒 = 25 + 9
15
[79 – 88> 83,5 5 100 417,5
Mediana
𝑀𝑒 =28,6
El 50% de los conductores, tiene menos de 28,6 años.
8 5/07/2023
Se ubicará el intervalo [LI - LS] donde se ubique la fm − fm−1
Intervalo
Marca
de
Frecuencia
Frecuencia
Absoluta
• Ubicamos la clase
[Li – Ls> clase
Absoluta
(fi)
Acumulada xi.fi modal, que contiene a
(xi) (Fi) la moda, es decir la
[16 – 25> 20,5 44 44 902 frecuencia absoluta
[25 – 34> 29,5 15 59 442,5
más grande:
Moda 𝑀𝑜 = 21,42
La mayoría de los conductores tienen aproximadamente 22 años.
9 5/07/2023
Aplicación en PSPP para una variable cuantitativa
1º
2º
3º
5º
Colocar el nombre de la
nueva variable
4º
11 Tablas de frecuencias para datos agrupados
Aplicación
Tenemos la
en PSPP para una variable cuantitativa
nueva
variable
2º
1º
Elegimos las
medidas de
posición central
Varianza
absolutas Las medidas estadísticas
de variabilidad se clasifican
Desviación Estándar
en absolutas o relativas.
Medidas Coeficiente de Variación
relativas
14
Rango
Es la medida de variabilidad o dispersión más
simple. Se calcula tomando la diferencia
entre el valor máximo y el mínimo observado.
Rango
R = Max − Min El rango o amplitud total es la medida de
(R) dispersión muy fácilmente calculable, pero es
muy inestable, ya que depende únicamente
de los dos valores extremos. Su valor puede
cambiar grandemente si se añade o elimina
un sólo dato. Por tanto su uso es muy
limitado.
15 5/07/2023
Varianza
La varianza, es una medida
que cuantifica el grado de k
dispersión o de variación de Datos No Tabulados − x)2
i=1(x i
los valores de una variable
S2 =
n−1
cuantitativa con respecto a Varianza
su media aritmética.
(S2)
Si los valores tienden a k
concentrarse alrededor de Datos Tabulados − x)2 ∙ fi
i=1(x i
su media, la varianza será (Continuos y S2 =
pequeña. Si los valores
Discretos) n−1
tienden a distribuirse lejos
de la media, la varianza
será grande.
16 5/07/2023
Desviación Estándar
También llamada desviación típica, es una
medida de dispersión usada en estadística que
nos dice cuánto tienden a alejarse los valores
Desviación puntuales del promedio en una distribución.
estándar S= S2 Una desviación estándar grande indica que los
puntos están lejos de la media, y una
(S) desviación pequeño indica que los datos están
agrupados cerca de la media.
La desviación es la raíz cuadrada de la
varianza.
17 5/07/2023
Coeficiente de Variación
Es una medida de dispersión relativa (libre de
unidades de medidas), que se define como la Coeficiente S
desviación estándar dividido por la media aritmética. de Variación CV = ∙ 100%
El coeficiente de variación mide el grado de
x
variabilidad de un conjunto de datos, además compara
(CV)
el grado de variabilidad entre dos o más distribuciones.
Cuando la desviación estándar es muy pequeña, el coeficiente de variación también es pequeño (los valores se encuentran muy concentrados
respecto a la media); en cambio, cuando el valor de la desviación estándar es muy grande, el coeficiente de variación es grande, hasta superar el
100% (los valores se encuentran muy dispersos)
18 5/07/2023
Interpretación del Coeficiente de Variación
Una escala que Rango del CV Interpretación Nivel de variabilidad
nos permite la 0% < CV < 5% Datos muy homogéneos
interpretación del Baja variabilidad
5% < CV < 10% Datos homogéneos
coeficiente de Datos regularmente
10% < CV < 15%
variación es homogéneos
Moderada variabilidad
fenómenos no 15% < CV < 20%
Datos regularmente
heterogéneos
controlados como 20% < CV < 25% Datos heterogéneos
los naturales, CV ≥ 25% Datos muy heterogéneos
Alta variabilidad
sociales,
deportivos, entre
otros, se tiene:
19 5/07/2023
Ejemplo Tabla de distribución de
frecuencias para datos agrupados
Se dispone de datos sobre el número de créditos acumulados de 50 estudiantes de la Carrera de
Negocios de Zegel IPAE. Los datos obtenidos son los siguientes:
18 21 23 34 45 56 32 26 25 31
36 29 24 22 34 45 56 32 19 41
20 25 27 32 46 50 51 56 54 23
26 35 24 38 39 43 49 60 48 50
21 30 35 19 43 48 54 56 26 29
Con los resultados obtenidos, elaborar la tabla de distribución de frecuencias.
20 5/07/2023
Ejemplo
Hallar la tabla de distribución de frecuencias
18 21 23 34 45 56 32 26 25 31
36 29 24 22 34 45 56 32 19 41
20 25 27 32 46 50 51 56 54 23
26 35 24 38 39 43 49 60 48 50
21 30 35 19 43 48 54 56 26 29
1) Rango (R) = valor máximo - valor mínimo. 2) Número de intervalos (k) = 1 + 3.3 log(50) = 6.6 = 7
Rango (R) = 60 - 18 = 42 (redondeo por exceso)
𝑅
3) Amplitud (A ) = (redondeo por exceso)
𝑘 𝑢𝑠𝑎𝑟Regla𝑑𝑒𝑆𝑡𝑢𝑟𝑔𝑒𝑠: 𝑘 = 1 + 3.3 log 𝑛
42
Amplitud (A ) = = 6 (redondeo por exceso)
7
21 5/07/2023
Ejemplo
1) Rango (R) = valor máximo - valor mínimo.
Intervalos Marca de
Rango (R) = 60 - 18 = 42 clase
[18 – 24 21
𝑅
[42 – 48 45
3) Amplitud (A ) = (redondeo por exceso)
𝑘 [48 – 54 51
42
Amplitud (A ) = = 6 (redondeo por exceso) [54 – 60] 57
7
22 5/07/2023
Aplicación en PSPP para una variable cuantitativa
1º
2º
3º
5º
Colocar el nombre de la
nueva variable
4º
24 Tablas de frecuencias para datos agrupados
Aplicación
Tenemos la
en PSPP para una variable cuantitativa
nueva
variable
Medidas Medidas
absolutas relativas
Coeficiente
Rango Desviación
Rango Varianza de
Intercuartil Estándar
Variación
26 Medidas de dispersión
Interpretación del Coeficiente de variación
Una escala que nos permite la interpretación del coeficiente de variación es fenómenos no controlados como los
naturales, sociales, deportivos, entre otros, se tiene:
Rango del CV Interpretación Nivel de variabilidad
Datos regularmente
10% < CV < 15%
homogéneos
Moderada variabilidad
Datos regularmente
15% < CV < 20%
heterogéneos
27 Medidas de dispersión
1º
Aplicación en PSPP 2º
3º Elegimos las
Hallaremos medidas de
dispersión
el rango, la
varianza y
desviación
estándar.
4º
Hallaremos el
coeficiente de
variación
Tenemos el
3° Ingresar resultado del
1º Colocar etiqueta para coeficiente de
los datos el coeficiente de
variación
variación.
4º
29 Medidas de dispersión
En PSPP:
Nivel de
Rango del CV Interpretación
variabilidad
0% < CV < 5% Datos muy homogéneos
Tenemos el
Baja variabilidad
5% < CV < 10% Datos homogéneos resultado del
10% < CV < 15%
Datos regularmente coeficiente de
homogéneos Moderada
variabilidad
variación.
Datos regularmente
15% < CV < 20% heterogéneos
Mostrar
magnitudes
Entre los
para comparar
valores
Una Explicar
que
Los datos
Gráfica estadísticos
tendencias adquiere
una
estadística Interpretar variable
relaciones
Analizar
31 Representación gráfica
Clasificación de los gráficos estadísticos
La clasificación de los gráficos estadísticos es en función del tipo de variable (cualitativo o cuantitativo)
Variables Variables
Cuantitativas Cualitativas
Tipo Continuo: Tipo Nominal y Ordinal:
• Histogramas • Gráfico Circular
• Ojiva • Gráfico de Barras
• Polígonos de frecuencia
Tipo Discreto:
• Gráfico de Barras
32 Representación gráfica
Gráficos de barras
Es un gráfico que se utiliza para Sencillo
representar datos de variables
cualitativas o cuantitativas
discretas.
Gráfico Agrupado
Está formado por barras
rectangulares (verticales u
de
horizontales) cuya altura es barras Apilado
proporcional a la frecuencia
absoluta de cada uno de los
valores de la variable. Pirámide de
población
33 Representación gráfica
Gráfico circular
También llamado gráfica de
pastel o diagrama de sectores.
Es un gráfico que se utiliza para
representar datos de variables
cualitativas.
Se utiliza para representar la
proporción de elementos de Se recomienda utilizar
cada uno de los valores de la gráficos en 2D ya que los de
variable. Consiste en dividir 3 dimensiones siempre
el círculo en porciones parece mayor la parte más
proporcionales a la frecuencia cercana al usuario.
relativa y porcentual.
34 Representación gráfica
Histograma
Es un gráfico que se utiliza para representar datos de variables
cuantitativas continuas.
35 Representación gráfica
Polígonos de frecuencia
Es un gráfico que se utiliza para
representar datos de variables
cuantitativas continuas.
37 Representación gráfica
Ejemplo Ejemplo: Construcción de una Tabla de Distribución de Frecuencias para
una Variable Cualitativa
Se pidió a un grupo de alumnos que indiquen su nivel socioeconómico, y se obtuvo los
siguientes resultados:
medio bajo alto alto bajo
bajo alto bajo bajo medio
alto bajo medio medio alto
medio medio alto alto bajo
Aplicación en PSPP para una gráfica correspondiente
a un variable cualitativa
Seleccionar
tipo de 1º
gráfico
39 Representación gráfica
Aplicación en PSPP para una gráfica correspondiente
a un variable cualitativa
2º
3º
40 Representación gráfica
Ejemplo
Hallar las medidas de posición central
41 5/07/2023
Ejemplo
Se dispone de datos sobre el número de créditos acumulados de 50 estudiantes de la Carrera de
Negocios de Zegel IPAE. Los datos obtenidos son los siguientes:
42 5/07/2023
Aplicación en PSPP para una gráfica correspondiente
a un variable cuantitativa continua
1º
Histograma
43 Representación gráfica
Aplicación en PSPP para una gráfica correspondiente
a un variable cuantitativa continua
2º
3º
44 Representación gráfica
Interpretación de las Medidas de
Localización
2º
1º
Elegimos las
medidas de
localización
49 5/07/2023
Medidas de Forma
Coeficiente de Asimetría: Casos
Las medidas de asimetría son indicadores que permiten
establecer el grado de simetría (o asimetría) que presenta
una distribución de probabilidad de una variable aleatoria
(medida intervalo y razón) sin tener que hacer su
representación gráfica. Si una distribución es simétrica,
existe el mismo número de valores a la derecha que a la
izquierda de la media, por tanto, el mismo número de
desviaciones con signo positivo que con signo negativo.
Decimos que hay asimetría positiva (o a la derecha) si la
"cola" a la derecha de la media es más larga que la de la
izquierda, es decir, si hay valores más separados de la
media a la derecha. Diremos que hay asimetría negativa
(o a la izquierda) si la "cola" a la izquierda de la media es
más larga que la de la derecha, es decir, si hay valores
más separados de la media a la izquierda.
Recuperado: http://andromeda.estadistica.unam.mx/tutorial_estadistica/Est_Indic_SHCP/recursos/imgpp07u1t04.png
Interpretación del Coeficiente de Asimetría
Coeficiente de
Interpretación
Asimetría
CA > 0,6 Asimétrica Positiva Fuerte
Los coeficientes de
0,3 < CA ≤ 0,6 Moderadamente asimétrica positiva
asimetría de Fisher o
0,05 < CA ≤ 0,3 Moderadamente simétrica
Pearson o Bowley se
- 0,05 ≤ CA ≤ 0,05
interpretan de la Simétrica
53 5/07/2023
Curtosis Tipos de curva de distribución según su
curtosis
Hallaremos
el
coeficiente 2º
de Asimetría
y Curtosis.
36 29 24 22 34 45 56 32 19 41
20 25 27 32 46 50 51 56 54 23
26 35 24 38 39 43 49 57 48 50
21 30 35 19 43 48 54 56 26 29
Amplitud (A ) =
39
= 5.57 = 6 (redondeo por exceso) [54 – 60
7
57 5/07/2023
Solución
Frecuenci
Frecuencia Frecuencia
Marca Frecuencia Frecuencia a Relativa Frecuencia
Intervalo Absoluta Porcentual
de clase Absoluta Relativa Acumulad Porcentual
1° Construir la [Li – Ls>
(xi) (fi)
Acumulada
(hi) a (pi)
Acumulada
(Fi) (Pi)
tabla de 18 − 24 (Hi)
58 5/07/2023
Aplicación en PSPP para una variable cuantitativa
1º
2º
3º
5º
Colocar el nombre de la
nueva variable
4º
60 Tablas de frecuencias para datos agrupados
Aplicación
Tenemos la
en PSPP para una variable cuantitativa
nueva
variable
Hallaremos
el
coeficiente 2º
de Asimetría
y Curtosis.
-0,2 < r < 0,0 Existe correlación no significativa 0,0 < r < 0,2
-0,7 < r ≤-0,4 Existe una significativa correlación 0,4 ≤ r < 0,7
-1,0 < r ≤-0,7 Existe alto grado de correlación 0,7 ≤ r < 1,0
Bueno si alguien dice que te ama pero con una seguridad del 2%,
no vale la pena tu esfuerzo y tiempo. Lo mismo nos sucede con
las hipótesis que tienen un grado de determinación o seguridad
muy bajo.
Mayo 2 7
Junio 1 3
Julio 3 8
Agosto 4 10
Agosto 4 10
12 08 11 14 19 16 09 16 15
06 09 14 12 04 05 07 02 10
13 15 12 16 11 06 05
Colocar los datos en el PSPP
12 08 11 14 19 16 09 16 15
06 09 14 12 04 05 07 02 10
13 15 12 16 11 06 05
Hallar los intervalos y la marca de clase
Rango (R) = 19 - 2 = 17
17
Amplitud (A ) = = 3.4 Intervalos Marca de
5 clase
[2 – 5.4 3.7
[5.4 – 8.8 7.1
[8.8 – 12.2 10.5
[12.2 – 15.6 13.9
[15.6 – 19 ] 17.3
Colocar los límites reales
Intervalos Marca de
clase
[2 – 5.4 3.7
[5.4 – 8.8 7.1
[8.8 – 12.2 10.5
[12.2 – 15.6 13.9
[15.6 – 19 ] 17.3
Generar la segunda variable
Colocar los intervalos y la marca de clase en la etiqueta de valor
Mostrar la etiqueta de valor
Generar la tabla de frecuencia con intervalos
Medidas de tendencia central
Medidas de Dispersión
Histograma
Medidas de Localización
Medidas de Forma
Aprendemos
2. Una fábrica de cierta marca de
Temperatura Cantidad de Temperatura Cantidad de
gaseosas ha tomado al azar 10 semanas media (ºC) gaseosas media (ºC) gaseosas
al año, observando la temperatura media (X) (Y) (X) (Y)
89 5/07/2023
Demostrando lo aprendido
Temperatura Cantidad de
media (ºC) gaseosas
(X) (Y)
10 21
28 65
12 31
31 72
30 75
19 39
24 67
5 11
9 12
15 24
Gráfico de Puntos
Regresión Lineal
Valores de la Regresión Lineal
Coeficiente de correlación y determinación
R = 0.97
Existe alto grado de correlación.
R2 = 0.95 = 95%
Entonces el coeficiente de determinación es 95%, esto nos
indica que de los datos de la variable “x” condiciona a los
datos de la variable “y” en un 95% de los casos.
Ecuación de Regresión