Documentos de Académico
Documentos de Profesional
Documentos de Cultura
• De tendencia central
• De Dispersión
• De Distribución
-
CORRELACIÓN - REGRESIÓN
• ESTADÍGRAFOS:
De Tendencia Central
De Dispersión
De Distribución
• CORRELACIÓN
• REGRESIÓN
ESTADÍGRAFOS DE POSICIÓN
Estadígrafos de Posición o
Medidas de Tendencia Central
Se llama así a ciertos indicadores numéricos que se obtienen de una muestra y se caracterizan porque
tienden a ubicarse al centro de la información.
4+5+3+7+2+8
𝓧= 6
= 4,8333.. = 4 min,50 seg
VARIABLE fi
Ejemplo 1: [10 – 12 ] 3
[13 – 15 ] 7
La siguiente información es una muestra
aleatoria de 56 estudiantes universitarios [16 – 18 ] 9
de la ciudad de Lima y que respondieron a [19 – 21 ] 12
la pregunta: [22 – 24] 15
¿Cuánto gastas semanalmente en pasajes?
[25 – 27 ] 6
[28 – 30 ] 4
N= 56
Solución:
VARIABLE fi xi fi . xi
[10 – 12 ] 3 11 33
[13 – 15 ] 7 14 98
[16 – 18 ] 9 17 153
[19 – 21 ] 12 20 240
[22 – 24] 15 23 345
[25 – 27 ] 6 26 156
[28 – 30 ] 4 29 116
N= Σ = 56 Σ= 1141
Análisis: El gasto promedio semanal en pasajes que tiene un estudiante universitario que vive
en Lima es de 20.40 soles aproximadamente.
Ejemplo 2: La siguiente información es una muestra aleatoria de 100 televidentes limeños que
respondieron a la pregunta:
¿Qué tiempo le dedicas a ver el programa Cuarto Poder?
Variable fi
[1-30] 50
[31-60] 40
[61-90] 5
[91-120] 3
[121-150] 2
Total 100
Solución:
Variable fi xi fi.xi
[1-30] 50 15,5 775,0
Análisis: El tiempo promedio que un televidente limeño, le dedica a ver el programa Cuarto
Poder es de 35 minutos aproximadamente
Media Ponderada (𝓧)
Donde:
Σ𝒙i . Pi P1, P2, ….., Pk son los pesos
𝓧= asociados a la variables 𝑥1, 𝑥2, … 𝑥k
Σ Pi
Ordenando: 1; 4; 5; 6; 7
Mediana = 5’
Donde:
Li : Límite real inferior de la clase mediana.
N : Número de datos
Σf1 : Suma de las frecuencias hasta antes de la
frecuencia mediana
f mediana : Frecuencia de la clase mediana
C : Tamaño del intervalo mediano
VARIABLE fi
[10 – 12 ] 3
Ejemplo 1: Calcular la mediana y analizarla
[13 – 15 ] 7
La siguiente información es una muestra aleatoria
de 56 estudiantes universitarios de la ciudad de [16 – 18 ] 9
Lima y que respondieron a la pregunta: [19 – 21 ] 12
¿Cuánto gastas semanalmente en pasajes? [22 – 24] 15
[25 – 27 ] 6
[28 – 30 ] 4
N= 56
Solución:
La mediana (Me) se encuentra en la frecuencia donde está el
dato medio es decir: 56/2 (28).
VARIABLE fi
Σf1: Suma de las frecuencias hasta antes de la
[10 – 12 ] 3
frecuencia mediana (3+7+9) = 19
[13 – 15 ] 7
C: tamaño del intervalo (3) [16 – 18 ] 9
[19 – 21 ] 12
[22 – 24] 15
[25 – 27 ] 6
[28 – 30 ] 4
N= 56
Análisis:
Ordenada la información al 50% se detecta un estudiante universitario de la ciudad de Lima, que
gasta semanalmente en pasajes 20.80 soles.
Otra manera:
El 50% de estudiantes universitarios, gasta semanalmente en pasajes entre 10 soles y 20,80 soles .
Ejemplo 2: Calcular la mediana y analizarla
Variable fi
[1-30] 50
[31-60] 40
[61-90] 5
[91-120] 3
[121-150] 2
Total 100
Solución:
El dato 50 se
Variable fi N/2 => 100/2= 50 encuentra en el
[1-30] 50 intervalo [1-30]
[31-60] 40
Li: 0,5
[61-90] 5
Sumatoria fi= 0
[91-120] 3 C= 30
[121-150] 2
Total 100
Análisis:
Ordenada la información al 50% se detecta un televidente limeño que le dedica a ver el programa Cuarto
Poder, 30 minutos aproximadamente .
Otra manera:
El 50% de televidentes limeños, le dedica de 1 a 30 minutos aproximadamente, a ver el programa Cuarto
Poder.
MODO o MODA (Mo ): Es el dato que más se repite
Donde:
Li : Límite real inferior de la clase modal
Δ1 : Diferencia entre la frecuencia modal y
la frecuencia anterior
Δ2 : Diferencia entre la frecuencia modal y
la frecuencia posterior
C : Tamaño del intervalo modal
VARIABLE fi
[10 – 12 ] 3
Ejemplo 1: Calcular la moda y analizarla
[13 – 15 ] 7
La siguiente información es una muestra aleatoria
de 56 estudiantes universitarios de la ciudad de [16 – 18 ] 9
Lima y que respondieron a la pregunta: [19 – 21 ] 12
¿Cuánto gastas semanalmente en pasajes? [22 – 24] 15
[25 – 27 ] 6
[28 – 30 ] 4
N= 56
Solución:
La clase modal se encuentra en la
frecuencia más alta (<22 – 24>)
Variable fi
[1-30] 50
[31-60] 40
[61-90] 5
[91-120] 3
[121-150] 2
Total 100
Solución:
Variable fi Li=0,5
[1-30] 50
1 = 50 – 0 =50
[31-60] 40 2 = 50 – 40 =10
[61-90] 5
C=30
[91-120] 3
[121-150] 2
Total 100
Análisis: La mayoría de televidentes limeños que le dedica a ver el programa Cuarto Poder 25 minutos
aproximadamente.
OTROS EJEMPLOS
Media Aritmética (𝓧)
Variable fi xi fi . xi
[1-2] 4 1.5 6
[3-4] 12 3.5 42
Variable fi
Variable fi
Mo= 8,5 + ( 13 ) .(2)
[1-2] 4
(13+43)
[3-4] 12
[5-6] 18
Mo= 8.964285714 ≈ 8
[7-8] 30
[9-10] 43
N= 107 La mayoría de los clientes asisten a Starbucks
Pardo 8 veces al mes, aproximadamente.
MEDIDAS DE LOCALIZACIÓN
CUARTILES – DECILES - PERCENTILES
-Cuartil : 1, 2, 3
Cuartiles, Deciles o -Decil : 1, 2, 3, 4, …,9
Percentiles -Percentil : 1, 2, 3, 4, … , 99
Cuartil, Decil o Percentil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos están ordenados de Menor a Mayor
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
CUARTILES – DECILES - PERCENTILES
Q1 Q2 Q3
(25%) (50%) (75%)
D1 D2 D3 …. D9
(10%) (20%) (30%) (90%)
P1 P2 P99
(1%) (2%)
(99%)
CUARTILES – DECILES - PERCENTILES
D1 = P10
Q1 = P25 D2 = P20
D3 = P30
Q2 = MEDIANA = P50
D4 =P40
Q3 = P75 D5 = P50
D6 = P60
D7 = P70
D8 = P80
D9 = P90
CUARTILES – DECILES - PERCENTILES
D3 Q2 P63 D9
(50%) (63%)
(30%) (90% P99
) (99%)
… el 30%
… el 63%
… el 90%
… el 99%
ESTADÍGRAFOS DE DISPERSIÓN
Estadígrafos de Dispersión
Son indicadores que se caracterizan porque miden que tan dispersos o lejos están los datos con respecto al
valor promedio.
X X X X X X XXXX X X X X X X X X
𝒙mín 𝒙máx
𝒙
𝐑 = 𝒙máx - 𝒙mín
Ejm 1:
R = X máx – X min ¿Cuánto gastas, a la semana, en pasajes?
VARIABLE fi
Para ejemplo: 10 - 12 3
R = 30 – 10 = 20 13 - 15 7
16 - 18 9
19 - 21 12
22 - 24 15
Análisis:
La mayor diferencia de gasto semanal en 25 - 27 6
pasajes , es de 20 soles. 28 - 30 4
N 56
Ejm. 2: Halla el rango y analízalo:
Una tienda que vende computadoras tuvo las siguientes ventas el día sábado:
1. El día sábado la menor venta registrada es de: 1200 soles
2. El día sábado la mayor venta registrada es de: 4600 soles
𝐑 = 𝒙máx - 𝒙mín
R = 4600 - 1200 = 3400
Análisis: La mayor diferencia entre las ventas del día sábado, que tuvo una tienda
que vende computadoras, fue de 3400 soles.
Ejm. 3: Halla el rango y analízalo:
¿Al mes, con qué frecuencia usas el metropolitano?
Variable fi Variable fi
[1-2 ] 20 [1-2 ] 20
[3-4 ] 25 Nota: como el [3-4 ] 25
mes tiene 30
[5-6 ] 30 días, entonces el [5-6 ] 30
dato mayor es
[7-8 ] 15 30
[7-8 ] 15
[9- a más ] 10 [9- 30 ] 10
𝐑 = 𝒙máx - 𝒙mín
R = 30 - 1 = 29
Análisis: Entre los usuarios del Metropolitano, la mayor diferencia de veces al mes
que lo utilizan, es de 29 veces.
Ejm. 4: ¿ CUANDO HACES TURISMO AL INTERIOR DEL PAÍS, CUÁNTOS DÍAS AL
MES LE DEDICAS?
VARIABLE fi
[ 1-2 ] 63
[ 3-4 ] 41
[ 5-6 ] 14
[ 7- 8 ] 4
[ 9 – a más [ 5
N =127
Ejm. 5: Si tuvieras un bono para usar gratis 15 minutos diarios de
internet, durante un mes, ¿ Cuántos días lo utilizarías?
VARIABLE fi
[ 1-2 ] 63
[ 3-4 ] 41
[ 5-6 ] 14
[ 7- 8 ] 4
[ 9 – a más [ 5
N =127
VARIANZA (S2):Es la máxima dispersión que puede soportar el estudio de la variable.
ANÁLISIS DE VARIANZA
CASO I: Cuando el intervalo obtenido está dentro de los límites frontera.
-4 +4
[ 8 a 16]
Nota: 9 – 4 = 5 (ese -4 +4
dato no existe); el
límite frontera menor
es 7. Por lo tanto se
debe reducir a 7. [ 7 a 13]
Nota: 17 + 4 = 21 (ese
dato no existe); el
límite frontera
superior es 20. Por lo
tanto se debe reducir
-4 +4 a 20.
[ 13 a 20 ]
CASO IV: Cuando los dos valores del intervalo obtenido, rebasan sus
límites frontera.
-4 +4
[ 7 a 12]
X = 4 + 6 + 3 + 7 = 5’
4
Entonces:
S2 = 42 + 62 + 32 + 72 - (5)2 = 2.5 ≈ 3’
4
ANÁLISIS DE VARIANZA ( S2 ):
Tardanza de trabajadores; S2 = 3
-3 +3
[ 3 a 7]
Ejemplo 1: VARIABLE fi
10 - 12 3
Muestra aleatoria de 56 estudiantes 13 - 15 7
universitarios de la ciudad de Lima y que 16 - 18 9
respondieron a la pregunta: 19 - 21 12
22 - 24 15
¿Cuánto gastas semanalmente en 25 - 27 6
28 - 30 4
pasajes?
N 56
VARIANZA ( S2 )
Solución:
VARIABLE fi xi xi 2 fi . xi 2
10 - 12 3 11 121 363
13 - 15 7 14 196 1372
16 - 18 9 17 289 2601
19 - 21 12 20 400 4800
22 - 24 15 23 529 7935
S2 = 24491 – (20.38)2
56 25 - 27 6 26 676 4056
28 - 30 4 29 841 3364
S2 = 21,99928 N 56 24491
S2 ≈ 22 soles
ANÁLISIS DE VARIANZA ( S2 ):
- 22 + 22
[ 10 a 30]
Variable fi
[3 - 5 min] 12
[6 - 8 min] 54
[9-11 min] 34
[12-14 min] 12
9
[15 - a más[
N=121
¿ Qué tiempo se demoran en atenderlo?
Solución:
Variable fi xi xi 2 fi . xi 2
[3 - 5 min] 12 4 16 192
[6 - 8 min] 54 7 49 2646
Toda raíz tiene dos respuestas, una positiva y otra negativa. Para conocer el signo hay que ordenar los datos
y ubicar su media aritmética.
X = 3 + 4 + 6 + 7 = 5’
4
Luego hay que ubicar la media aritmética en los datos.
Tardanza de trabajadores.
S = 2 minutos
+2
Como se nota aquí, la cantidad de datos que están después del intervalo donde está la
media aritmética es mayor que el anterior, entonces el signo que le corresponde es
positivo.
+ 4,70
VARIABLE fi
Solución:
[1-2] 54
[3-4] 22
[5-6] 11
[7-8] 15
Análisis Técnico : La media aritmética tiende a
4
variar de -3 veces visitas al mes
[9 - a más [
TOTAL 106
Análisis didáctico – Desviación estándar
¿Cuántas veces al mes visita “7 sopas”?
X min = 1 X max = 30
X= 3
-3
X= 1
Ejemplo:
CV = 4.70 . 100
20.38
CV = 23.061…%
Por lo tanto la distribución es homogénea
+ 4,70
+ 4,70
Ejemplo:
La siguiente información es una muestra
aleatoria de 106 asistentes al restaurante
y que respondieron a la pregunta: Datos:
¿Cuántas veces al mes visita
“7 sopas”? Media aritmética X= 3.48113207547 ≈ 3
VARIABLE fi
[1-2] 54
[3-4] 22
[5-6] 11
[7-8] 15
Solución:
[9 - a más [ 4
X min = 1 X max = 30
X= 3
Nota: Como el último intervalo es
-3 semiabierto (… a más), para efectos
de análisis, en el gráfico, se debe
X= 1 colocar como límite frontera
superior ejm: 30 ( porque el mes
tiene 30 dias)
Además de analizar la posición y la dispersión de los datos, otra medida de interés en una distribución de
frecuencias es la simetría y el apuntamiento o kurtosis.
Correlación Regresión
Determina el grado de asociación Es la encargada de describir o establecer el
lineal entre las dos variables, comportamiento de la relación entre las dos
mediante un valor numérico. variables, mediante un modelo matemático.
Coeficiente de Correlación de Pearson
No existe correlación
Grado de
Correlación
Correlación Correlación
Correlación
Fuerte Débil
Nula
Positiva Negativa
Regresión
N° Infracciones
(y)
3 6
4 5
5 4
6 3
7 2
c) Cálculo de tabla de valores:
N° de yi ²
infracciones
(y)
3 6
4 5
5 4
6 3
7 2
∑χ= 25 ∑y=20 ∑χ.y= ∑χ²= ∑y² =
c) Cálculo de tabla de valores:
N° de yi ²
infracciones
(y)
3 6 18 9 36
4 5 20 16 25
5 4 20 25 16
6 3 18 36 9
7 2 14 49 4
∑χ= 25 ∑y=20 ∑χ.y= 90 ∑χ²= 135 ∑y² =90
c) Cálculo de tabla de valores:
e) Cálculo de la ecuación de regresión lineal
CÁLCULO DE “b”
CÁLCULO DE “a”
Ecuación de la regresión:
f) PRONÓSTICO: Si x = 12 años ( Si tuviera 12 años de manejo)
MATEMÁTICAS 2 3 4 4 5 6 6 7 7 8 10 10
ESTADÍSTICA 1 3 2 4 4 4 6 4 6 7 9 10
c) Cálculo de tabla de valores:
ESTADÍSTICA yi ²
(y)
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9
10 10
∑χ= 72 ∑y=60 ∑χ.y= ∑χ²= ∑y² =
c) Cálculo de tabla de valores:
ESTADÍSTICA yi ²
(y)
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
CÁLCULO DE “b”
CÁLCULO DE “a”
Ecuación de la regresión:
g) Elabora el diagrama de dispersión.
CONCLUSIONES