Está en la página 1de 85

ESTADÍGRAFOS:

• De tendencia central
• De Dispersión
• De Distribución

-
CORRELACIÓN - REGRESIÓN

Docente: FAUSTINO RAÚL IPANAQUÉ MORENO


INTRODUCCIÓN

En la medida en que se tomen decisiones a partir de la obtención de


estadígrafos y se elaboren modelos estadísticos de comportamiento,
de las relaciones que se pueden establecer en un conjunto de datos ;
se podrá gestionar la calidad de los procesos y sus productos. Por
ello es esencial el aprendizaje para calcular estadígrafos, establecer
correlaciones y modelos de regresión, ya que permite que el
estudiante desarrolle capacidades para la investigación y el ejercicio
de toma de decisiones.
CONTENIDOS

• ESTADÍGRAFOS:
De Tendencia Central
De Dispersión
De Distribución
• CORRELACIÓN
• REGRESIÓN
ESTADÍGRAFOS DE POSICIÓN
Estadígrafos de Posición o
Medidas de Tendencia Central

Se llama así a ciertos indicadores numéricos que se obtienen de una muestra y se caracterizan porque
tienden a ubicarse al centro de la información.

Entre ellos tenemos: 𝒙 = Media Aritmética (Dato promedio)


𝑴𝒆 = Mediana (Dato central)
𝑴o = Modo o Moda (Dato que más se repite)
MEDIA ARITMÉTICA (𝓧 ): Es el valor promedio de una información

CASO I. PARA DATOS NO


AGRUPADOS.

Ejemplo: Hallar la media aritmética de la duración de 6 cortometrajes:

4’; 5’; 3’; 7’; 2’; 8’

4+5+3+7+2+8
𝓧= 6
= 4,8333.. = 4 min,50 seg

Análisis: El promedio de duración de los cortometrajes es de 4 min,50 seg.


MEDIA ARITMÉTICA (𝓧 )
CASO II. PARA DATOS
AGRUPADOS.

VARIABLE fi
Ejemplo 1: [10 – 12 ] 3
[13 – 15 ] 7
La siguiente información es una muestra
aleatoria de 56 estudiantes universitarios [16 – 18 ] 9
de la ciudad de Lima y que respondieron a [19 – 21 ] 12
la pregunta: [22 – 24] 15
¿Cuánto gastas semanalmente en pasajes?
[25 – 27 ] 6
[28 – 30 ] 4
N= 56
Solución:
VARIABLE fi xi fi . xi

[10 – 12 ] 3 11 33
[13 – 15 ] 7 14 98
[16 – 18 ] 9 17 153
[19 – 21 ] 12 20 240
[22 – 24] 15 23 345
[25 – 27 ] 6 26 156
[28 – 30 ] 4 29 116
N= Σ = 56 Σ= 1141

Análisis: El gasto promedio semanal en pasajes que tiene un estudiante universitario que vive
en Lima es de 20.40 soles aproximadamente.
Ejemplo 2: La siguiente información es una muestra aleatoria de 100 televidentes limeños que
respondieron a la pregunta:
¿Qué tiempo le dedicas a ver el programa Cuarto Poder?

Variable fi
[1-30] 50

[31-60] 40
[61-90] 5
[91-120] 3
[121-150] 2
Total 100
Solución:
Variable fi xi fi.xi
[1-30] 50 15,5 775,0

[31-60] 40 45,5 1820,0

[61-90] 5 75,5 377,5

[91-120] 3 105,5 316,5

[121-150] 2 135,5 271,0

Total Σ= 100 Σ= 3560,0

Análisis: El tiempo promedio que un televidente limeño, le dedica a ver el programa Cuarto
Poder es de 35 minutos aproximadamente
Media Ponderada (𝓧)

Donde:
Σ𝒙i . Pi P1, P2, ….., Pk son los pesos
𝓧= asociados a la variables 𝑥1, 𝑥2, … 𝑥k
Σ Pi

NOTAS PESOS Xi .Pi


(Xi) (Pi)
E. Parcial 08 1 08
P. 12 2 24
Prácticas
E. Final 15 3 45
MEDIANA (Me ): Es el valor central , previamente ordenada la información.

CASO I. PARA DATOS NO


AGRUPADOS.

Ejemplo: Hallar la mediana de la duración de 5 cortometrajes: :

7’; 4’; 6’; 5’; 1’

Ordenando: 1; 4; 5; 6; 7

Mediana = 5’

Análisis: Ordenada la información, al 50%, se detecta un


cortometraje cuya duración es de 5’ .
MEDIANA (Me )

CASO II. PARA DATOS AGRUPADOS.

Donde:
Li : Límite real inferior de la clase mediana.
N : Número de datos
Σf1 : Suma de las frecuencias hasta antes de la
frecuencia mediana
f mediana : Frecuencia de la clase mediana
C : Tamaño del intervalo mediano

VARIABLE fi
[10 – 12 ] 3
Ejemplo 1: Calcular la mediana y analizarla
[13 – 15 ] 7
La siguiente información es una muestra aleatoria
de 56 estudiantes universitarios de la ciudad de [16 – 18 ] 9
Lima y que respondieron a la pregunta: [19 – 21 ] 12
¿Cuánto gastas semanalmente en pasajes? [22 – 24] 15
[25 – 27 ] 6
[28 – 30 ] 4
N= 56
Solución:
La mediana (Me) se encuentra en la frecuencia donde está el
dato medio es decir: 56/2 (28).

El dato número 28 se encuentra en el intervalo 19 - 21

El límite real inferior (Li) es (19+18) / 2=18.5 ya


que se le puede considerar 19.

VARIABLE fi
Σf1: Suma de las frecuencias hasta antes de la
[10 – 12 ] 3
frecuencia mediana (3+7+9) = 19
[13 – 15 ] 7
C: tamaño del intervalo (3) [16 – 18 ] 9
[19 – 21 ] 12
[22 – 24] 15
[25 – 27 ] 6
[28 – 30 ] 4
N= 56

Análisis:
Ordenada la información al 50% se detecta un estudiante universitario de la ciudad de Lima, que
gasta semanalmente en pasajes 20.80 soles.
Otra manera:
El 50% de estudiantes universitarios, gasta semanalmente en pasajes entre 10 soles y 20,80 soles .
Ejemplo 2: Calcular la mediana y analizarla

La siguiente información es una muestra aleatoria de 100 televidentes limeños que


respondieron a la pregunta:
¿Qué tiempo le dedicas a ver el programa Cuarto Poder?

Variable fi
[1-30] 50

[31-60] 40
[61-90] 5
[91-120] 3
[121-150] 2
Total 100
Solución:

El dato 50 se
Variable fi N/2 => 100/2= 50 encuentra en el
[1-30] 50 intervalo [1-30]

[31-60] 40
Li: 0,5
[61-90] 5
Sumatoria fi= 0
[91-120] 3 C= 30
[121-150] 2
Total 100

Análisis:
Ordenada la información al 50% se detecta un televidente limeño que le dedica a ver el programa Cuarto
Poder, 30 minutos aproximadamente .
Otra manera:
El 50% de televidentes limeños, le dedica de 1 a 30 minutos aproximadamente, a ver el programa Cuarto
Poder.
MODO o MODA (Mo ): Es el dato que más se repite

CASO I. PARA DATOS NO


AGRUPADOS.
Ejemplo 1: Hallar la moda de la duración de
6 cortometrajes: :

7’; 5’; 5’; 4’; 6’; 5’; 1’; 7’

Mo = 5’ (UNIMODAL: solo una moda)

Análisis: La mayoría de cortometrajes dura 5’ .


Otros ejemplos:
Ejemplo 2: Tardanza de trabajadores:

8’; 3’; 4’; 8’; 2’; 4’; 3’; 8’ ; 4’

Mo = 4’; 8’ (BIMODAL: dos modas)


Análisis: La mayoría de trabajadores ha
llegado 4’ ó 8’ tarde.

Ejemplo 3: Tardanza de trabajadores:

8’; 3’; 4’; 4’; 3’; 8’; 8’; 3’ ; 4’

Mo = AMODAL: (no hay moda)


(No hay análisis)
MODA (Mo )

CASO II. PARA DATOS AGRUPADOS.

Donde:
Li : Límite real inferior de la clase modal
Δ1 : Diferencia entre la frecuencia modal y
la frecuencia anterior
Δ2 : Diferencia entre la frecuencia modal y
la frecuencia posterior
C : Tamaño del intervalo modal

VARIABLE fi
[10 – 12 ] 3
Ejemplo 1: Calcular la moda y analizarla
[13 – 15 ] 7
La siguiente información es una muestra aleatoria
de 56 estudiantes universitarios de la ciudad de [16 – 18 ] 9
Lima y que respondieron a la pregunta: [19 – 21 ] 12
¿Cuánto gastas semanalmente en pasajes? [22 – 24] 15
[25 – 27 ] 6
[28 – 30 ] 4
N= 56
Solución:
La clase modal se encuentra en la
frecuencia más alta (<22 – 24>)

Li = (22 +21) / 2 = 21.5


VARIABLE fi
Δ1 = 15 – 12 = 3 [10 – 12 ] 3
Δ2 = 15 – 6 = 9 [13 – 15 ] 7
C=3 [16 – 18 ] 9
[19 – 21 ] 12
Mo = 21.5 + ( 3 )x3 [22 – 24] 15
3+9 [25 – 27 ] 6
Mo = 22.25
[28 – 30 ] 4
N= 56

Análisis: La mayoría de los estudiantes universitarios de la ciudad de Lima, gastan


semanalmente en pasajes 22,30 soles.
Ejemplo 2: Calcular la moda y analizarla

La siguiente información es una muestra aleatoria de 100 televidentes limeños que


respondieron a la pregunta:
¿Qué tiempo le dedicas a ver el programa Cuarto Poder?

Variable fi
[1-30] 50

[31-60] 40
[61-90] 5
[91-120] 3
[121-150] 2
Total 100
Solución:
Variable fi Li=0,5

[1-30] 50
1 = 50 – 0 =50
[31-60] 40 2 = 50 – 40 =10

[61-90] 5
C=30
[91-120] 3

[121-150] 2

Total 100

Análisis: La mayoría de televidentes limeños que le dedica a ver el programa Cuarto Poder 25 minutos
aproximadamente.
OTROS EJEMPLOS
Media Aritmética (𝓧)

¿Cuántas veces al mes asiste a Starbucks?


Variable: Asistencia mensual a Starbucks.

Variable fi xi fi . xi
[1-2] 4 1.5 6
[3-4] 12 3.5 42

[5-6] 18 5.5 99 X= 780.5 =7.2943925234 ≈ 7


[7-8] 30 7.5 225 107
[9-10] 43 9.5 408.5
N= 107 780.5 ❖ El promedio de visitas de un
cliente a Starbucks Pardo es de 7
veces al mes aproximadamente.
MEDIANA (Me)

Variable fi

[1-2] 4 Me= 6,5+ (107/2 –34 ) (2)


[3-4] 12 30
[5-6] 18 Me= 7,8 ≈ 7
[7-8] 30
[9-10] 43 = n/2 Ordenada la información al 50% se
N= 107 =107/ detecta a un cliente de Starbucks
2 Pardo que asiste 7 veces al mes.
=53,5
MODA O MODO (MO)

Variable fi
Mo= 8,5 + ( 13 ) .(2)
[1-2] 4
(13+43)
[3-4] 12

[5-6] 18
Mo= 8.964285714 ≈ 8
[7-8] 30
[9-10] 43
N= 107 La mayoría de los clientes asisten a Starbucks
Pardo 8 veces al mes, aproximadamente.
MEDIDAS DE LOCALIZACIÓN
CUARTILES – DECILES - PERCENTILES

-Cuartil : 1, 2, 3
Cuartiles, Deciles o -Decil : 1, 2, 3, 4, …,9
Percentiles -Percentil : 1, 2, 3, 4, … , 99

Cuartil, Decil o Percentil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos están ordenados de Menor a Mayor

El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.

El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.

El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
CUARTILES – DECILES - PERCENTILES

Q1 Q2 Q3
(25%) (50%) (75%)

D1 D2 D3 …. D9
(10%) (20%) (30%) (90%)

P1 P2 P99
(1%) (2%)
(99%)
CUARTILES – DECILES - PERCENTILES

D1 = P10

Q1 = P25 D2 = P20
D3 = P30
Q2 = MEDIANA = P50
D4 =P40
Q3 = P75 D5 = P50
D6 = P60
D7 = P70
D8 = P80
D9 = P90
CUARTILES – DECILES - PERCENTILES

D3 Q2 P63 D9
(50%) (63%)
(30%) (90% P99
) (99%)

… el 30%

… el 63%

… el 90%

… el 99%
ESTADÍGRAFOS DE DISPERSIÓN
Estadígrafos de Dispersión

Son indicadores que se caracterizan porque miden que tan dispersos o lejos están los datos con respecto al
valor promedio.

X X X X X X XXXX X X X X X X X X

𝒙mín 𝒙máx
𝒙

Entre ellos tenemos: 𝐑 = Rango


S2 = Varianza
S = Desviación estándar
𝒄𝒗 = Coeficiente de variación
RANGO ( R ): Es la diferencia entre el dato mayor y el dato menor; es decir mide la
máxima dispersión que se puede establecer entre los datos.

𝐑 = 𝒙máx - 𝒙mín
Ejm 1:
R = X máx – X min ¿Cuánto gastas, a la semana, en pasajes?

VARIABLE fi
Para ejemplo: 10 - 12 3
R = 30 – 10 = 20 13 - 15 7
16 - 18 9
19 - 21 12
22 - 24 15
Análisis:
La mayor diferencia de gasto semanal en 25 - 27 6
pasajes , es de 20 soles. 28 - 30 4
N 56
Ejm. 2: Halla el rango y analízalo:

Una tienda que vende computadoras tuvo las siguientes ventas el día sábado:
1. El día sábado la menor venta registrada es de: 1200 soles
2. El día sábado la mayor venta registrada es de: 4600 soles

𝐑 = 𝒙máx - 𝒙mín
R = 4600 - 1200 = 3400

Análisis: La mayor diferencia entre las ventas del día sábado, que tuvo una tienda
que vende computadoras, fue de 3400 soles.
Ejm. 3: Halla el rango y analízalo:
¿Al mes, con qué frecuencia usas el metropolitano?

Variable fi Variable fi

[1-2 ] 20 [1-2 ] 20
[3-4 ] 25 Nota: como el [3-4 ] 25
mes tiene 30
[5-6 ] 30 días, entonces el [5-6 ] 30
dato mayor es
[7-8 ] 15 30
[7-8 ] 15
[9- a más ] 10 [9- 30 ] 10

Total 100 Total 100

𝐑 = 𝒙máx - 𝒙mín
R = 30 - 1 = 29

Análisis: Entre los usuarios del Metropolitano, la mayor diferencia de veces al mes
que lo utilizan, es de 29 veces.
Ejm. 4: ¿ CUANDO HACES TURISMO AL INTERIOR DEL PAÍS, CUÁNTOS DÍAS AL
MES LE DEDICAS?

VARIABLE fi

[ 1-2 ] 63

[ 3-4 ] 41

[ 5-6 ] 14

[ 7- 8 ] 4

[ 9 – a más [ 5

N =127
Ejm. 5: Si tuvieras un bono para usar gratis 15 minutos diarios de
internet, durante un mes, ¿ Cuántos días lo utilizarías?

VARIABLE fi

[ 1-2 ] 63

[ 3-4 ] 41

[ 5-6 ] 14

[ 7- 8 ] 4

[ 9 – a más [ 5

N =127
VARIANZA (S2):Es la máxima dispersión que puede soportar el estudio de la variable.

ANÁLISIS DE VARIANZA
CASO I: Cuando el intervalo obtenido está dentro de los límites frontera.

Ejm: Tardanza de trabajadores; S2 = 4

-4 +4

[ 8 a 16]

Jamás la tardanza promedio de los trabajadores será menor a


8 minutos ni mayor a 16 minutos.
ANÁLISIS DE VARIANZA ( S2 ):

CASO II: Cuando el límite inferior del intervalo obtenido, es menor a su


límite frontera.

Ejm: Tardanza de trabajadores; S2 = 4

Nota: 9 – 4 = 5 (ese -4 +4
dato no existe); el
límite frontera menor
es 7. Por lo tanto se
debe reducir a 7. [ 7 a 13]

Jamás la tardanza promedio de los trabajadores será mayor a


13 minutos.
ANÁLISIS DE VARIANZA ( S2 ):

CASO III: Cuando el límite superior del intervalo obtenido, es mayor a su


límite frontera.

Ejm: Tardanza de trabajadores; S2 = 4

Nota: 17 + 4 = 21 (ese
dato no existe); el
límite frontera
superior es 20. Por lo
tanto se debe reducir
-4 +4 a 20.

[ 13 a 20 ]

Jamás la tardanza promedio de los trabajadores será menor a


13 minutos.
ANÁLISIS DE VARIANZA ( S2 ):

CASO IV: Cuando los dos valores del intervalo obtenido, rebasan sus
límites frontera.

Ejm: Tardanza de trabajadores; S2 = 4

-4 +4

[ 7 a 12]

En caso extremo, la tardanza promedio de los trabajadores


puede variar de 7 minutos a 12 minutos.
VARIANZA ( S2 ): Es la máxima dispersión que puede soportar el estudio de la
variable.

CASO I. PARA DATOS NO


AGRUPADOS.

Ejemplo: tardanza de trabajadores:

4’; 6’; 3’; 7’

X = 4 + 6 + 3 + 7 = 5’
4
Entonces:

S2 = 42 + 62 + 32 + 72 - (5)2 = 2.5 ≈ 3’
4
ANÁLISIS DE VARIANZA ( S2 ):

Tardanza de trabajadores; S2 = 3

-3 +3

[ 3 a 7]

En caso extremo, la tardanza promedio de los trabajadores


puede variar de 3 minutos a 7 minutos.
VARIANZA ( S2 )

CASO II. PARA DATOS AGRUPADOS.

Ejemplo 1: VARIABLE fi
10 - 12 3
Muestra aleatoria de 56 estudiantes 13 - 15 7
universitarios de la ciudad de Lima y que 16 - 18 9

respondieron a la pregunta: 19 - 21 12
22 - 24 15
¿Cuánto gastas semanalmente en 25 - 27 6
28 - 30 4
pasajes?
N 56
VARIANZA ( S2 )

Solución:

VARIABLE fi xi xi 2 fi . xi 2
10 - 12 3 11 121 363
13 - 15 7 14 196 1372
16 - 18 9 17 289 2601
19 - 21 12 20 400 4800
22 - 24 15 23 529 7935
S2 = 24491 – (20.38)2
56 25 - 27 6 26 676 4056
28 - 30 4 29 841 3364
S2 = 21,99928 N 56 24491

S2 ≈ 22 soles
ANÁLISIS DE VARIANZA ( S2 ):

Variable: Gasto semanal en pasajes, de estudiantes universitarios que viven en


Lima.
S2 = 22

- 22 + 22

[ 10 a 30]

En caso extremo, el gasto promedio semanal en pasajes que


tiene un estudiante universitario que vive en Lima, puede
variar de 10 soles a 30 soles.
Ejemplo 2: Calcular la varianza y analizarla

La siguiente información es una muestra aleatoria de 121 clientes de Bembos, que


respondieron a la pregunta:
¿ Qué tiempo se demoran en atenderlo?

Variable fi

[3 - 5 min] 12

[6 - 8 min] 54

[9-11 min] 34

[12-14 min] 12

9
[15 - a más[

N=121
¿ Qué tiempo se demoran en atenderlo?
Solución:

Variable fi xi xi 2 fi . xi 2

[3 - 5 min] 12 4 16 192

[6 - 8 min] 54 7 49 2646

[9-11 min] 34 10 100 3400


Análisis:

[12-14 min] 12 13 169 2028

[15-17 min] 9 16 256 2304


- 10 + 10
N=121 10570

Nota: Se debe cerrar en el mismo tamaño de los otros


intervalos es decir 17, para efectos de cálculo; pero para
[ 3 a 19]
efectos de análisis, en el gráfico, se debe colocar como
límite frontera superior ejm: 30 ( es el mayor tiempo que
se demoran en atender en el local) Jamás el promedio de tiempo que se demoran en
atender en BEMBOS, será mayor a 19 minutos.
DESVIACIÓN ESTANDAR (S): Es la tendencia de variación de la
media aritmética.

CASO I. PARA DATOS NO


AGRUPADOS
Ejemplo: tardanza de trabajadores: 4’; 6’; 3’; 7’ S² = 2,5

Toda raíz tiene dos respuestas, una positiva y otra negativa. Para conocer el signo hay que ordenar los datos
y ubicar su media aritmética.

X = 3 + 4 + 6 + 7 = 5’
4
Luego hay que ubicar la media aritmética en los datos.

3’; 4’; 6’; 7’


5’
Si hay más datos antes de la ubicación de la media aritmética entonces “S” es negativo (-). Caso contrario “S” es
positivo (+).
ANÁLISIS: El promedio de tardanza tiende a variar en 2 minutos.
ANÁLISIS DE DESVIACIÓN ESTANDAR (S)

Tardanza de trabajadores.
S = 2 minutos

+2

Si bien es cierto, el promedio de tardanza es 5 minutos;


realmente este promedio tiende a ser de 7 minutos.
DESVIACIÓN ESTANDAR ( S )
CASO II. PARA DATOS AGRUPADOS.

Ejemplo: Del ejemplo anterior:


VARIABLE fi
10 - 12 3
Para determinar el signo hay que ubicar en qué
13 - 15 7
intervalo se encuentra la media aritmética (que en
este caso es 20.40). 16 - 18 9
19 - 21 12
Luego se suma la cantidad de datos de los
intervalos anteriores (en este caso: 3+7+9=19) 22 - 24 15
25 - 27 6
Y luego se suma la cantidad de datos de los 28 - 30 4
intervalos posteriores (en este caso: 15+6+4=25) N 56

Como se nota aquí, la cantidad de datos que están después del intervalo donde está la
media aritmética es mayor que el anterior, entonces el signo que le corresponde es
positivo.

Análisis: La media aritmética tiende a variar en +4.70 nuevos soles


ANÁLISIS DE DESVIACIÓN ESTANDAR

Gasto semanal en pasajes, de estudiantes universitarios que viven en Lima.


S = 4,70 soles

+ 4,70

Si bien es cierto, el promedio de gasto semanal en pasajes que un estudiante


universitario que vive en Lima es de 20,40 soles ; realmente este promedio
tiende a ser de 25,10 soles .
DESVIACIÓN ESTANDAR ( S )
¿Cuántas veces al mes visita
“7 sopas”?
MEDIA ARITMÉTICA X= 3.48113207547 ≈ 3

VARIABLE fi
Solución:
[1-2] 54

[3-4] 22

[5-6] 11

[7-8] 15
Análisis Técnico : La media aritmética tiende a
4
variar de -3 veces visitas al mes
[9 - a más [

TOTAL 106
Análisis didáctico – Desviación estándar
¿Cuántas veces al mes visita “7 sopas”?

X min = 1 X max = 30

X= 3

-3
X= 1

Análisis: Si bien es cierto el promedio de asistencia mensual a “7 sopas” – Angamos es de 3 veces


al mes, realmente este promedio tiende a ser 1 veces al mes.
COEFICIENTE DE VARIACIÓN (𝒄𝒗): Mide si la distribución es
homogénea o heterogénea.

Si CV ≤ 40% entonces la distribución es homogénea


Si CV > 40% entonces la distribución es heterogénea

Ejemplo:
CV = 4.70 . 100
20.38

CV = 23.061…%
Por lo tanto la distribución es homogénea

Cuando la distribución es homogénea significa que la media


aritmética es representativa.
ANÁLISIS DE COEFICIENTE DE VARIACIÓN (𝒄𝒗)

CASO I: Cuando la distribución es homogénea: CV ≤ 40%

Ejm: Gasto semanal en pasajes, de estudiantes universitarios que viven en Lima.


S = 4,70 soles ; CV = 23,061%

Nota: Se utiliza el gráfico de


desviación estandar

+ 4,70

Entonces la distribución es homogénea,


Luego la media aritmética es representativa,
Por lo tanto: La mayoría de estudiantes universitarios que viven en Lima
gastan, en promedio, semanalmente en pasajes 20,40 soles y los que no (son
pocos), tienden a gastar 25,10 soles
ANÁLISIS DE COEFICIENTE DE VARIACIÓN (𝒄𝒗)

CASO II: Cuando la distribución es heterogénea: CV > 40%

Ejm: Gasto semanal en pasajes, de estudiantes universitarios que viven en Lima.


S = 4,70 soles ; CV = 53,061%

Nota: Se utiliza el gráfico de


desviación estandar

+ 4,70

Entonces la distribución es heterogénea ,


Luego la media aritmética es no representativa,
Por lo tanto: La mayoría de estudiantes universitarios que viven en Lima gastan
semanalmente, en promedio, en pasajes 25,10 soles y los que no (son pocos),
tienden a gastar 20,40 soles
COEFICIENTE DE VARIACIÓN (𝒄𝒗)

Ejemplo:
La siguiente información es una muestra
aleatoria de 106 asistentes al restaurante
y que respondieron a la pregunta: Datos:
¿Cuántas veces al mes visita
“7 sopas”? Media aritmética X= 3.48113207547 ≈ 3

VARIABLE fi
[1-2] 54

[3-4] 22

[5-6] 11

[7-8] 15
Solución:
[9 - a más [ 4

TOTAL 106 CV ≥ 40%


Análisis – Coeficiente de variación (𝒄𝒗)
¿Cuántas veces al mes visita “7 sopas”?

X min = 1 X max = 30

X= 3
Nota: Como el último intervalo es
-3 semiabierto (… a más), para efectos
de análisis, en el gráfico, se debe
X= 1 colocar como límite frontera
superior ejm: 30 ( porque el mes
tiene 30 dias)

Entonces la distribución es heterogénea ,


Luego la media aritmética es no representativa,
Por lo tanto: La mayoría de personas asisten mensualmente, en promedio, 1
vez y los que no (son pocos), tienden a asistir 3 veces en promedio,
ESTADÍGRAFOS DE DISTRIBUCIÓN
Medidas de forma de la Distribución

• Las medidas de forma permiten determinar qué forma tiene la


curva de distribución de los datos.
• Concentración: mide si los valores de la variable están
uniformemente repartidos a lo largo de la muestra.
a) Asimetría: mide si respecto al centro (centro de simetría), los
segmentos de curva de su derecha e izquierda son similares.
b) Curtosis: mide si los valores de la distribución están
concentrados alrededor de los valores medios de la muestra.
MEDIDAS DE FORMA DE LA DISTRIBUCIÓN
-Asimetría
Medidas o Coeficientes -Kurtosis o Apuntamiento

Además de analizar la posición y la dispersión de los datos, otra medida de interés en una distribución de
frecuencias es la simetría y el apuntamiento o kurtosis.

Si CA=0 si la distribución es simétrica alrededor de la media.


Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría Si CA>0 si la distribución es asimétrica a la derecha

- Si CAp=0 la distribución se dice normal (similar


a la distribución normal de Gauss) y recibe el
Coeficiente de Apuntamiento nombre de mesocúrtica.
- Si CAp>0, la distribución es más puntiaguda
que la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.
MEDIDAS DE FORMA DE LA DISTRIBUCIÓN
CURTOSIS
Indica que tan apuntada o achatada se encuentra una distribución respecto a
un comportamiento normal (distribución normal).

▪ Si los datos están muy


concentrado hacia la media, la
distribución es leptocúrtica
(curtosis mayor a 0).
▪ Si los datos están muy
dispersos, la distribución es
platicúrtica (curtosis menor a
0).
▪ El comportamiento normal
exige que la curtosis sea igual
a 0 (distribución mesocúrtica).
CORRELACIÓN - REGRESIÓN
Relación entre dos variables

En la estadística no todo está supeditado al uso de una variable, también


existen técnicas para analizar la relación de dos variables.

Técnicas para hacer análisis de la relación entre dos


variables

Correlación Regresión
Determina el grado de asociación Es la encargada de describir o establecer el
lineal entre las dos variables, comportamiento de la relación entre las dos
mediante un valor numérico. variables, mediante un modelo matemático.
Coeficiente de Correlación de Pearson

El coeficiente de correlación de Pearson se utiliza para medir el grado o


fuerza de la relación de dos variables, se expresa mediante la letra ”r”.
ANÁLISIS DEL COEFICIENTE DE CORRELACIÓN “r” – PEARSON

Existe correlación inversa

No existe correlación

Existe correlación directa


Coeficiente de Correlación de Pearson

Grado de
Correlación
Correlación Correlación
Correlación
Fuerte Débil
Nula
Positiva Negativa
Regresión

• La regresión lineal establece el comportamiento de la relación entre dos variables cuantitativas.


• Para ello se debe elaborar un modelo matemático (ecuación) que relacione la variable
dependiente (Y) con una variable independiente (X).
• El modelo de regresión lineal ayuda a pronosticar el valor de la variable dependiente (Y) cuando la
variable independiente (X) toma un valor determinado.
CÁLCULO DE PEARSON

ECUACIÓN DE UNA REGRESIÓN LINEAL


Aplicaciones

N° Infracciones
(y)
3 6
4 5
5 4
6 3
7 2
c) Cálculo de tabla de valores:

N° de yi ²
infracciones
(y)
3 6

4 5

5 4

6 3

7 2
∑χ= 25 ∑y=20 ∑χ.y= ∑χ²= ∑y² =
c) Cálculo de tabla de valores:

N° de yi ²
infracciones
(y)
3 6 18 9 36

4 5 20 16 25

5 4 20 25 16

6 3 18 36 9

7 2 14 49 4
∑χ= 25 ∑y=20 ∑χ.y= 90 ∑χ²= 135 ∑y² =90
c) Cálculo de tabla de valores:
e) Cálculo de la ecuación de regresión lineal

CÁLCULO DE “b”

CÁLCULO DE “a”

Ecuación de la regresión:
f) PRONÓSTICO: Si x = 12 años ( Si tuviera 12 años de manejo)

Y=-x + 9 Y = - (12) + 9 = - 3 ≈ 0 infracciones


Si un taxista tuviera 12 años de manejo, existe una tendencia a que no cometa infracciones.

g) Elabora el diagrama de dispersión.


Aplicaciones

MATEMÁTICAS 2 3 4 4 5 6 6 7 7 8 10 10

ESTADÍSTICA 1 3 2 4 4 4 6 4 6 7 9 10
c) Cálculo de tabla de valores:
ESTADÍSTICA yi ²
(y)

2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9
10 10
∑χ= 72 ∑y=60 ∑χ.y= ∑χ²= ∑y² =
c) Cálculo de tabla de valores:
ESTADÍSTICA yi ²
(y)

2 1 2 4 1

3 3 9 9 9

4 2 8 16 4

4 4 16 16 16

5 4 20 25 16

6 4 24 36 16

6 6 36 36 36

7 4 28 49 16

7 6 42 49 36

8 7 56 64 49

10 9 90 100 81

10 10 100 100 100

∑χ= 72 ∑y=60 ∑χ.y= 431 ∑χ²= 504 ∑y² =380


c) Cálculo de tabla de valores:
e) Cálculo de la ecuación de regresión lineal

CÁLCULO DE “b”

CÁLCULO DE “a”

Ecuación de la regresión:
g) Elabora el diagrama de dispersión.
CONCLUSIONES

Las investigaciones que se sustentan en cálculos de


estadígrafos, correlaciones y modelos de regresión,
tienen un alto nivel de rigor científico; pues
permiten describir y proyectar escenarios con
objetividad y confiabilidad.

También podría gustarte