Ic PH

UNSCH ESTADÍSTICA (BORRADOR)
EL ARTE DE APRENDER 1 Mg. AGUILAR ALTAMIRANO, Erick

ÍNDICE
PARTE I: TEORÍA BÁSICA DE LA INFERENCIA PARAMÉTRICA CON SPSS ......................... 6
CAPÍTULO I DISTRIBUCIONES MUESTRALES ...................................................................... 8
1.1. Contenido: ............................................................................................................................. 8
1.2. Marco Teórico Distribuciones Muestrales ............................................................................ 9
1.2.1. Caso 01: La Media ........................................................................................................ 9
1.2.1.1. Objetivo 01: Distribución Muestral De La Media. .................................................. 9
1.2.1.2. Objetivo 02: Distribución Muestral De La Diferencia De Dos Medias:................. 10
1.2.2. Caso 02: La Proporción: ............................................................................................. 13
1.2.2.1. Objetivo 03: Distribución Muestral Para Una Proporción. ..................................... 13
1.2.2.2. Objetivo 04: Distribución Muestral Para La Diferencia De Dos Proporciones. ..... 13
1.2.3. Caso 03: Varianzas. .................................................................................................... 14
1.2.3.1. Objetivo 05: Distribución Muestral Para Una Varianza: ........................................ 14
1.2.3.2. Objetivo 06: Distribución Muestral Para La Razón De Dos Varianzas. ................. 14
CAPÍTULO II ESTIMACION DE PARÁMETROS ...................................................................... 15
2.1. Contenido: ........................................................................................................................... 15
2.2. Estimación Puntual De Parámetros (falta) .......................................................................... 16
2.3. Estimación De Parámetros Por Intervalos .......................................................................... 16
2.3.1. Aspectos Teóricos Básicos ......................................................................................... 16
2.3.2. Uso De Los Estadísticos: ............................................................................................ 17
2.4. Casos De Estudios: ............................................................................................................. 17
2.4.1. Caso 01: La Media ...................................................................................................... 17
2.4.1.1. Objetivo 01: Intervalo De Confianza Para La Media. ............................................ 17
2.4.1.2. Objetivo 02: Intervalo De Confianza Para La Diferencia Entre Dos Medias ......... 18
2.4.1.3. Objetivo 03: Intervalo De Confianza Para La Diferencia Entre Dos Medias Con
observaciones pareadas. .......................................................................................................... 20
2.4.2. Caso 02: La Proporción: ............................................................................................. 20
2.4.2.1. Objetivo 04: Intervalo de confianza para una proporción....................................... 20
2.4.2.2. Objetivo 05: Para la diferencia entre dos Proporciones. ......................................... 20
2.4.3. Caso 03: La Varianza .................................................................................................. 21
2.4.3.1. Objetivo 06: Intervalo de confianza para Para una varianza: ................................ 21
2.4.3.2. Objetivo 07: Intervalo de confianza para la razón de dos varianzas. ..................... 21
CAPÍTULO III PRUEBAS DE HIPOTESIS. .............................................................................. 22
3.1. Contenido: ........................................................................................................................... 22
3.2. Aspectos Teóricos Básicos ................................................................................................. 23
3.3. Tipos De Errores: ................................................................................................................ 23
3.4. Prueba De Hipotesis Estadística: ........................................................................................ 24
3.4.1. Tipos De Pruebas: ....................................................................................................... 24
3.4.2. Reglas De Decisión: .................................................................................................... 25
3.4.3. Procedimientos de la Prueba de Hipótesis. ................................................................. 25
3.5. Estadísticos Para Cada Prueba De Hipótesis ...................................................................... 28
3.5.1. Caso 01: La Media ...................................................................................................... 28
3.5.1.1. Objetivo 01: Estadísticos Para La Media. .............................................................. 28
3.5.1.2. Objetivo 02: Estadísticos Para La Diferencia De Dos Medias: ............................. 29
3.5.1.3. Objetivo 03: Estadísticos Para La Diferencia De Dos Medias Con Observaciones
Pareadas. 30
3.5.2. Caso 02: Proporciones: ............................................................................................... 31
3.5.2.1. Objetivo 04: Estadísticos Para Una Proporción. ..................................................... 31

3.5.2.2. Objetivo 05: Estadísticos Para Dos Proporciones. .................................................. 31

3.5.3. Caso 03: Varianzas. .................................................................................................... 31
3.5.3.1. Objetivo 06: Estadísticos Para Una Varianza: ........................................................ 31
3.5.3.2. Objetivo 07: Estadísticos Para La Razón De Dos Varianzas. ................................. 31
PARTE II: APLICACIÓNES BÁSICA DE LA INFERENCIA PARAMÉTRICA CASOS
PRÁCTICO TEÓRICOS .................................................................................................................... 33
CAPÍTULO IV : EJERCICIOS DE APLICACIÓN DISTRIBUCIÓN MUESTRAL. ................ 34
4.1. CASO 01: LA MEDIA ....................................................................................................... 34
4.1.1. Objetivo 01: Distribución muestral de la media. ........................................................ 34
4.1.1.1. Con varianza poblacional conocida. ....................................................................... 34
4.1.1.2. Con varianza poblacional no conocida. .................................................................. 39
4.1.2. Objetivo02: Distribución Muestral de Diferencia de Medias ..................................... 41
4.1.2.1. Con varianzas poblacionales conocidas. ................................................................. 45
4.1.2.2. Con varianzas poblacionales desconocidas............................................................. 45
4.2. CASO 02: LA PROPORCIÓN: .......................................................................................... 49
4.2.1. Objetivo 03: Distribución muestral para una proporción............................................ 49
4.2.2. Objetivo 04: Distribución Muestral de Diferencia de Proporciones ........................... 52
4.3. CASO 03: LA VARIANZA: .............................................................................................. 57
4.3.1. Objetivo 05: Distribución muestral Para una varianza: .............................................. 57
4.3.2. Objetivo 06: Distribución muestral Para la razón de dos varianzas. .......................... 60
CAPÍTULO V : EJERCICIOS DE APLICACIÓN INTERVALO DE CONFIANZA. ................. 63
5.1. CASO 01: LA MEDIA ....................................................................................................... 63
5.1.1. Objetivo 01: Intervalo de confianza para la media. .................................................. 63
5.1.1.2. Con varianza poblacional desconocida. .................................................................. 64
5.1.2. Objetivo 02: Intervalo de confianza para la diferencia de dos medias ...................... 65
5.1.3. Objetivo 03: Intervalo de confianza para la diferencia entre dos medias con
observaciones pareadas. .............................................................................................................. 70
5.2.1. Objetivo 04: Intervalo de confianza para una proporcion: ........................................ 72
5.2.2. Objetivo 05: Intervalo de confianza para La diferencia de dos proporciones. .......... 73
5.3. CASO 03: LA VARIANZA: .............................................................................................. 74
5.3.1. Objetivo 06: Intervalo de confianza para Para una varianza: .................................... 74
5.3.2. Objetivo 07: Intervalo de confianza para Para la razón de dos varianzas.................. 74
CAPÍTULO VI : EJERCICIOS DE APLICACIÓN PRUEBAS DE HIPÓTESIS. ..................... 76
6.1. CASO 01: LA MEDIA ....................................................................................................... 76
6.1.1. Objetivo 01: Pruebas de hipótesis para la media. ...................................................... 76
6.1.1.2. Con varianza poblacional desconocida. .................................................................. 76
6.1.2. Objetivo 02: Pruebas de hipótesis para la diferencia de dos medias ......................... 76
6.1.3. Objetivo 03: Pruebas de hipótesis para la diferencia entre dos medias con
observaciones pareadas. .............................................................................................................. 76
6.2.1. Objetivo 04: Pruebas de hipótesis para una proporcion: ........................................... 76
6.2.2. Objetivo 05: Pruebas de hipótesis para La diferencia de dos proporciones............... 76
6.3. CASO 03: LA VARIANZA: .............................................................................................. 76

6.3.1. Objetivo 06: Pruebas de hipótesis para Para una varianza: ....................................... 76
6.3.2. Objetivo 07: Pruebas de hipótesis para Para la razón de dos varianzas. .................... 76
PARTE III: APLICACIÓNES BÁSICA DE LA INFERENCIA PARAMÉTRICA CON SPSS ...... 77
CAPÍTULO VII : INTERVALOS DE CONFIANZA ................................................................... 78
7.1. Prueba de Normalidad......................................................................................................... 78
7.1.1. Prueba de normalidad.................................................................................................. 78
7.1.2. Proceso en SPSS ......................................................................................................... 78
7.2. Intervalos de Confianza Para la Media: .............................................................................. 81
7.2.1. Aplicación: .................................................................................................................. 81
7.2.1.1. Proceso en SPSS ..................................................................................................... 81
7.2.2. Aplicación: .................................................................................................................. 82
7.3. Intervalos de Confianza Para la Diferencia de Dos Muestras. ............................................ 85
7.3.1. Intervalos de Confianza Para la Diferencia de Dos Muestras Independientes. .......... 85
7.3.1.1. Aplicación 01: ......................................................................................................... 85
7.3.1.2. Proceso en SPSS ..................................................................................................... 85
7.3.2. Intervalos de Confianza Para la Diferencia de Dos Muestras Relacionadas. ............. 87
7.3.2.1. Aplicación: .............................................................................................................. 87
7.4. Intervalo de Confianza Para la Proporción: ........................................................................ 89
7.4.1. Aplicación: .................................................................................................................. 89
7.4.1.1. Transformación de Datos: ....................................................................................... 89
7.4.1.2. Cálculo Del Intervalo de Confianza ........................................................................ 90
7.4.2. Aplicación: .................................................................................................................. 92
7.4.2.1. Transformación de Datos: ....................................................................................... 92
7.4.2.2. Segmentación. ......................................................................................................... 93
7.4.2.3. Cálculo Del Intervalo de Confianza ........................................................................ 94
CAPÍTULO VIII PRUEBAS DE HIPÓTESIS ............................................................................... 96
8.1. Aclaraciones en el SPSS ..................................................................................................... 96
8.2. Aclaraciones Para el Planteamiento de las Hipótesis: ........................................................ 96
8.3. Prueba de Hipótesis Para la Media de Una Muestra: .......................................................... 97
8.3.1. Aclaración: .................................................................................................................. 97
8.3.2. Ejercicio de Aplicación: .............................................................................................. 97
8.3.3. Prueba de Normalidad:................................................................................................ 97
8.3.4. Proceso en SPSS: ........................................................................................................ 97
8.3.5. Aplicación 01: Caso A: ............................................................................................. 100
8.3.5.1. Prueba de Hipotesis............................................................................................... 100
8.3.5.2. Proceso en SPSS: .................................................................................................. 100
8.3.6. Aplicación 02: Caso B: ............................................................................................. 102
8.3.6.2. Proceso en SPSS: .................................................................................................. 102
8.3.7. Aplicación 03: Caso C: ............................................................................................. 104
8.3.7.2. Proceso En SPSS: ................................................................................................. 104
8.3.8. Aplicación 04: Caso D: ............................................................................................. 106
8.3.8.2. Proceso en SPSS: .................................................................................................. 106
8.3.9. Aplicación 05: Caso E: ............................................................................................. 108
8.3.9.2. Proceso en SPSS: .................................................................................................. 108
8.4. Prueba de Hipótesis Para 2 Muestras Relacionadas, Pareadas, Emparejadas ................... 110
8.4.1. Ejemplos de Aplicación: ........................................................................................... 110

8.4.2. Prueba de Normalidad:.............................................................................................. 110

8.4.3. Planteamiento de las hipótesis .................................................................................. 110
8.4.4. Proceso en SPSS: ...................................................................................................... 110
8.4.5. Aplicación 01: ........................................................................................................... 112
8.4.5.2. Proceso en SPSS: .................................................................................................. 113
8.5.1. Aplicación 02: ........................................................................................................... 115
8.5.1.2. Proceso en SPSS: .................................................................................................. 115
8.5.2. Aplicación 03: ........................................................................................................... 116
8.5.2.2. Proceso en SPSS: .................................................................................................. 116
8.6. Prueba de Hipótesis Para 2 Muestras Independientes ....................................................... 117
8.6.1. Aplicaciones:............................................................................................................. 117
8.6.2. Prueba de Normalidad............................................................................................... 117
8.6.3. Proceso en SPSS: ...................................................................................................... 117
8.6.4. Aplicación 01: ........................................................................................................... 122
8.6.4.2. Proceso en SPSS: .................................................................................................. 122
8.6.5. Aplicación 02: ........................................................................................................... 124
8.6.5.2. Proceso en SPSS: .................................................................................................. 124
8.6.6. Aplicación 03: ........................................................................................................... 125
8.6.7. Prueba de Hipotesis................................................................................................... 125
8.6.7.1. Proceso en SPSS: .................................................................................................. 125
8.7. ANOVA DE UN FACTOR: ............................................................................................. 126
8.7.1. Ejercicios De Aplicación .......................................................................................... 126
8.7.2. Prueba de normalidad................................................................................................ 126
8.7.2.1. Prueba De Hipotesis .............................................................................................. 126
8.7.2.2. Proceso en SPSS: .................................................................................................. 126
8.7.3. Aplicación 01: ........................................................................................................... 127
8.7.3.2. Proceso en SPSS: .................................................................................................. 128
8.7.4. Aplicación 02: ........................................................................................................... 128
8.7.4.1. Planteamiento de la Hipótesis: .............................................................................. 128
8.7.4.2. Proceso en SPSS: .................................................................................................. 128
CAPÍTULO IX : BASE DE DATOS PARA EL EJEMPLO...................................................... 133

PARTE I: TEORÍA BÁSICA DE LA INFERENCIA

PARAMÉTRICA CON SPSS

CASO PARA DATOS:
La primera gráfica representa una muestra extraida de una población y cada punto representa un valor
específico xi de esta muestra, se determina sus medidas descriptivas observandose que existe una
distancia desde la media hasta cada valor de los datos de la muestra di = xi − x , esta diferencia tiene la
( xi − x ) 2
siguiente relación di = Z1− /2 DS de donde xi = x  Z1− /2 DS con DS = s = , para este tipo
n
de análisis se habla de la distribución de datos.
CASO PARA MEDIAS:
Ahora si de una población se extrajera “n” muestras, de estas n muestras se obtiene la media de cada una
de ellas, es así que la segunda gráfica considera a cada punto como la media de la muestra i es decir xi , y
el punto promedio viene a ser una media de medias ( x ), podemos ver también que existe una distancia
desde la media de medias hasta cada media d i = x  xi , esta diferencia tiene la siguiente relación
s
di = Z1− /2 ES ; de donde xi = x  Z1− /2 ES ; ES = , para este tipo de análisis se habla de la
n
distribución muestral de la media.
La medida de variabilidad de los datos es la DS (Desviación Estándar) y

La medida de variabilidad de la media es el ES. (Error Estándar)
Si utilizamos DS en lugar de ES para comparar dos medias o para calcular el IC 95% de la media,
cometeremos un error grave.

CAPÍTULO I DISTRIBUCIONES MUESTRALES

1.1. Contenido:
Muestreo aleatorio.
Población y parámetros.
Muestra aleatoria. Tipos de muestras. Estadísticas
Distribuciones muéstrales.
CASO 01: LA MEDIA
Objetivo 01: Distribución muestral de la media.

Con varianza poblacional conocida.
Con varianza poblacional no conocida.
Objetivo 02: Distribución muestral de la diferencia de dos medias
Con varianzas poblacionales conocidas.
Distribución muestral de la diferencia de dos medias con varianzas poblacionales desconocidas.
Varianzas poblacionales iguales.
Varianzas poblacionales diferentes.
CASO 02: LA PROPORCIÓN:
Objetivo 03: Distribución muestral para una proporcion:

Objetivo 04: Distribución muestral para la diferencia de dos proporciones.
CASO 03: LA VARIANZA:
Objetivo 05: Distribución muestral Para una varianza:

Objetivo 06: Distribución muestral Para la razón de dos varianzas.

1.2. Marco Teórico Distribuciones Muestrales
1.2.1. Caso 01: La Media
1.2.1.1. Objetivo 01: Distribución Muestral De La Media.
* Con varianza poblacional conocida.

1. Estadística Z; Muestra pequeña (n <30), varianza poblacional conocida  y población normal.
2
X −
Z=

n
2. Estadística Z; Muestra grande (n ≥30), varianza poblacional conocida  y población normal o no.
2
X −
Z=

n
* Con varianza poblacional desconocida.
1. Estadística Z; Muestra grande (n ≥30), varianza poblacional desconocida ( 2  s 2 ) y población
normal o no.
X −
Z=
s
n
2. Estadística t: Muestra pequeña (n <30), varianza poblacional desconocida ( 2  s 2 ) y población
normal.
X −
t=
s
n
OBSERVACIONES:
01. Sobre el Error estándar:
Conocida  Desconocida 
2 2
Muestreo con reposición en una población infinita (o con sustitución en una población finita de tamaño N).
 s
x = sx =
n n
Muestreo sin reposición en una población finita o de tamaño N.
 N −n s N −n
x =  sx = 
n N −1 n N −1
N −n
Fc = : Factor de corrección para población finita.
N −1

02. Sobre el Cálculo De Probabilidades:
 
 X − X − 
P( X  X 0 ) = P   0  = P ( Z  Z0 )
   
 
 n n 
 
 X − X − 
P( X  X 0 ) = 1 − P   0  = 1 − P ( Z  Z0 )
   
 
 n n 
 
 X − X − X − 
P( X 0  X  X 1 ) = P  0   1  = P ( Z 0  Z  Z1 ) = P ( Z  Z1 ) − P ( Z  Z 0 )
    
 
 n n n 
03. Cuando se desconoce  será reemplazado por s , al igual que el valor de  será reemplazado por x , a
2 2
no ser que se tenga trabajos anteriores que especifique el valor de  .

04. La expresión X representa a la variable aleatoria y vienen a ser los valores de la media.
05. La expresión X 0 ; X 1 representan valores límites para X para el cálculo de probabilidades.
1.2.1.2. Objetivo 02: Distribución Muestral De La Diferencia De Dos Medias:
1.2.1.2.1. Con varianzas poblacionales conocidas.

1. Estadística Z; Muestras pequeñas (n1  30 y n2  30 ) , varianzas poblacionales conocidas
(12 y  22 ) y poblaciónes normales.
( X 1 − X 2 ) − ( 1 − 2 )  12  22
Z=  (X −X ) = +
 12  22 n1 n2
1 2
+
n1 n2
2. Estadística Z; Muestras grandes (n1  30 y n2  30 ) , varianzas poblacionales conocida (1 y  22 ) y
2
poblaciónes normales o no.

( X 1 − X 2 ) − ( 1 − 2 )  12  22
Z=  (X −X ) = +
 12  22 n1 n2
1 2
+
n1 n2

1.2.1.2.2. Con varianzas poblacionales desconocidas.
1. Estadística Z; Muestras grandes (n1  30 y n2  30 ) , varianzas poblacionales desconocidas

(12  s12 y  22  s22 ) y poblaciónes normales o no.
( X 1 − X 2 ) − ( 1 − 2 ) s12 s22
Z= s( x − x ) = +
s12 s22 1 2
n1 n2
+
n1 n2
Obs: Si se conocieran los tamaños poblacionales N1 y N 2 entonces se realizan las correcciones:
 12  N1 − n1   22  N 2 − n2  s12  N1 − n1  s22  N 2 − n2 
 (X −X ) =  +   s( X1 − X 2 ) =  +  
1 2
n1  N1 − 1  n2  N 2 − 1  n1  N1 − 1  n2  N 2 − 1 
2. A. Estadística t: Muestras pequeñas (n1  30 y n2  30 ) varianzas poblacionales desconocidas

(12  s12 y  22  s22 ) pero iguales (12 =  22 ) y poblaciónes normales.
( X 1 − X 2 ) − ( 1 − 2 ) 1 1 (n1 − 1) s12 + (n2 − 1) s22
t= s( X1 − X 2 ) = Sc + ; Sc =
s12 s22 n1 n2 n1 + n2 − 2
+
n1 n2
t0 = t(1− /2;n1 + n2 − 2)
* prueba de shapiro wilk para la normalidad de datos cuando (n1  30 y n2  30 ) y la prueba de

kolmogorof smirnof si (n1  30 y n2  30 )
* prueba de Levene para la igualdad de varianzas
B. Estadística t: Muestras pequeñas (n1  30 y n2  30 ) varianzas poblacionales desconocidas

(12  s12 y  22  s22 ) pero diferentes (12   22 ) y poblaciónes normales.
2
 s12 s22 
n + n 
( X 1 − X 2 ) − ( 1 − 2 )
t= t0 = t(1− / 2;r ) r =  12 2  2
s 2
s 2
 s12   s22 
+
1 2
n   
n1 n2  1  +  n2 
n1 − 1 n2 − 1
OBSEVACIONES:
01. Cuando se desconoce  1 y  2 , será reemplazado por s12 y s22 respectivamente, al igual que el
2 2
valor de 1 − 2 será reemplazado por x1 y x2 (minúsculas) , a no ser que se tenga trabajos anteriores
que especifique los valores de 1 − 2 .

02. La expresión ( X 1 − X 2 ) (mayúscula) representa a la variable aleatoria y vienen a ser la

representación de todos los valores de la diferencia de medias.
03. La expresión ( X1 − X 2 )0 ;( X1 − X 2 )1 representan valores límites para ( X 1 − X 2 ) ,en el cálculo de
probabilidades.
como referencia tomamos el cálculo de probabilidades del caso Con varianzas poblacionales conocidas
para el otro caso es similar.
 
 
 ( X 1 − X 2 ) − ( 1 − 2 ) ( X 1 − X 2 )0 − ( 1 − 2 ) 
P(( X 1 − X 2 )  ( X 1 − X 2 )0 ) = P    = P ( Z  Z0 )
  2
 2
 2
 2


1
+ 2 1
+ 2 
 n 1 n 2 n 1 n2 
 
 
 ( X 1 − X 2 ) − ( 1 − 2 ) ( X 1 − X 2 )0 − ( 1 − 2 ) 
P(( X 1 − X 2 )  ( X 1 − X 2 )0 ) = 1 − P    = 1 − P ( Z  Z0 )
  2
 2
 2
 2


1
+ 2 1
+ 2 
 n1 n2 n1 n 2 
 
 
 ( X 1 − X 2 )0 − ( 1 − 2 ) ( X 1 − X 2 ) − ( 1 − 2 ) ( X 1 − X 2 )1 − ( 1 − 2 ) 
P(( X 1 − X 2 )0  ( X 1 − X 2 )  ( X 1 − X 2 )1 ) = P    
  2
 2
 2
 2
 12  22 

1
+ 2 1
+ 2
+ 
 n 1 n 2 n 1 n 2 n 1 n 2 
= P ( Z 0  Z  Z1 ) = P ( Z  Z1 ) − P ( Z  Z 0 )

1.2.2. Caso 02: La Proporción:
1.2.2.1. Objetivo 03: Distribución Muestral Para Una Proporción.
P− p p(1 − p) p(1 − p)
EXPRESIÓN 01: Z = p = ; sp =
p (1 − p ) n n
n
p−P
EXPRESIÓN 02: Z =
P(1 − P)
n
OBSEVACIONES:
01.  = p; Para 01 y  = P; Para 02

02. La expresión P para 01 ó p para 02 representa a la variable aleatoria y vienen a ser la
representación de todos los valores de la proporción de cada una de las muestras.
03. .
1.2.2.2. Objetivo 04: Distribución Muestral Para La Diferencia De Dos Proporciones.
Z=
( P1 − P2 ) − ( p1 − p2 )
p1 (1 − p1 ) p2 (1 − p2 ) p1 (1 − p1 ) p2 (1 − p2 )
+ s p1 − p2 = +
n1 n2 n1 n2
;
p1 − p2
Z=
1 1
p (1 − p )   +  p = x1 + x2 = p1n1 + p2 n2
 n1 n2  ; n1 + n2 n1 + n2
Z=
(P − P ) −( p + p )
1 2 1 2
Con el factor de corrección.
p1 (1 − p1 )  N1 − n1  p2 (1 − p2 )  N 2 − n2 
 +  
n1  N1 − 1  n2  N2 −1 
p1 (1 − p1 )  N1 − n1  p2 (1 − p2 )  N 2 − n2 
s p1 − p2 =  +  
n1  N1 − 1  n2  N2 −1 

1.2.3. Caso 03: Varianzas.
1.2.3.1. Objetivo 05: Distribución Muestral Para Una Varianza:

(n − 1) s 2
 ( n −1) =
2

2
1.2.3.2. Objetivo 06: Distribución Muestral Para La Razón De Dos Varianzas.
s12
 12
F=
s22
 22

CAPÍTULO II ESTIMACION DE PARÁMETROS

2.1. Contenido:
• Estimación puntual de parámetros.

• Conceptos fundamentales:
• Estimación de parámetros por intervalos.
• Conceptos fundamentales:
Casos para los Intervalos de confianza
CASO 01: LA MEDIA

Objetivo 01: Intervalo de confianza para la media.
Con varianza poblacional desconocida.
Objetivo 02: Intervalo de confianza para la diferencia de dos medias
Con varianzas poblacionales desconocidas.
Objetivo 03: Intervalo de confianza para la diferencia entre dos medias con observaciones pareadas.
Objetivo 04: Intervalo de confianza para una proporcion:

Objetivo 05: Intervalo de confianza para La diferencia de dos proporciones.
Objetivo 06: Intervalo de confianza para Para una varianza:

Objetivo 07: Intervalo de confianza para Para la razón de dos varianzas.

2.2. Estimación Puntual De Parámetros (falta)
2.3. Estimación De Parámetros Por Intervalos
2.3.1. Aspectos Teóricos Básicos
1. Intervalo De Confianza:
Es un rango de valores representado por  Li ; Ls  en el cuál está contenido el verdadero valor del
parámetro. Por su naturaleza aleatoria, es poco probable que dos muestras de una población en particular
produzcan intervalos de confianza idénticos.
2. Nivel De Confianza:
Llamado también grado de confiabilidad y se denota por “(1-α)”, representa la probabilidad de encontrar
al parámetro dentro del intervalo de confianza.
* P    Li ; Ls  = P  Li    Ls  = 1 − 
3. Nivel De Error:
Se denota por “α” y representa la probabilidad de que el parámetro esté fuera del intervalo de confianza.
* P    Li ; Ls  = P   Li    Ls  = P   Li  + P   Ls  = 
4. Gráfica:
La gráfica esta representada de la siguiente forma:
5. Estimación De Punto:
Este valor individual estima un parámetro de población usando los datos de la muestra. Se representa en
forma general por  .
6. Margen De Error:
El margen de error indica la precisión de la estimación y es la diferencia entre el parámetro y el valor
estimado o estadístico E =  −  .
* Mientras mayor sea el margen de error, más ancho será el intervalo y menos seguro podrá estar usted
del valor de la estimación de punto.

El intervalo de confianza se determina calculando una estimación de punto y luego determinando su
margen de error.
2.3.2. Uso De Los Estadísticos:
Requicitos
Estadísticos Pruebas
Normalidad Varianzas Muestra
conocidas >=30
media; proporción; Normal o no
Z diferencia de desconocidas >=30
medias; diferencia normal conocidas <30
de proporciones
t normal desconocidas <30
χ2 Varianza - - -
F Razón de varianzas Normal - -
2.4. Casos De Estudios:
2.4.1.1. Objetivo 01: Intervalo De Confianza Para La Media.
01. Uso de la estadística Z
1. Varianza poblacional conocida  ; Muestra grande (n≥30) y población normal o no.

2
 
Linf = x − Zt  ; Lsup = x + Z t 
n n
2. Varianza poblacional conocida  ; Muestra pequeña (n<30), y población normal.

2
 
n n
3. Varianza poblacional desconocida   s ; Muestra grande (n≥30), y población normal o no.
2 2
s s
n n
Caso II: uso de la estadística t
1. Varianza poblacional desconocida   s Muestra pequeña (n<30), y población normal.

2 2
s s
Linf = x − tt  ; Lsup = x + tt 
n n
OBSERVACIONES:
Error estándar:

2 2
 s
x = sx =
n n
 N −n s N −n
x =  sx = 
n N −1 n N −1
N −n
Fc =
N − 1 : Factor de corrección para población finita.
tt = t1− /2;n −1
 s
ERROR DE ESTIMACIÓN: E = Z t  ó tt 
n n
2.4.1.2. Objetivo 02: Intervalo De Confianza Para La Diferencia Entre Dos Medias
1. Uso de la estadística Z.
1. Varianza poblacional conocidas  12 ;  22 ; Muestra grande n1  30; n2  30 y población normal o no.
 12  22  12  22
Linf = ( x1 − x 2 ) − Z t  + ; Lsup = ( x1 − x 2 ) + Z t  +
n1 n2 n1 n2
2. Varianza poblacional conocidas  12 ;  22 ; Muestra pequeña n1  30; n2  30 , y poblaciónes normales.
 12  22  12  22
Linf = ( x1 − x 2 ) − Z t  + ; Lsup = ( x1 − x 2 ) + Z t  +
n1 n2 n1 n2
3. Varianzas poblacionales desconocidas  12  s12 ;  22  s22 ; Muestras grandes n1  30; n2  30 y
poblaciónes normales o no.
s12 s22 s2 s2
Linf = ( x1 − x 2 ) − Z t  + ; Lsup = ( x1 − x 2 ) + Z t  1 + 2
n1 n2 n1 n2
02. Uso de la estadística t:
1. Varianzas poblacionales desconocidas  12  s12 ;  22  s22 ; Varianzas poblacionales iguales  12 =  22
Muestras pequeñas n1  30; n2  30 , y población normal.
1 1 1 1
Linf = ( x1 − x 2 ) − tt  Sc  + ; Lsup = ( x1 − x 2 ) + tt  Sc  +
n1 n2 n1 n2
1 1 (n1 − 1)  s12 + (n2 − 1)  s22

S( x1 − x2 ) = Sc  + ; Sc =
n1 n2 n1 + n2 − 2

2. Varianzas poblacionales desconocidas  12  s12 ;  22  s22 ; Varianzas poblacionales diferentes  12   22 ;

Muestras pequeñas n1  30; n2  30 , y población normal.
s12 s22 s12 s22

Linf = ( x1 − x 2 ) − tt  + ; Lsup = ( x1 − x 2 ) + tt  +
n1 n2 n1 n2
2
 s12 s22 
n + n 
tt = t (1 −  / 2; r ); r =  12 2  2
 s12   s22 
n   
 1  +  n2 
n1 − 1 n2 − 1
El valor de r debe ser un número entero. En caso de no serlo se redondea a su valor más próximo.
OBSERVACIONES:
Error estándar:
2 2
 12  22 s12  22
 (x −x ) = + s( x1 − x2 ) = +
1 2
n1 n2 n1 n2
 12  N1 − n1   22  N 2 − n2  s12  N1 − n1  s22  N 2 − n2 
 ( x −x ) =  +   s( x1 − x2 ) =  +  
1 2
n1  N1 − 1  n2  N 2 − 1  n1  N1 − 1  n2  N 2 − 1 
 N −n   N −n 
Fc1 =  1 1  ; Fc1 =  2 2 
 N1 − 1   N 2 − 1  : Factores de corrección para poblaciónes finitas.

2.4.1.3. Objetivo 03: Intervalo De Confianza Para La Diferencia Entre Dos Medias Con
observaciones pareadas.
Base de datos: ( x1 , y1 );( x2 , y2 );.....;( xi , yi );....;( xn , yn )

n n
 Di  ( D − D)
i
2
Medidas descriptivas: Di = ( xi − yi ); D = i =1
; sD2 = i =1
n n
01. Uso de la estadística Z

Varianza poblacional desconocida de la diferencia  D2  sD2 ; Muestra grande (n≥30), y población normal.
sD s
Linf = D − Z t  ; Lsup = x + Z t  D
n n
02. Uso de la estadística t
Varianza poblacional desconocida   s Muestra pequeña (n<30), y población normal.
2 2
sD s
Linf = D − tt  ; Lsup = x + tt  D
n n
tt = t1− /2;n−1
2.4.2. Caso 02: La Proporción:
2.4.2.1. Objetivo 04: Intervalo de confianza para una proporción.

2.4.2.1.1. Muestras grandes n ≥ 30
pq pq
Linf = p − Zt  ; Lsup = p + Zt 
n n
OBSERVACIONES:
Error estándar:
2 2
P(1 − P) p(1 − p)
p = Sp =
n n
P(1 − P)  N − n  p(1 − p)  N − n 
p =   Sp =  
n  N −1  n  N −1 
 N −n
Fc =   : Factor de corrección para poblaciónes finitas.
 N −1 
2.4.2.2. Objetivo 05: Para la diferencia entre dos Proporciones.

pq p q pq p q
Linf = ( p1 − p2 ) − Zt  1 1 + 2 2 ; Lsup = ( p1 − p2 ) + Z t  1 1 + 2 2
n1 n2 n1 n2

OBSERVACIONES:
Error estándar:
Desconocida 
2
p(1 − p)
Sp =
n
p(1 − p)  N − n 
Sp =  
n  N −1 
p1q1  N1 − n1  p2 q2  N 2 − n2 
s( p1 − p2 ) =  +  
n1  N1 − 1  n2  N 2 − 1 
 N −n   N −n 
Fc1 =  1 1  ; Fc2 =  2 2  : Factores de corrección para poblaciónes finitas.
 N1 − 1   N2 −1 
2.4.3. Caso 03: La Varianza
2.4.3.1. Objetivo 06: Intervalo de confianza para Para una varianza:

(n − 1) S 2 (n − 1) S 2
Linf = 2 ; Lsup = 2
(1− /2;n−1) ( /2;n−1)
2.4.3.2. Objetivo 07: Intervalo de confianza para la razón de dos varianzas.
S12 S12
Linf = F( /2; r2 ; r1 ) ; Lsup = F(1− /2;r2 ;r1 )
S 22 S 22
r1 = n1 − 1; r2 = n2 − 1 : grados de libertad.

CAPÍTULO III PRUEBAS DE HIPOTESIS.
3.1. Contenido:
MARCO TEÓRICO:
Hipótesis estadísticas.
Hipótesis simple y compuesta.
Hipótesis nula y alternativa.
Prueba de una hipótesis estadística.
Errores tipo I y tipo II y Nivel de significación.
Región crítica y regla de decisión.
Procedimiento de la prueba de hipótesis
CASOS PARA LAS PRUEBAS DE HIPÓTESIS:
CASO 01: LA MEDIA
Objetivo 01: Pruebas de hipótesis para la media.

Objetivo 02: Pruebas de hipótesis para la diferencia de dos medias
Objetivo 03: Pruebas de hipótesis para la diferencia entre dos medias con observaciones pareadas.
Objetivo 04: Pruebas de hipótesis para una proporción:

Objetivo 05: Pruebas de hipótesis para La diferencia de dos proporciones.
Objetivo 06: Pruebas de hipótesis para Para una varianza:

Objetivo 07: Pruebas de hipótesis para Para la razón de dos varianzas.

3.2. Aspectos Teóricos Básicos
1. Hipotesis: Son proposiciones sobre la población bajo estudio (Parámetros o modelo de distribución),
de las cuales se hacen suposiciones o conjeturas con el fin de verificar su veracidad.
2. Tipos De Hipotesis:
2.1. Hipótesis Estadísticas: Es una proposición o supuesto sobre los parámetros de una o más
poblaciones.
2.2. Hipótesis Simple: Son aquellas hipótesis estadísticas donde la forma de la distribución de la
población, y el valor de su(s) parámetro(s) estan bién especificados.
2.3. Hipótesis Compuesta: Son aquellas hipótesis estadísticas donde la forma de la distribución de la
población, y el valor de su(s) parámetro(s) no estan especificados.
2.4. Hipótesis Nula (H0): Es la hipótesis que se considera provisionalmente como verdadera y cuya
validez será sometida a comprobación experimental, generalmente se formula con la intención de
rechazarla.
* En la hipótesis nula siempre van las relaciones de: =;  ó  y en los ejercicios se los reconoce por: A
lo más, como máximo, a lo sumo, por lo menos, al menos, como mínimo.
2.5. Hipótesis Alternativa (H1 ó Ha):

Es la hipótesis cuya validez generalmente se quiere demostrar, se formula como la hipótesis del
investigador. En la hipótesis Alternativa siempre van las relaciones de: ;  ó 
3.3. Tipos De Errores:
Error Tipo I: Consiste en rechazar la hipótesis nula cuando esta es verdadera con una probabilidad “α".
Error Tipo II: Consiste en aceptar la hipótesis nula cuando esta es falsa con una probabilidad “β"
ESTADO DE LA NATURALEZA
DECISIÓN
H0 Verdadera H0 Falsa
(1-α)
ACEPTAR H0 DESICIÓN CORRECTA β = P(ERROR TIPO II)
(1-β)
RECHAZAR H0 α = P(ERROR TIPO I) DESICIÓN CORRECTA
Nivel De Significancia “α”: Es la probabilidad de cometer el error tipo I, generalmente se toma el valor
de 5% pudiendo tomar valores principalmente entre 1% a 10%.
Nivel De Confianza “1-α”: Es la probabilidad de tomar la decisión correcta.
Poder Estadístico De Un Estudio “1 –β”:
Generalmente varía entre el 80 y el 90%, lo que significa que la probabilidad de cometer un error beta
varía entre el 20 y el 10%.

3.4. Prueba De Hipotesis Estadística:
Es una regla o procedimiento para decidir si se aceptar o rechaza una hipotesis estadística.
3.4.1. Tipos De Pruebas:
Prueba De Cola Izquierda:

Si la región de rechazo se encuentra en el lado izquierdo del punto crítico
Prueba De Cola Derecha:

Si la región de rechazo se encuentra en el lado derecho del punto crítico
Prueba De Dos Cola:

Si la región de rechazo se encuentra dividido en los dos extremos o existe dos puntos críticos.
Región Crítica O De Rechazo: Es el intervalo cuyos valores corresponden a la probabilidad de cometer

un error tipo I ()

Región De Aceptación: Es el intervalo cuyos valores corresponden a la probabilidad del nivel de

confianza (1-).
3.4.2. Reglas De Decisión:
Decisión Por Medio del Estadístico Calculado: Consiste en comparar el estadístico calculado con
el punto crítico, donde si dicho estadístico calculado cae dentro de la región de rechazo entonces se
rechazará la hipótesis nula en caso contrario se aceptará.
Decisión Con el p-value: Es la probabilidad que debe ser comparada con el valor de “” para poder
aceptar o rechazar la hipótesis nula, este valor es usado frecuentemete con los softwares.
Comparación Desición
Si p<α Rechazamos H0 Aceptamos Ha
Si p>α Aceptamos H0 Rechazamos Ha
3.4.3. Procedimientos de la Prueba de Hipótesis.
1) Formular la hipótesis nula y la hipótesis alternativa adecuada

2) Especificar el tamaño  del nivel de significación.
3) Seleccionar la estadística apropiada a usar en la prueba.
4) Establecer la regla de decisión, determinando la región crítica de la prueba.
5) Calcular el valor del estadístico de la prueba a partir de los datos de la muestra.
6) Tomar la decisión de rechazar la hipótesis H0 si el valor del estadístico de la prueba está en la
región crítica. En caso contrario, no rechazar H0.
7) conclusiones

1) Formular la hipótesis nula y la hipótesis alternativa adecuada.

Siempre las hipotesis estadísticas tendrán una de las siguientes formas:
H0 :  ; H0 :  ; H0 : =
 
H1 :  ; H1 :  ; H1 :  ó 
 
Recordando que la igualdad irá siempre en la hipódesis nula.
2) Especificar el tamaño  del nivel de significación.


PRUEBA DE DOS COLAS: El valor de  tendrá que dividirse entre dos, es decir .
2

Para la cola izquierda: se usará para la determinación del estadístico de prueba para la izquierda Ept1 .
2
 Ept 2
Para la cola derecha: se usará 1 − para la determinación del estadísticos de prueba para la derecha
2
.
PRUEBA DE UNA COLA: El valor de  se mantiene, para una cola

Si es cola izquierda: se usará  para la determinación del estadístico de prueba Ept1
Si es cola derecha: se usará 1 −  para la determinación del estadístico de prueba Ept 2 .
3) Seleccionar la estadística apropiada a usar en la prueba.
En esta parte debemos decidir dos cosas:

Cual es el estadístico de prueba Ept (estadístico de prueba tabulado).
 Z t : Normal Estándar
t : t − Studen........................gl = (n − 1)
t
Ept =  2
 t : Chi cuadrada.................gl = (n − 1)
 F : F − Snédecor Fisher.......gl =  n − 1; n − 1
 t 1 2
Gl. Grados de libertad.

Cual es la fórmula que representa a Epc (estadístico de prueba calculado) para realizar los cálculos.
Zc
t
c
Epc =  2
c
F
 c
Son las fórmulas que tienen su correspondiente distribución.
4) Establecer la regla o criterio de decisión:
Se Determinan las regiónes críticas limitadas por los estadísticos de prueba Ept .

PRUEBA DE DOS COLAS:
Epc  R.R ( H 0 ) = −  ; Ept1    Ept 2 ; +   Se rechaza H 0

Epc  R. A( H 0 ) = [ Ept1 ; Ept 2 ] Se acepta H 0
PRUEBA DE UNA COLA:
COLA DERECHA:
Epc  R.R( H 0 ) = Ept 2 ; +   Se rechaza H 0

Epc  R. A( H 0 ) = − ; Ept 2 ] Se acepta H 0
COLA IZQUIERDA:
Epc  R.R( H 0 ) = −  ; Ept1  Se rechaza H 0

Epc  R. A( H 0 ) = [ Ept1 ; +   Se acepta H 0

5) Cálculo del valor del estadístico para cada prueba a partir de los datos de la muestra Epc .
Son los cálculos numéricos especificados en los casos para los estadísticos en la prueba de hipótesis y se
tratan en el apartado 3.5.
6) Toma de decisión:
Se rechazará la hipótesis H0 si el valor del estadístico de la prueba está dentro de la región crítica. En
caso contrario, no rechazar H0.
7) Conclusiones:
Es la interpretación textual de la desición tomada y tiene que ser clara y coherente.
3.5. Estadísticos Para Cada Prueba De Hipótesis
3.5.1.1. Objetivo 01: Estadísticos Para La Media.

* Con varianza poblacional conocida.
* Con varianza poblacional desconocida.

Estadística Z; Muestra pequeña (n <30), varianza poblacional conocida  y población normal.
2
X −
Zc =

n
Estadística Z; Muestra grande (n ≥30), varianza poblacional conocida  y población normal o no.
2
X −
Zc =

n
Estadística Z; Muestra grande (n ≥30), varianza poblacional desconocida (  s ) y población
2 2
normal o no.
X −
Zc =
s
n
Estadística t: Muestra pequeña (n ≤30), varianza poblacional desconocida (  s ) y población
2 2
normal.
X −
tc =
s
n
Observaciones:

Error estándar:
2 2
 s
x = sx =
n n
 N −n s N −n
x =  sx = 
n N −1 n N −1
N −n
Fc = : Factor de corrección para población finita.
N −1
3.5.1.2. Objetivo 02: Estadísticos Para La Diferencia De Dos Medias:

* Con varianzas poblacionales conocidas.
* Con varianzas poblacionales desconocidas.
- Varianzas poblacionales iguales.
- Varianzas poblacionales diferentes.

Estadística Z, Muestra pequeña (n1  30 y n2  30 ) , varianzas poblacionales conocidas
(12 y  22 ) y poblaciónes normales.
( x1 − x2 ) − ( 1 − 2 )
Z=
 12  22  12  22
+  (x −x ) = +
n1 n2 1 2
n1 n2
Estadística Z; Muestra grande (n1  30 y n2  30 ) , varianzas poblacionales conocida (12 y  22 )
y poblaciónes normales o no.
( x1 − x2 ) − ( 1 − 2 )
Z=
 12  22  12  22
+  (x −x ) = +
n1 n2 1 2
n1 n2

Estadística Z; Muestra grande (n1  30 y n2  30 ) , varianza poblacionales desconocidas
(12  s12 y  22  s22 ) y poblaciónes normales o no.
( x − x ) − ( 1 − 2 )
Z= 1 2
s12 s22 s2 s2
+ s( x − x ) = 1 + 2
n1 n2 1
n1 n2
2
Obs: Si se conocieran los tamaños poblacionales N1 y N 2 entonces se realizan las correcciones:

 12  N1 − n1   22  N 2 − n2  s12  N1 − n1  s22  N 2 − n2 
 ( x −x ) =  +   s( x − x ) =  +  
1 2
n1  N1 − 1  n2  N 2 − 1  1 2
n1  N1 − 1  n2  N 2 − 1 
Estadística t: Muestras pequeñas (n1  30 y n2  30 ) varianzas poblacionales desconocidas

(12  s12 y  22  s22 ) pero iguales (12 =  22 ) y poblaciónes normales.
( x1 − x2 ) − ( 1 − 2 ) ( x1 − x2 ) − ( 1 − 2 )
t= ó t=
s( x − x ) (n1 − 1) s12 + (n2 − 1) s22  1 1 
1 2
 + 
n1 + n2 − 2  n1 n2 
1 1 (n1 − 1) s12 + (n2 − 1) s22
s( x − x ) = Sc + ; Sc =
1 2
n1 n2 n1 + n2 − 2
t0 = t(1− /2;n1 + n2 − 2)
Estadística t: Muestras pequeñas (n1  30 y n2  30 ) varianzas poblacionales desconocidas

(12  s12 y  22  s22 ) pero diferentes (12   22 ) y poblaciónes normales.
2
 s12 s22 
n + n 
r =  12 2  2
( x1 − x2 ) − ( 1 − 2 )  s12   s22 
t=
s12 s22 n   
+  1  +  n2 
n1 n2 t0 = t(1− /2;r ) n1 − 1 n2 − 1
3.5.1.3. Objetivo 03: Estadísticos Para La Diferencia De Dos Medias Con Observaciones
Pareadas.
Base de datos: ( x1 , y1 );( x2 , y2 );.....;( xi , yi );....;( xn , yn )

n n
 Di  ( D − D) i
2
Medidas descriptivas: Di = ( xi − yi ); D = i =1
; sD2 = i =1
n n
Caso I: uso de la estadística Z
Varianza poblacional desconocida de la diferencia  D2  sD2 : Muestra grande (n≥30), y población normal.
D − ( 1 −  2 )
Z=
D n
Caso II: uso de la estadística t
Varianza poblacional desconocida   s Muestra pequeña (n<30), y población normal.

2 2

D − ( 1 −  2 )
T=
SD n
D
T= ; (con H 0 : 1 − 2 = 0)
SD n
3.5.2. Caso 02: Proporciones:
3.5.2.1. Objetivo 04: Estadísticos Para Una Proporción.

P− p
Z=
p (1 − p ) p(1 − p) p(1 − p)
p = ; sp =
n n n
3.5.2.2. Objetivo 05: Estadísticos Para Dos Proporciones.
Z=
( P1 − P2 ) − ( p1 + p2 )
p1 (1 − p1 ) p2 (1 − p2 ) p1 (1 − p1 ) p2 (1 − p2 )
+ s p1 − p2 = +
n1 n2 n1 n2
;
p1 − p2
Z=
1 1
p (1 − p )   +  p = x1 + x2 = p1n1 + p2 n2
 n1 n2  ; n1 + n2 n1 + n2
Z=
(P − P ) −( p + p )
1 2 1 2
Con el factor de corrección.
p1 (1 − p1 )  N1 − n1  p2 (1 − p2 )  N 2 − n2 
 +  
n1  N1 − 1  n2  N2 −1 
p1 (1 − p1 )  N1 − n1  p2 (1 − p2 )  N 2 − n2 
s p1 − p2 =  +  
n1  N1 − 1  n2  N2 −1 
3.5.3. Caso 03: Varianzas.
3.5.3.1. Objetivo 06: Estadísticos Para Una Varianza:
(n − 1) s 2
2 =
 (2n−1)
3.5.3.2. Objetivo 07: Estadísticos Para La Razón De Dos Varianzas.

s12
F=
s22

PARTE II: APLICACIÓNES BÁSICA DE LA INFERENCIA

PARAMÉTRICA CASOS PRÁCTICO TEÓRICOS

CAPÍTULO IV : EJERCICIOS DE APLICACIÓN DISTRIBUCIÓN

MUESTRAL.
4.1. CASO 01: LA MEDIA
4.1.1. Objetivo 01: Distribución muestral de la media.
4.1.1.1. Con varianza poblacional conocida.
Ejercicio 01:
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en
forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad
de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas.
Solución:
PASO 01: DATA (no contamos con data)
PASO 02: PRUEBA DE NORMALIDAD (del problema sabemos que tiene una distribución
Normal)
PASO 03: DATOS:
 = 800horas;  = 40horas; n = 16 focos; X 0 = 775 horas
Pide: La probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos
de 775 horas.
P ( X  775 horas )
X0 −  775 − 800
Z0 = = = −2.5
 40
n 16
 
 X −  775 − 800 
P ( X  775 ) = P    = P ( Z  −2.5 ) = 0.00621
  40 
 
 n 16 
P ( X  775 ) = 0.00621

Ejercicio 02:
Una empresa eléctrica se dedica a la fábrica de focos y desean saber la duración promedio, si
anteriormente se realizaron trabajos previos donde, la media era de 800 horas y desviación estándar
de 40 horas. Encuentre la probabilidad de que una muestra aleatoria cumpla ese requisito, los datos
se muestran en la tabla 01.
Tabla Nº01:
Data
Nº Duración
1 850
2 760
3 800
4 820
5 840
6 860
7 760
8 780
9 790
10 795
11 800
12 790
13 795
14 800
15 800
16 800
Solución:
PASO 01: Data en la Tabla Nº01
PASO 02: PRUEBA DE NORMALIDAD
Cuadro Nº02:
Prueba de Normalidad de la Duración de Focos
Pruebas de normalidad
Kolmogorov-Smirnov Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Duración promedio de focos
.285 16 .001 .902 16 .085
a. Corrección de significación de Lilliefors

De acuerdo al cuadro al cuadro Nº 02 podemos observar que la prueba de Shapiro-Wilk muestra un

valor de p o sig. igual a 0.085 mayor al nivel de significancia α =0.05, lo cual muestra que los datos
provienen de una distribución normal.
PASO 03: DATOS:
 = 800horas
 = 40horas
n = 16 foc os
x =?
Cálculos:
n
x i
850 + 760 + 800 + ...... + 800 + 800
x= i =1
= = 802.5
n 16
Pide: La probabilidad de que una muestra aleatoria de 16 focos cumpla el requisito 802.5 horas.
P ( X  802.5 horas )
.
 
 X −  802.5 − 800 
P ( X  802.5 ) = P    = P ( Z  0.25 ) = 0.598706
  40 
 
 n 16 
P ( X  775 ) = 0.598706

Ejercicio 03:
Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una
media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras
aleatorias de tamaño 25 sin reemplazo de esta población, determine:
El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
El número de medias muestrales que caen por debajo de 172 centímetros.
Solución:
Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin
reemplazo, por lo que se tendrá que agregar el factor de corrección.

PASO 02: PRUEBA DE NORMALIDAD (del problema sabemos que tiene una distribución
Normal)
PASO 03: DATOS:
 = 174.5cm;  = 6.9cm; N = 1000; n = 25
Extremos
X 1 = 172.5cm
X 2 = 175.8cm
X 3 = 172cm
número de muestras = 200
Pide:
El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
El número de medias muestrales que caen por debajo de 172 centímetros.
a. P (172.5  X  175.8 )
b.P ( X  172 )
X − 172.5 − 174.5
Z1 = = = −1.467
 N −n 6.9 1000 − 25

n N −1 25 1000 − 1
X − 175.8 − 174.5
Z2 = = = 0.953553
 N −n 6.9 1000 − 25

n N −1 25 1000 − 1
X − 172 − 174.5
Z3 = = = −1.83376
 N −n 6.9 1000 − 25

n N −1 25 1000 − 1
Parte a:

 
 
172.5 − 174.5 X − 175.8 − 174.5
P (172.5  X  175.8 ) = P    
 6.9 1000 − 25  N −n 6.9 1000 − 25 
  
 25 1000 − 1 n N −1 25 1000 − 1 
= P ( Z1  Z  Z 2 )
= P ( −1.467  Z  0.953553)
= P ( Z  0.953553) − P ( Z  −1.467 )
= 0.829845 − 0.071187
P (172.5  X  175.8 ) = 0.758657
Número de muestras que están dentro de este intervalor será: 200x0.758657=151.7315 es decir
aproximadamente 152 muestras.
Parte b:
 
 
X − 172 − 174.5
P ( X  172 ) = P    = P ( Z 3  −1.83376 )
  N −n 6.9 1000 − 25 
  
 n N −1 25 1000 − 1 
P ( X  172 ) = 0.033345
El número de medias muestrales que caen por debajo de 172 centímetros será (0.033345)(200)=
6.669034 que aproximadamente es 7 medias muestrales.

4.1.1.2. Con varianza poblacional no conocida.
Ejercicio 04:
Una empresa requiere la implementación de sistema de facturación, para lo cual requiere la
propuesta de desarrolladores en cuanto al tiempo de entrega, los datos se muestran en la tabla 01.
(según al investigador) Se desea conocer la probabilidad de que existan desarrolladores que

propongan una entrega menor a 60 días.
Tabla 01:
Data, propuesta de desarrolladores del tiempo de entrega.
Entrega
Nº (días) Nº Entrega Nº Entrega
1 90 13 64 25 58
2 55 14 72 26 63
3 65 15 73 27 64
4 50 16 75 28 72
5 54 17 77 29 73
6 56 18 79 30 75
7 80 19 79 31 58
8 89 20 81 32 63
9 50 21 91 33 58
10 53 22 92 34 63
11 58 23 96
12 63 24 96
Solución:
PASO 01: DATA en la Tabla 01

PASO 02: PRUEBA DE NORMALIDAD (del problema sabemos que tiene una distribución Normal)
Cuadro Nº02:
Prueba de Normalidad para la entrega
Kolmogorov-Smirnova Shapiro-Wilk
Tiempo de entrega
.147 34 .062 .941 34 .064
De acuerdo al cuadro Nº 02 podemos observar que la prueba de Kolmogorov-Smirnov muestra un valor de p o sig. igual
a 0.062 mayor al nivel de significancia α =0.05, lo cual muestra que los datos provienen de una distribución normal.
PASO 03: DATOS:

 =?
 =?
n = 34
X 0 = 60
Cálculos:
n
x i
90 + 55 + 65 + ...... + 58 + 63
x= i =1
= = 70.0929316dias
n 34
n
 (x − x ) i
2
(90 − 70.09) 2 + (55 − 70.09) 2 + ... + (63 − 70.09) 2
s2 = i =1
= = 187.280749
n 34
s = s 2 = 187.280749 = 13.6850557 días
Por tanto
  x = 70.1470588 días
 2  s 2 = 187.280749
  s = 13.6850557días
Pide: P ( X  60)
X −  70.0929316 − 60
P( X  60) = P(  ) = P( Z  −4.280497)
s 13.7487296
n 34
−6
P( X  60) = 9.3238110

4.1.2. Objetivo02: Distribución Muestral de Diferencia de Medias
Ejercicio 05:
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela
primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños
como para niñas los pesos siguen una distribución normal. El promedio de los pesos de todos los
niños de sexto grado de esa escuela es de 45.36kg y su desviación estándar es de 6.415kg, mientras
que el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 38.56kg y su
desviación estándar es de 5.555kg. Si x1 representa el promedio de los pesos de 20 niños y x2 es el
promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el promedio de
los pesos de los 20 niños sea al menos 9kg más grande que el de las 25 niñas.
Solución:
PASO 02: PRUEBA DE NORMALIDAD (del problema sabemos que las dos muestras tienen una
distribución Normal)
PASO 03: DATOS:
1 = 45.36kg ;  2 = 38.56kg ;
 1 = 6.415kg ;  2 = 5.555kg
n1 = 20 niños; n2 = 25niñas
X 1 − X 2 = 9kg
Pide:
La probabilidad de que el promedio de los pesos de los 20 niños sea al menos 9kg más grande que el
de las 25 niñas.
P ( x1 − x2  9 )
P ( x1 − x2  9 ) = 1 − P ( x1 − x2  9 )
 
 
 ( X 1 − X 2 ) − ( 1 − 2 ) 9 − (45.36 − 38.56) 
= 1− P   
  2
 2
6.4152 5.5552 

1
+ 2
+
 n1 n2 20 25 
= 1 − P ( Z  1.212543)
= 1 − 0.887348
P ( x1 − x2  9 ) = 0.112652

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos
9kg más grande que el de la muestra de las niñas es 0.112652.
Ejercicio 06:
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación
estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una desviación
estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía
A tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la
compañía B.
Solución:
Datos:
PASO 02: PRUEBA DE NORMALIDAD (del problema no especifica la distribución Normal)
PASO 03: DATOS:
 A = 7.2 años;  B = 6.7 años;
 A = 0.8años;  B = 0.7 años
nA = 34 tubos; nB = 40 tubos
(X A − X B )0 = 1
Pide:
Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A tenga una vida
promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la compañía B.
P( X A − X B  1)
P ( X A − X B  1) = 1 − P ( X A − X B  1)
 
 
 ( X A − X B ) − (  A −  B ) 1 − (7.2 − 6.7) 
= 1− P   
  2
 2
0.82 0.7 2 

A
+ B
+
 nA nB 34 40 
= 1 − P ( Z  2.836447 )
= 1 − 0.997719
P ( X A − X B  1) = 0.002281

Ejercicio 07:
Se prueba el rendimiento en km/l de 2 tipos de gasolina, encontrándose una desviación estándar de
1.23km/L para la primera gasolina y una desviación estándar de 1.37km/l para la segunda gasolina;
se prueba la primera gasolina en 35 autos y la segunda en 42 autos.
¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L
que la segunda gasolina?
¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y
0.83km/L a favor de la gasolina 1?.
Solución:
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones,
por lo que se supondrán que son iguales.
Datos:
PASO 02: PRUEBA DE NORMALIDAD (del problema no especifica la distribución Normal)
PASO 03: DATOS:
1 = 2 ( SUPONEMOS )
 1 = 1.23km / l;  2 = 1.37 km / l
n1 = 35 autos; n2 = 42 autos
(X 1 − X 2 )0 = 0.45
X 1 − X 2  0.45km / l
0.65  X 1 − X 2  0.83
Pide:
P ( X 1 − X 2  0.45 )
P ( 0.65  X 1 − X 2  0.83)
Pregunta a:
P ( X 1 − X 2  0.45 ) = 1 − P ( X 1 − X 2  0.45 )
 
 
 ( x1 − x2 ) − ( 1 − 2 ) 0.45 − 0 
= 1− P  
2 
 1  2
2 2 2
1.23 1.37 
 + +
 n 1 n2 35 42 
= 1 − P ( Z  1.517693)
= 1 − 0.935454
P ( X 1 − X 2  0.45 ) = 0.064546

Pregunta b:
 
 
 0.65 − 0 ( x1 − x2 ) − ( 1 − 2 ) 0.83 − 0 
P ( 0.65  X 1 − X 2  0.83) = P   
2 
2
 1.23 + 1.37
2
1  2
2 2 2
1.23 1.37 
 35 + +
 42 n1 n2 35 42 
= P ( 2.192223  Z  2.799301)
= P ( Z  2.799301) − P ( Z  2.192223)
= 0.997439 − 0.985818
P ( 0.65  X 1 − X 2  0.83) = 0.011621
La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre

0.65 y 0.83 Km/l a favor de la gasolina 1 es de 0.011621.

4.1.2.1. Con varianzas poblacionales conocidas.

4.1.2.2. Con varianzas poblacionales desconocidas.
4.1.2.2.1. Varianzas poblacionales iguales.
4.1.2.2.2. Varianzas poblacionales diferentes.
Ejercicio 08:
Una empresa de tecnología, desea saber la probabilidad de incrementar el presupuesto en el curso de
desarrollo web o de python de acuerdo a la audiencia captada en los talleres en vivo realizados en el
mes de enero.
Tabla 01:
Base de datos de la la audiencia captada en los talleres en vivo:
TALLERES
DESARROLLO
Nº WEB PYTHON
A B
1 15 28
2 85 95
3 120 100
4 150 130
5 140 150
6 145 160
7 190 189
8 180 175
9 170 185
10 199 198
11 209 205
12 208
13 230
14 250
15 254
16 245

Paso 02: Prueba De Normalidad

H0: Los datos presentan una distribución normal
H1: Los datos No presentan una distribución normal
Tabla 02:
Prueba De Normalidad para los talleres de Taller De Desarrollo Web Y Taller De Python:
TALLER DE
DESARROLLO .187 11 ,200* .899 11 .178
WEB
TALLER DE
.160 11 ,200* .901 11 .189
PYTHON
*. Esto es un límite inferior de la significación verdadera.
De acuerdo a la tabla 02 y a los valores de sig o p1=0.178 y p2 =0.189 mayores a 0.05, podemos
afirmar que se acepta la hipótesis nula donde los datos si presentan una distribución normal.
Paso 03: Prueba de homogeneidad de varianza
H0: Los grupos presentan varianzas estadísticamente iguales
H1: Los grupos presentan varianzas diferentes.
Tabla 03:
Prueba de homogeneidad de varianza, prueba de Levene.
Prueba de Levene de igualdad de
varianzas
F Sig.
Cantidad Se asumen
.282 .600
de varianzas iguales
audiencia No se asumen
varianzas iguales
De acuerdo a la tabla 03 y al valor de sig o p=0.600 podemos afirmar que los grupos presentan
varianzas estadísticamente iguales.

Cálculos:
n1
x i
15 + 85 + ... + 209
x1 = i =1
= = 145.78
n1 11
n1
 (x − x ) i 1
2
(15 − 145.78) 2 + (85 − 145.78) 2 + ... + (209 − 145.78)2
s12 = i =1
= = 3205.618182
n1 11
s1 = 56.6181789
n2
x i
28 + 95 + .. + 245
x2 = i =1
= = 175.13
n2 16
n1
 (x − x ) i 2
2
(28 − 175.13) 2 + (95 − 175.13) 2 + .. + (245 − 175.13) 2
s22 = i =1
= = 3940.91667
n2 16
s2 = 62.7767207
Datos:
x1 = 145.78; s12 = 3205.618182; s1 = 56.6181789; n1 = 11
x2 = 175.13; s22 = 3940.91667; s2 = 62.7767207; n2 = 16
Interés del investigador
X 1 − X 2  60
X 1 − X 2  75
50  X 1 − X 2  80
Pide:
P ( X 1 − X 2  60 )
P ( X 1 − X 2  75 )
P ( 50  X 1 − X 2  80 )
Estadísitico:
( x1 − x2 ) − ( 1 − 2 )
t= ; t0 = t(1− /2;n1 + n2 −2)
s12 s22
+
n1 n2
Pregunta a:

 
 
( X − X 2 ) − ( 1 − 2 ) 60 − (145.78 − 175.78)
P ( X 1 − X 2  60 ) = P  1  

 s12 s22 3205.618182 3940.91667
+ 
 + 
 n1 n2 11 16 
= P ( t  3.855187501)
P ( X 1 − X 2  60 ) = 0.99964101

4.2. CASO 02: LA PROPORCIÓN:
4.2.1. Objetivo 03: Distribución muestral para una proporción.
Ejercicio 09:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma
una muestra aleatoria de 800 estudiantes.
Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea
menor que 0.55.
Solución:
Datos:
PASO 03: DATOS:
P = 0.60; Q = 0.40; p0 = 0.55; n = 800 Est
P( p  0.55)
p−P
Estadístico a utilizar: Z =
P(1 − P)
n
1 1
p− − 0.60 0.55 − − 0.60
2(800) 2(800)
P ( p  0.55) = P (  )
0.6(1 − 0.6) 0.6(1 − 0.6)
800 800
P ( p  0.55) = P ( Z  −2.922835738) = 0.0017343
Observe que este valor es igual al obtenido en el método de la aproximación de la distribución

normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma probabilidad de
0.0017. También se debe de tomar en cuenta que el factor de corrección de 0.5 se esta dividiendo
entre el tamaño de la muestra, ya que estamos hablando de una proporción.

La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo que

diríamos que la probabilidad de que, al extraer una muestra de 800 estudiantes de esa universidad, la
proporción de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%.
Ejercicio 10:
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden
presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen
tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento,
encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan
una reacción adversa, exceda el 4%.
solución:

PASO 03: DATOS:
P = 0.03; Q = 0.97; p0 = 0.04; n = 150 Personas
P( p  0.04)
p−P
P(1 − P)
n
1 1
p+ − 0.03 0.04 + − 0.03
2(150) 2(150)
P ( p  0.04) = P(  )
0.03(1 − 0.03) 0.03(1 − 0.03)
150 150
P ( p  0.04) = P ( Z  0.957277545) = 1 − P ( Z  0.957277545)
P ( p  0.04) = 1 − 0.83078641 = 0.16921359
Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad del 17% de
que al tomar una muestra de 150 personas se tenga una proporción mayor de 0.04 presentando una
reacción adversa.

Ejercicio 11:
Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de
4%, encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:
a. Menos del 3% de los componentes defectuosos.
b. Más del 1% pero menos del 5% de partes defectuosas.
Solución:
PASO 03: DATOS:
P = 0.04; Q = 0.96; n = 60Componentes
p0 = 0.03; p1 = 0.01; p2 = 0.05;
Pide :
a. P( p  0.03)
b. P(0.01  p  0.05)
p−P
P(1 − P)
n
Para a:
1 1
p− − 0.04 0.03 − − 0.04
2(60) 2(60)
P( p  0.03) = P(  )
0.04(1 − 0.04) 0.04(1 − 0.04)
60 60
P( p  0.03) = P( Z  −0.72468863) = 0.23432154
La probabilidad de que en una muestra de 60 artículos exista una proporción menor de 0.03 artículos
defectuosos es de 0.2327.

Para b:
1 1 1
0.01 + − 0.04 p − − 0.04 0.05 − − 0.04
2(60) 2(60) 2(60)
P(0.01  p  0.05) = P (   )
0.04(1 − 0.04) 0.04(1 − 0.04) 0.04(1 − 0.04)
60 60 60
= P(−0.8564502  Z  0.065880785) =
= P( Z  0.065880785) − P( Z  −0.8564502)
= 0.52626363 − 0.1958744
P(0.01  p  0.05) = 0.330389227
4.2.2. Objetivo 04: Distribución Muestral de Diferencia de Proporciones
Ejercicio 12:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones
sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12%
de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres
adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión
sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de
hombres a favor sea al menos 3% mayor que el de las mujeres.
Solución:
PASO 03: DATOS:
P1 = 0.12; Q1 = 0.88; n1 = 100 varones
P2 = 0.10; Q2 = 0.90; n2 = 100 Mujeres
( P1 − P2 )0 = 0.03
Pide :
P(( P1 − P2 )  0.03)
( p1 − p2 ) − ( P1 − P2 )
P1 (1 − P1 ) P2 (1 − P2 )
+
n1 n2

 1 1 
 ( P1 − P2 ) − − (0.12 − 0.10) 0.03 − − (0.12 − 0.10) 
P (( P1 − P2 )  0.03) = P  2  100  2 100 
 0.12(1 − 0.12) 0.10(1 − 0.10) 0.12(1 − 0.12) 0.10(1 − 0.10) 
 + + 
 100 100 100 100 
= P( Z  0.113053908)
= 1 − P( Z  0.113053908) = 1 − 0.54500609
P (( P1 − P2 )  0.03) = 0.454993908
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al

menos 3% mayor que el de mujeres es de 0.4562.
Ejercicio 13:
Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despedidos
entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo menos dos años.
Supóngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los
empleados despedidos entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral
de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la
encuesta de Boston College, en 5% o más?
Solución:
En este ejercicio se cuenta únicamente con una población, de la cual se están extrayendo dos
muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas dos muestras,
por lo que se debe de utilizar la distribución muestral de proporciones con P1= P2, ya que es una
misma población.
Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de trabajadores
despedidos entre 1979 y 1984 que estuvieron desempleados por un período de por lo menos dos
años, sólo se conoce la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa
proporción.
En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se necesita
saber las proporciones de las poblaciones, las cuales en este ejercicio las desconocemos, por lo que

se utilizará el valor de 0.20 como una estimación puntual de P. En el siguiente tema se abordará el
tema de estimación estadística y se comprenderá el porque estamos utilizando de esa manera el dato.
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la probabilidad
de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del
porcentaje obtenido en la encuesta de Boston College, en 5% o más?, la palabra difiera quiere decir
que puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se
tendrán que calcular dos áreas en la distribución y al final sumarlas.
Datos:
Solución:
PASO 03: DATOS:
P1 − P2  p1 − p2 = 0.2
n1 = 320; n2 = 320 Mujeres
( P1 − P2 ) 0 = 0.05
Pide :
P ( P1 − P2  0.05)
( p1 − p2 ) − ( P1 − P2 )
P1 (1 − P1 ) P2 (1 − P2 )
+
n1 n2
P( P1 − P2  0.05) = P(+0.05  P1 − P2  P1 − P2  −0.05)

= P(+0.05  P1 − P2 ) + P( P1 − P2  −0.05)
= P( P1 − P2  0.05) + P ( P1 − P2  −0.05)
 1 1   1 1 
 ( P1 − P2 ) − − (0) 0.05 − − (0)   −0.05 + − (0) ( P1 − P2 ) − − (0) 
=P  2  320  2  320  + P 2  320  2  320 
 0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20)   0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20) 
 + +   + + 
 320 320 320 320   320 320 320 320 
= P( Z  1.531728242) + P(−1.531728242  Z )
= 1 − P( Z  1.531728242) + P(−1.531728242  Z )
= 1 − 0.93720524 + 0.06279476
 P( P1 − P2  0.05) = 0.12558951

La probabilidad de que su proporcion muestral de trabajadores sin empleo durante por lo menos dos
años, difiera del porcentaje obtenido en la encuesta de Boston College, en 0.05 o más es de 0.1260.
Ejercicio14:
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5
objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada
máquina:
¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la
máquina 1 en por lo menos 0.10?
¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la
máquina 2 en por lo menos 0.15?
Solución:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
p(p2-p1 0.10) = ?

Otra manera de hacer este ejercicio es poner P1-P2:
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo

menos 10% a favor de la máquina 2 es de 0.0011.
p(p1-p2
0.15)=?
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo

menos 15% a favor de la máquina 1 es de 0.2357.

4.3. CASO 03: LA VARIANZA:
4.3.1. Objetivo 05: Distribución muestral Para una varianza:
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber como se va
a comportar la varianza o desviación estándar en una muestra que proviene de una distribución
normal.
Ejercicio 15:
Suponga que los tiempos requeridos por un cierto autobús para alcanzar uno de sus destinos en una
ciudad grande forman una distribución normal con una desviación estándar  =1 minuto. Si se elige
al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor
que 2.
Solución:
PASO 01: DATA no se cuenta con una data
PASO 02: NORMALIDAD (del problema se sabe que los datos tienen una distribución normal)
PASO 03: DATOS:
 = 1min; n = 17 tiempos; s02 = 2
Pide:
P(s 2  s02 ) ó P(s 2  2)
(n − 1) s 2
Estadístico a utilizar es:  n2−1 =
2
(17 − 1) s 2 (17 − 1)  2
P(  ) = P (  n2−1  32)
(1) 2 (1) 2
= 1 − P (  n2−1  32)
= 1 − 0.99000022
= 0.009999781

Ejercicio 16:
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población

normal con varianza  2 = 6 , tenga una varianza muestral:
a. Mayor que 9.1
b. Entre 3.462 y 10.745
Solución.
PASO 03: DATOS:
 2 = 6; n = 25; s02 = 9.1; s12 = 3.462; s22 = 10.754.
Pide:
a.P( s 2  s02 ) ó P( s 2  9.1)
b.P( s12  s 2  s22 ) ó P(3.462  s 2  10.754)
(n − 1) s 2
Estadístico a utilizar es:  n2−1 =
2
Para a:
(25 − 1) s 2 (25 − 1)  9.1
P( s 2  9.1) = P (  )
6 6
= P(  n2−1  36.4)
= 1 − P(  n2−1  36.4)
= 1 − 0.9498299
 P( s 2  9.1) = 0.050170102
Para b:
(25 − 1)  3.462 (25 − 1) s 2 (25 − 1) 10.754
P(3.462  s  10.754) = P (
2
  )
6 6 6
= P(13.848   n2−1  43.016)
= P(  n2−1  43.016) − P(  n2−1  13.848)
= 0.99009462 − 0.04999081
P(3.462  s  10.754) = 0.940103809
2


4.3.2. Objetivo 06: Distribución muestral Para la razón de dos varianzas.
Ejercicio 17:
Si s12 y s22 son las varianzas muestrales de muestras aleatorias independientes de tamaños
n1 = 10 y n2 = 20 , tomadas de poblaciones normales que tienen las mismas varianzas, encuentre
 s2 
P  12  2.42 
 s2 
Solución:
Primero se establecen los grados de libertad. Como en el numerador está la población uno y en el
denominador la población dos, entonces los grados de libertad uno equivale a 10-1=9 y los grados de
libertad dos a 20-1=19.

PASO 03: DATOS:
n1 = 10 y n2 = 20;12 = 22 ; s12 y s22
Pide:
 s12 
P  2  2.42 
 s2 
s12
 12
Estadístico a utilizar es: F =
s22
 22
Grados de libertad de F
v1 = n1 − 1 = 10 − 1 = 9
v2 = n2 − 1 = 20 − 1 = 19
Para a:
 s2   s 2 /  2 2.42 /  12 
P  12  2.42  = P  12 12  
 s2   s2 /  2 1/  22 
= P ( F( v1;v 2)  2.42 )
 s2 
 P  12  2.42  = 0.9497903
 s2 

Ejercicio 18:
Si s12 y s22 representan las varianzas de las muestras aleatorias independientes de tamaño n1= 25 y
n2 = 31, tomadas de poblaciones normales con varianzas  12 = 10;  22 = 15 , respectivamente,
 s2 
encuentre P  12  1.26  .
 s2 
Solución:

PASO 03: DATOS:
n1 = 25 y n2 = 31;12 = 10; 22 = 15; s12 y s22
Pide:
 s2 
P  12  1.26 
 s2 
Grados de libertad de F:
v1 = n1 − 1 = 25 − 1 = 24
v2 = n2 − 1 = 31 − 1 = 30
s12
 12
Estadístico a utilizar es: F =
s22
 22
 s2   s 2 /  2 1.26 /  12   s12 /10 1.26 /10 
P  12  1.26  = P  12 12   = P  2  
 2
s   2 2
s /  1/  2
2   2
s /15 1/15 
= P ( F( v1;v 2)  1.89 )
= 1 − P ( F( v1;v 2)  1.89 )
= 1 − 0.95036718
 s2 
 P  12  1.26  = 0.049632815
 s2 


CAPÍTULO V : EJERCICIOS DE APLICACIÓN INTERVALO

DE CONFIANZA.
5.1.1. Objetivo 01: Intervalo de confianza para la media.
SOLUCIÓN:
Paso 01: data (no tenemos)
Paso 02: no hay prueba de normalidad dado que n>30
Paso 03: datos

 = 0.05


n = 40; x = 60 min;  = 15 min;1 −  = 0.95 →  = 0.025
2
 
1 − 2 = 0.975
Fórmua de los límites del intervalo:
 
Linf = x − Z t  ; Lsup = x + Z t 
n n
Determinación de Z t :
Zt = Z0.025 = 1.96
Intervalo de confianza:
 15
Linf = x − Z t  = 60 − 1.95996398 = 55.3515
n 40
 15
Lsup = x + Z t  = 60 + 1.95996398 = 64.6485
n 40
El parámetro   55.3515;64.6485 con un nivel de confianza del 95%
Conclusión:
Por lo tanto diremos que la duración media en el que una secretaria necesita para desplazarse del
trabajo su casa hasta es de 55.35 a 64.64 minutos con una seguridad del 95%.

5.1.1.2. Con varianza poblacional desconocida.
Se hace un estudio de mercado, para determinar la venta promedio de una nueva marca de gaseosas,
durante un mes en una cadena de tiendas. Los resultados para una muestra de 36 tiendas indicaron ventas
promedio de S/1000 con una desviación estándar de S/120. Calcule e interprete un intervalo de confianza
del 95% para la verdadera venta promedio µ en la cadena de tiendas.
Solución:
Paso 01: data (no tenemos)
Paso 02: prueba de normalidad
Paso 03: datos

 2 = 0.025
n = 36; x = 1000; s = 120;1 −  = 0.95;  = 0.05 → 
1 −  = 0.975
 2
Fórmua de los límites del intervalo:
s s
n n
Determinación de Z t :
 
1 −  = 0.95;  = 0.05 → = 0.025 y 1 − = 0.975
2 2
Zt = 1.95996398
Cálculo del I:
s 120
Linf = x − Z t  = 1000 − 1.95996398  = 960.80072
n 36
s 120
Lsup = x + Z t  = 1000 + 1.95996398  = 1039.19928
n 36
  960.80072;1039.19928 ó
  960.8;1039.2

5.1.2. Objetivo 02: Intervalo de confianza para la diferencia de dos medias
Un grupo de investigadores de Ecología midieron la concentración de células rojas en la sangre de

29 lagartos (Sceloporis occidentales) capturados en el campo. También observaron si los lagartos
estaban infectados por el parásito de Malaria Plasmodium. Los recuentos de células rojas
proporcionaron los siguientes valores.
Animales infectados : n1 = 13 X 1 = 972,1 s1 = 245,1
Animales no infectados : n2 = 16 X 2 = 843,4 s2 = 251,2
Construye un intervalo de confianza al 99% para la diferencia entre la concentración media de
células rojas en la sangre de animales infectados y no infectados (se supone normalidad).
¿Se podría afirmar que la malaria reduce el número de células rojas? Razona la respuesta.
Solución:
Paso 01: DATA (No se cuenta con data porque el problema es directo)
Paso 02: NORMALIDAD (el ejercicio asume la normalidad de los datos)
Paso 03: DATOS
Animales infectados : n1 = 13 X 1 = 972,1 s1 = 245,1
Animales no infectados : n2 = 16 X 2 = 843,4 s2 = 251,2
Paso 03: PRUEBA DE LEVENE U HOMOGENEIDAD DE VARIANZAS

S12 S12
Linf = 2 F( /2;r2 ;r1 ) ; Lsup = 2 F(1− /2;r2 ;r1 )
S2 S2
Determinación de Ft :
 
1 −  = 0.99;  = 0.01 → = 0.005 y 1 − = 0.995
2 2

F( /2;r2 ;r1 ) = F(0.005;15;12) = 0.23530801

F(1− /2;r2 ;r1 ) = F(0.995;15;12) = 4.72134061
Cálculo del I:
S12 S12 245.12

Linf = F( /2; r2 ; r1 ) = F(0.005;15;12) =  0.23530801 = 0.2240186
S 22 S 22 251.22
S12 S12 245.12
Lsup = F(1− /2; r2 ; r1 ) = F(0.995;15;12) =  4.72134061 = 4.49482394
S 22 S 22 251.22
 12
 2   0.2240186; 4.49482394
2
Intervalo de confianza par la diferencia de dos medias:
1 1 1 1
Linf = ( x1 − x 2 ) − tt  Sc  + y Lsup = ( x1 − x 2 ) + tt  Sc  +
n1 n2 n1 n2
(13 − 1)  ( 245.1) + (16 − 1)  ( 251.2 )

2 2
(n1 − 1)  s12 + (n2 − 1)  s22
Sc = = = 248.507375
n1 + n2 − 2 13 + 16 − 2
1 1 1 1
S( x1 − x2 ) = Sc  + = 248.507375  + = 92.7911621
n1 n2 13 16
tt = t( /2;n1 + n2 − 2) = t(0.005;27) = −2.77068296

tt = t(1− /2;n1 + n2 − 2) = t(0.995;27) = 2.77068296
 tt = 2.77068296
1 1
Linf = ( x1 − x 2 ) − tt  S c  + = (972.1 − 843.4) − 2.77068296  92.7911621 = −128.394891
n1 n2
1 1
Lsup = ( x1 − x 2 ) + tt  S c  + = (972.1 − 843.4) + 2.77068296  92.7911621 = 385.794891
n1 n2
1 − 2   −128.394891;385.794891
Se podría afirmar que la malaria reduce el número de células rojas
Si el intervalo contuviera sólo números negativos, estaríamos diciendo que la diferencia entre el número medio de
células rojas de P1 y P2 es negativa, o equivalentemente que el número medio de células rojas de P1 (lagartos infectados
con malaria) es inferior al de P2 (lagartos no infectados). En ese caso, se podría afirmar que la malaria reduce el número
de células rojas. Pero vemos que el intervalo contiene tanto números negativos como positivos, con lo cuál tan
aceptables es que sea mayor la media de los infectados, como la de los no infectados. En consecuencia, NO se puede
afirmar que la malaria reduzca el número de células rojas.

En un estudio sobre el efecto del dióxido de azufre como agente contaminante del aire, se
dispuso de cierto tipo de semillas de habichuelas en cámaras que se mantuvieron a lo largo
del experimento abiertas por su parte superior. Se asignaron aleatoriamente seis de esas
cámaras a un tratamiento consistente en fumigarlas con dióxido de azufre, y en las otras seis
no se efectuó ningún proceso. Transcurrido un mes, se registraron las cosechas totales (en kg)
de habichuelas en cada cámara, obteniéndose los siguientes datos:
TABLA 01
Con Diox. 1,52 1,85 1,39 1,15 1,30 1,57

Sin Diox. 1,49 1,55 1,21 0,65 0,76 0,69
Halla un intervalo de confianza al 90% para la diferencia de producción media de

habichuelas con y sin dióxido de azufre. Interprétalo.
Solución:
Paso 01: DATA: Tabla 01.

Paso 02: Prueba de normalidad:
Con_Diox .163 6 ,200* .981 6 .956
Sin_Diox .266 6 ,200* .843 6 .139
De acuerdo al estadístico Shapiro-Wilk observamos que el valor de Sig o p es 0.956 y 0.139

mayores al nivel de significancia α=0.05 podemos concluir que ambas muestras provienen de
una distribución normal.
PASO 03: Prueba de Levene:
CÁLCULOS PREVIOS:

n
x i
1.52 + 1.85 + 1.39 + 1.15 + 1.30 + 1.57
x1 = i =1
= = 1.463333333
n 6
n
x i
1.49 + 1.55 + 1.21 + 0.65 + 0.76 + 0.69
x2 = i =1
= = 1.058333333
n 6
n
 (x − x ) i 1
2
(1.52 − 1.4633) 2 + (1.85 − 1.4633) 2 + .... + (1.57 − 1.4633) 2
s12 = i =1
= = 0.058866667
n −1 6 −1
n
 (x − x ) i 1
2
(1.49 − 1.058) 2 + (1.55 − 1.058) 2 + ... + (0.69 − 1.058) 2
s 22 = i =1
= 0.168496667
n −1 6 −1
s1 = 0.058866667 = 0.242624538
s 2 = 0.168496667 = 0.410483455
Cálculo de IC para la varianza

S12 S12
Linf = 2 F( /2;r2 ;r1 ) ; Lsup = 2 F(1− /2;r2 ;r1 )
S2 S2
Determinación de Ft :
 
1 −  = 0.90;  = 0.10 → = 0.05 y 1 − = 0.95
2 2
F( /2;r2 ;r1 ) = F(0.05;5;5) = 0.1980069

F(1− /2;r2 ;r1 ) = F(0.95;5;5) = 5.050329058
Cálculo del I:
S12 S12 0.058866667

Linf = 2
F( /2; r2 ; r1 ) = 2
F(0.05;5;5) =  0.1980069 = 0.069176479
S2 S2 0.168496667
S12 S12 0.058866667
Lsup = 2
F(1− /2; r2 ; r1 ) = 2
F(0.95;5;5) =  5.050329058 = 1.764403077
S2 S2 0.168496667
 12
 2   0.069176479;1.764403077 
2
Queremos determinar un intervalo para la diferencia de medias poblacionales, I 1 − 2
Para comprobar si las varianzas poblacionales (que suponemos desconocidas) pueden

s2
considerarse iguales o no, como s2  s1 , calculamos 22 = 2,847  2 . Por lo tanto, consideramos
s1
que  12   22 (caso b2)

Cálculo del intervalo de confianza para la diferencia de dos medias con varianzas poblacionales diferentes
Determinación de t t :
s12 s22 s2 s2
Linf = ( x1 − x 2 ) − tt  + ; Lsup = ( x1 − x 2 ) + tt  1 + 2
n1 n2 n1 n2
2
 s12 s22   0.058866667 0.168496667 
2
n n  + +
 2

 6 6 
r= 1
2 2
= 2 2
= 8.11360783  8
 s12   s22   0.058866667   0.168496667 
n       
+
 1  +  n2  6 6
n1 − 1 n2 − 1 6 −1 6 −1
tt = t(1− /2;r ) = t(0.95;8) = 1.85954804
Cálculo de I:
s12 s22 0.05886667 0.16849667

Linf = ( x1 − x 2 ) − tt  + = (1.46333333 − 1.05833333) − 1.85954804  +
n1 n2 6 6
Linf = 0.04301382
s12 s22 0.05886667 0.16849667
Lsup = ( x1 − x 2 ) + tt  + = (1.46333333 − 1.05833333) + 1.85954804  +
n1 n2 6 6
Lsup = 0.76698618
 1 − 2   0.04301382;0.76698618
Como el intervalo contiene sólo números positivos, se tiene que 1 −  2  0 , luego 1   2 , es

decir, la cosecha media con dióxido de azufre es superior a la cosecha media sin él. En otras
palabras, efectivamente el dióxido de azufre favorece el crecimiento de las semillas.

5.1.3. Objetivo 03: Intervalo de confianza para la diferencia entre dos medias con
Se realizó un estudio para comparar el contenido en sodio en el plasma de las focas peleteras
australes jóvenes, con el nivel de sodio en la leche de las focas. Se obtuvieron las siguientes
observaciones sobre el contenido de sodio (en minimoles) por litro de leche (o plasma) en 10 focas
aleatoriamente seleccionadas:
Tabla 01:
Data
Sujeto Leche Plasma
1 93 147
2 104 157
3 95 142
4 81,5 141
5 95 142
6 95 147
7 76,5 148
8 80,5 144
9 79,5 144
10 87 146
Halle un intervalo de confianza del 95% para la diferencia de niveles de sodio en los dos
líquidos corporales. ¿Hay pruebas de que exista alguna diferencia? ¿En qué sentido?
Solución:
Observaciones:
Sea X el nivel de sodio en la Leche, y sea Y el nivel de sodio en el plasma.
Queremos estudiar la diferencia de las medias de Y, y X.
Sin embargo, como los valores que tenemos para ambas provienen de los mismos individuos,
en principio los valores de X e Y NO pueden considerarse independientes. Por lo tanto,
estamos ante el caso de datos emparejados.
Paso 01: Data tabla 01:

Paso 02: prueba de normalidad
VAR00001 .152 10 ,200* .952 10 0.696
De acuerdo al estadístico de Shapiro-Wilk y su valor p =0.696 mayor a α= 0.05, concluimos que los
datos provienen de una distribución normal
En consecuencia, formamos una nueva variable, D=X-Y, cuyos datos corresponden a las diferencias
entre los valores de X e Y; es decir:

Y=Sodio en X=Sodio en
Sujeto D =X-Y
Leche plasma
1 93 147 54
2 104 157 53
3 95 142 47
4 81,5 141 59,5
5 95 142 47
6 95 147 52
7 76,5 148 71,5
8 80,5 144 63,5
9 79,5 144 64,5
10 87 146 59
Total: 887 1458 571
Cálculo de medidas descriptivas:
D i
54 + 53 + 47 + ... + 64.5 + 59
D= i =1
= = 57.1
n 10
n
 ( D − D) i
2
(54 − 57.1) 2 + (53 − 57.1) 2 + ... + (59 − 57.1) 2
s 2Di = i =1
= = 63.21
n −1 10 − 1
s Di = 7.95054156
Cálculo del intervalo I:
sD s
Linf = D − tt  ; Lsup = D + tt  D ; tt = t(1− /2;n −1)
n n
tt = t(1− /2;n −1) = t(1−5%/2;10−1) = t(0.975;9) = 2.26215716

sD 7.95054156
Linf = D − tt  = 57.1 − 2.26215716  = 51.4125252
n 10
s 7.95054156
Lsup = D + tt  D = 57.1 + 2.26215716  = 62.7874748
n 10
 D  51.4125252;62.7874748
De los resultados observados y del intervalo de confianza al 95% podemos decir que la
presencia del sodio en el plasma es claramente superior.

5.2.1. Objetivo 04: Intervalo de confianza para una proporcion:
El auditor de una dependencia gubernamental de protección del consumidor, quiere determinar la

proporción de reclamos sobre pólizas de enfermedades que paga el seguro, en un plazo de dos meses de
haber recibido el reclamo. Se selecciona una muestra aleatoria de 200 reclamos y se determina que 80
fueron pagados en un plazo de 2 meses después de recibidos. a) Calcule e interprete un intervalo del 99
% de confianza para la proporción real de reclamos pagados dentro de ese plazo de dos meses; y b) Con
un 95% de confianza, ¿qué tamaño de muestra (reclamos) será necesario si desea cometer un error
máximo del 5%?
Solución:
Paso 01: data no se cuenta.
Datos:
80 120
n = 200; x = 80; p = = 0.4; q = = 0.6;  = 1%
200 200
Cálculo del intervalo I
Z t = Z1− /2 = Z1−0.01/2 = Z 0.995 = 2.5758293
pq 0.4  0.6
Linf = p − Z t  = 0.4 − 2.5758293 = 0.31077066
n 200
pq 0.4  0.6
Lsup = p + Z t  = 0.4 + 2.5758293 = 0.48922934
n 200
 P   0.31077066;0.48922934
Parte b:
n = ? ; E = p − P = 5%;  = 5%;
Z /2 = Z 0.025 = −1.95996398 → Z t = 1.95996398
Z 2 pq (1.95996398)  0.40  0.60
n0 = = = 368.780047  369
E2 0.052

5.2.2. Objetivo 05: Intervalo de confianza para La diferencia de dos proporciones.
Una empresa de estudios de mercado quiere estimar las proporciones de hombres y mujeres que
conocen un producto promocionado a escala nacional, en una muestra aleatoria de 100 hombres y
200 mujeres se determina que 20 hombres y 60 mujeres están familiarizados con el artículo indicado.
a) Calcular el intervalo de confianza de 95 % para la diferencia de proporciones de hombres y
mujeres que conocen el producto. b) ¿Son iguales las proporciones de hombres y mujeres que
conocen el producto?
solución:
datos:
n1 = 100; x1 = 20; n2 = 200; x2 = 60;  = 0.05
Z /2 = Z 0.025 = −1.95996398 → Z t = 1.95996398
20 60
p1 = = 0.20 y p2 = = 0.30
100 200
cálculo del intervalo I
p1q1 p2 q2 0.20  0.80 0.30  0.70
Linf = ( p1 − p2 ) − Z t  + = (0.20 − 0.30) − 1.95996398  +
n1 n2 100 200
Linf = −0.20089532
p1q1 p2 q2 0.20  0.80 0.30  0.70
Lsup = ( p1 − p2 ) + Z t  + = (0.20 − 0.30) + 1.95996398  +
n1 n2 100 200
Lsup = 0.00089532
P1 − P2   −0.20089532;0.00089532

5.3.1. Objetivo 06: Intervalo de confianza para Para una varianza:
5.3.2. Objetivo 07: Intervalo de confianza para Para la razón de dos varianzas.
Se realizaron 16 ensayos para dos tipos de tratamientos X e Y, obteniéndose las siguientes varianzas
muestrales sx2 = 35 y s y2 = 10 , determine el intervalo de confianza al 95% para la razón de estas.
¿Son iguales las varianzas poblacionales de X e Y?
Solución:
Datos:
sx2 = 35 y s y2 = 10; n1 = n2 = 16;  = 5%
Cálculo del intervalo I
S12 S12
Linf = 2 F( /2;r2 ;r1 ) ; Lsup = 2 F(1− /2;r2 ;r1 )
S2 S2
F( /2;r2 ;r1 ) = F(0.025;15;15) = 0.34939471

F(1− /2;r2 ;r1 ) = F(0.975;15;15) = 2.86209253
S12 35
Linf = 2
F( /2;r2 ;r1 ) =  0.34939471 = 1.2228815
S2 10
S12 35
Lsup = 2
F(1− /2;r2 ;r1 ) =  2.86209253 = 10.0173239
S2 10
 x2
 1.2228815;10.0173239
 y2


CAPÍTULO VI: EJERCICIOS DE APLICACIÓN PRUEBAS DE

HIPÓTESIS.
6.1.1. Objetivo 01: Pruebas de hipótesis para la media.

6.1.1.2. Con varianza poblacional desconocida.
6.1.2. Objetivo 02: Pruebas de hipótesis para la diferencia de dos medias

6.1.3. Objetivo 03: Pruebas de hipótesis para la diferencia entre dos medias con
6.2.1. Objetivo 04: Pruebas de hipótesis para una proporcion:
6.2.2. Objetivo 05: Pruebas de hipótesis para La diferencia de dos proporciones.
6.3.1. Objetivo 06: Pruebas de hipótesis para Para una varianza:
6.3.2. Objetivo 07: Pruebas de hipótesis para Para la razón de dos varianzas.

PARTE III: APLICACIÓNES BÁSICA DE LA INFERENCIA

PARAMÉTRICA CON SPSS

CAPÍTULO VII : INTERVALOS DE CONFIANZA

7.1. Prueba de Normalidad
7.1.1. Prueba de normalidad
para ciencias y letras:
7.1.2. Proceso en SPSS
Paso 01: Prueba de normalidad de ciencias y letras
Paso 02: Arrastramos los puntajes a lista de dependientes/ gráficos:
Paso 02: click en gráficos con pruebas de normalidad/continuar/aceptar.
Paso 03:

Como la cantidad de datos son mayores que 30, trabajamos con la prueba de kolmogorov-smirnov, con
sig=p=0.200>0.05 y 0.200>0.05 lo que comprueba que proviene de una población normal.
Pregunta 02: Prueba de normalidad para ciencias y letras según sexo:
Paso 01: Segmentamos o dividimos el archivo: datos/ dividir archivo
Paso 02: en el cuadro click en comparar los grupos /introducimos la variable género a (grupos basados en:)/aceptar
Paso 03: Prueba de normalidad de ciencias y letras

Paso 04: Arrastramos los puntajes a lista de dependientes/ gráficos:
Paso 05: click en gráficos con pruebas de normalidad/continuar/aceptar.
Paso 06:
Como la cantidad de datos son mayores que 30, trabajamos con la prueba de kolmogorov-smirnov, con
sig=p=0.200>0.05 y 0.200>0.05 en letras, lo que comprueba que proviene de una población normal cada grupo y por
otra parte también para el grupo de ciencias con sig=p=0.200>0.05 y 0.200>0.05 que comprueba que proviene de una
población normal cada grupo.

7.2. Intervalos de Confianza Para la Media:
7.2.1. Aplicación:
Se desea obtener una estimación del puntaje medio de aptitud en ciencias de todos los estudiantes
7.2.1.1. Proceso en SPSS

Paso 01: analizar/comparación de medias/ prueba T para una muestra.
Paso 02: Ponemos la variable puntaje en la prueba ciencias a variables para contrastar/ aceptar
Paso 04: obtenemos los cuadros siguientes y damos la conclusión
De la base de datos analizada se puede determinar que la media poblacional se encuentra en un intervalo que
va desde 13.9367 hasta 14.9291 con un nivel de significacia del 5%, es decir   13.9367;14.9291

7.2.2. Aplicación:
Se desea obtener una estimación del puntaje medio de aptitud en letras para hombres y mujeres por separados.
Paso 01: Segmentamos o dividimos el archivo: datos/ dividir archivo.
Paso 02: en el cuadro click en comparar los grupos /introducimos la variable género a (grupos basados en:)/aceptar
Paso 03: Analizar/comparación de medias/ prueba T para una muestra.
Paso 04:

Paso 05: La forma gráfica: gráficos/generador de gráficos/aceptar.
Paso 06: en barras/ Doble click o arrastramos barras de error simple para el tipo de gráfico/arrastramos sexo al eje
X/punteje letras arrastramos al eje Y/aceptar
Paso 07: tenemos el gráfico siguiente:

• Arreglamos doble click en el espacio del cuadrante/doble click en el eje Y/escogemos min 12 –max
17 incremento 1/ aplicar

7.3. Intervalos de Confianza Para la Diferencia de Dos Muestras.
7.3.1. Intervalos de Confianza Para la Diferencia de Dos Muestras Independientes.
7.3.1.1. Aplicación 01:

Se desea obtener una estimación de la diferencia entre las medias de los puntajes en ciencias entre hombres y mujeres.
7.3.1.2. Proceso en SPSS

Paso 01: analizar/ comparar medias/ pruebas T para muestras independientes/
Paso 02: Arrastramos puntaje en ciencias en variables para contrastar y sexo en variables de agrupación/definir grupos.
Paso 03: Definimos grupos: grupo 01 mujeres y grupo 02 varones /continuar:
Paso 04: Obtenemos el cuadro e interpretamos:

Primero existen 2 intervalos de confianza, usaremos uno de ellos de acuerdo a los resultados de levene.
Como Sig=p=0.105>0.05 entonces se acepta la igualdad de varianzas por lo tanto se utilizará para la diferencia de
medias el primer intervalo 1 − 2  0.41663; 2.33417 , es decir con una confianza del 95% podemos afirmar que
1 − 2 pertenece al intervalo que va desde 0.41663 hasta 2.33417.
( 1  2 )

7.3.2. Intervalos de Confianza Para la Diferencia de Dos Muestras Relacionadas.
7.3.2.1. Aplicación:
Se desea estimar la diferencia de medias entre los puntajes en ciencias y letras de todos los estudiantes.
Dado que las notas en ciencias y letras le corresponden a un mismo estudiante se trata de muestras relacionadas entonces.
Paso 01: analizar/comparar medias/pruebas T para muestras relacionadas.
Paso 02: arrastramos puntaje ciencias (variable 01) y puntaje letras (variables 02)/ aceptar
Paso 03:

De aquí observamos que 1 − 2   −0.818; −0.266 es decir que el puntaje en ciencias es menor que los puntajes en
letras, con un nivel de confianza se puede concluir que 1 − 2 pertenece a un intervalo que desde -0.818 hasta -0.266.

7.4. Intervalo de Confianza Para la Proporción:
7.4.1. Aplicación:
El investigador de educación desea obtener una estimación de la proporción de estudiantes que estudian economía y cual
es el intervalo de confianza
7.4.1.1. Transformación de Datos:

La categoría economía está codificado o etiquetado con el número 1 recordemos esto para la transformación.
Paso 01: click en transformar/ recodificar en distinta variable.
Paso 02: Aparece el cuadro siguiente: introducimos la variable carrera prof. /ponemos un nuevo nombre y la etiqueta
nueva.
Paso 03: precionamos cambiar/ valores antiguos y nuevos y aparece/ ponemos en valor antiguo 1 (que corresponde a la
etiqueta de economía) y en valor nuevo ponemos siempre 1 por que este valor va representar nuevamente a eco luego
click en añadir.

Paso 04: click en, todos los demás valores, luego en, valor nuevo, ponemos 0, esto codifica a las demás carreras con cero
luego click en añadir/ continuar/aceptar.
Paso 05: observamos que en la ventana de dato aparezca los valores de Eco, con el 1 para economía y ceros para el
resto.
7.4.1.2. Cálculo Del Intervalo de Confianza

Paso 01: Analizar/ Comparación de medias/ Pruebas T para una muestra

Paso 02: Introducimos la nueva variable Eco como variable para contrastar/ valor de prueba siempre para intervalos de
confianza será cero (0).
Paso 03: Verificamos el nivel de confianza en este caso al 95%/Continuar/ Aceptar.
Paso 04: Aparece en la ventana de resultados
De los resultados observamos que la proporción es p=0.25, es decir el 25% de los estudiantes es de economía y que la

proporción poblacional puede tomar los valores de 0.16 a 0.34 con una confianza del 95%, es decir P  0.16;0.34 . 

7.4.2. Aplicación:
Se desea obtener una estimación de la proporción de estudiantes que estudian matemática entre varones y mujeres por
separado.
7.4.2.1. Transformación de Datos:

Realizamos el proceso anterior ahora con La categoría Matemática que está codificado o etiquetado con el número 3
recordemos esto para la transformación.
Paso 01: click en transformar/ recodificar en distinta variable.
Paso 02: Aparece el cuadro siguiente: introducimos la variable carrera prof. /ponemos un nuevo nombre (Mate ) y la
etiqueta nueva (Matemática)/cambiar.
Paso 03:en valor antiguo ponemos 3 (etiqueta de matemática) valor nuevo siempre 1/añadir

Paso 04: click todos los demás valores/ valores nuevos 0/añadir/continuar/ aceptar
Es decir a matemática lo etiqueto como 1 y al resto como 0.
Paso 05: verificamos en la ventana de datos:
7.4.2.2. Segmentación.
Se realiza la segmentación con el objetivo de ver la proporción por separado de acuerdo al sexo
Paso 01: Datos/ Dividir archivo o segmentar datos

Paso 02: click en comparar grupos/introducimos la variable género en grupos basados/ aceptar
Con esto quedó separado por género.
7.4.2.3. Cálculo Del Intervalo de Confianza

Paso 01: Analizar/ Comparación de medias/ Pruebas T para una muestra
Paso 02: Introducimos la nueva variable Mate como variable para contrastar/ valor de prueba siempre para intervalos de
confianza será cero (0), Verificamos el nivel de confianza en este caso al 95%/Continuar/ Aceptar.
Paso 03:

De los resultados observamos la proporción es p1=0.18 y p2=0.18 es decir el 50% de los estudiantes es de Matemática
son varones y 50% son mujeres y que la proporción poblacional para ambos caso pueden tomar los valores de 0.07 a
  
0.29 con una confianza del 95%, es decir P1  0.07;0.29  P2  0.07;0.29 . 

CAPÍTULO VIII PRUEBAS DE HIPÓTESIS

8.1. Aclaraciones en el SPSS
En los resultados del spss se obtiene el valor de p- value o lo que es lo mismo sig.bilateral, dado un
nivel “” de significancia entonces tendremos las siguientes consideraciones:
Pasito 01: Analizamos la hipótesis alternativa si se trata de un análisis de cola derecha, izquierda o
de dos colas
Pasito 02: Observamos el signo del valor t-Student si es positivo o negativo
Pasito 03: De acuerdo a la hipótesis vemos si p se mantiene o cambia y de que forma para poder
compararlo con el valor“” de significancia.
Pasito 04: Tomamos la decisión de aceptar o rechazar la hipótesis nula comparando p con .
Este cuadro es exclusivo para el spss:
CASOS H1 Colas Signo de la t-student p-value p-value para comparar Se acepta

calculada en spss H0 si:
A ≠ Dos colas Se mantiene p=sig.bilateral p>

B > Cola a la + Se cambia p=sig.bilateral/2 p>
C > derecha - Se cambia p=1-sig.bilateral/2
Siempre
D < Cola a la + Se cambia p=1-sig.bilateral/2
E < izquierda - Se cambia p=sig.bilateral/2 p>
NOTA:
8.2. Aclaraciones Para el Planteamiento de las Hipótesis:
En la hipótesis nula siempre va las relaciones de: =;  ó  y en los ejercicios se los reconoce
por: A lo más, como máximo, a lo sumo, por lo menos, al menos, como mínimo
En la hipótesis alterna siempre va las relaciones de: ;  ó 
Comparación Desición
p<α Rechazamos H0 Aceptamos Ha
p>α Aceptamos H0 Rechazamos Ha

8.3. Prueba de Hipótesis Para la Media de Una Muestra:
8.3.1. Aclaración:
Consiste en decidir si la media poblacional es estadísticamente igual, mayor, menor, mayor igual,
menor igual a un valor específico, en estos casos se dirá CASOS BILATERAL, UNILATERAL
COLA A LA IZQUIERDA Y DERECHA.
8.3.2. Ejercicio de Aplicación:
Aplicación 01: Se desea investigar que la nota media de los estudiantes en ciencias es de 14:
Aplicación 02: Se desea investigar que la nota media de los estudiantes en ciencias es a lo más 10:
Aplicación 03: Se desea investigar que la nota media de los estudiantes en ciencias es a lo más 15:
Aplicación 04: Se desea investigar que la nota media de los estudiantes en ciencias es menor a 8:
Aplicación 05: Se desea investigar que la nota media de los estudiantes en ciencias es menor a 16:
8.3.3. Prueba de Normalidad:
Antes de realizar un análisis de datos se deberá verificar el requisito de trabajo para la

inferencia paramétrica es decir la normalidad de los datos
H0: Los datos provienen de una distribución normal:
H1: Los datos no provienen de una distribución normal:
Forma simbólica
H 0 : X = N (; 2 )
H1 : X  N (  ;  2 )
8.3.4. Proceso en SPSS:

Seleccionamos puntaje de ciencias:
Click en gráficos
Seleccionamos gráficos con pruebas de normalidad CONTINUAR Y ACEPTAR

Puntaje en la
prueba de
aptitud
.069 100 ,200 * .978 100 .090
ciencias
*. Este es un límite inferior de la significación verdadera.
a. Corrección de la significación de Lilliefors
Observando el valor de p=0.200 > =0.05 se acepta la hipótesis nula, es decir, podemos afirmar
estadísticamente que los datos provienen de una distribución normal.
Si n ≥ 30 se utilizará kolmogorov-Smirnov
Si n < 30 se utilizará Shapiro- Wilk
De manera adicional se puede observar las gráficas correspondientes, que muestran el
comportamiento de los datos en forma normal.
Paso dos: Para dar solución a las hipótesis procedemos a la comparación de los datos:

8.3.5. Aplicación 01: Caso A:
Se desea investigar que la nota media de los estudiantes en ciencias es de 14:
8.3.5.1. Prueba de Hipotesis

H0: La nota media de los estudiantes en ciencias es de 14:
H1: La nota media de los estudiantes en ciencias es diferente de 14:
Forma simbólica
H 0 :  = 14
H1 :   14
8.3.5.2. Proceso en SPSS:

CORRESPONDE AL CASO “A”

Observando el valor de p=0.087> =0.05 se acepta la hipótesis nula es decir podemos afirmar que
estadísticamente la nota promedio en ciencias es de 14.
* La prueba es de dos colas y p no sufre ningún cambio

8.3.6. Aplicación 02: Caso B:
Se desea investigar que la nota media de los estudiantes en ciencias es a lo más 10:

H0: La nota media de los estudiantes en ciencias es menor igual a 10:
H1: La nota media de los estudiantes en ciencias es mayor a 10:
Forma simbólica
H 0 :   10
H1 :   10

CORRESPONDE AL CASO “B”
Pasito 01: el análisis se trata de una cola (cola a la derecha)

Pasito 02: Observamos el signo del valor t-Student es positivo t=17,725
Pasito 03: Cambiamos entonces nuestro p value por p= sig.bilateral/2 es decir
p=0.000/2=0.00000…
Pasito 04: Observando el valor de p=0.000< =0.05 se rechaza la hipótesis nula y podemos afirmar
que estadísticamente la nota promedio en ciencias es mayor a 10. (ver el cuadrito)

8.3.7. Aplicación 03: Caso C:
Se desea investigar que la nota media de los estudiantes en ciencias es a lo más 15:
H0: La nota media de los estudiantes en ciencias es a lo más 15:
H1: La nota media de los estudiantes en ciencias es mayor a 15:
Forma simbólica
H 0 :   15
H1 :   15
8.3.7.2. Proceso En SPSS:

CORRESPONDE AL CASO “C”

Pasito 02: Observamos el signo del valor t-Student es negativo t=-2.268
Pasito 03: Cambiamos entonces nuestro p value por p= 1-sig.bilateral/2 es decir
p=1-0.026/2=0.987
Pasito 04: Observando el valor de p=0.987> =0.05 se acepta la hipótesis nula y podemos afirmar
que estadísticamente la nota promedio en ciencias es menor igual a15. (ver el cuadrito)
“Mayor negativo se acepta H0”

8.3.8. Aplicación 04: Caso D:
Se desea investigar que la nota media de los estudiantes en ciencias es menor a 8:
H0: La nota media de los estudiantes en ciencias es mayor igual a 8:
H1: La nota media de los estudiantes en ciencias es menor a 8:
Forma simbólica
H0 :   8
H1 :   8
CORRESPONDE AL CASO “D”
Pasito 01: el análisis se trata de una cola (cola a la izquierda)

Pasito 02: Observamos el signo del valor t-Student es positivo
Pasito 03: Cambiamos entonces nuestro p value por p= 1-sig.bilateral/2 es decir
p=1-0.000/2=0.9999…

Pasito 04: Observando el valor de p=0.999..> =0.05 se acepta la hipótesis nula y podemos afirmar
que estadísticamente la nota promedio en ciencias es mayor igual a 8. (ver el cuadrito)
“Menor positivo se acepta H0”

8.3.9. Aplicación 05: Caso E:
Se desea investigar que la nota media de los estudiantes en ciencias es menor a 16:
H0: La nota media de los estudiantes en ciencias es mayor o igual a 16:
H1: La nota media de los estudiantes en ciencias es menor a 16:
Forma simbólica
H 0 :   16
H1 :   16

CORRESPONDE AL CASO “E”
Pasito 01: el análisis se trata de una cola (cola a la Izquierda)

Pasito 02: Observamos el signo del valor t-Student negativo t=-6.266
Pasito 03: Cambiamos entonces nuestro p value por p= sig.bilateral/2 es decir p=0.000/2
que estadísticamente la nota promedio en ciencias es menor a 16.

8.4. Prueba de Hipótesis Para 2 Muestras Relacionadas, Pareadas, Emparejadas
8.4.1. Ejemplos de Aplicación:
APLICACIÓN 01: Los estudiantes del aula A tienen puntajes diferentes en ciencias y en letras?
APLICACIÓN 02: Los estudiantes del aula A tienen puntaje menor en ciencias que en letras?
APLICACIÓN 03: Los estudiantes del aula A tienen puntaje mayor en ciencias que en letras?
8.4.2. Prueba de Normalidad:
8.4.3. Planteamiento de las hipótesis
H0: Los datos provienen de una distribución normal:
H1: Los datos no provienen de una distribución normal:
Forma simbólica
H 0 : X C = N (; 2 ) H 0 : X L = N (; 2 )
H1 : X C  N (  ;  2 ) H1 : X L  N (  ;  2 )
Seleccionamos los datos puntaje de ciencia y de letra

Click en gráficos y marcamos gráficos con pruebas de normalidad
Continuar/ aceptar
Kolmogorov- Pruebas de normalidad

Smirnova Shapiro-Wilk
*
Puntaje en la prueba de .069 100 ,200 .978 100 .090
aptitud ciencias
Puntaje en la prueba de .062 100 ,200* .989 100 .554

aptitud letras
*. Este es un límite
inferior de la significación

Observando el valor de p=0.200 > =0.05 para ambos casos se acepta la hipótesis nula es decir
podemos afirmar estadísticamente que los Puntajes en la prueba de aptitud ciencias y los Puntajes en
la prueba de aptitud letras provienen de una distribución normal.
Si n < 30 se utilizará Shapiro- Wilk
Ahora recién podemos hacer las comparaciones:
8.4.5. Aplicación 01:
Los estudiantes del aula A tienen puntajes diferentes en ciencias y en letras.
H0: Los estudiantes del aula A tienen puntajes iguales en ciencias y en letras
H1: Los estudiantes del aula A tienen puntajes diferentes en ciencias y en letras
Forma simbólica
H 0 : C =  L
H 1 : C   L

Primero
ciencias luego
letras de
acuerdo a la
investigación
En opciones verificamos el nivel de significancia 1-=95%
Aceptar

CORRESPONDE AL CASO “A”, es decir un análisis de dos colas y Observando el valor de

p=0.000< =0.05 se rechaza la hipótesis nula, entonces podemos afirmar que las puntuaciones en las
pruebas de ciencias y letras son estadísticamente diferentes.

Los estudiantes del aula A tienen puntaje menor en ciencias que en letras

H0: Los estudiantes del aula A tienen puntaje mayor igual en ciencias que en letras
H1: Los estudiantes del aula A tienen puntaje menor en ciencias que en letras
Forma simbólica
H 0 : C   L
H 1 : C   L
CORRESPONDE AL CASO “E”
Pasito 01: El análisis se trata de una cola (cola a la Izquierda)

Pasito 02: Observamos el signo del valor t-Student negativo t=-3.899
que estadísticamente Los estudiantes del aula A tienen puntaje menor en ciencias que en letras.

Los estudiantes del aula A tienen puntaje mayor en ciencias que en letras?

H0: Los estudiantes del aula A tienen puntaje menor igual en ciencias que en letras
H1: Los estudiantes del aula A tienen puntaje mayor en ciencias que en letras
Forma simbólica
H 0 : C   L
H 1 : C   L

Pasito 02: Observamos el signo del valor t-Student es negativo t=-3.899
Pasito 03: Cambiamos entonces nuestro p value por p= 1-sig.bilateral/2 es decir p=1-
0.000/2=0.99999
Pasito 04: Observando el valor de p=0.99999> =0.05 se acepta la hipótesis nula y podemos
afirmar que estadísticamente Los estudiantes del aula A tienen puntaje menor en ciencias que en
letras. (ver el cuadrito)
“Mayor negativo se acepta H0”

8.6. Prueba de Hipótesis Para 2 Muestras Independientes
8.6.1. Aplicaciones:
APLICACIÓN 01: El puntaje medio en ciencias de los estudiantes varones es igual al de las
mujeres?
APLICACIÓN 01: El puntaje medio en ciencias de los estudiantes varones es menor al de las
mujeres?
APLICACIÓN 01: El puntaje medio en ciencias de los estudiantes varones es mayor al de las
mujeres?
8.6.2. Prueba de Normalidad
Primero realizamos la prueba de normalidad para cada grupo de datos para femenino y masculino
H0: Los datos correspondientes a los varones provienen de una distribución normal:
H1: Los datos correspondientes a los varones no provienen de una distribución normal:
H0: Los datos correspondientes a las mujeres provienen de una distribución normal:
H1: Los datos correspondientes a las mujeres no provienen de una distribución normal:
Forma simbólica
H 0 : X M = N ( ; 2 ) H 0 : X F = N (; 2 )
H1 : X M  N (  ;  2 ) H1 : X F  N (  ;  2 )
Para este caso:
Primero Separamos los grupos: dividir archivo ó segmentar archivo

Hasta aquí lo que hicimos es separar al grupo por género y los análisis que haga lo harán para estos
dos grupos.
Ahora realizamos el análisis no paramétrico:

Click en aceptar y tenemos:
a
Género Estadístico gl Sig. Estadístico gl Sig.
FEMENINO Puntaje en la prueba
de aptitud ciencias
.101 50 ,200* .944 50 .020
MASCULINO Puntaje en la prueba

de aptitud ciencias
.070 50 ,200* .985 50 .773

Observando el valor de p=0.200 > =0.05 para ambos casos se acepta la hipótesis nula es decir
podemos afirmar estadísticamente que los datos correspondientes a los varones y a las mujeres con
respecto a los puntajes en ciencia provienen de una distribución normal:
Si n < 30 se utilizará Shapiro-Wilk

De forma complementaria sus gráficos.
Por último, reestablescamos la información para que ya deje de considerarlo en función de los
grupos por géneros.

Ya está como al inicio.

El puntaje medio en ciencias de los estudiantes varones es igual al de las mujeres?

H0: El puntaje medio en ciencias de los estudiantes varones es igual al de las mujeres
H1: El puntaje medio en ciencias de los estudiantes varones es diferente al de las mujeres
Forma simbólica
H 0 : V =  M
H1 : V   M
LOS
DATOS
LOS
GRUPOS
LUEGO DEFINIMOS LOS GRUPOS (SÓLO ES POSIBLE PARA DOS GRUPOS)

2 para varones y 1 para mujeres.

El orden es de acuerdo a la investigación primero solicita a los varones después a las mujeres.
VERIFICAMOS EL NIVEL DE SIGNIFICANCIA EN OPCIONES
CONTINUAR / ACEPTAR
PRUEBA T
Estadísticos de grupo
Desviación Error típ. de
Género N Media típ. la media
Puntaje en la prueba MASCULINO 50 13.75 2.245 .318
de aptitud ciencias FEMENINO 50 15.12 2.575 .364
Prueba de muestras independientes

Prueba de Levene para la
igualdad de varianzas Prueba T para la igualdad de medias 95% Intervalo de confianza
Sig. Diferencia de Error típ. de para la diferencia
F Sig. t gl (bilateral) medias la diferencia Inferior Superior
Puntaje en la prueba Se han asumido
2.676 .105 -2.847 98 .005 -1.375 .483 -2.334 -.417
de aptitud ciencias varianzas iguales
No se han
asumido varianzas
-2.847 96.221 .005 -1.375 .483 -2.334 -.416
iguales

CORRESPONDE AL CASO “A”, es decir un análisis de dos colas y Observando el valor de

p=0.005< =0.05 se rechaza la hipótesis nula, entonces podemos afirmar que El puntaje medio en
ciencias de los estudiantes varones es estadísticamente diferente al de las mujeres
Regla práctica: como sig. =0.105 > =0.05 en la prueba de levene entonces se utiliza la primera
fila, en caso contrario se utilizaría la segunda fila.
El puntaje medio en ciencias de los estudiantes varones es menor al de las mujeres?
H0: El puntaje medio en ciencias de los estudiantes varones es mayor igual al de las mujeres
H1: El puntaje medio en ciencias de los estudiantes varones es menor al de las mujeres
Forma simbólica
H 0 : V   M
H1 : V   M
utilizamos el mismo cuadro final anterior.
PRUEBA T

2.676 .105 -2.847 98 .005 -1.375 .483 -2.334 -.417
No se han
asumido varianzas
-2.847 96.221 .005 -1.375 .483 -2.334 -.416
iguales
Pasito 01: el análisis se trata de una cola (cola a la Izquierda)

Pasito 02: Observamos el signo del valor t-Student negativo -2.847
Pasito 04: Observando el valor de p=0.0025< =0.05 se rechaza la hipótesis nula y podemos
afirmar que estadísticamente El puntaje medio en ciencias de los estudiantes varones es menor al de
las mujeres

El puntaje medio en ciencias de los estudiantes varones es mayor al de las mujeres
8.6.7. Prueba de Hipotesis
H0: El puntaje medio en ciencias de los estudiantes varones es menor igual al de las mujeres
H1: El puntaje medio en ciencias de los estudiantes varones es mayor al de las mujeres
Forma simbólica
H 0 : V   M
H1 : V   M

utilizamos el mismo cuadro final anterior.
PRUEBA T

2.676 .105 -2.847 98 .005 -1.375 .483 -2.334 -.417
No se han
asumido varianzas
-2.847 96.221 .005 -1.375 .483 -2.334 -.416
iguales

Pasito 02: Observamos el signo del valor t-Student es negativo
Pasito 03: Cambiamos entonces nuestro p value por p= 1-sig.bilateral/2 es decir p=1-0.005/2
=0.99975
Pasito 04: Observando el valor de p=0.99999> =0.05 se acepta la hipótesis nula y podemos
afirmar que estadísticamente El puntaje medio en ciencias de los estudiantes varones es mayor al de
las mujeres.

8.7. ANOVA DE UN FACTOR:
8.7.1. Ejercicios De Aplicación
APLICACIÓN 01: Los puntajes en ciencias son los mismos en los estudiantes de economía,
matemática, psicología y administración?
APLICACIÓN 02: Los puntajes en ciencias son los mismos según situación laboral?
8.7.2. Prueba de normalidad
Primero verificaremos si los datos para cada grupo son normales
8.7.2.1. Prueba De Hipotesis

H0: Los puntajes en ciencias en los grupos de economía, matemática, psicología y administración
tienen una distribución normal.
H1: Al menos un grupo no tiene no tienen una distribución normal.

Verificamos la normalidad de los datos:

Ahora todo se basa en función a la carrera profesional.
a
Carrera profesional
Puntaje en la prueba de
ECONOMÍA
aptitud ciencias
.117 25 ,200* .950 25 .251
Puntaje en la prueba de *
ADMINISTRACIÓN
aptitud ciencias .111 29 ,200 .965 29 .422
MATEMÁTICA .092 18 ,200 .980 18 .948
aptitud ciencias
PSCOLOGÍA .117 28 ,200 .969 28 .545
aptitud ciencias
De acuerdo a los valores de p para todos los grupos en este caso son mayores a =0.05 concluimos
aceptando la hipótesis nula de que los puntajes en ciencias en los grupos de economía, matemática,
psicología y administración tienen una distribución normal.
¿Los puntajes en ciencias son los mismos en los estudiantes de economía, matemática, pscología y
administración?
H0: ¿Los puntajes en ciencias son los mismos en los estudiantes de economía, matemática,
psicología y administración?
H1: Al menos dos son diferentes
Forma simbólica

H 0 : E = M =  P =  A
H1 : i   j ; i  j
Prueba de homogeneidad de varianzas

Puntaje en la prueba de aptitud ciencias
Estadístico de
Levene gl1 gl2 Sig.
1.568 3 96 .202
ANOVA de un factor
Puntaje en la prueba de aptitud ciencias
Suma de Media
gl F Sig.
cuadrados cuadrática
Inter-grupos 1.712 3 .571 .089 .966
Intra-grupos 617.468 96 6.432
Total 619.181 99
Se acepta la hipótesis nula
Los puntajes en ciencias son los mismos según situación laboral?
Solución:
Ahora comparamos los grupos:
8.7.4.1. Planteamiento de la Hipótesis:
H0: ¿Los puntajes en ciencias son los mismos en los estudiantes según situación laboral?
H1: Al menos dos son diferentes
Forma simbólica
H 0 :  NT = TC = TM
H1 : Al menos dos son diferentes


Por el valor de p=0.043>=0.05 entopnces rechazamos la hipótesis nula
La prueba de homogeneidad de varianzas, por el valor de p=0.057>=0.05 se concluye que si son

homogeneas.
Ahora como las varianzas son homogéneas, continuando ahora con post hoc

Escogemos DMS, es el método de mínimas diferencias significativa, por que es una prueba muy
eficiente.
Continuar y aceptar

El puntaje de los que no trabajan es

https://www.youtube.com/watch?v=VUFWtty1xpk

CAPÍTULO IX : BASE DE DATOS PARA EL EJEMPLO
Situación Puntaje en la prueba de Carrera Puntaje en la prueba

Nº Edad Género
laboral aptitud ciencias profesional de aptitud letras
1 27 1 1 12,44 2 13,88
2 25 1 1 13,47 4 14,27
3 21 3 2 19,09 4 17,88
4 24 2 1 19,88 4 20
5 19 1 2 13,23 4 14,01
6 19 1 2 16,37 4 14,46
7 20 1 2 13,77 1 16,64
8 18 3 2 14,64 2 16,4
9 21 3 1 10,82 1 10,35
10 27 1 2 12,29 4 12,25
11 27 3 1 15,26 3 16,92
12 17 3 1 13,31 3 13,25
13 21 1 2 14,96 1 14,22
14 27 2 1 17,23 1 17,11
15 18 3 2 13,37 1 13,31
16 24 1 2 13,47 4 14,29
17 25 1 2 15,01 1 15,17
18 25 3 2 11,73 2 11,77
19 20 2 2 14,8 4 13,38
20 21 2 1 20 2 18,55
21 20 2 1 17,26 4 17,36
22 20 1 2 15,85 4 17,49
23 19 1 2 11,41 1 9,86
24 24 1 2 14,64 1 14,99
25 24 2 2 14,91 3 15,55
26 23 3 1 20 1 20
27 19 1 1 11,92 1 10,8
28 20 3 1 14,82 4 16,79
29 22 3 1 14,87 2 16,63
30 22 3 2 17,8 2 17,99
31 16 1 1 15,66 2 14,46
32 18 1 1 13,79 4 15,92
33 28 3 2 15,89 1 17,67
34 19 1 2 14,85 4 14,34
35 28 3 2 17,91 4 18,81
36 16 3 1 18,27 3 20
37 23 3 1 16,19 1 16,17
38 24 1 2 13,97 1 15,72
39 23 3 1 12,39 4 12,43
40 19 3 1 19,86 1 18,12
41 25 2 2 8,16 2 9,54
42 22 2 1 18 2 17,18
43 22 1 2 9,83 4 10,96
44 20 2 1 12,2 2 10,31
45 26 1 1 16,99 1 15,03
46 21 1 2 14,74 2 14,3
47 19 1 2 11,97 2 11,99
48 18 2 2 12,68 4 12,41
49 25 3 2 13,27 3 11,92
50 21 1 1 12,92 4 15,3
51 21 3 2 12,35 1 10,5
52 23 2 1 14,61 2 16,7
53 23 3 2 13,14 1 15,67
54 22 2 1 17,78 2 15,92
55 21 3 1 15,87 2 17,19
56 26 2 2 10,72 4 12,29
57 16 3 1 13,9 4 15,59
58 23 1 2 8,84 2 7,45
59 17 3 1 14,19 3 15,37
60 23 2 1 16,23 1 18,65
61 18 3 1 16,08 3 18,85
62 22 2 1 12,17 2 15,04
63 28 2 2 14,11 3 16,66
64 21 2 2 15,37 3 16,3

65 22 1 2 13,28 1 14,7
66 22 1 2 11,1 4 12,72
67 20 1 2 12,5 4 10,86
68 24 3 1 17,62 3 20
69 23 2 1 12,57 2 15,16
70 21 1 1 13,6 2 13,77
71 21 1 2 14,56 3 15,95
72 22 3 1 14,57 4 14
73 28 1 2 13,8 3 12,3
74 20 1 1 12,76 4 14,43
75 26 2 1 12,52 1 12,47
76 17 3 1 15,82 3 15,94
77 23 2 1 12,76 3 14,86
78 23 1 2 11,78 1 14,17
79 26 2 2 14,14 1 14,85
80 22 3 1 11,13 3 14,02
81 26 3 1 12,53 2 14,49
82 22 2 1 20 2 20
83 24 3 2 14,37 3 16
84 21 1 1 16,27 2 17,93
85 26 3 2 10,32 1 12,96
86 23 1 2 12,43 1 13,05
87 23 2 2 15,69 3 14,77
88 21 2 2 12,66 2 14,74
89 23 3 1 12,63 2 12,8
90 24 1 1 13,11 4 13,28
91 23 2 1 19,27 2 17,53
92 19 2 2 12,98 3 14,46
93 18 3 1 14,15 2 15,81
94 23 2 1 16,66 4 15,97
95 21 3 2 13,61 2 11,71
96 24 3 1 13,93 1 14,99
97 20 2 2 15,44 2 16,3
98 22 3 1 15,75 2 16,96
99 25 3 2 15,25 4 14,88
100 22 1 2 18,21 4 18,36
CATEGORIZACIÓN:
CARRERA
COD GÉNERO PROFESIONAL SIUACIÓN LABORAL
1 FEMENINO ECONOMÍA NO TRABAJA
2 MASCULINO ADMINISTRACIÓN TRABAJA MEDIO TIEMPO
TRABAJA TIEMPO
3 - MATEMÁTICA COMPLETO
4 - PSCOLOGÍA -

Cuando se quiere analizar:
V. ordinal VS Ordinal→ Spearman

V. Ordinal VS cuantitativa discrete
Casos para el uso del coeficinete de Spearman
Ordinal Spearman
Ordinal Discreta
Continua
Discreta Discrete
Continua. Continua

https://www.youtube.com/watch?v=wEMdQvZDVUw

Ic PH

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ic PH

Cargado por

Copyright:

Formatos disponibles

UNSCH ESTADÍSTICA (BORRADOR)

EL ARTE DE APRENDER 1 Mg. AGUILAR ALTAMIRANO, Erick

EL ARTE DE APRENDER 2 Mg. AGUILAR ALTAMIRANO, Erick

3.5.2.2. Objetivo 05: Estadísticos Para Dos Proporciones. .................................................. 31

EL ARTE DE APRENDER 3 Mg. AGUILAR ALTAMIRANO, Erick

EL ARTE DE APRENDER 4 Mg. AGUILAR ALTAMIRANO, Erick

8.4.2. Prueba de Normalidad:.............................................................................................. 110

EL ARTE DE APRENDER 5 Mg. AGUILAR ALTAMIRANO, Erick

PARTE I: TEORÍA BÁSICA DE LA INFERENCIA

EL ARTE DE APRENDER 6 Mg. AGUILAR ALTAMIRANO, Erick

CASO PARA MEDIAS:

La medida de variabilidad de los datos es la DS (Desviación Estándar) y

EL ARTE DE APRENDER 7 Mg. AGUILAR ALTAMIRANO, Erick

CAPÍTULO I DISTRIBUCIONES MUESTRALES

CASO 01: LA MEDIA

Objetivo 01: Distribución muestral de la media.

Objetivo 03: Distribución muestral para una proporcion:

CASO 03: LA VARIANZA:

Objetivo 05: Distribución muestral Para una varianza:

EL ARTE DE APRENDER 8 Mg. AGUILAR ALTAMIRANO, Erick

1.2. Marco Teórico Distribuciones Muestrales

1.2.1. Caso 01: La Media

1.2.1.1. Objetivo 01: Distribución Muestral De La Media.

* Con varianza poblacional conocida.

01. Sobre el Error estándar:

EL ARTE DE APRENDER 9 Mg. AGUILAR ALTAMIRANO, Erick

no ser que se tenga trabajos anteriores que especifique el valor de  .

1.2.1.2. Objetivo 02: Distribución Muestral De La Diferencia De Dos Medias:

1.2.1.2.1. Con varianzas poblacionales conocidas.

poblaciónes normales o no.

EL ARTE DE APRENDER 10 Mg. AGUILAR ALTAMIRANO, Erick

1.2.1.2.2. Con varianzas poblacionales desconocidas.

1. Estadística Z; Muestras grandes (n1  30 y n2  30 ) , varianzas poblacionales desconocidas

2. A. Estadística t: Muestras pequeñas (n1  30 y n2  30 ) varianzas poblacionales desconocidas

* prueba de shapiro wilk para la normalidad de datos cuando (n1  30 y n2  30 ) y la prueba de

B. Estadística t: Muestras pequeñas (n1  30 y n2  30 ) varianzas poblacionales desconocidas

EL ARTE DE APRENDER 11 Mg. AGUILAR ALTAMIRANO, Erick

02. La expresión ( X 1 − X 2 ) (mayúscula) representa a la variable aleatoria y vienen a ser la

EL ARTE DE APRENDER 12 Mg. AGUILAR ALTAMIRANO, Erick

1.2.2. Caso 02: La Proporción:

1.2.2.1. Objetivo 03: Distribución Muestral Para Una Proporción.

01.  = p; Para 01 y  = P; Para 02

04. Sobre el Cálculo De Probabilidades:

1.2.2.2. Objetivo 04: Distribución Muestral Para La Diferencia De Dos Proporciones.

EL ARTE DE APRENDER 13 Mg. AGUILAR ALTAMIRANO, Erick

1.2.3. Caso 03: Varianzas.

1.2.3.1. Objetivo 05: Distribución Muestral Para Una Varianza:

1.2.3.2. Objetivo 06: Distribución Muestral Para La Razón De Dos Varianzas.

EL ARTE DE APRENDER 14 Mg. AGUILAR ALTAMIRANO, Erick

CAPÍTULO II ESTIMACION DE PARÁMETROS

• Estimación puntual de parámetros.

Casos para los Intervalos de confianza

CASO 01: LA MEDIA

CASO 02: LA PROPORCIÓN:

Objetivo 04: Intervalo de confianza para una proporcion:

CASO 03: LA VARIANZA:

Objetivo 06: Intervalo de confianza para Para una varianza:

EL ARTE DE APRENDER 15 Mg. AGUILAR ALTAMIRANO, Erick

2.2. Estimación Puntual De Parámetros (falta)

2.3. Estimación De Parámetros Por Intervalos

2.3.1. Aspectos Teóricos Básicos

La gráfica esta representada de la siguiente forma:

EL ARTE DE APRENDER 16 Mg. AGUILAR ALTAMIRANO, Erick