Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ÍNDICE
PARTE I: TEORÍA BÁSICA DE LA INFERENCIA PARAMÉTRICA CON SPSS ......................... 6
CAPÍTULO I DISTRIBUCIONES MUESTRALES ...................................................................... 8
1.1. Contenido: ............................................................................................................................. 8
1.2. Marco Teórico Distribuciones Muestrales ............................................................................ 9
1.2.1. Caso 01: La Media ........................................................................................................ 9
1.2.1.1. Objetivo 01: Distribución Muestral De La Media. .................................................. 9
1.2.1.2. Objetivo 02: Distribución Muestral De La Diferencia De Dos Medias:................. 10
1.2.2. Caso 02: La Proporción: ............................................................................................. 13
1.2.2.1. Objetivo 03: Distribución Muestral Para Una Proporción. ..................................... 13
1.2.2.2. Objetivo 04: Distribución Muestral Para La Diferencia De Dos Proporciones. ..... 13
1.2.3. Caso 03: Varianzas. .................................................................................................... 14
1.2.3.1. Objetivo 05: Distribución Muestral Para Una Varianza: ........................................ 14
1.2.3.2. Objetivo 06: Distribución Muestral Para La Razón De Dos Varianzas. ................. 14
CAPÍTULO II ESTIMACION DE PARÁMETROS ...................................................................... 15
2.1. Contenido: ........................................................................................................................... 15
2.2. Estimación Puntual De Parámetros (falta) .......................................................................... 16
2.3. Estimación De Parámetros Por Intervalos .......................................................................... 16
2.3.1. Aspectos Teóricos Básicos ......................................................................................... 16
2.3.2. Uso De Los Estadísticos: ............................................................................................ 17
2.4. Casos De Estudios: ............................................................................................................. 17
2.4.1. Caso 01: La Media ...................................................................................................... 17
2.4.1.1. Objetivo 01: Intervalo De Confianza Para La Media. ............................................ 17
2.4.1.2. Objetivo 02: Intervalo De Confianza Para La Diferencia Entre Dos Medias ......... 18
2.4.1.3. Objetivo 03: Intervalo De Confianza Para La Diferencia Entre Dos Medias Con
observaciones pareadas. .......................................................................................................... 20
2.4.2. Caso 02: La Proporción: ............................................................................................. 20
2.4.2.1. Objetivo 04: Intervalo de confianza para una proporción....................................... 20
2.4.2.2. Objetivo 05: Para la diferencia entre dos Proporciones. ......................................... 20
2.4.3. Caso 03: La Varianza .................................................................................................. 21
2.4.3.1. Objetivo 06: Intervalo de confianza para Para una varianza: ................................ 21
2.4.3.2. Objetivo 07: Intervalo de confianza para la razón de dos varianzas. ..................... 21
CAPÍTULO III PRUEBAS DE HIPOTESIS. .............................................................................. 22
3.1. Contenido: ........................................................................................................................... 22
3.2. Aspectos Teóricos Básicos ................................................................................................. 23
3.3. Tipos De Errores: ................................................................................................................ 23
3.4. Prueba De Hipotesis Estadística: ........................................................................................ 24
3.4.1. Tipos De Pruebas: ....................................................................................................... 24
3.4.2. Reglas De Decisión: .................................................................................................... 25
3.4.3. Procedimientos de la Prueba de Hipótesis. ................................................................. 25
3.5. Estadísticos Para Cada Prueba De Hipótesis ...................................................................... 28
3.5.1. Caso 01: La Media ...................................................................................................... 28
3.5.1.1. Objetivo 01: Estadísticos Para La Media. .............................................................. 28
3.5.1.2. Objetivo 02: Estadísticos Para La Diferencia De Dos Medias: ............................. 29
3.5.1.3. Objetivo 03: Estadísticos Para La Diferencia De Dos Medias Con Observaciones
Pareadas. 30
3.5.2. Caso 02: Proporciones: ............................................................................................... 31
3.5.2.1. Objetivo 04: Estadísticos Para Una Proporción. ..................................................... 31
6.3.1. Objetivo 06: Pruebas de hipótesis para Para una varianza: ....................................... 76
6.3.2. Objetivo 07: Pruebas de hipótesis para Para la razón de dos varianzas. .................... 76
PARTE III: APLICACIÓNES BÁSICA DE LA INFERENCIA PARAMÉTRICA CON SPSS ...... 77
CAPÍTULO VII : INTERVALOS DE CONFIANZA ................................................................... 78
7.1. Prueba de Normalidad......................................................................................................... 78
7.1.1. Prueba de normalidad.................................................................................................. 78
7.1.2. Proceso en SPSS ......................................................................................................... 78
7.2. Intervalos de Confianza Para la Media: .............................................................................. 81
7.2.1. Aplicación: .................................................................................................................. 81
7.2.1.1. Proceso en SPSS ..................................................................................................... 81
7.2.2. Aplicación: .................................................................................................................. 82
7.3. Intervalos de Confianza Para la Diferencia de Dos Muestras. ............................................ 85
7.3.1. Intervalos de Confianza Para la Diferencia de Dos Muestras Independientes. .......... 85
7.3.1.1. Aplicación 01: ......................................................................................................... 85
7.3.1.2. Proceso en SPSS ..................................................................................................... 85
7.3.2. Intervalos de Confianza Para la Diferencia de Dos Muestras Relacionadas. ............. 87
7.3.2.1. Aplicación: .............................................................................................................. 87
7.4. Intervalo de Confianza Para la Proporción: ........................................................................ 89
7.4.1. Aplicación: .................................................................................................................. 89
7.4.1.1. Transformación de Datos: ....................................................................................... 89
7.4.1.2. Cálculo Del Intervalo de Confianza ........................................................................ 90
7.4.2. Aplicación: .................................................................................................................. 92
7.4.2.1. Transformación de Datos: ....................................................................................... 92
7.4.2.2. Segmentación. ......................................................................................................... 93
7.4.2.3. Cálculo Del Intervalo de Confianza ........................................................................ 94
CAPÍTULO VIII PRUEBAS DE HIPÓTESIS ............................................................................... 96
8.1. Aclaraciones en el SPSS ..................................................................................................... 96
8.2. Aclaraciones Para el Planteamiento de las Hipótesis: ........................................................ 96
8.3. Prueba de Hipótesis Para la Media de Una Muestra: .......................................................... 97
8.3.1. Aclaración: .................................................................................................................. 97
8.3.2. Ejercicio de Aplicación: .............................................................................................. 97
8.3.3. Prueba de Normalidad:................................................................................................ 97
8.3.4. Proceso en SPSS: ........................................................................................................ 97
8.3.5. Aplicación 01: Caso A: ............................................................................................. 100
8.3.5.1. Prueba de Hipotesis............................................................................................... 100
8.3.5.2. Proceso en SPSS: .................................................................................................. 100
8.3.6. Aplicación 02: Caso B: ............................................................................................. 102
8.3.6.1. Prueba de Hipotesis............................................................................................... 102
8.3.6.2. Proceso en SPSS: .................................................................................................. 102
8.3.7. Aplicación 03: Caso C: ............................................................................................. 104
8.3.7.1. Prueba de Hipotesis............................................................................................... 104
8.3.7.2. Proceso En SPSS: ................................................................................................. 104
8.3.8. Aplicación 04: Caso D: ............................................................................................. 106
8.3.8.1. Prueba de Hipotesis............................................................................................... 106
8.3.8.2. Proceso en SPSS: .................................................................................................. 106
8.3.9. Aplicación 05: Caso E: ............................................................................................. 108
8.3.9.1. Prueba de Hipotesis............................................................................................... 108
8.3.9.2. Proceso en SPSS: .................................................................................................. 108
8.4. Prueba de Hipótesis Para 2 Muestras Relacionadas, Pareadas, Emparejadas ................... 110
8.4.1. Ejemplos de Aplicación: ........................................................................................... 110
( xi − x ) 2
siguiente relación di = Z1− /2 DS de donde xi = x Z1− /2 DS con DS = s = , para este tipo
n
de análisis se habla de la distribución de datos.
Ahora si de una población se extrajera “n” muestras, de estas n muestras se obtiene la media de cada una
de ellas, es así que la segunda gráfica considera a cada punto como la media de la muestra i es decir xi , y
el punto promedio viene a ser una media de medias ( x ), podemos ver también que existe una distancia
desde la media de medias hasta cada media d i = x xi , esta diferencia tiene la siguiente relación
s
di = Z1− /2 ES ; de donde xi = x Z1− /2 ES ; ES = , para este tipo de análisis se habla de la
n
distribución muestral de la media.
Muestreo aleatorio.
Población y parámetros.
Muestra aleatoria. Tipos de muestras. Estadísticas
Distribuciones muéstrales.
X −
Z=
n
2. Estadística Z; Muestra grande (n ≥30), varianza poblacional conocida y población normal o no.
2
X −
Z=
n
* Con varianza poblacional desconocida.
1. Estadística Z; Muestra grande (n ≥30), varianza poblacional desconocida ( 2 s 2 ) y población
normal o no.
X −
Z=
s
n
2. Estadística t: Muestra pequeña (n <30), varianza poblacional desconocida ( 2 s 2 ) y población
normal.
X −
t=
s
n
OBSERVACIONES:
Conocida Desconocida
2 2
Muestreo con reposición en una población infinita (o con sustitución en una población finita de tamaño N).
s
x = sx =
n n
Muestreo sin reposición en una población finita o de tamaño N.
N −n s N −n
x = sx =
n N −1 n N −1
N −n
Fc = : Factor de corrección para población finita.
N −1
03. Cuando se desconoce será reemplazado por s , al igual que el valor de será reemplazado por x , a
2 2
+
n1 n2
2. Estadística Z; Muestras grandes (n1 30 y n2 30 ) , varianzas poblacionales conocida (1 y 22 ) y
2
+
n1 n2
12 N1 − n1 22 N 2 − n2 s12 N1 − n1 s22 N 2 − n2
(X −X ) = + s( X1 − X 2 ) = +
1 2
n1 N1 − 1 n2 N 2 − 1 n1 N1 − 1 n2 N 2 − 1
t0 = t(1− /2;n1 + n2 − 2)
OBSEVACIONES:
01. Cuando se desconoce 1 y 2 , será reemplazado por s12 y s22 respectivamente, al igual que el
2 2
valor de 1 − 2 será reemplazado por x1 y x2 (minúsculas) , a no ser que se tenga trabajos anteriores
que especifique los valores de 1 − 2 .
como referencia tomamos el cálculo de probabilidades del caso Con varianzas poblacionales conocidas
para el otro caso es similar.
( X 1 − X 2 ) − ( 1 − 2 ) ( X 1 − X 2 )0 − ( 1 − 2 )
P(( X 1 − X 2 ) ( X 1 − X 2 )0 ) = P = P ( Z Z0 )
2
2
2
2
1
+ 2 1
+ 2
n 1 n 2 n 1 n2
( X 1 − X 2 ) − ( 1 − 2 ) ( X 1 − X 2 )0 − ( 1 − 2 )
P(( X 1 − X 2 ) ( X 1 − X 2 )0 ) = 1 − P = 1 − P ( Z Z0 )
2
2
2
2
1
+ 2 1
+ 2
n1 n2 n1 n 2
( X 1 − X 2 )0 − ( 1 − 2 ) ( X 1 − X 2 ) − ( 1 − 2 ) ( X 1 − X 2 )1 − ( 1 − 2 )
P(( X 1 − X 2 )0 ( X 1 − X 2 ) ( X 1 − X 2 )1 ) = P
2
2
2
2
12 22
1
+ 2 1
+ 2
+
n 1 n 2 n 1 n 2 n 1 n 2
= P ( Z 0 Z Z1 ) = P ( Z Z1 ) − P ( Z Z 0 )
P− p p(1 − p) p(1 − p)
EXPRESIÓN 01: Z = p = ; sp =
p (1 − p ) n n
n
p−P
EXPRESIÓN 02: Z =
P(1 − P)
n
OBSEVACIONES:
Z=
( P1 − P2 ) − ( p1 − p2 )
p1 (1 − p1 ) p2 (1 − p2 ) p1 (1 − p1 ) p2 (1 − p2 )
+ s p1 − p2 = +
n1 n2 n1 n2
;
p1 − p2
Z=
1 1
p (1 − p ) + p = x1 + x2 = p1n1 + p2 n2
n1 n2 ; n1 + n2 n1 + n2
Z=
(P − P ) −( p + p )
1 2 1 2
Con el factor de corrección.
p1 (1 − p1 ) N1 − n1 p2 (1 − p2 ) N 2 − n2
+
n1 N1 − 1 n2 N2 −1
p1 (1 − p1 ) N1 − n1 p2 (1 − p2 ) N 2 − n2
s p1 − p2 = +
n1 N1 − 1 n2 N2 −1
2
s12
12
F=
s22
22
1. Intervalo De Confianza:
Es un rango de valores representado por Li ; Ls en el cuál está contenido el verdadero valor del
parámetro. Por su naturaleza aleatoria, es poco probable que dos muestras de una población en particular
produzcan intervalos de confianza idénticos.
2. Nivel De Confianza:
Llamado también grado de confiabilidad y se denota por “(1-α)”, representa la probabilidad de encontrar
al parámetro dentro del intervalo de confianza.
* P Li ; Ls = P Li Ls = 1 −
3. Nivel De Error:
Se denota por “α” y representa la probabilidad de que el parámetro esté fuera del intervalo de confianza.
* P Li ; Ls = P Li Ls = P Li + P Ls =
4. Gráfica:
5. Estimación De Punto:
Este valor individual estima un parámetro de población usando los datos de la muestra. Se representa en
forma general por .
6. Margen De Error:
El margen de error indica la precisión de la estimación y es la diferencia entre el parámetro y el valor
estimado o estadístico E = − .
* Mientras mayor sea el margen de error, más ancho será el intervalo y menos seguro podrá estar usted
del valor de la estimación de punto.
Requicitos
Estadísticos Pruebas
Normalidad Varianzas Muestra
conocidas >=30
media; proporción; Normal o no
Z diferencia de desconocidas >=30
medias; diferencia normal conocidas <30
de proporciones
t normal desconocidas <30
χ2 Varianza - - -
F Razón de varianzas Normal - -
Linf = x − Zt ; Lsup = x + Z t
n n
Linf = x − Zt ; Lsup = x + Z t
n n
3. Varianza poblacional desconocida s ; Muestra grande (n≥30), y población normal o no.
2 2
s s
Linf = x − Zt ; Lsup = x + Z t
n n
Caso II: uso de la estadística t
s s
Linf = x − tt ; Lsup = x + tt
n n
OBSERVACIONES:
Error estándar:
Conocida Desconocida
2 2
Muestreo con reposición en una población infinita (o con sustitución en una población finita de tamaño N).
s
x = sx =
n n
Muestreo sin reposición en una población finita o de tamaño N.
N −n s N −n
x = sx =
n N −1 n N −1
N −n
Fc =
N − 1 : Factor de corrección para población finita.
tt = t1− /2;n −1
s
ERROR DE ESTIMACIÓN: E = Z t ó tt
n n
2.4.1.2. Objetivo 02: Intervalo De Confianza Para La Diferencia Entre Dos Medias
1. Uso de la estadística Z.
12 22 12 22
Linf = ( x1 − x 2 ) − Z t + ; Lsup = ( x1 − x 2 ) + Z t +
n1 n2 n1 n2
12 22 12 22
Linf = ( x1 − x 2 ) − Z t + ; Lsup = ( x1 − x 2 ) + Z t +
n1 n2 n1 n2
3. Varianzas poblacionales desconocidas 12 s12 ; 22 s22 ; Muestras grandes n1 30; n2 30 y
poblaciónes normales o no.
s12 s22 s2 s2
Linf = ( x1 − x 2 ) − Z t + ; Lsup = ( x1 − x 2 ) + Z t 1 + 2
n1 n2 n1 n2
02. Uso de la estadística t:
1. Varianzas poblacionales desconocidas 12 s12 ; 22 s22 ; Varianzas poblacionales iguales 12 = 22
Muestras pequeñas n1 30; n2 30 , y población normal.
1 1 1 1
Linf = ( x1 − x 2 ) − tt Sc + ; Lsup = ( x1 − x 2 ) + tt Sc +
n1 n2 n1 n2
2
s12 s22
n + n
tt = t (1 − / 2; r ); r = 12 2 2
s12 s22
n
1 + n2
n1 − 1 n2 − 1
El valor de r debe ser un número entero. En caso de no serlo se redondea a su valor más próximo.
OBSERVACIONES:
Error estándar:
Conocida Desconocida
2 2
Muestreo con reposición en una población infinita (o con sustitución en una población finita de tamaño N).
12 22 s12 22
(x −x ) = + s( x1 − x2 ) = +
1 2
n1 n2 n1 n2
Muestreo sin reposición en una población finita o de tamaño N.
12 N1 − n1 22 N 2 − n2 s12 N1 − n1 s22 N 2 − n2
( x −x ) = + s( x1 − x2 ) = +
1 2
n1 N1 − 1 n2 N 2 − 1 n1 N1 − 1 n2 N 2 − 1
N −n N −n
Fc1 = 1 1 ; Fc1 = 2 2
N1 − 1 N 2 − 1 : Factores de corrección para poblaciónes finitas.
2.4.1.3. Objetivo 03: Intervalo De Confianza Para La Diferencia Entre Dos Medias Con
observaciones pareadas.
Di ( D − D)
i
2
Medidas descriptivas: Di = ( xi − yi ); D = i =1
; sD2 = i =1
n n
sD s
Linf = D − tt ; Lsup = x + tt D
n n
tt = t1− /2;n−1
Conocida Desconocida
2 2
Muestreo con reposición en una población infinita (o con sustitución en una población finita de tamaño N).
P(1 − P) p(1 − p)
p = Sp =
n n
Muestreo sin reposición en una población finita o de tamaño N.
P(1 − P) N − n p(1 − p) N − n
p = Sp =
n N −1 n N −1
N −n
Fc = : Factor de corrección para poblaciónes finitas.
N −1
Desconocida
2
p(1 − p)
Sp =
n
p(1 − p) N − n
Sp =
n N −1
p1q1 N1 − n1 p2 q2 N 2 − n2
s( p1 − p2 ) = +
n1 N1 − 1 n2 N 2 − 1
N −n N −n
Fc1 = 1 1 ; Fc2 = 2 2 : Factores de corrección para poblaciónes finitas.
N1 − 1 N2 −1
2.4.3. Caso 03: La Varianza
S12 S12
Linf = F( /2; r2 ; r1 ) ; Lsup = F(1− /2;r2 ;r1 )
S 22 S 22
r1 = n1 − 1; r2 = n2 − 1 : grados de libertad.
3.1. Contenido:
MARCO TEÓRICO:
Hipótesis estadísticas.
Hipótesis simple y compuesta.
Hipótesis nula y alternativa.
Prueba de una hipótesis estadística.
Errores tipo I y tipo II y Nivel de significación.
Región crítica y regla de decisión.
Procedimiento de la prueba de hipótesis
1. Hipotesis: Son proposiciones sobre la población bajo estudio (Parámetros o modelo de distribución),
de las cuales se hacen suposiciones o conjeturas con el fin de verificar su veracidad.
2. Tipos De Hipotesis:
2.1. Hipótesis Estadísticas: Es una proposición o supuesto sobre los parámetros de una o más
poblaciones.
2.2. Hipótesis Simple: Son aquellas hipótesis estadísticas donde la forma de la distribución de la
población, y el valor de su(s) parámetro(s) estan bién especificados.
2.3. Hipótesis Compuesta: Son aquellas hipótesis estadísticas donde la forma de la distribución de la
población, y el valor de su(s) parámetro(s) no estan especificados.
2.4. Hipótesis Nula (H0): Es la hipótesis que se considera provisionalmente como verdadera y cuya
validez será sometida a comprobación experimental, generalmente se formula con la intención de
rechazarla.
* En la hipótesis nula siempre van las relaciones de: =; ó y en los ejercicios se los reconoce por: A
lo más, como máximo, a lo sumo, por lo menos, al menos, como mínimo.
Error Tipo I: Consiste en rechazar la hipótesis nula cuando esta es verdadera con una probabilidad “α".
Error Tipo II: Consiste en aceptar la hipótesis nula cuando esta es falsa con una probabilidad “β"
ESTADO DE LA NATURALEZA
DECISIÓN
H0 Verdadera H0 Falsa
(1-α)
ACEPTAR H0 DESICIÓN CORRECTA β = P(ERROR TIPO II)
(1-β)
RECHAZAR H0 α = P(ERROR TIPO I) DESICIÓN CORRECTA
Nivel De Significancia “α”: Es la probabilidad de cometer el error tipo I, generalmente se toma el valor
de 5% pudiendo tomar valores principalmente entre 1% a 10%.
Nivel De Confianza “1-α”: Es la probabilidad de tomar la decisión correcta.
Generalmente varía entre el 80 y el 90%, lo que significa que la probabilidad de cometer un error beta
varía entre el 20 y el 10%.
Es una regla o procedimiento para decidir si se aceptar o rechaza una hipotesis estadística.
Decisión Por Medio del Estadístico Calculado: Consiste en comparar el estadístico calculado con
el punto crítico, donde si dicho estadístico calculado cae dentro de la región de rechazo entonces se
rechazará la hipótesis nula en caso contrario se aceptará.
Decisión Con el p-value: Es la probabilidad que debe ser comparada con el valor de “” para poder
aceptar o rechazar la hipótesis nula, este valor es usado frecuentemete con los softwares.
Comparación Desición
H0 : ; H0 : ; H0 : =
H1 : ; H1 : ; H1 : ó
Recordando que la igualdad irá siempre en la hipódesis nula.
COLA DERECHA:
COLA IZQUIERDA:
5) Cálculo del valor del estadístico para cada prueba a partir de los datos de la muestra Epc .
Son los cálculos numéricos especificados en los casos para los estadísticos en la prueba de hipótesis y se
tratan en el apartado 3.5.
6) Toma de decisión:
Se rechazará la hipótesis H0 si el valor del estadístico de la prueba está dentro de la región crítica. En
caso contrario, no rechazar H0.
7) Conclusiones:
X −
Zc =
n
Estadística Z; Muestra grande (n ≥30), varianza poblacional conocida y población normal o no.
2
X −
Zc =
n
Con varianza poblacional desconocida.
Estadística Z; Muestra grande (n ≥30), varianza poblacional desconocida ( s ) y población
2 2
normal o no.
X −
Zc =
s
n
Estadística t: Muestra pequeña (n ≤30), varianza poblacional desconocida ( s ) y población
2 2
normal.
X −
tc =
s
n
Observaciones:
Conocida Desconocida
2 2
Muestreo con reposición en una población infinita (o con sustitución en una población finita de tamaño N).
s
x = sx =
n n
Muestreo sin reposición en una población finita o de tamaño N.
N −n s N −n
x = sx =
n N −1 n N −1
N −n
Fc = : Factor de corrección para población finita.
N −1
12 N1 − n1 22 N 2 − n2 s12 N1 − n1 s22 N 2 − n2
( x −x ) = + s( x − x ) = +
1 2
n1 N1 − 1 n2 N 2 − 1 1 2
n1 N1 − 1 n2 N 2 − 1
t0 = t(1− /2;n1 + n2 − 2)
3.5.1.3. Objetivo 03: Estadísticos Para La Diferencia De Dos Medias Con Observaciones
Pareadas.
Di ( D − D) i
2
Medidas descriptivas: Di = ( xi − yi ); D = i =1
; sD2 = i =1
n n
Varianza poblacional desconocida de la diferencia D2 sD2 : Muestra grande (n≥30), y población normal.
D − ( 1 − 2 )
Z=
D n
Caso II: uso de la estadística t
D − ( 1 − 2 )
T=
SD n
D
T= ; (con H 0 : 1 − 2 = 0)
SD n
Z=
( P1 − P2 ) − ( p1 + p2 )
p1 (1 − p1 ) p2 (1 − p2 ) p1 (1 − p1 ) p2 (1 − p2 )
+ s p1 − p2 = +
n1 n2 n1 n2
;
p1 − p2
Z=
1 1
p (1 − p ) + p = x1 + x2 = p1n1 + p2 n2
n1 n2 ; n1 + n2 n1 + n2
Z=
(P − P ) −( p + p )
1 2 1 2
Con el factor de corrección.
p1 (1 − p1 ) N1 − n1 p2 (1 − p2 ) N 2 − n2
+
n1 N1 − 1 n2 N2 −1
p1 (1 − p1 ) N1 − n1 p2 (1 − p2 ) N 2 − n2
s p1 − p2 = +
n1 N1 − 1 n2 N2 −1
(n − 1) s 2
2 =
(2n−1)
s12
F=
s22
Ejercicio 01:
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en
forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad
de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas.
Solución:
PASO 01: DATA (no contamos con data)
PASO 02: PRUEBA DE NORMALIDAD (del problema sabemos que tiene una distribución
Normal)
PASO 03: DATOS:
= 800horas; = 40horas; n = 16 focos; X 0 = 775 horas
Pide: La probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos
de 775 horas.
P ( X 775 horas )
X0 − 775 − 800
Z0 = = = −2.5
40
n 16
X − 775 − 800
P ( X 775 ) = P = P ( Z −2.5 ) = 0.00621
40
n 16
P ( X 775 ) = 0.00621
Ejercicio 02:
Una empresa eléctrica se dedica a la fábrica de focos y desean saber la duración promedio, si
anteriormente se realizaron trabajos previos donde, la media era de 800 horas y desviación estándar
de 40 horas. Encuentre la probabilidad de que una muestra aleatoria cumpla ese requisito, los datos
se muestran en la tabla 01.
Tabla Nº01:
Data
Nº Duración
1 850
2 760
3 800
4 820
5 840
6 860
7 760
8 780
9 790
10 795
11 800
12 790
13 795
14 800
15 800
16 800
Solución:
PASO 01: Data en la Tabla Nº01
PASO 02: PRUEBA DE NORMALIDAD
Cuadro Nº02:
Prueba de Normalidad de la Duración de Focos
Pruebas de normalidad
Kolmogorov-Smirnov Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Duración promedio de focos
.285 16 .001 .902 16 .085
Cálculos:
n
x i
850 + 760 + 800 + ...... + 800 + 800
x= i =1
= = 802.5
n 16
Pide: La probabilidad de que una muestra aleatoria de 16 focos cumpla el requisito 802.5 horas.
P ( X 802.5 horas )
.
X − 802.5 − 800
P ( X 802.5 ) = P = P ( Z 0.25 ) = 0.598706
40
n 16
P ( X 775 ) = 0.598706
Ejercicio 03:
Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una
media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras
aleatorias de tamaño 25 sin reemplazo de esta población, determine:
El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
El número de medias muestrales que caen por debajo de 172 centímetros.
Solución:
Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin
reemplazo, por lo que se tendrá que agregar el factor de corrección.
X − 172.5 − 174.5
Z1 = = = −1.467
N −n 6.9 1000 − 25
n N −1 25 1000 − 1
X − 175.8 − 174.5
Z2 = = = 0.953553
N −n 6.9 1000 − 25
n N −1 25 1000 − 1
X − 172 − 174.5
Z3 = = = −1.83376
N −n 6.9 1000 − 25
n N −1 25 1000 − 1
Parte a:
172.5 − 174.5 X − 175.8 − 174.5
P (172.5 X 175.8 ) = P
6.9 1000 − 25 N −n 6.9 1000 − 25
25 1000 − 1 n N −1 25 1000 − 1
= P ( Z1 Z Z 2 )
= P ( −1.467 Z 0.953553)
= P ( Z 0.953553) − P ( Z −1.467 )
= 0.829845 − 0.071187
P (172.5 X 175.8 ) = 0.758657
Número de muestras que están dentro de este intervalor será: 200x0.758657=151.7315 es decir
aproximadamente 152 muestras.
Parte b:
X − 172 − 174.5
P ( X 172 ) = P = P ( Z 3 −1.83376 )
N −n 6.9 1000 − 25
n N −1 25 1000 − 1
P ( X 172 ) = 0.033345
El número de medias muestrales que caen por debajo de 172 centímetros será (0.033345)(200)=
6.669034 que aproximadamente es 7 medias muestrales.
Ejercicio 04:
Una empresa requiere la implementación de sistema de facturación, para lo cual requiere la
propuesta de desarrolladores en cuanto al tiempo de entrega, los datos se muestran en la tabla 01.
Tabla 01:
Data, propuesta de desarrolladores del tiempo de entrega.
Entrega
Nº (días) Nº Entrega Nº Entrega
1 90 13 64 25 58
2 55 14 72 26 63
3 65 15 73 27 64
4 50 16 75 28 72
5 54 17 77 29 73
6 56 18 79 30 75
7 80 19 79 31 58
8 89 20 81 32 63
9 50 21 91 33 58
10 53 22 92 34 63
11 58 23 96
12 63 24 96
Solución:
Cuadro Nº02:
Prueba de Normalidad para la entrega
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Tiempo de entrega
.147 34 .062 .941 34 .064
a. Corrección de significación de Lilliefors
De acuerdo al cuadro Nº 02 podemos observar que la prueba de Kolmogorov-Smirnov muestra un valor de p o sig. igual
a 0.062 mayor al nivel de significancia α =0.05, lo cual muestra que los datos provienen de una distribución normal.
PASO 03: DATOS:
=?
=?
n = 34
X 0 = 60
Cálculos:
n
x i
90 + 55 + 65 + ...... + 58 + 63
x= i =1
= = 70.0929316dias
n 34
n
(x − x ) i
2
(90 − 70.09) 2 + (55 − 70.09) 2 + ... + (63 − 70.09) 2
s2 = i =1
= = 187.280749
n 34
s = s 2 = 187.280749 = 13.6850557 días
Por tanto
x = 70.1470588 días
2 s 2 = 187.280749
s = 13.6850557días
Pide: P ( X 60)
X − 70.0929316 − 60
P( X 60) = P( ) = P( Z −4.280497)
s 13.7487296
n 34
−6
P( X 60) = 9.3238110
Ejercicio 05:
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela
primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños
como para niñas los pesos siguen una distribución normal. El promedio de los pesos de todos los
niños de sexto grado de esa escuela es de 45.36kg y su desviación estándar es de 6.415kg, mientras
que el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 38.56kg y su
desviación estándar es de 5.555kg. Si x1 representa el promedio de los pesos de 20 niños y x2 es el
promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el promedio de
los pesos de los 20 niños sea al menos 9kg más grande que el de las 25 niñas.
Solución:
PASO 01: DATA (no contamos con data)
PASO 02: PRUEBA DE NORMALIDAD (del problema sabemos que las dos muestras tienen una
distribución Normal)
PASO 03: DATOS:
1 = 45.36kg ; 2 = 38.56kg ;
1 = 6.415kg ; 2 = 5.555kg
n1 = 20 niños; n2 = 25niñas
X 1 − X 2 = 9kg
Pide:
La probabilidad de que el promedio de los pesos de los 20 niños sea al menos 9kg más grande que el
de las 25 niñas.
P ( x1 − x2 9 )
P ( x1 − x2 9 ) = 1 − P ( x1 − x2 9 )
( X 1 − X 2 ) − ( 1 − 2 ) 9 − (45.36 − 38.56)
= 1− P
2
2
6.4152 5.5552
1
+ 2
+
n1 n2 20 25
= 1 − P ( Z 1.212543)
= 1 − 0.887348
P ( x1 − x2 9 ) = 0.112652
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos
9kg más grande que el de la muestra de las niñas es 0.112652.
Ejercicio 06:
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación
estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una desviación
estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía
A tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la
compañía B.
Solución:
Datos:
PASO 01: DATA (no contamos con data)
PASO 02: PRUEBA DE NORMALIDAD (del problema no especifica la distribución Normal)
PASO 03: DATOS:
A = 7.2 años; B = 6.7 años;
A = 0.8años; B = 0.7 años
nA = 34 tubos; nB = 40 tubos
(X A − X B )0 = 1
Pide:
Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A tenga una vida
promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la compañía B.
P( X A − X B 1)
P ( X A − X B 1) = 1 − P ( X A − X B 1)
( X A − X B ) − ( A − B ) 1 − (7.2 − 6.7)
= 1− P
2
2
0.82 0.7 2
A
+ B
+
nA nB 34 40
= 1 − P ( Z 2.836447 )
= 1 − 0.997719
P ( X A − X B 1) = 0.002281
Ejercicio 07:
Se prueba el rendimiento en km/l de 2 tipos de gasolina, encontrándose una desviación estándar de
1.23km/L para la primera gasolina y una desviación estándar de 1.37km/l para la segunda gasolina;
se prueba la primera gasolina en 35 autos y la segunda en 42 autos.
¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L
que la segunda gasolina?
¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y
0.83km/L a favor de la gasolina 1?.
Solución:
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones,
por lo que se supondrán que son iguales.
Datos:
PASO 01: DATA (no contamos con data)
PASO 02: PRUEBA DE NORMALIDAD (del problema no especifica la distribución Normal)
PASO 03: DATOS:
1 = 2 ( SUPONEMOS )
1 = 1.23km / l; 2 = 1.37 km / l
n1 = 35 autos; n2 = 42 autos
(X 1 − X 2 )0 = 0.45
X 1 − X 2 0.45km / l
0.65 X 1 − X 2 0.83
Pide:
P ( X 1 − X 2 0.45 )
P ( 0.65 X 1 − X 2 0.83)
Pregunta a:
P ( X 1 − X 2 0.45 ) = 1 − P ( X 1 − X 2 0.45 )
( x1 − x2 ) − ( 1 − 2 ) 0.45 − 0
= 1− P
2
1 2
2 2 2
1.23 1.37
+ +
n 1 n2 35 42
= 1 − P ( Z 1.517693)
= 1 − 0.935454
P ( X 1 − X 2 0.45 ) = 0.064546
Pregunta b:
0.65 − 0 ( x1 − x2 ) − ( 1 − 2 ) 0.83 − 0
P ( 0.65 X 1 − X 2 0.83) = P
2
2
1.23 + 1.37
2
1 2
2 2 2
1.23 1.37
35 + +
42 n1 n2 35 42
= P ( 2.192223 Z 2.799301)
= P ( Z 2.799301) − P ( Z 2.192223)
= 0.997439 − 0.985818
P ( 0.65 X 1 − X 2 0.83) = 0.011621
Ejercicio 08:
Una empresa de tecnología, desea saber la probabilidad de incrementar el presupuesto en el curso de
desarrollo web o de python de acuerdo a la audiencia captada en los talleres en vivo realizados en el
mes de enero.
Tabla 01:
Base de datos de la la audiencia captada en los talleres en vivo:
TALLERES
DESARROLLO
Nº WEB PYTHON
A B
1 15 28
2 85 95
3 120 100
4 150 130
5 140 150
6 145 160
7 190 189
8 180 175
9 170 185
10 199 198
11 209 205
12 208
13 230
14 250
15 254
16 245
F Sig.
Cantidad Se asumen
.282 .600
de varianzas iguales
audiencia No se asumen
varianzas iguales
De acuerdo a la tabla 03 y al valor de sig o p=0.600 podemos afirmar que los grupos presentan
varianzas estadísticamente iguales.
Cálculos:
n1
x i
15 + 85 + ... + 209
x1 = i =1
= = 145.78
n1 11
n1
(x − x ) i 1
2
(15 − 145.78) 2 + (85 − 145.78) 2 + ... + (209 − 145.78)2
s12 = i =1
= = 3205.618182
n1 11
s1 = 56.6181789
n2
x i
28 + 95 + .. + 245
x2 = i =1
= = 175.13
n2 16
n1
(x − x ) i 2
2
(28 − 175.13) 2 + (95 − 175.13) 2 + .. + (245 − 175.13) 2
s22 = i =1
= = 3940.91667
n2 16
s2 = 62.7767207
Datos:
x1 = 145.78; s12 = 3205.618182; s1 = 56.6181789; n1 = 11
x2 = 175.13; s22 = 3940.91667; s2 = 62.7767207; n2 = 16
Interés del investigador
X 1 − X 2 60
X 1 − X 2 75
50 X 1 − X 2 80
Pide:
P ( X 1 − X 2 60 )
P ( X 1 − X 2 75 )
P ( 50 X 1 − X 2 80 )
Estadísitico:
( x1 − x2 ) − ( 1 − 2 )
t= ; t0 = t(1− /2;n1 + n2 −2)
s12 s22
+
n1 n2
Pregunta a:
( X − X 2 ) − ( 1 − 2 ) 60 − (145.78 − 175.78)
P ( X 1 − X 2 60 ) = P 1
s12 s22 3205.618182 3940.91667
+
+
n1 n2 11 16
= P ( t 3.855187501)
P ( X 1 − X 2 60 ) = 0.99964101
Ejercicio 09:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma
una muestra aleatoria de 800 estudiantes.
Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea
menor que 0.55.
Solución:
Datos:
PASO 01: DATA (no contamos con data)
PASO 03: DATOS:
P = 0.60; Q = 0.40; p0 = 0.55; n = 800 Est
P( p 0.55)
p−P
Estadístico a utilizar: Z =
P(1 − P)
n
1 1
p− − 0.60 0.55 − − 0.60
2(800) 2(800)
P ( p 0.55) = P ( )
0.6(1 − 0.6) 0.6(1 − 0.6)
800 800
P ( p 0.55) = P ( Z −2.922835738) = 0.0017343
Ejercicio 10:
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden
presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen
tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el medicamento,
encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan
una reacción adversa, exceda el 4%.
solución:
p−P
Estadístico a utilizar: Z =
P(1 − P)
n
1 1
p+ − 0.03 0.04 + − 0.03
2(150) 2(150)
P ( p 0.04) = P( )
0.03(1 − 0.03) 0.03(1 − 0.03)
150 150
P ( p 0.04) = P ( Z 0.957277545) = 1 − P ( Z 0.957277545)
P ( p 0.04) = 1 − 0.83078641 = 0.16921359
Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad del 17% de
que al tomar una muestra de 150 personas se tenga una proporción mayor de 0.04 presentando una
reacción adversa.
Ejercicio 11:
Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una firma es de
4%, encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:
a. Menos del 3% de los componentes defectuosos.
b. Más del 1% pero menos del 5% de partes defectuosas.
Solución:
PASO 01: DATA (no contamos con data)
PASO 03: DATOS:
P = 0.04; Q = 0.96; n = 60Componentes
p0 = 0.03; p1 = 0.01; p2 = 0.05;
Pide :
a. P( p 0.03)
b. P(0.01 p 0.05)
p−P
Estadístico a utilizar: Z =
P(1 − P)
n
Para a:
1 1
p− − 0.04 0.03 − − 0.04
2(60) 2(60)
P( p 0.03) = P( )
0.04(1 − 0.04) 0.04(1 − 0.04)
60 60
P( p 0.03) = P( Z −0.72468863) = 0.23432154
La probabilidad de que en una muestra de 60 artículos exista una proporción menor de 0.03 artículos
defectuosos es de 0.2327.
Para b:
1 1 1
0.01 + − 0.04 p − − 0.04 0.05 − − 0.04
2(60) 2(60) 2(60)
P(0.01 p 0.05) = P ( )
0.04(1 − 0.04) 0.04(1 − 0.04) 0.04(1 − 0.04)
60 60 60
= P(−0.8564502 Z 0.065880785) =
= P( Z 0.065880785) − P( Z −0.8564502)
= 0.52626363 − 0.1958744
P(0.01 p 0.05) = 0.330389227
Ejercicio 12:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones
sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12%
de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres
adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión
sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de
hombres a favor sea al menos 3% mayor que el de las mujeres.
Solución:
PASO 01: DATA (no contamos con data)
PASO 03: DATOS:
P1 = 0.12; Q1 = 0.88; n1 = 100 varones
P2 = 0.10; Q2 = 0.90; n2 = 100 Mujeres
( P1 − P2 )0 = 0.03
Pide :
P(( P1 − P2 ) 0.03)
( p1 − p2 ) − ( P1 − P2 )
Estadístico a utilizar: Z =
P1 (1 − P1 ) P2 (1 − P2 )
+
n1 n2
1 1
( P1 − P2 ) − − (0.12 − 0.10) 0.03 − − (0.12 − 0.10)
P (( P1 − P2 ) 0.03) = P 2 100 2 100
0.12(1 − 0.12) 0.10(1 − 0.10) 0.12(1 − 0.12) 0.10(1 − 0.10)
+ +
100 100 100 100
= P( Z 0.113053908)
= 1 − P( Z 0.113053908) = 1 − 0.54500609
P (( P1 − P2 ) 0.03) = 0.454993908
Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despedidos
entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo menos dos años.
Supóngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los
empleados despedidos entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral
de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la
encuesta de Boston College, en 5% o más?
Solución:
En este ejercicio se cuenta únicamente con una población, de la cual se están extrayendo dos
muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas dos muestras,
por lo que se debe de utilizar la distribución muestral de proporciones con P1= P2, ya que es una
misma población.
Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de trabajadores
despedidos entre 1979 y 1984 que estuvieron desempleados por un período de por lo menos dos
años, sólo se conoce la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa
proporción.
En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se necesita
saber las proporciones de las poblaciones, las cuales en este ejercicio las desconocemos, por lo que
se utilizará el valor de 0.20 como una estimación puntual de P. En el siguiente tema se abordará el
tema de estimación estadística y se comprenderá el porque estamos utilizando de esa manera el dato.
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la probabilidad
de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del
porcentaje obtenido en la encuesta de Boston College, en 5% o más?, la palabra difiera quiere decir
que puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se
tendrán que calcular dos áreas en la distribución y al final sumarlas.
Datos:
Solución:
PASO 01: DATA (no contamos con data)
PASO 03: DATOS:
P1 − P2 p1 − p2 = 0.2
n1 = 320; n2 = 320 Mujeres
( P1 − P2 ) 0 = 0.05
Pide :
P ( P1 − P2 0.05)
( p1 − p2 ) − ( P1 − P2 )
Estadístico a utilizar: Z =
P1 (1 − P1 ) P2 (1 − P2 )
+
n1 n2
1 1 1 1
( P1 − P2 ) − − (0) 0.05 − − (0) −0.05 + − (0) ( P1 − P2 ) − − (0)
=P 2 320 2 320 + P 2 320 2 320
0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20) 0.20(1 − 0.20)
+ + + +
320 320 320 320 320 320 320 320
= P( Z 1.531728242) + P(−1.531728242 Z )
= 1 − P( Z 1.531728242) + P(−1.531728242 Z )
= 1 − 0.93720524 + 0.06279476
P( P1 − P2 0.05) = 0.12558951
La probabilidad de que su proporcion muestral de trabajadores sin empleo durante por lo menos dos
años, difiera del porcentaje obtenido en la encuesta de Boston College, en 0.05 o más es de 0.1260.
Ejercicio14:
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5
objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada
máquina:
¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la
máquina 1 en por lo menos 0.10?
¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la
máquina 2 en por lo menos 0.15?
Solución:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
p(p2-p1 0.10) = ?
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber como se va
a comportar la varianza o desviación estándar en una muestra que proviene de una distribución
normal.
Ejercicio 15:
Suponga que los tiempos requeridos por un cierto autobús para alcanzar uno de sus destinos en una
ciudad grande forman una distribución normal con una desviación estándar =1 minuto. Si se elige
al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor
que 2.
Solución:
PASO 01: DATA no se cuenta con una data
PASO 02: NORMALIDAD (del problema se sabe que los datos tienen una distribución normal)
PASO 03: DATOS:
= 1min; n = 17 tiempos; s02 = 2
Pide:
P(s 2 s02 ) ó P(s 2 2)
(n − 1) s 2
Estadístico a utilizar es: n2−1 =
2
(17 − 1) s 2 (17 − 1) 2
P( ) = P ( n2−1 32)
(1) 2 (1) 2
= 1 − P ( n2−1 32)
= 1 − 0.99000022
= 0.009999781
Ejercicio 16:
(n − 1) s 2
Estadístico a utilizar es: n2−1 =
2
Para a:
(25 − 1) s 2 (25 − 1) 9.1
P( s 2 9.1) = P ( )
6 6
= P( n2−1 36.4)
= 1 − P( n2−1 36.4)
= 1 − 0.9498299
P( s 2 9.1) = 0.050170102
Para b:
(25 − 1) 3.462 (25 − 1) s 2 (25 − 1) 10.754
P(3.462 s 10.754) = P (
2
)
6 6 6
= P(13.848 n2−1 43.016)
= P( n2−1 43.016) − P( n2−1 13.848)
= 0.99009462 − 0.04999081
P(3.462 s 10.754) = 0.940103809
2
Ejercicio 17:
Si s12 y s22 son las varianzas muestrales de muestras aleatorias independientes de tamaños
n1 = 10 y n2 = 20 , tomadas de poblaciones normales que tienen las mismas varianzas, encuentre
s2
P 12 2.42
s2
Solución:
Primero se establecen los grados de libertad. Como en el numerador está la población uno y en el
denominador la población dos, entonces los grados de libertad uno equivale a 10-1=9 y los grados de
libertad dos a 20-1=19.
Ejercicio 18:
Si s12 y s22 representan las varianzas de las muestras aleatorias independientes de tamaño n1= 25 y
n2 = 31, tomadas de poblaciones normales con varianzas 12 = 10; 22 = 15 , respectivamente,
s2
encuentre P 12 1.26 .
s2
Solución:
s12
12
Estadístico a utilizar es: F =
s22
22
s2 s 2 / 2 1.26 / 12 s12 /10 1.26 /10
P 12 1.26 = P 12 12 = P 2
2
s 2 2
s / 1/ 2
2 2
s /15 1/15
= P ( F( v1;v 2) 1.89 )
= 1 − P ( F( v1;v 2) 1.89 )
= 1 − 0.95036718
s2
P 12 1.26 = 0.049632815
s2
SOLUCIÓN:
Paso 01: data (no tenemos)
Paso 02: no hay prueba de normalidad dado que n>30
Paso 03: datos
= 0.05
n = 40; x = 60 min; = 15 min;1 − = 0.95 → = 0.025
2
1 − 2 = 0.975
Fórmua de los límites del intervalo:
Linf = x − Z t ; Lsup = x + Z t
n n
Determinación de Z t :
Zt = Z0.025 = 1.96
Intervalo de confianza:
15
Linf = x − Z t = 60 − 1.95996398 = 55.3515
n 40
15
Lsup = x + Z t = 60 + 1.95996398 = 64.6485
n 40
El parámetro 55.3515;64.6485 con un nivel de confianza del 95%
Conclusión:
Por lo tanto diremos que la duración media en el que una secretaria necesita para desplazarse del
trabajo su casa hasta es de 55.35 a 64.64 minutos con una seguridad del 95%.
Se hace un estudio de mercado, para determinar la venta promedio de una nueva marca de gaseosas,
durante un mes en una cadena de tiendas. Los resultados para una muestra de 36 tiendas indicaron ventas
promedio de S/1000 con una desviación estándar de S/120. Calcule e interprete un intervalo de confianza
del 95% para la verdadera venta promedio µ en la cadena de tiendas.
Solución:
Paso 01: data (no tenemos)
Paso 02: prueba de normalidad
Paso 03: datos
2 = 0.025
n = 36; x = 1000; s = 120;1 − = 0.95; = 0.05 →
1 − = 0.975
2
Fórmua de los límites del intervalo:
s s
Linf = x − Zt ; Lsup = x + Z t
n n
Determinación de Z t :
1 − = 0.95; = 0.05 → = 0.025 y 1 − = 0.975
2 2
Zt = 1.95996398
Cálculo del I:
s 120
Linf = x − Z t = 1000 − 1.95996398 = 960.80072
n 36
s 120
Lsup = x + Z t = 1000 + 1.95996398 = 1039.19928
n 36
960.80072;1039.19928 ó
960.8;1039.2
Solución:
Paso 01: DATA (No se cuenta con data porque el problema es directo)
Paso 02: NORMALIDAD (el ejercicio asume la normalidad de los datos)
Paso 03: DATOS
Animales infectados : n1 = 13 X 1 = 972,1 s1 = 245,1
Animales no infectados : n2 = 16 X 2 = 843,4 s2 = 251,2
Determinación de Ft :
1 − = 0.99; = 0.01 → = 0.005 y 1 − = 0.995
2 2
1 1 1 1
Linf = ( x1 − x 2 ) − tt Sc + y Lsup = ( x1 − x 2 ) + tt Sc +
n1 n2 n1 n2
Si el intervalo contuviera sólo números negativos, estaríamos diciendo que la diferencia entre el número medio de
células rojas de P1 y P2 es negativa, o equivalentemente que el número medio de células rojas de P1 (lagartos infectados
con malaria) es inferior al de P2 (lagartos no infectados). En ese caso, se podría afirmar que la malaria reduce el número
de células rojas. Pero vemos que el intervalo contiene tanto números negativos como positivos, con lo cuál tan
aceptables es que sea mayor la media de los infectados, como la de los no infectados. En consecuencia, NO se puede
afirmar que la malaria reduzca el número de células rojas.
En un estudio sobre el efecto del dióxido de azufre como agente contaminante del aire, se
dispuso de cierto tipo de semillas de habichuelas en cámaras que se mantuvieron a lo largo
del experimento abiertas por su parte superior. Se asignaron aleatoriamente seis de esas
cámaras a un tratamiento consistente en fumigarlas con dióxido de azufre, y en las otras seis
no se efectuó ningún proceso. Transcurrido un mes, se registraron las cosechas totales (en kg)
de habichuelas en cada cámara, obteniéndose los siguientes datos:
TABLA 01
Solución:
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Con_Diox .163 6 ,200* .981 6 .956
Sin_Diox .266 6 ,200* .843 6 .139
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
CÁLCULOS PREVIOS:
x i
1.52 + 1.85 + 1.39 + 1.15 + 1.30 + 1.57
x1 = i =1
= = 1.463333333
n 6
n
x i
1.49 + 1.55 + 1.21 + 0.65 + 0.76 + 0.69
x2 = i =1
= = 1.058333333
n 6
n
(x − x ) i 1
2
(1.52 − 1.4633) 2 + (1.85 − 1.4633) 2 + .... + (1.57 − 1.4633) 2
s12 = i =1
= = 0.058866667
n −1 6 −1
n
(x − x ) i 1
2
(1.49 − 1.058) 2 + (1.55 − 1.058) 2 + ... + (0.69 − 1.058) 2
s 22 = i =1
= 0.168496667
n −1 6 −1
s1 = 0.058866667 = 0.242624538
s 2 = 0.168496667 = 0.410483455
Determinación de Ft :
1 − = 0.90; = 0.10 → = 0.05 y 1 − = 0.95
2 2
s12 s22 s2 s2
Linf = ( x1 − x 2 ) − tt + ; Lsup = ( x1 − x 2 ) + tt 1 + 2
n1 n2 n1 n2
2
s12 s22 0.058866667 0.168496667
2
n n + +
2
6 6
r= 1
2 2
= 2 2
= 8.11360783 8
s12 s22 0.058866667 0.168496667
n
+
1 + n2 6 6
n1 − 1 n2 − 1 6 −1 6 −1
tt = t(1− /2;r ) = t(0.95;8) = 1.85954804
Cálculo de I:
5.1.3. Objetivo 03: Intervalo de confianza para la diferencia entre dos medias con
observaciones pareadas.
Se realizó un estudio para comparar el contenido en sodio en el plasma de las focas peleteras
australes jóvenes, con el nivel de sodio en la leche de las focas. Se obtuvieron las siguientes
observaciones sobre el contenido de sodio (en minimoles) por litro de leche (o plasma) en 10 focas
aleatoriamente seleccionadas:
Tabla 01:
Data
Sujeto Leche Plasma
1 93 147
2 104 157
3 95 142
4 81,5 141
5 95 142
6 95 147
7 76,5 148
8 80,5 144
9 79,5 144
10 87 146
Halle un intervalo de confianza del 95% para la diferencia de niveles de sodio en los dos
líquidos corporales. ¿Hay pruebas de que exista alguna diferencia? ¿En qué sentido?
Solución:
Observaciones:
Sea X el nivel de sodio en la Leche, y sea Y el nivel de sodio en el plasma.
Queremos estudiar la diferencia de las medias de Y, y X.
Sin embargo, como los valores que tenemos para ambas provienen de los mismos individuos,
en principio los valores de X e Y NO pueden considerarse independientes. Por lo tanto,
estamos ante el caso de datos emparejados.
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
VAR00001 .152 10 ,200* .952 10 0.696
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
De acuerdo al estadístico de Shapiro-Wilk y su valor p =0.696 mayor a α= 0.05, concluimos que los
datos provienen de una distribución normal
En consecuencia, formamos una nueva variable, D=X-Y, cuyos datos corresponden a las diferencias
entre los valores de X e Y; es decir:
Y=Sodio en X=Sodio en
Sujeto D =X-Y
Leche plasma
1 93 147 54
2 104 157 53
3 95 142 47
4 81,5 141 59,5
5 95 142 47
6 95 147 52
7 76,5 148 71,5
8 80,5 144 63,5
9 79,5 144 64,5
10 87 146 59
Total: 887 1458 571
D i
54 + 53 + 47 + ... + 64.5 + 59
D= i =1
= = 57.1
n 10
n
( D − D) i
2
(54 − 57.1) 2 + (53 − 57.1) 2 + ... + (59 − 57.1) 2
s 2Di = i =1
= = 63.21
n −1 10 − 1
s Di = 7.95054156
sD s
Linf = D − tt ; Lsup = D + tt D ; tt = t(1− /2;n −1)
n n
De los resultados observados y del intervalo de confianza al 95% podemos decir que la
presencia del sodio en el plasma es claramente superior.
Parte b:
n = ? ; E = p − P = 5%; = 5%;
Z /2 = Z 0.025 = −1.95996398 → Z t = 1.95996398
Z 2 pq (1.95996398) 0.40 0.60
n0 = = = 368.780047 369
E2 0.052
Una empresa de estudios de mercado quiere estimar las proporciones de hombres y mujeres que
conocen un producto promocionado a escala nacional, en una muestra aleatoria de 100 hombres y
200 mujeres se determina que 20 hombres y 60 mujeres están familiarizados con el artículo indicado.
a) Calcular el intervalo de confianza de 95 % para la diferencia de proporciones de hombres y
mujeres que conocen el producto. b) ¿Son iguales las proporciones de hombres y mujeres que
conocen el producto?
solución:
datos:
n1 = 100; x1 = 20; n2 = 200; x2 = 60; = 0.05
Z /2 = Z 0.025 = −1.95996398 → Z t = 1.95996398
20 60
p1 = = 0.20 y p2 = = 0.30
100 200
cálculo del intervalo I
p1q1 p2 q2 0.20 0.80 0.30 0.70
Linf = ( p1 − p2 ) − Z t + = (0.20 − 0.30) − 1.95996398 +
n1 n2 100 200
Linf = −0.20089532
p1q1 p2 q2 0.20 0.80 0.30 0.70
Lsup = ( p1 − p2 ) + Z t + = (0.20 − 0.30) + 1.95996398 +
n1 n2 100 200
Lsup = 0.00089532
P1 − P2 −0.20089532;0.00089532
5.3.2. Objetivo 07: Intervalo de confianza para Para la razón de dos varianzas.
Se realizaron 16 ensayos para dos tipos de tratamientos X e Y, obteniéndose las siguientes varianzas
muestrales sx2 = 35 y s y2 = 10 , determine el intervalo de confianza al 95% para la razón de estas.
¿Son iguales las varianzas poblacionales de X e Y?
Solución:
Datos:
sx2 = 35 y s y2 = 10; n1 = n2 = 16; = 5%
Cálculo del intervalo I
S12 S12
Linf = 2 F( /2;r2 ;r1 ) ; Lsup = 2 F(1− /2;r2 ;r1 )
S2 S2
observaciones pareadas.
6.3.2. Objetivo 07: Pruebas de hipótesis para Para la razón de dos varianzas.
Paso 03:
Como la cantidad de datos son mayores que 30, trabajamos con la prueba de kolmogorov-smirnov, con
sig=p=0.200>0.05 y 0.200>0.05 lo que comprueba que proviene de una población normal.
Paso 02: en el cuadro click en comparar los grupos /introducimos la variable género a (grupos basados en:)/aceptar
Paso 06:
Como la cantidad de datos son mayores que 30, trabajamos con la prueba de kolmogorov-smirnov, con
sig=p=0.200>0.05 y 0.200>0.05 en letras, lo que comprueba que proviene de una población normal cada grupo y por
otra parte también para el grupo de ciencias con sig=p=0.200>0.05 y 0.200>0.05 que comprueba que proviene de una
población normal cada grupo.
7.2.1. Aplicación:
Se desea obtener una estimación del puntaje medio de aptitud en ciencias de todos los estudiantes
Paso 02: Ponemos la variable puntaje en la prueba ciencias a variables para contrastar/ aceptar
De la base de datos analizada se puede determinar que la media poblacional se encuentra en un intervalo que
va desde 13.9367 hasta 14.9291 con un nivel de significacia del 5%, es decir 13.9367;14.9291
7.2.2. Aplicación:
Se desea obtener una estimación del puntaje medio de aptitud en letras para hombres y mujeres por separados.
Paso 02: en el cuadro click en comparar los grupos /introducimos la variable género a (grupos basados en:)/aceptar
Paso 04:
Paso 06: en barras/ Doble click o arrastramos barras de error simple para el tipo de gráfico/arrastramos sexo al eje
X/punteje letras arrastramos al eje Y/aceptar
• Arreglamos doble click en el espacio del cuadrante/doble click en el eje Y/escogemos min 12 –max
17 incremento 1/ aplicar
Paso 02: Arrastramos puntaje en ciencias en variables para contrastar y sexo en variables de agrupación/definir grupos.
Primero existen 2 intervalos de confianza, usaremos uno de ellos de acuerdo a los resultados de levene.
Como Sig=p=0.105>0.05 entonces se acepta la igualdad de varianzas por lo tanto se utilizará para la diferencia de
medias el primer intervalo 1 − 2 0.41663; 2.33417 , es decir con una confianza del 95% podemos afirmar que
1 − 2 pertenece al intervalo que va desde 0.41663 hasta 2.33417.
( 1 2 )
7.3.2.1. Aplicación:
Se desea estimar la diferencia de medias entre los puntajes en ciencias y letras de todos los estudiantes.
Dado que las notas en ciencias y letras le corresponden a un mismo estudiante se trata de muestras relacionadas entonces.
Paso 02: arrastramos puntaje ciencias (variable 01) y puntaje letras (variables 02)/ aceptar
Paso 03:
De aquí observamos que 1 − 2 −0.818; −0.266 es decir que el puntaje en ciencias es menor que los puntajes en
letras, con un nivel de confianza se puede concluir que 1 − 2 pertenece a un intervalo que desde -0.818 hasta -0.266.
7.4.1. Aplicación:
El investigador de educación desea obtener una estimación de la proporción de estudiantes que estudian economía y cual
es el intervalo de confianza
Paso 02: Aparece el cuadro siguiente: introducimos la variable carrera prof. /ponemos un nuevo nombre y la etiqueta
nueva.
Paso 03: precionamos cambiar/ valores antiguos y nuevos y aparece/ ponemos en valor antiguo 1 (que corresponde a la
etiqueta de economía) y en valor nuevo ponemos siempre 1 por que este valor va representar nuevamente a eco luego
click en añadir.
Paso 05: observamos que en la ventana de dato aparezca los valores de Eco, con el 1 para economía y ceros para el
resto.
Paso 02: Introducimos la nueva variable Eco como variable para contrastar/ valor de prueba siempre para intervalos de
confianza será cero (0).
De los resultados observamos que la proporción es p=0.25, es decir el 25% de los estudiantes es de economía y que la
proporción poblacional puede tomar los valores de 0.16 a 0.34 con una confianza del 95%, es decir P 0.16;0.34 .
7.4.2. Aplicación:
Se desea obtener una estimación de la proporción de estudiantes que estudian matemática entre varones y mujeres por
separado.
Paso 02: Aparece el cuadro siguiente: introducimos la variable carrera prof. /ponemos un nuevo nombre (Mate ) y la
etiqueta nueva (Matemática)/cambiar.
Paso 03:en valor antiguo ponemos 3 (etiqueta de matemática) valor nuevo siempre 1/añadir
7.4.2.2. Segmentación.
Se realiza la segmentación con el objetivo de ver la proporción por separado de acuerdo al sexo
Paso 02: Introducimos la nueva variable Mate como variable para contrastar/ valor de prueba siempre para intervalos de
confianza será cero (0), Verificamos el nivel de confianza en este caso al 95%/Continuar/ Aceptar.
Paso 03:
De los resultados observamos la proporción es p1=0.18 y p2=0.18 es decir el 50% de los estudiantes es de Matemática
son varones y 50% son mujeres y que la proporción poblacional para ambos caso pueden tomar los valores de 0.07 a
0.29 con una confianza del 95%, es decir P1 0.07;0.29 P2 0.07;0.29 .
En los resultados del spss se obtiene el valor de p- value o lo que es lo mismo sig.bilateral, dado un
nivel “” de significancia entonces tendremos las siguientes consideraciones:
Pasito 01: Analizamos la hipótesis alternativa si se trata de un análisis de cola derecha, izquierda o
de dos colas
Pasito 02: Observamos el signo del valor t-Student si es positivo o negativo
Pasito 03: De acuerdo a la hipótesis vemos si p se mantiene o cambia y de que forma para poder
compararlo con el valor“” de significancia.
Pasito 04: Tomamos la decisión de aceptar o rechazar la hipótesis nula comparando p con .
NOTA:
En la hipótesis nula siempre va las relaciones de: =; ó y en los ejercicios se los reconoce
por: A lo más, como máximo, a lo sumo, por lo menos, al menos, como mínimo
En la hipótesis alterna siempre va las relaciones de: ; ó
Comparación Desición
p<α Rechazamos H0 Aceptamos Ha
p>α Aceptamos H0 Rechazamos Ha
8.3.1. Aclaración:
Consiste en decidir si la media poblacional es estadísticamente igual, mayor, menor, mayor igual,
menor igual a un valor específico, en estos casos se dirá CASOS BILATERAL, UNILATERAL
COLA A LA IZQUIERDA Y DERECHA.
Aplicación 01: Se desea investigar que la nota media de los estudiantes en ciencias es de 14:
Aplicación 02: Se desea investigar que la nota media de los estudiantes en ciencias es a lo más 10:
Aplicación 03: Se desea investigar que la nota media de los estudiantes en ciencias es a lo más 15:
Aplicación 04: Se desea investigar que la nota media de los estudiantes en ciencias es menor a 8:
Aplicación 05: Se desea investigar que la nota media de los estudiantes en ciencias es menor a 16:
Forma simbólica
H 0 : X = N (; 2 )
H1 : X N ( ; 2 )
Click en gráficos
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Puntaje en la
prueba de
aptitud
.069 100 ,200 * .978 100 .090
ciencias
*. Este es un límite inferior de la significación verdadera.
a. Corrección de la significación de Lilliefors
Observando el valor de p=0.200 > =0.05 se acepta la hipótesis nula, es decir, podemos afirmar
estadísticamente que los datos provienen de una distribución normal.
Si n ≥ 30 se utilizará kolmogorov-Smirnov
Si n < 30 se utilizará Shapiro- Wilk
De manera adicional se puede observar las gráficas correspondientes, que muestran el
comportamiento de los datos en forma normal.
Paso dos: Para dar solución a las hipótesis procedemos a la comparación de los datos:
Forma simbólica
H 0 : = 14
H1 : 14
Se desea investigar que la nota media de los estudiantes en ciencias es a lo más 10:
Forma simbólica
H 0 : 10
H1 : 10
8.3.6.2. Proceso en SPSS:
Se desea investigar que la nota media de los estudiantes en ciencias es a lo más 15:
Forma simbólica
H 0 : 15
H1 : 15
8.3.7.2. Proceso En SPSS:
Forma simbólica
H0 : 8
H1 : 8
Pasito 04: Observando el valor de p=0.999..> =0.05 se acepta la hipótesis nula y podemos afirmar
que estadísticamente la nota promedio en ciencias es mayor igual a 8. (ver el cuadrito)
Se desea investigar que la nota media de los estudiantes en ciencias es menor a 16:
Forma simbólica
H 0 : 16
H1 : 16
8.3.9.2. Proceso en SPSS:
APLICACIÓN 01: Los estudiantes del aula A tienen puntajes diferentes en ciencias y en letras?
APLICACIÓN 02: Los estudiantes del aula A tienen puntaje menor en ciencias que en letras?
APLICACIÓN 03: Los estudiantes del aula A tienen puntaje mayor en ciencias que en letras?
Forma simbólica
H 0 : X C = N (; 2 ) H 0 : X L = N (; 2 )
H1 : X C N ( ; 2 ) H1 : X L N ( ; 2 )
Continuar/ aceptar
Observando el valor de p=0.200 > =0.05 para ambos casos se acepta la hipótesis nula es decir
podemos afirmar estadísticamente que los Puntajes en la prueba de aptitud ciencias y los Puntajes en
la prueba de aptitud letras provienen de una distribución normal.
Si n ≥ 30 se utilizará kolmogorov-Smirnov
Si n < 30 se utilizará Shapiro- Wilk
H0: Los estudiantes del aula A tienen puntajes iguales en ciencias y en letras
H1: Los estudiantes del aula A tienen puntajes diferentes en ciencias y en letras
Forma simbólica
H 0 : C = L
H 1 : C L
Primero
ciencias luego
letras de
acuerdo a la
investigación
Aceptar
Los estudiantes del aula A tienen puntaje menor en ciencias que en letras
H1: Los estudiantes del aula A tienen puntaje menor en ciencias que en letras
Forma simbólica
H 0 : C L
H 1 : C L
Los estudiantes del aula A tienen puntaje mayor en ciencias que en letras?
H1: Los estudiantes del aula A tienen puntaje mayor en ciencias que en letras
Forma simbólica
H 0 : C L
H 1 : C L
8.6.1. Aplicaciones:
APLICACIÓN 01: El puntaje medio en ciencias de los estudiantes varones es igual al de las
mujeres?
APLICACIÓN 01: El puntaje medio en ciencias de los estudiantes varones es menor al de las
mujeres?
APLICACIÓN 01: El puntaje medio en ciencias de los estudiantes varones es mayor al de las
mujeres?
Primero realizamos la prueba de normalidad para cada grupo de datos para femenino y masculino
H0: Los datos correspondientes a los varones provienen de una distribución normal:
H1: Los datos correspondientes a los varones no provienen de una distribución normal:
H0: Los datos correspondientes a las mujeres provienen de una distribución normal:
H1: Los datos correspondientes a las mujeres no provienen de una distribución normal:
Forma simbólica
H 0 : X M = N ( ; 2 ) H 0 : X F = N (; 2 )
H1 : X M N ( ; 2 ) H1 : X F N ( ; 2 )
Hasta aquí lo que hicimos es separar al grupo por género y los análisis que haga lo harán para estos
dos grupos.
Pruebas de normalidad
a
Kolmogorov-Smirnov Shapiro-Wilk
Género Estadístico gl Sig. Estadístico gl Sig.
FEMENINO Puntaje en la prueba
de aptitud ciencias
.101 50 ,200* .944 50 .020
Observando el valor de p=0.200 > =0.05 para ambos casos se acepta la hipótesis nula es decir
podemos afirmar estadísticamente que los datos correspondientes a los varones y a las mujeres con
respecto a los puntajes en ciencia provienen de una distribución normal:
Si n ≥ 30 se utilizará kolmogorov-Smirnov
Si n < 30 se utilizará Shapiro-Wilk
Por último, reestablescamos la información para que ya deje de considerarlo en función de los
grupos por géneros.
H1: El puntaje medio en ciencias de los estudiantes varones es diferente al de las mujeres
Forma simbólica
H 0 : V = M
H1 : V M
LOS
DATOS
LOS
GRUPOS
CONTINUAR / ACEPTAR
PRUEBA T
Estadísticos de grupo
Desviación Error típ. de
Género N Media típ. la media
Puntaje en la prueba MASCULINO 50 13.75 2.245 .318
de aptitud ciencias FEMENINO 50 15.12 2.575 .364
Regla práctica: como sig. =0.105 > =0.05 en la prueba de levene entonces se utiliza la primera
fila, en caso contrario se utilizaría la segunda fila.
H0: El puntaje medio en ciencias de los estudiantes varones es mayor igual al de las mujeres
H1: El puntaje medio en ciencias de los estudiantes varones es menor al de las mujeres
Forma simbólica
H 0 : V M
H1 : V M
PRUEBA T
Estadísticos de grupo
Desviación Error típ. de
Género N Media típ. la media
Puntaje en la prueba MASCULINO 50 13.75 2.245 .318
de aptitud ciencias FEMENINO 50 15.12 2.575 .364
H0: El puntaje medio en ciencias de los estudiantes varones es menor igual al de las mujeres
H1: El puntaje medio en ciencias de los estudiantes varones es mayor al de las mujeres
Forma simbólica
H 0 : V M
H1 : V M
PRUEBA T
Estadísticos de grupo
Desviación Error típ. de
Género N Media típ. la media
Puntaje en la prueba MASCULINO 50 13.75 2.245 .318
de aptitud ciencias FEMENINO 50 15.12 2.575 .364
APLICACIÓN 01: Los puntajes en ciencias son los mismos en los estudiantes de economía,
matemática, psicología y administración?
APLICACIÓN 02: Los puntajes en ciencias son los mismos según situación laboral?
Pruebas de normalidad
a
Kolmogorov-Smirnov Shapiro-Wilk
Carrera profesional
Estadístico gl Sig. Estadístico gl Sig.
Puntaje en la prueba de
ECONOMÍA
aptitud ciencias
.117 25 ,200* .950 25 .251
Puntaje en la prueba de *
ADMINISTRACIÓN
aptitud ciencias .111 29 ,200 .965 29 .422
Puntaje en la prueba de *
MATEMÁTICA .092 18 ,200 .980 18 .948
aptitud ciencias
Puntaje en la prueba de *
PSCOLOGÍA .117 28 ,200 .969 28 .545
aptitud ciencias
*. Este es un límite inferior de la significación verdadera.
a. Corrección de la significación de Lilliefors
De acuerdo a los valores de p para todos los grupos en este caso son mayores a =0.05 concluimos
aceptando la hipótesis nula de que los puntajes en ciencias en los grupos de economía, matemática,
psicología y administración tienen una distribución normal.
¿Los puntajes en ciencias son los mismos en los estudiantes de economía, matemática, pscología y
administración?
H0: ¿Los puntajes en ciencias son los mismos en los estudiantes de economía, matemática,
psicología y administración?
Forma simbólica
H 0 : E = M = P = A
H1 : i j ; i j
1.568 3 96 .202
ANOVA de un factor
Puntaje en la prueba de aptitud ciencias
Suma de Media
gl F Sig.
cuadrados cuadrática
Inter-grupos 1.712 3 .571 .089 .966
Intra-grupos 617.468 96 6.432
Total 619.181 99
Solución:
H0: ¿Los puntajes en ciencias son los mismos en los estudiantes según situación laboral?
Forma simbólica
H 0 : NT = TC = TM
H1 : Al menos dos son diferentes
Ahora como las varianzas son homogéneas, continuando ahora con post hoc
Escogemos DMS, es el método de mínimas diferencias significativa, por que es una prueba muy
eficiente.
Continuar y aceptar
1 27 1 1 12,44 2 13,88
2 25 1 1 13,47 4 14,27
3 21 3 2 19,09 4 17,88
4 24 2 1 19,88 4 20
5 19 1 2 13,23 4 14,01
6 19 1 2 16,37 4 14,46
7 20 1 2 13,77 1 16,64
8 18 3 2 14,64 2 16,4
9 21 3 1 10,82 1 10,35
10 27 1 2 12,29 4 12,25
11 27 3 1 15,26 3 16,92
12 17 3 1 13,31 3 13,25
13 21 1 2 14,96 1 14,22
14 27 2 1 17,23 1 17,11
15 18 3 2 13,37 1 13,31
16 24 1 2 13,47 4 14,29
17 25 1 2 15,01 1 15,17
18 25 3 2 11,73 2 11,77
19 20 2 2 14,8 4 13,38
20 21 2 1 20 2 18,55
21 20 2 1 17,26 4 17,36
22 20 1 2 15,85 4 17,49
23 19 1 2 11,41 1 9,86
24 24 1 2 14,64 1 14,99
25 24 2 2 14,91 3 15,55
26 23 3 1 20 1 20
27 19 1 1 11,92 1 10,8
28 20 3 1 14,82 4 16,79
29 22 3 1 14,87 2 16,63
30 22 3 2 17,8 2 17,99
31 16 1 1 15,66 2 14,46
32 18 1 1 13,79 4 15,92
33 28 3 2 15,89 1 17,67
34 19 1 2 14,85 4 14,34
35 28 3 2 17,91 4 18,81
36 16 3 1 18,27 3 20
37 23 3 1 16,19 1 16,17
38 24 1 2 13,97 1 15,72
39 23 3 1 12,39 4 12,43
40 19 3 1 19,86 1 18,12
41 25 2 2 8,16 2 9,54
42 22 2 1 18 2 17,18
43 22 1 2 9,83 4 10,96
44 20 2 1 12,2 2 10,31
45 26 1 1 16,99 1 15,03
46 21 1 2 14,74 2 14,3
47 19 1 2 11,97 2 11,99
48 18 2 2 12,68 4 12,41
49 25 3 2 13,27 3 11,92
50 21 1 1 12,92 4 15,3
51 21 3 2 12,35 1 10,5
52 23 2 1 14,61 2 16,7
53 23 3 2 13,14 1 15,67
54 22 2 1 17,78 2 15,92
55 21 3 1 15,87 2 17,19
56 26 2 2 10,72 4 12,29
57 16 3 1 13,9 4 15,59
58 23 1 2 8,84 2 7,45
59 17 3 1 14,19 3 15,37
60 23 2 1 16,23 1 18,65
61 18 3 1 16,08 3 18,85
62 22 2 1 12,17 2 15,04
63 28 2 2 14,11 3 16,66
64 21 2 2 15,37 3 16,3
CATEGORIZACIÓN:
CARRERA
COD GÉNERO PROFESIONAL SIUACIÓN LABORAL
1 FEMENINO ECONOMÍA NO TRABAJA
2 MASCULINO ADMINISTRACIÓN TRABAJA MEDIO TIEMPO
TRABAJA TIEMPO
3 - MATEMÁTICA COMPLETO
4 - PSCOLOGÍA -
Ordinal Spearman
Ordinal Discreta
Continua
Discreta Discrete
Continua. Continua
https://www.youtube.com/watch?v=wEMdQvZDVUw