Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La probabilidad va de 0 a 1.
FORMULA GENERAL
p = h/n
PROBLEMAS
1).- Obtener la probabilidad de que en una tirada de una moneda obtenga águila.
REGLAS DE LA PROBABILIDAD
PROBLEMA
¿Cuál es la probabilidad de que salga águila al lanzar 2 veces consecutivas la
moneda?
p = h/n = 1/2 = 0.50
p = 1/2 x 1/2 = 1/4 = 0.25
1).- Todos los eventos deben tener una probabilidad mayor que o igual a 0.
Un concepto clave en el enunciado de esta propiedad.
2).- La suma de la probabilidad de todos los resultados mutuamente exclusivos es
igual a 1.
La probabilidad va de 0 a 1.
p {E1} + p {E2}... = 1
PROBLEMAS
q = 1- p
q = 1- h/n
q = 1- 36/40
q = 1- 0.9
Q= 0.1
3).- ¿Cuál es la probabilidad de que caiga águila en tres tiradas consecutivas de
una moneda?
p = h/n
p=½x½x½
p = 0.125
PROBABILIDAD BINOMIAL
La probabilidad binomial es una teoría de grandes muestras, esta distribución se
obtiene de un proceso conocido como Ensayo deBernoulli. Cuando un solo
ensayo o experimento puede conducir a uno de los resultados mutuamente
exclusivos tales como muerto o vivo, masculino o femenino, enfermo o saludable,
el ensayo conduce a lo que se llama Ensayo de Bernoulli.
PROBLEMA
En cierta población el 52 % de todos los nacimientos registrados son varones,
entonces p de un nacimiento registrado es de 0.52. Si de esta población se
seleccionan al azar 5 nacimientos, ¿Cuál es la probabilidad de que exactamente 3
de los registros sean de nacimientos varones?
n=5
x=3
1º) pppqq 6º) ppqpq
2º) pqqpp 7º) pqpqp
3º) qqppp 8º) qpqpp
4º) ppqqp 9º) qpppq
5º) pqppq 10º) qppqp
P= 0.52
Q= 1-p = 1- 0.52 =0.48
PROBLEMA
En Veracruz el Pie de Atleta es común. De una muestra al azar de 6 ¿Qué
probabilidad hay de que 4 tengan la enfermedad, si la frecuencia es del 40 %?
n=6
x=4
p = 0.40 x 4 2
p= ( p) (q)
q = 1-p = 1-0.40 = 0.60 n
4 2
p=15 (0.40) (0.60)
n n! 6!
= = p=15 ( 0.025 )( 0.36)
x x ! n−x ! 4 ! ( 6−4 ) !
p=0.138
n 720
= =15
x 24 ( 2 )
PROBLEMA
En Escárcega el 80 % tiene parasitosis. Si se obtiene una muestra de 10 ¿Cuál es
la probabilidad de que 5 tengan la enfermedad?
p = 0.80
q = 1 - p = 1 - 0.80 = 0.20 x
n = 10 p= ( p)4 (q)2
n
x=5
p=252( 0.80)5 ( 0.20)5
n n! 10!
= =
x x ! n−x ! 5 ! ( 10−5 ) ! p=252 ( 0.327 )(3.2 x 10−4 )
PROBLEMA
La frecuencia de toxoplasmosis en las mujeres es del 40 %. Se obtiene una
muestra de 8 ¿Qué probabilidad hay de que 3 tengan la enfermedad?
p = 40 % = 0.4
q = 1 - p = 1 - 0.4 = 0.6
n=8
x=3
n!
J (x) = (n/x ) = q n - x px
x! n - x!
n n! 8!
J ( x )= = =
x x ! n−x ! 3 ! ( 8−3 ) !
n 40320 40320
= = =56
x 6 ( 120 ) 729
DISTRIBUCION Z
NIVEL DE CONFIANZA
Sin embargo hay otros investigadores que utilizan un nivel de confianza de 0.01 y
0.001.
Rechazar la hipótesis de nulidad cuando se debería aceptar se conoce como
Error alpha o Error tipo I.
Error tipo II o beta se presenta cuando se acepta la hipótesis de nulidad y ésta
debe ser rechazada, el método para reducir el riesgo de este error es aumentar el
tamaño de la muestra para que exista una diferencia poblacional real
PROBLEMA
Un investigador cree que los hombres difieren de las mujeres con respecto al
etnocentrismo. Desea saber si esta diferencia es significativa con un nivel de
confianza de 0.05.
1 3 2 9 4
2 4 2 16 4
3 2 4 4 16
4 3 3 9 9
5 5 5 25 25
6 6 6 36 36
7 7 4 49 16
8 1 6 1 36
9 2 7 4 49
10 3 8 9 64
11 4 4 16 16
12 5 5 25 25
13 2 7 4 49
14 2 3 4 9
15 3 9 9 81
16 4 5 16 25
17 5 1 25 1
18 3 2 9 4
19 4 2 16 4
20 5 3 25 9
21 6 4 36 16
22 7 2 49 4
23 8 6 64 36
24 9 5 81 25
25 2 7 4 49
26 3 9 9 81
27 4 6 16 36
28 3 5 9 25
29 5 4 25 16
30 4 3 16 9
31 6 2 36 4
32 7 2 49 4
33 8 1 64 1
34 1 3 1 9
35 1 5 1 25
Paso 1: Elaborar H0 y H1
H0: µ = µ
H1: µ ≠ µ
x1 147
1 = = = 4.2
n1 35
x2 152
2 = = = 4.34
n2 35
S1 =
771
S1= 35 √
−17 . 64
S1= √ 4.38
S1= 2.09
S2 =
822
S2= 35 √
−18 . 83
S2= √ 23.48−18.83
S2= √ 4.65
S2= 2.15
S1 2.09
1 = = = 0.35
√ 35−1
S2 2.15
2 = = = 0.36
√ n2−1
dif =
- 1.96 0 + 1.96
-0.27
No significativa, Z (p 0.05).
Paso 9: Conclusiones.
H01 = 2
H11≠2
x1 163
1 = = = 5.43
n1 30
x2 184
2 = = = 6.13
n2 30
S1 =
1033
S1= 30 √−29 . 48
S1= √ 34.43−29.48
S1= √ 4.95
S1= 2.22
S2 =
1304
S2= 30 √−37 .57
S2= √ 43.46−37.57
S2= √ 5.89
S2= 2.42
S1 2.22
1 = = = 0.412
S2 2.42
2 = = = 0.449
√ n2−1
dif =
0.05 x 2 = 0.10
0.90 / 2 = 0.45
- 1.65 0 + 1.65
-1.15
Como Z = -1.15, éste valor se encuentra fuera de la zona crítica, por lo tanto Z
(p > 0.05) por lo que es no significativa.
Paso 9: Conclusiones.
PROBLEMA
Paso 1: Elaborar H0 y H1 .
H01 = 2
H11≠2
Paso 3 : Encontrar la media para cada punto en el tiempo.
Ʃ x1 1289
1 = = = 25.28
n1 51
x2 2373.8
2 = = = 46.54
n2 51
S=
S = 51 √
58603. 26
(25 . 28−46 .54 )2
S= √ 1149−(−21 .26 )2
S= √ 1149−451 .98
S= √ 697.02
S = 26.4
S 26.4 26 . 4
dif = √ N −1 = √ 50 = 7 . 0710 = 3.73
Paso 6 : Determinar la distribución “ z“ con la fórmula :
- 2.58 0
- 5.69
Significativa, t (p 0.01).
Paso 9: Conclusiones.
PROBLEMA
En un estudio en función de las grasas en la etiología de las enfermedades
isquémicas del corazón, se seleccionaron a 35 hombres entre 40 y 60 años de
edad quienes habían tenido infarto del miocardio, la variable de estudio fue ácido
linoleico (AL) en los ácidos grasos triglicéridos del plasma, el investigador desea
saber si existe o no diferencia en las concentraciones de (AL) en el grupo de
estudio en relación a una media antecedente de 30, utiliza un α=0.05.
Ac.
Casos Linoleico X2
1 18 324
2 17.6 309.76
3 9.6 92.16
4 5.5 30.25
5 16.8 282.24
6 12.9 166.41
7 14 196
8 8 64
9 8.9 79.21
10 15 225
11 9.3 86.49
12 5.8 33.64
13 8.3 68.89
14 4.8 23.04
15 6.9 47.61
16 18.3 334.89
17 24 576
18 16.8 282.24
19 12.1 146.41
20 12.9 166.41
21 16.9 285.61
22 15.1 228.01
23 6.1 37.21
24 16.6 275.56
25 8.7 75.69
26 15.6 243.36
27 12.3 151.29
28 14.9 222.01
29 16.9 285.61
30 5.7 32.49
31 14.3 204.49
32 14.1 198.81
33 14.1 198.81
34 15.1 228.01
35 10.6 112.36
Total 442.5 6313.97
H01 = µ2
H11 µ2
x 442.5
= = = 12.64
N 35
S=
S= 35√
6313. 97
−(12 . 64 )2
S= √ 180.39−159.76
S= √ 20.63
S = 4.54
Z=
12. 64−30
Z = 4.54 / √ 35
−17 .36
Z = 4. 54/5 . 91
−17. 36
Z= 0.76
Z= - 22.84
- 1.96 0 + 1.96
-22.84
Significativa, z(p0.05).
Paso 8: Conclusiones.
z(p0.05), por lo tanto se acepta la H1 y se rechaza la H0 aceptando que existe
una diferencia significativa entre las concentraciones de ácido linoleico en relación
a una media antecedente de 30.
DISTRIBUCIÓN t STUDENT
MUESTRAS INDEPENDIENTES
H0: µ = µ
H1: µ ≠ µ
X1=
∑ X1
n1
8
X1=
6
X 1 =1.3
X2=
∑ X2
n2
27
X2=
6
X 2 =4.5
S1 =
S1 = √ 12
6
−(1 . 3)2 =√ 2−1 .69
S1 = √ 0.31
S1 = 4.54
S2 =
S2 =
125
6 √
−(4 . 5)2
S1
X1
Ϭ = √n 1−1
0 . 55
X1
Ϭ = √ 6−1
0. 55 0 .55
X1 = =0. 24
Ϭ = √ 5 2. 23
S2
= √ n 2−1
X2
Ϭ
0 . 76
X 1 = √6−1
Ϭ
0. 76 0 .76
X1 = =0 .34
Ϭ = √5 2 .23
dif =
X 1− X 2 1.3−4.5
t= =
σ dif 0.41
T= -7.80
gl= N1 + N2 – 2
gl= 6 +6 – 2
gl= 10
- 1.96 0 + 1.96
-7.80
Paso 8: Conclusiones.
PROBLEMA
Un investigador cree que existe diferencia en hombre y mujeres con respecto a los
puntajes del examen ordinario en la materia de Química Analítica I, en el grupo
202; utiliza un α de 0.05.
H0: No existe diferencia entre hombres y mujeres con respecto a los puntajes del
examen ordinario de Química Analítica I.
H1: Existe diferencia entre hombres y mujeres con respecto a los puntajes del
examen ordinario de Química Analítica I.
H01 = 2
H112
x1 56
1 = = = 6.22
n1 9
x2 62
2 = = = 6.88
n2 9
Paso 4: Obtener la desviación estándar de cada grupo.
S1 =
S1=
S2 =
S2=
S1 1.32
1 = = = 0.466
9–1
S2 1.94
2 = = = 0.685
√ n2−1 9-1
gl = N1 + N2 - 2
gl = 9 + 9 - 2
gl = 16
No significativa, t (p 005).
PROBLEMA
Un investigador cree que los niños blancos y negros, de cierto barrio difieren con
respecto a la tendencia hacia la criminalidad; desea un nivel de significancia de
0.05.
Paso 1: Elaborar H0 y H1
H0: No existe diferencia entre los niños blancos y negros de cierto barrio con
respecto a la criminalidad.
H1: Existe diferencia entre los niños blancos y negros de cierto barrio con respecto
a la criminalidad
H112
x1 15.26
1 = = = 2.6
n1 6
x2 13.7
2 = = = 1.95
n2 7
S1 =
S1= 6 √
50. 46
−6 .45
S1= √ 8.41−6.45=√1.96
S1= 1.4
S2 =
S2= √
28. 35
7
−3 .80
dif =
dif = √( 6+7−2 )( )
6(1 . 4 )2 +7(0 . 5 )2 1 1
+
6 7
dif = √ 11
( 6(1 . 96)+7 (0. 25 )
)( 0. 16+0 . 14)
dif = √ 11
( 11 .76+1. 75
)( 0 . 3 )
dif = √(1.22) ( 0.3)
dif = √ 0.36
dif = 0.60
gl = 6 + 7 - 2
gl = 11
- 2.201 0 + 2.201
1.08
No significativa, t (p 0.05).
Paso 9: Conclusiones.
PROBLEMA
H0 1 = 2
H1 12
x2 1122
2 = = = 70.12
n2 16
√ √
2
Σx1 59079
−x21 −(63. 21)2
S1 = n1 14 = √ 4219 .92−3995 .50 = √ 224.42 = 14.98
√ √
2
Σx 2 2 83158
−x2 −(72. 12)2
S2 = n2 = 16 = √ 5197.37−4916 .81 = √ 280.56 = 16.74
dif =
1 - 2 63.21- 70.12
t= = = -0.29
dif 23.15
gl = N1 + N2 -2 = 14+16 – 2= 28
gl = N1 + N2 -2
-2.763 0 +2.763
- 0.29
t (p > 0.01)
Paso 9: Conclusiones.
PROBLEMA
H01 = 2
H112
x1 72
1 = = = 12
n1 6
x2 84
2 = = = 14
n2 6
S=
S=
S=
S=
S = 0.81
dif = = = = 0.36
1 - 2 12 - 14 -2
t= = = = - 5.55
dif 0.36 0.36
gl = N1 - 1
gl = 6 – 1
gl = 5
- 2.015 0 + 2.015
- 5.55
Significativa, t (p 0.05).
Paso 9: Conclusiones.
PROBLEMA
H01 = 2
H112
x1 707
1 = = = 70.7
n1 10
x2 720
2 = = = 72
n2 10
Paso 4: Encontrar la desviación estándar de la diferencia entre el tiempo uno y el
tiempo después.
S=
S=
S=
S=
S=
S = 6.634
dif = = = = 2.21
gl = N - 1
gl = 10 - 1
gl = 9
- 2.262 0 + 2.262
-0.58
No significativa, t (p 0.05).
Paso 9: Conclusiones.
PROBLEMA
Un investigador cree que existe diferencia en la concentración de ciertas
soluciones químicas. Sabe por antecedentes que el promedio es de 17 milimoles.
Obtiene una muestra de 10 con los siguientes resultados. Utilice alfa de 0.05
Casos X X2
1 15.7 246.49
2 16.2 262.44
3 16.8 282.24
4 16.2 262.44
5 15.7 246.49
6 17.6 309.76
7 17.1 292.41
8 16.4 268.96
9 15.5 240.25
10 17 289
Total 164.2 2700.48
H0 1 = 2
H1 12
x 164.2
= = = 16.42
N 10
S=
S=
S=
S=
S = 0.66
t=
t=
t=
t=
t = - 2.9
gl = 10 - 1
gl = 9
- 2.262 0 + 2.262
- 2.9
Significativa, t (p0.05)
Paso 9: Conclusiones.
PROBLEMA
Ejercicios.
Antecedentes
Con un factor
DISTRIBUCION F
PROBLEMA
H1: Existe diferencia en el coeficiente de inteligencia entre los tres grupos sociales,
alta, media, baja.
H01 = 2 = 3
H112 3
x1 627
1 = = = 125.4
n1 5
x2 572
2 = = = 114.4
n2 5
x3 485
3 = = = 97
n3 5
( x total )2
s.c.total = x total -
2
N total
2835856
s.c.total = 191628 -
15
s.c.entre grupos = + + -
gl entre grupos = K – 1
gl entre grupos = 3 - 1
s.c.entre grupos
c.entre grupos =
gl entre grupos
F = 1025.26 / 43.36
F = 23.64
Paso 12: Obtener el valor crítico con de 0.05.
F = 23.64
Valor crítico = 3.98
- 3.98 0 + 3.98
23.64
Altamente significativa, F (p 0.05).
POS HOC
FORMULA:
DSH = q
Donde:
q : un valor de la tabla o un nivel de confianza dado para un número máximo
de medias que se están comparando.
c dentro: media cuadrática dentro de los grupos.
n: número de entrevistados de cada grupo.
1 - 2 =11.0
2 - 3 = 17.4
1 - 3 = 28.4
Paso 2: Encontrar q en la tabla con puntos de porcentaje del rango student; para
poder obtenerlo se necesita lo siguiente:
c) Tener un nivel de confianza que puede ser 0.01 o 0.05, en este caso vamos a
utilizar 0.05.(q = ).
DSH = q
DSH = 3.77
DSH = 3.77
DSH = 11.08
1 - 2 = 11.0 p 0.05
2 - 3 = 17.4 p 0.05
1 - 3 = 28.4 p 0.05
PROBLEMA
H0: No existe diferencia entre los grupos: 201, 202, 203 en los puntajes de
aprovechamiento en química orgánica
H1: Si existe diferencia entre los grupos: 201, 202, 203 en los puntajes de
aprovechamiento en química orgánica
H01 = 2 = 3
H112 3
x1 71
1 = = = 8.87
n1 8
x2 43
2 = = = 5.37
n2 8
x3 51
3 = = = 6.37
n3 8
( x total )2
s.c.total = x2 total -
N total
( 71+43+51 ) 2
s.c.total = (639+243+339) -
24
( 165 )2
s.c.total = (1221) -
24
s.c.total = 1221-1134.37
s.c.total = 86.63
gl entre grupos = K - 1
gl entre grupos = 3 - 1
s.c.entre grupos
c.entre grupos =
gl entre grupos
51.99
c.entre grupos =
2
34.64
c.dentro de los grupos =
21
25.99
F= = 15.84
1.64
1 - 2 = 8.87-5.37= 3.5
m
2 - 3 = 5.37-6.37= -1
1 - 3 = 8.87-6.37=2.5
Paso 2: Encontrar q en la tabla con puntos de porcentaje del rango student; para
poder obtenerlo se necesita lo siguiente:
e) Tener un nivel de confianza que puede ser 0.01 o 0.05, en este caso
Vamos a utilizar 0.05.(q = ).
DSH = 3.47 8√
1.64
DSH = 1.57
= universo
r=n
r=
PROBLEMA
Un investigador cree que existe una correlación entre la edad en días y el peso
en Kg de ciertos niños nacidos en el Puerto de Veracruz. Desea un de 0.05.
H1: Existe una correlación entre la edad en días y el peso en Kg de ciertos niños
nacidos en el Puerto de Veracruz.
H0 = 0
H1 0
r=
r=
r=
r=
r=
r=
r = 0.9835
- 0.602 0 + 0.602
0.98
Paso 5: Conclusiones.
PROBLEMA
Un investigador cree que existe una correlación entre la presión de oxígeno y la
saturación de oxígeno en la hemoglobina. Considera que cuanto mayor sea la
presión de oxígeno, mayor será la concentración en la hemoglobina. Utiliza un
de 0.05.
Casos X presión Y XY X2 Y2
de O2 saturación
O2 en Hb
H0: µ = µ
H1: µ ≠ µ
231840−206354 . 6
r = √ [ 211770−160801 ][ 372039 . 96−264813. 16 ]
25485. 4
r = 80188. 91
r =0.31
gl = 5
Valor crítico = 4
-0.754 0 +0.754
0.75
Significativa, r (p<0.05).
Paso 5 : Conclusiones.
De acuerdo con la correlación de Person el valor de (p<0.05) esto es significativo
aceptando la hipótesis alterna y rechazando la nula, cometiendo error tipo 2. Esto
indica que la presión de oxígeno difiere con la saturación de oxígeno en la
hemoglobina.
PROBLEMA
Un investigador está interesado en saber si los procedimientos de laboratorio se
han realizado adecuadamente; para ello ordena reproducir la técnica, a fin de
determinar si hay glucosa en la sangre mediante un método espectofotómetro;
desea saber qué relación existe entre diversas concentraciones de una solución
stándar de glucosa y los valores de absorvancia de luz, expresados como
densidad óptica. Utiliza un de 0.05.
H0 = 0
H1 0
r=
r=
r=
r=
r=
r=
r = 0.984
- 0.6021 0 + 0.6021
0.984
Paso 5: Conclusiones.
Fórmula
Y= a+bx
Donde:
Antes de iniciar las operaciones debe verificar si existe una correlación lineal,
Problema
Un investigador muestra una serie de correlaciones acerca de la concentración de
glucosa de modo que mediante una reacción química se obtienen diversas
densidades de un color y se miden con espectrofotometría, que permiten lecturas
de densidad óptica. Se ha observado que a mayor concentración de glucosa
existe un aumento en los valores de densidad óptica y una tendencia rectilínea por
lo que se procede a efectuar la pendiente de regresión.
b= NƩxy-(Ʃx) (Ʃy)
NƩx2– (Ʃx)2
Esta técnica se utiliza para predecir los valores de y requiere que los datos tenga
una distribución normal y correlación variables. .
y=a+bx
y= 0.239 y= 0.503
ANÁLISIS DE LA VARIANZA
EN DOS DIRECCIONES PARA RANGOS DE FRIEDMAN
Donde:
K: número de mediciones.
N: número total de entrevistados.
RI: suma de los rangos para una medición cualquiera.
PROBLEMA
La hostilidad de los niños varía según el nivel de violencia en los programas de
televisión.
H1: La hostilidad de los niños varía según el nivel de violencia en los programas de
televisión.
Paso 2: Obtener los rangos de cada grupo, el valor más alto tendrá el rango 1,
luego el 2 y el menor valor tendrá, rango 3 .
Paso 3: Sumar los rangos bajo cada condición para cada columna.
gl = 3 - 1
gl = 2
- 5.99 0 + 5.99
10.4
Paso 7: Conclusiones.
PROBLEMA
Un investigador está interesado en estudiar la acción de los fármacos
anticonvulsivos, en relación con una serie de sustancias que por mecanismos
diferentes inducen a crisis convulsivas.
NOTA: cuando existe un empate en los rangos o ligas, se suman los valores de
los rangos y se dividen entre el número de rangos.
Paso 2: Obtener los rangos de cada grupo, el valor más alto tendrá el rango 1,
luego el 2 y el menor valor tendrá, rango 3.
Paso 3: Sumar los rangos bajo cada condición para cada columna.
gl = K - 1
gl = 4 - 1
gl = 3
- 7.82 0 + 7.82
3.5
No significativa, (p 0.05).
Paso 7: Conclusiones.
1) Sirve para comparar una sola muestra medida bajo 3 o más condiciones.
2) Utiliza datos ordinales, que pueden colocarse por rangos.
3) El número de entrevistados no debe ser muy pequeño: el requisito mínimo
exacto para muestra depende del número de condiciones (K) a los que se va a
exponer a los entrevistados; n = 10 cuando K = 3; n = 5 cuando K = 4.
4) La obtención de la muestra debe ser probabilistica o por azar.
5) La procedencia de la muestra debe obtenerse de una distribución normal.
6) Se utiliza cuando se tiene más de 20 casos.
7) Cuando la muestra es menor de 20 casos e incluye 0, en algunas de las
casillas, se utiliza la prueba exacta de Fisher yates.
8) Utiliza grados de libertad.
9) Utiliza niveles de significancia de 0.01 y 0.05, generalmente.
H=
Donde:
Problema
Un investigador cree que existe diferencia entre el número de días para encontrar
un empleo con respecto a la edad senil mediana y joven. Se desea un de 0.05.
H1: Existe diferencia entre el número de días para encontrar un empleo con
respecto a la edad senil mediana y joven.
H=
H=
H=
H=
H = 9.14
gl = K - 1
gl=3-1
gl = 2
Paso 5: Obtener el valor crítico con de 0.05. (Buscar en la tabla de chi
cuadrada).
gl = 2
Valor crítico = 5.99
- 5.99 0 + 5.99
9.14
Significativa, H (p 0.05).
Paso 6: Conclusiones.
PROBLEMA
Un investigador estudia el efecto benéfico de 4 sustancias anticonvulsionantes
(fenobarbital, difenilhidantoinato, diacepan y clonacepan), para proteger contra la
muerte producida por la tiosemilcarbazida, elige a 24 ratones, los somete a la
investigación y toma el tiempo hasta que mueran los ratones. Utilice de 0.05.
H=
H=
12
24(24 +1)
Σ [ 6 ][ ][ ][
6 6 6 ]
(60. 5 )2 (44 )2 (126 )2 (65. 5 )2
−3(24 +1)
H = 10.874
gl = K - 1
gl = 4-1
gl = 3
Paso 6.- Obtener el valor critico en la tabla con alfa de 0.05 y diga si es o no
significativa.
-7.82 0 +7.82
13.86
H (p > 0.05).
Paso 7: Conclusiones.
Se acepta la hipótesis alterna y se rechaza la nula, por lo tanto se comete error
tipo 1. Esto indica que el tratamiento de los anticonvulsionantes difiere en los
ratones.
6(10 )
1−
rs = 8(64−1)
60
1−
rs = 504
rs = 1 – 1.88
rs = 0.88
- 0.643 0 + 0.643
0.88
Significativa,rs (p 0.05).
Paso 5: Conclusiones.
PROBLEMA
Un investigador cree que existe correlación entre las categorías de un grupo que
se gradúa y el coeficiente de inteligencia.
Posición de los alumnos según el coeficiente de inteligencia.
Casos Entrevistados Posición I.Q. Rango D D2
en la
clase
1 A 10 110 6 4 16
2 B 9 90 10 -1 1
3 C 8 104 8 0 0
4 D 7 100 9 -2 4
5 E 6 110 6 0 0
6 F 5 110 6 -1 1
7 G 4 132 3 1 1
8 H 3 115 4 -1 1
9 I 2 140 1.5 0.5 0.25
10 J 1 140 1.5 0.5 0.25
Paso 1: Elaborar H0 y H1
H0: No existe correlación entre los alumnos que se gradúan y el coeficiente de
inteligencia.
H1: Existe correlación entre los alumnos que se gradúan y el coeficiente de
inteligencia.
Paso 2: Colocar por rangos a los entrevistados.
Paso 3: Sustituir los datos de acuerdo con la fórmula.
rs = =
rs = = 1-0.148
rs = 0.851
- 0.564 0 + 0.564
0.851
Significativa, rs (p 0.05).
Paso 5: Conclusiones
La diferencia entre los valores es significativa, por lo tanto existe correlación entre
los estudiantes que se gradúan y el coeficiente de inteligencia.
Requisitos para el uso de rs:
1) Se usa cuando existe una correlación lineal.
2) Utiliza escala ordinal.
3) El muestreo debe ser aleatorio y de una población normal.
4) Generalmente utiliza niveles de significancia de 0.01 y 0.05.
5) Utiliza rangos.
6) Utiliza grados de libertad. Según la tabla que se utiliza.
n1 (n1 +1)
n1 n 2 + −Σ RI
U1 = 2
n2 (n 2 +1)
n1 n 2 + −ΣR 2
U2 = 2
Donde :
U1 y U2: Valores estadísticos de U Mann-Whitney.
n1: Tamaño de la muestra 1.
n2: Tamaño de la muestra 2.
RI: Sumatoria de rangos del grupo 1.
R2: Sumatoria de rangos del grupo 2.
PROBLEMA
Un investigador cree que las calificaciones de ejecución de lectura, según el
método de enseñanza del experimentador son más altos y diferentes que las
observadas en el método tradicional.
U1 =
U1 =
U1 =
U1 = 21
U2 =
U2 =
U2 =
U2 = 4
- 0.048 0 0.048
0.05
Significativa, U (p < 0.05 ).
Paso 6: Conclusiones.
Existe diferencia significativa por lo tanto las calificaciones ejecutadas según el
método experimental son más altas que las del método tradicional.
H0: Las calificaciones por el método experimental no son diferentes con respecto al
método tradicional.
H1: Las calificaciones por el método experimental son diferentes con respecto al
método tradicional.
Variables Rango
25 1
30 2
40 3.5
40 3.5
45 5
50 6
55 7.5
55 7.5
60 11.5
60 11.5
60 11.5
60 11.5
60 11.5
60 11.5
65 15
70 16.5
70 16.5
75 18.5
75 18.5
80 21.5
80 21.5
80 21.5
80 21.5
90 25.5
90 25.5
90 25.5
90 25.5
95 28.5
95 28.5
100 31.5
100 31.5
100 31.5
100 31.5
110 34.5
110 34.5
U =
Donde:
LI =
LI=
3 3 3 3 3 3 3 3 3 3
( 2 −2)+(2 −2 )+(6 −6 )+( 2 −2 )+(2 −2)+(4 −4 )+( 4 −4 )+(2 −2)+( 4 −4 )+(2 −2 )
12
6 +6+210+ 6+6+60+ 60+6+60+ 6
LI = 12
426
LI = 12
LI = 30.5
U =
U =
U =
U =
U =
U = 27.26
Paso 6: Hallar el valor de Z :
Z=
Donde:
Z: valor estadístico normal.
U: cualquier valor de U calculado.
: valor promedio de U.
U: desviación estándar de U.
U1 =
U1 =
U1 =
U1 = 178
U2 =
U2 =
U2 =
U2 = 72
Z=
Z=
Z = -1.94
Significativa, U (p <0.05).
Paso 9: Decisión.
U(p>0.05), por lo tanto las calificaciones por el método experimental son diferentes
con respecto al método tradicional.
PRUEBA DE WILCOXON
Es una técnica no paramétrica, con escala ordinal.
Problema
Un médico especialista urólogo, busca comprobar la efectividad de un
medicamento para infecciones de vías urinarias, de esta forma sus cirugías serán
de mayor éxito si da un tratamiento antes de la cirugía, para inhibir la flora
bacteriana, para esto realiza un urocultivo antes y después del tratamiento, desea
saber si existe o no diferencia significativa con α de 0.05.
Uro cultivo antes y después del tratamiento con el nuevo medicamento
X T = N(n + 1)
4
XT = 30(30 + 1) = 232.5
4
T = √ N ( N +1 )(2 N +1 )
24
T = √ 30(30+1)(2(30 )+1)
24
Paso 7: Obtener ZT
= 48.62
T −X T
ZT =
σT
118−232.5
ZT = =−2.35
48.61
X2 =
Donde:
X2: chi cuadrada.
o: frecuencia observada.
e: frecuencia esperada.
PROBLEMA
Un médico oncólogo ha tratado a 120 pacientes de un cáncer maligno, aplicó 4
tipos de terapia y la mortalidad observada fue diferente para cada grupo. Analizó
sólo el caso de los pacientes que fallecieron a fin de saber si la toxicidad fue
distinta.
Frecuencia de mortalidad en 4 tipos de tratamiento
Valores radiación + radiación + radiación solo total
droga 1 droga 2 + droga 4 radiación
Observad 15 7 8 6 36
o
Esperado 9 9 9 9 36
36/4 = 9
X2 =
X2 =
X2 =
X2 = 4 + 0.44 + 0.11 + 1
X2 = 5.55
gl = K-1
gl = 4 - 1
gl = 3
EDAD EN 10 - 14 15 - 19 20 - 24 25 – 29 Total
AÑOS
VARIABLES
Valores 20 40 10 15 85
observados
Valores esperados 21.25 21.25 21.25 21.25 85
x2 (p < 0.05).
Paso 6: Conclusiones.
H1: Existe diferencia significativa entre los jóvenes, con respecto al consumo de
estupefacientes
X2 =
PROBLEMA
Un investigador cree que existe asociación en el consumo excesivo de
carbohidratos con relación a la obesidad. Se desea un de 0.05.
Obesidad
Consumo de
carbohidratos
SI NO
Si 15 A B 5 20
No 6 C D 10 16
Total 21 15 36
X2 =
36
36[ ( 150−30 )− ]
X =
2
2
( 15+5 ) ( 6+10 ) ( 15+6 ) (5+10)
36[120−18 ]
X2=
( 20 )( 16 )( 21 ) (15)
374,544
X2= =3.71
100,800
gl = (C - 1)(r - 1)
C = columnas r = renglones
gl = (2 - 1)(2 - 1)
gl= 1
Paso 4: Obtener el valor crítico con de 0.05.
gl = 1
X2 = 3.71
Valor crítico = 3.84
X2(p >05)
No es significativa
Paso 5: Conclusiones.
La distribución no es diferente de la distribución normal por lo que existe relación
entre el consumo excesivo de carbohidratos y la obesidad.
Otra fórmula para obtener X2 con corrección de Yates es la siguiente
X2 =
PROBLEMA
Un investigador cree que existe una relación entre el tabaquismo y el cáncer
broncogénico. Desea un de 0.05, en una tabla de 2x2.
T Cáncer bronco génico
A si no Total
B
A Si 80 60 140
Q No 5 70 75
U Total 85 130 215
I
S
M
O
Paso 2: Obtener la tasa del daño de cáncer broncogénico con factor de riesgo.
80
Tasa del daño= x 1000 = 571.4
140
Paso 3: Obtener la tasa del daño de cáncer broncogénico sin factor de riesgo.
5
Tasa del daño= x 1000 = 66.6
75
X2 =
+ - Total
+ 80 60 140
- 5 70 75
Total 85 130 215
85 x 140
1er Valor esperado= = 55.35
215
130 x 140
2° Valor esperado = = 84.65
215
85 x 75
3erValor esperado = = 29.65
215
130 x 75
4° Valor esperado = = 45.34
215
X2 =
(80−55 .35 )2 (60−84 .65 )2 (5−29. 65 )2 (70−45. 34 )2
Σ + + +
X2 = 55 . 35 84 . 65 29 . 65 45 . 34
(607 . 62) (607 .62 ) (607 . 62) (607 .62 )
Σ + + +
X2 = 55 . 35 84 . 65 29 . 65 45 . 34
X2 = 10.97+ 7.17+ 20.49+ 13.41
X2= 52.04
X2 (p < 0.05).
Odds ratio =
(80)(70 ) 5 , 600
= =18 . 66
Odds ratio = (60)(5 ) 300
PROBLEMA
Un investigador cree que un producto de bajo peso al nacer conduce a una
mortalidad neonatal, desea saber si es o no significativa con de 0.05.
Mortalidad neonatal
Bajo peso Si No total
al nacer
Si 40 15 55
No 10 65 75
total 50 80 130
Paso 2: Obtener la tasa del daño de mortalidad neonatal con factor de riesgo.
Paso 3: Obtener la tasa del daño de mortalidad neonatal sin factor de riesgo.
10
Tasa del daño= x 1000 = 133.33
75
50
Tasa del daño= x 1000 = 384.61
130
55
Frecuencia del f.r en la muestra= x 1000 = 423.07
130
1° =
80 x 55
2° = =33.84
130
50 x 75
3° = =28.84
130
80 x 75
4° = =46.15
130
X2 =
X2= 47.27
gl = (C - 1)(r - 1)
gl= (2-1)(2-1)
gl= 1
Paso 9: Obtener el valor crítico con de 0.05.
Razón de Momios =
( 40 ) (65) 2,600
Razón de Momios= = = 17.33
( 15 ) (10) 150
Paso 10: Conclusiones.
Significativa
El bajo peso al nacer conduce a la mortalidad neonatal.
PROBLEMA
Un investigador cree que existe asociación entre las orientaciones políticas y los
métodos de crianza de los niños. Desea un de 0.05.
Orientaciones políticas
Métodos de conservador moderado liberal Total
crianza
No rígido 7 9 14 30
Moderado 10 10 8 28
Autoritario 15 11 5 31
Total 32 30 27 89
30 x 30
2° Valor esperado = = 10.11
89
27 x 30
3erValor esperado = = 9.10
89
32 x 28
4° Valor esperado = = 10.06
89
30 x 28
5° Valor esperado = = 9.43
89
27 x 28
6° Valor esperado = = 8.49
89
32 x 31
7° Valor esperado = = 11.14
89
30 x 31
8° Valor esperado = = 10.44
89
27 x 31
9° Valor esperado = = 9.40
89
X2 =
X2 =
X2 =
(7−18 . 78)2 (10−10. 06 )2 (15−11 .14 )2 (9−10 .11 )2 (10−9 . 43 )2 (11−10 . 44 )2
Σ + + + + +
18 . 78 10 .06 11 . 14 10 .11 9 . 43 10 . 44
2 2 2
(14−9 . 10) (8−8 . 49 ) (5−9 . 49 )
+ + +
9 . 10 8 . 49 9 . 49
X2 = 7.38+ 0.00+ 1.33+ 0.12+ 0.03+ 0.03+ 2.63+ 0.02+ 2.12
X2= 13.66
gl = (C - 1)(r - 1)
gl=(3-1)(3-1)
gl=(2)(2)
gl=4
X2 (p < 0.05).
Paso 6: Conclusiones.
Existe asociación entre las orientaciones políticas y los métodos de crianza de los
niños.
Requisitos de la x2
1) No requiere de una distribución normal.
2) Comparaciones entre dos o más muestras independientes, requiere una
tabla de 2x2.
3) No se utiliza en mediciones antes y después.
4) Utilizan datos normales.
5) Muestreo aleatorio de una población determinada.
6) Las frecuencias esperadas no deben ser demasiadas pequeñas, para una
tabla de 2x2, ninguna frecuencia esperada será menor de 5.
7) Para una corregida de Yates debe usarse una tabla de 2x2. en el cual una
casilla esperada es menor de 10.
8) En comparaciones de tablas de 3x3, o 4x5, no existe ninguna regla rápida.
9) La suma de las frecuencias esperadas debe ser el mismo número de
casillas observadas.
PRUEBA DE LA PROBABILIDAD EXACTA DE FISHER
Esta prueba es una técnica no paramétrica sumamente útil para analizar datos
concretos (nominales u ordinales).
Se usa cuando los puntajes de 2 muestras independientes pertenecen
respectivamente a clases mutuamente excluyentes. Los puntajes se representan
en una tabla de contingencia de 2x2, pueden ser dos grupos independientes
cualesquiera, como experimentales y controles, hombres y mujeres, empleados y
no empleados, etc.
Los encabezados pueden ser más o menos, por encima o por debajo de la
mediana, aprobado o reprobado.
PROBLEMA
Un investigador cree que existe asociación con cierto tipo de lesión de ligamento
con respecto al dolor. Utilice de 0.05.
P=
1.377576 x 1025
P=
1.271306 x 1027
P= 0.010
Paso 2: Conclusiones.
X2(p<0.05)
Este procedimiento es útil cuando las muestras son dos y resultan dependientes.
El tipo de escala utilizado es la nominal, dicha prueba es un equivalente de la “t de
Student” y sólo es aplicable cuando existen dos momentos antes y después.
PROBLEMA
Un investigador de medicina preventiva observa que los empleados en una fábrica
padecen frecuentemente de cuadro diarreico motivo del gran ausentismo. El
supone que existe una higiene inadecuada en la proporción de la comida. Sin
embargo la higiene personal de los empleados no es suficiente para atribuir la
culpa personal de la cocina por lo tanto elige una muestra de 50 individuos, de los
que resultan 34 presentando cuadros diarreicos frecuentes y 16 no. Vigila que se
apliquen las medidas de higiene del personal con un exhaustivo lavado de mano
antes de ingerir los alimentos durante un periodo de 2 semanas.
Antes de + - total
lavado de + 18 a b 16 34
manos - 4 c d 12 16
total 22 28 50
gl = (C - 1)(r - 1)
gl= (2)(2)
gl= 4
X2 (p< 0.05).
Paso 5: Conclusiones
Existe diferencia significativa
Existe relación entre el cuadro diarreico presentado por los empleados y la mala
higiene de los cocineros.
PROBLEMA
Un psicólogo está interesado en la iniciación de los niños en los contactos
sociales. Ha observado que los niños recién llegados a una guardería suelen
iniciar sus contactos personales con adultos. Predice que con la creciente
familiaridad y experiencia los niños iniciarán cada vez más contactos sociales con
los niños.
Cambios en los objetivos de la iniciación de los niños
OBJETIVOS DE LA INICIACION AL DIA 30
Adulto 4 a b 14 18
Niño 4 c d 3 7
8 17 25
gl = (C - 1)(r - 1)
gl= (2-1)(2-1)
gl=(1)(1)
gl=1
X2 (p < 0.05).
Paso 5: Conclusiones.
Significativa.
Con la creciente familiaridad y experiencia los niños iniciarán cada vez más
contactos sociales con los niños.
Las pruebas de proporciones son adecuadas cuando los datos que se están
analizando constan de cuentas o frecuencias de elementos de dos o más clases.
El objetivo de estas pruebas es evaluar las afirmaciones con respecto a una
proporción (o Porcentaje) de población.
las pruebas para medias y proporciones se pueden utilizar para evaluar
afirmaciones con respecto a:
1) Un parámetro de población único (prueba de una muestra)
2) La igualdad de parámetros de dos poblaciones (prueba de dos muestras), y
3) La igualdad de parámetros de más de dos poblaciones (prueba de k muestras).
Además, para tamaños grandes de muestras, la distribución de muestreo
adecuada para pruebas de proporciones de una y dos muestras es
aproximadamente normal, justo como sucede en el caso de pruebas de medias de
una y dos muestras.
Esta prueba comprende el cálculo del valor estadístico de prueba Z
~
P−P0
Z= √
( p o −q o
n )
PROBLEMA
En una investigación de consumidores de drogas en una ciudad grande
encontraron 18 de 423 individuos con VIH positivo. Se pretende saber si es
posible concluir que menos de 5% de consumidores en la población muestreada
tienen VIH.
~
p = 18/423=0.426
Ho= p= 0.05
H1= p<0.05
0 . 425−0 . 05
Z= √(
(
0 . 425−0 . 95
423 )
=0.018
Diga si es o no significativa
Conclusiones
Z (p>0.05)
La proporción de la población que tiene VIH positivo probablemente sea de 0.05 o
más.
PRUEBA DE PROPORCIONES DE DOS MUESTRAS
Ejemplo ilustrativo
Se ponen a prueba la enseñanza de la Estadística empleando Excel y Winstats.
Para determinar si los estudiantes difieren en términos de estar a favor de la
nueva enseñanza se toma una muestra de 20 estudiantes de dos paralelos. De
paralelo A 18 están a favor, en tanto que del paralelo B están a favor 14. ¿Es
posible concluir con un nivel de significación de 0,05 que los estudiantes que están
a favor de la nueva enseñanza de la Estadística es la misma en los dos
paralelos?.
Los datos son:
Datos.
Diga si es o no significativa
Significativa
Conclusiones
La prueba que se utiliza con más frecuencia con relación a la diferencia entre las
proporciones de dos poblaciones es aquella en la que su diferencia es cero. Es
posible probar que dicha diferencia es igual a otro valor. Se pueden efectuar
pruebas tanto unilaterales como bilaterales.
Prueba de hipótesis
Ho.- p1-p2 = 0
H1.- p1-p2 ≠0
Problema
Hipótesis
Ho: p1= p2
H1: p1>p2
X1+ X2
p=
n1 +n 2
24+36 60
p= = =0.29
55+149 204
x1 x2
−
n 1 n2
Zprueba=
√ P ( 1−p ) (
1 1
+ )
n1 n2
24 36
−
55 149
Zprueba=
√ 0.29 (1−0.29 ) (
1
+
1
55 149
)
0.43−0.24
Zprueba=
√ ( 0.2059 ) (0.018+0.006)
0.19 0.19
Zprueba= =
√ 0.0032 0.056
Zprueba=3.39
Diga si es o no significativa
Z (p<0.05)
Significativa
INDEPENDIENTES
PROBLEMA
En un hospital se trataron por el método clásico 80 casos de viruela, de los cuales
murieron 24, con una letalidad de 30 %. Otros 120 casos fueron sometidos a un
nuevo tratamiento con 30 fallecimientos, con una letalidad del 25 %. Se desea
saber si existe diferencia significativa con de 0.05.
(E.E.) P1 - P2 =
Donde:
p0 : letalidad global = 27%
q0 : 100 - p0 = 100 - 27 = 93%
: número de individuos en la primera muestra = 80
: número de individuos en la segunda muestra= 120
(E.E.) P1 - P2 = 80 √
1971 1971
+
120
1 - P2 = √ 24.63+16.42=√ 41.05
(E.E.) P
(E.E.) P1 - P2 = 6.40
= 0.78
Z (p < 0.05).
Paso 9: Conclusiones.
Significativa.
Existe diferencia significativa entre el tratamiento clásico y el nuevo con respecto a
la letalidad.
Problema
200 pacientes que sufrían síndrome X fueron divididos al azar en dos grupos
iguales; el primer grupo recibió tratamiento estándar; 78 se recuperaron en un
plazo de 3 días. De los otros 100 tratados con un nuevo método, 90 se
recuperaron en 3 días. El investigador cree que existe diferencia de que el nuevo
tratamiento es más efectivo que el estándar.
(E.E.) P1 - P2 =
(E.E.) P
1 - P2 =√(84 )(16 ) (84 )(16)
100
+
100
Z (p > 0.01).
No significativa
Paso 9: Conclusiones.
Se acepta H0, por lo tanto se comete un Error tipo II
No existe diferencia significativa entre el tratamiento estándar y el nuevo
tratamiento.
Z=
PRUEBA Q DE COCHRAN
Para tres o más muestras dependientes.
Es una prueba que puede considerarse como una extensión de la prueba de
McNemar.
El grupo sirve como su propio control, en el que existe un periodo previo y otro
ulterior
La escala es de tipo nominal.
Esta técnica se distribuye igual de la ji cuadrada, por lo tanto se expresa como x 2q.
FORMULA
X2Q= ( K−1 ) ¿ ¿
DONDE:
X2Q . = es la estadística de q de Cochran
K.- número de tratamientos.
Gn.- número total de respuestas de cambio por individuo de la muestra o hileras y
∑.= sumatoria.
PROBLEMA
Un psicólogo investiga el aprendizaje simple en 15 ratas a las que se les aplica
cuatro tratamientos diferentes a intervalos de un mes cada uno, para lo cual utiliza
cuatro laberintos distintos. Los tratamientos corresponden a 4 fármacos que según
afirman los fabricantes, tiene la capacidad para facilitar el aprendizaje.
Cada vez que ocurre un tratamiento aleatorizado.
Determina el investigador un periodo crítico de respuesta de la rata en estudio.
Con esto determina si fueron positivos o negativos.
PASO.1 Elaborar Ho y H1
HO : No existe diferencia entre los 4 tratamientos aplicados a las ratas.
H1: Existe diferencia entre los 4 tratamientos aplicados a las ratas.
PASO 2.- Arreglar la muestra individualmente de a cuerdo con las respuestas de
cambio.
X2Q= ( K−1 ) ¿ ¿
X2Q= ( 4−1 ) ¿ ¿
( 3 ) (99) 297
X2Q= =
49 49
X2Q= 6.06
PASO 8.- obtener los valores críticos en la tabla de chi cuadrada con alfa de 0.05.
Paso 9: Conclusiones
No existe diferencia entre los 4 tratamientos aplicados a las ratas y su efecto en
ellas.