Manual Estadística Completo

PROBABILIDAD
La probabilidad es la posibilidad de que ocurra un evento.
La probabilidad va de 0 a 1.
FORMULA GENERAL
p = h/n
La probabilidad es igual al número de eventos que ocurre en determinado

momento sobre el total de eventos.
PROBLEMAS
1).- Obtener la probabilidad de que en una tirada de una moneda obtenga águila.
p = h/n = 1/2 = 0.50
2).- ¿Cuál es la probabilidad de que en una tirada de dado salga 6?
p = h/n = 1/6 = 0.16
3).-¿Cuál es la probabilidad de que en una tirada de dado salga el 2 o el 4?
p = h/n = 2/6 = 0.33
4).- ¿Cuál es la probabilidad de que salga un as de un conjunto de barajas si el

total de barajas es de 40?
p = h/n = 4/40 = 0.1
REGLAS DE LA PROBABILIDAD
1- REGLA DE LA SUMA: afirma que la probabilidad de obtener un resultado,

cualquiera entre varios diferentes, es igual a la suma de sus distintas
probabilidades.
PROBLEMA
 ¿Qué probabilidad hay de obtener el 1 en una tirada de dado?
p = h/n = 1/6 = 0.16

p = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1
2- REGLA DE LA MULTIPLICACION: afirma que la probabilidad de obtener una
combinación de resultados que se excluyen mutuamente es igual a la suma de las
probabilidades por separado.
PROBLEMA
¿Cuál es la probabilidad de que salga águila al lanzar 2 veces consecutivas la
moneda?
p = h/n = 1/2 = 0.50
p = 1/2 x 1/2 = 1/4 = 0.25
La regla de la suma supone que los resultados se excluyen mutuamente y que no

pueden ocurrir simultáneamente dos resultados.
PROPIEDADES ELEMENTALES DE LA PROBABILIDAD
1).- Todos los eventos deben tener una probabilidad mayor que o igual a 0.
Un concepto clave en el enunciado de esta propiedad.
2).- La suma de la probabilidad de todos los resultados mutuamente exclusivos es
igual a 1.
La probabilidad va de 0 a 1.
p {E1} + p {E2}... = 1
3).- Probabilidad de la ocurrencia: la probabilidad de la ocurrencia {E 1} o {Ej} es

igual a la suma de las probabilidades individuales.
Por lo tanto la probabilidad de la ocurrencia es igual a la probabilidad de un
evento.
p = p {E} h/n (probabilidad de la ocurrencia)
q = 1-p {E} ó q = {no E}; 1-p = (probabilidad de no ocurrencia)
PROBLEMAS
1).- ¿Cuál es la probabilidad de que en una tirada de dado no salga el 3 o el 4?

q=1-p
q= 1 – h/n
q=1 – 4/6
q = 1 - 0.66
q= 0.34
2).- ¿Cuál es la probabilidad de que no salga un as en un conjunto de barajas?
q = 1- p
q = 1- h/n
q = 1- 36/40
q = 1- 0.9
Q= 0.1
3).- ¿Cuál es la probabilidad de que caiga águila en tres tiradas consecutivas de
una moneda?
p = h/n
p=½x½x½
p = 0.125
4).- ¿Qué probabilidad hay de que en una tirada de dados no salga el 4 o 5?

Q= 1-p
Q= 1-2/6
Q= 2/3
Q= 0.666
PROBABILIDAD BINOMIAL
La probabilidad binomial es una teoría de grandes muestras, esta distribución se
obtiene de un proceso conocido como Ensayo deBernoulli. Cuando un solo
ensayo o experimento puede conducir a uno de los resultados mutuamente
exclusivos tales como muerto o vivo, masculino o femenino, enfermo o saludable,
el ensayo conduce a lo que se llama Ensayo de Bernoulli.
Condiciones del Ensayo de Bernoulli:
1) Cada ensayo conduce a uno de los resultados posibles mutuamente exclusivos,

uno de los resultados posibles se denomina como éxito y el otro como fracaso.
2) La probabilidad de éxito se denota por “p” y permanece constante de ensayo
en ensayo y la probabilidad de fracaso como 1-p se denota por “q”.
3) Los ensayos son independientes, es decir, el resultado de cualquier ensayo
particular no es afectado por el resultado de cualquier otro ensayo.
PROBLEMA
En cierta población el 52 % de todos los nacimientos registrados son varones,
entonces p de un nacimiento registrado es de 0.52. Si de esta población se
seleccionan al azar 5 nacimientos, ¿Cuál es la probabilidad de que exactamente 3
de los registros sean de nacimientos varones?
n=5
x=3
1º) pppqq 6º) ppqpq
2º) pqqpp 7º) pqpqp
3º) qqppp 8º) qpqpp
4º) ppqqp 9º) qpppq
5º) pqppq 10º) qppqp
P= 0.52
Q= 1-p = 1- 0.52 =0.48
PROBLEMA
En Veracruz el Pie de Atleta es común. De una muestra al azar de 6 ¿Qué
probabilidad hay de que 4 tengan la enfermedad, si la frecuencia es del 40 %?
n=6
x=4
p = 0.40 x 4 2
p= ( p) (q)
q = 1-p = 1-0.40 = 0.60 n
4 2
p=15 (0.40) (0.60)
n n! 6!
= = p=15 ( 0.025 )( 0.36)
x x ! n−x ! 4 ! ( 6−4 ) !
p=0.138
n 720
= =15
x 24 ( 2 )
PROBLEMA
En Escárcega el 80 % tiene parasitosis. Si se obtiene una muestra de 10 ¿Cuál es
la probabilidad de que 5 tengan la enfermedad?
p = 0.80
q = 1 - p = 1 - 0.80 = 0.20 x
n = 10 p= ( p)4 (q)2
n
x=5
p=252( 0.80)5 ( 0.20)5
n n! 10!
= =
x x ! n−x ! 5 ! ( 10−5 ) ! p=252 ( 0.327 )(3.2 x 10−4 )
n 3628800 3628800 p=0.026

= = =252
x 120 ( 120 ) 14400
PROBLEMA
La frecuencia de toxoplasmosis en las mujeres es del 40 %. Se obtiene una
muestra de 8 ¿Qué probabilidad hay de que 3 tengan la enfermedad?
p = 40 % = 0.4
q = 1 - p = 1 - 0.4 = 0.6
n=8
x=3
n!
J (x) = (n/x ) = q n - x px
x! n - x!
n n! 8!
J ( x )= = =
x x ! n−x ! 3 ! ( 8−3 ) !
n 40320 40320
= = =56
x 6 ( 120 ) 729
DISTRIBUCION Z
Para este capítulo de toma de decisiones el planteamiento de la hipótesis de

nulidad y alterna juega un papel muy importante, así como el nivel de confianza.
NIVEL DE CONFIANZA
Para establecer si una diferencia muestral obtenida es estadísticamente

significativa, resultado de una diferencia poblacional real debe establecerse un
nivel de confianza y un nivel de significancia, nivel de probabilidad en el cual se
puede rechazar la hipótesis nula y se puede aceptar con confianza la hipótesis de
investigación.
El nivel de significancia más utilizado a conveniencia es de 0.05, es decir, que
estamos dispuestos a rechazar la hipótesis nula si una diferencia muestral
obtenida ocurre casualmente solo 5 veces o menos entre 100, o sea 5 %, según la
figura:
2.5 % 47.5 % 0 47.5 % 2.5 %
Sin embargo hay otros investigadores que utilizan un nivel de confianza de 0.01 y
0.001.
Rechazar la hipótesis de nulidad cuando se debería aceptar se conoce como
Error alpha o Error tipo I.
Error tipo II o beta se presenta cuando se acepta la hipótesis de nulidad y ésta
debe ser rechazada, el método para reducir el riesgo de este error es aumentar el
tamaño de la muestra para que exista una diferencia poblacional real
PROBLEMA
Un investigador cree que los hombres difieren de las mujeres con respecto al
etnocentrismo. Desea saber si esta diferencia es significativa con un nivel de
confianza de 0.05.
Diferencia entre mujeres y hombres con respecto al etnocentrismo.
No. De Mujeres Hombres

Casos X1 X2 X12 X22
1 3 2 9 4
2 4 2 16 4
3 2 4 4 16
4 3 3 9 9
5 5 5 25 25
6 6 6 36 36
7 7 4 49 16
8 1 6 1 36
9 2 7 4 49
10 3 8 9 64
11 4 4 16 16
12 5 5 25 25
13 2 7 4 49
14 2 3 4 9
15 3 9 9 81
16 4 5 16 25
17 5 1 25 1
18 3 2 9 4
19 4 2 16 4
20 5 3 25 9
21 6 4 36 16
22 7 2 49 4
23 8 6 64 36
24 9 5 81 25
25 2 7 4 49
26 3 9 9 81
27 4 6 16 36
28 3 5 9 25
29 5 4 25 16
30 4 3 16 9
31 6 2 36 4
32 7 2 49 4
33 8 1 64 1
34 1 3 1 9
35 1 5 1 25
TOTAL 147 152 771 822
Paso 1: Elaborar H0 y H1
H0: Los hombres no difieren de las mujeres con respecto al etnocentrismo.
H1: Los hombres difieren de las mujeres con respecto al etnocentrismo.
Paso 2: Elaborar la prueba de hipótesis
H0: µ = µ
H1: µ ≠ µ
Paso 3: Determinar la media.
 x1 147
1 = = = 4.2
n1 35
 x2 152
2 = = = 4.34
n2 35
Paso 4 : Obtener la desviación estándar de cada grupo.
S1 =
771
S1= 35 √
−17 . 64
S1= √ 4.38
S1= 2.09
S2 =
822
S2= 35 √
−18 . 83
S2= √ 23.48−18.83
S2= √ 4.65
S2= 2.15
Paso 5: Encontrar el error estándar de cada media.
S1 2.09
 1 = = = 0.35
√ 35−1
S2 2.15
 2 = = = 0.36
√ n2−1
Paso 6: Encontrar el error estándar de la diferencia.
dif =
dif = √(0 .35 )2+(0 .36 )2

dif = √ 0..1225+0.1296
dif = √ 0.2521
dif = 0.5020
Paso 7 : Obtener ”Z ”.
1 - 2 4.2- 4.34 -0.14

Z= = = = -0.27
dif 0.5020 0.5020
Paso 8: Obtener la razón de “Z” con  de 0.05.
1.00 - 0.05 = 0.95

0.95 / 2 = 0.475
- 1.96 0 + 1.96
-0.27
No significativa, Z (p 0.05).
Paso 9: Conclusiones.
El valor de Z obtenido es menor de acuerdo con el valor o razón crítica, Z (p 

0.05) no significativo. Se acepta H0 y se rechaza H1.
Por lo tanto, no existe diferencia significativa entre los hombres y las mujeres con
respecto al etnocentrismo.
Un investigador cree que los diabéticos mayores de 10 años de evolución tienen
diferente concentración de creatinina en relación a los diabéticos (DM) de 5 años
de evolución. Desea saber si existe o no diferencia significativa con α de 0.05.
Comparaciones entre diabéticos de diferentes años de evolución, con respecto a

la concentración de creatinina.
Casos x1:diabéticos de 10 x2:diabéticos x12 x22

años de evolución de 5 año de
evolución
1 5 4 25 16
2 3 6 9 36
3 2 7 4 49
4 8 8 64 64
5 3 9 9 81
6 3 3 9 9
7 4 4 16 16
8 2 9 4 81
9 6 9 36 81
10 6 9 36 81
11 5 2 25 4
12 8 3 64 9
13 3 10 9 100
14 4 2 16 4
15 7 5 49 25
16 9 3 81 9
17 3 7 9 49
18 8 4 64 16
19 8 5 64 25
20 5 8 25 64
21 8 4 64 16
22 7 10 49 100
23 6 5 36 25
24 5 7 25 49
25 4 8 16 64
26 2 5 4 25
27 6 8 36 64
28 7 9 49 81
29 10 5 100 25
30 6 6 36 36
TOTAL 163 184 1033 1304
Paso 1: Elaborar H0 y H1.
H0: Los diabéticos con más de 10 años de evolución no tienen diferente

concentración de creatinina en relación a los diabéticos de 5 años de evolución.
H1: Los diabéticos con más de 10 años de evolución tienen diferente

concentración de creatinina en relación a los diabéticos de 5 años de evolución.
Paso 2: Obtener la prueba de hipótesis.
H01 = 2
H11≠2
Paso 3: Obtener la media de cada grupo.
 x1 163
1 = = = 5.43
n1 30
 x2 184
2 = = = 6.13
n2 30
Paso 4: Obtener la desviación estándar de cada grupo
S1 =
1033
S1= 30 √−29 . 48
S1= √ 34.43−29.48
S1= √ 4.95
S1= 2.22
S2 =
1304
S2= 30 √−37 .57
S2= √ 43.46−37.57
S2= √ 5.89
S2= 2.42
Paso 5: Hallar el error estándar de cada media.
S1 2.22
 1 = = = 0.412
S2 2.42
 2 = = = 0.449
√ n2−1
Paso 6: Hallar el error estándar de la diferencia.
dif =
dif = √(0 . 412)2+(0 . 449)2

dif = √ 0.169+0.201
dif = √ 0.37
dif = 0.608
Paso 7 : Obtener “Z”.
1 - 2 5.43 – 6.13 -0.7

Z= = = = -1.15
dif 0.608 0.608
Paso 8: Obtener la razón de “Z” con  de 0.05.
* Nota : cuando en la hipótesis alterna se maneja ““ ó ““ , el valor de  se

duplica.
0.05 x 2 = 0.10
1.00 - 0.10 = 0.90
0.90 / 2 = 0.45
Buscando en la tabla Z el número más cercano = 0.4505

Los valores para la línea crítica son 1.6 y 0.05, se acomodan como 1.65 y ese es
el valor crítico.
- 1.65 0 + 1.65
-1.15
Como Z = -1.15, éste valor se encuentra fuera de la zona crítica, por lo tanto Z
(p > 0.05) por lo que es no significativa.
La diferencia entre las medias observadas no es significativa,

Z (p > 0.05). Se acepta H0 y se rechaza H1.
Por lo tanto los diabéticos con más de 10 años de evolución tienen la misma
concentración de creatinina en la sangre en relación a los diabéticos de 5 años de
evolución.
MUESTRAS RELACIONADAS CON MEDICIONES ANTES Y DESPUÉS PARA

ESTUDIOS CUASIEXPERIMETALES. GRANDES MUESTRAS.
PROBLEMA
Un investigador desea saber si existe diferencia en la concentración de de 7α-

HCO entre medición al inicio y un mes después de la cirugía. Desea unα 0.01
Pacientes antes después D d2

1 3.9 23.8 -19.9 396.01
2 18.6 39.7 -21.1 445.21
3 10.6 11.3 -0.7 0.49
4 3.0 5.6 -2.6 6.76
5 46.4 98.4 -52 2704
6 6 18.5 -12.5 156.25
7 8.3 17.5 -9.2 84.64
8 15.3 30 -14.7 216.09
9 20.7 41.4 -20.7 428.49
10 14.4 43.3 -28.9 835.21
11 9 23.6 -14.6 187.69
12 16 42.1 -26.1 681.21
13 55.4 28.1 27.3 750.76
14 51. 69.6 -18.4 338.56
15 37.4 51.2 -13.8 190.44
16 24.3 31.5 -7.2 51.84
17 29 27.1 1.9 3.61
18 15. 18.8 -3.8 9.61
19 4.1 3.9 0.2 0.04
20 25.6 35 -9.4 88.36
21 15.4 25.1 -9.7 102.01
22 15.2 50.9 -35.7 1274.49
23 24.2 29 -4.8 23.04
24 27.2 42 -14.8 219.04
25 35.1 33 2.1 4.41
26 13.4 39 -25.6 655.36
27 32 39.3 -7.3 53.29
28 11.1 98.8 -87.7 7691.29
29 27.6 108.2 -80.6 6496.36
30 11.5 44.8 -33.3 1108.89
31 25.3 144.6 -119.3 14232.49
32 34.8 82.9 -48.1 2313.61
33 34.3 97.4 -63.1 3981.61
34 31 31.7 -0.7 0.49
35 58.3 66.8 -8.5 72.25
36 32 38.3 -6.3 39.69
37 22.1 30.9 -8.8 77.44
38 12.5 35.9 -23.4 547.56
39 32.6 86.4 -53.8 2894.44
40 21.5 25.3 -3.8 14.44
41 24.5 35.2 -10.7 114.49
42 27.3 80.8 -53.5 2862.25
43 42.4 65.4 -23 29
44 37.1 20.7 16.4 268.96
45 45.2 93.9 -48.7 2371.69
46 37.3 78.5 -41.2 1697.44
47 29.8 31.9 -2.1 4.41
48 17.4 52.4 -35 1225
49 25.7 20.7 5 25
50 46.3 48.1 -1.8 3.24
51 25.5 35.5 -10 100
Total 1289.6 2373.8.2 58603.26
Paso 1: Elaborar H0 y H1 .
H0: No existe diferencia en la concentración de de 7α-HCO al inicio y un mes

después de la cirugía.
H1:Existe diferencia en la concentración de de 7α-HCO al inicio y un mes

H01 = 2
H11≠2
Paso 3 : Encontrar la media para cada punto en el tiempo.
Ʃ x1 1289
1 = = = 25.28
n1 51
x2 2373.8
2 = = = 46.54
n2 51
Paso 4: Encontrar la desviación estándar de la diferencia entre el tiempo antes y

el tiempo después.
S=
S = 51 √
58603. 26
(25 . 28−46 .54 )2
S= √ 1149−(−21 .26 )2
S= √ 1149−451 .98
S= √ 697.02
S = 26.4
Paso 5: Obtener el error estándar de la diferencia.
S 26.4 26 . 4
dif = √ N −1 = √ 50 = 7 . 0710 = 3.73
Paso 6 : Determinar la distribución “ z“ con la fórmula :
1 - 2 25.28 – 46.54 - 21.26

Z= = = = - 5.69
dif 3.73 3.73
Paso 7: obtener el valor critico con α de 0.01
1-0.01= 0.99 /2= 0.4950

Valor critico = 2.58
Paso 8: Obtener el valor crítico con  de 0.01.
- 2.58 0
- 5.69
Significativa, t (p  0.01).
La diferencia entre las medias observadas fue estadísticamente significativa,

Z (p  0.01). Se acepta H1 y se rechaza H0.
Existe diferencia en la concentración de de 7α-HCO medida al inicio y un mes
PRUEBA DE HIPÓTESIS PARA LA MEDIA DE UNA SOLA POBLACIÓN
PROBLEMA
En un estudio en función de las grasas en la etiología de las enfermedades
isquémicas del corazón, se seleccionaron a 35 hombres entre 40 y 60 años de
edad quienes habían tenido infarto del miocardio, la variable de estudio fue ácido
linoleico (AL) en los ácidos grasos triglicéridos del plasma, el investigador desea
saber si existe o no diferencia en las concentraciones de (AL) en el grupo de
estudio en relación a una media antecedente de 30, utiliza un α=0.05.
Ac.
Casos Linoleico X2
1 18 324
2 17.6 309.76
3 9.6 92.16
4 5.5 30.25
5 16.8 282.24
6 12.9 166.41
7 14 196
8 8 64
9 8.9 79.21
10 15 225
11 9.3 86.49
12 5.8 33.64
13 8.3 68.89
14 4.8 23.04
15 6.9 47.61
16 18.3 334.89
17 24 576
18 16.8 282.24
19 12.1 146.41
20 12.9 166.41
21 16.9 285.61
22 15.1 228.01
23 6.1 37.21
24 16.6 275.56
25 8.7 75.69
26 15.6 243.36
27 12.3 151.29
28 14.9 222.01
29 16.9 285.61
30 5.7 32.49
31 14.3 204.49
32 14.1 198.81
33 14.1 198.81
34 15.1 228.01
35 10.6 112.36
Total 442.5 6313.97
H0: Existe diferencia en las concentraciones de ácido linoleico en los ácidos

grasos triglicéridos del plasma en pacientes con isquemia del corazón con
antecedentes de infarto del miocardio en relación a una media antecedente.
H1: Existe diferencia en las concentraciones de acido linoleico en los ácidos

grasos triglicéridos del plasma en pacientes con isquemia del corazón con
antecedentes de infarto del miocardio en relación a una media antecedente.
H01 = µ2
H11  µ2
Paso 3: Obtener la media.
x 442.5
= = = 12.64
N 35
Paso 4: Obtener la desviación estándar.
S=
S= 35√
6313. 97
−(12 . 64 )2
S= √ 180.39−159.76
S= √ 20.63
S = 4.54
Paso 5:Obtener “ z “ con la formula:
Z=
12. 64−30
Z = 4.54 / √ 35
−17 .36
Z = 4. 54/5 . 91
−17. 36
Z= 0.76
Z= - 22.84
- 1.96 0 + 1.96
-22.84
Significativa, z(p0.05).
z(p0.05), por lo tanto se acepta la H1 y se rechaza la H0 aceptando que existe
una diferencia significativa entre las concentraciones de ácido linoleico en relación
a una media antecedente de 30.
REQUISITOS PARA LA UTILIZACIÓN DE LA DISTRIBUCIÓN Z
1) Sirve para comparar entre dos medias independientes o de una sola

muestra en diseño antes y después.
2) Utiliza datos de intervalo, de puntajes o escalares.
3) El muestreo debe haberse obtenido en forma aleatoria de una población de
puntajes.
4) Se requiere que las muestras estén normalmente distribuidas en la
población, sin embargo no es estrictamente necesario.
5) Esta técnica debe utilizarse para mayores de 30 casos.
6) Debe cumplir una distribución normal con varianzas homogéneas.
DISTRIBUCIÓN t STUDENT
MUESTRAS INDEPENDIENTES
Un investigador busca comprobar la hipótesis de que el comportamiento caritativo

varía según si la donación se hace anónimamente o si se da a conocer la
identidad del donante. Desea un nivel de significancia de 0.05.
H0: El comportamiento no varía según si la donación se hace anónimamente o

sabiendo la identidad del donante.
H1: El comportamiento varía según si la donación se hace anónimamente o

sabiendo la identidad del donante.
Paso 2:Obtener la prueba de hipótesis.
H0: µ = µ
H1: µ ≠ µ
Paso 3:Con los siguientes datos obtener el promedio de cada muestra.

X1: Identidad X2: Identidad
N casos X12 X22
desconocida conocida
1 1 3 1 9
2 2 5 4 25
3 1 5 1 25
4 1 5 1 25
5 2 4 4 16
6 1 5 1 35
total 8 247 12 125
X1=
∑ X1
n1
8
X1=
6
X 1 =1.3
X2=
∑ X2
n2
27
X2=
6
X 2 =4.5
Paso 4: Obtener la desviación estándar de cada grupo.
S1 =
S1 = √ 12
6
−(1 . 3)2 =√ 2−1 .69
S1 = √ 0.31
S1 = 4.54
S2 =
S2 =
125
6 √
−(4 . 5)2
S2 = √ 20. 83−20 .25=√ 0.58

S2 = 0.76
Paso 5:Encontrar el errorestándar de cada media.
S1
X1
Ϭ = √n 1−1
0 . 55
X1
Ϭ = √ 6−1
0. 55 0 .55
X1 = =0. 24
Ϭ = √ 5 2. 23
S2
= √ n 2−1
X2
Ϭ
0 . 76
X 1 = √6−1
Ϭ
0. 76 0 .76
X1 = =0 .34
Ϭ = √5 2 .23
Paso 6:encontrar el error estándar de la diferencia
dif =
dif = √(0 .24 )2 +(0 . 34 )2

dif = √ 0.057+0.115
dif = √ 0.172
dif = 0.41
Paso 7: Obtener “t” con la fórmula:
X 1− X 2 1.3−4.5
t= =
σ dif 0.41
T= -7.80
Paso 8: Buscar los grados de libertad
gl= N1 + N2 – 2
gl= 6 +6 – 2
gl= 10
Paso 9: Determinar el valor crítico con α de 0.05
Valor crítico= 1.96
- 1.96 0 + 1.96
-7.80
Significativa, t (p< 0.05)
t (p < 0.05), por lo tanto se observó variación en el comportamiento caritativo

según si la donación se hizo anónimamente o sabiendo la identidad del donante.
PROBLEMA
Un investigador cree que existe diferencia en hombre y mujeres con respecto a los
puntajes del examen ordinario en la materia de Química Analítica I, en el grupo
202; utiliza un α de 0.05.
Puntajes de la materia de química analítica entre hombres y mujeres del grupo

202.
X1: Hombres X2: Mujeres X12 X22
Casos
1 8 8 64 64
2 5 4 25 16
3 6 6 36 36
4 6 9 36 81
5 9 10 81 100
6 6 8 36 64
7 6 5 36 25
8 5 7 25 49
9 5 5 25 25
Total 56 62 364 460
H0: No existe diferencia entre hombres y mujeres con respecto a los puntajes del
examen ordinario de Química Analítica I.
H1: Existe diferencia entre hombres y mujeres con respecto a los puntajes del
examen ordinario de Química Analítica I.
H01 = 2
H112
Paso 3: Encontrar la media de cada muestra.
x1 56
1 = = = 6.22
n1 9
x2 62
2 = = = 6.88
n2 9
S1 =
S1=
S1= √ 40. 44−38 .68=√ 176 = 1.32
S2 =
S2=
S2= √ 51.11−47 .33=√ 3.78 = 1.94
Paso 5: Encontrar el error estándar de cada grupo.
S1 1.32
 1 = = = 0.466
9–1
S2 1.94
 2 = = = 0.685
√ n2−1 9-1
Paso 6: Encontrar el error estándar de la diferencia.

dif =
dif = √(0 . 46 )2+(0 . 68 )2

dif = √ 0.21+0.46=√ 0.67
dif = 0.81
Paso 7: Obtener “ t “con la fórmula :
1 - 2 6.22 - 6.88 - 0.66

t= = = = - 0.81
dif 0.81 0.81
Paso 8: Buscar los grados de libertad.
gl = N1 + N2 - 2
gl = 9 + 9 - 2
gl = 16

- 2.120 0 0 + 2.120
- 0.81
No significativa, t (p  005).
La diferencia entre las medias observadas no es estadísticamente significativa

t (p  0.05). Se acepta H0 y se rechaza H1.
Por lo tanto no existe diferencia entre hombres y mujeres con respecto a los
puntajes del examen ordinario de Química Analítica I.
MUESTRAS INDEPENDIENTES DE DISTINTO TAMAÑO
PROBLEMA
Un investigador cree que los niños blancos y negros, de cierto barrio difieren con
respecto a la tendencia hacia la criminalidad; desea un nivel de significancia de
0.05.
Niños blancos y negros con respecto a la criminalidad
Caso X1 : Blancos X2 : Negros X12 X22

s
1 1.00 2.50 1 6.25
2 2.00 1.80 4 3.24
3 1.20 1.90 1 3.61
4 3.00 2.00 9 4
5 4.50 2.00 20.25 4
6 3.90 2.50 15.21 6.25
7 1.00 1
Total Sx1 = 15.6 x2 = 13.7 x12= 50.46 x2 = 28.35
2
H0: No existe diferencia entre los niños blancos y negros de cierto barrio con
respecto a la criminalidad.
H1: Existe diferencia entre los niños blancos y negros de cierto barrio con respecto
a la criminalidad
Paso 2: Obtener la prueba de hipótesis

H01 = 2
H112
x1 15.26
1 = = = 2.6
n1 6
x2 13.7
2 = = = 1.95
n2 7
S1 =
S1= 6 √
50. 46
−6 .45
S1= √ 8.41−6.45=√1.96
S1= 1.4
S2 =
S2= √
28. 35
7
−3 .80
S2= √ 4.05−3.80=√ 0.25

S2 = 0.5
Paso 5: Encontrar el error estándar de la diferencia con la fórmula :
dif =
dif = √( 6+7−2 )( )
6(1 . 4 )2 +7(0 . 5 )2 1 1
+
6 7
dif = √ 11
( 6(1 . 96)+7 (0. 25 )
)( 0. 16+0 . 14)
dif = √ 11
( 11 .76+1. 75
)( 0 . 3 )
dif = √(1.22) ( 0.3)
dif = √ 0.36
dif = 0.60
Paso 6: Obtener “ t “ con la fórmula:
1 - 2 2.6 – 1.95 0.65

t= = = = 1.08
dif 0.60 0.60
Paso 7 : Buscar los grados de libertad.

gl = N1 + N2 - 2
gl = 6 + 7 - 2
gl = 11
Buscar en la tabla de t de Student para dos colas: = 2.201
- 2.201 0 + 2.201
1.08
No significativa, t (p  0.05).
La diferencia entre las medias observadas no es estadísticamente significativa, t (p

 0.05). Se acepta H0 y se rechaza H1.
Por lo tanto no existe diferencia entre los niños blancos y negros con respecto a la
tendencia hacia la criminalidad.
PROBLEMA
Un investigador cree que existe diferencia en puntajes en la materia de Química

Analítica I entre hombres y mujeres del grupo 101 en cuanto a las calificaciones de
exámenes ordinarios. Utilice α de 0.05.
Puntaje de los alumnos en la materia de química analítica 1en los exámenes

ordinarios.
X1: X2:
Hombres Mujeres X12 X22
Casos
1 55.00 68.00 3025 4624
2 75.00 63.00 5625 3969
3 48.00 53.00 2304 2809
4 36.00 57.00 1296 3249
5 87.00 45.00 7569 2025
6 77.00 87.00 5929 7569
7 50.00 94.00 2500 8836
8 60.00 83.00 3600 6889
9 73.00 54.00 5329 2916
10 84.00 97.00 7056 9109
11 63.00 56.00 3969 3136
12 50.00 83.00 2500 6889
13 76.00 73.00 5776 5329
14 51.00 63.00 2601 3969
94.00 8836
15
16 52.00 2704
Total 885 1122 59 079 83158
H0: No existe diferencia en los puntajes en la materia de Química Analítica entre

hombres y mujeres del grupo 101 en cuanto a los exámenes ordinarios.
H1: Existe diferencia en los puntajes en la materia de Química Analítica entre

hombres y mujeres del grupo 101 en cuanto a los exámenes ordinarios.
H0 1 = 2
H1 12

x1 885
1 = = = 63.21
n1 14
x2 1122
2 = = = 70.12
n2 16
√ √
2
Σx1 59079
−x21 −(63. 21)2
S1 = n1 14 = √ 4219 .92−3995 .50 = √ 224.42 = 14.98
√ √
2
Σx 2 2 83158
−x2 −(72. 12)2
S2 = n2 = 16 = √ 5197.37−4916 .81 = √ 280.56 = 16.74
Paso 5 : Encontrar el error estándar de la diferencia con la fórmula :
dif =
dif = √( (14×14 . 98 )2 + ( 16×16. 74 )2 1 1

14 +16−2
+
14 16 )( )
dif = √( (209 .72 )2 + ( 267 . 84 )2

28 )
( 0. 07+0 .06 )
dif = √ 28
( 43782. 47+71738 . 26
) ( 0 .13)
dif = √ ( 4125.74 ) ( 0.13 ) √ 536.34
= =
23.15
Paso 6: Obtener “ t “ con la fórmula:
1 - 2 63.21- 70.12
t= = = -0.29
dif 23.15
gl = N1 + N2 -2 = 14+16 – 2= 28
gl = N1 + N2 -2
Valor crítico: 2.763
-2.763 0 +2.763
- 0.29
t (p > 0.01)
La diferencia entre las medias observadas no es estadísticamente significativa, t (p

Por lo tanto no existe diferencia en los puntajes en la materia de Química
Analítica entre hombres y mujeres del grupo 101 en los exámenes ordinarios.
COMPARACION DE LA MUESTRA MEDIDA DOS VECES: ANTES Y DESPUES
PROBLEMA
Un investigador cree que existe una mejoría en la concentración de hemoglobina

en ciertos pacientes después de la aplicación de hierro. Utiliza un  de 0.05.
Concentración de hemoglobina antes y después de la aplicación de hierro
Casos X1: antes X2 después d d2

1 12 13 1 1
2 11 13 2 4
3 13 16 3 9
4 11 14 3 9
5 12 14 2 4
6 13 14 1 1
Total 72 84 12 28
H0: No existe diferencia antes y después de la aplicación de hierro.
H1: Existe una mejoría en la concentración de hemoglobina en los pacientes,

después de la aplicación de hierro.
H01 = 2
H112
Paso 3: Encontrar la media para cada punto en el tiempo.
x1 72
1 = = = 12
n1 6
x2 84
2 = = = 14
n2 6
Paso 4: Encontrar la desviación estándar de la diferencia entre el tiempo antes y

el tiempo después.
S=
S=
S=
S=
S=
S = 0.81
dif = = = = 0.36
Paso 6: Determinar la distribución “ t “ con la fórmula :
1 - 2 12 - 14 -2
t= = = = - 5.55
dif 0.36 0.36
Paso 7 : Buscar los grados de libertad.
gl = N1 - 1
gl = 6 – 1
gl = 5
- 2.015 0 + 2.015
- 5.55
Significativa, t (p  0.05).
La diferencia entre las medias observadas es estadísticamente significativa, t (p 

0.05). Se acepta H1 y se rechaza H0.
Por lo tanto existe una mejoría en la concentración de hemoglobina en los
pacientes, después de aplicar hierro.
PROBLEMA
Un investigador cree que existe diferencia en el pulso, en hombres antes y

después de un estrés por un examen para el ingreso a la Universidad, medición
hecha a través del pulso; utilice  de 0.05.
casos x1: Antes x2: Después D d2

Medición 72 70 2 4 del pulso
1
antes y después
2 70 68 2 4
de un estrés
3 72 64 8 64
4 72 64 8 64
5 84 80 4 16
6 70 76 6 36
7 48 60 12 144
8 74 80 6 36
9 82 87 5 25
10 63 71 8 64
Total 707 720 61 457
H0: No existe diferencia en el pulso en hombres antes y después de un estrés por

un examen para el ingreso a la Universidad.
H1: Existe diferencia en el pulso en hombres antes y después de un estrés por un

examen para el ingreso a la Universidad.
H01 = 2
H112
Paso 3: Encontrar la media para cada punto en el tiempo.
x1 707
1 = = = 70.7
n1 10
x2 720
2 = = = 72
n2 10
Paso 4: Encontrar la desviación estándar de la diferencia entre el tiempo uno y el
tiempo después.
S=
S=
S=
S=
S=
S = 6.634
dif = = = = 2.21
Paso 6: Determinar la distribución “ t “ con la fórmula :

1 - 2 70.7 - 72 - 1.3
t= = = = - 0.58
dif 2.21 2.21
gl = N - 1
gl = 10 - 1
gl = 9
- 2.262 0 + 2.262
-0.58
No significativa, t (p 0.05).
La diferencia entre las medias efectuadas no es estadísticamente significativa, t (p

Por lo tanto no existe diferencia entre los hombres en el número de pulsaciones
antes y después de un estrés por el examen de ingreso a la Universidad.
T DE STUDENT EN COMPARACIÓN CON UN PROMEDIO ANTECEDENTE
PROBLEMA
Un investigador cree que existe diferencia en la concentración de ciertas
soluciones químicas. Sabe por antecedentes que el promedio es de 17 milimoles.
Obtiene una muestra de 10 con los siguientes resultados. Utilice alfa de 0.05
Concentraciones de soluciones químicas
Casos X X2
1 15.7 246.49
2 16.2 262.44
3 16.8 282.24
4 16.2 262.44
5 15.7 246.49
6 17.6 309.76
7 17.1 292.41
8 16.4 268.96
9 15.5 240.25
10 17 289
Total 164.2 2700.48
H0: No existe diferencia en la concentración de ciertas soluciones químicas, con

respecto a un grupo antecedente.
H1: Existe diferencia en la concentración de ciertas soluciones químicas, con
respecto a un grupo antecedente.
H0 1 = 2
H1 12
Paso 3: Obtener la media.
x 164.2
= = = 16.42
N 10
Paso 4: Obtener la desviación estándar.
S=
S=
S=
S=
S = 0.66
Paso 5:Obtener “ t “ con la formula:
t=
t=
t=
t=
t = - 2.9

gl = N - 1
gl = 10 - 1
gl = 9
- 2.262 0 + 2.262
- 2.9
Significativa, t (p0.05)
La diferencia entre las medias observadas es estadísticamente significativa, t (p 

Por lo tanto la concentración de milimoles es menor en el grupo estudiado en
relación al antecedente, cuyos límites de confianza con el 95 % son de 15.96 a
16.88.
PROBLEMA
Ejercicios.
Antecedentes
La hiperglucemia es el principal componente fisiopatológico, que afecta al

paciente con diabetes mellitas tipo 2 (DM2). Se considera que a partir de los 126
mg/dl en forma crónica, los pacientes con DM2 desarrollan a corto plazo algún
tipo de complicaciones agudas como infecciones. Así mismo a mediano y largo
plazo complicaciones crónicas como insuficiencia renal.
Por lo anterior la mayoría de las líneas de investigación se han dirigido para
mejorar los niveles de glucosa del paciente, mediante el uso de fármacos, dieta
baja en carbohidratos y ejercicio.
Se han podido determinar que la realización de 30 minutos de ejercicio físico de
grado moderado (trotar, correr, nadar, uso de bicicleta y ejercicio aeróbicos), si se
realizan por lo menos 3 días a la semana, logran disminuir y mantener los niveles
de glucosa.
Algunos estudios has determinado que una sesión de 30 minutos de ejercicio
moderado disminuye 10 mg/dl, de glucosa en forma estable, pero no progresiva.
Un ensayo clínico aleatorio realizado en mujeres con DM2 en EU. Presenta los
siguientes datos antes y después de una investigación con ejercicio físico a 3
meses de evaluación final, comparado con un grupo sin intervención.
Grupo de pacientes con DM2 con Grupo de pacientes con DM2

Intervención a base de ejercicio físico sin intervención
Pacientes Medición Medición Pacientes Medición Medición
Grupo1 basal final Grupo2 basal final
1 150 110 1 160 166
2 160 100 2 170 170
3 170 145 3 200 180
4 200 170 4 215 200
5 180 140 5 135 145
6 210 170 6 180 170
7 180 188 7 190 185
8 170 140 8 150 150
Total 1420 1163 1400 1366
Con la tabla de resultados de la investigación, ahora conteste las siguientes

preguntas, utilice alfa de 0.05, apóyese con el ritual de la significancia estadística
en cada pregunta.
a).- ¿cuáles fueron los resultados (promedios, t y p) y conclusiones de las

concentraciones de glucosa al inicio del estudio entre el grupo experimental y
control?.
MS/ MC/ No existe diferencia significativa entre los niveles de

= 175 = 177.5 glucosa del grupo de pacientes con y sin intervención
t= -.213
p=0.834
b).- ¿cuáles fueron los resultados (promedios, t y p) y conclusiones de las
concentraciones de glucosa al inicio y al final del grupo control?.
MS/ MC/ No existe diferencia significativa entre los niveles de

Inicio Final glucosa del grupo de pacientes del grupo de control
= 175 = 170.75 al inicio y al final
t= 1.168
p=0.281
c).- ¿cuáles fueron los resultados (promedios, t y p) y conclusiones de las

concentraciones de glucosa al inicio y al final del grupo experimental?.
Mc/ Mc/ Se observó una diferencia significativa entre los niveles

Inicio Final de glucosa en los pacientes del grupo experimental al
= 177.5 =145.37 inicio y al final de la intervención indicando una
t= 4.68 mejoría significativa
p=0.002
d).- ¿cuáles fueron los resultados (promedios, t y p) y conclusiones de las

concentraciones de glucosa al final del estudio entre el grupo experimental y
control?
Ms/ Mc/ Se observo una diferencia significativa en el grupo de

Final Final control y experimental lo que indica que la intervención
= 170.75 =145.37 si logro una mejoría en los pacientes que realizaron
t= 2.041 ejercicio físico durante 3 meses
p=0.061
REQUISITOS PARA EL USO DE LA DISTRIBUCION t
1) Se utiliza para casos menores de 30.

2) Utiliza datos de intervalo o escalas cuantitativas continuas.
3) Sirve para comparar muestras independientes, muestras de distinto tamaño y
mediciones antes y después.
4) Utiliza niveles de significancia de 0.01 y 0.05 generalmente.
Utiliza grados de libertad

ANÁLISIS DE LA VARIANZA. (ANOVA)
Con un factor
DISTRIBUCION F
PROBLEMA
Un investigador cree que existe una diferencia importante en el coeficiente de

inteligencia entre los tres grupos sociales: alta, media y baja. Desea un nivel de
significancia de 0.05.
Coeficiente de inteligencia entre los 3 grupos sociales
X1 : Alta X2 : Media X3 : Baja X12 X22 X32

Casos
1 130 120 110 16900 14400 12100
2 125 115 100 15625 13225 10000
3 130 115 90 16900 13225 8100
4 120 110 100 14400 12100 10000
5 122 112 85 14884 12544 7225
Total 627 572 485 78709 65494 47425
H0: No existe diferencia en el coeficiente de inteligencia entre los tres grupos

sociales, alta, media, y baja.
H1: Existe diferencia en el coeficiente de inteligencia entre los tres grupos sociales,
alta, media, baja.
Paso 2 : Obtener la prueba de hipótesis.
H01 = 2 = 3
H112 3
x1 627
1 = = = 125.4
n1 5
x2 572
2 = = = 114.4
n2 5
x3 485
3 = = = 97
n3 5
Paso 4: Encontrar la suma total de cuadrados.
( x total )2
s.c.total = x total -
2
N total
(627 + 572 + 485) 2

s.c.total = (78709 + 65494 + 47425) -
15
2835856
s.c.total = 191628 -
15
s.c.total = 191628 - 189057.06

s.c.total = 2570.94
Paso 5: Encontrar la suma de cuadrados entre grupos.
(x)2 (x total)2

s.c.entre grupos =  -
N N total
s.c.entre grupos = + + -
s.c.entre grupos = 78625 + 65436.8 + 47045 - 189057.06
s.c.entre grupos = 2050.54
Paso 6: Encontrar la suma de cuadrados dentro de los grupos.
s.c.dentro de los grupos = s.c.total - s.c.entre grupos
s.c.dentro de los grupos = 2570.94 - 2050.54
s.c.dentro de los grupos = 520.41
Paso 7: Encontrar los grados de libertad entre los grupos.
gl entre grupos = K – 1
gl entre grupos = 3 - 1
gl entre los grupos = 2
Paso 8: Encontrar los grados de libertad dentro de los grupos.

gl dentro de los grupos = n1+n2+n3- 3
gl dentro de los grupos = 5+5+5 - 3
gl dentro de los grupos = 12
Paso 9: Encontrar la media cuadrática entre los grupos.
s.c.entre grupos
c.entre grupos =
gl entre grupos
c.entre grupos = 2050.53 / 2
c.entre grupos = 1025.26
Paso 10: Encontrar la media cuadrática dentro de los grupos.
s.c.dentro de los grupos

c.dentro de los grupos =
gl dentro de los grupos
c.dentro de los grupos = 520.41 / 12
c.dentro de los grupos = 43.36

Paso 11: Obtener F
c. entre grupos

F=
c. dentro de los grupos
F = 1025.26 / 43.36
F = 23.64
F = 23.64
Valor crítico = 3.98
- 3.98 0 + 3.98
23.64
Altamente significativa, F (p 0.05).

La diferencia entre las medias observadas es estadísticamente significativa, F (p 
Por lo tanto existe diferencia en el coeficiente de inteligencia entre los tres grupos
sociales.
POS HOC
COMPARACIONES MÚLTIPLES DE MEDIAS CON DSH (DIFERENCIA
SIGNIFICATIVA HONESTA) DE TUKEY.

Una razón F significativa nos indica una diferencia global, pero en la comparación
de múltiples medias es necesario saber donde está la diferencia real. Para tal
situación se utiliza la DSH de Tukey.
1) Se utiliza cuando se ha obtenido una diferencia significativa de F.

2) Se utiliza para las comparaciones de múltiples medias.
3) Una diferencia entre medias es estadísticamente significativa solo si es igual o
mayor que la DSH.
FORMULA:
DSH = q
Donde:
 q : un valor de la tabla o un nivel de confianza dado para un número máximo
de medias que se están comparando.
 c dentro: media cuadrática dentro de los grupos.
 n: número de entrevistados de cada grupo.
Paso 1: Construir una tabla de diferencias entre medias ordenadas de menor a

mayor valor.
1 - 2 =11.0
2 - 3 = 17.4
1 - 3 = 28.4
Paso 2: Encontrar q en la tabla con puntos de porcentaje del rango student; para
poder obtenerlo se necesita lo siguiente:
a) Grados de libertad para la media cuadrática dentro de los grupos.(= ).
b) Tener el mayor número de medias.(= ).
c) Tener un nivel de confianza que puede ser 0.01 o 0.05, en este caso vamos a
utilizar 0.05.(q = ).
d) Con los datos anteriores obtener DSH.
DSH = q
DSH = 3.77
DSH = 3.77
DSH = 11.08
1 - 2 = 11.0 p  0.05
2 - 3 = 17.4 p  0.05
1 - 3 = 28.4 p  0.05
PROBLEMA
Se trata de comprobar la teoría de que existe diferencia en los puntajes en

aprovechamiento entre los diferentes grupos: 201, 202 y 203 en Química
Orgánica.
Aprovechamiento de los alumnos en química orgánica
N x1 : grupo x2 : grupo x3 : grupo

201 202 203 x12 x22 x32
1 8 7 6 64 49 36
2 9 4 7 81 16 49
3 10 6 4 100 36 16
4 8 4 8 64 16 64
5 9 5 7 81 25 49
6 10 7 8 100 49 64
7 7 6 6 49 36 36
8 10 4 5 100 16 25
Total 71 43 51 639 243 339
H0: No existe diferencia entre los grupos: 201, 202, 203 en los puntajes de
aprovechamiento en química orgánica
H1: Si existe diferencia entre los grupos: 201, 202, 203 en los puntajes de
aprovechamiento en química orgánica
H01 = 2 = 3
H112 3
x1 71
1 = = = 8.87
n1 8
x2 43
2 = = = 5.37
n2 8
x3 51
3 = = = 6.37
n3 8
Paso 4: Encontrar la suma total de cuadrados.
( x total )2
s.c.total = x2 total -
N total
( 71+43+51 ) 2
s.c.total = (639+243+339) -
24
( 165 )2
s.c.total = (1221) -
24
s.c.total = 1221-1134.37
s.c.total = 86.63
Paso 5: Encontrar la suma de cuadrados entre grupos.
(x)2 (x total)2

s.c.entre grupos =  -
N N total
(71)2 (43)2 (51)2 (165)2

s.c.entre grupos =  + -
8 8 8 24
s.c.entre grupos = 630.12+231.12+325.12 – 1134.37
s.c.entre grupos = 51.99
Paso 6: Encontrar la suma de cuadrados dentro de los grupos.
s.c.dentro de los grupos = s.c.total - s.c.entre grupos
s.c.dentro de los grupos = 86.63 – 51.99

s.c.dentro de los grupos = 34.64
Paso 7: Encontrar los grados de libertad entre los grupos.
gl entre grupos = K - 1
gl entre grupos = 3 - 1
gl entre los grupos = 2
Paso 8: Encontrar los grados de libertad dentro de los grupos.
gl dentro de los grupos = n1+n2+n3-3
gl dentro de los grupos = 24- 3
gl dentro de los grupos = 21
Paso 9: Encontrar la media cuadrática entre los grupos.
s.c.entre grupos
c.entre grupos =
gl entre grupos
51.99
c.entre grupos =
2
c.entre grupos = 25.99
Paso 10: Encontrar la media cuadrática dentro de los grupos.
s.c.dentro de los grupos

gl dentro de los grupos
34.64
21
c.dentro de los grupos = 1.64
Paso 11: Obtener “F”.
c. entre grupos

F=
c. dentro de los grupos
25.99
F= = 15.84
1.64

-3.47 0 +3.47
15.84
Significativa, F (p < 0.05).

El estudio obtuvo un valor de (p<0.05) esto no indica que es significativo por lo
tanto se acepta la hipótesis alterna y se rechaza la nula por tanto se comete error
tipo 1. Esto nos indica que si existe diferencia entre los grupos 201, 202, 203 en
cuanto a los puntajes de aprovechamiento en química orgánica.
En razón de que F es significativa se hace post hoc.
Paso 1: Construir una tabla de diferencias entre medias ordenadas de menor a

mayor valor.
1 - 2 = 8.87-5.37= 3.5
m
2 - 3 = 5.37-6.37= -1
1 - 3 = 8.87-6.37=2.5
Paso 2: Encontrar q en la tabla con puntos de porcentaje del rango student; para
poder obtenerlo se necesita lo siguiente:
a) Grados de libertad para la media cuadrática dentro de los grupos.(= ).
b) Tener el número de medias. (= ).
e) Tener un nivel de confianza que puede ser 0.01 o 0.05, en este caso
Vamos a utilizar 0.05.(q = ).
d) Con los datos anteriores obtener DSH.

DSH = q
DSH = 3.47 8√
1.64
DSH = 1.57
REQUISITOS PARA LA DISTRIBUCION “F”.
1) Comparación de 3 o más medias independientes, no se puede comparar una

sola muestra.
2) Los datos de intervalos, requiere datos cuantitativos continuos.
3) La muestra debe ser aleatoria.
4) Debe constituir una población normal de donde se obtiene la muestra.
5) Utiliza niveles de significancia de 0.01 y 0.05.
COEFICIENTE DE CORRELACION DE PEARSON
MODELO RECTILINEO SIMPLE
 = universo
r=n
r=
PROBLEMA
 Un investigador cree que existe una correlación entre la edad en días y el peso
en Kg de ciertos niños nacidos en el Puerto de Veracruz. Desea un  de 0.05.
CORRELACION ENTRE LA EDAD EN DIAS Y PESO EN KILOGRAMOS.

Casos X : Días Y : Peso KG XY X2 Y2
1 1 3.6 3.6 1 12.96
2 2 3.4 6.8 4 11.56
3 3 3.1 9.3 9 9.61
4 30 3.9 117 900 15.21
5 30 4.2 126 900 17.64
6 60 5.8 348 3600 33.64
7 60 5.1 306 3600 26.01
8 90 5.9 531 8100 34.81
9 120 7 840 14400 49
10 150 8.6 1290 22500 73.96
Total 5346 50.6 3577.7 54014 284.4
H0: No existe una correlación entre la edad en días y el peso en Kg de ciertos

niños nacidos en el Puerto de Veracruz.
H1: Existe una correlación entre la edad en días y el peso en Kg de ciertos niños
nacidos en el Puerto de Veracruz.
Paso 2: Elaborar la prueba de hipótesis.
H0  = 0
H1  0
Paso 3: Obtener “r”.
r=
r=
r=
r=
r=
r=
r = 0.9835
Paso 4: 0btener los grados de libertad con alfa de 0.05

Gl = n-1gl = 10- 1 = 10
Paso 5: 0btener el valor crítico con  de 0.05.

Valor crítico de 0.602
- 0.602 0 + 0.602
0.98
Significativa, r (p 0.05).
La correlación entre la edad en días y el peso en Kg de los niños fué significativa, r

(p  0.05). Se acepta H1 y se rechaza H0.
Por lo tanto existe una correlación entre la edad en días y el peso en Kg de ciertos
niños nacidos en el Puerto de Veracruz.
PROBLEMA
 Un investigador cree que existe una correlación entre la presión de oxígeno y la
saturación de oxígeno en la hemoglobina. Considera que cuanto mayor sea la
presión de oxígeno, mayor será la concentración en la hemoglobina. Utiliza un
 de 0.05.
Correlación entre laza presión de oxígeno y la concentración de hemoglobina
Casos X presión Y XY X2 Y2
de O2 saturación
O2 en Hb
1 10 10 100 100 100

2 11 14 154 121 196
3 15 28 420 225 784
4 20 42 840 400 1764
5 30 69 2070 900 4761
6 35 80 2800 1225 6400
7 40 81 3240 1600 6561
8 50 92 4600 2500 8464
9 90 90 8100 8100 8100
10 100 8.6 860 10000 73.95
Total 23184 21177 37203.96
Paso 1 : Elaborar H0 y H1.
H0 :.La presión el oxígeno no difiere con la saturación del oxígeno en la

hemoglobina
H1 :La presión el oxígeno si difiere con la saturación del oxígeno en la

hemoglobina
Paso 2 : Elaborar la prueba de hipótesis.
H0: µ = µ
H1: µ ≠ µ
Paso 3 : Obtener “r”.

r=
10(23184 )−( 401 )( 514 . 16 )
r= √[ 10(21177 )−( 401 ) ][ 10(37203 . 96)−( 514 .6 ) ]

2 2
231840−206354 . 6
r = √ [ 211770−160801 ][ 372039 . 96−264813. 16 ]
25485. 4
r = 80188. 91
r =0.31
Paso 4 : 0btener el valor crítico con  de 0.05.
gl = 5
Valor crítico = 4
-0.754 0 +0.754
0.75
Significativa, r (p<0.05).
Paso 5 : Conclusiones.
De acuerdo con la correlación de Person el valor de (p<0.05) esto es significativo
aceptando la hipótesis alterna y rechazando la nula, cometiendo error tipo 2. Esto
indica que la presión de oxígeno difiere con la saturación de oxígeno en la
hemoglobina.
PROBLEMA
 Un investigador está interesado en saber si los procedimientos de laboratorio se
han realizado adecuadamente; para ello ordena reproducir la técnica, a fin de
determinar si hay glucosa en la sangre mediante un método espectofotómetro;
desea saber qué relación existe entre diversas concentraciones de una solución
stándar de glucosa y los valores de absorvancia de luz, expresados como
densidad óptica. Utiliza un  de 0.05.
Correlación entre la concentración de glucosa y densidad óptica
Casos x: conc.de glucosa y: densidad óptica XY X2 Y2

(mg)
1 0.01 0.165 0.00165 0.0001 0.027225
2 0.01 0.172 0.00172 0.0001 0.029584
3 0.02 0.22 0.0044 0.0004 0.0484
4 0.02 0.196 0.00392 0.0004 0.038416
5 0.03 0.265 0.00795 0.0009 0.070225
6 0.03 0.27 0.0081 0.0009 0.0729
7 0.04 0.295 0.0118 0.0016 0.087025
8 0.04 0.32 0.0128 0.0016 0.1024
9 0.05 0.4 0.02 0.0025 0.16
10 0.05 0.38 0.019 0.0025 0.1444
Total 0.3 2.683 0.09134 0.011 0.780575
H0: No existe correlación entre diversas concentraciones de una solución estándar

de glucosa y los valores de absorbancia de luz expresados como densidad óptica.
H1: Existe correlación entre diversas concentraciones de una solución estándar de

glucosa y los valores de absorbancia de luz expresados como densidad óptica.
H0 = 0
H1 0
Paso 3: Obtener “r”.
r=
r=
r=
r=
r=
r=
r = 0.984
Paso 4: 0btener los grados de libertad con alfa de 0.05

gl = n-1
gl = 10- 1 = 9

Valor cítrico de 0.60
r = 0.984 (correlación positiva casi perfecta)
gl = 9
- 0.6021 0 + 0.6021
0.984
Significativa, r (p 0.05).
La correlación que existe es estadísticamente significativa, r (p 0.05). Se acepta

H1 y se rechaza H0.
Por lo tanto existe correlación entre las diversas concentraciones de una solución
estándar de glucosa y los valores de absorvancia de luz expresados como
densidad óptica; a mayor concentración de glucosa, mayor absorvancia de la luz
expresada como densidad óptica.
Requisito para la utilización de la distribución “r” del
Coeficiente de correlación de Pearson:
1) Sirve para correlacionar una variable independiente con una dependiente.

2) Utiliza datos de intervalo o escalas cuantitativas continuas.
3) La obtención de la muestra debe ser aleatoria y debe proceder de una
población normal.
4) Generalmente utiliza niveles de significancia de 0.01 y 0.05.
5) Se utiliza para coeficiente de correlación lineal.
REGRESIÓN LINEAL SIMPLE

La regresión lineal es una línea que se calcula teóricamente, a partir de las
mediciones realizadas que presentan correlación y o asociación.
La correlación y la correlación son complementarias entre sí, son diversos
modelos matemáticos tendientes a auxiliar la descripción de un fenómeno.
Fórmula
Y= a+bx
Donde:
Y= Valor teórico del eje de la ordenada

a= punto de intersección en el eje de la ordenada, y
b=Incremento que se espera en la ordenada a los cambios que se presentan en el
eje de las abscisas.
Antes de iniciar las operaciones debe verificar si existe una correlación lineal,
Problema
Un investigador muestra una serie de correlaciones acerca de la concentración de
glucosa de modo que mediante una reacción química se obtienen diversas
densidades de un color y se miden con espectrofotometría, que permiten lecturas
de densidad óptica. Se ha observado que a mayor concentración de glucosa
existe un aumento en los valores de densidad óptica y una tendencia rectilínea por
lo que se procede a efectuar la pendiente de regresión.
Por lo tanto las fórmulas son:
a= (Ʃy)(Ʃx2) – (Ʃx) (Ʃxy)

NƩx2-(Ʃx)2
b= NƩxy-(Ʃx) (Ʃy)
NƩx2– (Ʃx)2
Esta técnica se utiliza para predecir los valores de y requiere que los datos tenga
una distribución normal y correlación variables. .
Valores de la densidad de glucosa en ciertos pacientes.

No. Casos (x) concentración de (y)
glucosa mg/100ml Densidad óptica) xy X2
1 0.01 0.165 0.00165 0.0001
2 0.01 0.172 0.00172 0.0001
3 0.02 0.22 0.0044 0.0004
4 0.02 0.196 0.00392 0.0004
5 0.03 0.265 0.00795 0.0009
6 0.03 0.27 0.0081 0.0009
7 0.04 0.295 0.0106 0.0016
8 0.04 0.32 0.0128 0.0016
9 0.05 0.4 0.02 0.0025
10 0.05 0.38 0.019 0.0025
11 0.06 0.43 0.0258 0.0036
12 0.06 0.46 0.0276 0.0036
13 0.07 0.475 0.0332 0.0049
14 0.07 0.499 0.0349 0.0049
15 0.08 0.53 0.0424 0.0064
16 0.08 0.551 0.0440 0.0064
17 0.09 0.56 0.0504 0.0081
18 0.09 0.559 0.0503 0.0081
19 0.10 0.569 0.0569 0.01
20 0.10 0.565 0.0565 0.01
Total 1.1 7.881 0.89374 0.077
Paso1.- Obtener una gráfica de correlación
Paso 2.- Obtener el valor de a. = 0.151
Paso 3.- Obtener el valor de b = 4.4
Paso 4.- Predicción. Calcular los valores de y´ si la concentración de glucosa

fuera de 0.02 y 0.08, ¿ Cuál serian los valores de Y´).
y=a+bx
y= 0.151 + (4.4) (0.02) y= 0.151 + 4.4 (0.08)
y= 0.239 y= 0.503
ANÁLISIS DE LA VARIANZA
EN DOS DIRECCIONES PARA RANGOS DE FRIEDMAN
Constituye un sistema no paramétrico para verificar la muestra a la que se ha

medido bajo dos condiciones.
Donde:
 K: número de mediciones.
 N: número total de entrevistados.
 RI: suma de los rangos para una medición cualquiera.
PROBLEMA
La hostilidad de los niños varía según el nivel de violencia en los programas de
televisión.
Niños como espectadores
Violencia Rango Violencia Rango Violencia Rango

Casos baja bajo media medio alta alto
1 23 3 30 2 32 1
2 41 3 45 1 43 2
3 36 2 35 3 39 1
4 28 3 29 2 35 1
5 39 3 41 2 47 1
6 25 3 28 1 27 2
7 38 3 46 2 51 1
8 40 3 47 2 49 1
9 45 2 46 1 42 3
10 29 3 34 2 38 1
Suma 28 18 14
Total total

H0: La hostilidad de los niños no varía según el nivel de violencia en los programas
de televisión.
H1: La hostilidad de los niños varía según el nivel de violencia en los programas de
televisión.
Paso 2: Obtener los rangos de cada grupo, el valor más alto tendrá el rango 1,
luego el 2 y el menor valor tendrá, rango 3 .
Paso 3: Sumar los rangos bajo cada condición para cada columna.
Paso 4: Sustituir los datos de acuerdo con la fórmula.
Paso 5: Obtener los grados de libertad.

gl = K - 1
gl = 3 - 1
gl = 2
Paso 6: Obtener el valor crítico con  de 0.05. (Buscar en la tabla de Chi

cuadrada).
- 5.99 0 + 5.99
10.4
Significativa, Xr2 (p < 0.05).
Los valores observados son estadísticamente significativos, X r2 (p < 0.05).
A mayor violencia en los programas de televisión, mayor hostilidad los niños. La

hostilidad fue mayor en los niños con programas de mayor violencia, seguido de
mediana violencia y por último los de violencia baja.
PROBLEMA
Un investigador está interesado en estudiar la acción de los fármacos
anticonvulsivos, en relación con una serie de sustancias que por mecanismos
diferentes inducen a crisis convulsivas.
Tiempo en horas en el cual se presenta la muerte en ratones

Inyectados
Convulsionantes Fenobarbita R Dife R Diacepa R Clonacepa R

l nilcar n n
bazid
a
Tiosemicarbacid 1 3 4 1 0.1 4 2 2
a
Metrazol 0.5 4 1 3 4 1 2 2
Estricnina 0.3 4 0.6 3 3 1.5 3 1.5
Total 11 7 6.5 5.5
NOTA: cuando existe un empate en los rangos o ligas, se suman los valores de
los rangos y se dividen entre el número de rangos.
Paso 1: Obtener H0 y H1.
H0: La acción de los fármacos anticonvulsionantes no es efectiva en relación con

una serie de sustancias que por mecanismos diferentes inducen a crisis
convulsivas.
H1: La acción de los fármacos anticonvulsionantes es efectiva en relación con una

serie de sustancias que por mecanismos diferentes inducen a crisis convulsivas.
Paso 2: Obtener los rangos de cada grupo, el valor más alto tendrá el rango 1,
luego el 2 y el menor valor tendrá, rango 3.
Paso 3: Sumar los rangos bajo cada condición para cada columna.
Paso 4: Sustituir los datos en la fórmula:

gl = K - 1
gl = 4 - 1
gl = 3
Paso 6 : Obtener el valor crítico con  de 0.05. (Buscar en la tabla de chi

cuadrada).
X2 = 3.5 Valor crítico = 7.81
- 7.82 0 + 7.82
3.5
No significativa, (p 0.05).
La diferencia entre los grupos observados no es estadísticamente significativa,

(p 0.05).
Por lo tanto la acción de los fármacos anticonvulsionantes no es efectiva en
relación con una serie de sustancias que por mecanismos diferentes inducen a
crisis convulsivas.
Requisitos para el uso de Xr2:
1) Sirve para comparar una sola muestra medida bajo 3 o más condiciones.
2) Utiliza datos ordinales, que pueden colocarse por rangos.
3) El número de entrevistados no debe ser muy pequeño: el requisito mínimo
exacto para muestra depende del número de condiciones (K) a los que se va a
exponer a los entrevistados; n = 10 cuando K = 3; n = 5 cuando K = 4.
4) La obtención de la muestra debe ser probabilistica o por azar.
5) La procedencia de la muestra debe obtenerse de una distribución normal.
6) Se utiliza cuando se tiene más de 20 casos.
7) Cuando la muestra es menor de 20 casos e incluye 0, en algunas de las
casillas, se utiliza la prueba exacta de Fisher yates.
8) Utiliza grados de libertad.
9) Utiliza niveles de significancia de 0.01 y 0.05, generalmente.
Análisis de la varianza en una dirección por rangos de Kruskal

Wallis
Alternativa no paramétrica para el análisis de la varianza para comparar varias

muestras independientes con datos ordinales.
H=
Donde:
 N: número total de casos.

 n: número de casos en una muestra dada.
 RI: suma de rangos para una muestra dada.
Problema
Un investigador cree que existe diferencia entre el número de días para encontrar
un empleo con respecto a la edad senil mediana y joven. Se desea un  de 0.05.
Número de días para encontrar un empleo entre las diferentes edades.
Casos adulto rango adulto Rango adulto rango

senil edad joven
media
1 63 19 33 12 25 7
2 20 6 42 13 31 11
3 43 14 27 8 6 1
4 58 18 28 9 14 4
5 57 17 51 16 18 5
6 71 21 64 20 13 3
7 45 15 12 2
8 30 10
Total 110 90 31

H0: No existe diferencia entre el número de días para encontrar un empleo con
respecto a la edad senil mediana y joven.
H1: Existe diferencia entre el número de días para encontrar un empleo con
Paso 2: Obtener por rangos el número de puntajes y encontrar la suma de los

rangos para cada muestra.
Paso 3: Sustituir los datos en la fórmula.
H=
H=
H=
H=
H = 9.14
Paso 4: Encontrar los grados de libertad.
gl = K - 1
gl=3-1
gl = 2
Paso 5: Obtener el valor crítico con  de 0.05. (Buscar en la tabla de chi
cuadrada).
gl = 2
- 5.99 0 + 5.99
9.14
Significativa, H (p  0.05).
La diferencia entre los valores observados es estadísticamente significativa, H (p 

0.05).
Por lo tanto existe diferencia en el número de días para encontrar un empleo con
PROBLEMA
Un investigador estudia el efecto benéfico de 4 sustancias anticonvulsionantes
(fenobarbital, difenilhidantoinato, diacepan y clonacepan), para proteger contra la
muerte producida por la tiosemilcarbazida, elige a 24 ratones, los somete a la
investigación y toma el tiempo hasta que mueran los ratones. Utilice  de 0.05.
Tiempo en horas que tarda el fármaco en causar la muerte en los ratones.
Fenobarbital R DHF R Diacepan R Clonacepan R
2 7.5 0.5 3 10 21 4 12

4 12 1 5 11 22 3 9.5
6 16.5 6 16.5 8 19 5 14
4 12 6 16.5 9 20 1 5
2 7.5 0.3 1 12 23 6 16.5
1 5 0.4 2 13 24 3 9.5
Suma total 60.5 14.2 44 63 126 22 66.5

H0: El efecto de las sustancias anticonvulsionantes no difieren en los ratones en
tratamiento
H1: El efecto de las sustancias anticonvulsionantes difiere en los ratones en

tratamiento
Paso 2: Obtener por rangos el número de puntajes y encontrar la suma de los

rangos para cada muestra (si hay rango empatados desempatar).
H=
H=
12
24(24 +1)
Σ [ 6 ][ ][ ][
6 6 6 ]
(60. 5 )2 (44 )2 (126 )2 (65. 5 )2
−3(24 +1)
H = 0.02 (610.04 + 322.66 + 2646 + 715.04) -75
H = 10.874
gl = K - 1
gl = 4-1
gl = 3
Paso 5: Obtener el valor crítico con  de 0.05. (Buscar en la tabla de chi

cuadrada).
Gl=3
H = 13.86
Paso 6.- Obtener el valor critico en la tabla con alfa de 0.05 y diga si es o no
significativa.
-7.82 0 +7.82
13.86
H (p > 0.05).
Se acepta la hipótesis alterna y se rechaza la nula, por lo tanto se comete error
tipo 1. Esto indica que el tratamiento de los anticonvulsionantes difiere en los
ratones.
Requisitos para la distribución H
1) Comparaciones de 3 o más muestras independientes.

2) No se puede aplicar para contrastar diferencias dentro de una sola muestra.
3) Utiliza datos ordinales; solo requiere que sean colocados por rango.
4) Debe tomarse por lo menos 6 casos.
COEFICIENTE DE CORRELACIÓN PARA DATOS ORDINALES
RANGOS ORDENADOS DE SPEARMAN

PROBLEMA
Considérese la relación entre el status socioeconómico y la cantidad de tiempo
empleado en ver televisión. Imaginemos una muestra de 8 entrevistados que
pudieran colocarse por rangos de la siguiente forma:
Niños según status socioeconómico y tiempo en ver televisión
casos entrevistados x : status y: d d2

socioeconómic tiempo
o en ver tv
1 Miguel 1 2 1 1
2 Araceli 2 1 1 1
3 Juan 3 3 0 0
4 Norma 4 5 1 1
5 María 5 4 1 1
6 Tomas 6 8 2 4
7 Rafael 7 6 1 1
8 Alejandro 8 7 1 1
Total 36 36 8 10
H0: No existe relación entre el status socioeconómico y la cantidad de tiempo

empleado en ver televisión.
H1: Existe relación entre el status socioeconómico y la cantidad de tiempo

empleado en ver televisión.
Paso 2: Colocar por rangos a los entrevistados.

rs =
6(10 )
1−
rs = 8(64−1)
60
1−
rs = 504
rs = 1 – 1.88
rs = 0.88

- 0.643 0 + 0.643
0.88
Significativa,rs (p  0.05).
La correlación entre las variables es estadísticamente significativa rs (p<0.05)

Por lo tanto los entrevistados con más alto status socioeconómico ven más
televisión que los de status socioeconómico bajo.
PROBLEMA
Un investigador cree que existe correlación entre las categorías de un grupo que
se gradúa y el coeficiente de inteligencia.
Posición de los alumnos según el coeficiente de inteligencia.
Casos Entrevistados Posición I.Q. Rango D D2
en la
clase
1 A 10 110 6 4 16
2 B 9 90 10 -1 1
3 C 8 104 8 0 0
4 D 7 100 9 -2 4
5 E 6 110 6 0 0
6 F 5 110 6 -1 1
7 G 4 132 3 1 1
8 H 3 115 4 -1 1
9 I 2 140 1.5 0.5 0.25
10 J 1 140 1.5 0.5 0.25
H0: No existe correlación entre los alumnos que se gradúan y el coeficiente de
inteligencia.
H1: Existe correlación entre los alumnos que se gradúan y el coeficiente de
inteligencia.
Paso 2: Colocar por rangos a los entrevistados.
rs = =
rs = = 1-0.148
rs = 0.851
Paso 4 : Obtener el valor crítico con α de 0.05

- 0.564 0 + 0.564
0.851
Significativa, rs (p  0.05).
Paso 5: Conclusiones
La diferencia entre los valores es significativa, por lo tanto existe correlación entre
los estudiantes que se gradúan y el coeficiente de inteligencia.
Requisitos para el uso de rs:
1) Se usa cuando existe una correlación lineal.
2) Utiliza escala ordinal.
3) El muestreo debe ser aleatorio y de una población normal.
4) Generalmente utiliza niveles de significancia de 0.01 y 0.05.
5) Utiliza rangos.
6) Utiliza grados de libertad. Según la tabla que se utiliza.
PRUEBA DE U MANN-WHITNEY PARA MUESTRAS PEQUEÑAS E

INDEPENDIENTES
Formulas :
n1 (n1 +1)
n1 n 2 + −Σ RI
U1 = 2
n2 (n 2 +1)
n1 n 2 + −ΣR 2
U2 = 2
Donde :
 U1 y U2: Valores estadísticos de U Mann-Whitney.
 n1: Tamaño de la muestra 1.
 n2: Tamaño de la muestra 2.
 RI: Sumatoria de rangos del grupo 1.
 R2: Sumatoria de rangos del grupo 2.
PROBLEMA
Un investigador cree que las calificaciones de ejecución de lectura, según el
método de enseñanza del experimentador son más altos y diferentes que las
observadas en el método tradicional.
Métodos estadísticos aplicados a los grupos de niños.

Casos Tradicional rango Experimental Rango
1 95 3 80 7
2 100 1.5 85 6
3 93 4 25 10
4 100 1.5 70 8
5 45 9 90 5
Total 19 36
Paso 1 : Elaborar H0 y H1
H0 : Las calificaciones de ejecución de lectura según el método experimental no
son diferentes a las leídas en el método tradicional.
H1 : Las calificaciones de ejecución de lectura según el método experimental son
diferentes y más altas que las leídas en el método tradicional.
Paso 2: Colocar los rangos de cada grupo en forma vertical.
Paso 3: Sustituir los datos en las fórmulas U1 y U2.
U1 =
U1 =
U1 =
U1 = 21
U2 =
U2 =
U2 =
U2 = 4
Paso 4: De los valores obtenidos se escoge el más pequeño y se busca en la

tabla.
En este caso U2= 4
P valor de la tabla= 0.048
- 0.048 0 0.048
0.05
Significativa, U (p < 0.05 ).
Existe diferencia significativa por lo tanto las calificaciones ejecutadas según el
método experimental son más altas que las del método tradicional.
PRUEBA DE U MANN- WHITNEY PARA MUESTRAS GRANDES E

INDEPENDIENTES
PROBLEMA
Un investigador decide incrementar la muestra para mejorar los resultados
previos. Considera que las calificaciones por el método experimental son
diferentes con respecto al método tradicional. Utilice α de 0.05.
H0: Las calificaciones por el método experimental no son diferentes con respecto al
método tradicional.
H1: Las calificaciones por el método experimental son diferentes con respecto al
método tradicional.
Paso 2: Colocar en orden los datos obtenidos de menor a mayor valor.
Variables Rango
25 1
30 2
40 3.5
40 3.5
45 5
50 6
55 7.5
55 7.5
60 11.5
60 11.5
60 11.5
60 11.5
60 11.5
60 11.5
65 15
70 16.5
70 16.5
75 18.5
75 18.5
80 21.5
80 21.5
80 21.5
80 21.5
90 25.5
90 25.5
90 25.5
90 25.5
95 28.5
95 28.5
100 31.5
100 31.5
100 31.5
100 31.5
110 34.5
110 34.5
Paso 3: Construir una tabla con los métodos tradicional y experimental.
Casos Método Rango Método Rango

tradicional experimental
1 60 11.5 55 7.5
2 80 21.5 70 16.5
3 25 1 90 25.5
4 30 2 110 34.5
5 40 3.5 45 5
6 60 11.5 60 11.5
7 90 25.5 60 11.5
8 100 31.5 75 18.5
9 60 11.5 80 21.5
10 55 7.5 95 28.5
11 100 31.5
12 110 34.5
13 95 28.5
14 60 11.5
15 70 16.5
16 80 21.5
17 40 3.5
18 65 15
19 50 6
20 75 18.5
21 90 28.5
22 90 25.5
23 100 31.5
24 80 21.5
25 100 31.5
Total 130 503
Paso 4: Colocar los rangos en la tabla y después transcribirlos en la primera tabla.
Paso 5: Determinar la desviación estándar con la fórmula.
U =
Donde:
 U: desviación estándar de U.

 n1 y n2: tamaño de la muestra de los grupos 1 y 2.
 N: tamaño total de la muestra.
 LI: sumatoria total de las ligas o empates.
LI =
LI=
3 3 3 3 3 3 3 3 3 3
( 2 −2)+(2 −2 )+(6 −6 )+( 2 −2 )+(2 −2)+(4 −4 )+( 4 −4 )+(2 −2)+( 4 −4 )+(2 −2 )
12
6 +6+210+ 6+6+60+ 60+6+60+ 6
LI = 12
426
LI = 12
LI = 30.5
U =
U =
U =
U =
U =
U = 27.26
Paso 6: Hallar el valor de Z :
Z=
Donde:
 Z: valor estadístico normal.
 U: cualquier valor de U calculado.
 : valor promedio de U.
 U: desviación estándar de U.
Paso 7: Obtener el valor de U1 Y U2.
U1 =
U1 =
U1 =
U1 = 178
U2 =
U2 =
U2 =
U2 = 72
Z=
Z=
Z = -1.94
Paso 8: Obtener el valor crítico en la tabla Z con  de 0.05.

-1.94 -0.056 0 1.94
Significativa, U (p <0.05).
Paso 9: Decisión.
U(p>0.05), por lo tanto las calificaciones por el método experimental son diferentes
con respecto al método tradicional.
Requisitos para la prueba de U Mann- Whitney

1) Usa mediciones ordinales.
2) Las muestras deben ser independientes.
3) Es una alternativa de “t de Student”.
4) Si n es menor de 20 se consideran muestras pequeñas.
5) Si n es mayor de 20 se consideran muestras grandes.
6) En caso de muestras grades se calcula Z.
7) Para todo valor menor o igual a α (0.05), se acepta H 1 y se rechaza H0.
8) Se utiliza cuando los datos en la “t de Student” no cumplen los requisitos
para el promedio
PRUEBA DE WILCOXON
Es una técnica no paramétrica, con escala ordinal.
Problema
Un médico especialista urólogo, busca comprobar la efectividad de un
medicamento para infecciones de vías urinarias, de esta forma sus cirugías serán
de mayor éxito si da un tratamiento antes de la cirugía, para inhibir la flora
bacteriana, para esto realiza un urocultivo antes y después del tratamiento, desea
saber si existe o no diferencia significativa con α de 0.05.
Uro cultivo antes y después del tratamiento con el nuevo medicamento
No. No. bacterias No. Diferencia de Rangos Rangos de

Casos antes Bacterias mediciones d signos negativos
después
1 15000 12000 3000 6
2 16000 2500 13500 24
3 5750 250 5500 14
4 11000 18000 -7000 -16.5 -16.5
5 7500 1500 6000 15
6 17300 10000 7300 18
7 5500 8250 -2750 -5 -5
8 6000 1500 4500 9.5
9 7000 12000 -500 -12 -12
10 2500 1000 1500 3
11 7500 8000 -500 -1 -1
12 6500 3000 3500 7
13 7000 11000 -4000 -8 -8
14 12000 1500 10500 21
15 30000 18000 12000 22.5
16 15000 3000 12000 22.5
17 25000 8000 17000 25
18 110000 5000 95000 30
19 75000 2000 73000 28
20 1850 2650 -800 -2 -2
21 25000 15000 10000 20
22 8000 15000 -7000 -16.5 -16.5
23 60000 30000 30000 27
24 5000 3200 1800 4
25 10000 15000 -5000 -12 -12
26 30000 25000 5000 12
27 100000 10000 90000 29
28 7000 25000 -18000 -26 -26
29 6000 1500 4500 9.5
30 7000 15000 -8000 -19 -19
Total T= 118
Paso1.- Elaborar hipótesis nula y alterna

H0: No existe efectividad de un medicamento para infecciones de vías urinarias,
después de la cirugía comprobado por del uro cultivo
H1: Existe efectividad de un medicamento para infecciones de vías urinarias,
después de la cirugía comprobado por uro cultivo
Paso 2: Obtener las diferencias antes y después del uro cultivo.
Paso 3: Obtener los rangos d sin tomar en cuenta los signos negativos en este
momento.
Paso 4: Obtener los rangos de signos menos frecuentes.
Paso 5: Obtener X T con la formula.
X T = N(n + 1)
4
XT = 30(30 + 1) = 232.5
4
Paso 6: obtener T con la fórmula
T = √ N ( N +1 )(2 N +1 )
24
T = √ 30(30+1)(2(30 )+1)
24
Paso 7: Obtener ZT
= 48.62
T −X T
ZT =
σT
118−232.5
ZT = =−2.35
48.61
El valor debe buscarse en la tabla de Z de la distribución normal (A.4), en la

intersección de la hilera 2 y columna 0.4 que es igual a 0.0094.
Es o no significativa y como se anotara
Es significativa
-2.35 -0.0094 0 0.0094
Por lo tanto ZT (p<0.05)
Paso 8 : Conclusiones

Existe diferencia significativa, lo que indica que el medicamento para infecciones
de vías urinarias es efectivo.
Requisitos para uso de Wilcoxon

1. Es un equivalente de t de Student
2. Se usa cuando la distribución no es normal.
3. En muestras pequeñas comprende para mayores de casos a menores o
igual de 25.
4. Las muestras grandes deben ser mayores de 25.
5. Dicha prueba estadística consiste en sumar los rangos de signos
frecuentes; por ello no se tiene una ecuación o fórmula, como en otras
pruebas estadísticas.
PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS DE ESCALA NOMINAL

X2 DE PEARSON PARA UNA MUESTRA
La correlación de X2 para una muestra se emplea frecuentemente como una
prueba de bondad de ajuste, las mediciones están es escala nominal, resulta muy
útil este procedimiento.
La eficacia de la prueba está de acuerdo con el tamaño de la muestra, algunos
autores consideran que es insensible, aporta más seguridad cuando se tienen dos
categorías.
Formula:
X2 =
Donde:
 X2: chi cuadrada.
 o: frecuencia observada.
 e: frecuencia esperada.
PROBLEMA
Un médico oncólogo ha tratado a 120 pacientes de un cáncer maligno, aplicó 4
tipos de terapia y la mortalidad observada fue diferente para cada grupo. Analizó
sólo el caso de los pacientes que fallecieron a fin de saber si la toxicidad fue
distinta.
Frecuencia de mortalidad en 4 tipos de tratamiento
Valores radiación + radiación + radiación solo total
droga 1 droga 2 + droga 4 radiación
Observad 15 7 8 6 36
o
Esperado 9 9 9 9 36

H0: No existe diferencia en la toxicidad y mortalidad entre los cuatro tipos de
terapia.
H1: Existe diferencia en la toxicidad y mortalidad entre los cuatro tipos de terapia.
Paso 2: Obtener los valores esperados.
36/4 = 9
X2 =
X2 =
X2 =
X2 = 4 + 0.44 + 0.11 + 1
X2 = 5.55
gl = K-1
gl = 4 - 1
gl = 3

X2 = 5.55
gl = 3
- 7.82 5.55 +7.82
No significativa, x2 (p> 0.05)

La diferencia entre los grupos observados no es estadísticamente significativa, X 2
(p  0.05).
Por lo tanto la toxicidad producida por los cuatros tipos de terapia no es diferente
entre sí.
PROBLEMA
En cierta población se realizó una encuesta observándose un incremento en el
uso de estupefacientes (droga) entre los jóvenes de 15 a 19 años; se desea saber
si existe una diferencia entre los demás grupos etarios. Utilice un  de 0.05.
EDAD EN 10 - 14 15 - 19 20 - 24 25 – 29 Total
AÑOS
VARIABLES
Valores 20 40 10 15 85
observados
Valores esperados 21.25 21.25 21.25 21.25 85

H0: No existe diferencia entre los grupos de jóvenes
H1: Existe diferencia entre los grupos de jóvenes

Valores esperados = 85/ 4 = 21.5

(o−e )2
Σ
X2 = e
(20−21. 25 )2 (40−21. 25)2 (10−21. 25 )2 (15−21 .25 )2
Σ + + +
X2 = 21 . 25 21. 25 21 . 25 21. 25
X2 = 0 . 07+16 .54 +5 .95+1. 83
X2= 24.42

gl = K-1
gl = 4-1
gl= 3

X2 = 24.42
gl = 3
-7.82 0 7.82 24.42
x2 (p < 0.05).
H1: Existe diferencia significativa entre los jóvenes, con respecto al consumo de
estupefacientes
CORRECCIONES PARA PEQUEÑAS FRECUENCIAS ESPERADAS EN X 2

CORRECCIÓN DE YATES
X2 =
PROBLEMA
Un investigador cree que existe asociación en el consumo excesivo de
carbohidratos con relación a la obesidad. Se desea un  de 0.05.
Obesidad
Consumo de
carbohidratos
SI NO
Si 15 A B 5 20
No 6 C D 10 16
Total 21 15 36

H0: Existe asociación en el consumo excesivo de carbohidratos con relación a la
obesidad.
H1: No existe asociación en el consumo excesivo de carbohidratos con relación a
la obesidad.
X2 =
36
36[ ( 150−30 )− ]
X =
2
2
( 15+5 ) ( 6+10 ) ( 15+6 ) (5+10)
36[120−18 ]
X2=
( 20 )( 16 )( 21 ) (15)
374,544
X2= =3.71
100,800
gl = (C - 1)(r - 1)
C = columnas r = renglones
gl = (2 - 1)(2 - 1)
gl= 1
gl = 1
X2 = 3.71
-3.84 0 3.71 3.84
X2(p >05)
No es significativa
La distribución no es diferente de la distribución normal por lo que existe relación
entre el consumo excesivo de carbohidratos y la obesidad.
Otra fórmula para obtener X2 con corrección de Yates es la siguiente
X2 =
PROBLEMA
Un investigador cree que existe una relación entre el tabaquismo y el cáncer
broncogénico. Desea un  de 0.05, en una tabla de 2x2.
T Cáncer bronco génico
A si no Total
B
A Si 80 60 140
Q No 5 70 75
U Total 85 130 215
I
S
M
O

H0: No existe relación entre el tabaquismo y el cáncer broncogénico
H1: Existe relación entre el tabaquismo y el cáncer broncogénico.
Paso 2: Obtener la tasa del daño de cáncer broncogénico con factor de riesgo.
C á ncer broncog é nicocon f . r

Tasa del daño = Total de fumadores con f . r
x 1000
80
Tasa del daño= x 1000 = 571.4
140
Paso 3: Obtener la tasa del daño de cáncer broncogénico sin factor de riesgo.
C á ncer broncog é nicosin f . r

Tasa del daño = Total de casossin f . r
x 1000
5
75
Paso 4: Obtener la tasa del daño en la muestra.
Total de casos por cáncer

Tasa del daño= x 1000
Tamaño de lamuestra
140
215
Paso 5: Frecuencia del factor de riesgo en la muestra.
Total de pacientes con f .r

Frecuencia del f.r en la muestra= x 1000
Tamaño de la muestra
Paso 6: Determinar la asociación estadística entre el factor de riesgo y el factor de

muerte de cáncer broncogénico.
X2 =
+ - Total
+ 80 60 140
- 5 70 75
Total 85 130 215
Total de columnas x Total de hileras

Valores esperados=
Grantotal
85 x 140
1er Valor esperado= = 55.35
215
130 x 140
2° Valor esperado = = 84.65
215
85 x 75
3erValor esperado = = 29.65
215
130 x 75
215
Paso 8: Obtener X2.
X2 =
(80−55 .35 )2 (60−84 .65 )2 (5−29. 65 )2 (70−45. 34 )2
Σ + + +
X2 = 55 . 35 84 . 65 29 . 65 45 . 34
(607 . 62) (607 .62 ) (607 . 62) (607 .62 )
Σ + + +
X2 = 55 . 35 84 . 65 29 . 65 45 . 34
X2 = 10.97+ 7.17+ 20.49+ 13.41
X2= 52.04
Paso 9: Hallar los grados de libertad.

gl = (C - 1)(r - 1)
gl= (2-1)(2-1)
gl= 1
gl = 1
VC= 3.84
-3.84 0 3.84 52.04
X2 (p < 0.05).
Paso 11: Obtener Odds ratio ( la razón de Momios).
Odds ratio =
(80)(70 ) 5 , 600
= =18 . 66
Odds ratio = (60)(5 ) 300

Existe relación entre el tabaquismo y el cáncer broncogénico
También se utiliza la fuerza de asociación y es igual a:

Fuerza de Asociación = tasa del daño en los expuestos al f.r.
Tasa del daño en los no expuestos
F. Asociación = 571.42 = 8.57. la interpretación es la misma que la de la R_M

66.66
PROBLEMA
 Un investigador cree que un producto de bajo peso al nacer conduce a una
mortalidad neonatal, desea saber si es o no significativa con  de 0.05.
Mortalidad neonatal
Bajo peso Si No total
al nacer
Si 40 15 55
No 10 65 75
total 50 80 130

H0: No existe relación entre el bajo peso al nacer y mortalidad neonatal.
H1: El bajo peso al nacer conduce a la mortalidad neonatal.
Paso 2: Obtener la tasa del daño de mortalidad neonatal con factor de riesgo.
Mortalidad neonatal con f.r

Tasa del daño = x 1000
Total de recién nacidos con f.r.
40
55
Paso 3: Obtener la tasa del daño de mortalidad neonatal sin factor de riesgo.
Mortalidad neonatal sin f . r

Tasa del daño = Total de recien nacidossin f .r x 1000
10
75
Paso 4: Obtener la tasa del daño en la muestra.

Total de casos de mortalidad neonatal
Tasa del daño = Tamaño de la muestra
x 1000
50
130
Paso 5: Obtener la frecuencia del factor de riesgo en la muestra.

Total de pacientes con f .r
Frecuencia del f.r en la muestra = Tamaño de la muestra x 1000
55
Frecuencia del f.r en la muestra= x 1000 = 423.07
130
Paso 6: Determinar la asociación estadística entre el factor de riesgo con bajo

peso.
1° =
80 x 55
2° = =33.84
130
50 x 75
3° = =28.84
130
80 x 75
4° = =46.15
130
X2 =
(40−21. 15 )2 (15−33 .84 )2 (10−28 .84 )2 (65−46 . 15)2

+ + +
X2 = 21. 15 33 . 84 28 . 84 46 .15
X2 = 16.80 + 10.48 + 12.30 + 7.69
X2= 47.27
gl = (C - 1)(r - 1)
gl= (2-1)(2-1)
gl= 1
-3.84 0 3.84 47.27
Significativa, X2 (p < 0.05).

Paso 9: Obtener la razón de Momios.
Razón de Momios =
( 40 ) (65) 2,600
Razón de Momios= = = 17.33
( 15 ) (10) 150
Significativa
El bajo peso al nacer conduce a la mortalidad neonatal.
COMPARACIÓN DE VARIOS GRUPOS DE X2
PROBLEMA
Un investigador cree que existe asociación entre las orientaciones políticas y los
métodos de crianza de los niños. Desea un  de 0.05.
Orientaciones políticas
Métodos de conservador moderado liberal Total
crianza
No rígido 7 9 14 30
Moderado 10 10 8 28
Autoritario 15 11 5 31
Total 32 30 27 89

H0: No existe asociación entre las orientaciones políticas y los métodos de crianza
de los niños.
H1: Existe asociación entre las orientaciones políticas y los métodos de crianza de
los niños.

32 x 30
1er Valor esperado= = 10.78
89
30 x 30
89
27 x 30
3erValor esperado = = 9.10
89
32 x 28
89
30 x 28
89
27 x 28
89
32 x 31
89
30 x 31
89
27 x 31
89
Paso 3: Obtener X2.
X2 =
X2 =
X2 =
(7−18 . 78)2 (10−10. 06 )2 (15−11 .14 )2 (9−10 .11 )2 (10−9 . 43 )2 (11−10 . 44 )2
Σ + + + + +
18 . 78 10 .06 11 . 14 10 .11 9 . 43 10 . 44
2 2 2
(14−9 . 10) (8−8 . 49 ) (5−9 . 49 )
+ + +
9 . 10 8 . 49 9 . 49
X2 = 7.38+ 0.00+ 1.33+ 0.12+ 0.03+ 0.03+ 2.63+ 0.02+ 2.12
X2= 13.66
Paso 4 : Obtener los grados de libertad.
gl = (C - 1)(r - 1)
gl=(3-1)(3-1)
gl=(2)(2)
gl=4

gl = 4
-9.49 0 9.49 13.66
X2 (p < 0.05).
Existe asociación entre las orientaciones políticas y los métodos de crianza de los
niños.
Requisitos de la x2
1) No requiere de una distribución normal.
2) Comparaciones entre dos o más muestras independientes, requiere una
tabla de 2x2.
3) No se utiliza en mediciones antes y después.
4) Utilizan datos normales.
5) Muestreo aleatorio de una población determinada.
6) Las frecuencias esperadas no deben ser demasiadas pequeñas, para una
tabla de 2x2, ninguna frecuencia esperada será menor de 5.
7) Para una corregida de Yates debe usarse una tabla de 2x2. en el cual una
casilla esperada es menor de 10.
8) En comparaciones de tablas de 3x3, o 4x5, no existe ninguna regla rápida.
9) La suma de las frecuencias esperadas debe ser el mismo número de
casillas observadas.
PRUEBA DE LA PROBABILIDAD EXACTA DE FISHER
Esta prueba es una técnica no paramétrica sumamente útil para analizar datos
concretos (nominales u ordinales).
Se usa cuando los puntajes de 2 muestras independientes pertenecen
respectivamente a clases mutuamente excluyentes. Los puntajes se representan
en una tabla de contingencia de 2x2, pueden ser dos grupos independientes
cualesquiera, como experimentales y controles, hombres y mujeres, empleados y
no empleados, etc.
Los encabezados pueden ser más o menos, por encima o por debajo de la
mediana, aprobado o reprobado.
PROBLEMA
Un investigador cree que existe asociación con cierto tipo de lesión de ligamento
con respecto al dolor. Utilice  de 0.05.
Pacientes con dolor por lesión del ligamento

- + total
Grupo I 10 a b 0 10
Grupo II 4 c d 5 9
14 5 19
P=
(10+0 )!(4+5)!(10+4 )!(0+5)!

P = 19 !10! 0! 4 !5 !
( 3628800 )( 362880 ) ( 87178291200)(120)

P= 17
(1.216451 x 10 ) ( 3628800 ) ( 1 )( 24 ) (120)
1.377576 x 1025
P=
1.271306 x 1027
P= 0.010
X2(p<0.05)
Existe asociación entre un tipo de lesión de ligamento con respecto al dolor.
Requisitos para la prueba exacta de Fisher Yates
1) Prueba estadística frecuentemente utilizada como alternativa cuando no se

puede aplicar la X2 de Pearson.
2) Utiliza escala nominal con dos muestras independientes.
3) Utiliza tabla de 2 x 2.
4) Utiliza valores factoriales.
5) Para todo valor de probabilidad igual o menor que el  (0.05) se acepta H1 y se
rechaza H0.
6) Se utiliza en muestras pequeñas (de 20).
PRUEBA DE MC NEMAR PARA MUESTRAS DEPENDIENTES
Este procedimiento es útil cuando las muestras son dos y resultan dependientes.
El tipo de escala utilizado es la nominal, dicha prueba es un equivalente de la “t de
Student” y sólo es aplicable cuando existen dos momentos antes y después.
PROBLEMA
Un investigador de medicina preventiva observa que los empleados en una fábrica
padecen frecuentemente de cuadro diarreico motivo del gran ausentismo. El
supone que existe una higiene inadecuada en la proporción de la comida. Sin
embargo la higiene personal de los empleados no es suficiente para atribuir la
culpa personal de la cocina por lo tanto elige una muestra de 50 individuos, de los
que resultan 34 presentando cuadros diarreicos frecuentes y 16 no. Vigila que se
apliquen las medidas de higiene del personal con un exhaustivo lavado de mano
antes de ingerir los alimentos durante un periodo de 2 semanas.
Después de lavado de manos
Antes de + - total
lavado de + 18 a b 16 34
manos - 4 c d 12 16
total 22 28 50

H0: No existe relación entre la higiene de los cocineros y el cuadro diarreico que
presentan los empleados
H1: Existe relación entre la mala higiene de los cocineros y el cuadro diarreico que
presentan los empleados
Paso 2: Reemplazar los datos en la fórmula:
2
[(B−C )]
X2 = B+C
[(16−4 )]2
X2 = 16+4
X2=7.2
Paso 3: Encontrar los grados de libertad. (Buscar en la tabla de x 2)
gl = (C - 1)(r - 1)
gl= (2)(2)
gl= 4

-3.84 0 3.84 7.2
X2 (p< 0.05).
Existe diferencia significativa
Existe relación entre el cuadro diarreico presentado por los empleados y la mala
higiene de los cocineros.
PROBLEMA
Un psicólogo está interesado en la iniciación de los niños en los contactos
sociales. Ha observado que los niños recién llegados a una guardería suelen
iniciar sus contactos personales con adultos. Predice que con la creciente
familiaridad y experiencia los niños iniciarán cada vez más contactos sociales con
los niños.
Cambios en los objetivos de la iniciación de los niños
OBJETIVOS DE LA INICIACION AL DIA 30
Iniciación en los Adulto Niño Total

niños
Adulto 4 a b 14 18
Niño 4 c d 3 7
8 17 25

H0: Los niños iniciarán contactos sociales con los adultos.
H1: Con la creciente familiaridad y experiencia los niños iniciarán cada vez más
contactos sociales con los niños.
Paso 2: Reemplazar los datos en la fórmula:

[(B−C )]2
X2 = B+C
[(14−4 )]2 100
= =5 .55
X2 = 14+4 18
gl = (C - 1)(r - 1)
gl= (2-1)(2-1)
gl=(1)(1)
gl=1

X2 = 5.5
-3.84 0 3.84 5.5
X2 (p < 0.05).
Significativa.
Con la creciente familiaridad y experiencia los niños iniciarán cada vez más
contactos sociales con los niños.
Requisitos para el uso de la prueba de Mc Nemar

1) Se utiliza cuando se tienen dos muestras y son dependientes.
2) Utiliza escala nominal.
3) Es un equivalente de la “t de Student” para muestras dependientes y son
aplicables para 2 momentos: antes y después.
4) Utiliza la tabla de X2 para obtener los valores críticos.
5) Para todo valor de probabilidad igual o menor que el de  (0.05), se acepta H1 y
se rechaza H0.
PRUEBA DE PROPORCIONES DE UNA MUESTRA
Las pruebas de proporciones son adecuadas cuando los datos que se están
analizando constan de cuentas o frecuencias de elementos de dos o más clases.
El objetivo de estas pruebas es evaluar las afirmaciones con respecto a una
proporción (o Porcentaje) de población.
las pruebas para medias y proporciones se pueden utilizar para evaluar
afirmaciones con respecto a:
1) Un parámetro de población único (prueba de una muestra)
2) La igualdad de parámetros de dos poblaciones (prueba de dos muestras), y
3) La igualdad de parámetros de más de dos poblaciones (prueba de k muestras).
Además, para tamaños grandes de muestras, la distribución de muestreo
adecuada para pruebas de proporciones de una y dos muestras es
aproximadamente normal, justo como sucede en el caso de pruebas de medias de
una y dos muestras.
Esta prueba comprende el cálculo del valor estadístico de prueba Z
~
P−P0
Z= √
( p o −q o
n )
PROBLEMA
En una investigación de consumidores de drogas en una ciudad grande
encontraron 18 de 423 individuos con VIH positivo. Se pretende saber si es
posible concluir que menos de 5% de consumidores en la población muestreada
tienen VIH.
~
p = 18/423=0.426
Ho= p= 0.05
H1= p<0.05
Sustituyendo los datos en la fórmula.
0 . 425−0 . 05
Z= √(
(
0 . 425−0 . 95
423 )
=0.018
Diga si es o no significativa
Con alfa de 0.05
-0.4247 0 0.018 0.4247
Conclusiones
Z (p>0.05)
La proporción de la población que tiene VIH positivo probablemente sea de 0.05 o
más.
PRUEBA DE PROPORCIONES DE DOS MUESTRAS
El objetivo de una prueba de dos muestras es determinar si las dos muestras

independientes fueron tomadas de dos poblaciones, las cuales presentan la
misma proporción de elementos con determinada característica. La prueba se
concentra en la diferencia relativa (diferencia dividida entre la desviación estándar
de la distribución de muestreo) entre las dos proporciones muestrales. Diferencias
pequeñas denotan únicamente la variación casual producto del muestreo (se
acepta H0), en tanto que grandes diferencias significan lo contrario (se rechaza
H0). El valor estadístico de prueba (diferencia relativa) es comparado con un valor
tabular de la distribución normal, a fin de decidir si H0 es aceptada o rechazada.
Una vez más, esta prueba se asemeja considerablemente a la prueba de medias
de dos muestras.
Ejemplo ilustrativo
Se ponen a prueba la enseñanza de la Estadística empleando Excel y Winstats.
Para determinar si los estudiantes difieren en términos de estar a favor de la
nueva enseñanza se toma una muestra de 20 estudiantes de dos paralelos. De
paralelo A 18 están a favor, en tanto que del paralelo B están a favor 14. ¿Es
posible concluir con un nivel de significación de 0,05 que los estudiantes que están
a favor de la nueva enseñanza de la Estadística es la misma en los dos
paralelos?.
Los datos son:
Datos.
Paso 1. Elaborar hipótesis nula y alterna
Ho. Los estudiantes no difieren de estar a favor de la nueva enseñanza.
H1. Los estudiantes difieren en términos de estar a favor de la nueva enseñanza
Elaborar la prueba de hipótesis

Calculando la proporción muestral se obtiene:
-0.4750 0 0.4750 1.58
Significativa
Entonces z ( p < 0.05)
Conclusiones
Z (p< 0.05) por lo tanto se acepta H1

Los estudiantes difieren en términos de estar a favor de la nueva enseñanza
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA ENTRE LAS

PROPORCIONES DE DOS POBLACIONES.
La prueba que se utiliza con más frecuencia con relación a la diferencia entre las
proporciones de dos poblaciones es aquella en la que su diferencia es cero. Es
posible probar que dicha diferencia es igual a otro valor. Se pueden efectuar
pruebas tanto unilaterales como bilaterales.
Prueba de hipótesis
Ho.- p1-p2 = 0
H1.- p1-p2 ≠0
Problema
En un estudio de cuidados nutricionales en asilos para ancianos, (Lan y Justice

( A-21), encontramos que entre 55 pacientes con hipertensión, 24 tenían una
dieta con restricción de sodio. De 149 pacientes sin hipertensión, 36 tenían una
dieta sin sodio. ¿Cree usted que en las poblaciones muestreadas, la proporción de
pacientes con dieta restringida en sodio es mayor entre pacientes con hipert4nsión
que entre pacientes sin hipertensión?.
Supuestos:
Se supone que los pacientes forman una muestra aleatoria independiente
extraída de poblaciones con y sin hipertensión.
Hipótesis
Ho: p1= p2
H1: p1>p2
P1.- Es la proporción de la población de pacientes hipertensos con dieta bajas en

sal, p2.- Es la proporción de la población de pacientes sin hipertensión con dietas
bajas en sal.
Utilice nivel de significancia de 0.05

Valor critico = 0.05/2 = 0.025
VC= 1.96
Sustituir los datos en la fórmula
X1+ X2
p=
n1 +n 2
24+36 60
p= = =0.29
55+149 204
x1 x2
−
n 1 n2
Zprueba=
√ P ( 1−p ) (
1 1
+ )
n1 n2
24 36
−
55 149
Zprueba=
√ 0.29 (1−0.29 ) (
1
+
1
55 149
)
0.43−0.24
Zprueba=
√ ( 0.2059 ) (0.018+0.006)
0.19 0.19
Zprueba= =
√ 0.0032 0.056
Zprueba=3.39
-0.4750 0 0.4750 3.39
Z (p<0.05)
Significativa
La proporción de la población de pacientes hipertensos con dieta bajas en sal, es

mayor que la proporción de la población de pacientes sin hipertensión con dietas
bajas en sal.
COMPARACIONES ENTRE LOS PORCENTAJES DE DOS MUESTRAS
INDEPENDIENTES
Otra forma de resolver este problema
PROBLEMA
En un hospital se trataron por el método clásico 80 casos de viruela, de los cuales
murieron 24, con una letalidad de 30 %. Otros 120 casos fueron sometidos a un
nuevo tratamiento con 30 fallecimientos, con una letalidad del 25 %. Se desea
saber si existe diferencia significativa con  de 0.05.
Pacientes con viruela y defunciones según tratamiento. Venezuela, 1961.

Tratamiento Casos Defunciones %
Clásico 80 24 (p1)
Nuevo 120 30 (p2)
Total 200 54 (P0)

H0: No existe diferencia significativa entre el tratamiento clásico y el tratamiento
nuevo.
H1: Existe diferencia significativa entre el tratamiento clásico y el tratamiento
nuevo.
Paso 2: Determinar el % de letalidad de cada grupo de tratamiento.

% letalidad T. Clásico= 30%
% letalidad T. Nuevo= 25%
Paso 3: Determinar el % de letalidad del total de pacientes.

( 54 ) (100)
% Letalidad=
200
%Letalidad= 27%
Paso 4: Determinar la letalidad del universo

%Letalidad del universo= 100-27
% Letalidad del universo= 73%
Paso 5: Calcular el error estándar de la diferencia entre los dos porcentajes.
(E.E.) P1 - P2 =
Donde:
 p0 : letalidad global = 27%
 q0 : 100 - p0 = 100 - 27 = 93%
 : número de individuos en la primera muestra = 80
 : número de individuos en la segunda muestra= 120
Sustitución de datos con la formula:
(E.E.) P1 - P2 = √ (27)(73 ) (27 )(73)

80
+
120
(E.E.) P1 - P2 = 80 √
1971 1971
+
120
1 - P2 = √ 24.63+16.42=√ 41.05
(E.E.) P
(E.E.) P1 - P2 = 6.40
Paso 6: Averiguar la diferencia en la letalidad entre el primero y el segundo grupo.

Diferencia = 30-25= 5
Paso 7: Obtener el cociente de:
= 0.78
Paso 8 : Obtener el valor crítico en la tabla de distribución Z con  de 0.05.

-0.4750 0 0.4750 0.78
Z (p < 0.05).
Significativa.
Existe diferencia significativa entre el tratamiento clásico y el nuevo con respecto a
la letalidad.
Problema
200 pacientes que sufrían síndrome X fueron divididos al azar en dos grupos
iguales; el primer grupo recibió tratamiento estándar; 78 se recuperaron en un
plazo de 3 días. De los otros 100 tratados con un nuevo método, 90 se
recuperaron en 3 días. El investigador cree que existe diferencia de que el nuevo
tratamiento es más efectivo que el estándar.
Pacientes con diferentes tratamientos
Tratamiento Casos Recuperación %

Estándar 100 78 (P1)
Nuevo 100 90 (P2)
Total 200 168 (P0)

H0: No existe diferencia entre el tratamiento estándar y el nuevo tratamiento.
H1: Existe diferencia entre el tratamiento estándar y el nuevo tratamiento

H0 p1 – p2 = 0
H1 P1 – p ≠ 0
Paso 3: Determinar el % de letalidad para cada grupo de tratamiento.

Estándar= 78%
Nuevo= 90%
( 168 ) (100)
Global=
200
= 84
Paso 4: Obtener q0.

q0: 100-84
q0: 16
Paso 5 : Calcular el error estándar de la diferencia entre los dos porcentajes.
(E.E.) P1 - P2 =
(E.E.) P
1 - P2 =√(84 )(16 ) (84 )(16)
100
+
100
(E.E.) P1 - P2 = √ 1344 1344

+
100 100
√
(E.E.) P1 - P2 = 13.44+13.44= √ 26.88
(E.E.) P1 - P2 = 5.18
Paso 6: Averiguar la diferencia en la letalidad entre el primero y el segundo grupo.

Diferencia= 78-90= -12
Paso 7: Obtener el cociente de:
−12
=−2.3
5.18
Paso 8: Obtener el valor crítico en la tabla de distribución Z con  de 0.01.
-2.58 -2.3 0 2.58
Z (p > 0.01).
No significativa
Se acepta H0, por lo tanto se comete un Error tipo II
No existe diferencia significativa entre el tratamiento estándar y el nuevo
tratamiento.
Otra fórmula que se puede utilizar es la siguiente:
Z=
Requisitos para comparar porcentajes
1) Sirve para comparar proporciones o porcentajes entre dos grupos.

2) Utiliza escalas cuantitativas discontinuas. O nominales
3) Debe obtenerse los porcentajes de cada grupo.
4) No utiliza grados de libertad.
5) Utiliza niveles de significancia de 0.01 y 0.05 generalmente.
6) El valor crítico debe obtenerse en la tabla de distribución Z.
PRUEBA Q DE COCHRAN
Para tres o más muestras dependientes.
Es una prueba que puede considerarse como una extensión de la prueba de
McNemar.
El grupo sirve como su propio control, en el que existe un periodo previo y otro
ulterior
La escala es de tipo nominal.
Esta técnica se distribuye igual de la ji cuadrada, por lo tanto se expresa como x 2q.
FORMULA
X2Q= ( K−1 ) ¿ ¿
DONDE:
X2Q . = es la estadística de q de Cochran
K.- número de tratamientos.
Gn.- número total de respuestas de cambio por individuo de la muestra o hileras y
∑.= sumatoria.
PROBLEMA
Un psicólogo investiga el aprendizaje simple en 15 ratas a las que se les aplica
cuatro tratamientos diferentes a intervalos de un mes cada uno, para lo cual utiliza
cuatro laberintos distintos. Los tratamientos corresponden a 4 fármacos que según
afirman los fabricantes, tiene la capacidad para facilitar el aprendizaje.
Cada vez que ocurre un tratamiento aleatorizado.
Determina el investigador un periodo crítico de respuesta de la rata en estudio.
Con esto determina si fueron positivos o negativos.
Solución del laberinto
Identidad Trata1 Tara2 Tara3 Tarat4 Lc L c2

de la rata
1 0 0 1 0 1 1
2 1 1 1 0 3 9
3 0 1 1 0 2 4
4 0 1 1 1 3 9
5 1 0 1 1 3 9
6 1 1 0 0 2 4
7 1 0 0 1 2 4
8 0 1 1 1 3 9
9 0 0 1 0 1 1
10 0 0 0 1 1 1
11 1 0 1 0 2 4
12 0 0 1 0 1 1
13 0 0 1 0 1 1
14 1 0 1 1 3 9
15 0 1 1 1 3 9
∑Gn 6 6 12 7 31 75
PASO.1 Elaborar Ho y H1
HO : No existe diferencia entre los 4 tratamientos aplicados a las ratas.
H1: Existe diferencia entre los 4 tratamientos aplicados a las ratas.
PASO 2.- Arreglar la muestra individualmente de a cuerdo con las respuestas de
cambio.
PASO 3.- obtener la sumatoria de cada cambio por columna.

PASO 4.- Obtener la sumatoria por renglones de cada caso.
PASO 5.- Elevar al cuadrado la sumatoria por renglones de casos positivos.
PASO 6 .- Aplicar la formula señalada para este estudio.
X2Q= ( K−1 ) ¿ ¿
X2Q= ( 4−1 ) ¿ ¿
( 3 ) (99) 297
X2Q= =
49 49
X2Q= 6.06
PASO 7.- Calcular los grados de libertad.

Gl. = K-1
Gl= 4-1
Gl= 3
PASO 8.- obtener los valores críticos en la tabla de chi cuadrada con alfa de 0.05.
PASO 9.- diga si es o no significativa.

VC= 7.82
-7.82 0 6.06 7.82
X2Q. = (p > 0.05)

No significativa
No existe diferencia entre los 4 tratamientos aplicados a las ratas y su efecto en
ellas.
Requisitos para su uso

1.- Tener 3 o mas muestras dependientes.
2.- utiliza escala nominal.
3.- decidir nivel de significancia de 0.05 o 0.01.
Bibliografía
1.- Bradford H A: Principios de estadística medica. 3ra ed. El Ateneo ,1995.

2.- Basilio G: Manual de estadística. C.E.C.S. A, 1982.
3.- Huntsberger D, Billingsley P: Elementos de estadística inferencial . C.EC.S.A.
1983.
4.- Heber A, Runyon RP: Estadística general. Fondo Educativo Interamericano.
1989.
5.- Duncan RC, Knapp RG,et al: Bioestadística . Interamericana. 1978.
6.- Koosis DJ: Introducción a la inferencia estadística para administración y
economía. Limusa.1974.
7.- Mainland D: Estadística Médica. 2da ed. Interamericana. 1966.
969.
8.- Lewis AE: Bioestadística. C.E.C.S.A. 1969.
9.- Ilton JS, Tsokos JO: Estadística para biología y ciencias de la salud.
Interamericana, Mc Graw Hill. 1987.
10.- Siegel S: Estadística no paramétrica aplicada a las ciencias de la conducta.
Trillas. 1974.
11.- Wayne D. Bioestadística, base para el análisis de las ciencias de la salud.
3ra
ed. Limusa. 1987.
12.- Hoel PG: Estadística elemental. C.E.C.S.A. 1973
13.- Downie NM, Heath W: Métodos estadísticos aplicados. Harla . 1973.
14.- Levin J: Fundamentos de estadística en investigación social. 2da ed. Harla.
1979.
15.- Kreyszig E: Introducción a la estadística matemática. Principios y métodos.

Limusa- wiley. SA. 1973
16.- Spiegel M R: Estadística. Mc Graw-Hill. 1975.
17.- Castilla-Serna L., Estadística simplificada para a investigación en ciencias de
la salud, Ed. Trillas, México, D.F. 1991.

Manual Estadística Completo

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Manual Estadística Completo

Cargado por

Copyright:

Formatos disponibles

PROBABILIDAD

La probabilidad es la posibilidad de que ocurra un evento.

La probabilidad es igual al número de eventos que ocurre en determinado

p = h/n = 1/2 = 0.50

2).- ¿Cuál es la probabilidad de que en una tirada de dado salga 6?

p = h/n = 1/6 = 0.16

3).-¿Cuál es la probabilidad de que en una tirada de dado salga el 2 o el 4?

p = h/n = 2/6 = 0.33

4).- ¿Cuál es la probabilidad de que salga un as de un conjunto de barajas si el

1- REGLA DE LA SUMA: afirma que la probabilidad de obtener un resultado,

p = h/n = 1/6 = 0.16

La regla de la suma supone que los resultados se excluyen mutuamente y que no

PROPIEDADES ELEMENTALES DE LA PROBABILIDAD

3).- Probabilidad de la ocurrencia: la probabilidad de la ocurrencia {E 1} o {Ej} es

p = p {E} h/n (probabilidad de la ocurrencia)

q = 1-p {E} ó q = {no E}; 1-p = (probabilidad de no ocurrencia)

1).- ¿Cuál es la probabilidad de que en una tirada de dado no salga el 3 o el 4?

2).- ¿Cuál es la probabilidad de que no salga un as en un conjunto de barajas?

4).- ¿Qué probabilidad hay de que en una tirada de dados no salga el 4 o 5?

Condiciones del Ensayo de Bernoulli:

1) Cada ensayo conduce a uno de los resultados posibles mutuamente exclusivos,

n 3628800 3628800 p=0.026

Para este capítulo de toma de decisiones el planteamiento de la hipótesis de

Para establecer si una diferencia muestral obtenida es estadísticamente

2.5 % 47.5 % 0 47.5 % 2.5 %

Diferencia entre mujeres y hombres con respecto al etnocentrismo.

No. De Mujeres Hombres

TOTAL 147 152 771 822

H0: Los hombres no difieren de las mujeres con respecto al etnocentrismo.

H1: Los hombres difieren de las mujeres con respecto al etnocentrismo.

Paso 2: Elaborar la prueba de hipótesis

Paso 3: Determinar la media.

Paso 4 : Obtener la desviación estándar de cada grupo.

Paso 5: Encontrar el error estándar de cada media.

Paso 6: Encontrar el error estándar de la diferencia.

dif = √(0 .35 )2+(0 .36 )2

1 - 2 4.2- 4.34 -0.14

Paso 8: Obtener la razón de “Z” con  de 0.05.

1.00 - 0.05 = 0.95

El valor de Z obtenido es menor de acuerdo con el valor o razón crítica, Z (p 

Comparaciones entre diabéticos de diferentes años de evolución, con respecto a

Casos x1:diabéticos de 10 x2:diabéticos x12 x22

H0: Los diabéticos con más de 10 años de evolución no tienen diferente

H1: Los diabéticos con más de 10 años de evolución tienen diferente

Paso 2: Obtener la prueba de hipótesis.

Paso 3: Obtener la media de cada grupo.

Paso 4: Obtener la desviación estándar de cada grupo

Paso 5: Hallar el error estándar de cada media.

Paso 6: Hallar el error estándar de la diferencia.

dif = √(0 . 412)2+(0 . 449)2

Paso 7 : Obtener “Z”.

1 - 2 5.43 – 6.13 -0.7

Paso 8: Obtener la razón de “Z” con  de 0.05.

* Nota : cuando en la hipótesis alterna se maneja ““ ó ““ , el valor de  se

1.00 - 0.10 = 0.90

Buscando en la tabla Z el número más cercano = 0.4505

La diferencia entre las medias observadas no es significativa,

MUESTRAS RELACIONADAS CON MEDICIONES ANTES Y DESPUÉS PARA

Un investigador desea saber si existe diferencia en la concentración de de 7α-

Pacientes antes después D d2

H0: No existe diferencia en la concentración de de 7α-HCO al inicio y un mes

H1:Existe diferencia en la concentración de de 7α-HCO al inicio y un mes

Paso 2: Obtener la prueba de hipótesis.

Paso 4: Encontrar la desviación estándar de la diferencia entre el tiempo antes y