Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medias en un grupo
Ms. Zoraida Yanet Vidal Melgarejo
zvidalm@upao.edu.pe
-2-
-3-
-4-
Antes que se discutan interrogantes de investigación que impliquen las medias, habrá que
detenerse un momento y pensar acerca de lo que es necesario para convencer que la media en
un estudio es significativamente diferente de una norma o media de una población.
Si se desea determinar si la ingesta media de energía en niños de dos años que acuden a consulta
es diferente de la media de un estudio de nutrición nacional, ¿qué datos se deben tener para
concluir que en la incorporación de energía es diferente en un grupo y no una coincidencia?
Si la media de la ingesta de energía es mayor o menor que la media del estudio de nutrición
nacional, como se muestra en la Figura 1 – A, se concluya que la diferencia es real, ¿qué
pasa si la diferencia es relativamente moderada, como en la Figura 1 – B ?
-5-
-7-
•
•
-8-
•
-9-
- 10 -
Student en realidad era un matemático llamado William Gosset, quien descubrió que cuando una
observación procede de una distribución normal, las medias se distribuyen de manera normal, sólo si se
conoce la verdadera desviación estándar de la población. Gosset denominó distribución t, a las
distribuciones de medias en las que se emplea la desviación estándar de la muestra
- 11 -
• ഥ ) menos el
La fórmula (o relación crítica) para la prueba de t tiene la media observada (𝑿
valor hipotético de la medio poblacional (𝝁) en el numerador, y el error estándar de la
media como denominador. El símbolo 𝝁 representa la verdadera media de la población.
ഥ −𝝁
𝑿
𝒕=
𝑫𝑬 / 𝒏
ഥ −𝝁
𝑿
=
𝑬𝑬
• Como la distribución t posee una desviación estándar mayor, por tanto resulta más ancha, con
colas más altas que las correspondientes a la distribución z. Ya que el tamaño de la muestra
incrementa a 30 o más, también lo hacen los grados de libertad, y la distribución de t aumenta
hasta ser casi la misma que la distribución estándar normal, y puede usarse tanto t como z.
En medicina, por lo general se usa la distribución t, aún cuando el tamaño de la muestra sea
de 30 o mayor. Los programas de cómputo como el Visual Statistics (módulo sobre
distribuciones continuas) o ConStats que sirven para el trazo de diferentes distribuciones,
pueden emplearse para generar distribuciones t en diferentes tamaños de muestra, de
manera que puedan compararse, como se hizo en la Figura 2.
- 13 -
- 14 -
• Con los datos de Dennison et al. (1997) Cuadro 1, se tiene que la media es 5.97 oz/día y la
desviación estándar es de 4.77. Los grados de libertad para la media de un solo grupo es n – 1, o
94 – 1 =93, el valor que corresponde a un límite de confianza de 95% se encuentra cerca de la
mitad 2.00 por 60 grados de libertad y 1.98 por 120 grados de libertad; por tanto usarán 1.99. Se
sustituye con éstas cifras los términos de la fórmula anterior y se obtiene:
𝑫𝑬
ഥ±𝒕
𝑿
𝒏
𝟒. 𝟕𝟕
= 𝟓. 𝟗𝟕 ± 𝟏. 𝟗𝟗
𝟗𝟒
= 𝟓. 𝟗𝟕 ± 𝟏. 𝟗𝟗 𝟎. 𝟒𝟗
= 𝟓. 𝟗𝟕 ± 𝟎. 𝟗𝟖
• Este intervalo de confianza se interpreta como sigue: en otra muestra de niños de 2 años de
edad, Dennison et al. (u otros investigadores) observaron casi en todas las ocasiones una
media del consumo de jugo de frutas diferente al de este estudio. Desde luego desconocerán
la media verdadera.
• Los investigadores médicos, con frecuencia emplean gráficas de error para ilustrar medias e
intervalos de confianza.
El Recuadro 1 muestra una gráfica de error de la media del consumo de jugo de frutas entre niños
de dos años junto con los límites de confianza de 95%. Este análisis puede replicarse usando el
procedimiento exploratorio SPSS.
- 17 -
- 18 -
- 19 -
• Para ilustrar las pruebas de hipótesis, se usan los datos de ingestión de energía de Dennison et al.
(1997) del Cuadro 1. Se tomarán estas observaciones al comprobar si la media de ingestión
energética en niños de dos años de edad es diferente de la media de ingestión energética
mostrada en los datos del estudio NHANES III que aparecen en el Cuadro 2, bajo la suposición de
que esta última representa la norma.
• Otra forma de plantear la interrogante a investigar es: ¿Los niños de dos años en la muestra
estudiada por Dennison et al., en promedio, obtienen la misma cantidad energética que los niños
de dos años en el estudio de NHANES III?
- 20 -
• Primero, se asume que la media de ingesta de energía es la misma que se obtuvo en el estudio
NHANES III (1286 kcal), para después buscar la probabilidad de observar una media de
incorporación de energía igual a 1242 kcal en una muestra de 94 niños, dada la presunción. Si la
probabilidad es grande, se concluye que la suposición está justificada y que la media de ingesta
de energía observada en el estudio no es, desde el punto de vista estadístico, diferente del visto
en el informe del estudio NHANES III. Sin embargo, si la probabilidad es pequeña, como 1 de cada
20 (0.05) o 1 por cada 100 (0.01), se puede concluir que la suposición no se justifica y que en
realidad si hay diferencia, esto es, que los niños de dos años del estudio de Dennison tienen una
media de consumo de energía diferente a la observada en el estudio NHANES III.
- 21 -
- 22 -
- 24 -
Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
Una hipótesis estadística es la exposición de una creencia acerca de los parámetros
poblacionales. De manera semejante a “probabilidad”, el término “hipótesis” posee un
significado más preciso en la estadística del que tiene por uso común.
- 25 -
Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
𝑯𝟏 : la ingesta de energía por niños de dos años en el estudio de Dennison et al., 𝜇1 , es diferente de la
norma (la media de NHANES III), 𝜇0 , expresada como 𝜇1 ≠ 𝜇0 (debe recordarse que 𝜇 corresponde a
la verdadera media de una población).
Estas hipótesis son para pruebas de dos colas (o no direccionales). La hipótesis de nulidad será
rechazada si la media de la energía obtenida es suficientemente mayor que 1286 kcal o
suficientemente menor a 1286 kcal.
- 26 -
Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
• La desventaja de usar pruebas de una sola cola son que una vez que los investigadores se empeñan
en seguir este enfoque, están obligados a poner a prueba la hipótesis en la dirección enunciada.
• Si, por alguna razón inesperada, la media de muestra se aparta en sentido opuesto a la media de la
población, los investigadores no podrán afirmar que el punto de partida es significativo.
• Quienes hacen la investigación médica, a menudo requieren pruebas para identificar posibles
efectos adversos inesperados, al tiempo que se hacen pruebas para identificar efectos positivos ya
previstos.
Dos colas o no
direccional.
- 29 -
Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
• Para decidir la prueba estadística adecuada se procede de como sigue. Cada prueba estadística tiene
una distribución de probabilidades. En este ejemplo, la prueba estadística apropiada se basa en la
distribución t, porque se desea hacer inferencias sobre una media y se requiere usar la desviación
estándar de la muestra, ya que se desconoce la desviación estándar de la población. La prueba de t
es la prueba estadística para comprobar una media; es la diferencia entre la media de una muestra y
la media hipotética dividida entre el error estándar.
ഥ −𝝁
𝑿
𝒕=
𝑫𝑬 / 𝒏
ഥ −𝝁
𝑿
=
𝑬𝑬
- 30 -
Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
- 31 -
Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
- 32 -
Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
- 34 -
Prueba de hipótesis
Equivalencia de los intervalos de 2
confianza y las pruebas de hipótesis
Los resultados de las pruebas de hipótesis permiten concluir que la ingesta media de energía en los niños
de dos años estudiados por Dennison et al. no difiere de la media obtenida en el estudio NHANES III (1286
kcal), usando el valor de 𝛼 de 0.05. Aunque no se muestran los cálculos realizados, el intervalo de
confianza de 95% para la media de ingestión energética es 1189 a 1295 kcal, lo que significa que se tiene
el 95% de confianza.
• Se puede concluir que la media obtenida por Dennison y colaboradores, muy bien podría ser 1286
kcal, aun cuando la que ellos encontraron fue de 1242 kcal. Cuando se comparan los dos enfoques, se
aprecia que los grados de libertad (94-1=93) son los mismos, el valor crítico de t es el mismo, ±1.99, y
las conclusiones son las mismas. La única diferencia es que el intervalo de confianza da una idea del
rango dentro del cuál la media puede presentarse al azar.
- 35 -
Prueba de hipótesis
Errores en las pruebas de hipótesis 3
En la prueba de hipótesis es un error concluir que hay una diferencia cuando no existe
ninguna (error tipo I o 𝛼 ), o que no hay diferencia cuando ésta sí existe (error tipo II o β).
El caso marcado por I, llamado error tipo I es por rechazar la hipótesis de nulidad cuando es
verdadera, 𝛼 es la probabilidad de cometer el error tipo I.
Un error tipo II produce en el caso marcado por II, el error consiste en no rechazar la
hipótesis de nulidad cuando es falsa.
- 36 -
- 37 -
Prueba de hipótesis
Potencia 4
La potencia es importante en la prueba de hipótesis .
- 38 -
Prueba de hipótesis
Valores de P 5
• El valor de P se relaciona con las pruebas de hipótesis (aunque a veces se expresa junto con los
intervalos de confianza); es la probabilidad de obtener un resultado tan extremo como el que se
observó, si la hipótesis de nulidad resulta verdadera.
• El valor de P se calcula después de realizada la prueba estadística; si el valor de P es menor que 𝛼,
se rechaza la hipótesis de nulidad.
• Para la prueba de una cola el valor crítico es 1-665 ligeramente menor que el valor encontrado de
-1.67. Se puede reportar el valor de P como P > 0.10 o P < 0.05 para indicar que el nivel de
significancia es mayor que 0.10. Sin embargo es más fácil y más preciso utilizar un programa de
cómputo.
El valor de P asume primero que la hipótesis nula es verdadera y entonces indica la
probabilidad de obtener un resultado más extremo al que se observó. En un lenguaje más
directo, el valor de P es la probabilidad de observar un resultado que ocurrió sólo por
casualidad.
- 39 -
Prueba de hipótesis
Analogías para la prueba de hipótesis 6
• Las analogías siempre ayudan para mejorar la comprensión de temas nuevos o complejos.
Algunas características de las pruebas diagnósticas, como la sensibilidad y la especificidad,
proporcionan una analogía directa para la prueba de hipótesis.
• Un error tipo I, concluir incorrectamente que existe significancia, cuando el resultado es no
significativo, es similar a una prueba falsa positiva que de manera incorrecta indica una
enfermedad cuan está ausente.
• De la misma manera, un error tipo II se comete al concluir incorrectamente que no hay
significancia cuando el resultado sí es significativo, lo que es análogo a una prueba falsa negativa
que indica de manera incorrecta la ausencia de una enfermedad que en realidad está presente.
- 40 -
- 41 -
• La distribución binomial tiene ciertas características interesantes de las que se puede sacar
provecho. La Figura 4 muestra la distribución binomial cuando la proporción de población 𝜋 es
0.2 y 0.4 para tamaños de muestra de 5, 10 y 25.
• Se observa que la distribución tiene cada vez más la forma de campana, conforme el tamaño
de la muestra aumenta y la proporción se acerca a 0.5.
• Estas observaciones conducen a la idea de usar la normal estándar, o distribución z, como una
aproximación a la distribución binomial.
- 42 -
No diluida, 108.1 pfu/mL 106 103 97.2 (92.0 a 99.4) 103 97.2 (92.0 a 99.4)
Dilución 1:5, 107.2 pfu/mL 234 232 99.1 (97.0 a 99.9) 234 100.0 (98.4 a 100.0)
7.0 3356
Dilución 1:10, 10 pfu/mL 340 330 97.1 (94.7-98.6) 98.8 (97.0 a 99.7)
- 43 -
1. El éxito se definió por la formación de vesícula de 7 a 9 días después de la inoculación intradérmica con aguja bifurcada. Los sujetos que no tuvieron
una respuesta inicial fueron revacunados entre 7 y 17 días después. IC denota intervalo de confianza.
2. El título de cada grupo es el medio de todos los frascos de vacuna preparados para usar en el estudio salvo para las diluciones 1:10, para las cuales se
descartaron 2 de 14 preparaciones (como se explica en la sección de Resultados). Las cantidades medias del virus de vaccinia en las agujas bifurcadas
representativas fueron de 105.0 pfu en el caso de la vacuna no diluida, 104.3 pfu en el caso de la dilución 1:5 y 103.9 pfu en el caso de la dilución 1:10.
3. La edad media de los 15 sujetos sin respuesta a la vacunación fue significativamente mayor que la de los sujetos con respuesta (27.1 en comparación
24.6 años, P= 0.03); 6 de los 15 tuvieron anticuerpo neutralizador contra el virus de vaccinia antes de la vacunación inicial. Al profundizar en el
interrogatorio, tres de los sujetos seropositivos informaron del antecedente de un viaje internacional antes de 1985 o de servicio militar.
4. El valor en el grupo que recibió la vacuna no diluida menor el valor en el grupo que recibió la dilución 1:5 fue de -2.0 puntos porcentuales (límite
superior del intervalo de confianza 95% de una cola, 2.3 puntos porcentuales).
5. El valor en el grupo que recibió la vacuna no diluida menos el valor en el grupo de dilución 1:5 fue de -2.8 puntos porcentuales (límite superior del
intervalo de confianza 95% de una cola, 0.5 puntos porcentuales). De igual modo, el valor en el grupo que recibió la vacuna no diluida menos el valor en
el grupo con la dilución 1:10 fue de 1.7 puntos porcentuales (límite superior del intervalo de confianza 95% de una cola, 1.7 puntos porcentuales). El
valor en el grupo que recibió la vacuna no diluida menos el valor en los dos grupos combinados que recibieron la vacuna diluida fue de -2.1 puntos
porcentuales (límite superior del intervalo de confianza 95% de una cola, 0.6 puntos porcentuales). Cuando se combinaron los dos grupos que
recibieron la vacuna diluida, la diferencia en los valores entre este grupo y el grupo que recibió la vacuna no diluida fue de -2.1 puntos porcentuales
(límite superior del intervalo de confianza 95% de una cola, 0.6 puntos porcentuales).
6. Uno de los 340 sujetos que no puedo ser revacunado por limitaciones logística.
- 44 -
- 45 -
- 46 -
- 47 -
𝝅(𝟏 − 𝝅) 𝒑(𝟏 − 𝒑)
𝒐
𝒏 𝒏
- 48 -
𝒑(𝟏 − 𝒑)
𝑷 ± 𝟏. 𝟗𝟔 ×
𝒏
- 49 -
𝟎. 𝟗𝟕𝟏(𝟏 − 𝟎. 𝟗𝟕𝟏)
𝟎. 𝟗𝟕𝟏 ± 𝟏. 𝟗𝟔 × = 𝟎. 𝟗𝟕𝟏 ± 𝟎. 𝟎𝟏𝟖
𝟑𝟒𝟎
• Por tanto, lo investigadores pueden tener 95% de confiabilidad de que el intervalo de 0.953 a
0.988% contiene la verdadera proporción de sujetos que tuvieron una vacunación exitosa con
la dilución de la vacuna 1:10. En el cuadro 5 se dan los resultados de esta prueba para una
proporción en el NCSS.
- 50 -
- 51 -
• Se considera que los investigadores buscaban conocer si la proporción observada de 0.971 era más
significativa que 0.95. La letra griega 𝜋 representa la hipótesis de la proporción de la población
porque la hipótesis nula se refiere a la población:
𝑯𝟎 : la proporción de sujetos con una vacunación exitosa es 0.95 o menor, o π ≤ 0.95.
𝑯𝟏 : la proporción de sujetos con una vacunación exitosa es mayor de 0.95, o π > 0.95.
- 52 -
• Al multiplicar el tamaño de la muestra simple (340) por la proporción (0.971), se tiene 330 y
la muestra por 1 menos la proporción (0.029) da 10. Como ambos resultados son mayores a
5, se puede usar la prueba de z, la cuál, al igual que la prueba t, toma la forma común del
valor estadístico menos el valor hipotético entre el error estándar
𝒑−𝝅
𝒛=
𝝅(𝟏 − 𝝅)/𝒏
- 53 -
𝟎. 𝟗𝟕𝟏 − 𝟎. 𝟗𝟓 𝟎. 𝟎𝟐𝟏
= = 𝟏. 𝟕𝟓
𝟎. 𝟗𝟓 𝟏 − 𝟎. 𝟗𝟓 /𝟑𝟒𝟎 𝟎. 𝟎𝟏𝟐
- 55 -
- 56 -
- 58 -
Distribución
normal
𝝁 = 𝟎, 𝝈 = 𝟏
- 59 -
𝑷 − 𝝅 − 𝟏/(𝟐𝒏)
𝒛=
𝝅(𝟏 − 𝝅)/𝒏
- 60 -
- 61 -
- 63 -
- 64 -
- 65 -
σ 𝒅−𝒅 𝟐
𝑫𝑬𝒅 = , 𝒐 𝟐𝟔. 𝟔𝟖
𝒏−𝟏 - 66 -
𝑫𝑬𝒅 𝟐𝟔. 𝟔𝟖
ഥ ± 𝒕(𝒏−𝟏) ×
𝒅 = 𝟐𝟏. 𝟐𝟐 ± 𝟐. 𝟎𝟏
𝒏 𝟓𝟏
= 𝟐𝟏. 𝟐𝟐 ± 𝟐. 𝟎𝟏 × 𝟑. 𝟕𝟑
= 𝟐𝟏. 𝟐𝟐 ± 𝟕. 𝟓𝟏 = 𝟏𝟑 − 𝟕𝟏 𝒂 𝟐𝟖. 𝟕𝟑
- 67 -
• Este intervalo de confianza puede interpretarse como sigue. Hay 95% de seguridad de que la diferencia
media verdadera en 7𝛼 − 𝐻𝐶𝑂 a un mes en comparación la línea basal entre 13.71 y 28.73.
Lógicamente, debido a que todo intervalo es mayor que cero, se puede tener 95% de seguridad de
que la diferencia media es mayor que cero. En otras palabras, es la manifestación de como 7𝛼 − 𝐻𝐶𝑂
incrementa en el mes siguiente de la colecistectomía.
- 68 -
- 69 -
- 70 -
La hipótesis estadística para un diseño pareado, a menudo se plantea como sigue, donde la letra
griega (𝛿) representa la diferencia de la población:
- 71 -
• El valor de t que divide la distribución en 99% central es, por interpolación, 2.682 con 0.5% del
área de cada cola con n-1=50 grados de libertad. Por tanto, se rechaza la hipótesis de nulidad de
que el programa no establece diferencia si el valor de t estadística es menor a -2.682 o mayor
que + 2.682.
- 73 -
ഥ−𝜹
𝒅 𝟐𝟏. 𝟐𝟐 − 𝟎 𝟐𝟏. 𝟐𝟐
𝒕= = = = 𝟓. 𝟔𝟖
𝑫𝑬𝒅 / 𝒏 𝟐𝟔. 𝟔𝟖 / 𝟓𝟏 𝟑. 𝟕𝟒
• Una forma habitual de mediar la confiabilidad intervaluatoria cuando las mediciones son nominales, es
mediante el uso de la estadística kapa 𝜅. Si las mediciones se hacen mediante escala numérica, se
encuentra la correlación entre medidas.
• En el planteamiento de problema 4, Yuan et al. (2001) interpretaron la IRM de 90 localizaciones de la
arteria carótida y compararon sus hallazgos con los exámenes histopatológicos. La kappa estadística
puede usarse para estimar el nivel de concordancia entre los hallazgos de la IRM y la histología.
• La información de los Cuadros 9 y 10 son los resultados de la IRM y el examen histológico que tuvieron
una concordancia de que 56 de 90 fueron positivos y 22 negativos.
- 76 -
- 77 -
Mediciones simétricas
Error estándar
Valor 𝑻𝟐 aproximada Sig. Aproximada
asintótico
Medición de acuerdo kappa .692
.081 6.706 .000
N de casos válidos 90
- 81 -
En estudios en los cuáles los resultados son una variable binaria (si o no), los investigadores
podrías desear conocer cuándo cambia la proporción de individuos que tienen (o no) la
característica de interés, después de una intervención o del paso del tiempo.
- 82 -
- 83 -
- 85 -
Otra transformación es la transformación por raíz cuadrada Y=√X. Aunque esta transformación no
se emplea con tanta frecuencia en medicina como la transformación logarítmica, sí puede, en
cambio, se de utilidad cuando una transformación logarítmica produce una sobrecorrección. En un
estudio de mujeres a quienes se les administró un bloqueador paracervical para disminuir dolor y
calambres por criocirugía, una de las variables usadas para medir el dolor tenía mucho sesgo. Los
autores usaron la transformación por raíz cuadrada y mejoraron los resultados. Se calcularon el
logaritmo natural y la raíz cuadrada de la calificación del dolor. Se muestra el histograma de cada
uno en la figura 7. Puede verse que ninguna de las transformaciones se acerca a la distribución
normal. En este caso, los investigadores muy bien podrían seleccionar un procedimiento no
paramétrico que no dé lugar a suposiciones sobre la forma de la distribución.
- 87 -
- 89 -
- 90 -
𝒏!
𝑷 𝒙 = 𝝅 𝒙 𝟏 − 𝝅 𝒏−𝒙
𝒙! 𝒏 − 𝒙 !
𝟗𝟒!
𝑷 𝟓𝟕 = 𝟎. 𝟓 𝟓𝟕 𝟏 − 𝟎. 𝟓 𝒏−𝒙
𝟓𝟕! 𝟗𝟒 − 𝟓𝟕 !
• Lejos de tratar de calcular esta probabilidad, se usa este ejemplo como oportunidad para utilizar la
aproximación z a la distribución binomial para ilustrar la prueba de signo. Se usa el mismo grado de α
junto con una prueba de dos colas, para comparar los resultados de la prueba de t directamente de la
sección Pasos para la prueba de hipótesis.
- 91 -
- 95 -
𝑿 − 𝒏𝝅 − (𝟏Τ𝟐)
𝒛=
𝒏𝝅(𝟏 − 𝝅)
Donde X es el número de niños con cantidades de energía obtenida menores de 1286 (57 en
este ejemplo) o puede usarse el número de niños con ingesta de energía mayores que 1286,
esto no es importante. El número total de niños es de n=94, y la probabilidad π = 0.5, para
indicar que hay 50% de oportunidades de observar una mediana menor (o mayor). - 96 -
Paso 4
• El valor crítico de la distribución z para α = 0.05 es ± 1.96. Por tanto, si la prueba
estadística de z es ≤-1.96 o ≥+1.96, se rechazará la prueba de nulidad enunciando que no
existe diferencia en las medianas de las cantidades ingeridas de energía.
- 97 -
𝟓𝟕 − 𝟗𝟓(𝟎. 𝟓) − 𝟎. 𝟓
𝒛=
𝟗𝟒(𝟎. 𝟓)(𝟏 − 𝟎. 𝟓)
𝟓𝟕 − 𝟒𝟕 − 𝟎. 𝟓
𝒛=
𝟒. 𝟖𝟓
𝟗. 𝟓
𝒛=
𝟒. 𝟖𝟓
𝒛 = 𝟏. 𝟗𝟔
- 98 -
• El valor de la prueba de signo es 1.96, y está justo en la línea de +1.96. Los especialistas en esta
disciplina tienen por tradición no rechazar la hipótesis de nulidad, a menos que el valor de la prueba
estadística excede el valor crítico.
• Hay dos puntos interesantes. Primero, el valor de la prueba estadística usando la prueba t fue -1.37. Al
ver la fórmula se aprecia que el valor crítico de la prueba de signo es positivo por usar el valor
absoluto en el numerador. Segundo, se saca la misma conclusión cuando se utiliza la prueba de t. Sin
embargo, de no haber usado la correlación de continuidad, el valor de z habría sido 10/4.85, o 2.06, y
se hubiera rechazado la hipótesis de nulidad.
- 99 -
• En caso de diseños pareados, puede utilizarse la prueba de signo que se empleó para un solo
grupo, aplicándola a las diferencias. Alternativamente, se puede utilizar un procedimiento no
paramétrico llamado prueba de rango con signo de Wilcoxon (también conocido como prueba
de U de Mann – Whitney). De hecho, no existe desventaja alguna en usar la prueba de rango
con signo de Wilcoxon en cualquier caso, el tamaño de muestra es pequeño aun cuando las
observaciones tengan distribución normal. La prueba de Wilcoxon es casi tan poderosa
(rechazando sin error la hipótesis de nulidad cuando es falsa) como la prueba t.
• Se recomienda la prueba de Wilcoxon, por encima de la prueba de signo para comparaciones
pareadas por ser más potente. En el pasado, la prueba de Wilcoxon para designación de rango
requería cálculos exhaustivos o tablas estadísticas extensas. En la actualidad, sin embargo, las
pruebas no paramétricas se realizan fácilmente con rutinas de cómputo.
- 100 -
- 101 -
Estadísticas de prueba
7α_HCO un mes después de CCT-7α_HCO
antes de CCT
z −5.3711
Sig. Asint (dos colas) .000
1Basados en rangos negativos
2Prueba de rangos señalados de Wilcoxon
- 103 -
CCT = colecistectomía; 7α_HCO = 7α – hidroxi – 4 – colesten – 3 – uno
• Una variedad de fórmulas puede determinar el tamaño requerido de una muestra, y diversos
programas de cómputo hacen los cálculos de tamaños de las muestras para un gran número de
diseños de estudios y de métodos estadísticos. Lerman (1996) hizo una descripción avanzada
acerca de la lógica para calcular el tamaño de una muestra para investigación clínica.
• Muchas personas prefieren usar un programa de computadora para calcular los tamaños de las
muestras. Los manuales que acompañan a estos programas son de mucha utilidad.
• También se ofrecen fórmulas que protegen contra los errores tipo I y tipo II en dos casos
comunes: un estudio que comprende una media o una proporción, y un estudio que mide un
grupo dos veces y que compara la diferencia entre antes y después de una intervención.
- 104 -
1. ¿Qué grado de significancia (grado α o valor de 𝑃) requiere en relación con la hipótesis de nulidad?
2. ¿Cuál es el grado de potencia (igual a 1-𝛽) que desea?
3. ¿Qué tan grande debe ser la diferencia entre la media y valor estándar o norma (𝜇1-𝜇0) para que la
diferencia tenga importancia clínica?
4. ¿Cuál es una estimación suficiente de la desviación estándar 𝜎?
- 105 -
ഥ
𝒙 − 𝝁𝟎 ഥ
𝒙 − 𝝁𝟏
𝒛𝜶 = y 𝒛𝜷 =
𝜹Τ 𝒏 𝜹Τ 𝒏
- 107 -
• Para concluir, el consumo medio de jugo ≤ oz/día o ≥ 6 oz/día es punto de partida significativo
para un supuesto consumo de 5 oz/día (con una desviación estándar de 3), para lo cual los
investigadores requieren un tamaño de muestra igual a 71.
- 108 -
𝟐
𝒛𝜶 𝝅𝟎 (𝟏 − 𝝅𝟎) − 𝒛𝜷 𝝅𝟏 (𝟏 − 𝝅𝟏)
𝒏=
𝝅𝟎 − 𝝅𝟏
• Donde, usando la misma lógica como con el tamaño de la muestra para una
media, zα es el valor de z de dos colas relacionado con la hipótesis nula, y zβes
el valor de z de una cola más bajo relacionado con la hipótesis alterna.
- 110 -
𝟐
𝟏. 𝟗𝟔 𝟎. 𝟗𝟎 𝒙𝟎. 𝟏𝟎 − (−𝟎. 𝟖𝟒) 𝟎. 𝟗𝟓𝒙𝟎. 𝟎𝟓
𝒏=
𝟎. 𝟗𝟎 − 𝟎. 𝟗𝟓 A partir de lo cual elevando
𝟐
𝟎. 𝟕𝟕 al cuadrado se tiene 238.
𝒏=
−𝟎. 𝟎𝟓
𝒏 = 𝟏𝟓. 𝟒𝟎𝟐
- 111 -
- 112 -
- 113 -