Medias en Un Grupo

Facultad de Medicina Humana
Escuela Profesional de Medicina Humana
Medias en un grupo
Ms. Zoraida Yanet Vidal Melgarejo
zvidalm@upao.edu.pe
Adaptado de: Bioestadística Médica. Dawson & Trapp.

Editorial Manual Moderno. 2005.
Preguntas de investigación sobre un grupo

Planteamiento del Problema 1
Bárbara Dennison et al. (1997) hicieron una pregunta inquietante relacionada con la nutrición de los
niños pequeños: ¿Cómo afecta el consumo de jugo de frutas, durante los primeros años de la infancia,
los parámetros de desarrollo? Las American Academy of Pediatrics ha advertido que el consumo
excesivo de jugo de frutas puede causar síntomas gastrointestinales, incluyendo: diarrea, dolor e
inflamación, como consecuencia de mala absorción de la fructosa y la presencia de azúcar, alcohol y
sorbitol no absorbibles. Se ha reportado que el consumo excesivo de jugo de frutas es un factor
contribuyente al escaso crecimiento.
Estos investigadores diseñaron un estudio seccional cruzado en el cuál participaron 116 niños de dos
años de edad y 107 niños de cinco años, que asistían a una clínica pediátrica de primer nivel. Los
padres de los menores recibieron instrucciones para llenar un registro dietético durante siete días, que
incluyera consumo diario de líquidos por el niño – leche, jugo de frutas, gaseosas y otras bebidas.
-2-
Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Docente: Ms. Zoraida Yanet Vidal Melgarejo Pág. 1

La estatura se midió en cerca de 0.1 cm, y el peso en cerca de 0.25 libra. Se definió el exceso de
consumo de jugo de frutas como ≥ 12 fl oz/día.
Como medida de obesidad se tomaron el índice de masa corporal (IMC) y el índice relativo al peso.
Encontraron que la ingesta energética en la dieta de los niños, incluidos en el estudio, 1245 kcal y 1549
kcal en niños de cinco años, era notablemente, similar a la informada por la National Health and
Nutrition (NHANES), realizada en una población nacional representativa de niños blancos. La
prevalencia de estatura corta y obesidad fue mayor entre niños consumidores de jugo de frutas en
exceso 42% de los niños que ingerían ≥ 12 fl oz/día de jugo de frutas eran bajos, en comparación con
14% de los niños que bebían < 12 fl oz/día. Respecto a la obesidad, los porcentajes fueron 53 y 32%
respectivamente.
Se utilizaron las observaciones en un grupo de niños de dos años de edad, y se encontró que la
distribución t y la prueba de t era apropiadas en su aproximación estadística.
-3-
Media de un grupo cuando las observaciones

están normalmente distribuidas
Introducción a las
1 interrogantes sobre medias
Dennison et al. (1997) querían calcular el consumo promedio de varias bebidas por niños de 2
y 5 años de edad para determinar si la incorporación nutricional de los infantes estudiados
difería de la que se informó en un estudio nacional de nutrición (NHANES III). Algunos de sus
hallazgos se representan en el Cuadro 1. Se puede enfocar específicamente a los niños de dos
años para asentar sus interrogantes de investigación de dos maneras:
• ¿Qué tanta confianza se puede tener acerca de que el consumo

medio de jugo de frutas observado sea de 5.97 fl oz/día?
• ¿La media de la incorporación energética (1242 kcal) de los

niños de dos años de su estudio es resignificativa diferente del
valor de 1286 kcal informado por NHANES III?
-4-


Introducción a las
1 interrogantes sobre medias
Antes que se discutan interrogantes de investigación que impliquen las medias, habrá que
detenerse un momento y pensar acerca de lo que es necesario para convencer que la media en
un estudio es significativamente diferente de una norma o media de una población.
Si se desea determinar si la ingesta media de energía en niños de dos años que acuden a consulta
es diferente de la media de un estudio de nutrición nacional, ¿qué datos se deben tener para
concluir que en la incorporación de energía es diferente en un grupo y no una coincidencia?
Si la media de la ingesta de energía es mayor o menor que la media del estudio de nutrición
nacional, como se muestra en la Figura 1 – A, se concluya que la diferencia es real, ¿qué
pasa si la diferencia es relativamente moderada, como en la Figura 1 – B ?
-5-

Son tres los factores que juegan un papel importante para
decidir cuándo una media es diferente de la norma.
1 La diferencia entre la media observada y la regla
2 El monto de variabilidad entre individuos
3 El número de individuos en el estudio
Los dos primeros factores son importantes cuando se quiere calcular el

tamaño de la muestra necesaria antes de comenzar el estudio.
-6-


Figura 1. Comparación de distribuciones
-7-

Cuadro 1. Datos acerca del consumo promedio en niños de dos y cinco años de edad.
Fila Peso Estatura Jugo Gaseosa Energía Edad
1 30.75 92.90 2.00 1.14 754.38 2.00

2 29.25 92.80 0.21 0.00 784.07 2.00
3 32.75 91.40 8.43 0.21 804.94 2.00
4 24.50 80.70 4.07 5.21 846.47 2.00
5 26.00 86.10 0.00 1.00 871.25 2.00
6 29.75 84.40 4.57 0.43 880.52 2.00
7 26.00 84.50 4.19 1.29 906.89 2.00
8 26.75 90.80 3.57 1.57 907.95 2.00
9 25.50 83.80 10.36 1.14 909.58 2.00
10 25.00 81.60 16.43 0.00 923.18 2.00
•
•
-8-
•


•
•
•
Fila Peso Estatura Jugo Gaseosa Energía Edad
160 40.00 105.80 2.29 3.14 1877.10 5.00
161 39.75 107.40 5.00 1.71 1879.66 5.00
162 43.00 107.50 0.57 2.29 1919.29 5.00
163 41.20 109.80 10.93 2.43 1941.62 5.00
164 39.00 110.50 4.64 4.71 1960.26 5.00
165 42.50 113.60 1.71 8.50 1988.64 5.00
166 41.75 111.30 4.71 3.57 2206.71 5.00
167 40.50 104.80 8.57 4.00 2285.65 5.00
168 43.75 111.70 7.71 4.00 2490.33 5.00
-9-

Variables Cuenta Media Mediana Desviación estándar
Peso 168 35.59887 34.1 8.593439

Estatura 168 98.675 94.25 12.03473
Jugo 168 5.5295 4.6785 4.61938
Gaseosa 168 1.575435 1.143 1.748458
Energía 168 1383.249 1367.767 310.3222
- 10 -


2 Introducción a la distribución t
• La prueba t se utilizar mucho en todas las áreas de la ciencia. La distribución t es similar a

la distribución z, cuál uno de sus mayores usos es responder a interrogantes de
investigación sobre medias.
• La prueba de t a veces se conoce como prueba de t de Student por recibir el nombre de la
persona que estudió primero, en 1890, la distribución de medias para muestras pequeñas.
Student en realidad era un matemático llamado William Gosset, quien descubrió que cuando una
observación procede de una distribución normal, las medias se distribuyen de manera normal, sólo si se
conoce la verdadera desviación estándar de la población. Gosset denominó distribución t, a las
distribuciones de medias en las que se emplea la desviación estándar de la muestra
- 11 -

• ഥ ) menos el
La fórmula (o relación crítica) para la prueba de t tiene la media observada (𝑿
valor hipotético de la medio poblacional (𝝁) en el numerador, y el error estándar de la
media como denominador. El símbolo 𝝁 representa la verdadera media de la población.
ഥ −𝝁
𝑿
𝒕=
𝑫𝑬 / 𝒏
ഥ −𝝁
𝑿
=
𝑬𝑬
• El tamaño exacto de una desviación estándar depende de un concepto complejo

relacionado con el tamaño de la muestra llamado grados de libertad (gl), el cuál se
relaciona con el número de veces que se usa la información de la muestra
- 12 -


• Como la distribución t posee una desviación estándar mayor, por tanto resulta más ancha, con
colas más altas que las correspondientes a la distribución z. Ya que el tamaño de la muestra
incrementa a 30 o más, también lo hacen los grados de libertad, y la distribución de t aumenta
hasta ser casi la misma que la distribución estándar normal, y puede usarse tanto t como z.
En medicina, por lo general se usa la distribución t, aún cuando el tamaño de la muestra sea
de 30 o mayor. Los programas de cómputo como el Visual Statistics (módulo sobre
distribuciones continuas) o ConStats que sirven para el trazo de diferentes distribuciones,
pueden emplearse para generar distribuciones t en diferentes tamaños de muestra, de
manera que puedan compararse, como se hizo en la Figura 2.
- 13 -

Figura 2. Distribución de t con 1, 5 y 25 grados de libertad y una distribución
estándar normal (z)
- 14 -


La distribución t y los intervalos
y la reglade
3reglaEventos
Eventos independientes y la
independientes
de multiplicación.
confianza sobre una media en un grupo
multiplicación.
de
• El uso de los intervalos de confianza se ha incrementado en la investigación que comprende

medias, proporciones y otras estadísticas en la medicina. La fórmula general para intervalos de
confianza para una media es
𝑴𝒆𝒅𝒊𝒂 𝒐𝒃𝒔𝒆𝒓𝒗𝒂𝒅𝒂 ± 𝒄𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝒄𝒐𝒏𝒇𝒊𝒂𝒏𝒛𝒂 × 𝒖𝒏𝒂 𝒎𝒆𝒅𝒊𝒅𝒂𝒅 𝒅𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅 𝒅𝒆 𝒍𝒂 𝒎𝒆𝒅𝒊𝒂
• ഥ como la media (muestra) observada, la fórmula para un intervalo de confianza de 95%

Se usa 𝑿
de media verdadera es:
ഥ ± 𝒕 𝑫𝑬 𝑿
𝑿 ഥ ± 𝒕 × 𝑬𝑬
𝒏
donde t representa el coeficiente de confianza (valor crítico de la distribución t) mismo que

depende de los grados de libertad.
- 15 -

La distribución t y los intervalos
y la reglade
3reglaEventos
Eventos independientes y la
independientes
de multiplicación.
multiplicación.
de
• Con los datos de Dennison et al. (1997) Cuadro 1, se tiene que la media es 5.97 oz/día y la
desviación estándar es de 4.77. Los grados de libertad para la media de un solo grupo es n – 1, o
94 – 1 =93, el valor que corresponde a un límite de confianza de 95% se encuentra cerca de la
mitad 2.00 por 60 grados de libertad y 1.98 por 120 grados de libertad; por tanto usarán 1.99. Se
sustituye con éstas cifras los términos de la fórmula anterior y se obtiene:
𝑫𝑬
ഥ±𝒕
𝑿
𝒏
𝟒. 𝟕𝟕
= 𝟓. 𝟗𝟕 ± 𝟏. 𝟗𝟗
𝟗𝟒
= 𝟓. 𝟗𝟕 ± 𝟏. 𝟗𝟗 𝟎. 𝟒𝟗
= 𝟓. 𝟗𝟕 ± 𝟎. 𝟗𝟖
O aproximadamente 4.99 a 6.95 oz/día

- 16 -


La distribución
Eventos t y los intervalos
independientes la reglade
Eventos
Eventos independientes 3independientes
y la y la regla de ymultiplicación.
regla de multiplicación.
de
multiplicación.
• Este intervalo de confianza se interpreta como sigue: en otra muestra de niños de 2 años de
edad, Dennison et al. (u otros investigadores) observaron casi en todas las ocasiones una
media del consumo de jugo de frutas diferente al de este estudio. Desde luego desconocerán
la media verdadera.
• Los investigadores médicos, con frecuencia emplean gráficas de error para ilustrar medias e
intervalos de confianza.
El Recuadro 1 muestra una gráfica de error de la media del consumo de jugo de frutas entre niños
de dos años junto con los límites de confianza de 95%. Este análisis puede replicarse usando el
procedimiento exploratorio SPSS.
- 17 -

Recuadro 1. Intervalo de confianza de 95% y gráfica de error para la media del consumo de
jugo de frutas en niños de dos años.
Prueba de una muestra
Valor de la prueba = 0
Intervalo de confianza de 95% de
Significancia (con Media de la la diferencia
t dt
dos colas) diferencia
Inferior Superior
Jugo 12.129 93 .000 5.9714 4.9938 6.9490
- 18 -


Distribución t yDistribución Binomial
prueba de hipótesis
4 sobre la media de un grupo
Algunos investigadores analizan la hipótesis en lugar de encontrar e informar intervalos de

confianza. Las conclusiones son las mismas, sin importar el método que se utilice.
Cada vez son más los especialistas en estadística que recomiendan los intervalos de confianza,
porque en realidad proporcionan mayor información que las pruebas de hipótesis.
Como en los cálculos y los límites de confianza, el propósito de una prueba de hipótesis es
hacer generalizaciones en una población a partir de una muestra tomada de ésta. Tanto las
pruebas de hipótesis estadísticas como los cálculos, dan certeza a suposiciones acerca de la
población y después utilizan las probabilidades para calcular la posibilidad de obtener
resultados en la muestra, dadas esas suposiciones
- 19 -

• Para ilustrar las pruebas de hipótesis, se usan los datos de ingestión de energía de Dennison et al.
(1997) del Cuadro 1. Se tomarán estas observaciones al comprobar si la media de ingestión
energética en niños de dos años de edad es diferente de la media de ingestión energética
mostrada en los datos del estudio NHANES III que aparecen en el Cuadro 2, bajo la suposición de
que esta última representa la norma.
• Otra forma de plantear la interrogante a investigar es: ¿Los niños de dos años en la muestra
estudiada por Dennison et al., en promedio, obtienen la misma cantidad energética que los niños
de dos años en el estudio de NHANES III?
- 20 -


• Primero, se asume que la media de ingesta de energía es la misma que se obtuvo en el estudio
NHANES III (1286 kcal), para después buscar la probabilidad de observar una media de
incorporación de energía igual a 1242 kcal en una muestra de 94 niños, dada la presunción. Si la
probabilidad es grande, se concluye que la suposición está justificada y que la media de ingesta
de energía observada en el estudio no es, desde el punto de vista estadístico, diferente del visto
en el informe del estudio NHANES III. Sin embargo, si la probabilidad es pequeña, como 1 de cada
20 (0.05) o 1 por cada 100 (0.01), se puede concluir que la suposición no se justifica y que en
realidad si hay diferencia, esto es, que los niños de dos años del estudio de Dennison tienen una
media de consumo de energía diferente a la observada en el estudio NHANES III.
- 21 -

Suposiciones al usar
5 la distribución t
• Para emplear la distribución t o la prueba de t, las observaciones deben tener una

distribución normal. Muchos programas para computadora, como el NCSS y el SPSS,
extienden un trazo de la distribución normal sobre un histograma de datos.
• A menudo es posible observar histograma o un cuadro y trazo de dos colas largas, para hacer
una llamada de juicio. Algunas veces se conoce la distribución de los datos, desde las
investigaciones anteriores y se puede decidir si la suposición de normalidad está o no dentro
de lo razonable. Esta suposición puede comprobarse de manera empírica traza la
observación sobre una gráfica de distribución normal, llamada gráfica de Lilliefors (Conover,
1999) o usando varias pruebas estadísticas de normalidad.
- 22 -


Cuadro 2. Ingesta de energía y macronutrientes por niño.
Estudio de los Estudio NHANES III1 Estudio de los Estudio NHANES III1
Variable dietética autores 2.0 a 1.0 a 2.9 años autores 5.0 a 5.9 3.0 a 5.0 años
2.9 años (n=94) (n=424) años (n=74) (n=425)
Energía (kcal) 1242±302 1286±22 1549±34 1573±28
Proteína(g) 43±1.3 47±0.9 43±1.6 55±1.2
(% kcal) 14.0±0.2 14.7±0.2 13.7±0.2 14.1±0.21
Carbohidratos (g) 169±4.6 17.1±3.3 211±5.1 215±4.0
(% kcal) 54.4±0.6 53.9±0.6 54.7±0.6 55.3±0.5
Grasa total(g) 46±1.3 49±1.1 57±1.6 58±1.4
(% kcal) 33.2±0.5 33.5±0.4 33.0±0.5 32.7±0.4
Grasas saturadas (g) 19±0.6 20±0.5 23±0.7 22±0.6
(% kcal) 13.7±0.3 13.7±0.2 13.2±0.3 12.5±0.2
Colesterol 15.4±6.7 168±70 173±7.2 175±7.2
(mg/1000kcal) 126±5.1 1313 111±4.1 1113
1Blancos no hispanos
2Media ± error estándar de la media - 23 -
3Calculado de los datos de NHANES III. La desviación estándar y el error estándar de la media no estaban disponible

La preocupación por el uso del virus de viruela como un agente potencial de la guerra biológica ha
provocado un gran interés en la evaluación de la disponibilidad y seguridad de la vacuna de la viruela.
Actualmente el suministro de la vacuna es insuficiente para todos los residentes de EUA:
El National Institute of Allergy and Infectious Diseases dirigió un estudio simple ciego aleatorio para
determinar la frecuencia del éxito de la inoculación con diferentes diluciones de vacuna de viruela (Frey
et al. 2002). Un total de 680 adultos sanos voluntarios de 18 a 32 años de edad fueron asignados al azar
para recibir vacuna pura, una vacuna con dilución 1: 5 o una vacuna con dilución 1: 10.
Una de las conclusiones principales del estudio era la frecuencia de éxito de la vacunación, definido por
la presencia de una vesícula primaria en el sitio de la inoculación 7 a 9 días después de ésta. Si no se
formaba las vesículas. Se administraba una revacunación con la misma dilución de la vacuna.
Los investigadores también determinaron el rango y frecuencia de reacciones adversas a la vacuna. Se
usaron los datos de este estudio para ilustrar los métodos estadísticos para una proporción.
- 24 -

Prueba de hipótesis
Pasos a dar en la comprobación de hipótesis 1
Una hipótesis estadística es la exposición de una creencia acerca de los parámetros
poblacionales. De manera semejante a “probabilidad”, el término “hipótesis” posee un
significado más preciso en la estadística del que tiene por uso común.
Paso 1: Expresar la interrogante de investigación como una hipótesis estadística
• La hipótesis de nulidad simbolizada como 𝑯𝟎 , es una manifestación que reclama la ausencia de

la diferencia entre los valores supuestos o hipotéticos y la media de la población, es decir, la
nulidad significa “no hay diferencia”.
• La hipótesis alterna simbolizada como 𝑯𝟏 , es una manifestación del desacuerdo con la hipótesis
de nulidad.
- 25 -

• Para el estudio de Dennison et al., la hipótesis de nulidad y alterna son las siguientes:
𝑯𝟎 : la media de la ingesta de energía por niños de dos años incluidos en el estudio 𝜇1 , no es diferente
a la norma (la media de NHANES III), 𝜇0 , expresada como 𝜇1 = 𝜇0 .
𝑯𝟏 : la ingesta de energía por niños de dos años en el estudio de Dennison et al., 𝜇1 , es diferente de la
norma (la media de NHANES III), 𝜇0 , expresada como 𝜇1 ≠ 𝜇0 (debe recordarse que 𝜇 corresponde a
la verdadera media de una población).
Estas hipótesis son para pruebas de dos colas (o no direccionales). La hipótesis de nulidad será
rechazada si la media de la energía obtenida es suficientemente mayor que 1286 kcal o
suficientemente menor a 1286 kcal.
- 26 -


• Una prueba de dos colas es apropiada cuando los investigadores no tienen una esperanza a priori
de los valores en una muestra; quieren saber si la media de una muestra es diferente a la media de
la población en cualquier dirección.
• Puede utilizarse una prueba de una cola (o direccional) cuando los investigadores tiene esperanza
acerca del valor de la muestra y sólo quieren probar si es mayor o menor que la media de la
población.
• La prueba de una cola tiene la ventaja sobre la prueba de dos colas que obtiene significancia
estadística partiendo de valores menores que los hipotéticos, porque sólo existe en una dirección.
Por tanto, siempre que se emplea una prueba de una cola, debe tener sentido que los
investigadores en verdad se interesen en una sola dirección antes de examinar los datos.
- 27 -
• La desventaja de usar pruebas de una sola cola son que una vez que los investigadores se empeñan
en seguir este enfoque, están obligados a poner a prueba la hipótesis en la dirección enunciada.
• Si, por alguna razón inesperada, la media de muestra se aparta en sentido opuesto a la media de la
población, los investigadores no podrán afirmar que el punto de partida es significativo.
• Quienes hacen la investigación médica, a menudo requieren pruebas para identificar posibles
efectos adversos inesperados, al tiempo que se hacen pruebas para identificar efectos positivos ya
previstos.
En la Figura 3 se representan la pruebas de una cola y de dos colas

- 28 -


Figura 3. Definición de áreas de aceptación y rechazo en prueba de hipótesis usando 𝛼 = 0.05.
Dos colas o no
direccional.
Una cola o cola Una cola o cola

direccional superior direccional inferior.
- 29 -
Paso 2: Decidir sobre la prueba estadística adecuada
• Para decidir la prueba estadística adecuada se procede de como sigue. Cada prueba estadística tiene
una distribución de probabilidades. En este ejemplo, la prueba estadística apropiada se basa en la
distribución t, porque se desea hacer inferencias sobre una media y se requiere usar la desviación
estándar de la muestra, ya que se desconoce la desviación estándar de la población. La prueba de t
es la prueba estadística para comprobar una media; es la diferencia entre la media de una muestra y
la media hipotética dividida entre el error estándar.
ഥ −𝝁
𝑿
𝒕=
𝑫𝑬 / 𝒏
ഥ −𝝁
𝑿
=
𝑬𝑬
- 30 -

Paso 3: Seleccionar el grado de significancia para la prueba estadística
• Cuando se selecciona el grado de significancia antes de realizar la

prueba estadística, se le conoce como valor alfa, expresado con 𝛼
(letra griega alfa), el cuál expresa la probabilidad de rechazar de
manera incorrecta la hipótesis de nulidad cuando en realidad es
verdadera (y concluyendo que hay una diferencia cuando no la hay).
• Esta probabilidad debe ser pequeña para no rechazar la hipótesis de
nulidad cuando es verdadera. Los valores comunes de 𝛼 son 0.05,
0.01 y 0.001. Se usará este enfoque y el valor seleccionado para 𝛼 =
0.05.
- 31 -
Paso 4: Determinar el valor de la prueba estadística

debe lograr que sea declarada significativa
• El valor significativo también se conoce como valor crítico de la prueba estadística.

Determinar cuál es el valor crítico es sencillo ( de hecho se encontró cuando se calculó un
intervalo de confianza de 95%), pero detallar el razonamiento que apoya el proceso
ilustrativo.
• Cada prueba estadística tiene una distribución, la cuál se divide en un área de aceptación
hipótesis y en un área de rechazo hipótesis. El valor crítico es la línea que divide a las dos
áreas.
- 32 -

Paso 5: Realización de los cálculos

• En resumen, la media de incorporación energética en 94 niños de dos años, estudiados por Dennison
et al., fue de 1242 kcal con desviación estándar de 256 y un error estándar de 26.4. Se compara este
valor con el valor supuesto en la población de 1286 kcal. Sustituyendo estos valores en la prueba
estadística se tiene:
ഥ −𝝁
𝑿
𝒕=
𝑫𝑬 / 𝒏
𝟏𝟐𝟒𝟐 − 𝟏𝟐𝟖𝟔
=
𝟐𝟓𝟔 / 𝟗𝟒
−𝟒𝟒
=
𝟐𝟔. 𝟒
= −𝟏. 𝟔𝟕
- 33 -
Paso 6: Hacer y exponer conclusiones

• Exponer las conclusiones por escrito es muy importante, ya que la experiencia indica que el
aprendizaje de estadística en ocasiones se concentra en los mecanismos de prueba de hipótesis,
aunque se dificulta la aplicación de los conceptos.
• En la Figura 3 se observa que -1.67 cae dentro del área de aceptación de la distribución. La decisión
será la de no rechazar la hipótesis de nulidad en el sentido de que la media de la incorporación
energética de niños de dos años, la muestra estudiada por Dennison et al., difiere de la expresada en
el estudio NHANES III. Otra manera de asentar la conclusión es no rechazar la hipótesis, porque los
valores de ingesta de energía por muestra pueden obtenerse de una población con incorporación
media de energía de 11286 kcal.
- 34 -

Equivalencia de los intervalos de 2
confianza y las pruebas de hipótesis
Los resultados de las pruebas de hipótesis permiten concluir que la ingesta media de energía en los niños
de dos años estudiados por Dennison et al. no difiere de la media obtenida en el estudio NHANES III (1286
kcal), usando el valor de 𝛼 de 0.05. Aunque no se muestran los cálculos realizados, el intervalo de
confianza de 95% para la media de ingestión energética es 1189 a 1295 kcal, lo que significa que se tiene
el 95% de confianza.
• Se puede concluir que la media obtenida por Dennison y colaboradores, muy bien podría ser 1286
kcal, aun cuando la que ellos encontraron fue de 1242 kcal. Cuando se comparan los dos enfoques, se
aprecia que los grados de libertad (94-1=93) son los mismos, el valor crítico de t es el mismo, ±1.99, y
las conclusiones son las mismas. La única diferencia es que el intervalo de confianza da una idea del
rango dentro del cuál la media puede presentarse al azar.
- 35 -
Errores en las pruebas de hipótesis 3
• En el paso 3 se hizo referencia táctica a uno de estos errores – rechazar la hipótesis de

nulidad cuando es verdadera – como una consecuencia de seleccionar el grado de
significancia 𝛼 para la prueba.
En la prueba de hipótesis es un error concluir que hay una diferencia cuando no existe
ninguna (error tipo I o 𝛼 ), o que no hay diferencia cuando ésta sí existe (error tipo II o β).
El caso marcado por I, llamado error tipo I es por rechazar la hipótesis de nulidad cuando es
verdadera, 𝛼 es la probabilidad de cometer el error tipo I.
Un error tipo II produce en el caso marcado por II, el error consiste en no rechazar la
hipótesis de nulidad cuando es falsa.
- 36 -


Cuadro 3. Corrección de decisiones y errores en la prueba de hipótesis.
- 37 -
Potencia 4
La potencia es importante en la prueba de hipótesis .
• Es la probabilidad de rechazar la hipótesis de nulidad cuando en verdad es falsa o, de manera

equivalente, concluir que la hipótesis alterna es cierta cuando, en realidad, es verdadera.
• Es la capacidad de un estudio para demostrar una diferencia verdadera. Es obvio que la alta potencia
es una valioso atributo para un estudio, porque todos los investigadores desean demostrar resultados
significativos, si en verdad son así. La potencia se calcula como (1 − 𝛽), y está muy relacionada con el
tamaño de la muestra usada en el estudio.
• No se puede subestimar la importancia de tratar el tema de la potencia de un estudio – es esencial en
el diseño de un estudio válido.
- 38 -

Valores de P 5
• El valor de P se relaciona con las pruebas de hipótesis (aunque a veces se expresa junto con los
intervalos de confianza); es la probabilidad de obtener un resultado tan extremo como el que se
observó, si la hipótesis de nulidad resulta verdadera.
• El valor de P se calcula después de realizada la prueba estadística; si el valor de P es menor que 𝛼,
se rechaza la hipótesis de nulidad.
• Para la prueba de una cola el valor crítico es 1-665 ligeramente menor que el valor encontrado de
-1.67. Se puede reportar el valor de P como P > 0.10 o P < 0.05 para indicar que el nivel de
significancia es mayor que 0.10. Sin embargo es más fácil y más preciso utilizar un programa de
cómputo.
El valor de P asume primero que la hipótesis nula es verdadera y entonces indica la
probabilidad de obtener un resultado más extremo al que se observó. En un lenguaje más
directo, el valor de P es la probabilidad de observar un resultado que ocurrió sólo por
casualidad.
- 39 -
Analogías para la prueba de hipótesis 6
• Las analogías siempre ayudan para mejorar la comprensión de temas nuevos o complejos.
Algunas características de las pruebas diagnósticas, como la sensibilidad y la especificidad,
proporcionan una analogía directa para la prueba de hipótesis.
• Un error tipo I, concluir incorrectamente que existe significancia, cuando el resultado es no
significativo, es similar a una prueba falsa positiva que de manera incorrecta indica una
enfermedad cuan está ausente.
• De la misma manera, un error tipo II se comete al concluir incorrectamente que no hay
significancia cuando el resultado sí es significativo, lo que es análogo a una prueba falsa negativa
que indica de manera incorrecta la ausencia de una enfermedad que en realidad está presente.
- 40 -

Interrogantes de Investigación acerca de

una proporción en un grupo
• Cuando en un estudio se toman datos nominales o binarios (si/no), los resultados por lo
general se reportan como proporciones o porcentajes. En medicina, algunas veces se observa
un solo grupo y se requiere comprar la proporción de individuos que tienen cierta
característica con algún estándar o norma bien establecida. Frey et al. (2002) en el
planteamiento de problema 2 buscaban examinar la eficacia de la vacuna contra viruela con
diferentes diluciones. Los resultados de este estudio se encuentran en el Cuadro 4.
• La distribución binomial, puede utilizarse para determinar límites de confianza o prueba de
hipótesis acerca de la proporción observada, cuando se realiza un número específico de
ensayos independientes (simbolizado por n), cada uno con la misma probabilidad de
presentarse (simbolizado por 𝜋), y esta probabilidad puede interpretarse como la proporción
de personas con sin la característica en cuál existe interés.
- 41 -

• La distribución binomial tiene ciertas características interesantes de las que se puede sacar
provecho. La Figura 4 muestra la distribución binomial cuando la proporción de población 𝜋 es
0.2 y 0.4 para tamaños de muestra de 5, 10 y 25.
• Se observa que la distribución tiene cada vez más la forma de campana, conforme el tamaño
de la muestra aumenta y la proporción se acerca a 0.5.
• Estas observaciones conducen a la idea de usar la normal estándar, o distribución z, como una
aproximación a la distribución binomial.
- 42 -

Interrogantes de Investigación acerca de una

proporción en un grupo
Cuadro 4. Tasa de éxito de la vacunación inicial y repetida con el virus de vaccinia1.
Vacunación inicial exitosa 3 Vacunación inicial o subsecuente

2 Número de
Vacuna y título
sujetos Número de Porcentaje Número de Porcentaje
sujetos (IC 95%) 4 sujetos (IC 95%)5
No diluida, 108.1 pfu/mL 106 103 97.2 (92.0 a 99.4) 103 97.2 (92.0 a 99.4)
Dilución 1:5, 107.2 pfu/mL 234 232 99.1 (97.0 a 99.9) 234 100.0 (98.4 a 100.0)
7.0 3356
Dilución 1:10, 10 pfu/mL 340 330 97.1 (94.7-98.6) 98.8 (97.0 a 99.7)
- 43 -
Interrogantes de Investigación acerca de una

proporción en un grupo
Cuadro 4. Tasa de éxito de la vacunación inicial y repetida con el virus de vaccinia1.
1. El éxito se definió por la formación de vesícula de 7 a 9 días después de la inoculación intradérmica con aguja bifurcada. Los sujetos que no tuvieron
una respuesta inicial fueron revacunados entre 7 y 17 días después. IC denota intervalo de confianza.
2. El título de cada grupo es el medio de todos los frascos de vacuna preparados para usar en el estudio salvo para las diluciones 1:10, para las cuales se
descartaron 2 de 14 preparaciones (como se explica en la sección de Resultados). Las cantidades medias del virus de vaccinia en las agujas bifurcadas
representativas fueron de 105.0 pfu en el caso de la vacuna no diluida, 104.3 pfu en el caso de la dilución 1:5 y 103.9 pfu en el caso de la dilución 1:10.
3. La edad media de los 15 sujetos sin respuesta a la vacunación fue significativamente mayor que la de los sujetos con respuesta (27.1 en comparación
24.6 años, P= 0.03); 6 de los 15 tuvieron anticuerpo neutralizador contra el virus de vaccinia antes de la vacunación inicial. Al profundizar en el
interrogatorio, tres de los sujetos seropositivos informaron del antecedente de un viaje internacional antes de 1985 o de servicio militar.
4. El valor en el grupo que recibió la vacuna no diluida menor el valor en el grupo que recibió la dilución 1:5 fue de -2.0 puntos porcentuales (límite
superior del intervalo de confianza 95% de una cola, 2.3 puntos porcentuales).
5. El valor en el grupo que recibió la vacuna no diluida menos el valor en el grupo de dilución 1:5 fue de -2.8 puntos porcentuales (límite superior del
intervalo de confianza 95% de una cola, 0.5 puntos porcentuales). De igual modo, el valor en el grupo que recibió la vacuna no diluida menos el valor en
el grupo con la dilución 1:10 fue de 1.7 puntos porcentuales (límite superior del intervalo de confianza 95% de una cola, 1.7 puntos porcentuales). El
valor en el grupo que recibió la vacuna no diluida menos el valor en los dos grupos combinados que recibieron la vacuna diluida fue de -2.1 puntos
porcentuales (límite superior del intervalo de confianza 95% de una cola, 0.6 puntos porcentuales). Cuando se combinaron los dos grupos que
recibieron la vacuna diluida, la diferencia en los valores entre este grupo y el grupo que recibió la vacuna no diluida fue de -2.1 puntos porcentuales
(límite superior del intervalo de confianza 95% de una cola, 0.6 puntos porcentuales).
6. Uno de los 340 sujetos que no puedo ser revacunado por limitaciones logística.
- 44 -


Figura 4. D𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑏𝑖𝑛𝑜𝑚𝑖𝑎𝑙 𝑐𝑢𝑎𝑛𝑑𝑜 𝜋 = 0.2 𝑦 0.4.
- 45 -

- 46 -


- 47 -

Intervalos de confianza para un
1 proporción de sujetos
• Encontrar la probabilidad de dos eventos cuando no son independientes es un poco más

complejo que sólo multiplicar sus probabilidades marginales. Cuando ambos no son
independientes, la presencia de un evento depende de que haya tenido lugar el otro o no.
Supóngase que
𝝅(𝟏 − 𝝅) 𝒑(𝟏 − 𝒑)
𝒐
𝒏 𝒏
- 48 -


• Entonces, el límite de confianza de 95% para la verdadera proporción de la población 𝜋 está
dado por:
𝑷𝒓𝒐𝒑𝒐𝒓𝒄𝒊ó𝒏 𝒐𝒃𝒔𝒆𝒓𝒗𝒂𝒅𝒂 ± 𝟏𝟏. 𝟗𝟔

× 𝒆𝒓𝒓𝒐𝒓 𝒆𝒔𝒕á𝒏𝒅𝒂𝒓 𝒅𝒆 𝒍𝒂 𝒑𝒓𝒐𝒑𝒐𝒓𝒄𝒊ó𝒏 𝒐𝒃𝒔𝒆𝒓𝒗𝒂𝒅𝒂
𝒑(𝟏 − 𝒑)
𝑷 ± 𝟏. 𝟗𝟔 ×
𝒏
- 49 -

• Utilizando la fórmula anterior, el intervalo de confianza de 95% para la verdadera proporción
de pacientes con una vacunación inicial exitosa usando la dilución 1:10 es:
𝟎. 𝟗𝟕𝟏(𝟏 − 𝟎. 𝟗𝟕𝟏)
𝟎. 𝟗𝟕𝟏 ± 𝟏. 𝟗𝟔 × = 𝟎. 𝟗𝟕𝟏 ± 𝟎. 𝟎𝟏𝟖
𝟑𝟒𝟎
• Por tanto, lo investigadores pueden tener 95% de confiabilidad de que el intervalo de 0.953 a
0.988% contiene la verdadera proporción de sujetos que tuvieron una vacunación exitosa con
la dilución de la vacuna 1:10. En el cuadro 5 se dan los resultados de esta prueba para una
proporción en el NCSS.
- 50 -


Comparar el intervalo de confianza en el cuadro 4

con nuestros resultados y los del NCSS en el
cuadro 5. Frey et al., usaron el método binomial
exacto, y hay motivos para usarlo; está disponible
en algunos programas estadísticos como el NCSS.
- 51 -

Distribución z para probar una
2 hipótesis de proporción
Se pueden deducir las conclusiones de las muestras utilizando dos métodos: encontrando los
intervalos de confianza o probando las hipótesis.
Paso 1: Plantear las interrogantes a investigar con términos de hipótesis estadística
• Se considera que los investigadores buscaban conocer si la proporción observada de 0.971 era más
significativa que 0.95. La letra griega 𝜋 representa la hipótesis de la proporción de la población
porque la hipótesis nula se refiere a la población:
𝑯𝟎 : la proporción de sujetos con una vacunación exitosa es 0.95 o menor, o π ≤ 0.95.
𝑯𝟏 : la proporción de sujetos con una vacunación exitosa es mayor de 0.95, o π > 0.95.
- 52 -


Paso 2: Decidir la prueba estadística apropiada
• Al multiplicar el tamaño de la muestra simple (340) por la proporción (0.971), se tiene 330 y
la muestra por 1 menos la proporción (0.029) da 10. Como ambos resultados son mayores a
5, se puede usar la prueba de z, la cuál, al igual que la prueba t, toma la forma común del
valor estadístico menos el valor hipotético entre el error estándar
𝒑−𝝅
𝒛=
𝝅(𝟏 − 𝝅)/𝒏
- 53 -

Paso 3: seleccionar el nivel de significancia para la prueba estadística

• Para la prueba de una cola se usa 𝛼 = 0.05
Paso 4: Determinar el valor que debe tener la prueba estadística para ser
declarada significancia
• Una prueba de una cola con la hipótesis alternativa en la dirección positiva coloca toda
el área de rechazo en la parte superior de la distribución de probabilidad.
• La hipótesis nula de que la proporción de la población verdadera es menor o igual a
0.95 se rechaza si el valor observado de z es mayor que 1.645
- 54 -


Paso 5: Realizar los cálculos

• La hipótesis nula indica que la proporción es 0.95 o menor, por lo que éste es el valor que usa en
el error estándar, y no el de la proporción observada de 0.971. Sustituyendo estos valores en la
prueba de z se obtiene:
𝟎. 𝟗𝟕𝟏 − 𝟎. 𝟗𝟓 𝟎. 𝟎𝟐𝟏
= = 𝟏. 𝟕𝟓
𝟎. 𝟗𝟓 𝟏 − 𝟎. 𝟗𝟓 /𝟑𝟒𝟎 𝟎. 𝟎𝟏𝟐
- 55 -

Paso 6: Diagramar y sacar conclusiones

• Como el valor observado de z (1.75) es mayor que el valor crítico, 1.645, la decisión es
rechazar la hipótesis nula y concluir que la hipótesis alternativa y que la proporción de
pacientes con una vacunación positiva > 0.95, correcta.
• La conclusión es que una dilución de 1:10 es mayor que 0.95 con P<0.05.
• El cuadro 5 también contiene los resultados de la prueba de hipótesis; nótese que el NCSS
proporciona la decisión para una prueba de dos colas y de una en ambas direcciones.
- 56 -


Cuadro 5. Éxito inicial de la primera vacunación usando la dilución 1:10, 107.0pfu/mL.
Sección de datos
Tamaño de la Número de Proporción de la Proporción
Confianza ∝ Hipótesis ∝
muestra (n) éxitos (X) muestra (P) hipotética (P0)
340 330.000000 0.970588 0.950000 0.050000 0.50000
Sección de límites de confianza
Métodos de cálculo IC 95% inferior Proporción de la muestra (P) IC 95% superior
Exacto (binomial) 0.946577 0.970588 0.985808
Aproximación (no corregida) 0.952629 0.970588 0.988547
Aproximación (corregida) 0.951158 0.970588 0.990018
Calificación de Wilson 0.946714 0.970588 0.983947
Sección de prueba de hipótesis
Exacta (binomial) Aproximación normal usando (P0)
Nivel de Nivel de
Hipótesis alterna Decisión (5%) Valor de z Decisión (5%)
probabilidad probabilidad
P<>PO 0.103537 Aceptar H0 1.6174 0.105784 Aceptar H0
P<PO 0.976547 Aceptar H0 1.6174 0.947108 Aceptar H0
- 57 -
P>PO 0.045015 Rechazar H0 1.6174 0.052892 Aceptar H0

Cuadro 6. Ilustración de observación es un diseño pareado (mediciones antes y después)
Paciente Peso antes (kg) Peso después (kg)

1 100 95
2 89 84
3 83 78
4 98 93
5 108 103
6 95 90
- 58 -


Figura 5. Definición de áreas de aceptación y rechazo en la distribución normal estándar (z)
usando 𝛼 = 0.05.
Distribución
normal
𝝁 = 𝟎, 𝝈 = 𝟏
- 59 -

3 Corrección de continuidad
• La distribución z es continua y la distribución binomial es discontinua, muchos especialistas

recomiendan hacer una pequeña corrección en la prueba estadística para llegar a una
aproximación más exacta.
• Una corrección de continuidad implica sustraer z/(2n) del valor absoluto del numerador de la
estadística z.
𝑷 − 𝝅 − 𝟏/(𝟐𝒏)
𝒛=
𝝅(𝟏 − 𝝅)/𝒏
- 60 -


3 Corrección de continuidad
• Newcombe (1998) comparó siete procedimientos de intervalos de confianza, y encontró que

la calificación de Wilson fue más segura que los otros métodos para los intervalos de
confianza. Esta estadística dada por el NCSS, es:
( 𝟐𝒏𝒑 + 𝒛𝟐 ± 𝒛𝟐𝜶/𝟐 + 𝟒𝒏𝒑(𝟏 − 𝒑)

𝒛=
𝟐(𝒏 + 𝒛𝟐𝒂/𝟐 )
- 61 -

Después de colecistectomía, los síntomas como dolor abdominal, flatulencia, o dispepsia ocurren con
frecuencia, y son parte del “síndrome poscolecistectomía”. La diarrea poscolecistomía (DPC), es la
complicación mejor conocida de esta cirugía; sin embargo, la frecuencia de su aparición varía de manera
considerable en los reportes clínicos. Sauter et al. (2002) evaluaron prospectivamente la frecuencia de DPC y
los cambios de hábito intestinal en los pacientes sometidos a este procedimiento. También evaluaron el papel
de la malabsorción de ácidos biliares en la DPC.
Cincuenta y un pacientes sometidos a colecistectomía se evaluaron antes, un mes después, y tres meses
después del procedimiento. Los pacientes fueron interrogados sobre la calidad y frecuencia de sus
evacuaciones.
Además, para evaluar la función de la malabsorción de ácidos biliares, se midieron antes y después de la
cirugía las concentraciones séricas de 7𝛼 − ℎ𝑖𝑑𝑟𝑜𝑥𝑖 − 4 − 𝑐𝑜𝑙𝑒𝑠𝑡𝑒𝑛 − 3 − 𝑢𝑛𝑜 7𝛼 − 𝐻𝐶𝑂 .
Después de la colecistectomía, aumentó el número de pacientes que reportaron incremento del peristaltismo
durante el día: 22% antes de la cirugía, 51% a un mes y 45% a los tres meses; también reportaron aumento de
evacuaciones menos consistentes.
- 62 -


El aerotromboembolismo de los vasos mayores es la causa principal de evento vascular cerebral isquémico.
Estudios histológicos de placas ateroscleróticas sugieren que los pacientes con lesiones que contienen un gran
centro necrótico rico en lípidos o placas intraplaquetarias hemorrágicas son los que tienen más riesgo de sufrir
un evento vascular cerebral isquémico. Yuan et al. (2001) usaron resonancia imágenes por magnética (IRM) de
alta resolución para el estudio de alteraciones en las arterias carótidas para determinar qué características de
las placas ofrecen el riesgo más alto de complicaciones isquémicas futuras.
Evaluaron 18 pacientes consecutivos programados para endarterectomía de la arteria carótida con un examen
por IRM, y correlacionaron los hallazgos con las características histopatológicas de las muestras quirúrgicas de
la cirugía de la arteria carótida. Las laminillas histológicas fueron evaluadas por un patólogo que desconocía los
resultados obtenidos por imagen.
Esto es importante para establecer el nivel de concordancia entre los resultados de la IRM y la histología; se
usarán estas observaciones para ilustrar la medición de la concordancia llamada 𝜅 kappa de Cohen.
- 63 -
Medias cuando el mismo grupo se mide dos

veces
Métodos de muestreo
• Existen estudios en los cuáles un mismo grupo de individuos es observado dos mediante diseños
pareados o diseñados de mediciones repetidas. En estos estudios es típico que los individuos sean
medidos para establecer un línea basal (llamada a veces medida previa), y después de alguna
intervención o tiempo después, se repite la medición a los mismos sujetos (llamada medida posterior).
La pregunta a investigar es si la intervención produjo o no alguna diferencia.
• La observación en estos estudios se llama pareada porque las mediciones tomadas antes y después en
el mismo individuo (o en juegos pares) se aparean en el análisis. Éstas a veces son llamas observaciones
dependientes, que si se conoce la primera medida, se puede suponer como resultará la segunda
- 64 -


veces
¿Por qué los investigadores usan 1
estudios de medición repetida?
• Supóngase que un investigador desea evaluar el efecto la pérdida
de pero de una nueva dieta y que la población sólo consiste en
seis personas que han tenido esa dieta por dos meses, sus pesos
antes y después de la dieta se muestran en el cuadro 6.
• La prueba estadística que usan los investigadores cuando los
mismos individuos son objeto de la medición de una variable
numérica (intervalo) antes y después de una intervención se
llama prueba de t pareada, porque las observaciones en el
mismo individuo son pareadas unas con otras para encontrar la
diferencia. A esta prueba se le conoce también como prueba t
para grupos pareados y como prueba t para grupos
dependientes
- 65 -

veces
Intervalos de confianza para la diferencia 2
de medias en diseños pareados
Una manera de evaluar el efecto de una intervención en un estudio de antes y después es formar
un intervalo de confianza (IC) para una diferencia de medias. Para ilustrarlo, se usaron datos del
estudio de Sauter et al. (2002), que investiga la frecuencia de diarrea después de una
colecistectomía y los cambios de hábitos intestinales después de la cirugía. En el Cuadro 7 se
proporciona información descriptiva sobre los pacientes y valores séricos.
• Para examinar la diferencia de calificaciones como se fueron obteniendo, de modo que se

encuentre la media y la desviación estándar de la diferencia de los datos entre antes y después.
Las calificaciones de antes, después y la diferencia se presentan en el cuadro 8.
• ത y la
Usando la diferencia de d´ en lugar de X´ y la media de la diferencia d en lugar de 𝑋,
desviación estándar es
σ 𝒅−𝒅 𝟐
𝑫𝑬𝒅 = , 𝒐 𝟐𝟔. 𝟔𝟖
𝒏−𝟏 - 66 -


veces
Para calcular el intervalo de confianza de 95% para la media de la diferencia es igual a calcular el intervalo
de confianza de 95% de la media de un grupo excepto que una vez más se toma la media de la diferencia
y el error estándar de la media de a diferencia, en lugar de la media y el error estándar de la media de un
grupo.
𝑫𝒊𝒇𝒆𝒓𝒆𝒏𝒄𝒊𝒂 ± 𝒇𝒂𝒄𝒕𝒐𝒓 𝒅𝒆 𝒄𝒐𝒏𝒇𝒊𝒂𝒏𝒛𝒂

× 𝒆𝒓𝒓𝒐𝒓 𝒆𝒔𝒕á𝒏𝒅𝒂𝒓 𝒅𝒆 𝒍𝒂 𝒅𝒊𝒇𝒆𝒓𝒆𝒏𝒄𝒊𝒂
𝑫𝑬𝒅 𝟐𝟔. 𝟔𝟖
ഥ ± 𝒕(𝒏−𝟏) ×
𝒅 = 𝟐𝟏. 𝟐𝟐 ± 𝟐. 𝟎𝟏
𝒏 𝟓𝟏
= 𝟐𝟏. 𝟐𝟐 ± 𝟐. 𝟎𝟏 × 𝟑. 𝟕𝟑
= 𝟐𝟏. 𝟐𝟐 ± 𝟕. 𝟓𝟏 = 𝟏𝟑 − 𝟕𝟏 𝒂 𝟐𝟖. 𝟕𝟑
- 67 -

veces
• Este intervalo de confianza puede interpretarse como sigue. Hay 95% de seguridad de que la diferencia
media verdadera en 7𝛼 − 𝐻𝐶𝑂 a un mes en comparación la línea basal entre 13.71 y 28.73.
Lógicamente, debido a que todo intervalo es mayor que cero, se puede tener 95% de seguridad de
que la diferencia media es mayor que cero. En otras palabras, es la manifestación de como 7𝛼 − 𝐻𝐶𝑂
incrementa en el mes siguiente de la colecistectomía.
- 68 -


Cuadro 7. Información descriptiva de los pacientes y de las concentraciones séricas antes
de la colecistectomía, y 1 y 3 meses después de cirugía.
Número de paciente: 18 varones, 33 mujeres

Edad media ± desviación estándar 58.04 ± 15.04
Valores séricos Antes de CCT Después de CCT (1 mes) Después de CCT (3 meses)
7α –HCO (ng/mL) 25.33±13.51 46.55±29.58 52.60±33.02
Colesterol LDL (mg/dL) 144.57±40.14 141.48±42.48 143.86±42.33
Colesterol HDL (mg/dL) 48.39±17.51 49.02±15.09 51.10±15.92
Frecuencia de evacuaciones 1.22±0.42 1.51±0.50 1.45±0.50
Consistencia de heces 1.02±1.14 1.47±0.50 1.33±0.48
- 69 -

Cuadro 8. Diferencia entre la medición de 7𝛼 − 𝐻𝐶𝑂 el inicio y un mes después.
- 70 -


veces
Prueba t pareada para la diferencia de la media 3
Paso 1: Plantear la interrogante a investigar desde el punto de vista estadístico
La hipótesis estadística para un diseño pareado, a menudo se plantea como sigue, donde la letra
griega (𝛿) representa la diferencia de la población:
𝑯𝟎 : La verdadera diferencia 7𝛼 − 𝐻𝐶𝑂 es 0 o, en símbolos 𝛿 = 0.

𝑯𝟏 : La verdadera diferencia 7𝛼 − 𝐻𝐶𝑂 no es 0 o, en símbolos 𝛿 ≠ 0.
• Interesa rechazar la hipótesis de nulidad de no diferencia en dos situaciones: cuando 7𝛼 −

𝐻𝐶𝑂 incrementa de manera significativa y cuando el programa disminuye de manera
significativa; es una prueba de dos colas
- 71 -

veces
Paso 2: Decidir sobre la prueba estadística apropiada

• Cuando el propósito es ver si existe una diferencia entre las medidas de antes y después de un
diseño pareado, y las observaciones son medidas en escala numérica, la prueba de t estadística para
comparar dos medias entre dos grupos pareados.
• Si se quiere probar la hipótesis de que la media de la diferencia es igual a un valor diferente a cero,
se tendrá que restar ese valor (y no el cero) de la media de la diferencia en el numerador de
siguiente fórmula:
ഥ−𝟎
𝒅
𝒕=
𝑫𝑬𝒅 / 𝒏
Con n – 1 grados de libertad, donde 𝒅 ഥ representa la media de diferencia y 𝑫𝑬𝒅 / 𝒏

representan el error estándar de la diferencia de medias. - 72 -


veces
Paso 3: Elegir el grado de significancia de la prueba estadística

• Se usará 𝛼 = 0.01.
Paso 4: Determinar el valor que la prueba estadística debe alcanzar para

considerarla significativa
• El valor de t que divide la distribución en 99% central es, por interpolación, 2.682 con 0.5% del
área de cada cola con n-1=50 grados de libertad. Por tanto, se rechaza la hipótesis de nulidad de
que el programa no establece diferencia si el valor de t estadística es menor a -2.682 o mayor
que + 2.682.
- 73 -

veces

• Sustituir cifras (media de la diferencia 21.22, diferencia hipotética de 0, desviación estándar de 26.68
y tamaño de la muestra de 51), el valor observado de t estadística es:
ഥ−𝜹
𝒅 𝟐𝟏. 𝟐𝟐 − 𝟎 𝟐𝟏. 𝟐𝟐
𝒕= = = = 𝟓. 𝟔𝟖
𝑫𝑬𝒅 / 𝒏 𝟐𝟔. 𝟔𝟖 / 𝟓𝟏 𝟑. 𝟕𝟒
Paso 6: Obtener y expresar conclusiones

• Puesto que el valor observado de la t estadística es 5.68, mayor al valor crítico 2.682, se rechaza la
hipótesis de nulidad que la media 7𝛼 − 𝐻𝐶𝑂 es igual antes de la colecistectomía y un mes después
(P < 0.01).
- 74 -

Proporciones cuando el mismo grupo se mide

dos veces
Los investigadores podrían hacer dos tipos de preguntas cuando una medición se ha repetido en
el mismo grupo de individuos. Algunas veces se interesan en conocer cuánto concuerdan entre
sí la primera y segunda medidas.
Medición de la concordancia entre dos personas 1

• En el campo de la salud, un médico debe interpretar con frecuencia un procedimiento indicador de la
presencia o ausencia de una enfermedad o anormalidad, es decir, la observación revela un si o no, una
medición nominal.
• La estrategia habitual para demostrar que las mediciones son confiables es repetirlos y ver qué tanto
concuerdan.
• Cuando una persona observa dos veces un individuo y se comparan las observaciones, el grado de
concordancia se llama confiabilidad intravaluatoria y cuando dos o más personas observan al mismo
individuo, su concordancia se llama confiabilidad intervaluatoria.
- 75 -

dos veces
• Una forma habitual de mediar la confiabilidad intervaluatoria cuando las mediciones son nominales, es
mediante el uso de la estadística kapa 𝜅. Si las mediciones se hacen mediante escala numérica, se
encuentra la correlación entre medidas.
• En el planteamiento de problema 4, Yuan et al. (2001) interpretaron la IRM de 90 localizaciones de la
arteria carótida y compararon sus hallazgos con los exámenes histopatológicos. La kappa estadística
puede usarse para estimar el nivel de concordancia entre los hallazgos de la IRM y la histología.
• La información de los Cuadros 9 y 10 son los resultados de la IRM y el examen histológico que tuvieron
una concordancia de que 56 de 90 fueron positivos y 22 negativos.
- 76 -


dos veces
• Revisando los datos del cuadro 10, la IRM indicó

𝑶𝒃𝒔𝒆𝒓𝒗𝒂𝒄𝒊𝒐𝒏𝒆𝒔 − 𝒂𝒄𝒖𝒆𝒓𝒅𝒐 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒐
que 58 a 64% fueron positivos, y la clasificación 𝜿=
𝟏 − 𝑨𝒄𝒖𝒆𝒓𝒅𝒐 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒐
histológica indicó que 66 o 73% fueron positivos.
Usando la regla de multiplicación, estarían 𝑶−𝑬
concordantes por casualidad 64 x 73%, o 47%, de =
𝟏−𝑬
las muestras fueron positivas.
• La concordancia potencial más allá de la casualidad =
𝟎. 𝟖𝟕 − 𝟎. 𝟓𝟕 𝟎. 𝟑𝟎
𝟏 − 𝟎. 𝟓𝟕
=
𝟎. 𝟒𝟑
es 100% menos la concordancia por casualidad de
57% o, usando las proporciones, 1 – 0.57 = 0.43. La = 𝟎. 𝟕𝟎
fórmula para kappa y los cálculos son:
- 77 -

dos veces
• Sackett et al. (1991) señalaron que el nivel de

concordancia varía de manera considerable en la labor 𝟎. 𝟗𝟑 𝒂 𝟏. 𝟎𝟎 excelente concordancia
clínica, donde existe variación entre 57% de acuerdo con 𝟎. 𝟖𝟏 𝒂 𝟎. 𝟗𝟐 muy buena concordancia
𝜅 de 0.30 entre dos cardiólogos que examinaron los 𝟎. 𝟔𝟏 𝒂 𝟎. 𝟖𝟎 buena concordancia
mismos electrocardiogramas de diferentes pacientes, 𝟎. 𝟒𝟏 𝒂 𝟎. 𝟔𝟎 regular concordancia
hasta un 97% de coincidencia con 𝜅 de 0.67. Byrt (1996) 𝟎. 𝟐𝟏 𝒂 𝟎. 𝟒𝟎 poca concordancia
propuso las siguientes guías para interpretar 𝜅: 𝟎. 𝟎𝟏 𝒂 𝟎. 𝟐𝟎 mala concordancia
< 𝟎. 𝟎𝟎 nula concordancia
La tabla 2x2 en el cuadro 9, se reproduce por NCSS en
el cuadro 11, junto con los cálculos de 𝜿. Casi siempre
hay interés en la estadística de 𝜿 como una medida
descriptiva.
- 78 -


Fila IRM Histología Fila IRM Histología Fila IRM Histología
1 + + 31 + + 61 + +
2 + + 32 + + 62 + +
3 + + 33 + + 63 + +
4 + + 34 + + 64 + +
5 + + 35 + + 65 + +
6 + + 36 + + 66 + +
7 + + 37 + + 67 + +
Cuadro 9. 8 + + 38 + + 68 + +
9 + + 39 + + 69 + +
Realización de 10 + + 40 + + 70 + +
prueba de IRM 11 + + 41 + + 71 + +
12 + + 42 + + 72 + +
multiespectral para 13 + + 43 + + 73 + +
identificar regiones 14 + + 44 + + 74 + +
15 + + 45 + + 75 + +
de centro necrótico 16 + + 46 + + 76 + +
ricas en lípidos y 17
18
+
+
+
+
47
48
+
+
+
+
77
78
+
+
+
+
hemorragia aguda 19 + + 49 + + 79 + +
intraplaquetaria 20
21
+
+
+
+
50
51
+
+
+
+
80
81
+
+
+
+
22 + + 52 + + 82 + +
23 + + 53 + + 83 + +
24 + + 54 + + 84 + +
25 + + 55 + + 85 + +
26 + + 56 + + 86 + +
27 + + 57 + + 87 + +
28 + + 58 + + 88 + +
29 + + 59 + + 89 + +- 79 -
30 + + 60 + + 90 + +

Cuadro 10. Concordancia observada entre los hallazgos de IRM e histología
Sección observada de cuentas
Histología
IRM Positiva Negativa Total
Positiva 56 2 58
Negativa 10 22 32
Total 66 24 90
El número de hileras al menos con un valor faltante es de 0
Cuentas esperadas suponiendo sección de independencia
Histología
IRM Positiva Negativa Total
Positiva 42.5 15.5 58.0
Negativa 23.5 8.5 32.0
Total 66.0 24.0 90.0
El número de hileras al menos con un valor faltante es de 0 - 80 -


Cuadro 11. Resultados comparativos de los hallazgos de IRM e histología
Identificación de CNRL y HI aguda
Identificación de CNRL y HI aguda
Histología
Cuenta Total
+ -
IRM + 56 2 58
- 10 22 32
Total 66 24 90
Mediciones simétricas
Error estándar
Valor 𝑻𝟐 aproximada Sig. Aproximada
asintótico
Medición de acuerdo kappa .692
.081 6.706 .000
N de casos válidos 90
- 81 -

dos veces
Proporciones en estudios con mediciones 2
repetidas y la prueba de Necmar
En estudios en los cuáles los resultados son una variable binaria (si o no), los investigadores
podrías desear conocer cuándo cambia la proporción de individuos que tienen (o no) la
característica de interés, después de una intervención o del paso del tiempo.
• La prueba de McNemar puede emplearse para comparar proporciones pareadas.

• Los investigadores en el Planteamiento de problema 3, Sauter et al. (2002) buscaban conocer
si ocurrían cambios en la función intestinal de los pacientes después de la colecistectomía.
Obtuvieron información de un número de pacientes que tenían una o menos evacuaciones al
días comparándolos con los que tenían más de una evacuación por día.
• Falta un poco
- 82 -


Cuadro 12. Análisis usando la prueba McNemar para el número de pacientes que tienen
más de una evaluación al día antes y un mes después de la colecistectomía
- 83 -
¿Qué hacer cuando las observaciones no

están normalmente distribuidas?
Si las observaciones están muy sesgadas, no debe emplearse la distribución de t, debido a
que los valores que se supone deben separar los 2.5% superior e inferior del área de 95%
central de distribución, no lo hacen en realidad.
Transformación o readaptación de observaciones 1

• Transformar observaciones significa expresar los valores en otra escala. Ya se conocen ciertos tipos de
transformaciones. La transformación z, es una transformación lineal, readapta una distribución, con
una media y una desviación estándar dadas a una distribución en la cual la media es 0 y la desviación
estándar es 1. La forma básica de campana de la distribución misma no cambia con esta
transformación.
• Las transformaciones no lineales ponen las observaciones por rangos, desde la más baja a la más alta
(o viceversa). La transformación por rangos puede resultar muy útil en el análisis de observaciones que
están sesgadas y muchos de los métodos no paramétricos que se tratan en este libro se basan en
rangos.
- 84 -


 Otras transformaciones no lineales pueden usarse para enderezar relaciones entre dos variables,
cambiando la forma del sesgo de la distribución a una que sea más semejante del sesgo de la
distribución a una que sea más semejante a una distribución normal. Considerar el tiempo de
supervivencia de paciente con diagnóstico de cáncer de la próstata. En la figura 6A se presenta una
gráfica con posibles valores de supervivencia (en años), con posibles metástasis a los huesos de cáncer
prostático. La distribución tiene un importante sesgo positivo, por lo que los métodos que supone una
distribución normal no pueden aplicarse.
 La figura 6B muestra la distribución si, en cambio, se toma el logaritmo* del tiempo de supervivencia;
es decir 𝑌 = 𝑙𝑜𝑔(𝑋), y donde Y es el valor transformador (o exponente) relacionado con un valor dado
de X. Este es el logaritmo de base 10.
- 85 -
¿Qué hacer cuando las observaciones no están

normalmente distribuidas?
Figura 6. Ejemplos de transformación logarítmica para supervivencia de pacientes con cáncer de
próstata con metástasis en huesos
A Supervivencia B Supervivencia (años) después de la

(años) transformación logarítmica. - 86 -


 Otra transformación es la transformación por raíz cuadrada Y=√X. Aunque esta transformación no
se emplea con tanta frecuencia en medicina como la transformación logarítmica, sí puede, en
cambio, se de utilidad cuando una transformación logarítmica produce una sobrecorrección. En un
estudio de mujeres a quienes se les administró un bloqueador paracervical para disminuir dolor y
calambres por criocirugía, una de las variables usadas para medir el dolor tenía mucho sesgo. Los
autores usaron la transformación por raíz cuadrada y mejoraron los resultados. Se calcularon el
logaritmo natural y la raíz cuadrada de la calificación del dolor. Se muestra el histograma de cada
uno en la figura 7. Puede verse que ninguna de las transformaciones se acerca a la distribución
normal. En este caso, los investigadores muy bien podrían seleccionar un procedimiento no
paramétrico que no dé lugar a suposiciones sobre la forma de la distribución.
- 87 -

Figura 7. Observaciones originales y dos transformaciones de la calificación del dolor
Raíz cuadrada del

Logaritmo de
Dolor dolor
dolor
- 88 -


Prueba de signo para hipótesis sobre la 2
mediana de un grupo
Una alternativa para la transformación de datos es usar los procedimientos estadísticos
llamados no paramétricos, o de distribución libre. Los métodos no paramétricos están basados
en hipótesis más débiles que las pruebas 𝑧 o 𝑡, y no requieren observaciones para seguir
cualquier distribución en particular.
• La figura 8 es un histograma del consumo de energía en niños de dos años (Denisson et al.,
1997), ¿Se puede asumir que tienen una distribución normal? ¿Cómo se puede describir la
distribución? ¿Es, de algún modo sesgada, en sentido positivo o desviada a la derecha? ¿Se
debió usar la prueba de t para comparar esta media de incorporación de energía con la
mostrada en el estudio NHANES III? Véase el resultado que sé hubiera obtenido de haberse
usado un método que no requiriera suposiciones sobre la distribución.
- 89 -

mediana de un grupo
• La prueba signo es una prueba no paramétrica que puede emplearse para un solo grupo usando la
mediana y no la media. Por ejemplo, puede preguntarse si los niños del estudio de Dennison et al.,
tienen una mediana de la cantidad de energía obtenida como las 1286 kcal reportados en el estudio
NHANES III.
• La prueba de signo es como sigue: si la mediana de la cantidad incorporada de energía en la población
de niños de dos años es de 1286, la probabilidad es de 0-50 de cualquier otra observación sea menor a
1286. Se cuenta el número de observaciones con menos de 1286, y puede usarse la distribución
binominal con π=0.50. En el cuadro 13 se muestran los datos de incorporación de energía en niños de
dos años por rangos de menor a mayor; 57 niños de dos años tienen niveles de energía más altos. La
probabilidad de observar x=57 de n=94 con valores menores a 1286 mediante la distribución binomial
es:
- 90 -


mediana de un grupo
𝒏!
𝑷 𝒙 = 𝝅 𝒙 𝟏 − 𝝅 𝒏−𝒙
𝒙! 𝒏 − 𝒙 !
𝟗𝟒!
𝑷 𝟓𝟕 = 𝟎. 𝟓 𝟓𝟕 𝟏 − 𝟎. 𝟓 𝒏−𝒙
𝟓𝟕! 𝟗𝟒 − 𝟓𝟕 !
• Lejos de tratar de calcular esta probabilidad, se usa este ejemplo como oportunidad para utilizar la
aproximación z a la distribución binomial para ilustrar la prueba de signo. Se usa el mismo grado de α
junto con una prueba de dos colas, para comparar los resultados de la prueba de t directamente de la
sección Pasos para la prueba de hipótesis.
- 91 -
¿Qué hacer cuando las observaciones no están

normalmente distribuidas?
Figura 8. Un histograma de la curva normal de consumo de energía entre niños de dos años
Energía consumida por niños de dos años - 92 -


Cuadro 13. Orden por rangos de acuerdo al consumo de energía por niños de dos años de edad
Fila ID Energía (rangos) Fila ID Energía (rangos) Fila ID Energía (Rangos)

2 3 754.3 36 196 1133.09 79 65 1348.54
3 111 784.07 37 71 1138.43 80 161 1253.41
4 14 804.94 38 90 1140.85 82 12 1360.29
5 171 846.47 39 155 1142.86 83 1 1361.23
6 110 871.25 40 127 1156.89 84 75 1366.55
7 166 880.52 41 89 1173.3 86 61 1376.75
8 192 906.89 42 93 1175.76 87 27 1379.75
9 208 907.95 43 176 1177.24 89 98 1395.66
10 237 909.85 44 5 1184.59 90 197 1401.53
11 11 923.18 45 87 1191.05 95 135 1415.58
12 209 930.37 46 51 1192.12 98 58 1433.81
13 33 930.92 47 67 1192.35 100 129 1437.98
14 23 944.83 48 108 1192.69 105 70 1448.06
15 66 947.55 49 231 1194.34 107 8 1458.32
17 6 984.12 51 132 1213.32 112 73 1494.85
- 93 -

Cuadro 13. Orden por rangos de acuerdo al consumo de energía por niños de dos años de edad
Fila ID Energía (rangos) Fila ID Energía (rangos) Fila ID Energía (Rangos)

18 94 990.46 52 163 1229.13 115 179 1500.29
19 88 992.09 53 230 1235.56 116 105 1502.42
20 72 1009.83 54 199 1241.2 117 44 1510.7
21 76 1029.15 55 229 1248.31 120 35 1530.82
22 13 1035.34 53 36 1249.01 123 125 1553.7
23 112 1037.19 57 148 1253.14 129 28 1595.82
24 233 1054.41 58 183 1258.85 133 41 1627.34
25 207 1060.85 59 206 1259.94 135 21 1636
26 18 1074.43 63 138 1271.83 138 162 1653.48
27 82 1087.06 64 174 1285.44 141 10 1676.85
29 216 1096.98 65 39 1287.97 148 69 1727.23
30 106 1098.76 67 178 1290.07 50 109 1741.91
31 85 1108.74 68 19 1293.83 154 15 1785.38
32 146 1110.32 72 142 1308.86 155 101 1788.58
33 134 1110.85 75 37 1317.63 165 168 2154.31
34 7 1115.39 76 143 1321.53
35 57 1122.28 78 92 1337.6
Variables Cuenta Media Mediana Desviación estándar
- 94 -
Energía 94 1242.197 1221.225 256.1682


Prueba de signo para hipótesis 2
sobre la mediana de un grupo
Paso 1: La hipótesis de nulidad y alterna son:
𝑯𝟎 : la mediana de la ingesta de energía de la población en niños de dos años es 1286 kcal,

o , MD = 1286.
𝑯𝟏 : la mediana de la ingesta de energía de la población de niños de dos años es 1286 kcal,
o, MD ≠ 1286.
- 95 -

Paso 2
• Es la prueba de signo se trata con frecuencias en vez de proporciones, entonces se replantea, la
prueba de z en función de frecuencias.
𝑿 − 𝒏𝝅 − (𝟏Τ𝟐)
𝒛=
𝒏𝝅(𝟏 − 𝝅)
Donde X es el número de niños con cantidades de energía obtenida menores de 1286 (57 en
este ejemplo) o puede usarse el número de niños con ingesta de energía mayores que 1286,
esto no es importante. El número total de niños es de n=94, y la probabilidad π = 0.5, para
indicar que hay 50% de oportunidades de observar una mediana menor (o mayor). - 96 -


Paso 3
• se emplea 𝛼 = 0.05 para comparar los resultados con los obtenidos en al prueba de t.
Paso 4
• El valor crítico de la distribución z para α = 0.05 es ± 1.96. Por tanto, si la prueba
estadística de z es ≤-1.96 o ≥+1.96, se rechazará la prueba de nulidad enunciando que no
existe diferencia en las medianas de las cantidades ingeridas de energía.
- 97 -

mediana de un grupo
𝟓𝟕 − 𝟗𝟓(𝟎. 𝟓) − 𝟎. 𝟓
𝒛=
𝟗𝟒(𝟎. 𝟓)(𝟏 − 𝟎. 𝟓)
𝟓𝟕 − 𝟒𝟕 − 𝟎. 𝟓
𝒛=
𝟒. 𝟖𝟓
𝟗. 𝟓
𝒛=
𝟒. 𝟖𝟓
𝒛 = 𝟏. 𝟗𝟔
- 98 -


Paso 6
• El valor de la prueba de signo es 1.96, y está justo en la línea de +1.96. Los especialistas en esta
disciplina tienen por tradición no rechazar la hipótesis de nulidad, a menos que el valor de la prueba
estadística excede el valor crítico.
• Hay dos puntos interesantes. Primero, el valor de la prueba estadística usando la prueba t fue -1.37. Al
ver la fórmula se aprecia que el valor crítico de la prueba de signo es positivo por usar el valor
absoluto en el numerador. Segundo, se saca la misma conclusión cuando se utiliza la prueba de t. Sin
embargo, de no haber usado la correlación de continuidad, el valor de z habría sido 10/4.85, o 2.06, y
se hubiera rechazado la hipótesis de nulidad.
- 99 -
Diferencias de la media cuando las

observaciones no tienen distribución normal
Usar la prueba de t requiere que se dé por supuesto que las diferencias tengan distribución
normal, lo que es especialmente importante cuando los tamaños de las muestras son pequeños
(n<30).
• En caso de diseños pareados, puede utilizarse la prueba de signo que se empleó para un solo
grupo, aplicándola a las diferencias. Alternativamente, se puede utilizar un procedimiento no
paramétrico llamado prueba de rango con signo de Wilcoxon (también conocido como prueba
de U de Mann – Whitney). De hecho, no existe desventaja alguna en usar la prueba de rango
con signo de Wilcoxon en cualquier caso, el tamaño de muestra es pequeño aun cuando las
observaciones tengan distribución normal. La prueba de Wilcoxon es casi tan poderosa
(rechazando sin error la hipótesis de nulidad cuando es falsa) como la prueba t.
• Se recomienda la prueba de Wilcoxon, por encima de la prueba de signo para comparaciones
pareadas por ser más potente. En el pasado, la prueba de Wilcoxon para designación de rango
requería cálculos exhaustivos o tablas estadísticas extensas. En la actualidad, sin embargo, las
pruebas no paramétricas se realizan fácilmente con rutinas de cómputo.
- 100 -

Diferencias de la media cuando las

observaciones no tienen distribución normal
 La figura 9 es una gráfica de caja de los cambios de 7α-HCO antes de la cirugía y

después de un mes de la misma; existe cierta evidencia de sesgos positivos, por lo que
el uso de procedimientos no paramétricos está justificado. Los resultados de la prueba
de Wilcoxon utilizando el procedimiento no paramétrico de SPSS se muestran en el
cuadro 14.
 El SPSS proporciona el número de pacientes con incremento de 7α-HCO después de un
mes, disminución, y el número de pacientes en los que no hay cambios (O en este
ejemplo). Nótese que el nivel de significancia que se obtiene es 0.0000. ¿Esto significa
que hay cero probabilidades de que ocurra una casualidad? No realmente: solo
implica que los programas de cómputo reportan valores de P con sólo un número
decimal pequeño. Se acostumbra reportar P<0.001 y no 0.0000.
- 101 -

Figura 9. Cuadro y bigote (gráfica de caja) de cambios en la 7 𝛼 – HCO después de la
colecistectomía
Incremento de la 7 𝜶 – hidroxi – 4 – colesten – 3 – uno

- 102 -


Cuadro 14. Prueba de rangos señalados de Wilcoxon para 7 𝛼 – HCO
Rangos
N Rango medio Suma de rangos
Rangos negativos 61 15.00 90.00
7α_HCO un mes
después de CCT Rangos positivos 452 27.47 1236.00
7α_HCO antes Empate 03
CCT
Total 51
17α_HCO un mes después de CCT <7α_HCO antes de CCT
27α_HCO un mes después de CCT >7α_HCO antes de CCT
37α_HCO un mes después de CCT =7α_HCO antes de CCT
Estadísticas de prueba
7α_HCO un mes después de CCT-7α_HCO
antes de CCT
z −5.3711
Sig. Asint (dos colas) .000
1Basados en rangos negativos
2Prueba de rangos señalados de Wilcoxon
- 103 -
CCT = colecistectomía; 7α_HCO = 7α – hidroxi – 4 – colesten – 3 – uno
Calcular el tamaño de muestra adecuado para

investigación
Los investigadores deben conocer que tan grande se necesita la muestra antes de comenzar una
investigación, porque de otra manera no podrán determinar la significancia cuando así sea.
Definimos el poder (1-β) como la probabilidad de encontrar significancia cuando en verdad existe
una diferencia. Se mencionó que la potencia puede ser baja cuando la muestra sea demasiado
pequeña.
• Una variedad de fórmulas puede determinar el tamaño requerido de una muestra, y diversos
programas de cómputo hacen los cálculos de tamaños de las muestras para un gran número de
diseños de estudios y de métodos estadísticos. Lerman (1996) hizo una descripción avanzada
acerca de la lógica para calcular el tamaño de una muestra para investigación clínica.
• Muchas personas prefieren usar un programa de computadora para calcular los tamaños de las
muestras. Los manuales que acompañan a estos programas son de mucha utilidad.
• También se ofrecen fórmulas que protegen contra los errores tipo I y tipo II en dos casos
comunes: un estudio que comprende una media o una proporción, y un estudio que mide un
grupo dos veces y que compara la diferencia entre antes y después de una intervención.
- 104 -


investigación
Obtener el tamaño de la muestra 1
para estudios con una media
• Para calcular el tamaño de la muestra para un estudio de investigación que requiere una media, se
debe responder a las siguientes cuatro preguntas:
1. ¿Qué grado de significancia (grado α o valor de 𝑃) requiere en relación con la hipótesis de nulidad?
2. ¿Cuál es el grado de potencia (igual a 1-𝛽) que desea?
3. ¿Qué tan grande debe ser la diferencia entre la media y valor estándar o norma (𝜇1-𝜇0) para que la
diferencia tenga importancia clínica?
4. ¿Cuál es una estimación suficiente de la desviación estándar 𝜎?
- 105 -

investigación
• Las especificaciones de α para la hipótesis de nulidad y 𝛽 para la hipótesis alterna permiten resolver el
tamaño de la muestra. Estas especificaciones conducen a las siguientes dos relaciones críticas, donde za
α es el valor de dos colas (pasa una prueba bidireccional) de 𝑧 relacionada con α, por lo general 0.05 y
zb es el valor mínimo de una cola de 𝑧 relacionado con y 𝛽, por lo general, 0.20. Se usa el valor mínimo
de una prueba unilateral para y 𝛽 debido a que se quiere que la potencia sea igual a (1- 𝛽) o más.
ഥ
𝒙 − 𝝁𝟎 ഥ
𝒙 − 𝝁𝟏
𝒛𝜶 = y 𝒛𝜷 =
𝜹Τ 𝒏 𝜹Τ 𝒏
• Al resolver estos valores críticos para el tamaño de muestra n da.

𝟐
(𝒛𝜶 − 𝒛𝜷 )𝜹
𝒏=
𝝁𝟏 − 𝝁𝟎
- 106 -


investigación
• Supóngase que antes de comenzar su estudio, Dennison et al. (1997) quisieron saber si la media
del consumo de jugo por niños de dos años difiere de 5 oz/día - ya sea más o menos. Por lo
general, los investigadores eligen el error tipo I de 0.05 y el poder de 0.80. Se asume que la
desviación estándar es de 3 oz. De la información proporcionada, ¿Cuál es el tamaño necesario de
la muestra para demostrar una diferencia de una o más onzas?
• El valor de z de dos colas para α de 0.05 es ± 1.96 (del cuadro A-2). El valor inferior de una cola de z
relacionado con β es aproximadamente de - 0.84 (el valor crítico que separa el 20% inferior de la
distribución de z del 80% superior). Con una desviación estándar de 3 y 1 oz de diferencia, los
investigadores quieren demostrar (consumo ≤ 3oz o ≥ 6oz) que el tamaño de la muestra es:
- 107 -

investigación
𝟐
𝟏. 𝟗𝟔 − (−𝟎. 𝟖𝟒) 𝟑
=
𝟔−𝟓
𝟐
𝟏. 𝟗𝟔 + 𝟎. 𝟖𝟒 𝟑
=
𝟏
𝟐
𝟖. 𝟒𝟎
=
𝟏
= 𝟕𝟎. 𝟓𝟔 𝒐 𝟕𝟏
• Para concluir, el consumo medio de jugo ≤ oz/día o ≥ 6 oz/día es punto de partida significativo
para un supuesto consumo de 5 oz/día (con una desviación estándar de 3), para lo cual los
investigadores requieren un tamaño de muestra igual a 71.
- 108 -


investigación
El tamaño de la muestra para 2
estudios de una proporción
• Al igual que el cálculo de un tamaño de muestra para una media, se debe responder a las mismas
cuatro preguntas para el cálculo del tamaño de la muestra necesario para una proporción.
1. ¿Cuál es el grado deseado de significancia (el grado α) relacionado con la hipótesis de
nulidad, 𝜋0 ?
2. ¿Cuál es la potencia deseada de (1-𝛽) relacionado con la hipótesis alterna, 𝜋1 ?
3. ¿Qué tan grande debe ser la diferencia entre la proporción (𝜋0 -𝜋1 ) para que sea
significativa desde el punto de vista clínica?
4. ¿Cuál sería un buen cálculo de la desviación estándar en la población? Para una
proporción es fácil, la proporción misma, 𝜋, determina la desviación estándar calculada,
la cual es𝜋(1-𝜋).
- 109 -

investigación
• La fórmula para determinar el tamaño de la muestra es:
𝟐
𝒛𝜶 𝝅𝟎 (𝟏 − 𝝅𝟎) − 𝒛𝜷 𝝅𝟏 (𝟏 − 𝝅𝟏)
𝒏=
𝝅𝟎 − 𝝅𝟏
• Donde, usando la misma lógica como con el tamaño de la muestra para una
media, zα es el valor de z de dos colas relacionado con la hipótesis nula, y zβes
el valor de z de una cola más bajo relacionado con la hipótesis alterna.
- 110 -


investigación
• Se considera el estudio de Frey et al. (2002) sobre el éxito de la vacuna contra la viruela cuando
se usa una dilución más débil que la normal. Su plan era complicado y aquí se usa una
ilustración más simple y se asume que ellos esperaban que la dilución 1:10 fuera 95% eficaz y
buscaron asegurarse que fuera significativamente mayor de 90. El valor de z de dos colas
relacionados con α = 0.05 es + 1.96 y el valor de z de una cola más bajo relacionado para β es
aproximadamente -0.84. Entonces, el tamaño estimado de la muestra es:
𝟐
𝟏. 𝟗𝟔 𝟎. 𝟗𝟎 𝒙𝟎. 𝟏𝟎 − (−𝟎. 𝟖𝟒) 𝟎. 𝟗𝟓𝒙𝟎. 𝟎𝟓
𝒏=
𝟎. 𝟗𝟎 − 𝟎. 𝟗𝟓 A partir de lo cual elevando
𝟐
𝟎. 𝟕𝟕 al cuadrado se tiene 238.
𝒏=
−𝟎. 𝟎𝟓
𝒏 = 𝟏𝟓. 𝟒𝟎𝟐
- 111 -

investigación
Tamaños de muestra para 3
estudios de antes y después
• Para estimar el tamaño de la muestra requerida

de un estudio es necesario especificar el nivel de
significancia (a menudo 0.05), nivel deseado de
potencia (generalmente 80%), tamaño de la
muestra para ser de importancia clínica, y una
estimación de la desviación estándar-
- 112 -


investigación
Programas de cómputo para 4
calcular tamaños de muestras
Es posible estimar el tamaño de la muestra que

se necesita, pero es mucho más eficaz utilizar
paquetes de potencia estadística, como lo son el
PASS en el NCSS, nQuery o SamplePower.
- 113 -


Medias en Un Grupo

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Medias en Un Grupo

Cargado por

Copyright:

Formatos disponibles

Facultad de Medicina Humana

Escuela Profesional de Medicina Humana

Adaptado de: Bioestadística Médica. Dawson & Trapp.

Preguntas de investigación sobre un grupo

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Preguntas de investigación sobre un grupo

Media de un grupo cuando las observaciones

• ¿Qué tanta confianza se puede tener acerca de que el consumo

• ¿La media de la incorporación energética (1242 kcal) de los

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

Media de un grupo cuando las observaciones

1 La diferencia entre la media observada y la regla

2 El monto de variabilidad entre individuos

3 El número de individuos en el estudio

Los dos primeros factores son importantes cuando se quiere calcular el

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

Media de un grupo cuando las observaciones

Fila Peso Estatura Jugo Gaseosa Energía Edad

1 30.75 92.90 2.00 1.14 754.38 2.00

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

Media de un grupo cuando las observaciones

Variables Cuenta Media Mediana Desviación estándar

Peso 168 35.59887 34.1 8.593439

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

• La prueba t se utilizar mucho en todas las áreas de la ciencia. La distribución t es similar a

Media de un grupo cuando las observaciones

• El tamaño exacto de una desviación estándar depende de un concepto complejo

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

Media de un grupo cuando las observaciones

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

• El uso de los intervalos de confianza se ha incrementado en la investigación que comprende

𝑴𝒆𝒅𝒊𝒂 𝒐𝒃𝒔𝒆𝒓𝒗𝒂𝒅𝒂 ± 𝒄𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝒄𝒐𝒏𝒇𝒊𝒂𝒏𝒛𝒂 × 𝒖𝒏𝒂 𝒎𝒆𝒅𝒊𝒅𝒂𝒅 𝒅𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅 𝒅𝒆 𝒍𝒂 𝒎𝒆𝒅𝒊𝒂

• ഥ como la media (muestra) observada, la fórmula para un intervalo de confianza de 95%

donde t representa el coeficiente de confianza (valor crítico de la distribución t) mismo que

Media de un grupo cuando las observaciones

O aproximadamente 4.99 a 6.95 oz/día

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

Media de un grupo cuando las observaciones

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

Algunos investigadores analizan la hipótesis en lugar de encontrar e informar intervalos de

Media de un grupo cuando las observaciones

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

Media de un grupo cuando las observaciones

• Para emplear la distribución t o la prueba de t, las observaciones deben tener una

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Media de un grupo cuando las observaciones

Preguntas de investigación sobre un grupo

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Paso 1: Expresar la interrogante de investigación como una hipótesis estadística

• La hipótesis de nulidad simbolizada como 𝑯𝟎 , es una manifestación que reclama la ausencia de

Paso 1: Expresar la interrogante de investigación como una hipótesis estadística

Curso: Informática Médica y Bioestadística Tema: Medias en un grupo

Paso 1: Expresar la interrogante de investigación como una hipótesis estadística

Paso 1: Expresar la interrogante de investigación como una hipótesis estadística