Documentos de Académico
Documentos de Profesional
Documentos de Cultura
com
DÉCIMA EDICIÓN
BIOSTATÍSTICA
Una base para el análisis en
ciencias de la salud
DÉCIMA EDICIÓN
BIOSTATÍSTICA
Una base para el análisis en
ciencias de la salud
Estadístico
Oficina de Informática y Analítica
Administración de Salud de Veteranos
Fundada en 1807, John Wiley & Sons, Inc. ha sido una valiosa fuente de conocimiento y comprensión durante más de 200 años, ayudando a
personas de todo el mundo a satisfacer sus necesidades y cumplir sus aspiraciones. Nuestra empresa está construida sobre una base de
principios que incluyen la responsabilidad hacia las comunidades a las que servimos y donde vivimos y trabajamos. En 2008, lanzamos una
Iniciativa de Ciudadanía Corporativa, un esfuerzo global para abordar los desafíos ambientales, sociales, económicos y éticos que
enfrentamos en nuestro negocio. Entre los temas que estamos abordando se encuentran el impacto del carbono, las especificaciones y
adquisiciones del papel, la conducta ética dentro de nuestro negocio y entre nuestros proveedores, y el apoyo comunitario y caritativo.
Para obtener más información, por favor visite nuestro sitio web:www.wiley.com/go/ciudadanía.
Copyright # 2013, 2009, 2005, 1999 John Wiley & Sons, Inc. Todos los derechos reservados. Ninguna parte de esta publicación
puede ser reproducida, almacenada en un sistema de recuperación o transmitida de ninguna forma o por ningún medio, ya
sea electrónico, mecánico, fotocopiado, grabado, escaneado o de otro modo, excepto según lo permitido por las Secciones
107 o 108 de la Ley de derechos de autor de los Estados Unidos de 1976. Act, sin el permiso previo por escrito del Editor o la
autorización mediante el pago de la tarifa correspondiente por copia al Copyright Clearance Center, Inc. 222 Rosewood
Drive, Danvers, MA 01923, sitio webwww.copyright.com. Las solicitudes de autorización al editor deben dirigirse al
Departamento de permisos, John Wiley & Sons, Inc., 111 River Street, Hoboken, NJ 07030-5774, (201)748-6011, fax
(201)748-6008, sitio webhttp://www.wiley.com/go/permisos.
Las copias de evaluación se proporcionan a académicos y profesionales calificados solo con fines de revisión, para su uso en
sus cursos durante el próximo año académico. Estas copias tienen licencia y no pueden venderse ni transferirse a terceros. Al
finalizar el período de revisión, devuelva la copia de evaluación a Wiley. Las instrucciones de devolución y una etiqueta de envío
de devolución sin cargo están disponibles enwww.wiley.com/go/returnlabel. Si ha elegido adoptar este libro de texto para su
uso en su curso, acepte este libro como su copia de escritorio de cortesía. Fuera de los Estados Unidos, comuníquese con su
representante de ventas local.
10 9 8 7 6 5 4 3 2 1
doctor daniel
A mis hijos, Jean, Carolyn y
John, y a la memoria de
su madre, mi esposa, María.
doctor cruz
A mi esposa Pamela
y a mis hijos, Annabella Grace
y Breanna Fe.
PREFACIO
Esta décima edición deBioestadística: una base para el análisis en las ciencias de la saludfue preparado con el
objetivo de atraer a una amplia audiencia. Las ediciones anteriores del libro han sido utilizadas por los
autores y sus colegas en una variedad de contextos. Para los estudiantes universitarios, esta edición debe
proporcionar una introducción a los conceptos estadísticos para estudiantes de biociencias, ciencias de la
salud y para estudiantes de matemáticas que deseen exponerse a conceptos estadísticos aplicados. Al igual
que sus predecesores, esta edición está diseñada para satisfacer las necesidades de los estudiantes
graduados principiantes en diversos campos, como enfermería, ciencias aplicadas y salud pública, que
buscan una base sólida en métodos cuantitativos. Para los profesionales que ya trabajan en el campo de la
salud, esta edición puede servir como una útil referencia de escritorio.
La amplitud de la cobertura provista en este texto, junto con los cientos de ejercicios prácticos,
permite a los instructores una gran flexibilidad en el diseño de cursos en muchos niveles. Con ese fin,
ofrecemos a continuación algunas ideas sobre la cobertura de temas que hemos encontrado útiles en el
entorno del salón de clases.
Al igual que las ediciones anteriores de este libro, esta edición requiere pocos requisitos
matemáticos más allá de una sólida competencia en álgebra universitaria. Hemos mantenido un
énfasis en la comprensión práctica e intuitiva de los principios en lugar de los conceptos abstractos
que subyacen a algunos métodos y que requieren una mayor sofisticación matemática. Con eso en
mente, nos hemos basado en conjuntos de problemas y ejemplos tomados directamente de la
literatura de ciencias de la salud en lugar de ejemplos artificiales. Creemos que esto hace que el texto
sea más interesante para los estudiantes y más práctico para los profesionales de la salud en ejercicio
que consultan el texto en el desempeño de sus funciones laborales.
Para la mayoría de los ejemplos y técnicas estadísticas cubiertas en esta edición,
analizamos el uso de software de computadora para los cálculos. La experiencia ha informado
nuestra decisión de incluir impresiones de ejemplo de una variedad de software estadístico en
esta edición (p. ej., MINITAB, SAS, SPSS y R). Creemos que la inclusión de ejemplos de estos
paquetes particulares, que generalmente son los más utilizados por los profesionales,
proporciona una rica presentación del material y permite al estudiante la oportunidad de
apreciar las diversas tecnologías utilizadas por los estadísticos en ejercicio.
viii
viii PREFACIO
Los cambios específicos a esta edición incluyen texto adicional sobre medidas de dispersión en
el Capítulo 2, texto adicional y ejemplos usando el programa R en el Capítulo 6, una nueva
introducción a los modelos lineales en el Capítulo 8 que une los conceptos de regresión y ANOVA en
los Capítulos 8–11, la adición de ANOVA de medidas repetidas de dos factores en el Capítulo 8, una
discusión de las similitudes de ANOVA y la regresión en el Capítulo 11, y un extenso texto nuevo y
ejemplos sobre cómo probar el ajuste de los modelos de regresión logística en el Capítulo 11.
En la siguiente tabla ofrecemos algunas sugerencias para la cobertura de temas en una variedad de
contextos, con “X"indicando aquellos capítulos que creemos que son más relevantes para una variedad de
cursos para los cuales este texto es apropiado. El texto ha sido diseñado para ser flexible con el fin de
acomodar varios estilos de enseñanza y varias presentaciones del curso. Aunque el texto está diseñado
teniendo en cuenta la presentación progresiva de los conceptos, algunos de los temas pueden omitirse o
cubrirse brevemente para que el enfoque se pueda centrar en los conceptos importantes para los
instructores.
Curso Capítulos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Curso de pregrado para estudiantes de X X X X X X X X X O O X O O O
ciencias de la salud
Curso de pregrado en X O O O X X X X X X O X X X O
estadística aplicada para
estudiantes de matemáticas
SUPLEMENTOS
Manual de soluciones del instructor.Preparado por el Dr. Chad Cross, este manual incluye soluciones a todos
los problemas que se encuentran en el texto. Este manual está disponible solo para los instructores que han
adoptado el texto.
Manual de soluciones del estudiante.Preparado por el Dr. Chad Cross, este manual incluye soluciones para
todos los ejercicios impares. Este manual se puede empaquetar con el texto a un precio con descuento.
Conjuntos de datos.Más de 250 conjuntos de datos están disponibles en línea para acompañar el texto. Estos
conjuntos de datos incluyen los datos presentados en ejemplos, ejercicios, ejercicios de revisión y los grandes
conjuntos de datos que se encuentran en algunos capítulos. Estos están disponibles en formatos SAS, SPSS y Minitab,
así como en formato CSV para importar a otros programas. Los datos están disponibles para su descarga en
www.wiley.com/college/daniel
Quienes no tengan acceso a Internet pueden comunicarse con Wiley directamente en 111 River Street,
Hoboken, NJ 07030-5774; teléfono: 1-877-762-2974.
EXPRESIONES DE GRATITUD
Muchos revisores, estudiantes y docentes han hecho contribuciones a este texto a través de su
cuidadosa revisión, preguntas inquisitivas y discusión profesional de los temas. En particular, nos
gustaría agradecer al Dr. Sheniz Moonie de la Universidad de Nevada, Las Vegas; el Dr. Roy T. Sabo de
la Universidad Virginia Commonwealth; y al Dr. Derek Webb, Universidad Estatal de Bemidji por sus
útiles comentarios sobre la novena edición de este texto.
Hay tres reconocimientos importantes adicionales que se deben hacer a los contribuyentes
importantes del texto. Dr. Juan. P. Holcomb de la Universidad Estatal de Cleveland actualizó muchos
de los ejemplos y ejercicios que se encuentran en el texto. El Dr. Edward Danial de la Universidad
Estatal de Morgan proporcionó una extensa revisión de la precisión de la novena edición del texto, y
sus valiosos comentarios aportaron mucho al libro. La Dra. Jodi BA McKibben, de la Universidad de
Ciencias de la Salud de los Servicios Uniformados, proporcionó una extensa revisión de la precisión de
la edición actual del libro.
Deseamos reconocer la cooperación de Minitab, Inc. por poner a disposición de los
autores durante muchos años y ediciones del libro las últimas versiones de su software.
asistencia con algunos de los métodos de análisis de supervivencia presentados en ediciones anteriores del
texto.
Agradecemos a los muchos investigadores en el campo de las ciencias de la salud que publican sus
resultados y, por lo tanto, ponen a disposición datos que brindan una práctica valiosa a los estudiantes de
bioestadística.
Wayne W. Daniel
chad l cruz-
-
Los puntos de vista presentados en este libro son los del autor y no representan necesariamente los puntos de vista del Departamento de
Asuntos de Veteranos de EE. UU.
CONTENIDOS BREVES
10REGRESIÓN MÚLTIPLE Y
CORRELACIÓN 489
xi
CONTENIDO
XIII
xiv CONTENIDO
El propósito de este capítulo es proporcionar una descripción general de los conceptos estadísticos
básicos que se utilizan en todo el libro de texto. Un curso de estadística requiere que el estudiante
aprenda muchos términos y conceptos nuevos. Este capítulo sienta las bases necesarias para
comprender los términos y conceptos estadísticos básicos y el papel que desempeñan los estadísticos
en la promoción del conocimiento y los descubrimientos científicos.
TEMAS
1.1INTRODUCCIÓN
1.2ALGUNOS CONCEPTOS BÁSICOS
1
2 CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA
1.1 INTRODUCCIÓN
Debido a que este volumen está diseñado para personas que se preparan para una carrera en el
campo de la salud o que ya la están siguiendo, el material ilustrativo y los ejercicios reflejan los problemas y
actividades que estas personas probablemente encontrarán en el desempeño de sus funciones.
Como todos los campos del aprendizaje, la estadística tiene su propio vocabulario. Algunas de las palabras y
frases encontradas en el estudio de la estadística serán nuevas para aquellos que no hayan estado expuestos
previamente al tema. Otros términos, aunque parezcan familiares, pueden tener significados especializados
que son diferentes de los significados que estamos acostumbrados a asociar con estos términos. Los
siguientes son algunos términos que usaremos extensamente en este libro.
DatosLa materia prima de las estadísticas esdatos.Para nuestros propósitos, podemos definir
los datos como números.Los dos tipos de números que usamos en estadística son números
que resultan de la toma—en el sentido usual del término—de unamedición,y las que resultan
del proceso decontando.Por ejemplo, cuando una enfermera pesa a un paciente o le toma la
temperatura, se obtiene una medida que consiste en un número como 150 libras o 100 grados
Fahrenheit. Se obtiene un tipo de número bastante diferente cuando el administrador de un
hospital cuenta el número de pacientes (quizás 20) dados de alta del hospital en un día
determinado. Cada uno de los tres números es undato,y los tres tomados juntos son datos.
1. Registros mantenidos de forma rutinaria.Es difícil imaginar cualquier tipo de organización que no mantenga
registros de las transacciones diarias de sus actividades. Los registros médicos de los hospitales, por ejemplo,
contienen inmensas cantidades de información sobre los pacientes, mientras que los registros contables de
los hospitales contienen una gran cantidad de datos sobre las actividades comerciales de las instalaciones.
Cuando surge la necesidad de datos, debemos buscarlos primero entre los registros que se llevan de forma
rutinaria.
2. Encuestas.Si los datos necesarios para responder una pregunta no están disponibles en los registros
que se llevan de forma rutinaria, la fuente lógica puede ser una encuesta. Supongamos, por ejemplo,
que el administrador de una clínica desea obtener información sobre el modo de transporte utilizado
por los pacientes para visitar la clínica. Si los formularios de admisión no contienen una pregunta
sobre el modo de transporte, podemos realizar una encuesta entre los pacientes para obtener esta
información.
3. Experimentos.Con frecuencia, los datos necesarios para responder una pregunta están disponibles solo
como resultado de un experimento. Una enfermera puede desear saber cuál de varias estrategias es
la mejor para maximizar el cumplimiento del paciente. La enfermera podría realizar un experimento
en el que se prueben diferentes estrategias para motivar el cumplimiento con diferentes pacientes. La
evaluación posterior de las respuestas a las diferentes estrategias podría permitir a la enfermera
decidir cuál es la más eficaz.
4. Fuentes externas.Es posible que los datos necesarios para responder una pregunta ya existan en
forma de informes publicados, bancos de datos disponibles comercialmente o literatura de
investigación. En otras palabras, podemos encontrar que alguien más ya ha hecho la misma
pregunta, y la respuesta obtenida puede ser aplicable a nuestra situación actual.
VariableSi, al observar una característica, encontramos que toma diferentes valores en diferentes
personas, lugares o cosas, llamamos a la característica unavariable.Hacemos esto por la sencilla razón
de que la característica no es la misma cuando se observa en diferentes poseedores de la misma.
Algunos ejemplos de variables incluyen la presión arterial diastólica, la frecuencia cardíaca, la altura
de los hombres adultos, el peso de los niños en edad preescolar y las edades de los pacientes
atendidos en una clínica dental.
4CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA
de valores asumidos por la variable. Los ejemplos de variables continuas incluyen las diversas
medidas que se pueden realizar en individuos, como la altura, el peso y la circunferencia del
cráneo. No importa qué tan cerca estén las alturas observadas de dos personas, por ejemplo,
podemos, teóricamente, encontrar a otra persona cuya altura se encuentre en algún punto
intermedio.
Sin embargo, debido a las limitaciones de los instrumentos de medición disponibles, las
observaciones sobre variables que son inherentemente continuas se registran como si fueran
discretas. La altura, por ejemplo, generalmente se registra con precisión de un cuarto, media o
pulgada entera, mientras que, con un dispositivo de medición perfecto, dicha medición podría
hacerse tan precisa como se desee.
PoblaciónLa persona promedio piensa en una población como una colección de entidades, generalmente
personas. Sin embargo, una población o colección de entidades puede consistir en animales, máquinas,
lugares o células. Para nuestros propósitos, definimos unpoblación de entidades como la mayor colección de
entidades por las que tenemos interés en un momento determinado.Si tomamos una medida de alguna
variable sobre cada una de las entidades de una población, generamos una población de valores de esa
variable. Podemos, por tanto, definir unpoblación de valores como la colección más grande de valores de una
variable aleatoria por la que tenemos interés en un momento particular.Si, por ejemplo, estamos interesados
en los pesos de todos los niños matriculados en el sistema de escuelas primarias de un determinado
condado, nuestra población se compone de todos estos pesos. Si nuestro interés radica solo en los pesos de
los estudiantes de primer grado en el sistema, tenemos una población diferente: los pesos de los estudiantes
de primer grado matriculados en el sistema escolar. Por lo tanto, las poblaciones están determinadas o
definidas por nuestra esfera de interés. Las poblaciones pueden serfinito oinfinito.Si una población de
valores consiste en un número fijo de estos valores, se dice que la población esfinito.Si, por el contrario, una
población consiste en una sucesión interminable de valores, la población es uninfinitouno.
MuestraUna muestra puede definirse simplemente comouna parte de una población.Supongamos que
nuestra población consiste en los pesos de todos los niños de escuela primaria matriculados en un
determinado sistema escolar del condado. Si recolectamos para el análisis los pesos de solo una fracción de
estos niños, tenemos solo una parte de nuestra población de pesos, es decir, tenemos unamuestra.
1.3 MEDICIÓN Y
ESCALAS DE MEDIDA
La escala ordinalCuando las observaciones no sólo difieren de una categoría a otra, sino que pueden clasificarse de acuerdo con algún criterio, se dice
que se miden en una escala ordinal. Los pacientes convalecientes pueden clasificarse como sin mejoría, mejoría y mucha mejoría. Las personas pueden
clasificarse según su nivel socioeconómico en bajo, medio o alto. La inteligencia de los niños puede estar por encima del promedio, promedio o por
debajo del promedio. En cada uno de estos ejemplos, los miembros de cualquier categoría se consideran todos iguales, pero los miembros de una
categoría se consideran inferiores, peores o más pequeños que los de otra categoría, que a su vez guarda una relación similar con otra categoría. Por
ejemplo, un paciente que ha mejorado mucho tiene mejor salud que uno clasificado como mejorado, mientras que un paciente que ha mejorado está en
mejores condiciones que uno que no ha mejorado. Por lo general, es imposible inferir que la diferencia entre los miembros de una categoría y la
siguiente categoría adyacente es igual a la diferencia entre los miembros de esa categoría y los miembros de la siguiente categoría adyacente. El grado
de mejora entre no mejorado y mejorado probablemente no sea el mismo que entre mejorado y muy mejorado. La implicación es que si se hiciera un
desglose más fino que diera como resultado más categorías, estas también podrían ordenarse de manera similar. La función de los números asignados
a los datos ordinales es ordenar (o clasificar) las observaciones de menor a mayor y, por lo tanto, el término El grado de mejora entre no mejorado y
mejorado probablemente no sea el mismo que entre mejorado y muy mejorado. La implicación es que si se hiciera un desglose más fino que diera como
resultado más categorías, estas también podrían ordenarse de manera similar. La función de los números asignados a los datos ordinales es ordenar (o
clasificar) las observaciones de menor a mayor y, por lo tanto, el término El grado de mejora entre no mejorado y mejorado probablemente no sea el
mismo que entre mejorado y muy mejorado. La implicación es que si se hiciera un desglose más fino que diera como resultado más categorías, estas
también podrían ordenarse de manera similar. La función de los números asignados a los datos ordinales es ordenar (o clasificar) las observaciones de
La escala de razónEl nivel más alto de medición es elescala de proporción.Esta escala se caracteriza
por el hecho de que se puede determinar tanto la igualdad de razones como la igualdad de intervalos.
Fundamental para la escala de razón es un verdadero punto cero. La medición de rasgos tan
familiares como la altura, el peso y la longitud hace uso de la escala de proporción.
1.4 MUESTREO E INFERENCIA ESTADÍSTICA 7
1.4 MUESTREO Y
INFERENCIA ESTADÍSTICA
Como se señaló anteriormente, uno de los propósitos de este libro es enseñar los conceptos de inferencia estadística,
que podemos definir de la siguiente manera:
DEFINICIÓN
La inferencia estadística es el procedimiento mediante el cual llegamos a una
conclusión sobre una población sobre la base de la información contenida en una
muestra que se ha extraído de esa población.
Hay muchos tipos de muestras que se pueden extraer de una población. Sin embargo, no
todos los tipos de muestras pueden usarse como base para hacer inferencias válidas sobre una
población. En general, para poder hacer una inferencia válida sobre una población, necesitamos una
muestra científica de la población. También hay muchos tipos de muestras científicas que se pueden
extraer de una población. El más simple de ellos es elmuestra aleatoria simple.En esta sección
definimos una muestra aleatoria simple y le mostramos cómo extraer una de una población.
DEFINICIÓN
Si una muestra de tamañonortese extrae de una población de tamañonortede tal manera que
toda muestra posible de tamañonortetiene la misma probabilidad de ser seleccionada, la
muestra se denomina muestra aleatoria simple.
La mecánica de extraer una muestra para satisfacer la definición de una muestra aleatoria
simple se llamamuestreo aleatorio simple.
Demostraremos el procedimiento del muestreo aleatorio simple en breve, pero primero
consideremos el problema de si muestrearcon reemplazoosin reemplazo.Cuando se emplea el muestreo con
reemplazo, todos los miembros de la población están disponibles en cada sorteo. Por ejemplo, suponga que
estamos extrayendo una muestra de una población de antiguos pacientes hospitalizados como parte de un
estudio de duración de la estancia. Supongamos que el muestreo implica seleccionar de los estantes del
departamento de registros médicos una muestra de historias clínicas de pacientes dados de alta. En el
muestreo con reemplazo, procederíamos de la siguiente manera: seleccionar un cuadro para estar en la
muestra, registrar la duración de la estadía y devolver el cuadro al estante. La tabla vuelve a estar en la
“población” y puede volver a dibujarse en algún sorteo posterior, en cuyo caso se registrará nuevamente la
duración de la estadía. En el muestreo sin reemplazo, no devolveríamos un gráfico dibujado al estante
después de registrar la duración de la estadía, sino que lo dejaríamos a un lado hasta que se extraiga toda la
muestra. Siguiendo este procedimiento, un gráfico dado podría aparecer en la muestra solo una vez. Como
regla, en la práctica, el muestreo siempre se realiza sin reemplazo. El significado y las consecuencias de esto
se explicarán más adelante, pero primero veamos cómo se selecciona una muestra aleatoria simple. Para
asegurar la verdadera aleatoriedad de la selección, necesitaremos seguir algún procedimiento objetivo. Sin
duda querremos evitar
8CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA
usar nuestro propio juicio para decidir qué miembros de la población constituyen una muestra
aleatoria. El siguiente ejemplo ilustra un método para seleccionar una muestra aleatoria simple de
una población.
EJEMPLO 1.4.1
Oro et al. (A-1) estudiaron la eficacia para dejar de fumar de bupropion SR, un parche de nicotina, o
ambos, cuando se administran junto con la terapia cognitivo-conductual. Los pacientes consecutivos
que dieron su consentimiento se asignaron a uno de los tres tratamientos. Con fines ilustrativos,
consideremos todos estos sujetos como una población de tamañonorte¼189. Deseamos seleccionar
una muestra aleatoria simple de tamaño 10 de esta población cuyas edades se muestran en la Tabla
1.4.1.
TABLA 1.4.1 Edades de 189 sujetos que participaron en un estudio para dejar de fumar
Núm. de sujeto Edad Núm. de sujeto Edad Núm. de sujeto Edad Núm. de sujeto Edad
1 48 49 38 97 51 145 52
2 35 50 44 98 50 146 53
3 46 51 43 99 50 147 61
4 44 52 47 100 55 148 60
5 43 53 46 101 63 149 53
6 42 54 57 102 50 150 53
7 39 55 52 103 59 151 50
8 44 56 54 104 54 152 53
9 49 57 56 105 60 153 54
10 49 58 53 106 50 154 61
11 44 59 64 107 56 155 61
12 39 60 53 108 68 156 61
13 38 61 58 109 66 157 64
14 49 62 54 110 71 158 53
15 49 63 59 111 82 159 53
dieciséis 53 64 56 112 68 160 54
17 56 sesenta y cinco 62 113 78 161 61
18 57 66 50 114 66 162 60
19 51 67 64 115 70 163 51
20 61 68 53 116 66 164 50
21 53 69 61 117 78 165 53
22 66 70 53 118 69 166 64
23 71 71 62 119 71 167 64
24 75 72 57 120 69 168 53
25 72 73 52 121 78 169 60
26 sesenta y cinco 74 54 122 66 170 54
27 67 75 61 123 68 171 55
28 38 76 59 124 71 172 58
(Continuación)
1.4 MUESTREO E INFERENCIA ESTADÍSTICA 9
Núm. de sujeto Edad Núm. de sujeto Edad Núm. de sujeto Edad Núm. de sujeto Edad
29 37 77 57 125 69 173 62
30 46 78 52 126 77 174 62
31 44 79 54 127 76 175 54
32 44 80 53 128 71 176 53
33 48 81 62 129 43 177 61
34 49 82 52 130 47 178 54
35 30 83 62 131 48 179 51
36 45 84 57 132 37 180 62
37 47 85 59 133 40 181 57
38 45 86 59 134 42 182 50
39 48 87 56 135 38 183 64
40 47 88 57 136 49 184 63
41 47 89 53 137 43 185 sesenta y cinco
42 44 90 59 138 46 186 71
43 48 91 61 139 34 187 71
44 43 92 55 140 46 188 73
45 45 93 61 141 46 189 66
46 40 94 56 142 48
47 48 95 52 143 47
48 49 96 54 144 43
Fuente: Datos proporcionados por cortesía de Paul B. Gold, Ph.D.
Solución: Una forma de seleccionar una muestra aleatoria simple es usar una tabla de números aleatorios como la que se muestra en el Apéndice, Tabla A. Como primer
paso, localizamos un punto de partida aleatorio en la tabla. Esto se puede hacer de varias maneras, una de las cuales es apartar la mirada de la página mientras se
toca con la punta de un lápiz. El punto de inicio aleatorio es el dígito más cercano a donde el lápiz tocó la página. Supongamos que seguir este procedimiento
condujo a un punto de inicio aleatorio en la Tabla A en la intersección de la fila 21 y la columna 28. El dígito en este punto es 5. Dado que tenemos 189 valores para
elegir, solo podemos usar los números aleatorios Del 1 al 189. Será conveniente elegir números de tres dígitos para que los números del 001 al 189 sean los
únicos números elegibles. El primer número de tres dígitos, que comienza en nuestro punto de partida aleatorio, es 532, un número que no podemos usar. El
siguiente número (descendente) es 196, que nuevamente no podemos usar. Bajemos más allá de 196, 372, 654 y 928 hasta llegar a 137, un número que podemos
usar. La edad del sujeto 137 de la Tabla 1.4.1 es 43, el primer valor en nuestra muestra. Registramos el número aleatorio y la edad correspondiente en la Tabla
1.4.2. Registramos el número aleatorio para realizar un seguimiento de los números aleatorios seleccionados. Como queremos muestrear sin reemplazo, no
queremos incluir dos veces la edad del mismo individuo. Proceder de la manera recién descrita nos lleva a los nueve números aleatorios restantes y sus
correspondientes edades que se muestran en la Tabla 1.4.2. Note que cuando llegamos al final de la columna, simplemente nos movemos sobre tres dígitos y 928
hasta llegar al 137, número que podemos utilizar. La edad del sujeto 137 de la Tabla 1.4.1 es 43, el primer valor en nuestra muestra. Registramos el número
aleatorio y la edad correspondiente en la Tabla 1.4.2. Registramos el número aleatorio para realizar un seguimiento de los números aleatorios seleccionados.
Como queremos muestrear sin reemplazo, no queremos incluir dos veces la edad del mismo individuo. Proceder de la manera recién descrita nos lleva a los nueve
números aleatorios restantes y sus correspondientes edades que se muestran en la Tabla 1.4.2. Note que cuando llegamos al final de la columna, simplemente
nos movemos sobre tres dígitos y 928 hasta llegar al 137, número que podemos utilizar. La edad del sujeto 137 de la Tabla 1.4.1 es 43, el primer valor en nuestra
muestra. Registramos el número aleatorio y la edad correspondiente en la Tabla 1.4.2. Registramos el número aleatorio para realizar un seguimiento de los
números aleatorios seleccionados. Como queremos muestrear sin reemplazo, no queremos incluir dos veces la edad del mismo individuo. Proceder de la manera
recién descrita nos lleva a los nueve números aleatorios restantes y sus correspondientes edades que se muestran en la Tabla 1.4.2. Note que cuando llegamos al
final de la columna, simplemente nos movemos sobre tres dígitos Registramos el número aleatorio para realizar un seguimiento de los números aleatorios
seleccionados. Como queremos muestrear sin reemplazo, no queremos incluir dos veces la edad del mismo individuo. Proceder de la manera recién descrita nos lleva a los nueve números aleatorios rest
10 CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA
Aleatorio Muestra
Número Número de asunto Edad
137 1 43
114 2 66
155 3 61
183 4 64
185 5 sesenta y cinco
028 6 38
085 7 59
181 8 57
018 9 57
164 10 50
al 028 y suba por la columna. Podríamos haber comenzado en la parte superior con el
número 369.
Por lo tanto, hemos extraído una muestra aleatoria simple de tamaño 10 de una
población de tamaño 189. En discusiones futuras, siempre que se use el término
muestra aleatoria simple, se entenderá que la muestra se ha extraído de esta manera
o de una manera equivalente. &
La discusión anterior sobre el muestreo aleatorio se presenta debido al importante papel que
juega el proceso de muestreo en el diseñoEstudios de investigaciónyexperimentosLa metodología y
los conceptos empleados en los procesos de muestreo se describirán con más detalle en la Sección
1.5.
DEFINICIÓN
Un estudio de investigación es un estudio científico de un fenómeno de interés. Los
estudios de investigación implican el diseño de protocolos de muestreo, la recopilación y el
análisis de datos y la obtención de conclusiones válidas basadas en los resultados de los
análisis.
DEFINICIÓN
Los experimentos son un tipo especial de estudio de investigación en el que se realizan
observaciones después de que se hayan llevado a cabo manipulaciones específicas de las
condiciones; proporcionan la base para la investigación científica.
en lugar de familiarizar al estudiante con dos métodos de muestreo adicionales que se emplean en las
ciencias de la salud,muestreo sistemáticoymuestreo aleatorio estratificado.Los lectores interesados pueden
consultar los libros de Thompson (3) y Levy y Lemeshow (4) para obtener una descripción general detallada
de varios métodos de muestreo y explicaciones sobre cómo se calculan las estadísticas muestrales cuando
estos métodos se aplican en estudios de investigación y experimentos.
EJEMPLO 1.4.2
Continuando con el estudio de Gold et al. (A-1) ilustrado en el ejemplo anterior, imagina que
queremos una muestra sistemática de 10 sujetos de los enumerados en la Tabla 1.4.1.
Solución: Para obtener un punto de partida, volveremos a utilizar la Tabla A del Apéndice. Con
fines ilustrativos, supongamos que el punto de partida aleatorio en la Tabla A fue la
intersección de la fila 10 y la columna 30. El dígito es un 4 y servirá como nuestro
punto de partida. punto,X.Dado que comenzamos en el tema 4, quedan 185 temas
restantes (es decir, 189-4) para elegir. Como deseamos seleccionar 10 sujetos, un
método para definir el intervalo de muestra,k,sería tomar 185/10¼18.5. Para
asegurarse de que habrá suficientes sujetos, se acostumbra a redondear este cociente
hacia abajo y, por lo tanto, redondearemos el resultado a 18. La muestra resultante se
muestra en la Tabla 1.4.3.
4 44
22 66
40 47
58 53
76 59
94 56
112 68
130 47
148 60
166 64
&
12 CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA
Muestreo aleatorio estratificadoUna situación común que se puede encontrar en una población
bajo estudio es aquella en la que las unidades de muestra se encuentran juntas en forma agrupada.
En ocasiones, cuando las unidades de muestra no están inherentemente agrupadas, puede ser
posible y deseable agruparlas con fines de muestreo. En otras palabras, puede ser deseable dividir
una población de interés en grupos, oEstratos,en el que las unidades muestrales dentro de un estrato
particular son más similares entre sí que con las unidades muestrales que componen los otros
estratos. Después de estratificar la población, se acostumbra tomar una muestra aleatoria
independientemente de cada estrato. Esta técnica se llamamuestreo aleatorio estratificado.La
muestra resultante se denominamuestra aleatoria estratificada.Aunque los beneficios del muestreo
aleatorio estratificado pueden no ser fácilmente observables, lo más frecuente es que las muestras
aleatorias tomadas dentro de un estrato tengan mucha menos variabilidad que una muestra aleatoria
tomada en todos los estratos. Esto es cierto porque las unidades de muestra dentro de cada estrato
tienden a tener características similares.
EJEMPLO 1.4.3
Los centros hospitalarios de trauma reciben calificaciones según sus capacidades para tratar diversos traumas. En
este sistema, un centro de traumatología de nivel 1 es el nivel más alto de atención traumatológica disponible y un
centro de traumatología de nivel 4 es el nivel más bajo de atención traumatológica disponible. Imagine que estamos
interesados en estimar la tasa de supervivencia de las víctimas de trauma tratadas en hospitales dentro de un área
metropolitana grande. Suponga que el área metropolitana tiene un centro de trauma de nivel 1, nivel 2 y nivel 3.
Deseamos tomar muestras de pacientes de estos centros de trauma de tal manera que el tamaño total de la muestra
sea de 30.
Cabe señalar que con frecuencia se emplean dos ligeras modificaciones de la técnica de
muestreo estratificado. Para ilustrar, considere nuevamente el ejemplo del centro de trauma. En
primer lugar, se podría haber seleccionado una muestra sistemática de expedientes de pacientes de
cada centro de trauma (estrato). Tal muestra se llamamuestra sistemática estratificada.
La segunda modificación del muestreo estratificado implica seleccionar la muestra de un
estrato dado de tal manera que el número de unidades de muestra seleccionadas de ese estrato sea
proporcional al tamaño de la población de ese estrato. Supongamos, en nuestro ejemplo de centro de
trauma, que el centro de trauma de nivel 1 trató a 100 pacientes y los centros de trauma de nivel 2 y 3
trataron solo 10 cada uno. En ese caso, seleccionando una muestra aleatoria de 10 de
1.5 EL MÉTODO CIENTÍFICO Y EL DISEÑO DE EXPERIMENTOS 13
cada centro de trauma sobrerrepresenta a los centros de trauma con cargas de pacientes más pequeñas.
Para evitar este problema, ajustamos el tamaño de la muestra tomada de un estrato para que sea
proporcional al tamaño de la población del estrato. Este tipo de muestreo se llamamuestreo estratificado
proporcional al tamaño.Las muestras dentro del estrato pueden ser aleatorias o sistemáticas, como se
describió anteriormente.
EJERCICIOS
1.4.1Usando la tabla de números aleatorios, seleccione un nuevo punto de partida aleatorio y extraiga otra muestra
aleatoria simple de tamaño 10 de los datos de la Tabla 1.4.1. Registre las edades de los sujetos en esta nueva
muestra. Guarde sus datos para uso futuro. ¿Cuál es la variable de interés en este ejercicio? ¿Qué escala de
medición se utilizó para obtener las medidas?
1.4.2Seleccione otra muestra aleatoria simple de tamaño 10 de la población representada en la Tabla 1.4.1. Compare
los sujetos de esta muestra con los de la muestra extraída en el ejercicio 1.4.1. ¿Hay algún sujeto que
apareció en ambas muestras? ¿Cuántos? Compare las edades de los sujetos en las dos muestras. ¿Cuántas
edades en la primera muestra se duplicaron en la segunda muestra?
1.4.3Usando la tabla de números aleatorios, seleccione una muestra aleatoria y una muestra sistemática, cada una de tamaño 15,
de los datos de la Tabla 1.4.1. Compare visualmente las distribuciones de las dos muestras. ¿Parecen
similares? ¿Cuál parece ser la mejor representación de los datos?
1.4.4Construya un ejemplo en el que sería apropiado utilizar un muestreo estratificado. Discuta cómo usaría el
muestreo aleatorio estratificado y el muestreo estratificado proporcional al tamaño con este ejemplo.
¿Cuál crees que representaría mejor a la población que describiste en tu ejemplo? ¿Por qué?
Los análisis de datos que utilizan una amplia gama de métodos estadísticos juegan un papel importante en
los estudios científicos. La sección anterior destacó la importancia de obtener muestras de manera científica.
Las técnicas de muestreo apropiadas aumentan la probabilidad de que los resultados de los análisis
estadísticos de un conjunto de datos proporcionen resultados válidos y científicamente defendibles. Debido a
la importancia de la recopilación adecuada de datos para respaldar el descubrimiento científico, es necesario
considerar la base de dicho descubrimiento: elmétodo científico-y explorar el papel de las estadísticas en el
contexto de este método.
DEFINICIÓN
El método científico es un proceso mediante el cual se recopila, analiza e
informa información científica para producir resultados imparciales y
reproducibles en un esfuerzo por proporcionar una representación precisa de
los fenómenos observables.
El diseño de un experimento depende del tipo de datos que deben recopilarse para probar una
hipótesis específica. Como se discutió en la Sección 1.2, los datos se pueden recopilar o poner a disposición a
través de una variedad de medios. Sin embargo, para gran parte de la investigación científica, el estándar
para la recopilación de datos es la experimentación. Una verdaddiseño experimentales aquel en el que los
sujetos de estudio son asignados al azar a ungrupo experimental (ogrupo de tratamiento)y ungrupo de
controlque no está directamente expuesto a un tratamiento. Continuando con el ejemplo de la pérdida de
peso, se podría asignar aleatoriamente una muestra de 100 participantes a dos condiciones usando los
métodos de la Sección 1.4. Se asignaría una muestra de 50 de los participantes a un programa de ejercicio
específico y se controlaría a los 50 restantes, pero se les pediría que no hicieran ejercicio durante un período
de tiempo específico. Al final de este experimento se pudieron comparar las pérdidas de peso medias
(medias) de los dos grupos. La razón por la que los diseños experimentales son deseables es que si se
controlan todos los demás factores potenciales, unrelación causa-efectopuede ser probado; es decir, en
igualdad de condiciones, podríamos concluir o dejar de concluir que el grupo experimental perdió peso como
resultado del ejercicio.
La complejidad potencial de los diseños de investigación requiere experiencia estadística,
y el Capítulo 8 destaca algunos diseños experimentales de uso común. Para una discusión más
profunda de los diseños de investigación, el lector interesado puede consultar los textos de
Kuehl (5), Keppel y Wickens (6) y Tabachnick y Fidell (7).
EJERCICIOS
1.5.1Usando el ejemplo de la pérdida de peso como punto final, discuta cómo usaría el método científico para probar
la observación de que el cambio en la dieta está relacionado con la pérdida de peso. Incluya todos los pasos,
incluida la hipótesis a probar y el diseño de su experimento.
1.5.2Continuando con el Ejercicio 1.5.1, considere cómo usaría el método científico para probar la observación de que
tanto el ejercicio como el cambio en la dieta están relacionados con la pérdida de peso. Incluya todos los
pasos, prestando especial atención a cómo podría diseñar el experimento y qué hipótesis serían
comprobables dado su diseño.
1.6 COMPUTADORAS Y
ANÁLISIS BIOSTATÍSTICO
1.7 RESUMEN
En este capítulo presentamos al lector los conceptos básicos de estadística. Definimos la estadística como un
área de estudio relacionada con la recopilación y descripción de datos y con la realización de inferencias
estadísticas. Definimos la inferencia estadística como el procedimiento mediante el cual llegamos a una
conclusión sobre una población sobre la base de la información contenida en una muestra extraída de esa
población. Aprendimos que un tipo básico de muestra que nos permitirá hacer inferencias válidas es la
muestra aleatoria simple. Aprendimos a usar una tabla de números aleatorios para extraer una muestra
aleatoria simple de una población.
Se proporcionan al lector las definiciones de algunos términos básicos, como variable y
muestra, que se utilizan en el estudio de la estadística. También discutimos la medición y
definimos cuatro escalas de medición: nominal, ordinal, de intervalo y de razón. el lector es
PREGUNTAS DE REPASO Y EJERCICIOS 17
3.Definir:
(a)Estadísticas (b)Bioestadística
(C)Variable (d)Variable cuantitativa
(mi)variable cualitativa (F)Variable aleatoria
(gramo)Población (h)Población finita
(i)Población infinita (j)Muestra
(k)Variable discreta (l)Variable continua
(metro)Muestra aleatoria simple (norte)Muestreo con reemplazo
(o)Muestreo sin reemplazo
4.Definir la palabramedición.
5.Enumere, describa y compare las cuatro escalas de medida.
6.Para cada una de las siguientes variables, indique si es cuantitativa o cualitativa y especifique la
escala de medida que se emplea al tomar medidas en cada una:
(a)Posición de clase de los miembros de esta clase entre sí
(b)Diagnóstico de admisión de pacientes ingresados en una clínica de salud mental
8.Considere las dos situaciones dadas en el Ejercicio 7. Para la Situación A, describa cómo usaría una muestra aleatoria
estratificada para recopilar los datos. Para la Situación B, describa cómo usaría el muestreo sistemático de los
registros de pacientes para recopilar los datos.
18 CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA
REFERENCIAS
Referencias de metodología
1. SS STEVENS, "En la teoría de las escalas de medición,"Ciencias, 103 (1946), 677–680.
2. SS STEVENS, "Matemáticas, Medida y Psicofísica", en SS Stevens (ed.),manual de psicología experimental,
Wiley, Nueva York, 1951.
3. STEVENK THOMPSON,Muestreo (2ª ed.), Wiley, Nueva York, 2002.
4. pagAULS. L.EVYy STANLEYLEMESHOW,Muestreo de Poblaciones: Métodos y Aplicaciones (3.ª ed.), Wiley, Nueva
York, 1999.
5. ROBERTODE ACUERDOUEHL,Principios estadísticos del diseño y análisis de la investigación (2ª ed.), Duxbury Press, Belmont, CA, 1999.
6. gEOFFREYkEPPELy THOMASD. W.GALLETA,Diseño y análisis: manual de un investigador (4.ª ed.), Prentice Hall, Upper
Saddle River, Nueva Jersey, 2004.
7. BARBARAG. T.ABACHNICKy yoINDAS. F.IDEAL,Diseños Experimentales usando ANOVA,Thomson, Belmont, California, 2007.
8. gEORGES. F.ISMAN,Conceptos y Métodos en Simulación Digital de Eventos Discretos,Wiley, Nueva York, 1973.
9. WILLIAMRHERSH,Recuperación de información: una perspectiva de atención médica,Springer, Nueva York, 1996.
10. mERIDALJOHNS,Gestión de la información para las profesiones de la salud,Editorial Delmar, Albany, Nueva York, 1997.
11. mARVINJ. M.ILLER, kENRICWHammond, y MATTEOGHILE(eds.),informática de salud mental,Springer, Nueva York,
1996.
12. VIRGINIAKSABAy kATLETASOYCCORMICK,Fundamentos de la informática para enfermeras,McGraw-Hill, Nueva York,
1996.
13. LEE.UU.HANCOCK,Guía de Internet para médicos,Lippincott Williams & Wilkins Publishers, Filadelfia, 1996.
14. LESLIEH NICOLLy TEENAHOUELLETTE,Computers in Nursing's Nurses' Guide to the Internet, 3.ª ed., Lippincott
Williams & Wilkins Publishers, Filadelfia, 2001.
Aplicaciones Referencias
A-1. PAGAULBGVIEJO, ROBERTOnrUBEYy RICHARDTHARVEY, “Estudio comparativo naturalista y autoasignado de bupropion SR, un
parche de nicotina o ambos para el tratamiento para dejar de fumar en la atención primaria”Revista estadounidense
sobre adicciones, 11 (2002), 315–331.
CAPÍTULO 2
ESTADÍSTICAS DESCRIPTIVAS
TEMAS
2.1INTRODUCCIÓN
2.2LA MATRIZ ORDENADA
2.3DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS
19
20 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
2.1 INTRODUCCIÓN
En el Capítulo 1 dijimos que la toma de una medida y el proceso de contar producen números que
contienen información. El objetivo de quien aplica las herramientas de la estadística a estos números
es determinar la naturaleza de esta información. Esta tarea se hace mucho más fácil si los números
están organizados y resumidos. Cuando se toman medidas de una variable aleatoria en las entidades
de una población o muestra, los valores resultantes se ponen a disposición del investigador o
estadístico como una masa de datos desordenados. Las mediciones que no han sido organizadas,
resumidas o manipuladas de otra manera se denominandatos sin procesar. A menos que el número
de observaciones sea extremadamente pequeño, es poco probable que estos datos en bruto
proporcionen mucha información hasta que se hayan puesto en algún tipo de orden.
En este capítulo aprendemos varias técnicas para organizar y resumir datos de modo que
podamos determinar más fácilmente qué información contienen. Lo último en resumen de
datos es el cálculo de un solo número que de alguna manera transmite información importante
sobre los datos a partir de los cuales se calculó. Estos números únicos que se utilizan para
describir datos se denominanmedidas descriptivas.Después de estudiar este capítulo, podrá
calcular varias medidas descriptivas tanto para poblaciones como para muestras de datos.
Un primer paso en la organización de datos es la preparación de una matriz ordenada. Unmatriz ordenadaes
una lista de los valores de una colección (ya sea población o muestra) en orden de magnitud desde el valor
más pequeño hasta el valor más grande. Si el número de medidas a pedir es de un tamaño apreciable, es
muy deseable el uso de una computadora para preparar la matriz ordenada.
Una matriz ordenada permite determinar rápidamente el valor de la medida más
pequeña, el valor de la medida más grande y otros datos sobre los datos de la matriz que
podrían necesitarse rápidamente. Ilustramos la construcción de un arreglo ordenado con los
datos discutidos en el ejemplo 1.4.1.
EJEMPLO 2.2.1
La Tabla 1.4.1 contiene una lista de las edades de los sujetos que participaron en el estudio para dejar
de fumar discutido en el Ejemplo 1.4.1. Como puede verse, esta tabla desordenada requiere una
búsqueda considerable para que podamos determinar información tan elemental como la edad de los
sujetos más jóvenes y mayores.
Solución: La Tabla 2.2.1 presenta los datos de la Tabla 1.4.1 en forma de matriz ordenada.
Haciendo referencia a la Tabla 2.2.1 podemos determinar rápidamente la edad del
sujeto más joven (30) y la edad del sujeto más viejo (82). También notamos fácilmente
que alrededor de un tercio de los sujetos tienen 50 años de edad o menos.
2.2 LA MATRIZ ORDENADA 21
30 34 35 37 37 38 38 38 38 39 39 40 40 42 42
43 43 43 43 43 43 44 44 44 44 44 44 44 45 45
45 46 46 46 46 46 46 47 47 47 47 47 47 48 48
48 48 48 48 48 49 49 49 49 49 49 49 50 50 50
50 50 50 50 50 51 51 51 51 52 52 52 52 52 52
53 53 53 53 53 53 53 53 53 53 53 53 53 53 53
53 53 54 54 54 54 54 54 54 54 54 54 54 55 55
55 56 56 56 56 56 56 57 57 57 57 57 57 57 58
58 59 59 59 59 59 59 60 60 60 60 61 61 61 61
61 61 61 61 61 61 61 62 62 62 62 62 62 62 63
63 64 64 64 64 64 64 sesenta y cinco sesenta y cinco 66 66 66 66 66 66
67 68 68 68 69 69 69 70 71 71 71 71 71 71 71
72 73 75 76 77 78 78 78 82
&
Análisis informáticoSi los cálculos adicionales y la organización de un conjunto de datos deben realizarse a
mano, el trabajo puede facilitarse trabajando a partir de una matriz ordenada. Si los datos van a ser
analizados por una computadora, puede que no sea deseable preparar una matriz ordenada, a menos que se
necesite para fines de referencia o para algún otro uso. Una computadora no necesita que su usuario
construya primero una matriz ordenada antes de ingresar datos para la construcción de distribuciones de
frecuencia y la realización de otros análisis. Sin embargo, casi todos los paquetes estadísticos de
computadora y los programas de hojas de cálculo contienen una rutina para clasificar los datos en orden
ascendente o descendente. Consulte la Figura 2.2.1, por ejemplo.
Aunque un conjunto de observaciones puede hacerse más comprensible y significativo por medio de
una matriz ordenada, se puede lograr un resumen más útil agrupando los datos. Antes de los días de
las computadoras, uno de los principales objetivos al agrupar grandes conjuntos de datos era facilitar
el cálculo de diversas medidas descriptivas, como porcentajes y promedios. Debido a que las
computadoras pueden realizar estos cálculos en grandes conjuntos de datos sin agrupar primero los
datos, el objetivo principal de agrupar datos ahora es resumir. Hay que tener en cuenta que los datos
contienen información y que la síntesis es una forma de facilitar la determinación de la naturaleza de
esta información. También se debe ser consciente de que reducir una gran cantidad de información
para resumir los datos de manera sucinta conlleva el potencial de perder inadvertidamente cierta
cantidad de especificidad con respecto al conjunto de datos subyacente. Por lo tanto, es importante
agrupar los datos lo suficiente como para que las grandes cantidades de información se reduzcan a
resúmenes comprensibles. Al mismo tiempo, los datos deben resumirse en la medida en que las
complejidades útiles de los datos no sean fácilmente obvias.
Para agrupar un conjunto de observaciones, seleccionamos un conjunto de intervalos contiguos que no se
superponen de modo que cada valor del conjunto de observaciones pueda colocarse en uno, y solo uno, de los
intervalos. Estos intervalos se conocen generalmente comointervalos de clase.
Una de las primeras consideraciones cuando se van a agrupar los datos es cuántos
intervalos incluir. Muy pocos intervalos son indeseables debido a la pérdida de información
resultante. Por otro lado, si se utilizan demasiados intervalos, no se cumplirá el objetivo de
resumen. La mejor guía para esto, así como para otras decisiones a tomar al agrupar datos, es
su conocimiento de los datos. Puede ser que los intervalos de clase hayan sido determinados
por precedentes, como en el caso de las tabulaciones anuales, cuando los intervalos de clase de
años anteriores se mantienen con fines comparativos. Una regla empírica comúnmente
seguida establece que no debe haber menos de cinco intervalos ni más de 15. Si hay menos de
cinco intervalos, los datos se han resumido demasiado y la información que contienen se ha
perdido. Si hay más de 15 intervalos,
Aquellos que necesiten una guía más específica en cuanto a decidir cuántos intervalos de
clase emplear pueden usar una fórmula dada por Sturges (1). Esta fórmula da k¼1þ3:322d
registro10norteÞ,dóndekrepresenta el número de intervalos de clase ynortees el número de
valores en el conjunto de datos bajo consideración. La respuesta obtenida aplicando regla de
Sturgesno debe considerarse como final, sino solo como una guía. El número de intervalos de
clase especificados por la regla debe aumentarse o disminuirse por conveniencia y una
presentación clara.
Supongamos, por ejemplo, que tenemos una muestra de 275 observaciones que
queremos agrupar. El logaritmo en base 10 de 275 es 2.4393. La aplicación de la fórmula de
Sturges da k¼1þ3:322d2:4393Þ '9. En la práctica, otras consideraciones podrían hacer que
usemos ocho o menos o quizás 10 o más intervalos de clase.
Otra cuestión que debe decidirse se refiere a la amplitud de los intervalos de clase. Los
intervalos de clase generalmente deben tener el mismo ancho, aunque a veces esto es imposible de
lograr. Este ancho se puede determinar dividiendo el rango pork,el número de intervalos de clase.
Simbólicamente, el ancho del intervalo de clase viene dado por
R
w¼ (2.3.1)
k
2.3 DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS 23
dóndeR (el rango) es la diferencia entre la observación más pequeña y la más grande en el conjunto
de datos, ykse define como arriba. Como regla general, este procedimiento produce un ancho que es
inconveniente para su uso. Nuevamente, podemos ejercer nuestro buen juicio y seleccionar un ancho
(usualmente cercano al dado por la Ecuación 2.3.1) que sea más conveniente.
Hay otras reglas generales que son útiles para establecer intervalos de clase útiles. Cuando la
naturaleza de los datos los hace apropiados, los anchos de intervalo de clase de 5 unidades, 10
unidades y anchos que son múltiplos de 10 tienden a hacer que el resumen sea más comprensible.
Cuando se emplean estos anchos, generalmente es una buena práctica que el límite inferior de cada
intervalo termine en cero o 5. Por lo general, los intervalos de clase se ordenan de menor a mayor; es
decir, el primer intervalo de clase contiene las medidas más pequeñas y el último intervalo de clase
contiene las medidas más grandes. Cuando este sea el caso, el límite inferior del primer intervalo de
clase debe ser igual o menor que la medida más pequeña del conjunto de datos, y el límite superior
del último intervalo de clase debe ser igual o mayor que la medida más grande.
La mayoría de los paquetes estadísticos permiten a los usuarios cambiar de forma interactiva el número de
intervalos de clase y/o los anchos de clase, de modo que se puedan obtener rápidamente varias visualizaciones de los
datos. Esta característica permite a los usuarios ejercer su juicio para decidir qué pantalla de datos es la más
adecuada para un propósito determinado. Usemos las 189 edades que se muestran en la Tabla 1.4.1 y dispuestas en
la Tabla 2.2.1 para ilustrar la construcción de una distribución de frecuencias.
EJEMPLO 2.3.1
Deseamos saber cuántos intervalos de clase debe haber en la distribución de frecuencia de los datos.
También queremos saber qué tan anchos deben ser los intervalos.
Solución: Para tener una idea del número de intervalos de clase a utilizar, podemos aplicar la regla de
Sturges para obtener
k¼1þ3:322dregistro 189Þ
¼1þ3:322d2:2764618Þ
- 9
Ahora dividamos el rango por 9 para tener una idea sobre el ancho del intervalo
de clase. Tenemos
R 82 - 30 52
¼ ¼ ¼5:778
k 9 9
30–39
40–49
50–59
60–69
24 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
70–79
80–89
Vemos que hay seis de estos intervalos, tres menos que el número sugerido
por la regla de Sturges.
A veces es útil referirse al centro, llamado elpunto medio,de un intervalo
de clase. El punto medio de un intervalo de clase se determina obteniendo la
suma de los límites superior e inferior del intervalo de clase y dividiendo por 2.
Así, por ejemplo, se encuentra que el punto medio del intervalo de clase 30–39 es
d30þ39Þ=2¼34:5. &
Cuando agrupamos datos manualmente, determinar el número de valores que caen en cada
intervalo de clase es simplemente una cuestión de mirar la matriz ordenada y contar el número de
observaciones que caen en los distintos intervalos. Cuando hacemos esto para nuestro ejemplo,
tenemos la Tabla 2.3.1.
Una tabla como la Tabla 2.3.1 se llamadistribución de frecuencias.Esta tabla muestra la forma
en que se distribuyen los valores de la variable entre los intervalos de clase especificados. Al
consultarlo, podemos determinar la frecuencia de ocurrencia de valores dentro de cualquiera de los
intervalos de clase mostrados.
Frecuencias relativasA veces puede ser útil conocer la proporción, en lugar del número, de
valores que caen dentro de un intervalo de clase particular. Obtenemos esta información
dividiendo el número de valores en el intervalo de clase particular por el número total de
valores. Si en nuestro ejemplo queremos saber la proporción de valores entre 50 y 59, ambos
inclusive, dividimos 70 entre 189, obteniendo .3704. Así decimos que 70 de 189, o 70/189, o
.3704, de los valores están entre 50 y 59. Multiplicando .3704 por 100 nos da el porcentaje de
valores entre 50 y 59. Entonces podemos decir que El 37,04 por ciento de los sujetos tiene entre
50 y 59 años. Podemos referirnos a la proporción de valores que caen dentro de un intervalo de
clase como lafrecuencia relativa de ocurrenciade valores en ese intervalo. En la Sección 3.2
veremos que una frecuencia relativa puede interpretarse también como la probabilidad de
ocurrencia dentro del intervalo dado. Esta probabilidad de ocurrencia también se llama
probabilidad experimentalo elprobabilidad empírica.
30–39 11
40–49 46
50–59 70
60–69 45
70–79 dieciséis
80–89 1
Total 189
2.3 DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS 25
Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia
Al determinar la frecuencia de valores que caen dentro de dos o más intervalos de clase,
obtenemos la suma del número de valores que caen dentro de los intervalos de clase de interés. De
manera similar, si queremos conocer la frecuencia relativa de ocurrencia de valores que caen dentro
de dos o más intervalos de clase, sumamos las respectivas frecuencias relativas. Podemos sumar, o
recoger en montón,las frecuencias y frecuencias relativas para facilitar la obtención de información
sobre la frecuencia o frecuencia relativa de valores dentro de dos o más intervalos de clase contiguos.
La Tabla 2.3.2 muestra los datos de la Tabla 2.3.1 junto con losfrecuencias acumuladas,elfrecuencias
relativas,yfrecuencias relativas acumuladas.
Suponga que estamos interesados en la frecuencia relativa de los valores entre 50 y 79.
Usamos la columna de frecuencia relativa acumulada de la tabla 2.3.2 y restamos .3016 de .
9948, obteniendo .6932.
Podemos usar un paquete estadístico para obtener una tabla similar a la que se muestra en la
Tabla 2.3.2. Las tablas obtenidas del software MINITAB y SPSS se muestran en la Figura 2.3.1.
El nivel de precisión observado en los datos notificados que se miden en una escala continua
indica cierto orden de redondeo. El orden de redondeo refleja la preferencia personal del reportero o
las limitaciones del instrumento de medición empleado. Cuando se construye una distribución de
frecuencias a partir de los datos, los límites del intervalo de clase suelen reflejar el grado de precisión
de los datos sin procesar. Esto se ha hecho en nuestro ejemplo ilustrativo.
26 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
Producción:
80-89 1 .5 .5 100.0
n= 189 Total 189 100.0 100.0
Sabemos, sin embargo, que algunos de los valores que caen en el intervalo de segunda clase, por ejemplo,
cuando se miden con precisión, probablemente serían un poco menos de 40 y algunos serían un poco más
de 49. Considerando la continuidad subyacente de nuestra variable, y suponiendo que los datos se
redondearon al número entero más próximo, nos parece conveniente pensar en 39,5 y 49,5 como los
verdaderos límites de este segundo intervalo. Entonces, tomamos los verdaderos límites para cada uno de
los intervalos de clase como se muestra en la Tabla 2.3.3.
Si construimos un gráfico usando estos límites de clase como la base de nuestros rectángulos, no
habrá espacios y tendremos el histograma que se muestra en la figura 2.3.2. Usamos MINITAB para construir
este histograma, como se muestra en la Figura 2.3.3.
Nos referimos al espacio encerrado por los límites del histograma como eláreadel
histograma. A cada observación se le asigna una unidad de esta área. Como tenemos 189
observaciones, el histograma consta de un total de 189 unidades. Cada celda contiene una
cierta proporción del área total, dependiendo de la frecuencia. La segunda celda, por ejemplo,
contiene 46/189 del área. Esta, como hemos aprendido, es la frecuencia relativa de ocurrencia
de valores entre 39.5 y 49.5. De esto vemos que las subáreas del histograma definidas por las
celdas corresponden a las frecuencias de aparición de valores entre los límites de la escala
horizontal de las áreas. La relación entre una subárea particular y el área total del histograma
es igual a la frecuencia relativa de ocurrencia de valores entre los puntos correspondientes en
el eje horizontal.
2.3 DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS 27
Frecuencia
29,5–39,5 11 40
39,5–49,5 46
30
49,5–59,5 70
59,5–69,5 45 20
69,5–79,5 dieciséis
79,5–89,5 1 10
Total 189 0
34,5 44,5 54,5 64,5 74,5 84,5
Edad
FIGURA 2.3.2Histograma de edades de
189 sujetos de la Tabla 2.3.1.
FIGURA 2.3.3Cuadro de diálogo de MINITAB y comando de sesión para construir un histograma a partir de datos
sobre edades en el Ejemplo 1.4.1.
28 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
70 70
60 60
50 50
Frecuencia
Frecuencia
40 40
30 30
20 20
10 10
0 0
24,5 34,5 44,5 54,5 64,5 74,5 84,5 94,5 24,5 34,5 44,5 54,5 64,5 74,5 84,5 94,5
Edad Edad
FIGURA 2.3.4Polígono de frecuencias para las edades de FIGURA 2.3.5Histograma y polígono de frecuencias para las
189 sujetos mostrados en la Tabla 2.2.1. edades de 189 sujetos que se muestran en la Tabla 2.2.1.
Exhibiciones de tallo y hojasOtro dispositivo gráfico que es útil para representar conjuntos
de datos cuantitativos es elexhibición de tallo y hojas.Una pantalla de tallo y hojas se parece
mucho a un histograma y tiene el mismo propósito. Una representación de tallo y hojas
construida correctamente, como un histograma, brinda información sobre el rango del
conjunto de datos, muestra la ubicación de la mayor concentración de mediciones y revela la
presencia o ausencia de simetría. Una ventaja de la visualización de tallo y hojas sobre el
histograma es el hecho de que conserva la información contenida en las mediciones
individuales. Esta información se pierde cuando las medidas se asignan a los intervalos de clase
de un histograma. Como se hará evidente, otra ventaja de las pantallas de tallo y hojas es el
hecho de que pueden construirse durante el proceso de conteo, por lo que se elimina el paso
intermedio de preparar una matriz ordenada.
Para construir una representación de tallo y hojas, dividimos cada medida en dos partes. La primera
parte se llamaprovenir,y la segunda parte se llamahoja.El tallo consta de uno o más de los dígitos iniciales de
la medida, y la hoja está compuesta de uno o más de los dígitos restantes. Todos los números particionados
se muestran juntos en una sola pantalla; los tallos forman una columna ordenada con el tallo más pequeño
en la parte superior y el más grande en la parte inferior. Incluimos en la columna de tallo todos los tallos
dentro del rango de los datos incluso cuando una medición con ese tallo no está en el conjunto de datos. Las
filas de la pantalla contienen las hojas, ordenadas y listadas a la derecha de sus respectivos tallos. Cuando las
hojas constan de más de un dígito, se pueden eliminar todos los dígitos posteriores al primero. Los decimales
cuando están presentes en los datos originales se omiten en la visualización de tallo y hojas. Los tallos están
separados de sus hojas por una línea vertical. Así vemos que una representación de tallo y hojas también es
un arreglo ordenado de los datos.
Las visualizaciones de tallo y hojas son más efectivas con conjuntos de datos relativamente pequeños.
Por regla general, no son adecuados para su uso en informes anuales u otras comunicaciones dirigidas al
público en general. Son principalmente valiosos para ayudar a los investigadores y a los tomadores de
decisiones a comprender la naturaleza de sus datos. Los histogramas son más apropiados para publicaciones
de circulación externa. El siguiente ejemplo ilustra la construcción de una pantalla de tallo y hojas.
2.3 DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS 29
Provenir Hoja
3 04577888899
4 0022333333444444455566666677777788888889999999
5 0000000011112222223333333333333333344444444444555666666777777788999999
6 000011111111111222222233444444556666667888999
7 0111111123567888
8 2
FIGURA 2.3.6Visualización de tallo y hojas de las edades de 189 sujetos que se muestran en la Tabla 2.2.1 (unidad de tallo
¼10, unidad de hoja¼1).
EJEMPLO 2.3.2
Usemos los datos de edad que se muestran en la Tabla 2.2.1 para construir una representación de tallo y hojas.
Solución: Como todas las medidas son números de dos dígitos, tendremos tallos de un
dígito y hojas de un dígito. Por ejemplo, la medida 30 tiene un tallo de 3 y una
hoja de 0. La figura 2.3.6 muestra la visualización de tallo y hojas para los datos.
El paquete de software estadístico MINITAB se puede usar para construir
presentaciones de tallo y hojas. El procedimiento y la salida de MINITAB se muestran
en la Figura 2.3.7. El subcomando de incremento especifica la distancia de un tallo al
siguiente. Los números en la columna de salida más a la izquierda de la Figura 2.3.7
Producción:
11 3 04577888899
57 4 002233333334444444455566666677777788888889999999
(70) 5 000000000000001111122223333333333333333333344444444445556666666121111111111111111111111111111111111111111
62 6
17 7 0111111123567888
1 8 2
FIGURA 2.3.7Representación de tallo y hojas preparada por MINITAB a partir de los datos sobre las edades de los sujetos que se
muestran en la Tabla 2.2.1.
30 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
FIGURA 2.3.8Representación de tallo y hojas preparada por MINITAB a partir de los datos sobre las edades de los sujetos que se
muestran en la Tabla 2.2.1; ancho de intervalo de clase¼5.
Una forma de evitar exceder la capacidad de una línea es tener más líneas. Esto se logra
acortando la distancia entre líneas, es decir, disminuyendo el ancho de los intervalos de clase. Para el
presente ejemplo, podemos usar anchos de intervalo de clase de 5, de modo que la distancia entre las
líneas sea 5. La figura 2.3.8 muestra el resultado cuando se usa MINITAB para producir la
representación de tallo y hojas.
EJERCICIOS
2.3.1En un estudio de la práctica del cuidado oral en el hogar y las razones para buscar atención dental entre personas en
diálisis renal, Atassi (A-1) estudió a 90 sujetos en diálisis renal. El estado de higiene bucal de todos los sujetos se
examinó utilizando un índice de placa con un rango de 0 a 3 (0¼sin depósitos de placa blanda,
EJERCICIOS 31
3¼abundantes depósitos de placa blanda). La siguiente tabla muestra las puntuaciones del índice de placa para los 90
sujetos.
1,17 2,50 2,00 2,33 1,67 1,33
1,17 2,17 2,17 1,33 2,17 2,00
2,17 1,17 2,50 2,00 1,50 1,50
1,00 2,17 2,17 1,67 2,00 2,00
1,33 2,17 2,83 1,50 2,50 2,33 0,33
2,17 1,83 2,00 2,17 2,00
1.00 2,17 2,17 1,33 2,17 2,50
0.83 1,17 2,17 2,50 2,00 2,50
0.50 1,50 2,00 2,00 2,00 2,00
1,17 1,33 1,67 2,17 1,50 2,00
1,67 0,33 1,50 2,17 2,33 2,33
1.17 0.00 1,50 2,33 1,83 2,67
0.83 1,17 1,50 2,17 2,67 1,50
2.00 2,17 1,33 2,00 2,33 2,00
2.17 2.17 2.00 2.17 2.00 2.17
Fuente: Datos proporcionados por cortesía de
Farhad Atassi, DDS, MSc, FICOI.
2.3.2Janardhan et al. (A-2) realizaron un estudio en el que midieron los aneurismas intracraneales (AII) incidentales en 125
pacientes. Los investigadores examinaron las complicaciones posteriores al procedimiento y concluyeron que
Los AII pueden tratarse de manera segura sin causar mortalidad y con una tasa de complicaciones menor que la
reportada anteriormente. Los siguientes son los tamaños (en milímetros) de los 159 AII de la muestra.
2.3.3Hoekema et al. (A-3) estudiaron la morfología craneofacial de pacientes diagnosticados con síndrome de apnea
obstructiva del sueño (SAOS) en sujetos varones sanos. Una de las variables demográficas que recopilaron los
investigadores para todos los sujetos fue el índice de masa corporal (que se calcula dividiendo el peso en kg por el
cuadrado de la altura del paciente en cm). Los siguientes son los valores de IMC de 29 sujetos con OSAS.
11.23 15.82
29.63 27.74
20.42 22.35
10.12 34.78
39.91 35.09
32.66 32.60
38.38 37.03
36.21 27.00
16.39 44.20
27.44 13.09
17.29 33.03
56.20 9.69
28.94 32.45
20.11 37.38
25.35 34.91
21.77 27.99
31.62 22.36
32.63 22.68
30.31 26.52
46.16 46.01
(Continuación)
34 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
56.61 38.04
24.47 30.88
29.39 30.04
40.71 25.91
18.52 18.54
27.80 25.51
19.49
Fuente: Datos proporcionados por
cortesía de David Holben, Ph.D.
(b)Describa estos datos con respecto a la simetría y la asimetría como se explicó en el Ejercicio 2.3.1, parte h.
(C)¿Cuántas de las medidas son mayores que 40?
(d)¿Qué porcentaje de las medidas son menos de 25?
2.3.5La siguiente tabla muestra el número de horas que 45 pacientes hospitalizados durmieron después de la administración de un
determinado anestésico.
7 10 12 4 8 7 3 8 5
12 11 3 8 1 1 13 10 4
4 5 5 8 7 7 3 2 3
8 13 1 7 17 3 4 5 5
3 1 17 10 4 7 7 11 8
(b)Describa estos datos en relación con la simetría y la asimetría, como se explicó en el Ejercicio 2.3.1, parte h.
2.3.6Los siguientes son el número de bebés nacidos durante un año en 60 hospitales comunitarios.
30 55 27 45 56 48 45 49 32 57 47 56 37 55 52 34 54 54 42 32
59 35 46 24 57 32 26 40 28 53 54 29 42 42 54 53 59 39 56 59
59 58 49 53 30 53 21 34 28 50 52 57 43 46 54 31 22 31 24 24
57 29
(b)Describa estos datos en relación con la simetría y la asimetría, como se explicó en el Ejercicio 2.3.1, parte h.
EJERCICIOS 35
2.3.7En un estudio de los niveles de resistencia física de estudiantes universitarios masculinos de primer año, se recopilaron las siguientes
254 281 192 260 212 179 182 210 225 179 181 149
235 239 258 166 180 188 135 233 159 223 186 190
220 204 198 190 151 157 204 238 219 211 245 151
222 187 134 193 264 312 165 194 205 229 191 200
206 193 218 198 198 265 222 264 214 227 190 212
249 175 205 220 201 203 172 234 241 149 164 225
1972 195 195 227 230 168 232 232 252 210 178 159
191 175 236 152 258 214 278 252 173 187 189 237
283 205 184 184 218 213 172 159 217 249 196 223
203 212 169 187 204 180 261 236 155 215 197 210
191 124 199 235 139 231 251 206 172 228 193 130
173 236 215 228 188 195 240 163 117 197 206 198
208 217 205 212 218
116 182 243 217
183 204 186 134
(b)Describa estos datos en relación con la simetría y la asimetría, como se explicó en el Ejercicio 2.3.1, parte h.
2.3.8Las siguientes son las edades de 30 pacientes atendidos en la sala de emergencias de un hospital un viernes por la noche.
Construya una representación de tallo y hojas a partir de estos datos. Describa estos datos en relación con la simetría y la
asimetría, como se explicó en el Ejercicio 2.3.1, parte h.
35 32 21 43 39 60
36 12 54 45 37 53
45 23 64 10 34 22
36 45 55 44 55 46
22 38 35 56 45 57
2.3.9Los siguientes son los cargos de urgencias realizados a una muestra de 25 pacientes en dos hospitales de la ciudad.
Construya una representación de tallo y hojas para cada conjunto de datos. ¿Qué sugiere una comparación de las dos
pantallas con respecto a los dos hospitales? Describa los dos conjuntos de datos con respecto a la simetría y la
asimetría como se explicó en el Ejercicio 2.3.1, parte h.
Hospital A
Hospital B
2.3.10Consulte las edades de los pacientes discutidas en el Ejemplo 1.4.1 y mostradas en la Tabla 1.4.1.
(a)Use anchos de intervalo de clase de 5 y construya:
Una distribución de frecuencia
Una distribución de frecuencias relativas Una
distribución de frecuencias acumuladas
Una distribución de frecuencia relativa acumulada Un
histograma
Un polígono de frecuencia
(b)Describa estos datos con respecto a la simetría y la asimetría como se explicó en el Ejercicio 2.3.1, parte h.
2.3.11Los objetivos de un estudio de Skjelbo et al. (A-5) fueron para examinar (a) la relación entre el metabolismo de la
cloroguanida y la eficacia en la profilaxis de la malaria y (b) el metabolismo de la mefenitoína y su relación
con el metabolismo de la cloroguanida entre los tanzanos. A partir de la información proporcionada por las
muestras de orina de los 216 sujetos, los investigadores calcularon la proporción de orina sin cambios
S-mefenitoína aR-mefenitoína (S/Rrelación). Los resultados fueron los siguientes:
(a)A partir de estos datos, construya las siguientes distribuciones: frecuencia, frecuencia relativa, frecuencia
acumulada y frecuencia relativa acumulada; y las siguientes gráficas: histograma, polígono de frecuencias y
diagrama de tallo y hojas.
(b)Describa estos datos con respecto a la simetría y la asimetría como se explicó en el Ejercicio 2.3.1, parte h.
(C)Los investigadores definieron como metabolizadores lentos de mefenitoína a cualquier sujeto con unaS/R
proporción de mefenitoína superior a 0,9. ¿Cuántos y qué porcentaje de los sujetos eran metabolizadores
lentos?
(d)¿Cuántos y qué porcentaje de los sujetos tenían proporciones inferiores a 0,7? ¿Entre .3 y .6999
inclusive? ¿Mayor que .4999?
2.3.12Schmidt et al. (A-6) realizó un estudio para investigar si la autotransfusión de células mediastínicas
sangre podría reducir el número de pacientes que necesitan transfusión de sangre homóloga y reducir la
cantidad de sangre homóloga transfundida si se usaran criterios de transfusión fijos. La siguiente tabla
muestra las alturas en centímetros de los 109 sujetos de los cuales 97 eran hombres.
(a)Para estos datos construya las siguientes distribuciones: frecuencia, frecuencia relativa, frecuencia
acumulada y frecuencia relativa acumulada; y las siguientes gráficas: histograma, polígono de frecuencias y
diagrama de tallo y hojas.
(b)Describa estos datos con respecto a la simetría y la asimetría como se explicó en el Ejercicio 2.3.1, parte h.
(C)¿Cómo se explica la forma de la distribución de estos datos?
(d)¿Qué altura tenía el 6,42 por ciento más alto de los sujetos?
(mi)¿Qué altura tenía el 10,09 por ciento más bajo de los sujetos?
38 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
Aunque las distribuciones de frecuencia tienen propósitos útiles, hay muchas situaciones que
requieren otros tipos de resumen de datos. Lo que necesitamos en muchos casos es la capacidad de
resumir los datos por medio de un solo número llamadomedida descriptiva.Las medidas descriptivas
se pueden calcular a partir de los datos de una muestra o de los datos de una población. Para
distinguirlos tenemos las siguientes definiciones:
DEFINICIONES
1. Una medida descriptiva calculada a partir de los datos de una muestra se llama
estadística.
2. Una medida descriptiva calculada a partir de los datos de una población se
llamaparámetro.
EJEMPLO 2.4.1
Deseamos obtener la edad media de la población de 189 sujetos representados en la Tabla 1.4.1.
48þ35þ46þ þ73þ66
edad Media¼ ¼55:032
189 &
Los tres puntos en el numerador representan los valores que no mostramos para guardar
espacio.
2.4 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE TENDENCIA CENTRAL 39
X1¼48;X2¼35; . . . ;X189¼66
En general, un valor típico de una variable aleatoria será designado porXiy el valor final, en una población
finita de valores, porXnorte, dóndenortees el número de valores en la población. Finalmente, usaremos la letra
griegametropara representar la media de la población. Ahora podemos escribir la fórmula general para una
media de población finita de la siguiente manera:
PAG
norte
Xi
metro¼i¼1 (2.4.1)
norte
PAGnorte
El símbolo i¼1nos indica que sumemos todos los valores de la variable desde el primero hasta el último. Este
símboloS,llamó alsigno de suma,se usará extensamente en este libro. Cuando por el
contexto es obvio qué valores deben agregarse, los símbolos arriba y abajoSserá omitido.
Xi
- X¼i¼1 (2.4.2)
norte
EJEMPLO 2.4.2
En el Capítulo 1 seleccionamos una muestra aleatoria simple de 10 sujetos de la población de sujetos
representada en la Tabla 1.4.1. Calculemos ahora la edad media de los 10 sujetos de nuestra muestra.
Solución: Recordamos (ver Tabla 1.4.2) que las edades de los 10 sujetos de nuestra muestra eran
X1¼43;X2¼66;X3¼61;X4¼64;X5¼sesenta y cinco;X6¼38;X7¼59;X8¼57; X9¼57;X10¼50. La
sustitución de nuestros datos de muestra en la Ecuación 2.4.2 da
PAGnorte
Xi
i¼1 43þ66þ þ50
- X¼ ¼ ¼56
norte 10 &
40 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
1.Unicidad. Para un conjunto dado de datos existe una y sólo una media aritmética.
2.Sencillez. La media aritmética es fácil de entender y fácil de calcular.
3.Dado que todos y cada uno de los valores de un conjunto de datos entran en el cálculo de la media, se
ven afectados por cada valor. Los valores extremos, por lo tanto, tienen influencia sobre la media y, en
algunos casos, pueden distorsionarla tanto que se vuelve indeseable como medida de tendencia
central.
Como ejemplo de cómo los valores extremos pueden afectar la media, considere la siguiente
situación. Suponga que se encuesta a los cinco médicos que ejercen en un área para determinar sus
cargos por un determinado procedimiento. Suponga que informan estos cargos: $75, $75, $80, $80 y
$280. Se encuentra que el cargo medio de los cinco médicos es de $118, un valor que no es muy
representativo del conjunto de datos en su conjunto. El único valor atípico tuvo el efecto de inflar la
media.
MedianaLa mediana de un conjunto finito de valores es aquel valor que divide el conjunto en
dos partes iguales de manera que el número de valores iguales o mayores que la mediana es
igual al número de valores iguales o menores que la mediana. Si el número de valores es impar,
la mediana será el valor medio cuando todos los valores se hayan ordenado en orden de
magnitud. Cuando el número de valores es par, no hay un solo valor medio. En cambio, hay dos
valores medios. En este caso, la mediana se toma como la media de estos dos valores medios,
cuando todos los valores se han ordenado en el orden de sus magnitudes. En otras palabras, la
observación mediana de un conjunto de datos es ladnorteþ1Þ=2º cuando se haya ordenado la
observación. Si, por ejemplo, tenemos 11 observaciones, la mediana es lad11þ1Þ=2¼6ª
observación ordenada. Si tenemos 12 observaciones la mediana es el d12þ1Þ=2¼6:5
observación ordenada y es un valor a medio camino entre las observaciones ordenadas 6 y 7.
EJEMPLO 2.4.3
Ilustremos encontrando la mediana de los datos en la Tabla 2.2.1.
Solución: Los valores ya están ordenados, por lo que solo necesitamos encontrar los dos
valores medios. El valor medio es eldnorteþ1Þ=2¼ ð189þ1Þ=2¼190=2¼95 uno.
Contando desde el valor más pequeño hasta el 95, vemos que es 54. Así, la
mediana de edad de los 189 sujetos es 54 años. &
EJEMPLO 2.4.4
Deseamos encontrar la mediana de edad de los sujetos representados en la muestra descrita en el
ejemplo 2.4.2.
Solución: Ordenar las 10 edades en orden de magnitud de menor a mayor da 38, 43, 50,
57, 57, 59, 61, 64, 65, 66. Dado que tenemos un número par de edades, hay
2.4 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE TENDENCIA CENTRAL 41
no hay valor medio. Los dos valores medios, sin embargo, son 57 y 59. La
mediana, entonces, esd57þ59Þ=2¼58. &
El modoLa moda de un conjunto de valores es aquel valor que ocurre con mayor frecuencia. Si todos
los valores son diferentes no hay moda; por otro lado, un conjunto de valores puede tener más de
una moda.
EJEMPLO 2.4.5
Encuentre la edad modal de los sujetos cuyas edades se dan en la Tabla 2.2.1.
Solución: Un recuento de las edades en la Tabla 2.2.1 revela que la edad 53 ocurre con mayor
frecuencia (17 veces). La moda para esta población de edades es 53. &
DEFINICIÓN
Si la gráfica (histograma o polígono de frecuencias) de una distribución es asimétrica, se
dice que la distribución essesgadoSi una distribución no es simétrica porque su gráfica
se extiende más a la derecha que a la izquierda, es decir, si tiene una cola larga a la
derecha, decimos que la distribución essesgado a la derechao essesgada positivamente.
Si una distribución no es simétrica porque su gráfica se extiende más a la izquierda que
a la derecha, es decir, si tiene una cola larga a la izquierda, decimos que la distribución
es sesgado a la izquierdao essesgada negativamente.
Una distribución estará sesgada a la derecha, o positivamente sesgada, si su media es mayor que su
moda. Una distribución tendrá un sesgo hacia la izquierda, o un sesgo negativo, si su media es menor que su
moda. La asimetría se puede expresar de la siguiente manera:
norte norte
pffiffiffiPAG pffiffiffiPAG
norte dXi- -XÞ3 norte dXi- -XÞ3
i¼1 i¼1
Oblicuidad¼ - 3=2
¼ pffiffiffiffiffiffiffiffiffiffiffiffi (2.4.3)
PAG
norte
dn-1Þ n-1s3
dXi- -XÞ2
i¼1
En la Ecuación 2.4.3,ses la desviación estándar de una muestra como se define en la Ecuación 2.5.4. La
mayoría de los paquetes estadísticos de computadora incluyen esta estadística como parte de una impresión
estándar. Un valor de asimetría > 0 indica asimetría positiva y un valor de asimetría < 0 indica asimetría
negativa. En la Figura 2.4.1 se muestra una ilustración de la asimetría.
EJEMPLO 2.4.6
Considere las tres distribuciones que se muestran en la figura 2.4.1. Dado que los histogramas
representan conteos de frecuencia, los datos pueden recrearse fácilmente e ingresarse en un paquete
estadístico. Por ejemplo, la observación de la distribución "Sin sesgo" arrojaría los siguientes datos:
las distribuciones sesgadas de manera similar. Usando el software SPSS, se obtuvieron las
siguientes estadísticas descriptivas para estas tres distribuciones
R¼XL- XS (2.5.1)
Población A
Población B
metro
FIGURA 2.5.1Dos distribuciones de frecuencia con medias iguales pero diferentes cantidades de
dispersión.
44 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
EJEMPLO 2.5.1
Deseamos calcular el rango de edades de los sujetos de la muestra discutidos en la Tabla 2.2.1.
Solución: Dado que el sujeto más joven de la muestra tiene 30 años y el mayor 82,
calculamos que el rango es
La utilidad de la gama es limitada. El hecho de que tenga en cuenta solo dos valores hace que sea una
mala medida de dispersión. La principal ventaja de usar el rango es la simplicidad de su cálculo. Dado
que el rango, expresado como una sola medida, brinda información mínima sobre un conjunto de
datos y, por lo tanto, tiene un uso limitado, a menudo es preferible expresar el rango como un par de
números.½XS;XL, en el cualXSyXLson los valores más pequeño y más grande en el conjunto de datos,
respectivamente. Para los datos del ejemplo 2.5.1, podemos expresar el rango como el par de
números [30, 82]. Aunque esta no es la expresión tradicional para el rango, es intuitivo imaginar que
el conocimiento de los valores mínimo y máximo en este conjunto de datos transmitiría más
información que saber solo que el rango es igual a 52. Un número infinito de distribuciones, cada una
con valores mínimos y máximos bastante diferentes, puede tener un rango de 52.
PAG
norte
dXi- -XÞ2
s2¼i¼1
(2.5.2)
n-1
Por lo tanto, es fácil ver que la varianza se puede describir como la desviación cuadrada promedio de
los valores individuales de la media de ese conjunto. Puede parecer poco intuitivo en esta etapa que
las diferencias en el numerador se eleven al cuadrado. Sin embargo, considere una distribución
simétrica. Es fácil imaginar que si calculamos la diferencia de cada punto de datos en la distribución a
partir del valor medio, la mitad de las diferencias serían positivas y la mitad negativas, lo que daría
como resultado una suma que sería cero. Una varianza de cero sería una medida no informativa para
cualquier distribución de números, excepto una en la que todos los valores son iguales. Por lo tanto,
el cuadrado de cada diferencia se usa para asegurar un numerador positivo y, por lo tanto, una
medida de dispersión mucho más valiosa.
EJEMPLO 2.5.2
Ilustremos calculando la varianza de las edades de los sujetos discutidos en el
Ejemplo 2.4.2.
2.5 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN 45
Grados de libertadLa razón de dividir porn-1 en lugar denorte,como podríamos haber esperado, es
la consideración teórica referida comogrados de libertad.Al calcular la varianza, decimos que tenemos
n-1grados de libertad.Razonamos de la siguiente manera. La suma de las desviaciones de los valores
de su media es igual a cero, como puede verse. Si conocemos los valores den-1 de las desviaciones de
la media, conocemos el norteth uno, ya que se determina automáticamente debido a la necesidad de
todosnortevalores para sumar a cero. Desde un punto de vista práctico, dividir las diferencias al
cuadrado porn-1 en lugar de nortees necesario para utilizar la varianza muestral en los
procedimientos de inferencia que se analizan más adelante. El concepto de grados de libertad será
revisado en un capítulo posterior. Los estudiantes interesados en profundizar en el tema en este
momento deben consultar el artículo de Walker (2).
Cuando calculamos la varianza de una población finita denortevalores, se siguen los
procedimientos descritos anteriormente excepto que restamosmetrode cadaXy dividir pornorteen vez
denorte-1. Si dejamoss2representan la varianza de la población finita, la fórmula es la siguiente:
PAG
norte
dXi-metroÞ2
s2¼i¼1
(2.5.3)
norte
Desviación EstándarLa varianza representa unidades al cuadrado y, por tanto, no es una medida
apropiada de dispersión cuando queremos expresar este concepto en términos de las unidades
originales. Para obtener una medida de dispersión en unidades originales, simplemente tomamos la
raíz cuadrada de la varianza. El resultado se llamaDesviación Estándar.En general, la desviación
estándar de una muestra viene dada por
vffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
arriba
norte
tu dxi - -xÞ2
pffiffiffiffi t i¼1
s¼s2¼ (2.5.4)
n-1
s
CV:¼ ð100Þ% (2.5.5)
-X
Vemos que, dado que la media y las desviaciones estándar se expresan en la misma
unidad de medida, la unidad de medida se cancela al calcular el coeficiente de variación. Lo que
tenemos, entonces, es una medida que es independiente de la unidad de medida.
EJEMPLO 2.5.3
Supongamos que dos muestras de machos humanos arrojan los siguientes resultados:
Muestra 1 Muestra 2
Deseamos saber cuál es más variable, los pesos de los de 25 años o los de los de
11 años.
Solución: Una comparación de las desviaciones estándar podría llevar a la conclusión de que las dos
muestras poseen la misma variabilidad. Sin embargo, si calculamos los coeficientes de
variación, tenemos para los jóvenes de 25 años
10
CV:¼ d100¼6:9%
145
10
CV:¼ d100¼12:5%
80
El coeficiente de variación también es útil para comparar los resultados obtenidos por
diferentes personas que realizan investigaciones que involucran la misma variable. Dado que el
coeficiente de variación es independiente de la escala de medición, es una estadística útil para
comparar la variabilidad de dos o más variables medidas en diferentes escalas. Podríamos, por
ejemplo, usar el coeficiente de variación para comparar la variabilidad en los pesos de una
muestra de sujetos cuyos pesos se expresan en libras con la variabilidad en los pesos de otra
muestra de sujetos cuyos pesos se expresan en kilogramos.
2.5 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN 47
Percentiles y cuartilesLa media y la mediana son casos especiales de una familia de parámetros
conocidos comoparámetros de ubicación.Estas medidas descriptivas se llaman parámetros de
ubicación porque se pueden usar para designar ciertas posiciones en el eje horizontal cuando se
grafica la distribución de una variable. En ese sentido, los llamados parámetros de ubicación “ubican”
la distribución en el eje horizontal. Por ejemplo, una distribución con una mediana de 100 se ubica a la
derecha de una distribución con una mediana de 50 cuando se representan gráficamente las dos
distribuciones. Otros parámetros de ubicación incluyen percentiles y cuartiles. Podemos definir un
percentil de la siguiente manera:
DEFINICIÓN
Dado un conjunto denorteobservacionesX1;X2; . . .Xnorte, elpagpercentilPAGes el valor
deXtal quepagpor ciento o menos de las observaciones son menores quePAG yd100 -
pagÞpor ciento o menos de las observaciones son mayores quePAG.
El procedimiento MEDIOS
Variable de análisis: Edad
norte Significar Desv estándar Mínimo Máximo
10 56.0000000 9.4868330 38.0000000 66.0000000
coeficiente de
Error estándar Suma Diferencia Variación
3.0000000 560.0000000 90.0000000 16.9407732
9
q1¼
norteþ1
>
4
la observación ordenada >
>
>
=
2dnorteþ1Þ norteþ1
q2¼ ¼ la observación ordenada
>
(2.5.6)
4 2 >
>
>
3dnorteþ1Þ ;
q3¼ la observación ordenada
4
Cabe señalar que las ecuaciones que se muestran en 2.5.6 determinan las posiciones de los cuartiles
en un conjunto de datos, no los valores de los cuartiles. También se debe tener en cuenta que,
aunque existe una forma universal de calcular la mediana (q2), hay una variedad de formas de calcular
q1, y q2valores. Por ejemplo, SAS proporciona un total de cinco formas diferentes de calcular los
valores de los cuartiles, y otros programas implementan incluso métodos diferentes. Para una
discusión de los diversos métodos para calcular cuartiles, los lectores interesados pueden consultar
el artículo de Hyndman y Fan (3). Para ilustrar, observe que la impresión en MINITAB en la Figura 2.5.2
muestraq1¼48.25 yq3¼64.25, mientras que el programaRda los valoresq1¼52.75 y q3¼63.25.
DEFINICIÓN
El rango intercuartílico (RIC) es la diferencia entre el tercer y el primer
cuartil: es decir,
IQR¼q3-q1 (2.5.7)
Un IQR grande indica una gran cantidad de variabilidad entre el 50 por ciento medio de las
observaciones relevantes, y un IQR pequeño indica una pequeña cantidad de variabilidad entre
las observaciones relevantes. Dado que tales declaraciones son bastante vagas, es más
informativo comparar el rango intercuartílico con el rango de todo el conjunto de datos. Se
puede hacer una comparación formando la relación entre el IQR y el rango (R)y multiplicando
por 100. Es decir, 100 (IQR/R)nos dice qué porcentaje es el IQR del rango total.
curtosisAsí como podemos describir una distribución en términos de asimetría, podemos describir
una distribución en términos de curtosis.
2.5 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN 49
DEFINICIÓN
curtosises una medida del grado en que una distribución tiene un "pico" o es plana en
comparación con una distribución normal cuyo gráfico se caracteriza por una
apariencia en forma de campana.
Una distribución, en comparación con una distribución normal, puede poseer una proporción
excesiva de observaciones en sus colas, por lo que su gráfica presenta una apariencia achatada. Se
dice que tal distribución esplaticúrtico.Por el contrario, una distribución, en comparación con una
distribución normal, puede tener una menor proporción de observaciones en sus colas, de modo que
su gráfico muestre una apariencia más puntiaguda. Se dice que tal distribución esleptocúrtico.Se dice
que una distribución normal o en forma de campana esmesocúrtico.
La curtosis se puede expresar como
PAG norte
PAG norte
El cálculo manual usando la Ecuación 2.5.8 generalmente no es necesario, ya que la mayoría de los
paquetes estadísticos calculan y reportan información sobre la curtosis como parte de las estadísticas
descriptivas para un conjunto de datos. Tenga en cuenta que cada una de las dos partes de la
Ecuación 2.5.8 se ha reducido en 3. Una distribución perfectamente mesocúrtica tiene una medida de
curtosis de 3 según la ecuación. La mayoría de los algoritmos informáticos reducen la medida en 3,
como se hace en la Ecuación 2.5.8, de modo que la medida de curtosis de una distribución
mesocúrtica será igual a 0. Entonces, una distribución leptocúrtica tendrá una medida de curtosis > 0,
y una distribución platicúrtica distribución tendrá una medida de curtosis < 0. Tenga en cuenta que no
todos los paquetes de computadora hacen este ajuste. En tales casos, las comparaciones con una
distribución mesocúrtica se realizan contra 3 en lugar de contra 0.
EJEMPLO 2.5.4
Considere las tres distribuciones que se muestran en la Figura 2.5.4. Dado que los histogramas
representan conteos de frecuencia, los datos pueden recrearse fácilmente e ingresarse en un paquete
estadístico. Por ejemplo, la observación de la distribución "mesokúrtica" arrojaría los siguientes datos:
1, 2, 2, 3, 3, 3, 3, 3, . . . , 9, 9, 9, 9, 9, 10, 10, 11. Los valores se pueden obtener de las otras
distribuciones de manera similar. Usando el software SPSS, se obtuvieron las siguientes estadísticas
descriptivas para estas tres distribuciones:
Diagramas de caja y bigotesUn dispositivo visual útil para comunicar la información contenida en
un conjunto de datos es eldiagrama de caja y bigotes.La construcción de un diagrama de caja y
bigotes (a veces llamado, simplemente,diagrama de caja)hace uso de los cuartiles de un conjunto de
datos y puede lograrse siguiendo estos cinco pasos:
5.Dibuja otra línea horizontal, o bigote, desde el extremo derecho del cuadro hasta un punto que se alinee
con la medida más grande del conjunto de datos.
EJEMPLO 2.5.5
Evans et al. (A-7) examinó el efecto de la velocidad sobre las fuerzas de reacción del suelo (GRF)
en perros con cojera por un ligamento cruzado craneal desgarrado. Los perros fueron
paseados y trotados sobre una plataforma de fuerza, y se registró el GRF durante una
determinada fase de su actuación. La Tabla 2.5.1 contiene 20 medidas de fuerza donde cada
valor mostrado es la media de cinco medidas de fuerza por perro al trote.
14.6 24.3 24,9 27,0 27.2 27.4 28.2 28.8 29,9 30.7
31.5 31.6 32.3 32.8 33.3 33.6 34.3 36,9 38.3 44.0
Fuente: Datos proporcionados por cortesía de Richard Evans, Ph.D.
2.5 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN 51
14 dieciséis 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46
Mediciones de GRF
FIGURA 2.5.5Diagrama de caja y bigotes para el ejemplo 2.5.5.
Solución: Las medidas más pequeña y más grande son 14,6 y 44,
respectivamente. El primer cuartil es elq1¼ ð20þ1Þ=4¼Medida 5:25,
que es 27:2þ ð:25Þð27:4 - 27:2¼27:25. La mediana es laq2þ ð20þ1Þ=
2¼ 10:5ª medida o 30:7þ ð:5Þð31:5 - 30:7¼31:1; y el tercer cuartil es
elq3þ3d20þ1Þ=4¼Medida 15:75, que es igual a 33:3þ ð:75Þð33:6 -
33:3¼33:525. El rango intercuartílico es IQR¼33:525 - 27:25¼6:275. El
rango es 29.4 y el IQR es 100d6:275=29:4¼21 por ciento del rango. El
diagrama de caja y bigotes resultante se muestra en la Figura 2.5.5.
&
El examen de la figura 2.5.5 revela que el 50 por ciento de las medidas están entre 27 y
33, los valores aproximados del primer y tercer cuartil, respectivamente. La barra vertical
dentro de la caja muestra que la mediana es aproximadamente 31.
Muchos paquetes de software estadístico tienen la capacidad de construir diagramas de caja y
bigotes. La Figura 2.5.6 muestra una construida por MINITAB y otra construida por NCSS a partir de los datos
de la Tabla 2.5.1. El procedimiento para producir la gráfica MINTAB se muestra en la Figura 2.5.7. Los
asteriscos en la Figura 2.5.6 nos alertan sobre el hecho de que el conjunto de datos contiene un valor
inusualmente grande y otro inusualmente pequeño, llamadovalores atípicosLos valores atípicos son los
perros que generaron fuerzas de 14,6 y 44. La figura 2.5.6 ilustra el hecho de que los diagramas de caja y
bigotes pueden mostrarse tanto vertical como horizontalmente.
Un valor atípico, o una observación típica, se puede definir de la siguiente manera.
45 45
*
40
35 35
30
Fuerza
25 25
20
15
* 15
FIGURA 2.5.6Diagrama de caja y bigotes construido por MINITAB (izquierda) y por R (derecha) a partir de los datos de
la Tabla 2.5.1.
52 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
DEFINICIÓN
Unparte aisladaes una observación cuyo valor,X,excede el valor del tercer
cuartil en una magnitud superior a 1,5 (IQR) o es inferior al valor del
primer cuartil en una magnitud superior a 1,5 (IQR). Es decir, una
observación dex > q3þ1:5dIQRÞo una observación de x < Q1- 1:5dIQRÞse
llama un valor atípico.
Para los datos de la Tabla 2.5.1 podemos usar los valores previamente calculados deq1;q3
, y IQR para determinar cuán grande o pequeño tendría que ser un valor para ser considerado
un valor atípico. Los cálculos son los siguientes:
Entonces, para los datos de la Tabla 2.5.1, un valor observado inferior a 17,8375 o superior a
42,9375 se consideraría un valor atípico.
el sas®La sentencia PROC UNIVARIATE se puede utilizar para obtener un diagrama de caja y
bigotes. La declaración también produce otras medidas y presentaciones descriptivas, incluidos
diagramas de tallo y hojas, medias, varianzas y cuartiles.
Análisis exploratorio de datosLos diagramas de caja y bigotes y los diagramas de tallo y hojas son
ejemplos de lo que se conoce comoanálisis exploratorio de datostecnicas Estas técnicas, que se
hicieron populares como resultado del trabajo de Tukey (4), permiten al investigador examinar datos
de manera que revelan tendencias y relaciones, identifican características únicas de conjuntos de
datos y facilitan su descripción y resumen.
EJERCICIOS
Para cada uno de los conjuntos de datos en los siguientes ejercicios, calcule (a) la media, (b) la mediana, (c) la
moda, (d) el rango, (e) la varianza, (f) la desviación estándar, (g) ) el coeficiente de variación, y (h) el rango
intercuartílico. Trata cada conjunto de datos como una muestra. Para aquellos ejercicios para los que crea
que sería apropiado, construya un diagrama de caja y bigotes y analice la utilidad para comprender la
naturaleza de los datos que proporciona este dispositivo. Para cada ejercicio, seleccione la medida de
tendencia central que considere más apropiada para describir los datos. Da razones para justificar tu
elección.
EJERCICIOS 53
2.5.1Porcellini et al. (A-8) estudiaron a 13 pacientes con VIH que fueron tratados con terapia antirretroviral de gran
actividad (HAART) durante al menos 6 meses. La célula T CD4 cuenta 106=Lal inicio del estudio para los 13
sujetos se enumeran a continuación.
2.5.2Shair y Jasper (A-9) investigaron si la disminución del retorno venoso en ratas jóvenes afectaría las
vocalizaciones ultrasónicas (USV). Su investigación no mostró cambios significativos en el número de
vocalizaciones ultrasónicas cuando se extrajo sangre de la vena cava superior o de la arteria carótida.
Otra variable importante medida fue la frecuencia cardíaca (bmp) durante la extracción de sangre.
La siguiente tabla presenta la frecuencia cardíaca de siete crías de rata del experimento que involucra la arteria
carótida.
2.5.3Butz et al. (A-10) evaluaron la duración del beneficio derivado del uso de ventilación con presión positiva no invasiva en
pacientes con esclerosis lateral amiotrófica sobre los síntomas, la calidad de vida y la supervivencia. Una de las
variables de interés es la presión parcial de dióxido de carbono arterial (PaCO2). Los valores a continuación (mm Hg)
reflejan el resultado de las pruebas de referencia en 30 sujetos según lo establecido por los análisis de gases en
sangre arterial.
40,0 47,0 34,0 42,0 54,0 48,0 53,6 56,9 58,0 45,0
54,5 54,0 43,0 44,3 53,9 41,8 33,0 43,1 52,4 37,9
34,5 40,1 33,0 59,9 62,6 54,1 45,7 40,6 56,6 59,0
Fuente: M. Butz, KH Wollinsky, U. Widemuth-Catrinescu, A. Sperfeld,
S. Winter, HH Mehrkens, AC Ludolph y H. Schreiber, "Efectos longitudinales de la
ventilación con presión positiva no invasiva en pacientes con esclerosis lateral
amiotrófica".Diario Americano de Rehabilitación Médica, 82 (2003), 597–604.
2.5.4Según Almidón et al. (A-11), los injertos de tendones isquiotibiales han sido el “eslabón débil” en la
reconstrucción del ligamento cruzado anterior. En un estudio de laboratorio controlado, compararon dos
técnicas de reconstrucción: un tornillo de interferencia o un manguito central y un tornillo en el lado tibial.
Para ocho rodillas cadavéricas, las siguientes medidas representan la fuerza requerida (en newtons) a la que
se produjo el fallo inicial de las hebras del injerto para la técnica de tornillo y manguito central.
2.5.5Cardosi et al. (A-12) realizó una revisión retrospectiva de 4 años de 102 mujeres sometidas a histerectomía
radical por cáncer cervical o endometrial. Se observó infección del tracto urinario asociada al catéter en 12 de
los sujetos. A continuación se muestra el número de días postoperatorios hasta el diagnóstico de la infección
para cada sujeto que experimentó una infección.
16104915 6 15
8191122 13 17
Fuente: Richard J. Cardosi, Rosemary Cardosi, Edward
C. Grendys Jr., James V. Fiorica y Mitchel S. Hoffman,
“Morbilidad infecciosa del tracto urinario con
Cateterismo vesical después de histerectomía radical”,Revista
americana de obstetricia y ginecología,
189 (2003), 380–384.
2.5.6El propósito de un estudio de Nozawa et al. (A-13) fue evaluar el resultado de la reparación quirúrgica del defecto de la pars
interarticularis mediante fijación segmentaria con alambre en adultos jóvenes con espondilólisis lumbar. Los autores
encontraron que históricamente la fijación segmentaria con alambre ha tenido éxito en el tratamiento de espondilólisis de
personas que no son deportistas, pero no existía información sobre los resultados de este tipo de cirugía en deportistas. En un
estudio retrospectivo, los autores encontraron 20 sujetos que se sometieron a la cirugía entre 1993 y 2000. Para estos sujetos,
los datos a continuación representan la duración en meses de la atención de seguimiento después de la operación.
103 68 62 60 60 54 49 44 42 41
38 36 34 30 19 19 19 19 17 dieciséis
37 48 53 46 42 49 44
38 32 32 51 51 48 41
Fuente: Gea A. Huizinga, Winette TA van der Graaf, Annemike Visser, Jos S.
Dijkstra y Josette EHM Hoekstra-Weebers, "Consecuencias psicosociales para
los hijos de un padre con cáncer"Enfermería oncológica, 26 (2003), 195–202.
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 2 55
2.6 RESUMEN
Fórmula
Número Nombre Fórmula
Xi
metro¼i¼1
norte
PAG
norte 2 n-1Þn-1s3
dXi- -XÞ2
i¼1
Xi
- X¼i¼1
norte
dXi- -XÞ2
s2¼i¼1
n-1
dXi-metroÞ2
s2¼i¼1
norte
(Continuación)
56 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
tudXi- -XÞ2
s2¼ ti¼1
pffiffiffiffi
s¼
n-1
tamaño de la muestra
dn-1¼grados de libertad q1
¼primer cuartil
q2¼segundo cuartil¼mediana
q3¼tercer cuartil R¼rango
s¼Desviación Estándar s2
¼varianza muestral
s2¼varianza de la población Xi¼i
- X¼muestra promedio
w¼ancho de clase
PREGUNTAS DE REPASO Y EJERCICIOS 57
1.Definir:
(a)Exhibición de tallo y hojas (b)Diagrama de caja y bigotes
(C)percentil (d)Cuartilla
(mi)Parámetro de ubicación (F)Análisis exploratorio de datos
(gramo)matriz ordenada (h)Distribución de frecuencias
(i)Distribución de frecuencias relativas (j)Estadística
(k)Parámetro (l)Polígono de frecuencia
(metro)Límites de clase verdaderos (norte)Histograma
9.Recopile un conjunto de datos reales o realistas de su campo de estudio y construya una distribución de frecuencias, una
distribución de frecuencias relativas, un histograma y un polígono de frecuencias.
10Calcule la media, la mediana, la moda, la varianza y la desviación estándar de los datos del ejercicio 9.
11Encuentre un artículo en una revista de su campo de estudio en el que se haya calculado alguna medida de
tendencia central y dispersión.
12El propósito de un estudio de Tam et al. (A-15) fue investigar el manejo de la silla de ruedas en personas con lesión de la médula
espinal (LME) de nivel inferior y controles sanos. Los sujetos utilizaron una silla de ruedas modificada para incorporar una
superficie de asiento rígida para facilitar las medidas experimentales especificadas. La medición de la presión de la interfaz se
registró mediante el uso de una alfombra sensible a la presión de alta resolución con una resolución espacial de 4 sensores por
centímetro cuadrado pegada en el soporte rígido del asiento. Durante las condiciones estáticas de sedestación, se registraron
presiones promedio debajo de las tuberosidades isquiáticas. Los datos para las mediciones de la tuberosidad isquiática
izquierda (en mm Hg) para los grupos SCI y control se muestran a continuación.
Control 131 115 124 131 122 117 88 114 150 169
LME 60 150 130 180 163 130 121 119 130 148
Fuente: Eric W. Tam, Arthur F. Mak, Wai Nga Lam, John H. Evans y York Y. Chow,
“Movimiento pélvico y distribución de la presión de interfaz durante la propulsión manual
en silla de ruedas”Archivos de Medicina Física y Rehabilitación, 84 (2003), 1466–1472.
13Johnson et al. (A-16) realizó una revisión retrospectiva de 50 fetos que se sometieron a cierre de mielomeningocele fetal
abierto. Los datos a continuación muestran la edad gestacional en semanas de los 50 fetos que se sometieron al
procedimiento.
25 25 26 27 29 29 29 30 30 31
32 32 32 33 33 33 33 34 34 34
35 35 35 35 35 35 35 35 35 36
36 36 36 36 36 36 36 36 36 36
36 36 36 36 36 36 36 36 37 37
Fuente: Mark P. Johnson, Leslie N. Sutton, Natalie Rintoul, Timothy M. Crombleholme,
Alan W. Flake, Lori J. Howell, Holly L. Hedrick, R. Douglas Wilson y N. Scott Adzick,
“Reparación del mielomeningocele fetal : Resultados clínicos a corto plazo,” Revista
americana de obstetricia y ginecología, 189 (2003), 482–487.
(b)Con base en el diagrama de tallo y hojas, ¿qué palabra usarías para describir la naturaleza de los datos?
(C)¿Por qué crees que el diagrama de tallo y hojas se ve así?
(d)Calcule la media, la mediana, la varianza y la desviación estándar.
14La siguiente tabla muestra la distribución por edades de la cantidad de muertes en el estado de Nueva York debido a
accidentes de residentes de 25 años o más.
Número de muertes
Años de edad) Debido a Accidentes
25–34 393
35–44 514
45–54 460
55–64 341
65–74 365
75–84 616
85–94 618
Fuente: Departamento de Salud del Estado de Nueva York,
Estadísticas Vitales del Estado de Nueva York, 2000, Tabla 32:
Información resumida de defunciones por edad.
Puede incluir muertes por accidente de adultos mayores de 94
años.
Para estos datos, construya una distribución de frecuencias acumuladas, una distribución de frecuencias relativas y una
distribución de frecuencias relativas acumuladas.
15.Krieser et al. (A-17) examinó la tasa de filtración glomerular (TFG) en receptores pediátricos de trasplante renal.
La TFG es un parámetro importante de la función renal evaluada en receptores de trasplante renal.
Las siguientes son mediciones de 19 sujetos de GFR medidas con ácido dietilentriamina
pentaacético. (Nota: algunos sujetos se midieron más de una vez).
PREGUNTAS DE REPASO Y EJERCICIOS 59
18 42
21 43
21 43
23 48
27 48
27 51
30 55
32 58
32 60
32 62
36 67
37 68
41 88
42 63
Fuente: Datos proporcionados por cortesía de DMZ Krieser, MD
dieciséis.Los siguientes son los niveles de cistatina C (mg/L) para los pacientes descritos en el Ejercicio 15 (A-17). La
cistatina C es una proteína básica catiónica que se investigó por su relación con los niveles de GFR. Además,
también se dan los niveles de creatinina. (Nota: algunos sujetos se midieron más de una vez).
(a)Para cada variable, calcule la media, la mediana, la varianza, la desviación estándar y el coeficiente de
variación.
(b)Para cada variable, construya un diagrama de tallo y hojas y un diagrama de caja y bigotes.
(C)¿Qué conjunto de medidas es más variable, la cistatina C o la creatinina? ¿En qué basas tu
respuesta?
60 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
10–14 7
15–19 258
20–24 585
25–29 841
30–34 981
35–39 526
40–44 99
45–49 4
Fuente: Departamento de Salud del Estado de Nueva York, Estadísticas
vitales anuales 2000, Tabla 7, Nacidos vivos por condado de residencia
y edad de la madre.
Puede incluir nacidos vivos de madres mayores de 49 años.
Para estos datos, construya una distribución de frecuencias acumuladas, una distribución de frecuencias relativas y una
distribución de frecuencias relativas acumuladas.
19Spivack (A-18) investigó la gravedad de la enfermedad asociada conC. dificultaden pacientes pediátricos hospitalizados.
Una de las variables que examinaron fue la cantidad de días que los pacientes experimentaron diarrea. Los datos de
los 22 sujetos del estudio aparecen a continuación. Calcule la media, la mediana, la varianza y la desviación estándar.
3 11 3 4 14 2 4 5 3 11 2
2 3 2 1 1 7 2 1 1 3 2
Fuente: Jordan G. Spivack, Stephen C. Eppes y Joel D. Klien,
“Clostridium Difficile–Diarrea asociada en un hospital
pediátrico”,Pediatría Clínica, 42 (2003), 347–352.
22Considere los siguientes posibles intervalos de clase para usar en la construcción de una distribución de frecuencia de los
niveles de colesterol sérico de los sujetos que participaron en un cribado masivo:
¿Qué conjunto de intervalos de clase crees que es más apropiado para el propósito? ¿Por qué? Indique
específicamente para cada uno por qué cree que los otros dos son menos deseables.
23En una prueba de estadística, se pidió a los estudiantes que construyeran una distribución de frecuencia de los niveles de
creatina en sangre (unidades/litro) para una muestra de 300 sujetos sanos. La media fue 95 y la desviación estándar
fue 40. Los estudiantes utilizaron los siguientes intervalos de clase:
(a)1 (d)15
(b)5 (mi)20
(C)10 (F)25
Comente sobre la idoneidad de estas elecciones de anchos.
24Dé un ejemplo relacionado con las ciencias de la salud de una población de mediciones para las cuales la media
sería una mejor medida de tendencia central que la mediana.
25Dé un ejemplo relacionado con las ciencias de la salud de una población de mediciones para las cuales la mediana sería
una mejor medida de tendencia central que la media.
26Indique para las siguientes variables cuál cree que sería una mejor medida de tendencia central, la
media, la mediana o la moda, y justifique su elección:
(a)Ingresos anuales de enfermeras prácticas con licencia en el sureste.
(b)Diagnósticos de pacientes atendidos en el servicio de urgencias de un hospital de una gran ciudad.
27Consulte el Ejercicio 2.3.11. Calcule la media, la mediana, la varianza, la desviación estándar, el primer cuartil, el tercer
cuartil y el rango intercuartílico. Construya un diagrama de caja de los datos. ¿Son iguales la moda, la mediana y la
media? Si no, explique por qué. Discuta los datos en términos de variabilidad. Compare el IQR con el rango. ¿Qué te
dice la comparación sobre la variabilidad de las observaciones?
28Consulte el Ejercicio 2.3.12. Calcule la media, la mediana, la varianza, la desviación estándar, el primer cuartil, el tercer
cuartil y el rango intercuartílico. Construya un diagrama de caja de los datos. ¿Son iguales la moda, la mediana y la
media? Si no, explique por qué. Discuta los datos en términos de variabilidad. Compare el IQR con el rango. ¿Qué te
dice la comparación sobre la variabilidad de las observaciones?
29Thilothammal et al. (A-19) diseñó un estudio para determinar la eficacia de la vacuna BCG (bacillus Calmette-Gu-
erin) en la prevención de la meningitis tuberculosa. Entre los datos recopilados sobre cada sujeto se
encontraba una medida del estado nutricional (peso real expresado como porcentaje del peso esperado para
la altura real). La siguiente tabla muestra los valores del estado nutricional de los 107 casos estudiados.
(a)Para estos datos, calcule las siguientes medidas descriptivas: media, mediana, moda, varianza,
desviación estándar, rango, primer cuartil, tercer cuartil y IQR.
(b)Construya los siguientes gráficos para los datos: histograma, polígono de frecuencia, diagrama de tallo y hojas y diagrama
de caja.
(C)Discuta los datos en términos de variabilidad. Compare el IQR con el rango. ¿Qué te dice la
comparación sobre la variabilidad de las observaciones?
(d)¿Qué proporción de las medidas están dentro de una desviación estándar de la media? ¿Dos
desviaciones estándar de la media? ¿Tres desviaciones estándar de la media?
(mi)¿Qué proporción de las medidas son menos de 100?
(F)¿Qué proporción de las medidas son menos de 50?
Ejercicios para usar con grandes conjuntos de datos disponibles en el siguiente sitio web:www.wiley.com/
college/daniel
1.Consulte el conjunto de datos NCBIRTH800. El Centro Estatal de Estadísticas de Salud de Carolina del Norte y el Instituto
Howard W. Odum para la Investigación en Ciencias Sociales de la Universidad de Carolina del Norte en Chapel Hill
(A-20) ponen a disposición del público datos sobre nacimientos y muertes infantiles de todos los niños nacidos en el
estado de North carolina Se puede acceder a estos datos enwww.irss.unc.edu/ncvital/bfd1down.html. Los registros
de nacimientos se remontan a 1968. Este completo conjunto de datos de nacimientos en 2001 contiene 120.300
registros. Los datos representan una muestra aleatoria de 800 de esos nacimientos y variables seleccionadas. Las
variables son las siguientes:
5.Construya diagramas de caja y bigotes uno al lado del otro para la variable de TOUNCES para mujeres
que admitieron fumar y mujeres que no admitieron fumar. ¿Ve alguna diferencia en el peso al nacer
en los dos grupos? ¿Qué grupo tiene más variabilidad?
6.Construya diagramas de caja y bigotes uno al lado del otro para la variable de MAGE para mujeres casadas y no
casadas. ¿Ves una diferencia en las edades en los dos grupos? ¿Qué grupo tiene más variabilidad?
¿Son sorprendentes los resultados?
REFERENCIAS
Referencias de metodología
1. HASTURGES, "La elección de un intervalo de clase",Revista de la Asociación Estadounidense de Estadística, 21 (1926), 65–
66.
2. hELENMWALKER, "Grados de libertad,"Revista de Psicología Educativa, 31 (1940), 253–269.
3. Rtransmisión exteriorJ HYNDMANy YANÁNFUN, “Cuantiles de muestra en paquetes estadísticos,”El Estadístico Americano, 50 (1996),
361–365.
4. jOHNWTUKEY,Análisis exploratorio de datos,Addison-Wesley, Reading, MA, 1977.
Aplicaciones Referencias
A-1. FARHADATASSI, “Cuidado oral en el hogar y las razones para buscar atención dental por parte de personas en diálisis
renal”, Revista de práctica dental contemporánea, 3 (2002), 031–041.
A-2. VALABHjANARDHAN, ROBERTOFRIEDLANDER, hPREMIORIINA, y PHILIPmiDWINSTIEG, “Identificación de pacientes en riesgo de
Morbilidad posprocedimiento después del tratamiento de aneurismas intracraneales incidentales: el papel del tamaño y la ubicación del
aneurisma”,Enfoque neuroquirúrgico, 13 (2002), 1–8.
A-3. AHOEKEMA, BHOVINGA, B. S.TEGENGA, y LGM De BONT, "Morfología craneofacial y apnea obstructiva del sueño:
un análisis cefalométrico"Revista de Rehabilitación Oral, 30 (2003), 690–696.
64 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS
A-4. DÁVIDOS.SOLBÉN, "Contenido de selenio de venado, ardilla y carne de res comprada o producida en Ohio, una región baja en
selenio de los Estados Unidos",Revista de ciencia de los alimentos, 67 (2002), 431–433.
A-5. miRIKSKJELBO, THEONESTOKMUTABINGWA, IBBYGBJERG, kARÍNK. N.IELSEN, LARSF GRAMy kSOYBROSEN,
“Metabolismo de la cloroguanida en relación con la eficacia en la profilaxis de la malaria y laS-Oxidación de
mefenitoína en tanzanos”,Farmacología clínica y terapéutica, 59 (1996), 304–311.
A-6. HENRIKSCHMIDT, PAGOULmiRIKMETROORTENSEN, SARÉNLARSFALSGAARD, y miSTHERAJENSEN, “Autotransfusión después
El injerto de derivación de la arteria coronaria reduce a la mitad el número de pacientes que necesitan transfusiones de sangre”,Anales de
Cirugía Torácica, 61 (1996), 1178–1181.
A-7. RICHARDmiFURGONETAS, WANDAGRAMOORDÓN, y McomoCONZEMIO, "Efecto de la velocidad sobre las fuerzas de reacción del
suelo en perros con cojera atribuible al desgarro del ligamento cruzado craneal",Diario Americano de Investigación
Veterinaria, 64 (2003), 1479–1481.
A-8. SimonaPAGORCELINI, gUILIANAVALLANTÍ, SILVIAnorteOZA, gUIDOPAGOLI, ADRIANOLAzzarín, gUISEPPETAMBUSSI, y
ANTONIOGRAMORASIA, "Potencial timopoyético mejorado en individuos infectados por VIH avirémicos con HAART mediante la
administración intermitente de IL-2",SIDA, 17 (2003) 1621-1630.
A-9. HARRYn.s.CABELLOy unNNAjASPER, "El retorno venoso disminuido no es suficiente ni necesario para provocar la vocalización
ultrasónica de las crías de ratas lactantes",Neurociencia conductual, 117 (2003), 840–853.
A-10. MBUTZ, KHWOLLINSKY, U. W.IDEMUTO-CATRINESCU, COMOPERFELADO, SUDOESTEENTERRAR, HH MEHRKENS, CA
LUDOLFO, y H. S.CHREIBER, “Efectos longitudinales de la ventilación con presión positiva no invasiva en
pacientes con esclerosis lateral amiotófica,”Diario Americano de Rehabilitación Médica, 82 (2003),
597–604.
A-11. DÁVIDOWSTARCH, jERRYWALEXANDER, PAGHILIPCNOBLEA, SURAJRREMOLINO, y DÁVIDOMLINTERNO, “Multitrenzado
Fijación del injerto del tendón de la corva con un tornillo de interferencia tibial estándar o de cuatro cuadrantes centrales para
la reconstrucción del ligamento cruzado anterior.Revista americana de medicina deportiva, 31 (2003), 338–344.
A-12. RICHARDJCARDOSI, ROSEMARIOCARDOSI, miENANOCGRENDYSJr., J.AMÉSV. F.IORICA, y MITCHELS. H.OFICIAL,
“Morbilidad infecciosa del tracto urinario con cateterismo vesical prolongado después de histerectomía radical”
Revista americana de obstetricia y ginecología, 189 (2003), 380–384.
A-13. SATOSHInorteOZAWA, kATSUJISHIMIZU, kIEMETROIYAMOTO, y MIZUOTANAKÁ, "Reparación del defecto pars interarticularis mediante fijación
segmentaria con alambre en atletas jóvenes con espondilólisis",Revista estadounidense de medicina deportiva, 31 (2003),
359–364.
A-14. GRAMOEE. UU.AHUIZINGA, WINETTETA van der GRAAF, ANEMIKEVISSER, jsistema operativoDAKOTA DEL SURIJKSTRAy J.OSETTEEHM
HOEKSTRA-WEEBERES, “Consecuencias psicosociales para los hijos de un padre con cáncer”,Enfermería oncológica, 26
(2003), 195–202.
A-15. miRICWTSOY, ARTHURFMAlaska, WAInorteGeorgiaLSOY, jOHNÉLFURGONETAS, y YORKY CCÓMO, "Movimiento pélvico y distribución de
la presión de interfaz durante la propulsión manual de una silla de ruedas",Archivos de Medicina Física y
Rehabilitación, 84 (2003), 1466–1472.
A-16. METROARCAPJOHNSON, LESLIEn.s.UTON, norteATALIARINTOUL, TIMOTEOMCROMBLEHOLME, ALANWFLAGO, LO YO
J HO BIEN, hOLLYLHEDRICK, RDOUGLASWILSON, y N. S.COTTADZICK, “Reparación del mielomeningocele fetal:
resultados clínicos a corto plazo,”Revista americana de obstetricia y ginecología, 189 (2003), 482–487.
A-17. DMZ KRIESER, AR ROSENBERG, G KAINER, y D. N.AIDOO, "La relación entre la creatinina sérica, la cistatina C sérica y
la tasa de filtración glomerular en receptores de trasplante renal pediátrico: un estudio piloto" Trasplante
Pediátrico, 6 (2002), 392–395.
A-18. jORDÁNG. S.PIVACO, StephenCESPPy J.OELD. K.DERECHO DE RETENCIÓN, “Clostridium difficile—Diarrea asociada en un
hospital pediátrico,”Pediatría Clínica, 42 (2003), 347–352.
A-19. NTHILO TAMMAL, PVKRISHNAMURTHY, DESMONDK. R.UNYANy K. B.ANU, “¿La vacuna BCG previene la meningitis
tuberculosa?”Archives of Disease in Childhood, 74 (1996), 144–147.
A-20. Centro Estatal de Estadísticas de Salud de Carolina del Norte e Instituto Howard W. Odum para la Investigación en Ciencias Sociales de la
Universidad de Carolina del Norte en Chapel Hill. Conjunto de datos de nacimiento para 2001 encontrado enwww.irss.unc.edu/ncvital/
bfd1down.html. Todos los cálculos fueron realizados por John Holcomb y no representan los hallazgos del Centro o Instituto.
CAPÍTULO 3
ALGUNA PROBABILIDAD BÁSICA
CONCEPTOS
La probabilidad sienta las bases para la inferencia estadística. Este capítulo proporciona una
breve descripción general de los conceptos de probabilidad necesarios para comprender los
temas tratados en los capítulos siguientes. También proporciona un contexto para comprender
las distribuciones de probabilidad utilizadas en la inferencia estadística e introduce al
estudiante a varias medidas que se encuentran comúnmente en la literatura médica (p. ej., la
sensibilidad y la especificidad de una prueba).
TEMAS
3.1INTRODUCCIÓN
3.2DOS PERSPECTIVAS DE LA PROBABILIDAD: OBJETIVA Y SUBJETIVA
3.3PROPIEDADES ELEMENTALES DE LA PROBABILIDAD
3.1 INTRODUCCIÓN
sesenta y cinco
66 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
seguir este tema debe consultar los muchos libros sobre probabilidad disponibles en la mayoría de las
bibliotecas de colegios y universidades. Se recomiendan los libros de Gut (1), Isaac (2) y Larson (3). Los
objetivos de este capítulo son ayudar a los estudiantes a adquirir alguna habilidad matemática en el
área de probabilidad y ayudarlos a desarrollar una comprensión de los conceptos más importantes. El
progreso en este sentido contribuirá enormemente a su éxito en la comprensión de los
procedimientos de inferencia estadística presentados más adelante en este libro.
El concepto de probabilidad no es ajeno a los trabajadores de la salud y se encuentra con frecuencia
en la comunicación cotidiana. Por ejemplo, podemos escuchar a un médico decir que un paciente tiene una
probabilidad de 50 a 50 de sobrevivir a una determinada operación. Otro médico puede decir que está 95 por
ciento seguro de que un paciente tiene una enfermedad en particular. Una enfermera de salud pública puede
decir que nueve de cada diez veces cierto cliente faltará a una cita. Como sugieren estos ejemplos, la mayoría
de las personas expresan las probabilidades en términos de porcentajes. Al tratar matemáticamente las
probabilidades, es más conveniente expresar las probabilidades como fracciones. (Los porcentajes resultan
de multiplicar las fracciones por 100). Así, medimos la probabilidad de que ocurra algún evento por un
número entre cero y uno. Cuanto más probable sea el evento, más cerca estará el número de uno; y cuanto
más improbable sea el evento, más cerca estará el número de cero. Un evento que no puede ocurrir tiene
una probabilidad de cero, y un evento que es seguro que ocurrirá tiene una probabilidad de uno.
Los investigadores de las ciencias de la salud se preguntan continuamente si los resultados de sus
esfuerzos podrían haber ocurrido solo por casualidad o si alguna otra fuerza estaba operando para producir
los efectos observados. Por ejemplo, supongamos que seis de cada diez pacientes que padecen alguna
enfermedad se curan después de recibir un determinado tratamiento. ¿Es probable que se haya producido
tal tasa de curación si los pacientes no hubieran recibido el tratamiento, o es evidencia de un verdadero
efecto curativo por parte del tratamiento? Veremos que preguntas como estas pueden responderse
mediante la aplicación de los conceptos y leyes de probabilidad.
Hasta hace relativamente poco tiempo, los estadísticos y matemáticos pensaban en la probabilidad
sólo como unobjetivofenómeno derivado de procesos objetivos.
El concepto deprobabilidad objetivapueden clasificarse aún más bajo los
encabezados de (1)clásico,oa priori, probabilidad,y (2) elFrecuencia relativa,o
posteriormente, concepto de probabilidad.
estas probabilidades. Al tirar el dado, decimos que cada uno de los seis lados esigualmente probable a observarse si
no hay razón para favorecer a cualquiera de los seis lados. De manera similar, si no hay razón para favorecer el sorteo
de una carta en particular de una baraja de cartas, decimos que cada una de las 52 cartas tiene la misma probabilidad
de ser sacada. Podemos definir la probabilidad en el sentido clásico de la siguiente manera:
DEFINICIÓN
Si un evento puede ocurrir ennortemaneras mutuamente excluyentes e igualmente
probables, y simetrode estos poseen un rasgoMI,la probabilidad de que ocurrami es
igual am=N.
metro
PAGdmi¼ (3.2.1)
norte
DEFINICIÓN
Si algún proceso se repite un gran número de veces,norte,y si algún
evento resultante con la característicamiocurremetroveces, la frecuencia
relativa de ocurrencia deMI,m=n,será aproximadamente igual a la
probabilidad deMI.
metro
PAGdmi¼ (3.2.2)
norte
Sin embargo, debemos tener en cuenta que, en sentido estricto,m=nes solo una estimación dePAGdmiÞ.
Probabilidad subjetivaA principios de la década de 1950, LJ Savage (4) dio un impulso considerable
a lo que se denomina el concepto “personalista” o subjetivo de probabilidad. Este punto de vista
sostiene que la probabilidad mide la confianza que un individuo particular tiene en la verdad de una
proposición particular. Este concepto no se basa en la repetibilidad de ningún proceso. De hecho, al
aplicar este concepto de probabilidad, se puede evaluar la probabilidad de un evento que solo puede
ocurrir una vez, por ejemplo, la probabilidad de que se descubra una cura para el cáncer en los
próximos 10 años.
Aunque la visión subjetiva de la probabilidad ha disfrutado de una mayor atención a lo largo de los
años, no ha sido completamente aceptada por los estadísticos que tienen orientaciones tradicionales.
68 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
DEFINICIÓN
Elprobabilidad previade un evento es una probabilidad basada en el conocimiento
previo, la experiencia previa o los resultados derivados de la actividad previa de
recopilación de datos.
DEFINICIÓN
Elprobabilidad posteriorde un evento es una probabilidad obtenida mediante el uso de
nueva información para actualizar o revisar una probabilidad anterior.
A medida que se recopilan más datos, es probable que se sepa más acerca de la probabilidad “verdadera” del
evento que se está considerando. Aunque la idea de actualizar las probabilidades con base en nueva
información contrasta directamente con la filosofía detrás de la probabilidad de frecuencia de ocurrencia, los
conceptos bayesianos se usan ampliamente. Por ejemplo, las técnicas bayesianas han encontrado una
aplicación reciente en la construcción de filtros de spam de correo electrónico. Típicamente, la aplicación de
conceptos bayesianos hace uso de una fórmula matemática llamadaTeorema de Bayes.En la Sección 3.5
empleamos el teorema de Bayes en la evaluación de los datos de la prueba de detección diagnóstica.
PAGdmiiÞ -0 (3.3.1)
En otras palabras, todos los eventos deben tener una probabilidad mayor o igual a cero,
un requisito razonable en vista de la dificultad de concebir una probabilidad negativa. Un
concepto clave en la declaración de esta propiedad es el concepto demutuamente excluyentes
resultados. Se dice que dos eventos son mutuamente excluyentes si no pueden ocurrir
simultáneamente.
3.4 CÁLCULO DE LA PROBABILIDAD DE UN EVENTO 69
- - --
EDUCACIÓN FÍSICAiþmij¼PAGdmiiÞ þEDUCACIÓN FÍSICAj (3.3.3)
Supongamos que los dos eventos no fueran mutuamente excluyentes; es decir, supongamos que
pudieran ocurrir al mismo tiempo. Al intentar calcular la probabilidad de que ocurra cualquiera de los dos mii
omijse descubriría el problema de la superposición y el procedimiento podría volverse bastante complicado.
Este concepto será discutido más adelante en la siguiente sección.
Ahora hacemos uso de los conceptos y técnicas de las secciones anteriores para calcular las
probabilidades de eventos específicos. Se introducirán ideas adicionales según sea necesario.
EJEMPLO 3.4.1
El objetivo principal de un estudio de Carter et al. (A-1) fue investigar el efecto de la edad de inicio del
trastorno bipolar en el curso de la enfermedad. Una de las variables investigadas fue la historia familiar de
trastornos del estado de ánimo. La Tabla 3.4.1 muestra la frecuencia de antecedentes familiares de
Antecedentes familiares de trastornos del estado de ánimo Temprano¼18(MI) Más tarde > 18(L) Total
Negativo (A) 28 35 63
Trastorno bipolar (B) 19 38 57
Unipolar (C) 41 44 85
Unipolares y bipolares (D) 53 60 113
trastornos del estado de ánimo en los dos grupos de interés (edad temprana de inicio definida como 18 años
o menos y edad tardía de inicio definida como posterior a los 18 años). Supongamos que elegimos una
persona al azar de esta muestra. ¿Cuál es la probabilidad de que esta persona tenga 18 años o menos?
Solución: A los efectos de ilustrar el cálculo de probabilidades, consideramos que este grupo de
318 sujetos es el grupo más grande por el que tenemos interés. En otras palabras,
para este ejemplo, consideramos a los 318 sujetos como una población. Suponemos
que Early y Later son categorías mutuamente excluyentes y que la probabilidad de
seleccionar a cualquier persona es igual a la probabilidad de seleccionar a cualquier
otra persona. Definimos la probabilidad deseada como el número de sujetos con la
característica de interés (Early) dividido por el número total de sujetos. Podemos
escribir el resultado en notación de probabilidad de la siguiente manera:
EJEMPLO 3.4.2
Supongamos que elegimos un sujeto al azar de los 318 sujetos y encontramos que tiene 18 años o menos (
MI).¿Cuál es la probabilidad de que este sujeto sea uno que no tenga antecedentes familiares de trastornos
del estado de ánimo (A)?
Solución: El número total de asignaturas deja de ser de interés, ya que, con la selección de una
asignatura Temprana, se eliminan las asignaturas Tardías. Entonces, podemos definir la
probabilidad deseada de la siguiente manera: ¿Cuál es la probabilidad de que un sujeto no
tenga antecedentes familiares de trastornos del estado de ánimo (A),dado que el tema
seleccionado es Temprano (MI)?Esta es una probabilidad condicional y se escribe comoPAGd
AjmiÞen el que la línea vertical se lee "dado". Los 141 sujetos tempranos se convierten en el
denominador de esta probabilidad condicional, y 28, el número de sujetos tempranos sin
antecedentes familiares de trastornos del estado de ánimo, se convierte en el numerador.
Nuestra probabilidad deseada, entonces, es
EJEMPLO 3.4.3
Volvamos a referirnos a la Tabla 3.4.1. ¿Cuál es la probabilidad de que una persona escogida al azar de los
318 sujetos sea Temprano (mi) yserá una persona que no tiene antecedentes familiares de trastornos del
estado de ánimo (A)?
Solución: La probabilidad que estamos buscando se puede escribir en notación simbólica como
PAGdE\AÞen el que el símbolo \ se lee como "intersección" o "y". La declaraciónE\A
indica la ocurrencia conjunta de condicionesmiyA.El número de sujetos que satisfacen
ambas condiciones deseadas se encuentra en la Tabla 3.4.1 en la intersección de la
columna etiquetadamiy la fila etiquetadaA y se ve que es 28. Dado que la selección se
hará del conjunto total de sujetos, el denominador es 318. Por lo tanto, podemos
escribir la probabilidad conjunta como
EJEMPLO 3.4.4
Deseamos calcular la probabilidad conjunta de Edad temprana al inicio (MI)y antecedentes familiares
negativos de trastornos del estado de ánimo (A)del conocimiento de una probabilidad marginal apropiada y
una probabilidad condicional apropiada.
Podemos establecer la regla de la multiplicación en términos generales de la siguiente manera: Para dos eventos cualesquiera
AyB,
Para los mismos dos eventosAyB,la regla de la multiplicación también se puede escribir como PAGd
A\B¼PAGdAÞPAGdBjAÞ;siPAGdAÞ 6¼0.
Vemos que a través de la manipulación algebraica, la regla de la multiplicación establecida en la
Ecuación 3.4.1 puede usarse para encontrar cualquiera de las tres probabilidades en su declaración si se
conocen las otras dos. Podemos, por ejemplo, encontrar la probabilidad condicionalPAGdAjBÞpor
72 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
DEFINICIÓN
Ella probabilidad condicionaldeAdadoBes igual a la probabilidad de
A\Bdividido por la probabilidad deB,dada la probabilidad deB no es
cero
Eso es,
PAGdA\BÞ
PAGdAjB¼ ; PAGdBÞ 6¼0 (3.4.2)
PAGdBÞ
Ilustramos el uso de la regla de la multiplicación para calcular una probabilidad condicional con el
siguiente ejemplo.
EJEMPLO 3.4.5
Deseamos usar la Ecuación 3.4.2 y los datos de la Tabla 3.4.1 para encontrar la probabilidad condicional, PAG
dAjmiÞ
¿Qué pasa si dos eventos no son mutuamente excluyentes? Este caso está cubierto por lo que se conoce como
elregla de suma,que puede enunciarse de la siguiente manera:
DEFINICIÓN
Dados dos eventosAyB,la probabilidad de que el eventoA,o eventoB,o ambos
ocurren es igual a la probabilidad de que el eventoAocurre, más la probabilidad de
que el eventoBocurre, menos la probabilidad de que los eventos ocurran
simultáneamente.
3.4 CÁLCULO DE LA PROBABILIDAD DE UN EVENTO 73
EJEMPLO 3.4.6
Si seleccionamos una persona al azar de los 318 sujetos representados en la Tabla 3.4.1, ¿cuál es la probabilidad de
que esta persona sea un sujeto de edad temprana de inicio (MI)o no tendrá antecedentes familiares de trastornos del
estado de ánimo (A)¿o ambos?
Tenga en cuenta que los 28 sujetos que sonambosTempranoyno tienen antecedentes familiares de
trastornos del estado de ánimo se incluyen en los 141 que son Tempranos así como en los 63 que no tienen
antecedentes familiares de trastornos del estado de ánimo. Dado que, al calcular la probabilidad, estos 28 se
agregaron dos veces al numerador, deben restarse una vez para superar el efecto de duplicación o
superposición.
Eventos independientesSuponga que, en la Ecuación 3.4.2, se nos dice que el eventoBha ocurrido,
pero que este hecho no tiene efecto sobre la probabilidad deA.Es decir, suponga que la probabilidad
de eventoAes el mismo independientemente de si o noBocurre. En esta situación, PAGdAjB¼PAGdAÞ.
En tales casos decimos queAyBsoneventos independientes.Entonces, la regla de multiplicación para
dos eventos independientes se puede escribir como
Así, vemos que si dos eventos son independientes, la probabilidad de que ocurran
juntos es igual al producto de las probabilidades de que ocurran individualmente.
Tenga en cuenta que cuando dos eventos con probabilidades distintas de cero son independientes, cada una de las
siguientes afirmaciones es verdadera:
Dos eventos no son independientes a menos que todas estas afirmaciones sean verdaderas. Es importante
tener en cuenta que los términosindependienteymutuamente excluyentesno significan lo mismo.
Ilustremos el concepto de independencia mediante el siguiente ejemplo.
74 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
EJEMPLO 3.4.7
En cierta clase de secundaria, compuesta por 60 niñas y 40 niños, se observa que 24 niñas y 16
niños usan anteojos. Si se elige al azar a un estudiante de esta clase, la probabilidad de que el
estudiante use anteojos,EDUCACIÓN FÍSICA),es 40=100, o .4.
(a)¿Cuál es la probabilidad de que un estudiante elegido al azar use anteojos, dado que el
estudiante es un niño?
Solución: Al usar la fórmula para calcular una probabilidad condicional, encontramos que esto
es
PAGdmi \ segundo¼PAGdBÞPAGdmijBÞ
pero, como hemos demostrado que los eventosmiyBson independientes podemos reemplazar PAGdmijBÞ
porEDUCACIÓN FÍSICA)para obtener, por la Ecuación 3.4.4,
PAGdmi \ segundo¼PAGdBÞPAGdmiÞ
40 40
¼
100 100
¼ :dieciséis &
-Þ ¼1PAGdAÞ
PAGdA (3.4.5)
EJEMPLO 3.4.8
Suponga que de 1200 admisiones a un hospital general durante cierto período de tiempo, 750 son
- es igual a 1200 menos 750, o
admisiones privadas. Si los designamos como conjuntoA,entoncesA
450. Podemos calcular
PAGdA¼750=1200¼ :625
y
-Þ ¼450=1200¼ :375
PAGdA
y mira eso
-Þ ¼1
PAGdA PAGdAÞ
:375¼1 :625
:375¼ :375
&
DEFINICIÓN
Dada alguna variable que se puede descomponer enmetrocategorías
designadas porA1;A2; . . . ;Ai; . . . ;Ametroy otra variable conjunta que se
descompone ennortecategorías designadas porB1; B2; . . . ;Bj; . . . ;Bnorte, la
probabilidad marginal deAi;PAGdAiÞ,es igual a la suma de las
probabilidades conjuntas deAicon todas las categorías deB.Eso es,
- -
PAGdAi¼SPensilvaniai\ Bj; para todos los valores dej (3.4.6)
EJEMPLO 3.4.9
Deseamos usar la ecuación 3.4.6 y los datos de la tabla 3.4.1 para calcular la probabilidad marginal
EDUCACIÓN FÍSICA).
76 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
Solución: La variable edad de inicio se divide en dos categorías, Temprano para el inicio 18 años
o menos (MI)y Tardío para el inicio que ocurre a una edad mayor de 18 años
(L).La variable antecedentes familiares de trastornos del estado de ánimo se divide en cuatro
categorías: antecedentes familiares negativos (A),solo trastorno bipolar (B),trastorno
unipolar solamente (C),y sujetos con antecedentes de trastorno unipolar y bipolar (D).La
categoría Temprano ocurre junto con las cuatro categorías de la variable antecedentes
familiares de trastornos del estado de ánimo. Las cuatro probabilidades conjuntas que se
pueden calcular son
siguiente manera:
El resultado, como era de esperar, es el mismo que se obtiene utilizando el total marginal de
Early como numerador y el número total de sujetos como denominador.
EJERCICIOS
3.4.1En un estudio de victimización violenta de mujeres y hombres, Porcerelli et al. (A-2) recopiló información de 679
mujeres y 345 hombres de 18 a 64 años en varios centros de medicina familiar en el área metropolitana de
Detroit. Los pacientes completaron un cuestionario de historial de salud que incluía una pregunta sobre
victimización. La siguiente tabla muestra los sujetos de la muestra clasificados en forma cruzada por sexo y el
tipo de victimización violenta reportada. Las categorías de victimización se definen como no victimización,
victimización por la pareja (y no por otros), victimización por personas distintas a la pareja (amigos, familiares
o extraños) y quienes reportaron victimización múltiple.
(a)Supongamos que elegimos un sujeto al azar de este grupo. ¿Cuál es la probabilidad de que este sujeto sea
una mujer?
(b)¿Cómo llamamos a la probabilidad calculada en el inciso a?
(C)Muestre cómo calcular la probabilidad solicitada en el inciso a por dos métodos adicionales.
EJERCICIOS 77
(d)Si elegimos un sujeto al azar, ¿cuál es la probabilidad de que el sujeto sea una mujer y haya sufrido abuso
por parte de su pareja?
(mi)¿Cómo llamamos a la probabilidad calculada en el inciso d?
(F)Supongamos que elegimos a un hombre al azar. Con esta información, ¿cuál es la probabilidad de que haya sufrido abuso
por parte de personas que no son su pareja?
3.4.2Fernando et al. (A-3) estudió el uso compartido de drogas entre usuarios de drogas inyectables en el sur del Bronx en la ciudad de
Nueva York. Los usuarios de drogas en la ciudad de Nueva York usan el término "dividir una bolsa" o "bajarse en una bolsa"
para referirse a la práctica de dividir una bolsa de heroína u otras sustancias inyectables. Una práctica común incluye dividir las
drogas después de disolverlas en una olla común, un procedimiento con un riesgo considerable de VIH. Aunque esta práctica
es común, se sabe poco sobre la prevalencia de tales prácticas. Los investigadores preguntaron a los usuarios de drogas
inyectables en cuatro vecindarios del sur del Bronx si alguna vez "consumieron" drogas en bolsas o inyecciones. Los resultados
clasificados por género y práctica de desdoblamiento se detallan a continuación:
(a)¿Cuántas probabilidades marginales se pueden calcular a partir de estos datos? Indique cada uno en notación de
probabilidad y haga los cálculos.
(b)¿Cuántas probabilidades conjuntas se pueden calcular? Indique cada uno en notación de probabilidad y haga los
cálculos.
(C)¿Cuántas probabilidades condicionales se pueden calcular? Indique cada uno en notación de probabilidad y haga
los cálculos.
(d)Usa la regla de la multiplicación para encontrar la probabilidad de que una persona escogida al azar nunca divida
las drogas y sea mujer.
(mi)¿Cómo llamamos a la probabilidad calculada en el inciso d?
(F)Usa la regla de la multiplicación para encontrar la probabilidad de que una persona elegida al azar sea hombre,
dado que admite dividir las drogas.
(gramo)¿Cómo llamamos a la probabilidad calculada en la parte f?
3.4.3Consulte los datos del Ejercicio 3.4.2. Enuncie las siguientes probabilidades con palabras y calcule:
(a)PAGdHombre \ Drogas divididasÞ
(C)PAGdMasculinojDrogas divididasÞ
(d)PAG(Masculino)
78 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
3.4.4Laveist y Nuru-Jeter (A-4) realizaron un estudio para determinar si la concordancia racial médico-paciente
se asociaba con una mayor satisfacción con la atención. Con ese fin, recopilaron una muestra nacional
de encuestados afroamericanos, caucásicos, hispanos y asiáticoamericanos. La siguiente tabla
clasifica la raza de los sujetos así como la raza de su médico:
Africano- Asiático-
Carrera del médico caucásico Americano Hispano Americano Total
(a)¿Cuál es la probabilidad de que un sujeto seleccionado al azar tenga un médico asiático = isleño del
Pacífico?
(b)¿Cuál es la probabilidad de que un sujeto afroamericano tenga un médico
afroamericano?
(C)¿Cuál es la probabilidad de que un sujeto seleccionado al azar en el estudio sea asiático-estadounidense y tenga un
médico asiático = isleño del Pacífico?
(d)¿Cuál es la probabilidad de que un sujeto elegido al azar sea hispano o tenga un médico
hispano?
(mi)Utilice el concepto de eventos complementarios para encontrar la probabilidad de que un sujeto elegido
al azar en el estudio no tenga un médico blanco.
3.4.5Si la probabilidad de ser zurdo en cierto grupo de personas es .05, ¿cuál es la probabilidad de ser diestro
(suponiendo que no haya ambidestreza)?
3.4.6La probabilidad es .6 de que un paciente seleccionado al azar de los residentes actuales de cierto hospital sea un hombre.
La probabilidad de que el paciente sea un hombre que se va a operar es .2. Se encuentra que un paciente
seleccionado al azar de los residentes actuales es un hombre; ¿Cuál es la probabilidad de que el paciente esté en el
hospital para la cirugía?
3.4.7En cierta población de pacientes hospitalarios, la probabilidad es .35 de que un paciente seleccionado al azar tenga una enfermedad
cardíaca. La probabilidad es de .86 de que un paciente con enfermedad cardíaca sea fumador. ¿Cuál es la probabilidad de que
un paciente seleccionado al azar de la población sea fumador?ytiene enfermedad del corazón?
En el campo de las ciencias de la salud, una aplicación ampliamente utilizada de las leyes y conceptos de probabilidad
se encuentra en la evaluación de pruebas de detección y criterios diagnósticos. De interés para los médicos es una
mayor capacidad para predecir correctamente la presencia o ausencia de una enfermedad particular de
3.5 TEOREMA DE BAYES, PRUEBAS DE DETECCIÓN, SENSIBILIDAD, ESPECIFICIDAD 79
conocimiento de los resultados de las pruebas (positivo o negativo) y/o el estado de los síntomas de
presentación (presentes o ausentes). También es de interés la información sobre la probabilidad de
resultados positivos y negativos de las pruebas y la probabilidad de la presencia o ausencia de un síntoma
particular en pacientes con y sin una enfermedad particular.
En nuestra consideración de las pruebas de detección, debemos ser conscientes del hecho de que no siempre
son infalibles. Es decir, un procedimiento de prueba puede producir unafalso positivoo unfalso negativo.
DEFINICIÓN
1. Un falso positivo resulta cuando una prueba indica un estado positivo cuando el
verdadero estado es negativo.
2. Un resultado falso negativo cuando una prueba indica un estado negativo cuando el
verdadero estado es positivo.
En resumen, las siguientes preguntas deben responderse para evaluar la utilidad de los
resultados de las pruebas y el estado de los síntomas para determinar si un sujeto tiene o no alguna
enfermedad:
1.Dado que un sujeto tiene la enfermedad, ¿cuál es la probabilidad de un resultado positivo en la prueba
(o la presencia de un síntoma)?
Supongamos que tenemos para una muestra denortetemas (dondenortees un número grande) la
información que se muestra en la Tabla 3.5.1. La tabla muestra para estosnortesujetos su estado con
respecto a una enfermedad y los resultados de una prueba de detección diseñada para identificar sujetos
con la enfermedad. Las entradas de las celdas representan el número de sujetos que caen en las categorías
definidas por los encabezados de fila y columna. Por ejemplo,aes el número de sujetos que tienen la
enfermedad y cuyo resultado de la prueba de detección fue positivo.
Como hemos aprendido, se pueden calcular una variedad de estimaciones de probabilidad a partir de
la información que se muestra en una tabla de doble entrada como la Tabla 3.5.1. Por ejemplo, podemos
Enfermedad
DEFINICIÓN
La sensibilidad de una prueba (o síntoma) es la probabilidad de un resultado positivo
de la prueba (o la presencia del síntoma) dada la presencia de la enfermedad.
DEFINICIÓN
La especificidad de una prueba (o síntoma) es la probabilidad de un resultado negativo
de la prueba (o ausencia del síntoma) dada la ausencia de la enfermedad.
DEFINICIÓN
El valor predictivo positivo de una prueba de cribado (o síntoma) es la
probabilidad de que un sujeto tenga la enfermedad dado que el sujeto tiene un
resultado positivo en la prueba de cribado (o tiene el síntoma).
-
Del mismo modo, la relaciónPAGdD jT-Þes una estimación de la probabilidad condicional de que un sujeto
no tiene la enfermedad dado que el sujeto tiene un resultado negativo en la prueba de
detección (o no tiene el síntoma). La probabilidad estimada por esta razón se llamavalor
predictivo negativode la prueba de tamizaje o síntoma.
DEFINICIÓN
El valor predictivo negativo de una prueba de detección (o síntoma) es la
probabilidad de que un sujeto no tenga la enfermedad, dado que el sujeto
tiene una prueba de detección negativa (o no tiene el síntoma).
Las estimaciones del valor predictivo positivo y el valor predictivo negativo de una prueba (o
síntoma) se pueden obtener a partir del conocimiento de la sensibilidad y especificidad de una prueba
(o síntoma) y la probabilidad de la enfermedad relevante en la población general. Para obtener estas
estimaciones de valor predictivo, hacemos uso del teorema de Bayes. El siguiente enunciado del
teorema de Bayes, empleando la notación establecida en la Tabla 3.5.1, da el valor predictivo positivo
de una prueba de cribado (o síntoma):
PAGdTjDÞPAGdDÞ
PAGdDjT¼ (3.5.1)
PAGdTjDÞPAGdDÞ þPAGdTjD - -Þ
ÞPAGdD
3.5 TEOREMA DE BAYES, PRUEBAS DE DETECCIÓN, SENSIBILIDAD, ESPECIFICIDAD 81
-Þ
PAGdT¼PAGdTjDÞPAGdDÞ þPAGdTjD - ÞPAGdD (3.5.3)
PAGdT-jD - Þ
- jT-¼
PAGdD
- ÞPAGdD
(3.5.4)
PAGdT-jD - Þ þPAGdT-jDÞPAGdDÞ
- ÞPAGdD
La ecuación 3.5.4 nos permite calcular una estimación de la probabilidad de que un sujeto que da
negativo en la prueba (o no tiene síntomas) no tenga la enfermedad, que es el valor predictivo
negativo de una prueba de detección o un síntoma.
Ilustramos el uso del teorema de Bayes para calcular un valor predictivo positivo
con el siguiente ejemplo.
EJEMPLO 3.5.1
Un equipo de investigación médica deseaba evaluar una prueba de detección propuesta para la enfermedad
de Alzheimer. La prueba se administró a una muestra aleatoria de 450 pacientes con enfermedad de
Alzheimer ya una muestra aleatoria independiente de 500 pacientes sin síntomas de la enfermedad.
82 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
¿Diagnóstico de alzhéimer?
Usando estos datos, estimamos que la sensibilidad de la prueba esPAGdTjD¼436=450¼ :97. Se estima
que la especificidad de la prueba esPAGdT-jD -Þ ¼495=500¼ :99. Ahora usamos los resultados de
el estudio para calcular el valor predictivo positivo de la prueba. Es decir, deseamos estimar la
probabilidad de que un sujeto que da positivo en la prueba tenga la enfermedad de Alzheimer. A
partir de los datos tabulados calculamosPAGdTjD¼436=450¼ :9689 yPAGdTjD -Þ ¼5=500¼ :01.
La sustitución de estos resultados en la Ecuación 3.5.1 da
d:9689ÞPAGdDÞ
PAGdDjT¼ (3.5.5)
d:9689ÞPAGdDÞ þ ð:01ÞPAGdD- Þ
d:9689Þð:113Þ
PAGdDjT¼ ¼ :93
d:9689Þð:113Þ þ ð:01Þð1:113Þ
- jT¼ d:99Þð1:113Þ
PAGdD ¼ :996
d:99Þð1 :113Þ þ ð:0311Þð:113Þ
EJERCICIOS 83
EJERCICIOS
3.5.1Un equipo de investigación médica desea evaluar la utilidad de cierto síntoma (llámeloS)en el diagnóstico de una
determinada enfermedad. En una muestra aleatoria de 775 pacientes con la enfermedad, 744 informaron
tener el síntoma. En una muestra aleatoria independiente de 1380 sujetos sin la enfermedad, 21 informaron
que tenían el síntoma.
(a)En el contexto de este ejercicio, ¿qué es un falso positivo?
(b)¿Qué es un falso negativo?
(C)Calcule la sensibilidad del síntoma.
(d)Calcular la especificidad del síntoma.
(mi)Suponga que se sabe que la tasa de la enfermedad en la población general es. 001. ¿Cuál es el
valor predictivo positivo del síntoma?
(F)¿Cuál es el valor predictivo negativo del síntoma?
(gramo)Encuentre el valor predictivo positivo y el valor predictivo negativo para el síntoma para las
siguientes tasas hipotéticas de enfermedad: .0001, .01 y .10.
(h)¿Qué concluye acerca del valor predictivo del síntoma sobre la base de los resultados obtenidos en
el inciso g?
3.5.2En un artículo titulado "Desgarros meniscales en asa de cubo de la rodilla: sensibilidad y especificidad de los signos de resonancia magnética",
Dorsay y Helms (A-6) realizaron un estudio retrospectivo de 71 rodillas escaneadas por resonancia magnética. Uno de los indicadores que
examinaron fue la ausencia del "signo de la pajarita" en la resonancia magnética como evidencia de un desgarro del menisco en asa de
cubo o "tipo asa de cubo". En el estudio, la cirugía confirmó que 43 de los 71 casos eran desgarros en asa de balde. Los casos pueden
clasificarse de forma cruzada según el estado del "signo de la pajarita" y los resultados quirúrgicos de la siguiente manera:
Prueba positiva 38 10 48
(signo de pajarita ausente) (T)
Prueba negativa 5 18 23
(signo de pajarita presente)dT-Þ
Total 43 28 71
Fuente: Theodore A. Dorsay y Clyde A. Helms, "Desgarros meniscales en asa de cubo de la rodilla: sensibilidad y especificidad de los
signos de resonancia magnética"Radiología esquelética, 32 (2003), 266–272.
(a)¿Cuál es la sensibilidad de la prueba para ver si el signo de la corbata de lazo ausente indica un desgarro de menisco?
(b)¿Cuál es la especificidad de la prueba para ver si el signo de la corbata de lazo ausente indica un desgarro de menisco?
3.5.3Oexle et al. (A-7) calculó el valor predictivo negativo de una prueba para portadores de deficiencia de ornitina transcarbamilasa
ligada al cromosoma X (OTCD, un trastorno del ciclo de la urea). Una prueba conocida como "prueba de alopurinol" se usa a
menudo como un dispositivo de detección de posibles portadores cuyos familiares son pacientes con OTCD. Citaron un estudio
de Brusilow y Horwich (A-8) que estimó la sensibilidad de la prueba de alopurinol como
. 927. Oexle et al. ellos mismos estimaron la especificidad de la prueba de alopurinol en .997. También
estimaron la prevalencia en la población de individuos con TOCD en 1=32000. Utilice esta información
y el teorema de Bayes para calcular el valor predictivo negativo de la prueba de detección de
alopurinol.
84 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
3.6 RESUMEN
En este capítulo se presentaron algunas de las ideas y conceptos básicos de probabilidad. El objetivo
ha sido proporcionar una “sensación” suficiente del tema para que los aspectos probabilísticos de la
inferencia estadística puedan entenderse y apreciarse más fácilmente cuando se presente este tema
más adelante.
Definimos probabilidad como un número entre 0 y 1 que mide la
posibilidad de que ocurra algún evento. Distinguimos entre probabilidad
subjetiva y probabilidad objetiva. La probabilidad objetiva se puede categorizar
aún más como probabilidad de frecuencia clásica o relativa. Después de
enunciar las tres propiedades de la probabilidad, definimos e ilustramos el
cálculo de los siguientes tipos de probabilidades: marginal, conjunta y
condicional. También aprendimos cómo aplicar las reglas de suma y
multiplicación para encontrar ciertas probabilidades. Aprendimos el significado
de eventos independientes, mutuamente excluyentes y complementarios.
Aprendimos el significado de especificidad, sensibilidad, valor predictivo positivo
y valor predictivo negativo aplicados a una prueba de detección o síntoma de
enfermedad. Finalmente,
norte
probabilidad norte
PAG
3.4.6 Probabilidad marginal PAGdAi¼ PAGdAi\ BjÞ
1.Defina lo siguiente:
(a)Probabilidad (b)Probabilidad objetiva
(C)Probabilidad subjetiva (d)Probabilidad clásica
(mi)El concepto de frecuencia relativa de probabilidad (F)Eventos mutuamente excluyentes
(gramo)Independencia (h)Probabilidad marginal
(i)Probabilidad conjunta (j)La probabilidad condicional
(k)La regla de la suma (l)La regla de la multiplicación
(metro)Eventos complementarios (norte)Falso positivo
(o)Falso negativo (pag)Sensibilidad
(q)especificidad (R)Valor predictivo positivo
(s)Valor predictivo negativo (t)teorema de bayes
3.Coughlin et al. (A-9) examinó las prácticas de detección de mama y cuello uterino de mujeres hispanas y no
hispanas en condados que se aproximan a la región fronteriza sur de EE. UU. El estudio utilizó datos de las
encuestas del Sistema de Vigilancia de Factores de Riesgo del Comportamiento de adultos de 18 años o más
realizados en 1999 y 2000. La siguiente tabla informa el número de observaciones de mujeres hispanas y no
hispanas que se habían realizado una mamografía en los últimos 2 años. clasificación cruzada con el estado
civil.
86 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
(a)Seleccionamos al azar un sujeto que se realizó una mamografía. ¿Cuál es la probabilidad de que esté
divorciada o separada?
(b)Seleccionamos al azar un sujeto que se hizo una mamografía y descubrimos que es hispana. Con esa
información, ¿cuál es la probabilidad de que esté casada?
(C)Seleccionamos al azar un sujeto que se realizó una mamografía. ¿Cuál es la probabilidad de que no sea
hispana y esté divorciada o separada?
(d)Seleccionamos al azar un sujeto que se realizó una mamografía. ¿Cuál es la probabilidad de
que sea hispana o viuda?
(mi)Seleccionamos al azar un sujeto que se realizó una mamografía. ¿Cuál es la probabilidad de que no esté
casada?
4.Swor et al. (A-10) analizó la efectividad del entrenamiento en reanimación cardiopulmonar (RCP) en personas mayores de 55 años.
Compararon las tasas de retención de habilidades de los sujetos en este grupo de edad que completaron un curso de
instrucción de RCP tradicional con aquellos que recibieron reanimación cardiopulmonar con compresiones torácicas
únicamente (CC-CPR). Se evaluaron grupos independientes 3 meses después del entrenamiento. La siguiente tabla muestra los
números de retención de habilidades con respecto a la competencia general según lo evaluado por las calificaciones de video
realizadas por dos evaluadores de video.
Calificación general
Competente RCP CC-RCP Total
Sí 12 15 27
No 15 14 29
Total 27 29 56
Fuente: Robert Swor, Scott Compton, Fern Vining, Lynn Ososky Farr,
Sue Kokko, Rebecca Pascual y Raymond E. Jackson, "Un ensayo
controlado aleatorizado de RCP solo con compresión torácica para
adultos mayores: un estudio piloto"Reanimación, 58 (2003), 177–185.
5.PAGdDjA¼PAGdDÞ 6.PAGdC\B¼PAGdCÞPAGdBÞ
7.PAGdA\B¼0 8.PAGdC\B¼PAGdBÞPAGdCjBÞ
9.PAGdA \ D¼PAGdAÞPAGdAjDÞ
5.Pillman et al. (A-11) estudiaron pacientes con breves episodios agudos de psicosis. Los investigadores
clasificaron a los sujetos en cuatro tipos de personalidad: obsesivo, asténico = poca confianza en sí mismo,
asténico = mucha confianza en sí mismo, nervioso = tenso e indeterminable. La siguiente tabla clasifica estos
tipos de personalidad en tres grupos de sujetos: aquellos con trastornos psicóticos agudos y transitorios
(ATPD), aquellos con esquizofrenia "positiva" (PS) y aquellos con trastorno esquizoafectivo bipolar (BSAD):
obsesivo (O) 9 2 6 17
Asténico = baja confianza en sí mismo (A) 20 17 15 52
Asténico = alto Seguro de sí mismo (S) 5 3 8 dieciséis
Total 42 42 42 126
Fuente: Frank Pillmann, Raffaela Bloink, Sabine Balzuweit, Annette Haring y Andreas
Marneros, “Personalidad e interacciones sociales en pacientes con psicosis aguda breve”
Revista de enfermedades nerviosas y mentales, 191 (2003), 503–508.
6.Cierto departamento de salud del condado ha recibido 25 solicitudes para una vacante que existe para una enfermera
de salud pública. De estos solicitantes, 10 tienen más de 30 años y 15 tienen menos de 30. Diecisiete tienen títulos de
licenciatura únicamente y ocho tienen títulos de maestría. De los menores de 30 años, seis tienen maestrías. Si se
hace una selección al azar entre estos 25 solicitantes, ¿cuál es la probabilidad de que una persona mayor de 30 añoso
¿Se seleccionará una persona con una maestría?
7.La siguiente tabla muestra 1000 solicitantes de la escuela de enfermería clasificados de acuerdo con los puntajes obtenidos en un
examen de ingreso a la universidad y la calidad de la escuela secundaria de la que se graduaron, según la calificación de un
grupo de educadores:
8.Si la probabilidad de que una enfermera de salud pública encuentre un cliente en casa es 0,7, ¿cuál es la probabilidad (suponiendo
independencia) de que en dos visitas domiciliarias realizadas en un día ambos clientes estén en casa?
9.Por una variedad de razones, los resultados de enfermedades autoinformados se utilizan con frecuencia sin verificación
en la investigación epidemiológica. En un estudio de Parikh-Patel et al. (A-12), los investigadores observaron la
relación entre los casos de cáncer autoinformados y los casos reales. Usaron los datos de cáncer autoinformados de
un Estudio de Maestros de California y validaron los casos de cáncer usando los datos del Registro de Cáncer de
California. La siguiente tabla informa sus hallazgos para el cáncer de mama:
Fuente: Arti Parikh-Patel, Mark Allen, William E. Wright y el Comité Directivo del Estudio de Docentes de California, “Validación
de los cánceres autoinformados en el Estudio de Docentes de California”Diario Americano de Epidemiología, 157 (2003), 539–
545.
(a)DejarAser el caso de informar sobre el cáncer de mama en el Estudio de Maestros de California. Encuentre la
probabilidad deAen este estudio.
(b)DejarBser el caso de tener cáncer de mama confirmado en el Registro de Cáncer de California. Encuentre la
probabilidad deBen este estudio.
(C)EncontrarPAGdA\BÞ
(d)EncontrardAjBÞ
(mi)EncontrarPAGdBjAÞ
(F)Encuentre la sensibilidad de usar el cáncer de mama autoinformado como predictor de cáncer de mama real en el
registro de California.
(gramo)Encuentre la especificidad de usar el cáncer de mama autoinformado como predictor de cáncer de mama real en el
registro de California.
10En cierta población, la probabilidad de que un sujeto seleccionado al azar haya estado expuesto a
cierto alérgeno y experimente una reacción al alérgeno es .60. La probabilidad es 0,8 de que un
sujeto expuesto al alérgeno experimente una reacción alérgica. Si se selecciona un sujeto al
azar de esta población, ¿cuál es la probabilidad de que haya estado expuesto al alérgeno?
11Suponga que el 3 por ciento de las personas en una población de adultos ha intentado suicidarse. También se
sabe que el 20 por ciento de la población vive por debajo del nivel de pobreza. Si estos dos eventos son
PREGUNTAS DE REPASO Y EJERCICIOS 89
independiente, ¿cuál es la probabilidad de que una persona seleccionada al azar de la población haya intentado
suicidarse?yestar viviendo por debajo del nivel de pobreza?
12En cierta población de mujeres, el 4 por ciento ha tenido cáncer de mama, el 20 por ciento son fumadoras y el 3
por ciento son fumadoras y han tenido cáncer de mama. Se selecciona una mujer al azar de la población.
¿Cuál es la probabilidad de que haya tenido cáncer de mama o fume o ambos?
13La probabilidad de que una persona seleccionada al azar de una población presente el síntoma clásico de cierta
enfermedad es .2, y la probabilidad de que una persona seleccionada al azar tenga la enfermedad es .23.
La probabilidad de que una persona que tiene el síntoma también tenga la enfermedad es .18. Una persona
seleccionada al azar de la población no tiene el síntoma. ¿Cuál es la probabilidad de que la persona tenga la
enfermedad?
14Para una determinada población definimos los siguientes eventos para la edad de la madre al momento del
parto:A¼ menores de 20 años;B¼20–24 años;C¼25–29 años;D¼30–44 años. son los eventosA B C,yD por
pares mutuamente excluyentes?
18Para una determinada población definimos los siguientes eventos con respecto a los niveles de lipoproteínas
plasmáticas (mg=dl):A¼ (10–15);B¼ ð-30Þ;C¼ ð20Þ.son los eventosAyB¿mutuamente excluyentes?Ay ¿C? By
¿C?Explique su respuesta a cada pregunta.
19Consulte el ejercicio 18. Indique con palabras el significado de los siguientes eventos:
20Consulte el ejercicio 18. Indique con palabras el significado de los siguientes eventos:
21Rothenberg et al. (A-13) investigó la eficacia del uso del sonómetro Sahara de Hologic, un dispositivo portátil que
mide la densidad mineral ósea (DMO) en el tobillo, para predecir una fractura. Utilizaron un valor de
densidad mineral ósea estimado por Hologic de 0,57 como punto de corte. Los resultados de la investigación
arrojaron los siguientes datos:
Fractura confirmada
Presente (D) No presentedD- Þ Total
(a)Calcule la sensibilidad de utilizar un valor de DMO de 0,57 como valor límite para predecir fracturas e
interprete sus resultados.
(b)Calcule la especificidad de utilizar un valor de DMO de 0,57 como valor de corte para predecir fracturas e interprete
sus resultados.
90 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD
22Verma et al. (A-14) examinó el uso de la prueba ELISA con heparina-PF4 para la trombocitopenia inducida por heparina
(TIH) en pacientes en estado crítico. Usando el ensayo de liberación de C-serotonina (SRA) como la forma de validar
HIT, los autores encontraron que en 31 pacientes que dieron negativo por SRA, 22 también dieron negativo por
heparina-PF4 ELISA.
(a)Calcule la especificidad de la prueba ELISA de heparina-PF4 para HIT.
(b)Usando una "sensibilidad derivada de la literatura" del 95 por ciento y una probabilidad previa de ocurrencia de HIT como
3.1 por ciento, encuentre el valor predictivo positivo.
(C)Usando la misma información que en la parte (b), encuentre el valor predictivo negativo.
23La sensibilidad de una prueba de detección es .95 y su especificidad es .85. La tasa de la enfermedad para la que se
utiliza la prueba es de 0,002. ¿Cuál es el valor predictivo positivo de la prueba?
Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
Consulte la muestra aleatoria de 800 sujetos del registro de nacimientos de Carolina del Norte que investigamos en los
ejercicios de revisión del Capítulo 2.
1.Cree una tabla que cruce los recuentos de madres en las clasificaciones de si el bebé fue
prematuro o no (PREMIO) y si la madre admitió haber fumado durante el embarazo
(SMOKE) o no.
(a)Encuentre la probabilidad de que una madre en esta muestra admita que fuma.
(b)Encuentre la probabilidad de que una madre en esta muestra haya tenido un bebé prematuro.
(C)Encuentre la probabilidad de que una madre de la muestra haya tenido un bebé prematuro dado que la
madre admitió que fumaba.
(d)Encuentre la probabilidad de que una madre de la muestra haya tenido un bebé prematuro dado que la madre
no admitió fumar.
(mi)Encuentre la probabilidad de que una madre de la muestra haya tenido un bebé prematuro o que la madre
no admitiera que fumaba.
2.Cree una tabla que cruce los conteos del estado civil de cada madre (MATRIMONIO) y si tuvo
un bebé con bajo peso al nacer (BAJO).
(a)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra tenga un bebé con bajo peso al nacer.
(b)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra esté casada.
(C)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra tuviera un hijo con bajo peso al nacer
dado que estaba casada.
(d)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra tuviera un hijo con bajo peso al nacer
dado que no estaba casada.
(mi)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra tuviera un hijo con bajo peso al
nacer y la madre estuviera casada.
REFERENCIAS
Referencias de metodología
1. unLLANGRAMOUtah,Un curso intermedio de probabilidad,Springer-Verlag, Nueva York, 1995.
2. RICHARDISAAC,Los placeres de la probabilidad,Springer-Verlag, Nueva York, 1995.
3. hAROLDJ. L.INCENDIO PROVOCADO,Introducción a la probabilidad,Addison-Wesley, Reading, MA, 1995.
4. LJ SPROMEDIO,Fundamentos de Estadística,Segunda edición revisada, Dover, Nueva York, 1972.
5. AN KOLMOGOROV,Fundamentos de la Teoría de la Probabilidad,Chelsea, Nueva York, 1964 (edición original en alemán
publicada en 1933).
REFERENCIAS 91
Aplicaciones Referencias
A-1. TASHADCARTER, miMANUELAMETRODESHACER, SAGARVPARCAy J.AMÉSLkENNEDY, “La edad temprana de inicio como factor de riesgo
de mala evolución del trastorno bipolar”,Revista de Investigación Psiquiátrica, 37 (2003), 297–303.
A-2. jOHNHPORCERELLI, ROSEMARIOCOGAN, PAGATRICIAP. W.est, miENANOA. R.OSE, DARISTALAMBRECHE, kARÉNE. W.ILSON,
RICHARDKSEVERSON, y DUNÍAkARANA, “Vitimización violenta de mujeres y hombres: síntomas físicos y
psiquiátricos”,Revista de la Junta Estadounidense de Medicina Familiar, 16 (2003), 32–39.
A-3. DanielFERNANDO, ROBERTOFSESPELUZNANTE, jORGEFONTDEVILA, y NÁBILAmiL-BASSEL, “Predictores de compartir drogas
entre usuarios de drogas inyectables en el sur del Bronx: implicaciones para la transmisión del VIH”,Revista de Drogas
Psicoactivas, 35 (2003), 227–236.
A-4. THOMASA. L.AVEÍSTAy unMANÍnorteURU-JETER, “¿La concordancia racial médico-paciente está asociada con una mayor
satisfacción con la atención?”Revista de Salud y Comportamiento Social, 43 (2002), 296–306.
A-5. DA EFURGONETAS, PASCHERR, NR CAceptar, MS ALBERT, HH FUNKENSTEIN, LA SMITO, LEHEBERT, TTWETLE,
LG BRANCHO, M. C.CÓMO, CHHENNEKENS, y JO TAYLOR, "Prevalencia estimada de la enfermedad de Alzheimer en los Estados
Unidos",Trimestral de Milbank, 68 (1990), 267–289.
A-6. THéodoroADORSAYy CLYDEAHOLMOS, "Roturas de menisco en asa de cubo de la rodilla: sensibilidad y especificidad de los signos de
resonancia magnética"Radiología esquelética, 32 (2003), 266–272.
A-7. kONRADOEXLE, LUISABONAFE, y BCOMERSTENMANN, "Observación sobre la utilidad y las tasas de error de la prueba de
alopurinol para detectar la deficiencia leve de ornitina transcarbamilasa",Genética Molecular y Metabolismo, 76 (
2002), 71–75.
A-8. SO BRUSILOW, ALHORIGINAL, “Enzimas del ciclo de la urea”, en: CR SCRIVER, AL BEAUDET, WS SLY, DVTODO
(Editor),Las bases metabólicas y moleculares de las enfermedades hereditarias,8.ª ed., McGraw-Hill, Nueva York, 2001, págs.
1909–1963.
A-9. STEVENSCOUGHLIN, ROBERTOJ. U.HLER, THOMASRCHARDOSy kATERINAMWILSON, “Cáncer de mama y de cuello uterino
Prácticas de detección entre mujeres hispanas y no hispanas que residen cerca de la frontera entre Estados Unidos y
México, 1999–2000”,Salud Familiar y Comunitaria, 26 (2003), 130–139.
A-10. ROBERTOSWOR, SCOTTCOMPTON, FERNVENTRADA, LYNNOSOSKYFARR, SUEkOKKO, REBECCAPAGASCUALy RAYMONDMI.
jACKSON, "Un ensayo controlado aleatorizado de RCP solo con compresión torácica para adultos mayores: un estudio piloto"
Reanimación, 58 (2003), 177–185.
A-11. FRANGOPAGILLMANN, RAFFAELABL ~ gruñir, SABINEBALZUWEIT, ANNETTEHUN ANILLO, y ANDREASMETROARNEROS, "Personalidad
e interacciones sociales en pacientes con psicosis breves agudas”,El Diario de Enfermedades Nerviosas y Mentales, 191 (2003),
503–508.
A-12. AITRPAGARIKH-PAGATEL, mARCAALLEN, WILLIAME. W.BIEN, y el Comité Directivo del Estudio de Maestros de California, “Validación de
los cánceres autoinformados en el Estudio de Maestros de California”,Diario Americano de Epidemiología, 157 (2003), 539–545.
A-13. RALFAJROTHENBERG, jOANLBOYDy J.OHNPHolcomb, "Ultrasonido cuantitativo del calcáneo como herramienta de detección para
detectar osteoporosis: diferentes rangos de referencia para mujeres caucásicas, mujeres afroamericanas y hombres
caucásicos"Revista de Densitometría Clínica, 7 (2004), 101–110.
A-14. ACORRERKVERMA, mARCOLEVINO, StephenJCARTERy J.OHNG KELTON, “Frecuencia de trombocitopenia inducida por herparina
en pacientes en cuidados intensivos,”Farmacoterapia, 23 (2003), 645–753.
CAPÍTULO 4
DISTRIBUCIONES DE PROBABILIDAD
TEMAS
4.1INTRODUCCIÓN
4.2DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES DISCRETAS
92
4.2 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES DISCRETAS 93
4.1 INTRODUCCIÓN
En el capítulo anterior presentamos los conceptos básicos de probabilidad, así como los métodos para
calcular la probabilidad de un evento. Nos basamos en estos conceptos en el presente capítulo y
exploramos formas de calcular la probabilidad de un evento en condiciones algo más complejas. En
este capítulo veremos que la relación entre los valores de una variable aleatoria y las probabilidades
de su ocurrencia se puede resumir por medio de un dispositivo llamadoDistribución de probabilidad.
Una distribución de probabilidad puede expresarse en forma de tabla, gráfico o fórmula. El
conocimiento de la distribución de probabilidad de una variable aleatoria proporciona al clínico y al
investigador una poderosa herramienta para resumir y describir un conjunto de datos y para llegar a
conclusiones sobre una población de datos sobre la base de una muestra de datos extraída de la
población.
DEFINICIÓN
ElDistribución de probabilidadde una variable aleatoria discreta es una tabla, gráfico,
fórmula u otro dispositivo utilizado para especificar todos los valores posibles de una
variable aleatoria discreta junto con sus respectivas probabilidades.
EJEMPLO 4.2.1
En un artículo que aparece en elDiario de la Asociación Dietética Americana,Holben et al. (A-1) analizó el
estado de la seguridad alimentaria en las familias de la región de los Apalaches en el sur de Ohio. El
propósito del estudio fue examinar las tasas de hambre de las familias con niños en un programa local de
Head Start en Athens, Ohio. El instrumento de la encuesta incluía el Módulo de Encuesta de Seguridad
Alimentaria de los Hogares de EE. UU. de 18 preguntas para medir el hambre y la seguridad alimentaria.
Además, se preguntó a los participantes cuántos programas de asistencia alimentaria habían utilizado en los
últimos 12 meses. La Tabla 4.2.1 muestra el número de programas de asistencia alimentaria utilizados por los
sujetos de esta muestra.
Deseamos construir la distribución de probabilidad de la variable discretaX,dónde X¼número
de programas de asistencia alimentaria utilizados por los sujetos del estudio.
1 62
2 47
3 39
4 39
5 58
6 37
7 4
8 11
Total 297
Fuente: Datos proporcionados por cortesía de David H.
Holben, Ph.D. y John P. Holcomb, Ph.D.
1 . 2088
2 . 1582
3 . 1313
4 . 1313
5 . 1953
6 . 1246
7 . 0135
8 . 0370
Total 1.0000
0.25
0.20
0.15
Probabilidad
0.10
0.05
0.00
1 2 3 4 5 6 7 8
X(número de programas de asistencia)
variableX,entonces podemos dar las siguientes dos propiedades esenciales de una distribución de
probabilidad de una variable discreta:
d1Þ 0PAG-PAGdX¼XÞ -1
d2Þ PAGdX¼X¼1; para todosX
El lector también notará que cada una de las probabilidades en la Tabla 4.2.2 es la
frecuencia relativa de ocurrenciadel valor correspondiente deX.
Con su distribución de probabilidad disponible para nosotros, podemos hacer declaraciones de
probabilidad con respecto a la variable aleatoriaX.Ilustramos con algunos ejemplos.
EJEMPLO 4.2.2
¿Cuál es la probabilidad de que una familia seleccionada al azar utilice tres programas de asistencia?
EJEMPLO 4.2.3
¿Cuál es la probabilidad de que una familia seleccionada al azar use uno o dos programas?
Solución: Para responder a esta pregunta, usamos la regla de la suma para eventos mutuamente
excluyentes. Usando la notación de probabilidad y los resultados de la Tabla 4.2.2,
escribimos la respuesta comoPAGd1 [ 2¼PAGd1Þ þPAGd2Þ ¼ :2088þ :1582¼ :3670: &
96 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
1 . 2088
2 . 3670
3 . 4983
4 . 6296
5 . 8249
6 . 9495
7 . 9630
8 1.0000
1.0
0.9
0.8
0.7
0.6
F(X)
0.5
0.4
0.3
0.2
0.1
0.0
1 2 3 4 5 6 7 8
X(número de programas)
FIGURA 4.2.2Distribución de probabilidad acumulada del número de programas de
asistencia entre los sujetos descritos en el Ejemplo 4.2.1.
4.2 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES DISCRETAS 97
EJEMPLO 4.2.4
¿Cuál es la probabilidad de que una familia escogida al azar use dos o menos programas de
asistencia?
EJEMPLO 4.2.5
¿Cuál es la probabilidad de que una familia seleccionada al azar use menos de cuatro programas?
Solución: Dado que una familia que usó menos de cuatro programas usó uno, dos o
tres programas, la respuesta es la probabilidad acumulada de 3. Es decir,
PAGdX <4¼PAGdX -3Þ ¼ :4983. &
EJEMPLO 4.2.6
¿Cuál es la probabilidad de que una familia seleccionada al azar use cinco o más programas?
EJEMPLO 4.2.7
¿Cuál es la probabilidad de que una familia seleccionada al azar use entre tres y cinco
programas, inclusive?
Solución: PAGdX -5Þ ¼ :8249 es la probabilidad de que una familia utilice entre uno y cinco
programas, inclusive. Para obtener la probabilidad de entre tres y cinco
programas, restamos, de .8249, la probabilidad de dos o menos. Usando la
notación de probabilidad, escribimos la respuesta comoPAGd3 -X -5¼PAGdX -5Þ
PAGdX -2Þ ¼ :8249 :3670¼ :4579. &
La distribución de probabilidad dada en la Tabla 4.2.1 se desarrolló a partir de la experiencia real, por
lo que encontrar otra variable que siga esta distribución sería una coincidencia. La probabilidad
98 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
sin embargo, las distribuciones de muchas variables de interés pueden determinarse o asumirse
sobre la base de consideraciones teóricas. En secciones posteriores, estudiamos en detalle tres de
estas distribuciones de probabilidad teóricas: labinomio,elveneno,y elnormal.
EJEMPLO 4.2.8
¿Cuáles son la media, la varianza y la desviación estándar de la distribución del ejemplo 4.2.1?
Solución:
metro¼ ð1Þð:2088Þ þ ð2Þð:1582Þ þ ð3Þð:1313Þ þ s2 þ ð8Þð:0370¼3:5589
¼ ð1 3:5589Þ2d:2088Þ þ ð2 3:5589Þ2d:1582Þ þ ð3 3:5589Þ2d:1313Þ
þ þ ð8 3:5589Þ2d:0370¼3:8559
Por lo tanto, podemos concluir que el número medio de progpag rafimar
ffiffiffiffisffiffiffiuffiffiffitffiiffiffilized fue 3.5589 con un
varianza de 3.8559. La desviación estándar es por lo tanto 3:8559¼1:9637 programas.&
EJERCICIOS
4.2.1.En un estudio de Cross et al. (A-2), a los pacientes que estaban involucrados en el tratamiento de problemas con el juego
se les preguntó acerca de las adicciones concurrentes a las drogas y el alcohol. Sea la variable aleatoria discretaX
representan el número de sustancias adictivas concurrentes utilizadas por los sujetos. La Tabla 4.2.4 resume la
distribución de frecuencias para esta variable aleatoria.
(a)Construya una tabla de la frecuencia relativa y la frecuencia acumulada para esta distribución
discreta.
(b)Construya un gráfico de la distribución de probabilidad y un gráfico que represente la distribución de
probabilidad acumulada para estos datos.
4.2.3.Consulte el Ejercicio 4.2.1. Encuentre la media, la varianza y la desviación estándar de esta distribución de frecuencia.
4.3 LA DISTRIBUCIÓN BINOMIAL 99
0 144
1 342
2 142
3 72
4 39
5 20
6 6
7 9
8 2
9 1
Total 777
1.Cada prueba da como resultado uno de dos resultados posibles, mutuamente excluyentes. Uno de los
posibles resultados se denota (arbitrariamente) como un éxito, y el otro se denota como un fracaso.
EJEMPLO 4.3.1
Estamos interesados en poder calcular la probabilidad deXéxitos ennorteEnsayos de Bernoulli. Por ejemplo,
si examinamos todos los registros de nacimiento del Centro Estatal de Estadísticas de Salud de Carolina del
Norte (A-3) para el año calendario 2001, encontramos que el 85.8 por ciento de los embarazos tuvieron parto
en la semana 37 o más tarde. Nos referiremos a esto como un nacimiento a término. Con ese porcentaje,
podemos interpretar la probabilidad de un nacimiento registrado en la semana 37 o posterior como . 858. Si
seleccionamos al azar cinco registros de nacimiento de esta población, ¿cuál es la probabilidad de que
exactamente tres de los registros sean de nacimientos a término?
100 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
nacimientos a término:
FPFFP
En forma codificada escribiríamos esto como
10110
Dado que la probabilidad de éxito se denota porpagy la probabilidad de falla se
denota porq,la probabilidad de la secuencia anterior de resultados se encuentra por
medio de la regla de la multiplicación para ser
PAGd1; 0; 1; 1; 0¼pqppq¼q2pag3
Número Secuencia
2 11100
3 10011
4 11010
5 11001
6 10101
7 01110
8 00111
9 01011
10 01101
4.3 LA DISTRIBUCIÓN BINOMIAL 101
10d:142Þ2d:858Þ3¼10d:0202Þð:6316Þ ¼ :1276
&
DEFINICIÓN
Una combinación denorteobjetos tomadosXa la vez es un subconjunto desordenado deX del
norteobjetos.
0 norteC0qnorte
0pag0
1 norteC1qnorte
1pag1
2 norteC2qnorte
2pag2
.. ..
. .
X
X CXq Xpag
norte norte
.. ..
. .
nortepagnorte
norte norteCnorteqnorte
Total 1
5! 54321 120
norteC3¼ ¼ ¼ ¼10
3!d5 3Þ! d3 2 1Þð2 1Þ 12
1.FdXÞ -0 para todos los valores reales deX.Esto se sigue del hecho de quenorteypagson no
negativos y, por lo tanto,norteCX;pagX, yd1pagÞnxson todas no negativas y, por lo tanto,
su producto es mayor o igual a cero. PAG
PAG
2. FdX¼1. Esto se ve como cierto si reconocemos que norteCXqnxpagXes igual a
½ð1pagÞ þpagnorte¼1norte¼1, la conocida expansión binomial. Si el binomiodqþpagÞnortese
expande, tenemos
nortednorte 1Þ
dqþ pag¼q
Þnorte norteþn qnorte
1pag1
þ qnorte 2 pag2þ þn q1pagnorte 1þpagnorte
2
Si comparamos los términos de la expansión, término por término, con elFdXÞen la Tabla 4.3.1
vemos que son, término por término, equivalentes, ya que
Fd0¼norteC0qnorte0pag0¼qnorte
Fd1¼norteC1qnorte1pag1¼n qnorte1pag
4.3 LA DISTRIBUCIÓN BINOMIAL 103
2 nortednorte 1Þq 2
Fd2¼ norteC 2q
norte
2pag¼ norte2pag
2
.. .. ..
. . .
norte norte
Fdnorte¼ norteC norteq nortepagnorte¼pag
EJEMPLO 4.3.2
Como otro ejemplo del uso de la distribución binomial, los datos del Centro Estatal de Estadísticas de
Salud de Carolina del Norte (A-3) muestran que el 14 por ciento de las madres admitieron fumar uno o
más cigarrillos por día durante el embarazo. Si se selecciona una muestra aleatoria de tamaño 10 de
esta población, ¿cuál es la probabilidad de que contenga exactamente cuatro madres que admitieron
haber fumado durante el embarazo?
Solución: Consideramos que la probabilidad de que una madre admita que fuma es .14. Usando la
Ecuación 4.3.2 encontramos
6
Fd4¼ 10C4d:86Þ ð:14Þ4
10!
¼ d:4045672Þð:0003842Þ
4!6!
¼ :0326 &
Tabla BinomialEl cálculo de una probabilidad usando la Ecuación 4.3.2 puede ser una tarea
tediosa si el tamaño de la muestra es grande. Afortunadamente, las probabilidades para
diferentes valores denorte, pag,yXhan sido tabulados, de modo que solo necesitamos consultar
una tabla apropiada para obtener la probabilidad deseada. La Tabla B del Apéndice es una de
las muchas tablas disponibles. Da la probabilidad de queXes menor o igual a algún valor
especificado. Es decir, la tabla da las probabilidades acumulativas deX¼0 hasta cierto número
positivo especificado de éxitos.
Ilustremos el uso de la tabla usando el Ejemplo 4.3.2, donde se deseaba encontrar la
probabilidad de queX¼4 cuandonorte¼10 ypag¼ :14. Basándonos en nuestro conocimiento de
las distribuciones de probabilidad acumulada de la sección anterior, sabemos quePAGdX¼4Þse
puede encontrar restandoPAGdX -3ÞdePAGdX -4Þ.Si en la tabla B ubicamospag¼ :14 para norte
¼10, encontramos quePAGdX -4Þ ¼ :9927 yPAGdX -3Þ ¼ :9600. Restando el último del primero
da: 9927: 9600¼ :0327, que casi concuerda con nuestro cálculo manual (discrepancia debido al
redondeo).
Con frecuencia nos interesa determinar probabilidades, no valores específicos de
X,pero para intervalos tales como la probabilidad de queXestá entre, digamos, 5 y 10. Ilustremos con
un ejemplo.
EJEMPLO 4.3.3
Suponga que se sabe que el 10 por ciento de cierta población es daltónico. Si se extrae una muestra
aleatoria de 25 personas de esta población, use la Tabla B en el Apéndice para encontrar la
probabilidad de que:
Uso de la tabla B cuandopag > :5La tabla B no da probabilidades para los valores depag
mayor que .5. Sin embargo, podemos obtener probabilidades de la Tabla B, replanteando el
problema en términos de la probabilidad de una falla, 1pag,en lugar de en términos de la
probabilidad de éxito,pag.Como parte de la reafirmación, también debemos pensar en
términos del número de fallas,no,en lugar del número de éxitos,X.Podemos resumir esta idea
de la siguiente manera:
PAGdX¼Xjnorte; pag > :50¼PAGdX¼nxjnorte;1pagÞ (4.3.3)
En palabras, la Ecuación 4.3.3 dice: “La probabilidad de queXes igual a algún valor especificado
dado el tamaño de la muestra y una probabilidad de éxito mayor que .5 es igual a la
probabilidad de queXes igual anxdado el tamaño de la muestra y la probabilidad de falla de 1
pag:"A los efectos de utilizar la tabla binomial, tratamos la probabilidad de falla como si fuera la
probabilidad de éxito. Cuandopages mayor que .5, podemos obtener probabilidades
acumulativas de la Tabla B usando la siguiente relación:
Finalmente, usar la Tabla B para encontrar la probabilidad de queXes mayor o igual a algunaXcuando
PAG > :5, usamos la siguiente relación:
EJEMPLO 4.3.4
Según una encuesta de junio de 2003 realizada por el proyecto Massachusetts Health Benchmarks
(A-4), aproximadamente el 55 por ciento de los residentes respondieron “problema grave” a la
pregunta: “Algunas personas piensan que la obesidad infantil es un problema de salud nacional. ¿Qué
opinas? ¿Es un problema muy serio, algo problemático, no muy problemático o no es un problema en
absoluto?”. Suponiendo que la probabilidad de dar esta respuesta a la pregunta es .55 para cualquier
residente de Massachusetts, use la Tabla B para encontrar la probabilidad de que si se eligen 12
residentes al azar:
La Figura 4.3.1 proporciona una representación visual de la solución a las tres partes del
Ejemplo 4.3.4.
FIGURA 4.3.1Representación esquemática de las soluciones del Ejemplo 4.3.4 (los números relevantes de éxitos y
fracasos en cada caso están encerrados en un círculo).
que cuandonortees pequeño en relación conNORTE,el modelo binomial es apropiado. Algunos escritores dicen que nortees
pequeño en relación connortesinortees al menos 10 veces más grande quenorte.
La mayoría de los programas de software estadístico permiten el cálculo de probabilidades
binomiales con una computadora personal. EXCEL, por ejemplo, se puede usar para calcular probabilidades
individuales o acumulativas para valores específicos dex, n,ypag.Supongamos que deseamos encontrar las
probabilidades individuales paraX¼0 a travésX¼6 cuandonorte¼6 ypag¼ :3. Ingresamos los números del 0 al
6 en la Columna 1 y procedemos como se muestra en la Figura 4.3.2. Podemos seguir un procedimiento
similar para encontrar las probabilidades acumuladas. Para esta ilustración, usamos MINITAB y colocamos
los números del 1 al 6 en la Columna 1. Procedemos como se muestra en la Figura 4.3.3.
0 0.117649
1 0.302526
2 0.324135
3 0.185220
4 0.059535
5 0.010206
6 0.000729
Datos:
C1: 0 1 2 3 4 5 6
ElegirProbabilidad acumulada.Tipo6enNúmero de
intentos.Tipo0.3enProbabilidad de éxito.Elegir Columna de
entraday tipoC1.Hacer clicDE ACUERDO.
Producción:
X P( X < X)
0.00 0.1176
1.00 0.4202
2.00 0.7443
3.00 0.9295
4.00 0.9891
5.00 0.9993
6.00 1.0000
EJERCICIOS
En cada uno de los siguientes ejercicios, suponga quenortees lo suficientemente grande en relación connorteque la
distribución binomial puede usarse para encontrar las probabilidades deseadas.
4.3.1Según los datos recopilados por el Centro Nacional de Estadísticas de Salud y puestos a disposición del público en la base
de datos Sample Adult (A-5), una estimación del porcentaje de adultos a los que en algún momento de su vida se les
ha dicho que tienen hipertensión es 23,53. por ciento. Si seleccionamos una muestra aleatoria simple de 20
adultos estadounidenses y suponga que la probabilidad de que a cada uno le hayan dicho que tiene hipertensión es
. 24, encuentre la probabilidad de que el número de personas en la muestra a las que se les ha dicho que
tienen hipertensión sea:
4.3.2Consulte el Ejercicio 4.3.1. ¿Cuántos adultos a los que se les ha dicho que tienen hipertensión esperaría
encontrar en una muestra de 20?
4.3.3Consulte el Ejercicio 4.3.1. Supongamos que seleccionamos una muestra aleatoria simple de cinco adultos. Utilice la Ecuación 4.3.2
para encontrar la probabilidad de que, en la muestra, el número de personas a las que se les ha dicho que tienen hipertensión
sea:
4.3.4La misma base de datos de encuestas citada en el ejercicio 4.3.1 (A-5) muestra que el 32 por ciento de los adultos estadounidenses
indicaron que se han hecho la prueba del VIH en algún momento de su vida. Considere una muestra aleatoria simple de 15
adultos seleccionados en ese momento. Encuentre la probabilidad de que el número de adultos que han sido examinados para
El VIH en la muestra sería:
(a)Tres (b)menos de cinco
(C)Entre cinco y nueve, inclusive (d)Más de cinco, pero menos de 10
(mi)seis o más
4.3.5Consulte el Ejercicio 4.3.4. Encuentre la media y la varianza del número de personas a las que se les hizo la prueba del VIH en muestras de
tamaño 15.
4.3.6Consulte el Ejercicio 4.3.4. Supongamos que tomáramos una muestra aleatoria simple de 25 adultos hoy y encontráramos que dos
se han hecho la prueba del VIH en algún momento de su vida. ¿Sería sorprendente estos resultados? ¿Por qué o por qué no?
4.3.7Coughlin et al. (A-6) estimó que el porcentaje de mujeres que viven en condados fronterizos a lo largo del sur de los
Estados Unidos con México (condados designados en California, Arizona, Nuevo México y Texas) que tienen menos de
una educación secundaria es 18.7. Suponga que la probabilidad correspondiente es .19. Supongamos que
seleccionamos tres mujeres al azar. Encuentre la probabilidad de que el número con menos de una educación
secundaria sea:
4.3.8En una encuesta de estudiantes de enfermería que cursan una maestría, el 75 por ciento afirmó que espera ser
promovido a un puesto más alto dentro de un mes después de recibir el título. Si este porcentaje se cumple para toda
la población, encuentre, para una muestra de 15, la probabilidad de que el número que espera una promoción dentro
de un mes después de recibir su título sea:
4.3.9Dado el binomioPAG
todos los parámetrospag¼ :8 ynorte¼3, muestre por medio de la expansión binomial dada en
Tabla 4.3.1 que FdX¼1.
modelo de probabilidad en biología y medicina. Haight (1) presenta un catálogo bastante extenso de
tales aplicaciones en el Capítulo 7 de su libro.
SiXes el número de ocurrencias de algún evento aleatorio en un intervalo de tiempo o espacio
(o algún volumen de materia), la probabilidad de queXocurrirá está dada por
miyoyoX
FdX¼ ; X¼0; 1; 2; . . . (4.4.1)
¡X!
Cuándo usar el modelo de PoissonLa distribución de Poisson se emplea como modelo cuando
se realizan recuentos de eventos o entidades que se distribuyen aleatoriamente en el espacio o
el tiempo. Uno puede sospechar que cierto proceso obedece a la ley de Poisson, y bajo esta
suposición se pueden calcular las probabilidades de ocurrencia de eventos o entidades dentro
de alguna unidad de espacio o tiempo. Por ejemplo, bajo los supuestos de que la distribución
de algún parásito entre los miembros individuales del huésped sigue la ley de Poisson, uno
puede, con el conocimiento del parámetroyo,calcular la probabilidad de que un huésped
individual seleccionado al azar produzcaXnúmero de parásitos. En un capítulo posterior
aprenderemos cómo decidir si es plausible la suposición de que un proceso específico obedece
a la ley de Poisson. Un uso adicional de la distribución de Poisson en la práctica ocurre cuando
nortees grande ypages pequeño. En este caso, la distribución de Poisson se puede utilizar para
1Para simplificar, la distribución de Poisson se analiza en términos de intervalos, pero se implican otras unidades, como el
volumen de materia.
110 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
miyoyoX
norteCXpagXqnx ;X¼0; 1; 2; . . .
¡X!
dóndeyo¼notario público:
EJEMPLO 4.4.1
En un estudio de anafilaxia inducida por fármacos entre pacientes que tomaban bromuro de
rocuronio como parte de su anestesia, Laake y Røttingen (A-7) encontraron que la aparición de
anafilaxia seguía un modelo de Poisson conyo¼12 incidentes por año en Noruega. Encuentre la
probabilidad de que en el próximo año, entre los pacientes que reciben rocuronio, exactamente tres
experimenten anafilaxia.
mi12123
PAGdX¼3¼ ¼ :00177
3! &
EJEMPLO 4.4.2
Consulte el Ejemplo 4.4.1. ¿Cuál es la probabilidad de que al menos tres pacientes en el próximo
año experimenten anafilaxia si se administra rocuronio con anestesia?
Solución: Podemos usar el concepto de eventos complementarios en este caso. DesdePAGdX -2Þ
es el complemento dePAGdX -3Þ,tenemos
En los ejemplos anteriores, las probabilidades se evaluaron directamente a partir de la ecuación. Sin
embargo, podemos usar la Tabla C del Apéndice, que da probabilidades acumulativas para varios
valores deyoyX.
EJEMPLO 4.4.3
En el estudio de cierto organismo acuático, se tomó una gran cantidad de muestras de un
estanque y se contó la cantidad de organismos en cada muestra. El número promedio de
4.4 LA DISTRIBUCIÓN DE POISSON 111
Se encontró que los organismos por muestra eran dos. Suponiendo que el número de organismos sigue una
distribución de Poisson, encuentre la probabilidad de que la siguiente muestra contenga uno o menos
organismos.
Solución: En la tabla C vemos que cuandoyo¼2, la probabilidad de queX -1 es .406. Eso es,
PAGdX -1j2Þ ¼ :406. &
EJEMPLO 4.4.4
Consulte el Ejemplo 4.4.3. Encuentre la probabilidad de que la próxima muestra que se tome contenga exactamente
tres organismos.
Solución:
Datos:
C1: 0 1 2 3 4 5 6
Producción:
X P( X X)
0.00 0.4966
1.00 0.3476
2.00 0.1217
3.00 0.0284
4.00 0.0050
5.00 0.0007
6.00 0.0001
EJEMPLO 4.4.5
Consulte el Ejemplo 4.4.3. Encuentre la probabilidad de que la próxima muestra que se tome contenga más
de cinco organismos.
Solución: Dado que el conjunto de más de cinco organismos no incluye cinco, estamos
preguntando por la probabilidad de que se observen seis o más organismos. Esto
se obtiene restando de uno la probabilidad de observar cinco o menos. Eso es,
Las probabilidades de Poisson se pueden obtener de la mayoría de los paquetes de software estadístico. Para ilustrar
el uso de MINITAB para este propósito, suponga que deseamos encontrar las probabilidades individuales paraX¼0 a
travésX¼6 cuandoyo¼ :7. Introducimos los valores deXen la Columna 1 y proceda como se muestra en la Figura 4.4.1.
Obtenemos las probabilidades acumuladas para los mismos valores deXyyo como se muestra en la Figura 4.4.2.
EJERCICIOS
4.4.1Singh et al. (A-8) analizó la aparición de hemangioma capilar retiniano (RCH) en pacientes con enfermedad de
von Hippel-Lindau (VHL). El RCH es un tumor vascular benigno de la retina. Usando una revisión retrospectiva
de una serie de casos consecutivos, los investigadores encontraron que la cantidad de tumores RCH
4.5 DISTRIBUCIONES DE PROBABILIDAD CONTINUA 113
incidentes siguieron una distribución de Poisson conyo¼4 tumores por ojo para pacientes con VHL. Utilizando este
modelo, encuentre la probabilidad de que en un paciente con VHL seleccionado al azar:
(a)Hay exactamente cinco casos de tumores por ojo.
(b)Hay más de cinco casos de tumores por ojo.
(C)Hay menos de cinco casos de tumores por ojo.
(d)Hay entre cinco y siete casos de tumores por ojo, inclusive.
4.4.2Tubert-Bitter et al. (A-9) encontró que la cantidad de reacciones gastrointestinales graves informadas al Comité
Británico de Seguridad de la Medicina fue de 538 para 9 160 000 recetas del fármaco antiinflamatorio
piroxicam. Esto corresponde a una tasa de 0,058 reacciones gastrointestinales por cada 1000 recetas escritas.
Usando un modelo de Poisson para la probabilidad, conyo¼ :06, encuentre la probabilidad de
(a)Exactamente una reacción gastrointestinal en 1000 recetas
(b)Exactamente dos reacciones gastrointestinales en 1000 recetas
(C)Sin reacciones gastrointestinales en 1000 prescripciones
(d)Al menos una reacción gastrointestinal en 1000 prescripciones
4.4.3Si la media de accidentes graves por año en una fábrica grande (donde el número de empleados se
mantiene constante) es cinco, encuentre la probabilidad de que en el año actual haya:
4.4.4En un estudio de la efectividad de un insecticida contra cierto insecto, se roció una gran área de tierra. Posteriormente, se
examinó el área en busca de insectos vivos seleccionando cuadrados al azar y contando el número de insectos vivos
por cuadrado. La experiencia pasada ha demostrado que el número promedio de insectos vivos por cuadrado
después de rociar es de 0,5. Si el número de insectos vivos por cuadrado sigue una distribución de Poisson, encuentre
la probabilidad de que un cuadrado seleccionado contenga:
4.4.5En una determinada población se diagnostican una media de 13 nuevos casos de cáncer de esófago cada año. Si
la incidencia anual de cáncer de esófago sigue una distribución de Poisson, encuentre la probabilidad de que
en un año determinado el número de casos nuevos de cáncer de esófago sea:
4.5 DISTRIBUCIONES DE
PROBABILIDAD CONTINUA
Imagine ahora la situación en la que el número de valores de nuestra variable aleatoria es muy
grande y el ancho de nuestros intervalos de clase se hace muy pequeño. El histograma resultante podría
parecerse al que se muestra en la Figura 4.5.1.
Si tuviéramos que conectar los puntos medios de las celdas del histograma en la Figura 4.5.1 para
formar un polígono de frecuencia, claramente tendríamos una figura mucho más suave que el polígono de
frecuencia de la Figura 2.3.4.
En general, como el número de observaciones,norte,tiende a infinito, y el ancho de los
intervalos de clase tiende a cero, el polígono de frecuencia tiende a una curva suave como la
que se muestra en la Figura 4.5.2. Estas curvas suaves se utilizan para representar gráficamente
las distribuciones de variables aleatorias continuas. Esto tiene algunas consecuencias
importantes cuando tratamos con distribuciones de probabilidad. Primero, el área total bajo la
curva es igual a uno, como ocurría con el histograma, y la frecuencia relativa de aparición de
valores entre dos puntos cualesquiera de laX-eje es igual al área total delimitada por la curva, el
X-eje, y líneas perpendiculares erigidas en los dos puntos en elX-eje. Ver Figura 4.5.3. El
F(X)
X
FIGURA 4.5.1Un histograma resultante de una gran cantidad de valores y
pequeños intervalos de clase.
4.5 DISTRIBUCIONES DE PROBABILIDAD CONTINUA 115
F(X)
X
FIGURA 4.5.2Representación gráfica de una distribución
continua.
Probabilidad decualquier valor específicode la variable aleatoria escero.Esto parece lógico, ya que un
valor específico está representado por un punto en laX-eje y el área sobre un punto es cero.
Encontrar el área bajo una curva suaveCon un histograma, como hemos visto,
Las subáreas de interés se pueden encontrar agregando áreas representadas por las celdas. No
tenemos celdas en el caso de una curva suave, por lo que debemos buscar un método alternativo
para encontrar subáreas. Tal método es proporcionado por el cálculo integral. Para encontrar el área
bajo una curva suave entre dos puntosayb,elfunción de densidadse integra deaab.Afunción de
densidades una fórmula utilizada para representar la distribución de una variable aleatoria continua.
La integración es el caso límite de la suma, pero no realizaremos ninguna integración, ya que el nivel
de matemáticas involucrado está más allá del alcance de este libro. Como veremos más adelante,
para todas las distribuciones continuas que consideraremos, habrá una manera más fácil de
encontrar áreas bajo sus curvas.
Aunque la definición de una distribución de probabilidad para una variable aleatoria
continua está implícita en la discusión anterior, a modo de resumen, la presentamos de forma
más compacta como sigue.
DEFINICIÓN
Una función no negativaf(x)se llama distribución de probabilidad (a veces
llamada función de densidad de probabilidad) de la variable aleatoria
continuaXsi el área total delimitada por su curva y elX -eje es igual a 1 y si el
subárea bajo la curva delimitada por la curva, el X -eje y perpendiculares
erigidas en dos puntos cualesquieraaybdar la probabilidad de queXesta entre
los puntosayb.
F(X)
a b X
FIGURA 4.5.3Gráfica de una distribución continua que
muestra el área entreayb.
116 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
Así, la probabilidad de que una variable aleatoria continua asuma valores entrea ybse
denota porPAGdun < X < segundoÞ.
1
FdXÞ ¼ pffiffiffiffiffimidXmetroÞ2=2s2; 1 <X <1 (4.6.1)
2PD
En la Ecuación 4.6.1,pagymison las constantes familiares, 3.14159 . . . y 2.71828
. . . , respectivamente, que se encuentran con frecuencia en matemáticas. Los dos parámetros de la
distribución sonmetro,la media, ys,la desviación estándar. Para nuestros propósitos podemos pensar
enmetroysde una distribución normal, respectivamente, como medidas de tendencia central y
dispersión, como se analiza en el Capítulo 2. Sin embargo, dado que una variable aleatoria con
distribución normal es continua y toma valores entre1yþ1,su media y desviación estándar pueden
definirse más rigurosamente; pero tales definiciones no pueden darse sin usar el cálculo. El gráfico de
la distribución normal produce la familiar curva en forma de campana que se muestra en la Figura
4.6.1.
1.es simétrica respecto a su media,metro.Como se muestra en la Figura 4.6.1, la curva a cada lado
demetroes una imagen especular del otro lado.
2.La media, la mediana y la moda son todas iguales.
3.El área total bajo la curva por encima de laX-eje es una unidad cuadrada. Esta característica
se deriva del hecho de que la distribución normal es una distribución de probabilidad.
Debido a la simetría ya mencionada, el 50 por ciento del área está a la derecha de una
perpendicular erigida en el medio y el 50 por ciento está a la izquierda.
m X
FIGURA 4.6.1Gráfico de una distribución normal.
4.6 LA DISTRIBUCIÓN NORMAL 117
. 68
. 16 1σ 1σ.dieciséis
m_1σ m m+1σ X
(a)
. 95
. 025 . 025
2σ 2σ
m_2σ m m+2σ X
(b)
. 997
. 0015 3σ 3σ . 0015
m_3σ m m+3σ X
(C)
FIGURA 4.6.2Subdivisión del área bajo la curva normal (las áreas son
aproximadas).
m1 m2 m3 X
m1<m2<m3
FIGURA 4.6.3Tres distribuciones normales con diferentes medias pero la misma cantidad de
variabilidad.
σ1
σ2
σ3
σ1<σ2<σ3 X
FIGURA 4.6.4 Tres distribuciones normales con diferentes desviaciones estándar pero la
misma media.
z¼ ðXmetroÞ=s (4.6.2)
1
FdzÞ ¼ pffiffiffiffiffimiz2=2; 1 <z <1 (4.6.3)
2pag
σ=1
m=0 z
FIGURA 4.6.5La distribución normal estándar.
0 z0 z
Para encontrar la probabilidad de queztoma un valor entre dos puntos cualesquiera de laz-eje,
digamos,z0yz1, debemos encontrar el área delimitada por las perpendiculares erigidas en estos
puntos, la curva y el eje horizontal. Como mencionamos anteriormente, las áreas bajo la curva de una
distribución continua se encuentran integrando la función entre dos valores de la variable. En el caso
de la normal estándar, entonces, para encontrar el área entrez0yz1directamente, necesitaríamos
evaluar la siguiente integral:
Zz1
1
pffiffiffiffiffimiz2=2dz
z0 2pag
Aunque no existe una solución de forma cerrada para la integral, podemos usar métodos
numéricos de cálculo para aproximar las áreas deseadas debajo de la curva con la precisión
deseada. Afortunadamente, no tenemos que preocuparnos por tales asuntos, ya que hay tablas
disponibles que brindan los resultados de cualquier integración en la que podamos estar
interesados. La Tabla D en el Apéndice es un ejemplo de estas tablas. En el cuerpo de la Tabla D
se encuentran las áreas bajo la curva entre1y los valores dezse muestra en la columna más a la
izquierda de la tabla. El área sombreada de la Figura 4.6.6 representa el área listada en la tabla
como entre1yz0, dóndez0es el valor especificado dez.
Ahora ilustramos el uso de la Tabla D con varios ejemplos.
EJEMPLO 4.6.1
Dada la distribución normal estándar, encuentre el área bajo la curva, arriba de
laz-eje entrez¼ 1yz¼2.
120 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
0 2 z
FIGURA 4.6.7La distribución normal estándar que muestra el
área entrez¼ 1yz¼2.
Solución: Será útil hacer un dibujo de la distribución normal estándar y sombrear el área
deseada, como en la Figura 4.6.7. si ubicamosz¼2 en la Tabla D y leemos la
entrada correspondiente en el cuerpo de la tabla, encontramos que el área
deseada es .9772. Podemos interpretar esta zona de varias maneras. Podemos
interpretarlo como la probabilidad de que unzelegidos al azar de la población de
z's tendrá un valor entre1y 2. También podemos interpretarlo como la frecuencia
1yese
relativa de ocurrencia (o proporción) de valores dezentre 2, o podemos
97,72 decir
por ciento de
losz's tiene un valor entre 1y 2. &
EJEMPLO 4.6.2
¿Cuál es la probabilidad de que unzelegidos al azar de la población dez's tendrá
un valor entre 2:55 yþ2:55?
Solución: La Figura 4.6.8 muestra el área deseada. La tabla D nos da el área entre1 y 2,55,
que se encuentra ubicando 2,5 en la columna más a la izquierda de la tabla y
luego moviéndose hasta llegar a la entrada en la columna encabezada por 0,05.
Encontramos que esta área es .9946. Si miramos el dibujo que dibujamos, vemos
que esta es más área de la deseada. Necesitamos restar de .9946 el área a la
izquierda de 2:55. La referencia a la Tabla D muestra que el área a la izquierda de
2:55 es .0054. Por lo tanto, la probabilidad deseada es
_2.55 0 2.55 X
FIGURA 4.6.8 Curva normal estándar que muestra
PAGd2:55 <z <2:55Þ. &
4.6 LA DISTRIBUCIÓN NORMAL 121
_2.74 0 1.53 z
FIGURA 4.6.9Curva normal estándar que muestra la proporción de
zvalores entrez¼2:74 yz¼1:53.
Supongamos que nos piden encontrar la probabilidad de quezes entre 2:55 y 2:55
inclusive. La probabilidad deseada se expresa comoPAGd2:55 -z-2:55Þ.Dado que, como
señalamos en la Sección 4.5,PAGdz¼z0¼0;PAGd2:55 -z-2:55¼PAGd2:55 <z <2:55Þ ¼ :9892.
EJEMPLO 4.6.3
¿Qué proporción dezlos valores están entre 2:74 y 1.53?
Solución:La Figura 4.6.9 muestra el área deseada. Encontramos en la tabla D que el área entre
1y 1.53 es .9370, y el área entre1y 2:74 es .0031. Para obtener la
probabilidad deseada restamos .0031 de .9370. Eso es,
PAGd2:74 -z-1:53Þ ¼ :9370 :0031¼ :9339 &
EJEMPLO 4.6.4
Dada la distribución normal estándar, encuentrePAGdz-2:71Þ.
¼1 :9966
¼ :0034
0 2.71 z
FIGURA 4.6.10Distribución normal estándar que muestra
PAGdz-2:71Þ.
&
122 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
EJEMPLO 4.6.5
Dada la distribución normal estándar, encuentrePAGd:84 -z-2:45Þ.
¼ :9929 :7995
¼ :1934
0 .84 2.45 z
FIGURA 4.6.11Curva normal estándar que muestra
PAGd:84 -z-2:45Þ.
&
EJERCICIOS
Hay varias otras razones por las que la distribución normal es tan importante en las
estadísticas, y éstas se considerarán a su debido tiempo. Por ahora, veamos cómo podemos
responder preguntas simples de probabilidad sobre variables aleatorias cuando sabemos, o estamos
dispuestos a suponer, que tienen, al menos, una distribución aproximadamente normal.
EJEMPLO 4.7.1
El Uptimer es un monitor de actividad liviano hecho a medida que funciona con baterías y que registra la
cantidad de tiempo que una persona pasa en posición vertical. En un estudio de niños de 8 a 15 años,
Eldridge et al. (A-10) estudió a 529 niños con un desarrollo normal, cada uno de los cuales usó el Uptimer
continuamente durante un período de 24 horas que incluía un día escolar típico. Los investigadores
encontraron que la cantidad de tiempo que los niños pasaban en posición vertical seguía una distribución
normal con una media de 5,4 horas y una desviación estándar de 1,3 horas. Suponga que este hallazgo se
aplica a todos los niños de 8 a 15 años de edad. Encuentre la probabilidad de que un niño seleccionado al
azar pase menos de 3 horas en posición vertical en un período de 24 horas.
σ=1.3
X
3.0 m=5.4
FIGURA 4.7.1 Distribución normal para aproximar
distribución de la cantidad de tiempo que los niños pasan en
posición vertical (media y desviación estándar estimada).
124 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
σ=1.3
X
3.0 5.4
σ=1
_ 1.85 z
0
FIGURA 4.7.2Distribución normal del tiempo de permanencia en posición vertical
(X)y la distribución normal estándar (z).
3:0 5:4
z¼ ¼ 1:85
1:3
Examinemos estas relaciones más de cerca. Se ve que la distancia de la media, 5.4, a laX-
valor de interés, 3.0, es 3:0 5:4¼2:4, que es una distancia de 1,85 desviaciones estándar.
cuando nos transformamosXvalores azvalores, la distancia delzvalor de interés de su
media, 0, es igual a la distancia de la correspondienteXvalor de su media, 5,4, en unidades
de desviación estándar. Hemos visto que esta última distancia es de 1,85 desviaciones
estándar. En elzdistribución, una desviación estándar es igual a 1 y, en consecuencia, el
punto en lazescala situada a una distancia de 1,85 desviaciones estándar por debajo de 0
esz¼1:85, el resultado obtenido al emplear la fórmula. Por consulta
4.7 APLICACIONES DE DISTRIBUCIÓN NORMAL 125
En la tabla D, encontramos que el área a la izquierda dez¼1:85 es .0322. Podemos resumir esta discusión de
la siguiente manera:
3:0 5:4
PAGdX <3:0¼PAG z< ¼PAGdz < 1:85Þ ¼ :0322
1:3
Para responder a la pregunta original, decimos que la probabilidad es .0322 de que un niño seleccionado al
azar tenga un tiempo de actividad de menos de 3.0 horas.
EJEMPLO 4.7.2
Diskin et al. (A-11) estudió los metabolitos comunes del aliento, como el amoníaco, la acetona,
el isopreno, el etanol y el acetaldehído, en cinco sujetos durante un período de 30 días. Cada
día, se tomaron muestras de aliento y se analizaron temprano en la mañana al llegar al
laboratorio. Para el sujeto A, una mujer de 27 años, la concentración de amoníaco en partes por
billón (ppb) siguió una distribución normal durante 30 días con media 491 y desviación estándar
119. ¿Cuál es la probabilidad de que en un día aleatorio, el amoníaco del sujeto concentración
está entre 292 y 649 ppb?
292 491
z¼ ¼ 1:67
119
σ=119
σ=1
_1.67 0 1.33 z
FIGURA 4.7.3Distribución de la concentración de amoníaco (X)y la
distribución normal estándar correspondiente (z).
126 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
649 491
z¼ ¼1:33
119
¼ :9082 :0475
¼ :8607
EJEMPLO 4.7.3
En una población de 10 000 de los niños descritos en el ejemplo 4.7.1, ¿cuántos esperaría
que estuvieran de pie más de 8,5 horas?
8:5 5:4
PAGdX -8:5¼PAG z- ¼PAGdz-2:38¼1 :9913¼ :0087
1:3
Podemos usar MINITAB para calcular las probabilidades normales estándar acumulativas. Suponga
que deseamos encontrar las probabilidades acumuladas para los siguientes valores dez:
3; 2; 1; 0; 1; 2; y 3. Introducimos los valores dezen la Columna 1 y proceda como se muestra
en la Figura 4.7.4.
Las dos secciones anteriores se centraron ampliamente en la distribución normal, la
distribución de probabilidad continua más importante y utilizada con mayor frecuencia. Aunque
gran parte de lo que se tratará en los siguientes capítulos utiliza esta distribución, no es la única
distribución de probabilidad continua importante. Presentaremos varias otras distribuciones
continuas más adelante en el texto, a saber, ladistribución t,eldistribución de chi-cuadrado,y el
Distribución F.Los detalles de estas distribuciones se discutirán en los capítulos en los que los
necesitemos para pruebas inferenciales.
EJERCICIOS 127
Datos:
C1: -3 -2 -1 0 1 2 3
Producción:
X PAG(X < X)
3.0000 0.0013
2.0000 0.0228
1.0000 0.1587
0.0000 0.5000
1.0000 0.8413
2.0000 0.9772
3.0000 0.9987
EJERCICIOS
4.7.1Para otro sujeto (un hombre de 29 años) en el estudio de Diskin et al. (A-11), los niveles de acetona se distribuyeron
normalmente con una media de 870 y una desviación estándar de 211 ppb. Encuentre la probabilidad de que en un
día dado el nivel de acetona del sujeto sea:
(a)Entre 600 y 1000 ppb
(b)Más de 900 ppb
(C)Menos de 500 ppb
(d)Entre 900 y 1100 ppb
4.7.2En el estudio de las huellas dactilares, una característica cuantitativa importante es el recuento total de crestas de los 10
dedos de un individuo. Suponga que los recuentos totales de crestas de los individuos de una determinada población
tienen una distribución aproximadamente normal con una media de 140 y una desviación estándar de 50. Halle la
probabilidad de que un individuo elegido al azar de esta población tenga un recuento de crestas de:
(a)200 o más
(b)Menos de 100
128 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
4.7.3Una de las variables recopiladas en los datos del Registro de Nacimientos de Carolina del Norte (A-3) son las libras
ganadas durante el embarazo. De acuerdo con los datos de todo el registro de 2001, la cantidad de libras ganadas
durante el embarazo se distribuyó de forma aproximadamente normal con una media de 30,23 libras y una
desviación estándar de 13,84 libras. Calcule la probabilidad de que una madre seleccionada al azar en Carolina del
Norte en 2001 ganara:
4.7.4Suponga que la duración promedio de la estadía en un hospital para enfermedades crónicas de cierto tipo de paciente es de 60 días
con una desviación estándar de 15. Si es razonable suponer una distribución aproximadamente normal de la duración de la
estadía, encuentre la probabilidad de que un paciente seleccionado al azar de este grupo tendrá un tiempo de permanencia:
4.7.5Si los valores de colesterol total para cierta población tienen una distribución aproximadamente normal con una
media de 200 mg = 100 ml y una desviación estándar de 20 mg = 100 ml, encuentre la probabilidad de que un
individuo elegido al azar de esta población tenga un valor de colesterol :
4.7.6Dada una población distribuida normalmente con una media de 75 y una varianza de 625, encuentre:
4.7.7Los pesos de cierta población de mujeres adultas jóvenes tienen una distribución aproximadamente normal con
una media de 132 libras y una desviación estándar de 15. Calcule la probabilidad de que un sujeto
seleccionado al azar de esta población pese:
4.8 RESUMEN
Fórmula
Número Nombre Fórmula
PAG
4.2.1 Media de una distribución de metro¼ XPdXÞ
frecuencias
PAG
4.2.2 Varianza de una distribución s2¼ dX metroÞ2pagdXÞ
de frecuencias o PAG
s2¼ X pagdXÞ 2 metro2
1.¿Qué es una variable aleatoria discreta? Dé tres ejemplos que sean de interés para el profesional de la
salud.
2.¿Qué es una variable aleatoria continua? Dé tres ejemplos de interés para el profesional de la salud.
10Da un ejemplo de una variable aleatoria que creas que se distribuye de acuerdo con la ley de Poisson.
13Da un ejemplo de una variable aleatoria que creas que tiene, al menos aproximadamente, una distribución normal.
14Usando los datos de su respuesta a la Pregunta 13, demuestre el uso de la distribución normal estándar para responder
preguntas de probabilidad relacionadas con la variable seleccionada.
15.Kanjanarat et al. (A-12) estiman que la tasa de eventos adversos prevenibles por medicamentos (ADE) en los hospitales es
del 35,2 por ciento. Los ADE prevenibles suelen ser el resultado de una atención inadecuada o errores de medicación,
que incluyen errores de comisión y errores de omisión. Suponga que se eligen al azar 10 pacientes hospitalizados
que experimentan un ADE. Dejarpag¼ :35, y calcule la probabilidad de que:
(a)Exactamente siete de esos eventos de drogas fueron prevenibles
(b)Más de la mitad de esos eventos de drogas fueron prevenibles
(C)Ninguno de esos eventos de drogas fue prevenible.
(d)Entre tres y seis inclusive eran prevenibles
dieciséis.En una encuesta realizada por el Centro de Investigación Pew en 2003 (A-13), una muestra nacional de adultos respondió la
siguiente pregunta: “En general, ¿está usted muy a favor, a favor, en contra o muy en contra? . . ¿Haciendo que sea legal que
los médicos proporcionen a los pacientes con enfermedades terminales los medios para terminar con sus vidas? Los resultados
mostraron que el 43 por ciento de los sujetos de la muestra respondieron "muy a favor" o "a favor" de esta pregunta.
Si se eligen al azar 12 sujetos representados por esta muestra, calcule la probabilidad de que:
(a)Exactamente dos de los encuestados responden “muy a favor” o “a favor”
(b)No más de dos de los encuestados responden “muy a favor” o “a favor”
(C)Entre cinco y nueve respuestas inclusive “muy a favor” o “a favor”
17En un estudio de Thomas et al. (A-14) Se utilizó la distribución de Poisson para modelar el número de pacientes
por mes derivados a un oncólogo. Los investigadores utilizan una tasa de 15,8 pacientes por mes que son
derivados al oncólogo. Utilice la Tabla C del Apéndice y una tasa de 16 pacientes por mes para calcular la
probabilidad de que en un mes:
(a)Exactamente 10 pacientes son derivados a un oncólogo
(b)Entre cinco y 15 inclusive son referidos a un oncólogo
(C)Más de 10 son derivados a un oncólogo
PREGUNTAS DE REPASO Y EJERCICIOS 131
18En promedio, dos estudiantes por hora se presentan para recibir tratamiento en la sala de primeros auxilios de una escuela primaria grande.
(a)¿Cuál es la probabilidad de que durante una hora determinada acudan tres estudiantes a la sala de primeros auxilios para ser
atendidos?
(b)¿Cuál es la probabilidad de que durante una hora dada dos o menos estudiantes se presenten en la sala de primeros auxilios?
(C)¿Cuál es la probabilidad de que durante una hora dada entre tres y cinco estudiantes, inclusive, se presenten en la
sala de primeros auxilios?
19Una encuesta de Harris Interactive realizada en el otoño de 2002 (A-15) a través de una encuesta telefónica nacional de
adultos preguntó: "¿Cree que se debería permitir que los adultos usen legalmente marihuana con fines médicos si su
médico se la receta, o cree que la marihuana debería seguir siendo ilegal incluso para fines médicos?
Los resultados mostraron que el 80 por ciento de los encuestados respondió "Sí" a la pregunta anterior. Suponiendo que el 80
por ciento de los estadounidenses respondiera “Sí” a la pregunta anterior, encuentre la probabilidad cuando se eligen ocho
estadounidenses al azar de que:
20En un estudio de la relación entre la vacunación contra el sarampión y el síndrome de Guillain-Barr-e (GBS),
Silveira et al. (A-16) utilizó un modelo de Poisson en el examen de la aparición de GBS durante los períodos
de latencia después de las vacunas. Llevaron a cabo su estudio en Argentina, Brasil, Chile y Colombia.
Encontraron que durante el período de latencia, la tasa de GBS fue de 1,28 casos por día. Usando esta estimación
redondeada a 1.3, encuentre la probabilidad en un día dado de:
21Los coeficientes intelectuales de las personas admitidas en una escuela pública para retrasados mentales tienen una distribución
aproximadamente normal con una media de 60 y una desviación estándar de 10.
(b)¿Cuál es la probabilidad de que un individuo elegido al azar tenga un coeficiente intelectual entre 55 y 75?
(C)EncontrarPAGd50 -X -70Þ:
22Una supervisora de enfermería descubrió que las enfermeras del personal, en promedio, completan una determinada tarea en 10 minutos. Si
los tiempos requeridos para completar la tarea tienen una distribución aproximadamente normal con una desviación estándar de 3
minutos, encuentre:
23Las puntuaciones obtenidas en cierta prueba de aptitud por estudiantes de enfermería tienen una distribución aproximadamente
normal con una media de 500 y una varianza de 10 000.
(a)¿Qué proporción de los que toman la prueba obtienen una puntuación inferior a 200?
(b)Una persona está a punto de tomar la prueba. ¿Cuál es la probabilidad de que obtenga una puntuación de
650 o más?
(C)¿Qué proporción de puntajes se encuentran entre 350 y 675?
24Dada una variable binomial con una media de 20 y una varianza de 16, encuentrenorteypag.
132 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD
25Supongamos que una variableXse distribuye normalmente con una desviación estándar de 10. Dado que .0985 de los
valores deXson mayores que 70, ¿cuál es el valor medio de¿X?
26Dada la variable aleatoria normalmente distribuidaX,encontrar el valor numérico dektal que PAGd
metroks -X -metroþksÞ ¼ :754.
27Dada la variable aleatoria normalmente distribuidaXcon media 100 y desviación estándar 15, encuentre
el valor numérico dektal que:
(a)PAGdX-kÞ ¼ :0094
(b)PAGdX-kÞ ¼ :1093
(C)PAGd100 -X-kÞ ¼ :4778
(d)PAGdk0-X-kÞ ¼ :9660, dondek0ykson equidistantes demetro
33.Explique por qué cada una de las siguientes medidas es o no el resultado de un ensayo de Bernoulli:
(a)El género de un niño recién nacido.
(b)La clasificación de la condición de un paciente hospitalario como estable, crítica, regular, buena o mala
(C)El peso en gramos de un niño recién nacido.
34.Explique por qué cada una de las siguientes medidas es o no el resultado de un ensayo de Bernoulli:
(a)El número de procedimientos quirúrgicos realizados en un hospital en una semana.
(b)La temperatura de un paciente del hospital en grados centígrados
35.Explique por qué cada una de las siguientes distribuciones es o no una distribución de probabilidad:
(a) (b)
X PAGdX¼XÞ X PAGdX¼XÞ
0 0.15 0 0.15
1 0.25 1 0.20
2 0.10 2 0.30
3 0.25 3 0.10
4 0.30
(C) (d)
X PAGdX¼XÞ X PAGdX¼XÞ
0 0.15 1 0.15
1 0:20 0 0.30
2 0.30 1 0.20
3 0.20 2 0.15
4 0.15 3 0.10
4 0.10
REFERENCIAS 133
REFERENCIAS
Referencias de metodología
1. F.RANGOAHDERECHO,manual de la distribución de poisson,Wiley, Nueva York, 1967.
Aplicaciones Referencias
A-1. DÁVIDOS.SOLBÉN, mEGANCMCCLINCYy J.OHNPHolcomb, “Estado de seguridad alimentaria de los hogares en los
Apalaches de Ohio con niños en Head Start”,Diario de la Asociación Dietética Americana, 104 (2004), 238–
241.
A-2. CTENÍALCROSS, BOBERNHARD, ANNERDE OTRO MODO, mELANIEMETROULLÍN, y ANNABELLEjANAIRO,"Investigación y
Evaluación del problema del juego: Informe anual de Nevada, abril de 2006–abril de 2007”, Informe final de la subvención a la
División de Salud y Servicios Humanos de Nevada.
A-3. Centro Estatal de Estadísticas de Salud de Carolina del Norte e Instituto Howard W. Odum para la Investigación en Ciencias
Sociales de la Universidad de Carolina del Norte en Chapel Hill. Conjunto de datos de nacimiento para 2001 encontrado en
www.irss.unc.edu/ncvital/ bfd1down.html. Todos los cálculos fueron realizados por John Holcomb y no representan los
hallazgos del Centro o Instituto.
A-4. Encuesta de la Universidad de Massachusetts, realizada del 29 de mayo al 2 de junio de 2003. Datos proporcionados por Massachusetts
Health Benchmarks.http://www.healthbenchmarks.org/Poll/June2003Survey.cfm.
A-5. Centro Nacional de Estadísticas de Salud (2001) Documentación de archivos de datos, Encuesta Nacional de Entrevistas de
Salud, CD Serie 10, No. 16A, Centro Nacional de Estadísticas de Salud, Hyattsville, Maryland. Todos los cálculos son
responsabilidad de John Holcomb y no reflejan los esfuerzos de NCHS.
A-6. STEVENSCOUGHLIN, ROBERTOJ. U.HLER, THOMASRCHARDOSy kATERINAMWILSON, “Cáncer de mama y de cuello uterino
Prácticas de detección entre mujeres hispanas y no hispanas que residen cerca de la frontera entre Estados Unidos y
México, 1999–2000”,Salud Familiar Comunitaria, 26 (2003), 130–139.
A-7. JH LAAKEy JA RøTTINGEN, “Rocuronio y anafilaxia: un desafío estadístico”,Acta Anasthesiologica
Scandinavica, 45 (2001), 1196–1203.
A-8. ACORRERD. S.INGH, mAHNAZnorteOURI, CarolLSHIELOS, jERRYCOMOHIELOS, y ANDREWFSMITO, “Retina Capilar
hemangioma,”Oftalmología, 10 (2001), 1907–1911.
A-9. PAGUNA ESCALATUBERT-BITTER, BERNARDOBEGAUD, YOLAMETROÓRDEN, ANIZACHASLERÍA, y FRANCOISEHARAMBURU,
“Comparación de la toxicidad de dos fármacos en el marco de la notificación espontánea: un enfoque de intervalo de
confianza”Revista de Epidemiología Clínica, 49 (1996), 121–123.
A-10. SERLDRIDGE, MGALEA, SOYCCOY, R. W.OLFE, H. y K. G.RAHAM, “Valores normativos del tiempo de actividad en niños de 8 a 15
años”,Medicina del desarrollo y neurología infantil, 45 (2003), 189–193.
A-11. ANNMDISKIN, PAGATRIKS9PANEL, y DÁVIDOSMITO, "Variación temporal de amoníaco, acetona, isopreno y etanol en el
aliento: un estudio cuantitativo SIFT-MS durante 30 días"Medición fisiológica, 24 (2003), 107–119.
A-12. PAGENKARNkANJANARAT, ALMUTG. W.INTERSTEIN, THOMASEJOHNS, RANDYCHATTON, RICARDOGRAMOONZALEZ-ROTI,
y RICHARDSIGUAL, "Naturaleza de los eventos adversos prevenibles de medicamentos en hospitales: una revisión de la literatura",Diario
Americano de Farmacia del Sistema de Salud, 60 (2003), 1750-1759.
A-13. Encuesta del Pew Research Center realizada por Princeton Survey Research Associates, del 24 de junio al 8 de julio de 2003.
Datos proporcionados por el Roper Center for Public Opinion Research.www.kaisernetwork.org/health_poll/hpoll_index. cfm.
A-14. SJTHOMAS, MVWILLIAMS, NG BUrnet, y CR BAKER, "¿Cuánta capacidad excedente se requiere para mantener
tiempos de espera bajos?"Oncología clínica, 13 (2001), 24–28.
A-15. Time, encuesta de Cable News Network realizada por Harris Associates, 22 y 23 de octubre de 2002. Datos proporcionados por
el Roper Center for Public Opinion Research.www.kaisernetwork.org/health_poll/hpoll_index.cfm.
A-16. CLAUDIOMETRO.ADSILVEIRA, DÁVIDOEMALISBURY, y CORIADelawareqUADROS, “Vacunación contra el sarampión y síndrome de
Guillain-Barr-e”,La lanceta,349 (1997), 14–16.
CAPÍTULO 5
ALGUNAS DISTRIBUCIONES DE
MUESTREO IMPORTANTES
TEMAS
5.1INTRODUCCIÓN
5.2DISTRIBUCIONES DE MUESTREO
5.1 INTRODUCCIÓN
Antes de examinar el tema de este capítulo, repasemos los puntos principales de lo que
hemos cubierto hasta ahora. El capítulo 1 presenta algunas estadísticas básicas y útiles.
134
5.2 DISTRIBUCIONES DE MUESTREO 135
DEFINICIÓN
La distribución de todos los valores posibles que puede asumir alguna estadística,
calculada a partir de muestras del mismo tamaño extraídas al azar de la misma
población, se denomina distribución.distribución muestralde esa estadística.
1.De una población finita de tamañoNORTE,extraer al azar todas las muestras posibles de tamañonorte.
Ambos problemas pueden obviarse por medio de las matemáticas. Aunque los
procedimientos involucrados no son compatibles con el nivel matemático de este texto, las
distribuciones de muestreo se pueden derivar matemáticamente. El lector interesado puede
consultar uno de los muchos libros de texto de estadística matemática, por ejemplo, Larsen y
Marx (1) o Rice (2).
En las secciones que siguen, se analizan algunas de las distribuciones
muestrales más frecuentes.
EJEMPLO 5.3.1
Supongamos que tenemos una población de tamañonorte¼5, que consta de las edades de cinco niños que
son pacientes ambulatorios en un centro comunitario de salud mental. Las edades son las siguientes:
¼6;X2¼8;X3¼10;X4¼12, yX5¼14. La media,metro,de esta población es igual a
X1PAG
Xi=N¼10 y la varianza es
PAG 2
dXi-metroÞ 40
s2¼ ¼ ¼8
norte 5
PAG 2
dXi-metroÞ 40
S2¼ ¼ ¼10
norte-1 4
Solución: Extraigamos todas las muestras posibles de tamañonorte¼2 de esta población. Estas
muestras, junto con sus medias, se muestran en la Tabla 5.3.1.
5.3 DISTRIBUCIÓN DE LA MEDIA MUESTRAL 137
TABLA 5.3.1 Todas las muestras posibles de tamañonorte¼2 de una población de tamaño norte¼5.
Muestras por encima o por debajo del resultado de la diagonal principal cuando el muestreo es sin
reemplazo. Las medias de la muestra están entre paréntesis
Segundo Sorteo
6 8 10 12 14
6 6, 6 6, 8 6, 10 6, 12 6, 14
(6) (7) (8) (9) (10)
8 8, 6 8, 8 8, 10 8, 12 8, 14
(7) (8) (9) (10) (11)
primer sorteo 10 10, 6 10, 8 10, 10 10, 12 10, 14
(8) (9) (10) (11) (12)
12 12, 6 12, 8 12, 10 12, 12 12, 14
(9) (10) (11) (12) (13)
14 14, 6 14, 8 14, 10 14, 12 14, 14
(10) (11) (12) (13) (14)
Relativo
X- Frecuencia Frecuencia
6 1 1/25
7 2 2/25
8 3 3/25
9 4 4/25
10 5 5/25
11 4 4/25
12 3 3/25
13 2 2/25
14 1 1/25
Total 25 25/25
Vemos que los datos de la tabla 5.3.2 satisfacen los requisitos para una distribución de
probabilidad. Las probabilidades individuales son todas mayores que 0 y su suma es igual a 1.
138 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES
Anteriormente se dijo que por lo general estamos interesados en la forma funcional de una
distribución de muestreo, su media y su varianza. Ahora consideramos estas características para la
distribución muestral de la media muestral, -X.
PAG
- Xi 6þ7þ7þ8þ - - - þ14 250
metro-X¼ ¼ ¼10
norte ¼
norte
25 25
PAG
d-Xi-metro-X 2 Þ
s2- X¼
nortenorte
s2 8
s2- X¼ ¼ ¼4
norte 2
pffiffiffi pffiffiffi
La raíz cuadrada de la varianza de la distribución muestral, Error s2- X¼s= nortese llama el
estandar de la mediao, simplemente, elError estándar.
Estos resultados no son coincidencias sino ejemplos de las características de las distribuciones
muestrales en general, cuando el muestreo es con reemplazo o cuando el muestreo es de una
población infinita. Para generalizar, distinguimos entre dos situaciones: muestreo de una población
con distribución normal y muestreo de una población con distribución no normal.
Una formulación matemática del teorema del límite central es que la distribución de
- X -metro
pffiffiffi
s=norte
se aproxima a una distribución normal con media 0 y varianza 1 comon !1.Tenga en cuenta que el teorema
del límite central nos permite tomar muestras de poblaciones distribuidas de forma no normal con una
garantía de aproximadamente los mismos resultados que se obtendrían si las poblaciones estuvieran
distribuidas normalmente, siempre que tomemos una muestra grande.
La importancia de esto se hará evidente más adelante cuando aprendamos que una distribución de muestreo
distribuida normalmente es una herramienta poderosa en la inferencia estadística. En el caso de la media de la
muestra, estamos seguros de que al menos hay una distribución de muestreo aproximadamente normalmente
distribuida bajo tres condiciones: (1) cuando el muestreo proviene de una población normalmente distribuida; (2)
cuando el muestreo es de una población que no se distribuye normalmente y nuestra muestra es grande; y (3)
cuando el muestreo es de una población cuya forma funcional es desconocida para nosotros siempre que el tamaño
de nuestra muestra sea grande.
La pregunta lógica que surge en este punto es: ¿Qué tan grande debe ser la muestra para que
se aplique el teorema del límite central? No hay una respuesta única, ya que el tamaño de la muestra
necesaria depende del grado de no normalidad presente en la población. Una regla general establece
que, en la mayoría de las situaciones prácticas, una muestra de tamaño 30 es satisfactoria. En general,
la aproximación a la normalidad de la distribución muestral de -Xmejora cada vez más a medida que
aumenta el tamaño de la muestra.
Muestreo sin reemplazoLos resultados anteriores se han dado asumiendo que el muestreo es con
reemplazo o que las muestras se extraen de poblaciones infinitas. En general, no tomamos muestras
con reemplazo y, en la mayoría de las situaciones prácticas, es necesario tomar muestras de una
población finita; por lo tanto, necesitamos familiarizarnos con el comportamiento de la distribución
muestral de la media muestral en estas condiciones. Antes de hacer declaraciones generales, veamos
nuevamente los datos de la tabla 5.3.1. La muestra significa que el resultado cuando el muestreo es
sin reposición son los que están por encima de la diagonal principal, que son los mismos que los que
están por debajo de la diagonal principal, si ignoramos el orden en que se extrajeron las
observaciones. Vemos que hay 10 muestras posibles. En general, cuando se toman muestras de
tamañonortede una población finita de tamañonortesin reemplazo, e ignorando el orden en que se
extraen los valores muestrales, el número de muestras posibles viene dado por la combinación de
nortecosas tomadasnortea la vez En nuestro ejemplo actual tenemos
¡NORTE! 5! 5 - 4 - 3!
norteCnorte¼ ¼ ¼ ¼10 muestras posibles:
¡norte!dn - nÞ! 2!3! 2!3!
PAG
- X2Þ
d-Xi-metro 30
s2- X¼ ¼ ¼3
norteCnorte 10
s2 n - n 8 5-2
- ¼ - ¼3
norte-1
norte 2 4
Este resultado nos dice que si multiplicamos la varianza de la distribución muestral que se
obtendría si el muestreo fuera con reemplazo, por el factordn - nÞ=ðnorte-1Þ,obtenemos el
valor de la varianza de la distribución muestral que resulta cuando el muestreo es sin
reemplazo. Podemos generalizar estos resultados con la siguiente afirmación.
s2 n - n
s2- X¼ -
norte norte-1
1.El muestreo es de una población distribuida normalmente con una varianza de población
conocida:
(a)metro-X¼metropffiffiffi
(b)s-X¼s=norte
(C)La distribución muestral de -Xes normal.
142 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES
2.El muestreo proviene de una población distribuida de manera no normal con una varianza de población conocida:
(a)metro-X¼metropffiffiffi
(b)s-X¼s= norte;cuando n=n :05
n-n
rffiffiffiffiffiffiffiffiffiffiffiffiffi pffiffiffi
s-X¼ ðs= norteÞ ; de lo contrario
norte-1
(C)La distribución muestral de -Xes aproximadamente normal.
EJEMPLO 5.3.2
Suponga que se sabe que en cierta población humana grande, la longitud del cráneo tiene una
distribución aproximadamente normal con una media de 185,6 mm y una desviación estándar de 12,7
mm. ¿Cuál es la probabilidad de que una muestra aleatoria de tamaño 10 de esta población tenga una
media mayor que 190?
Solución: Sabemos que la muestra única que se está considerando es una de todas las muestras
posibles de tamaño 10 que se pueden extraer de la población, de modo que la media
que produce es una de las siguientes:X's que constituye la distribución muestral de -X
que, teóricamente, podría derivarse de esta población.
Cuando decimos que la población tiene una distribución aproximadamente
normal, suponemos que la distribución muestral de -Xestarán, para todos los efectos
prácticos, normalmente distribuidos. También sabemos que la media y el estándar
desviación de la distribución muestral son iguales a 185.6 y
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
pffiffiffiffiffi
La probabilidad que responde a nuestra pregunta está representada por el área a la derecha
de:X¼190 bajo la curva de la distribución muestral. Esta área es igual al área a la derecha de
Al consultar la tabla normal estándar, encontramos que el área a la derecha de 1.10 es .1357; por
tanto, decimos que la probabilidad es .1357 de que una muestra de tamaño 10 tenga una media
mayor que 190.
La Figura 5.3.2 muestra la relación entre la población original, la distribución
muestral de -Xy la distribución normal estándar.
EJEMPLO 5.3.3
Si la media y la desviación estándar de los valores de hierro sérico para hombres sanos son 120 y 15
microgramos por 100 ml, respectivamente, ¿cuál es la probabilidad de que una muestra aleatoria de
50 hombres normales produzca una media entre 115 y 125 microgramos por 100 ml?
-
115 - 120 125 - 120
PAGd115 - X 125¼PAG z
2:12 2:12
¼PAGd-2:36 z 2:36Þ
¼ :9909 - :0091
¼ :9818 &
EJERCICIOS
5.3.1La Encuesta Nacional de Examen de Salud y Nutrición de 1988–1994 (NHANES III, A-1) estimó que el nivel medio de
colesterol sérico para mujeres estadounidenses de 20 a 74 años de edad es de 204 mg/dl. La estimación de la
desviación estándar fue de aproximadamente 44. Usando estas estimaciones como la mediametroy desviación
estándarspara la población de EE. UU., considere la distribución muestral de la media muestral basada en muestras
de tamaño 50 extraídas de mujeres en este grupo de edad. ¿Cuál es la media de la distribución muestral? ¿El error
estándar?
5.3.2El estudio citado en el Ejercicio 5.3.1 informó un nivel de colesterol sérico medio estimado de 183 para mujeres de 20 a 29
años. La desviación estándar estimada fue de aproximadamente 37. Use estas estimaciones como la mediametroy
desviación estándarspara la población estadounidense. Si se extrae una muestra aleatoria simple de tamaño 60 de
esta población, calcule la probabilidad de que el nivel de colesterol sérico medio de la muestra sea:
5.3.3Si los valores de ácido úrico en varones adultos normales tienen una distribución aproximadamente normal con una media y una
desviación estándar de 5,7 y 1 mg por ciento, respectivamente, calcule la probabilidad de que una muestra de tamaño 9
produzca una media:
5.3.4Wright et al. [A-2] utilizó la Encuesta Nacional de Examen de Salud y Nutrición de 1999–2000 (NHANES) para
estimar la ingesta dietética de 10 nutrientes clave. Uno de esos nutrientes era el calcio (mg). Encontraron en
todos los adultos de 60 años o más una ingesta media diaria de calcio de 721 mg con una desviación
estándar de 454. Utilizando estos valores para la media y la desviación estándar de la población de EE. UU.,
calcule la probabilidad de que una muestra aleatoria de tamaño 50 tenga un sentido:
(a)Más de 800 mg (b)Menos de 700 mg
(C)Entre 700 y 850 mg
5.3.5En el estudio citado en el Ejercicio 5.3.4, los investigadores encontraron que la ingesta media de sodio en hombres y
mujeres de 60 años o más era de 2940 mg con una desviación estándar de 1476 mg. Utilice estos valores para la
media y la desviación estándar de la población de EE. UU. y encuentre la probabilidad de que una muestra aleatoria
de 75 personas de la población tenga una media:
5.3.6Dada una población distribuida normalmente con una media de 100 y una desviación estándar de 20, encuentre las
siguientes probabilidades con base en una muestra de tamaño 16:
5.3.8Suponga que una población consta de los siguientes valores: 1, 3, 5, 7, 9. Construya la distribución
muestral de -Xbasado en muestras de tamaño 2 seleccionadas sin reemplazo. Encuentre la media y la
varianza de la distribución muestral.
5.3.9Utilice los datos del ejemplo 5.3.1 para construir la distribución muestral de:Xbasado en muestras de tamaño 3
seleccionadas sin reemplazo. Encuentre la media y la varianza de la distribución muestral.
5.3.10Utilice los datos citados en el Ejercicio 5.3.1. Imagine que tomamos muestras de tamaño 5, 25, 50, 100 y 500 de las
mujeres de este grupo de edad.
(a)Calcule el error estándar para cada uno de estos escenarios de muestreo.
(b)Discuta cómo el tamaño de la muestra afecta las estimaciones del error estándar calculadas en la parte (a) y las
implicaciones potenciales que esto puede tener en la práctica estadística.
EJEMPLO 5.4.1
Supongamos que tenemos dos poblaciones de individuos: una población (población 1) ha
experimentado alguna condición que se cree que está asociada con el retraso mental y la
otra población (población 2) no ha experimentado la condición. La distribución de
146 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES
Se cree que las puntuaciones de inteligencia en cada una de las dos poblaciones tienen una distribución
aproximadamente normal con una desviación estándar de 20.
Supongamos, además, que tomamos una muestra de 15 individuos de cada población y
calculamos para cada muestra la puntuación media de inteligencia con los siguientes resultados:X1¼
92 y -X2¼105. Si no hay diferencia entre las dos poblaciones, con respecto a sus verdaderos puntajes
promedio de inteligencia, ¿cuál es la probabilidad de observar una diferencia tan grande o mayor?d-X
1- -X2Þentre medias muestrales?
TABLA 5.4.1 Mesa de trabajo para construir la distribución de la diferencia entre dos medias
muestrales
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
las medias muestrales serían iguales a s21=n1þs2 2=n2. Cabe señalar que estos
Las propiedades transmiten dos puntos importantes. Primero, las medias de dos distribuciones
se pueden restar una de la otra, o sumar, usando operaciones aritméticas estándar. En
segundo lugar, dado que la varianza general de la distribución muestral se verá afectada por
ambas distribuciones contribuyentes, las varianzas siempre se sumarán incluso si estamos
interesados en la diferencia de las medias. Este último hecho supone que las dos
distribuciones son independientes entre sí.
Para nuestro ejemplo actual, tendríamos una distribución normal con una media de
0 (si no hay diferencia entre las medias de las dos poblaciones) y una varianza de
½ð20Þ2=15þ ½ð20Þ2=15¼53:3333. El gráfico de la distribución muestral se muestra en la Figura
5.4.1.
- 13 - 0 - 13 - 13
¼ -1:78
z¼sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼ pffiffiffiffiffiffiffiffiffi ¼
53:3 7:3
d20Þ2 d20Þ2
þ
15 15
Al consultar la Tabla D, encontramos que el área bajo la curva normal estándar a la izquierda de
- 1:78 es igual a .0375. En respuesta a nuestra pregunta original, decimos que si no hay
148 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES
diferencia entre las medias de la población, la probabilidad de obtener una diferencia entre las
medias de la muestra igual o mayor que 13 es .0375.
EJEMPLO 5.4.2
Supongamos que se ha establecido que para cierto tipo de cliente la duración promedio de una visita
domiciliaria de una enfermera de salud pública es de 45 minutos con una desviación estándar de 15 minutos,
y que para un segundo tipo de cliente la visita domiciliaria promedio es de 30 minutos de duración con una
desviación estándar de 20 minutos. Si una enfermera visita aleatoriamente a 35 clientes de la primera y 40 de
la segunda población, ¿cuál es la probabilidad de que la duración promedio de la visita domiciliaria difiera
entre los dos grupos en 20 minutos o más?
Solución: No se hace mención de la forma funcional de las dos poblaciones, por lo que
supongamos que se desconoce esta característica, o que las poblaciones no se
distribuyen normalmente. Dado que los tamaños de muestra son grandes (superiores
a 30) en ambos casos, recurrimos a los resultados del teorema del límite central para
responder a la pregunta planteada. Sabemos que la diferencia entre las medias de las
muestras tiene una distribución al menos aproximadamente normal con la siguiente
media y varianza:
metro-X1--
X 2
¼metro1-metro2¼45 - 30¼15
El área bajo la curva de -X1- -X2que buscamos es esa área a la derecha de 20.
El valor correspondiente dezen el estándar normal es
EJERCICIOS
5.4.1El estudio citado en los Ejercicios 5.3.1 y 5.3.2 proporciona los siguientes datos sobre los niveles de colesterol sérico en
mujeres estadounidenses:
Utilice estas estimaciones como la mediametroy desviación estándarspara las respectivas poblaciones estadounidenses.
Supongamos que seleccionamos una muestra aleatoria simple de tamaño 50 independientemente de cada población. ¿Cuál es
la probabilidad de que la diferencia entre las medias de la muestra -XB- -XAserán más de 8?
5.4.2En el estudio citado en los Ejercicios 5.3.4 y 5.3.5, los niveles de calcio en hombres y mujeres de 60 años o
más se resumen en la siguiente tabla:
Utilice estas estimaciones como la mediametroy desviación estándarspara las poblaciones de EE. UU. para estos
grupos de edad. Si tomamos una muestra aleatoria de 40 hombres y 35 mujeres, ¿cuál es la probabilidad de obtener
una diferencia entre las medias muestrales de 100 mg o más?
5.4.3Dadas dos poblaciones distribuidas normalmente con medias y varianzas iguales des2 1¼100 y
s22¼80, ¿cuál es la probabilidad de que muestras de tamañonorte1¼25 ynorte2¼16 dará un valor de -X1- -X2
mayor o igual a 8?
5.4.4Dadas dos poblaciones distribuidas normalmente con medias y varianzas iguales des2 1¼240 y
s22¼350, ¿cuál es la probabilidad de que muestras de tamañonorte1¼40 ynorte2¼35 dará un valor de
- X1- -X2tan grande como o más grande que 12?
5.4.5Para una población de niños de 17 años y niñas de 17 años, las medias y las desviaciones estándar,
respectivamente, de sus valores de espesor del pliegue cutáneo subescapular son los siguientes: niños, 9,7 y 6,0;
niñas, 15,6 y 9,5. De las poblaciones se seleccionan muestras aleatorias simples de 40 niños y 35 niñas. ¿Cuál es la
probabilidad de que la diferencia entre las medias de la muestra -Xchicas- -XNiñosserá mayor que 10?
5.5 DISTRIBUCIÓN DE LA
PROPORCIÓN DE LA MUESTRA
En las secciones anteriores nos hemos ocupado de las distribuciones muestrales de estadísticos
calculados a partir de variables medidas. Sin embargo, con frecuencia nos interesa la distribución
muestral de una estadística, como una proporción muestral, que resulta de conteos o datos de
frecuencia.
EJEMPLO 5.5.1
Los resultados [A-3] de la Encuesta nacional de examen de salud y nutrición (NHANES) de 2009–2010
muestran que el 35,7 % de los adultos estadounidenses mayores de 20 años son obesos (obesos
definidos con un índice de masa corporal mayor o igual a 30,0). Designamos esta proporción de la
población comopag¼ :357. Si seleccionamos al azar 150 individuos de esta población, ¿cuál es la
probabilidad de que la proporción de obesos en la muestra sea tan grande como .40?
p̂ - p
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi (5.5.1)
pagd1 -pagÞ
norte
La pregunta que surge ahora es: ¿Qué tan grande debe ser el tamaño de la muestra para que el uso
de la aproximación normal sea válido? Un criterio ampliamente utilizado es que ambosnotario públicoy norte
d1 -pagÞdebe ser mayor que 5, y cumpliremos con esa regla en este texto.
Ahora estamos en condiciones de responder a la pregunta sobre la obesidad en la muestra de
150 individuos de una población en la que el 35,7 por ciento son obesos. Ya que ambosnotario público
y norted1 -pagÞson mayores que 5d150 :357¼53:6 y 150:643¼96:5Þ,podemos decir que, en
este caso, p̂ tiene una distribución aproximadamente normal con una mediametropag;¼pag¼ :357 y
s2pag¼pagd1 -pagÞ=norte¼ ð:357Þð:643Þ=150¼ :00153. La probabilidad que buscamos es el área bajo
la curva de p̂ que está a la derecha de .40. Esta área es igual al área bajo el estándar
152CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES
p̂ - p :40 - :357
¼1:10
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼ pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
Xþ :5
- pag
zC¼ pag ; nffiffiffiffiffiffiffiffiffiffiffi parax <np
(5.5.2)
pq=n
o
X - :5
- pag
zC¼ pag ; nffiffiffiffiffiffiffiffiffiffiffi parax > np
(5.5.3)
pq=n
dóndeq¼1 -pag.La corrección por continuidad no hará una gran diferencia cuandonortees
largo. En el ejemplo anteriornotario público¼150d:4¼60, y
60 - :5
- :357
zC¼pffiffiffiffi1ffiffiffi5ffiffi0ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼1:01
d:357Þð:643Þ=150
EJEMPLO 5.5.2
Blanche Mikhail [A-4] estudió el uso de la atención prenatal entre mujeres afroamericanas de bajos
ingresos. Encontró que solo el 51 por ciento de estas mujeres tenían atención prenatal adecuada.
Supongamos que para una población similar de mujeres afroamericanas de bajos ingresos,
EJERCICIOS 153
El 51 por ciento tuvo atención prenatal adecuada. Si se extraen al azar 200 mujeres de esta
población, ¿cuál es la probabilidad de que menos del 45 por ciento haya recibido atención
prenatal adecuada?
EJERCICIOS
5.5.1Smith et al. [A-5] realizó un análisis retrospectivo de los datos de 782 pacientes elegibles admitidos con infarto de
miocardio en un centro de servicios cardíacos de 46 camas. De estos pacientes, 248 (32 por ciento) informaron
un infarto de miocardio pasado. Usa .32 como la proporción de la población. Suponga que se eligen al azar
50 sujetos de la población. ¿Cuál es la probabilidad de que más del 40 por ciento informen infartos de
miocardio previos?
5.5.2En el estudio citado en el Ejercicio 5.5.1, el 13 por ciento de los pacientes del estudio informaron episodios previos de accidente
cerebrovascular o ataque isquémico transitorio. Utilice el 13 por ciento como la estimación de la prevalencia de accidente
cerebrovascular o ataque isquémico transitorio dentro de la población. Si se eligen al azar 70 sujetos de la población, ¿cuál es la
probabilidad de que el 10 por ciento o menos informen una incidencia de accidente cerebrovascular o ataque isquémico
transitorio?
5.5.3En el informe NHANES de 1999-2000, los investigadores estimaron que el 64 por ciento de los adultos
estadounidenses de 20 a 74 años tenían sobrepeso u obesidad (sobrepeso: IMC 25–29, obesidad: IMC 30 o
más). Use esta estimación como la proporción de la población de adultos estadounidenses de 20 a 74 años. Si
se seleccionan al azar 125 sujetos de la población, ¿cuál es la probabilidad de que el 70 por ciento o más
tenga sobrepeso u obesidad?
5.5.4Gallagher et al. [A-6] informó sobre un estudio para identificar los factores que influyen en la asistencia de las mujeres a
los programas de rehabilitación cardíaca. Descubrieron que a las 12 semanas posteriores al alta, solo el 64 por ciento
de las mujeres elegibles asistieron a dichos programas. Usando el 64 por ciento como una estimación del porcentaje
de asistencia de todas las mujeres elegibles, encuentre la probabilidad de que en una muestra de 45 mujeres
seleccionadas al azar de la población de mujeres elegibles, menos del 50 por ciento asista a los programas.
5.5.5Dada una población en la quepag¼ :6 y una muestra aleatoria de esta población de tamaño 100, encuentre:
5.5.6Se sabe que el 35 por ciento de los miembros de una determinada población padecen una o más enfermedades
crónicas. ¿Cuál es la probabilidad de que en una muestra de 200 sujetos seleccionados al azar de esta
población, 80 o más tengan al menos una enfermedad crónica?
154 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES
A menudo, hay dos proporciones de población en las que estamos interesados y deseamos evaluar
la probabilidad asociada con una diferencia en las proporciones calculadas a partir de muestras
extraídas de cada una de estas poblaciones. La distribución muestral relevante es la distribución de la
diferencia entre las dos proporciones muestrales.
metropag1-pag¼pag1-pag 2
2
y varianza
pagd1
1 -pag1Þ pagd1
2 - pag2Þ
s2pag1-pag 2
¼ þ
norte1 norte2
EJEMPLO 5.6.1
La Encuesta Nacional de Entrevistas de Salud de 1999, publicada en 2003 [A-7], informó que el 28 por ciento
de los sujetos que se identificaron a sí mismos como blancos dijeron que habían experimentado dolor
lumbar durante los tres meses anteriores a la encuesta. Entre los sujetos de origen hispano, el 21 por ciento
reportó dolor de espalda baja. Supongamos que .28 y .21 son las proporciones de las respectivas razas que
reportaron dolor lumbar en los Estados Unidos. ¿Cuál es la probabilidad de que muestras aleatorias
independientes de tamaño 100 extraídas de cada una de las poblaciones den un valor de p̂1- pag2tan grande
como .10?
Solución: Suponemos que la distribución muestral de p̂1- pag2es aproximadamente normal con
media
metropag1-pag
2
¼ :28 - :21¼ :07
y varianza
d:28Þð:72Þ d:21Þð:79Þ
s2 ¼ þ
pag1-pag2
100 100
¼ :003675
Consultando la tabla D, encontramos que el área bajo la curva normal estándar que se
encuentra a la derecha dez¼ :49 es 1 - :6879¼ :3121. La probabilidad de observar una
diferencia tan grande como .10 es, entonces, .3121. &
EJEMPLO 5.6.2
En la Encuesta Nacional de Entrevistas de Salud de 1999 [A-7], los investigadores encontraron que entre los adultos
estadounidenses de 75 años o más, el 34 por ciento había perdido todos sus dientes naturales y para los adultos
estadounidenses de 65 a 74 años, el 26 por ciento había perdido todos sus dientes naturales. Suponga que estas
proporciones son los parámetros para los Estados Unidos en esos grupos de edad. Si se extrae una muestra aleatoria
de 200 adultos de 65 a 74 años y una muestra aleatoria independiente de 250 adultos de 75 años o más de
156 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES
estas poblaciones, calcule la probabilidad de que la diferencia en el porcentaje de pérdida total de dientes
naturales sea inferior al 5 por ciento entre las dos poblaciones.
metropag1-pag
2
¼ :34 - :26¼ :08
y la varianza es
pagd1
1 - pag1Þpag d:34Þð:66Þ d:26Þð:74Þ
s2pag ¼ þ2d1 -pag2Þ ¼ þ ¼ :00186
-pag
1 2
norte1 norte2 250 200
:05 -d:08Þ
z¼ pffiffiffiffiffiffiffiffiffiffiffiffiffiffi ¼ -:70
:00186
EJERCICIOS
5.6.1Según la Oficina del Censo de EE. UU. de 2000 [A-8], en 2000, el 9,5 por ciento de los niños en el estado de Ohio
no estaban cubiertos por un seguro de salud privado o gubernamental. En el estado vecino de Pensilvania, el
4,9 por ciento de los niños no estaban cubiertos por un seguro de salud. Supongamos que estas
proporciones son parámetros para las poblaciones infantiles de los respectivos estados. Si se extrae una
muestra aleatoria de niños de tamaño 100 de la población de Ohio y una muestra aleatoria independiente de
tamaño 120 de la población de Pensilvania, ¿cuál es la probabilidad de que las muestras produzcan una
diferencia, p̂1- pag2de .09 o más?
5.6.2En el informe citado en el Ejercicio 5.6.1 [A-8], la Oficina del Censo indicó que para los estadounidenses en el grupo de edad de 18 a
24 años, el 64.8 por ciento tenía seguro médico privado. En el grupo de edad de 25 a 34 años, el porcentaje fue de 72,1.
Suponga que estos porcentajes son los parámetros de población en esos grupos de edad para los Estados Unidos.
Supongamos que seleccionamos una muestra aleatoria de 250 estadounidenses del grupo de edad de 18 a 24 años y una
muestra aleatoria independiente de 200 estadounidenses del grupo de edad de 25 a 34 años; encuentre la probabilidad de que
p̂2- pag1es inferior al 6 por ciento.
5.6.3A partir de los resultados de una encuesta realizada por la Oficina de Estadísticas Laborales de EE. UU. [A-9], se estimó que el 21 por
ciento de los trabajadores empleados en el noreste participaron en programas de beneficios de atención médica que incluían
atención de la vista. El porcentaje en el Sur fue del 13 por ciento. Suponga que estos porcentajes son parámetros de población
para las respectivas regiones de EE. UU. Suponga que seleccionamos una muestra aleatoria simple de 120 trabajadores del
noreste y una muestra aleatoria simple independiente de 130 trabajadores del sur.
¿Cuál es la probabilidad de que la diferencia entre proporciones muestrales, p̂1- pag2, estará entre .04
y .20?
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 5 157
5.7 RESUMEN
Hacemos hincapié en la importancia de este material e instamos a los lectores a asegurarse de que lo
entienden antes de continuar con el siguiente capítulo.
1 s22
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi s2
þ
norte1 norte2
norte
pq=n
5.5.3 Corrección de continuidad cuandox > np Xþ :5
þpag
ZC¼ pagnffiffiffiffiffiffiffiffiffiffiffi
pq=n
5.6.1 z-transformacion de la diferencia ðp̂ - p̂ Þ - ðpagÞ
ZC¼rffiffiffiffiffi1ffiffiffiffiffiffiffiffiffiffiffi2ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi1ffiffiffiffiffiffiffiffiffiffiffi2ffiffiffiffiffiffiffiffiffi
entre dos proporciones pag1d1 -pag1Þ pagd1 - pag
Þ2
2
þ
norte1 norte2
2.Explique cómo se puede construir una distribución muestral a partir de una población finita.
3.Describa la distribución muestral de la media muestral cuando el muestreo es con reemplazo de una población
normalmente distribuida.
5.¿En qué difiere la distribución muestral de la media muestral, cuando el muestreo es sin reemplazo, de
la distribución muestral obtenida cuando el muestreo es con reemplazo?
8.Describa la distribución muestral de la diferencia entre dos medias muestrales cuando se extraen muestras
grandes.
9.Explique el procedimiento que seguiría para construir la distribución muestral de la diferencia entre
proporciones muestrales con base en muestras grandes de poblaciones finitas.
10Suponga que se sabe que el tiempo de respuesta de los sujetos sanos a un estímulo particular es una variable
aleatoria distribuida normalmente con una media de 15 segundos y una varianza de 16. ¿Cuál es la
probabilidad de que una muestra aleatoria de 16 sujetos tenga un tiempo de respuesta medio? de 12
segundos o más?
11Jansen et al. [A-10] estudió a estadounidenses de 60 años o más. Estimaron que el índice de masa corporal medio de las mujeres
mayores de 60 años con músculo esquelético normal era de 23,1 con una desviación estándar de 3,7. Usando estos valores
como la media poblacional y la desviación estándar para mujeres mayores de 60 años con índice de músculo esquelético
normal, encuentre la probabilidad de que 45 mujeres seleccionadas al azar en este rango de edad con índice de músculo
esquelético normal tengan un IMC medio superior a 25.
12En el estudio citado en el ejercicio de revisión 11, los investigadores informaron que el IMC promedio para hombres de 60
años o más con un índice de músculo esquelético normal era de 24,7 con una desviación estándar de 3,3. Usando
estos valores como la media de la población y la desviación estándar, encuentre la probabilidad de que 50 hombres
seleccionados al azar en este rango de edad con un índice de músculo esquelético normal tengan un IMC medio
inferior a 24.
13Con la información de los Ejercicios de repaso 11 y 12, calcule la probabilidad de que la diferencia en el IMC
medio de 45 mujeres y 50 hombres seleccionados de forma independiente y al azar de las respectivas
poblaciones exceda de 3.
14En los resultados publicados por Wright et al. [A-2] según los datos del estudio NHANES de 1999–2000 mencionado en los
Ejercicios 5.4.1 y 5.4.2, los investigadores informaron sobre su examen de los niveles de hierro. El nivel medio de
hierro para mujeres de 20 a 39 años fue de 13,7 mg con una desviación estándar estimada de 8,9 mg. Utilizándolos
como valores poblacionales para mujeres de 20 a 39 años, calcule la probabilidad de que una muestra aleatoria de
100 mujeres tenga un nivel medio de hierro inferior a 12 mg.
15.Consulte el ejercicio de repaso 14. El nivel medio de hierro para los hombres entre las edades de 20 y 39 años es
17,9 mg con una desviación estándar estimada de 10,9 mg. Usando 17.9 y 10.9 como parámetros de población,
encuentre la probabilidad de que una muestra aleatoria de 120 hombres tenga un nivel medio de hierro superior a
19 mg.
PREGUNTAS DE REPASO Y EJERCICIOS 159
dieciséis.Utilizando la información de los ejercicios de repaso 14 y 15, y suponiendo muestras aleatorias independientes de tamaño
100 y 120 para mujeres y hombres, respectivamente, calcule la probabilidad de que la diferencia en los niveles medios de
hierro de la muestra sea mayor que 5 mg.
17Los resultados de la Encuesta Nacional de Entrevistas de Salud de 1999 publicada en 2003 [A-7] mostraron que entre
Adultos estadounidenses de 60 años o más, al 19 por ciento les había dicho un médico u otro proveedor de
atención médica que tenían algún tipo de cáncer. Si usamos esto como el porcentaje de todos los adultos
mayores de 65 años que viven en los Estados Unidos, ¿cuál es la probabilidad de que entre 65 adultos
elegidos al azar, su médico u otro proveedor de atención médica le haya dicho a más del 25 por ciento que
tienen cancer?
18Consulte el ejercicio de repaso 17. La tasa de cáncer informada para mujeres de 65 años o más es del 17 por ciento.
Usando esta estimación como el porcentaje verdadero de todas las mujeres de 65 años o más a quienes un
proveedor de atención médica les ha dicho que tienen cáncer, encuentre la probabilidad de que si se seleccionan al
azar 220 mujeres de la población, más del 20 por ciento habrá sido dijeron que tienen cáncer.
19Consulte el ejercicio de repaso 17. La tasa de cáncer para hombres de 65 años o más es del 23 por ciento. Use esta
estimación como el porcentaje de todos los hombres de 65 años o más a quienes un proveedor de atención médica
les ha dicho que tienen cáncer. Calcule la probabilidad de que, entre 250 hombres seleccionados al azar, a menos del
20 por ciento se les haya dicho que tienen cáncer.
20Use la información de los Ejercicios de repaso 18 y 19 para encontrar la probabilidad de que la diferencia en los
porcentajes de cáncer entre hombres y mujeres sea menor al 5 por ciento cuando se seleccionan al azar 220
mujeres y 250 hombres de 65 años o más.
21¿Cuántas muestras aleatorias simples (sin reemplazo) de tamaño 5 se pueden seleccionar de una población de
tamaño 10?
22Se estima por el NHANES 1999-2000 [A-7] que entre los adultos de 18 años o más, el 53 por ciento nunca ha
fumado. Suponga que la proporción de adultos estadounidenses que nunca han fumado es 0,53. Considere
la distribución muestral de la proporción muestral basada en muestras aleatorias simples de tamaño 110
extraídas de esta población. ¿Cuál es la forma funcional de la distribución muestral?
24Consulte el ejercicio 22. ¿Cuál es la probabilidad de que una sola muestra aleatoria simple de tamaño 110
extraída de esta población produzca una proporción muestral menor que .50?
25En una población de sujetos que murieron de cáncer de pulmón después de la exposición al asbesto, se encontró que el
número medio de años transcurridos entre la exposición y la muerte fue de 25. La desviación estándar fue de 7 años.
Considere la distribución muestral de las medias muestrales con base en muestras de tamaño 35 extraídas de esta
población. ¿Cuál será la forma de la distribución muestral?
27Consulte el ejercicio 25. ¿Cuál es la probabilidad de que una sola muestra aleatoria simple de tamaño 35 extraída
de esta población produzca una media entre 22 y 29?
28Para cada una de las siguientes poblaciones de mediciones, indique si la distribución muestral de la media
muestral tiene una distribución normal, una distribución aproximadamente normal o una distribución
aproximadamente normal cuando se calcula a partir de muestras de tamaño (A) 10, (B) 50 y (C) ) 200.
(a)El logaritmo de las proporciones metabólicas. La población se distribuye normalmente.
(b)Tono vagal en reposo en adultos sanos. La población se distribuye normalmente.
(C)Acción de la insulina en sujetos obesos. La población no se distribuye normalmente.
160 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES
29Para cada una de las siguientes situaciones de muestreo, indique si la distribución muestral de la proporción
muestral puede aproximarse mediante una distribución normal y explique por qué o por qué no.
REFERENCIAS
Referencias de metodología
1. R.ICHARDJ. L.ARSENy MRAÍZ DE FLORENCIALMARX,Una introducción a la estadística matemática y sus aplicaciones,2.ª ed., Prentice-
Hall, Englewood Cliffs, Nueva Jersey, 1986.
2. jOHNA. R.HIELO,Estadística Matemática y Análisis de Datos,2ª ed., Duxbury, Belmont, CA, 1995.
Aplicaciones Referencias
A-1. La Tercera Encuesta Nacional de Examen de Salud y Nutrición, NHANES III (1988–94), Tabla 2. Centro Nacional de
Estadísticas de Salud, División de Servicios de Datos, Hyattsville, MD. Disponible enhttp://www.cdc.gov/nchs/about/
major/nhanes/datatablelink.htm.
A-2. jACQUELINED. W.BIEN, CEIS-YyoWESP, jOCELYNkENNEDY-STEPHENSONy R. B.ETENEmiRVIN, “Ingesta dietética de
Diez nutrientes clave para la salud pública, Estados Unidos: 1999–2000”, Centro Nacional de Estadísticas de Salud. Datos
Avanzados de Estadísticas Vitales y de Salud, N° 334 (2003).
A-3. CYNTIAL. O.GDEN, mARGARETDCARROLLO, BRIANK. K.ÉLy kATERINAM. F.LEGAL, “Prevalencia de la obesidad en los Estados Unidos,
2009–2010”, Centro Nacional de Estadísticas de Salud, Resumen de datos No. 82,http://www.cdc.gov/nchs/data/
databriefs/db82.pdf.
A-4. BLANCHEMETROIKHAIL, "Utilización de la atención prenatal entre mujeres afroamericanas de bajos ingresos",Revista de Enfermería
de Salud Comunitaria, 17 (2000), 235–246.
A-5. jAMÉSPDMITO, RAJENDRAH. M.EHTA, SUGATAKDCOMO, THOMASTEFS, DEANJ. K.ARAVITO, PAGAMELALRUSMAN, DÁVIDO
BRUCKMANy kSOYAEAGLE, "Efectos de la admisión a fin de mes sobre la duración de la estadía y la calidad de la atención entre
pacientes hospitalizados con infarto de miocardio",Diario Americano de Medicina, 113 (2002), 288–293.
A-6. ROBYNGRAMOALLAGHER, SharónMETROCkINLEYy kATLETADRACUP, "Predictor de la asistencia de las mujeres a los programas de
rehabilitación cardíaca",Avances en Enfermería Cardiovascular, 18 (2003), 121–126.
A-7. JR PLEISy RCOLES, “Resumen de estadísticas de salud para adultos de EE. UU.: Encuesta nacional de entrevistas de salud, 1999”,
Centro Nacional de Estadísticas de Salud.Estadísticas vitales y de salud, 10 (212), (2003).
A-8. Oficina del Censo de EE.UU,Informes de población actual,P60–215, según se informa en Statistical Abstract of the United States:
2002 (118th edition), US Bureau of the Census, Washington, DC, 2002, Table Nos. 137–138.
A-9. Oficina de Estadísticas Laborales de EE. UU.,Noticias,USDL 01–473, según se informa en Statistical Abstract of the United States:
2002 (118th edition), US Bureau of the Census, Washington, DC, 2002, Table No. 139.
A-10. IUNjANSSEN, STEVENBHCAMPO EYMy ROBERTOROSS, "La masa muscular esquelética relativa baja (sacopenia) en las personas
mayores está asociada con el deterioro funcional y la discapacidad física",Diario de la Sociedad Americana de
Geriatría, 50 (2002), 889–896.
CAPÍTULO 6
ESTIMACION
Este capítulo cubre la estimación, uno de los dos tipos de inferencia estadística. Como se
discutió en capítulos anteriores, las estadísticas, como las medias y las varianzas, se
pueden calcular a partir de muestras extraídas de poblaciones. Estas estadísticas sirven
como estimaciones de los parámetros de población correspondientes. Esperamos que
estas estimaciones difieran en cierta medida de los parámetros que estiman. Este capítulo
presenta procedimientos de estimación que toman en cuenta estas diferencias,
proporcionando así una base para los procedimientos de inferencia estadística discutidos
en los capítulos restantes del libro.
TEMAS
6.1INTRODUCCIÓN
6.2INTERVALO DE CONFIANZA PARA UNA MEDIA POBLACIONAL
6.3ELtDISTRIBUCIÓN
6.4INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS
POBLACIONALES
6.5INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN DE LA POBLACIÓN
161
162 CAPÍTULO 6 ESTIMACIÓN
6.1 INTRODUCCIÓN
Llegamos ahora a una consideración deEstimacion,la primera de las dos áreas generales de inferencia
estadística. La segunda área general,evaluación de la hipótesis,se examina en el capítulo siguiente.
Aprendimos en el Capítulo 1 que la estadística inferencial se define de la siguiente manera.
DEFINICIÓN
Inferencia estadísticaes el procedimiento por el cual llegamos a una conclusión
sobre una población sobre la base de la información contenida en una muestra
extraída de esa población.
El proceso de estimación consiste en calcular, a partir de los datos de una muestra, algún
estadístico que se ofrece como una aproximación del parámetro correspondiente de la
población de la que se extrajo la muestra.
El fundamento de la estimación en el campo de las ciencias de la salud se basa en la suposición de
que los trabajadores de este campo tienen interés en los parámetros, como las medias y las proporciones, de
varias poblaciones. Si este es el caso, hay una buena razón por la que se debe confiar en los procedimientos
de estimación para obtener información sobre estos parámetros. Muchas poblaciones de interés, aunque
finitas, son tan grandes que un examen del 100 por ciento sería prohibitivo desde el punto de vista del costo.
Suponga que el administrador de un gran hospital está interesado en la edad media de los pacientes
ingresados en su hospital durante un año determinado. Puede considerar demasiado costoso revisar los
registros de todos los pacientes admitidos durante ese año en particular y, en consecuencia, optar por
examinar una muestra de los registros a partir de la cual puede calcular una estimación de la edad media de
los pacientes admitidos ese año.
Un médico de práctica general puede estar interesado en saber qué proporción de cierto
tipo de individuo, tratado con un fármaco particular, sufre efectos secundarios indeseables. Sin
duda, su concepto de población consiste en todas aquellas personas que alguna vez han sido o
serán tratadas con esta droga. Aplazar una conclusión hasta que se haya observado a toda la
población podría tener un efecto adverso en su práctica.
Estos dos ejemplos han implicado un interés en estimar, respectivamente, una
media poblacional y una proporción poblacional. Otros parámetros, cuya estimación
cubriremos en este capítulo, son la diferencia entre dos medias, la diferencia entre dos
proporciones, la varianza de la población y la razón de dos varianzas.
6.1 INTRODUCCIÓN 163
Encontraremos que para cada uno de los parámetros que discutimos, podemos calcular dos tipos de
estimación: una estimación puntual y una estimación de intervalo.
DEFINICIÓN
Apunto estimadoes un único valor numérico utilizado para estimar el
parámetro de población correspondiente.
DEFINICIÓN
Unestimación de intervaloconsta de dos valores numéricos que definen un rango
de valores que, con un grado específico de confianza, muy probablemente incluye
el parámetro que se estima.
DEFINICIÓN
Un estimador, digamos,T,del parámetrotuse dice que es imparcialestimador
detusiE(T) =tu
mi(t)se lee, “el valor esperado deT.”Para una población finita,mi(t)se obtiene tomando el
valor medio deTcalculada a partir de todas las muestras posibles de un tamaño dado que
pueden extraerse de la población. Eso es,midT¼metroT.Para una población infinita,mi(t)se
define en términos de cálculo.
En el capítulo anterior hemos visto que la media muestral, la proporción muestral, la
diferencia entre dos medias muestrales y la diferencia entre dos proporciones muestrales son
estimaciones no sesgadas de sus parámetros correspondientes. Esta propiedad estaba implícita
cuando se decía que los parámetros eran las medias de las respectivas distribuciones
muestrales. Por ejemplo, dado que la media de la distribución muestral de -Xes igual ametro, lo
sabemos -Xes un estimador insesgado demetro.Los otros criterios de buenos estimadores no
164 CAPÍTULO 6 ESTIMACIÓN
ser discutido en este libro. El lector interesado los encontrará cubiertos en detalle en la mayoría de los textos
de estadística matemática.
DEFINICIÓN
Elpoblación muestreadaes la población de la que realmente se extrae una
muestra.
DEFINICIÓN
Elpoblación objetivoes la población sobre la que se desea hacer una
inferencia.
Muestras aleatorias y no aleatoriasEn los ejemplos y ejercicios de este libro, suponemos que los datos
disponibles para el análisis provienen de muestras aleatorias. La estricta validez de los procedimientos
estadísticos discutidos depende de esta suposición. En muchos casos, en aplicaciones del mundo real, es
imposible o poco práctico utilizar muestras verdaderamente aleatorias. En los experimentos con animales,
por ejemplo, los investigadores suelen utilizar cualquier animal disponible de los proveedores o de su propio
ganado reproductor. Si los investigadores tuvieran que depender de
6.2 INTERVALO DE CONFIANZA PARA UNA MEDIA POBLACIONAL 165
material seleccionado al azar, se llevaría a cabo muy poca investigación de este tipo. Una vez más, las
consideraciones no estadísticas deben desempeñar un papel en el proceso de generalización. Los
investigadores pueden afirmar que las muestras realmente utilizadas son equivalentes a muestras aleatorias
simples, ya que no hay razón para creer que el material realmente utilizado no sea representativo de la
población sobre la cual se desean inferencias.
En muchos proyectos de investigación en salud, se emplean muestras de conveniencia, en lugar de
muestras aleatorias. Es posible que los investigadores tengan que confiar en sujetos voluntarios o en sujetos
fácilmente disponibles, como los estudiantes en sus clases. Las muestras obtenidas de dichas fuentes son
ejemplos demuestras de conveniencia.Nuevamente, las generalizaciones deben hacerse sobre la base de
consideraciones no estadísticas. Las consecuencias de tales generalizaciones, sin embargo, pueden ser útiles
o pueden variar desde engañosas hasta desastrosas.
En algunas situaciones, es posible introducir la aleatorización en un experimento aunque
los sujetos disponibles no se seleccionen aleatoriamente de una población bien definida. Al
comparar dos tratamientos, por ejemplo, cada sujeto puede ser asignado al azar a uno u otro
de los tratamientos. Las inferencias en tales casos se aplican a los tratamientos y no a los
sujetos y, por lo tanto, las inferencias son válidas.
Supongamos que los investigadores desean estimar la media de alguna población normalmente distribuida.
Extraen una muestra aleatoria de tamañonortede la población y calcular -X,que utilizan como una estimación
puntual demetro.Aunque este estimador demetroposee todas las cualidades de un buen estimador, sabemos
que debido a que el muestreo aleatorio involucra inherentemente el azar, -Xno se puede esperar que sea
igual ametro.
Sería mucho más significativo, por lo tanto, estimarmetropor un intervalo que de
alguna manera comunica información sobre la magnitud probable demetro.
(1 _α) = .95
α/2 α/2
2 σX 2σX
m X
X1
X2
X3
X4
X5
útil para construir un intervalo sobre esta estimación puntual de¿metro?La respuesta es sí.
Supongamos que construimos intervalos sobre cada valor posible de -Xcalculado a partir de todas las
muestras posibles de tamañonortede la población de interés. Tendríamos un gran número de
intervalos de la forma -X -2s-Xcon anchos todos iguales al ancho del intervalo sobre la incógnitametro.
Aproximadamente el 95 por ciento de estos intervalos tendrían centros dentro del -2s-Xintervalo sobre
metro.Cada uno de los intervalos cuyos centros caen dentro de 2s-Xdemetrocontendríametro.Estos
conceptos se ilustran en la Figura 6.2.1, en la que vemos que:X; -X3, y -X4
todos caen dentro del intervalo sobremetro,y, en consecuencia, los 2s-Xintervalos sobre estas medias
muestrales incluyen el valor demetro.La muestra significa -X2y -X5no caigas dentro de los 2s-X
intervalo sobremetro,y los 2s-Xintervalos sobre ellos no incluyenmetro.
EJEMPLO 6.2.1
Suponga que un investigador, interesado en obtener una estimación del nivel promedio de alguna
enzima en cierta población humana, toma una muestra de 10 individuos, determina el nivel de la
enzima en cada uno y calcula una media muestral de:X¼22. Suponga además que se sabe que la
variable de interés tiene una distribución aproximadamente normal con una varianza de 45.
Deseamos estimarmetro.
Solución:Un intervalo de confianza aproximado del 95 por ciento parametroes dado por
- X -2s-X
rffiffiffiffiffi
45
22 - 2
10
22 - 2d2:1213Þ
17:76; 26:24 &
6.2 INTERVALO DE CONFIANZA PARA UNA MEDIA POBLACIONAL 167
dóndezd1-un =2Þes el valor deza la izquierda del cual se encuentra 1 -un =2 y a la derecha de la cual se
encuentra un =2 del área bajo su curva.
Interpretación Probabilística
En muestreo repetido, de una población distribuida normalmente con una desviación estándar
conocida,100d1 -aÞporcentaje de todos los intervalos de la forma -x - zd1-un =2Þs-Xincluirá a la
larga la media de la poblaciónmetro.
Interpretación Práctica
Cuando el muestreo es de una población distribuida normalmente con desviación estándar
conocida, estamos100d1 -aÞpor ciento seguro de que el único intervalo calculado,
- x - zd1-un =2Þs-X,contiene la media de la poblaciónmetro.
En el ejemplo dado aquí, podríamos preferir, en lugar de 2, el valor más exacto dez,
1,96, correspondiente a un coeficiente de confianza de 0,95. Los investigadores pueden usar cualquier
coeficiente de confianza que deseen; los valores más utilizados son .90, .95 y .99, que tienen factores
de confiabilidad asociados, respectivamente, de 1.645, 1.96 y 2.58.
168 CAPÍTULO 6 ESTIMACIÓN
EJEMPLO 6.2.2
Un fisioterapeuta deseaba estimar, con un 99 por ciento de confianza, la fuerza máxima media de un
músculo en particular en cierto grupo de individuos. Está dispuesto a suponer que las puntuaciones
de fuerza se distribuyen aproximadamente normalmente con una varianza de 144. Una muestra de 15
sujetos que participaron en el experimento arrojó una media de 84,3.
84:3 - 2:58d3:0984Þ
84:3 - 8:0
76:3; 92:3
Decimos que estamos 99 por ciento seguros de que la media de la población está
entre 76.3 y 92.3 ya que, en muestreo repetido, el 99 por ciento de todos los intervalos
que podrían construirse de la manera que acabamos de describir incluiría la media de
la población. &
Las situaciones en las que la variable de interés tiene una distribución aproximadamente normal con una
varianza conocida son bastante raras. El propósito de los ejemplos anteriores, que suponían que existían
estas condiciones ideales, era establecer los antecedentes teóricos para construir intervalos de confianza
para las medias de población. En la mayoría de las situaciones prácticas, las variables no tienen una
distribución aproximadamente normal o no se conocen las varianzas de la población, o ambas cosas. El
ejemplo 6.2.3 y la sección 6.3 explican los procedimientos que están disponibles para usar en situaciones
menos que ideales, pero más comunes.
EJEMPLO 6.2.3
La puntualidad de los pacientes en la asistencia a las citas es de interés para un equipo de investigación. En un
estudio de flujo de pacientes a través de los consultorios de médicos generales, se encontró que una muestra de 35
pacientes llegaba 17,2 minutos tarde a las citas, en promedio. Investigaciones anteriores habían demostrado que la
desviación estándar era de unos 8 minutos. Se consideró que la distribución de la población no era normal. ¿Cuál es el
intervalo de confianza del 90 por ciento parametro,la verdadera cantidad media de tiempo atrasado para las citas?
6.2 INTERVALO DE CONFIANZA PARA UNA MEDIA POBLACIONAL 169
Solución: Como el tamaño de la muestra es bastante grande (más de 30) y como se conoce la
desviación estándar de la población, nos basamos en el teorema del límite central y
asumimos la distribución muestral de:Xaproximadamente distribuida normalmente. De la
Tabla D del Apéndice encontramos el coeficiente de confiabilidad correspondiente a un
coeficiente de confianzapag ieffinffiffitffiffi de .90 para ser alrededor de 1.645, si interpolamos. El
el error estándar ess-X¼8= 35¼1:3522, de modo que nuestro intervalo de confianza del 90 por ciento
parametroes
17:2 - 1:645d1:3522Þ
17:2 - 2:2
15:0; 19:4 &
Con frecuencia, cuando la muestra es lo suficientemente grande para la aplicación del teorema del
límite central, se desconoce la varianza de la población. En ese caso, usamos la varianza muestral
como reemplazo de la varianza poblacional desconocida en la fórmula para construir un intervalo de
confianza para la media poblacional.
EJEMPLO 6.2.4
Los siguientes son los valores de actividad (micromoles por minuto por gramo de tejido) de
cierta enzima medida en tejido gástrico normal de 35 pacientes con carcinoma gástrico.
Deseamos usar el paquete de software de computadora MINITAB para construir un intervalo de confianza
del 95 por ciento para la media de la población. Supongamos que sabemos que la varianza de la población es
.36. No es necesario suponer que la población de valores muestreada se distribuye normalmente ya que el
tamaño de la muestra es lo suficientemente grande para la aplicación del teorema del límite central.
Solución: Ingresamos los datos en la Columna 1 y procedemos como se muestra en la Figura 6.2.2. Estas
de confianza del 95 por ciento, que la desviación estándar de la población es 0,6 y que los datos
están en la Columna 1. El resultado nos dice que la media muestral es 0,718, lapagsffiffiffimple spag
la desviación de taffinffiffidffiffiard es .511, y el error estándar de la media,
s=nortees :6= 35¼ :101. &
Tenemos un 95 por ciento de confianza en que la media de la población está entre .519 y .917.
Los intervalos de confianza se pueden obtener mediante el uso de muchos otros paquetes de
software. Usuarios de SAS®, por ejemplo, puede querer usar la salida de PROC MEANS o PROC
UNIVARIATE para construir intervalos de confianza.
170 CAPÍTULO 6 ESTIMACIÓN
Producción:
Una muestra Z: C1
FIGURA 6.2.2Procedimiento de MINITAB para construir un intervalo de confianza del 95 por ciento para una
media poblacional, Ejemplo 6.2.4.
Media recortadaLos estimadores que no son sensibles a los valores atípicos se denominanestimadores
robustos.Otra medida robusta y estimador de tendencia central es lamedia recortada.Para un conjunto de
datos de muestra que contienenortemedidas calculamos el 100aporcentaje de media recortada de la
siguiente manera:
EJERCICIOS
Para cada uno de los siguientes ejercicios, construya intervalos de confianza de 90, 95 y 99 por ciento para la
media de la población y establezca las interpretaciones prácticas y probabilísticas de cada uno. Indique qué
interpretación cree que sería más apropiada usar al discutir los intervalos de confianza con
6.3 ELtDISTRIBUCIÓN 171
alguien que no haya tenido un curso de estadística, y exponga el motivo de su elección. Explica por
qué los tres intervalos que construyes no tienen el mismo ancho. Indique cuál de los tres intervalos
preferiría utilizar como estimación de la media de la población y exponga el motivo de su elección.
6.2.1.Deseamos estimar el número promedio de latidos del corazón por minuto para una determinada población. Se encontró
que el número promedio de latidos cardíacos por minuto para una muestra de 49 sujetos es 90. Suponga que estos
49 pacientes constituyen una muestra aleatoria y que la población se distribuye normalmente con una desviación
estándar de 10.
6.2.2.Deseamos estimar el nivel medio de bilirrubina indirecta en suero de lactantes de 4 días de edad. Se encontró que la media para una
muestra de 16 lactantes era de 5,98 mg/100 cc. Suponga que los niveles de bilirrubina en lactantes de 4 días tienen una
distribución aproximadamente normal con una desviación estándar de 3,5 mg/100 cc.
6.2.3.En un estudio de la duración de la hospitalización realizado por varios hospitales cooperantes, se extrajo una muestra aleatoria de
64 pacientes con úlcera péptica de una lista de todos los pacientes con úlcera péptica que alguna vez ingresaron en los
hospitales participantes y se determinó la duración de la hospitalización por ingreso para cada uno. Se encontró que la
duración media de la hospitalización fue de 8,25 días. Se sabe que la desviación estándar de la población es de 3 días.
6.2.4.Una muestra de 100 varones adultos aparentemente normales, de 25 años, tenía una presión arterial sistólica media de
125. Se cree que la desviación estándar de la población es 15.
6.2.5.Algunos estudios de la enfermedad de Alzheimer (EA) han mostrado un aumento en14CO2producción en pacientes con la
enfermedad. En uno de esos estudios, lo siguiente14CO2los valores se obtuvieron de 16 muestras de biopsia
neocortical de pacientes con EA.
6.3 ELtDISTRIBUCIÓN
En la Sección 6.2, se describió un procedimiento para construir un intervalo de confianza para una
media poblacional. El procedimiento requiere el conocimiento de la varianza de la población de la que
se extrae la muestra. Puede parecer algo extraño que uno pueda tener conocimiento de la varianza
de la población y no saber el valor de la media de la población. De hecho, es el caso habitual, en
situaciones como las que se han presentado, que se desconoce la varianza de la población, así como
la media de la población. Esta condición presenta un problema con respecto a la construcción de
intervalos de confianza. Aunque, por ejemplo, la estadística
- X -metro
z¼ pffiffiffi
s= norte
s¼ dXi- -XÞ2=ðn-1Þ
172 CAPÍTULO 6 ESTIMACIÓN
para reemplazars.Cuando el tamaño de la muestra es grande, digamos mayor a 30, nuestra fe enscomo una
aproximación dessuele ser sustancial, y puede estar debidamente justificado el uso de la teoría de la
distribución normal para construir un intervalo de confianza para la media de la población. En ese caso,
procedemos como se indica en la Sección 6.2.
Es cuando tenemos muestras pequeñas que se nos hace obligatorio encontrar un
procedimiento alternativo para construir intervalos de confianza.
A raíz del trabajo de Gosset (2), escribiendo bajo el seudónimo de “Estudiante”, una alternativa,
conocida comodistribución t de Student,generalmente abreviado adistribución de t,está disponible
para nosotros.
La cantidad
- X -metro
t¼ pffiffiffi (6.3.1)
s= norte
Grados de libertad = 30
Grados de libertad = 5
Grados de libertad = 2
t
FIGURA 6.3.1Eltdistribución para diferentes valores de grados de libertad.
6.3 ELtDISTRIBUCIÓN 173
Distribución normal
tdistribución
X
FIGURA 6.3.2Comparación de distribución normal ytdistribución.
6.En comparación con la distribución normal, latla distribución es menos puntiaguda en el centro y
tiene colas más gruesas. La Figura 6.3.2 compara eltdistribución con la normal.
7.Eltdistribución se aproxima a la distribución normal comon-1 tiende a infinito.
EltLa distribución, como la normal estándar, ha sido tabulada extensamente. Una de estas
tablas se proporciona como Tabla E en el Apéndice. Como veremos, debemos tener en cuenta tanto el
coeficiente de confianza como los grados de libertad cuando usamos la tabla de latdistribución.
Puede usar MINITAB para graficar eltdistribución (para valores de grados de libertad
especificados) y otras distribuciones. Después de designar el eje horizontal siguiendo las instrucciones
en el cuadro Establecer datos con patrones, elija la ruta del menú Calc y luego Probability
Distributions. Finalmente, haga clic en la distribución deseada y siga las instrucciones. Utilice el
cuadro de diálogo Trazar para trazar el gráfico.
Lo que es diferente es la fuente del coeficiente de confiabilidad. Ahora se obtiene de la tabla de lat
distribución en lugar de la tabla de distribución normal estándar. Para ser más especifico,cuando el
muestreo es de una distribución normal cuya desviación estándar,s,se desconoce, el100d1 -aÞ
intervalo de confianza porcentual para la media de la población,metro,es dado por
s
- x - td1-un =2Þpffiffiffi (6.3.2)
norte
Resaltamos que un requisito para el uso estrictamente válido de latdistribución es que la muestra
debe ser extraída de una distribución normal. Sin embargo, la experiencia ha demostrado que se
pueden tolerar desviaciones moderadas de este requisito. Como consecuencia, elt la distribución se
utiliza incluso cuando se sabe que la población original se desvía un poco de la normalidad. La
mayoría de los investigadores requieren que sea sostenible una suposición de, al menos, una
distribución de la población en forma de montículo.
EJEMPLO 6.3.1
Maffulli et al. (A-1) estudiaron la eficacia de las terapias tempranas de movilización del tobillo y carga
de peso después de la reparación aguda de una rotura del tendón de Aquiles. una de las variables
174 CAPÍTULO 6 ESTIMACIÓN
midieron después del tratamiento la fuerza isométrica del músculo gastrocsoleo. En 19 sujetos, la
fuerza isométrica media del miembro operado (en newtons) fue de 250,8 con una desviación estándar
de 130,9. Suponemos que estos 19 pacientes constituyen una muestra aleatoria de una población de
sujetos similares. Deseamos utilizar estos datos de muestra para estimar para la población la fuerza
isométrica media después de la cirugía.
Solución: Podemos usar la media muestral, 250.8, como una estimación puntual de la media
poblacional pero, debido a que se desconoce la desviación estándar de la población,
debemos suponer que la población de valores tiene una distribución al menos
aproximadamente normal antes de construir un intervalo de confianza parametro.
Supongamos que tal suposición es razonable y que un 95 por ciento de confianza en
pagerffivffiffi al es deseopagedffiffiffi.ffiffi Tenemos nuestro estimador, -X,y nuestro error estándar es
s = norte¼130:9= 19¼30:0305. Ahora necesitamos encontrar el coeficiente de
confiabilidad, el valor detasociado con un coeficiente de confianza de .95 yn-1¼18
grados de libertad. Dado que un intervalo de confianza del 95 por ciento deja 0,05 del
área bajo la curva detpara ser dividido equitativamente entre las dos colas,
necesitamos el valor deta la derecha del cual se encuentra .025 del área. Localizamos
en el Apéndice Tabla E la columna encabezadat:975. Este es el valor deta la izquierda del
cual se encuentra .975 del área bajo la curva. El área a la derecha de este valor es igual
al .025 deseado. Ahora ubicamos el número 18 en la columna de grados de libertad. El
valor en la intersección de la fila con la etiqueta 18 y la columna con la etiquetat:975es el
tnosotros buscamos. Este valor deyo,que es nuestro coeficiente de confiabilidad, se
encuentra que es 2.1009. Ahora construimos nuestro intervalo de confianza del 95 por
ciento de la siguiente manera:
250:8 - 2:1009d30:0305Þ
250:8 - 63:1
187:7; 313:9
&
Este intervalo puede interpretarse tanto desde el punto de vista probabilístico como práctico. Estamos 95 por
ciento seguros de que la verdadera población significa,metro,está en algún lugar entre 187.7 y 313.9 porque,
en muestreo repetido, el 95 por ciento de los intervalos construidos de manera similar incluiránmetro.
Población
Sí normalmente No
¿repartido?
Muestra Muestra
Sí tamaño No Sí tamaño No
¿grande? ¿grande?
z t z t z z * *
FIGURA 6.3.3Diagrama de flujo para usar al decidir entrezytal hacer inferencias sobre las medias de la
población. (Utilice un procedimiento no paramétrico. Consulte el Capítulo 13).
EJERCICIOS
6.3.1.Utilizar eltdistribución para encontrar el factor de confiabilidad para un intervalo de confianza basado en los siguientes
coeficientes de confianza y tamaños de muestra:
a b C d
Coeficiente de confianza . 95 . 99 . 90 . 95
Tamaño de la muestra 15 24 8 30
6.3.2.En un estudio de los efectos de la enfermedad de Alzheimer temprana en la memoria no declarativa, Reber et al. (A-2) usó la prueba
de fluidez de categoría para establecer la persistencia de referencia y la memoria semántica y las habilidades lingüísticas. Los
ocho sujetos de la muestra obtuvieron puntajes en la prueba de fluidez de categoría de 11, 10, 6, 3, 11, 10, 9,
11. Suponga que los ocho sujetos constituyen una muestra aleatoria simple de una población normalmente
distribuida de sujetos similares con enfermedad de Alzheimer temprana.
(a)¿Cuál es la estimación puntual de la media poblacional?
(b)¿Cuál es la desviación estándar de la muestra?
(C)¿Cuál es el error estándar estimado de la media muestral?
(d)Construya un intervalo de confianza del 95 por ciento para la puntuación de la prueba de fluidez de la categoría media de la población.
6.3.3.Pedroletti et al. (A-3) informaron la velocidad máxima de difusión de óxido nítrico en una muestra de 15
escolares asmáticos y 15 controles como media - error estándar de la media. Para los niños asmáticos, ellos
176 CAPÍTULO 6 ESTIMACIÓN
reportaron 3:5 - 0:4 nL=s (nanolitros por segundo) y para sujetos de control reportaron 0:7 - :1 nL=s.
Para cada grupo, determine lo siguiente:
(a)¿Cuál fue la desviación estándar de la muestra?
(b)¿Cuál es el intervalo de confianza del 95 por ciento para la velocidad máxima media de difusión de óxido nítrico de la
población?
(C)¿Qué suposiciones son necesarias para la validez del intervalo de confianza que construyó?
(d)¿Cuáles son las interpretaciones prácticas y probabilísticas del intervalo que construyó?
(mi)¿Qué interpretación sería más apropiada para usar cuando se analizan los intervalos de confianza con
alguien que no ha tomado un curso de estadística? Indique las razones de su elección.
(F)Si tuviera que construir un intervalo de confianza del 90 por ciento para la media de la población a partir de la
información proporcionada aquí, ¿el intervalo sería más ancho o más estrecho que el intervalo de confianza del 95
por ciento? Explique su respuesta sin construir realmente el intervalo.
(gramo)Si tuviera que construir un intervalo de confianza del 99 por ciento para la media de la población a partir de la
información proporcionada aquí, ¿el intervalo sería más ancho o más estrecho que el intervalo de confianza del 95
por ciento? Explique su respuesta sin construir realmente el intervalo.
6.3.4.La preocupación de un estudio de Beynnon et al. (A-4) fueron nueve sujetos con desgarros crónicos del
ligamento cruzado anterior (LCA). Una de las variables de interés fue la laxitud anteroposterior, donde
valores más altos indican mayor inestabilidad de la rodilla. Los investigadores encontraron que entre los
sujetos con rodillas con LCA deficiente, el valor medio de laxitud fue de 17,4 mm con una desviación estándar
de 4,3 mm.
(a)¿Cuál es el error estándar estimado de la media?
(b)Construya el intervalo de confianza del 99 por ciento para la media de la población de la cual se puede
suponer que los nueve sujetos son una muestra aleatoria.
(C)¿Cuál es la precisión de la estimación?
(d)¿Qué suposiciones son necesarias para la validez del intervalo de confianza que construyó?
6.3.5.Una muestra de 16 niñas de diez años tenía un peso medio de 71,5 y una desviación estándar de 12 libras.
respectivamente. Suponiendo normalidad, encuentre los intervalos de confianza de 90, 95 y 99 por ciento parametro.
6.3.6.Los sujetos de un estudio de Dugoff et al. (A-5) eran 10 pasantes de obstetricia y ginecología en el Centro de
Ciencias de la Salud de la Universidad de Colorado. Los investigadores querían evaluar la competencia en la
realización de exámenes clínicos de mama. Una de las medidas de referencia fue el número de tales
exámenes realizados. Los siguientes datos dan el número de exámenes de mama realizados para esta
muestra de 10 internas.
1 30
2 40
3 8
4 20 Fuente: Lorraine Dugoff, Mauritha R. Everett,
5 26 Louis Vontver y Gwyn E. Barley, “Evaluación de
6 35 las habilidades de examen pélvico y mamario
7 35 de los internos en
8 20 Obstetricia y Ginecología y Medicina
9 25 Interna”,Revista americana de
obstetricia y ginecología, 189 (2003),
10 20
655–658.
6.4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 177
Construya un intervalo de confianza del 95 por ciento para la media de la población de la que se puede
suponer que se han extraído los sujetos del estudio.
A veces surgen casos en los que nos interesa estimar la diferencia entre dos medias
poblacionales. De cada una de las poblaciones se extrae una muestra aleatoria independiente y,
a partir de los datos de cada una, las medias muestrales -X1y -X2, respectivamente, se calculan.
Aprendimos en el capítulo anterior que el estimador -X1- -X2produce una estimación no sesgada
demetro-1-metro2, la- diferencia entre las medias de la población. La varianza de la
estimador ess21=n1þs2 2=n2. También sabemos por el Capítulo 5 que, dependiendo de la
condiciones, la distribución de muestreo de -X1- -X2puede tener, al menos, una distribución
aproximadamente normal, de modo que en muchos casos hacemos uso de la teoría relevante para las
distribuciones normales para calcular un intervalo de confianza parametro1-metro2. Cuando se conocen las
varianzas de la población, el 100d1 -aÞintervalo de confianza porcentual parametro1-metro2es dado por
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
s21 s 22
d-X1- -X2Þ -z1-un =2 norte1 þ (6.4.1)
norte2
EJEMPLO 6.4.1
Un equipo de investigación está interesado en la diferencia entre los niveles de ácido úrico en suero
en pacientes con y sin síndrome de Down. En un gran hospital para el tratamiento de personas con
problemas mentales, una muestra de 12 personas con síndrome de Down arrojó una media de
- X1¼4:5mg=100ml. En un hospital general se encontró que una muestra de 15 individuos normales de
la misma edad y sexo tenía un valor medio de -X2¼3:4. Si es razonable suponer que las dos
poblaciones de valores se distribuyen normalmente con varianzas iguales a 1 y 1.5, encuentre el
intervalo de confianza del 95 por ciento parametro1-metro2.
Solución: Para una estimación puntual demetro1-metro2, usamos -X1- -X2¼4:5 - 3:4¼1:1. El
coeficiente de confiabilidad correspondiente a .95 se encuentra en la Tabla D del
Apéndice como 1.96. El error estándar es
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
s21 s2 1 1:5
s-X1--X2 ¼ þ 2¼ þ ¼ :4282
norte1 norte2 12 15
178 CAPÍTULO 6 ESTIMACIÓN
1:1 - 1:96d:4282Þ
1:1 - :84
d:26; 1:94Þ
EJEMPLO 6.4.2
A pesar del conocimiento común de los efectos adversos de hacerlo, muchas mujeres continúan
fumando durante el embarazo. Mayhew et al. (A-6) examinó la efectividad de un programa para
dejar de fumar para mujeres embarazadas. La media de cigarrillos fumados diariamente al
cierre del programa por las 328 mujeres que completaron el programa fue de 4,3 con una
desviación estándar de 5,22. Entre 64 mujeres que no completaron el programa, la media de
cigarrillos fumados por día al final del programa fue de 13 con una desviación estándar de 8,97.
Deseamos construir un intervalo de confianza del 99 por ciento para la diferencia entre las
medias de las poblaciones de las que se supone que se seleccionaron las muestras.
5:222 8:972
s-X1--X2¼ þ ¼1:1577
328 64
6.4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 179
Por la Ecuación 6.4.1, nuestro intervalo de confianza del 99 por ciento para la diferencia entre
las medias de la población es
- 8:7 - 2:58d1:1577Þ
ð-11:7; -5:7Þ
Estamos seguros en un 99 por ciento de que la media de cigarrillos que fuman al
día las mujeres que completan el programa es entre 5,7 y 11,7 más baja que la
media de las mujeres que no completan el programa. &
Población Varianzas IgualesSi se justifica la suposición de varianzas poblacionales iguales, las dos
varianzas muestrales que calculamos a partir de nuestras dos muestras independientes pueden
considerarse estimaciones de la misma cantidad, la varianza común. Parece lógico, entonces, que de
alguna manera deberíamos capitalizar esto en nuestro análisis. Hacemos precisamente eso y
obtenemos unestimación agrupadade la varianza común. Esta estimación combinada se obtiene
calculando el promedio ponderado de las dos varianzas de la muestra. Cada varianza muestral se
pondera por sus grados de libertad. Si los tamaños de muestra son iguales, este promedio ponderado
es la media aritmética de las dos varianzas de muestra. Si los dos tamaños de muestra son diferentes,
el promedio ponderado aprovecha la información adicional proporcionada por la muestra más
grande. La estimación agrupada viene dada por la fórmula
spag
2 s2pag
s-X1--X2¼ þ (6.4.3)
norte1 norte2
spag
2 spag
2
d-X1- -X2Þ -td1-un =2Þ norte1 þ (6.4.4)
norte2
El número de grados de libertad utilizados para determinar el valor deta utilizar en la construcción del
intervalo esnorte1þnorte2- 2, el denominador de la Ecuación 6.4.2. Interpretamos este intervalo de la
manera habitual.
Los métodos que se pueden usar para llegar a una decisión sobre la igualdad de las varianzas
de la población se analizan en las Secciones 6.10 y 7.8.
180 CAPÍTULO 6 ESTIMACIÓN
EJEMPLO 6.4.3
El propósito de un estudio de Granholm et al. (A-7) fue determinar la efectividad de un
programa integrado de tratamiento ambulatorio de diagnóstico dual para sujetos con
enfermedades mentales. Los autores estaban abordando el problema del abuso de
sustancias entre las personas con trastornos mentales graves. Se realizó una revisión
retrospectiva de las historias clínicas de 50 referencias consecutivas de pacientes al
programa de Abuso de Sustancias/Enfermedad Mental en el Sistema de Atención Médica
de VA San Diego. Una de las variables de resultado examinadas fue el número de días de
tratamiento hospitalario por trastorno psiquiátrico durante el año siguiente a la
finalización del programa. Entre 18 sujetos con esquizofrenia, el número medio de días de
tratamiento fue de 4,7 con una desviación estándar de 9,3. Para 10 sujetos con trastorno
bipolar, el número medio de días de tratamiento del trastorno psiquiátrico fue de 8,8 con
una desviación estándar de 11,5.
Solución: Primero usamos la Ecuación 6.4.2 para calcular la estimación agrupada de la varianza común
de la población.
-
d18 - 1Þ9:32þ ð10 - 1Þð11:5Þ2
2 ¼
spag ¼102:33
18þ10 - 2
Cuando ingresamos la Tabla E del Apéndice con 18þ10 - 2¼26 grados de libertad y un nivel
de confianza deseado de .95, encontramos que el factor de confiabilidad es 2.0555. Por la
Expresión 6.4.4 calculamos el intervalo de confianza del 95 por ciento para la diferencia entre
las medias de la población de la siguiente manera:
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
102:33 102:33
d4:7 - 8:8Þ -2:0555 þ
18 10
- 4:1 - 8:20
d-12.3, 4.1Þ
Las varianzas de la población no son igualesCuando no se puede concluir que las varianzas de
dos poblaciones de interés son iguales, aunque se suponga que las dos poblaciones están
normalmente distribuidas, no es adecuado utilizar eltdistribución como se acaba de esbozar en la
construcción de intervalos de confianza.
Como regla práctica en problemas aplicados, se puede desear asumir la desigualdad de
varianzas si la relación entre la varianza mayor y la menor excede de 2; sin embargo, en la Sección
6.10 se describe una prueba más formal.
6.4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 181
Una solución al problema de las varianzas desiguales fue propuesta por Behrens (3) y
posteriormente verificada y generalizada por Fisher (4,5). Las soluciones también han sido
propuestas por Neyman (6), Scheff-e (7,8) y Welch (9,10). El problema es discutido en detalle por
Cochran (11).
El problema gira en torno al hecho de que la cantidad
s2 spag
2
pagþ
norte1 norte2
w1t1þw2t2
t1-un
0 =2¼ (6.4.5)
w1þw2
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
s12 s22
d-X1- -X2Þ -t0d1-un =2Þ þ (6.4.6)
norte1 norte2
EJEMPLO 6.4.4
Reexaminemos los datos presentados en el Ejemplo 6.4.3 del estudio de Granholm et al. (A-7).
Recuerde que entre los 18 sujetos con esquizofrenia, el número medio de días de tratamiento fue de
4,7 con una desviación estándar de 9,3. En el grupo de tratamiento del trastorno bipolar de 10 sujetos,
el número medio de días de tratamiento del trastorno psiquiátrico fue de 8,8 con una desviación
estándar de 11,5. Suponemos que las dos poblaciones de número de días de trastorno psiquiátrico se
distribuyen aproximadamente normalmente. Ahora supongamos, sin embargo, que las dos varianzas
de población no son iguales. Deseamos construir un intervalo de confianza del 95 por ciento para la
diferencia entre las medias de las dos poblaciones representadas por las muestras.
Población
Sí normalmente No
¿repartido?
Muestra Muestra
Sí tamaños No Sí tamaños No
¿grande? ¿grande?
Sí =? No Sí =? No Sí =? No Sí =? No Sí =? No Sí =? No Sí =? No Sí =? No
z z
FIGURA 6.4.1Diagrama de flujo para usar al decidir si el factor de confiabilidad debe serz, t,ot0
al hacer inferencias sobre la diferencia entre las medias de dos poblaciones. (Utilice un
procedimiento no paramétrico. Consulte el Capítulo 13).
Mediante la Expresión 6.4.6 ahora construimos el intervalo de confianza del 95 por ciento
para la diferencia entre las dos medias de población.
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
9:32 11:52
d4:7 - 8:8Þ -2:2216 þ
18 10
d4:7 - 8:8Þ -2:2216d4:246175Þ
- 13:5; 5:3
Dado que el intervalo incluye cero, concluimos que las dos medias poblacionales
pueden ser iguales.
En la figura 6.4.2 se proporciona un ejemplo de este tipo de cálculo
utilizando el programa R, que utiliza la aproximación de Welch al problema de las
varianzas desiguales. Observe que hay una ligera diferencia en los extremos del
intervalo. &
EJERCICIOS 183
Código R :
> tsum.test(media.x¼4.7, sx¼9.3, nx¼18, media.y¼8.8, sí¼11.5, Nueva York¼10, alternativa¼
“dos.lados”, mu¼0, var.igual¼FALSO, nivel conf.¼0,95)
RSalida :
Prueba t de dos muestras modificada de Welch
datos: x e y resumidos
t¼-0.9656, gl¼15.635, valor p¼0.349
hipótesis alternativa: la verdadera diferencia de medias no es igual a 0
media de x media de y
4.7 8.8
FIGURA 6.4.2Programe el cálculo de ejemplo R para el intervalo de confianza entre dos medias suponiendo
varianzas desiguales utilizando los datos del Ejemplo 6.4.4.
EJERCICIOS
Para cada uno de los siguientes ejercicios, construya intervalos de confianza de 90, 95 y 99 por ciento para la
diferencia entre las medias de las poblaciones. En su caso, establezca los supuestos que hacen que su
método sea válido. Indique las interpretaciones prácticas y probabilísticas de cada intervalo que construya.
Considere las variables bajo consideración en cada ejercicio y establezca qué uso cree que los investigadores
podrían hacer de sus resultados.
6.4.1.Iannelo et al. (A-8) realizó un estudio que examinó las concentraciones de ácidos grasos libres en 18 sujetos delgados y 11
sujetos obesos. Los sujetos delgados tenían un nivel medio de 299metroEq/L con un error estándar de la media de
30, mientras que los sujetos obesos tenían una media de 744metroEq/L con un error estándar de la media de 62.
6.4.2.Chan et al. (A-9) desarrolló un cuestionario para evaluar el conocimiento del cáncer de próstata. Hubo un total de 36 preguntas a las
que los encuestados podían responder "de acuerdo", "en desacuerdo" o "no sé". Las puntuaciones pueden oscilar entre 0 y 36.
Las puntuaciones medias de los participantes caucásicos del estudio fueron 20,6 con una desviación estándar
de 5,8, mientras que la puntuación media de los hombres afroamericanos fue de 17,4 con una desviación estándar de
5,8. El número de participantes caucásicos en el estudio fue de 185 y el número de afroamericanos fue de 86.
6.4.3.Los objetivos de un estudio de van Vollenhoven et al. (A-10) fueron para examinar la eficacia de etanercept solo y
etanercept en combinación con metotrexato en el tratamiento de la artritis reumatoide. Los investigadores realizaron
un estudio retrospectivo utilizando datos de la base de datos STURE, que recopila datos de eficacia y seguridad para
todos los pacientes que inician tratamientos biológicos en los principales hospitales de Estocolmo, Suecia. Los
investigadores identificaron a 40 sujetos a los que se les recetó etanercept solo ya 57 sujetos a los que se les
administró etanercept con metotrexato. Utilizando una escala analógica visual de 100 mm (cuanto mayor sea el valor,
mayor será el dolor), los investigadores encontraron que después de 3 meses
de tratamiento, la puntuación media del dolor fue de 36,4 con un error estándar de la media de 5,5 para los sujetos que
tomaban solo etanercept. En la muestra que recibió etanercept más metotrexato, la puntuación media fue de 30,5 con un error
estándar de la media de 4,6.
6.4.4.El propósito de un estudio de Nozawa et al. (A-11) fue determinar la efectividad de la fijación segmentaria con
alambre en atletas con espondilólisis. Entre 1993 y 2000, 20 atletas (6 mujeres y 14 hombres)
184 CAPÍTULO 6 ESTIMACIÓN
con espondilólisis lumbar fueron tratados quirúrgicamente con la técnica. La siguiente tabla proporciona el puntaje
de evaluación de la Asociación Ortopédica Japonesa (JOA) para el síndrome de dolor lumbar para hombres y mujeres
antes de la cirugía. La puntuación más baja indica menos dolor.
6.4.5.Krantz et al. (A-12) investigó los efectos relacionados con la dosis de metadona en sujetos con torsade de
pointes, una taquicardia ventricular polimórfica. En el estudio de 17 sujetos, nueve estaban siendo tratados
con metadona por dependencia de opiáceos y ocho por dolor crónico. La dosis media diaria de metadona en
el grupo de dependencia de opiáceos fue de 541 mg/día con una desviación estándar de 156, mientras que el
grupo de dolor crónico recibió una dosis media de 269 mg/día con una desviación estándar de 316.
6.4.6.Las mediciones del diámetro transversal en los corazones de machos y hembras adultos dieron los siguientes resultados:
6.4.7.Veinticuatro animales de experimentación con deficiencia de vitamina D se dividieron por igual en dos grupos. El grupo 1
recibió tratamiento consistente en una dieta que aportaba vitamina D. El segundo grupo no recibió tratamiento. Al
finalizar el período experimental se realizaron determinaciones de calcio sérico con los siguientes resultados:
6.4.8.A dos grupos de niños se les realizaron pruebas de agudeza visual. El grupo 1 estuvo compuesto por 11 niños que reciben
su atención médica de médicos privados. El puntaje promedio para este grupo fue 26 con una desviación estándar de
5. El grupo 2 estaba compuesto por 14 niños que reciben atención médica del departamento de salud y tuvo un
puntaje promedio de 21 con una desviación estándar de 6. Suponga poblaciones distribuidas normalmente con
varianzas iguales.
6.4.9.La estancia media de una muestra de 20 pacientes dados de alta de un hospital general fue de 7 días con una
desviación estándar de 2 días. Una muestra de 24 pacientes dados de alta de un hospital de enfermedades
crónicas tuvo una estadía promedio de 36 días con una desviación estándar de 10 días. Suponga poblaciones
normalmente distribuidas con varianzas desiguales.
6.4.10.En un estudio de los factores que se cree que son responsables de los efectos adversos del tabaquismo en los humanos
reproducción, se realizaron determinaciones del nivel de cadmio (nanogramos por gramo) en tejido de placenta de un
6.5 INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN DE LA POBLACIÓN 185
muestra de 14 madres fumadoras y una muestra aleatoria independiente de 18 madres no fumadoras. Los
resultados fueron los siguientes:
No fumadores: 10,0, 8,4, 12,8, 25,0, 11,8, 9,8, 12,5, 15,4, 23,5,
9.4, 25.1, 19.5, 25.5, 9.8, 7.5, 11.8, 12.2, 15.0
¿Parece probable que el nivel medio de cadmio sea mayor entre los fumadores que entre los no fumadores? ¿Por qué
llegas a esta conclusión?
Muchas preguntas de interés para el trabajador de la salud se relacionan con las proporciones de la
población. ¿Qué proporción de pacientes que reciben un tipo particular de tratamiento se recupera? ¿Qué
proporción de una población tiene cierta enfermedad? ¿Qué proporción de una población es inmune a una
determinada enfermedad?
Para estimar una proporción poblacional se procede de la misma manera que para
estimar una media poblacional. Se extrae una muestra de la población de interés y se calcula la
proporción muestral, p̂. Esta proporción muestral se utiliza como estimador puntual de la
proporción poblacional. Un intervalo de confianza se obtiene mediante la fórmula general
En el capítulo anterior vimos que cuando ambosnotario públicoynorted1 -pagÞson mayores que 5,
podemos considerar que la distribución muestral de p̂ está bastante cerca de la distribución normal.
Cuando se cumple esta condición, nuestro coeficiente de confiabilidad es un valor dezdel estándar
ufffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff
distribución normal. El error estándar, como hemos visto, es igual aspag¼pagd1 -pagÞ=norte.
Desdepag,el parámetro que estamos tratando de estimar es desconocido, debemos usar p̂ como una estimación.
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff
EJEMPLO 6.5.1
El Pew Internet and American Life Project (A-13) informó en 2003 que el 18 por ciento de los usuarios
de Internet lo han utilizado para buscar información sobre tratamientos o medicamentos
experimentales. La muestra estuvo compuesta por 1220 usuarios adultos de Internet, y la información
se recopiló a través de entrevistas telefónicas. Deseamos construir un intervalo de confianza del 95
por ciento para la proporción de usuarios de Internet en la población muestreada que han buscado
información sobre tratamientos o medicamentos experimentales.
186 CAPÍTULO 6 ESTIMACIÓN
Solución: Supondremos que los 1220 sujetos fueron muestreados de forma aleatoria. La
mejor estimación puntual de la proporción de la población es p̂¼ :18. El tamaño
de la muestra y nuestra estimación depagson de suficiente magnitud para
justificar el uso de la distribución normal estándar en la construcción de un
intervalo de confianza. El coeficiente de fiabilidad correspondiente a una confi-
nivel de dencia de .95 es 1.96, y nuestra estimación del error estándarspages
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff
:18 - 1:96d:0110Þ
:18 - :022
:158; :202
Estamos 95 por ciento seguros de que la proporción de la poblaciónpagestá entre .158 y .202
porque, en muestreo repetido, alrededor del 95 por ciento de los intervalos construidos de la
misma manera que el presente intervalo único incluiría el verdadero
pag.Sobre la base de estos resultados, esperaríamos, con un 95 por ciento de confianza, encontrar
que entre el 15,8 y el 20,2 por ciento de los usuarios adultos de Internet lo hayan utilizado para
obtener información sobre medicamentos o tratamientos experimentales. &
EJERCICIOS
Para cada uno de los siguientes ejercicios, indique las interpretaciones prácticas y probabilísticas del intervalo que
construya. Identifique cada componente del intervalo: estimación puntual, coeficiente de confiabilidad y error
estándar. Explique por qué los coeficientes de confiabilidad no son los mismos para todos los ejercicios.
6.5.1.Luna et al. (A-14) estudiaron pacientes ventilados mecánicamente en la unidad de cuidados intensivos de seis hospitales
de Buenos Aires, Argentina. Los investigadores encontraron que de 472 pacientes ventilados mecánicamente, 63
tenían evidencia clínica de neumonía asociada al ventilador (NAV). Construya un intervalo de confianza del 95 por
ciento para la proporción de todos los pacientes con ventilación mecánica en estos hospitales que se espera que
desarrollen VAP.
6.5.2.Ondas Q en el electrocardiograma, según Schinkel et al. (A-15), a menudo se considera que reflejan un miocardio
con cicatrices irreversibles. Sin embargo, estos investigadores afirman que hay algunos indicios de que
puede haber tejido viable residual en las regiones con infarto de ondas Q. Su estudio de 150 pacientes con
infarto de onda Q electrocardiográfico crónico encontró 202 regiones de onda Q disfuncionales.
Con la ecocardiografía de estrés con dobutamina (DSE), notaron que 118 de estas 202 regiones eran viables con la
información de la prueba DSE. Construya un intervalo de confianza del 90 por ciento para la proporción de regiones
viables que cabría esperar encontrar en una población de regiones de ondas Q disfuncionales.
6.5.3.En un estudio de von zur Muhlen et al. (A-16), se estudiaron 136 sujetos con síncope o casi síncope. El síncope es la
pérdida temporal de la conciencia debido a una disminución repentina del flujo sanguíneo al cerebro. De estos
sujetos, 75 también reportaron tener enfermedad cardiovascular. Construya un intervalo de confianza del 99 por
ciento para la proporción poblacional de sujetos con síncope o casi síncope que también tienen enfermedad
cardiovascular.
6.5.4.En una muestra aleatoria simple de 125 varones desempleados y desertores de la escuela secundaria entre 16 y 21 años
inclusive, 88 manifestaron ser consumidores habituales de bebidas alcohólicas. Construya un intervalo de confianza
del 95 por ciento para la proporción de la población.
6.6 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES 187
La magnitud de la diferencia entre dos proporciones de población suele ser de interés. Podemos querer
comparar, por ejemplo, hombres y mujeres, dos grupos de edad, dos grupos socioeconómicos o dos grupos
de diagnóstico con respecto a la proporción que posee alguna característica de interés. Un estimador puntual
no sesgado de la diferencia entre dos proporciones poblacionales es proporcionado por la diferencia entre
proporciones muestrales, p̂1- pag2. Como hemos visto, cuandonorte1ynorte2son grandes y las proporciones
de la población no están demasiado cerca de 0 o 1, se aplica el teorema del límite central y se puede emplear
la teoría de la distribución normal para obtener intervalos de confianza. El error estándar de la estimación
por lo general debe ser estimado por
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
porque, por regla general, las proporciones de la población son desconocidas. un 100d1 -aÞpor ciento
intervalo de confianza parapag1-pag2es dado por
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
Podemos interpretar este intervalo tanto desde el punto de vista probabilístico como práctico.
EJEMPLO 6.6.1
Connor et al. (A-17) investigó las diferencias de género en la agresión proactiva y reactiva en una
muestra de 323 niños y adolescentes (68 mujeres y 255 hombres). Los sujetos procedían de
remisiones consecutivas no solicitadas a un centro de tratamiento residencial y una clínica de
psicofarmacología pediátrica que atiende a un hospital terciario y una facultad de medicina. En la
muestra, 31 de las mujeres y 53 de los hombres denunciaron abuso sexual. Deseamos construir un
intervalo de confianza del 99 por ciento para la diferencia entre las proporciones de abuso sexual en
las dos poblaciones muestreadas.
Solución: Las proporciones muestrales para mujeres y hombres son, respectivamente, p̂F¼
31=68¼ :4559 y p̂METRO¼53=255¼ :2078. La diferencia entre las proporciones de la
muestra es p̂F- pagMETRO¼ :4559 - :2078¼ :2481. El estándar estimado
error de la diferencia entre las proporciones de la muestra es
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
d:4559Þð:5441Þ d:2078Þð:7922Þ
spagF-pag¼ þ
METRO
68 255
¼ :0655
El factor de confiabilidad de la Tabla D del Apéndice es 2.58, por lo que nuestro intervalo de
confianza, por la Expresión 6.6.1, es
:2481 - 2:58d:0655Þ
:0791; :4171
188 CAPÍTULO 6 ESTIMACIÓN
EJERCICIOS
Para cada uno de los siguientes ejercicios, indique las interpretaciones prácticas y probabilísticas del intervalo que
construya. Identifique cada componente del intervalo: estimación puntual, coeficiente de confiabilidad y error
estándar. Explique por qué los coeficientes de confiabilidad no son los mismos para todos los ejercicios.
6.6.1.Horwitz et al. (A-18) estudió a 637 personas que fueron identificadas por registros judiciales de 1967 a 1971 por
haber sufrido abuso o negligencia. Para un grupo de control, ubicaron a 510 sujetos que de niños asistieron
a la misma escuela primaria y vivían dentro de un radio de cinco cuadras de aquellos en el grupo abusado/
abandonado. En el grupo abusado/abandonado y el grupo de control, 114 y 57 sujetos, respectivamente,
habían desarrollado trastornos de personalidad antisocial a lo largo de sus vidas. Construya un intervalo de
confianza del 95 por ciento para la diferencia entre las proporciones de sujetos que desarrollan trastornos
antisociales de la personalidad que cabría esperar encontrar en las poblaciones de sujetos de las que se
supone que proceden los sujetos de este estudio.
6.6.2.El objetivo de un ensayo controlado aleatorio de Adab et al. (A-19) fue determinar si proporcionar a las mujeres
información adicional sobre las ventajas y desventajas de la detección del cáncer de cuello uterino aumentaría su
disposición a hacerse la prueba. Un grupo de tratamiento de 138 mujeres recibió un folleto sobre la detección que
contenía más información (riesgo individual promedio de cáncer de cuello uterino, probabilidad de resultado positivo,
la posibilidad de resultados falsos positivos/negativos, etc.) que el folleto estándar desarrollado por el Servicio Nacional de
Salud Británico que recibieron 136 mujeres en un grupo de control. En el grupo de tratamiento, 109 mujeres indicaron que
querían hacerse la prueba de detección del cáncer de cuello uterino, mientras que en el grupo de control, 120 indicaron que
querían hacerse la prueba de detección. Construya un intervalo de confianza del 95 por ciento para la diferencia de
proporciones de las dos poblaciones representadas por estas muestras.
6.6.3.Spetus et al. (A-20) realizó un estudio aleatorizado simple ciego para sujetos con enfermedad arterial coronaria estable.
Asignaron al azar a los sujetos en dos grupos de tratamiento. Al primer grupo se le optimizaron los medicamentos
actuales para la angina, y al segundo grupo se le redujeron los medicamentos existentes y luego comenzó con
diltiazem de acción prolongada a 180 mg/día. Los investigadores realizaron varias pruebas para determinar
si hubo diferencias significativas en los dos grupos de tratamiento al inicio del estudio. Una de las características de
interés fue la diferencia en los porcentajes de sujetos que habían informado antecedentes de insuficiencia cardíaca
congestiva. En el grupo en el que se optimizaron los medicamentos actuales, 16 de 49 sujetos informaron
antecedentes de insuficiencia cardíaca congestiva. En los sujetos que recibieron diltiazem, 12 de los 51 sujetos
informaron antecedentes de insuficiencia cardíaca congestiva. Indique las suposiciones que considere necesarias y
construya un intervalo de confianza del 95 por ciento para la diferencia entre las proporciones de quienes informaron
insuficiencia cardíaca congestiva dentro de las dos poblaciones de las que suponemos que se seleccionaron estos
grupos de tratamiento.
6.6.4.Estudiar la diferencia en la adherencia al tratamiento farmacológico entre sujetos con depresión que recibieron tratamiento habitual.
atención y los que recibieron atención en un modelo de atención colaborativa fue el objetivo de un estudio realizado por Finley
et al. (A-21). El modelo de atención colaborativa enfatizó el papel de los farmacéuticos clínicos en la gestión de la
farmacoterapia y el seguimiento del tratamiento. De los 50 sujetos que recibieron atención habitual, 24 se adhirieron al
régimen de medicamentos prescritos, mientras que 50 de 75 sujetos en el modelo de atención colaborativa
6.7 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA LA ESTIMACIÓN DE LOS MEDIOS 189
adherido al régimen farmacológico. Construya un intervalo de confianza del 90 por ciento para la diferencia en las
proporciones de adherencia para las poblaciones de sujetos representados por estas dos muestras.
La cuestión de qué tamaño de muestra tomar surge al principio de la planificación de cualquier encuesta o
experimento. Esta es una pregunta importante que no debe tomarse a la ligera. Tomar una muestra más
grande de la que se necesita para lograr los resultados deseados es un desperdicio de recursos, mientras
que muestras muy pequeñas a menudo conducen a resultados que no tienen ningún uso práctico.
Consideremos, entonces, cómo se puede proceder para determinar el tamaño de la muestra que se necesita
en una situación dada. En esta sección presentamos un método para determinar el tamaño muestral
requerido para estimar una media poblacional, y en la siguiente sección aplicamos este método al caso de
determinación del tamaño muestral cuando el parámetro a estimar es una proporción poblacional. Mediante
ampliaciones sencillas de estos métodos, se pueden determinar los tamaños de muestra necesarios para
situaciones más complicadas.
ObjetivosLos objetivos en la estimación de intervalos son obtener intervalos estrechos con alta
confiabilidad. Si observamos los componentes de un intervalo de confianza, vemos que el ancho del
intervalo está determinado por la magnitud de la cantidad
ya que el ancho total del intervalo es el doble de esta cantidad. Hemos aprendido que esta cantidad
suele denominarse precisión de la estimación o margen de error. Para un error estándar dado,
aumentar la confiabilidad significa un mayor coeficiente de confiabilidad. Pero un coeficiente de
confiabilidad mayor para un error estándar fijo genera un intervalo más amplio.
Por otro lado, si fijamos el coeficiente de confiabilidad, la única forma de reducir el anchopag
thffiffiffi del intervalo es reducir el error estándar. Como el error estándar es igual a s=norte;y desdes
es una constante, la única forma de obtener un error estándar pequeño es tomar una muestra
grande. ¿Qué tan grande es una muestra? Eso depende del tamaño des,la desviación estándar de la
población, el grado deseado de confiabilidad y el ancho del intervalo deseado.
Supongamos que queremos un intervalo que se extiendadunidades a cada lado del estimador.
Podemos escribir
z2s2
norte¼ (6.7.3)
d2
190 CAPÍTULO 6 ESTIMACIÓN
Cuando el muestreo es sin reemplazo de una población finita pequeña, se requiere la corrección de
población finita y la Ecuación 6.7.1 se convierte en
rffiffiffiffiffiffiffiffiffiffiffiffiffi
s n-n
d¼zpffiffiffi (6.7.4)
norte norte-1
Nueva Zelanda2s2
norte¼ (6.7.5)
d2dnorte-1Þ þz2s2
Estimacións2 Las fórmulas para el tamaño de la muestra requieren el conocimiento des2pero, como
se ha señalado, la varianza de la población es, por regla general, desconocida. Como resultado,s2tiene
que ser estimado. Las fuentes de estimación más utilizadas paras2son los siguientes:
1.Apilotoo una muestra preliminar puede extraerse de la población, y la varianza calculada a partir de esta
muestra puede utilizarse como una estimación des2. Las observaciones utilizadas en la muestra piloto
pueden contarse como parte de la muestra final, de modo quen (el tamaño de muestra calculado) -
norte1(el tamaño de la muestra piloto)¼norte2(el número de observaciones necesarias para satisfacer
el requisito de tamaño total de la muestra).
3.Si se piensa que la población de la que se va a extraer la muestra tiene una distribución
aproximadamente normal, se puede utilizar el hecho de que el rango es
aproximadamente igual a seis desviaciones estándar y calcularsR=6. Este método requiere
algún conocimiento del valor más pequeño y más grande de la variable en la población.
EJEMPLO 6.7.1
Un nutricionista del departamento de salud, que desea realizar una encuesta entre una población de
adolescentes para determinar su ingesta diaria promedio de proteínas (medida en gramos), busca el
consejo de un bioestadístico en relación con el tamaño de la muestra que debe tomarse.
¿Qué procedimiento sigue el bioestadístico para ayudar al nutricionista? Antes de
que el estadístico pueda ayudar al nutricionista, este último debe proporcionar tres
elementos de información: (1) el ancho deseado del intervalo de confianza, (2) el nivel de
confianza deseado y (3) la magnitud de la varianza de la población. .
d1:96Þ2d20Þ2
norte¼
d5Þ2
¼61:47
EJERCICIOS
6.7.1.El administrador de un hospital desea estimar el peso medio de los bebés que nacen en su hospital. ¿De qué tamaño
debe tomarse una muestra de registros de nacimiento si quiere un intervalo de confianza del 99 por ciento de 1 libra
de ancho? Suponga que una estimación razonable deses 1 libra. ¿Qué tamaño de muestra se requiere si el coeficiente
de confianza se reduce a .95?
6.7.2.El director de la sección de control de la rabia en el departamento de salud de una ciudad desea extraer una muestra de los
registros del departamento de mordeduras de perros reportadas durante el último año para estimar la edad promedio de las
personas mordidas. Quiere un intervalo de confianza del 95 por ciento, estará satisfecho con dejard¼2:5 y, a partir de estudios
anteriores, estima que la desviación estándar de la población es de unos 15 años. ¿De qué tamaño debe extraerse una
muestra?
6.7.3.A un médico le gustaría saber el valor medio de glucosa en sangre en ayunas (miligramos por 100 ml) de los pacientes
atendidos en una clínica de diabetes en los últimos 10 años. Determine el número de registros que el médico debe
examinar para obtener un intervalo de confianza del 90 por ciento parametrosi el ancho deseado del intervalo es de 6
unidades y una muestra piloto arroja una varianza de 60.
6.7.4.Para los pacientes con esclerosis múltiple deseamos estimar la edad media a la que se diagnosticó la enfermedad por primera vez.
Queremos un intervalo de confianza del 95 por ciento que tenga 10 años de ancho. Si la varianza de la población
es 90, ¿qué tamaño debe tener nuestra muestra?
El método para determinar el tamaño de la muestra cuando se estima una proporción de la población
es esencialmente el mismo que se describe para estimar la media de la población. Hacemos uso del
hecho de que la mitad del intervalo deseado,d,puede establecerse igual al producto del coeficiente de
confiabilidad y el error estándar.
Suponiendo que el muestreo aleatorio y las condiciones que garantizan la normalidad aproximada de
la distribución de p̂ conduce a la siguiente fórmula paranortecuando el muestreo es con
192 CAPÍTULO 6 ESTIMACIÓN
z2pq
norte¼ (6.8.1)
d2
dóndeq¼1 -pag:
Si no se puede ignorar la corrección por población finita, la fórmula adecuada paranortees
Nueva Zelanda2pq
norte¼ (6.8.2)
d2dnorte-1Þ þz2pq
:05 lapuede
Cuandonortees grande en comparación conn (eso es,n=n la corrección población finita
ignorarse, y la Ecuación 6.8.2 se reduce a la Ecuación 6.8.1.
EJEMPLO 6.8.1
Se está planeando una encuesta para determinar qué proporción de familias en un área determinada
son médicamente indigentes. Se cree que la proporción no puede ser mayor a .35. Se desea un
intervalo de confianza del 95 por ciento cond¼ :05. ¿Qué tamaño de muestra de familias se debe
seleccionar?
d1:96Þ2d:35Þð:sesenta y cincoÞ
norte¼ ¼349:59
d:05Þ2
EJERCICIOS
6.8.1.Un epidemiólogo desea saber qué proporción de adultos que viven en un área metropolitana grande tienen el
subtipo ayr del virus de la hepatitis B. Determine el tamaño de la muestra que se requeriría para estimar la
verdadera proporción dentro de .03 con un 95 por ciento de confianza. En un área metropolitana similar, se
informa que la proporción de adultos con la característica es de 0,20. Si los datos de otra área metropolitana
no estuvieran disponibles y no se pudiera obtener una muestra piloto, ¿qué tamaño de muestra se
requeriría?
6.8.2.Se planea una encuesta para determinar qué proporción de los estudiantes de secundaria en un sistema escolar
metropolitano ha fumado marihuana regularmente. Si no hay estimación depagestá disponible a partir de
estudios previos, no se puede extraer una muestra piloto, se desea un coeficiente de confianza de .95, yd¼ :
04, determine el tamaño de muestra apropiado. ¿Qué tamaño de muestra se requeriría si se deseara una
confianza del 99 por ciento?
6.8.3.El administrador de un hospital desea saber qué proporción de pacientes dados de alta no está satisfecho con la
atención recibida durante la hospitalización. ¿De qué tamaño debe extraerse una muestra si permitimosd¼ :
05, el coeficiente de confianza es .95 y no hay más información disponible? ¿Qué tamaño debe tener la
muestra sipagse aproxima por .25?
6.8.4.Una agencia de planificación de la salud desea saber, para cierta región geográfica, qué proporción de pacientes
ingresados en hospitales para el tratamiento de traumatismos mueren en el hospital. Se desea un intervalo
de confianza del 95 por ciento, el ancho del intervalo debe ser 0,06 y la proporción de la población, a partir de
otra evidencia, se estima en 0,20. ¿Qué tamaño de muestra se necesita?
PAG PAG
dX-metroÞ 2
i dX i-metroÞ2
s2¼ ¼8 y S2¼ ¼10
norte norte-1
PAG
Si calculamos la varianza muestrals2¼ dXi- -XÞ2=ðn-1Þpara cada uno de los posibles
muestras que se muestran en la Tabla 5.3.1, obtenemos las varianzas muestrales que se muestran en la Tabla 6.9.1.
194 CAPÍTULO 6 ESTIMACIÓN
Segundo Sorteo
6 8 10 12 14
6 0 2 8 18 32
8 2 0 2 8 18
primer sorteo 10 8 2 0 2 8
12 18 8 2 0 2
14 32 18 8 2 0
Muestreo con reemplazoSi el muestreo es con reemplazo, el valor esperado des2se obtiene
tomando la media de todas las varianzas muestrales en la Tabla 6.9.1. Cuando hacemos esto,
tenemos
PAG
- s2 0þ2þ þ2þ0 200
mi2¼ i¼ ¼ ¼8
nortenorte 25 25
gl = 1
0.4
0.3 gl = 2
0.2 gl = 4
gl = 10
0.1
0.0
0 2 4 6 8 10 12 14
FIGURA 6.9.1Distribuciones chi-cuadrado.
(Fuente: Gerald van Belle, Lloyd D. Fisher, Patrick J. Heagerty y Thomas Lumley, Biostatistics: A Methodology for
the Health Sciences, 2nd Ed., # 2004 John Wiley & Sons, Inc. Este material se reproduce con autorización de John
Wiley & Sons, Inc.)
dn-1Þs2
Xun
2 =2< <X2 1-dun =2Þ
s2
196 CAPÍTULO 6 ESTIMACIÓN
Ahora manipulamos esta expresión de tal manera que obtenemos una expresión con s2
solo como término medio. Primero, dividamos cada término pordn-1Þs2Llegar
X2 1 X21-dun =2Þ
< <
un =2
dn-1Þs2 s2 dn-1Þs2
dn-1Þs2 dn-1Þs2
> s 2>
X2 un =2
X1-dun
2 =2Þ
Tenga en cuenta que la dirección de las desigualdades cambió cuando tomamos los recíprocos. Si
invertimos el orden de los términos, tenemos
dn-1Þs2 dn-1Þs2
<s2< (6.9.1)
X1-dun
2 =2Þ
X2 un =2
cual es el 100d1 -aÞintervalo de confianza porcentual paras2. Si sacamos la raíz cuadrada de cada
término en la Expresión 6.9.1, tenemos los siguientes 100d1 -aÞintervalo de confianza porcentual para
s,la desviación estándar de la población:
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
dn-1Þs2 dn-1Þs2
<s < (6.9.2)
X1-dun
2 =2Þ
X2 un =2
EJEMPLO 6.9.1
En un estudio sobre la eficacia de una dieta sin gluten en familiares de primer grado de pacientes con
diabetes tipo I, Hummel et al. (A-22) colocó a siete sujetos en una dieta sin gluten durante 12 meses.
Antes de la dieta, tomaron medidas de referencia de varios anticuerpos y autoanticuerpos, uno de los
cuales fue el autoanticuerpo de insulina relacionado con la diabetes (IAA). Los niveles de IAA se
midieron mediante un ensayo de radioenlace. Los siete sujetos tenían unidades IAA de
Deseamos estimar a partir de los datos de esta muestra la varianza de las unidades IAA en la
población de la que se extrajo la muestra y construir un intervalo de confianza del 95 por ciento
para esta estimación.
X12-dun =2Þ¼14:449 yX2 un =2¼1:237. Nuestro intervalo de confianza del 95 por ciento para
s2es
6d39:763Þ 6d39:763Þ
<s2 <
14:449 1:237
Estamos seguros en un 95 por ciento de que los parámetros que se estiman se encuentran
dentro de los límites especificados, porque sabemos que, a la larga, en muestreos repetidos,
el 95 por ciento de los intervalos construidos como se ilustra incluiría los parámetros
respectivos. &
EJERCICIOS
6.9.1.Un estudio de Aizenberg et al. (A-23) examinó la eficacia de sildenafilo, una potente fosfodiesterasa
inhibidor, en el tratamiento de hombres de edad avanzada con disfunción eréctil inducida por tratamiento
antidepresivo para el trastorno depresivo mayor. Las edades de los 10 participantes en el estudio fueron
Suponga que los sujetos de esta muestra constituyen una muestra aleatoria simple extraída de una población de
sujetos similares. Construya un intervalo de confianza del 95 por ciento para la varianza de las edades de los sujetos
de la población.
6.9.2.Borden et al. (A-24) realizó experimentos en rodillas cadavéricas para probar la eficacia de varias técnicas de reparación
de meniscos. Las muestras se cargaron en un dispositivo servohidráulico y se sometieron a tensión hasta que
fallaron. La prueba biomecánica se realizó utilizando una tasa de carga lenta para simular las tensiones a las que
podría estar sujeto el menisco medial durante los primeros ejercicios de rehabilitación y las actividades de la vida
diaria. Una de las medidas es la cantidad de desplazamiento que se produce. De los 12 especímenes que recibieron la
sutura de colchonero vertical y el método FasT-FIX, los valores de desplazamiento
198 CAPÍTULO 6 ESTIMACIÓN
medidas en milímetros son 16,9, 20,2, 20,1, 15,7, 13,9, 14,9, 18,0, 18,5, 9,2, 18,8, 22,8, 17,5. Construya un
intervalo de confianza del 90 por ciento para la varianza del desplazamiento en milímetros para una
población de sujetos que reciben estas técnicas de reparación.
6.9.3.Se realizaron determinaciones forzadas de capacidad vital en 20 varones adultos sanos. La varianza de la muestra fue
1,000,000. Construya intervalos de confianza del 90 por ciento paras2ys.
6.9.4.En un estudio de tiempos de tránsito miocárdico, se obtuvieron tiempos de tránsito de aparición en una muestra de 30
pacientes con enfermedad arterial coronaria. Se encontró que la varianza de la muestra era 1.03. Construya
intervalos de confianza del 99 por ciento paras2ys.
6.9.5.Una muestra de 25 hombres sanos física y mentalmente participó en un experimento de sueño en el que se registró el
porcentaje del tiempo total de sueño de cada participante en una determinada etapa del sueño. La varianza calculada
a partir de los datos de la muestra fue de 2,25. Construya intervalos de confianza del 95 por ciento paras2
ys.
6.9.6.Se realizaron determinaciones de hemoglobina en 16 animales expuestos a un químico dañino. Se registraron
las siguientes observaciones: 15.6, 14.8, 14.4, 16.6, 13.8, 14.0, 17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4, 13.9, 14.8,
17.5. Construya intervalos de confianza del 95 por ciento paras2ys.
6.9.7.Veinte muestras de aire tomadas en el mismo sitio durante un período de 6 meses mostraron las siguientes cantidades de
partículas en suspensión (microgramos por metro cúbico de aire):
68223632
42242838
30442827
28434550
79745721
Considere estas medidas como una muestra aleatoria de una población de medidas normalmente
distribuidas y construya un intervalo de confianza del 95 por ciento para la varianza de la población.
Con frecuencia es de interés comparar dos varianzas, y una forma de hacerlo es formar su
relación,s21= s22. Si dos varianzas son iguales, su razón será igual a 1. Usualmente no lo haremos
conocer las varianzas de las poblaciones de interés y, en consecuencia, cualquier comparación que hagamos
se basará en las varianzas de la muestra. En otras palabras, es posible que deseemos estimar la razón de las
varianzas de dos poblaciones. Aprendimos en la Sección 6.4 que el uso válido de latdistribución para
construir un intervalo de confianza para la diferencia entre dos medias poblacionales requiere que las
varianzas poblacionales sean iguales. El uso de la razón de dos varianzas de población para determinar la
igualdad de varianzas se ha formalizado en una prueba estadística. La distribución de esta prueba
proporciona valores de prueba para determinar si la razón excede el valor 1 en una medida lo
suficientemente grande como para concluir que las varianzas no son iguales. La prueba se denomina Prueba
F-max de Hartley (13) o Prueba de relación de varianza de Zar (14). Muchos programas de computadora
proporcionan alguna prueba formalizada de la igualdad de varianzas, de modo que la suposición de igualdad
de varianzas asociada con muchas de las pruebas en los siguientes capítulos puede ser
6.10 INTERVALO DE CONFIANZA PARA LA RAZÓN DE LAS VARIACIONES DE DOS POBLACIONES NORMALMENTE DISTRIBUIDAS 199
(10;∞)
1.0
(10; 50)
(10; 10)
0.8
(10; 4)
0.6
F(X)
0.4
0.2
0.0
0 0.5 1,0 1,5 2,0 2,5 3,0 3,5 4,0
F
FIGURA 6.10.1ElFdistribución para varios grados de libertad.
(DeDocumenta Geigy, Mesas Científicas,Séptima edición, 1970. Cortesía de Ciba-Geigy Limited, Basilea,
Suiza.)
examinado. Si el intervalo de confianza para la razón de dos varianzas poblacionales incluye 1, concluimos que las dos
varianzas poblacionales pueden, de hecho, ser iguales. Una vez más, dado que esta es una forma
de inferencia, debemos confiar en alguna distribución de muestreo, y esta vez la distribución de
s12= s12=s2 2= s22se utiliza siempre que se cumplan ciertos supuestos. Los supuestos son
esos21ys2 2se calculan a partir de muestras independientes de tamañonorte1ynorte2respectivamente, dibujado
de dos poblaciones normalmente distribuidas. Usamoss2 1para designar el mayor de los dos
varianzas de la muestra.
- -
ElFDistribuciónSi se cumplen los supuestos,s2 1= s12=s2 2= s22sigue un
distribución conocida comodistribución F.Aplazamos una discusión más completa de esta distribución
hasta el capítulo 8, pero tenga en cuenta que esta distribución depende de dos grados de
valores de libertad, uno correspondiente al valor denorte1- 1 utilizado en computacións2 1y el
otra correspondiente al valor denorte2- 1 utilizado en computacións2 2.
Estos suelen ser referidos
a como elnumerador grados de libertady elgrados de libertad del denominador. La Figura
6.10.1 muestra algunosFdistribuciones para varias combinaciones de grados de libertad de
numerador y denominador. La tabla G del apéndice contiene, para combinaciones específicas
de grados de libertad y valores dea;Fvalores a la derecha de los cuales se encuentraun =2 del
área bajo la curva deF.
s12= s2
Fun =2< 1<F Þ
s22= s22
1-dun =2
EJEMPLO 6.10.1
Allen y Gross (A-25) examinan la fuerza de los flexores de los dedos de los pies en sujetos con fascitis plantar
(dolor de espolón en el talón o dolor general en el talón), una condición común en pacientes con problemas
musculoesqueléticos. La inflamación de la fascia plantar suele ser costosa de tratar y frustrante tanto para el
paciente como para el médico. Una de las medidas de referencia fue el índice de masa corporal (IMC). Para
las 16 mujeres del estudio, la desviación estándar del IMC fue de 8,1 y para los cuatro hombres del estudio, la
desviación estándar fue de 5,9. Deseamos construir un intervalo de confianza del 95 por ciento para el
cociente de las varianzas de las dos poblaciones de las que suponemos que se extrajeron estas muestras.
Ahora estamos listos para obtener nuestro intervalo de confianza del 95 por ciento para
s21= s22sustituyendo los valores apropiados en la Expresión 6.10.1:
s2
:1323 < 1< 7:8221
s22
6.10 INTERVALO DE CONFIANZA PARA LA RAZÓN DE LAS VARIACIONES DE DOS POBLACIONES NORMALMENTE DISTRIBUIDAS 201
HallazgoF1-dun =2ÞyFun =2 Llegados a este punto debemos hacer una digresión engorrosa, pero
inevitable, y explicar cómo los valoresF:975¼14:25 yF:025¼ :Se obtuvieron 24096. El valor deF:975en
la intersección de la columna encabezadad.f.1¼15 y la fila etiquetadad.f.2¼3 es 14.25. Si
tuviéramos una tabla más extensa de losFdistribución, encontrar F:025no sería ningún problema;
simplemente encontraríamosF:025como encontramosF:975. Tomaríamos el valor en la
intersección de la columna con el encabezado 15 y la fila con el encabezado 3. Para incluir todos
los percentiles posibles deFsería una mesa muy larga. Afortunadamente, sin embargo, existe
una relación que nos permite calcular los valores percentiles más bajos de nuestra tabla
limitada. La relación es la siguiente:
1
Fa;d.f. 1;df2 ¼ (6.10.2)
F1-a;d.f.2;df1
s12 1
LCL¼
s22Fd1-un =2Þ;d.f. ;df
1 2
s22
EJERCICIOS
6.10.1.El propósito de un estudio de Moneim et al. (A-26) fue para examinar las amputaciones del pulgar del equipo de lazada en
los rodeos. Los investigadores revisaron 16 casos de amputaciones de pulgar. De estos, 11 fueron amputaciones
completas mientras que cinco fueron incompletas. El tiempo de isquemia es el tiempo que se suministra oxígeno
insuficiente al pulgar amputado. Los tiempos de isquemia (horas) para 11 sujetos que experimentaron amputaciones
completas fueron
4:67; 10:5; 2:0; 3:18; 4:00; 3:5; 3:33; 5:32; 2:0; 4:25; 6:0
Para cinco víctimas de amputación incompleta del pulgar, los tiempos de isquemia fueron
Trate los dos conjuntos de datos informados como datos de muestra de las dos poblaciones como se describe.
Construya un intervalo de confianza del 95 por ciento para la razón de las dos varianzas de población desconocidas.
6.10.2.El objetivo de un estudio de Horesh et al. (A-27) fue explorar la hipótesis de que algunas formas de
las conductas suicidas entre los adolescentes están relacionadas con la ira y la impulsividad. La muestra estuvo compuesta por
65 adolescentes ingresados en una unidad psiquiátrica de adolescentes adscrita a una universidad. Los investigadores
utilizaron la Escala de control de impulsividad (ICS, A-28) donde los números más altos indican grados más altos de
impulsividad y las puntuaciones pueden variar de 0 a 45. Los 33 sujetos clasificados como suicidas tenían una desviación
estándar de la puntuación ICS de 8,4 mientras que los 32 sujetos no suicidas los sujetos tenían una desviación estándar de 6,0.
Suponga que estos dos grupos constituyen muestras aleatorias simples independientes de dos poblaciones de sujetos
similares. Suponga también que las puntuaciones de la ICS en estas dos poblaciones se distribuyen normalmente. Encuentre el
intervalo de confianza del 99 por ciento para la razón de las dos varianzas poblacionales de puntajes en el ICS.
6.10.3.Los valores del índice de accidente cerebrovascular se analizaron estadísticamente para dos muestras de
pacientes que padecían infarto de miocardio. Las varianzas de la muestra fueron 12 y 10. Hubo 21 pacientes
en cada muestra. Construya el intervalo de confianza del 95 por ciento para la razón de las dos varianzas de
población.
6.10.4.Treinta y dos asfásicos adultos que buscaban terapia del habla se dividieron por igual en dos grupos. Grupo 1
recibió el tratamiento 1 y el grupo 2 recibió el tratamiento 2. Análisis estadístico del tratamiento
las puntuaciones de efectividad arrojaron las siguientes variaciones:s2 1¼8;s2 2¼15. Construye el 90 por ciento
intervalo de confianza paras2 2= s21.
6.10.5.Se calcularon las varianzas de la muestra para los volúmenes corrientes (mililitros) de dos grupos de pacientes que sufrían
por comunicación interauricular. Los resultados y tamaños de muestra fueron los siguientes:
norte1¼31;s21¼35; 000
norte2¼41;s22¼20; 000
Construya el intervalo de confianza del 95 por ciento para la razón de las dos varianzas de población.
6.10.6.Se registraron las respuestas de glucosa a la glucosa oral en 11 pacientes con enfermedad de Huntington (grupo 1)
y 13 sujetos control (grupo 2). El análisis estadístico de los resultados arrojó la siguiente muestra
varianzas:s2 1¼105;s2 2¼148. Construya el intervalo de confianza del 95 por ciento para la razón de los dos
varianzas de la población.
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 6 203
6.10.7.Mediciones de secreción gástrica de ácido clorhídrico (miliequivalentes por hora) en 16 pacientes normales
sujetos y 10 sujetos con úlcera duodenal arrojaron los siguientes resultados:
Sujetos normales: 6.3, 2.0, 2.3, 0.5, 1.9, 3.2, 4.1, 4.0, 6.2, 6.1, 3.5, 1.3, 1.7, 4.5, 6.3, 6.2
Sujetos de úlcera: 13.7, 20.6, 15.9, 28.4, 29.4, 18.4, 21.1, 3.0, 26.2, 13.0
Construya un intervalo de confianza del 95 por ciento para la razón de las dos varianzas de población. ¿Qué supuestos
se deben cumplir para que este procedimiento sea válido?
6.11 RESUMEN
Este capítulo se ocupa de una de las principales áreas de la inferencia estadística: la estimación.
Se cubren tanto la estimación puntual como la estimación por intervalos. Los conceptos y
métodos involucrados en la construcción de intervalos de confianza se ilustran para los
siguientes parámetros: medias, la diferencia entre dos medias, proporciones, la diferencia entre
dos proporciones, varianzas y la razón de dos varianzas. Además, aprendimos en este capítulo
cómo determinar el tamaño de muestra necesario para estimar una media poblacional y una
proporción poblacional en niveles específicos de precisión.
También aprendimos en este capítulo que las estimaciones por intervalos de los parámetros de la población son más
deseables que las estimaciones puntuales porque las declaraciones de confianza se pueden adjuntar a las estimaciones por
intervalos.
Fórmula
Número Nombre Fórmula
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.4.1 Estimación de intervalo para
s21 s 22
la diferencia entre dos d-X1- -X2Þ -zd1-un =2Þ þ
norte1 norte2
población significa cuando
s1ys2son conocidos
6.4.2 2
Estimación de la varianza agrupada dnorte1- 1Þs21þ ðnorte2- 1Þs 2
2 ¼
spag
norte1þnorte2- 2
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.4.3 Error estándar de estimación
spag
2 spag
2
sd-X1--XÞ
2 ¼
þ
norte1 norte2
(Continuación)
204 CAPÍTULO 6 ESTIMACIÓN
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.4.4 Estimación de intervalo para
spag
2 s2pag
la diferencia entre dos d-X1- -X2Þ -td1-un =2Þ þ
norte1 norte2
población significa cuando
s1es desconocido
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff
6.5.1 Estimación de intervalo para p - zd1-un =2Þ pagd1 - p̂Þ=norte
una proporción de población
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.6.1 Estimación de intervalo para
pag1d1 - p̂1Þ pagd1
2 - pag^2Þ
la diferencia entre dos ðp̂1- pag2Þ -zd1-un =2Þ þ
norte1 norte2
proporciones de población
;
z2s2
norte¼
d2
rffiffiffiffiffiffiffiffiffiffiffiffiffi
6.7.4–6.7.5 Determinación del tamaño de s n-n
d¼zpffiffiffi
la muestra al muestrear sin norte-1
norte
reemplazo
;
Nueva Zelanda2s2
norte¼
d2dnorte-1Þ þz2s2
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.9.2 Estimación de intervalo paras
dn-1Þs2 dn-1Þs2
<s <
X1-dun
2 =2Þ X2 dun =2Þ
tamaño de la muestra
5.Defina lo siguiente:
(a)Coeficiente de fiabilidad (b)Coeficiente de confianza (C)Precisión
(d)Error estándar (mi)Estimador (F)Margen de error
9.Describe eltdistribución.
10¿Cuáles son los supuestos que subyacen al uso de latdistribución al estimar una sola media poblacional?
12¿Cuáles son los supuestos que subyacen al uso de latdistribución al estimar la diferencia entre las medias
de dos poblaciones?
206 CAPÍTULO 6 ESTIMACIÓN
13Los análisis de gases en sangre arterial realizados en una muestra de 15 hombres adultos físicamente activos arrojaron la
siguiente PaO en reposo2valores:
75; 80; 80; 74; 84; 78; 89; 72; 83; 76; 75; 87; 78; 79; 88
14¿Qué proporción de pacientes con asma son alérgicos al polvo doméstico? En una muestra de 140, el 35 por ciento tuvo reacciones
cutáneas positivas. Construya el intervalo de confianza del 95 por ciento para la proporción de la población.
15.Se realizó una encuesta de higiene industrial en una gran área metropolitana. De 70 plantas de fabricación de cierto tipo visitadas,
21 recibieron una calificación de "pobre" con respecto a la ausencia de riesgos de seguridad. Construya un intervalo de
confianza del 95 por ciento para la proporción de la población que merece una calificación de "pobre".
dieciséis.Consulte el problema anterior. ¿Qué tamaño de muestra se necesitaría para estimar la proporción de la población
dentro de 0,05 con un 95 por ciento de confianza (0,30 es la mejor estimación disponible depag):
(a)¿Si se puede ignorar la corrección de población finita?
(b)Si no se ignora la corrección por población finita ynorte¼1500?
17En una encuesta dental realizada por un equipo de salud dental del condado, se pidió a 500 adultos que indicaran el
motivo de su última visita al dentista. De los 220 que tenían menos de la educación secundaria, 44 dijeron que fueron
por razones preventivas. De los 280 restantes, que tenían estudios secundarios o superiores, 150 manifestaron que
acudían por motivos preventivos. Construya un intervalo de confianza del 95 por ciento para la diferencia entre las
dos proporciones de población.
18Un equipo de investigación del cáncer de mama recopiló los siguientes datos sobre el tamaño del tumor:
A 21 3,85cm 1,95cm
B dieciséis 2,80cm 1,70cm
Construya un intervalo de confianza del 95 por ciento para la diferencia entre las medias de la población.
19Cierto fármaco resultó ser eficaz en el tratamiento de la enfermedad pulmonar en 180 de 200 casos tratados.
Construya el intervalo de confianza del 90 por ciento para la proporción de la población.
20Setenta pacientes con úlceras por estasis en la pierna se dividieron aleatoriamente en dos grupos iguales. Cada grupo
recibió un tratamiento diferente para el edema. Al final del experimento, la eficacia del tratamiento se midió en
términos de reducción del volumen de las patas determinado por el desplazamiento del agua. Las medias y las
desviaciones estándar para los dos grupos fueron las siguientes:
Grupo (Tratamiento) -X s
A 95cc 25
B 125 cc 30
Construya un intervalo de confianza del 95 por ciento para la diferencia en las medias de la población.
21¿Cuál es el nivel promedio de bilirrubina sérica de los pacientes ingresados en un hospital para el tratamiento de la hepatitis? Una
muestra de 10 pacientes arrojó los siguientes resultados:
20:5; 14:8; 21:3; 12:7; 15:2; 26:6; 23:4; 22:9; 15:7; 19:2
Construya un intervalo de confianza del 95 por ciento para la media de la población.
PREGUNTAS DE REPASO Y EJERCICIOS 207
22Las determinaciones de los niveles de pH de la saliva se realizaron en dos muestras aleatorias independientes de escolares de
séptimo grado. Los niños de la muestra A no tenían caries, mientras que los niños de la muestra B tenían una alta incidencia de
caries. Los resultados fueron los siguientes:
A: 7.14, 7.11, 7.61, 7.98, 7.21, 7.16, 7.89 B: 7.36, 7.04, 7.19, 7.41, 7.10, 7.15, 7.36,
7.24, 7.86, 7.47, 7.82, 7.37, 7.66, 7.62, 7.65 7.57, 7.64, 7.00, 7.25, 7.19
Construya un intervalo de confianza del 90 por ciento para la diferencia entre las medias de la población. Suponga
que las varianzas de la población son iguales.
23Se recetó el fármaco A a una muestra aleatoria de 12 pacientes que padecían insomnio. Una muestra aleatoria
independiente de 16 pacientes con la misma dolencia recibió el fármaco B. El número de horas de sueño
experimentadas durante la segunda noche después de iniciado el tratamiento fue el siguiente:
A: 3.5, 5.7, 3.4, 6.9, 17.8, 3.8, 3.0, 6.4, 6.8, 3.6, 6.9, 5.7
B: 4.5, 11.7, 10.8, 4.5, 6.3, 3.8, 6.2, 6.6, 7.1, 6.4, 4.5, 5.1,
3.2, 4.7, 4.5, 3.0
Construya un intervalo de confianza del 95 por ciento para la diferencia entre las medias de la población. Suponga
que las varianzas de la población son iguales.
24El objetivo de un estudio de Crane et al. (A-29) fue examinar la eficacia, seguridad y satisfacción materna de (a)
misoprostol oral y (b) oxitocina intravenosa para la inducción del parto en mujeres con ruptura prematura de
membranas a término. Los investigadores asignaron aleatoriamente a las mujeres a los dos tratamientos. Para las 52
mujeres que recibieron misoprostol oral, el tiempo medio en minutos hasta el trabajo de parto activo fue de 358
minutos con una desviación estándar de 308 minutos. Para las 53 mujeres que tomaban oxitocina, el tiempo medio
fue de 483 minutos con una desviación estándar de 144 minutos. Construya un intervalo de confianza del 99 por
ciento para la diferencia en el tiempo medio hasta el trabajo de parto activo para estos dos medicamentos diferentes.
¿Qué suposiciones se deben hacer sobre los datos informados? Describe la población sobre la que se puede
hacer una inferencia.
25Durante un período de 2 años, 34 mujeres europeas con diabetes gestacional previa fueron reclutadas
retrospectivamente de las bases de datos prenatales del oeste de Londres para un estudio realizado por Kousta et al.
(A-30). Una de las medidas para estas mujeres fue la concentración de ácidos grasos no esterificados en ayunas
(NEFA) medida enmetromol=L. En la muestra de 34 mujeres, el nivel medio de NEFA fue 435 con una desviación
estándar muestral de 215,0. Construya un intervalo de confianza del 95 por ciento para el nivel medio de NEFA en
ayunas para una población de mujeres con diabetes gestacional. Indique todas las suposiciones necesarias sobre los
datos y sujetos informados.
26Scheid et al. (A-31) entrevistó a 387 mujeres que se sometieron a un examen gratuito de densidad mineral ósea. Las
preguntas se centraron en los antecedentes de tabaquismo. Se preguntó a los sujetos que se sometían a la terapia de
reemplazo hormonal (TRH) y a los sujetos que no se sometían a la TRH si alguna vez habían sido fumadores
habituales. En el grupo de TRH, el 29,3 por ciento de 220 mujeres afirmó que en algún momento de su vida fumaba
habitualmente. En el grupo sin TRH, el 17,3 por ciento de 106 mujeres respondió positivamente a haber sido
fumadora habitual en algún momento de su vida. (Sesenta y una mujeres optaron por no responder la pregunta).
Construya un intervalo de confianza del 95 por ciento para la diferencia en los porcentajes de fumadores para las dos
poblaciones de mujeres representadas por los sujetos del estudio. ¿Qué supuestos sobre los datos son necesarios?
27El propósito de un estudio de Elliott et al. (A-32) fue evaluar la prevalencia de la deficiencia de vitamina D en mujeres que
viven en hogares de ancianos. La muestra consistió en 39 mujeres en un centro de enfermería especializada de 120
camas. Se invitó a participar a mujeres mayores de 65 años que fueran residentes de larga duración si no tenían
diagnóstico de cáncer terminal o enfermedad metastásica. En la muestra, 23 mujeres tenían niveles de 25-
hidroxivitamina D de 20 ng/ml o menos. Construya un intervalo de confianza del 95 por ciento para el porcentaje de
mujeres con deficiencia de vitamina D en la población que se supone que está representada por esta muestra.
208 CAPÍTULO 6 ESTIMACIÓN
28En un estudio sobre el papel de las grasas de la dieta en la etiología de la cardiopatía isquémica, los sujetos
fueron 60 hombres de entre 40 y 60 años que habían sufrido recientemente un infarto de miocardio y 50
hombres aparentemente sanos del mismo grupo de edad y clase social. Una variable de interés en el estudio
fue la proporción de ácido linoleico (LA) en los ácidos grasos de triglicéridos plasmáticos de los sujetos. Los
datos de esta variable fueron los siguientes:
Sujetos sanos
Construya el intervalo de confianza del 95 por ciento para la diferencia entre las medias de la población. ¿Qué
sugieren estos datos acerca de los niveles de ácido linoleico en las dos poblaciones muestreadas?
29El propósito de un estudio realizado por Tahmassebi y Curzon (A-33) fue comparar la tasa de flujo salival
promedio entre sujetos con parálisis cerebral y entre sujetos en un grupo de control. Cada grupo tenía 10
sujetos. La siguiente tabla proporciona el caudal medio en ml/minuto, así como el error estándar.
PREGUNTAS DE REPASO Y EJERCICIOS 209
SFuente: JF Tahmassebi y MEJ Curzon, "La causa del babeo en niños con parálisis cerebral:
¿hipersalivación o defecto de deglución?"Revista Internacional de Odontología Pediátrica,
13 (2003), 106–111.
Construya el intervalo de confianza del 90 por ciento para la diferencia en la tasa de flujo salival promedio para las dos
poblaciones de sujetos representadas por los datos de la muestra. Indique las suposiciones necesarias para que este sea un
intervalo de confianza válido.
30Culligan et al. (A-34) compararon los resultados a largo plazo de dos tratamientos: (a) un procedimiento de Burch
modificado y (b) un procedimiento de cabestrillo para la incontinencia de esfuerzo con uretra de baja presión. Treinta
y seis mujeres participaron en el estudio con 19 en el grupo de tratamiento de Burch y 17 en el grupo de tratamiento
de procedimiento de cabestrillo. Una de las medidas de resultado a los tres meses de la cirugía fue la presión máxima
de cierre uretral (cm H2O). En el grupo de Burch la media y la desviación estándar fueron 16,4 y 8,2 cm,
respectivamente. En el grupo de cabestrillo, la media y la desviación estándar fueron 39,8 y 23,0, respectivamente.
Construya el intervalo de confianza del 99 por ciento para la diferencia en la presión de cierre uretral máxima media
para las dos poblaciones representadas por estos sujetos. Indique todas las suposiciones necesarias.
31En general, se prefieren los intervalos de confianza estrechos a los anchos. Podemos estrechar un intervalo
usando un pequeño coeficiente de confianza. Para un conjunto dado de otras condiciones, ¿qué sucede con
el nivel de confianza cuando usamos un coeficiente de confianza pequeño? ¿Qué pasaría con el ancho del
intervalo y el nivel de confianza si usáramos un coeficiente de confianza de cero?
32.En general, se prefiere un alto nivel de confianza a un bajo nivel de confianza. Para un conjunto dado de otras
condiciones, supongamos que establecemos nuestro nivel de confianza en 100 por ciento. ¿Cuál sería el efecto de tal
elección sobre la amplitud del intervalo?
33.Los sujetos de un estudio de Borland et al. (A-35) eran niños con dolor agudo. Treinta y dos niños que se
presentaron en una sala de emergencias se inscribieron en el estudio. Cada niño usó la escala analógica
visual para calificar el dolor en una escala de 0 a 100 mm. La puntuación media del dolor fue de 61,3 mm con
un intervalo de confianza del 95 % de 53,2 mm a 69,4 mm. ¿Cuál sería el factor de confiabilidad apropiado
para el intervalo,zot?Justifique su elección. ¿Cuál es la precisión de la estimación? ¿El margen de error?
34.¿El delirio aumenta la estancia hospitalaria? Esa fue la pregunta de investigación investigada por McCusker et al.
(A-36). Los investigadores tomaron muestras de 204 pacientes con delirio prevalente y 118 sin delirio. La
conclusión del estudio fue que los pacientes con delirio prevalente no tenían una estancia media mayor en
comparación con aquellos sin delirio. ¿Cuál era la población objetivo? ¿La población muestreada?
35.Evaluar la autolimitación de la conducción en relación con el rendimiento de la visión fue el objetivo de un estudio de West et al.
(A-37). Los investigadores estudiaron a 629 conductores actuales de 55 años o más durante 2 años. Las variables de interés
fueron el comportamiento al volante, la salud, la función física y la función visual. Los sujetos formaban parte de un estudio de
visión más amplio en el Instituto de Investigación del Ojo Smith-Kettlewell. Una conclusión del estudio fue que los adultos
mayores con cambios tempranos en la función de la visión espacial y la percepción de profundidad parecen reconocer sus
limitaciones y restringen su conducción. ¿Cuál era la población objetivo? ¿La población muestreada?
36.En un estudio piloto realizado por Ayouba et al. (A-38), los investigadores estudiaron a 123 niños nacidos de madres infectadas por
el VIH-1 en Yaound-e, Camerún. A las mujeres embarazadas asesoradas y que dieron su consentimiento se les administró una
dosis única de nevirapina al comienzo del trabajo de parto. A los bebés se les administró un jarabe que contenía nevirapina
dentro de las primeras 72 horas de vida. Los investigadores encontraron que se consideró que el 87 por ciento de los niños no
estaban infectados entre las 6 y las 8 semanas de edad. ¿Cuál es la población objetivo? ¿Cuál es la población muestreada?
210 CAPÍTULO 6 ESTIMACIÓN
37.Consulte el Ejercicio 2.3.11. Construya un intervalo de confianza del 95 por ciento para la media de la poblaciónS/R
relación. ¿Deberías usartozcomo el coeficiente de confiabilidad? ¿Por qué? Describa la población sobre la cual se
pueden hacer inferencias basadas en este estudio.
38.Consulte el Ejercicio 2.3.12. Construya un intervalo de confianza del 90 por ciento para la altura media de la población.
¿Deberías usartozcomo el coeficiente de confiabilidad? ¿Por qué? Describa la población sobre la cual se pueden hacer
inferencias basadas en este estudio.
Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.Consulte los datos del registro de nacimientos de Carolina del Norte NCBIRTH800 con 800 observaciones (consulte el
Ejercicio 1 de datos grandes en el Capítulo 2). Calcule los intervalos de confianza del 95 por ciento para lo siguiente:
2.Consulte los niveles de colesterol sérico para 1000 sujetos (CHOLEST). Seleccione una muestra aleatoria
simple de tamaño 15 de esta población y construya un intervalo de confianza del 95 por ciento para la
media de la población. Compara tus resultados con los de tus compañeros. ¿Qué suposiciones son
necesarias para que su procedimiento de estimación sea válido?
3.Consulte los niveles de colesterol sérico para 1000 sujetos (CHOLEST). Seleccione una muestra aleatoria
simple de tamaño 50 de la población y construya un intervalo de confianza del 95 por ciento para la
proporción de sujetos en la población que tienen lecturas superiores a 225. Compare sus resultados con
los de sus compañeros de clase.
4.Refiérase a los pesos de 1200 bebés nacidos en un hospital comunitario (BEBE WGTS). Extraiga una muestra
aleatoria simple de tamaño 20 de esta población y construya un intervalo de confianza del 95 por ciento para la
media de la población. Compara tus resultados con los de tus compañeros. ¿Qué suposiciones son necesarias
para que su procedimiento de estimación sea válido?
5.Refiérase a los pesos de 1200 bebés nacidos en un hospital comunitario (BEBE WGTS). Extraiga una
muestra aleatoria simple de tamaño 35 de la población y construya un intervalo de confianza del 95 por
ciento para la media de la población. Compare este intervalo con el construido en el Ejercicio 4.
6.Refiérase a las alturas de 1000 niños de doce años (BOY HGTS). Seleccione una muestra aleatoria simple de tamaño
15 de esta población y construya un intervalo de confianza del 99 por ciento para la media de la población. ¿Qué
suposiciones son necesarias para que este procedimiento sea válido?
7.Refiérase a las alturas de 1000 niños de doce años (BOY HGTS). Seleccione una muestra aleatoria simple de
tamaño 35 de la población y construya un intervalo de confianza del 99 por ciento para la media de la
población. Compare este intervalo con el construido en el Ejercicio 5.
REFERENCIAS
Referencias de metodología
1. jOHNA. R.HIELO,Estadística Matemática y Análisis de Datos,2ª ed., Duxbury, Belmont, CA, 1988.
2. WS GOSSET("Estudiante"), "El error probable de una media",Biometrika, 6 (1908), 1–25.
REFERENCIAS 211
9. BL WELCH, "La importancia de la diferencia entre dos medias cuando las varianzas de la población son
desiguales",Biometrika, 29 (1937), 350–361.
10. BL WELCH, "La generalización del 'problema del estudiante cuando están involucradas varias varianzas de población
diferentes",Biometrika, 34 (1947), 28–35.
11. WILLIAMGCOCRAN, “Niveles de significancia aproximados de la prueba de Behrens-Fisher,”biometría, 20 (1964),
191-195.
12. RF TCOMIÓy GW KLETÓN, “Intervalos de confianza óptimos para la varianza de una distribución normal,”Revista de la
Asociación Estadounidense de Estadística, 54 (1959), 674–682.
13. HO HARTLEY, "La relación F máxima como prueba abreviada para la heterogeneidad de las varianzas",Biometrika, 37 (
1950), 308–312.
14. JHZArkansas,Análisis bioestadístico,4.ª ed., Prentice-Hall, Upper Saddle River, NJ, 1999.
15. WAYNEWDaniel,Estadística no paramétrica aplicada,2ª ed., PWS-KENT, Boston, 1989.
Aplicaciones Referencias
A-1. norteICOLAMETROAFFULLI, CHERLYTALLON, jUN HIJOWONG, kSOYPAGESPy ROBERTOBFUGAS, “Soporte de peso temprano y
Movilización del tobillo después de la reparación abierta de desgarros agudos de sustancia media del tendón de Aquiles”,Revista
americana de medicina deportiva, 31 (2003), 692–700.
A-2. PAGAULJREBER, LUCYSOYARTINEZ, y SANDRAWEINTRAUB, "Aprendizaje artificial de la gramática en la enfermedad de
Alzheimer",Neurociencia cognitiva, afectiva y conductual, 3 (2003), 145–153.
A-3. CHRISTOPHEPAGEDROLETTI, marianaH€oGMAN, PAGEKKAMETROERILA€INÉN, LENNARTS. N.ORDVALL, gUNILLAHEDLIN, y
kCUAJARAVIVIR, “Capacidad de difusión de óxido nítrico en las vías respiratorias y concentración en la mucosa de escolares
asmáticos”Investigación pediátrica, 54 (2003), 496–501.
A-4. BRUCEDBEYNNON, BradenC. F.LEMING, DÁVIDOLCHURCHILL, y DanielBFILA, “El Efecto de Anterior
Deficiencia del ligamento cruzado y refuerzo funcional en la traslación de la tibia en relación con el fémur durante la
carga y la ausencia de peso”,Revista americana de medicina deportiva, 31 (2003), 99–105.
A-5. LORRENADUGOFF, mAURITHAREVERETT, LOUISVONTVER, y GWYNEBARLEY, "Evaluación de las habilidades de examen
pélvico y mamario de los internos en obstetricia y ginecología y medicina interna",Revista americana de
obstetricia y ginecología, 189 (2003), 655–658.
A-6. DIONNEMETROAYHEW, kARÉNMPERRÍN, y WFINSTRUCHEN, “Análisis de un programa para dejar de fumar Healthy Start”,Revista
estadounidense de estudios de salud, 17 (2002), 186–190.
A-7. miRICGRAMORANHOLM, ROBERTOANTHELLI, RITAMETROONTEIRO, jOHNSEVCIK, y MARILYNSTOLER, “Breve integrado
El tratamiento ambulatorio de diagnóstico dual reduce las hospitalizaciones psiquiátricas”,Revista estadounidense sobre adicciones, 12 (
2003), 306–313.
A-8. SILVIAIANNELO, ANTONINACAVALERI, PAGAOLINAMETROILAZZO, SANTICANTARELLA, y FRANCESCOBELFIORE, “Ayuno Bajo
Nivel de triglicéridos séricos como marcador precoz de trastornos autoinmunes”,Medscape Medicina general, 5 (3)
(2003).
A-9. miVELYNCY Chan, SALIADOW. V.ERNÓN, FREDERICKT. O'DONNEL, CHULAhn, ANTONYGRAMORESINGER, y DONNIEw
AGeorgia, “Consentimiento informado para la detección del cáncer con antígeno prostático específico: ¿qué tan bien reciben el
mensaje los hombres?”Diario Americano de Salud Pública, 93 (2003), 779–785.
A-10. RONALDF.CAMIONETAVOLLENHOVEN, SOFIAmiRESTAM, ANDSHARJU, jOHANBrata, y yoARSkLARESKOG, “Etanercept
Versus Etanercept más metotrexato: un estudio basado en registros que sugiere que la combinación es clínicamente
más eficaz”,Investigación y terapia de la artritis, 5 (2003), R347–R351.
212 CAPÍTULO 6 ESTIMACIÓN
A-11. SATOSHInorteOZAWA, kATSUJISHIMIZU, kIEMETROIYAMOTO, y MIZUOTANAKÁ, "Reparación del defecto pars interarticularis
mediante fijación segmentaria con alambre en atletas jóvenes con espondilólisis",Revista americana de medicina
deportiva, 31 (2003), 359–364.
A-12. METROO YOJ. K.RANTZ, ILANAB.KUTINSKY, AÚLTIMA ESCALERADROBERTSON, y PHILIPSMEHLER, "Efectos de la metadona relacionados con la dosis
en la prolongación del intervalo QT en una serie de pacientes con Torsade de Pointes",Farmacoterapia, 23 (2003), 802–805.
A-13. SUSANNAHFBUEYy DEBORÁFELLOS, "Las búsquedas de salud y el correo electrónico se han vuelto más comunes, pero hay espacio
para mejorar en las búsquedas y el acceso general a Internet".Pew Internet y proyecto de vida estadounidense,
www.pewinternet.org/PPF/r/95/report_display.asp.
A-14. CARLOSMLUNA, DanielBLANZACO, mICHAELS. N.IDERMAN, WALTERARMETROATARUCCO, norteATALIOCBAREDES, PAGABLO
DESMERY, FERNANDOPAGALIZAS, gUILLERMOMETROENGA, FERNANDORiOS, y CARLOSAPEZTEGUIA, "Resolución de
Neumonía asociada al ventilador: evaluación prospectiva de la puntuación clínica de infección pulmonar como
predictor clínico temprano de resultados”,Medicina de Cuidados Críticos, 31 (3) (2003), 676–682.
A-15. ADESGARRARFL SCHINQUEL, jEROENJBHACHA, miRICBOERSMA, ABDOUmiLHENDY, miLENICVOURVOURI, jsistema operativoRTC RÖLANDT,
y DENPAGOLDERMANS, “Evaluación de la viabilidad miocárdica residual en regiones con infarto electrocardiográfico
crónico con onda Q”,Diario americano del corazón, 144 (2002), 865–869.
A-16. FRIEDERIKE VON ZURMETROUHLEN, WEILUMqUAN, DÁVIDOJ. D'APUERTA, y TEXTRAÑOJCOHEN, “Un estudio del seno carotídeo
Pruebas de masaje y mesa basculante con la cabeza hacia arriba en pacientes con síncope y casi síncope”,Diario de Cardiología
Invasiva, 14 (2002), 477–482.
A-17. DanielFCONNOR, RONALDJ. S.TEINGARD, jENNIFERJ. A.NDERSONy RICHARDH. M.ELONI, Jr., “Diferencias de género
en Agresión Reactiva y Proactiva,”Psiquiatría infantil y desarrollo humano, 33 (2003), 279–294.
A-18. ALLANVHORWITZ, CAthySPATZWIDOM, jMIENTESMETROCLAUGHLIN, y HELENERPREGUNTARWHITE, "El impacto de
Abuso y negligencia infantil en la salud mental de los adultos: un estudio prospectivo”,Revista de Salud y Comportamiento
Social, 42 (2001), 184–201.
A-19. PALENGUADO, TMARSHALL, A. R.CASA, BRANDHAWA, H. S.ANGHA, y N.B.HANGÚ, "Ensayo controlado aleatorio del efecto de la información
basada en la evidencia sobre la disposición de las mujeres a participar en la detección del cáncer de cuello uterino", Revista de
Epidemiología y Salud Comunitaria, 57 (2003), 589–593.
A-20. jOHNCOMOPERTO, TSOYkEWHURST, CYNTIAMDOUGHERDAD, y PAULnorteICOL, "Prueba de la eficacia de convertir a los pacientes a
medicamentos antianginosos de acción prolongada: la calidad de vida en la investigación sobre la angina" Diario
americano del corazón, 141 (2001), 550–558.
A-21. PAGUN TRUCORFINLEY, hEIDIR. R.ES, jOANTPONT, SEstados UnidosL. G.ESS, CLEVANTAR ENLOUIE, SCOTTABULL, jANELLEY LEE.UU., y
LES UNABERO, "Impacto de un modelo de atención colaborativa sobre la depresión en un entorno de atención primaria: un
ensayo controlado aleatorio"Farmacoterapia, 23 (9) (2003), 1175–1185.
A-22. METROICHAELHUMMEL, miZIOBONIFACIO, hEIKEESASERKE, y ANETAG ZIEGLER, "La eliminación del gluten dietético no reduce los
títulos de autoanticuerpos asociados a la diabetes tipo 1 en sujetos de alto riesgo",Cuidado de la diabetes, 25 (2002),
1111–1116.
A-23. DVOAIZENBERG, ABRAHAMWEIZMAN, y YORAMBARAK, "Sildenafil para la disfunción eréctil inducida por inhibidores selectivos de la
recaptación de serotonina en pacientes deprimidos de sexo masculino de edad avanzada"Revista de Terapia Sexual y Marital,
29 (2003), 297–303.
A-24. PAGETERBORDENAR, jOHNnorteYLAND, DÁVIDONM CABORTAR, y DÁVIDOPAGIENKOWSKI, “Comparación biomecánica del sistema de
sutura de reparación de menisco FasT-Fix con suturas de colchonero verticales y flechas de menisco,”Revista
americana de medicina deportiva, 31 (2003), 374–378.
A-25. RACHELJALLENy MICHAELTGROSS, "Fuerza de los flexores del dedo del pie y rango de movimiento de extensión pasiva de la
primera articulación metatarsofalángica en personas con fascitis plantar"Revista de fisioterapia ortopédica y
deportiva, 33 (2003), 468–477.
A-26. METROOHEBSMONEIM, kEIKHOSRÓWFIROOZBAKHSH, DOMINICOGRAMOROSS, STEVEND. Y.JOVEN, y GEORGEOMER, "Pulgar
Amputaciones de Team Roping,”Revista americana de medicina deportiva, 31 (2003), 728–735.
A-27. norteETAHORESH, ISRAELORACH, DORONGRAMOOTRO, mEIRmiFRATI, y ALANAPTER, “Comparación de los suicidios
Comportamiento de pacientes adolescentes hospitalizados con trastorno límite de la personalidad y depresión mayor.Revista de
enfermedades nerviosas y mentales, 191 (2003), 582–588.
A-28. R. P.LUTCHIK, y hCAMIONETAPAGRAAG, "La medición de la tendencia suicida, la agresividad y la impulsividad",
Neurofarmacología Clínica, 9(suplemento) (1989), 380–382.
A-29. jOANMG CRANÉ, TEN UNDELANEY, y DONNAHUTCHENS, “Misoprostol oral para la ruptura prematura de membranas a
término”,Revista americana de obstetricia y ginecología, 189 (2003), 720–724.
REFERENCIAS 213
METROICHELETARDÍO, ROBERTOLSUPLIR LAS DEFICIENCIAS, mAURICEnorteKAM, ANNEESPRESTAR, FRANCOSOISEBARRE - - SINOUSSI, PAGAULMV MARTIN,
y miRICnorteERRIENET, “Baja tasa de transmisión maternoinfantil del VIH-1 después de la intervención con nevirapina en
un programa piloto de salud pública en Yaound-e, Camerún”,Diario del Síndrome de Inmunodeficiencia Adquirida,
34 (2003), 274–280.
CAPÍTULO 7
EVALUACIÓN DE LA HIPÓTESIS
TEMAS
7.1INTRODUCCIÓN
7.2PRUEBA DE HIPÓTESIS: UNA ÚNICA MEDIA POBLACIONAL
7.3PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS MEDIAS DE POBLACIÓN
7.11RESUMEN
214
7.1 INTRODUCCIÓN 215
7.1 INTRODUCCIÓN
Conceptos básicosEn esta sección se presentan algunos de los conceptos básicos esenciales para la
comprensión de la prueba de hipótesis. Los detalles específicos de las pruebas particulares se darán
en las secciones siguientes.
DEFINICIÓN
Ahipótesispuede definirse simplemente comoun enunciado sobre una o más
poblaciones.
La hipótesis se ocupa con frecuencia de los parámetros de las poblaciones sobre las que se
hace el enunciado. El administrador de un hospital puede plantear la hipótesis de que la estancia
media de los pacientes ingresados en el hospital es de 5 días; una enfermera de salud pública puede
plantear la hipótesis de que un programa educativo en particular resultará en una mejor
comunicación entre la enfermera y el paciente; un médico puede formular la hipótesis de que un
determinado fármaco será eficaz en el 90 por ciento de los casos en los que se utilice. Por medio de la
prueba de hipótesis se determina si tales afirmaciones son o no compatibles con los datos
disponibles.
DEFINICIÓN
Elhipótesis de la investigaciónes la conjetura o suposición que motiva la
investigación.
Puede ser el resultado de años de observación por parte del investigador. Una enfermera de
salud pública, por ejemplo, pudo haber notado que ciertos clientes respondían más fácilmente a un
tipo particular de programa de educación para la salud. Un médico puede recordar numerosos casos
en los que ciertas combinaciones de medidas terapéuticas fueron más eficaces que cualquiera de
ellas sola. Los proyectos de investigación a menudo resultan del deseo de tales profesionales de la
salud de determinar si sus teorías o sospechas pueden o no ser respaldadas cuando se someten a los
rigores de la investigación científica.
216 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
DEFINICIÓN
Hipótesis estadísticasson hipótesis que se formulan de tal manera que pueden
ser evaluadas mediante técnicas estadísticas apropiadas.
En este libro, las hipótesis en las que nos centraremos son hipótesis estadísticas.
Supondremos que las hipótesis de investigación para los ejemplos y ejercicios ya han sido
consideradas.
y la alternativa es
HA:metro6¼50
Supongamos que queremos saber si podemos concluir que la media de la población es mayor que 50.
Nuestras hipótesis son
Si queremos saber si podemos concluir que la media poblacional es menor que 50, las
hipótesis son
En resumen, podemos enunciar las siguientes reglas empíricas para decidir qué
enunciado se incluye en la hipótesis nula y qué enunciado se incluye en la hipótesis
alternativa:
(a)Lo que usted espera o espera poder concluir como resultado de la prueba por lo general
debe colocarse en la hipótesis alternativa.
(b)La hipótesis nula debe contener un enunciado de igualdad, ya sea¼; -;o -.
(C)La hipótesis nula es la hipótesis que se prueba.
(d)Las hipótesis nula y alternativa son complementarias. Es decir, los dos juntos agotan
todas las posibilidades en cuanto al valor que puede asumir el parámetro hipotético.
4. Estadística de prueba.La estadística de prueba es alguna estadística que se puede calcular a partir de
los datos de la muestra. Como regla, hay muchos valores posibles que la estadística de prueba puede
asumir, dependiendo el valor particular observado de la muestra particular extraída. Como veremos,
el estadístico de prueba sirve como tomador de decisiones, ya que la decisión de rechazar o no la
hipótesis nula depende de la magnitud del estadístico de prueba. Un ejemplo de una estadística de
prueba es la cantidad
-X metro
z¼ pffiffi0ff (7.1.1)
s= norte
218 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
dóndemetro0es un valor hipotético de una media poblacional. Este estadístico de prueba está relacionado con el
estadístico
-X metro
z¼ pffiffiffi (7.1.2)
s= norte
Fórmula general para la estadística de pruebaLa siguiente es una fórmula general para un
estadístico de prueba que será aplicable en muchas de las pruebas de hipótesis discutidas en este
libro:
pffiffiffi
En la Ecuación 7.1.1, -Xes la estadística relevante,metro0es el parámetro hipotético, ys= el error nortees
-X metro
z¼ pffiffi0ff
s= norte
Nivel significativoLa decisión sobre qué valores van a la región de rechazo y cuáles van a la
región de no rechazo se toma sobre la base de la deseadanivel de significancia,diseñado pora.El
términonivel de significanciarefleja el hecho de que las pruebas de hipótesis a veces se
denominan pruebas de significación, y se dice que un valor calculado del estadístico de prueba
que cae en la región de rechazo essignificativo.El nivel de importancia,a,especifica el área bajo
la curva de la distribución de la estadística de prueba que está por encima de los valores en el
eje horizontal que constituye la región de rechazo.
7.1 INTRODUCCIÓN 219
DEFINICIÓN
Elnivel de significanciaaes una probabilidad y, de hecho, es laprobabilidad de
rechazar una hipótesis nula verdadera.
Dado que rechazar una hipótesis nula verdadera constituiría un error, parece
razonable que hagamos pequeña la probabilidad de rechazar una hipótesis nula
verdadera y, de hecho, eso es lo que se hace. Seleccionamos un pequeño valor deapara
hacer pequeña la probabilidad de rechazar una hipótesis nula verdadera. Los valores más
frecuentes deason .01, .05 y .10.
Tipos de erroresEl error que se comete cuando se rechaza una hipótesis nula verdadera se
llamaerror tipo I.Elerror de tipo IIes el error que se comete cuando no se rechaza una hipótesis
nula falsa. La probabilidad de cometer un error tipo II se designa porb.
Siempre que rechazamos una hipótesis nula siempre existe el riesgo concomitante de cometer un
error tipo I, rechazando una hipótesis nula verdadera. Cada vez que fallamos en rechazar una hipótesis nula,
el riesgo de fallar en rechazar una hipótesis nula falsa siempre está presente. Hacemosa pequeño, pero
generalmente no ejercemos ningún control sobreb,aunque sabemos que en la mayoría de las situaciones
prácticas es mayor quea.
Nunca sabemos si hemos cometido uno de estos errores cuando rechazamos o no rechazamos
una hipótesis nula, ya que se desconoce el verdadero estado de cosas. Si el procedimiento de prueba
conduce al rechazo de la hipótesis nula, podemos consolarnos con el hecho de que hicimosa pequeña
y, por tanto, la probabilidad de cometer un error tipo I era pequeña. Si no rechazamos la hipótesis
nula, no conocemos el riesgo concurrente de cometer un error tipo II, ya quebgeneralmente se
desconoce pero, como se ha señalado, sabemos que, en la mayoría de las situaciones prácticas, es
más grande quea.
La Figura 7.1.1 muestra, para varias condiciones de una prueba de hipótesis, las posibles acciones que
puede tomar un investigador y las condiciones bajo las cuales se cometerá cada uno de los dos tipos de
error. La tabla que se muestra en esta figura es un ejemplo de lo que generalmente se conoce comomatriz
de confusión.
Verdadero FALSO
FIGURA 7.1.1Condiciones bajo las cuales se pueden cometer errores tipo I y tipo II.
220 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
DEFINICIÓN
Avalor pes la probabilidad de que el valor calculado de un estadístico de prueba sea al menos
tan extremo como un valor especificado del estadístico de prueba cuando la hipótesis nula es
verdadera. Por lo tanto, lavalor pes el valor más pequeño deapara lo cual podemos rechazar
una hipótesis nula.
Resaltamos que cuando no se rechaza la hipótesis nula no se debe decir que se acepta la
hipótesis nula. Deberíamos decir que la hipótesis nula “no se rechaza”. Evitamos usar la palabra
“aceptar” en este caso porque podemos haber cometido un error tipo II. Dado que, con
frecuencia, la probabilidad de cometer un error de tipo II puede ser bastante alta, no queremos
comprometernos a aceptar la hipótesis nula.
La figura 7.1.2 es un diagrama de flujo de los pasos que seguimos cuando realizamos una hipótesis.
prueba.
Evaluar
datos
Rdover
asumir pciones
Calle ate
hipotético tesis
Sel etc.
tecalle
estati palos
mío
Desalentar
bución
distribuir
de test
estati palos
ate
Calle
sión
decidir
tu le
tutarde
Calcular
tecalle
estati palos
No Hacer
rechazarH0
estadístico RechazarH0
decisión
ConcluirH0 ConcluirHA
puede ser verdad es verdad
sensible al tamaño de las muestras que se analizan, y se debe tener cuidado al interpretar los
resultados que involucran tamaños de muestra muy pequeños.
Sin embargo, debemos enfatizar en este punto que el resultado de la prueba estadística
es solo una pieza de evidencia que influye en la decisión administrativa o clínica. La decisión
estadística no debe interpretarse como definitiva, sino que debe considerarse junto con toda la
demás información relevante disponible para el experimentador.
Con estos comentarios generales como antecedentes, ahora discutimos hipótesis específicas
pruebas
222 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
En esta sección consideramos la prueba de una hipótesis sobre la media de una población bajo tres
condiciones diferentes: (1) cuando el muestreo es de una población de valores distribuida
normalmente con varianza conocida; (2) cuando el muestreo proviene de una población normalmente
distribuida con varianza desconocida, y (3) cuando el muestreo proviene de una población que no
tiene una distribución normal. Aunque la teoría para las condiciones 1 y 2 depende de poblaciones
distribuidas normalmente, es una práctica común hacer uso de la teoría cuando las poblaciones
relevantes solo tienen una distribución aproximadamente normal. Esto es satisfactorio siempre que la
salida de la normalidad no sea drástica. Cuando el muestreo es de una población distribuida
normalmente y se conoce la varianza de la población, el estadístico de prueba para probarH0:metro¼
metro0es
-X metro
z¼ pffiffiffi (7.2.1)
s= norte
que cuandoH0es cierto, se distribuye como la normal estándar. Los ejemplos 7.2.1 y 7.2.2
ilustran la prueba de hipótesis en estas condiciones.
EJEMPLO 7.2.1
Los investigadores están interesados en la edad media de una determinada población. Digamos que
se hacen la siguiente pregunta: ¿Podemos concluir que la media de edad de esta población es
diferente de los 30 años?
Solución: Con base en nuestro conocimiento de la prueba de hipótesis, respondemos que pueden
concluir que la edad media es diferente de 30 si pueden rechazar la hipótesis nula de que la
media es igual a 30. Usemos el procedimiento de prueba de hipótesis de diez pasos que se
da en el sección anterior para ayudar a los investigadores a llegar a una conclusión.
1. Datos.Los datos disponibles para los investigadores son las edades de una
muestra aleatoria simple de 10 individuos extraídos de la población de
interés. De esta muestra una media de -X¼27 ha sido calculado.
2. Supuestos.Se supone que la muestra proviene de una población cuyas edades
se distribuyen aproximadamente normalmente. Supongamos también que la
población tiene una varianza conocida des2¼20
3. Hipótesis.La hipótesis a contrastar, o hipótesis nula, es que la edad
media de la población es igual a 30 años. La hipótesis alternativa es
7.2 PRUEBA DE HIPÓTESIS: UNA ÚNICA MEDIA POBLACIONAL 223
H0:metro¼30
HA:metro6¼30
4. Estadística de prueba.Dado que estamos probando una hipótesis sobre la media de una
población, dado que suponemos que la población tiene una distribución normal y dado
que se conoce la varianza de la población, nuestro estadístico de prueba está dado por la
Ecuación 7.2.1.
6. Regla de decisión.La regla de decisión nos dice que rechacemosH0si el valor calculado de
la estadística de prueba cae en la región de rechazo y falla en rechazarH0
si cae en la región de no rechazo. Ahora debemos especificar las regiones de
rechazo y no rechazo. Podemos comenzar preguntándonos qué magnitud de
valores del estadístico de prueba provocará el rechazo deH0. Si la hipótesis nula es
falsa, puede ser porque la media de la población es menor que 30 o porque la
media de la población es mayor que 30. Por lo tanto, los valores suficientemente
pequeños o suficientemente grandes del estadístico de prueba provocarán el
rechazo de la hipótesis nula. hipótesis. Queremos que estos valores extremos
constituyan la región de rechazo. ¿Qué tan extremo debe ser un valor posible del
estadístico de prueba para calificar para la región de rechazo? La respuesta
depende del nivel de significación que elijamos, es decir, del tamaño de la
probabilidad de cometer un error tipo I. Digamos que queremos que la
probabilidad de rechazar una hipótesis nula verdadera seaa¼ :05. Dado que
nuestra región de rechazo constará de dos partes, valores suficientemente
pequeños y valores suficientemente grandes del estadístico de prueba, parte dea
tendrá que asociarse con los valores grandes y parte con los valores pequeños.
Parece razonable que dividamosapor igual y dejarun =2¼ :025 estar asociado con
valores pequeños yun =2¼ :025 estar asociado con valores grandes.
224 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
¿Qué valor del estadístico de prueba es tan grande que, cuando la hipótesis nula es verdadera, la
probabilidad de obtener un valor tan grande o mayor es .025? En otras palabras, ¿cuál es el valor dez¿a la
derecha de la cual se encuentra .025 del área bajo la distribución normal estándar? El valor deza la derecha
del cual se encuentra .025 del área es el mismo valor que tiene .975 del área entre él y1.Buscamos en el
cuerpo de la Tabla D del Apéndice hasta que encontramos .975 o su valor más cercano y leemos las entradas
marginales correspondientes para obtener nuestrazvalor. En el presente ejemplo el valor dezes 1,96. Un
razonamiento similar nos llevará a encontrar 1:96 como el valor del estadístico de prueba tan pequeño que
cuando la hipótesis nula es verdadera, la probabilidad de obtener un valor tan pequeño o menor es .025.
Nuestra región de rechazo, entonces, consiste en todos los valores del estadístico de prueba iguales o
mayores a 1.96 y menores o iguales a 1:96. La región de no rechazo consta de todos los valores intermedios.
Podemos establecer la regla de decisión para esta prueba de la siguiente manera:rechazar H0si el valor
calculado de la estadística de prueba es -1:96o
- 1:96. De lo contrario, no rechacesH0. Las regiones de rechazo y no rechazo se muestran en
la figura 7.2.1. Los valores del estadístico de prueba que separan las regiones de rechazo y no
rechazo se denominanvalores criticosdel estadístico de prueba, y la región de rechazo a veces
se denominaregión crítica.
La regla de decisión nos dice que calculemos un valor del estadístico de prueba a partir
de los datos de nuestra muestra y rechacemosH0si obtenemos un valor que es igual o mayor a
1.96 o igual o menor a 1:96 y no logramos rechazarH0si obtenemos cualquier otro valor. El valor
deay, por lo tanto, la regla de decisión debe decidirse antes de recopilar los datos. Esto evita
que se nos acuse de permitir que los resultados de la muestra influyan en nuestra elección dea.
Esta condición de objetividad es muy deseable y debe preservarse en todas las pruebas.
27 30 3
z¼pffiffiffiffiffiffiffiffiffiffiffiffiffi¼ ¼2:12
20=10 1:4142
s=1
. 95
a/2= .025 a/2 = .025
_1.96 0 1.96 z
Veamos cómo podríamos haber llegado a esta misma conclusión usando un 100d1aÞ intervalo de
confianza porcentual. El intervalo de confianza del 95 por ciento parametroes
27 1:96d1:414Þ
27 2:7714
d24:2286; 29:7714Þ
Como este intervalo no incluye 30, decimos que 30 no es candidato para la media que estamos
estimando y, por lo tanto,metrono es igual a 30 yH0se rechaza. Esta es la misma conclusión
alcanzada por medio del procedimiento de prueba de hipótesis.
Si el parámetro hipotético, 30, hubiera estado dentro del intervalo de confianza del 95
por ciento, habríamos dicho queH0no se rechaza en el nivel de significancia de .05. En general,al
probar una hipótesis nula por medio de un intervalo de confianza bilateral, rechazamos H0en el
anivel de significación si el parámetro hipotético no está contenido dentro de la100d1aÞ
intervalo de confianza porcentual. Si el parámetro hipotético está contenido dentro del
intervalo, H0no puede ser rechazado en elanivel de significancia.
EJEMPLO 7.2.2
Consulte el Ejemplo 7.2.1. Supongamos que, en lugar de preguntar si podrían concluir quemetro6¼30,
los investigadores habían preguntado: ¿Podemos concluir quem <30? A esta pregunta
responderíamos que pueden concluir así si pueden rechazar la hipótesis nula de quem-30
Solución: Repasemos el procedimiento de diez pasos para llegar a una decisión basada en una prueba
unilateral.
H0:m-30
HA:m <30
-X metro
z¼ pffiffi0ff
s= norte
27 30
z¼pffiffiffiffiffiffiffiffiffiffiffiffiffi¼2:12
20=10
s=1
. 95
. 05
_1.645 0 z
-X metro
t¼ pffiffiffi0 (7.2.2)
s= norte
EJEMPLO 7.2.3
Nakamura et al. (A-1) estudiaron sujetos con desgarros del ligamento colateral medial (MCL) y del
ligamento cruzado anterior (LCA). Entre febrero de 1995 y diciembre de 1997, 17 pacientes
consecutivos con lesiones agudas combinadas de LCA y LCM de grado III fueron tratados por el
mismo médico en el centro de investigación. Una de las variables de interés fue el tiempo en días
entre la ocurrencia de la lesión y la primera resonancia magnética (RM). Los datos se muestran en la
Tabla 7.2.1. Deseamos saber si podemos concluir que el número medio de días entre la lesión y la
resonancia magnética inicial no es de 15 días en una población que se supone que está representada
por estos datos de muestra.
TABLA 7.2.1 Número de días hasta la RM para sujetos con desgarros de MCL y ACL
1 14 6 0 11 28 dieciséis 14
2 9 7 10 12 24 17 9
3 18 8 4 13 24
4 26 9 8 14 2
5 12 10 21 15 3
Fuente: Norimasa Nakamura, Shuji Horibe, Yukyoshi Toritsuka, Tomoki Mitsuoka, Hideki Yoshikawa y Konsei Shino,
“Lesión aguda del ligamento colateral medial de grado III de la rodilla asociada con desgarro del ligamento cruzado
anterior”Revista americana de medicina deportiva, 31 (2003), 261–267.
7.2 PRUEBA DE HIPÓTESIS: UNA ÚNICA MEDIA POBLACIONAL 229
13:2941 15 1:7059
t¼ pffiffiffiffiffi ¼ ¼ :791
8:88654= 17 2:1553
. 95
. 025 . 025
– 2.1199 0 2.1199 t
. 10 . 10
H0:m-15
HA:m <15
H0:m-15
HA:metro >15
habríamos tenido una prueba unilateral con toda la región de rechazo en la cola
superior de la distribución. &
conocido, la práctica habitual es utilizar la desviación estándar de la muestra como una estimación. La estadística de
prueba para probarH0:metro¼metro0, entonces es
-X metro
z¼ pffiffiffi0 (7.2.3)
s= norte
que cuandoH0es cierto, se distribuye aproximadamente como la distribución normal estándar sinorte
es largo. La justificación para usarspara reemplazarses que la muestra grande, necesaria para que se
aplique el teorema del límite central, producirá una desviación estándar de la muestra que se
aproxima muchos.
EJEMPLO 7.2.4
El objetivo de un estudio de Klingler et al. (A-2) fue determinar cómo el reconocimiento y la percepción
de los síntomas influyen en la presentación clínica en función de la raza. Caracterizaron los síntomas y
el comportamiento de búsqueda de atención en pacientes afroamericanos con dolor torácico
atendidos en el departamento de emergencias. Uno de los signos vitales de presentación fue la
presión arterial sistólica. Entre 157 hombres afroamericanos, la presión arterial sistólica media fue de
146 mm Hg con una desviación estándar de 27. Deseamos saber si, sobre la base de estos datos,
podemos concluir que la presión arterial sistólica media para una población africana -Hombres
americanos es mayor a 140.
Solución: Diremos que los datos sí aportan evidencia suficiente para concluir que la media
poblacional es superior a 140 si podemos rechazar la hipótesis nula de que la
media es inferior o igual a 140. Se puede realizar la siguiente prueba:
4. Estadística de prueba.El estadístico de prueba viene dado por la Ecuación 7.2.3, ya queses
desconocido.
. 05
0 1.645 z
146 140 6
z¼ pffiffiffiffiffiffiffiffi ¼ ¼2:78
27= 157 2:1548
EJEMPLO 7.2.5
Las siguientes son las circunferencias de la cabeza (centímetros) al nacer de 15 bebés:
Producción:
T de una muestra: C1
Solución: Suponemos que los supuestos para el uso de latse cumplen las estadísticas. Ingresamos los datos
en la Columna 1 y procedemos como se muestra en la Figura 7.2.6.
Para indicar que una prueba es unilateral en Windows, haga clic en el
Opcionesy luego elija "menor que" o "mayor que" según corresponda en el
Alternativacaja. Sizes la estadística de prueba apropiada, elegimos 1-
Muestrazdel menú Estadísticas básicas. El resto de los comandos son los
mismos que para eltprueba.
Aprendemos de la impresión que el valor calculado de la estadística de prueba
es 4:31 y elpagel valor para la prueba es .0007. S.A.S.®los usuarios pueden usar la
salida de PROC MEANS o PROC UNIVARIATE para realizar pruebas de hipótesis.
Cuando tanto elzestadística y latestadístico son estadísticos de prueba
inapropiados para usar con los datos disponibles, se puede desear usar una técnica no
paramétrica para probar una hipótesis sobre una sola medida de tendencia central de
la población. Uno de estos procedimientos, la prueba de signos, se analiza en el
capítulo 13. &
EJERCICIOS
Para cada uno de los siguientes ejercicios, lleve a cabo el procedimiento de prueba de hipótesis de diez pasos para el
nivel de significancia dado. Para cada ejercicio, según corresponda, explique por qué eligió una prueba unilateral o
una prueba bilateral. Discuta cómo cree que los investigadores y/o los médicos podrían usar los resultados de su
prueba de hipótesis. ¿Qué decisiones y/o acciones clínicas y/o de investigación cree que serían apropiadas a la luz de
los resultados de su prueba?
7.2.1Escobar et al. (A-3) realizó un estudio para validar una versión traducida del cuestionario del índice de
osteoartritis de las universidades de Western Ontario y McMaster (WOMAC) utilizado con pacientes de habla
hispana con osteoartritis de cadera o rodilla. Para las 76 mujeres clasificadas con dolor severo de cadera, el
234 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
La puntuación de función media de WOMAC (en una escala de 0 a 100, donde un número más alto indica menos
función) fue de 70,7 con una desviación estándar de 14,6. Deseamos saber si podemos concluir que la puntuación
funcional media para una población de mujeres similares con dolor intenso de cadera es inferior a 75. Seaa¼ :01.
7.2.2Un estudio de Thienprasiddhi et al. (A-4) examinó una muestra de 16 sujetos con glaucoma de ángulo abierto y
defectos de hemicampo unilaterales. Las edades (años) de los sujetos fueron:
62 62 68 48 51 60 51 57 57 41 62 50 53 34 62 61
¿Podemos concluir que la edad media de la población de la que se supone que se ha extraído la
muestra es inferior a 60 años? Dejara¼ :05.
7.2.3El propósito de un estudio de Lugli-e et al. (A-5) fue investigar el estado oral de un grupo de pacientes
diagnosticados con talasemia mayor (TM). Una de las medidas de resultado fue el índice de dientes cariados,
perdidos y obturados (CPOD). En una muestra de 18 pacientes el valor medio del índice CPOD fue de 10,3 con
una desviación estándar de 7,3. ¿Es esta evidencia suficiente para permitirnos concluir que el índice CPOD
medio es superior a 9,0 en una población de sujetos similares? Dejara¼ :10
7.2.4Se estudió una muestra de 25 registros de pacientes atendidos en un hospital de enfermedades crónicas en
forma ambulatoria. El número medio de visitas ambulatorias por paciente fue de 4,8 y la desviación estándar
de la muestra fue de 2. ¿Se puede concluir a partir de estos datos que la media poblacional es mayor que
cuatro visitas por paciente? Sea .05 la probabilidad de cometer un error tipo I. ¿Qué supuestos son
necesarios?
7.2.5En una muestra de 49 adolescentes que sirvieron como sujetos en un estudio inmunológico, una variable de
interés fue el diámetro de la reacción de la prueba cutánea a un antígeno. La media muestral y la desviación estándar
fueron eritema de 21 y 11 mm, respectivamente. ¿Se puede concluir a partir de estos datos que la media de la
población es menor que 30? Dejara¼ :05.
7.2.6Nueve animales de laboratorio fueron infectados con cierta bacteria y luego inmunosuprimidos. El número medio de
organismos recuperados más tarde de las muestras de tejido fue de 6,5 (datos codificados) con una desviación
estándar de 0,6. ¿Se puede concluir a partir de estos datos que la media de la población es mayor que 6?
Dejara¼ :05. ¿Qué suposiciones son necesarias?
7.2.7Una muestra de 25 estudiantes de enfermería de primer año obtuvo una puntuación media de 77 en una prueba
diseñada para medir la actitud hacia el paciente moribundo. La desviación estándar de la muestra fue 10.
¿Proporcionan estos datos evidencia suficiente para indicar, en el nivel de significación de .05, que la media de la
población es menor que 80? ¿Qué supuestos son necesarios?
7.2.8Queremos saber si podemos concluir que la ingesta calórica diaria media en la población rural adulta de un país
en desarrollo es inferior a 2000. Una muestra de 500 tenía una media de 1985 y una desviación estándar de
210. Seaa¼ :05.
7.2.9Una encuesta de 100 hospitales de tamaño similar reveló un censo diario promedio en el servicio de pediatría de
27 con una desviación estándar de 6,5. ¿Estos datos proporcionan evidencia suficiente para indicar que la
media de la población es mayor que 25? Dejara¼ :05.
EJERCICIOS 235
7.2.10Después de un programa de capacitación de supervisión hospitalaria de una semana de duración, 16 administradores auxiliares del
hospital obtuvieron una puntuación media de 74 en una prueba administrada como parte de la evaluación del programa de
capacitación. La desviación estándar de la muestra fue 12. ¿Se puede concluir a partir de estos datos que la media de la
población es mayor que 70? Dejara¼ :05. ¿Qué suposiciones son necesarias?
7.2.11Se seleccionó una muestra aleatoria de 16 informes de emergencia de los archivos de un servicio de ambulancias. El
tiempo medio (calculado a partir de los datos de la muestra) necesario para que las ambulancias lleguen a sus
destinos fue de 13 minutos. Suponga que la población de tiempos se distribuye normalmente con
una varianza de 9. ¿Podemos concluir en el nivel de significancia de .05 que la media de la población es mayor que 10
minutos?
7.2.12Los siguientes datos son los consumos de oxígeno (mililitros) durante la incubación de una muestra aleatoria de
15 suspensiones celulares:
¿Proporcionan estos datos evidencia suficiente al nivel de significancia de .05 de que la media poblacional no
es 12 ml? ¿Qué supuestos son necesarios?
7.2.13¿Podemos concluir que el valor medio de ventilación voluntaria máxima para universitarios aparentemente sanos
mayores no son 110 litros por minuto? Una muestra de 20 arrojó los siguientes valores:
132, 33, 91, 108, 67, 169, 54, 203, 190, 133,
96, 30, 187, 21, 63, 166, 84, 110, 157, 138
7.2.14Las siguientes son las presiones arteriales sistólicas (mm Hg) de 12 pacientes en tratamiento farmacológico para
hipertensión:
183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158
¿Podemos concluir sobre la base de estos datos que la media de la población es menor que 165? Dejara¼ :05. ¿Qué
suposiciones son necesarias?
7.2.15¿Podemos concluir que la edad media de muerte de los pacientes con enfermedad de células falciformes homocigotas es menor
de 30 años? Una muestra de 50 pacientes arrojó las siguientes edades en años:
7.2.16Los siguientes son valores de presión intraocular (mm Hg) registrados para una muestra de 21 sujetos ancianos:
14,5 12,9 14,0 16,1 12,0 17,5 14,1 12,9 17,9 12,0
16,4 24,2 12,2 14,4 17,0 10,0 18,5 20,8 16,2 14,9
19.6
¿Podemos concluir a partir de estos datos que la media de la población de la que se extrajo la muestra es
mayor que 14? Dejara¼ :05. ¿Qué suposiciones son necesarias?
236 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
7.2.17Suponga que se sabe que las puntuaciones de CI de cierta población de adultos tienen una distribución
aproximadamente normal con una desviación estándar de 15. Una muestra aleatoria simple de 25 adultos extraída
de esta población tuvo una puntuación media de CI de 105. Sobre la base de estos datos ¿Podemos concluir que la
puntuación media de CI de la población no es 100? Sea la probabilidad de cometer un error tipo I
ser .05.
7.2.18Un equipo de investigación está dispuesto a suponer que las presiones arteriales sistólicas en cierta población de
hombres tienen una distribución aproximadamente normal con una desviación estándar de 16. Una muestra
aleatoria simple de 64 hombres de la población tenía una lectura de presión arterial sistólica media de 133. .05 nivel
de significación, ¿proporcionan estos datos evidencia suficiente para concluir que la media de la población es mayor
que 130?
7.2.19Una muestra aleatoria simple de 16 adultos extraída de cierta población de adultos arrojó un peso medio de 63
kg. Suponga que los pesos en la población tienen una distribución aproximadamente normal con una
varianza de 49. ¿Los datos de la muestra brindan evidencia suficiente para concluir que el peso medio de la
población es menor que 70 kg? Sea .01 la probabilidad de cometer un error tipo I.
EJEMPLO 7.3.1
Los investigadores desean saber si los datos que han recopilado brindan evidencia suficiente
para indicar una diferencia en los niveles medios de ácido úrico en suero entre individuos
normales e individuos con síndrome de Down. Los datos consisten en lecturas de ácido úrico en
suero de 12 personas con síndrome de Down y 15 personas normales. Los medios son -X1¼ 4:5
mg/100 ml y -X2¼3:4mg/100ml.
Solución: Diremos que los datos muestrales proporcionan evidencia de que las medias
poblacionales no son iguales si podemos rechazar la hipótesis nula de que las medias
poblacionales son iguales. Lleguemos a una conclusión por medio del procedimiento
de prueba de hipótesis de diez pasos.
H0:metro1¼metro2
HA:metro16¼metro2
1=12þ1:5=15 :4282
s=1
_1.96 0 1.96 z
norte þnorte
1 2 2
Cuando cada una de dos muestras aleatorias simples independientes ha sido extraída de una población
distribuida normalmente y las dos poblaciones tienen varianzas iguales pero desconocidas, el estadístico de
prueba para probarH0:metro1¼metro2es dado por
EJEMPLO 7.3.2
El propósito de un estudio de Tam et al. (A-6) fue investigar el manejo de sillas de ruedas en personas
con lesión de la médula espinal (SCI) de nivel inferior y controles sanos (C). Los sujetos utilizaron una
silla de ruedas modificada para incorporar una superficie de asiento rígida para facilitar las medidas
experimentales especificadas. La medición de la presión de la interfaz se registró mediante el uso de
un tapete sensible a la presión de alta resolución con una resolución espacial de cuatro sensores por
centímetro cuadrado pegado al soporte rígido del asiento. Durante las condiciones estáticas de
sedestación, se registraron las presiones promedio debajo de las tuberosidades isquiáticas (la parte
inferior de los huesos pélvicos). Los datos para las mediciones de la tuberosidad isquiática izquierda
(en mm Hg) para los grupos SCI y control se muestran en la Tabla 7.3.1. Deseamos saber si podemos
concluir, sobre la base de estos datos, que, en general,
Solución:
- XC¼126:1;sC¼21:8; -XLME¼133:1;sLME¼32:2
9d21:8Þ2þ9d32:2Þ2
spag
2 ¼ ¼756:04
9þ9
TABLA 7.3.1 Presiones (mm Hg) debajo de la pelvis durante condiciones estáticas para el ejemplo
7.3.2
Control 131 115 124 131 122 117 88 114 150 169
LME 60 150 130 180 163 130 121 119 130 148
Fuente: Eric W. Tam, Arthur F. Mak, Wai Nga Lam, John H. Evans y York Y. Chow, “Movimiento pélvico y distribución de
la presión de interfaz durante la propulsión manual en silla de ruedas”Archivos de Medicina Física y Rehabilitación, 84
(2003), 1466–1472.
240 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
ahora calculamos
d126:1 133:1Þ0 t¼
:569
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼
756:04 756:04
þ
10 10
10pagvalor.Para esta prueba,pag > :10 usando la Tabla E, o .5764 usando una
computadora desde 1:330 < :569. &
w1t1þw2t2
t10 dun =2Þ¼ (7.3.4)
w1þw2
EJEMPLO 7.3.3
Dernellis y Panaretou (A-7) examinaron sujetos con hipertensión y sujetos de control sanos. Una
de las variables de interés fue el índice de rigidez aórtica. Las medidas de esta variable se
calcularon a partir del diámetro aórtico evaluado por ecocardiografía en modo M y la presión
arterial medida por un esfigmomanómetro. En general, los médicos desean
7.3 PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 241
reducir la rigidez aórtica. En los 15 pacientes hipertensos (grupo 1), el índice de rigidez aórtica medio
fue de 19,16 con una desviación estándar de 5,29. En los 30 sujetos control (grupo 2), el índice de
rigidez aórtica medio fue de 9,53 con una desviación estándar de 2,69. Deseamos determinar si las
dos poblaciones representadas por estas muestras difieren con respecto al índice medio de rigidez
aórtica.
Solución:
1. Datos.Los tamaños de las muestras, las medias y las desviaciones estándar de las muestras son:
H0:metro1 metro2¼0
HA:metro1 metro26¼0
1:8656d2:1448Þ þ :2412d2:0452Þ
t0¼ ¼2:133
1:8656þ :2412
que cuandoH0es cierto, sigue la distribución normal estándar. Si se conocen las varianzas de la
población, se utilizan; pero si se desconocen, como suele ser el caso, se utilizan como estimaciones las
varianzas muestrales, que necesariamente se basan en muestras grandes. Las varianzas de la
muestra no se agrupan, ya que la igualdad de las varianzas de la población no es una suposición
necesaria cuando elzse utiliza la estadística.
EJEMPLO 7.3.4
El objetivo de un estudio de Sairam et al. (A-8) fue identificar el papel de varios estados de
enfermedad y factores de riesgo adicionales en el desarrollo de trombosis. Uno de los objetivos
del estudio fue determinar si había diferentes niveles del anticuerpo IgG anticardiolipina en
sujetos con y sin trombosis. La Tabla 7.3.2 resume los hallazgos de los investigadores:
TABLA 7.3.2 Niveles de IgG para sujetos con y sin trombosis para el ejemplo 7.3.4
Deseamos saber si podemos concluir, sobre la base de estos resultados, que, en general, las
personas con trombosis tienen, en promedio, niveles de IgG más altos que las personas sin
trombosis.
Solución:
o alternativamente,
H0:metroT-metroNuevo Testamento
HA:metroT>metroNuevo Testamento
4. Estadística de prueba.Como tenemos muestras grandes, el teorema del límite central nos
permite usar la Ecuación 7.3.5 como estadístico de prueba.
59:01 46:61
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼1:59
44:892 34:852
þ
53 54
Podemos usar MINITAB para realizar dos muestrastpruebas Para ilustrar, consultemos
los datos de la Tabla 7.3.1. Ponemos los datos para sujetos de control y médula espinal
244 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
Producción:
Diferencia MU C Mu LME
Estimación de diferencia: 7.0
Límite superior del 95% para la diferencia: 14.3
Prueba T de diferencia 0 (frente a <): Valor T 0.57 Valor P 0.288
DF 18
Ambos usan Desv. estándar agrupada 27.5
El Sistema SAS
El Procedimiento de PRUEBAT
Pruebas T
---------------------------------------------------------------------------------
Variable Método variaciones DF Valor t Pr > |t|
presión agrupados Igual 18 0.57 0.5761
presión Satterthwaite Desigual 15.8 0.57 0.5771
Igualdad de Varianzas
---------------------------------------------------------------------------------
Variable Método Núm DF Guarida DF Valor F PR > F
presión Doblada F 9 9 2.17 0.2626
EJERCICIOS
En cada uno de los siguientes ejercicios, complete el procedimiento de prueba de hipótesis de diez pasos.
Indique los supuestos que son necesarios para que su procedimiento sea válido. Para cada ejercicio, según
corresponda, explique por qué eligió una prueba unilateral o bilateral. Discuta cómo cree que los
investigadores o los médicos podrían usar los resultados de su prueba de hipótesis. ¿Qué decisiones o
acciones clínicas o de investigación cree que serían apropiadas a la luz de los resultados de su prueba?
7.3.1Los sujetos de un estudio de Dabonneville et al. (A-9) incluyó una muestra de 40 hombres que afirmaron practicar una variedad de
actividades deportivas (multideporte). El índice de masa corporal (IMC) medio de estos hombres fue de 22,41 con una
desviación estándar de 1,27. Una muestra de 24 jugadores masculinos de rugby tenía un IMC medio de 27,75 con una
desviación estándar de 2,64. ¿Existe evidencia suficiente para afirmar que, en general, los jugadores de rugby tienen un IMC
más alto que los hombres que practican varios deportes? Dejara¼ :01.
7.3.2El propósito de un estudio realizado por Ingle y Eastell (A-10) fue examinar la densidad mineral ósea (DMO) y las
propiedades de ultrasonido de mujeres con fracturas de tobillo. Los investigadores reclutaron a 31 mujeres
posmenopáusicas con fracturas de tobillo y 31 mujeres posmenopáusicas sanas para que sirvieran como
controles. Una de las medidas de referencia fue el índice de rigidez del Aquiles lunar. El índice de rigidez
medio para el grupo con fractura de tobillo fue de 76,9 con una desviación estándar de 12,6. En el grupo
control, la media fue de 90,9 con una desviación estándar de 12,5. ¿Proporcionan estos datos evidencia
suficiente para permitirle concluir que, en general, el índice de rigidez medio es más alto en
246 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
mujeres posmenopáusicas sanas que en mujeres posmenopáusicas con fracturas de tobillo? Dejar a
¼ :05.
7.3.3Hoekema et al. (A-11) estudiaron la morfología craneofacial de 26 pacientes masculinos con síndrome de apnea
obstructiva del sueño (SAOS) y 37 sujetos masculinos sanos (sin SAOS). Una de las variables de interés fue la
longitud desde el punto más superoanterior del cuerpo del hueso hioides hasta la horizontal de Frankfort
(medida en milímetros).
¿Estos datos proporcionan evidencia suficiente para permitirnos concluir que las dos poblaciones
muestreadas difieren con respecto a la longitud desde el hueso hioides hasta la horizontal de Frankfort?
Dejar a¼ :01.
7.3.4¿Podemos concluir que los pacientes con hipertensión primaria (HP), en promedio, tienen niveles de colesterol total más
altos que los pacientes normotensos (NT)? Esta fue una de las investigaciones de interés para Rossi et al. (A-12). En la
siguiente tabla se encuentran las mediciones de colesterol total (mg/dl) para 133 pacientes con HP y 41 pacientes con
NT. ¿Podemos concluir que los pacientes con HP tienen, en promedio, niveles de colesterol total más altos que los
pacientes con NT? Dejara¼ :05.
7.3.5GarcS ~ao y Cabrita (A-13) querían evaluar la capacidad del farmacéutico comunitario para influir positivamente
en los resultados de la terapia con medicamentos antihipertensivos a través de un programa de atención
farmacéutica en Portugal. Ochenta y dos sujetos con hipertensión esencial fueron asignados aleatoriamente
a un grupo de intervención o de control. El grupo de intervención recibió un seguimiento mensual por parte
de un farmacéutico investigador para controlar la presión arterial, evaluar la adherencia al tratamiento,
prevenir, detectar y resolver problemas relacionados con los medicamentos y fomentar medidas no
farmacológicas para el control de la presión arterial. Los cambios después de 6 meses en la presión arterial
diastólica (pre post, mm Hg) se dan en la siguiente tabla para pacientes en cada uno de los dos grupos.
20 4 12 dieciséis 0 4 12 0
2 24 6 10 12 2 2 8
36 6 24 dieciséis 18 2 0 10
26 2 42 10 0 8 0 14
2 8 20 6 8 10 4 8
20 8 14 6 10 0 12 0
2 dieciséis 2 2 8 6 4 2
14 14 10 8 14 10 28 8
30 8 2 dieciséis 4 2 18 dieciséis
18 20 18 12 2 2 12 12
6 6
Fuente: Datos proporcionados por cortesía de Jose GarcS ~ao, MS, Pharm.D.
Sobre la base de estos datos, ¿qué debe concluir el investigador? Dejara¼ :05.
7.3.6Se administró una prueba diseñada para medir las actitudes de las madres hacia sus experiencias de trabajo de parto y parto a dos
grupos de nuevas madres. La muestra 1 (asistentes) había asistido a clases prenatales realizadas en el local
248 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
Departamento de salud. La muestra 2 (no asistentes) no asistió a las clases. Los tamaños de muestra y las medias y
desviaciones estándar de los puntajes de las pruebas fueron los siguientes:
Muestra norte -
X s
1 15 4.75 1.0
2 22 3.00 1.5
¿Estos datos proporcionan evidencia suficiente para indicar que los asistentes, en promedio, obtienen una puntuación más alta que los que
7.3.7Las determinaciones del nivel de cortisol se realizaron en dos muestras de mujeres durante el parto. Los sujetos del grupo 1 se
sometieron a una cesárea de emergencia después del parto inducido. Sujetas del grupo 2 que dieron a luz por cesárea o por
vía vaginal después de un trabajo de parto espontáneo. Los tamaños de muestra, los niveles medios de cortisol y las
desviaciones estándar fueron los siguientes:
Muestra norte -
X s
2 12 645 80
¿Estos datos proporcionan evidencia suficiente para indicar una diferencia en los niveles medios de cortisol en las
poblaciones representadas? Dejara¼ :05.
7.3.8Los niveles de protoporfirina se midieron en dos muestras de sujetos. La muestra 1 constaba de 50 alcohólicos varones
adultos con sideroblastos anulares en la médula ósea. La muestra 2 constaba de 40 varones adultos no alcohólicos
aparentemente sanos. Los niveles medios de protoporfirina y las desviaciones estándar para las dos muestras fueron
los siguientes:
Muestra -
X s
1 340 250
2 45 25
¿Se puede concluir sobre la base de estos datos que los niveles de protoporfirina son más altos en la
población alcohólica representada que en la población no alcohólica? Dejara¼ :01.
7.3.9Un investigador estaba interesado en saber si los bebés prematuros con acidosis metabólica tardía y los bebés
prematuros sin la afección difieren con respecto a los niveles de una determinada sustancia química en la orina.
Los niveles medios, las desviaciones estándar y los tamaños de muestra para las dos muestras estudiadas fueron los
siguientes:
Muestra norte -
X s
¿Qué debe concluir el investigador sobre la base de estos resultados? Dejara¼ :05.
7.4 COMPARACIONES POR PARES 249
7.3.10Los investigadores querían saber si podían concluir que dos poblaciones de bebés difieren con respecto
para significar la edad en la que caminaban solos. Se recogieron los siguientes datos (edades en meses):
7.3.11¿La privación sensorial tiene un efecto en la frecuencia de ondas alfa de una persona? Veinte voluntarios
los sujetos fueron divididos aleatoriamente en dos grupos. Los sujetos del grupo A fueron sometidos a un período de
privación sensorial de 10 días, mientras que los sujetos del grupo B sirvieron como controles. Al final del período
experimental, se midió el componente de frecuencia de ondas alfa de los electroencefalogramas de los sujetos. Los
resultados fueron los siguientes:
Grupo A: 10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4
Grupo B: 11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9
Dejara¼ :05.
7.3.12¿Podemos concluir que, en promedio, los linfocitos y las células tumorales difieren en tamaño? Los siguientes son
los diámetros de las celdasdmetrometroÞde 40 linfocitos y 50 células tumorales obtenidas de biopsias de tejido de
pacientes con melanoma:
linfocitos
Células Tumorales
12,6 14,6 16,2 23,9 23,3 17,1 20,0 21,0 19,1 19,4
16,7 15,9 15,8 16,0 17,9 13,4 19,1 16,6 18,9 18,7
20,0 17,8 13,9 22,1 13,9 18,3 22,8 13,0 17,9 15,2
17,7 15,1 16,9 16,4 22,8 19,4 19,6 18,4 18,2 20,7
16,3 17,7 18,1 24,3 11,2 19,5 18,6 16,4 16,1 21,5
Dejara¼ :05.
En nuestra discusión anterior sobre la diferencia entre las medias de dos poblaciones, se supuso que
las muestras eran independientes. Un método frecuentemente empleado para evaluar la efectividad
de un tratamiento o procedimiento experimental es aquel que hace uso de
250 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
observaciones resultantes de muestras no independientes. Una prueba de hipótesis basada en este tipo de
datos se conoce comocomparaciones pareadasprueba.
Razones para el emparejamientoCon frecuencia sucede que no existen verdaderas diferencias entre
dos poblaciones con respecto a la variable de interés, pero la presencia de fuentes extrañas de
variación puede provocar el rechazo de la hipótesis nula de no diferencia. Por otro lado, las
verdaderas diferencias también pueden estar enmascaradas por la presencia de factores extraños.
Supongamos, por ejemplo, que deseamos comparar dos protectores solares.
Hay al menos dos formas en las que se puede llevar a cabo el experimento. Un
método sería seleccionar una muestra aleatoria simple de sujetos para recibir
protector solar A y una muestra aleatoria simple e independiente de sujetos para
recibir protector solar B. Enviamos a los sujetos a la luz del sol durante un período de
tiempo específico, luego de lo cual mediremos la cantidad de daño de los rayos del
sol. Supongamos que empleamos este método, pero sin darnos cuenta, la mayoría
de los sujetos que reciben protector solar A tienen tez más oscura que es
naturalmente menos sensible a la luz solar. Digamos que después de completar el
experimento encontramos que los sujetos que recibieron protector solar A sufrieron
menos daño solar.
Una mejor manera de diseñar el experimento sería seleccionar solo una muestra aleatoria simple de
sujetos y dejar que cada miembro de la muestra reciba ambos protectores solares. Podríamos, por ejemplo,
asignar aleatoriamente los protectores solares al lado izquierdo o derecho de la espalda de cada sujeto y
cada sujeto recibiría ambos protectores solares. Después de un período específico de exposición al sol,
mediríamos la cantidad de daño solar en cada mitad de la espalda. Si la mitad de la espalda que recibe el
protector solar A tendiera a estar menos dañada, podríamos atribuir con mayor confianza el resultado al
protector solar, ya que en cada caso ambos protectores solares se aplicaron a la piel igualmente pigmentada.
d-metrod0
t¼ (7.4.1)
sd-
7.4 COMPARACIONES POR PARES 251
EJEMPLO 7.4.1
John M. Morton et al. (A-14) examinó la función de la vesícula biliar antes y después de la
fundoplicatura, una cirugía que se usa para evitar que el contenido del estómago regrese al esófago
(reflujo), en pacientes con enfermedad por reflujo gastroesofágico. Los autores midieron la
funcionalidad de la vesícula biliar calculando la fracción de eyección de la vesícula biliar (GBEF) antes y
después de la fundoplicatura. El objetivo de la fundoplicatura es aumentar el GBEF, que se mide como
un porcentaje. Los datos se muestran en la Tabla 7.4.1. Deseamos saber si estos datos proporcionan
evidencia suficiente para permitirnos concluir que la fundoplicatura aumenta el funcionamiento de
GBEF.
Solución: Diremos que se proporciona evidencia suficiente para que concluyamos que la
fundoplicatura es efectiva si podemos rechazar la hipótesis nula de que la media
poblacional cambiametrodes diferente de cero en la dirección apropiada. Podemos
llegar a una conclusión por medio del procedimiento de prueba de hipótesis de diez
pasos.
41,5, 28,2, 37:0, 28,6, 7,0, 30:4, 8,0, 18,8, 22,0, 36,2, 88,0, 6,0
H0:metrod-0
HA:metrod>0
Si hubiéramos obtenido las diferencias restando los porcentajes postoperatorios de los pesos
preoperatoriosdpostoperatorio preoperatorioÞ,nuestras hipótesis habrían sido
H0:metrod-0
HA:metrod<0
Si la pregunta hubiera sido tal que se hubiera indicado una prueba de dos caras,
las hipótesis habrían sido
H0:metrod¼0
HA:metrod6¼0
4. Estadística de prueba.El estadístico de prueba apropiado viene dado por la Ecuación 7.4.1.
a= .05
0 1.7959 t
PAG
di
þ d28:2Þ þ ð 37:0Þ þ d41:5 Þ
þ ð6:0Þ 216:9
d-¼ ¼ ¼ ¼18:075
norte 12 12
PAG PAG PAG
ddi d-Þ2 di2 d di2Þ 12d15669:49Þ d216:9Þ2
norte
sd2 ¼ ¼ ¼ ¼1068:0930
1 1Þ
norte d12Þð11Þ nortednorte
18:075 0 18:075
¼1:9159
t¼uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff¼
1068:0930=12 9:4344
Pareado T para C2 - C1
FIGURA 7.4.2Procedimiento MINITAB y salida para prueba de comparaciones pareadas, Ejemplo 7.4.1
(datos en la Tabla 7.4.1).
254 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
Un intervalo de confianza parametrod Un intervalo de confianza del 95 por ciento parametrodtal vez
obtenido de la siguiente manera:
18:075 20:765
d2:690; 38:840Þ
d- metro
z¼ pffidfiffi (7.4.2)
sd= norte
Alternativassi ningunoznites un estadístico de prueba apropiado para usar con los datos disponibles, es
posible que desee considerar el uso de alguna técnica no paramétrica para probar una hipótesis sobre una
diferencia de medianas. La prueba del signo, discutida en el Capítulo 13, es candidata para su uso en tales
casos.
EJERCICIOS
En los siguientes ejercicios, lleve a cabo el procedimiento de prueba de hipótesis de diez pasos en el nivel de
significación especificado. Para cada ejercicio, según corresponda, explique por qué eligió una prueba unilateral o
una prueba bilateral. Discuta cómo cree que los investigadores o los médicos podrían usar los resultados de su
prueba de hipótesis. ¿Qué decisiones o acciones clínicas o de investigación cree que serían apropiadas a la luz de los
resultados de su prueba?
EJERCICIOS 255
7.4.1Ellen Davis Jones (A-15) estudió los efectos de la terapia de reminiscencia para mujeres mayores con depresión.
Estudió a 15 mujeres de 60 años o más que residían durante 3 meses o más en un centro de atención a largo
plazo de vida asistida. Para este estudio, la depresión se midió con el Geriatric Depression
Escala (GDS). Las puntuaciones más altas indican síntomas de depresión más graves. Los participantes recibieron terapia de
reminiscencia para el cuidado a largo plazo, que utiliza fotografías familiares, álbumes de recortes y recuerdos personales para
estimular la memoria y la conversación entre los miembros del grupo. Las puntuaciones de depresión previas al tratamiento y
posteriores al tratamiento se dan en la siguiente tabla. ¿Podemos concluir, con base en estos datos, que los sujetos que
participan en la terapia de reminiscencia experimentan, en promedio, una disminución en las puntuaciones de depresión de
GDS? Dejara¼ :01.
7.4.2Beney et al. (A-16) evaluaron el efecto del seguimiento telefónico en la dimensión bienestar físico de la calidad de vida
relacionada con la salud en pacientes con cáncer. Una de las principales variables de resultado se midió mediante la
subescala de bienestar físico de la Escala General de Evaluación Funcional de la Terapia del Cáncer (FACT-G). Una
puntuación más alta indica un mayor bienestar físico. La siguiente tabla muestra la puntuación FACT-G inicial y la
puntuación de seguimiento para evaluar el bienestar físico durante los 7 días posteriores al alta del hospital a
domicilio para 66 pacientes que recibieron una llamada telefónica entre 48 y 72 horas después del alta que les dio a
los pacientes la oportunidad de discutir medicamentos, problemas y consejos.
¿Existe evidencia suficiente para indicar que la calidad del bienestar físico disminuye significativamente en la primera
semana del alta entre los pacientes que reciben una llamada telefónica? Dejara¼ :05.
1 dieciséis 19 34 25 14
2 26 19 35 21 17
3 13 9 36 14 22
4 20 23 37 23 22
5 22 25 38 19 dieciséis
6 21 20 39 19 15
7 20 10 40 18 23
8 15 20 41 20 21
9 25 22 42 18 11
10 20 18 43 22 22
11 11 6 44 7 17
12 22 21 45 23 9
13 18 17 46 19 dieciséis
14 21 13 47 17 dieciséis
15 25 25 48 22 20
dieciséis 17 21 49 19 23
17 26 22 50 5 17
18 18 22 51 22 17
19 7 9 52 12 6
20 25 24 53 19 19
21 22 15 54 17 20
22 15 9 55 7 6
(Continuación)
256 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
23 19 7 56 27 10
24 23 20 57 22 dieciséis
25 19 19 58 dieciséis 14
26 21 24 59 26 24
27 24 23 60 17 19
28 21 15 61 23 22
29 28 27 62 23 23
30 18 26 63 13 3
31 25 26 64 24 22
32 25 26 sesenta y cinco 17 21
33 28 28 66 22 21
Fuente: Datos proporcionados por cortesía de Johnny Beney, Ph.D. y E. Beth Devine, Pharm.D.,
MBA et al.
7.4.3El propósito de una investigación de Morley et al. (A-17) fue evaluar la eficacia analgésica de una dosis diaria de
metadona oral en pacientes con síndromes de dolor neuropático crónico. Los investigadores utilizaron una
escala analógica visual (0-100 mm, un número más alto indica un dolor más alto) para clasificar la intensidad
máxima del dolor a lo largo del día. Cada sujeto tomó 20 mg de metadona o un placebo cada día durante 5
días. Los sujetos no sabían qué tratamiento estaban tomando. La siguiente tabla proporciona las
puntuaciones medias de la intensidad máxima del dolor durante los 5 días con metadona y los 5 días con
placebo. ¿Estos datos brindan suficiente evidencia, al nivel de significancia de .05, para indicar que, en
general, la intensidad máxima del dolor es menor en los días en que se toma metadona?
1 29.8 57.2
2 73.0 69.8
3 98.6 98.2
4 58.8 62.4
5 60.6 67.2
6 57.2 70.6
7 57.2 67.8
8 89.2 95.6 Fuente: John S. Morley, John Bridson, Tim P. Nash, John B. Miles,
9 97.0 98.4 Sarah White y Matthew K. Makin, “La dosis baja de metadona
10 49.8 63.2 tiene un efecto analgésico en el dolor neuropático: un ensayo
cruzado controlado aleatorio doble ciego ,” Medicina paliativa, 17
11 37.0 63.6
(2003), 576–587.
7.4.4Woo y McKenna (A-18) investigaron el efecto de la terapia ultravioleta B (UVB) de banda ancha y la crema
tópica de calcipotriol usadas juntas en áreas de psoriasis. Una de las variables de resultado es el
Psoriasis Area and Severity Index (PASI). La siguiente tabla proporciona los puntajes PASI para 20
sujetos medidos al inicio y después de ocho tratamientos. ¿Proporcionan estos datos evidencia
suficiente, al nivel de significancia de .01, para indicar que la terapia de combinación reduce
puntajes PASI?
7.5 PRUEBA DE HIPÓTESIS: UNA PROPORCIÓN ÚNICA DE LA POBLACIÓN 257
después de las 8
1 5.9 5.2
2 7.6 12.2
3 12.8 4.6
4 16.5 4.0
5 6.1 0.4
6 14.4 3.8
7 6.6 1.2
8 5.4 3.1
9 9.6 3.5
10 11.6 4.9
11 11.1 11.1
12 15.6 8.4
13 6.9 5.8
14 15.2 5.0
15 21.0 6.4
dieciséis 5.9 0.0
17 10.0 2.7
18 12.2 5.1
19 20.2 4.8
20 6.2 4.2 Fuente: Datos proporcionados por cortesía de WK Woo, MD
7.4.5Uno de los propósitos de una investigación de Porcellini et al. (A-19) fue investigar el efecto sobre el recuento de
células T CD4 de la administración intermitente de interleucina (IL-2) además de la terapia antirretroviral de
gran actividad (HAART). La siguiente tabla muestra el recuento de células T CD4 al inicio y luego nuevamente
después de 12 meses de terapia HAART con IL-2. ¿Muestran los datos, al nivel de 0,05, un cambio significativo
en el recuento de células T CD4?
Sujeto 1 2 3 4 5 6 7
Recuento de células T CD4 al ingresod 106=LÞ 173 58 103 181 105 301 169
Recuento de células T CD4 al final del seguimiento 257 108 315 362 141 549 369
d106=LÞ
Fuente: Simona Procellini, Giuliana Vallanti, Silvia Nozza, Guido Poli, Adraino Lazzarin, Guiseppe Tabussi y Antonio
Grassia, "Potencial timopoyético mejorado en individuos infectados por el VIH con TARGA mediante administración
intermitente de IL-2"SIDA, 17 (2003), 1621–1630.
La prueba de hipótesis sobre proporciones poblacionales se lleva a cabo de la misma manera que para las
medias cuando se cumplen las condiciones necesarias para usar la curva normal. Se pueden hacer pruebas
unilaterales o bilaterales, dependiendo de la pregunta que se haga. Cuando una muestra
258 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
suficientemente grande para la aplicación del teorema del límite central, como se analiza en la sección 5.5, está
disponible para el análisis, el estadístico de prueba es
pag
z¼rffiffiffiffiffiffiffiffi0fiffi (7.5.1)
pag0q0
norte
EJEMPLO 7.5.1
Wagenknecht et al. (A-20) recopiló datos sobre una muestra de 301 mujeres hispanas que vivían en
San Antonio, Texas. Una variable de interés fue el porcentaje de sujetos con alteración de la glucosa
en ayunas (GAI). IFG se refiere a una etapa metabólica intermedia entre la homeostasis normal de la
glucosa y la diabetes. En el estudio, 24 mujeres fueron clasificadas en la etapa IFG. El artículo cita
estimaciones de población para IFG entre mujeres hispanas en Texas como 6.3 por ciento. ¿Existe
evidencia suficiente para indicar que la población de mujeres hispanas en San Antonio tiene una
prevalencia de IFG superior al 6.3 por ciento?
Solución:
:080 :063
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼1:21
d:063Þð:937Þ
301
Las pruebas que involucran una sola proporción se pueden llevar a cabo usando una variedad
de programas de computadora. Los resultados de MINITAB y NCSS, utilizando los datos del Ejemplo
7.5.1, se muestran en la Figura 7.5.1. Cabe señalar que los resultados variarán ligeramente, debido a
errores de redondeo, si los cálculos se realizan a mano. También debe tenerse en cuenta que algunos
programas, como NCSS, utilizan una corrección de continuidad para calcular laz-valor, y por lo tanto
los valores estadísticos de prueba y correspondientepaglos valores difieren ligeramente de la salida
de MINITAB.
Salida de MINITAB
95% inferior
Muestra X norte Muestra p Atado Valor Z Valor P
1 24 301 0.079734 0.054053 1.19 0.116
Salida NCSS
FIGURA 7.5.1Salida de MINITAB y NCSS parcial para los datos del ejemplo 7.5.1.
260 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
EJERCICIOS
Para cada uno de los siguientes ejercicios, lleve a cabo el procedimiento de prueba de hipótesis de diez pasos en el
nivel de significación designado. Para cada ejercicio, según corresponda, explique por qué eligió una prueba
unilateral o bilateral. Discuta cómo cree que los investigadores o los médicos podrían usar los resultados de su
prueba de hipótesis. ¿Qué decisiones o acciones clínicas o de investigación cree que serían apropiadas a la luz de los
resultados de su prueba?
7.5.1Jacquemyn et al. (A-21) realizó una encuesta entre ginecólogos-obstetras de la región de Flandes y
obtuvo 295 respuestas. De los que respondieron, 90 indicaron que habían realizado al menos
una cesárea a pedido cada año. ¿Proporciona este estudio suficiente evidencia para que
concluyamos que menos del 35 por ciento de los ginecólogos-obstetras en la región de Flandes
realizan al menos una cesárea a pedido cada año? Dejara¼ :05.
7.5.2En un artículo de la revistaSalud y Lugar,Hui y Bell (A-22) encontraron que entre 2428 niños de 7 a 12 años, 461
tenían sobrepeso u obesidad. Sobre la base de este estudio, ¿podemos concluir que más del 15 por ciento de
los niños de 7 a 12 años en la población muestreada son obesos o tienen sobrepeso? Dejar a¼ :05.
7.5.3Becker et al. (A-23) realizó un estudio con una muestra de 50 mujeres de etnia fijiana. Las mujeres completaron
un cuestionario de autoinforme sobre la dieta y las actitudes hacia la forma y el cambio del cuerpo.
Los investigadores encontraron que cinco de los encuestados reportaron al menos episodios semanales de
atracones durante los 6 meses anteriores. ¿Es esta evidencia suficiente para concluir que menos del 20 por
ciento de la población de mujeres fiyianas se involucra al menos en episodios semanales de atracones? Dejar
a¼ :05.
7.5.4El siguiente cuestionario fue completado por una muestra aleatoria simple de 250 ginecólogos. El número que
marca cada respuesta se muestra en la casilla correspondiente.
1.Cuando tiene la opción, ¿qué procedimiento prefiere para obtener muestras de endometrio?
(a)Dilatación y curetaje 175
(b)Aspiración Vobra 75
2.¿Ha visto a una o más mujeres embarazadas durante el último año que sabía que tenían niveles elevados
de plomo en la sangre?
(a)Sí 25
(b)No 225
3.¿Informa rutinariamente a sus pacientes embarazadas que fuman sobre los posibles peligros del
tabaquismo para el feto?
(a)Sí 238
(b)No 12
¿Podemos concluir a partir de estos datos que en la población muestreada más del 60 por ciento prefiere la dilatación
y el legrado para obtener muestras de endometrio? Dejara¼ :01.
7.5.5Consulte el Ejercicio 7.5.4. ¿Podemos concluir a partir de estos datos que en la población muestreada menos del 15 por
ciento ha visto (durante el último año) una o más mujeres embarazadas con niveles elevados de plomo en la sangre?
Dejara¼ :05.
7.5.6Consulte el Ejercicio 7.5.4. ¿Podemos concluir a partir de estos datos que más del 90 por ciento conocen
sus pacientes embarazadas que fuman con los peligros sospechosos de fumar para el feto? Dejar a¼ :
05.
7.6 PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS PROPORCIONES DE POBLACIÓN 261
La prueba más frecuente empleada en relación con la diferencia entre dos proporciones de
población es que su diferencia sea cero. Sin embargo, es posible probar que la diferencia es
igual a algún otro valor. Se pueden realizar pruebas tanto unilaterales como bilaterales.
X1þX2;
¼
- pag y - q¼1 - pag
norte1þnorte2
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
EJEMPLO 7.6.1
El síndrome de Noonan es una condición genética que puede afectar el corazón, el crecimiento, la
coagulación de la sangre y el desarrollo mental y físico. Noonan et al. (A-24) examinó la estatura de hombres
y mujeres con síndrome de Noonan. El estudio contenía 29 adultos masculinos y 44 femeninos. Uno de los
valores de corte utilizados para evaluar la estatura fue el tercer percentil de la talla adulta. Once de los
hombres cayeron por debajo del percentil 3 de la estatura masculina adulta, mientras que 24 de las mujeres
cayeron por debajo del percentil 3 de la estatura adulta femenina. ¿Proporciona este estudio pruebas
suficientes para concluir que, entre los sujetos con síndrome de Noonan, las mujeres tienen más
probabilidades que los hombres de caer por debajo del respectivo tercer percentil de estatura adulta? Dejar a
¼ :05.
262 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
Solución:
d:545 :379Þ
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼1:39
d:479Þð:521Þ d:479Þð:521Þ
þ
44 29
Las pruebas que involucran dos proporciones, utilizando los datos del ejemplo 7.6.1, se pueden
realizar con una variedad de programas de computadora. Los resultados de MINITAB y NCSS se muestran en
la Figura 7.6.1. Una vez más, cabe señalar que, debido a los errores de redondeo, los resultados variarán
ligeramente si los cálculos se realizan a mano.
EJERCICIOS 263
Salida de MINITAB
Salida NCSS
FIGURA 7.6.1Salida de MINITAB y NCSS parcial para los datos del ejemplo 7.6.1.
EJERCICIOS
En cada uno de los siguientes ejercicios utilice el procedimiento de prueba de hipótesis de diez pasos. Para
cada ejercicio, según corresponda, explique por qué eligió una prueba unilateral o bilateral. Discuta cómo
cree que los investigadores o los médicos podrían usar los resultados de su prueba de hipótesis. ¿Qué
decisiones o acciones clínicas o de investigación cree que serían apropiadas a la luz de los resultados de su
prueba?
7.6.1Ho et al. (A-25) utilizó entrevistas telefónicas de encuestados seleccionados al azar en Hong Kong para obtener
información sobre las percepciones de los individuos sobre la salud y el historial de tabaquismo. Entre 1222
fumadores masculinos actuales, 72 informaron que tenían una salud "mala" o "muy mala", mientras que 30 de los
282 ex fumadores informaron que tenían una salud "mala" o "muy mala". ¿Es esta evidencia suficiente para permitir
concluir que entre los hombres de Hong Kong existe una diferencia entre los fumadores actuales y los exfumadores
con respecto a la proporción que se percibe a sí misma como de salud “mala” y “muy mala”? Dejara¼ :01.
7.6.2Landolt et al. (A-26) examinó las tasas de trastorno de estrés postraumático (TEPT) en madres y padres. Los
padres fueron entrevistados 5 a 6 semanas después de un accidente o un nuevo diagnóstico de cáncer o
diabetes mellitus tipo I para su hijo. Veintiocho de los 175 padres entrevistados y 43 de las 180 madres
264 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
entrevistados cumplieron con los criterios para el TEPT actual. ¿Existe evidencia suficiente para que podamos concluir que los
padres tienen menos probabilidades de desarrollar TEPT que las madres cuando un niño está traumatizado por un accidente,
un diagnóstico de cáncer o un diagnóstico de diabetes? Dejara¼ :05.
7.6.3en unriñón internacionalartículo, Avram et al. (A-27) informaron sobre un estudio en el que participaron 529 pacientes de
hemodiálisis y 326 pacientes de diálisis peritoneal. Encontraron que al inicio 249 sujetos en el grupo de tratamiento
de hemodiálisis eran diabéticos, mientras que al inicio 134 de los sujetos en el grupo de diálisis peritoneal eran
diabéticos. ¿Existe una diferencia significativa en la prevalencia de la diabetes al inicio del estudio entre los dos
grupos de este estudio? Dejara¼ :05. ¿Qué implica su hallazgo con respecto a la significancia de la muestra acerca de
las poblaciones de sujetos?
7.6.4En un estudio de obesidad se obtuvieron los siguientes resultados de muestras de hombres y mujeres entre las edades
de 20 y 75 años:
machos 150 21
Hembras 200 48
¿Podemos concluir a partir de estos datos que en las poblaciones muestreadas hay una diferencia en las
proporciones que tienen sobrepeso? Dejara¼ :05.
En la Sección 6.9 examinamos cómo es posible construir un intervalo de confianza para la varianza de
una población normalmente distribuida. Los principios generales presentados en esa sección pueden
emplearse para probar una hipótesis sobre la varianza de una población. Cuando los datos
disponibles para el análisis consisten en una muestra aleatoria simple extraída de una población
normalmente distribuida, el estadístico de prueba para probar hipótesis sobre la varianza de una
población es
EJEMPLO 7.7.1
El propósito de un estudio de Wilkins et al. (A-28) fue para medir la eficacia de la hormona de crecimiento
humana recombinante (rhGH) en niños con quemaduras en el área total de la superficie corporal
> 40 por ciento En este estudio, 16 sujetos recibieron inyecciones diarias en casa de rhGH. Al inicio del
estudio, los investigadores querían conocer los niveles actuales del factor de crecimiento similar a la insulina
(IGF-I) antes de la administración de rhGH. La varianza muestral de los niveles de IGF-I (en ng/ml) fue de
670,81. Deseamos saber si podemos concluir a partir de estos datos que la varianza de la población no es
600.
7.7 PRUEBA DE HIPÓTESIS: UNA VARIACIÓN ÚNICA DE LA POBLACIÓN 265
Solución:
15d670:81Þ
X2¼ ¼16:77
600
. 025
. 025
0 6.262 27.488
X2
15
haga esto con una distribución de muestreo asimétrica como la distribución chi-
cuadrado. En esta situación, el unilateralpagEl valor se informa junto con la
dirección de la desviación observada de la hipótesis nula. De hecho, este
procedimiento puede seguirse en el caso de distribuciones muestrales
simétricas. El precedente, sin embargo, parece favorecer la duplicación de la
unilateral pagvalor cuando la prueba es bilateral e involucra una distribución de
muestreo simétrica.
Para el presente ejemplo, entonces, podemos reportar elpagvalor de la
siguiente manera: pag > :05 (prueba bilateral). Los datos de la muestra sugieren
una varianza de la población superior a 600, pero la prueba no respalda
firmemente esta hipótesis.
Si el problema se plantea en términos de la desviación estándar de la población, se puede
elevar al cuadrado la desviación estándar de la muestra y realizar la prueba como se indicó
anteriormente. &
Pruebas unilateralesAunque este fue un ejemplo de una prueba de dos caras, las pruebas de una cara
también se pueden hacer mediante la modificación lógica del procedimiento dado aquí.
Las pruebas que involucran una sola varianza de población se pueden realizar utilizando el software MINITAB.
La mayoría de los demás programas informáticos estadísticos carecen de procedimientos para realizar estas pruebas
directamente. El resultado de MINITAB, utilizando los datos del Ejemplo 7.7.1, se muestra en la Figura 7.7.2.
Estadísticas
IC para IC para
Método Desvst Diferencia
Estándar (19.1, 40.1) (366, 1607)
Pruebas
EJERCICIOS
En cada uno de los siguientes ejercicios, lleve a cabo el procedimiento de prueba de diez pasos. Para cada ejercicio,
según corresponda, explique por qué eligió una prueba unilateral o bilateral. Discuta cómo cree que los
investigadores o los médicos podrían usar los resultados de su prueba de hipótesis. ¿Qué decisiones o acciones
clínicas o de investigación cree que serían apropiadas a la luz de los resultados de su prueba?
7.7.1Recuerde el Ejemplo 7.2.3, donde Nakamura et al. (A-1) sujetos estudiados con colateral medial aguda
Lesión del ligamento (MCL) con desgarro del ligamento cruzado anterior (LCA). Las edades de los 17 sujetos fueron:
31; 26; 21; 15; 26; dieciséis; 19; 21; 28; 27; 22; 20; 25; 31; 20; 25; 15
Use estos datos para determinar si hay evidencia suficiente para concluir que en una población de
sujetos similares, la varianza de las edades de los sujetos no es de 20 años. Dejara¼ :01.
7.7.2Robinson et al. (A-29) estudió a nueve sujetos que se sometieron a un procedimiento de deflector para la transposición de
las grandes arterias (TGA). Al inicio del estudio, la resistencia vascular sistémica (RVS) (medida en WU m2) los valores
en reposo arrojaron una desviación estándar de 28. ¿Podemos concluir a partir de estos datos que la varianza de la
RVS de una población de sujetos similares con TGA no es 700? Dejara¼ :10
7.7.3Se registraron los valores de capacidad vital para una muestra de 10 pacientes con obstrucción crónica grave de las vías
respiratorias. La varianza de las 10 observaciones fue .75. Pruebe la hipótesis nula de que la varianza de la población
es 1.00. Dejara¼ :05.
7.7.4Se registraron los valores de hemoglobina (g por ciento) para una muestra de 20 niños que formaban parte de un estudio
de leucemia aguda. La varianza de las observaciones fue de 5. ¿Estos datos proporcionan evidencia suficiente para
indicar que la varianza de la población es mayor que 4? Dejara¼ :05.
7.7.5Una muestra de 25 administradores de grandes hospitales participó en un estudio para investigar la naturaleza y el
alcance de la frustración y la tensión emocional asociada con el trabajo. Cada participante recibió una prueba
diseñada para medir el grado de tensión emocional que experimentó como resultado de los deberes y
responsabilidades asociados con el trabajo. La varianza de las puntuaciones fue de 30. ¿Se puede concluir a partir de
estos datos que la varianza de la población es mayor que 25? Dejara¼ :05.
7.7.6En un estudio en el que los sujetos eran 15 pacientes que sufrían enfermedad sarcoide pulmonar, se realizaron
determinaciones de gases en sangre. La varianza del Pao2(mm Hg) fue de 450. Pruebe la hipótesis nula de
que la varianza de la población es mayor que 250. Seaa¼ :05.
7.7.7El análisis del líquido amniótico de una muestra aleatoria simple de 15 mujeres embarazadas arrojó las
siguientes medidas de proteína total (gramos por 100 ml) presente:
¿Estos datos proporcionan suficiente evidencia para indicar que la varianza de la población es mayor que .05?
Dejara¼ :05. ¿Qué suposiciones son necesarias?
las varianzas respectivas son las varianzas calculadas a partir de muestras tomadas de las
poblaciones. Nos gustaría saber si la diferencia que, indudablemente, existirá entre las
varianzas muestrales es indicativa de una diferencia real en las varianzas poblacionales, o si la
diferencia es de tal magnitud que podría haberse producido por pura casualidad cuando la las
varianzas de la población son iguales.
Dos métodos de análisis químico pueden dar los mismos resultados en promedio. Puede ser,
sin embargo, que los resultados producidos por un método sean más variables que los resultados del
otro. Nos gustaría algún método para determinar si es probable que esto sea cierto.
Prueba de relación de varianzaLas decisiones sobre la comparabilidad de las varianzas de dos poblaciones
generalmente se basanen la prueba de la razón de varianza,que es una prueba de la hipótesis nula de que
dos varianzas poblacionales son iguales. Cuando probamos la hipótesis de que las varianzas de dos
poblaciones son iguales, estamos, en efecto, probando la hipótesis de que su razón es igual a 1.
Aprendimos en el capítulo anterior que, cuando se cumplen ciertos supuestos, el
cantidads21= s21=s2 2= s22se distribuye comoFconnorte1 1 numerador grados de libertad y
norte2 1 denominador grados de libertad. Si estamos hipotetizando ques2 1¼s2 2, asumimos
que la hipótesis es verdadera, y las dos varianzas se anulan en la expresión anterior dejando
s12= s22, que sigue el mismoFdistribución. El radios2 1= s22será designado VR para
relación de varianza.
Para una prueba bilateral, seguimos la convención de colocar la varianza muestral más grande
en el numerador y obtener el valor crítico deFparaun =2 y los grados de libertad apropiados. Sin
embargo, para una prueba unilateral, cuál de las dos varianzas de la muestra debe colocarse en el
numerador está predeterminado por el enunciado de la hipótesis nula. por ejemplo, para
la hipótesis nula de ques2 1= s22, el estadístico de prueba apropiado es V:R:¼s2 1= s22. El critico
valor deFse obtiene pora (noun =2) y los grados de libertad apropiados. en me gusta
manera, si la hipótesis nula es ques2 1-s2 2, el estadístico de prueba apropiado es V:R:¼s2 2= s21.
En todos los casos, la regla de decisión es rechazar la hipótesis nula si la VR calculada es
igual o mayor que el valor crítico deF.
EJEMPLO 7.8.1
Borden et al. (A-30) compararon técnicas de reparación de meniscos utilizando muestras de rodilla de
cadáver. Una de las variables de interés fue la carga al fracaso (en newtons) para las rodillas fijadas
con la técnica FasT-FIX (grupo 1) y el método de sutura vertical (grupo 2). Cada técnica se aplicó a seis
especímenes. La desviación estándar para el método FasT-FIX fue de 30,62 y la desviación estándar
para el método de sutura vertical fue de 11,37. ¿Podemos concluir que, en general, la varianza de la
carga en la falla es mayor para la técnica FasT-FIX que para el método de sutura vertical?
Solución:
. 05
0 5.05 F(5, 5)
3. Hipótesis.
H0:s2 1-s2 2
HA:s2 1>s2 2
4. Estadística de prueba.
s2
V: R:¼1 (7.8.1)
s22
d30:62Þ2
V: R:¼ ¼7:25
d11:37Þ2
&
Se pueden usar varios programas de computadora para probar la igualdad de dos varianzas. Los
resultados de estos programas diferirán según la prueba que se utilice. Vimos en la Figura 7.3.3,
270 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
por ejemplo, que el sistema SAS utiliza un procedimiento de prueba F plegado. MINITAB utiliza dos pruebas
diferentes. La primera es una prueba F bajo el supuesto de normalidad, y la otra es una prueba de Levene
modificada (1) que se utiliza cuando no se puede asumir la normalidad. SPSS utiliza una prueba de Levene sin
modificar (2). Independientemente de las opciones, estas pruebas generalmente se consideran superiores a
la prueba de razón de varianza que se presenta en el Ejemplo 7.8.1. La discusión de las matemáticas detrás
de estas pruebas está más allá del alcance de este libro, pero se da un ejemplo para ilustrar estos
procedimientos, ya que los resultados de estas pruebas a menudo se proporcionan automáticamente como
salidas cuando se usa un programa de computadora para llevar a cabo una prueba.t-prueba.
EJEMPLO 7.8.2
Usando los datos del ejemplo 7.3.2, estamos interesados en probar si la suposición de la igualdad de
varianzas se puede asumir antes de realizar unat-prueba. Para facilitar la discusión, los datos se
reproducen a continuación (Tabla 7.8.1):
TABLA 7.8.1 Presiones (mm Hg) debajo de la pelvis durante condiciones estáticas para el ejemplo
7.3.2
Control 131 115 124 131 122 117 88 114 150 169
LME 60 150 130 180 163 130 121 119 130 148
Los resultados parciales de MINITAB, SAS y SPSS se muestran en la figura 7.8.2. Independientemente de la
prueba o el programa que se utilice, no podemos rechazar la hipótesis nula de igualdad de varianzas.
H0:s2 1¼s2 2porque todopagvalores > 0:05. Ahora podemos proceder con unt-prueba bajo el
suposición de varianzas iguales. &
Salida SAS
Igualdad de Varianzas
FIGURA 7.8.2Salidas parciales de MINITAB, SPSS y SAS para probar la igualdad de dos varianzas
de población.
EJERCICIOS 271
EJERCICIOS
En los siguientes ejercicios realice la prueba de los diez pasos. Para cada ejercicio, según corresponda, explique por
qué eligió una prueba unilateral o bilateral. Discuta cómo cree que los investigadores o los médicos podrían usar los
resultados de su prueba de hipótesis. ¿Qué decisiones o acciones clínicas o de investigación cree que serían
apropiadas a la luz de los resultados de su prueba?
7.8.1Dora et al. (A-31) investigó las dimensiones del canal espinal en 30 sujetos sintomáticos con hernia de disco
seleccionados para una discectomía y 45 individuos asintomáticos. Los investigadores querían saber si las
dimensiones del canal espinal son un factor de riesgo significativo para el desarrollo de la ciática. Con ese fin,
midieron la dimensión del canal espinal entre las vértebras L3 y L4 y obtuvieron una media de 17,8 mm en el
grupo de discectomía con una desviación estándar de 3,1. En el grupo control, la media fue de 18,5 mm con
una desviación estándar de 2,8 mm. ¿Existe evidencia suficiente para indicar que en poblaciones relevantes la
varianza para sujetos sintomáticos con hernia de disco es mayor que la varianza para sujetos de control?
Dejara¼ :05.
7.8.2Nagy et al. (A-32) estudiaron a 50 pacientes estables que ingresaron por herida de bala que atravesaba el
mediastino. De estos, se consideró que ocho tenían una lesión mediastínica y 42 no. La desviación estándar
de las edades de los ocho sujetos con lesión mediastínica fue de 4,7 años y la desviación estándar de las
edades de los 42 sin lesión fue de 11,6 años. ¿Podemos concluir a partir de estos datos que la varianza de la
edad es mayor para una población de sujetos similares sin lesión en comparación con una población con
lesión mediastínica? Dejara¼ :05.
7.8.3Se administró una prueba diseñada para medir el nivel de ansiedad a una muestra de pacientes masculinos y femeninos
justo antes de someterse al mismo procedimiento quirúrgico. Los tamaños de muestra y las varianzas calculadas a
partir de las puntuaciones fueron los siguientes:
Hombres: norte¼dieciséis;s2¼
¿Proporcionan estos datos evidencia suficiente para indicar que en las poblaciones representadas las
puntuaciones de las mujeres son más variables que las de los hombres? Dejara¼ :05.
7.8.4En un experimento para evaluar los efectos de la exposición al humo del cigarrillo en ratas, 11 animales
estuvieron expuestos y 11 animales de control no estuvieron expuestos al humo de los cigarrillos sin
filtro. Al final del experimento, se realizaron mediciones de la frecuencia del latido ciliar (latidos/min a
20 C) en cada animal. La varianza para el grupo expuesto fue de 3400 y 1200 para el grupo no
expuesto. ¿Estos datos indican que en las poblaciones representadas las varianzas son diferentes?
Dejara¼ :05.
7.8.5Se comparó la eficacia de dos fármacos analgésicos sobre la base del tiempo transcurrido entre la
administración del fármaco y el cese del dolor. Trece pacientes recibieron el fármaco 1 y 13
recibió el fármaco 2. Las varianzas de la muestra fuerons2 1¼64 ys2 2¼16. Pruebe la hipótesis nula de que los dos
las varianzas de las poblaciones son iguales. Dejara¼ :05.
7.8.6Se realizaron determinaciones del volumen de células empaquetadas en dos grupos de niños con cardiopatía congénita
cianótica. Los tamaños de muestra y las varianzas fueron los siguientes:
Grupo norte s2
1 10 40
2 dieciséis 84
272 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
¿Estos datos proporcionan evidencia suficiente para indicar que la varianza de la población 2 es mayor que la
varianza de la población 1? Dejara¼ :05.
7.8.7Muestras aleatorias simples independientes de dos cepas de ratones utilizadas en un experimento produjeron las
siguientes mediciones de los niveles de glucosa en plasma después de una experiencia traumática:
Cepa A: 54; 99; 105; 46; 70; 87; 55; 58; 139; 91
Cepa B: 93; 91; 93; 150; 80; 104; 128; 83; 88; 95; 94; 97
¿Estos datos proporcionan evidencia suficiente para indicar que la varianza es mayor en la población de ratones de la
cepa A que en la población de ratones de la cepa B? Dejara¼ :05. ¿Qué suposiciones son necesarias?
EJEMPLO 7.9.1
Supongamos que tenemos una variable cuyos valores arrojan una desviación estándar de la población de 3,6.
De la población seleccionamos una muestra aleatoria simple de tamañonorte¼100. Seleccionamos un valor
dea¼ :05 para las siguientes hipótesis:
H0:metro¼17:5;HA:metro6¼17:5
7.9 EL ERROR TIPO II Y LA POTENCIA DE UNA PRUEBA 273
Solución: Cuando estudiamos la potencia de una prueba, ubicamos las regiones de rechazo y no
rechazo en el -Xescala en lugar de lazescala. Encontramos los valores críticos de -X para una
prueba bilateral utilizando las siguientes fórmulas:
s
- Xtu¼metro0þzpffiffiffi (7.9.1)
norte
y
s
- XL¼metro0 zpffiffiffi (7.9.2)
norte
dónde -Xtuy -XLson los valores críticos superior e inferior, respectivamente, de -X;
þzyzson los valores críticos dez;ymetro0es el valor hipotético demetro. Para
nuestro ejemplo, tenemos
d3:6Þ
- Xtu¼17:50þ1:96 ¼17:50þ1:96d:36Þ
d10Þ
¼17:50þ :7056¼18:21
Así, la probabilidad de tomar una acción apropiada (es decir, rechazar H0)
cuando la hipótesis nula establece quemetro¼17:5, pero de hechometro¼16:5, es
274 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
Tenga en cuenta que en la Figura 7.9.1 y la Tabla 7.9.1 esos valores demetrobajo
la hipótesis alternativa que están más cerca del valor demetroespecificado porH0tener
asociados más grandesbvalores. por ejemplo, cuandometro¼18 bajo la hipótesis
alternativa,b¼ :7190; y cuandometro¼19:0 bajoHA,b¼ :0143. La potencia de la prueba
para estas dos alternativas, entonces, es 1:7190¼ :2810 y 1:0143¼ :9857,
respectivamente. Mostramos la potencia de la prueba de forma gráfica
7.9 EL ERROR TIPO II Y LA POTENCIA DE UNA PRUEBA 275
1 -b
1.00
0.90
0.80
0.70
0,60
0.50
0.40
0.30
0.20
0.10
0
16.0 17.0 18.0 19.0
Valores alternativos demetro
en una curva de potencia, como en la Figura 7.9.2. Tenga en cuenta que cuanto más alta es la curva, mayor
es la potencia. &
Aunque sólo un valor deaestá asociado con una prueba de hipótesis dada, hay muchos valores deb,uno para
cada valor posible demetrosimetro0no es el verdadero valor demetrocomo se hipotetiza. A menos que los
valores alternativos demetroson mucho más grandes o más pequeños quemetro0,bes relativamente grande
en comparación cona.Por lo general, usamos procedimientos de prueba de hipótesis con más frecuencia en
aquellos casos en los que, cuandoH0es falso, el valor verdadero del parámetro es bastante cercano al valor
hipotético. En la mayoría de los casos,b,la probabilidad calculada de no poder rechazar una hipótesis nula
falsa, es mayor quea,la probabilidad de rechazar una hipótesis nula verdadera. Estos hechos son compatibles
con nuestra afirmación de que una decisión basada en una hipótesis nula rechazada es más concluyente que
una decisión basada en una hipótesis nula que no se rechaza. La probabilidad de equivocarse en el último
caso es generalmente mayor que la probabilidad de equivocarse en el primer caso.
La Figura 7.9.2 muestra la apariencia en forma de V de una curva de potencia para una prueba de dos
caras. En general, una prueba bilateral que discrimine bien entre el valor del parámetro enH0
y valores enH1da como resultado una curva de potencia estrecha en forma de V. Una amplia curva en forma de V
276 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
indica que la prueba discrimina pobremente sobre un intervalo relativamente amplio de valores
alternativos del parámetro.
Curvas de potencia para pruebas unilateralesLa forma de una curva de potencia para una prueba
unilateral con la región de rechazo en la cola superior es una S alargada. Si la región de rechazo de una
prueba unilateral está ubicada en la cola inferior de la distribución, la curva de potencia toma la forma de una
S alargada inversa. El siguiente ejemplo muestra la naturaleza de la curva de potencia para una prueba
unilateral.
EJEMPLO 7.9.2
El tiempo medio que los empleados de laboratorio tardan ahora en realizar una determinada tarea en
una máquina es de 65 segundos, con una desviación estándar de 15 segundos. Los tiempos tienen
una distribución aproximadamente normal. Los fabricantes de una nueva máquina afirman que su
máquina reducirá el tiempo medio necesario para realizar la tarea. El supervisor de control de calidad
diseña una prueba para determinar si debe o no creer en la afirmación de los fabricantes de la nueva
máquina. Ella elige un nivel de significación dea¼0:01 y selecciona al azar a 20 empleados para
realizar la tarea en la nueva máquina. Las hipótesis son
El supervisor de control de calidad también desea construir una curva de potencia para la prueba.
Encontramosbcomo sigue:
57 55
b¼PAGd-X >57jmetro¼55¼P z > pffiffiffiffiffi ¼PAGdz > :60Þ
15= 20
¼1:7257¼ :2743
b=0.2743
a=0.01
X–
55 57 sesenta y cinco
1 -b
1.00
0.90
0.80
0.70
0,60
0.50
0.40
0.30
0.20
0.10
51 53 55 57 59 61 63 sesenta y cinco
también dan valores de 1b.Cuando se grafica contra los valores demetro,estos dan la curva
de potencia que se muestra en la Figura 7.9.4. &
EJERCICIOS
Construya y grafique la función de potencia para cada una de las siguientes situaciones.
En el Capítulo 6 aprendió cómo encontrar los tamaños de muestra necesarios para construir
intervalos de confianza para medias y proporciones de población para niveles de confianza
específicos. Aprendiste en el Capítulo 7 que los intervalos de confianza se pueden usar para probar
hipótesis. El método para determinar el tamaño de la muestra presentado en el Capítulo 6 tiene en
cuenta la probabilidad de un error tipo I, pero no un error tipo II, ya que el nivel de confianza está
determinado por el coeficiente de confianza, 1a.
278 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
EJEMPLO 7.10.1
En el ejemplo 7.9.2, las hipótesis son
Solución: Paraa¼ :01 ynorte¼20;bes igual a .2743. El valor crítico es 57. Bajo las nuevas
condiciones, el valor crítico es desconocido. Llamemos a este nuevo valor crítico
C.Dejarmetro0Sea la media hipotética ymetro1la media bajo la hipótesis alternativa.
Podemos transformar cada una de las distribuciones de muestreo relevantes de -X, el
que tiene una media demetro0y el que tiene una media demetro1a unzdistribución. Por
lo tanto, podemos convertirCa unzvalor en la escala horizontal de cada una de las dos
distribuciones normales estándar. Cuando transformamos la distribución muestral de -
Xque tiene un medio demetro0a la distribución normal estándar, la llamamosz eso
resultaz0. Cuando transformamos la distribución de muestreo -Xque tiene un medio de
metro1a la distribución normal estándar, la llamamoszeso resultaz1. La figura 7.10.1
representa la situación descrita hasta ahora.
Podemos expresar el valor críticoCcomo una función dez0ymetro0y
también en función dez1ymetro1. Esto da las siguientes ecuaciones:
s
C¼metro0 z0pffiffiffi (7.10.1)
norte
s
C¼metro1þz1pffiffiffi (7.10.2)
norte
b
a
X–
metro1 C metro0
z
0 z1
z
z0 0
FIGURA 7.10.1 Representación gráfica de las relaciones en la determinación
del tamaño de la muestra para controlar los errores de tipo I y tipo II.
EJERCICIOS 279
dz0þz1Þs2
norte¼ (7.10.3)
dmetro0 metro1Þ
d2:33þ1:645Þð15Þ2
norte¼ ¼35:55
d65 55Þ
Necesitaríamos una muestra de tamaño 36 para lograr los niveles deseados deayb
cuando elegimosmetro1¼55 como el valor alternativo demetro.
ahora calculamosC,el valor crítico para la prueba y establecer una regla de
decisión apropiada. EncontrarC,podemos sustituir valores numéricos conocidos en la
Ecuación 7.10.1 o en la Ecuación 7.10.2. Con fines ilustrativos, resolvemos ambas
ecuaciones paraC.Primero tenemos
15
C¼65 2:33 ¼59:175
pffiffiffiffiffi
36
De la Ecuación 7.10.2, tenemos
15
C¼55 1:645 ¼59:1125
pffiffiffiffiffi
36
La diferencia entre los dos resultados se debe a un error de redondeo.
La regla de decisión, cuando usamos el primer valor deC,es como sigue:
EJERCICIOS
7.11 RESUMEN
9.Conclusión.
10Determinación depagvalor.
Una serie de pruebas de hipótesis específicas se describen en detalle y se ilustran con ejemplos
apropiados. Estos incluyen pruebas relacionadas con las medias de población, la diferencia entre dos
medias de población, comparaciones pareadas, proporciones de población, la diferencia entre dos
proporciones de población, una varianza de población y la razón de dos varianzas de población.
Además, analizamos el poder de una prueba y la determinación del tamaño de la muestra para
controlar los errores de tipo I y tipo II.
7.2.3 - Xmetro
z¼
Estadística de prueba cuando
pffiffiffi0
muestreo de un s = norte
población que no se
distribuye normalmente
muestreo de normalmente
spag
2 s2pag
poblaciones distribuidas: þ
norte1 norte2
varianzas de población
desconocido e igual
dnorte1 1Þsþ2ðnorte
1 2 1Þs22
spag
2 ¼
norte1þnorte2 2
norte
7.6.1, 7.6.2 Estadístico de prueba para ðp̂1 pag2Þ ðpag1 pag2Þ0, dónde
z¼
la diferencia entre dos spag1pag2
proporciones de población
X1 þX2, y
- pag¼
norte1þnorte2
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
s
- XL¼metro0 zpffiffiffi
norte
tamaño a controlar
errores tipo II
7.10.3 2
Tamaño de muestra para dzþz
0 1Þs
norte¼
controlar errores tipo II
dmetro0 metro1Þ
4.Definir:
(a)error tipo I (b)Error tipo II
(C)El poder de una prueba (d)Función de potencia
(mi)Curva de potencia (F)Curva característica de funcionamiento
5.Explique la diferencia entre las curvas de potencia para pruebas unilaterales y bilaterales.
6.Explique cómo se decide qué enunciado entra en la hipótesis nula y qué enunciado entra en la
hipótesis alternativa.
7.¿Cuáles son los supuestos que subyacen al uso de latestadística en la prueba de hipótesis sobre una sola
media? ¿La diferencia entre dos medios?
9.Al probar una hipótesis sobre la diferencia entre las medias de dos poblaciones, ¿cuál es la razón detrás de
agrupar las varianzas de la muestra?
11Proporcione un ejemplo de su campo de interés donde sería apropiada una prueba de comparaciones pareadas. Utilizar
datos reales o realistas y realizar una prueba de hipótesis adecuada.
12Dé un ejemplo de su campo de interés donde sería apropiado probar una hipótesis sobre la diferencia
entre dos medias de población. Use datos reales o realistas y lleve a cabo el procedimiento de prueba
de hipótesis de diez pasos.
18Ochsenk€uhn et al. (A-33) estudiaron el nacimiento por fecundación in vitro (FIV) y el nacimiento por concepción
espontánea. En la muestra, hubo 163 nacimientos únicos resultantes de FIV con un peso medio al nacer de
3071 gy una desviación estándar de la muestra de 761 g. Entre los 321 nacimientos únicos resultantes de la
concepción espontánea, el peso medio al nacer fue de 3172 g con una desviación estándar de 702 g.
Determinar si estos datos proporcionan evidencia suficiente para que podamos concluir que el peso medio al
nacer en gramos de los nacimientos únicos resultantes de la FIV es más bajo, en general, que el peso medio
al nacer de los nacimientos únicos resultantes de la concepción espontánea.
Dejara¼ :10
19William Tindall (A-34) realizó un estudio retrospectivo de los registros de pacientes que recibían atención por
hipercolesterolemia. La siguiente tabla proporciona mediciones del colesterol total para pacientes antes y 6
semanas después de tomar una estatina. ¿Existe suficiente evidencia en ela¼ :01 nivel de significancia para
que nosotros concluyamos que el fármaco resultaría en una reducción del colesterol total en una población
de pacientes con hipercolesterolemia similar?
284 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
Identificación. No. Antes Después Identificación. No. Antes Después Identificación. No. Antes Después
20El objetivo de un estudio de van Vollenhoven et al. (A-35) fue examinar la eficacia de Etanercept solo y Etanercept
en combinación con metotrexato en el tratamiento de la artritis reumatoide. Realizaron un estudio
retrospectivo utilizando datos de la base de datos STURE, que recopila datos de eficacia y seguridad para
todos los pacientes que inician tratamientos biológicos en los principales hospitales de Estocolmo, Suecia.
Los investigadores identificaron a 40 sujetos a los que se les recetó Etanercept solo ya 57 a los que se les
administró Etanercept con metotrexato. Una de las medidas de resultado fue el número de articulaciones
inflamadas. La siguiente tabla proporciona el número medio de articulaciones inflamadas en los dos grupos,
así como el error estándar de la media. ¿Existe suficiente evidencia en el
PREGUNTAS DE REPASO Y EJERCICIOS 285
a¼ :05 nivel de significación para que concluyamos que hay una diferencia en el recuento medio de articulaciones
inflamadas en las poblaciones relevantes?
21Miyazaki et al. (A-36) examinó las tasas sin recurrencia de la extirpación con varicectomía y la extirpación con
escleroterapia para el tratamiento de venas varicosas primarias. El grupo de varicectomía constaba de 122
extremidades en las que se realizó el procedimiento, y el grupo de escleroterapia constaba de 98 extremidades en las
que se realizó ese procedimiento. Después de 3 años, 115 extremidades del grupo de varicectomía y 87 extremidades
del grupo de escleroterapia estaban libres de recurrencia. ¿Es esta evidencia suficiente para concluir que no hay
diferencia, en general, en la tasa libre de recurrencia entre los dos procedimientos para tratar las venas varicosas?
Dejara¼ :05.
22Recuerde el estudio, informado en el Ejercicio 7.8.1, en el que Dora et al. (A-37) investigó las dimensiones
del canal espinal en 30 sujetos sintomáticos con hernia de disco seleccionados para una discectomía y
45 individuos asintomáticos (grupo de control). Una de las áreas de interés fue determinar si existe
una diferencia entre los dos grupos en el área transversal del canal espinal (cm2) entre las vértebras
L5/S1. Los datos de la tabla siguiente se simulan para ser consistentes con los resultados informados
en el documento. ¿Estos datos simulados nos brindan evidencia para concluir que existe una
diferencia en el área transversal del canal espinal entre una población de sujetos con hernias de disco
y una población de aquellos que no tienen hernias de disco? Dejar a¼ :05.
2,62 2,57 1,98 3,21 3,59 3,72 4,30 2,87 3,87 2,73 5,28
1,60 1,80 3,91 2,56 1,53 1,33 2,36 3,67 1,64 3,54 3,63
2,39 2,67 3,53 2,26 2,82 4,26 3,08 3,32 4,00 2,76 3,58
2,05 1,19 3,01 2,39 3,61 3,11 3,94 4,39 3,73 2,22 2,73
2,09 3,79 2,45 2,55 2,10 5,02 3,62 3,02 3,15 3,57 2,37
2,28 2,33 2,81 3,70 2,61 5,42 3,35 2,62 3,72 4,37 5,28
4,97 2,58 2,25 3,12 3,43
3,95 2,98 4,11 3,08 2,22
Fuente: Datos simulados.
23Iannelo et al. (A-38) investigaron las diferencias entre los niveles de triglicéridos en sujetos obesos sanos
(control) y sujetos obesos con hepatitis B o C activa crónica. Los niveles de triglicéridos de 208 controles
obesos tenían un valor medio de 1,81 con un error estándar de la media de 0,07 mmol/L. Los 19 sujetos con
hepatitis obesos tenían una media de 0,71 con un error estándar de la media de 0,05. ¿Es esta evidencia
suficiente para concluir que, en general, existe una diferencia en los niveles promedio de triglicéridos entre
sujetos obesos sanos y sujetos obesos con hepatitis B o C? Dejara¼ :01.
24Los estudiantes de jardín de infantes fueron los participantes en un estudio realizado por Susan Bazyk et al. (A-39). Los
investigadores estudiaron las habilidades motoras finas de 37 niños que recibían terapia ocupacional. Usaron un
índice de habilidades motoras finas que midió el uso de la mano, la coordinación ojo-mano y la destreza manual.
286 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
antes y después de 7 meses de terapia ocupacional. Los valores más altos indican habilidades motoras finas más fuertes. Las
puntuaciones aparecen en la siguiente tabla.
1 91 94 20 76 112
2 61 94 21 79 91
3 85 103 22 97 100
4 88 112 23 109 112
5 94 91 24 70 70
6 112 112 25 58 76
7 109 112 26 97 97
8 79 97 27 112 112
9 109 100 28 97 112
10 115 106 29 112 106
11 46 46 30 85 112
12 45 41 31 112 112
13 106 112 32 103 106
14 112 112 33 100 100
15 91 94 34 88 88
dieciséis 115 112 35 109 112
17 59 94 36 85 112
18 85 109 37 88 97
19 112 112
Fuente: Datos proporcionados por cortesía de Susan Bazyk, MHS
¿Se puede concluir sobre la base de estos datos que después de 7 meses, las habilidades motoras finas en una
población de sujetos similares serían más fuertes? Dejara¼ :05. Determinar elpagvalor.
25Una encuesta de 90 mujeres que dieron a luz recientemente en las listas de un departamento de bienestar del condado
reveló que 27 tenían antecedentes de infección intraparto o posparto. Pruebe la hipótesis nula de que la proporción
de la población con antecedentes de infección intraparto o posparto es menor o igual a .25. Dejar a¼ :05. Determinar
elpagvalor.
26En una muestra de 150 admisiones hospitalarias de emergencia con un diagnóstico determinado, 128 mencionaron el
vómito como síntoma de presentación. ¿Proporcionan estos datos suficiente evidencia para indicar, en el nivel de
significancia de .01, que la proporción de la población es menor que .92? Determina elpagvalor.
27Un equipo de investigación midió el volumen corriente en 15 animales de experimentación. La media y la desviación
estándar fueron 45 y 5 cc, respectivamente. ¿Estos datos proporcionan evidencia suficiente para indicar que la media
poblacional es mayor que 40 cc? Dejara¼ :05.
28Una muestra de ocho pacientes ingresados en un hospital con diagnóstico de cirrosis biliar tenía un nivel medio de IgM
de 160,55 unidades por mililitro. La desviación estándar de la muestra fue de 50. ¿Estos datos proporcionan evidencia
suficiente para indicar que la media de la población es mayor que 150? Dejara¼ :05. Determinar elpagvalor.
29Algunos investigadores han observado una mayor resistencia de las vías respiratorias en los fumadores que en los no fumadores.
Suponga que un estudio, realizado para comparar el porcentaje de retención traqueobronquial de partículas en gemelos
monocigóticos discordantes fumadores, arroja los siguientes resultados:
PREGUNTAS DE REPASO Y EJERCICIOS 287
Doble para fumadores Doble para no fumadores Doble para fumadores Doble para no fumadores
¿Apoyan estos datos la hipótesis de que el aclaramiento traqueobronquial es más lento en los fumadores? Dejar a¼ :
05. Determinar elpagvalor para esta prueba.
30Se midieron los niveles circulantes de estrona en una muestra de 25 mujeres posmenopáusicas después de un
tratamiento con estrógenos. La media muestral y la desviación estándar fueron 73 y 16, respectivamente. Con un
nivel de significación de 0,05, ¿se puede concluir sobre la base de estos datos que la media de la población es
superior a 70?
31Las determinaciones de resistencia vascular sistémica se realizaron en una muestra de 16 pacientes con insuficiencia
cardíaca congestiva crónica mientras recibían un tratamiento particular. La media muestral y la desviación estándar
fueron 1600 y 700, respectivamente. Con un nivel de significación de .05, ¿estos datos proporcionan evidencia
suficiente para indicar que la media de la población es menor que 2000?
32.La longitud media al nacer de 14 niños varones fue de 53 cm con una desviación estándar de 9 cm. ¿Se puede
concluir sobre la base de estos datos que la media de la población no es de 50 cm? Sea .10 la probabilidad de
cometer un error tipo I.
Para cada uno de los estudios descritos en los ejercicios 33 a 38, responda tantas de las siguientes
preguntas como sea posible: (a) ¿Cuál es la variable de interés? (b) ¿El parámetro de interés es una media, la
diferencia entre dos medias (muestras independientes), una diferencia de medias (datos pareados), una
proporción o la diferencia entre dos proporciones (muestras independientes)? (c) ¿Cuál es la población
muestreada? (d) ¿Cuál es la población objetivo? (e) ¿Cuáles son las hipótesis nula y alternativa? (f) ¿La
alternativa es de un solo lado (cola izquierda), de un solo lado (cola derecha) o de dos lados? (g) ¿Qué errores
tipo I y tipo II son posibles? (h) ¿Cree que se rechazó la hipótesis nula? Explica por qué o por qué no.
33.Durante un período de un año, Hong et al. (A-40) estudiaron a todos los pacientes que acudieron al
servicio de cirugía con posible apendicitis. Ciento ochenta y dos pacientes con posible apendicitis se
asignaron al azar a evaluación clínica (AC) sola oa evaluación clínica y TC abdominal/pélvica. Un caso
verdadero positivo resultó en una laparotomía que reveló una lesión que requería operación.
Un caso verdadero negativo no requirió una operación en la evaluación de seguimiento de una semana. Al cierre del estudio,
no encontraron diferencias significativas en la duración de la estancia hospitalaria para los dos grupos de tratamiento.
34.Recuerde el estudio informado en el Ejercicio 7.8.2 en el que Nagy et al. (A-32) estudiaron a 50 pacientes
estables ingresados por herida de bala que atravesaba el mediastino. Descubrieron que ocho de los sujetos
tenían una lesión mediastínica, mientras que 42 no tenían tal lesión. Realizaron una alumnatprueba para
determinar si había una diferencia en la edad media (años) entre los dos grupos. el reportadopagel valor fue
.59.
35.Dykstra et al. (A-41) estudiaron 15 pacientes mujeres con frecuencia urinaria con o sin
incontinencia. Las mujeres fueron tratadas con toxina botulínica tipo B (BTX-B). Atprueba de la
288 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
La diferencia pre/post en la frecuencia indicó que estos 15 pacientes experimentaron un promedio de 5,27 episodios
de frecuencia menos por día después del tratamiento con BTX-B. Elpagvalor para la prueba fue inferior a 0,001.
36.Recuerde el estudio informado en el Ejercicio 6.10.2 en el que Horesh et al. (A-42) investigó el comportamiento
suicida entre adolescentes. Además de la impulsividad, los investigadores estudiaron la desesperanza entre
los 33 sujetos del grupo suicida y los 32 sujetos del grupo no suicida. Las medias de los dos grupos en la
Escala de desesperanza de Beck fueron 11,6 y 5,2, respectivamente, y latvalor para la prueba fue de 5,13.
37.Mauksch et al. (A-43) encuestó a 500 pacientes consecutivos (de 18 a 64 años de edad) en una clínica de atención primaria que
atiende solo a pacientes sin seguro y de bajos ingresos. Utilizaron preguntas de autoinforme sobre por qué los pacientes
acudían a la clínica y otras herramientas para clasificar a los sujetos según tuvieran o no enfermedades mentales graves. En
comparación con los pacientes sin una enfermedad mental importante actual, los pacientes con una enfermedad mental
importante actual informaron significativamentedpag < :001Þmás preocupaciones, enfermedades crónicas, factores
estresantes, formas de maltrato y síntomas físicos.
38.Un estudio de Hosking et al. (A-44) fue diseñado para comparar los efectos del alendronato y el risedronato en la
densidad mineral ósea (DMO). Una de las medidas de resultado fue el aumento porcentual de la DMO a los
12 meses. El alendronato produjo un cambio porcentual significativamente mayor (4,8 %) en la BMD que el
risedronato (2,8 %) con unpagvalor < :001.
39.Para cada una de las siguientes situaciones, identifique los errores tipo I y tipo II y las acciones correctas.
(a)H0: Un nuevo tratamiento no es más efectivo que el tradicional.
(1)Adopte el nuevo tratamiento cuando el nuevo sea más efectivo.
(2)Continuar con el tratamiento tradicional cuando el nuevo sea más efectivo.
(3)Continuar con el tratamiento tradicional cuando el nuevo no sea más efectivo.
(4)Adoptar el nuevo tratamiento cuando el nuevo no sea más efectivo.
(b)H0: Un nuevo procedimiento de fisioterapia es satisfactorio.
(1)Emplear un nuevo procedimiento cuando no es satisfactorio.
(2)No emplee un nuevo procedimiento cuando no sea satisfactorio.
(3)No emplee un nuevo procedimiento cuando sea satisfactorio.
(4)Emplear un nuevo procedimiento cuando sea satisfactorio.
(C)H0: Una tanda de producción de un fármaco es de calidad satisfactoria.
Para cada uno de los estudios descritos en los ejercicios 40 a 55, haga lo siguiente:
(a)Realice un análisis estadístico de los datos (incluidas las pruebas de hipótesis y la construcción de
intervalos de confianza) que crea que generarían información útil para los investigadores.
(b)Indique todas las suposiciones que sean necesarias para validar su análisis.
(C)Encontrarpagvalores para todas las estadísticas de prueba calculadas.
(d)Describa la(s) población(es) sobre las que cree que serían aplicables las inferencias basadas en su
análisis.
40Un estudio de Bell (A-45) investigó la hipótesis de que la alteración del sistema endocrino de la vitamina D en los
negros resulta de la reducción de la 25-hidroxivitamina D sérica y que la alteración se revierte con el
tratamiento oral con 25-hidroxivitamina D.3. Los ocho sujetos (tres hombres y cinco mujeres) fueron
estudiados sin tratamiento (control) y después de haber recibido 25-hidroxivitamina D3durante 7 días
PREGUNTAS DE REPASO Y EJERCICIOS 289
(25-OHD3). Las siguientes son las determinaciones de calcio urinario (mg/d) para los ocho sujetos bajo las dos
condiciones.
A 66 98
B 115 142
C 54 78
D 88 101
mi 82 134
F 115 158
GRAMO 176 219
H 46 60 Fuente: Datos proporcionados por cortesía
del Dr. Norman H. Bell.
41.Montner et al. (A-46) realizaron estudios para evaluar los efectos de la hiperhidratación potenciada con glicerol (GEH)
sobre la resistencia en el rendimiento ciclista. Los 11 sujetos, de 22 a 40 años de edad, pedaleaban regularmente al
menos 75 millas por semana. Los siguientes son los volúmenes de producción de orina antes del ejercicio (ml)
después de la ingestión de glicerol y agua:
Experimental, ml Testigo, ml
Sujeto # (Glicerol) (Placebo)
1 1410 2375
2 610 1610
3 1170 1608
4 1140 1490
5 515 1475
6 580 1445
7 430 885
8 1140 1187
9 720 1445
10 275 890
11 875 1785 Fuente: Datos proporcionados por
cortesía del Dr. Paul Montner.
42.D'Alessandro et al. (A-47) deseaba saber si la hiperreactividad de las vías respiratorias (HR) preexistente
predispone a los sujetos a un resultado más grave después de la exposición al cloro. Los sujetos eran
voluntarios sanos entre las edades de 18 y 50 años que fueron clasificados como con y sin HR.
Los siguientes son los FEV1y mediciones de la resistencia específica de las vías respiratorias (Sraw) tomadas en los
sujetos antes y después de la exposición al cloro gaseoso adecuadamente diluido:
Sujetos hiperreactivos
sujetos normales
43.Notando la escasez de información sobre el efecto del estrógeno en la composición de ácidos grasos de la membrana plaquetaria,
Ranganath et al. (A-48) realizó un estudio para examinar la posibilidad de que se presenten cambios en mujeres
posmenopáusicas y que éstos puedan ser reversibles con el tratamiento con estrógenos. Las 31 mujeres reclutadas para el
estudio no habían menstruado durante al menos 3 meses o tenían síntomas de la menopausia. Ninguna mujer estaba en
ninguna forma de terapia de reemplazo hormonal (TRH) en el momento en que fue reclutada. Los siguientes son los valores de
ácido linoleico de la membrana plaquetaria antes y después de un período de TRH:
44.El propósito de un estudio de Goran et al. (A-49) fue examinar la precisión de algunas técnicas de composición
corporal ampliamente utilizadas para niños mediante el uso de la técnica de absorciometría de rayos X de
energía dual (DXA). Los sujetos eran niños entre las edades de 4 y 10 años. Las siguientes son mediciones de
masa grasa tomadas en los niños mediante tres técnicas: DXA, grosor del pliegue cutáneo (ST) y resistencia
bioeléctrica (BR):
Sexo
DXA CALLE BR (1¼Masculino; 0¼Femenino)
Sexo
DXA CALLE BR (1¼Masculino; 0¼Femenino)
Sexo
DXA CALLE BR (1¼Masculino; 0¼Femenino)
45.Hartard et al. (A-50) realizó un estudio para determinar si un determinado régimen de entrenamiento puede
contrarrestar la pérdida de densidad ósea en mujeres con osteopenia posmenopáusica. Las siguientes son
mediciones de fuerza para cinco grupos musculares tomadas en 15 sujetos antes (B) y después (A) de 6 meses de
entrenamiento:
1 100 180 8 15 10 20
2 l55 195 10 20 12 25
3 115 150 8 13 12 19
4 130 170 10 14 12 20
5 120 150 7 12 12 15
6 60 140 5 12 8 dieciséis
7 60 100 4 6 6 9
8 140 215 12 18 14 24
9 110 150 10 13 12 19
10 95 120 6 8 8 14
11 110 130 10 12 10 14
12 150 220 10 13 15 29
13 120 140 9 20 14 25
14 100 150 9 10 15 29
15 110 130 6 9 8 12
1 10 12 12 19
2 7 20 10 20
3 8 14 8 14
4 8 15 6 dieciséis
5 8 13 9 13
6 5 13 6 13
7 4 8 4 8
8 12 15 14 19
9 10 14 8 14
10 6 9 6 10
11 8 11 8 12
12 8 14 13 15
13 8 19 11 18
14 4 7 10 22
15 4 8 8 12
Fuente: Datos proporcionados por cortesía del Dr. Manfred Hartard.
46.Vitaca et al. (A-51) realizaron un estudio para determinar si la posición supina o la posición sentada empeoran los flujos
espiratorios forzados estáticos y las mediciones de la mecánica pulmonar. Los sujetos tenían edades
294 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
personas que vivían en un hogar de ancianos que estaban clínicamente estables y sin evidencia clínica de
enfermedades cardiorrespiratorias. Entre los datos recopilados se encuentran los siguientes FEV1valores
porcentuales para sujetos en posturas sentadas y supinas:
64 56 103 94
44 37 109 92
44 39 99 99
40 43 169 165
32 32 73 66
70 61 95 94
82 58 99 99
74 48 73 58
91 63
Fuente: Datos proporcionados por cortesía del Dr. M. Vitacca.
47.El propósito de una investigación de Young et al. (A-52) fue examinar la eficacia y seguridad de un cabestrillo suburetral
en particular. Los sujetos eran mujeres que experimentaban incontinencia de esfuerzo y que también cumplían con
otros criterios. Entre los datos recopilados se encuentran los siguientes valores de capacidad cistométrica pre y
postoperatoria (ml):
48.Diamante et al. (A-53) deseaba saber si se debe utilizar la evaluación cognitiva para ayudar a seleccionar
candidatos apropiados para la rehabilitación hospitalaria integral. Estudiaron una muestra de pacientes de
rehabilitación geriátrica utilizando estrategias de medición estandarizadas. Entre los datos recopilados se
encuentran los siguientes puntajes de admisión y alta realizados por los sujetos en el Mini Examen del Estado
Mental (MMSE):
PREGUNTAS DE REPASO Y EJERCICIOS 295
9 10 24 26
11 11 24 30
14 19 24 28
15 15 25 26
dieciséis 17 25 22
dieciséis 15 26 26
dieciséis 17 26 28
dieciséis 17 26 26
17 14 27 28
17 18 27 28
17 21 27 27
18 21 27 27
18 21 27 27
19 21 28 28
19 25 28 29
19 21 28 29
19 22 28 29
19 19 29 28
20 22 29 28
21 23 29 30
22 22 29 30
22 19 29 30
22 26 29 30
23 21 29 30
24 21 30 30
24 20
Fuente: Datos proporcionados por cortesía del Dr. Stephen N. Macciocchi.
49.En un estudio para explorar la posibilidad de alteración hormonal en el asma, Weinstein et al. (A-54) recopilaron
datos sobre 22 mujeres posmenopáusicas con asma y 22 mujeres posmenopáusicas de la misma edad sin
asma. Los siguientes son los valores de sulfato de dehidroepiandrosterona (DHEAS) recopilados por los
investigadores:
50La motivación para un estudio de Gruber et al. (A-55) fue el deseo de encontrar un marcador sérico
potencialmente útil en la artritis reumatoide (AR) que refleje los mecanismos patogénicos
subyacentes. Midieron, entre otras variables, los niveles circulantes de gelatinasa B en suero y líquido
sinovial (LS) de pacientes con AR y de sujetos control. Los resultados fueron los siguientes:
Control
REAL ACADEMIA DE BELLAS ARTES Control AR Control
REAL ACADEMIA DE BELLAS ARTES Control AR
51.Benini et al. (A-56) realizó un estudio para evaluar la gravedad de la acidificación esofágica en la acalasia luego de una
dilatación exitosa del cardias y para determinar qué factores están asociados con la acidificación esofágica patológica
en tales pacientes. Veintidós sujetos, de los cuales siete eran hombres; con edades comprendidas entre los 28 y los
78 años. Sobre la base de los criterios establecidos se clasificaron como refluxers o no refluxers. Los siguientes son
los valores de depuración de ácido (min/reflujo) para los 22 sujetos:
Reflujadores no reflujo
8.9 2.3
30.0 0.2
23.0 0.9
6.2 8.3
11.5 0.0
0.9
0.4
2.0
0.7
3.6
0.5
1.4
0.2
0.7
17.9
2.1
Fuente: Datos proporcionados por
0.0
cortesía del Dr. Luigi Benini.
PREGUNTAS DE REPASO Y EJERCICIOS 297
52.El objetivo de un estudio de Baker et al. (A-57) fue determinar si la deformación médica altera los efectos in vitro del
plasma de pacientes con preeclampsia en la función de las células endoteliales para producir un paradigma similar al
estado de la enfermedad in vivo. Los sujetos fueron 24 mujeres embarazadas nulíparas antes del parto, de las cuales
12 tenían preeclampsia y 12 eran pacientes embarazadas normales. Entre los datos recopilados se encuentran las
siguientes edades gestacionales (semanas) al momento del parto:
38 40
32 41
42 38
30 40
38 40
35 39
32 39
38 41
39 41
29 40
29 40
Fuente: Datos proporcionados por
32 40 cortesía del Dr. James M. Roberts.
53.Zisselman et al. (A-58) realizaron un estudio para evaluar el uso de benzodiazepinas y el tratamiento de la depresión antes del
ingreso a una unidad de psiquiatría geriátrica para pacientes internados en una muestra de pacientes de edad avanzada. Entre
los datos recopilados se encuentran las siguientes puntuaciones de trastornos del comportamiento en 27 pacientes tratados
con benzodiazepinas (W) y 28 que no lo eran (WO).
W WO
. 00 1.00 . 00 . 00
. 00 1.00 . 00 10.00
. 00 . 00 . 00 . 00
. 00 . 00 . 00 18.00
. 00 10.00 . 00 . 00
. 00 2.00 . 00 2.00
. 00 . 00 5.00
. 00 . 00
. 00 4.00
. 00 1.00
4.00 2.00
3.00 . 00
2.00 6.00
. 00 . 00
10.00 . 00
2.00 1.00
. 00 2.00
9.00 1.00
. 00 22.00
1.00 . 00
Fuente: Datos proporcionados por
16.00 . 00
cortesía del Dr. Yochi Shmuely.
298 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
54.El objetivo de un estudio de Reinecke et al. (A-59) fue investigar la actividad funcional y la expresión del sarcolema Naþ
=Ca2þintercambio en el corazón humano que falla. Los investigadores obtuvieron muestras del ventrículo izquierdo
de corazones humanos defectuosos de 11 pacientes masculinos (edad promedio de 51 años) que se sometieron a un
trasplante cardíaco. Se obtuvieron corazones de control que no fallaban de donantes de órganos (cuatro mujeres,
dos hombres, edad media 41 años) cuyos corazones no podían trasplantarse por razones no cardíacas. Los siguientes
son los Naþ=Ca2þmediciones de la actividad del intercambiador para los pacientes con insuficiencia cardíaca terminal
(CHF) y controles que no fallan (NF).
NF francos suizos
0.075 0.221
0.073 0.231
0.167 0.145
0.085 0.112
0.110 0.170
0.083 0.207
0.112
0.291
0.164
0.195
0.185
55.Reichmann et al. (A-60) realizó un estudio con el propósito de demostrar que los síntomas negativos son prominentes en
pacientes con enfermedad de Alzheimer y son distintos de la depresión. Las siguientes son puntuaciones realizadas
en la Escala para la Evaluación de Síntomas Negativos en la Enfermedad de Alzheimer por pacientes con enfermedad
de Alzheimer (PT) y sujetos de comparación de edad avanzada, cognitivamente intactos, normales (C).
PT C
19 6
5 5
36 10
22 1
1 1
18 0
24 5
17 5
7 4
19 6
5 6
2 7
14 5
9 3
34 5
13 12
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 299
PT C
0 0
21 5
30 1
43 2
19 3
31 19
21 3
41 5
24
3 Fuente: Datos proporcionados por
cortesía del Dr. Andrew C. Coyne.
Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.Consulte los datos de creatina fosfoquinasa en 1005 sujetos (PCKDATA). A los investigadores les gustaría saber si las
situaciones psicológicamente estresantes provocan un aumento en los niveles de creatina fosfoquinasa (CPK) sérica
entre individuos aparentemente sanos. Para ayudar a los investigadores a tomar una decisión, seleccione una
muestra aleatoria simple de esta población, realice un análisis apropiado de los datos de la muestra y proporcione un
informe narrativo de sus hallazgos y conclusiones. Compara tus resultados con los de tus compañeros.
2.Consulte los datos de tiempo de protrombina de 1000 lactantes (PROTHROM). Seleccione una muestra aleatoria simple
de tamaño 16 de cada una de estas poblaciones y realice una prueba de hipótesis adecuada para determinar si se
debe concluir que las dos poblaciones difieren con respecto al tiempo medio de protrombina.
Dejara¼ :05. Compara tus resultados con los de tus compañeros. ¿Qué suposiciones son necesarias para la
validez de la prueba?
3.Consulte los datos de la circunferencia de la cabeza de 1000 sujetos emparejados (HEADCIRC). Seleccione una muestra
aleatoria simple de tamaño 20 de la población y realice una prueba de hipótesis adecuada para determinar si se
puede concluir que los sujetos con la anomalía cromosómica sexual tienden a tener cabezas más pequeñas que los
sujetos normales. Dejara¼ :05. Construya un intervalo de confianza del 95 por ciento para la diferencia de medias de
la población. ¿Qué supuestos son necesarios? Compara tus resultados con los de tus compañeros.
4.Consulte los datos de hemoglobina de 500 niños con anemia por deficiencia de hierro y 500 niños
aparentemente sanos (HEMOGLOB). Seleccione una muestra aleatoria simple de tamaño 16 de la población A
y una muestra aleatoria simple independiente de tamaño 16 de la población B. ¿Los datos de su muestra
proporcionan suficiente evidencia para indicar que las dos poblaciones difieren con respecto al valor medio
de Hb? Dejar a¼ :05. ¿Qué supuestos son necesarios para que su procedimiento sea válido? Compara tus
resultados con los de tus compañeros.
5.Consulte los puntajes de destreza manual de 500 niños con discapacidades de aprendizaje y 500 niños sin
discapacidades de aprendizaje conocidas (MANDEXT). Seleccione una muestra aleatoria simple de tamaño 10
de la población A y una muestra aleatoria simple independiente de tamaño 15 de la población B.
¿Proporcionan sus muestras suficiente evidencia para concluir que los niños con problemas de aprendizaje,
en promedio, tienen puntajes de destreza manual más bajos que niños sin problemas de aprendizaje? Dejara
¼ :05. ¿Qué supuestos son necesarios para que su procedimiento sea válido? Compara tus resultados con los
de tus compañeros.
300 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
REFERENCIAS
Referencias de metodología
1. MB BFILAy AB FORSYTHE, “Pruebas Robustas para la Igualdad de Varianzas,”Revista de la Asociación Estadounidense de
Estadística, 69 (1974), 364–367.
2. H. L.NOCHE, "Pruebas robustas para la igualdad de varianzas", en I. Olkin, ed.,Contribuciones a la Probabilidad y Estadística, Prensa
de la Universidad de Stanford, Palo Alto, CA, 1960, 278–292.
Aplicaciones Referencias
A-1. norteORIMASAnorteAKAMURA, SHUJIHORIBE, YUKYOSHITORITSUKA, TOMOKIMETROITSUOKA, hIDEKIYOSHIKAWAy kONSEI
SHINO, “Lesión aguda del ligamento colateral medial de grado III de la rodilla asociada con desgarro del ligamento
cruzado anterior,”Revista americana de medicina deportiva, 31 (2003), 261–267.
A-2. DIANEkLINGLER, ROBYAGRAMOREEN-WEIR, DÁVIDOnorteERENZ, SUZANNÉHAVSTAD, hPREMIOS. R.osmán, LEONARDOCETNER,
SEmirSHAH, FRANCESWEMBARCAR, y STEVENBORZAK, "Las percepciones del dolor torácico difieren según la raza",Diario americano del
corazón, 144 (2002), 51–59.
A-3. AESCOBAR, JMQUINTANA, ABILBAO, J. A.ZKARATE, y JI Gtu €ENAGA, “Validación de la Versión Española de la
Cuestionario WOMAC para pacientes con osteoartritis de cadera o rodilla”,Reumatología clínica, 21 (2002), 466–471.
A-4. PAGHAMORNSAKTHIENPRASAIDDHI, VIVIENNECGREENSTEIN, CANDICESCGALLINA, jEFREYMLIEBMANN, ROBERTORPICAR, y
DONALDCHDOO, "Respuestas de potenciales evocados visuales multifocales en pacientes con glaucoma con defectos de
hemicampo unilaterales"Diario Americano de Oftalmología, 136 (2003), 34–40. FP Lfeo
A-5. -, gUGLIELMOCAMPUS, CDEIOLA, MG MELA, y D. G.ALLISAI, “Condición Oral, Química de la Saliva,
y niveles salivales deStreptococcus mutansen pacientes talasémicos”,Investigaciones orales clínicas, 6 (2002), 223–
226.
A-6. miRICWTSOY, ARTHURFMAlaska, WAInorteGeorgiaLSOY, jOHNÉLFURGONETAS, y YORKY CCÓMO, "Movimiento pélvico y distribución de
la presión de interfaz durante la propulsión manual de una silla de ruedas",Archivos de Medicina Física y
Rehabilitación, 84 (2003), 1466–1472.
A-7. jOHNDERNELISy MARIAPAGANARETOU, “Efectos de la terapia de reemplazo tiroideo sobre la presión arterial en
pacientes con hipertensión e hipotiroidismo,”Diario americano del corazón, 143 (2002), 718–724.
A-8. S. S.AIRAM, BA BAETHGE, y T. M.CnorteGANAR, “Análisis de factores de riesgo y enfermedades comórbidas en el desarrollo
de trombosis en pacientes con anticuerpos anticardiolipina,”Reumatología clínica, 22 (2003), 24–29.
A-9. METROICHELDABONNEVILLE, PAGAULBertón, PAGHILIPPEVASLIN, y NICOLEFELMANN, “Las 5 M en Running Field Test:
Probar y volver a probar la confiabilidad en hombres y mujeres capacitados”,Revista Europea de Fisiología Aplicada, 88 (2003),
353–360.
A-10. BM INGLEy R. E.ASTELL, "Mediciones óseas específicas del sitio en pacientes con fractura de tobillo",Osteoporosis
Internacional, 13 (2002), 342–347.
A-11. AHOEKEMA, BHOVINGA, B. S.TEGENGA, y LGM DmiBONT, "Morfología craneofacial y apnea obstructiva pronunciada:
un análisis cefalométrico",Revista de Rehabilitación Oral, 30 (2003), 690–696.
A-12. GRAMOIANPAGAOLOROSSI, StefanoTADEI, AGOSTINOVIRDIS, mARTINACAVALLIN, LORENZOGRAMOHIADONI, STEFANIAFUNA VILLA
, DANIELAVERSARI, ISABELLASUDANO, ACHILECPESINA, y ANTONIOSALVETTI, "La t786C y Glu298Asp
Los polimorfismos del gen del óxido nítrico endotelial afectan las respuestas del flujo sanguíneo del antebrazo de los
pacientes hipertensos caucásicos.Revista del Colegio Americano de Cardiología, 41 (2003), 938–945.
A-13. jOSEGRAMOARCOSA~ Oy jOSECABRITA, “Evaluación de un Programa de Atención Farmacéutica a Hipertensos en Zonas Rurales
Portugal,"Diario de la Asociación Farmacéutica Americana, 42 (2002), 858–864.
A-14. jOHNMMORTON, STEVENPBORAS, TANANCHAIA. L.UCKTONG, SAMÉRICAMETROESENCIA DE ROSAS, WALANBRADSHAW, kEVINEB
EHRNS, mARCAJ. K.ORUDA, CHARLESAHERBST, WILLIAMMETROCCARTNEY, RAGHUVEERKHALKAR, CDanielSMITO, y
TIMOTEOM. F.ARRELL, “Función de la vesícula biliar antes y después de la funduplicatura,”Revista de Cirugía
Gastrointestinal, 6 (2002), 806–811.
A-15. miLLENDAvisjUNOS, "Terapia de reminiscencia para mujeres mayores con depresión: efectos de la clasificación de las intervenciones de
enfermería en el cuidado a largo plazo de vida asistida"Revista de Enfermería Gerontológica, 29 (2003), 26–33.
A-16. jOHNNYBENEY, EBETHDEVINO, VALBYCCÓMO, ROBERTOJIGNOFFO, LES UNMETROITSUNAGA, mEN UNSHAHKARAMI, Alex
METROCMETROILLAN, y yoES UNABERO. “Efecto del Seguimiento Telefónico en la Dimensión Bienestar Físico de la Calidad
de Vida en Pacientes con Cáncer”Farmacoterapia, 22 (2002), 1301–1311.
REFERENCIAS 301
A-17. jOHNSMORLEY, jOHNBRIDSON, TSOYP. N.CENIZA, jOHNBMILES, SARAHWHITE, y MATTEOKMPARECIDO, "Dosis baja
La metadona tiene un efecto analgésico en el dolor neuropático: un ensayo cruzado controlado, aleatorizado y doble
ciego.Medicina paliativa, 17 (2003), 576–587.
A-18. WK WOOy KE MCkENNA, “Combinación de fototerapia ultravioleta B TL01 y calcipotriol tópico para la psoriasis: un
ensayo clínico prospectivo, aleatorizado y controlado con placebo,”Revista británica de dermatología, 149 (2003),
146–150.
A-19. SimonaPAGORCELINI, gIULIANAVALLANTÍ, SILVIAnorteOZA, gUIDOPAGOLI, ADRENAJELAzzarín, gUISEPPETABUSI, y
ANTONIOGRAMORASIA, "Potencial timopoyético mejorado en individuos infectados por el VIH avirémicos con HAART mediante la
administración intermitente de IL-2",SIDA, 17 (2003), 1621–1630.
A-20. LYNNEE. W.AGENKNECHT, CARLDLANGEFELD, ANNLSCHERZINGER, jENFERMOMNRAÍZ DE FLORENCIA, STEVENMHAFFNER,
METROOHAMMEDFSAADy RICHARDNBERGMAN, “Sensibilidad a la insulina, secreción de insulina y grasa abdominal”, Diabetes,
52 (2003), 2490–2496.
A-21. YVESjAQUEMINA, FATIMAAHANKOUR, y GUYMETROARTENS, "Preferencia personal de los obstetras flamencos con
respecto al modo de parto y la actitud hacia la cesárea a pedido",Revista europea de obstetricia y
ginecología y biología reproductiva, 111 (2003), 164–166.
A-22. LIHinterfaz de usuarioy A. C.OLINBANA, “Sobrepeso y Obesidad en Niños de Shenzhen, República Popular de China,”
Salud y Lugar, 9 (2003), 371–376.
A-23. ANNEEBECKER, REBECCAABURBELL, kESAIAnorteAVARA, y StephenP.EJILMAN, "Comida compulsiva y trastorno por atracón compulsivo en una
sociedad indígena a pequeña escala: la visión desde Fiji",Revista Internacional de Trastornos de la Alimentación, 34 (2003),
423–431.
A-24. jACQUELINEUNOONÁN, RENSKERFABRICANTES DE AAIJ, y BryanDHTODO, "Estatura adulta en el síndrome de Noonan",
Revista americana de genética médica, 123A (2003), 68–71.
A-25. SAIYENHO, TAIHEN GLSOY, RICHARDFCAMPAÑA, y miENANODENISjANO, “Tabaquismo y salud percibida en chinos de Hong
Kong”,Ciencias Sociales y Medicina, 57 (2003), 1761–1770.
A-26. METROARKUSA. L.ANDOLT, mARGARETEVOLLRATH, kARÍNRIBI, hANSPETERP.EJNEHM, y FELIXHSENNHAUSER,
“Incidencia y Asociaciones de Síntomas de Estrés Postraumático de Padres e Hijos en Pacientes Pediátricos,”Revista
de Psicología y Psiquiatría Infantil, 44 (2003), 1199–1207.
A-27. METROORELLMETROICHAELAVRAM, DanielBLAUSTEIN, PAGAULA. F.EIN, norteAVEENGRAMOOEL, jYOTIPRAKASCSOMBRERO, y NEAL
METROITTMAN, "La hemoglobina predice la supervivencia a largo plazo en pacientes en diálisis: un estudio longitudinal de un
solo centro de 15 años y una tendencia de correlación entre la prealbúmina y la hemoglobina",Riñón Internacional, 64 (2003),
A-28. 6–11. jUDYP. W.ILKINS, ohCICATRIZESUMAN, DEBABENJAMÍN, y DÁVIDONHEMDON, "Comparación del cumplimiento autoinformado y
monitoreado de la inyección diaria de hormona de crecimiento humano en niños quemados"Quemaduras, 29 (2003), 697–701.
A-29. B. R.OBINSON, CT HEISE, JW MOORE, J. A.NELLA, EMOKOLOSKI, y E. E.SHAGHPOUR, “Terapia de reducción de la poscarga en
pacientes después de una operación de deflector intraauricular para la transposición de las grandes arterias,”
Cardiología Pediátrica, 23 (2003), 618–623.
A-30. PAGETERBORDENAR, jOHNnorteYLAND, DÁVIDONM CABORTAR, y DÁVIDOPAGIENOWSKI, “Comparación biomecánica del sistema de
sutura de reparación de menisco FasT-FIX con colchón vertical y flechas de menisco,”Revista americana de medicina
deportiva, 31 (2003), 374–378.
A-31. CLAUDIODora, BCOMERWA €LCHLI, ACHIMENEAmiLFERING, IMREGRAMOAlabama, DOMINIKWEISHAUPT, y NORBERTOBOOS, "El
Importancia de las dimensiones del canal espinal para discriminar las hernias de disco sintomáticas de las asintomáticas”,
Revista Europea de Columna Vertebral, 11 (2002), 575–581.
A-32. kIMBERLYK. N.AGY, ROXANAR. R.OBERTS, ROBERTOFSMITO, kIMBERLYTJOSEPH, gARIO, C. A.norte, FAránBOKHARI, y
jOHNBARRETTO, "Heridas de bala transmediastínicas: ¿los pacientes 'estables' son realmente estables?"Revista mundial
de cirugía, 26 (2002), 1247–1250.
A-33. ROBERTOOCHSENKU €hn, THOMASSTROWITZKI, mONIKAGRAMOUrtner, ALEXANDERSTRAUSS, ANDREASSCHULZE, hERMANN
HPPE, y PETERHILEMANNS, "Complicaciones del embarazo, riesgos obstétricos y resultado neonatal en embarazos únicos
y gemelares después de GIFT y FIV",Archivos de Ginecología y Obstetricia, 268 (2003), 256–261. William Tindall y el
A-34. Centro de Consultoría de la Universidad Estatal de Wright (2003).
A-35. RONALDF.CAMIONETAVOLLENHOVEN, SOFIAmiRESTAM, ANDSHARJU, jOHANBrata, y yoARSkLARESKOG, “Etanercept
Versus Etanercept más metotrexato: un estudio basado en registros que sugiere que la combinación es clínicamente
más eficaz”,Investigación y terapia de la artritis, 5 (2003), R347–R351.
A-36. kICOMETROIYAZAKI, TOSHIYAnorteISHIBE, FUMIHIROSATA, TAKAHIROIAMI, FAVÍOAKTÚ HACES, jORGEFLORES, YASUMASAj
METROIYAZAKIy kEISHUYASUDA, “Operación de extirpación con escleroterapia para venas varicosas primarias debido al
reflujo de la vena safena mayor: resultados de tres años,”Revista mundial de cirugía, 27 (2003), 551–553.
302 CAPÍTULO 7 PRUEBA DE HIPÓTESIS
A-48. LR RANGANATH, JACHRISTOFIDES, JWWBIEN, y V. M.ARCAS, “Efecto de la terapia de reemplazo hormonal en la composición de
ácidos grasos de la membrana plaquetaria,”Revista de Endocrinología, 148 (1996), 207–212.
A-49. METROICHAELYO GORAN, PAGATRICIADRISCOLL, RACHELjOHNSON, TSOYR. N.AGY, y GARIOHUNTER, “Calibración cruzada de
Técnicas de composición corporal contra la absorciometría de rayos X de energía dual en niños pequeños”,Diario
Americano de Nutrición Clínica, 63 (1996), 299–305.
A-50. METROANFREDOHARTARDO, PAGAULHABER, DIANAILIEVA, miLISABETHPAGREISINGER, gEORGSEIDLy J.OHANNESHUBER,
“Entrenamiento Sistemático de Fuerza como Modelo de Intervención Terapéutica,”Revista estadounidense de medicina física y
rehabilitación, 75 (1996), 21–28.
A-51. MVITACCA, E. C.LINI, W. S.PASSINI, LSCAGLIA, P. N.EGRINI, y A. QUADRI, “¿La posición supina empeora la función
respiratoria en sujetos de edad avanzada?”Gerontología, 42 (1996), 46–53.
A-52. StephenPORJOVEN, PAGETERLROSENBLATT, DIANEMPINGETON, ALLISONEHPREMIO, y StephenPBAKER, "El
Cabestrillo suburetral de malla Mersilene: una evaluación clínica y urodinámica”,Diario americano de obstetricia y
ginecología, 173 (1995), 1719–1726.
A-53. PAGAULTDIAMANTE, gERALDFELSENTHAL, StephenNMACCIOCCHI, DONNAHBÚLTIMO, y DENISELALIADO-CENSAYO,
“Efecto del deterioro cognitivo en el resultado de la rehabilitación”,Revista estadounidense de medicina física y
rehabilitación, 75 (1996), 40–43.
A-54. ROBERTOE. W.EINSTEIN, CATERINAA. L.OBOCKI, SharónGRAMORAVETT, hILLMANHMU, RONALDnorteEGRICH, jONATÁN
HERBST, DAnaGRAMOREENBERG, y DÁVIDOR. P.IEPER, "Disminución de los niveles de esteroides sexuales suprarrenales en ausencia
de supresión de glucocorticoides en mujeres asmáticas posmenopáusicas",Revista de Alergia e Inmunología Clínica, 97 (1996),
1–8.
A-55. BARRYL. G.GOMA, DARIOSORBI, DEBORÁLFRENCHE, mARIOJ. M.ARQUESA, gERARDJ. N.UOVO, RICHARDR. K.EW, y
LEONARDOA.ARBEIT, "Niveles de MMP-9 (gelatinasa B) en suero marcadamente elevados en la artritis reumatoide: un
marcador de laboratorio potencialmente útil"Inmunología Clínica e Inmunopatología, 78 (1996), 161–171.
REFERENCIAS 303
Este capítulo presenta el primero de una serie de capítulos dedicados a los modelos
lineales. El tema de este capítulo, el análisis de la varianza, proporciona una
metodología para dividir la varianza total calculada a partir de un conjunto de datos
en componentes, cada uno de los cuales representa la cantidad de la varianza total
que se puede atribuir a una fuente específica de variación. Los resultados de esta
partición se pueden usar para estimar y probar hipótesis sobre las varianzas y
medias de la población. En este capítulo centramos nuestra atención en la prueba de
hipótesis de medias. Específicamente, discutimos la prueba de diferencias entre
medias cuando hay interés en más de dos poblaciones o dos o más variables. Las
técnicas discutidas en este capítulo son ampliamente utilizadas en las ciencias de la
salud.
TEMAS
8.1INTRODUCCIÓN
8.2EL DISEÑO TOTALMENTE ALEATORIZADO
8.3EL DISEÑO DE BLOQUE COMPLETO ALEATORIZADO
8.4EL DISEÑO DE MEDIDAS REPETIDAS
8.5EL EXPERIMENTO FACTORIAL
8.6RESUMEN
304
8.1 INTRODUCCIÓN 305
8.1 INTRODUCCIÓN
Modelos linealesUn modelo estadístico es una representación matemática de las relaciones entre
variables. Más específicamente, para los propósitos de este libro, un modelo estadístico se usa con
mayor frecuencia para describir cómo las variables aleatorias se relacionan entre sí en un contexto en
el que el valor de unovariable de resultado,a menudo referido con la letra "y,”puede ser modelado
como una función de uno o másvariables explicativas,a menudo referido con la letra "X."De esta
manera, estamos interesados en determinar cuánta variabilidad en los resultados puede explicarse
por variables aleatorias que se midieron o controlaron como parte de un experimento. El modelo
lineal se puede expandir fácilmente a la forma más generalizada, en la que incluimos múltiples
variables de resultado simultáneamente. Estos modelos se denominan modelos lineales generales y
se pueden encontrar en libros de estadística más avanzados.
DEFINICIÓN
Unvariable de resultadoestá representado por el conjunto de valores medidos
que resultan de un experimento o algún otro proceso estadístico. Un variable
explicativa,por otro lado, es una variable que es útil para predecir el valor de
la variable de resultado.
Un modelo lineal es cualquier modelo que es lineal en los parámetros que definen el modelo.
Podemos representar tales modelos genéricamente en la forma:
En esta ecuación,bjrepresenta los coeficientes en el modelo ymijrepresenta un error aleatorio. Por lo tanto,
cualquier modelo que se pueda representar de esta forma, donde los coeficientes son constantes y el orden
algebraico del modelo es uno, se considera un modelo lineal. Aunque a primera vista esta ecuación puede
parecer abrumadora, en realidad es generalmente fácil encontrar valores para los parámetros utilizando
álgebra o cálculo básico, como veremos a medida que avanza el capítulo.
Veremos muchas representaciones de modelos lineales en esta y otras formas en los próximos
capítulos. En particular, nos enfocaremos en el uso de modelos lineales para analizar datos utilizando
el análisis de varianza para probar diferencias entre medias, regresión para hacer predicciones y
correlación para comprender asociaciones entre variables. En el contexto del análisis de varianza, las
variables predictoras sonvariables de clasificaciónse utilizan para definir factores de interés (p. ej.,
diferenciar entre un grupo de control y un grupo de tratamiento), y en el contexto de la correlación y
la regresión lineal, las variables predictoras suelen ser variables continuas, o al menos variables a un
nivel más alto que las clases nominales. Aunque los propósitos subyacentes de estas tareas pueden
parecer bastante diferentes, estudiar estas técnicas y
306 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
la estructura de los modelos utilizados para representarlos demostrará ser valiosa para
comprender algunas de las estadísticas inferenciales más utilizadas.
El análisis de varianza se usa para dos propósitos diferentes: (1) para estimar y probar
hipótesis sobre las varianzas de la población, y (2) para estimar y probar hipótesis sobre las
medias de la población. Nos interesa aquí el último uso. Sin embargo, como veremos, nuestras
conclusiones con respecto a las medias dependerán de las magnitudes de las varianzas
observadas.
Los conceptos y técnicas que cubrimos bajo el título de análisis de varianza son extensiones de
los conceptos y técnicas cubiertos en el Capítulo 7. En el Capítulo 7 aprendimos a probar la hipótesis
nula de que dos medias son iguales. En este capítulo aprenderemos a probar la hipótesis nula de que
tres o más medias son iguales. Mientras que, por ejemplo, lo que aprendimos en el Capítulo 7 nos
permite determinar si podemos concluir que dos tratamientos difieren en efectividad, lo que
aprendemos en este capítulo nos permite determinar si podemos concluir que tres o más
tratamientos difieren en efectividad. El siguiente ejemplo ilustra algunas ideas básicas involucradas
en la aplicación del análisis de varianza. Estos serán ampliados y elaborados más adelante en este
capítulo.
EJEMPLO 8.1.1
Supongamos que deseamos saber si tres fármacos difieren en su eficacia para reducir el colesterol
sérico en sujetos humanos. Algunos sujetos reciben el fármaco A, algún fármaco B y algún fármaco C.
Después de un período de tiempo específico, se toman medidas para determinar hasta qué punto se
redujo el colesterol sérico en cada sujeto. Encontramos que la cantidad en la que se redujo el
colesterol sérico no es la misma en todos los sujetos. En otras palabras, hay variabilidad entrelas
medidas. ¿Por qué, nos preguntamos, las medidas no son todas iguales? Presumiblemente, una de las
razones por las que no son iguales es que los sujetos recibieron diferentes medicamentos. Ahora
observamos las medidas de los sujetos que recibieron el fármaco A. Encontramos que la cantidad en
la que se redujo el colesterol sérico no es la misma entre estos sujetos. Encontramos que este es el
caso cuando observamos las medidas de los sujetos.
8.1 INTRODUCCIÓN 307
que recibieron la droga B y aquellos sujetos que recibieron la droga C. Vemos que hay
variabilidadentre las medidasdentrolos grupos de tratamiento. ¿Por qué, nos volvemos a
preguntar, estas medidas no son iguales? Entre las razones que me vienen a la mente están las
diferencias en la composición genética de los sujetos y las diferencias en sus dietas. A través de
un análisis de lavariabilidadque hemos observado, podremos llegar a una conclusión respecto a
la equivalencia de la eficacia de los tres fármacos. Para ello empleamos las técnicas y conceptos
del análisis de varianza. &
VariablesEn nuestro ejemplo aludimos a tres tipos de variables. Encontramos que estas
variables están presentes en todas las situaciones en las que el uso del análisis de varianza es
apropiado. Primero, tenemos elvariable de tratamiento,que en nuestro ejemplo era “droga”.
Teníamos tres “valores” de esta variable, droga A, droga B y droga C. El segundo tipo de
variable al que nos referimos es lavariable de respuesta.En el ejemplo, es un cambio en el
colesterol sérico. La variable de respuesta es la variable que esperamos que muestre diferentes
valores cuando se emplean diferentes "valores" de la variable de tratamiento. Finalmente,
tenemos las otras variables que mencionamos: composición genética y dieta. Estos se llaman
variables extrañas.Estas variables pueden tener un efecto sobre la variable de respuesta, pero
no son el foco de nuestra atención en el experimento. La variable de tratamiento es la variable
de interés principal, y la pregunta que debe responderse es: ¿Los diferentes "valores" de la
variable de tratamiento resultan en diferencias, en promedio, en la variable de respuesta?
El procedimiento ANOVAEn nuestra presentación del análisis de varianza para los diferentes
diseños, seguimos el procedimiento de diez pasos presentado en el Capítulo 7. Lo siguiente es una
reafirmación de los pasos del procedimiento, incluidos algunos conceptos nuevos necesarios para su
adaptación al análisis de varianza.
1. Descripción de los datos.Además de describir los datos de la forma habitual, mostramos los
datos de muestra en forma tabular.
2. Supuestos.Junto con los supuestos que subyacen al análisis, presentamos el modelo para
cada diseño que discutimos. El modelo consiste en una representación simbólica de un
valor típico de los datos que se analizan.
3. Hipótesis.
308 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
4. Estadística de prueba.
6. Regla de decisión.
7. Cálculo de la estadística de prueba. Los resultados de los cálculos aritméticos serán
resumido en una tabla llamada tabla de análisis de varianza (ANOVA). Las entradas en la
tabla facilitan la evaluación de los resultados del análisis.
8. Decisión estadística.
9. Conclusión.
10. Determinación depagvalor.
El uso de las computadorasLos cálculos requeridos por el análisis de varianza son más largos y
complicados que los que hemos encontrado en los capítulos anteriores. Por esta razón, la
computadora asume un papel importante en el análisis de la varianza. Todos los ejercicios que
aparecen en este capítulo son aptos para el análisis por computadora y pueden resolverse con los
paquetes estadísticos mencionados en el Capítulo 1. El resultado de los paquetes estadísticos puede
variar ligeramente del presentado en este capítulo, pero esto no debería representar un problema
importante para quienes que utilizan una computadora para analizar los datos de los ejercicios. Los
conceptos básicos de análisis de varianza que presentamos aquí deben proporcionar los
antecedentes necesarios para comprender la descripción de los programas y su salida en cualquiera
de los paquetes estadísticos.
Vimos en el Capítulo 7 cómo es posible probar la hipótesis nula de que no hay diferencia entre las
medias de dos poblaciones. No es raro que el investigador esté interesado en probar la hipótesis nula
de que no hay diferencia entre las medias de varias poblaciones. El estudiante que se encuentre por
primera vez con este problema podría estar inclinado a sugerir que todos los pares posibles de
medias muestrales se prueben por separado mediante el test de Student.tprueba. Supongamos que
hay cinco poblaciones involucradas. El número de posibles pares de medias muestrales es5C2¼10.
Como la cantidad de trabajo involucrada en llevar a cabo tantostpruebas es sustancial, valdría la pena
si estuviera disponible una alternativa más eficiente para el análisis. Una consecuencia más
importante de realizar todos los posiblestpruebas, sin embargo, es que es muy probable que lleve a
una conclusión falsa.
Supongamos que extraemos cinco muestras de poblaciones que tienen medias iguales. Como
hemos visto, serían 10 pruebas si hiciéramos por separado cada una de las posibles pruebas. Si
seleccionamos un nivel de significación dea¼ :05 para cada prueba, la probabilidad de no rechazar
una hipótesis de no diferencia en cada caso sería :95. Por la regla de probabilidad de la multiplicación,
si las pruebas fueran independientes entre sí, la probabilidad de no rechazar una hipótesis de
ninguna diferencia en los 10 casos seríad:95Þ10¼ :5987. La probabilidad de rechazar al menos una
hipótesis de no diferencia, entonces, sería 1 - :5987¼ :4013. Como sabemos que la hipótesis nula es
verdadera en todos los casos en este ejemplo ilustrativo, rechazar la hipótesis nula constituye la
comisión de un error tipo I. A la larga, entonces, en
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 309
Probando todos los posibles pares de medias de cinco muestras, cometeríamos un error de
tipo I el 40 por ciento de las veces. El problema se complica aún más en la práctica, ya que tres
o mástlas pruebas basadas en los mismos datos no serían independientes entre sí.
Queda claro, entonces, que se necesita algún otro método para probar una diferencia
significativa entre varias medias. El análisis de varianza proporciona dicho método.
ANOVA unidireccionalEl tipo más simple de análisis de varianza es el conocido como Análisis de
varianza de una sola vía,en el que sólo una fuente de variación, ofactor,es investigado. Es una
extensión a tres o más muestras de latprocedimiento de prueba (discutido en el Capítulo 7) para usar
con dos muestras independientes. Dicho de otra manera, podemos decir que eltLa prueba para usar
con dos muestras independientes es un caso especial de análisis de varianza de una vía.
En una situación típica, queremos usar un análisis de varianza de una vía para probar la
hipótesis nula de que tres o más tratamientos son igualmente efectivos. El experimento
necesario está diseñado de tal manera que los tratamientos de interés se asignan
completamente al azar a los sujetos u objetos sobre los que se van a realizar las mediciones
para determinar la eficacia del tratamiento. Por esta razón el diseño se llamadiseño
experimental completamente al azar.
Podemos asignar aleatoriamente sujetos a tratamientos de la siguiente manera. Supongamos
que tenemos 16 sujetos disponibles para participar en un experimento en el que deseamos comparar
cuatro fármacos. Numeramos a los sujetos del 01 al 16. Luego vamos a una tabla de números
aleatorios y seleccionamos 16 números consecutivos no duplicados entre 01 y 16. Para ilustrar,
usemos la Tabla A del Apéndice y un punto de inicio aleatorio que, digamos, está en la intersección de
la Fila 4 y las Columnas 11 y 12. El número de dos dígitos en esta intersección es 98. Los 16 números
consecutivos de dos dígitos siguientes (moviéndose hacia abajo) entre 01 y 16 son 16, 09, 06, 15, 14,
11 , 02, 04, 10, 07, 05, 13, 03, 12, 01 y 08. Asignamos los sujetos 16, 09, 06 y 15 al fármaco A; sujetos
14, 11, 02 y 04 al fármaco B; sujetos 10, 07, 05 y 13 al fármaco C; y los sujetos 03, 12, 01 y 08 al
fármaco D. Hacemos hincapié en que el número de sujetos en cada grupo de tratamiento no tiene por
qué ser el mismo. La figura 8.2.1 ilustra el esquema de asignación aleatoria.
Disponible
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 dieciséis
asignaturas
Aleatorio
dieciséis 09 06 15 14 11 02 04 10 07 05 13 03 12 01 08
números
dieciséis 09 06 15 14 11 02 04 10 07 05 13 03 12 01 08
Tratamiento A B C D
FIGURA 8.2.1Asignación de sujetos a tratamientos, diseño completamente al azar.
310 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Tratamiento
1 2 3 ... k
Xk kX j
Xnorte
T::¼ T:j¼ Xyo¼total de todas las observaciones
j¼1 j¼1i¼1
T::; Xk
- X--¼ norte¼ nortej
norte
j¼1
Componentes del modeloAl observar nuestro modelo, podemos ver que una observación típica
del conjunto total de datos bajo estudio se compone de (1) la gran media, (2) un efecto de tratamiento
y (3) un término de error que representa la desviación de la observación. de la media de su grupo.
Supuestos del ModeloLos supuestos para el modelo de efectos fijos son los
siguientes:
(a)Elkconjuntos de datos observados constituyenkmuestras aleatorias independientes de las
respectivas poblaciones.
(b)Cada una de las poblaciones de las que proceden las muestras se distribuye normalmente con
mediametrojy varianzas2 j.
(C)Cada una de las poblaciones tiene la misma varianza. Eso es,s2 1¼s2 2¼ . . .s2 k¼s2el
varianza común.
PAG
(d)Eltjson constantes desconocidas y tj¼0 ya que la suma de todas las desviaciones de lametroj
de su medio,metro,es cero
(mi)Elmiyotienen una media de 0, ya que la media deXyoesmetroj.
(F)Elmiyotienen una varianza igual a la varianza delXyo, desde elmiyoyXyodifieren solo por una
constante; es decir, la varianza del error es igual as2, la varianza común especificada en el
supuesto c.
(gramo)Elmiyose distribuyen normalmente (e independientemente).
3. Hipótesis.Probamos la hipótesis nula de que todas las medias de población o tratamiento son iguales
contra la alternativa de que los miembros de al menos un par no son iguales. Podemos formular las
hipótesis formalmente de la siguiente manera:
H0:metro1¼metro2¼ - - - ¼metrok
metro1=metro2=...=metrok
Si las medias de la población son iguales, cada efecto de tratamiento es igual a cero, por lo que,
alternativamente, las hipótesis pueden establecerse como
H0:tj¼0; j¼1; 2; . . . ;k
HA:no todotj¼0
las varianzas a partir de las cuales se calcula VR se calculan a su vez a partir de los datos
de la muestra. Los métodos por los cuales se calculan se darán en la discusión que sigue.
Los cálculos iniciales realizados en ANOVA de una vía consisten en dividir la variación
total presente en los datos observados en sus componentes básicos, cada uno de los cuales es
atribuible a una fuente identificable.
Aquellos que usan una computadora para los cálculos pueden desear omitir la siguiente discusión de
los cálculos involucrados en la obtención de la estadística de prueba.
La suma total de cuadradosAntes de que podamos hacer cualquier partición, primero debemos obtener la
suma total de los cuadrados. La suma total de cuadrados es la suma de los cuadrados de las desviaciones de
las observaciones individuales de la media de todas las observaciones tomadas en conjunto. Estesuma total
de cuadradosSe define como
Xk X nortej - -
acero inoxidable¼ Xyo- -X::2 (8.2.2)
j¼1 i¼1
dóndeSnortei¼1
j nos dice que sumemos las desviaciones al cuadrado para cada grupo de tratamiento, ySk j¼1Cuéntanos
para agregar elktotales de grupo obtenidos aplicandoSnortej i¼1. El lector reconocerá la ecuación
8.2.2 como el numerador de la varianza que se puede calcular a partir del conjunto completo de
observaciones tomadas en conjunto.
Xk X nortej - -2
SSO¼ Xyo- -X:j (8.2.3)
j¼1 i¼1
314 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Xk- -2
SSA¼ nortej-X:j- -X:: (8.2.4)
j¼1
En resumen, entonces, hemos encontrado que la suma total de cuadrados es igual a la suma
de la suma de cuadrados entre y dentro. Expresamos esta relación de la siguiente manera:
acero inoxidable¼SSAþSSO
A partir de las sumas de cuadrados que ahora hemos aprendido a calcular, es posible obtener dos
estimaciones de la varianza común de la población,s2. Se puede demostrar que cuando se cumplen
los supuestos y las medias de la población son todas iguales, tanto la suma de cuadrados entre como
la suma de cuadrados dentro, cuando se dividen por sus respectivos grados de libertad, producen
estimaciones independientes e insesgadas des2.
Xnortej - -
Xyo- -X:j2
i¼1
nortej-1
proporciona una estimación no sesgada de la varianza real de la población de la que procede la muestra.
Bajo el supuesto de que las varianzas de la población son todas iguales, podemos agrupar lask estimaciones
para obtener
X j -
Xknorte -
Xyo- -X:j2
RSU¼j¼1i¼1 (8.2.5)
Xk - -
nortej-1
j¼1
Esta es nuestra primera estimación des2y puede llamarse elvariación dentro de los grupos,ya
que es la suma de los cuadrados de la Ecuación 8.2.3 dentro de los grupos dividida por los
grados de libertad apropiados. El estudiante reconocerá esto como una extensión dekmuestras
del procedimiento de combinación de varianzas encontrado en los Capítulos 6 y 7 cuando las
varianzas de dos muestras se combinaron para usar eltdistribución. La cantidad en la Ecuación
8.2.5 se suele denominar dentro de los gruposcuadrado medioen lugar de la varianza dentro de
los grupos.
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 315
El cuadrado medio dentro de los grupos es una estimación válida des2sólo si las varianzas de la
población son iguales. No es necesario, sin embargo, paraH0cierto para que el cuadrado medio dentro de los
grupos sea una estimación válida des2; es decir, las estimaciones cuadráticas medias dentro de los gruposs2
independientemente de siH0es verdadero o falso, siempre que las varianzas de la población sean iguales.
s2¼nortes2- X (8.2.6)
Una estimación imparcial des2 - Xcalculado a partir de datos de muestra es proporcionado por
k-
PAG -2
- X:j- -X::
j¼1
k-1
k-
PAG -2
norte - X:j- -X::
j¼1
MSA¼ (8.2.7)
k-1
PAG
k - -2
nortej-X:j- -X::
MSA¼j¼1 (8.2.8)
k-1
Si, de hecho, la hipótesis nula es verdadera, esperaríamos que estas dos estimaciones des2estar
bastante cerca en magnitud. Si la hipótesis nula es falsa, es decir, si todas las medias poblacionales no son
iguales, esperaríamos que el cuadrado medio entre grupos, que se calcula usando las desviaciones al
cuadrado de las medias muestrales de la media general, sea mayor que el cuadrado medio entre grupos.
grupos significan el cuadrado.
Para comprender el análisis de varianza, debemos darnos cuenta de que el cuadrado medio
entre grupos proporciona una estimación válida des2cuando el supuesto de igual población
316 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
se cumplen las varianzasy cuando h0es verdad. Ambas condiciones, una hipótesis nula verdadera y varianzas
poblacionales iguales, deben cumplirse para que el cuadrado medio entre grupos sea una estimación válida
des2.
La relación de varianzaLo que tenemos que hacer ahora es comparar estas dos estimaciones de s2,
y hacemos esto calculando la siguiente razón de varianza, que es la estadística de prueba deseada:
Si las dos estimaciones son casi iguales, VR estará cerca de 1. Una relación cercana a 1 tiende a
respaldar la hipótesis de medias poblacionales iguales. Si, por el contrario, el cuadrado medio entre
grupos es considerablemente mayor que el cuadrado medio dentro de los grupos, VR será
considerablemente mayor que 1. Un valor de VR suficientemente mayor que 1 pondrá en duda la
hipótesis de medias poblacionales iguales.
Sabemos que debido a los caprichos del muestreo, incluso cuando la hipótesis nula es verdadera, es
poco probable que los cuadrados medios entre y dentro de los grupos sean iguales. Entonces, debemos
decidir qué tan grande debe ser la diferencia observada antes de que podamos concluir que la diferencia se
debe a algo más que a la fluctuación de muestreo. En otras palabras, ¿qué tan grande es el valor de VR
requerido para que estemos dispuestos a concluir que la diferencia observada entre nuestras dos
estimaciones des2¿No es el resultado de la casualidad solamente?
PAG
k - -2 MSA
Entre muestras SSA¼ nortej X--j- X-:: k-1 MSA¼SSA=dk-1Þ V:R-¼
j¼1 RSU
-
k PAG
PAG nortej
-2
Dentro de las muestras SSO¼ Xyo- X--j N-k RSU¼SSW=dN - kÞ
j¼1i¼1
PAG
kPAG
norte - j -2
Total acero inoxidable¼ X yo- X-:: norte-1
j¼1i¼1
Como hemos visto, calculamos VR en situaciones de este tipo colocando el cuadrado medio de
los grupos en el numerador y el cuadrado medio de los grupos en el denominador, de modo que los
grados de libertad del numerador sean iguales adk-1Þ,el número de grupos menos 1, y el valor de los
grados de libertad del denominador es igual a
!
Xk- - Xk
nortej-1 ¼ nortej -k¼N - k
j¼1 j¼1
Es esta última explicación la que solemos dar para los valores calculados de VR que
exceden el valor crítico deF.En otras palabras, si el valor calculado de VR es mayor que el
valor crítico deF,rechazamos la hipótesis nula.
318 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
H0:metro1¼metro2¼ - - - ¼metrok
¿El rechazo de la hipótesis sobre varianzas implica un rechazo de la hipótesis de medias poblacionales
iguales? La respuesta es sí. Un gran valor de VR resultó del hecho de que el cuadrado medio entre
grupos era considerablemente mayor que el cuadrado medio dentro de los grupos. Dado que el
cuadrado medio entre grupos se basa en la dispersión de las medias muestrales sobre su media
(llamada media general), esta cantidad será grande cuando haya una gran discrepancia entre los
tamaños de las medias muestrales. Entonces, debido a esto, un valor significativo de VR nos dice que
rechacemos la hipótesis nula de que todas las medias poblacionales son iguales.
EJEMPLO 8.2.1
Las carnes de caza, incluidas las del venado de cola blanca y las ardillas grises orientales, son
utilizadas como alimento por familias, cazadores y otras personas por motivos de salud, culturales o
personales. Un estudio realizado por David Holben (A-1) evaluó el contenido de selenio de la carne de
venado de cola blanca (venado) y ardilla gris (ardilla) en libertad obtenida de una región baja en
selenio de los Estados Unidos. Estos valores de contenido de selenio también se compararon con los
de la carne vacuna producida dentro y fuera de la misma región. Queremos saber si los niveles de
selenio son diferentes entre los cuatro grupos de carne.
Solución:
Tipo de carne
Tipo de carne
VEN
SQU
tipo de carne
RRB
NRB
0 20 40 60 80 100 120 140
Contenido de selenio (metrog/100 g de peso seco)
FIGURA 8.2.4 Contenido de selenio de cuatro tipos de carne. VEN¼venado, SQU¼ardilla, RRB¼
carne de res criada en la región y NRB¼carne de res criada fuera de la región.
320 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Fuente SS d.f. EM F
HA: No todometro's son iguales (Al menos una carne produce un contenido
promedio de selenio diferente del contenido promedio de selenio de al menos
otra carne).
acero inoxidable¼58009:05560
SSA¼21261:82886
SSO¼58009:05560 - 21261:82886¼36747:22674
Una palabra de precauciónEl diseño completamente al azar es simple y, por lo tanto, ampliamente
utilizado. Sin embargo, debe usarse solo cuando las unidades que reciben los tratamientos son
homogéneas. Si las unidades experimentales no son homogéneas, el investigador debe considerar un
diseño alternativo como uno de los que se discutirán más adelante en este capítulo.
En nuestro ejemplo ilustrativo, los tratamientos son tratamientos en el sentido habitual de la palabra.
Sin embargo, este no es siempre el caso, ya que el término "tratamiento" como se usa en el diseño
experimental es bastante general. Podríamos, por ejemplo, desear estudiar la respuesta a la misma
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 321
Producción:
Fuente DF SS EM F PAG
Tipo de carne 3 21262 7087 27,00 0,000
Error 140 36747 262
Total 143 58009
tratamiento (en el sentido usual de la palabra) de varias razas de animales. Sin embargo, nos
referiríamos a la raza del animal como el "tratamiento".
También debemos señalar que, aunque las técnicas de análisis de varianza se aplican más a
menudo a los datos resultantes de experimentos controlados, las técnicas también pueden usarse
para analizar los datos recopilados por una encuesta, siempre que se cumplan razonablemente los
supuestos subyacentes.
El Sistema SAS
La suma de
Fuente DF Cuadrícula Cuadrado medio F Valor PR > F
Modelo 3 21261.82886 7087.27629 27.00 <.0001
Error 140 36747.22674 262.48019
corregido Total 143 58009.05560
R Plaza coeficiente Var Raíz MSE selen Significar
Desviación Estándar. Esta última cantidad es igual a la raíz cuadrada del cuadrado medio del error que se
muestra en la tabla ANOVA. Finalmente, la salida de la computadora brinda representaciones gráficas de los
intervalos de confianza del 95% para la media de cada una de las cuatro poblaciones representadas por los
datos de la muestra.
La figura 8.2.6 contiene un SAS parcial®impresión resultante del análisis de los datos del
Ejemplo 8.2.1 mediante el uso del SAS®enunciado PROC ANOVA. S.A.S.®calcula algunas
cantidades adicionales como se muestra en la salida. R Plaza¼SSA=SST. Esta cantidad nos dice
qué proporción de la variabilidad total presente en las observaciones se explica por las
diferencias en respuesta a los tratamientos. CV:¼100 (raíz MSE/selen media). Root MSE es la raíz
cuadrada de MSW, y selen mean es la media de todas las observaciones.
Tenga en cuenta que la estadística de prueba VR está etiquetada de manera diferente por diferentes
programas de software estadístico. MINITAB, por ejemplo, usa F en lugar de VR SAS®utiliza la etiqueta Valor
F.
Un dispositivo útil para mostrar características importantes de un conjunto de datos analizados mediante un
análisis de varianza unidireccional es un gráfico que consta de diagramas de caja uno al lado del otro. Para cada
muestra se construye un diagrama de caja usando el método descrito en el Capítulo 2. La Figura 8.2.7 muestra los
diagramas de caja uno al lado del otro para el Ejemplo 8.2.1. Tenga en cuenta que en la Figura 8.2.7 la variable de
interés está representada por el eje vertical en lugar del eje horizontal.
AlternativasSi los datos disponibles para el análisis no cumplen con los supuestos para el
análisis de varianza de una vía como se analiza aquí, se puede considerar el uso del
procedimiento de Kruskal-Wallis, una técnica no paramétrica que se analiza en el Capítulo 13.
150
*
Selenio (metrog/100 g)
100
*
50
0
NRB RRB SQU VEN
tipo de carne
FIGURA 8.2.7Diagramas de caja uno al lado del otro para el ejemplo 8.2.1.
Ejemplo 8.2.1, donde hay cuatro tratamientos, podemos desear saber, después de rechazar H0:metro1
¼metro2¼metro3¼metro4, cuál de las seis posibles hipótesis individuales debe rechazarse. El
experimentador, sin embargo, debe tener cuidado al probar diferencias significativas entre las medias
individuales y siempre debe asegurarse de que el procedimiento sea válido. El tema crítico en el
procedimiento es el nivel de significancia. Aunque la probabilidad,a,de rechazar una hipótesis nula
verdadera para la prueba en su conjunto se hace pequeña, la probabilidad de rechazar al menos una
hipótesis verdadera cuando se prueban varios pares de medias es, como hemos visto, mayor quea.
Existen varios procedimientos de comparación múltiple comúnmente utilizados en la práctica. A
continuación, ilustramos dos procedimientos populares, a saber, la prueba HSD de Tukey y el método
de Bonferroni. Se remite al estudiante interesado a los libros de Hsu (7) y Westfall et al. (8) para
técnicas adicionales.
Prueba HSD de TukeyA lo largo de los años se han sugerido varios procedimientos para hacer comparaciones
múltiples. Un procedimiento de comparación múltiple desarrollado por Tukey (9) se usa con frecuencia para
probar la hipótesis nula de que todos los posibles pares de medias de tratamiento son iguales cuando las
muestras son todas del mismo tamaño. Cuando se emplea esta prueba, seleccionamos un nivel de
significación general dea.la probabilidad esa,entonces, que una o más de las hipótesis nulas es falsa.
rffiffiffiffiffiffiffiffiffiffiffi
MSE
HSD¼qa;k;Nk (8.2.9)
norte
Prueba de Tukey para tamaños de muestra desigualesCuando las muestras no son todas del
mismo tamaño, como en el caso del Ejemplo 8.2.1, la prueba HSD de Tukey dada por la
Ecuación 8.2.9 no es aplicable. El mismo Tukey (9) y Kramer (11), sin embargo, han extendido el
procedimiento de Tukey al caso donde los tamaños de muestra son diferentes. Su
procedimiento, que a veces se denomina método Tukey-Kra-mer, consiste en reemplazarMSE/n
en la Ecuación 8.2.9 condMSE=2Þ1=norteiþ1=nortej,dóndenorteiynortejson los tamaños de
muestra de los dos grupos a comparar. Si designamos la nueva cantidad por HSD , tenemos
como nuevo criterio de prueba
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
MSE 1 1
HSD¼qa;k;Nk þ (8.2.10)
2 nortei nortej
Cualquier valor absoluto de la diferencia entre dos medias muestrales que exceda HSD se
declara significativo.
EJEMPLO 8.2.2
Ilustremos el uso de la prueba HSD con los datos del Ejemplo 8.2.1.
Solución: El primer paso es preparar una tabla de todas las posibles diferencias (ordenadas)
entre las medias. Los resultados de este paso para el presente ejemplo se muestran en
la Tabla 8.2.5.
TABLA 8.2.6 Pruebas de comparación múltiple utilizando datos del ejemplo 8.2.1 y HSD
262:4802 1 1
H0:metroVEN¼metroRRB HSD ¼3:677 þ ¼8:68 no rechazarH0
2 42 53
desde 3:208 < 8:68
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
262:4802 1 1
H0:metroVEN¼metroSQU HSD ¼3:677 þ ¼10:04 RechazarH0 desde
2 42 30
17:37 > 10:04
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
262:4802 1 1
H0:metroVEN¼metroNRB HSD ¼3:677 þ ¼11:61 RechazarH0 desde
2 42 19
36:171 > 11:61
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
262:4802 1 1
H0:metroRRB¼metroSQU HSD ¼3:677 þ ¼9:60 RechazarH0 desde
2 53 30
14:163 > 9:60
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
262:4802 1 1
H0:metroRRB¼metroNRB HSD ¼3:677 þ ¼11:23 RechazarH0 desde
2 53 19
32:963 > 11:23
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
262:4802 1 1
H0:metroSQU¼metroNRB HSD ¼3:677 þ ¼12:32 RechazarH0 desde
2 30 19
18:801 > 12:32
326 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
El Sistema SAS
Alfa 0.05
Error Grados de libertad Error 140
Cuadrado medio 262.4802
Valor crítico del rango estudentizado 3.67719
Diferencia
tipo Entre 95% simultáneo
Comparación Medio Límites de confianza
intervalos de confianza para la diferencia entre todos los posibles pares de medias poblacionales. Este
resultado de SAS para el Ejemplo 8.2.1 se muestra en la Figura 8.2.8.
También se puede usar SPSS para realizar comparaciones múltiples mediante una variedad de
métodos, incluido el de Tukey. Los resultados de SPSS para el HSD de Tukey y el método de Bonferroni para
los datos del Ejemplo 8.2.1 se muestran en las Figuras 8.2.9 y 8.2.10, respectivamente. Los resultados
contienen una comparación exhaustiva de las medias muestrales, junto con los errores estándar asociados,
pagvalores e intervalos de confianza del 95%. &
comparaciones múltiples
FIGURA 8.2.9Salida de SPSS para el HSD de Tukey usando datos del Ejemplo 8.2.1.
comparaciones múltiples
FIGURA 8.2.10Salida de SPSS para el método de Bonferroni usando datos del Ejemplo 8.2.1.
327
328 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
EJERCICIOS
En el ejercicio 8.2.1 a 8.2.7, siga los diez pasos del análisis de la prueba de hipótesis de varianza para ver si puede
concluir que hay una diferencia entre las medias de la población. Dejara¼ :05 por cada prueba. Use el procedimiento
HSD de Tukey para probar diferencias significativas entre pares de medias individuales (si corresponde). usa lo mismo
avalor para elFprueba. Construya un diagrama de puntos y diagramas de caja uno al lado del otro de los datos.
8.2.1.Los investigadores de la Universidad Case Western Reserve (A-2) querían desarrollar e implementar un
transductor, manejable en un entorno clínico, para cuantificar los momentos isométricos producidos en la
articulación del codo por personas con tetraplejía (parálisis o paresia de las cuatro extremidades). El aparato, llamado
transductor de momento del codo (EMT), mide la fuerza que el codo puede ejercer cuando se flexiona. La variable de
salida es el voltaje. La máquina se probó en cuatro ángulos de extensión de codo diferentes, 30, 60, 90 y 120 grados,
en un codo simulado que constaba de dos vigas de aluminio con bisagras. Los datos se muestran en la siguiente
tabla.
30 60 90 120
30 60 90 120
8.2.2.Los pacientes que padecen enfermedades reumáticas u osteoporosis a menudo sufren pérdidas críticas en la densidad mineral ósea
(DMO). El alendronato es un medicamento recetado para desarrollar o prevenir una mayor pérdida de DMO. Holcomb y
Rothenberg (A-3) observaron a 96 mujeres que tomaban alendronato para determinar si existía una diferencia en el cambio
porcentual medio de la DMO entre cinco clasificaciones de diagnóstico primario diferentes.
Los pacientes del grupo 1 fueron diagnosticados con artritis reumatoide (AR). Los pacientes del grupo 2 eran una
colección mixta de pacientes con enfermedades que incluían lupus, granulomatosis de Wegener y poliarteritis, y otras
enfermedades vasculíticas (LUPUS). Los pacientes del grupo 3 tenían polimialgia reumática o artritis temporal
(PMRTA). Los pacientes del grupo 4 tenían artrosis (OA) y los pacientes del grupo 5 tenían osteoporosis (O) sin otras
enfermedades reumáticas identificadas en la historia clínica. Los cambios en la DMO se muestran en la siguiente
tabla.
Diagnóstico
(Continuado)
330 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Diagnóstico
Fuente: Datos proporcionados por cortesía de John P. Holcomb, Ph.D. y Ralph J. Rothenberg, MD
8.2.3.Ilich-Ernst et al. (A-4) investigó la ingesta dietética de calcio entre una muestra representativa de 113 mujeres sanas de 20 a 88 años
de edad. Los investigadores formaron cuatro grupos de edad de la siguiente manera: Grupo A, 20,0 a 45,9 años; grupo B,
46,0-55,9 años; grupo C, 56,0-65,9 años; y grupo D, mayores de 66 años. El calcio de la ingesta de alimentos se midió en mg/día.
Los datos a continuación son consistentes con las estadísticas resumidas proporcionadas en el documento.
A B C D A B C D
A B C D A B C D
8.2.4.Oro et al. (A-5) investigaron la eficacia para dejar de fumar de un parche de nicotina, bupropion SR o ambos, cuando se
administran junto con terapia cognitivo-conductual. Pacientes consecutivos que dan su consentimientodnorte¼164Þ
se asignaron a uno de los tres tratamientos de acuerdo con sus preferencias personales: parche de nicotinadPNT;
norte¼13Þ,bupropión SRdB;norte¼92Þ,y bupropión SR más parche de nicotina dBNTP;norte¼59Þ.En su primera clase
para dejar de fumar, los pacientes calcularon la cantidad de paquetes de cigarrillos que fumaban actualmente por día
y la cantidad de años que fumaban. Los "años del paquete" es el número promedio de paquetes que el sujeto fumó
por día multiplicado por el número de años que el sujeto había fumado. Los resultados se muestran en la siguiente
tabla.
Pack Años
NTP B BNTP
15 8 60 90 8 80
17 10 60 90 15 80
18 15 60 90 25 82
20 20 60 95 25 86
20 22 60 96 25 87
20 24 60 98 26 90
30 25 60 98 30 90
37 26 66 99 34 90
43 27 66 100 35 90
48 29 67 100 36 90
60 30 68 100 40 95
100 30 68 100 45 99
100 35 70 100 45 100
35 70 100 45 102
39 70 105 45 105
40 75 110 48 105
40 75 110 48 105
40 75 120 49 111
40 75 120 52 113
40 76 123 60 120
40 80 125 60 120
45 80 125 60 125
45 80 126 64 125
(Continuado)
332 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Pack Años
NTP B BNTP
45 80 130 64 129
50 80 130 70 130
51 80 132 70 133
52 80 132 70 135
55 84 142 75 140
58 84 157 75 154
60 84 180 76
60 90
Fuente: Datos proporcionados por cortesía de Paul B. Gold, Ph.D.
8.2.5.En un estudio de Wang et al. (A-6), los investigadores examinaron la fortaleza ósea. Recolectaron 10 fémures
cadavéricos de sujetos en tres grupos de edad: jóvenes (19 a 49 años), de mediana edad (50 a 69 años) y
ancianos (70 años o más) [Nota: faltaba un valor en la mediana edad grupo]. Una de las medidas de resultado
(W)fue la fuerza en Newtons necesaria para fracturar el hueso. La siguiente tabla muestra los datos para los
tres grupos de edad.
8.2.6.En un estudio de 90 pacientes en diálisis renal, Farhad Atassi (A-7) evaluó las prácticas de cuidado oral en el hogar.
Recopiló datos de 30 sujetos que estuvieron en (1) diálisis durante menos de 1 año, (2) diálisis durante 1 a 3 años y (3)
diálisis durante más de 3 años. La siguiente tabla muestra las puntuaciones del índice de placa para estos sujetos.
Una puntuación más alta indica una mayor cantidad de placa.
8.2.7.La trombocitopenia es una condición de plaquetas anormalmente bajas que a menudo ocurre durante la enterocolitis
necrotizante (ECN), una enfermedad grave en los bebés que puede causar daño a los tejidos de los intestinos. Ragazzi
et al. (A-8) investigó las diferencias en el registro10de recuentos de plaquetas en 178 lactantes con NEC. Los pacientes
se agruparon en cuatro categorías de estado NEC. El grupo 0 se refirió a lactantes sin gangrena, el grupo 1 se refirió a
sujetos en quienes la gangrena se limitó a un solo segmento intestinal, el grupo 2 se refirió a pacientes con dos o más
segmentos intestinales de gangrena y el grupo 3 se refirió a pacientes con la mayoría de los pequeños y el intestino
grueso involucrado. La siguiente tabla da el registro10
recuentos de plaquetas para estos sujetos.
Agrupación de gangrena
0 1 2 3
Agrupación de gangrena
0 1 2 3
8.2.8.El objetivo de un estudio de Romita et al. (A-9) fue determinar si hay una respuesta diferente
a diferentes bloqueadores de los canales de calcio. Doscientos cincuenta pacientes con hipertensión leve a
moderada fueron asignados al azar a 4 semanas de tratamiento con dosis una vez al día de (1) lercanidipina,
(2) felodipina o (3) nifedipina. Antes del tratamiento y al final de las 4 semanas, se midió la presión arterial
sistólica de cada uno de los sujetos. Luego, los investigadores calcularon el cambio en la presión arterial
sistólica. ¿Cuál es la variable de tratamiento en este estudio? ¿La variable de respuesta? ¿Qué variables
extrañas se te ocurren cuyos efectos estarían incluidos en el término de error? ¿Cuáles son los “valores” de la
variable de tratamiento? Construya una tabla de análisis de varianza en la que especifique para este estudio
las fuentes de variación y los grados de libertad.
8.2.9.Kosmiski et al. (A-10) realizó un estudio para examinar las distribuciones de grasa corporal de hombres infectados y no
infectados por el VIH, tomando y no tomando inhibidores de la proteasa (IP), y habiendo sido diagnosticados y no diagnosticados de lipodistrofia. La lipodistrofia es un síndrome asociado con
el tratamiento del VIH/PI que sigue siendo controvertido. Generalmente se refiere a la acumulación de grasa en el abdomen o vísceras acompañada de resistencia a la insulina, intolerancia a
la glucosa y dislipidemia. En el estudio, 14 sujetos estaban tomando inhibidores de la proteasa y se les diagnosticó lipodistrofia, 12 estaban tomando inhibidores de la proteasa, pero no se les
diagnosticó lipodistrofia, cinco eran VIH positivos, no tomaban inhibidores de la proteasa, ni tenían lipodistrofia diagnosticada, y 43 sujetos eran VIH negativos. y no diagnosticados con
lipodistrofia. Cada uno de los sujetos se sometió a análisis de composición corporal y distribución de grasa mediante absorciometría de rayos X de energía dual y tomografía computarizada.
Luego, los investigadores pudieron examinar el porcentaje de grasa corporal en el tronco. ¿Cuál es la variable de tratamiento? ¿La variable de respuesta? ¿Cuáles son los “valores” de la
variable de tratamiento? ¿Quiénes son los sujetos? ¿Qué variables extrañas se te ocurren cuyos efectos estarían incluidos en el término de error? ¿Cuál fue el propósito de incluir hombres VIH
negativos en el estudio? Construya una tabla ANOVA en la que especifique las fuentes de variación y los grados de libertad para cada una. Los autores informaron un VR calculado de 11,79.
Cuál es el ¿Cuál es la variable de tratamiento? ¿La variable de respuesta? ¿Cuáles son los “valores” de la variable de tratamiento? ¿Quiénes son los sujetos? ¿Qué variables extrañas se te
ocurren cuyos efectos estarían incluidos en el término de error? ¿Cuál fue el propósito de incluir hombres VIH negativos en el estudio? Construya una tabla ANOVA en la que especifique las
fuentes de variación y los grados de libertad para cada una. Los autores informaron un VR calculado de 11,79. Cuál es el ¿Cuál es la variable de tratamiento? ¿La variable de respuesta? ¿Cuáles
son los “valores” de la variable de tratamiento? ¿Quiénes son los sujetos? ¿Qué variables extrañas se te ocurren cuyos efectos estarían incluidos en el término de error? ¿Cuál fue el propósito
de incluir hombres VIH negativos en el estudio? Construya una tabla ANOVA en la que especifique las fuentes de variación y los grados de libertad para cada una. Los autores informaron un
Elbloque completo al azarEl diseño fue desarrollado alrededor de 1925 por RA Fisher, quien buscaba
métodos para mejorar los experimentos de campo agrícola. El diseño de bloques completos al azar es
un diseño en el que las unidades (llamadasunidades experimentales)a los que se aplican los
tratamientos se subdividen en grupos homogéneos denominadosbloques,de modo que el número de
unidades experimentales en un bloque sea igual al número (o algún múltiplo del número) de
tratamientos que se están estudiando. Luego, los tratamientos se asignan aleatoriamente a las
unidades experimentales dentro de cada bloque. Cabe recalcar que cada tratamiento aparece en cada
bloque, y cada bloque recibe todos los tratamientos.
8.3 EL DISEÑO DE BLOQUE COMPLETO ALEATORIZADO 335
ObjetivoEl objetivo de utilizar el diseño de bloques completos al azar es aislar y eliminar del término
de error la variación atribuible a los bloques, mientras se asegura que los medios de tratamiento
estarán libres de efectos de bloque. La efectividad del diseño depende de la capacidad de lograr
bloques homogéneos de unidades experimentales. La capacidad de formar bloques homogéneos
depende del conocimiento que tenga el investigador del material experimental. Cuando el bloqueo se
usa de manera efectiva, el cuadrado medio del error en la tabla ANOVA se reducirá, la VR aumentará y
la posibilidad de rechazar la hipótesis nula mejorará. En los experimentos con animales, la raza del
animal puede utilizarse como factor de bloqueo. Las camadas también se pueden utilizar como
bloques, en cuyo caso un animal de cada camada recibe un tratamiento. En experimentos con seres
humanos, si se desea que se eliminen las diferencias resultantes de la edad, entonces se pueden
agrupar los sujetos según la edad para que una persona de cada edad reciba cada tratamiento. El
diseño de bloques completos al azar también se puede emplear con eficacia cuando un experimento
debe realizarse en más de un laboratorio (bloque) o cuando se requieren varios días (bloques) para
completarlo.
La asignación aleatoria de tratamientos a los sujetos está restringida en el diseño de bloques
completos al azar. Es decir, cada tratamiento debe representarse un número igual de veces (una o
más veces) dentro de cada unidad de bloqueo. En la práctica, esto generalmente se logra asignando
una permutación aleatoria del orden de los tratamientos a los sujetos dentro de cada bloque. Por
ejemplo, si hay cuatro tratamientos que representan tres fármacos y un placebo (fármaco A, fármaco
B, fármaco C y placebo [P]), ¡entonces hay 4!¼24 permutaciones posibles de los cuatro tratamientos:
(A, B, C, P) o (A, C, B, P) o (C, A, P, B), y así sucesivamente. A continuación, se asigna aleatoriamente
una permutación a cada bloque.
VentajasUna de las ventajas del diseño de bloques completos al azar es que es fácil de
entender. Además, ciertas complicaciones que pueden surgir en el curso de un
experimento se manejan fácilmente cuando se emplea este diseño.
Es instructivo señalar aquí que el análisis de comparaciones pareadas presentado en el
Capítulo 7 es un caso especial del diseño de bloques completos al azar. El ejemplo 7.4.1, por ejemplo,
puede tratarse como un diseño de bloques completos al azar en el que los dos puntos en el tiempo
(antes de la operación y después de la operación) son los tratamientos y los individuos en quienes se
tomaron las medidas son los bloques.
Visualización de datosEn general, los datos de un experimento que utiliza el diseño de bloques
completos al azar se pueden mostrar en una tabla como la Tabla 8.3.1. Debe observarse la
siguiente nueva notación en esta tabla:
Xk
totales de losiel bloque¼Ti:¼ Xyo
j¼1
Xk
Xyo
j¼1 T i:
media de laiel bloque¼ -Xi:¼ ¼
k k
Xk X norte
Tratos
indicando que el total general puede obtenerse sumando los totales de las filas o sumando los totales de las
columnas.
ANOVA de dos víasLa técnica para analizar los datos de un diseño de bloques
completos al azar se llamaanálisis de varianza de dos víasya que una observación se
categoriza sobre la base de dos criterios: el bloque al que pertenece y el grupo de
tratamiento al que pertenece.
Los pasos para la prueba de hipótesis cuando se utiliza el diseño de bloques completos al azar son los
siguientes:
1. Datos.Después de identificar los tratamientos, los bloques y las unidades experimentales, los
datos, por conveniencia, se pueden mostrar como en la Tabla 8.3.1.
2. Supuestos.El modelo para el diseño de bloques completos al azar y sus
supuestos subyacentes son los siguientes:
El modelo
Xyo¼metroþbiþtjþmiyo
(8.3.1)
i¼1; 2; . . . ;norte; j¼1; 2; . . . ;k
en este modelo
tj¼ bi¼0
j¼1 i¼1
Las consecuencias de una violación de esta suposición son resultados engañosos. Uno no
necesita preocuparse por la violación de la suposición de aditividad a menos que la media más
grande sea más del 50 por ciento mayor que la más pequeña.
Cuando estos supuestos son ciertos, eltjybison un conjunto de constantes fijas y tenemos una
situación que se ajusta al modelo de efectos fijos.
3. Hipótesis.Podemos probar
H0:tj¼0;j¼1; 2; . . . ;k
contra la alternativa
HA: no todotj¼0
Una prueba de hipótesis con respecto a los efectos de bloque generalmente no se lleva a cabo
bajo los supuestos del modelo de efectos fijos por dos razones. Primero, el interés principal está en
los efectos del tratamiento, siendo el propósito habitual de los bloques proporcionar un medio para
eliminar una fuente extraña de variación. Segundo, aunque las unidades experimentales se asignan
aleatoriamente a los tratamientos, los bloques se obtienen de manera no aleatoria.
Las fórmulas para las cantidades en la Ecuación 8.3.2 son las siguientes:
Xk Xnorte- -2
acero inoxidable¼ Xyo- -X:: (8.3.3)
j¼1 i¼1
Xk X norte
2
SSBl¼ d-Xi-- -X::Þ (8.3.4)
j¼1 i¼1
Xk Xnorte- -
SSTr¼ - X-j- -X::2 (8.3.5)
j¼1 i¼1
Los grados de libertad apropiados para cada componente de la Ecuación 8.3.2 son
Los grados de libertad residuales, al igual que la suma residual de cuadrados, se pueden obtener por
resta de la siguiente manera:
8. Decisión estadística.Se puede demostrar que cuando se aplica el modelo de efectos fijos y la
hipótesis nula de ningún efecto de tratamientodtodoti¼0Þes cierto, tanto el cuadrado medio
del error, o residual, como el cuadrado medio de los tratamientos son estimaciones de la
varianza comúns2. Cuando la hipótesis nula es verdadera, por lo tanto, la cantidad
MSTr=MSE
se distribuye comoFconk-1 numerador grados de libertad ydn-1Þ ðk-1Þ grados de
libertad del denominador. La relación de varianza calculada, por lo tanto, se
compara con el valor crítico deF.
EJEMPLO 8.3.1
Un fisioterapeuta deseaba comparar tres métodos para enseñar a los pacientes a usar un
determinado dispositivo protésico. Sintió que la tasa de aprendizaje sería diferente para pacientes de
diferentes edades y deseaba diseñar un experimento en el que se pudiera tener en cuenta la
influencia de la edad.
Método de enseñanza
Menos de 20 7 9 10 26 8.67
20 a 29 8 9 10 27 9.00
30 a 39 9 9 12 30 10.00
40 a 49 10 9 12 31 10.33
50 y más 11 12 14 37 12.33
Total 45 48 58 151
3. Hipótesis.
H0:tj¼0j¼1; 2; 3 HA: no
todotj¼0
Total 46.9335 14
8.3 EL DISEÑO DE BLOQUE COMPLETO ALEATORIZADO 341
9. Conclusión.Concluimos que no todos los efectos de los tratamientos son iguales a cero, o de manera
equivalente, que no todas las medias de los tratamientos son iguales.
Análisis informáticoLa mayoría de los paquetes de software estadístico analizarán los datos de un
diseño de bloques completos aleatorios. Ilustramos la entrada y la salida para MINITAB. Usamos los
datos del experimento para configurar una hoja de trabajo de MINITAB que consta de tres columnas.
La columna 1 contiene las observaciones, la columna 2 contiene números que identifican el bloque al
que pertenece cada observación y la columna 3 contiene números que identifican el tratamiento al
que pertenece cada observación. La figura 8.3.1 muestra la hoja de trabajo de MINITAB para el
ejemplo 8.3.1. La figura 8.3.2 contiene el cuadro de diálogo MINITAB que inicia el análisis y la tabla
ANOVA resultante.
La tabla ANOVA del SAS®La salida para el análisis del Ejemplo 8.3.1 se muestra en la
Figura 8.3.3. Tenga en cuenta que en esta salida el modelo SS es igual a la suma deSSBl y
SSTr.
AlternativasCuando los datos disponibles para el análisis no cumplen con los supuestos del
diseño de bloques completos al azar como se analiza aquí, el procedimiento de Friedman
analizado en el Capítulo 13 puede resultar una alternativa no paramétrica adecuada.
FILA C1 C2 C3
1 7 1 1
2 9 1 2
3 10 1 3
4 8 2 1
5 9 2 2
6 10 2 3
7 9 3 1
8 9 3 2
9 12 3 3
10 10 4 1
11 9 4 2
12 12 4 3
13 11 5 1
14 12 5 2
15 14 5 3
Producción:
FIGURA 8.3.2Cuadro de diálogo de MINITAB y salida para el análisis de varianza de dos factores, Ejemplo 8.3.1.
EJERCICIOS
Para los Ejercicios 8.3.1 a 8.3.5 realice el procedimiento de prueba de hipótesis de diez pasos para el análisis de varianza.
8.3.1.El objetivo de un estudio de Brooks et al. (A-11) fue evaluar la eficacia del uso de una cocina virtual para la
formación profesional de personas con problemas de aprendizaje. Veinticuatro estudiantes participaron
EJERCICIOS 343
El Sistema SAS
en el estudio. Cada participante realizó cuatro tareas de preparación de alimentos y se les calificó según la calidad de la
preparación. Luego, cada participante recibió capacitación vocacional regular en preparación de alimentos (capacitación real),
capacitación virtual usando una pantalla de TV y computadora de una cocina típica, capacitación con libros de trabajo con
materiales de lectura especializados y sin capacitación (para servir como control). Después de cada uno de estos
entrenamientos, los sujetos fueron evaluados en la preparación de alimentos. Las puntuaciones de mejora para cada uno de
los cuatro métodos de entrenamiento se muestran en la siguiente tabla.
1 2 10 2 -4
2 4 3 2 1
3 4 13 0 1
4 6 11 2 1
5 5 13 5 1
6 2 0 1 4
7 10 17 2 6
8 5 5 2 2
9 10 4 5 2
10 3 6 9 3
11 11 9 8 7
12 10 9 6 10
13 5 8 4 1
(Continuado)
344 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
14 8 11 1 1
15 4 8 5 2
dieciséis 11 8 10 2
17 6 11 1 3
18 2 5 1 2
19 3 1 0 -3
20 7 5 0 -6
21 7 10 4 4
22 8 7 -2 8
23 4 9 3 0
24 9 6 3 5
Fuente: Datos proporcionados por cortesía de BM Brooks, Ph.D.
Después de eliminar los efectos del sujeto, ¿podemos concluir que las puntuaciones de mejora difieren entre los métodos de
entrenamiento? Dejara¼ :05.
8.3.2.McConville et al. (A-12) informan los efectos de masticar un chicle de nicotina (que contiene 2 mg de nicotina)
sobre la frecuencia de los tics en pacientes cuyo trastorno de Tourette no se controló adecuadamente con
haloperidol. Las siguientes son las frecuencias de tic bajo cuatro condiciones:
1 249 108 93 59
2 1095 593 600 861
3 83 27 32 61
4 569 363 342 312
5 368 141 167 180
6 326 134 144 158
7 324 126 312 260
8 95 41 63 71
9 413 365 282 321
10 332 293 525 455
Fuente: Datos proporcionados por cortesía de Brian J. McConville, M. Harold Fogelson,
Andrew B. Norman, William M. Klykylo, Pat Z. Manderscheid, Karen W. Parker y Paul R.
Sanberg. “Potenciación de la nicotina del haloperidol en la reducción de la frecuencia de
los tics en el trastorno de Tourette”Diario Americano de Psiquiatría, 148 (1991), 793–794.
Copyright # 1991, Asociación Americana de Psiquiatría.
Después de eliminar los efectos del paciente, ¿podemos concluir que el número medio de tics difiere entre las cuatro
condiciones? Dejara¼ :01.
8.3.3.Un equipo de remotivación en un hospital psiquiátrico realizó un experimento para comparar cinco métodos para
remotivar a los pacientes. Los pacientes fueron agrupados según el nivel de motivación inicial. pacientes en cada
EJERCICIOS 345
grupo fueron asignados aleatoriamente a los cinco métodos. Al final del período experimental, los pacientes fueron
evaluados por un equipo compuesto por un psiquiatra, un psicólogo, una enfermera y un trabajador social, ninguno
de los cuales conocía el método al que habían sido asignados los pacientes. El equipo asignó a cada paciente una
puntuación compuesta como medida de su nivel de motivación. Los resultados fueron los siguientes:
Nulo 58 68 60 68 64
Muy bajo 62 70 sesenta y cinco 80 69
Bajo 67 78 68 81 70
Promedio 70 81 70 89 74
¿Estos datos proporcionan evidencia suficiente para indicar una diferencia en las puntuaciones medias entre los métodos?
Dejar a¼ :05.
8.3.4.El supervisor de enfermería en un departamento de salud local deseaba estudiar la influencia de la hora del día en la duración de las
visitas domiciliarias del personal de enfermería. Se pensó que las diferencias individuales entre las enfermeras podrían ser
grandes, por lo que se utilizó a la enfermera como factor de bloqueo. El supervisor de enfermería recopiló los siguientes datos:
A 27 28 30 23
B 31 30 27 20
C 35 38 34 30
D 20 18 20 14
¿Estos datos brindan suficiente evidencia para indicar una diferencia en la duración de la visita domiciliaria entre las
diferentes horas del día? Dejara¼ :05.
8.3.5.Cuatro sujetos participaron en un experimento para comparar tres métodos para aliviar el estrés. Cada sujeto fue
colocado en una situación estresante en tres ocasiones diferentes. Cada vez se utilizó un método diferente para
reducir el estrés con el sujeto. La variable de respuesta es la cantidad de disminución en el nivel de estrés medido
antes y después de la aplicación del tratamiento. Los resultados fueron los siguientes:
Tratamiento
Sujeto A B C
1 dieciséis 26 22
2 dieciséis 20 23
3 17 21 22
4 28 29 36
¿Podemos concluir a partir de estos datos que los tres métodos difieren en efectividad? Dejara¼ :05.
346 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
8.3.6.En un estudio de Valencia et al. (A-13), los efectos de la temperatura y la humedad ambientales en el gasto
energético de 24 horas se midieron mediante calorimetría indirecta de cuerpo entero en ocho hombres
jóvenes de peso normal que usaban ropa ligera estandarizada y seguían un régimen de actividad controlada.
Los efectos de la temperatura se evaluaron mediante mediciones a 20, 23, 26 y 30 grados Celsius con
humedad ambiental ya 20 y 30 grados Celsius con humedad alta. ¿Cuál es la variable de bloqueo? ¿La
variable de tratamiento? ¿Cuántos bloques hay? ¿Cuántos tratamientos? Construya una tabla ANOVA en la
que especifique las fuentes de variabilidad y los grados de libertad para cada una. ¿Qué son las unidades
experimentales? ¿Qué variables extrañas se te ocurren cuyos efectos estarían incluidos en el término de
error?
8.3.7.Hodgson et al. (A-14) realizaron un estudio en el que indujeron la dilatación gástrica en seis perros anestesiados
mantenidos con dosis constantes de isoflurano en oxígeno. Las mediciones cardiopulmonares antes de la
distensión estomacal (línea base) se compararon con las mediciones tomadas durante 0,1, 0,5, 1,0, 1,5, 2,5 y
3,5 horas de distensión estomacal analizando el cambio desde la línea base. Después de distender el
estómago, el índice cardíaco aumentó de 1,5 a 3,5 horas. El volumen sistólico no cambió. Durante la inflación,
se observaron aumentos en la presión arterial sistémica, arterial pulmonar y auricular derecha. La frecuencia
respiratoria no se modificó. PaO2tendía a disminuir durante la dilatación gástrica. ¿Qué son las unidades
experimentales? ¿Los bloques? ¿Variable de tratamiento? ¿Variable(s) de respuesta? ¿Puedes pensar en
alguna variable extraña cuyo efecto contribuiría al término de error? Construya una tabla ANOVA para este
estudio en la que identifique las fuentes de variabilidad y especifique los grados de libertad.
Uno de los diseños experimentales más utilizados en el campo de las ciencias de la salud es el diseño
de medidas repetidas.
DEFINICIÓN
Amedidas repetidasEl diseño es aquel en el que se realizan mediciones de la
misma variable sobre cada sujeto en dos o más ocasiones diferentes.
Las diferentes ocasiones durante las cuales se toman las medidas pueden ser puntos en el
tiempo o diferentes condiciones, como diferentes tratamientos.
VentajasLa principal ventaja del diseño de medidas repetidas es, como se mencionó anteriormente,
su capacidad para controlar variaciones extrañas entre sujetos. Una ventaja adicional es el hecho de
que se necesitan menos sujetos para el diseño de medidas repetidas que
8.4 EL DISEÑO DE MEDIDAS REPETIDAS 347
por un diseño en el que se utilizan diferentes sujetos para cada ocasión en la que se realizan las
mediciones. Supongamos, por ejemplo, que tenemos cuatro tratamientos (en el sentido habitual) o
cuatro puntos en el tiempo en cada uno de los cuales nos gustaría tener 10 mediciones. Si se utiliza
una muestra diferente de sujetos para cada uno de los cuatro tratamientos o puntos en el tiempo, se
requerirían 40 sujetos. Si podemos tomar medidas sobre el mismo sujeto para cada tratamiento o
punto en el tiempo, es decir, si podemos usar un diseño de medidas repetidas, solo se requerirían 10
sujetos. Esto puede ser una ventaja muy atractiva si los sujetos son escasos o costosos de reclutar.
DesventajasUn importante problema potencial del que hay que estar alerta es lo que se
conoce comoefecto de arrastre.Cuando se evalúan dos o más tratamientos, el investigador
debe asegurarse de que la respuesta de un sujeto a un tratamiento no refleje un efecto residual
de tratamientos anteriores. Con frecuencia, este problema puede resolverse dejando suficiente
tiempo entre tratamientos.
Otro posible problema es elefecto de posiciónLa respuesta de un sujeto a un tratamiento
experimentado al final de una secuencia puede ser diferente de la respuesta que habría ocurrido si el
tratamiento hubiera sido el primero en la secuencia. En ciertos estudios, como los que involucran la
participación física de los sujetos, el entusiasmo que es alto al comienzo del estudio puede dar paso al
aburrimiento hacia el final. Una forma de evitar este problema es aleatorizar la secuencia de
tratamientos de forma independiente para cada sujeto.
DEFINICIÓN
El diseño de medidas repetidas en el que se introduce un factor adicional en el
experimento se denomina diseño.Diseño unifactorial de medidas repetidas.
suposicionesLos siguientes son los supuestos del diseño de medidas repetidas de un solo
factor que consideramos en este texto. Un diseño en el que se cumplen estos supuestos se
denominaaditivo de efectos fijosdiseño.
1.Los sujetos en estudio constituyen una muestra aleatoria simple de una población de
sujetos similares.
2.Cada observación es una muestra aleatoria simple independiente de tamaño 1 de cada una de
laskn poblaciones, dondenortees el número de sujetos ykes el número de tratamientos a los
que se expone cada sujeto.
348 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
3.Elknlas poblaciones tienen medias potencialmente diferentes, pero todas tienen la misma
varianza.
4.Elklos tratamientos son fijos; es decir, son los únicos tratamientos sobre los que tenemos
interés en la situación actual. No deseamos hacer inferencias a una colección más grande
de tratamientos.
5.No hay interacción entre tratamientos y sujetos; es decir, el tratamiento y los efectos
del sujeto son aditivos.
Los experimentadores pueden encontrar con frecuencia que sus datos no se ajustan a los
supuestos de tratamientos fijos y/o tratamiento aditivo y efectos de sujeto. Para tales casos, se
pueden consultar las referencias al final de este capítulo como guía.
Además de las suposiciones que acabamos de enumerar, se debe tener en cuenta que en un
experimento de medidas repetidas existe la presunción de que deben existir correlaciones entre las medidas
repetidas. Es decir, las mediciones en los tiempos 1 y 2 probablemente estén correlacionadas, al igual que las
mediciones en los tiempos 1 y 3, 2 y 3, y así sucesivamente. Esto es de esperar porque las medidas se toman
en los mismos individuos a lo largo del tiempo.
Una suposición subyacente del diseño ANOVA de medidas repetidas es que todas estas
correlaciones son iguales, una condición denominadasimetría compuesta.Esta suposición, junto con la
suposición 3 sobre varianzas iguales, se conoce como esfericidad.Las violaciones de la suposición de
esfericidad pueden dar como resultado un error de tipo I inflado. La mayoría de los programas de
computadora proporcionan una prueba formal para la suposición de esfericidad junto con métodos
de estimación alternativos si se viola la suposición de esfericidad.
El modeloEl modelo para el diseño de medidas repetidas de factor único aditivo de efectos
fijos es
Xyo¼metroþbiþtjþmiyo
(8.4.1)
i¼1; 2; . . . ;norte; j¼1; 2; . . . ;k
El lector reconocerá este modelo como el modelo para el diseño de bloques completos al azar discutido en la
Sección 8.3. Los sujetos son los bloques. En consecuencia, la notación, la presentación de datos y el
procedimiento de prueba de hipótesis son los mismos que para el diseño de bloques completos al azar como
se presentó anteriormente. El siguiente es un ejemplo de un diseño de medidas repetidas.
EJEMPLO 8.4.1
Licciardona et al. (A-15) examinaron sujetos con dolor lumbar crónico e inespecífico. En este estudio,
18 de los sujetos completaron un cuestionario de encuesta que evaluaba el funcionamiento físico al
inicio y después de 1, 3 y 6 meses. La Tabla 8.4.1 muestra los datos de estos sujetos que recibieron un
tratamiento simulado que parecía ser una manipulación osteopática genuina. Los valores más altos
indican un mejor funcionamiento físico. El objetivo del experimento era determinar si los sujetos
reportarían una mejora con el tiempo a pesar de que el tratamiento que recibieron proporcionaría
una mejora mínima. Deseamos saber si hay una diferencia en los valores medios de la encuesta entre
los cuatro puntos en el tiempo.
8.4 EL DISEÑO DE MEDIDAS REPETIDAS 349
1 80 60 95 100
2 95 90 95 95
3 sesenta y cinco 55 50 45
4 50 45 70 70
5 60 75 80 85
6 70 70 75 70
7 80 80 85 80
8 70 60 75 sesenta y cinco
9 80 80 70 sesenta y cinco
10 sesenta y cinco 30 45 60
11 60 70 95 80
12 50 50 70 60
13 50 sesenta y cinco 80 sesenta y cinco
14 85 45 85 80
15 50 sesenta y cinco 90 70
dieciséis 15 30 20 25
17 10 15 55 75
18 80 85 90 70
Fuente: Datos proporcionados por cortesía de John C. Licciardone.
Solución:
Producción:
Figura 8.4.2, muestra el SAS®la salida para el análisis del ejemplo 8.4.1 y la figura 8.4.3 muestra la
salida de SPSS para el mismo ejemplo. Tenga en cuenta que SPSS proporciona cuatro pruebas
potenciales. La primera prueba se utiliza bajo el supuesto de esfericidad y coincide con los resultados
de las Figuras 8.4.1 y 8.4.2. Las siguientes tres pruebas son modificaciones si se viola el supuesto de
esfericidad. Tenga en cuenta que SPSS modifica los grados de libertad para estas tres pruebas, lo que
cambia los cuadrados medios y lapagvalores, pero no el VR Tenga en cuenta que se violó el supuesto
de esfericidad para estos datos, pero que la regla de decisión no cambió, ya que todos lospagLos
valores fueron inferiores aa¼ :05. &
El ANOVA Procedimiento
Medida: MEDIDA_1
suposicionesLos supuestos del diseño de medidas repetidas de dos factores son los mismos que los
del diseño de medidas repetidas de un factor. Sin embargo, no es raro que haya interacciones entre
los tratamientos en este diseño, una posible violación de la Suposición 5 anterior. Los efectos de
interacción pueden ser interesantes de examinar, pero son complejos de calcular. Por esta razón, y al
nivel de la audiencia a la que se dirige este texto, supondremos que los efectos de interacción, cuando
están presentes, se manejan matemáticamente utilizando un paquete de software estadístico que
proporciona los cálculos correctos para este problema.
El modeloEl modelo para el diseño de medidas repetidas de dos factores debe representar el
hecho de que hay dos factores,AyB,y tienen una interacción potencial. Estas características,
junto con el efecto de bloque y el error, deben tenerse en cuenta en el modelo, que viene dado
por
Xjk¼metroþryoþaiþbjþ ðabdominalesÞyoþmijk
(8.4.2)
i¼1; 2; . . . ;a; j¼1; 2; . . . ;b; k¼1; 2; . . . ;norte
en este modelo
mijkes un componente residual que representa todas las fuentes de variación distintas de los tratamientos
y bloques
Este modelo es muy similar al modelo ANOVA de dos factores presentado en la Sección 8.5.
EJEMPLO 8.4.2
El Mid-Michigan Medical Center (A-16) examinó a 25 sujetos con cáncer de cuello y midió como
una de las variables de resultado un puntaje de condición de salud oral. Los pacientes fueron
divididos aleatoriamente en dos grupos de tratamiento. Estos fueron un tratamiento con
placebo (tratamiento 1) y un grupo de jugo de aloe (tratamiento 2). La salud del cáncer se midió
al inicio y al final de 2, 4 y 6 semanas de tratamiento. El objetivo era discernir si había algún
cambio en la condición de salud oral durante el transcurso del experimento y ver si había
alguna diferencia entre las dos condiciones de tratamiento.
Solución:
TABLA 8.4.2 Puntuaciones de las condiciones de salud oral en cuatro puntos diferentes en el tiempo
bajo dos condiciones de tratamiento
Tratamiento
1¼placebo
Sujeto 2¼jugo de aloe TotalC1 TotalC2 TotalC3 TotalC4
1 1 6 6 6 7
2 1 9 6 10 9
3 1 7 9 17 19
4 1 6 7 9 3
5 1 6 7 dieciséis 13
6 1 6 6 6 11
7 1 6 11 11 10
8 1 6 11 15 15
9 1 6 9 6 8
10 1 6 4 8 7
11 1 7 8 11 11
12 1 6 6 9 6
13 1 8 8 9 10
14 1 7 dieciséis 9 10
15 2 6 10 11 9
dieciséis 2 4 6 8 7
17 2 6 11 11 14
18 2 6 7 6 6
19 2 12 11 12 9
20 2 5 7 13 12
21 2 6 7 7 7
22 2 8 11 dieciséis dieciséis
23 2 5 7 7 7
24 2 6 8 dieciséis dieciséis
25 2 7 8 10 8
Fuente: Mid-Michigan Medical Center, Midland, Michigan, 1999: Aestudio de la condición oral de los pacientes con cáncer.
Disponible en el dominio público en:http://calcnet.mth.cmich.edu/org/spss/Prj_cancer_data.htm.
3. Hipótesis.
a.H0:ai¼0 i¼1; 2; . . . ;a
Ha:no todoai¼0
Aunque el resultado proporcionado en la Figura 8.4.2 puede ser valioso para la interpretación estadística, a
menudo es útil examinar los gráficos para obtener una interpretación visual de los resultados. La Figura 8.4.5
muestra un gráfico de medias marginales frente al tiempo, con líneas que representan cada uno de los
tratamientos. Es evidente que ocurrieron cambios en la condición oral a través del tiempo, pero que los dos
tratamientos fueron muy similares, como puede verse por la proximidad de las dos curvas. Además, es
evidente que se produjo una interacción entre el tiempo y el tratamiento, como lo demuestra el cruce de las
líneas trazadas. &
8.4 EL DISEÑO DE MEDIDAS REPETIDAS 355
Código SPSS
GLM TOTALCIN T0TALCW2 TOTALCW4 T0TALCW6 POR TRT /
WSFACTOR¼TotatC 4 Polinomio /MÉTODO¼TIPOSS(3)
11
10
Media marginal 9
Placebo
8
Jugo de aloe
6
Hora 1 tiempo 2 Tiempo 3 tiempo 4
Total C
FIGURA 8.4.5 Gráfica de Excel de medias marginales frente a la puntuación total de salud oral para los datos de
Ejemplo 8.4.2.
EJERCICIOS
Para los ejercicios 8.4.1 a 8.4.3 realice el procedimiento de prueba de hipótesis de diez pasos. Dejara¼ :05.
8.4.1.Uno de los propósitos de un estudio de Liu et al. (A-17) fue determinar los efectos de MRZ 2/579 sobre el déficit
neurológico en ratas Sprague-Dawley. En este estudio, se midieron 10 ratas en cuatro períodos de tiempo
después de la oclusión de la arteria carótida media y el tratamiento posterior con el no competitivoNORTE-
antagonista de metilo-D-aspartato MRZ 2/579, que estudios previos habían sugerido proporciona actividad
neuroprotectora. La variable de resultado fue una variable de función neurológica medida en una escala de 0
a 12. Un número más alto indica un mayor grado de deterioro neurológico.
1 11 9 8 4
2 11 7 5 3
3 11 10 8 6
4 11 4 3 2
5 11 10 9 9
6 11 6 5 5
7 11 6 6 6
8 11 7 6 5
9 11 7 5 5
10 11 9 7 7
Fuente: Datos proporcionados por cortesía de Ludmila Belayev, MD
8.4.2.Almidón et al. (A-18) quería mostrar la eficacia de un manguito central de cuatro cuadrantes y un tornillo en la
reconstrucción del ligamento cruzado anterior. Los investigadores realizaron una serie de reconstrucciones en ocho
rodillas cadavéricas. La siguiente tabla muestra las cargas (en newtons) requeridas para lograr diferentes laxitudes
del injerto (mm) para siete especímenes (datos no disponibles para un espécimen) utilizando cinco pesos de carga
diferentes. La laxitud del injerto es la separación (en mm) del fémur y la tibia en los puntos de fijación del injerto.
EJERCICIOS 357
¿Existe suficiente evidencia para concluir que se requieren diferentes cargas para producir diferentes niveles de
laxitud del injerto? Dejara¼ :05.
Muestra 1 2 3 4 5
Fuente: David W. Starch, Jerry W. Alexander, Philip C. Noble, Suraj Reddy y David M. Lintner,
“Fijación de injerto de tendón de la corva de múltiples hebras con un tornillo de interferencia tibial
estándar o de cuatro cuadrantes central para la reconstrucción del ligamento cruzado anterior. ”
Revista americana de medicina deportiva, 31 (2003), 338–344.
8.4.3.Holben et al. (A-19) diseñó un estudio para evaluar la ingesta de selenio en mujeres jóvenes en los años de la pubertad.
Los investigadores estudiaron una cohorte de 16 mujeres durante tres veranos consecutivos. Una de las variables de
resultado fue la ingesta de selenio por día. Los investigadores examinaron los diarios dietéticos de los sujetos en el
transcurso de 2 semanas y luego calcularon la ingesta diaria promedio de selenio. La siguiente tabla muestra los
valores promedio diarios de ingesta de seleniodenmetrog=dÞpara las 16 mujeres en los años 1, 2 y 3 del estudio.
Fuente: Datos proporcionados por cortesía de David H. Holben, Ph.D. y John P. Holcomb, Ph.D.
8.4.4.Linke et al. (A-20) estudió siete perros mestizos machos. Indujeron la diabetes inyectando a los animales monohidrato de
aloxano. Los investigadores midieron la glucosa arterial (mg/gl), el lactato arterial (mmol/L), la concentración arterial
de ácidos grasos libres y lab-concentración de ácido hidroxibutírico antes de la inyección de alloxan y nuevamente en
las semanas 1, 2, 3 y 4 después de la inyección. ¿Cuál es la(s) variable(s) de respuesta? Comente el efecto de arrastre y
el efecto de posición, ya que pueden o no ser motivo de preocupación en este estudio. Construya una tabla ANOVA
para este estudio en la que identifique las fuentes de variabilidad y especifique los grados de libertad para cada una.
8.4.5.Werther et al. (A-21) examinó la concentración del factor de crecimiento endotelial vascular (VEGF) en la sangre de pacientes con
cáncer de colon. La investigación sugiere que la inhibición de VEGF puede interrumpir el crecimiento del tumor. Los
investigadores midieron la concentración de VEGF (ng/L) en 10 sujetos y encontraron una tendencia ascendente en
Concentraciones de VEGF durante el tiempo de coagulación medidas al inicio y en las horas 1 y 2. ¿Cuál es la variable
de respuesta? ¿Cuál es la variable de tratamiento? Construya una tabla ANOVA para este estudio en la que identifique
las fuentes de variabilidad y especifique los grados de libertad para cada una.
358 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
8.4.6.Yucha et al. (A-22) realizó un estudio para determinar si la experiencia de los estudiantes de enfermería que fueron asignados a un
hospital domiciliario (HH) difería de la de los tradicionalmente colocados (TP) en hospitales a lo largo de su formación en
enfermería. En la siguiente tabla se proporciona un pequeño subconjunto de datos. En este conjunto de datos, la ubicación en
el hospital es la variable entre sujetos. Ansiedad, medida por el Estado de Ansiedad de Spielberger
La escala (donde los puntajes más altos sugieren niveles más altos de ansiedad) es la variable dentro de los sujetos y se
proporciona en cuatro puntos en el tiempo durante la formación de enfermería. ¿Existe evidencia de que el nivel de ansiedad
cambió con el tiempo para estos estudiantes de enfermería? ¿Hay alguna diferencia en la ansiedad entre los que están en un
hospital domiciliario y los que están en un hospital tradicional? ¿Existe una interacción significativa entre el tipo de colocación y
la ansiedad? Dejara¼ :05.
1 S.S 51 33 12 31
2 S.S 50 51 50 44
3 S.S sesenta y cinco 58 45 37
4 S.S 43 40 31 51
5 S.S 67 56 50 42
6 S.S 46 69 62 46
7 S.S 29 28 28 43
8 S.S 76 69 62 60
9 S.S 66 39 47 38
10 S.S 56 46 34 31
11 TP 44 48 51 59
12 TP 44 50 54 40
13 TP 54 49 35 46
14 TP 38 38 32 37
15 TP 25 27 25 24
dieciséis TP 61 60 55 66
17 TP 42 51 42 34
18 TP 36 49 49 51
19 TP 52 63 50 64
20 TP 41 55 56 34
Fuente: Datos proporcionados por cortesía de Carolyn B. Yucha, RN, PhD, FAAN.
En los diseños experimentales que hemos considerado hasta este punto, nos hemos interesado en los
efectos de una sola variable: los tratamientos. Sin embargo, es frecuente que nos interese estudiar,
simultáneamente, los efectos de dos o más variables. Nos referimos a las variables en las que
estamos interesados comofactoresEl experimento en el que dos o más factores se investigan
simultáneamente se llama experimento.experimento factorial.
Las diferentes categorías designadas de los factores se denominannivelesSupongamos, por
ejemplo, que estamos estudiando el efecto sobre el tiempo de reacción de tres dosis de algún
fármaco. Entonces, se dice que el factor de la droga ocurre en tres niveles. Supongamos que el
segundo factor de interés en el estudio es la edad, y se piensa que se deben incluir dos grupos de
edad, menores de 65 años y mayores de 65 años. Entonces tenemos dos niveles del factor edad. En
general, decimos que el factorAocurre enaniveles y factorBocurre enbniveles
8.5 EL EXPERIMENTO FACTORIAL 359
En un experimento factorial podemos estudiar no sólo los efectos de los factores individuales
sino también, si el experimento se lleva a cabo correctamente, la interacción entre los factores. Para
ilustrar el concepto de interacción, consideremos el siguiente ejemplo.
EJEMPLO 8.5.1
Supongamos, en términos del efecto sobre el tiempo de reacción, que se conoce la verdadera relación entre
tres niveles de dosificación de algún fármaco y la edad de los sujetos humanos que toman el fármaco.
Supongamos además que la edad se presenta en dos niveles: “jóvenes” (menores de 65 años) y “viejos” (65
años o más). Si se conoce la verdadera relación entre los dos factores, sabremos, para los tres niveles de
dosificación, el efecto medio sobre el tiempo de reacción de los sujetos en los dos grupos de edad.
Supongamos que el efecto se mide en términos de reducción del tiempo de reacción a algún estímulo.
Suponga que estos medios son los que se muestran en la Tabla 8.5.1.
Deben tenerse en cuenta las siguientes características importantes de los datos de la Tabla 8.5.1.
1.Para ambos niveles de factorAla diferencia entre las medias de dos niveles cualesquiera de factor
Bes el mismo. Es decir, para ambos niveles de factorA,la diferencia entre medias para los
niveles 1 y 2 es 5, para los niveles 2 y 3 la diferencia es 10, y para los niveles 1 y 3 la diferencia
es 15.
2.Para todos los niveles de factorBla diferencia entre las medias de los dos niveles de factorA
es el mismo. En el presente caso, la diferencia es 5 en los tres niveles de factorB.
3.Una tercera característica se revela cuando los datos se grafican como en la Figura 8.5.1. Observamos
que las curvas correspondientes a los diferentes niveles de un factor son todas paralelas.
Cuando los datos de población poseen las tres características enumeradas anteriormente, decimos que no hay
interacción presente.
FactorB-Dosis de drogas
25 a2 25 b3
20 a1 20
15 15 b2
10 10 b1
5 5
0 0
b1 b2 b3 a1 a2
dosis de drogas Edad
FIGURA 8.5.1 Efectos de la edad y de las drogas, sin interacción presente.
360 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
FactorB-Dosis de drogas
30 30
Reducción del tiempo de reacción
15 15 b1
10 10 b2
5 a2 5 b3
0 0
b1 b2 b3 a1 a2
dosis de drogas Edad
FIGURA 8.5.2 Efectos de la edad y de las drogas, interacción presente.
La presencia de interacción entre dos factores puede afectar las características de los datos en
una variedad de formas dependiendo de la naturaleza de la interacción. Ilustramos el efecto de un
tipo de interacción alterando los datos de la Tabla 8.5.1 como se muestra en la Tabla 8.5.2.
Las características importantes de los datos de la Tabla 8.5.2 son las siguientes.
1.La diferencia entre las medias de dos niveles cualesquiera de factorBno es igual para ambos
niveles del factor A. Lo observamos en la Tabla 8.5.2. por ejemplo, que la diferencia entre los
niveles 1 y 2 del factorBes -5 para el grupo de edad joven yþ5 para el grupo de la tercera edad.
2.La diferencia entre las medias de ambos niveles del factor A no es la misma en todos los niveles
del factorB.Las diferencias entre factoresAlas medias son -10, 0 y 15 para los niveles 1, 2 y 3,
respectivamente, del factorB.
3.Las curvas de nivel de los factores no son paralelas, como se muestra en la Figura 8.5.2.
Cuando los datos de población exhiben las características ilustradas en la Tabla 8.5.2 y la
Figura 8.5.2, decimos que hay interacción entre los dos factores. Hacemos hincapié en que el
tipo de interacción ilustrado por el presente ejemplo es sólo uno de los muchos tipos de
interacción que pueden ocurrir entre dos factores. &
En el experimento factorial todas las observaciones pueden usarse para estudiar los
efectos de cada uno de los factores bajo investigación. La alternativa, cuando se investigan dos
factores, sería realizar dos experimentos diferentes, uno para estudiar cada uno de los dos
factores. Si se hiciera esto, algunas de las observaciones darían información solo sobre uno de
los factores, y el resto daría información solo sobre el otro factor. Para lograr el nivel de
precisión del experimento factorial, se necesitarían más unidades experimentales si los factores
se estudiaran a través de dos experimentos. Se ve, entonces, que 1 experimento de dos
factores es más económico que 2 experimentos de un factor.
3.Debido a que los diversos factores se combinan en un experimento, los resultados tienen un rango de
aplicación más amplio.
1. Datos.Los resultados de un diseño completamente aleatorizado de dos factores se pueden presentar en forma
tabular como se muestra en la Tabla 8.5.3.
Aquí tenemosaniveles de factoruna, bniveles de factorB,ynorteobservaciones para cada
combinación de niveles. Cada una de lasabdominalescombinaciones de niveles de factorAcon niveles
de factorBes un tratamiento Además de los totales y las medias que se muestran en la Tabla 8.5.3,
observamos que el total y la media de losyolas celdas son
X
norte
FactorB
.. ..
... ... ... ... ... .
.. .. ..
... . . Ta:: X-a::
Xa1norte Xa2norte ... Xabn
El modeloEl modelo de efectos fijos para el diseño completamente aleatorizado de dos factores
se puede escribir como
Xjk¼metroþaiþbjþ ðabdominalesÞyoþmijk
(8.5.1)
i¼1; 2; . . . ;a; j¼1; 2; . . . ;b; k¼1; 2; . . . ;norte
Antes de recopilar datos, los investigadores pueden decidir probar solo una de las
hipótesis posibles. En este caso, seleccionan la hipótesis que desean probar, eligen un nivel de
significanciaa,y proceda de la manera familiar y directa. Este procedimiento está libre de las
complicaciones que surgen si los investigadores desean probar las tres hipótesis.
Cuando se prueban las tres hipótesis, la situación se complica por el hecho de que las tres
pruebas no son independientes en el sentido probabilístico. si dejamosaser el nivel de significancia
asociado con la prueba como un todo, ya0;a00;ya000los niveles de significación asociados con las
hipótesis 1, 2 y 3, respectivamente, encontramos
Sia0¼a00¼a000¼ :05, entoncesun <1 -d:95Þ3, oun < :143. Esto significa que la probabilidad de
rechazar una o más de las tres hipótesis es menor que .143 cuando se ha elegido un nivel de
significación de .05 para las hipótesis y todas son verdaderas. Para demostrar el procedimiento de
prueba de hipótesis para cada caso, realizamos las tres pruebas. El lector, sin embargo, debe ser
consciente del problema que implica la interpretación de los resultados.
5. Distribución de la estadística de prueba.CuandoH0es verdadero y se cumplen los supuestos, cada uno de los
estadísticos de prueba se distribuye comoF.
XaX bX norte
2
XaX bX norte-
-X aX bX norte
- -2
dXjk- -X . . . Þ ¼ - Xij-- -X... 2þ Xjk- -X ij-
i¼1j¼1k¼1 i¼1j¼1k¼1 i¼1j¼1k¼1
(8.5.3)
o
acero inoxidable¼SSTrþSSE (8.5.4)
La suma de los cuadrados de los tratamientos se puede dividir en tres partes de la siguiente manera:
XaX bX norte-
-X aX bX norte
o
SSTr¼SSAþSSBþSSAB
La tabla ANOVALos resultados de los cálculos para el modelo de efectos fijos para un experimento
completamente aleatorizado de dos factores pueden, en general, mostrarse como se muestra en la
Tabla 8.5.4.
EJEMPLO 8.5.2
En un estudio sobre la duración de las visitas domiciliarias individuales por parte de enfermeras de salud pública, se
informaron datos sobre la duración de la visita domiciliaria, en minutos, por una muestra de 80 enfermeras. También
se registró la edad de cada enfermera y el tipo de enfermedad de cada paciente visitado. Los investigadores
deseaban obtener de su investigación respuestas a las siguientes preguntas:
1.¿La duración media de la visita domiciliaria difiere entre los diferentes grupos de edad de las enfermeras?
Solución:
TABLA 8.5.5 Duración de la visita domiciliaria en minutos de las enfermeras de salud pública por
grupo de edad de la enfermera y tipo de paciente
FactorA
(Tipo de Paciente) 1 2 3 4
Niveles (20 a 29) (30 a 39) (40 a 49) (50 y más)
1 (cardiaco) 20 25 24 28
25 30 28 31
22 29 24 26
27 28 25 29
21 30 30 32
2 (Cáncer) 30 30 39 40
45 29 42 45
30 31 36 50
35 30 42 45
36 30 40 60
3 (CVA) 31 32 41 42
30 35 45 50
40 30 40 40
35 40 40 55
30 30 35 45
4 (tuberculosis) 20 23 24 29
21 25 25 30
20 28 30 28
20 30 26 27
19 31 23 30
Dejara¼ :05
Fila C1 C2 C3 Fila C1 C2 C3
1 20 1 1 41 31 3 1
2 25 1 1 42 30 3 1
3 22 1 1 43 40 3 1
4 27 1 1 44 35 3 1
5 21 1 1 45 30 3 1
6 25 1 2 46 32 3 2
7 30 1 2 47 35 3 2
8 29 1 2 48 30 3 2
9 28 1 2 49 40 3 2
10 30 1 2 50 30 3 2
11 24 1 3 51 41 3 3
12 28 1 3 52 45 3 3
13 24 1 3 53 40 3 3
14 25 1 3 54 40 3 3
15 30 1 3 55 35 3 3
dieciséis 28 1 4 56 42 3 4
17 31 1 4 57 50 3 4
18 26 1 4 58 40 3 4
19 29 1 4 59 55 3 4
20 32 1 4 60 45 3 4
21 30 2 1 61 20 4 1
22 45 2 1 62 21 4 1
23 30 2 1 63 20 4 1
24 35 2 1 64 20 4 1
25 36 2 1 sesenta y cinco 19 4 1
26 30 2 2 66 23 4 2
27 29 2 2 67 25 4 2
28 31 2 2 68 28 4 2
(Continuado)
8.5 EL EXPERIMENTO FACTORIAL 367
Fila C1 C2 C3 Fila C1 C2 C3
29 30 2 2 69 30 4 2
30 30 2 2 70 31 4 2
31 39 2 3 71 24 4 3
32 42 2 3 72 25 4 3
33 36 2 3 73 30 4 3
34 42 2 3 74 26 4 3
35 40 2 3 75 23 4 3
36 40 2 4 76 29 4 4
37 45 2 4 77 30 4 4
38 50 2 4 78 28 4 4
39 45 2 4 79 27 4 4
40 60 2 4 80 30 4 4
La Figura 8.5.4 muestra el SAS®salida para el análisis del Ejemplo 8.5.2. &
Hemos tratado solo el caso en el que el número de observaciones en cada celda es el mismo.
Cuando el número de observaciones por celda no es el mismo para todas las celdas, el análisis
se vuelve más complejo.
En tales casos se dice que el diseño está desequilibrado. Para analizar estos diseños con
MINITAB usamos el procedimiento lineal general (GLM). Otros paquetes de software como SAS®
también acomodará tamaños de celda desiguales.
368 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Producción:
El Sistema SAS
EJERCICIOS
Para los Ejercicios 8.5.1 a 8.5.4, realice el análisis de varianza, pruebe las hipótesis apropiadas en el .
05 nivel de significación, y determinar elpagvalor asociado a cada prueba.
8.5.1.Uryu et al. (A-23) estudió el efecto de tres dosis diferentes de troglitazonadmetroMETROÞsobre la muerte de las células
neurológicas. La muerte celular provocada por un accidente cerebrovascular se debe en parte a la acumulación de
altas concentraciones de glutamato. Los investigadores querían determinar si diferentes dosis de troglitazona (1.3,
4.5 y 13:5metroM) y diferentes formas de ionesd-yþÞde LY294002, un inhibidor de la PI3-quinasa, daría diferentes
niveles de neuroprotección. Se estudiaron cuatro ratas con cada dosis y nivel de iones, y la variable medida es el
porcentaje de muerte celular en comparación con el glutamato. Por lo tanto, un valor más alto implica menos
neuroprotección. Los resultados se muestran en la siguiente tabla.
8.5.2.Los investigadores de un centro de trauma deseaban desarrollar un programa para ayudar a las víctimas de trauma con daño cerebral
recuperar un nivel aceptable de independencia. Se realizó un experimento en el que participaron 72
sujetos con el mismo grado de daño cerebral. El objetivo fue comparar diferentes combinaciones de
tratamiento psiquiátrico y fisioterapia. Cada sujeto fue asignado a una de 24 combinaciones
diferentes de cuatro tipos de tratamiento psiquiátrico y seis programas de fisioterapia. Había tres
sujetos en cada combinación. La variable de respuesta es el número de meses transcurridos entre el
inicio de la terapia y el momento en que el paciente pudo funcionar de forma independiente. Los
resultados fueron los siguientes:
¿Se puede concluir sobre la base de estos datos que los diferentes programas de tratamiento psiquiátrico
tienen efectos diferentes? ¿Se puede concluir que los programas de fisioterapia difieren en efectividad? ¿Se
puede concluir que existe interacción entre los programas de tratamiento psiquiátrico y los programas de
fisioterapia? Dejara¼ :05 por cada prueba.
Los ejercicios 8.5.3 y 8.5.4 son opcionales ya que tienen tamaños de celda desiguales. Se recomienda que los datos
para estos se analicen utilizando SAS.®o algún otro paquete de software que acepte tamaños de celda desiguales.
8.5.3.Principal et al. (A-24) afirman: “El dolor de cabeza primario es una condición muy común y que las
enfermeras encuentran en muchos entornos de atención diferentes. Sin embargo, hay una falta
de evidencia sobre si los consejos dados a los pacientes son efectivos y qué mejoras se pueden
esperar en las condiciones”. Los investigadores evaluaron la frecuencia de los dolores de
cabeza al principio y al final del estudio en 19 sujetos de un grupo de intervención (tratamiento
1) y 25 sujetos en un grupo de control (tratamiento 2). Los sujetos del grupo de intervención
recibieron educación sanitaria de una enfermera, mientras que el grupo de control no recibió
educación. En los 6 meses entre la evaluación previa y posterior, los sujetos mantuvieron un
diario de dolor de cabeza. La siguiente tabla da como variable de respuesta la diferencia (pre –
post) en la frecuencia de dolores de cabeza durante los 6 meses para dos factores:
Cambiar en Cambiar en
Frecuencia de Sufridor de migraña Frecuencia de Sufridor de migraña
dolores de cabeza (1 = No, 2 = Sí) Tratamiento dolores de cabeza (1 = No, 2 = Sí) Tratamiento
-2 1 1 -3 2 2
2 2 1 -6 2 2
33 1 1 11 1 2
-6 2 1 64 1 2
6 2 1 sesenta y cinco 1 2
98 1 1 14 1 2
2 2 1 8 1 2
6 2 1 6 2 2
(Continuado)
372 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Cambiar en Cambiar en
Frecuencia de Sufridor de migraña Frecuencia de Sufridor de migraña
dolores de cabeza (1 = No, 2 = Sí) Tratamiento dolores de cabeza (1 = No, 2 = Sí) Tratamiento
33 1 1 14 1 2
-7 2 1 - 11 2 2
-1 2 1 53 1 2
- 12 2 1 26 2 2
12 1 1 3 1 2
64 1 1 15 1 2
36 2 1 3 1 2
6 2 1 41 1 2
4 2 1 dieciséis 1 2
11 2 1 -4 2 2
0 2 1 -6 2 2
9 1 2
9 2 2
-3 2 2
9 2 2
3 1 2
4 2 2
Fuente: Datos proporcionados por cortesía de A. Main, H. Abu-Saad, R. Salt, l. Vlachonikolis, y A. Dowson, "Manejo por parte de enfermeras de la cefalea
primaria: un estudio piloto"Opinión de investigación médica actual, 18 (2002), 471–478.
¿Se puede concluir sobre la base de estos datos que existe una diferencia en la reducción de la frecuencia del dolor de
cabeza entre los grupos de control y tratamiento? ¿Se puede concluir que hay una diferencia en la reducción de la
frecuencia del dolor de cabeza entre los que sufren de migraña y los que no la padecen? ¿Se puede concluir que
existe una interacción entre los tratamientos y el estado de la migraña? Dejara¼ :05 por cada prueba.
8.5.4.El propósito de un estudio de Porcellini et al. (A-25) fue estudiar la diferencia en la respuesta de las células CD4
en pacientes que tomaban terapia antirretroviral altamente activa (TARGA, tratamiento 1) y pacientes que
tomaban TARGA más interleucina intermitente (IL-2, tratamiento 2). Otro factor de interés fue el VIH-
Recuento de ARN en plasma al inicio del estudio. Los sujetos se clasificaron como con menos de 50 copias/ml (plasma
1) o con 50 o más copias/ml (plasma 2). La variable de resultado es el cambio porcentual en el recuento de células T
CD4 desde el inicio hasta los 12 meses de tratamiento. ¿Se puede concluir que hay una diferencia en el cambio
porcentual en el recuento de células T CD4 entre los dos tratamientos? Los resultados se muestran en la siguiente
tabla. ¿Se puede concluir que existe una diferencia en el porcentaje de cambio en el recuento de células T CD4 entre
quienes tienen menos de 50/ml de copias plasmáticas de ARN del VIH y quienes no las tienen? ¿Se puede concluir que
existe interacción entre los tratamientos y los niveles plasmáticos? Dejara¼ :05 por cada prueba.
- 12:60 1 1
- 14:60 2 1
28.10 2 1
(Continuado)
8.6 RESUMEN 373
77.30 1 1
- 0:44 1 1
50.20 1 1
48.60 2 2
86.20 2 2
205.80 1 2
100.00 1 2
34.30 1 2
82.40 1 2
118.30 1 2
Fuente: Datos proporcionados por cortesía de Simona Porcellini, Guiliana
Vallanti, Silvia Nozza, Guido Poli, Adriano Lazzarin, Guiseppe Tabussi y
Antonio Grassia, “Improved Thymopoietic Potential in Aviremic HIV
Infected Individuals with HAART by Intermittent IL-2 Administration,”SIDA,
17 (2003), 1621–1630.
8.5.5.Un estudio de G-orecka et al. (A-26) evaluaron la forma en que, entre los fumadores de mediana edad, el
diagnóstico de limitación del flujo aéreo (LA) combinado con el consejo de dejar de fumar influye en la tasa
de abandono del hábito tabáquico. Sus preocupaciones eran si tener AL, si el sujeto dejó de fumar con éxito y
si la interacción entre AL y el tabaquismo eran factores significativos con respecto a
a variables basales y variables de capacidad pulmonar al final del estudio. Algunas de las variables de interés
fueron los años previos de tabaquismo (paquete años), la edad en que el sujeto comenzó a fumar por
primera vez, el volumen espiratorio forzado en un segundodVEF1Þ,y capacidad vital forzada (FVC). Hubo 368
sujetos en el estudio. ¿Cuáles son los factores en este estudio? ¿A cuántos niveles ocurre cada uno? ¿Quiénes
son los sujetos? ¿Cuál es (son) la(s) variable(s) de respuesta? ¿Puedes pensar en alguna variable extraña cuyos
efectos estén incluidos en el término de error?
8.5.6.Un estudio de Meltzer et al. (A-27) examinó la respuesta a 5 mg de desloratadina, un antagonista del receptor H1, en
pacientes con alergias estacionales. Durante la temporada de alergias de otoño, 172 sujetos fueron asignados
aleatoriamente para recibir tratamientos de desloratadina y 172 fueron asignados aleatoriamente para recibir
un placebo Los sujetos tomaron la medicación durante 2 semanas, después de lo cual se calcularon los cambios en la
puntuación de los síntomas nasales. Se notó una reducción significativa en el grupo de tratamiento en comparación con el
grupo de placebo, pero el género no fue un factor significativo. ¿Cuáles son los factores en el estudio? ¿A cuántos niveles ocurre
cada uno? ¿Cuál es la variable de respuesta?
8.6 RESUMEN
El propósito de este capítulo es introducir al estudiante a las ideas y técnicas básicas del análisis
de varianza. Dos diseños experimentales, el completamente aleatorizado y el de bloques
completos aleatorizados, se discuten con considerable detalle. Además, se introduce el
concepto de diseños de medidas repetidas y un experimento factorial como se usa con el
diseño completamente al azar. Las personas que deseen profundizar en cualquier aspecto del
análisis de varianza encontrarán de gran utilidad las referencias metodológicas al final del
capítulo.
374 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Fórmula
Número Nombre Fórmula
rffiffiffiffiffiffiffiffiffiffiffi
8.2.9 HSD de Tukey MSE
(tamaños de muestra iguales)
HSD¼qa;k;Nk
norte
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
8.2.10 HSD de Tukey
MSE 1 1
(tamaños de muestra desiguales) HSD ¼qa;k;Nk þ
2 nortei nortej
(Continuado)
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 8 375
2
SSBl¼ d-Xi-- -X: :Þ
j¼1 i¼1
2
partición de tratamiento - Xij-- -X::: ¼ d-Xi::- -X:::Þ
i¼1j¼1k¼1 i¼1j¼1k¼1
XabXX norte-
-2
þ - X-j-- -X:::
i¼1j¼1k¼1
XaX bX norte-
-2
þ - Xij-- -Xi::- -X-j-þ -X :::
i¼1j¼1k¼1
dabdominalesÞyo¼efecto de interacción
miyo¼término de error
9.¿Qué es la interacción?
Saludable A B C D
14En el Ejemplo 8.4.1, examinamos los datos de un estudio realizado por Licciardone et al. (A-15) sobre la manipulación
osteopática como tratamiento del dolor de espalda crónico. Al comienzo de ese estudio, en realidad había 91 sujetos
asignados aleatoriamente a uno de tres tratamientos: tratamiento de manipulación osteopática (OMT), manipulación
simulada (SHAM) o no intervención (CONTROL). Una variable de resultado importante fue la calificación del dolor de
espalda al comienzo del estudio. Los investigadores querían saber si el tratamiento tenía esencialmente el mismo
nivel medio de dolor al comienzo del ensayo. Los resultados se muestran en la siguiente tabla. Los investigadores
utilizaron una escala analógica visual de 0 a 10 cm, donde 10 indicaba "el peor dolor posible". ¿Podemos concluir,
sobre la base de estos datos, que, en promedio, los niveles de dolor difieren en los tres grupos de tratamiento? Dejar
a¼ :05 y encuentra elpagvalor. Si está justificado, use el procedimiento de Tukey para probar las diferencias entre
pares individuales de medias de muestra.
15.El objetivo de un estudio realizado por Meshack y Norman (A-29) fue evaluar los efectos de las pesas sobre el temblor
postural de la mano relacionado con la autoalimentación en sujetos con enfermedad de Parkinson (EP). A cada uno
de los 16 sujetos se le midió la amplitud del temblor (en mm) en tres condiciones: sosteniendo una cuchara armada
(108 gramos), sosteniendo una cuchara con peso (248 gramos) y sosteniendo la cuchara armada mientras usaba una
muñeca con peso. manguito (470 gramos). Los datos se muestran en la siguiente tabla.
1 . 77 1.63 1.02
2 . 78 . 88 1.11
3 . 17 . 14 . 14
4 . 30 . 27 . 26
5 . 29 . 27 . 28
6 1.60 1.49 1.73
7 . 38 . 39 . 37
8 . 24 . 24 . 24
9 . 17 . 17 . dieciséis
10 . 38 . 29 . 27
11 . 93 1.21 . 90
12 . 63 . 52 . 66
13 . 49 . 73 . 76
14 . 42 . 60 . 29
15 . 19 . 21 . 21
dieciséis . 19 . 20 . dieciséis
Fuente: Rubia P. Meshack y Kathleen E. Norman, "Un ensayo controlado aleatorio de los efectos de los pesos
en la amplitud y frecuencia del temblor postural de la mano en personas con enfermedad de Parkinson"
Rehabilitación Clínica, 16 (2003), 481–492.
PREGUNTAS DE REPASO Y EJERCICIOS 379
¿Se puede concluir sobre la base de estos datos que las tres condiciones experimentales, en promedio, tienen
diferentes efectos sobre la amplitud del temblor? Dejara¼ :05. Determinar elpagvalor.
dieciséis.En un estudio de los efectos pulmonares en cobayos, Lacroix et al. (A-30) expuso a 18 cobayos
sensibilizados con ovoalbúmina y 18 cobayos no sensibilizados a aire normal, benzaldehído y
acetaldehído. Al final de la exposición, los cobayos fueron anestesiados y se evaluaron las respuestas
alérgicas en lavado broncoalveolar (BAL). La siguiente tabla muestra el recuento de células alveolares
106por grupo de tratamiento para cobayos sensibilizados y no sensibilizados con ovoalbúmina.
No acetaldehído 49.90
No acetaldehído 50.60
No acetaldehído 50.35
No acetaldehído 44.10
No acetaldehído 36.30
No acetaldehído 39.15
No aire 24.15
No aire 24.60
No aire 22.55
No aire 25.10
No aire 22.65
No aire 26.85
No benzaldehido 31.10
No benzaldehido 18.30
No benzaldehido 19.35
No benzaldehido 15.40
No benzaldehido 27.10
No benzaldehido 21.90
Sí acetaldehído 90.30
Sí acetaldehído 72.95
Sí acetaldehído 138.60
Sí acetaldehído 80.05
Sí acetaldehído 69.25
Sí acetaldehído 31.70
Sí aire 40.20
Sí aire 63.20
Sí aire 59.10
Sí aire 79.60
Sí aire 102.45
Sí aire 64.60
Sí benzaldehido 22.15
Sí benzaldehido 22.75
Sí benzaldehido 22.15
Sí benzaldehido 37.85
Sí benzaldehido 19.35
Sí benzaldehido 66.70
Pruebe las diferencias (a) entre los resultados sensibilizados con ovoalbúmina y no sensibilizados, (b) entre las tres
exposiciones diferentes y (c) la interacción. Dejara¼ :05 para todas las pruebas.
17Watanabe et al. (A-31) estudió a 52 trabajadores sanos de mediana edad. Los investigadores utilizaron el
Cuestionario de agotamiento vital de Masstricht para evaluar el agotamiento vital. Según las puntuaciones
resultantes, asignaron sujetos en tres grupos: VE1, VE2 y VE3. VE1 indica la menor cantidad de signos de
agotamiento y VE3 indica la mayor cantidad de signos de agotamiento. Los investigadores también
preguntaron a los sujetos sobre sus hábitos de fumar. El estado de tabaquismo se clasificó de la siguiente
manera: SMOKE1 son no fumadores, SMOKE2 son fumadores leves (20 cigarrillos o menos por día), SMOKE3
son fumadores empedernidos (más de 20 cigarrillos por día). Una de las variables de resultado de interés fue
la amplitud del análisis espectral de alta frecuencia de la variabilidad del ritmo cardíaco observado durante
un chequeo médico anual. Esta variable, HF-amplitud, se utilizó como índice de la función nerviosa
parasimpática.
HF-Amplitud
Estado de tabaquismo
Agotamiento Vital
Grupo HUMO1 HUMO2 HUMO3
Realice un análisis de varianza de estos datos y pruebe las tres hipótesis posibles. Dejar a0¼a00
¼a000¼ :05. Determinar elpagvalores.
PREGUNTAS DE REPASO Y EJERCICIOS 381
18Los efectos de la contaminación térmica enCorbicula fluminea (almejas asiáticas) en tres ubicaciones geográficas
diferentes fueron analizadas por John Brooker (A-32). Los datos de muestra sobre la longitud, el ancho y la altura de
la concha de almeja se muestran en la siguiente tabla. Determine si existe una diferencia significativa en la longitud,
la altura o el ancho promedio (medido en mm) de la concha de almeja en las tres ubicaciones diferentes mediante la
realización de tres análisis. ¿Qué inferencias se pueden hacer a partir de sus resultados? ¿Cuáles son los supuestos
que subyacen a sus inferencias? ¿Cuáles son las poblaciones objetivo?
19Eleftherios Kellis (A-33) realizó un experimento con 18 varones púberes. Él registró la actividad
electromiográfica (EMG) en nueve posiciones angulares diferentes del músculo bíceps femoral. Los
valores de EMG se expresan como un porcentaje (0-100 por ciento) del esfuerzo máximo ejercido con
el músculo y representan un promedio en un rango de ángulos de flexión. Las nueve posiciones
corresponden a la prueba de ángulos de flexión de rodilla de 1 a 10, 11 a 20, 21 a 30, 31 a 40, 41 a 50,
51 a 60, 61 a 70, 71 a 80 y 81 a 90. Los resultados se muestran en la siguiente tabla. Para el sujeto 1,
por ejemplo, el valor de 30,96 por ciento representa el porcentaje máximo promedio de esfuerzo en
posiciones angulares de 1 a 10 grados.
382 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Sujeto 1–10 11–20 21–30 31–40 41–50 51–60 61–70 71–80 81–90
¿Podemos concluir sobre la base de estos datos que los valores promedio de EMG difieren entre las nueve
ubicaciones angulares? Dejara¼ :05.
20En un estudio del síndrome de Marfan, Pyeritz et al. (A-34) informaron las siguientes puntuaciones de gravedad de pacientes sin
ectasia dural, leve y marcada. ¿Podemos concluir, sobre la base de estos datos, que las puntuaciones medias de gravedad
difieren entre las tres poblaciones representadas en el estudio? Dejara¼ :05 y encuentra elpagvalor. Utilice el procedimiento de
Tukey para probar diferencias significativas entre pares individuales de medias muestrales.
Sin ectasia dural: 18, 18, 20, 21, 23, 23, 24, 26, 26, 27, 28, 29, 29, 29, 30, 30, 30,
30, 32, 34, 34, 38
Ectasia dural leve: 10, 16, 22, 22, 23, 26, 28, 28, 28, 29, 29, 30, 31, 32, 32, 33, 33,
38, 39, 40, 47
Ectasia dural marcada: 17, 24, 26, 27, 29, 30, 30, 33, 34, 35, 35, 36, 39
Fuente: Datos proporcionados por cortesía de Reed E. Pyeritz, MD, Ph.D.
21La siguiente tabla muestra las concentraciones de epinefrina en plasma arterial (nanogramos por mililitro) encontradas
en 10 animales de laboratorio durante tres tipos de anestesia:
Animal
Anestesia 1 2 3 4 5 6 7 8 9 10
A . 28 . 50 . 68 . 27 . 31 . 99 . 26 . 35 . 38 . 34
B . 20 . 38 . 50 . 29 . 38 . 62 . 42 . 87 . 37 . 43
C 1.23 1.34 . 55 1.06 . 48 . 68 1.12 1.52 . 27 . 35
¿Podemos concluir a partir de estos datos que los tres tipos de anestesia, en promedio, tienen efectos
diferentes? Dejara¼ :05.
Traducido del inglés al español - www.onlinedoctranslator.com
22El objetivo de un estudio de Hartman-Maeir et al. (A-35) fue evaluar el conocimiento de los perfiles de déficit entre los pacientes con
accidente cerebrovascular en rehabilitación. Estudió a 35 pacientes con lesión por accidente cerebrovascular en el hemisferio
derecho y 19 pacientes con lesión en el hemisferio izquierdo. También agrupó el tamaño de la lesión como
Puntuación de desconocimiento
2 11 10 8
13 11 10
10 13 9
11 10 9
9 13 9
10 10
9 10
8 9
10 8
3 13 11 10
8 10 11
10 10 12
10 14 11
10 8
4 11 10 11
13 13 9
14 10 19
13 10 10
14 15 9 Fuente: Datos proporcionados por cortesía
8 10 de Adina Hartman-Maeir, Ph.D., OTR
Pruebe la diferencia en el tamaño de la lesión, el hemisferio y la interacción. Dejara¼ :05 para todas las pruebas.
23Se seleccionó una muestra aleatoria de los registros de nacimientos únicos de cada una de cuatro poblaciones. Los pesos
(gramos) de los bebés al nacer fueron los siguientes:
Muestra
A B C D
Muestra
A B C D
¿Proporcionan estos datos evidencia suficiente para indicar, al nivel de significancia de .05, que las cuatro poblaciones
difieren con respecto al peso medio al nacer? Pruebe si hay una diferencia significativa entre todos los posibles pares
de medias.
24La siguiente tabla muestra las puntuaciones de agresión de 30 animales de laboratorio criados en tres condiciones
diferentes. Se asignó aleatoriamente un animal de cada una de las 10 camadas a cada una de las tres condiciones de
crianza.
Condición de crianza
Extremadamente Moderadamente No
Basura Atestado Atestado Atestado
1 30 20 10
2 30 10 20
3 30 20 10
4 25 15 10
5 35 25 20
6 30 20 10
7 20 20 10
8 30 30 10
9 25 25 10
10 30 20 20
¿Estos datos proporcionan suficiente evidencia para indicar que el nivel de hacinamiento tiene un efecto sobre la
agresión? Dejara¼ :05.
25La siguiente tabla muestra las medidas de capacidad vital de 60 hombres adultos clasificados por ocupación y
grupo de edad:
Ocupación
Grupo de edad A B C D
Ocupación
Grupo de edad A B C D
Pruebe las diferencias entre ocupaciones, las diferencias entre grupos de edad y la interacción. Dejara¼ :05
para todas las pruebas.
Tratos 154.9199 4
Error
Total 200.4773 39
Tratos 3
bloques 183.5 3
Error 26,0
Total 709.0 15
Total 51.0938 59
386 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
31En un estudio de la relación entre fumar y las concentraciones séricas de colesterol de lipoproteínas de alta
densidad (HDL-C), se recopilaron los siguientes datos (codificados para facilitar el cálculo) de muestras de
hombres adultos que no fumaban, fumadores leves, fumadores moderados, y grandes fumadores.
Deseamos saber si estos datos brindan evidencia suficiente para indicar que las cuatro poblaciones difieren
con respecto a la concentración sérica media de HDL-C. Sea la probabilidad de cometer un error tipo I
. 05. Si se encuentra una diferencia significativa general, determine qué pares de medias de muestras individuales son
significativamente diferentes.
Estado de tabaquismo
12 9 5 3
10 8 4 2
11 5 7 1
13 9 9 5
9 9 5 4
9 10 7 6
12 8 6 2
PREGUNTAS DE REPASO Y EJERCICIOS 387
32.Polyzogopoulou et al. (A-36) informan los efectos de la cirugía bariátrica en los niveles de glucosa en ayunas (mmol/L) en 12 sujetos
obesos con diabetes tipo 2 en cuatro momentos: antes de la operación, a los 3 meses, 6 meses y 12 meses. ¿Podemos concluir,
después de eliminar los efectos de los sujetos, que los niveles de glucosa en ayunas difieren con el tiempo después de la
cirugía? Dejara¼ :05.
33.Consulte el ejercicio de revisión 32. Además de estudiar a los 12 sujetos con diabetes tipo 2 (grupo 1),
Polyzogopoulou et al. (A-36) estudiaron cinco sujetos con intolerancia a la glucosa (grupo 2) y ocho sujetos
con tolerancia normal a la glucosa (grupo 3). Los siguientes datos son los niveles de glucosa en ayunas
después de la cirugía de 12 meses para los tres grupos.
Grupo
1.0 92.0
1.0 93.0
1.0 74.0
1.0 80.5
1.0 76.0
1.0 71.0
1.0 75.5
1.0 88.5
1.0 93.0
1.0 80.5
1.0 83.0
1.0 87.0
2.0 79.0
2.0 78.0
2.0 100.0
2.0 76.5
2.0 68.0
3.0 81.5
3.0 75,0
3.0 76.5
(Continuado)
388 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
Grupo
3.0 70.5
3.0 69.0
3.0 73.8
3.0 74.0
3.0 80.0
Fuente: Datos proporcionados por cortesía
de Theodore K. Alexandrides, MD
¿Podemos concluir que hay una diferencia entre las medias de los tres grupos? Si es así, ¿qué pares de medias
difieren? Dejara¼ :05 para todas las pruebas.
(a)Indique qué técnica estudiada en este capítulo (el diseño completamente al azar, el diseño
de bloques al azar, el diseño de medidas repetidas o el experimento factorial) es la adecuada.
(b)Identificar la variable de respuesta y las variables de tratamiento.
(C)Según corresponda, identifique los factores y el número de niveles de cada uno, las variables de bloqueo y los
sujetos.
(d)Enumere cualquier variable extraña cuyos efectos crea que podrían estar incluidos en el término de error.
(mi)Según corresponda, comente los efectos de arrastre y de posición.
(F)Construya una tabla ANOVA en la que indique las fuentes de variabilidad y el número de grados de
libertad para cada una.
34.Johnston y Bowling (A-37) estudiaron el contenido de ácido ascórbico (vitamina C) en varios productos de jugo de naranja. Uno de
los productos examinados fue el jugo listo para beber envasado en un recipiente con tapa de rosca que se puede volver a
sellar. Un análisis analizó el contenido de vitamina C reducida y oxidada del jugo en el momento de la compra y volvió a
analizarlo tres veces por semana durante 4 a 5 semanas.
35.Un estudio de Pittini et al. (A-38) evaluó la efectividad de un plan de estudios basado en un simulador en 30 alumnos que
aprendieron la práctica básica de la amniocentesis. El rendimiento antes y después del entrenamiento se evaluó con
el mismo instrumento. La variable de resultado fue la puntuación post-entrenamiento-puntuación pre-
entrenamiento. Los alumnos se agruparon por años de experiencia de posgrado: PGY 0–2, PGY 3–5, Fellows y
Facultad.
36.Anim-Nyame et al. (A-39) estudió tres conjuntos de mujeres en un esfuerzo por comprender los factores relacionados con la
preeclampsia. Se inscribieron en el estudio 18 mujeres con preeclampsia, 18 mujeres embarazadas normales y 18 controles
emparejados de mujeres no embarazadas. Se obtuvieron muestras de sangre para medir los niveles plasmáticos de factor de
crecimiento endotelial vascular, leptina, TNF-aconcentraciones de proteínas plasmáticas y hemograma completo.
37.En un estudio de lwamoto et al. (A-40) 26 mujeres fueron asignadas aleatoriamente al medicamento alfacalcidol para el
tratamiento de la densidad mineral ósea (DMO) lumbar. La DMO de la columna lumbar se midió al inicio del estudio y
cada año durante 5 años.
38.Inou et al. (A-41) estudió el tipo de célula donante y el genotipo sobre la eficacia de la clonación de células somáticas de
ratón. Realizaron un experimento factorial con dos tipos de células donantes (células de Sertoli o cúmulos)
y seis genotipos. Las variables de resultado fueron la tasa de escisión y la tasa de natalidad de las crías en cada
combinación de tratamiento.
PREGUNTAS DE REPASO Y EJERCICIOS 389
(a)Realice un análisis estadístico de los datos (incluidas las pruebas de hipótesis y la construcción de
intervalos de confianza) que crea que generarían información útil para los investigadores.
(b)Determinarpagvalores para cada estadística de prueba calculada.
(C)Indique todas las suposiciones que sean necesarias para validar su análisis.
(d)Describa la(s) población(es) sobre las que cree que serían aplicables las inferencias basadas en su
análisis.
39.Shirakami et al. (A-42) investigó la importancia clínica de la endotelina (ET), los péptidos natriuréticos y el sistema
renina-angiotensina-aldosterona en el trasplante de hígado pediátrico. Los sujetos eran niños de 6 meses a
12 años que se sometieron a un trasplante de hígado relacionado con la vida debido a atresia biliar
congénita y cirrosis hepática grave. Entre los datos recopilados se encuentran los siguientes niveles de
bilirrubina sérica total (mg/dl) después del trasplante (h-horas, d-días):
preoperatorio Transección del hígado Fase anhepática 1 hora 2 h 4 h 8 h 1 día 2 días 3 días
Tenga en cuenta que falta una observación en el conjunto de datos. Puede manejar este problema al menos de tres maneras.
(a)Omita el sujeto cuyo dato falta y analice los datos de los 17 sujetos restantes.
(b)Use un paquete de computadora que se ocupe automáticamente de los datos faltantes.
(C)Analice los datos utilizando un procedimiento de datos faltantes. Para un procedimiento de este tipo, véase Jerome L. Myers
y Arnold D. Well,Diseño de Investigación y Análisis Estadístico,Erlbaum Associates, Hillsdale, Nueva Jersey, 1995, págs. 256–258.
390 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
40El propósito de un estudio realizado por Sakakibara y Hayano (A-43) fue examinar el efecto de la respiración lenta
voluntaria sobre la respuesta parasimpática cardíaca a una amenaza (la anticipación de una descarga eléctrica). Los
sujetos fueron 30 estudiantes universitarios sanos cuya edad media era de 23 años con una desviación estándar de
1,5 años. Se asignó aleatoriamente un número igual de sujetos a grupos de respiración lenta (seis hombres, cuatro
mujeres), rápida (siete hombres, tres mujeres) y sin ritmo (cinco hombres, cinco mujeres). Los sujetos de los grupos
de respiración lenta y rápida regularon su frecuencia respiratoria a 8 y 30 cpm, respectivamente. El grupo sin ritmo
respiró espontáneamente. Las siguientes son las puntuaciones de los sujetos en la Puntuación de ansiedad estatal
del Inventario de ansiedad rasgo-estado después de la línea de base y el período de amenaza:
39 59 37 49 36 51
44 47 40 42 34 71
48 51 39 48 50 37
50 61 47 57 49 53
34 48 45 49 38 52
54 69 43 44 39 56
34 43 32 45 66 67
38 52 27 54 39 49
44 48 44 44 45 sesenta y cinco
Fuente: Datos proporcionados por
39 sesenta y cinco 41 61 42 57 cortesía del Dr. Masahito Sakakibara.
41.Takahashi et al. (A-44) investigaron la correlación de la intensidad de la señal de resonancia magnética con los potenciales evocados
de la médula espinal y la morfología de la médula espinal después de 5 horas de compresión de la médula espinal en gatos.
Veinticuatro gatos adultos se dividieron en cuatro grupos sobre la base de una medida de la función de la médula espinal más
un grupo de control que no se sometió a compresión espinal. Entre los datos recopilados se encuentran los siguientes valores
de relación de compresión [(diámetro sagital/diámetro transversal) 100] después de 5 horas de compresión:
Grupo II 30.263158
34.865900
Fuente: Datos proporcionados
43.775100
cortesía del Dr. Toshiaki
82.439024 Takahashi.
PREGUNTAS DE REPASO Y EJERCICIOS 391
42.El objetivo de un estudio de Yamashita et al. (A-45) fue investigar si la pentoxifilina administrada en la solución
de lavado o durante la reperfusión reduciría la lesión pulmonar por isquemia-reperfusión en aloinjertos de
pulmón canino conservados. Se estudiaron tres grupos de animales. No se administró pentoxifilina a los
animales del grupo 1 (C), se administró solo durante el período de reperfusión (P)
a los animales del grupo 2, y se administró solo en la solución de lavado a los animales del grupo 3 (F). Se
realizaron un total de 14 alotrasplantes de pulmón izquierdo. Las siguientes son las lecturas de presión
aórtica para cada animal durante el período de evaluación de 6 horas:
Falta la observación.
Fuente: Datos proporcionados por cortesía del Dr. Motohiro Yamashita.
43.En un estudio que investiga la biodisponibilidad relativa de betacaroteno (BC) y alfacaroteno (AC) de diferentes
fuentes de zanahorias, Zhou et al. (A-46) utilizaron hurones como animales de experimentación. Entre los
datos recopilados se encuentran las siguientes concentraciones de BC, AC y relaciones molares AC/BC en los
sueros de 24 hurones que recibieron diferentes fuentes de carotenoides durante 3 días en su agua potable:
Jugo Calentado
Jugo Calentado
Cromoplasto calentado
44.Potteiger et al. (A-47) deseaba determinar si la ingesta de citrato de sodio mejoraría el rendimiento en ciclismo y
facilitaría condiciones metabólicas favorables durante el recorrido en bicicleta. Los sujetos fueron ocho
ciclistas competitivos masculinos entrenados cuya edad media era de 25,4 años con una desviación estándar
de 6,5. Cada participante completó una prueba contrarreloj de ciclismo de 30 km en dos condiciones, luego
de la ingestión de citrato de sodio y luego de la ingestión de un placebo. Se recogieron muestras de sangre
antes de la ingestión del tratamiento (PRE-ING); antes del ejercicio (PRE-EX); durante el recorrido en bicicleta
al completar 10, 20 y 30 km; y 15 minutos después del cese del ejercicio (POST-EX). Los siguientes son los
valores de las presiones parciales de oxígeno (PO2) y dióxido de carbono (PCO2) para cada sujeto, bajo cada
condición, en cada tiempo de medición:
(PAGO2) (mmHg)
Tiempos de medición
Sujeto Tratamientoa PRE-ING PRE-EX 10 km 20 km 30 km 15-POST-EX
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 393
(PAGO2) (mmHg)
Tiempos de medición
Sujeto Tratamientoa PRE-ING PRE-EX 10 km 20 km 30 km 15-POST-EX
(PAGCO2) (mmHg)
Tiempos de medición
Sujeto Tratamientoa PRE-ING PRE-EX 10 km 20 km 30 km 15-POST-EX
45.Teitge et al. (A-48) describen un método radiográfico para demostrar la inestabilidad rotuliana. Los 90
sujetos tenían entre 13 y 52 años de edad y se dividieron en los siguientes cuatro grupos según los
hallazgos clínicos relacionados con la naturaleza de la inestabilidad de la rodilla: normal (sin síntomas
o signos relacionados con la rodilla), lateral, medial, e inestabilidad multidireccional. Entre los datos
recopilados se encontraban las siguientes mediciones radiográficas del ángulo de congruencia
(grados):
394 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
12 28 -4 - 34
- 20 6 - 20 - 14
- 20 9 - 20 -6
-5 10 - 20 - 35
10 20 - 22 - 24
-4 -9 - 15 - 25
-2 - 10 - 10 10
-6 12 -5 - dieciséis
-7 0 -5 - 30
0 35 -6 - 30
-2 -1 - 15
- 15 5 - 25
-5 22 - 10
22 - 20
Fuente: Datos proporcionados por cortesía del Dr. Robert A. Teitge.
46.Un estudio de Ikeda et al. (A-49) fue diseñado para determinar la dosis de aerosol de bromuro de ipratropio que mejora
el rendimiento del ejercicio usando cicloergometría progresiva en pacientes con enfermedad pulmonar obstructiva
crónica estable. La edad media de los 20 sujetos masculinos fue de 69,2 años con una desviación estándar de 4 a 0,6
años. Entre los datos recopilados se encuentran los siguientes: ventilación máxima
VEmáx;Valores L=min en el ejercicio máximo alcanzado para diferentes niveles de dosificación de bromuro de ipratropiod
metrogramoÞ:
26 24 23 25 28
38 39 43 43 37
49 46 54 57 52
37 39 39 38 38
34 33 37 37 41
42 38 44 44 42
23 26 28 27 22
38 41 44 37 40
37 37 36 38 39
33 35 34 38 36
40 37 40 46 40
52 58 48 58 63
45 48 47 51 38
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 395
24 30 23 27 30
41 37 39 46 42
56 54 51 58 58
35 51 49 51 46
28 41 37 33 38
28 34 34 35 35
38 40 43 39 45
Fuente: Datos proporcionados por cortesía del Dr. Akihiko Ikeda.
47.Pertovaara et al. (A-50) compararon el efecto de la temperatura de la piel sobre el umbral crítico de temperatura que
provoca el dolor por calor con el efecto de la temperatura de la piel sobre la latencia de respuesta a la primera
sensación de dolor por calor. Los sujetos eran adultos sanos entre las edades de 23 y 54 años. Entre los datos
recopilados se encuentran las siguientes latencias (segundos) de la primera respuesta de dolor inducida por la
estimulación con calor radiante a tres temperaturas diferentes de la piel:
48.Knight et al. informaron sobre un estudio para el desarrollo y validación de un método sensible y
específico para cuantificar las concentraciones totales de activina-A. (A-51). Como parte del estudio,
recolectaron las siguientes concentraciones séricas periféricas de activina-A en sujetos humanos de
diferente estado reproductivo: fase folicular normal (FP), fase lútea normal (LP), embarazada (PREG),
ovario hiperestimulado para la fertilización in vivo ( HYP), posmenopáusicas (PM) y varones adultos
normales. Sugerencia: convierta las respuestas en logaritmos antes de realizar el análisis.
49.El propósito de un estudio de Maheux et al. (A-52) fue evaluar el efecto del trabajo sobre la producción de
glucosa y la utilización de glucosa. Los sujetos fueron seis mujeres embarazadas normales. Entre los datos
396 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
se recolectaron las siguientes concentraciones de glucosa durante cuatro etapas del trabajo de parto: fases
latente (A1) y activa (A2) de dilatación cervical, expulsión fetal (B) y expulsión placentaria (C).
A1 A2 B C
50Trachtmann et al. (A-53) realizaron estudios (1) para evaluar el efecto del IGF-I humano recombinante (rh) en la nefropatía
crónica por puromicina aminonucleósido (PAN) y (2) para comparar los resultados del tratamiento con rhIGF-I versus
rhGH en un modelo de Glomeruloesclerosis focal y segmentaria. Como parte de los estudios, ratas macho Sprague-
Dawley se dividieron en cuatro grupos: PAN (IA), PANþrhIGF-I (IB), normal (IIA) y normalþrhIGF-I (IIB). Los animales
arrojaron los siguientes datos sobre los niveles de creatinina antes (pre) y después de 4, 8 y 12 semanas de
tratamiento:
Grupo
IA BI IIA IIB
Pre
44 44 44 35
44 44 44 44
44 44 44 44
53 44 44 35
44 44
44 53
4 semanas
97 44 53 44
88 35 44 53
62 44 44 53
53 35 53 44
62 62
53 53
8 semanas
53 53 62 44
53 53 53 62
44 53 62 44
53 44 53 44
62 53
70 62
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 397
Grupo
IA BI IIA IIB
12 semanas
88 79 53 53
70 79 62 62
53 79 53 53
70 62 62 53
88 79
88 70
Fuente: Datos proporcionados por cortesía del Dr. Howard Trachtman.
51.Doce hombres sanos, de 22 a 35 años de edad, produjeron la siguiente T sérica3dnmol=LÞniveles a las 0800
horas después de 8 (día 1), 32 (día 2) y 56 (día 3) horas de ayuno, respectivamente. Los sujetos fueron
participantes en un estudio de alteraciones inducidas por el ayuno en la secreción pulsátil de glicoproteínas
realizado por Samuels y Kramer (A-54).
52.Para determinar la naturaleza y el alcance de los cambios neuroconductuales asociados con la toxicidad resultante de la
exposición al exceso de hierro (Fe) en la dieta, Sobotka et al. (A-55) utilizaron ratas Sprague-Dawley macho recién
destetadas como sujetos experimentales. Los investigadores asignaron aleatoriamente a los animales, de acuerdo
con los pesos corporales clasificados, a uno de los cinco grupos de dieta diferenciados en función de la cantidad de Fe
presente: control: 35 (1), 350 (2), 3500 (3), 4 (con deficiencia de hierro). ) (4) y 20.000 (5) ppm, respectivamente. Los
siguientes son los pesos corporales de los animales (gramos) al final de las 10 semanas.
53.Hansen (A-56) señala que las concentraciones de bilirrubina cerebral aumentan por la hiperosmolaridad y la hipercarbia,
y que los estudios anteriores no han abordado la cuestión de si el aumento de la bilirrubina cerebral en diferentes
condiciones se debe a los efectos sobre la entrada o la eliminación de la bilirrubina del cerebro. En un estudio,
planteó la hipótesis de que la cinética del aumento de la concentración de bilirrubina cerebral diferiría en la acidosis
respiratoria (hipercarbia) y la hiperosmolaridad. Se sacrificaron cuarenta y cuatro ratas Sprague-Dawley macho
adultas jóvenes en varios períodos de tiempo después de la infusión con bilirrubina.
Los siguientes son los niveles de bilirrubina en sangre.dmetromol=LÞde 11 animales justo antes del sacrificio 60 minutos
después del inicio de la infusión de bilirrubina:
30 48 102
94 20 118
78 58 74
52 74
Fuente: Datos proporcionados por cortesía del Dr. Thor Willy Ruud Hansen.
54.Johanson et al. (A-57) compararon los efectos de tratamientos a corto plazo con hormona de crecimiento (GH) y factor de
crecimiento similar a la insulina I (IGF-I) sobre marcadores bioquímicos del metabolismo óseo en hombres con
osteoporosis idiopática. Los sujetos tenían entre 32 y 57 años de edad. Entre los datos recopilados se encontraban las
siguientes concentraciones séricas de proteína de unión a IGF-3 a los 0 y 7 días después de la primera inyección y 1,
4, 8 y 12 semanas después de la última inyección con GH e IGF-I.
PREGUNTAS DE REPASO Y EJERCICIOS 399
55.El objetivo de un estudio de Strijbos et al. (A-58) fue comparar los resultados de un programa de rehabilitación para pacientes
ambulatorios en un hospital de 12 semanas (grupo 1) con los de un programa de rehabilitación de atención domiciliaria de 12
semanas (grupo 2) en la enfermedad pulmonar obstructiva crónica con limitación del flujo de aire de moderada a grave . Un
grupo de control (grupo 3) no recibió terapia de rehabilitación. Entre los datos recopilados se encuentran las siguientes
puntuaciones de frecuencia respiratoria de los sujetos 18 meses después de la rehabilitación:
Grupo Grupo
1 2 3 1 2 3
12 dieciséis 24 12 dieciséis 24
dieciséis 14 dieciséis 12 12 14
dieciséis 12 18 14 12 15
14 12 18 dieciséis 12 dieciséis
12 18 24 12 12 dieciséis
12 12 24 12 15 18
12 10 18 20 dieciséis
56.Siete hombres sanos (edad media de 27,4 años con una desviación estándar de 4,4) participaron en un estudio
de Lambert et al. (A-59), que midió la absorción intestinal tras la ingestión oral y la perfusión intestinal de un
líquido. Como parte del estudio, los investigadores registraron los siguientes cambios porcentuales en
400 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
volumen de plasma en seis puntos durante 85 minutos de ejercicio en bicicleta en los experimentos de
bebida e infusión:
Sujeto 1 2 3
Sujeto 4 5 6
57.Romer et al. (A-60) desarrolló una medida de autoinforme del trastorno de ansiedad generalizada (TAG)
para usar con poblaciones de estudiantes universitarios. En los estudios de confiabilidad, los sujetos
de pregrado completaron el cuestionario GAD (GAD-Q), así como el Cuestionario de Preocupación de
Penn State (PSWQ). Las siguientes son las puntuaciones del PSWQ realizadas por cuatro grupos de
sujetos determinados por su estado de GAD: GAD por cuestionario, Estudio II (grupo 1); no TAG por
cuestionario, Estudio II (grupo 2); GAD por cuestionario, Estudio I (grupo 3); y TAG clínico (grupo 4).
PREGUNTAS DE REPASO Y EJERCICIOS 401
Grupo
1 2 3 4
59.0 50.0 46,0 65,0 65,0
51.0 28,0 77.0 62.0 66,0
58.0 43.0 80.0 76.0 69.0
61.0 36,0 60.0 66,0 73.0
64.0 36,0 59.0 78.0 67.0
68.0 30.0 56,0 76.0 78.0
64.0 24.0 44.0 74.0 76.0
67.0 39.0 71.0 73.0 66,0
56,0 29,0 54.0 61.0 55,0
78.0 48.0 64.0 63.0 59.0
48.0 36,0 66,0 75,0 44.0
62.0 38.0 59.0 63.0 68.0
77.0 42.0 68.0 55,0 64.0
72.0 26,0 59.0 67.5 41.0
59.0 35,0 61.0 70.0 54.0
32,0 78.0 70.0 72.0
43.0 70.0 55,0 74.0
55,0 74.0 73.0 59.0
42.0 73.0 80.0 63.0
37.0 79.0 51.0
36,0 79.0 72.0
41.0 61.0 63.0
36,0 61.0 58.0
34,0 72.0 71.0
42.0 67.0
35,0 74.0
51.0 65,0
37.0 68.0
50.0 72.0
39.0 75,0
56,0
Fuente: Datos proporcionados por cortesía del Dr. TD Borkovec.
58.Teniendo en cuenta que los linfomas no Hodgkin (LNH) representan un grupo heterogéneo de enfermedades en las que
el pronóstico es difícil de predecir, Christiansen et al. (A-61) informan sobre los aspectos pronósticos de la molécula
de adhesión intercelular soluble 1 (sICAM-1) en el LNH. Entre los datos recopilados se encontraban los siguientes
niveles séricos de sICAM-1 (ng/ml) en cuatro grupos de sujetos: controles sanos (C), LNH de alto grado (hNHL), LNH
de bajo grado (1NHL) y pacientes con enfermedad de células pilosas. leucemia (HCL).
59.Cossette et al. (A-62) examinó el género y el parentesco con respecto al uso de apoyo formal e informal por
parte de los cuidadores y a dos modelos de apoyo. Entre los datos recopilados se encuentran las siguientes
edades de tres grupos de cuidadores de un pariente demente que vive en el hogar: esposos, esposas e hijas
adultas.
64 66 73 59 67 40 50
70 58 71 66 67 47 58
55 81 70 80 57 46 46
67 77 71 76 53 45 47
79 76 56 68 50 69 50
67 64 68 53 70 48 53
77 82 76 78 70 53 57
68 85 67 75 50 sesenta y cinco
72 63 66 74 47 50
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 403
67 72 67 86 62 43
77 77 72 63 55 59
70 79 72 52 49 44
sesenta y cinco 63 70 55 43 45
sesenta y cinco 80 66 71 44 41
74 70 73 67 47 50
86 85 78 78 57 58
72 76 64 70 49 35
71 67 78 68 50
78 72 59 78 59
71 60 71 59 45
88 74 70 72 50
77 sesenta y cinco 67 73 48
75 53 78 75 51
66 70 67 54 46
80 72 55 sesenta y cinco 62
76 74 64 67 55
67 79 69 83 50
sesenta y cinco 63 59 70 43
62 77 55 72 39
82 78 75 71 50
75 69 68 76 50
80 sesenta y cinco 74 43
74 81 68 28
70 79 69
75 72
Fuente: Datos proporcionados por cortesía de Sylvie Cossette, M.Sc., RN
60Tasaka et al. (A-63) tenga en cuenta queCorynebacterium parvum (CP) aumenta la susceptibilidad a la
endotoxina, que se asocia con una mayor producción de factor de necrosis tumoral (TNF). Investigaron el
efecto del cebado con CP en la patogenia de la lesión pulmonar aguda causada porEscherichia coli
endotoxina (lipopolisacárido [LPS]). Los animales de experimentación consistieron en cobayas hembra
divididas en cuatro grupos. Los animales en dos grupos recibieron un tratamiento de 4 mg/kg de CP 7 días
antes del estudio. Posteriormente, los animales no pretratados recibieron solución salina sola (Control) o
endotoxina (LPSalone). Los grupos pretratados recibieron solución salina (CP-solo) o LPSdPCþLPSÞ.Entre los
datos recopilados se encuentran los siguientes valores de la proporción de tejido pulmonar a plasma del
ensayo de albúmina sérica radioyodada:
61.Según Takahashi et al. (A-64) investigaciones indican que existe una asociación entre alteraciones en el
metabolismo del calcio y diversas enfermedades óseas en pacientes con otras discapacidades. Usando
sujetos con retraso mental severo (edad promedio de 16 años) que habían vivido en instituciones la mayor
parte de sus vidas, Takahashi et al. examinó la relación entre el cambio óseo y otras variables. Los sujetos se
dividieron en grupos sobre la base de la gravedad del cambio óseo. Entre los datos recopilados se
encuentran los siguientes valores de fosfatasa alcalina sérica (UI/L):
Grado I: 109, 86, 79, 103, 47, 105, 188, 96, 249
Grado II: 86, 106, 164, 146, 111, 263, 162, 111
Grado III: 283, 201, 208, 301, 135, 192, 135, 83, 193, 175, 174, 193, 224, 192,
233
Fuente: Datos proporcionados por cortesía del Dr. Mitsugi Takahashi.
62.Las investigaciones indican que la deficiencia de cobre en la dieta reduce la tasa de crecimiento en ratas. En un estudio relacionado,
Allen (A-65) asignó ratas macho Sprague-Dawley recién destetadas a uno de tres grupos de alimentos: deficientes en cobre
(CuD), adecuadas en cobre (CuA) y alimentadas en pareja (PF). Las ratas en el grupo PF fueron inicialmente emparejadas en
peso con las ratas del grupo CuD y luego alimentadas con el mismo peso de la dieta CuA que el consumido por sus
contrapartes CuD. Después de 20 semanas, se anestesiaron las ratas, se extrajeron muestras de sangre y se extrajeron los
órganos. Como parte del estudio se recopilaron los siguientes datos:
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 405
63.Hughes et al. (A-66) señalan que las complicaciones sistémicas en la pancreatitis aguda son en gran parte responsables
de la mortalidad asociada a la enfermedad. Señalan además que las citocinas proinflamatorias, particularmente el
TNFa,puede desempeñar un papel central en la pancreatitis aguda al mediar en las secuelas sistémicas. En su
investigación, utilizaron un modelo de infusión de bilis de pancreatitis aguda para mostrar una mejora en la gravedad
de la enfermedad, así como una mejora en la supervivencia general por TNF.ainhibición. El material experimental
consistió en ratas Sprague-Dawley macho adultas con un peso entre 250 y 300 gramos divididas en tres grupos: sin
tratar (solución biliar infundida sin tratamiento); tratados (solución biliar infundida precedida de tratamiento con anti
- TNF policlonalaanticuerpo); y simulado (infundido con solución salina). Entre los datos recopilados se encuentran los
siguientes valores de hematocrito (%) para animales que sobreviven más de 48 horas:
38 56 40
40 60 42
32 50 38
36 50 46
40 50 36
40 35
38 40
40 40
38 55
40 35
36
40
40
35
45
Fuente: Datos proporcionados por cortesía
del Dr. A. Osama Gaber.
64.Un estudio de Sm-arason et al. (A-67) fue motivado por las observaciones de otros investigadores de que los sueros de
mujeres preeclámpticas dañaron las células endoteliales humanas cultivadas. Los sujetos del presente estudio fueron
mujeres con preeclampsia, mujeres de control emparejadas con embarazos normales y mujeres no embarazadas.
406 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
las mujeres en edad fértil. Entre los datos recopilados se encontraban las siguientes observaciones sobre una
variable relevante medida en sujetos de los tres grupos.
sesenta y cinco.El objetivo de un estudio de LeRoith et al. (A-68) fue evaluar el efecto de una administración de 7 semanas de
GH humana recombinante (rhGH) y factor de crecimiento similar a la insulina humana recombinante (rhIGF-I) por
separado y en combinación sobre la función inmune en monos rhesus hembras de edad avanzada. El ensayo de la
función in vivo del sistema inmunitario se basó en la respuesta a una inmunización con toxoide tetánico. Las
siguientes son las respuestas para los tres grupos de tratamiento y un grupo de control:
66.Hampl et al. (A-69) tenga en cuenta que el óxido nítrico (NO) inhalado es un vasodilatador pulmonar selectivo. Plantearon
la hipótesis de que una dietilentriamina/NO nebulizada (DETA/NO) permanecería en las vías respiratorias inferiores y
suministraría continuamente suficiente NO para lograr una vasodilatación sostenida en la hipertensión pulmonar
crónica. El material experimental consistió en ratas Sprague-Dawley adultas, machos, libres de patógenos específicos,
divididas aleatoriamente en cuatro grupos: controles normotensos pulmonares, no tratados;
PREGUNTAS DE REPASO Y EJERCICIOS 407
monocrotalina inyectada (para inducir hipertensión) sin tratamiento (MCT); monocrotalina inyectada tratada
con un 5 -metrodosis mol o 50 -metrodosis mol de DETA/NO. Diecinueve días después de inducir
hipertensión pulmonar en los dos grupos de ratas, los investigadores comenzaron el procedimiento de
tratamiento, que duró 4 días. Recolectaron, entre otros datos, las siguientes mediciones sobre el gasto
cardíaco de los animales en los cuatro grupos:
MCTþDETA/NO
Control MCT 5metromol 50metromol
Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.En Kreiter et al. (A-70) los exámenes de la escuela de medicina se entregaron a través de formato de computadora. Debido a que no
había suficientes estaciones de computadora para evaluar a toda la clase simultáneamente, los exámenes se administraron durante 2
días. Tanto los estudiantes como los docentes se preguntaron si los estudiantes que toman el examen el día 2 podrían tener una
ventaja debido al tiempo de estudio adicional o una brecha en la seguridad del examen. Por lo tanto, los investigadores examinaron
una gran clase médicadnorte¼193Þevaluado durante 2 días con tres exámenes de opción múltiple de 80 ítems de 2 horas. A los
estudiantes se les asignaron días de prueba a través de una asignación pseudoaleatoria. De interés fue si tomar un examen en
particular el día 1 o el día 2 tuvo un impacto significativo en las calificaciones. Use el conjunto de datos MEDSCORES para determinar
si la prueba, el día o la interacción tienen un impacto significativo en los puntajes de la prueba. Dejara¼ :05.
2.Consulte los datos de ácido siálico unido a lípidos séricos en 1400 sujetos (LSADATA). Deseamos realizar un estudio
para determinar si la medición del ácido siálico unido a lípidos (LSA) en suero podría ser útil en la detección del
cáncer de mama. Las mediciones de LSA (mg/dl) son para cuatro poblaciones de sujetos: controles normales, A;
pacientes con enfermedad mamaria benigna, B; pacientes con cáncer de mama primario, C; y pacientes con
cáncer de mama metastásico recurrente, D. Seleccione una muestra aleatoria simple de tamaño 10 de cada
población y realice un análisis adecuado para determinar si podemos concluir que las medias de las cuatro
poblaciones son diferentes. Dejara¼ :05 y determinar elpagvalor. Pruebe todos los posibles pares de medias
muestrales para determinar su significancia. ¿Qué conclusiones se pueden sacar del análisis? Preparar un
informe verbal de los hallazgos. Compara tus resultados con los de tus compañeros.
3.Consulte los datos de la enzima convertidora de angiotensina sérica en 1600 sujetos (SACEDATA). La sarcoidosis,
que se encuentra en todo el mundo, es una enfermedad granulomatosa sistémica de causa desconocida. El
análisis de la enzima convertidora de angiotensina sérica (SACE) es útil en el diagnóstico de sarcoidosis activa. La
actividad de SACE suele estar aumentada en pacientes con la enfermedad, mientras que los niveles normales
ocurren en sujetos que no han tenido la enfermedad, aquellos que se han recuperado y pacientes con otros
trastornos granulomatosos. Los datos son los valores de SACE para cuatro poblaciones de sujetos clasificados
según el estado con respecto a la sarcoidosis: nunca tuvo, A; activo, B; estable, C; recuperado, D. Seleccione una
muestra aleatoria simple de 15 sujetos de cada población y realice un análisis para determinar si puede concluir
que las medias de la población son diferentes. Dejara¼ :05. Use la prueba de Tukey para probar diferencias
significativas entre pares de medias individuales. Prepare un informe escrito sobre sus hallazgos. Compara tus
resultados con los de tus compañeros.
408 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
4.Consulte los datos del factor estimulante de colonias urinarias en 1500 sujetos (CSFDATA). Los datos son los niveles
del factor estimulante de colonias urinarias (LCR) en cinco poblaciones: sujetos normales y sujetos con cuatro
enfermedades diferentes. Cada observación representa el recuento medio de colonias de cuatro placas de una
única muestra de orina de un sujeto determinado. Seleccione una muestra aleatoria simple de tamaño 15 de
cada una de las cinco poblaciones y realice un análisis de varianza para determinar si se puede concluir que las
medias de la población son diferentes. Dejara¼ :05. Use la estadística HSD de Tukey para probar diferencias
significativas entre todos los pares posibles de medias muestrales. Prepare un informe narrativo sobre los
resultados de su análisis. Compara tus resultados con los de tus compañeros.
5.Consulte los datos de glóbulos rojos en 1050 sujetos (RBCDATA). Suponga que usted es un consultor estadístico de
un investigador médico que está interesado en aprender algo sobre la relación entre las concentraciones de
folato en sangre en mujeres adultas y la calidad de su dieta. El investigador tiene disponibles tres poblaciones de
sujetos: aquellos cuya calidad de la dieta es calificada como buena, aquellos cuyas dietas son regulares y aquellos
con dietas deficientes. Para cada sujeto también está disponible su valor de folato de glóbulos rojos (RBC) (en
metrog=litro de glóbulos rojos). Extraiga una muestra aleatoria simple de tamaño 10 de cada población y
determine si el investigador puede concluir que las tres poblaciones difieren con respecto al valor medio de
folato en los glóbulos rojos. Usa la prueba de Tukey para hacer todas las comparaciones posibles. Dejara¼ :05 y
encuentra elpagvalor de cada prueba. Compara tus resultados con los de tus compañeros.
6.Consulte los datos de colesterol sérico en 350 sujetos con tres regímenes dietéticos (SERUMCHO). Un total
de 347 hombres adultos de entre 30 y 65 años participaron en un estudio para investigar la relación
entre el consumo de carne y los niveles de colesterol sérico. Cada sujeto comió carne de res como única
carne durante un período de 20 semanas, cerdo como única carne durante otro período de 20 semanas y
pollo o pescado como única carne durante otro período de 20 semanas. Al final de cada periodo
determinaciones de colesterol séricodmg=100mlÞse realizaron sobre cada tema. Seleccione una muestra
aleatoria simple de 10 sujetos de una población de 350. Use un análisis de varianza de dos vías para
determinar si se debe concluir que existe una diferencia en los niveles de colesterol sérico promedio de
la población entre las tres dietas. Dejara¼ :05. Compara tus resultados con los de tus compañeros.
REFERENCIAS
Referencias de metodología
1. AR FES ELLA,El diseño de experimentos,Octava edición, Oliver and Boyd, Edimburgo, 1966.
2. RA FES ELLA,Contribuciones a la Estadística Matemática,Wiley, Nueva York, 1950.
3. RA FES ELLA,Métodos estadísticos para investigadores,Decimocuarta edición, Hafner, Nueva York, 1973.
4. kLAÚSHINKELMANNy OCICATRIZkEMPTHORNE,Diseño y análisis de experimentos,Edición revisada, Wiley, Nueva York,
1994.
5. DOUGLASCMONGOMERÍA,Diseño y análisis de experimentos,Cuarta edición, Wiley, Nueva York, 1997.
6. J.EROMELMSÍy unRNOLDD. W.ANA,Diseño de Investigación y Análisis Estadístico,Earlbaum Associates, Hillsdale,
Nueva Jersey, 1995.
7. J.UN HIJOCHSU,Comparaciones Múltiples: Teoría y Métodos,Chapman & Hall, Nueva York, 1996.
8. P.ETERH WESFALL, RY TODODTOBÍAS, DTDRROM, RUSSELLD. W.OLFINGER, y YOSEFHOCHBERG,Múltiple
Comparaciones y Pruebas Múltiples,SAS Publishing, Cary, Carolina del Norte, 2001.
9. JW TUKEY, “El problema de las comparaciones múltiples”, Monografía mimeografiada, Universidad de Princeton, 1953;
citado en Yosef Hochberg y Ajit C. Tamhane,Procedimientos de comparación múltiple,John Wiley and Sons, Nueva
York, 1987.
10. BJWINER,Principios estadísticos en diseño experimental, segunda edición,McGraw-Hill, Nueva York, 1971.
11. CY KRAMERO, “Extensión de pruebas de rangos múltiples a medias grupales con tamaños de muestra desiguales,”biometría, 63
(1956), 307–310.
REFERENCIAS 409
Aplicaciones Referencias
A-1 DÁVIDOS.SOLBÉN, "Contenido de selenio de venado, ardilla y carne de res comprada o producida en Ohio, una región baja en
selenio de los Estados Unidos",Revista de ciencia de los alimentos, 67 (2002), 431–433.
A-2 WD MASCUA, WM MURRY, SEÑORINGLEB, KL KILGORE, y SA SNYDER, “Un transductor para medir momentos de codo
isométricos,”Biomecánica clínica, 16 (2001), 918–920.
A-3 jOHNPHolcomby RALFAJROTHENBERG, "La eficacia de alendronato y etidronato en la práctica
clínica" (manuscrito no publicado).
A-4 jASMINKAILICH-MIRNST, RHONDAABROWNBILL, mARTHAA. L.UDEMANNy RONGWEIFtu, “Factores críticos para el hueso
Salud en mujeres de todas las edades: ¿Qué tan importante es la masa muscular?Revista electrónica de salud de la mujer de Medscape, 7
(2002).
A-5 PAGAULBGVIEJO, ROBERTOnrUBEYy RICHARDTHARVEY, “Estudio comparativo naturalista y autoasignado de bupropion SR, un
parche de nicotina o ambos para el tratamiento para dejar de fumar en la atención primaria”Revista estadounidense
sobre adicciones, 11 (2002), 315–331.
A-6 X. W.ESP, X.SGALLINA, X.LI, y C. M.AULIAGRAWAL, “Cambios relacionados con la edad en la red de colágeno y dureza del
hueso,”Hueso, 31 (2002), 1–7.
A-7 FARHADATASSI, “Cuidado oral en el hogar y las razones para buscar atención dental por parte de personas en diálisis renal”,
Revista de práctica dental contemporánea, 3 (2002), 031–041.
A-8 SSOY UNORAGAZZI, AGOSTINOPAGIERRO, mARCAPAGÉTERES, LORELLAFASOLI, y SESTOY ENmiATÓN, “Hemograma completo temprano y
Gravedad de la enfermedad en recién nacidos con enterocolitis necrotizante”,Cirugía Pediátrica Internacional, 19 (2003), 376–
379.
A-9 ROBERTAROMITIR, mARIAIADPAGANSINI, FRANCESCOPAGERTICON, gIAN FRANCOANTONELLI, mARIAVITTORIAPAGITZALIS, y
PAGAOLORIZZÓN, “Efecto comparativo de los FITS de lercanidipina, felodipina y nifedipina sobre la presión arterial y la
frecuencia cardíaca en pacientes con hipertensión arterial de leve a moderada: el estudio de lercanidipina en adultos
(LEAD)”,Revista de Hipertensión Clínica, 5 (2003), 249–253.
A-10 Lkosmiski, D. K.URITZKES, J HAMILTON, T. S.ARPA, K. L.ICHTENSTIEN, J HENFERMOy R. E.CKEL, “La distribución de grasa se altera en
hombres infectados por el VIH sin evidencia clínica del síndrome de lipodistrofia del VIH”,Medicina del VIH, 4 (2003),
235–240.
A-11 BM BTORRES, FD ROSE, EAÁRBOL, y A. E.LLIOT-SCUADRADO, “Evaluación de la eficacia de la formación de personas con
problemas de aprendizaje en un entorno virtual”,Discapacidad y Rehabilitación, 24 (2002), 622–626.
A-12 BRIANJ. M.CCONVILLE, MHAROLDFOGELSON, ANDREWB. N.ORMAN, WILLIAMMKLYKYLO, PAGENZ MANDERSCHEID,
kARÉNWPARKER, y PAULR. S.ANBERG, "Potenciación de la nicotina del haloperidol en la reducción de la frecuencia de los tics en el
trastorno de Tourette",Diario Americano de Psiquiatría, 148 (1991), 793–794.
A-13 YO VALENCIA, GMCnorteEILL, JM BROCKWAY, y JS SMITO, "El efecto de la temperatura y la humedad ambientales en el gasto
energético de 24 horas en los hombres",Revista británica de nutrición, 68 (septiembre de 1992), 319–327. DSHODGSON,
A-14 CI DDESBLOQUEAR, PL CHAPMAN, y JL GCACHONDO, "Respuestas cardiopulmonares a la dilatación gástrica inducida
experimentalmente en perros anestesiados con isoflurano"Diario Americano de Investigación Veterinaria, 53 (junio
de 1992), 938–943.
A-15 jOHNC LICCIARDONE, SCOTTT. S.PEAJE, kIMBERLYG. F.ULDA, DÁVIDOPROSS, jFEPSIU, WILLIAMWPOSADAy J.OHN
SWIFT, Jr., "Tratamiento de manipulación osteopática para el dolor lumbar crónico: un ensayo controlado aleatorio" Columna
vertebral, 28 (2003), 1355–1362.
A-16 Centro Médico Mid-Michigan, Midland, Michigan, 1999; Aestudio de la condición oral de los pacientes con cáncer.Disponible
en línea en:http://calcnet.mth.cmich.edu/org/spss/Prj_cancer_data.htm.
A-17 YITAOLIU, LUDMILABELAYEV, WEIZHAOZHAO, RAULBUSTO, y MYRONDGINSBURG, “MRZ 2/579, una novela
poco competitivoNORTE-Antagonista de metil-D-aspartato, reduce el volumen del infarto y la inflamación del cerebro y mejora el déficit
neurológico después de la isquemia cerebral focal en ratas”,Investigación del cerebro, 862 (2000), 111–119.
A-18 DÁVIDOWSTARCH, jERRYWALEXANDER, PAGHILIPCNOBLEA, SURAJRREMOLINO, y DÁVIDOMLINTERNO, “Multitrenzado
Fijación del injerto del tendón de la corva con un tornillo de interferencia tibial estándar o de cuatro cuadrantes
centrales para la reconstrucción del ligamento cruzado anterior.Revista americana de medicina deportiva, 31 (2003),
A-19 338–344. DHOLBÉN, COMOMITO, JILICH, J. L.ANDOLL, J Holcomb, y V. M.ATKOVIK, "La pubertad no afecta negativamente el
estado de selenio en las mujeres jóvenes",Diario de la Asociación Dietética Americana, 102 (2002), 1082–1087.
A-20 AXELLINKE, gONGZHAO, FABIÓA. R.ECCHIA, jEFREYWILLIAMS, XIAOBINXtu, y THOMASS.SINTZE, "Desplazar en
Absorción de sustrato metabólico por el corazón durante el desarrollo de la diabetes inducida por aloxano”,American Journal
of Physiology: corazón y fisiología circulatoria, 285 (2003), H1007–H1014.
410 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA
A-21 K. W.ÉTER, IJCHRISTENSEN, y HJNIELSEN, "Determinación del factor de crecimiento endotelial vascular (VEGF) en
sangre circulante: importancia de VEGF en varios leucocitos y plaquetas"Revista escandinava de
investigación clínica y de laboratorio, 62 (2002), 343–350.
A-22 CarolynPORUCHA, SEstados UnidoskOWALSKI, y CTENÍALCROSS. “Estrés Estudiantil y Rendimiento Académico: Programa Hospital
Domiciliario,”Revista de Educación en Enfermería, 48 (2009), 631–637.
A-23 SHIGEKOtuRYU, jNaciones UnidasHARADA, mARIEHISAMOTO, y TOMIICHIROOAD, "La troglitazona inhibe tanto la neurotoxicidad posterior al glutamato
como la apoptosis inducida por bajo contenido de potasio en las neuronas granulares del cerebelo",Investigación del cerebro, 924 (2002),
229–236.
A-24 SOYAIN, JABU-SAAD, RSalternativa, I. V.LACONICOLIS, y A.D.OWSON, "Manejo por parte de enfermeras de la cefalea primaria: un
estudio piloto",Opinión de investigación médica actual, 18 (2002), 471–478.
A-25 SimonaPAGORCELINI, gUILIANAVALLANTÍ, SILVIAnorteOZA, gUIDOPAGOLI, ADRIANOLAzzarín, gUISEPPETABUSI, y
ANTONIOGRAMORASIA, "Potencial timopoyético mejorado en individuos infectados por VIH avirémicos con HAART mediante la
administración intermitente de IL-2",SIDA, 17 (2003), 1621–1630.
A-26 DOROTAIrRECKA, mICHALBENAREK, APRESAnorteOWINSKI, miLZBIETAPAGUSCINSKA, ANNAGRAMOoljan-GRAMOEREMEKy J.UN
ZIELINSKI, "El diagnóstico de limitación del flujo de aire combinado con consejos para dejar de fumar aumenta la tasa de abandono del
hábito de fumar",Cofre, 123 (2003), 1916–1923.
A-27 miLIMETROELTZER, BRUCEMPRENNER, y ANJULInorteAYAK, "Eficacia y tolerabilidad de 5 mg de desloratadina una vez al día, un
antagonista del receptor H1, en pacientes con evaluación de la rinitis alérgica estacional durante las estaciones
alérgicas de primavera y otoño"Investigaciones clínicas de medicamentos, 21 (2001), 25–32.
A-28 K. W.ÉTER, IJCHRISTENSEN, y HJNIELSEN, "Determinación del factor de crecimiento endotelial vascular (VEGF) en
sangre circulante: importancia de VEGF en varios leucocitos y plaquetas"Revista escandinava de
investigación clínica y de laboratorio, 62 (2002), 343–350.
A-29 RUBIAPMESHACKy kATLETAESORMAN, "Un ensayo controlado aleatorio de los efectos de los pesos en la amplitud y
frecuencia del temblor postural de la mano en personas con enfermedad de Parkinson"Rehabilitación Clínica, 16 (
2003), 481–492.
A-30 GLACROIX, CALLEISSOT, FROGERIEUX, R. B.EAULIEU, LCORNU, CGILLETA, FR OBIDEL, JP LEFEVRE, y año fiscal
BOIS, "Disminución de la respuesta alérgica pulmonar inducida por ovoalbúmina por exposición al benzaldehído pero no al
acetaldehído en un modelo de conejillo de Indias"Revista de Toxicología y Salud Ambiental, Parte A (2002), 995–1012.
A-32 jOHNBROCADOR, Datos analizados por el Centro de Consulta Estadística de la Universidad Estatal de Wright, Universidad Estatal de
Wright, Dayton, OH (1997).
A-33 miIZQUIERDOSkellis, Ph.D., "Los niños púberes no pueden relajarse durante el procedimiento de corrección de gravedad
pasiva en el dinamómetro iscinético"Isocinética y ciencia del ejercicio, 10 (2002), 97–105.
A-34 RDEEEPyeritz, miLLIOTK. F.ISMAN, BARBARAABERNHARDT, y STANLEYS. S.IEGELMAN, “La ectasia dural es una
Característica común del síndrome de Marfan”,Diario Americano de Genética Humana, 43 (1988), 726–732. ADINAHARTMAN
A-35 -METROAEIR, norteACHÚMSOROKER, hAPUNTARREN G, y NOMIkZTA, "Conciencia de los déficits en la rehabilitación del accidente
cerebrovascular",Revista de Medicina de Rehabilitación, 34 (2002), 158–164.
A-36 miFTIHIAVPOLYZOGOPOULOU, FOTIOSkALFARENTZOS, APOSTOLOSG. V.AGENAKIS, y THéodoroK. A.LEXANDRIDAS,
“Restauración de la euglucemia y la respuesta normal aguda de la insulina a la glucosa en sujetos obesos con
diabetes tipo 2 después de la cirugía bariátrica”Diabetes, 53 (2003), 1098–1103.
A-37 CarolSJOHNSTONy DL BBÚHO, "Estabilidad del ácido ascórbico en jugos de naranja disponibles comercialmente",
Diario de la Asociación Dietética Americana, 102 (2002), 525–529.
A-38 R. P.ITTINI, HACEREPKESS, KMACUERDO, R. R.EZNICK, J. B.OJOy R. W.INDRIM, “Enseñanza de procedimientos perinatales invasivos:
evaluación de un plan de estudios basado en un simulador de alta fidelidad”,Ultrasonido Obstetricia y Ginecología,
19 (2002), 478–483.
A-39 norteICKANIM-NORTEYAME, jOHNGRAMOAMBLADURA, SURENR. S.ORANNA, mARCAR. J.OHNSON, y PHILIPJ. S.TEER, “Microvascular
La permeabilidad está relacionada con los niveles circulantes del factor de necrosis tumoral-a en la preeclampsia.Investigación
cardiovascular, 58 (2003), 162–169.
A-40 jNaciones UnidasIWAMOTO, TSUYOSHITAKEDA, SHOICHIICHIMURA, y MITSUYOSHItuZAWA, “Efectos del tratamiento de 5 años con
Elcatonina y alfacalcidol sobre la densidad mineral ósea lumbar y la incidencia de fracturas vertebrales en
REFERENCIAS 411
A-60 LIZABETROEMER, mARIOBORKOVEC, SharónPAGAOS, y TD BORKOVEC, "Una medida de autodiagnóstico del trastorno de
ansiedad generalizada",Revista de terapia conductual y psiquiatría experimental, 26 (1995), 345–350.
A-61 ILSECcristiansen, CECILIAGRAMOIDLO €F, kARL-METROICHAELkA €LKNER, hRespuestaHAGBERG, hELGEBENNMARKER, y THOMAS
T€oTTERMAN, "Los niveles séricos elevados de ICAM-1 soluble en los linfomas no Hodgkin se correlacionan con la carga tumoral,
la actividad de la enfermedad y otros marcadores de pronóstico",Revista británica de hematología, 92 (1996), 639–646. SYLVIEC
A-62 OSETA, LOuiseLE-VESQUE, y yoIANELAURÍN, “Apoyo informal y formal para los cuidadores de un pariente demente: ¿el género y el
parentesco marcan la diferencia?”Investigación en Enfermería y Salud, 18 (1995), 437–451.
A-63 SADATOMOTASAKA, AKITOSHIISHIZAKA, kOICHISAYAMA, FUMIOSAkamaki, hIDETOSHInorteAKAMURA, TAKESHITERA-SHIMA, YASUHIRO
WLRA, kENZOSOEJIMA, mORIOnorteAKAMURA, hIROAKIMETROATSUBARA, SÉITAROFUJISHIMA, y MINORU
kANAZAWA, “Asesinado por calorCorynebacterium parvummejora la lesión pulmonar por endotoxinas con una mayor
producción de TNF en cobayas”,American Journal of Respiratory and Critical Care Medicine, 153 (1996), 1047–1055.
A-64 METROITSUGITAKAHASHI, hIDEOnorteAGAO, y HIROSIMETROATSUDA, "Estimación del cambio óseo en pacientes con
discapacidad grave",Medicina del Desarrollo y Neurología Infantil, 37 (1995), 1085–1093.
A-65 CORRIEB.ALLEN, "Efectos de la deficiencia de cobre en la dieta sobre la ingesta relativa de alimentos y la eficiencia del crecimiento en ratas"
Fisiología y comportamiento, 59 (1996), 247–253.
A-66 CHRISTOPHERBHUGHES, LILLIANWGABER, ABOUBAKRMETROOyemiL-DEN, hY YOPGREGALO, mALAKkOTB, LINDA
METROANA, y A. O.SAMAGRAMOABER, "La inhibición de TNFa mejora la supervivencia en un modelo experimental de pancreatitis
aguda",Cirujano estadounidense, 62 (1996), 8–13.
A-67 ALEXANDERKSMAMÁ - RAZON, IUNLSARGÉN, y CHRISTOPHERGT REDMAN, “La proliferación de células endoteliales es
Suprimido por plasma pero no por suero de mujeres con preeclampsia”,Diario americano de obstetricia y
ginecología, 174 (1996), 787–793.
A-68 DEREKLmiROITH, jACKYANEWSKI, miRICPAQUETEALDJIAN, miLAINASJAFE, TANYALeROITH, kAthyPAGURDUE, BARBARA
DCOPER, ROBERTOPAGYLE, y WILLIAMADLER, "Los efectos de la hormona de crecimiento y el factor de crecimiento similar a la insulina I en el
sistema inmunológico de los monos hembra de edad avanzada"Endocrinología, 137 (1996), 1071-1079. VA
A-69 -CLAVHAMPL, mARTINTRISTANI-FIROUZI, THOMASCHVENDER, y StephenLARCHER, “Óxido Nítrico Nebulizado/
El aducto nucleófilo reduce la hipertensión pulmonar crónica”,Investigación cardiovascular, 31 (1996), 55–62.
A-70 CKREITER, MW PETERSON, K. F.ERGUSON, y S. E.LLIOTT, "Los efectos de las pruebas en turnos en un examen clínico
computarizado en curso",Educación Médica, 37 (2003), 202–204.
CAPÍTULO 9
REGRESIÓN LINEAL SIMPLE Y
CORRELACIÓN
Este capítulo proporciona una introducción y una descripción general de dos técnicas
comunes para explorar la fuerza de la relación entre dos variables. La primera
técnica, la regresión lineal, nos ayudará a encontrar una forma objetiva de predecir o
estimar el valor de una variable dado el valor de otra variable. La segunda técnica, la
correlación, nos ayudará a encontrar una medida objetiva de la fuerza de la relación
entre dos variables.
TEMAS
9.1INTRODUCCIÓN
9.2EL MODELO DE REGRESIÓN
9.3LA ECUACIÓN DE REGRESIÓN MUESTRA
9.4EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN
9.5USO DE LA ECUACIÓN DE REGRESIÓN
9.6EL MODELO DE CORRELACIÓN
9.7EL COEFICIENTE DE CORRELACIÓN
9.8ALGUNAS PRECAUCIONES
9.9RESUMEN
413
414 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
9.1 INTRODUCCIÓN
Al analizar datos para las disciplinas de las ciencias de la salud, encontramos que con frecuencia es
deseable aprender algo sobre la relación entre dos variables numéricas. Nos puede interesar, por
ejemplo, estudiar la relación entre la presión arterial y la edad, la altura y el peso, la concentración de
un fármaco inyectado y la frecuencia cardiaca, el nivel de consumo de algún nutriente y el aumento
de peso, la intensidad de un estímulo y el tiempo de reacción , o ingreso familiar total y gastos de
atención médica. La naturaleza y la fuerza de las relaciones entre variables como estas pueden
examinarse utilizando modelos lineales comoregresiónycorrelación análisis, dos técnicas estadísticas
que, aunque relacionadas, sirven para propósitos diferentes.
RegresiónEl análisis de regresión es útil para evaluar formas específicas de la relación entre
variables, y el objetivo final cuando se emplea este método de análisis suele serpredeciro
estimarel valor de una variable correspondiente a un valor dado de otra variable. Las ideas de la
regresión fueron aclaradas por primera vez por el científico inglés Sir Francis Galton
(1822-1911) en los informes de su investigación sobre la herencia, primero en los guisantes de
olor y luego en la estatura humana. Describió una tendencia de la descendencia adulta, que
tiene padres altos o bajos, a volver a la altura promedio de la población general. Usó por
primera vez la palabrareversión,y despuésregresión,para referirse a este fenómeno.
En el típico problema de regresión, como en la mayoría de los problemas de estadística aplicada, los
investigadores tienen disponible para el análisis una muestra de observaciones de alguna población
real o hipotética. Con base en los resultados de su análisis de los datos de la muestra, están
interesados en tomar decisiones sobre la población de la que se supone que se extrajo la muestra. Es
importante, por lo tanto, que los investigadores comprendan la naturaleza de la población en la que
están interesados. Deben saber lo suficiente sobre la población para poder construir un modelo
matemático para su representación o determinar si se ajusta razonablemente.
9.2 EL MODELO DE REGRESIÓN 415
1.Valores de la variable independienteXse dice que son "fijos". Esto significa que los valores deXson
preseleccionados por el investigador para que en la recolección de los datos no se les permita
variar de estos valores preseleccionados. En este modelo,Xes referido por algunos escritores
como unno aleatoriovariable y por otros comomatemáticovariable. Cabe señalar en este
momento que el enunciado de este supuesto clasifica nuestro modelo como elmodelo de
regresión clásico.El análisis de regresión también se puede llevar a cabo en datos en los queXes
una variable aleatoria.
2.La variableXse mide sin error. Dado que ningún procedimiento de medición es perfecto,
esto significa que la magnitud del error de medición enXes despreciable.
3.Para cada valor deXhay una subpoblación deYvalores. Para que los procedimientos
inferenciales usuales de estimación y prueba de hipótesis sean válidos, estas
subpoblaciones deben estar normalmente distribuidas. Para que se presenten estos
procedimientos se supondrá que elYlos valores se distribuyen normalmente en los
ejemplos y ejercicios que siguen.
4.Las varianzas de las subpoblaciones deYson todos iguales y se denotan pors2.
5.Las medias de las subpoblaciones deYtodos se encuentran en la misma línea recta. Esto se
conoce como elsupuesto de linealidad.Esta suposición puede expresarse simbólicamente como
metroyjX¼b0þb1X (9.2.1)
y¼b0þb1Xþmi (9.2.2)
dóndeyes un valor típico de una de las subpoblaciones deY,b0yb1son como se definen para la
Ecuación 9.2.1, ymise llama término de error. Si resolvemos 9.2.2 parami,tenemos
mi¼y-db0þb1XÞ
(9.2.3)
¼y-metroyjX
LÍNEA [Lineal (supuesto 5), Independiente (supuesto 6), Normal (supuesto 3),
Varianzas iguales (supuesto 4)]
F(X,Y)
my|X=β + βX Y
0 1
X1
my|X1
X2
my|X2
X3
my|X3
X4
my|X4
X
FIGURA 9.2.1 Representación del modelo de regresión lineal simple.
9.3 LA ECUACIÓN DE REGRESIÓN DE MUESTRA 417
1.Determinar si los supuestos subyacentes a una relación lineal se cumplen o no en los datos
disponibles para el análisis.
2.Obtenga la ecuación de la línea que mejor se ajuste a los datos de la muestra.
EJEMPLO 9.3.1
Despr-es et al. (A-1) señalan que la topografía del tejido adiposo (TA) se asocia a
complicaciones metabólicas consideradas como factores de riesgo de enfermedad
cardiovascular. Es importante, afirman, medir la cantidad de AT intraabdominal
como parte de la evaluación del riesgo de enfermedad cardiovascular de un
individuo. Sin embargo, la tomografía computarizada (TC), la única técnica disponible
que mide de manera precisa y confiable la cantidad de TA abdominal profunda, es
costosa y requiere irradiación del sujeto. Además, la técnica no está disponible para
muchos médicos. Despr-es y sus colegas realizaron un estudio para desarrollar
ecuaciones para predecir la cantidad de TA abdominal profunda a partir de
mediciones antropométricas simples. Sus sujetos eran hombres de entre 18 y 42
años que no padecían enfermedades metabólicas que requirieran tratamiento.
418 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
se muestra en la Tabla 9.3.1. Una cuestión de interés es qué tan bien se puede predecir y estimar la TA
abdominal profunda a partir del conocimiento de la circunferencia de la cintura. Esta pregunta es
típica de las que pueden responderse mediante análisis de regresión. Dado que la TA abdominal
profunda es la variable sobre la que deseamos hacer predicciones y estimaciones, es la variable
dependiente. La variable medida de la cintura, cuyo conocimiento se utilizará para realizar las
predicciones y estimaciones, es la variable independiente.
El diagrama de dispersión
Un primer paso que suele ser útil para estudiar la relación entre dos variables es preparar
undiagrama de dispersiónde los datos como se muestra en la Figura 9.3.1. Los puntos se
grafican asignando valores de la variable independienteXal eje horizontal y valores de la
variable dependienteYal eje vertical.
El patrón formado por los puntos trazados en el diagrama de dispersión generalmente sugiere
la naturaleza básica y la fuerza de la relación entre dos variables. Cuando miramos la Figura 9.3.1, por
ejemplo, los puntos parecen estar dispersos alrededor de una línea recta invisible. El diagrama de
dispersión también muestra que, en general, los sujetos con circunferencias de cintura grandes
también tienen mayores cantidades de TA abdominal profunda. Estas impresiones sugieren que la
relación entre las dos variables puede describirse mediante una línea recta que cruza laY- debajo del
origen y formando un ángulo de aproximadamente 45 grados con elX-eje. Parece que sería sencillo
dibujar, a mano alzada, a través de los puntos de datos la línea que describe la relación entreXyySin
embargo, es muy poco probable que las líneas dibujadas por dos personas sean exactamente iguales.
En otras palabras, por cada persona que dibuje una línea de este tipo a ojo oa mano alzada,
esperaríamos una línea ligeramente diferente. Entonces surge la pregunta de qué línea describe
mejor la relación entre las dos variables. No podemos obtener una respuesta a esta pregunta
inspeccionando las líneas. De hecho, no es probable que ninguna línea a mano alzada
260
240
220
200
180
Área abdominal profunda AT (cm2),Y
160
140
120
100
80
60
40
20
0
0 60 70
sesenta y cinco 75 80 85 90 95 100 105 110 115 120 125
Circunferencia de la cintura (cm),X
trazada a través de los datos será la línea que mejor describa la relación entreXyY, ya que las
líneas a mano alzada reflejarán cualquier defecto de visión o juicio de la persona que traza la
línea. Del mismo modo, al juzgar cuál de las dos líneas describe mejor la relación, la evaluación
subjetiva está sujeta a las mismas deficiencias.
Lo que se necesita para obtener la línea deseada es algún método que no esté plagado de
estas dificultades.
y¼aþbx (9.3.1)
dóndeyes un valor en el eje vertical,Xes un valor en el eje horizontal,aes el punto donde la línea cruza
el eje vertical, ybmuestra la cantidad por la cualycambios por cada unidad cambio enX.Nos referimos
aacomo ely-interceptar ybcomo elpendientede la linea Para dibujar una línea basada en la Ecuación
9.3.1, necesitamos los valores numéricos de las constantesayb.Dadas estas constantes, podemos
sustituir varios valores deXen la ecuación para obtener los valores correspondientes dey.Los puntos
resultantes se pueden trazar. Dado que dos de estas coordenadas determinan una línea recta,
podemos seleccionar dos, ubicarlas en un gráfico y conectarlas para obtener la línea correspondiente
a la ecuación.
La ecuación de la línea de regresión de mínimos cuadrados se puede obtener a partir de datos de muestra
mediante cálculos aritméticos simples que se pueden realizar a mano utilizando las siguientes ecuaciones
PAG
norte
Estadística Regresión Regresión MTB > Nombre C3 = 'FITS1' C4 = 'RESI1' MTB >
TipoyenRespuestayXenPredictores. Hacer clicAlmacenamiento. Regresión 'y' 1 'x';
ControlarDerechos residuales de autoryEncaja. Hacer clicDE SUBC> Se adapta a 'FITS1';
ACUERDO. SUBC> Constante;
SUBC> Derechos residuales de autor 'RESI1'.
Producción:
Análisis de Diferencia
FUENTE DF SS EM F pag
Regresión 1 237549 237549 217.28 0.000
Error 107 116982 1093
Total 108 354531
Inusual Observaciones
Obs. X y Adaptar Stdev.Ajuste Residual San Resid
58 86 155.00 82.52 3.43 72.48 2.20R
sesenta y cinco 120 90.41 197.70 7.23 - 107.29 -3.33R
66 120 106.00 198.74 7.29 - 92.74 -2.88R
71 107 87.99 154.12 4.75 - 66.13 -2.02R
97 106 241.00 150.66 4.58 90.34 2.76R
102 109 229.00 161.38 5.13 67.62 2.07R
103 115 253.00 181.79 6.28 71.21 2.19R
FIGURA 9.3.2Procedimiento y salida de MINITAB para obtener la ecuación de regresión de mínimos cuadrados
a partir de los datos de la tabla 9.3.1.
422 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
De la Figura 9.3.2 vemos que la ecuación lineal para la línea de mínimos cuadrados que
describe la relación entre la circunferencia de la cintura y la AT abdominal profunda puede escribirse,
entonces, como
ŷ¼ -216þ3:46X
Esta ecuación nos dice que dado que b̂0es negativo, la recta cruza elY-eje debajo del origen, y
que desde b̂1la pendiente es positiva, la línea se extiende desde la esquina inferior izquierda del
gráfico hasta la esquina superior derecha. Vemos además que por cada unidad de aumento enx, y
aumenta en una cantidad igual a 3,46. El símbolo ŷ denota un valor deycalculado a partir de la
ecuación, en lugar de un valor observado dey
Sustituyendo dos valores convenientes deXen la Ecuación 9.3.2, podemos obtener las
coordenadas necesarias para dibujar la línea. Supongamos, primero, que dejamosX¼70 y obtener
ŷ¼ -216þ3:46d70¼26:2
si dejamosX¼110 obtenemos
ŷ¼ -216þ3:46d110¼164
La línea, junto con los datos originales, se muestra en la Figura 9.3.3.
260
240
220
200
180
Área abdominal profunda AT (cm2),Y
160
140
120
ŷ= _216 + 3,46X
100
80
60
40
20
0
0 60 70
sesenta y cinco 75 80 85 90 95 100 105 110 115 120 125
Circunferencia de la cintura (cm),X
El criterio de los mínimos cuadradosAhora que hemos obtenido lo que llamamos la línea de
"mejor ajuste" para describir la relación entre nuestras dos variables, necesitamos determinar
por qué criterio se considera mejor. Antes de establecer el criterio, examinemos la figura 9.3.3.
Observamos que, por lo general, la línea de mínimos cuadrados no pasa por los puntos
observados que se trazan en el diagrama de dispersión. En otras palabras, la mayoría de los
puntos observadosdesviarsede la línea en cantidades variables.
La línea que hemos trazado a través de los puntos es mejor en este sentido:
La suma de las desviaciones verticales al cuadrado de los puntos de datos observados (yi)de la línea de mínimos
cuadrados es menor que la suma de las desviaciones verticales al cuadrado de los puntos de datos de cualquier
otra línea.
En otras palabras, si elevamos al cuadrado la distancia vertical desde cada punto observado (yi) a la
línea de mínimos cuadrados y suma estos valores cuadrados para todos los puntos, el total resultante será
más pequeño que el total calculado de manera similar para cualquier otra línea que pueda dibujarse a través
de los puntos. Por esta razón, la recta que hemos trazado se llama recta de mínimos cuadrados.
EJERCICIOS
9.3.1Trace cada una de las siguientes ecuaciones de regresión en papel cuadriculado y establezca siXyYestán directa o
inversamente relacionados.
(a) ŷ¼ -3þ2X
(por¼3þ0:5X
(c) ŷ¼10 - 0:75X
9.3.2Las siguientes puntuaciones representan la evaluación de una enfermera (X)y la evaluación de un médico (Y)de la
condición de 10 pacientes en el momento de la admisión a un centro de trauma.
X: 18 13 18 15 10 12 8 4 7 3
Y: 23 20 18 dieciséis 14 11 10 7 6 4
(b)Trace las siguientes ecuaciones de regresión en el diagrama de dispersión e indique cuál cree que se
ajusta mejor a los datos. Indique el motivo de su elección.
(1) ŷ¼8þ0:5X
(2) ŷ¼ -10þ2X
(3)y¼1þ1X
Para cada uno de los siguientes ejercicios (a) dibuje un diagrama de dispersión y (b) obtenga la ecuación de regresión y
grafítela en el diagrama de dispersión.
9.3.3La metadona a menudo se prescribe para el tratamiento de la adicción a los opiáceos y el dolor crónico. Krantz et al.
(A-2) estudiaron la relación entre la dosis de metadona y el intervalo QT corregido (QTc) en 17 sujetos
que desarrollarontorsade de pointes (taquicardia ventricular casi siempre debida a medicamentos). El
QTc se calcula a partir de un electrocardiograma y se mide en mm/seg. Un mayor valor de QTc indica
un mayor riesgo de mortalidad cardiovascular. Una cuestión de interés es qué tan bien se puede
predecir y estimar el valor de QTc a partir del conocimiento de la dosis de metadona. Esta pregunta es
típica de las que pueden responderse mediante análisis de regresión. Como QTc es la variable
424 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
9.3.4Reiss et al. (A-3) compararon ensayos de laboratorio hospitalarios estándar y en el punto de atención para monitorear
pacientes que recibieron un solo anticoagulante o un régimen que consiste en una combinación de anticoagulantes.
Es bastante común, cuando se comparan dos técnicas de medición, utilizar análisis de regresión en los que una
variable se utiliza para predecir otra. En el presente estudio, los investigadores obtuvieron medidas de la razón
normalizada internacional (INR) mediante análisis de muestras de sangre venosa y capilar recolectadas de 90 sujetos
que tomaban warfarina. El INR, utilizado especialmente cuando los pacientes reciben warfarina, mide la capacidad de
coagulación de la sangre. Las pruebas de INR en el punto de atención se realizaron con el producto de ensayo
CoaguChek. Las pruebas hospitalarias se realizaron con ensayos estándar de laboratorio hospitalario. Los autores
utilizaron el nivel de INR del ensayo del hospital para predecir el nivel de INR de CoaguChek. Las medidas se dan en la
siguiente tabla.
9.3.5La digoxina es un fármaco que se suele recetar para tratar enfermedades del corazón. El propósito de un estudio de
Parker et al. (A-4) fue examinar las interacciones de la digoxina con el jugo de toronja común. En un experimento, los
sujetos tomaron digoxina con agua durante 2 semanas, seguido de un período de 2 semanas durante el cual se
suspendió la digoxina. Durante las siguientes 2 semanas, los sujetos tomaron digoxina con jugo de toronja. Para siete
sujetos, la concentración plasmática máxima promedio de digoxina (Cmax) al tomar agua se da en la primera
columna de la siguiente tabla. La segunda columna contiene el cambio porcentual en la concentración de Cmax
cuando los sujetos tomaban digoxina con jugo de toronja [GFJ (cambio %)]. Use el nivel de Cmax cuando tome
digoxina con agua para predecir el cambio porcentual en la concentración de Cmax cuando tome digoxina con jugo
de toronja.
2.34 29.5
2.46 40.7
1.87 5.3
3.09 23.3
5.59 - 45:1
4.05 - 35:3
6.21 - 44:6
2.34 29.5
Fuente: Datos proporcionados por cortesía de Robert B. Parker, Pharm.D.
9.3.6Evans et al. (A-5) examinó el efecto de la velocidad sobre las fuerzas de reacción del suelo (GRF) en perros con cojera por
un ligamento cruzado craneal desgarrado. Los perros fueron paseados y trotados sobre una fuerza
426 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
plataforma y el GRF registrado (en newtons) durante la fase de apoyo. La siguiente tabla contiene 22
medidas de fuerza expresadas como la media de cinco medidas de fuerza por perro al caminar y la
media de cinco medidas de fuerza por perro al trotar. Utilice el valor de GRF al caminar para predecir
el valor de GRF al trotar.
9.3.7La tasa de filtración glomerular (TFG) es el parámetro más importante de la función renal evaluado en
receptores de trasplantes. Aunque el aclaramiento de inulina se considera la medida estándar de oro
de la TFG, su uso en la práctica clínica es limitado. Krieser et al. (A-6) examinaron la relación entre el
inverso de la cistatina C (una proteína básica catiónica medida en mg/L) y la tasa de filtración
glomerular de inulina medida por el aclaramiento (ml/min/ 1,73 metros2). Los resultados de 27
pruebas se muestran en la siguiente tabla. Use DTPA GFR como predictor de Cistatina C inversa.
18 0.213 42 0.485
21 0.265 42 0.427
21 0.446 43 0.562
23 0.203 43 0.463
27 0.369 48 0.549
27 0.568 48 0.538
30 0.382 51 0.571
32 0.383 55 0.546
32 0.274 58 0.402
32 0.424 60 0.592
36 0.308 62 0.541
37 0.498 67 0.568
41 0.398 68 0.800
88 0.667
Una vez que se ha obtenido la ecuación de regresión, se debe evaluar para determinar si
describe adecuadamente la relación entre las dos variables y si se puede usar de manera
efectiva con fines de predicción y estimación.
Por lo tanto, vemos que antes de usar una ecuación de regresión muestral para
predecir y estimar, es deseable probarH0:b1¼0. Podemos hacer esto usando el
análisis de varianza y elFestadística o usando eltestadística. Ilustraremos ambos
métodos. Sin embargo, antes de hacer esto, veamos cómo podemos investigar la
fuerza de la relación entreXyy
X
(a)
X
(b)
FIGURA 9.4.1 Condiciones en una población que pueden evitar el rechazo de la hipótesis nula
esob1¼0. (a)La relación entreXyYes lineal, perob1está tan cerca de cero que es probable que los datos de la
muestra no produzcan ecuaciones que sean útiles para predecirYcuandoXes dado. (b)La relación entreXyY
no es lineal; un modelo curvilíneo proporciona un mejor ajuste a los datos; No es probable que los datos de
muestra produzcan ecuaciones que sean útiles para predecirYcuandoXes dado.
Parece bastante obvio a partir de la figura 9.4.3 que la dispersión de los puntos alrededor
de la línea de regresión es mucho menor que la dispersión alrededor de -ylínea. No
desearíamos, sin embargo, decidir sobre esta sola base que la ecuación es útil. La situación
puede no ser siempre tan clara, por lo que una medida objetiva de algún tipo sería mucho más
deseable. Tal medida objetiva, llamadacoeficiente de determinación,está disponible.
X
(a)
X
(b)
FIGURA 9.4.2 Condiciones de la población relativas aXyYque puede causar el rechazo de la
hipótesis nula de queb1¼0. (a)La relación entreXyYes lineal y de fuerza suficiente para justificar el
uso de una ecuación de regresión de muestra para predecir y estimarYpara valores dados deX. (b)Un
modelo lineal proporciona un buen ajuste a los datos, pero algún modelo curvilíneo proporcionaría
un ajuste aún mejor.
260
240
220
200
180
ŷ= _216 + 3,46X
Área abdominal profunda AT (cm2),Y
160
140
120
100
y–=101.89
80
60
40
20
0
0 60 70
sesenta y cinco 75 80 85 90 95 100 105 110 115 120 125
Circunferencia de la cintura (cm),X
FIGURA 9.4.3Diagrama de dispersión, línea de regresión muestral yy-línea para el Ejemplo 9.3.1.
Si medimos estas desviaciones para cada valor deyiy ŷi, al cuadrado de cada desviación, y
sumamos las desviaciones al cuadrado, tenemos
X X X
dyi- -yÞ2¼ ðŷi- -yÞ 2þ dyi- ŷ2 iÞ (9.4.2)
Suma total de cuadradosElsuma total de cuadrados (SST), por ejemplo, es una medida de la
dispersión de los valores observados deYsobre su media -y;es decir, este término es una
medida de la variación total en los valores observados deyEl lector reconocerá este término
como el numerador de la fórmula familiar para la varianza muestral.
260
240
inexplicable
desviación
220 (yi– ŷi)
200
Desviación total
Área abdominal profunda AT (cm2),Y 180 (yi– y–)
160 Explicado
desviarse_ion
ŷ= _216 + 3,46X (ŷi- y)
140
120
100
y–=101.89
80
60
40
20
0
0 60 70
sesenta y cinco 75 80 85 90 95 100 105 110 115 120 125
Circunferencia de la cintura (cm),X
FIGURA 9.4.4Diagrama de dispersión que muestra las desviaciones totales, explicadas y no explicadas para un
valor seleccionado deY,Ejemplo 9.3.1.
acero inoxidable¼RSSþSSE
Los valores numéricos de estas sumas de cuadrados para nuestro ejemplo ilustrativo aparecen en la
tabla de análisis de varianza de la figura 9.3.2. Así, vemos queacero inoxidable¼354531,RSS¼237549,
SSE¼116982, y
354531¼237549þ116982
354531¼354531
En nuestro ejemplo actual tenemos, utilizando los valores de sumas de cuadrados de la Figura 9.3.2,
237549
r2¼ ¼ :67
354531
EJEMPLO 9.4.1
Consulte el Ejemplo 9.3.1. Queremos saber si podemos concluir que, en la población de la que se
extrajo nuestra muestra,XyYestán relacionados linealmente.
9.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN 433
(a) (b)
Corte ajustado, grander2 Ajuste pobre, pequeñor2
(C) (d)
r2= 1 r2 ← 0
FIGURA 9.4.5 r2como una medida de la cercanía de ajuste de la línea de regresión muestral a la muestra
observaciones.
116982=107
~r2¼1 - ¼ :66695
354531=108
Esta cantidad está etiquetada como R-sq(adj) en la Figura 9.3.2 y se reporta como 66.7 por ciento. Vemos que
este valor es menor que
116982
r2¼1 - ¼ :67004
354531
metrob
0
¼b 0 (9.4.4)
PAG
s2y=x Xi2
s2b0 ¼ PAG (9.4.5)
norte dXi- -XÞ2
metrob
1
¼b 1 ( 9.4.6)
s2yjX
s2b1 ¼PAG (9.4.7)
dXi- -XÞ2
En las Ecuaciones 9.4.5 y 9.4.7s2 y=xes la varianza no explicada de las subpoblaciones deY
valores.
Con conocimiento de las distribuciones muestrales de b̂0y B1podemos construir
intervalos de confianza y probar hipótesis relativas ab0yb1de la manera habitual.
Inferencias sobreano suelen ser de interés. Por otro lado, como hemos visto, gran parte
del interés se centra en los procedimientos inferenciales con respecto a b̂1. La razón de
esto es el hecho de queb1nos dice mucho sobre la forma de la relación entreXyy CuandoX
yYestán relacionados linealmente a b̂ positivo1indica que, en general,Yaumenta a medida
queX aumenta, y decimos que hay unrelación lineal directaentreXyyUna b negativa1indica
que los valores deYtienden a disminuir a medida que los valores deXaumentar, y decimos
436 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
Y Y Y
X X X
(a) (b) (C)
FIGURA 9.4.6Diagramas de dispersión que muestran (a)relación lineal directa, (b)relación lineal
inversa, y (C)ninguna relación lineal entreXyy
La estadística de prueba Para probar hipótesis sobreb1el estadístico de prueba cuandos2 yjXes
conocido es
b1-db1Þ0
z¼ (9.4.8)
sb1
dóndedb1Þ0es el valor hipotético deb1. El valor hipotético deb1no tiene que ser cero,
pero en la práctica, la mayoría de las veces, la hipótesis nula de interés es que b1¼0.
Como una reglas2 yjXes desconocido. Cuando este es el caso, el estadístico de prueba es
b1-db1Þ0
t¼ (9.4.9)
sb1
EJEMPLO 9.4.2
Consulte el Ejemplo 9.3.1. Deseamos saber si podemos concluir que la pendiente de la
línea de regresión poblacional que describe la relación entre X e Y es cero.
Solución:
3. Hipótesis.
H0:b1¼0
HA:b16¼0
a¼ :05
4. Estadística de prueba. El estadístico de prueba viene dado por la Ecuación 9.4.9.
3:4589 - 0
t¼ ¼14:74
:2347
Como ya se ha señalado, la Ecuación 9.4.9 puede usarse para probar la hipótesis nula de que b1
es igual a algún valor distinto de 0. El valor hipotético parab1,db1Þ0se sustituye en la Ecuación
9.4.9. Todas las demás cantidades, así como los cálculos, son los mismos que en el ejemplo
ilustrativo. Los grados de libertad y el método para determinar el significado también son los
mismos.
438 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
Intervalo de confianza parab1 Una vez que determinamos que es poco probable, a la luz de la evidencia
de la muestra, queb1es cero, podemos estar interesados en obtener una estimación de intervalo deb1. La
fórmula general para un intervalo de confianza,
s2yjX
sb 1 ¼ PAG
dXi- -XÞ2
s2
sb1¼PAGyjX 2
dXi- -XÞ
dóndes2yjX¼MSE
En la mayoría de las situaciones prácticas, nuestro 100d1 -aÞintervalo de confianza porcentual parabes
Para nuestro ejemplo ilustrativo, construimos el siguiente intervalo de confianza del 95 por
ciento parab:
3:4589 - 1:9826d:2347Þ
d2:99; 3:92Þ
que aunque los datos se ajustan bastante bien al modelo de regresión lineal (como lo demuestra el
hecho de que la hipótesis nula de queb1¼0 es rechazado), algún modelo no lineal proporcionaría un
ajuste aún mejor. En consecuencia, cuando rechazamosH0esob1¼0, lo mejor que podemos decir es
que se pueden obtener resultados más útiles (discutidos a continuación) al tener en cuenta la
regresión deYenXque en ignorarlo.
línea
el
FIGURA 9.4.7Gráficas residuales útiles para probar los supuestos de linealidad y de varianzas iguales del
modelo de regresión. (a)Un patrón aleatorio de puntos que ilustran la no violación de los supuestos. (b)Un
patrón no aleatorio que ilustra una probable violación de la suposición de linealidad.
(C)Un patrón de canalización que ilustra una probable violación de la suposición de igualdad de varianzas.
440 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
valores estandarizados (es decir,mii=MSE)de los valores residuales y predichos, pero se interpretan de
la misma manera que los gráficos de valores no estandarizados.
EJEMPLO 9.4.3
Consulte el Ejemplo 9.3.1. Deseamos usar gráficas de residuos para probar las suposiciones de linealidad y
varianzas iguales en los datos.
EJERCICIOS
9.4.1 a 9.4.5Consulte los Ejercicios 9.3.3 a 9.3.7, y para cada uno haga lo siguiente:
(a)Calcule el coeficiente de determinación.
(b)Prepare una tabla ANOVA y use elFestadístico para probar la hipótesis nula de queb1¼0. Deja a¼ :
05.
(C)Utilizar eltestadístico para probar la hipótesis nula de queb1¼0 en el nivel de significancia de .05.
(d)Determina elpagvalor para cada prueba de hipótesis.
(mi)Exprese sus conclusiones en términos del problema.
(F)Construya el intervalo de confianza del 95 por ciento parab1.
9.5 USO DE LA ECUACIÓN DE REGRESIÓN 441
Si los resultados de la evaluación de la ecuación de regresión muestral indican que existe una
relación entre las dos variables de interés, podemos poner en práctica la ecuación de regresión.
Hay dos formas en que se puede utilizar la ecuación. puede ser usado para predecirque valorY
es probable que asuma dado un valor particular deX.Cuando se cumple el supuesto de
normalidad de la Sección 9.2, unintervalo de predicciónpara este valor predicho deYpuede ser
construido.
También podemos usar la ecuación de regresión paraestimarla media de la subpoblación
deYvalores que se supone que existen en cualquier valor particular deX.De nuevo, si se cumple
el supuesto de poblaciones normalmente distribuidas, se puede construir un intervalo de
confianza para este parámetro. El valor predicho deYy la estimación puntual de la media de la
subpoblación deYserá numéricamente equivalente para cualquier valor particular deXpero,
como veremos, el intervalo de predicción será más amplio que el intervalo de confianza.
-
tu
vffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
t 1þ 1 xpag
- -x2
ŷ - td1-un =2ÞsyjX þPAG (9.5.1)
norte dXi- -XÞ2
dóndeXpages el valor particular deXen el que deseamos obtener un intervalo de predicción para
Y y los grados de libertad utilizados en la seleccióntsonn-2.
u-
tu xpag
- -x2
t1
ŷ - td1-un =2ÞsyjXnorte þPAG (9.5.2)
dXi- -XÞ2
Usamos MINITAB para ilustrar, para un valor específico deX,el cálculo de un intervalo de confianza del
95 por ciento para la media deYy un intervalo de predicción del 95 por ciento para un individuoY
medición.
Supongamos, para nuestro ejemplo actual, que deseamos hacer predicciones y estimaciones sobre AT
para una circunferencia de cintura de 100 cm. En el cuadro de diálogo de regresión, haga clic en "Opciones".
Ingrese 100 en el cuadro "Intervalo de predicción para nuevas observaciones". Haga clic en "Límites de
confianza" y haga clic en "Límites de predicción".
Obtenemos la siguiente salida:
Línea ResistenteCon frecuencia, los conjuntos de datos disponibles para el análisis mediante técnicas de
regresión lineal contienen una o más observaciones "inusuales"; es decir, valores deXoy,o ambos, mamá
a mí
FIGURA 9.5.1 Intervalos de confianza simultáneos (a)e intervalos de predicción (b)para los datos en
Ejemplo 9.3.1.
9.5 USO DE LA ECUACIÓN DE REGRESIÓN 443
El Sistema SAS
Modelo: MODEL1
Variable dependiente: Y
Análisis de variación
La suma de Significar
Estimaciones de parámetros
FIGURA 9.5.2Impresión parcial del análisis por computadora de los datos dados en el Ejemplo 9.3.1,
usando el SAS®paquete de software.
observaciones inusuales en la circunferencia de la cintura y los datos de TA abdominal profunda que se muestran en
la Tabla 9.3.1.
El método de mínimos cuadrados para ajustar una línea recta a los datos es sensible a las
observaciones inusuales, y la ubicación de la línea ajustada puede verse afectada sustancialmente por
ellas. Debido a esta característica del método de mínimos cuadrados, se dice que la línea de mínimos
cuadrados resultante carece deresistenciaa la influencia de observaciones inusuales. Se han ideado
varios métodos para tratar este problema, incluido uno desarrollado por John W. Tukey. La línea
resultante se denomina de diversas formas comola linea de tukeyy ellínea resistente.
Basada en medianas, que, como hemos visto, son medidas descriptivas resistentes a los
valores extremos, la metodología de línea resistente es una herramienta de análisis de datos
exploratoria que permite al investigador ajustar rápidamente una línea recta a un conjunto de
datos que consta de pares.x, ymediciones. La técnica consiste en dividir, sobre la base de la
variable independiente, las medidas de la muestra en tres grupos de tamaño lo más parecido
posible: las medidas más pequeñas, las medidas más grandes y las intermedias. La línea
resistente es la línea ajustada de tal manera que hay un número igual de valores
444 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
TipoC2enRespuestayC1enPredictores. ControlarDerechos
residuales de autoryEncaja.Hacer clicDE ACUERDO.
Producción:
FIGURA 9.5.3Procedimiento de línea resistente MINITAB y salida para los datos de la Tabla 9.3.1.
por encima y por debajo tanto en el grupo más pequeño como en el grupo más grande. La pendiente
resultante y y-las estimaciones de intercepción son resistentes a los efectos de cualquiera de los extremosy
valores, extremoXvalores, o ambos. Para ilustrar el ajuste de una línea resistente, usamos los datos de la
Tabla 9.3.1 y MINITAB. El procedimiento y la salida se muestran en la Figura 9.5.3.
Vemos en el resultado de la Figura 9.5.3 que la línea resistente tiene una pendiente de 3.2869 y
unay-intercepción de -203:7868. Elrelación de media pendiente,mostrado en la salida como igual a
.690, es un indicador del grado de linealidad entreXyy.Se calcula una pendiente, llamada media
pendiente, para cada mitad de los datos de la muestra. La razón de la media pendiente derecha,bR, y
la media pendiente izquierda,bL, es igual abR=bL. Si la relación entreXyyes recta, las medias pendientes
serán iguales y su relación será 1. Una relación de medias pendientes que no se acerque a 1 indica
una falta de linealidad entreXyy.
Hartwig y Dearing analizan con más detalle la metodología de la línea resistente.
(1), Johnstone y Velleman (2), McNeil (3) y Velleman y Hoaglin (4).
EJERCICIOS
En cada ejercicio hacer referencia al ejercicio anterior correspondiente y, por el valor deXindicado, (a)
construya el intervalo de confianza del 95 por ciento parametroyjXy (b) construya el intervalo de predicción del
95 por ciento paray
En el modelo de regresión clásico, que ha sido el modelo subyacente en nuestra discusión hasta este
punto, soloY,que se ha llamado variable dependiente, se requiere que sea aleatoria. La variableXse
define como una variable fija (no aleatoria o matemática) y se denomina variable independiente.
Recuérdese, también, que bajo este modelo las observaciones se obtienen frecuentemente
preseleccionando valores deXy determinando los valores correspondientes dey
cuando ambosYyXson variables aleatorias, tenemos lo que se llamamodelo de correlación.Por
lo general, bajo el modelo de correlación, las observaciones de la muestra se obtienen seleccionando
una muestra aleatoria de losunidades de asociación (que pueden ser personas, lugares, animales,
momentos, o cualquier otro elemento sobre el que se toman las dos medidas) y tomando en cada uno
una medida deXy una medida deyEn este procedimiento, los valores de Xno son preseleccionados
sino que ocurren al azar, dependiendo de la unidad de asociación seleccionada en la muestra.
Supuestos de correlaciónLas siguientes suposiciones deben cumplirse para que las inferencias
sobre la población sean válidas cuando el muestreo es de una distribución bivariada.
f(X, Y) f(X, Y)
Y X Y X
(a) (b)
f(X, Y)
Y X
(C)
FIGURA 9.6.1Una distribución normal bivariada. (a)Una distribución normal bivariada. (b)Un corte que
muestra una subpoblación normalmente distribuida deYpor dadoX. (c)Un corte que muestra una
subpoblación normalmente distribuida deXpor dadoy
X
FIGURA 9.7.1Diagrama de dispersión parar¼ -1.
EJEMPLO 9.7.1
El propósito de un estudio de Kwast-Rabben et al. (A-7) fue analizar los potenciales evocados
somatosensoriales (SEP) y sus interrelaciones después de la estimulación de los dedos I, III y V en la mano.
Los investigadores querían establecer criterios de referencia en una población de control. Por lo tanto, se
reclutaron voluntarios sanos para el estudio. En el futuro, esta información podría ser muy valiosa ya que los
SEP pueden proporcionar un método para demostrar alteraciones funcionales en pacientes con sospecha de
lesión de la raíz cervical que tienen dolor y síntomas sensoriales. En el estudio, se aplicó estimulación en los
dedos con una intensidad por debajo del nivel del dolor. Grabaciones de columna
448 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
las respuestas se realizaron con electrodos fijados mediante crema adhesiva para electrodos a
la piel del sujeto. Una de las relaciones de interés fue la correlación entre la altura de un sujeto
(cm) y el pico de latencia espinal (Cv) del SEP. Los datos de 155 mediciones se muestran en la
Tabla 9.7.1.
Solución:El diagrama de dispersión y la línea de regresión de mínimos cuadrados se muestran en la Figura 9.7.2.
Supongamos que el investigador desea obtener una ecuación de regresión
para usar con fines de estimación y predicción. En ese caso, el coeficiente de
correlación de la muestra se obtendrá mediante los métodos discutidos en el
modelo de regresión.
21
20
19
18
CV (unidades)
17
dieciséis
15
14
13
150 160 170 180 190 200
Altura (cm)
FIGURA 9.7.2Altura y potenciales cervicales (columna vertebral) en la
estimulación del dígito I para los datos descritos en el Ejemplo 9.7.1.
450 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
La ecuación de regresión es Cv =
-3.20 + 0.115 Altura
Vaticinador coef SE coef T PAG
Constante - 3.198 1.016 - 3.15 0.002
Altura 0.114567 0.005792 19.78 0.000
S = 0,8573 R-Sq = 71,9% R-Cuadrado(ajustado) = 71,7 %
Análisis de Diferencia
Fuente DF SS EM F PAG
Regresión 1 287.56 287.56 391.30 0.000
Residual Error 153 112.44 0.73
Total 154 400.00
Inusual Observaciones
Obs. Altura CV Adaptar Ajuste SE Residual Calle residir
39 166 14.1000 15.8199 0.0865 - 1.7199 -2.02R
42 166 13.9000 15.8199 0.0865 - 1.9199 - 2.25R
105 181 15.8000 17.5384 0.0770 - 1.7384 -2.04R
151 202 18.6000 19.9443 0.1706 - 1.3443 - 1,60 X
152 202 18.6000 19.9443 0.1706 - 1.3443 - 1,60 X
153 182 20.0000 17.6529 0.0798 2.3471 2.75R
R denota una observación con un residuo estandarizado grande X denota una observación
cuyo valor X le da una gran influencia.
FIGURA 9.7.3Resultado de MINITAB para el ejemplo 9.7.1 usando el procedimiento de regresión simple.
La ecuación de regresión
Supongamos que deseamos predecir los niveles de Cv a partir del conocimiento de las alturas. En ese caso
tratamos la altura como la variable independiente y el nivel Cv como la variable dependiente y obtenemos la
ecuación de regresiónpagcoeficiente de relación con MINITAB como se muestra en la figura 9.7.3. Para este
ejemplor¼ :719¼ :848. Sabemos queres positivo porque la pendiente de la línea de regresión es positiva.
También podemos usar el procedimiento de correlación de MINITAB para obtenerr como se muestra en la
Figura 9.7.4.
La impresión del SAS®El procedimiento de correlación se muestra en la Figura 9.7.5. Tenga en
cuenta que el SAS®procedimiento da medidas descriptivas para cada variable, así como lapagvalor del
coeficiente de correlación.
Cuando no se disponga de una computadora para realizar los cálculos,rpuede obtenerse
mediante las siguientes fórmulas:
P
tu PAG
vffiffiffiffiffi sififi
tu2
tuberculosis1 Xi2-d XiÞ2=n
r¼ PAG PAG 2 (9.7.1)
yi2-d yÞ =norte
i
9.7 EL COEFICIENTE DE CORRELACIÓN 451
Datos:
C1: Altura
C2: CV
PRODUCCIÓN:
Correlaciones: Altura, Cv
FIGURA 9.7.4 Procedimiento de MINITAB para el ejemplo 9.7.1 usando el comando de correlación.
El Procedimiento CORR
2 Variables: ALTURA CV
Estadísticas simples
ALTURA CV
ALTURA 1.00000 0.84788
<.0001
CV 0.84788 1.00000
<.0001
Una ventaja de esta fórmula es querse puede calcular sin calcular primerob. Este es
el procedimiento deseable cuando no se anticipa que se utilizará la ecuación de regresión.
EJEMPLO 9.7.2
Consulte el Ejemplo 9.7.1. Deseamos ver si el valor muestral der¼ :848 es de magnitud
suficiente para indicar que, en la población, los niveles de talla y Cv SEP están correlacionados.
H0:r¼0
HA:r6¼0
rffiffiffiffiffiffiffiffiffiffiffiffiffi
n-2
t¼r (9.7.3)
1 -r2
5. Distribución de la estadística de prueba.CuandoH0es verdadero y se cumplen los
supuestos, el estadístico de prueba se distribuye como Student'stdistribución conn-2
grados de libertad.
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
153
t¼ :848 ¼19:787
1 - :719
También se puede notar que la estadística de prueba para el coeficiente de correlación es equivalente
a la estadística de prueba para la pendiente de la línea de regresión. Por lo tanto, al cuadrar latla estadística
en el paso 7 de la solución da como resultado elFestadístico proporcionado en la Figura 9.7.3. Esto puede ser
útil cuando se usa un paquete de computadora que no proporciona rutinariamente eltestadístico para el
coeficiente de correlación (p. ej., SPSS) y uno no desea calcular el estadístico de prueba a mano.
1 1þr
zr¼ en (9.7.4)
2 1 -r
donde ln es un logaritmo natural. Se puede demostrar quezrtiene una distribución aproximadamente normal
con una media dezr¼1 2enfð1þrÞ=ð1 -rÞgy la desviación estándar estimada de
1
szr ¼ pffiffiffiffiffiffiffiffiffiffiffi (9.7.5)
n-3
Para probar la hipótesis nula de queres igual a algún valor distinto de cero, el estadístico de
prueba es
zr-z
Z¼ pag (9.7.6)
1= ffiffiffiffiffiffiffirffiffiffiffiffiffi n-3
H0:r¼ :80
contra la alternativa
HA:r6¼ :80
r¼ :848; zr¼1:24726
y para
r¼ :80; zr¼1:09861
Nuestro estadístico de prueba, entonces, es
1:24726 - 1:09861
Z¼ ¼1:83
pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
1= 155 - 3
454 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
Como 1.83 es menor que el valor crítico dez¼1:96, no podemos rechazarH0. Concluimos que el
coeficiente de correlación de la población puede ser .80.
Para tamaños de muestra inferiores a 25, Fisher'sZla transformación se debe utilizar con precaución,
en todo caso. Se puede utilizar un procedimiento alternativo de Hotelling (6) para tamaños de muestra
iguales o superiores a 10. En este procedimiento, la siguiente transformación derestá empleado:
3zrþr
z¼zr- (9.7.7)
4norte
z - z pffiffiffiffiffiffiffiffiffiffiffiffi
dónde
-
3zþr
r
z dpronunciado zeta¼zr-
4norte
3d1:24726Þ þ :848
z ¼1:24726 - ¼1:2339
4d155Þ
3d1:09861Þ þ :8
z ¼1:09861 - ¼1:0920
4d155Þ
pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
Como 1,7609 es menor que 1,96, no se rechaza la hipótesis nula y se llega a la misma
conclusión que cuando se utiliza la transformación de Fisher.
AlternativasEn algunas situaciones, los datos disponibles para el análisis no cumplen con los
supuestos necesarios para el uso válido de los procedimientos discutidos aquí para probar hipótesis
sobre un coeficiente de correlación poblacional. En tales casos, puede ser más apropiado usar la
técnica de correlación de rangos de Spearman que se analiza en el Capítulo 13.
Intervalo de confianza pararLa transformación de Fisher puede usarse para construir 100d1 -a
Þintervalos de confianza porcentuales paraR.La fórmula general para un intervalo de confianza.
está empleado. Primero convertimos nuestro estimador,r,azr, construya un intervalo de confianza sobrezr, y
luego reconvertir los límites para obtener un 100d1 -aÞintervalo de confianza porcentual sobreR. Entonces la
fórmula general se convierte en
pffiffiffiffiffiffiffiffiffiffiffiffi
zr-z1=n-3 (9.7.10)
Para nuestro ejemplo actual, el intervalo de confianza del 95 por ciento parazres dado por
- pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
Convirtiendo estos límites (por interpolación en la Tabla I del Apéndice), que son valores dezr,
en valores derda
zr r
1.08828 . 7962
1.40624 . 8866
Estamos seguros en un 95 por ciento, entonces, de querestá contenido en el intervalo .7962 a .88866.
Debido a las entradas limitadas en la tabla, estos límites deben considerarse solo aproximados.
EJERCICIOS
9.7.1El propósito de un estudio de Brown y Persley (A-8) fue caracterizar la hepatitis A aguda en pacientes mayores de 40 años.
Realizaron una revisión retrospectiva de las historias clínicas de 20 sujetos a los que se les diagnosticó hepatitis A
aguda, pero que no fueron hospitalizados. De interés fue el uso de la edad (años) para predecir los niveles de
bilirrubina (mg/dl). Se recogieron los siguientes datos.
78 7.5 44 7.0
72 12.9 42 1.8
81 14.3 45 .8
59 8.0 78 3.8
64 14.1 47 3.5
48 10.9 50 5.1
46 12.3 57 16.5
(Continuación)
456 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
42 1.0 52 3.5
58 5.2 58 5.6
52 5.1 45 1.9
Fuente: Datos proporcionados por cortesía de Geri R. Brown, MD
9.7.2Otra variable de interés en el estudio de Reiss et al. (A-3) (ver Ejercicio 9.3.4) fue parcial
tromboplastina (aPTT), la prueba estándar utilizada para controlar la anticoagulación con heparina. Utilice los datos
de la siguiente tabla para examinar la correlación entre los niveles de aPTT medidos por el ensayo de punto de
atención CoaguCheck y el ensayo hospitalario de laboratorio estándar en 90 sujetos que recibieron heparina sola,
heparina con warfarina y warfarina y exoenoxaparina.
warfarina y
heparina warfarina exoenoxaparina
CoaguCheck Hospital CoaguCheck Hospital Hospital CoaguCheck
TTPa TTPa TTPa TTPa TTPa TTPa
9.7.3En el estudio de Parker et al. (A-4) (consulte el Ejercicio 9.3.5), los autores también observaron el cambio en el
AUC (área bajo la curva de la concentración plasmática de digoxina) al comparar los niveles de digoxina
tomados con y sin jugo de toronja. La siguiente tabla proporciona el AUC cuando se consumió digoxina con
agua.dng h = mlÞy el cambio en el AUC en comparación con el cambio en el AUC cuando la digoxina se toma
con jugo de toronja (GFJ, %).
6.96 17.4
5.59 24.5
5.31 8.5
8.22 20.8
11.91 - 26,7
9.50 - 29,3
11.28 - 16,8
Fuente: Datos proporcionados por cortesía de Robert B. Parker,
Pharm.D.
9.7.4Un artículo de Tuzson et al. (A-9) enArchivos de Medicina Física y Rehabilitacióninformaron los siguientes datos
sobre la velocidad máxima de la rodilla al caminar (medida en grados por segundo) en flexión y extensión
para 18 sujetos con parálisis cerebral.
100 100
150 150
210 180
255 165
200 210
185 155
440 440
110 180
400 400
160 140
150 250
425 275
375 340
400 400
400 450
300 300
300 300
320 275
Fuente: Ann E. Tuzson, Kevin P. Granata y Mark
F. Abel, "El umbral de velocidad espástica limita
el rendimiento funcional en la parálisis
cerebral"Archivos de Medicina Física y
Rehabilitación, 84 (2003), 1363–1368.
458 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
9.7.5La esclerosis lateral amiotrófica (ELA) se caracteriza por una disminución progresiva de la función motora. El
proceso degenerativo afecta el sistema respiratorio. Butz et al. (A-10) investigaron el impacto longitudinal de
la ventilación nocturna no invasiva con presión positiva en pacientes con ELA. Antes del tratamiento midieron
la presión parcial de oxígeno arterial (Pao2) y presión parcial de dióxido de carbono arterial (Paco2) en
pacientes con la enfermedad. Los resultados fueron los siguientes:
Paco2 Pao2
40,0 101.0
47.0 69.0
34,0 132.0
42.0 65,0
54.0 72.0
48.0 76.0
53.6 67.2
56,9 70,9
58.0 73.0
45,0 66,0
54.5 80.0
54.0 72.0
43.0 105.0
44.3 113.0
53,9 69.2
41.8 66.7
33.0 67.0
43.1 77.5
52.4 65.1
37,9 71.0
34.5 86.5
40.1 74.7
33.0 94.0
59,9 60.4
62.6 52.5
54.1 76,9 Fuente: M. Butz, KH Wollinsky, U. Widemuth-Catrinescu,
45.7 65.3 A. Sperfeld, S. Winter, HH Mehrkens, AC Ludolph y
40.6 80.3 H. Schreiber, “Efectos longitudinales de los métodos positivos no invasivos
9.7.6Una muestra aleatoria simple de 15 niños aparentemente sanos entre las edades de 6 meses y 15 años arrojó
los siguientes datos sobre la edad,X,y volumen hepático por unidad de peso corporal (ml/kg),Y:
X Y X Y
.5 41 10.0 26
.7 55 10.1 35
2.5 41 10.9 25
4.1 39 11.5 31
(Continuación)
9.8 ALGUNAS PRECAUCIONES 459
X Y X Y
5.9 50 12.1 31
6.1 32 14.1 29
7.0 41 15.0 23
8.2 42
Los análisis de regresión y correlación son poderosas herramientas estadísticas cuando se emplean
correctamente. Sin embargo, su uso inapropiado solo puede conducir a resultados sin sentido. Para ayudar
en el uso adecuado de estas técnicas, hacemos las siguientes sugerencias:
Y
Extrapolación
Extrapolación
X
Intervalo muestreado
representación limitada de la población, y proyectar los resultados de la muestra más allá del
intervalo representado por la muestra puede llevar a conclusiones falsas. La figura 9.8.1 ilustra
los posibles peligros de la extrapolación.
9.9 RESUMEN
Fórmula
Número Nombre Fórmula
dXi- -XÞ2
línea de regresión
i¼1
(Continuación)
462 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
metrob
1
¼b 1
s2yjX
s2b1 ¼ X norte
dXi- -XÞ2
i¼1
9.5.1 Predicción -
tu
vffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
1 xpag
- -x2
intervalo paraY
ŷ - td1-un =2Þsy=x t1þ þPAG
para una dadaX norte dXi- -XÞ2
Confianza
sffiffiffiffiffiffiffiffiffiffi-ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
9.5.2
1 X
intervalo para ŷ - td1-un =2ÞsyjX þPAGpag- -X
la media de Y norte dXi- -XÞ
para una X dada
u hp i
9.7.1–9.7.2 Coeficiente de correlación PAG
tu Xi2-d
tuberculosis2
1 XiÞ2=n
r ¼ PAG PAG 2
yi2-d y Þ =norte i
Xi2-dXiÞ2
norte Nueva Yorki-dyiÞ2 2
9.9 RESUMEN 463
rffiffiffiffiffiffiffiffiffiffiffiffiffi
9.7.3 testadística para n-2
coeficiente de correlación t¼r
1 -r2
9.7.4 zestadística para 1 1þr
zr¼ en
coeficiente de correlación 2 1 -r
9.7.5 Estándar estimado 1
szpag ¼ pffiffiffiffiffiffiffiffiffiffiffi
desviación parazestadística n-3
9.7.6 r z-z
Zestadística para
Z¼ pag
coeficiente de correlación 1= ffiffiffiffiffiffiffipagffiffiffiffiffiffi n-3
cuandon <25
n-3
9.7.9 Zestadística para z-j pffiffiffiffiffiffiffiffiffiffiffiffi
- pffiffiffiffiffiffiffiffiffiffiffiffi
9.7.10 Intervalo de confianza Zr¼Z1=n-3
parar
1.¿Cuáles son los supuestos que subyacen al análisis de regresión lineal simple cuando uno de los objetivos es
hacer inferencias sobre la población de la que se extrajeron los datos de la muestra?
8.Describa tres formas en las que se puede probar la hipótesis nula de que b̂1¼0.
10¿Cuáles son los supuestos que subyacen al análisis de correlación simple cuando la inferencia es un objetivo?
12¿Cuáles son las posibles explicaciones para un coeficiente de correlación muestral significativo?
13Explique por qué es riesgoso usar una ecuación de regresión muestral para predecir o estimar fuera del rango
de valores de la variable independiente representada en la muestra.
14Describa una situación en su área particular de interés donde sería útil un análisis de regresión simple. Utilice
datos reales o realistas y realice un análisis de regresión completo.
15.Describa una situación en su área particular de interés donde sería útil un análisis de correlación simple. Utilice
datos reales o realistas y realice un análisis de correlación completo.
En cada uno de los siguientes ejercicios, lleve a cabo el análisis requerido y pruebe las hipótesis en los niveles de
significancia indicados. Calcular elpagvalor de cada prueba.
dieciséis.Un estudio de Scrogin et al. (A-11) fue diseñado para evaluar los efectos de manipulaciones simultáneas
de NaCl y calcio en la dieta sobre la presión arterial, así como las respuestas de la presión arterial y las
catecolaminas al estrés. Los sujetos eran ratas macho hipertensas espontáneamente, sensibles a la sal. Entre
los análisis realizados por los investigadores se encontraba una correlación entre la presión arterial inicial y
la concentración de epinefrina en plasma (E). Se recogieron los siguientes datos sobre estas dos variables.
Dejara¼ :01.
PA PlasmaE PA PlasmaE
PA PlasmaE PA PlasmaE
17Dean Parmalee (A-12) deseaba saber si las calificaciones de fin de año asignadas a los estudiantes de la Escuela de Medicina de la
Universidad Estatal de Wright predicen sus puntajes de la junta de segundo año. La siguiente tabla muestra, para 89
estudiantes, el puntaje de fin de año (PROMEDIO, en porcentaje de 100) y el puntaje en el examen de la junta médica de
segundo año (BOARD).
Realice un análisis de regresión completo con AVG como variable independiente. Dejara¼ :05 para todas las
pruebas.
18Maria Mathias (A-13) realizó un estudio de niños hiperactivos. Midió la actitud, la hiperactividad y el comportamiento
social de los niños antes y después del tratamiento. La siguiente tabla muestra para 31 sujetos la edad y las
puntuaciones de mejora desde el pretratamiento hasta el postratamiento para la actitud (ATT), el comportamiento
social (SOC) y la hiperactividad (HYP). Una puntuación negativa para HYP indica una mejora en la hiperactividad; una
puntuación positiva en ATT o SOC indica una mejora. Realice un análisis para determinar si existe evidencia que
indique que la edad (años) está correlacionada con alguna de las tres variables de resultado. Dejara¼ :05 para todas
las pruebas.
19Un estudio de Triller et al. (A-14) examinó la cantidad de tiempo requerida para que las enfermeras de atención médica domiciliaria
vuelvan a empaquetar los medicamentos de un paciente en varios organizadores de medicamentos (es decir, cajas de
pastillas). Para los 19 pacientes del estudio, los investigadores registraron el tiempo necesario para volver a empaquetar los
medicamentos. También registraron el número de problemas encontrados en la sesión de reenvasado.
reenvasado reenvasado
Número de paciente Nº de problemas Tiempo (Minutos) Número de paciente Nº de problemas Tiempo (Minutos)
1 9 38 11 1 10
2 2 25 12 2 15
3 0 5 13 1 17
4 6 18 14 0 18
5 5 15 15 0 23
6 3 25 dieciséis 10 29
7 3 10 17 0 5
8 1 5 18 1 22
9 2 10 19 1 20
10 0 15
Fuente: Datos proporcionados por cortesía de Darren M. Triller, Pharm.D.
Realice un análisis de regresión completo de estos datos usando la cantidad de problemas para predecir el tiempo que tomó
completar una sesión de reempaquetado. Dejara¼ :05 para todas las pruebas. ¿Qué conclusiones se pueden sacar de su
análisis? ¿Cómo podrían usar sus resultados los proveedores de atención médica?
20Los siguientes son los valores de flujo sanguíneo pulmonar (PBF) y volumen de sangre pulmonar (PBV)
registrados para 16 bebés y niños con cardiopatía congénita:
Y X
PBV (ml/m2) PBF (L/min/m2)
168 4.31
280 3.40
391 6.20
420 17.30
303 12.30
429 13.99
605 8.73
522 8.90
224 5.87
291 5.00
(Continuación)
468 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
Y X
PBV (ml/m2) PBF (L/min/m2)
233 3.51
370 4.24
531 19.41
516 16.61
211 7.21
439 11.60
Encuentre la ecuación de regresión que describe la relación lineal entre las dos variables, calculer2y
pruebaH0:b1¼0 por ambosFprueba y eltprueba. Dejara¼ :05.
21Quince especímenes de sueros humanos fueron probados comparativamente para anticuerpos de tuberculina por dos métodos.
Los logaritmos de los títulos obtenidos por los dos métodos fueron los siguientes:
Método
3.31 4.09
2.41 3.84
2.72 3.65
2.41 3.20
2.11 2.97
2.11 3.22
3.01 3.96
2.13 2.76
2.41 3.42
2.10 3.38
2.41 3.28
2.09 2.93
3.00 3.54
2.08 3.14
2.11 2.76
Encuentre la ecuación de regresión que describe la relación entre las dos variables, calculer2y prueba
H0:b1¼0 por ambosFprueba y eltprueba.
22La siguiente tabla muestra la ingesta de metilmercurio y los valores de mercurio en sangre entera en 12 sujetos
expuestos a metilmercurio a través del consumo de pescado contaminado:
X Y
Metilo Mercurio en
Ingesta de mercurio Sangre pura
dmetrogHg=díaÞ (ng/g)
180 90
200 120
230 125
410 290
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 469
X Y
Metilo Mercurio en
Ingesta de mercurio Sangre pura
dmetrogHg=díaÞ (ng/g)
600 310
550 290
275 170
580 375
105 70
250 105
460 205
650 480
Encuentre la ecuación de regresión que describe la relación lineal entre las dos variables,
calculer2y pruebaH0:b1¼0 por ambosFytpruebas
23Los siguientes son los pesos (kg) y los niveles de glucosa en sangre (mg/100 ml) de 16 varones adultos aparentemente
sanos:
64.0 108
75.3 109
73.0 104
82.1 102
76.2 105
95.7 121
59.4 79
93.4 107
82.1 101
78,9 85
76.7 99
82.1 100
83,9 108
73.0 104
64.4 102
77.6 87
Encuentre la ecuación de regresión lineal simple y pruebeH0:b1¼0 usando ANOVA y eltprueba. Prueba H0:r¼0 y
construya un intervalo de confianza del 95 por ciento paraR.¿Cuál es el nivel de glucosa pronosticado para un hombre
que pesa 95 kg? Construya el intervalo de predicción del 95 por ciento para su peso. Dejara¼ :05 para todas las
pruebas.
24Las siguientes son las edades (años) y las presiones arteriales sistólicas de 20 adultos aparentemente sanos:
20 120 46 128
43 128 53 136
63 141 70 146
(Continuación)
470 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
26 126 20 124
53 134 63 143
31 128 43 130
58 136 26 124
46 132 19 121
58 140 31 126
70 144 23 123
Encuentre la ecuación de regresión lineal simple y pruebeH0:b1¼0 usando ANOVA y eltprueba. PruebaH0:r¼0
y construya un intervalo de confianza del 95 por ciento paraR.Encuentre el intervalo de predicción del 95 por
ciento para la presión arterial sistólica de una persona de 25 años. Dejara¼ :05 para todas las pruebas.
25Los siguientes datos se recopilaron durante un experimento en el que se inoculó un patógeno a animales
de laboratorio. Las variables son tiempo en horas después de la inoculación y temperatura en grados
Celsius.
24 38.8 44 41.1
28 39.5 48 41.4
32 40.3 52 41.6
36 40.7 56 41.8
40 41.0 60 41,9
Encuentre la ecuación de regresión lineal simple y pruebeH0:b1¼0 usando ANOVA y eltprueba. Prueba H0:r¼0 y
construya un intervalo de confianza del 95 por ciento paraR.Construya el intervalo de predicción del 95 por ciento
para la temperatura a las 50 horas después de la inoculación. Dejara¼ :05 para todas las pruebas.
Para cada uno de los estudios descritos en los ejercicios 26 a 28, responda tantas de las siguientes preguntas
como sea posible.
(a)¿Cuál es más relevante, el análisis de regresión o el análisis de correlación, o ambas técnicas son
igualmente relevantes?
(b)¿Cuál es la variable independiente?
(C)¿Cuál es la variable dependiente?
(d)¿Cuáles son las hipótesis nula y alternativa apropiadas?
(mi)¿Cree que se rechazó la hipótesis nula? Explica por qué o por qué no.
(F)¿Cuál es el objetivo más relevante, la predicción o la estimación, o son los dos igualmente
relevantes?
(gramo)¿Cuál es la población muestreada?
(h)¿Cuál es la población objetivo?
(i)¿Están las variables directa o inversamente relacionadas?
26Lamarre-Cliche et al. (A-15) afirman: “Se cree que el intervalo QT corregido para la frecuencia cardíaca (QTc) refleja el
equilibrio simpatovagal. También se ha establecido queb-los bloqueadores influyen en el sistema nervioso
autónomo”. Los investigadores realizaron un análisis de correlación para medir la asociación entre el intervalo QTc, la
frecuencia cardíaca, el cambio de la frecuencia cardíaca y la respuesta terapéutica de la presión arterial durante 73
PREGUNTAS DE REPASO Y EJERCICIOS 471
sujetos hipertensos que tomanb-bloqueadores Los investigadores encontraron que la duración del intervalo QTc, la frecuencia
cardíaca previa al tratamiento y el cambio de la frecuencia cardíaca con la terapia no eran buenos predictores de la respuesta
de la presión arterial ab1-selectivob-bloqueadores en sujetos hipertensos.
27Skinner et al. (A-16) realizó una encuesta telefónica transversal para obtener un recuerdo dietético de 24 horas de la
ingesta de alimentos de bebés y niños pequeños, según lo informado por las madres u otros cuidadores principales.
Un hallazgo de interés fue que entre 561 niños pequeños de 15 a 24 meses de edad, la edad en semanas del niño se
relacionó negativamente con la densidad de vitamina C b̂1¼ -:43,pag¼ :01. Al predecir la densidad de calcio, la edad
en semanas del niño produjo un coeficiente de pendiente de -1:47 con unpagde .09.
28Parque et al. (A-17) estudió a 29 sujetos masculinos con cirrosis clínicamente confirmada. Entre otras variables,
midieron los niveles de manganeso en sangre total (MnB), manganeso en plasma (MnP), manganeso en
orina (MnU) y el índice pálido (PI), una medida de la intensidad de la señal en imágenes de resonancia
magnética (IRM) ponderadas en T1. Encontraron un coeficiente de correlación de .559,pag < :01, entre MnB y
PI. Sin embargo, no hubo correlaciones significativas entre MnP y Pi o MnU y Pi (r¼ :353, pag > :05,r¼ :252,
pag > :05, respectivamente).
(mi)Indique todas las suposiciones que sean necesarias para validar su análisis.
(F)Describa la(s) población(es) sobre las que cree que serían aplicables las inferencias basadas en su
análisis.
(gramo)Si está disponible, consulte la referencia citada y compare sus análisis y resultados con los de los
autores.
29Moerloose et al. (A-18) realizó un estudio para evaluar la utilidad clínica de una nueva técnica de
laboratorio (método A) para su uso en el diagnóstico de la embolia pulmonar (EP). El
rendimiento de la nueva técnica se comparó con el de una técnica estándar (método B). Los
sujetos consistieron en pacientes con sospecha clínica de EP que ingresaron en la sala de
emergencias de un hospital universitario europeo. Las siguientes son las medidas obtenidas
por las dos técnicas para 85 pacientes. Los investigadores realizaron dos análisis: (1) en los 85
pares de medidas y (2) en aquellos pares de medidas para los cuales el valor del método B era
inferior a 1000.
B A B A B A
B A B A B A
30La investigación de Huhtaniemi et al. (A-19) se centró en la calidad de la hormona luteinizante (LH) sérica durante la
maduración puberal en niños. Los sujetos, que consistían en niños sanos que entraban en la pubertad (de 11 años, 5
meses a 12 años), se estudiaron durante un período de 18 meses. Las siguientes son las concentraciones (UI/L) de LH
bioactiva (B-LH) y LH inmunorreactiva (I-LH) en muestras de suero tomadas de los sujetos. Solo se informan aquí las
observaciones en las que la relación B/I de los sujetos fue superior a 3,5.
. 104 . 37 . 97 3.63
. 041 . 28 . 49 2.26
. 124 . 64 1 4.55
. 808 2.32 1.17 5.06
. 403 1.28 1.46 4.81
. 27 .9 1.97 8.18
. 49 2.45 . 88 2.48
. 66 2.8 1.24 4.8
. 82 2.6 1.54 3.12
1.09 4.5 1.71 8.4
1.05 3.2 1.11 6
. 83 3.65 1.35 7.2
. 89 5.25 1.59 7.6
. 75 2.9
Fuente: Datos proporcionados por cortesía del Dr. Ilpo T. Huhtaniemi.
PREGUNTAS DE REPASO Y EJERCICIOS 473
31Tsau et al. (A-20) estudiaron la excreción urinaria del factor de crecimiento epidérmico (EGF) en niños normales y en
aquellos con insuficiencia renal aguda (IRA). Se obtuvieron muestras aleatorias de orina seguidas de recolección de
orina de 24 horas de 25 niños. Los sujetos tenían edades comprendidas entre 1 mes y 15 años. La excreción urinaria
de EGF se expresó como una proporción de EGF urinario a concentración de creatinina urinaria (EGF/Cr). Los autores
concluyen a partir de los resultados de su investigación que es razonable utilizar análisis de orina aleatorios para
controlar la excreción de EGF. Las siguientes son las concentraciones de EGF/Cr urinario aleatorias (puntuales) y de 24
horas (pmol/mmol) para los 25 sujetos:
Sujeto FEAG/Cr (X) FEAG/Cr (y) Sujeto FEAG/Cr (X) FEAG/Cr (y)
32.Una de las razones de un estudio realizado por Usaj y Starc (A-21) fue el interés en el comportamiento de la cinética del
pH durante condiciones de resistencia a largo plazo y resistencia a corto plazo entre corredores sanos. Los nueve
sujetos que participaron en el estudio eran corredores de maratón de entre 26 y 5 años. Los autores informan que
obtuvieron una buena correlación entre la cinética del pH y la resistencia tanto a corto como a largo plazo.
Los siguientes son los cortos- (VSE) y largo plazo (VLE) velocidades y mediciones de pH sanguíneo para los
sujetos participantes.
33.Frijol et al. (A-22) realizó un estudio para evaluar el rendimiento del procedimiento de isoelectroenfoque/
inmunotransferencia/densitometría láser (IEF/IB/LD) para evaluar la transferrina deficiente en carbohidratos
(CDT) derivada de gotas de sangre seca. Los investigadores evaluaron suero pareado (S) y seco
474 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
muestras de gotas de sangre (DBS) simultáneamente para CDT. La evaluación de CDT sirve como marcador para el
abuso de alcohol. El uso de gotas de sangre seca como fuente de CDT para análisis por IEF/IB/LD da como resultado
un muestreo, almacenamiento y transporte de muestras simplificados. Los siguientes son los valores IEF/IB/LD en
unidades de densitometría (DU) de CDT de 25 muestras de suero y sangre seca:
1 64 23 14 9 13
2 74 38 15 10 8
3 75 37 dieciséis 17 7
4 103 53 17 38 14
5 10 9 18 9 9
6 22 18 19 15 9
7 33 20 20 70 31
8 10 5 21 61 26
9 31 14 22 42 14
10 30 15 23 20 10
11 28 12 24 58 26
12 dieciséis 9 25 31 12 Fuente: Datos proporcionados por cortesía
13 13 7 de la Dra. Pamela Bean.
34.Kato et al. (A-23) midieron la concentración plasmática de adrenomedulina (AM) en pacientes con insuficiencia cardíaca
congestiva crónica debida a diversas enfermedades cardíacas. La AM es un péptido hipotensor que, sobre la base de
otros estudios, dicen los autores, tiene un papel implícito como hormona circulante en la regulación del sistema
cardiovascular. Otros datos recopilados de los sujetos incluyeron concentraciones plasmáticas de hormonas que se
sabe que afectan el sistema cardiovascular. Los siguientes son la AM plasmática (fmol/ml) y la actividad de renina
plasmática (PRA)dng=LsÞvalores para 19 pacientes con insuficiencia cardiaca:
1 1 70 12.11 . 480594
2 1 44 7.306 . 63894
3 1 72 6.906 1.219542
4 1 62 7.056 . 450036
5 2 52 9.026 . 19446
6 2 sesenta y cinco 10.864 1.966824
7 2 64 7.324 . 29169
8 1 71 9.316 1.775142
9 2 61 17.144 9.33408
10 1 68 6.954 . 31947
11 1 63 7.488 1.594572
12 2 59 10.366 . 963966
13 2 55 10.334 2.191842
14 2 57 13 3.97254
15 2 68 6.66 . 52782
dieciséis 2 51 8.906 . 350028
17 1 69 8.952 1.73625
18 1 71 8.034 . 102786 Fuente: Datos proporcionados
19 1 46 13.41 1.13898 cortesía del Dr. Johji Kato.
PREGUNTAS DE REPASO Y EJERCICIOS 475
35.En un estudio informado enArchivos de Enfermedades en la Infancia,Dorado et al. (A-24) probaron la hipótesis de que la
concentración de calprotectina plasmática (PCal) (una proteína citosólica de los neutrófilos liberada durante la
activación o muerte de los neutrófilos) es un indicador temprano y sensible de la inflamación asociada con la
infección bacteriana en la fibrosis quística (FQ). Los sujetos eran niños con FQ confirmada y un grupo de control de
niños de la misma edad y sexo sin la enfermedad. Entre los datos recopilados se encuentran los siguientes
calprotectina plasmáticadmetrogramo=LÞy plasma de cobre (PCu)dmetromol=LÞmediciones. El cobre plasmático es
un índice de respuesta de fase aguda en la fibrosis quística. Los autores informaron un coeficiente de correlación de
0,48 entre la calprotectina plasmática (log10) y plasma de cobre.
FC FC FC
Sujeto Sujeto Sujeto
No. PCal UCP No. PCal UCP No. PCal UCP
Control Control
Sujeto Sujeto
No. PCal UCP No. PCal UCP
36.Gelb et al. (A-25) realizaron un estudio en el que exploraron la relación entre la limitación del flujo de aire espiratorio de
moderada a grave y la presencia y extensión de enfisema morfológico y puntuado por TC en pacientes ambulatorios
con enfermedad pulmonar obstructiva crónica atendidos consecutivamente. Entre los datos recopilados se
encontraban las siguientes medidas de TC y patología pulmonar (PATH) para la puntuación de enfisema:
5 15 45 50
90 70 45 40
50 20 85 75
10 25 7 0
12 25 80 85
35 10 15 5
40 35 45 40
45 30 37 35
5 5 75 45
25 50 5 5
60 60 5 20
70 60
Fuente: Datos proporcionados por cortesía del Dr. Arthur F. Gelb.
37.El objetivo de un estudio de Witteman et al. (A-26) fue investigar la reactividad de la piel con alérgenos
principales purificados y evaluar la relación con los niveles séricos de anticuerpos de inmunoglobulina E (IgE)
y determinar qué factores adicionales contribuyen al resultado de la prueba cutánea. Los sujetos
consistieron en pacientes con rinitis alérgica, asma alérgica o ambos, que fueron atendidos en un centro
médico europeo. Como parte de su estudio, los investigadores recolectaron, de 23 sujetos, las siguientes
mediciones de IgE específica (UI/ml) y prueba cutánea (ng/ml) en presencia de Lol p 5, un alérgeno purificado
del polen de gramíneas. Deseamos conocer la naturaleza y la fuerza de la relación entre las dos variables. (
Nota:Los autores convirtieron las medidas a logaritmos naturales antes de investigar esta relación).
24.87 . 055
12.90 . 041034
9.87 . 050909
8.74 . 046
6.88 . 039032
5.90 . 050909
4.85 . 042142
3.53 . 055
2.25 4.333333
2.14 . 55
1.94 . 050909
1.29 . 446153
. 94 .4
. 91 . 475
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 477
. 55 4.461538
. 30 4.103448
. 14 7.428571
. 11 4.461538
. 10 6.625
. 10 49.13043
. 10 36.47058
. 10 52.85714
. 10 47.5
Fuente: Datos proporcionados por
cortesía del Dr. Jaring S. van der Zee.
38.guirnalda et al. (A-27) realizaron una serie de experimentos para delinear la farmacocinética materno-fetal
compleja y los efectos de la zidovudina (AZT) en el babuino materno y fetal instrumentado crónicamente (
Papioespecies) durante la infusión intravenosa en estado estacionario y los regímenes de dosificación en
bolo oral. Entre los datos recopilados se encuentran las siguientes mediciones de dosis (mg/kg/h) y
concentración de AZT en plasma materno en estado estacionario (ng/ml):
AZT AZT
Dosis Concentración Dosis Concentración
39.El propósito de un estudio de Halligan et al. (A-28) fue evaluar la variación diurna de la presión
arterial (PA) en mujeres normotensas y con preeclampsia. Los sujetos eran similares en edad,
peso y duración media de la gestación (35 semanas). Los investigadores recopilaron las
siguientes lecturas de PA. Como parte de su análisis, estudiaron la relación entre las
mediciones medias diurnas y nocturnas y las diferencias día/noche para la PA diastólica y
sistólica en cada grupo.
478 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
C1 C2 C3 C4 C5 C1 C2 C3 C4 C5
40Marcas et al. (A-29) realizó un estudio para determinar los efectos de la pérdida rápida de peso sobre la contracción de la
vesícula biliar y para evaluar los efectos del ursodiol y el ibuprofeno sobre la saturación, la nucleación y el crecimiento
y la contracción. Los sujetos fueron pacientes obesos asignados al azar para recibir ursodiol, ibuprofeno o placebo.
Entre los datos recopilados se encuentran los siguientes valores de índice de saturación de colesterol (CSI) y tiempos
de nucleación (NT) en días de 13 (seis hombres, siete mujeres) sujetos tratados con placebo al final de las 6 semanas:
1.20 4.00
1.42 6.00
1.18 14.00
. 88 21.00
1.05 21.00
1.00 18.00
1.39 6.00
1.31 10.00
1.17 9.00
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 479
1.36 14.00
1.06 21.00
1.30 8.00
1.71 2.00
Fuente: Datos proporcionados por
cortesía del Dr. Jay W. Marks.
41.El objetivo de un estudio de Peacock et al. (A-30) fue investigar si la osteoartritis espinal es responsable del hecho de que
la densidad mineral ósea (DMO) de la columna lumbar sea mayor cuando se mide en el plano anteroposterior que
cuando se mide en el plano lateral. Se estudiaron radiografías laterales de la columna de mujeres (rango de edad de
34 a 87 años) que asistieron a un departamento de pacientes ambulatorios de un hospital para la medición de la
densidad ósea y se sometieron a una radiografía de la columna lumbar. Entre los datos recopilados se encuentran las
siguientes mediciones de DMO anteroposterior (A) y lateral (L) (g/cm2):
42.Sloan et al. (A-31) tenga en cuenta que la activación simpática cardíaca y la retirada parasimpática dan como resultado aumentos de
la frecuencia cardíaca durante el estrés psicológico. Como indicadores de la actividad adrenérgica cardíaca, la epinefrina (E) y la
norepinefrina (NE) plasmáticas generalmente aumentan en respuesta al desafío psicológico. El análisis espectral de potencia de
la variabilidad del período cardíaco también proporciona estimaciones de la autonomía cardíaca.
480 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
actividad del sistema nervioso. Los autores realizaron un estudio para determinar la relación entre neurohumoral y
dos estimaciones espectrales diferentes de la actividad del sistema nervioso simpático cardíaco durante una línea
base de reposo tranquila y en respuesta a una tarea aritmética psicológicamente desafiante. Los sujetos eran
voluntarios masculinos y femeninos sanos y libres de medicación con una edad media de 37,8 años. Ninguno tenía
antecedentes de enfermedad cardíaca, respiratoria o vascular. Entre los datos recopilados se encuentran las
siguientes mediciones de E, NE, índices espectrales de potencia de baja frecuencia (LF) y muy baja frecuencia (VLF), y
relaciones de baja frecuencia/alta frecuencia (LH/HF). Las mediciones se dan para tres períodos: línea de base (B), una
tarea de aritmética mental (MA) y cambio de línea de base a tarea (DELTA).
¼datos perdidos.
Fuente: Datos proporcionados por cortesía del Dr. Richard P. Sloan.
43.El propósito de un estudio de Chati et al. (A-32) fue determinar el papel del desacondicionamiento físico en las anomalías
metabólicas del músculo esquelético en pacientes con insuficiencia cardíaca crónica (ICC). Los sujetos incluyeron
pacientes ambulatorios con CHF (12 hombres, dos mujeres) de 35 a 74 años de edad. Entre los datos recopilados se
encuentran las siguientes mediciones, durante el ejercicio, de carga de trabajo (WL) en condiciones controladas,
consumo máximo de oxígeno (Vo2), umbral ventilatorio anaeróbico (AT), ambos medidos en ml/kg/min, y tiempo total
de ejercicio (ET) en segundos.
44.Czader et al. (A-33) investigó ciertos factores pronósticos en pacientes con linfomas no Hodgkin
centroblásticoscentrocíticos (LNH CB/CC). Los sujetos consistieron en hombres y mujeres entre las
edades de 20 y 84 años en el momento del diagnóstico. Entre los datos recopilados se encuentran las
siguientes mediciones sobre dos factores relevantes, A y B. Los autores informaron una correlación
significativa entre los dos.
Traducido del inglés al español - www.onlinedoctranslator.com
A B A B A B
Fuente: Datos proporcionados por cortesía de la Dra. Magdalena Czader y la Dra. Anna Porwit-MacDonald.
45.La fleroxacina, un derivado de la fluoroquinolona con un amplio espectro antibacteriano y una potente
actividad in vitro contra bacterias gramnegativas y muchas grampositivas, fue objeto de un estudio
realizado por Reigner y Welker (A-34). Los objetivos de su estudio fueron estimar los valores típicos de
aclaramiento sobre la disponibilidad sistémica (CL/F) y el volumen de distribución sobre la
disponibilidad sistémica (V/F) después de la administración de dosis terapéuticas de fleroxacino e
identificar los factores que influyen en la disposición de fleroxacino y cuantificar el grado en que lo
hacen. Los sujetos fueron 172 voluntarios sanos masculinos y femeninos y pacientes no infectados
que representaban un amplio rango de edad. Entre los datos analizados se encuentran las siguientes
mediciones (ml/min) de CL/F y aclaramiento de creatinina (CLcr). Según los autores,
46.Yasu et al. (A-35) utilizaron espectroscopía de resonancia magnética no invasiva para determinar los efectos a corto y
largo plazo de la comisurotomía mitral transvenosa percutánea (PTMC) sobre la capacidad de ejercicio y las
respuestas metabólicas de los músculos esqueléticos durante el ejercicio. Se recogieron datos de 11 pacientes (2
hombres, 9 mujeres) con estenosis mitral sintomática. Su edad media fue de 52 años con una desviación estándar de
11. Entre los datos recopilados se encuentran las siguientes mediciones sobre los cambios en el área de la válvula
mitral (d-MVA) y el consumo máximo de oxígeno (d-Vo2) 3, 30 y 90 días posteriores al PTMC:
Días d-vo2
Sujeto Post-PTMC d-MVA (cm2) (ml/kg/min)
1 3 0,64 0.3
2 3 0.76 - 0:9
3 3 0.3 1.9
4 3 0.6 - 3:1
PREGUNTAS DE REPASO Y EJERCICIOS 485
Días d-vo2
Sujeto Post-PTMC d-MVA (cm2) (ml/kg/min)
5 3 0.3 - 0:5
6 3 0.4 - 2:7
7 3 0.7 1.5
8 3 0.9 1.1
9 3 0.6 - 7:4
10 3 0.4 - 0:4
11 3 0,65 3.8
1 30 0.53 1.6
2 30 0.6 3.3
3 30 0.4 2.6
4 30 0.5
5 30 0.3 3.6
6 30 0.3 0.2
7 30 0,67 4.2
8 30 0.75 3
9 30 0.7 2
10 30 0.4 0.8
11 30 0,55 4.2
1 90 0.6 1.9
2 90 0.6 5.9
3 90 0.4 3.3
4 90 0.6 5
5 90 0.25 0.6
6 90 0.3 2.5
7 90 0.7 4.6
8 90 0.8 4
9 90 0.7 1
10 90 0.38 1.1
11 90 0.53
¼Datos perdidos.
Fuente: Datos proporcionados por cortesía del Dr. Takanori Yasu.
Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.Consulte los datos de 1050 sujetos con edema cerebral (CEREBRAL). El edema cerebral con el consiguiente
aumento de la presión intracraneal suele acompañar a las lesiones resultantes de un traumatismo
craneoencefálico y otras afecciones que afectan negativamente a la integridad del cerebro. Los
tratamientos disponibles para el edema cerebral varían en efectividad y efectos secundarios indeseables.
Uno de estos tratamientos es el glicerol, administrado por vía oral o intravenosa. De interés para los
médicos es la relación entre la presión intracraneal y la concentración plasmática de glicerol. Suponga
que usted es un consultor estadístico con un equipo de investigación que investiga la relación entre estas
dos variables. Seleccione una muestra aleatoria simple de la población y realice el análisis que crea que
sería útil para los investigadores. Presente sus hallazgos y conclusiones en forma narrativa e ilústrelos
con gráficos cuando corresponda. Compara tus resultados con los de tus compañeros.
486 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN
2.Consulte los datos de 1050 sujetos con hipertensión esencial (HIPERTENSIÓN). Suponga que es un
consultor estadístico de un equipo de investigación médica interesado en la hipertensión esencial.
Seleccione una muestra aleatoria simple de la población y realice los análisis que considere útiles para
los investigadores. Presente sus hallazgos y conclusiones en forma narrativa e ilústrelos con gráficos
cuando corresponda. Compara tus resultados con los de tus compañeros. Consulte con su instructor
sobre el tamaño de la muestra que debe seleccionar.
3.Consulte los datos de 1200 pacientes con artritis reumatoide (CALCIO). Cien pacientes recibieron el
medicamento en cada nivel de dosis. Suponga que usted es un investigador médico que desea
comprender mejor la naturaleza de la relación entre el nivel de dosis de prednisolona y el calcio corporal
total. Seleccione una muestra aleatoria simple de tres pacientes de cada grupo de nivel de dosis y haga lo
siguiente.
(a)Utilice el número total de pares de observaciones para obtener la ecuación de mínimos cuadrados que
describe la relación entre el nivel de dosis (la variable independiente) y el calcio corporal total.
(b)Dibuja un diagrama de dispersión de los datos y traza la ecuación.
(C)Calcularry prueba de significancia al nivel .05. Encuentra elpagvalor.
(d)Compara tus resultados con los de tus compañeros.
REFERENCIAS
Referencias de metodología
1. F.REDERICKHARTWIGcon BLLUVIAEDPENDIENTES,Análisis exploratorio de datos,Publicaciones Sage, Beverly Hills, 1979.
2. yoAINMJOHNSTONEy PAULF. V.ELLEMAN, “La línea resistente y los métodos de regresión relacionados”,Revista de la Asociación
Estadounidense de Estadística, 80 (1985), 1041–1054.
3. DONALDR. M.CnorteNIE,Análisis interactivo de datos: una introducción práctica,Wiley, Nueva York, 1977.
4. pagAULF. V.ELLEMANy DÁVIDOCHOAGLIN,Aplicaciones, conceptos básicos y computación del análisis de datos exploratorios, Duxbury,
Belmont, California, 1981.
5. RA FES ELLA, “Sobre el error probable de un coeficiente de correlación deducido de una muestra pequeña”,Metron, 1
(1921), 3–21.
6. H. HTELÉFONO, "Nueva luz sobre el coeficiente de correlación y sus transformadas",Revista de la Royal Statistical
Society, Serie B, 15 (1953), 193–232.
7. TERRYEDIELMAN,Análisis de regresión aplicado para negocios y economía,Segunda edición, Duxbury, Belmont, CA,
1996.
8. RONALDRHOCUPAR,Métodos y aplicaciones de modelos lineales: regresión y análisis de varianza, Wiley,
Nueva York, 1996.
9. WILLIAMMETROENDENHALLy TERRYSINCICH,Un Segundo Curso de Estadística: Análisis de Regresión,Quinta edición,
Prentice Hall, Upper Saddle River, NJ, 1996.
10. J.OHNnorteETER, mICHAELHKUTNER, CHRISTOPHERJ. N.ACTSHEIM, y WILLIAMWASERMAN,Lineal Aplicado
modelos de regresión,Tercera edición, Irwin, Chicago, 1996.
Aplicaciones Referencias
A-1. jEAN-PAGIERREDESPRE- S, DENISPAGRUD'HOMME, mARIE-CCRISTINAPAGOULIOT, ANGELOTREMBLAY, y CLAUDEBOUCHARD,
"Estimación de la acumulación de tejido adiposo abdominal profundo a partir de mediciones antropométricas simples en
hombres"Diario Americano de Nutrición Clínica, 54 (1991), 471–477.
A-2. METROO YOJ. K.RANTZ, ILANAB.KUTINSKY, AÚLTIMA ESCALERADROBERSTON, y PHILIPSMEHLER, "Efectos de la metadona relacionados con la dosis
en la prolongación del intervalo QT en una serie de pacientes con Torsade de Pointes",Farmacoterapia, 23 (2003), 802–805.
A-3. ROBERTOA. R.EISS, CURTISEHSAA, DEBORÁL. G.RIFFIS, BERNADETTEPAGORTER, y MARIOANNTARA, “Punto de atención
versus monitoreo de laboratorio de pacientes que reciben diferentes terapias anticoagulantes”,Farmacoterapia, 22
(2002), 677–685.
REFERENCIAS 487
A-4. ROBERTOBPARKER, RyanYATE, jUDITHESOBERMAN, y CASEYLAIZURA, "Efectos del jugo de toronja en la glicoproteína P
intestinal: evaluación con digoxina en humanos"Farmacoterapia, 23 (2003), 979–987.
A-5. RB EFURGONETAS, WGORDÓN, y M. C.ONZEMIO, "Efecto de la velocidad sobre las fuerzas de reacción del suelo en perros con
cojera atribuible al desgarro del ligamento cruzado craneal",Diario Americano de Investigación Veterinaria, 64 (
2003), 1479–1481.
A-6. DÁVIDOkRIESER, ANDREWROSENBERG, y GANUNCIOkAINER, "La relación entre la creatinina sérica, la cistatina C sérica y la
tasa de filtración glomerular en receptores de trasplante renal pediátrico: un estudio piloto"Trasplante
Pediátrico, 6 (2002), 392–395.
A-7. OLGAkDESPERDICIO-RABÉN, ROLFLIBELIUS, y HañoHEIKKILA €, “Potenciales evocados somatosensoriales tras
A-25. ARTHURF GELB, jAMÉSCHOGG, norteESTORLMtu €LLER, mARCAJ. S.CHEIN, jOSEPHkUEI, DONALDPTCENIZAS, jOELD.
miPSTEÍNA, jOZEFkOLLIN, ROBERTOHGREEN, norteEquipo originalZAMEL, WMARCAmiLLIOTT, y yoAIFHAJIAGHAI, "Contribución de
Enfisema y pequeñas vías respiratorias en la EPOC”,Cofre, 109 (1996), 353–359.
A-26. AGNESMWITTEMAN, STEVENOSCINTA, gERRORJ. P.ERDOK, DEMANSA SJAMSOEDIN, hENKMJANSEN, Rtransmisión exteriorC.
AALBERSEy J.UN ANILLOS.VAN DERZEE.UU., "La relación entre RAST y los resultados de las pruebas cutáneas en pacientes con
asma o rinitis: un estudio cuantitativo con alérgenos principales purificados"Revista de Alergia e Inmunología Clínica,
97 (1996), 16–25.
A-27. METROARIANNEGRAMOARLANDA, hAZELHSZETO, SALHADAKOTA DEL SURaniel, PAGAMELAJTPELUCHE, mICHAELMMSÍy RAYMONDI.
STARCO, "Cinética de zidovudina en el babuino preñado",Revista de Síndromes de Inmunodeficiencia Adquirida y
Retrovirología Humana, 11 (1996), 117-127.
A-28. AHALLIGAN, COMOHENNAN, L PCámbar, mDelawareSWIETy DJ TAYLOR, "Diferencia de la presión arterial diurna en la
evaluación de la preeclampsia",Obstetricia y Ginecología, 87 (1996), 205–208.
A-29. jSÍWMARCAS, gEORGEGBONORRIS, y yoESLIEJ. S.CHOENFIELD, "Efectos del ursodiol o el ibuprofeno en la contracción de la
vesícula biliar y la bilis entre pacientes obesos durante la pérdida de peso",Enfermedades y Ciencias Digestivas, 41
(1996), 242–249.
A-30. DJ PEACOCK, EDUCACIÓN FÍSICAGGER, PTAYLOR, MEDIO CAWLEY, y C.C.OPER, “Medición de la densidad ósea lateral en la
osteoartritis de la columna lumbar,”Anales de las enfermedades reumáticas, 55 (1996), 196–198.
A-31. RP SPRÉSTAMO, PASFELIZ, EBAGIELLA, JTBIGGER, ES LOy JM GORMAN, "Relaciones entre las catecolaminas circulantes y
la variabilidad del período cardíaco de baja frecuencia como índices de la actividad simpática cardíaca
durante el estrés mental"Medicina Psicosomática, 58 (1996) 25–31.
A-32. ZReino Unido€ICHATI, FA€ZIEZAnad, CLAUDEjEANDEL, BRIGITTELHERBIER, jEAN-METROARIEmiSCANYE, jACCESROBERTO, y
miTIENNEALIOT, "El desacondicionamiento físico puede ser un mecanismo para las anomalías del metabolismo del fosfato energético del
músculo esquelético en la insuficiencia cardíaca crónica",Diario americano del corazón, 131 (1996), 560–566.
A-33. METROAGDALENACZADER, jOANNAMETROAZUR, mIKAELPAGETTERSON, jUNLILIEMARCA, mATSSTRO €MBERG, BIRGERCHRISTENSSON,
BERNARDOTRIBUKAIT, gERTAUER, AKEO €CALLE, y ANNAPAGORWIT, “Importancia pronóstica de enfermedades proliferativas y
Fracciones apoptóticas en linfomas no hodgkinianos derivados de células del centro del folículo de bajo grado.Cáncer, 77
(1996), 1180–1188.
A-34. BG REIGNERy HAWELKER, “Factores que influyen en la eliminación y distribución de la fleroxacina: Metaanálisis de datos
individuales de 10 estudios farmacocinéticos,”Agentes antimicrobianos y quimioterapia, 40 (1996), 575–580.
TEMAS
10.1 INTRODUCCIÓN
10.2 EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE
10.3 OBTENCIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE
10.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE
10.5 USO DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE
10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE
10.7 RESUMEN
489
490 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
10.1 INTRODUCCIÓN
En el Capítulo 9 exploramos los conceptos y técnicas para analizar y hacer uso de la relación
lineal entre dos variables. Vimos que este análisis puede conducir a una ecuación lineal que se
puede usar para predecir el valor de alguna variable dependiente dado el valor de una variable
independiente asociada.
La intuición nos dice que, en general, deberíamos poder mejorar nuestra capacidad de predicción al
incluir más variables independientes en dicha ecuación. Por ejemplo, un investigador puede encontrar que
los puntajes de inteligencia de los individuos pueden predecirse a partir de factores físicos como el orden de
nacimiento, el peso al nacer y la duración de la gestación junto con ciertos factores hereditarios y
ambientales externos. La duración de la estancia en un hospital de enfermedades crónicas puede estar
relacionada con la edad, el estado civil, el sexo y los ingresos del paciente, sin mencionar el factor obvio del
diagnóstico. La respuesta de un animal de experimentación a algún fármaco puede depender del tamaño de
la dosis y de la edad y peso del animal. Una supervisora de enfermería puede estar interesada en la fuerza
de la relación entre el desempeño de una enfermera en el trabajo, la puntuación en el examen de la junta
estatal, el expediente académico, y puntaje en alguna prueba de desempeño o aptitud. O un administrador
de hospital que estudie las admisiones de varias comunidades atendidas por el hospital puede estar
interesado en determinar qué factores parecen ser responsables de las diferencias en las tasas de admisión.
Los conceptos y técnicas para analizar las asociaciones entre varias variables son
extensiones naturales de las exploradas en los capítulos anteriores. Los cálculos, como
cabría esperar, son más complejos y tediosos. Sin embargo, como se señaló en el Capítulo
9, esto no presenta un problema real cuando se dispone de una computadora. No es
inusual encontrar investigadores investigando las relaciones entre una docena o más de
variables. Para aquellos que tienen acceso a una computadora, la decisión sobre cuántas
variables incluir en un análisis no se basa en la complejidad y la duración de los cálculos,
sino en consideraciones tales como su significado, el costo de su inclusión y la
importancia de su contribución.
En este capítulo seguimos de cerca la secuencia del capítulo anterior. Primero se
considera el modelo de regresión, seguido de una discusión del modelo de correlación. Al
considerar el modelo de regresión, se cubren los siguientes puntos: una descripción del
modelo, métodos para obtener la ecuación de regresión, evaluación de la ecuación y los usos
que pueden hacerse de la ecuación. En ambos modelos se discuten los posibles procedimientos
inferenciales y sus supuestos subyacentes.
En el modelo de regresión múltiple suponemos que existe una relación lineal entre
alguna variableY,que llamamos la variable dependiente, ykvariables independientes,
X1;X2; . . . ;Xk. Las variables independientes a veces se denominanvariables
explicativas,debido a su uso para explicar la variación enytambién se les llama
variables predictoras,debido a su uso en la prediccióny
10.2 EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE 491
1.ElXison variables no aleatorias (fijas). Este supuesto distingue el modelo de regresión múltiple del
modelo de correlación múltiple, que se presentará en la Sección 10.6. Esta condición indica que
las inferencias que se extraen de los datos de la muestra se aplican solo al conjunto deXvalores
observados y no a una colección más grande deX's. Bajo el modelo de regresión, el análisis de
correlación no es significativo. Bajo el modelo de correlación que se presentará más adelante,
se pueden aplicar las técnicas de regresión que siguen.
2.Para cada conjunto deXivalores hay una subpoblación deYvalores. Para construir ciertos
intervalos de confianza y probar hipótesis, debe saberse, o el investigador debe estar
dispuesto a asumir, que estas subpoblaciones deYLos valores se distribuyen
normalmente. Como queremos demostrar estos procedimientos inferenciales, en los
ejemplos y ejercicios de este capítulo se hará la suposición de normalidad.
3.Las varianzas de las subpoblaciones deYson todos iguales.
4.ElYlos valores son independientes Es decir, los valores deYseleccionado para un conjunto deXLos valores
no dependen de los valores deYseleccionado en otro conjunto deXvalores.
La ecuación del modeloLos supuestos para el análisis de regresión múltiple pueden establecerse
de manera más compacta como
yj¼b0þb1X1jþb2X2jþmij (10.2.2)
aaviónen el espacio tridimensional se puede ajustar a los puntos de datos como se ilustra en la Figura
10.2.1. Cuando el modelo contiene más de dos variables independientes, se describe
geométricamente como unhiperplano
En la figura 10.2.1, el observador debe visualizar algunos de los puntos ubicados
por encima del plano y otros por debajo del plano. La desviación de un punto del plano
está representada por
mij¼yj-b0-b1X1j-b2X2j (10.2.3)
Desviaciones de la
Plano de regresión
avión
X2 X1
X X- -
j¼2
mi yj-b0-b1X1j-b2X2j- - - - -bkX2 kj
se minimiza. Esta cantidad, conocida como la suma de los cuadrados de los residuos, también puede ser
Escrito como
X X- -2
j¼2
mi yj- ŷj (10.3.1)
indicando el hecho de que la suma de los cuadrados de las desviaciones de los valores observados deYde los
valores deYcalculado a partir de la ecuación estimada se minimiza.
10.3 OBTENCIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE 493
EJEMPLO 10.3.1
Los investigadores Jansen y Keller (A-1) utilizaron la edad y el nivel educativo para predecir la capacidad para
dirigir la atención (CDA) en sujetos de edad avanzada. CDA se refiere a los mecanismos inhibitorios
neuronales que enfocan la mente en lo que es significativo mientras bloquea las distracciones. El estudio
recopiló información sobre 71 mujeres mayores que vivían en la comunidad con un estado mental normal. La
medida de CDA se calculó a partir de los resultados de medidas visuales y auditivas estándar que requieren la
inhibición de estímulos competitivos y de distracción. En este estudio, las puntuaciones CDA oscilaron entre
- 7:65 a 9.61 con puntajes más altos correspondientes a un mejor funcionamiento atencional. Las
medidas de CDA, edad en años y nivel educativo (años de escolaridad) para 71 sujetos se muestran en
la Tabla 10.3.1. Deseamos obtener la ecuación de regresión múltiple muestral.
72 20 4.57 79 12 3.17
68 12 - 3,04 87 12 - 1.19
sesenta y cinco 13 1.39 71 14 0.99
85 14 - 3.55 81 dieciséis - 2.94
84 13 - 2.56 66 dieciséis - 2.21
90 15 - 4.66 81 dieciséis - 0,75
79 12 - 2,70 80 13 5.07
74 10 0.30 82 12 - 5.86
69 12 - 4.46 sesenta y cinco 13 5.00
87 15 - 6.29 73 dieciséis 0,63
84 12 - 4.43 85 dieciséis 2.62
79 12 0.18 83 17 1.77
71 12 - 1.37 83 8 - 3.79
76 14 3.26 76 20 1.44
73 14 - 1.12 77 12 - 5.77
86 12 - 0,77 83 12 - 5.77
69 17 3.73 79 14 - 4.62
66 11 - 5,92 69 12 - 2,03
(Continuación)
494 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
Análisis de Diferencia
Fuente DF SS EM F PAG
Regresión 2 393.39 196.69 20.02 0.000
error residual 68 667.97 9.82
Total 70 1061.36
Fuente DF SS de secuencia
X1 1 194.24
X2 1 199.15
Inusual Observaciones
Obs. X1 Y Adaptar Ajuste SE Residual Calle residir
28 67 9.610 0.487 0.707 9.123 2.99R
31 102 - 2.300 - 5.957 1.268 3.657 1.28X
44 80 5.070 - 1.296 0.425 6.366 2.05R
67 94 - 7.070 - 6.927 1.159 - 0.143 - 0.05X
El Procedimiento REG
Modelo: MODEL1
Variable dependiente: CDA
Análisis de variación
La suma de Significar
Parámetro Estimados
Parámetro Estándar
Variable DF Estimar Error t Valor PR > |t|
Interceptar 1 5.49407 4.44297 1.24 0.2205
EDAD 1 - 0.18412 0.04851 - 3,80 0.0003
EDUCAR 1 0.61078 0.13565 4.50 <.0001
entre CDA y Edad y una relación positiva entre CDA y Ed-Level. Veremos que este
es el caso cuando usamos MINITAB para analizar los datos.
Solución: Ingresamos las observaciones sobre edad, nivel educativo y CDA en c1 a c3 y las
nombramosX1,X2, yY,respectivamente. El cuadro de diálogo y el comando de sesión de
MINITAB, así como la salida, se muestran en la Figura 10.3.2. Vemos a partir de la
salida que la ecuación de regresión múltiple muestral, en la notación de la Sección
10.2, es
EJERCICIOS
Obtenga la ecuación de regresión para cada uno de los siguientes conjuntos de datos.
10.3.1 Machiel Naeije (A-2) estudió la relación entre la apertura máxima de la boca y las medidas del maxilar
inferior (mandíbula). Midió la variable dependiente, apertura máxima de la boca (MMO, medida en
mm), así como variables predictoras, longitud mandibular (ML, medida en mm) y ángulo de rotación
de la mandíbula (RA, medida en grados) de 35 sujetos.
10.3.2 El cuidado familiar de adultos mayores es más común en Corea que en los Estados Unidos. Hijo et al. (A-3)
estudió a 100 cuidadores de adultos mayores con demencia en Seúl, Corea del Sur. La variable dependiente
fue la carga del cuidador medida por el Inventario de Carga de Corea (KBI). Los puntajes variaron de 28 a
140, y los puntajes más altos indicaron una mayor carga. Las variables explicativas fueron índices que
midieron lo siguiente:
AVD: total de actividades de la vida diaria (puntuaciones bajas indican que los ancianos realizan actividades
independientemente).
KBI (Y) AVD (X1) MEM (X2) COG (X3) KBI (Y) AVD (X1) MEM (X2) COG (X3)
28 39 4 18 88 76 50 5
68 52 33 9 54 79 44 11
59 89 17 3 73 48 57 9
91 57 31 7 87 90 33 6
(Continuación)
498 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
KBI (Y) AVD (X1) MEM (X2) COG (X3) KBI (Y)AVD (X1) MEM (X2) COG (X3)
70 28 35 19 47551120
38 34 3 25 60832411
46 42 dieciséis 17 65502125
57 52 6 26 57443118
89 88 41 13 85793020
48 90 24 3 28 24 5 22
74 38 22 13 40402017
78 83 41 11 87351527
43 30 9 24 80 55 9 21
76 45 33 14 49452817
72 47 36 18 57461917
61 90 17 0 32 37 4 21
63 63 14 dieciséis 52 47 29 3
77 34 35 22 42 28 23 21
85 76 33 23 49 61 8 7
31 26 13 18 63 35 31 26
79 68 34 26 89 68 sesenta y cinco 6
92 85 28 10 67 80 29 10
76 22 12 dieciséis 43 43 8 13
91 82 57 3 47 53 14 18
78 80 51 3 70 60 30 dieciséis
103 80 20 18 99 63 22 18
99 81 20 1 53 28 9 27
73 30 7 17 78 35 18 14
88 27 27 27 112 37 33 17
64 72 9 0 52 82 25 13
52 46 15 22 68 88 dieciséis 0
71 63 52 13 63 52 15 0
41 45 26 18 49 30 dieciséis 18
85 77 57 0 42 69 49 12
52 42 10 19 56 52 17 20
68 60 34 11 46 59 38 17
57 33 14 14 72 53 22 21
84 49 30 15 95 sesenta y cinco 56 2
91 89 64 0 57 90 12 0
83 72 31 3 88 88 42 6
73 45 24 19 81 66 12 23
57 73 13 3 104 60 21 7
69 58 dieciséis 15 88 48 14 13
81 33 17 21 115 82 41 13
71 34 13 18 66 88 24 14
91 90 42 6 92 63 49 5
48 48 7 23 97 79 34 3
94 47 17 18 69 71 38 17
57 32 13 15 112 66 48 13
49 63 32 15 88 81 66 1
Fuente: Datos proporcionados por cortesía de Gwi-Ryung Son, RN, Ph.D.
EJERCICIOS 499
10.3.3 En un estudio de factores que se cree que están relacionados con los patrones de ingreso a un gran hospital general,
un administrador obtuvo estos datos en 10 comunidades en el área de captación del hospital:
Índice de
Personas por 1000 Disponibilidad de
Población Admitida Otra Salud Índice de
Durante el período de estudio Servicios indigencia
Comunidad (Y) (X1) (X2)
10.3.4 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes de cirugía durante un estudio
para determinar qué factores parecen estar relacionados con la duración de la estadía:
Postoperatorio preoperatorio
Longitud de Número de corriente Longitud de
Estancia en Días Problemas médicos Estancia en Días
(Y) (X1) (X2)
6 1 1
6 2 1
11 2 2
9 1 3
dieciséis 3 3
dieciséis 1 5
4 1 1
8 3 1
11 2 2
13 3 2
13 1 4
9 1 2
17 3 3
17 2 4
12 4 1
6 1 1
5 1 1
(Continuación)
500 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
Postoperatorio preoperatorio
Longitud de Número de corriente Longitud de
Estancia en Días Problemas médicos Estancia en Días
(Y) (X1) (X2)
12 3 2
8 1 2
9 2 2
Total 208 38 43
10.3.5 Una muestra aleatoria de 25 enfermeras seleccionadas de un registro estatal arrojó la siguiente información sobre la
puntuación de cada enfermera en el examen de la junta estatal y su puntuación final en la escuela. Ambos puntajes se
relacionan con el área de afiliación de la enfermera. Se puso a disposición de la investigadora información adicional sobre el
puntaje obtenido por cada enfermero en una prueba de aptitud, tomada en el momento del ingreso a la escuela de enfermería.
Los datos completos son los siguientes:
440 87 92
480 87 79
535 87 99
460 88 91
525 88 84
480 89 71
510 89 78
530 89 78
545 89 71
600 89 76
495 90 89
545 90 90
575 90 73
525 91 71
575 91 81
600 91 84
490 92 70
510 92 85
575 92 71
540 93 76
595 93 90
525 94 94
545 94 94
600 94 93
625 94 73
10.3.6 Los siguientes datos fueron recolectados en una muestra aleatoria simple de 20 pacientes con hipertensión. las
variables son
Paciente Y X1 X2 X3 X4 X5 X6
Antes de usar una ecuación de regresión múltiple para predecir y estimar, es deseable
determinar primero si, de hecho, vale la pena usarla. En nuestro estudio de la regresión lineal
simple hemos aprendido que la utilidad de una ecuación de regresión puede evaluarse
considerando el coeficiente de determinación de la muestra y la pendiente estimada. Al evaluar
una ecuación de regresión múltiple, enfocamos nuestra atención en lacoeficiente de
determinación múltipley los coeficientes de regresión parcial.
inexplicablederrorÞsuma de cuadrados
EJEMPLO 10.4.1
Consulte el Ejemplo 10.3.1. CalcularR2 y:12.
acero inoxidable¼1061:36
RSS¼ 393:39
SSE¼ 667:97
393:39
Ry:12
2 ¼ ¼ :3706 :371
1061:36
10.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE 503
Decimos que alrededor del 37.1 por ciento de la variación total en elYvalores se
explica por el plano de regresión ajustado, es decir, por la relación lineal con la
edad y el nivel educativo. &
4. Estadística de prueba.La estadística de prueba adecuada es VR, que se calcula como parte de
un análisis de varianza. La tabla general de ANOVA se muestra en la Tabla 10.4.1. En la Tabla
10.4.1,MSRrepresenta el cuadrado medio debido a la regresión yMSEsignifica el cuadrado
medio de la regresión o, como a veces se le llama, el cuadrado medio del error.
EJEMPLO 10.4.2
Deseamos probar la hipótesis nula de que no existe una relación lineal entre las tres variables
discutidas en el ejemplo 10.3.1: puntaje CDA, edad y nivel educativo.
Solución:
3. Hipótesis.
H0: ¼b1¼b2¼0
HA: ¼no todobi¼0
4. Estadística de prueba.La estadística de prueba es VR
Pruebas de hipótesis para labi Para probar la hipótesis nula de quebies igual a algún valor
particular, digamos,bi0, la siguientetla estadística se puede calcular:
bi-bi0
t¼ (10.4.3)
sbi
EJEMPLO 10.4.3
Consultemos el Ejemplo 10.3.1 y probemos la hipótesis nula de que la edad (años) es irrelevante para
predecir la capacidad para dirigir la atención (CDA).
Solución:
b1- 0 - :18412
t¼ ¼ ¼ -3:80
sb1 :04851
&
Ahora, realicemos una prueba similar para el segundo coeficiente de regresión parcial,b2:
H0:b2¼0
HA:b26¼0
a¼ :05
b2- 0 :6108
t¼ ¼ ¼4:50
sb2 :1357
506 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
En este caso también se rechaza la hipótesis nula, ya que 4,50 es mayor que 1,9957.
Concluimos que existe una relación lineal entre el nivel educativo y el CDA en la edad de
presencia, y que el nivel educativo, utilizado de esta manera, es una variable útil para
predecir el CDA. [Para esta prueba,pag <2d:005Þ ¼ :01.
bi t1-dun =2Þ;nk-1sbi
Para nuestro ejemplo ilustrativo, podemos calcular los siguientes intervalos de confianza del 95
por ciento parab1yb2.
El intervalo de confianza del 95 por ciento parab1es
- :18412 1:9957d:04851Þ
- :18412 :0968
d-:28092; - :08732Þ
:6108 d1:9957Þð:1357Þ
:6108 :2708
d:3400; :8816Þ
Podemos dar a estos intervalos las interpretaciones probabilísticas y prácticas usuales. Estamos
seguros en un 95 por ciento, por ejemplo, de queb2está contenido en el intervalo de .3400 a .8816 ya
que, en muestreo repetido, el 95 por ciento de los intervalos que pueden construirse de esta manera
incluirán el parámetro verdadero.
Algunas precaucionesUno debe ser consciente de los problemas que implica realizar múltiples
pruebas de hipótesis y construir múltiples intervalos de confianza a partir de los mismos datos de
muestra. El efecto sobreade realizar múltiples pruebas de hipótesis a partir de los mismos datos se
analiza en la Sección 8.2. Un problema similar surge cuando se desea construir intervalos de confianza
para dos o más coeficientes de regresión parcial. Los intervalos no serán independientes, por lo que,
en general, no se aplica el coeficiente de confianza tabulado. En otras palabras, todos esos intervalos
no serían 100d1 -aÞintervalos de confianza porcentuales.
Para mantener aproximadamente 100d1 -aÞintervalos de confianza para los coeficientes
de regresión parcial, se deben realizar ajustes en el cálculo de errores en las ecuaciones
anteriores. Estos ajustes a veces se denominantasas de error por familia,y se puede encontrar
en muchos paquetes de software de computadora. El tema es discutido en detalle por Kutner,
et al. (4).
10.5 USO DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE 507
EJERCICIOS
10.4.1 Consulte el Ejercicio 10.3.1. (a) Calcular el coeficiente de determinación múltiple; (b) realizar un análisis de varianza; (c)
pruebe la significación de cada b̂idyo >0Þ.Dejara¼ :05 para todas las pruebas de significación y determinar elpagvalor
para todas las pruebas; (d) construya un intervalo de confianza del 95 por ciento para cada pendiente muestral
significativa.
Como aprendimos en el capítulo anterior, se puede usar una ecuación de regresión para obtener un
valor calculado deY, ŷ,cuando un valor particular deXes dado. De manera similar, podemos usar
nuestra ecuación de regresión múltiple para obtener un valor de ŷ cuando se nos dan valores
particulares de dos o másXvariables presentes en la ecuación.
Tal como sucedió en la regresión lineal simple, podemos, en la regresión múltiple, interpretar un valor
de ŷ de una de dos maneras. Primero podemos interpretar ŷ como una estimación de la media de la
subpoblación deYvalores que se supone que existen para combinaciones particulares deXi
valores. Bajo esta interpretación, ŷ se llamaestimar,y cuando se usa para este propósito, la
ecuación se considera como unestimación de la ecuación.La segunda interpretación de ŷ es que
es el valorYes más probable que asuma para valores dados de laXi. En este caso ŷ
508 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
Si designamos el error estándar de este estimador porsŷ, los 100d1 -aÞintervalo de confianza
porcentual para la media deY,dado especificadoXies como sigue:
EJEMPLO 10.5.1
Nos referimos al ejemplo 10.3.1. Primero, deseamos construir un intervalo de confianza del 95 por ciento
para la puntuación CDA media (Y)en una población de sujetos de 68 años (X1) que completó 12 años de
educación (X2). En segundo lugar, supongamos que tenemos un sujeto que tiene 68 años de edad.
EJERCICIOS 509
y tiene un nivel de educación de 12 años. ¿Cuál predecimos que será la puntuación CDA de este
sujeto?
Para obtener el intervalo de confianza y el intervalo de predicción para los parámetros para
los que acabamos de calcular una estimación puntual y una predicción puntual, usamos MINITAB de
la siguiente manera. Después de ingresar la información para un análisis de regresión de nuestros
datos como se muestra en la Figura 10.3.2, hacemos clic en Opciones en el cuadro de diálogo. En el
cuadro denominado "Intervalos de predicción para nuevas observaciones", escribimos 68 y 12 y
hacemos clic en Aceptar dos veces. Además del análisis de regresión, obtenemos el siguiente
resultado:
EJERCICIOS
Para cada uno de los siguientes ejercicios calcule layvalor y construya (a) 95 por ciento de confianza y
(b) 95 por ciento de intervalos de predicción para los valores especificados deXi.
EJEMPLO 10.6.1
Wang et al. (A-4), utilizando fémures humanos cadavéricos de sujetos de 16 a 19 años, investigó las
propiedades de dureza del hueso y las medidas de la red de colágeno dentro del hueso. Dos variables
que miden la red de colágeno son la porosidad (PAG,expresado como porcentaje) y una medida de la
resistencia a la tracción de la red de colágeno (S).La medida de la dureza. (W,Newtons), es la fuerza
requerida para la fractura del hueso. Los 29 fémures cadavéricos utilizados en el estudio estaban
libres de patologías relacionadas con los huesos. Deseamos analizar la naturaleza y la fuerza de la
relación entre las tres variables. Las medidas se muestran en la siguiente tabla.
W PAG S
W PAG S
Solución: Usamos MINITAB para realizar el análisis de nuestros datos. Los lectores interesados en la
derivación de las fórmulas subyacentes y los procedimientos aritméticos involucrados
pueden consultar los textos enumerados al final de este capítulo y el Capítulo 9, así como las
ediciones anteriores de este texto. Si se desea una ecuación de predicción de mínimos
cuadrados y un coeficiente de correlación múltiple como parte del análisis, podemos
obtenerlos usando el procedimiento de regresión múltiple MINITAB descrito anteriormente.
Cuando hacemos esto con los valores de muestra deY, X1, y X2, almacenado en las Columnas
1 a 3, respectivamente, obtenemos el resultado que se muestra en la Figura 10.6.1.
ŷj¼35:61þ1:451X1jþ2:3960X2j
Análisis de Diferencia
Fuente DF SS EM F PAG
Regresión 2 8151.1 4075.6 5.42 0.011
error residual 26 19553.5 752.1
Total 28 27704.6
FIGURA 10.6.1Resultado del procedimiento de regresión múltiple de MINITAB para los datos de la
tabla 10.6.1.
10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE 513
Ry2:12¼ :294
El coeficiente de correlación múltiple, por lo tanto, es
pffiffiffiffiffiffiffiffiffiffi
Ry:12¼ :294¼ :542
Interpretación deRy:12
nosotros interpretamosRy:12como una medida de la correlación entre las variables fuerza requerida
para la fractura, porosidad y resistencia de la red de colágeno en la muestra de 29 huesos de fémur
de sujetos de 16 a 19 años. Si nuestros datos constituyen una muestra aleatoria de la población de
tales personas, podemos usarRy:12como una estimación dery:12, el verdadero coeficiente de correlación
múltiple de la población. También podemos interpretarRy:12como el coeficiente de correlación simple
entreyjy ŷ, los valores observados y calculados, respectivamente, de la variable “dependiente”.
Correspondencia perfecta entre los valores observados y calculados deYdará como resultado un
coeficiente de correlación de 1, mientras que la falta total de una relación lineal entre los valores
observados y calculados produce un coeficiente de correlación de 0. El coeficiente de correlación
múltiple siempre recibe un signo positivo.
Podemos probar la hipótesis nula de query:12...k¼0 por computación
Ry:12...k
2 n-k-1
F¼ - (10.6.3)
1 -R2 y:12...k k
:294 29 - 2 - 1
F¼ - ¼5:41
1 - :294 2
Como 5.41 es mayor que 4.27,pag < :025, por lo que podemos rechazar la hipótesis nula en el . 025 de
significación y concluye que la fuerza requerida para la fractura está correlacionada con la porosidad y
la medida de la fuerza de la red de colágeno en la población muestreada.
El valor calculado deFpara las pruebasH0que el coeficiente de correlación múltiple de
población es igual a cero se da en la tabla de análisis de varianza en la figura 10.6.1 y es 5.42.
Los dos valores calculados deFdifieren como resultado de diferencias en el redondeo en los
cálculos intermedios. &
Producción:
Y X1
X1 0.043
0.823
X2 0.535 - 0.080
0.003 0.679
FIGURA 10.6.2Procedimiento de MINITAB para calcular los coeficientes de correlación simple para los datos
de la tabla 10.6.1.
EJEMPLO 10.6.2
Para ilustrar el cálculo de los coeficientes de correlación parcial de la muestra, consulte el
ejemplo 10.6.1 y calcule los coeficientes de correlación parcial entre las variables fuerza de
fractura (Y ),porosidad (X1), y la fuerza de la red de colágeno (X2).
Solución: En lugar de calcular los coeficientes de correlación parcial a partir de los coeficientes
de correlación simple mediante las Ecuaciones 10.6.4 a 10.6.6, usamos MINITAB para
obtenerlos.
El procedimiento de MINITAB para calcular los coeficientes de correlación
parcial se basa en el hecho de que un coeficiente de correlación parcial dado es
en sí mismo la correlación simple entre dos conjuntos de residuos. Un conjunto
de residuos se obtiene de la siguiente manera. Supongamos que tenemos
medidas en dos variables,X (independiente) yY (dependiente). Obtenemos la
ecuación de predicción de mínimos cuadrados, ŷ¼ b̂0þ b̂X. Para cada valor deX
calculamos un residuo, que es igual adyi- ŷiÞ,la diferencia entre el valor
observado deYy el valor predicho deYasociado con elX.
Ahora, supongamos que tenemos tres variables,X1;X2, yyQueremos calcular
el coeficiente de correlación parcial entreX1yYmientras lo esté agarrando X2
constante. retrocedemosX1enX2y calcular los residuos, que podemos llamar
conjunto residualA.retrocedemosYenX2y calcular los residuos, que podemos
llamar conjunto residualB.El coeficiente de correlación simple que mide la fuerza
de la relación entre el conjunto residualAy conjunto residualBes el coeficiente de
correlación parcial entreX1yYdespués de controlar el efecto deX2.
516 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
n-k-1
t¼ry1:2...k 1 -r2 (10.6.7)
y1:2...k
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
29 - 2 - 1
t¼ :102 ¼ :523
1 -d:102Þ2
Dado que el calculadotde .523 es más pequeño que el tabuladotde 2,0555 para 26 grados de libertad
ya¼ :05 (prueba de dos caras), no podemos rechazarH0con un nivel de significancia de 0,05 y concluir
que puede no haber correlación entre la fuerza requerida para la fractura y la porosidad después de
controlar el efecto de la fuerza de la red de colágeno. Las pruebas de significación para los otros dos
coeficientes de correlación parcial se dejarán como ejercicio para el lector. Tenga en cuenta quepag
MINITAB calcula los valores para estas pruebas, como se muestra en la Figura 10.6.3.
El paquete de software estadístico SPSS para PC proporciona un procedimiento conveniente
para obtener coeficientes de correlación parcial. Para usar esta función, elija "Analizar" en la barra de
menú, luego "Correlacionar" y, finalmente, "Parcial". Siguiendo esta secuencia de opciones, aparece
en la pantalla el cuadro de diálogo Correlaciones parciales. En el cuadro denominado "Variables:",
ingrese los nombres de las variables para las que se desean correlaciones parciales. En el cuadro
etiquetado como "Controlando por:" ingrese los nombres de la(s) variable(s) que desea controlar.
Seleccione un nivel de significancia de dos colas o de una cola. A menos que se anule la selección de la
opción, se mostrarán los niveles de significación reales. Para el ejemplo 10.6.2, la figura 10.6.4
muestra los coeficientes de correlación parcial calculados por SPSS entre las otras dos variables al
controlar, sucesivamente, porX1(porosidad),X2(fortaleza de la red de colágeno), yY (fuerza requerida
para la fractura).
10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE 517
Correlaciones: C4, C5
Correlaciones: C6, C7
Correlaciones: C8, C9
FIGURA 10.6.3Procedimiento de MINITAB para calcular coeficientes de correlación parcial a partir de los
datos de la tabla 10.6.1.
518 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
Controlando por: X1
X2 Y
X2 1.0000 . 5412
( 0) ( 26)
P= . P= . 003
Y . 5412 1.0000
( 26) ( 0)
P= . 003 P= .
Controlando por: X2
Y X1
Y 1.0000 . 1024
( 0) (26)
P= . P= . 604
X1 . 1024 1.0000
( 26) ( 0)
P= . 604 P= .
Controlando por: Y
X1 X2
X1 1.0000 - . 1225
( 0) ( 26)
P= . P= . 535
X2 - . 1225 1.0000
( 26) ( 0)
P= . 535 P= .
FIGURA 10.6.4Coeficientes parciales obtenidos con SPSS para Windows, Ejemplo 10.6.2.
10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE 519
Correlaciones
Forzar
Variables de control Fractura (Y) Porosidad (X1)
Correlaciones
Porosidad De tensión
Variables de control (X1) Fuerza (X2)
(b)
Correlaciones
De tensión Forzar
Variables de control Fuerza (X2) Fractura (Y)
(C)
FIGURA 10.6.5Coeficientes de correlación parcial para los datos del ejemplo 10.6.1. (a) ry1.2, (b) r12y, y (c)
ry2.1.
Aunque nuestra ilustración del análisis de correlación se limita al caso de tres variables,
los conceptos y técnicas se extienden lógicamente al caso de cuatro o más variables. El número
y la complejidad de los cálculos aumentan rápidamente a medida que aumenta el número de
variables.
520 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
EJERCICIOS
10.6.1 El objetivo de un estudio de Anton et al. (A-5) fue investigar la estructura de correlación de múltiples medidas
de la carga del VIH en muestras de sangre y tejido. Midieron la carga del VIH de cuatro maneras. Dos
mediciones se derivaron de muestras de sangre y dos mediciones se realizaron en tejido rectal. Las dos
medidas de sangre se basaron en ensayos de ADN del VIH y un segundo ensayo de cocultivo que fue una
modificación de la primera medida. Las mediciones tercera y cuarta fueron cuantificaciones de ADN y ARN de
VIH-1 de tejido de biopsia rectal. La siguiente tabla proporciona datos sobre los niveles de VIH de estas
mediciones para 34 sujetos.
ADN del VIH Co-cultura del VIH ADN del VIH Rectal ARN del VIH Rectal
Sangre (Y) Sangre (X1) Tejido (X2) Tejido (X3)
115 . 38 899 56
86 1.65 167 158
19 . dieciséis 73 152
6 . 08 146 35
23 . 02 82 60
147 1.98 2483 1993
27 . 15 404 30
140 . 25 2438 72
345 . 55 780 12
92 . 22 517 5
85 . 09 346 5
24 . 17 82 12
109 . 41 1285 5
5 . 02 380 5
95 . 84 628 32
46 . 02 451 5
25 . 64 159 5
187 . 20 1335 121
5 . 04 30 5
47 . 02 13 30
118 . 24 5 5
112 . 72 625 83
79 . 45 719 70
52 . 23 309 167
52 . 06 27 29
7 . 37 199 5
13 . 13 510 42
80 . 24 271 15
86 . 96 273 45
26 . 29 534 71
53 . 25 473 264
185 . 28 2932 108
30 . 19 658 33
9 . 03 103 5
76 . 21 2339 5
(Continuación)
EJERCICIOS 521
ADN del VIH Co-cultura del VIH ADN del VIH Rectal ARN del VIH Rectal
Sangre (Y) Sangre (X1) Tejido (X2) Tejido (X3)
51 . 09 31 36
73 . 06 158 5
47 . 08 773 5
48 . 12 545 67
dieciséis . 03 5 5
Fuente: Datos proporcionados por cortesía de Peter A. Anton, MD
(a)Calcule los coeficientes de correlación simple entre todos los posibles pares de variables.
(b)Calcule el coeficiente de correlación múltiple entre las cuatro variables. Pruebe la correlación
general para la significación.
(C)Calcule las correlaciones parciales entre el ADN del VIH en sangre y cada una de las otras variables
mientras controla las otras dos. (Estos se denominan coeficientes de correlación parcial de segundo
orden).
(d)Calcule la correlación parcial entre la sangre del cocultivo del VIH y el ADN del VIH, controlando las otras
dos variables.
(mi)Calcule la correlación parcial entre la sangre del cocultivo del VIH y el ARN del VIH, controlando las otras
dos variables.
(F)Calcule las correlaciones parciales entre el ADN del VIH y el ARN del VIH, controlando las otras dos
variables.
10.6.2 Los siguientes datos se obtuvieron en 12 varones entre las edades de 12 y 18 años (todas las medidas están
en centímetros):
(b)Encuentre cada uno de los coeficientes de correlación parcial y pruebe cada uno para determinar su significación. Dejara¼ :05 para todas las pruebas.
10.6.4 Se llevó a cabo un proyecto de investigación para estudiar las relaciones entre inteligencia, afasia y apraxia. Los
sujetos eran pacientes con daño focal en el hemisferio izquierdo. Las puntuaciones en las siguientes variables se
obtuvieron mediante la aplicación de pruebas estándar.
Y¼inteligencia
X1¼apraxia ideomotora X2¼
apraxia constructiva X3¼
volumen de la lesióndpíxelesÞ
X4¼severidad de la afasia
Los resultados se muestran en la siguiente tabla. Encuentre el coeficiente de correlación múltiple y pruebe la
significancia. Dejara¼ :05 y encuentra elpagvalor.
Sujeto Y X1 X2 X3 X4
Sujeto Y X1 X2 X3 X4
5 77 11.4 11.2 2470.50 5
6 82 14.4 13.1 3136.58 9
7 82 13.3 12.8 2799.55 8
8 75 12.4 11.9 2565.50 6
9 81 10.7 11.5 2429.49 11
10 71 7.6 7.8 2369.37 6
11 77 11.2 10.8 2644.62 7
12 74 9.7 9.7 2647.45 9
13 77 10.2 10.0 2672.92 7
14 74 10.1 9.7 2640.25 8
15 68 6.1 7.2 1926.60 5
10.7 RESUMEN
En este capítulo examinamos cómo los conceptos y técnicas de regresión lineal simple y
análisis de correlación se extienden al caso de múltiples variables. Se presenta e ilustra el
método de mínimos cuadrados para obtener la ecuación de regresión. Este capítulo
también se ocupa del cálculo de medidas descriptivas, pruebas de significancia y los usos
que se harán de la ecuación de regresión múltiple. Además, se discuten los métodos y
conceptos del análisis de correlación, incluida la correlación parcial.
Cuando no se cumplen los supuestos subyacentes a los métodos de regresión y
correlación presentados en este capítulo y en el anterior, el investigador debe recurrir a
técnicas alternativas como las discutidas en el Capítulo 13.
Fórmula
Número Nombre Fórmula
(Continuación)
524 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
PAG- -2 -
PAG -2 -
PAG -
10.4.1 Suma de cuadrados yj- -y ¼ ŷj- -y þ yj- ŷ2 j
ecuación
acero inoxidable¼RSSþSSE
PAG- -
10.4.2 Coeficiente de ŷj- -y2 RSS
múltiple Ry:12...k
2 ¼PAG- - ¼
yj- -y2 acero inoxidable
determinación
0
10.5.3 Intervalo de predicción ŷj td1-un =2Þ;nk-1sŷj
paraYpara una dadaX
Ry:12...k RSS
correlación Ry:12...k¼ 2 ¼ tp- -2 ¼
yj- -y
acero inoxidable
coeficiente
1.¿Cuáles son los supuestos que subyacen al análisis de regresión múltiple cuando se desea inferir acerca de la
población de la que se extrajeron los datos de la muestra?
2.¿Cuáles son los supuestos que subyacen al modelo de correlación cuando la inferencia es un objetivo?
4.Describa una situación en su área particular de interés donde el análisis de regresión múltiple sería útil. Utilice
datos reales o realistas y realice un análisis de regresión completo.
5.Describa una situación en su área particular de interés donde el análisis de correlación múltiple sería útil. Utilice
datos reales o realistas y realice un análisis de correlación completo.
En los ejercicios 6 al 11 realice el análisis indicado y pruebe las hipótesis en los niveles de significación
indicados. Calcular elpagvalor de cada prueba.
6.Aprendimos en el Ejemplo 9.7.1 que el propósito de un estudio de Kwast-Rabben et al. (A-6) fue analizar los potenciales evocados
somatosensoriales (SEP) y sus interrelaciones después de la estimulación de los dedos I, III y V en la mano. Se reclutaron
voluntarios sanos para el estudio. Los investigadores aplicaron estimulación en los dedos con una intensidad por debajo del
nivel del dolor. Los registros de las respuestas espinales se realizaron con electrodos fijados a la piel del sujeto mediante una
crema adhesiva para electrodos. Los resultados se muestran en la siguiente tabla para
526 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
114 temas. Utilice la regresión múltiple para ver qué tan bien puede predecir la latencia espinal máxima (Cv) del SEP
para el dígito I cuando la edad (años) y la longitud del brazo (cm) son las variables predictoras. Evalúa la utilidad de tu
ecuación de predicción.
Edad Largo del brazo Cv Dig.I Edad Largo del brazo Cv Dig.I Edad Largo del brazo Cv Dig.I
7.La siguiente tabla muestra el peso y los niveles de colesterol total y triglicéridos en 15 pacientes con
hiperlipoproteinemia primaria tipo II justo antes del inicio del tratamiento:
PREGUNTAS DE REPASO Y EJERCICIOS 527
X1 X2
Colesterol total triglicéridos
YPeso (kg) (mg/100ml) (mg/100ml)
76 302 139
97 336 101
83 220 57
52 300 56
70 382 113
67 379 42
75 331 84
78 332 186
70 426 164
99 399 205
75 279 230
78 332 186
70 410 160
77 389 153
76 302 139
8.En un estudio de la relación entre la excreción de creatinina, la altura y el peso, se recopilaron los datos que se
muestran en la siguiente tabla en 20 niños varones:
Creatinina
Excreción
(mg/día) Peso (kg) Altura (cm)
Niño Y X1 X2
1 100 9 72
2 115 10 76
3 52 6 59
4 85 8 68
5 135 10 60
6 58 5 58
7 90 8 70
8 60 7 sesenta y cinco
9 45 4 54
10 125 11 83
11 86 7 64
12 80 7 66
13 sesenta y cinco 6 61
14 95 8 66
15 25 5 57
dieciséis 125 11 81
17 40 5 59
(Continuación)
528 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
Creatinina
Excreción
(mg/día) Peso (kg) Altura (cm)
Niño Y X1 X2
18 95 9 71
19 70 6 62
20 120 10 75
(a)Encuentre la ecuación de regresión múltiple que describe la relación entre estas variables.
(b)CalcularR2y hacer un análisis de varianza.
(C)DejarX1¼10 yX2¼60 y encuentre el valor predicho dey
9.Se realizó un estudio para examinar aquellas variables que se pensaba que estaban relacionadas con la satisfacción
laboral de los empleados hospitalarios no profesionales. Una muestra aleatoria de 15 empleados dio los siguientes
resultados:
codificado Índice de
Puntuación en el trabajo Inteligencia Personal
Satisfacción Puntaje Ajustamiento
Prueba (Y) (X1) (X2)
54 15 8
37 13 1
30 15 1
48 15 7
37 10 4
37 14 2
31 8 3
49 12 7
43 1 9
12 3 1
30 15 1
37 14 2
61 14 10
31 9 1
31 4 5
(a)Encuentre la ecuación de regresión múltiple que describe la relación entre estas variables.
(b)Calcule el coeficiente de determinación múltiple y realice un análisis de varianza.
(C)DejarX1¼10 yX2¼5 y encuentre el valor predicho dey
10Un equipo de investigación médica obtuvo el índice de adiposidad, la insulina basal y los valores de glucosa basal
en 21 sujetos normales. Los resultados se muestran en la siguiente tabla. Los investigadores deseaban
investigar la fuerza de la asociación entre estas variables.
PREGUNTAS DE REPASO Y EJERCICIOS 529
90 12 98
112 10 103
127 14 101
137 11 102
103 10 90
140 38 108
105 9 100
92 6 101
92 8 92
96 6 91
114 9 95
108 9 95
160 41 117
91 7 101
115 9 86
167 40 106
108 9 84
156 43 117
167 17 99
165 40 104
168 22 85
11Como parte de un estudio para investigar la relación entre el estrés y algunas otras variables, se recolectaron los
siguientes datos en una muestra aleatoria simple de 15 ejecutivos corporativos.
(a)Encuentre la ecuación de regresión de mínimos cuadrados para estos datos.
(b)Construya la tabla de análisis de varianza y pruebe la hipótesis nula de ausencia de relación entre las cinco
variables.
(C)Pruebe la hipótesis nula de que cada pendiente en el modelo de regresión es igual a cero.
(d)Encuentre el coeficiente de determinación múltiple y el coeficiente de correlación múltiple. Dejar a¼ :05 y
encuentra elpagvalor de cada prueba.
Anual
Medida de Número de años Salario
Medida de Tamaño de la empresa en la actualidad ( 1000)
Estrés (Y) (X1) Posición (X2) (X3) Edad (X4)
Anual
Medida de Número de años Salario
Medida de Tamaño de la empresa en la actualidad ( 1000)
Estrés (Y) (X1) Posición (X2) (X3) Edad (X4)
89 505 13 52 34
60 401 4 27 45
dieciséis 177 6 26 50
184 598 9 52 60
34 412 dieciséis 34 44
17 127 2 28 39
78 601 8 42 41
141 297 11 84 58
11 205 4 31 51
104 603 5 38 63
76 484 8 41 30
Para cada uno de los estudios descritos en los ejercicios 12 a 16, responda tantas de las siguientes preguntas
como sea posible:
(a)¿Cuál es más relevante, el análisis de regresión o el análisis de correlación, o ambas técnicas son
igualmente relevantes?
(b)¿Cuál es la variable dependiente?
(C)¿Cuáles son las variables independientes?
(d)¿Cuáles son las hipótesis nula y alternativa apropiadas?
(mi)¿Qué hipótesis nulas crees que fueron rechazadas? ¿Por qué?
(F)¿Cuál es el objetivo más relevante, la predicción o la estimación, o son los dos igualmente relevantes?
Explica tu respuesta.
(gramo)¿Cuál es la población muestreada?
(h)¿Cuál es la población objetivo?
(i)¿Qué variables están relacionadas con qué otras variables? ¿Las relaciones son directas o
inversas?
(j)Escriba la ecuación de regresión usando los números apropiados para las estimaciones de parámetros.
(k)¿Cuál es el valor numérico del coeficiente de determinación múltiple?
(l)Da valores numéricos para cualquier coeficiente de correlación que puedas.
12Hashimoto et al. (A-7) desarrolló un modelo de regresión múltiple para predecir el número de visitas a las salas de
emergencia de los hospitales de la Universidad de Jikei en Tokio para niños que sufrían un ataque de asma. Los
investigadores encontraron que el número de visitas por noche aumentó significativamente cuando las condiciones
climáticas mostraron una rápida disminución debido a una mayor presión barométrica, una mayor temperatura del
aire y una mayor humedad, así como una menor velocidad del viento. El modelo final demostró que el 22 por ciento
de la variación en el número de visitas se explicaba por la variación en las variables predictoras mencionadas
anteriormente con otras ocho variables climáticas significativas.
13La correlación fue uno de los muchos procedimientos discutidos en un estudio informado por Stenvinkel et al. (A-8). En una cohorte
de 204 sujetos con enfermedad renal en etapa terminal, no encontraron correlaciones significativas entre los niveles
logarítmicos de adiponectina plasmática y la edad, ni ninguna correlación significativa entre logaritmo de la adiponectina
plasmática y la tasa de filtración glomerular.
PREGUNTAS DE REPASO Y EJERCICIOS 531
14Van Schuylenbergh et al. (A-9) utilizaron medidas fisiológicas y antropométricas como variables independientes
para predecir el rendimiento en triatlón (expresado en minutos). Diez triatletas se sometieron a extensas
pruebas fisiológicas en natación, ciclismo y carrera. Dentro de las 2 semanas posteriores a la última prueba
de laboratorio, todos los sujetos compitieron en el Campeonato Nacional Universitario de Triatlón. El modelo
de regresión final fue
en que TP¼rendimiento de triatlón en minutos, MLSSR¼la velocidad de carrera en MLSS (m/s), MLSSS¼la
velocidad de natación en MLSS y BLCR¼concentración de lactato en sangre en funcionamiento MLSS (mmol/
L). MLSS se refiere al estado estable máximo de lactato y generalmente se reconoce como un buen marcador
de la potencia aeróbica funcional durante el ejercicio prolongado. También difiere para cada actividad física.
Para el modelo anteriorR2¼ :98.
15.Inspiración estática máxima (PImax) la presión bucal es una medida simple de la fuerza de los músculos
respiratorios. Un estudio de Tomalak et al. (A-10) examinó las correlaciones entre las variables con PImax
(medido sentado), volumen espiratorio forzado (FEV), flujo espiratorio máximo (PEF) y flujo inspiratorio
máximo (PIF) en 144 niños y 152 niñas de 7 a 14 años. Los investigadores encontraron PImaxse correlacionó
con FEV, PEF y PIF en niños (pag¼ :001;pag¼ :0055, ypag¼ :002; respectivamente) y para las niñas las
correlaciones también fueron significativas (pag < :001;pag < :001, ypag < :001, respectivamente).
dieciséis.Di Mónaco et al. (A-11) utilizaron regresión múltiple para predecir la densidad mineral ósea del cuello
femoral (entre otras localizaciones). Entre 124 mujeres posmenopáusicas sanas caucásicas, encontraron que
el pesodpag < :001Þ,edaddpag < :01Þ,y recuento total de linfocitosdpag < :001Þfueron útiles para predecir la
densidad mineral ósea. Además,R2¼ :40
Para cada uno de los conjuntos de datos dados en los Ejercicios 17 a 19, haga tantos de los siguientes como considere
apropiados:
17Pellegrino et al. (A-12) planteó la hipótesis de que la broncoconstricción máxima se puede predecir a partir del efecto
broncomotor de la inhalación profunda y el grado de sensibilidad de las vías respiratorias a la metacolina (MCh). Un
grupo de participantes estaba formado por 26 sujetos sanos o levemente asmáticos (22 hombres,
4 mujeres) que presentaban broncoconstricción limitada a MCh inhalado. La edad media de los pacientes fue de 31
años con una desviación estándar de 8. Había un fumador en el grupo. Entre los datos recopilados sobre cada sujeto
se encontraban las siguientes observaciones sobre diversas variables de medición de la función pulmonar:
532 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
(X2) dX3Þ dX6Þ (X7) (X8) dX9Þ dX10Þ (X11) VEF1 dX12Þ dX13Þ
(X1) VEF1, VEF1= dX4Þ dX5Þ M=P parlamentario PD15VEF1 PD_40Vm50 PD_vicepresidente
40 50 Disminución máx. V_ m50máx. V_p50máx.
VEF1 % pred. CVF;% V_ m50 V_p50 Relación Pendiente (en miligramos) dentradaÞ dentradaÞ (%) diciembreð%Þ diciembreð%Þ
5.22 108.75 83.92 5,30 3,90 1,36 0,75 8.44 8.24 6.34 21.40 55.40 74.40
5.38 123.96 78.54 6,00 3,70 1,62 0,56 7.76 7.00 6.18 15.80 50.80 85.14
3.62 111.04 86.19 3,10 2,85 1,10 0,69 6.92 6.61 5.56 30.40 54.36 83.07
3.94 94,26 85,28 4,10 2,70 1,52 0,44 6.79 8.52 6.38 16.40 29.10 58.50
4.48 104.43 76.58 3.21 3.00 1.07 0,63 8.79 9.74 6.68 27.80 46.30 76.70
5.28 117.33 81.99 5,65 5,55 1.02 0.83 8.98 8.97 8.19 32.60 70.80 90.00
3.80 93,37 76,61 3,75 4,70 0.80 0.50 10.52 10.60 10.04 15.80 35.30 64,90
3.14 104.67 82.63 3.20 3.20 1.00 0.70 6.18 6.58 6.02 37.60 64.10 87.50
5.26 120.09 84.84 6.30 7.40 0.89 0,55 11.85 11.85 11.85 11.70 29.10 41.20
4.87 121.14 89.69 5.50 5.50 1.00 0.56 11.85 11.85 11.85 10.30 16.40 29.70
5.35 124.71 84.65 5,60 7,00 0.80 0.40 11.98 11.98 11.29 0.00 18.00 47.20
4.30 95,98 80,37 5,78 4,90 1,18 0,59 6.48 6.19 5.11 17.00 48.20 79.60
3.75 87,82 65,79 2,26 1,65 1,37 0,53 6.25 7.02 5.03 27.10 39.53 81.80
4.41 112.21 69.78 3,19 2,95 1.08 0.57 7.66 8.08 5.51 24.70 48.80 85,90
4.66 108.37 78.72 5,00 5,90 0.85 0.49 7.79 9.77 6.10 15.00 35.00 70.30
5.19 99.05 73.62 4,20 1,50 2,80 0,63 5.15 5.78 4.72 31.40 61.90 86.70
4.32 122.38 75.13 4,39 3,30 1,33 0,74 6.20 6.34 5.10 28.25 60.30 78.00
4.05 95,97 84,38 3,40 2,50 1,30 0,59 5.64 8.52 5.61 18.20 29.50 46.00
3.23 88,25 87,30 4.00 4.00 1,00 0,71 3.47 3.43 2.77 21.60 64.50 86.00
3.99 105.56 86.74 5,30 2,70 1,96 0,76 6.40 5.20 6.17 22.50 63.00 77.80
4.37 102.34 80.18 3,20 1,80 1,77 0,85 5.05 4.97 5.42 35.30 57.00 78.00
2.67 68.11 65.12 1,70 1,30 1,38 0,91 3.97 3.95 4.11 32.40 58.80 82.40
4.75 103.71 73.08 4,60 3,60 1,21 0,71 6.34 5.29 6.04 18.85 47.50 72.20
3.19 88.12 85.07 3,20 1,80 1,77 0,76 5.08 4.85 5.16 36.20 83.40 93.00
3.29 102.17 92.68 3,80 2,40 1,58 0,50 8.21 6,90 10.60 21.60 28.10 66.70
2.87 95.03 95.67 3,00 3,00 1,00 0,75 6.24 5.99 7.50 27.00 46.70 68.30
V_ m50y V_ p50¼flujos espiratorios forzados máximos y parciales al 50 por ciento de la FVC de control; Relación M=P¼relación de V_ m50a V_p50en control; Pendiente MP
= pendiente de la regresión de decrementos porcentuales de V_ m50y V_ p50registrado durante el desafío de inhalación de MCh; PD15VEF1¼dosis de MCh que
disminuyó el FEV1por el 15 por ciento del control; PD40Vm50y PD40V_p50¼dosis de MCh que disminuyeron V_ m50y vicepresidente50en un 40 por ciento de control
respectivamente; % de disminución máxima = porcentaje de disminución máxima en la meseta. Fuente: Datos proporcionados por cortesía del Dr. Riccardo Pellegrino.
18El propósito de un estudio de O'Brien et al. (A-13) fue para evaluar la función del eje hipotálamo-pituitario-suprarrenal
(HPA) (que se sabe que está alterada en la depresión) en pacientes con enfermedad de Alzheimer (EA)
mediante la prueba de la hormona adrenocorticotrófica (ACTH), que evalúa la función suprarrenal midiendo la
producción de cortisol por parte de la glándula suprarrenal en respuesta a una inyección de ACTH. Los sujetos con AD
(edad media de 69,9 años con una desviación estándar de 9,8) se reclutaron a partir de referencias a una clínica de
memoria del hospital. Los sujetos de control normales consistían en cónyuges de pacientes y residentes de un
albergue de retiro (edad media 73,8 con desviación estándar de 11,6). Había ocho hombres y ocho mujeres en el
grupo AD y 10 hombres y ocho mujeres en el grupo de control. Entre los datos recopilados se encuentran las
siguientes observaciones sobre la edad (C1), la edad de inicio de los sujetos con EA (C2), la duración de la historia de
la enfermedad en meses (C3), la puntuación del examen cognitivo (C4), el nivel máximo de cortisol (C5) y respuesta
hormonal total (C6):
PREGUNTAS DE REPASO Y EJERCICIOS 533
¼No aplica.
Fuente: Datos proporcionados por cortesía del Dr. John T. O'Brien.
19Johnson et al. (A-14) tenga en cuenta que la capacidad de identificar la fuente de información recordada es una
función cognitiva fundamental. Realizaron un experimento para explorar la contribución relativa de las
señales perceptivas y la información de las operaciones cognitivas a los déficits relacionados con la edad en
la discriminación de recuerdos de diferentes fuentes externas (supervisión de fuentes externas). Los sujetos
del experimento incluyeron 96 estudiantes de posgrado y pregrado (41 hombres y 55 mujeres) con edades
comprendidas entre los 18 y los 27 años. Entre los datos recopilados se encuentran los siguientes puntajes
de reconocimiento de desempeño en condiciones de monitoreo de fuente (C1, C2, C3) y puntajes en la
Prueba de reconocimiento facial de Benton (C4), la Escala de inteligencia para adultos de Wechsler—Revisada
(WAIS-R), Bloque WAIS-R Subescala de diseño (C5), Subescala de vocabulario WAIS-R (C6), Prueba de fluidez
verbal de Benton (C7),
C1 C2 C3 C4 C5 C6 C7 C8
C1 C2 C3 C4 C5 C6 C7 C8
0.792 3.15 0.884 50
0.680 4.07 0.962 56
0.731 4.64 1.000 23 30 59 47 3
0.826 1.84 0.616 52
0.609 2.98 0.846 56
0.923 4.64 1.000 53
0.773 3.36 0.846 60
0.714 1.62 0.577 23 43 53 42 6
0.667 3.72 0.923 20 32 59 28 6
0.769 1.40 0.423 51
0.565 3.55 0.885 45
0.824 1.78 0.577 45
0.458 1.90 0.615 21 46 50 47 6
0.840 4.07 0.962 59
0.720 4.07 0.962 53
0.917 3.72 0.923 24 31 43 37 6
0.560 4.07 0.926 62
0.840 4.07 0.962 26 22 50 40 6
0.720 4.07 0.962 52
0.783 1.74 0.577 54
0.696 1.62 0.539 57
0.625 3.72 0.923 22 37 55 40 6
0.737 1.12 0.423 47
0.900 1.92 0.654 22 40 46 42 6
0.565 3.55 0.885 22 43 56 64 6
0.680 4.07 0.962 54
0.760 4.07 0.962 58
0.958 1.90 0.615 24 36 46 43 6
0.652 2.98 0.846 54
0.560 4.07 0.962 56
0.500 1.92 0.654 24 42 45 46 6
0.826 2.63 0.808 60
0.783 2.58 0.808 60
0.783 2.63 0.808 49
0.750 2.14 0.692 22 37 62 58 6
0.913 2.11 0.693 46
0.952 1.49 0.539 26 32 48 36 6
0.800 4.07 0.962 59
0.870 3.55 0.885 48
0.652 1.97 0.654 59
0.640 4.07 0.962 25 36 56 54 6
0.692 4.64 1.000 23 23 58 25 6
0.917 3.72 0.923 55
0.760 4.07 0.962 22 35 52 33 6
0.739 3.55 0.885 24 43 58 43 6
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 535
C1 C2 C3 C4 C5 C6 C7 C8
0.857 3.20 0.808 59
0.727 3.36 0.846 61
0.833 2.80 0.846 56
0.840 4.07 0.962 21 11 49 58 3
0.478 2.27 0.731 60
0.920 4.07 0.962 24 40 64 50 6
0.731 4.64 1.000 20 40 51 50 6
0.920 4.07 0.962 23 50 61 53 6
0.720 4.07 0.962 57
1.000 2.79 0.807 25 47 56 30 6
0.708 3.72 0.923 24 dieciséis 57 42 6
1.000 4.64 1.000 25 48 55 54 6
0.739 3.55 0.885 23 27 57 38 6
0.600 4.20 0.962 22 38 57 33 6
0.962 4.64 1.000 25 37 63 31 6
0.772 2.22 0.731 24 48 51 41 6
0.800 2.92 0.847 24 28 47 45 6
0.923 4.64 1.000 25 45 54 48 6
0.870 3.50 0.885 24 44 54 48 5
0.808 4.64 1.000 24 43 57 58 6
1.000 4.07 0.962 25 30 59 49 6
0.870 3.55 0.885 26 44 61 35 6
0.923 4.64 1.000 52
0.958 2.58 0.808 27 32 52 33 6
0.826 3.50 0.885 21 31 61 44 6
0.962 3.72 0.923 23 31 57 38 6
0.783 3.50 0.885 23 46 60 36 6
0.905 3.20 0.808 23 34 55 37 4
1.000 4.64 1.000 23 33 57 33 6
0.875 3.72 0.923 21 34 55 29 6
0.885 4.07 0.962 52
0.913 2.92 0.846 23 44 57 47 6
0.962 4.07 0.961 24 36 54 43 6
0.682 3.36 0.846 20 41 61 34 1
0.810 2.63 0.769 20 40 57 43 6
0.720 2.79 0.808 25 23 64 43 3
0.875 2.80 0.846 24 43 59 43 2
0.923 3.72 0.924 25 40 58 33 6
0.909 3.36 0.846 24 43 56 41 6
0.920 4.07 0.962 24 50 52 28 6
1.000 3.72 0.923 21 45 64 46 6
0.609 3.50 0.885 22 25 49 35 6
¼Datos perdidos.
Fuente: Datos proporcionados por cortesía de la Dra. Doreen M. De Leonardis.
536 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
Ejercicios para usar con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.Winters et al. (A-15) realizó un estudio con 248 estudiantes de secundaria matriculados en cursos de introducción a
la educación física. Los investigadores querían saber si los constructos de la teoría cognitiva social estaban
correlacionados con el ejercicio físico discrecional en el "tiempo libre". La principal variable de resultado es
STREN, que es la cantidad de días en una semana que un estudiante de secundaria realizó actividad física
extenuante (definida operativamente como ejercicio que resulta en sudoración, dificultad para respirar y
frecuencia cardíaca rápida). Los estudiantes del estudio completaron extensos cuestionarios de los que se
derivaron las siguientes variables:
SELFR100: mide la regulación personal del comportamiento dirigido a objetivos (los valores más altos indican
más orientado a objetivos).
SS100: mide el apoyo social, el estímulo social y la expectativa social que son
proporcionado por amigos y familiares para el ejercicio físico (los valores más altos indican más apoyo).
SSE100: mide la capacidad percibida para superar las barreras al ejercicio (los valores más altos indican
mayor capacidad).
OEVNORM: mide las expectativas de resultados y sus expectativas asociadas de
ejercicio (los valores más altos indican vínculos percibidos más fuertes con los resultados deseados del ejercicio).
2.Con datos obtenidos de una base de datos nacional sobre el parto, Matulavich et al. (A-16) examinó el
número de cursos de esteroides prescritos que tomó una madre durante el embarazo (ESTEROIDES). El
tamaño del bebé se midió por longitud (cm), peso (gramos) y circunferencia de la cabeza (cm). Calcule la
correlación del número de cursos de esteroides con cada una de las tres variables de resultado. ¿Cuáles
son las hipótesis para sus pruebas? ¿Cuáles son lospag-¿valores? ¿Cuáles son tus conclusiones? (El
nombre del conjunto de datos es STERLENGTH.)
3.Consulte los datos sobre factores de riesgo cardiovascular (RISKFACT). Los sujetos son 1000 hombres que
se dedican a ocupaciones sedentarias. Desea estudiar las relaciones entre los factores de riesgo en esta
población. las variables son
Y¼consumo de oxigeno
X1¼presión arterial sistólicadmilímetro
hectogramoÞ X2¼colesterol totaldmg=dlÞ X
3¼Colesterol HDLdmg=dlÞ X4¼triglicéridosd
mg=dlÞ
Seleccione una muestra aleatoria simple de esta población y realice un análisis estadístico
apropiado. Prepara un informe narrativo de tus hallazgos y compáralos con los de tus
compañeros. Consulte con su instructor sobre el tamaño de la muestra.
REFERENCIAS 537
4.Consulte los datos de 500 pacientes que han buscado tratamiento para el alivio de los síntomas de enfermedades
respiratorias (RESPDIS). Un equipo de investigación médica está realizando un estudio para determinar qué factores
pueden estar relacionados con las enfermedades respiratorias. La variable dependienteYes una medida de la gravedad de
la enfermedad. Un valor mayor indica una condición más grave. Las variables independientes son las siguientes:
Seleccione una muestra aleatoria simple de sujetos de esta población y realice un análisis estadístico que
considere valioso para el equipo de investigación. Prepare un informe narrativo de sus resultados y
conclusiones. Utilice ilustraciones gráficas cuando corresponda. Compara tus resultados con los de tus
compañeros. Consulte a su instructor sobre el tamaño de la muestra que debe seleccionar.
REFERENCIAS
Referencias de metodología
1. gEORGEWSNEDECORy WILLIAMGCOCRAN,Métodos de estadística,Sexta edición, Iowa State University Press,
Ames, 1967.
2. ROBERTOGD STEELy jAMÉSHTORRIE,Principios y procedimientos de estadísticas,McGraw-Hill, Nueva York, 1960.
3. RL ANDERSONy TA BANCROFT,Teoría Estadística en la Investigación,McGraw-Hill, Nueva York, 1952.
4. MH KUTNER, CJNACTSHEIM, J. N.ETERy W. L.I,Modelos estadísticos lineales aplicados,Quinta edición, McGraw-Hill/
Irwin, Nueva York, 2005.
Aplicaciones Referencias
A-1. DEBRAAJANSENy MARIOLkELLER, “Función cognitiva en mujeres ancianas que viven en la comunidad”,Revista de
Enfermería Gerontológica, 29 (2003), 34–43.
A-2. MNAEIJE, “Factores Antropométricos y Cinemáticos Locales Relacionados con la Apertura Máxima de la Boca en
Individuos Sanos,”Revista de Rehabilitación Oral, 29 (2002), 534–539.
A-3. GRAMOWisconsin-RYUNGSEN, mSÍL. W.YKLEy J.ACLENEAZAUSZNIEWSKI, “Cuidadores de niños adultos coreanos de adultos
mayores con demencia”,Revista de Enfermería Gerontológica, 29 (2003), 19–28.
A-4. X. W.ESP, X.SGALLINA, X.LI, y C. M.AULIAGRAWAL, “Cambios relacionados con la edad en la red de colágeno y dureza del
hueso,”Hueso, 31 (2002), 1–7.
A-5. PAGETERA.ANTON, RONALDTMITSUYASU, STEVENG DEEKS, DÁVIDOT. S.CADÉN, BRIDGETWAGNER, CCRISTINAHUANG, CATERINA
METROACKEN, DOUGLASDRICHMAN, CINDIACHRISTOPHERSON, FLAVIABORELLINI, RICHARDLAzary kRISTEN
MHEGE, "Múltiples medidas de la carga del VIH en la sangre y los tejidos están correlacionadas entre sí, pero no con el
parámetro clínico en sujetos avirémicos",SIDA, 17 (2003), 53–63.
A-6. OLGAkDESPERDICIO-RABÉN, ROLFLIBELIUS, y HañoHEIKKILA €, “Potenciales evocados somatosensoriales tras
Estimulación de los Nervios Digitales,”Músculo y nervio, 26 (2002), 533–538.
A-7. METROITSUOHASHIMOTO, TAIKIFUKUDA, TETSUYASHIMIZU, SHOUWATANABE, SATOSHIWATANUKI, YOSHIKATSUmiA, y
METROITSUYOSHItuRASHIMA, “Influencia de los factores climáticos en las visitas de emergencia para el ataque de asma infantil”,
Pediatría Internacional, 46 (2004), 48–52.
A-8. PAGETERSTENVINKEL, ALICIAMETROARCHELEWSKA, ROBERTOPAGECOITS-FOIT, ohLOFHEIMBU €RGER, ZHENGZHONGZCOLGAR,
CATERINAHAPAGADO, CELEVACIÓNHOLMES, jOANASAXELSSON, SIVONNEArvidsson, mARTINSDESAFÍO, PAGETERBARANY, BENGT
LTINTO, y yoOuisenorteÓRDENES, "Adiponectina en la enfermedad renal: relación con el fenotipo y la variación genética en
la codificación genética de la adiponectina",Riñón Internacional, 65 (2004), 274–281.
538 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN
A-9. R. V.UNSCHUYLENBERGH, BVANDÉNmiYNDE, y P. H.ESPEL, “Predicción del rendimiento del triatlón Sprint a partir de pruebas de
laboratorio”,Revista Europea de Fisiología Aplicada, 91 (2004), 94–99.
A-10. WALDEMARTOMALAK, ANDRZEJPAGOGORZELSKIy J.AROSLAWPAGRUSAK, “Valores normales para estática máxima
Presiones inspiratorias y espiratorias en niños sanos”,Neumología pediátrica, 34 (2002), 42–46.
A-11. METROARCODIMETROONACO, FULVIAVALLERO, ROBERTODIMETROONACO, FULVIOMETROAUTINO, y ALBERTOCAVANA, "Total
Recuento de linfocitos y densidad mineral del hueso femoral en mujeres posmenopáusicas”,Revista de metabolismo
mineral óseo, 22 (2004), 58–63.
A-12. RICCARDOPAGELLEGRINO, BENEDETTOVIOLANTE, y VITOBRUSASCO, "Broncoconstricción máxima en humanos: relación con la
inhalación profunda y la sensibilidad de las vías respiratorias"American Journal of Respiratory and Critical Care
Medicine, 153 (1996), 115-121.
A-13. JT O'BRIEN, D. A.MES, ESCHWEITZER, M. M.ASTWYK, y P. C.OLMAN, "La sensibilidad suprarrenal mejorada a la hormona
adrenocorticotrófica (ACTH) es evidencia de hiperactividad del eje HPA en la enfermedad de Alzheimer"
Medicina Psicológica, 26 (1996), 7–14.
A-14. METROARCIAK. J.OHNSON, DOREENMDmiLEONARDIS, SHAHINHARSHTROUDI, y SEstados UnidosA. F.ERGUSON, “Envejecimiento y Soltería
Contra Múltiples Señales en Monitoreo de Fuente,”Psicología y Envejecimiento, 10 (1995), 507–517.
A-15. miRICR. W.INTERÉS, RICKLPETOSA, y THOMASECHARLETON, "Uso de la teoría cognitiva social para explicar el ejercicio
físico discrecional en el 'tiempo libre' entre los estudiantes de secundaria",Diario de Salud Adolescente, 32 (
2003), 436–442.
A-16. ANELAMETROATULAVICH, DONNAMETROILES-CURRY, BARBARAWArner, BOBBAGRAMORAYO, y el Instituto Nacional de Desarrollo Infantil y
Salud. Datos analizados en el Centro de Consultoría Estadística de la Universidad Estatal de Wright.
CAPÍTULO 11
ANÁLISIS DE REGRESIÓN:
ALGUNAS TÉCNICAS ADICIONALES
TEMAS
11.1INTRODUCCIÓN
11.2VARIABLES CUALITATIVAS INDEPENDIENTES
11.3PROCEDIMIENTOS DE SELECCIÓN DE VARIABLES
11.4REGRESIÓN LOGÍSTICA
11.5RESUMEN
539
540 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
11.1 INTRODUCCIÓN
Los conceptos básicos y la metodología del análisis de regresión lineal se cubren en los Capítulos 9 y
10. En el Capítulo 9 analizamos la situación en la que el objetivo es obtener una ecuación que se
pueda usar para hacer predicciones y estimaciones sobre alguna variable dependiente a partir del
conocimiento de algunas variables. otra variable única que llamamos variable independiente,
predictora o explicativa. En el Capítulo 10, las ideas y técnicas aprendidas en el Capítulo 9 se amplían
para cubrir la situación en la que se cree que la inclusión de información sobre dos o más variables
independientes producirá una mejor ecuación para hacer predicciones y estimaciones. El análisis de
regresión es una herramienta estadística compleja y poderosa que se emplea ampliamente en la
investigación en ciencias de la salud. Para hacer justicia al tema se requiere más espacio del que está
disponible en un libro de texto de introducción a la estadística. Sin embargo, para el beneficio de
aquellos que deseen una cobertura adicional del análisis de regresión, presentamos en este capítulo
algunos temas adicionales que deberían resultar útiles para el estudiante y el profesional de la
estadística.
Datos no normalesMuchas veces, los datos que se utilizan para construir un modelo de regresión no se
distribuyen normalmente. Uno puede desear explorar la posibilidad de que algunos de los puntos de datos
observados sean valores atípicos o que afecten de manera desproporcionada la distribución de los datos. Tal
investigación puede llevarse a cabo de manera informal mediante la construcción de un diagrama de
dispersión y la búsqueda de observaciones que no parecen encajar con las demás. Alternativamente, muchos
paquetes de computadora producen pruebas formales para evaluar posibles observaciones atípicas en la
variable dependiente o en las variables independientes. Sin embargo, siempre depende del investigador
justificar qué observaciones se eliminarán del conjunto de datos antes del análisis.
A menudo, uno puede desear intentar una transformación de los datos. Las transformaciones
matemáticas son útiles porque no afectan las relaciones subyacentes entre las variables. Dado que las
pruebas de hipótesis para los coeficientes de regresión se basan en estadísticas de distribución
normal, las transformaciones de datos a veces pueden normalizar los datos en la medida necesaria
para realizar dichas pruebas. Las transformaciones simples, como sacar la raíz cuadrada de las
medidas o sacar el logaritmo de las medidas, son bastante comunes.
EJEMPLO 11.1.1
Los investigadores estaban interesados en las concentraciones en sangre de delta-9-tetrahidrocannabinol
(D-9-THC), el componente psicotrópico activo de la marihuana, de 25 sujetos de investigación. Estos datos se
presentan en la Tabla 11.1.1, al igual que estos mismos datos después de usar un registro10
transformación.
11.1 INTRODUCCIÓN 541
1 . 30 - . 52
2 2.75 . 44
3 2.27 . 36
4 2.37 . 37
5 1.12 . 05
6 . 60 - . 22
7 . 61 - . 21
8 . 89 - . 05
9 . 33 - . 48
10 . 85 - . 07
11 2.18 . 34
12 3.59 . 56
13 . 28 - . 55
14 1.90 . 28
15 1.71 . 23
dieciséis . 85 - . 07
17 1.53 . 18
18 2.25 . 35
19 . 88 - . 05
20 . 49 - . 31
21 4.35 . 64
22 . 67 - . 17
23 2.74 . 44
24 . 79 - . 10
25 6.94 . 84
Los diagramas de caja y bigotes del software SPSS para estos datos se muestran en la Figura 11.1.1. Los
datos sin procesar están claramente sesgados y se identifica un valor atípico (observación 25). Un registro10La
transformación, que a menudo es útil para tales datos sesgados, elimina la magnitud del valor atípico y da
como resultado una distribución que es mucho más simétrica con respecto a la mediana. Por lo tanto, los
datos transformados podrían usarse en lugar de los datos sin procesar para construir el modelo de
regresión. Aunque los datos simétricos no necesariamente implican que los datos sean normales, dan como
resultado un modelo más apropiado. Las pruebas formales de normalidad, como se mencionó
anteriormente, siempre deben realizarse antes del análisis. &
Varianzas de error desigualesCuando las varianzas de los términos de error no son iguales, podemos obtener
una ecuación satisfactoria para el modelo, pero, debido a que se viola el supuesto de que las varianzas de
error son iguales, no podremos realizar pruebas de hipótesis apropiadas sobre los coeficientes del modelo.
Tal como sucedió al superar el problema de la no normalidad, las transformaciones de las variables de
regresión pueden reducir el impacto de las varianzas de error desiguales.
542 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
EJEMPLO 11.1.2
Un estudio sobre la obesidad y el síndrome metabólico utilizó datos recopilados de 15 estudiantes e
incluyó la presión arterial sistólica (PAS), el peso y el IMC. Estos datos se presentan en la Tabla 11.1.2.
PAS Peso
Peso 0.289
valor p 0.296
FIGURA 11.1.2Correlaciones calculadas en el software MINITAB para los datos del Ejemplo 11.1.2.
&
DEFINICIÓN
Avariable ficticiaes una variable que asume solo un número finito de
valores (como 0 o 1) con el propósito de identificar las diferentes
categorías de una variable cualitativa.
El término “dummy” se utiliza para indicar el hecho de que los valores numéricos (como 0
y 1) asumidos por la variable no tienen un significado cuantitativo sino que se utilizan
simplemente para identificar diferentes categorías de la variable cualitativa en consideración.
Las variables cualitativas a veces se denominanindicadorvariables, y cuando hay sólo dos
categorías, a veces se les llamadicotómicovariables
Los siguientes son algunos ejemplos de variables cualitativas y las variables ficticias utilizadas
para cuantificarlas:
Nótese en estos ejemplos que cuando la variable cualitativa tienekcategorías,k-Se deben definir
1 variables ficticias para que todas las categorías se codifiquen correctamente. Esta regla se aplica a
cualquier regresión múltiple que contenga una constante de intersección. La variable sexo, con dos
categorías, se puede cuantificar mediante el uso de una sola variable ficticia, mientras que se
requieren tres variables ficticias para cuantificar la variable tabaquismo, que tiene cuatro categorías.
Los siguientes ejemplos ilustran algunos de los usos de las variables cualitativas en la
regresión múltiple. En el primer ejemplo suponemos que no hay interacción entre las variables
independientes. Dado que la suposición de que no hay interacción no es realista en muchos
casos, ilustramos, en el segundo ejemplo, el análisis que es apropiado cuando se tiene en
cuenta la interacción entre variables.
EJEMPLO 11.2.1
En un estudio de factores que se cree que están asociados con el peso al nacer, se seleccionó una
muestra aleatoria simple de 100 actas de nacimiento del Registro de nacimientos de Carolina del
Norte de 2001 (A-1). La Tabla 11.2.1 muestra, para tres variables, los datos extraídos de cada registro.
Hay dos variables independientes: la duración de la gestación (semanas), que es cuantitativa, y el
tabaquismo de la madre (tabaquismo), una variable cualitativa. La variable dependiente es el peso al
nacer (gramos).
TABLA 11.2.1 Datos de una muestra aleatoria simple de 100 nacimientos del Registro de
nacimientos de Carolina del Norte, ejemplo 11.2.1
1 3147 40 0 51 3232 38 0
2 2977 41 0 52 3317 40 0
3 3119 38 0 53 2863 37 0
4 3487 38 0 54 3175 37 0
5 4111 39 0 55 3317 40 0
6 3572 41 0 56 3714 34 0
7 3487 40 0 57 2240 36 0
8 3147 41 0 58 3345 39 0
9 3345 38 1 59 3119 39 0
10 2665 34 0 60 2920 37 0
11 1559 34 0 61 3430 41 0
12 3799 38 0 62 3232 35 0
13 2750 38 0 63 3430 38 0
14 3487 40 0 64 4139 39 0
15 3317 38 0 sesenta y cinco 3714 39 0
dieciséis 3544 43 1 66 1446 28 1
17 3459 45 0 67 3147 39 1
18 2807 37 0 68 2580 31 0
19 3856 40 0 69 3374 37 0
20 3260 40 0 70 3941 40 0
(Continuación)
546 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
21 2183 42 1 71 2070 37 0
22 3204 38 0 72 3345 40 0
23 3005 36 0 73 3600 40 0
24 3090 40 1 74 3232 41 0
25 3430 39 0 75 3657 38 1
26 3119 40 0 76 3487 39 0
27 3912 39 0 77 2948 38 0
28 3572 40 0 78 2722 40 0
29 3884 41 0 79 3771 40 0
30 3090 38 0 80 3799 45 0
31 2977 42 0 81 1871 33 0
32 3799 37 0 82 3260 39 0
33 4054 40 0 83 3969 38 0
34 3430 38 1 84 3771 40 0
35 3459 41 0 85 3600 40 0
36 3827 39 0 86 2693 35 1
37 3147 44 1 87 3062 45 0
38 3289 38 0 88 2693 36 0
39 3629 36 0 89 3033 41 0
40 3657 36 0 90 3856 42 0
41 3175 41 1 91 4111 40 0
42 3232 43 1 92 3799 39 0
43 3175 36 0 93 3147 38 0
44 3657 40 1 94 2920 36 0
45 3600 39 0 95 4054 40 0
46 3572 40 0 96 2296 36 0
47 709 25 0 97 3402 38 0
48 624 25 0 98 1871 33 1
49 2778 36 0 99 4167 41 0
50 3572 35 0 100 3402 37 1
Fuente: John P. Holcomb, muestra y codificado de los datos del Registro de Nacimiento de Carolina del Norte encontrados enwww.irss.unc.
edu/ ncvital/ bfd1down.html.
Solución: Para el análisis cuantificamos el tabaquismo mediante una variable ficticia que se
codifica como 1 si la madre es fumadora y 0 si no fuma. Los datos de la Tabla 11.2.1 se
representan como un diagrama de dispersión en la Figura 11.2.1. El diagrama de
dispersión sugiere que, en general, los períodos más largos de gestación se asocian
con pesos al nacer más altos.
Para obtener información adicional sobre la naturaleza de estos datos,
podemos ingresarlos en una computadora y emplear un programa apropiado para
realizar análisis adicionales. Por ejemplo, introducimos las observacionesy1¼3147,X11¼
40,X21¼0, para el primer caso;Y2¼2977,X12¼41,X22¼0 para el segundo caso; etcétera. La
figura 11.2.2 muestra la salida de la computadora obtenida con el uso del programa de
regresión múltiple MINITAB.
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 547
5000
4000
2000
1000
0
25 30 35 40 45 50
Duración de la gestación (semanas)
FIGURA 11.2.1 Pesos al nacer y duración de la gestación para 100 nacimientos: (~) tabaquismo y ( )
madres no fumadoras.
La ecuación de regresión es
Análisis de variación
FUENTE DF SS EM F PAG
Regresión 2 19689185 9844593 41.92 0.000
error residual 97 22781681 234863
Total 99 42470867
FUENTE DF SS de secuencia
x1 1 18585166
x2 1 1104020
ŷj¼ b̂0þb̂1X1jþb̂2X2j
(11.2.1)
ŷj¼ -1724:4þ130:05X1j-294:4X2j
Para observar el efecto sobre esta ecuación cuando deseamos considerar sólo los
nacimientos de madres fumadoras, dejamosX2j¼1. La ecuación entonces se convierte en
ŷj¼ -1724:4þ130:05X1j-294:4d1Þ
(11.2.2)
¼ -2018:8þ130:05X1j
que tiene uny-intercepto de -2018.8 y una pendiente de 130. Tenga en cuenta que ely-
el intercepto para la nueva ecuación es igual a (b̂0þ b̂1)¼ [-1724.4þ (-294.4)]¼-2018.
Ahora consideremos sólo los nacimientos de madres no fumadoras. cuando dejamos
X2¼0, nuestra ecuación de regresión se reduce a
ŷj¼ -1724:4þ130:05X1j-294d0Þ
(11.2.3)
¼ -1724:4þ130:05X1j
5000
4000
De fumar
madres
Peso al nacer (gramos)
De no fumadores
3000
madres
2000
1000
0
25 30 35 40 45 50
Duración de la gestación (semanas)
FIGURA 11.2.3 Pesos al nacer y duración de la gestación para 100 nacimientos y la regresión ajustada
líneas: (~) fumar y ( ) madres no fumadoras.
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 549
las madres que no fuman pesaron, en promedio, más que los bebés nacidos de
madres que fuman, cuando se toma en cuenta la duración de la gestación. La cantidad
de la diferencia, en promedio, es de 294 gramos. Dicho de otra manera, podemos
decir que para esta muestra, los bebés nacidos de madres fumadoras pesaron, en
promedio, 294 gramos menos que los bebés nacidos de madres no fumadoras,
cuando se toma en cuenta el tiempo de gestación. La figura 11.2.3 muestra el
diagrama de dispersión de los datos originales junto con un gráfico de las dos líneas
de regresión (ecuaciones 11.2.2 y 11.2.3). &
EJEMPLO 11.2.2
En este punto surge una pregunta con respecto a qué inferencias podemos hacer sobre la población
muestreada sobre la base de los resultados muestrales obtenidos en el Ejemplo 11.2.1. En primer
lugar, deseamos saber si la diferencia de muestra de 294 gramos es significativa. En otras palabras,
¿fumar tiene un efecto sobre el peso al nacer? Podemos responder a esta pregunta a través del
siguiente procedimiento de prueba de hipótesis.
Solución:
La estimación puntual de la diferencia promedio en los pesos al nacer, cuando se tiene en cuenta la duración
de la gestación, es de 294 gramos a favor de los bebés nacidos de madres que no fuman. Podemos obtener
una estimación de intervalo de la cantidad media de la diferencia usando información de la impresión de la
computadora por medio de la siguiente expresión:
b2 tb2
- 294:4 1:9848d135:8Þ
ð-563:9; -24:9Þ
Por lo tanto, estamos seguros en un 95 % de que la diferencia está entre 564 gramos y 25
gramos.
yj¼b0þb1X1jþb2X2jþb3X3jþb4X1jX2jþb5X1jX3jþmij (11.2.4)
Las tres ecuaciones de regresión muestral para los tres niveles de la variable cualitativa, entonces, son
las siguientes:
Nivel 1dX2¼1;X3¼0Þ
ŷj¼ b̂0þb̂1X1jþb̂2d1Þþb̂3d0Þþb̂X 4 1jd1Þ þb^
5X1jd0Þ
Nivel 2dX2¼0;X3¼1Þ
ŷj¼b ^ 0þb̂1X1jþb̂2d0Þþb̂ 3d1Þ þb^
4X1jd0Þþb̂5X1jd1Þ
Nivel 3dX2¼0;X3¼0Þ
ŷj¼b ^ 0þb̂ 1X1jþb2^d0Þþb̂3d0Þþb̂4X1jd0Þþb̂5X1jd0Þ
(11.2.7)
¼ b̂0þb̂1X1j
EJEMPLO 11.2.3
Un equipo de investigadores de salud mental desea comparar tres métodos (A, B y C) para tratar la
depresión severa. También les gustaría estudiar la relación entre la edad y la eficacia del tratamiento,
así como la interacción (si la hay) entre la edad y el tratamiento. Cada miembro de una muestra
aleatoria simple de 36 pacientes, comparable con respecto al diagnóstico y la gravedad de la
depresión, se asignó al azar para recibir el tratamiento A, B o C. Los resultados se muestran en la
Tabla 11.2.2. La variable dependienteYes la efectividad del tratamiento, la variable independiente
cuantitativaX1es la edad del paciente en el cumpleaños más cercano, y la variable independiente tipo
de tratamiento es una variable cualitativa que ocurre en tres niveles. La siguiente codificación de
variable ficticia se utiliza para cuantificar la variable cualitativa:
-
1 para el tratamiento A
X2¼
0 de lo contrario
-
1 para el tratamiento B 0
X3¼
en caso contrario
El diagrama de dispersión para estos datos se muestra en la Figura 11.2.4. La Tabla 11.2.3 muestra los
datos tal como fueron ingresados en una computadora para su análisis. La figura 11.2.5 contiene la
impresión del análisis utilizando el programa de regresión múltiple MINITAB.
56 21 A
41 23 B
40 30 B
28 19 C
55 28 A
25 23 C
46 33 B
71 67 C
48 42 B
63 33 A
52 33 A
62 56 C
50 45 C
45 43 B
58 38 A
46 37 C
58 43 B
34 27 C
sesenta y cinco 43 A
55 45 B
57 48 B
59 47 C
64 48 A
61 53 A
62 58 B
36 29 C
69 53 A
47 29 B
73 58 A
64 66 B
60 67 B
62 63 A
71 59 C
62 51 C
70 67 A
71 63 C
Las tres ecuaciones de regresión para los tres tratamientos son las siguientes:
80
75
70
sesenta y cinco
60
15 20 25 30 35 40 45 50 55 60 65 70 75 80
Edad
FIGURA 11.2.4Diagrama de dispersión de datos para el Ejemplo 11.2.3: ( ) tratamiento A, (~) tratamiento B,
(&)tratamiento c
Procedimientos de inferencia
Las relaciones que vemos en la Figura 11.2.6, sin embargo, son resultados de muestra. ¿Qué podemos
concluir acerca de la población de la que se extrajo la muestra?
Para obtener una respuesta, echemos un vistazo a latproporciones en la copia impresa de la computadora en la figura 11.2.5.
bi-0
t¼
sbi
554 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
TABLA 11.2.3 Datos para el ejemplo 11.2.3 Codificados para análisis por computadora
Y X1 X2 X3 X1X2 X1X3
56 21 1 0 21 0
55 28 1 0 28 0
63 33 1 0 33 0
52 33 1 0 33 0
58 38 1 0 38 0
sesenta y cinco 43 1 0 43 0
64 48 1 0 48 0
61 53 1 0 53 0
69 53 1 0 53 0
73 58 1 0 58 0
62 63 1 0 63 0
70 67 1 0 67 0
41 23 0 1 0 23
40 30 0 1 0 30
46 33 0 1 0 33
48 42 0 1 0 42
45 43 0 1 0 43
58 43 0 1 0 43
55 45 0 1 0 45
57 48 0 1 0 48
62 58 0 1 0 58
47 29 0 1 0 29
64 66 0 1 0 66
60 67 0 1 0 67
28 19 0 0 0 0
25 23 0 0 0 0
71 67 0 0 0 0
62 56 0 0 0 0
50 45 0 0 0 0
46 37 0 0 0 0
34 27 0 0 0 0
59 47 0 0 0 0
36 29 0 0 0 0
71 59 0 0 0 0
62 51 0 0 0 0
71 63 0 0 0 0
para las pruebasH0:bi¼0. Vemos por la Ecuación 11.2.5 que ely-el intercepto de la línea de regresión
para el tratamiento A es igual ab̂0þb̂2. Desde eltrelación de 8,12 para la pruebaH0:b2¼0 es mayor que
el críticotde 2,0423 (paraa¼.05), podemos rechazarH0esob2¼0 y concluya que ely- El intercepto de la
línea de regresión de población para el tratamiento A es diferente dely-intercepto de la línea de
regresión de la población para el tratamiento C, que tiene unay-intercepción deb0. Similarmente,
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 555
La ecuación de regresión es
Análisis de variación
FUENTE DF SS EM F pag
Regresión 5 4932.85 986.57 64.04 0.000
Error 30 462.15 15.40
Total 35 5395.00
FUENTE DF SEC SS
x1 1 3424.43
x2 1 803.80
x3 1 1.19
x4 1 375.00
x5 1 328.42
80 Tratamiento C
75
Tratamiento A
70
Tratamiento B
sesenta y cinco
60
Eficacia del tratamiento
55
50
45
40
35
30
25
15 20 25 30 35 40 45 50 55 60 65 70 75 80
Edad
FIGURA 11.2.6Diagrama de dispersión de los datos del ejemplo 11.2.3 con las líneas de regresión ajustadas: )
(tratamiento A, (~) tratamiento B, (&) tratamiento C.
556 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
desde eltrelación de 4,46 para la pruebaH0:b3¼0 también es mayor que el críticotde 2.0423, podemos concluir
(en el nivel de significancia de .05) que ely-El intercepto de la línea de regresión de la población para el
tratamiento B también es diferente dely-intercepto de la línea de regresión de la población para el
tratamiento C. (Ver lay-intersección de la Ecuación 1l.2.6.)
Ahora consideremos las pendientes. Vemos por la Ecuación 11.2.5 que la pendiente de la línea
de regresión para el tratamiento A es igual a b̂1(la pendiente de la línea para el tratamiento C)þb̂4.
Desde eltrelación de -6.45 para pruebasH0:b4¼0 es menor que el críticotde -2.0423, podemos concluir
(pora¼.05) que las pendientes de las líneas de regresión poblacional para los tratamientos A y C son
diferentes. Del mismo modo, dado que el calculadotproporción para la pruebaH0:b5¼0 también es
menor que -2.0423, concluimos (paraa¼.05) que las líneas de regresión poblacional para los
tratamientos B y C tienen pendientes diferentes (ver la pendiente de la Ecuación 11.2.6). Por lo tanto,
concluimos que existe interacción entre la edad y el tipo de tratamiento. Esto se refleja en la falta de
paralelismo entre las líneas de regresión de la Figura 11.2.6. &
Otra pregunta de interés es la siguiente: ¿La pendiente de la línea de regresión poblacional para el
tratamiento A es diferente de la pendiente de la línea de regresión poblacional para el tratamiento B? Para
responder a esta pregunta se requieren técnicas computacionales más allá del alcance de este texto. Se
remite al lector interesado a libros dedicados específicamente al análisis de regresión.
En la Sección 10.4 se advirtió al lector que existen problemas al hacer inferencias múltiples a partir de
los mismos datos de muestra. Nuevamente, hay libros disponibles sobre análisis de regresión que se pueden
consultar para conocer los procedimientos que se deben seguir cuando se desean inferencias múltiples,
como las que se analizan en esta sección.
Hemos discutido solo dos situaciones en las que el uso de variables ficticias es apropiado.
Modelos más complejos que involucran el uso de una o más variables independientes
cualitativas en presencia de dos o más variables cuantitativas pueden ser apropiados en ciertas
circunstancias. Los modelos más complejos se analizan en los numerosos libros dedicados al
tema del análisis de regresión múltiple.
En este punto, puede ser evidente que existen muchas similitudes entre el uso de un modelo
de regresión lineal con variables ficticias y el enfoque ANOVA básico. En ambos casos, se intenta
modelar la relación entre las variables predictoras y una variable de resultado. En el caso de la
regresión lineal, generalmente estamos más interesados en la predicción, y en ANOVA,
generalmente estamos más interesados en comparar medias. Si el deseo es comparar las medias
usando la regresión, se podría desarrollar un modelo para predecir la respuesta media, digamos
metroi, en lugar de un resultado,yi. Modelar la respuesta media usando regresión con variables
ficticias es equivalente a ANOVA. Para el estudiante interesado, sugerimos el libro de Bowerman y
O'Connell (1), quienes brindan un ejemplo del uso de ambos enfoques para los mismos datos.
EJERCICIOS
(a)Dibuje un diagrama de dispersión de los datos usando diferentes símbolos para las diferentes variables categóricas.
11.2.1Para los sujetos que se someten a trasplantes de células madre, las células dendríticas (DC) son células presentadoras de antígenos que
son críticos para la generación de respuestas tumorales inmunológicas. Bolwell et al. (A-2) estudió las CD
linfoides en 44 sujetos que se sometieron a un trasplante autólogo de células madre. La variable de resultado
es la concentración de células DC2 medida por citometría de flujo. Una de las variables independientes es la
edad del sujeto (años), y la segunda variable independiente es el método de movilización. Durante la
quimioterapia, 11 sujetos recibieron movilizador del factor estimulante de colonias de granulocitos (G-CSF)
(metrog/kg/día) y 33 recibieron etopósido (2 g=m2). El movilizador es un tipo de célula progenitora sanguínea
que desencadena la formación de las células DC. Los resultados fueron los siguientes:
G-CSF etopósido
corriente continua Edad corriente continua Edad corriente continua Edad corriente continua Edad
11.2.2Según Pandey et al. (A-3) El carcinoma de vesícula biliar no es infrecuente. Uno de los principales factores de riesgo para
el cáncer de vesícula biliar es la colelitiasis, la presencia asintomática de cálculos en la vesícula biliar. Los
investigadores realizaron un estudio de casos y controles de 50 sujetos con cáncer de vesícula biliar y 50 sujetos con
colelitiasis. De interés fue la concentración de productos de peroxidación de lípidos en la bilis de la vesícula biliar, una
condición que puede dar lugar al cáncer de vesícula biliar. El producto de peroxidación lipídica melonaldehído (MDA,
metrog=mg) se usó para medir la peroxidación lipídica. Una de las variables independientes consideradas fue la
concentración de citocromo P-450 (CYTO, nmol/mg). Los investigadores utilizaron el estado de la enfermedad (cáncer
de vesícula biliar frente a colelitiasis) y la concentración de citocromo P-450 para predecir la MDA. Se recogieron los
siguientes datos.
11.2.3El propósito de un estudio de Krantz et al. (A-4) fue investigar los efectos relacionados con la dosis de metadona
en sujetos contorsades de pointes,una taquicardia ventricular polimórfica. En el estudio de 17 sujetos,
10 eran hombres (sexo¼0) y siete eran mujeres (sexo¼1). La variable de resultado es el intervalo QTc,
una medida del riesgo de arritmia. La otra variable independiente, además del sexo, fue la dosis de
metadona (mg/día). Las mediciones de estas variables para los 17 sujetos fueron las siguientes.
0 1000 600
0 550 625
0 97 560
1 90 585
1 85 590
1 126 500
0 300 700
0 110 570
1 sesenta y cinco 540
1 650 785
1 600 765
1 660 611
1 270 600
1 680 625
0 540 650
0 600 635
1 330 522
Fuente: Datos proporcionados por cortesía de Mori J. Krantz, MD
EJERCICIOS 559
11.2.4Consulte el Ejercicio 9.7.2, que describe la investigación de Reiss et al. (A-5), que recolectó muestras de 90
pacientes y midió el tiempo de tromboplastina parcial (aPTT) usando dos métodos diferentes: el ensayo de
punto de atención CoaguChek y el ensayo hospitalario de laboratorio estándar. Los sujetos también fueron
clasificados por su estado de medicación: 30 recibieron heparina sola, 30 recibieron heparina con warfarina,
y 30 recibiendo warfarina y enoxaparina. Los datos son los siguientes.
Utilice la regresión múltiple para predecir el TTPa del hospital a partir del nivel de TTPa de CoaguCheck, así como la
medicación recibida. ¿El conocimiento de la medicación es útil en la predicción? Dejara¼ :05 para todas las pruebas.
560 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
Los investigadores de ciencias de la salud que contemplan el uso del análisis de regresión múltiple para
investigar una pregunta generalmente encuentran que tienen una gran cantidad de variables para
seleccionar las variables independientes que se emplearán como predictores de la variable dependiente.
Dichos investigadores querrán incluir en su modelo tantas variables como sea posible para maximizar la
capacidad predictiva del modelo. Sin embargo, el investigador debe darse cuenta de que agregar otra
variable independiente a un conjunto de variables independientes siempre aumenta el coeficiente de
determinación.R2. Por lo tanto, las variables independientes no deben agregarse al modelo de manera
indiscriminada, sino solo por una buena razón. En la mayoría de las situaciones, por ejemplo, algunas
variables predictoras potenciales son más costosas que otras en términos de costos de recopilación de datos.
El investigador consciente de los costos, por lo tanto, no querrá incluir una variable costosa en un modelo a
menos que haya evidencia de que hace una contribución valiosa a la capacidad predictiva del modelo.
El investigador que desee utilizar el análisis de regresión múltiple de la manera más efectiva
debe ser capaz de emplear alguna estrategia para hacer selecciones inteligentes entre las posibles
variables de predicción disponibles. Muchas de estas estrategias están en uso actualmente, y cada
una tiene sus defensores. Las estrategias varían en términos de complejidad y el tedio que implica su
empleo. Desafortunadamente, las estrategias no siempre conducen a la misma solución cuando se
aplican al mismo problema.
Regresión por pasosQuizás la estrategia más utilizada para seleccionar variables independientes
para un modelo de regresión múltiple es el procedimiento paso a paso. El procedimiento consta de
una serie de pasos. En cada paso del procedimiento, se evalúa cada variable en el modelo para ver si,
de acuerdo con los criterios especificados, debe permanecer en el modelo.
Supongamos, por ejemplo, que deseamos realizar una regresión por pasos para un
modelo que contienekvariables predictoras. La medida del criterio se calcula para cada variable.
De todas las variables que no cumplen el criterio de inclusión en el modelo, se elimina del
modelo la que menos cumple el criterio. Si se elimina una variable en este paso, se calcula la
ecuación de regresión para el modelo más pequeño y se calcula la medida del criterio para cada
variable ahora en el modelo. Si alguna de estas variables no cumple con el criterio de inclusión
en el modelo, se elimina la que menos lo cumple. Si se elimina una variable en este paso, la
variable que se eliminó en el primer paso se vuelve a ingresar en el modelo y se continúa con el
procedimiento de evaluación. Este proceso continúa hasta que no se pueden ingresar o
eliminar más variables.
La naturaleza del procedimiento paso a paso es tal que, aunque una variable puede eliminarse
del modelo en un paso, se evalúa para su posible reingreso al modelo en pasos posteriores.
el procedimiento pasa al paso siguiente. Si no se puede eliminar ninguna variable, el procedimiento intenta
agregar una variable. UnFLa estadística se calcula para cada variable que no está en el modelo. De estas
variables, la de mayor valor asociadoFse añade la estadística, siempre que suFla estadística es mayor que el
valor límite especificado (4 si no se especifica ningún otro valor). La ecuación de regresión se reajusta para el
nuevo modelo, se imprimen los resultados y el procedimiento continúa con el siguiente paso. El
procedimiento se detiene cuando no se puede agregar o eliminar ninguna variable.
El siguiente ejemplo ilustra el uso del procedimiento paso a paso para seleccionar
variables para un modelo de regresión múltiple.
EJEMPLO. 11.3.1
A una directora de enfermería le gustaría usar las características personales de las enfermeras para
desarrollar un modelo de regresión para predecir el desempeño laboral (JOBPER). Las siguientes variables
están disponibles para elegir las variables independientes para incluir en el modelo:
X1¼asertividaddASRVÞ X2¼
entusiasmodENTHÞ X3¼
ambicióndAMBÞ
X4¼habilidades de comunicacióndCOMUNICACIÓNÞ X
5¼habilidades para resolver problemasdPROBLEMAÞ
X6¼iniciativadEN ESOÞ
Deseamos utilizar el procedimiento paso a paso para seleccionar variables independientes de las
disponibles en la tabla para construir un modelo de regresión múltiple para predecir el desempeño
laboral.
Solución: La tabla 11.3.1 muestra las medidas tomadas sobre la variable dependiente
JOBPER y cada una de las seis variables independientes para una muestra de 30
enfermeras.
Y X1 X2 X3 X4 X5 X6
45 74 29 40 66 93 47
sesenta y cinco sesenta y cinco 50 64 68 74 49
73 71 67 79 81 87 33
63 64 44 57 59 85 37
83 79 55 76 76 84 33
45 56 48 54 59 50 42
60 68 41 66 71 69 37
73 76 49 sesenta y cinco 75 67 43
74 83 71 77 76 84 33
(Continuación)
562 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
Y X1 X2 X3 X4 X5 X6
69 62 44 57 67 81 43
66 54 52 67 63 68 36
69 61 46 66 84 75 43
71 63 56 67 60 64 35
70 84 82 68 84 78 37
79 78 53 82 84 78 39
83 sesenta y cinco 49 82 sesenta y cinco 55 38
75 86 63 79 84 80 41
67 61 64 75 60 81 45
67 71 45 67 80 86 48
52 59 67 64 69 79 54
52 71 32 44 48 sesenta y cinco 43
66 62 51 72 71 81 43
55 67 51 60 68 81 39
42 sesenta y cinco 41 45 55 58 51
sesenta y cinco 55 41 58 71 76 35
68 78 sesenta y cinco 73 93 77 42
80 76 57 84 85 79 35
50 58 43 55 56 84 40
87 86 70 81 82 75 30
84 83 38 83 69 79 41
Usamos MINITAB para obtener un modelo útil mediante el procedimiento paso a paso.
Las observaciones sobre la variable dependiente desempeño laboral (JOBPER) y las seis
variables independientes candidatas se almacenan en las columnas 1 a 7 de MINITAB,
respectivamente. La figura 11.3.1 muestra el procedimiento MINITAB apropiado y la
impresión de los resultados.
Para obtener los resultados de la Figura 11.3.1, los valores deFpara entrar yF
para eliminar ambos se configuraron automáticamente en 4. En el paso 1 no hay
variables a considerar para su eliminación del modelo. La variable AMB (Columna 4)
tiene asociada la mayorFestadística, que esF¼ (9.74)2¼94.8676. Dado que 94,8676 es
mayor que 4, se agrega AMB al modelo. En el paso 2, la variable INIT (Columna 7)
califica para agregarse al modelo ya que su asociadoFde (-2.2)2¼4,84 es mayor que 4 y
es la variable con mayor número asociadoFestadística. Se agrega al modelo. Después
del paso 2, no se pudo agregar ni eliminar ninguna otra variable y el procedimiento se
detuvo. Vemos, entonces, que el modelo elegido por el procedimiento paso a paso es
un modelo de dos variables independientes con AMB e INIT como variables
independientes. La ecuación de regresión estimada es
Paso 1 2
Constante 7.226 31.955
C4 0.888 0.787
Relación T 9.74 8.13
C7 - 0,45
Relación T - 2.20
S 5.90 5.53
cuadrados R 77.21 80.68
FIGURA 11.3.1Procedimiento paso a paso de MINITAB y salida para los datos de la tabla 11.3.1.
Para cambiar el criterio para permitir que una variable ingrese al modelo de 4 a algún
otro valork,haga clic en Opciones, luego escriba el valor deseado deken el cuadro Entrar. El
nuevo criterioFla estadística, entonces, esken lugar de 4. Para cambiar el criterio para eliminar
una variable del modelo de 4 a algún otro valork,haga clic en Opciones, luego escriba el valor
deseado deken el cuadro Quitar. debemos elegirkentrar a ser mayor o igual akpara eliminar.
Aunque el procedimiento de selección paso a paso es una técnica común empleada por los investigadores,
hay otros métodos disponibles. A continuación se presenta una breve discusión de dos de estas herramientas. El
modelo final obtenido por cada uno de estos procedimientos es el mismo modelo que se encontró utilizando el
procedimiento paso a paso en el ejemplo 11.3.1.
sido considerado. El modelo final contiene todas las variables independientes que cumplen los
criterios de inclusión.
Eliminación hacia atrásEste procedimiento de construcción de modelos comienza con todas las
variables del modelo. Esta estrategia también construye un modelo usando correlaciones y un criterio
de inclusión predeterminado basado en elFestadística. La primera variable considerada para su
eliminación del modelo es la que tiene el coeficiente de correlación parcial más pequeño. Si esta
variable no cumple con el criterio de inclusión, se elimina del modelo. La siguiente variable a
considerar para la eliminación es la que tiene la siguiente correlación parcial más baja. Será eliminado
si no cumple con el criterio de inclusión. Este procedimiento continúa hasta que todas las variables
han sido consideradas para su eliminación. El modelo final contiene todas las variables
independientes que cumplen los criterios de inclusión.
EJERCICIOS
11.3.1Consulte los datos del Ejercicio 10.3.2 informados por Son et al. (A-6), que estudió el cuidado familiar en Corea de adultos
mayores con demencia. La variable de resultado, la carga del cuidador (CARGA), se midió mediante el Inventario de
Carga de Corea (KBI), donde las puntuaciones oscilaron entre 28 y 140, y las puntuaciones más altas indicaron una
mayor carga. Realice un análisis de regresión por pasos sobre las siguientes variables independientes informadas por
los investigadores:
MEM: problemas de memoria y de comportamiento con puntuaciones más altas que indican más problemas. COG:
deterioro cognitivo con puntuaciones más bajas que indican un mayor grado de deterioro cognitivo.
SOCIALSU: puntuación total de apoyo social percibido (25-175, los valores más altos indican más
apoyo). Los datos reportados son los siguientes.
41 200 12 39 4 18 119 28
30 120 36 52 33 9 131 68
41 300 60 89 17 3 141 59
35 350 2 57 31 7 150 91
37 600 48 28 35 19 142 70
42 90 4 34 3 25 148 38
49 300 26 42 dieciséis 17 172 46
39 500 dieciséis 52 6 26 147 57
49 309 30 88 41 13 98 89
40 250 60 90 24 3 147 48
(Continuación)
EJERCICIOS 565
40 300 36 38 22 13 146 74
70 60 10 83 41 11 97 78
49 450 24 30 9 24 139 43
55 300 18 45 33 14 127 76
27 309 30 47 36 18 132 72
39 250 10 90 17 0 142 61
39 260 12 63 14 dieciséis 131 63
44 250 32 34 35 22 141 77
33 200 48 76 33 23 106 85
42 200 12 26 13 18 144 31
52 200 24 68 34 26 119 79
48 300 36 85 28 10 122 92
53 300 12 22 12 dieciséis 110 76
40 300 11 82 57 3 121 91
35 200 8 80 51 3 142 78
47 150 60 80 20 18 101 103
33 180 19 81 20 1 117 99
41 200 48 30 7 17 129 73
43 300 36 27 27 27 142 88
25 309 24 72 9 0 137 64
35 250 12 46 15 22 148 52
35 200 6 63 52 13 135 71
45 200 7 45 26 18 144 41
36 300 24 77 57 0 128 85
52 600 60 42 10 19 148 52
41 230 6 60 34 11 141 68
40 200 36 33 14 14 151 57
45 400 96 49 30 15 124 84
48 75 6 89 64 0 105 91
50 200 30 72 31 3 117 83
31 250 30 45 24 19 111 73
33 300 2 73 13 3 146 57
30 200 30 58 dieciséis 15 99 69
36 250 6 33 17 21 115 81
45 500 12 34 13 18 119 71
32 300 60 90 42 6 134 91
55 200 24 48 7 23 165 48
50 309 20 47 17 18 101 94
37 250 30 32 13 15 148 57
40 1000 21 63 32 15 132 49
40 300 12 76 50 5 120 88
49 300 18 79 44 11 129 54
37 309 18 48 57 9 133 73
47 250 38 90 33 6 121 87
41 200 60 55 11 20 117 47
33 1000 18 83 24 11 140 60
28 309 12 50 21 25 117 sesenta y cinco
(Continuación)
566 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
11.3.2Machiel Naeije (A-7) identifica variables útiles para predecir la apertura máxima de la boca (MMO,
milímetros) para 35 voluntarios sanos. Las variables examinadas fueron:
EDAD: años
ABAJO_CON: traslación condilar hacia abajo, mm
FORW_CON: traslación condilar hacia adelante, mm 0¼
Género: Mujer, 1¼Longitud mandibular masculina,
MAN_LENG: mm
MAN_WIDT: ancho mandibular, mm
Utilice las siguientes medidas informadas para realizar una regresión paso a paso.
11.3.3Uno de los propósitos de un estudio de Connor et al. (A-8) fue examinar la agresión reactiva entre niños y
adolescentes derivados a un centro de tratamiento residencial. Los investigadores utilizaron la Escala de
calificación proactiva/reactiva, obtenida al presentar tres declaraciones a los médicos que examinaron a los
sujetos. Los encuestados respondieron usando una escala del 1 al 5, donde 5 indica que la declaración casi
siempre se aplica al niño. Un ejemplo de una declaración de agresión reactiva es: “Cuando este niño ha sido
objeto de burlas o amenazas, se enfada con facilidad y contraataca”. La puntuación reactiva fue la respuesta
promedio a tres afirmaciones de este tipo. Con esta variable como variable de resultado, los investigadores
también examinaron lo siguiente: EDAD (años), VERBALIQ (coeficiente intelectual verbal), STIM (uso de
estimulantes), ABUSO DE EDAD (edad cuando se abusó por primera vez), CTQ
(una medida de hiperactividad en la que las puntuaciones más altas indican una mayor hiperactividad),
TOTALHOS (hostilidad total medida por un evaluador, donde los números más altos indican una mayor
hostilidad). Realice una regresión por pasos para encontrar las variables más útiles para predecir la agresión
reactiva en la siguiente muestra de 68 sujetos.
4.0 17 91 0 0 0 8
3.7 12 94 0 1 29 10
2.3 14 105 0 1 12 10
5.0 dieciséis 97 0 1 9 11
2.0 15 97 0 2 17 10
2.7 8 91 0 0 6 4
2.0 10 111 0 0 6 6
3.3 12 105 0 0 28 7
2.0 17 101 1 0 12 9
4.3 13 102 1 1 8 11
4.7 15 83 0 0 9 9
4.3 15 66 0 1 5 8
2.0 15 90 0 2 3 8
4.0 13 88 0 1 28 8
2.7 13 98 0 1 17 10
2.7 9 135 0 0 30 11
2.7 18 72 0 0 10 9
2.0 13 93 0 2 20 8
3.0 14 94 0 2 10 11
2.7 13 93 0 1 4 8
3.7 dieciséis 73 0 0 11 11
2.7 12 74 0 1 10 7
2.3 14 97 0 2 3 11
4.0 13 91 1 1 21 11
4.0 12 88 0 1 14 9
4.3 13 90 0 0 15 2
3.7 14 104 1 1 10 10
3.0 18 82 0 0 1 7
4.3 14 79 1 3 6 7
1.0 dieciséis 93 0 0 5 8
4.3 dieciséis 99 0 1 21 11
(Continuación)
11.4 REGRESIÓN LOGÍSTICA 569
2.3 14 73 0 2 8 9
3.0 12 112 0 0 15 9
1.3 15 102 0 1 1 5
3.0 dieciséis 78 1 1 26 8
2.3 9 95 1 0 23 10
1.0 15 124 0 3 0 11
3.0 17 73 0 1 1 10
3.3 11 105 0 0 23 5
4.0 11 89 0 0 27 8
1.7 9 88 0 1 2 8
2.3 dieciséis 96 0 1 5 7
4.7 15 76 1 1 17 9
1.7 dieciséis 87 0 2 0 4
1.7 15 90 0 1 10 12
4.0 12 76 0 0 22 10
5.0 12 83 1 1 19 7
4.3 10 88 1 0 10 5
5.0 9 98 1 0 8 9
3.7 12 100 0 0 6 4
3.3 14 80 0 1 3 10
2.3 dieciséis 84 0 1 3 9
1.0 17 117 0 2 1 9
1.7 12 145 1 0 0 5
3.7 12 123 0 0 1 3
2.0 dieciséis 94 0 2 6 6
3.7 17 70 0 1 11 13
4.3 14 113 0 0 8 8
2.0 12 123 1 0 2 8
3.0 7 107 0 0 11 9
3.7 12 78 1 0 15 11
4.3 14 73 0 1 2 8
2.3 18 91 0 3 8 10
4.7 12 91 0 0 6 9
3.7 15 111 0 0 2 9
1.3 15 71 0 1 20 10
3.7 7 102 0 0 14 9
1.7 9 89 0 0 24 6
Fuente: Datos proporcionados por cortesía de Daniel F. Connor, MD y Lang Lin.
Hasta ahora, nuestra discusión sobre el análisis de regresión se ha limitado a aquellas situaciones en las que
la variable dependiente es una variable continua, como el peso, la presión arterial o los niveles plasmáticos
de alguna hormona. Gran parte de la investigación en el campo de las ciencias de la salud se
570 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
motivado por el deseo de describir, comprender y hacer uso de la relación entre las
variables independientes y una variable dependiente (o de resultado) que es discreta.
Particularmente abundantes son las circunstancias en las que la variable de resultado es
dicotómica. Una variable dicotómica, recordemos, es una variable que puede asumir sólo
uno de dos valores mutuamente excluyentes. Estos valores suelen codificarseY¼1 para un
éxito yY¼0 para un fracaso o fracaso. Las variables dicotómicas incluyen aquellas cuyos
dos posibles valores son categorías tales como murió-no murió; curado-no curado;
enfermedad ocurrió enfermedad no ocurrió; y fumador-no fumador. El profesional de las
ciencias de la salud que se dedica a la investigación o necesita comprender los resultados
de la investigación realizada por otros encontrará ventajoso tener, al menos, una
comprensión básica deRegresión logística,el tipo de análisis de regresión que suele
emplearse cuando la variable dependiente es dicotómica. El propósito de la presente
discusión es proporcionar al lector este nivel de comprensión. Limitaremos nuestra
presentación al caso en el que sólo exista una variable independiente que puede ser
continua o dicotómica.
y¼b0þb1Xþmi (11.4.1)
metroyjX¼b0þb1X (11.4.2)
midyjX¼b0þb1X (11.4.3)
Generalmente, el lado derecho de las Ecuaciones (11.4.1) a (11.4.3) puede asumir cualquier
valor entre menos infinito y más infinito.
Aunque sólo intervienen dos variables, el modelo de regresión lineal simple no es
apropiado cuandoYes una variable dicotómica porque el valor esperado (o la media) deY
es la probabilidad de queY¼1 y, por lo tanto, está limitado al rango de 0 a 1, inclusive. Las
ecuaciones (11.4.1) a (11.4.3), entonces, son incompatibles con la realidad de la situación.
entre menos infinito y más infinito al igual que el lado derecho de las Ecuaciones 11.4.1 a
(11.4.3). Por lo tanto, podemos escribir
pag
en ¼b0 þbX1 (11.4.4)
1 -pag
Expdb0þb1XÞ
pag
¼ (11.4.5)
1þExpdb0þb1XÞ
Un objetivo del análisis de los datos que cumplen estos criterios es una estadística conocida como relación de
probabilidades.Para entender el concepto de razón de probabilidades, debemos entender el términoimpares,
Independiente
Variable (X)
Dependiente
Variable (Y) 1 0
1 norte1;1 norte1;0
2 norte0;1 norte0;0
572 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
que es utilizado con frecuencia por aquellos que hacen apuestas sobre los resultados de los eventos deportivos o participan en
otros tipos de actividades de juego. Usando la terminología de probabilidad, podemos definir las probabilidades de la siguiente
manera.
DEFINICIÓN
La probabilidad de éxito es la relación entre la probabilidad de éxito y la
probabilidad de fracaso.
La razón de probabilidades es una medida de cuánto mayor (o menor) es la probabilidad de que los
sujetos que poseen el factor de riesgo experimenten un resultado particular. Esta conclusión asume que el
resultado es un evento raro. Por ejemplo, cuando el resultado es contraer una enfermedad, la interpretación
de la razón de posibilidades asume que la enfermedad es rara.
Supongamos, por ejemplo, que la variable de resultado es la adquisición o no adquisición de cáncer
de piel y la variable independiente (o factor de riesgo) son los altos niveles de exposición al sol. El análisis de
dichos datos recopilados en una muestra de sujetos podría arrojar una razón de probabilidad de 2, lo que
indica que las probabilidades de cáncer de piel son dos veces mayores entre sujetos con altos niveles de
exposición al sol que entre sujetos sin altos niveles de exposición.
Los paquetes de software de computadora que realizan la regresión logística frecuentemente proporcionan
como parte de su salida estimaciones deb0yb1y el valor numérico de la razón de probabilidades. Resulta que la razón
de probabilidades es igual a exp(b1).
EJEMPLO 11.4.1
LaMont et al. (A-9) evaluó la enfermedad arterial coronaria obstructiva (OCAD) entre 113 hombres y 35
mujeres que se quejaron de dolor en el pecho o posible equivalente a su médico de atención primaria.
La Tabla 11.4.2 muestra la clasificación cruzada de OCAD con género. Deseamos utilizar el análisis de
regresión logística para determinar cuánto mayores son las probabilidades de encontrar OCAD entre
los hombres que entre las mujeres.
Solución: Podemos usar el SAS®paquete de software para analizar estos datos. La variable
independiente es el género y la variable dependiente es el estado con respecto a tener
enfermedad arterial coronaria obstructiva (OCAD). Uso del SAS®produce el comando
PROC LOGIST. como parte de la salida resultante, las estadísticas que se muestran en
la Figura 11.4.1.
El Procedimiento LOGÍSTICO
FIGURA 11.4.1Resultado parcial del uso de SAS®comando PROC LOGISTIC con los datos de la Tabla
11.4.2.
EJEMPLO 11.4.2
Según Gallagher et al. (A-10), los programas de rehabilitación cardíaca ofrecen “información, apoyo y
seguimiento para el retorno a las actividades, manejo de síntomas y modificación de factores de
riesgo”. Los investigadores realizaron un estudio para identificar entre las mujeres los factores que
están asociados con la participación en tales programas. Los datos de la Tabla 11.4.3 son las edades
de 185 mujeres dadas de alta de un hospital en Australia que cumplieron con los criterios de
elegibilidad relacionados con el alta por infarto de miocardio, cirugía de derivación arterial,
angioplastia o stent. Deseamos utilizar estos datos para obtener información sobre la relación entre la
edad (años) y la participación en un programa de rehabilitación cardíaca (ATT¼1, si participó, y ATT¼0,
si no). También deseamos saber si podemos usar los resultados de nuestro análisis para predecir la
probabilidad de participación de una mujer si conocemos su edad.
No participante Participativo
(ATT¼0) (ATT¼1)
50 73 46 74 74 62
59 75 57 59 50 74
42 71 53 81 55 61
50 69 40 74 66 69
34 78 73 77 49 76
49 69 68 59 55 71
67 74 72 75 73 61
44 86 59 68 41 46
53 49 64 81 64 69
45 63 78 74 46 66
79 63 68 sesenta y cinco sesenta y cinco 57
46 72 67 81 50 60
62 64 55 62 61 63
58 72 71 85 64 63
70 79 80 84 59 56
60 75 75 39 73 70
67 70 69 52 73 70
64 73 80 67 sesenta y cinco 63
62 66 79 82 67 63
50 75 71 84 60 sesenta y cinco
61 73 69 79 69 67
69 71 78 81 61 68
74 72 75 74 79 84
sesenta y cinco 69 71 85 66 69
80 76 69 92 68 78
69 60 77 69 61 69
77 79 81 83 63 79
61 78 78 82 70 83
72 62 76 85 68 67
67 73 84 82 59 47
80 64 57
66
Fuente: Datos proporcionados por cortesía de Robyn Gallagher, RN, Ph.D.
Estándar Wald
Parámetro DF Estimar Error chi-cuadrado Pr > ChiSq
FIGURA 11.4.2SAS parcial®impresión del análisis de regresión logística de los datos en la Tabla 11.4.3.
S.A.S.®documentación para obtener más detalles). En la Figura 11.4.2 se muestra una copia
impresa parcial del análisis.
La pendiente de nuestra regresión es -0,0379 y el intercepto es 1,8744. La
ecuación de regresión, entonces, es
ŷi¼1:8744 - :0379Xi
Prueba deH0esob1¼0
Llegamos a una conclusión sobre la adecuación del modelo logístico probando la hipótesis nula
de que la pendiente de la línea de regresión es cero. La estadística de prueba esz¼b̂1= sbdónde
zes el estadístico normal estándar, b̂1es la pendiente de la muestra (-.0379), ysbes su s1error
estándar (.0146) como se muestra en la Figura 11.4.2. A partir de estos números1calcularz¼
- . 0379/.0146¼-2.5959, que tiene un lado asociadopagvalor de .0094. Concluimos, por
tanto, que el modelo logístico es adecuado. la plaza dezes chi-cuadrado con 1 grado de
libertad, un estadístico que se muestra en la Figura 11.4.2.
Exp½1:8744 -d:0379Þð50Þ
pag¼ ¼ :49485
1þExp½1:8744 -d:0379Þð50Þ
S.A.S.®calcula las probabilidades estimadas para los valores dados deX.Podemos ver las
probabilidades estimadas de asistir a programas de rehabilitación cardiaca para el rango de edad de
los sujetos inscritos en el estudio en la Figura 11.4.3. Dado que la pendiente fue negativa, vemos una
probabilidad decreciente de asistir a un programa de rehabilitación cardíaca para mujeres mayores.
576 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
0,65
0,60
0,55
0.50
Probabilidad estimada
0,45
0.40
0.35
0.30
0.25
0.20
0.15
30 40 50 60 70 80 90 100
FIGURA 11.4.3Probabilidades estimadas de asistencia por edades dentro del estudio para el
Ejemplo 11.4.2. &
pag
en ¼b0 þbX1 1jþ bX
2 2j þ þ bX
k kj (11.4.6)
1 -pag
-
Expb0þb1X1jþb2X2jþ þbkXkj
pag¼ - (11.4.7)
1þExpb0þb1X1jþb2X2jþ þbkXkj
EJEMPLO 11.4.3
Considere los datos presentados en el ejercicio de revisión 24. En este estudio de Fils-Aime et al.
(A-21), se recogieron y clasificaron los datos con respecto al consumo de alcohol. Los sujetos se
clasificaron como de inicio temprano (< 25 años) o tardío (> 25 años) de consumo excesivo de alcohol.
11.4 REGRESIÓN LOGÍSTICA 577
ŷi¼2:076 - :013X1jþ0X2j
Prueba de H0esob1¼0
Las pruebas de significación de los coeficientes de regresión se pueden obtener directamente de la figura
11.4.4. Tenga en cuenta que tanto la constante (intersección) como las variables 5-HIAA son significativas en
el modelo (ambas tienenpagvalores, anotados como “Sig.” en la tabla, <.05); sin embargo, TRYPT no es
significativo y, por lo tanto, no necesita estar en el modelo, lo que sugiere que no es útil para identificar a los
participantes del estudio con inicio temprano o tardío de alcoholismo.
Como antes, las probabilidades se pueden obtener fácilmente utilizando la Ecuación
11.4.7 y sustituyendo los valores obtenidos del análisis. &
Evaluación de la bondad de ajusteUna pregunta natural que surge al hacer una regresión
logística es: "¿Qué tan bueno es mi modelo?" En la regresión lineal clásica discutimos medidas comoR2
para determinar cuánta variación explica el modelo, con valores deR2acercándose a 1 como un buen
indicador de la adecuación del modelo basado en los predictores elegidos para modelar el resultado.
Dada la naturaleza de la variable de respuesta en la regresión logística, un coeficiente de
determinación no proporciona la misma información que en la regresión lineal. Esto se debe a que en
la regresión logística los valores de los parámetros no se derivan para minimizar las sumas de los
cuadrados, sino que son estimaciones iterativas; por lo tanto, no hay una medida equivalente deR2en
regresión logística. A continuación, brindamos una explicación de algunos enfoques comúnmente
utilizados para evaluar modelos de regresión logística y seguimos estas explicaciones con dos
ejemplos ilustrativos.
Muchos autores han intentado desarrollar lo que se conoce como “pseudo-R2” valores que van
de 0 a 1, donde los valores más altos indican un mejor ajuste. En general, estas medidas son
578 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
basado en comparaciones de un modelo derivado con un modelo que contiene solo una intersección.
En otras palabras, son medidas comparativas diseñadas para indicar "cuánto mejor" es un modelo
con variables predictoras en comparación con un modelo sin predictores. Dos pseudo-R2las
estadísticas fueron desarrolladas por Cox y Snell (4) y Nagelkerke (5). Estos a menudo se proporcionan
en los resultados estándar del software estadístico. El valor de estas medidas es el hecho de que
pueden ser útiles para comparar modelos con diferentes variables predictoras, pero brindan poca
utilidad relativa para examinar un solo modelo. Ambos enfoques se basan en la idea de utilizar una
medida de ajuste conocida como estadística de verosimilitud logarítmica. El logaritmo de
verosimilitud para el modelo de intercepción solamente se usa para representar la suma total de
cuadrados, mientras que el logaritmo de verosimilitud para el modelo con variables predictoras se
usa para representar la suma de cuadrados del error. Los lectores interesados pueden encontrar una
explicación de la estadística de verosimilitud en Hosmer y Lemeshow (2).
Otro enfoque intuitivo es considerar una tabla de clasificación. Con este método, se desarrolla una tabla de contingencia que proporciona
recuentos de frecuencia de la cantidad de puntos de datos que se observaron como 0 o 1 en los datos sin procesar, junto con si los datos sin procesar se
clasificaron como 0 o 1 según la ecuación predictiva. . Entonces se puede estimar cuántos de los puntos de datos se clasificaron correctamente. Como
regla general, clasificar correctamente el 70 por ciento o más se considera evidencia de un modelo satisfactorio desde un punto de vista estadístico. Sin
embargo, es posible que el modelo no proporcione una capacidad predictiva lo suficientemente grande como para ser útil en un sentido práctico. Sin
embargo, surge un problema, ya que la reclasificación de los mismos datos utilizados para construir un modelo con el propio modelo puede sesgar los
resultados. Hay dos formas prácticas de lidiar con este problema. Primero, uno puede usar parte del conjunto de datos para construir el modelo y la otra
parte del conjunto de datos para desarrollar una tabla de clasificación. Esta estrategia, por supuesto, requiere una muestra lo suficientemente grande
como para acomodar adecuadamente las necesidades de ambos procedimientos. Un segundo enfoque es construir un modelo utilizando los datos
disponibles y luego recopilar datos adicionales para probar la idoneidad del modelo utilizando una tabla de clasificación. Esta estrategia también tiene
sus deficiencias, ya que la recopilación de datos adicionales puede llevar mucho tiempo y ser costosa. Un segundo enfoque es construir un modelo
utilizando los datos disponibles y luego recopilar datos adicionales para probar la idoneidad del modelo utilizando una tabla de clasificación. Esta
estrategia también tiene sus deficiencias, ya que la recopilación de datos adicionales puede llevar mucho tiempo y ser costosa. Un segundo enfoque es
construir un modelo utilizando los datos disponibles y luego recopilar datos adicionales para probar la idoneidad del modelo utilizando una tabla de
clasificación. Esta estrategia también tiene sus deficiencias, ya que la recopilación de datos adicionales puede llevar mucho tiempo y ser costosa.
Un tercer enfoque que también tiene un atractivo visual intuitivo es desarrollar una gráfica que
muestre la frecuencia de las observaciones frente a su probabilidad predicha. En este tipo de gráfico, uno
esperaría ver una separación completa de los valores 0 y 1. Cuando hay una clasificación incorrecta de la
variable de resultado, este tipo de gráfico proporciona un medio para determinar dónde ocurrió la
clasificación incorrecta y con qué frecuencia se clasificaron incorrectamente las observaciones.
Finalmente, en un enfoque de uso común conocido como prueba de Hosmer y Lemeshow, se
desarrolla una tabla de frecuencias observadas y esperadas y se usa una prueba de chi-cuadrado para
determinar si existe una desviación significativa entre las frecuencias observadas y esperadas. Para el
lector interesado sugerimos el texto de Hosmer y Lemeshow (2).
EJEMPLO 11.4.4
Considere el modelo de regresión logística que se construyó a partir de los datos del programa de
rehabilitación cardíaca en el ejemplo 11.4.2.
La figura 11.4.5 muestra la salida estándar de SPSS para este modelo de regresión logística. En
esta figura, vemos que tanto Cox and Snell como Nagelkerke pseudo-R2se proporcionan valores. Dado
que ambos son > 0, el modelo con el predictor brinda más información que el modelo de solo
intercepto. Uno puede ver fácilmente que solo el 63% de los datos fueron correctos.
11.4 REGRESIÓN LOGÍSTICA 579
Resumen Modelo
Cox y Snell R. Nagelkerke R
Cuadrado Cuadrado
. 037 . 051
Tabla de clasificacióna
Predicho
att Porcentaje
Observado 0 1 Correcto
FIGURA 11.4.5Salida parcial de SPSS para el análisis de regresión logística de los datos del Ejemplo
11.4.2.
reclasificados, con aquellos que participan en el programa de rehabilitación mucho peor clasificados
que aquellos que no asistieron al programa. La distribución de frecuencias muestra el gran número
de ATT¼1 sujetos que fueron clasificados erróneamente como ATT¼0 según el modelo. &
EJEMPLO 11.4.5
Considere el modelo de regresión logística que se construyó a partir de los datos del programa de
rehabilitación cardíaca en el ejemplo 11.4.3.
La Figura 11.4.6 muestra la salida estándar de SPSS para este modelo de regresión logística. En esta
figura, vemos que tanto Cox and Snell como Nagelkerke pseudo-R2se proporcionan valores y, dado que
ambos son > 0, el modelo con los predictores proporciona más información que el modelo de solo
intercepción. Se puede ver fácilmente que solo el 69% de los datos se reclasificaron correctamente, con el
modelo reclasificando a aquellos con inicio de consumo excesivo de alcohol en una proporción mucho mayor.
580 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
Resumen Modelo
Cox y Snell R. Nagelkerke R
Cuadrado Cuadrado
0.49 . 069
Tabla de clasificacióna
Predicho
Comienzo Porcentaje
Observado 0 1 Correcto
comienzo 0 2 37 5.1
a. El corte
FIGURA 11.4.6Salida parcial de SPSS para el análisis de regresión logística de los datos del Ejemplo 11.4.3.
tasa más alta que aquellos sin tal inicio. La distribución de frecuencias muestra el gran número de personas
sin inicio de consumo excesivo de alcohol predicho por el modelo para desarrollar inicio temprano de
alcoholismo. &
Regresión logística politómicaHasta ahora hemos limitado nuestra discusión a situaciones en las
que existe una variable de respuesta dicotómica (p. ej., exitoso o no exitoso). A menudo, tenemos una
situación en la que múltiples categorías componen la respuesta. Podemos, por ejemplo, tener sujetos
clasificados como positivos, negativos e indeterminados para una determinada enfermedad (una
respuesta politómica estándar). También puede haber ocasiones en las que tengamos una variable de
respuesta que esté ordenada. Podemos, por ejemplo, clasificar a nuestros sujetos según el IMC en
bajo peso, peso ideal, sobrepeso u obesidad (una respuesta politómica ordinal). El proceso de
modelado es un poco más complejo y requiere el uso de un programa de computadora. Para aquellos
interesados en explorar más a fondo estos valiosos métodos, recomendamos el libro de Hosmer y
Lemeshow (2).
EJERCICIOS 581
Otras lecturasHemos discutido solo los conceptos básicos y las aplicaciones de la regresión logística.
La técnica tiene una aplicación mucho más amplia. El análisis de regresión por pasos se puede utilizar
con la regresión logística. También hay técnicas disponibles para construir intervalos de confianza
para razones de probabilidades. El lector que desee aprender más sobre la regresión logística puede
consultar los libros de Hosmer y Lemeshow (2) y Kleinbaum (3).
EJERCICIOS
11.4.1En un estudio de victimización violenta de mujeres y hombres, Porcerelli et al. (A-11) recopiló información de 679 mujeres
y 345 hombres de 18 a 64 años de edad en varios centros de medicina familiar en el área metropolitana de Detroit.
Los pacientes completaron un cuestionario de historial de salud que incluía una pregunta sobre victimización. La
siguiente tabla muestra los sujetos de muestra clasificados de forma cruzada por género y si el sujeto se identificó a
sí mismo como "golpeado, pateado, puñetazo o lastimado de otra manera por alguien en el último año". Los sujetos
que responden afirmativamente a esa pregunta se clasifican como "victimizados violentamente".
Utilice el análisis de regresión logística para encontrar los coeficientes de regresión y la estimación de la razón de
probabilidades. Escribe una interpretación de tus resultados.
11.4.2Consulte la investigación de Gallagher et al. (A-10) discutido en el Ejemplo 11.4.2. Otra covariable de
interés fue una puntuación utilizando el Índice de Ansiedad y Depresión Hospitalaria. Un valor más alto para esta
puntuación indica un mayor nivel de ansiedad y depresión. Use los siguientes datos para predecir si una mujer en el
estudio participó en un programa de rehabilitación cardíaca.
Ansiedad hospitalaria
y depresión
Puntuaciones índice para
17 14 19 dieciséis 23 25
7 21 6 9 3 6
19 13 8 22 24 29
dieciséis 15 13 17 13 22
23 21 4 14 26 11
27 12 15 14 19 12
23 9 23 5 25 20
18 29 19 5 15 18
21 4 14 14 22 24
27 18 19 20 13 18
(Continuación)
582 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
Ansiedad hospitalaria
y depresión
Puntuaciones índice para
14 22 17 21 21 8
25 5 13 17 15 10
19 27 14 17 12 17
23 dieciséis 14 10 25 14
6 11 17 13 29 21
8 19 26 10 17 25
15 23 15 20 21 25
30 22 19 3 8 dieciséis
18 25 dieciséis 18 19 23
10 11 10 9 dieciséis 19
29 20 15 10 24 24
8 11 22 5 17 11
12 28 8 15 26 17
27 12 15 13 12 19
12 19 20 dieciséis 19 20
9 18 12 13 17
dieciséis 13 2 23 31
6 12 6 11 0
22 7 14 17 18
10 12 19 29 18
9 14 14 6 15
11 13 19 20
Fuente: Datos proporcionados por cortesía de Robyn Gallagher, RN, Ph.D.
11.5 RESUMEN
Este capítulo se incluye para el beneficio de aquellos que deseen ampliar su comprensión
del análisis de regresión y su capacidad para aplicar técnicas a modelos que son más
complejos que los que se cubren en los Capítulos 9 y 10. En este capítulo presentamos
algunos temas adicionales del análisis de regresión. . Discutimos el análisis que es
apropiado cuando una o más de las variables independientes son dicotómicas. En esta
discusión se presenta el concepto de codificación de variables ficticias. Un segundo tema
que discutimos es cómo seleccionar las variables independientes más útiles cuando
tenemos una larga lista de candidatos potenciales. La técnica que ilustramos para este
propósito es el análisis de regresión por pasos. Finalmente, presentamos los conceptos y
procedimientos básicos que intervienen en el análisis de regresión logística. Abarcamos
dos situaciones:
Dado que los cálculos necesarios para obtener resultados útiles a partir de datos
apropiados para el análisis por medio de las técnicas presentadas en este capítulo son
complicados y consumen mucho tiempo cuando se intentan a mano, se recomienda utilizar una
computadora para trabajar los ejercicios.
Traducido del inglés al español - www.onlinedoctranslator.com
Fórmula
Número Nombre Fórmula
metroyjX¼significado deyenX
Xi¼valor de la variable independiente eni
4.¿Por qué es importante el conocimiento de las técnicas de selección de variables para el investigador en ciencias de la salud?
9.Definir la palabraimpares.
11Dé un ejemplo en su campo en el que el análisis de regresión logística sería apropiado cuando la variable
independiente es dicotómica.
584 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
12Dé un ejemplo en su campo en el que el análisis de regresión logística sería apropiado cuando la variable
independiente es continua.
13Encuentre un artículo publicado en el campo de las ciencias de la salud en el que se emplee cada una de las siguientes técnicas:
14En el Ejemplo 10.3.1, vimos que el propósito de un estudio de Jansen y Keller (A-12) era predecir la capacidad
para dirigir la atención (CDA) en sujetos de edad avanzada. El estudio recopiló información sobre 71 mujeres
mayores que vivían en la comunidad con un estado mental normal. Las puntuaciones más altas de CDA
indican un mejor funcionamiento atencional. Además de las variables edad y nivel educativo, los
investigadores realizaron una regresión por pasos con dos variables adicionales: IADL, una medida de las
actividades de la vida diaria (los valores más altos indican un mayor número de actividades diarias), y ADS,
una medida de las demandas de atención (mayor valores indican más demandas atencionales). Realice una
regresión por pasos con los datos de la siguiente tabla e informe su modelo final,pagvalores y conclusiones.
CDA Edad Edyrs AIVD ANUNCIOS CDA Edad Edyrs AIVD ANUNCIOS
4.57 72 20 28 27 3.17 79 12 28 18
- 3:04 68 12 27 96 - 1:19 87 12 21 61
1.39 sesenta y cinco 13 24 97 0.99 71 14 28 55
- 3:55 85 14 27 48 - 2:94 81 dieciséis 27 124
- 2:56 84 13 28 50 - 2:21 66 dieciséis 28 42
- 4:66 90 15 27 47 - 0:75 81 dieciséis 28 64
- 2:70 79 12 28 71 5.07 80 13 28 26
0.30 74 10 24 48 - 5:86 82 12 28 84
- 4:46 69 12 28 67 5.00 sesenta y cinco 13 28 43
- 6:29 87 15 21 81 0,63 73 dieciséis 26 70
- 4:43 84 12 27 44 2.62 85 dieciséis 28 20
0.18 79 12 28 39 1.77 83 17 23 80
- 1:37 71 12 28 124 - 3:79 83 8 27 21
3.26 76 14 29 43 1.44 76 20 28 26
- 1:12 73 14 29 30 - 5:77 77 12 28 53
- 0:77 86 12 26 44 - 5:77 83 12 22 69
3.73 69 17 28 47 - 4:62 79 14 27 82
- 5:92 66 11 28 49 - 2:03 69 12 28 77
5.74 sesenta y cinco dieciséis 28 48 - 2:22 66 14 28 38
2.83 71 14 28 46 0.80 75 12 28 28
- 2:40 80 18 28 25 - 0:75 77 dieciséis 27 85
- 0:29 81 11 28 27 - 4:60 78 12 22 82
4.44 66 14 29 54 2.68 83 20 28 34
3.35 76 17 29 26 - 3:69 85 10 20 72
- 3:13 70 12 25 100 4.85 76 18 28 24
- 2:14 76 12 27 38 - 0:08 75 14 29 49
9.61 67 12 26 84 0,63 70 dieciséis 28 29
7.57 72 20 29 44 5.92 79 dieciséis 27 83
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 585
CDA Edad Edyrs AIVD ANUNCIOS CDA Edad Edyrs AIVD ANUNCIOS
2.21 68 18 28 52 3.63 75 18 28 32
- 2:30 102 12 26 18 - 7:07 94 8 24 80
1.73 67 12 27 80 6.39 76 18 28 41
6.03 66 14 28 54 - 0:08 84 18 27 75
- 0:02 75 18 26 67 1.07 79 17 27 21
- 7:65 91 13 21 101 5.31 78 dieciséis 28 18
4.17 74 15 28 90 0.30 79 12 28 38
Fuente: Datos proporcionados por cortesía de Debra Jansen, Ph.D., RN
15.En la siguiente tabla se encuentran el gasto cardíaco (L/min) y el consumo de oxígeno (VO) para una
2
muestra de
adultos (A) y niños (C), que participaron en un estudio diseñado para investigar la relación entre estas
variables. Las medidas se tomaron tanto en reposo como durante el ejercicio. Trate el gasto cardíaco como la
variable dependiente y utilice la codificación de variables ficticias y analice los datos mediante técnicas de
regresión. Explique los resultados. Grafique los datos originales y las ecuaciones de regresión ajustadas.
4.0 . 21 A 4.0 . 25 C
7.5 . 91 C 6.1 . 22 A
3.0 . 22 C 6.2 . 61 C
8.9 . 60 A 4.9 . 45 C
5.1 . 59 C 14.0 1.55 A
5.8 . 50 A 12.9 1.11 A
9.1 . 99 A 11.3 1.45 A
3.5 . 23 C 5.7 . 50 C
7.2 . 51 A 15.0 1.61 A
5.1 . 48 C 7.1 . 83 C
6.0 . 74 C 8.0 . 61 A
5.7 . 70 C 8.1 . 82 A
14.2 1.60 A 9.0 1.15 C
4.1 . 30 C 6.1 . 39 A
dieciséis.Una muestra aleatoria simple de sujetos normales entre las edades de 6 y 18 arrojó los datos sobre el potasio
corporal total (mEq) y el agua corporal total (litros) que se muestran en la siguiente tabla. Sea el potasio total la
variable dependiente y utilice la codificación de variables ficticias para cuantificar la variable cualitativa. Analizar los
datos utilizando técnicas de regresión. Explique los resultados. Grafique los datos originales y las ecuaciones de
regresión ajustadas.
(Continuación)
586 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
800 10 F 1695 26 F
2100 26 METRO 1510 21 F
1700 15 F 2000 27 F
1260 dieciséis METRO 3200 33 METRO
1370 18 F 1050 14 F
1000 11 F 2600 31 METRO
1500 20 F 1900 25 F
1450 19 METRO 2200 30 F
1100 14 METRO
17Los datos que se muestran en la siguiente tabla se recopilaron como parte de un estudio en el que los sujetos eran bebés
prematuros con bajo peso al nacer nacidos en tres hospitales diferentes. Utilice la codificación de variables ficticias y
técnicas de regresión múltiple para analizar estos datos. ¿Podemos concluir que las tres poblaciones hospitalarias de
la muestra difieren con respecto al peso medio al nacer cuando se tiene en cuenta la edad gestacional? ¿Podemos
concluir que existe interacción entre el hospital de nacimiento y la edad gestacional?
Grafique los datos originales y las ecuaciones de regresión ajustadas.
1.4 30 A 1.0 29 C
.9 27 B 1.4 33 C
1.2 33 A .9 28 A
1.1 29 C 1.0 28 C
1.3 35 A 1.9 36 B
.8 27 B 1.3 29 B
1.0 32 A 1.7 35 C
.7 26 A 1.0 30 A
1.2 30 C .9 28 A
.8 28 A 1.0 31 A
1.5 32 B 1.6 31 B
1.3 31 A 1.6 33 B
1.4 32 C 1.7 34 B
1.5 33 B 1.6 35 C
1.0 27 A 1.2 28 A
1.8 35 B 1.5 30 B
1.4 36 C 1.8 34 B
1.2 34 A 1.5 34 C
1.1 28 B 1.2 30 A
1.2 30 B 1.2 32 C
18Consulte el Capítulo 9, Ejercicio de repaso 18. En el estudio citado en ese ejercicio, Maria Mathias (A-13) investigó
la relación entre las edades (EDAD) de los niños y la mejora en las medidas de hiperactividad, actitud y
comportamiento social. En el estudio, los sujetos fueron asignados aleatoriamente a dos tratamientos
diferentes. El grupo de control (TRATAR¼0) recibió terapia estándar para la hiperactividad y el grupo de
tratamiento (TREAT¼1) recibió terapia estándar más terapia con mascotas. los resultados son
PREGUNTAS DE REPASO Y EJERCICIOS 587
se muestra en la siguiente tabla. Cree un gráfico de dispersión con la edad como variable independiente y
ATT (cambio de actitud con números positivos que indican un cambio de actitud positivo) como variable
dependiente. Utilice símbolos diferentes para los dos grupos de tratamiento diferentes. Use técnicas de
regresión múltiple para determinar si la edad, el tratamiento o la interacción son útiles para predecir el ATT.
Reporte sus resultados.
1 1 9 - 1:2 17 0 10 0.4
2 1 9 0.0 18 0 7 0.0
3 1 13 - 0:4 19 0 12 1.1
4 1 6 - 0:4 20 0 9 0.2
5 1 9 1.0 21 0 7 0.4
6 1 8 0.8 22 0 6 0.0
7 1 8 - 0:6 23 1 11 0.6
8 1 9 - 1:2 24 1 11 0.4
9 0 7 0.0 25 1 11 1.0
10 0 12 0.4 26 1 11 0.8
11 0 9 - 0:8 27 1 11 1.2
12 0 10 1.0 28 1 11 0.2
13 0 12 1.4 29 1 11 0.8
14 0 9 1.0 30 1 8 0.0
15 0 12 0.8 31 1 9 0.4
dieciséis 0 9 1.0
Fuente: Datos proporcionados por cortesía de Maria Mathias, MD y el Centro de Consulta Estadística de la Universidad Estatal de Wright.
Para cada estudio descrito en los Ejercicios 19 a 21, responda tantas de las siguientes preguntas como sea
posible:
(a)¿Cuál es la variable dependiente?
(b)¿Cuáles son las variables independientes?
(C)¿Cuáles son las hipótesis nula y alternativa apropiadas?
(d)¿Qué hipótesis nulas crees que fueron rechazadas? ¿Por qué?
(mi)¿Cuál es el objetivo más relevante, la predicción o la estimación, o son los dos igualmente relevantes?
Explica tu respuesta.
(F)¿Cuál es la población muestreada?
(gramo)¿Cuál es la población objetivo?
(h)¿Qué variables están relacionadas con qué otras variables? ¿Las relaciones son directas o
inversas?
(i)Escriba la ecuación de regresión usando los números apropiados para las estimaciones de parámetros.
(j)Da valores numéricos para cualquier otra estadística que puedas.
(k)Identifique cada variable en cuanto a si es cuantitativa o cualitativa.
(l)Explique el significado de cualquier estadística para la cual se dan valores numéricos.
19Golfinopoulos y Arhonditsis (A-14) utilizaron un modelo de regresión múltiple en un estudio de trihalometanos (THM) en
agua potable en Atenas, Grecia. Los THM son motivo de preocupación ya que se han relacionado con el cáncer y los
resultados reproductivos. Los investigadores encontraron útil el siguiente modelo de regresión para
588 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
predicción de THM:
20En un estudio de Takata et al. (A-15), los investigadores evaluaron la relación entre la capacidad de masticar y el
número de dientes y las medidas de aptitud física en una muestra de sujetos de 80 años o más en Japón.
Una de las variables de resultado que midió la condición física fue la fuerza extensora de la pierna. Para medir la
capacidad de masticar alimentos, se preguntó a los sujetos sobre su capacidad para masticar 15 alimentos (maní,
pulpo en vinagre y pan francés, entre otros). La consideración de variables como la altura, el peso corporal, el sexo, la
presión arterial sistólica, la albúmina sérica, la concentración de glucosa en ayunas, el dolor de espalda, el
tabaquismo, el consumo de alcohol, el estado civil, el tratamiento médico regular y el ejercicio regular revelaron que
la cantidad de alimentos masticables era significativa. en la predicción de la fuerza extensora de la pierna (b̂1¼ :075;
pag¼ :0366). Sin embargo, en presencia de las otras variables, el número de dientes no fue un predictor significativo.
(b1¼ :003;pag¼ :9373).
21Varela et al. (A-16) examinó a 515 pacientes que se sometieron a resección pulmonar por carcinoma
broncogénico. La variable resultado fue la ocurrencia de morbilidad cardiorrespiratoria después de la cirugía.
Cualquiera de los siguientes eventos postoperatorios indicó morbilidad: atelectasia pulmonar o neumonía,
insuficiencia respiratoria o ventilatoria al alta, necesidad de ventilación mecánica en cualquier momento
después de la extubación en el quirófano, tromboembolismo pulmonar, arritmia, isquemia o infarto de
miocardio e insuficiencia cardíaca clínica. Al realizar una regresión logística por pasos, los investigadores
encontraron que la edad (pag < :001) y volumen espiratorio forzado postoperatorio (pag¼ :003) fueron
estadísticamente significativos en la predicción de la ocurrencia de morbilidad cardiorrespiratoria.
Para cada uno de los conjuntos de datos dados en los Ejercicios 22 a 29, haga tantos de los siguientes como considere
apropiados:
22Un estudio de Davies et al. (A-17) fue motivado por el hecho de que, en estudios previos de respuestas
contráctiles ab-agonistas de los receptores adrenérgicos en miocitos individuales de corazones humanos
defectuosos y no defectuosos, habían observado una disminución relacionada con la edad en la respuesta
máxima al isoproterenol, en frecuencias en las que la respuesta máxima a niveles altos de Ca2þen la misma
celda no cambió. Para el presente estudio, los investigadores calcularon el isoproterenol/Ca2þ(ISO/CA) a
partir de mediciones tomadas en miocitos de pacientes con edades comprendidas entre 7 y 70 años. Los
sujetos se clasificaron como mayores (> 50 años) y más jóvenes. Los siguientes son los valores (ISO/CA), la
edad y la fuente de miocitos de los sujetos del estudio. Las fuentes de miocitos se informaron como donante
y biopsia.
PREGUNTAS DE REPASO Y EJERCICIOS 589
7 1.37 Donante
21 1.39 Donante
28 1.17 Donante
35 0.71 Donante
38 1.14 Donante
50 0,95 Donante
51 0.86 Biopsia
52 0.72 Biopsia
55 0.53 Biopsia
56 0.81 Biopsia
61 0.86 Biopsia
70 0.77 Biopsia
24Según Fils-Aime et al. (A-21), las encuestas epidemiológicas han encontrado que el alcoholismo es el trastorno mental o
de abuso de sustancias más común entre los hombres en los Estados Unidos. Fils-Aime y asociados investigaron las
interrelaciones de la edad al inicio del consumo excesivo de alcohol, los antecedentes familiares de alcoholismo, la
comorbilidad psiquiátrica y las concentraciones de metabolitos de monoamina en el líquido cefalorraquídeo (LCR) en
alcohólicos abstinentes que buscaban tratamiento. Los sujetos eran en su mayoría hombres blancos clasificados
como que experimentaron un inicio temprano (25 años o menos) o tardío (mayores de 25 años) de consumo excesivo
de alcohol. Entre los datos recopilados se encuentran las siguientes mediciones de las concentraciones de triptófano
(TRYPT) y ácido 5-hidroxiindolacético (5-HIAA) en LCR (pmol/ml).
Comienzo Comienzo
1¼Temprano 1¼Temprano
5-HIAA TRIPTO 0¼Tarde 5-HIAA TRIPTO 0¼Tarde
Comienzo Comienzo
1¼Temprano 1¼Temprano
5-HIAA TRIPTO 0¼Tarde 5-HIAA TRIPTO 0¼Tarde
25El objetivo de un estudio de Abrahamsson et al. (A-22) fue investigar los efectos antitrombóticos de un inhibidor del
inhibidor-1 del activador del plasminógeno (PAI-1) en ratas que recibieron endotoxina. Los sujetos experimentales
fueron ratas macho Sprague-Dawley que pesaban entre 300 y 400 gramos. Entre los datos recopilados se encuentran
las siguientes mediciones sobre la actividad de PAI-1 y el pulmón125Concentración de I en ratas anestesiadas que
recibieron tres fármacos:
260 277
203 216
195 169
414 272
244 192
26Pearse y Sylvester (A-23) realizaron un estudio para determinar las contribuciones separadas de la isquemia y la perfusión
extracorpórea a la lesión vascular que se produce en pulmones aislados de ovejas y para determinar la dependencia
de oxígeno de esta lesión. Los pulmones se sometieron a isquemia sola, perfusión extracorpórea sola e isquemia y
perfusión extracorpórea. Entre los datos recopilados se encuentran las siguientes observaciones sobre el cambio en
la presión arterial pulmonar (mm Hg) y la permeabilidad vascular pulmonar evaluada mediante la estimación del
coeficiente de reflexión para la albúmina en pulmones perfundidos con y sin isquemia anterior:
Cambiar en Cambiar en
Pulmonar Reflexión Pulmonar Reflexión
Presión Coeficiente Presión Coeficiente
Cambiar en Cambiar en
Pulmonar Reflexión Pulmonar Reflexión
Presión Coeficiente Presión Coeficiente
27El propósito de un estudio de Balzamo et al. (A-24) fue investigar, en conejos anestesiados, los efectos de la
ventilación mecánica sobre la concentración de sustancia P (SP) medida por radioinmunoensayo en nervios y
músculos asociados a la ventilación y que participan en la inervación sensorial del aparato respiratorio y del
corazón. SP es un neurotransmisor ubicado en las neuronas sensoriales primarias en los sistemas nerviosos
central y autónomo. Entre los datos recopilados se encuentran las siguientes medidas de concentración de
SP en los nervios vagos cervicales (X) y los ganglios nodosos correspondientes (NG), lados derecho e
izquierdo:
28Scheeringa y Zeanah (A-25) examinaron la presencia de trastorno de estrés postraumático (TEPT), la gravedad de
la sintomatología postraumática y el patrón de expresión de los grupos de síntomas en relación con seis
variables independientes que pueden ser importantes para el desarrollo de un trastorno postraumático. en
niños menores de 48 meses de edad. Los siguientes datos fueron recolectados durante el transcurso del
estudio.
594 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES
Género Edad Agudo/Rept. Experiencia en lesiones cuidador Reexp. entumecido excitado FragAgg
0 1 0 1 1 1 3 0 0 1
0 1 0 0 0 1 2 2 1 1
1 1 0 0 0 1 3 1 1 1
0 1 0 0 0 1 3 1 0 4
1 0 1 1 1 0 1 3 1 1
1 1 0 1 1 0 3 1 0 1
0 1 0 1 1 0 4 2 0 1
0 1 0 0 1 0 5 2 0 4
1 1 0 0 0 1 2 1 3 2
1 1 1 1 1 0 4 1 0 0
0 0 1 1 1 0 1 3 0 1
1 0 1 0 1 0 1 3 0 2
1 0 1 1 1 0 0 3 0 0
1 1 0 1 1 0 4 1 2 1
1 0 0 1 1 1 3 2 1 3
1 0 0 1 1 1 3 1 2 1
0 1 0 1 1 1 3 1 2 2
0 1 0 0 0 1 5 2 1 1
0 1 0 0 0 1 1 2 2 2
0 1 0 1 1 0 4 4 0 3
1 0 1 1 1 0 2 1 2 3
1 0 0 1 1 1 1 1 2 1
1 1 0 0 0 1 4 1 1 1
0 1 0 0 0 1 3 2 1 0
0 1 0 0 0 1 3 1 2 4
0 1 0 0 0 1 3 1 2 4
0 1 0 0 1 0 2 2 0 0
1 1 0 0 0 1 2 0 3 0
1 1 0 0 0 1 2 0 1 2
0 1 0 1 0 1 2 3 1 3
1 1 1 0 1 0 1 2 1 1
1 1 0 1 1 1 3 2 0 4
1 1 0 0 0 0 2 4 2 0
0 1 0 0 0 1 1 1 0 2
0 0 1 0 0 1 2 3 2 3
0 0 1 0 0 1 3 1 4 3
0 0 1 0 0 1 3 1 2 3
0 0 0 0 1 0 1 1 0 0
1 0 0 0 0 1 4 3 2 3
1 0 0 1 1 0 4 2 3 2
0 0 1 1 1 0 1 2 2 1
PREGUNTAS DE REPASO Y EJERCICIOS 595
Género Edad Agudo/Rept. Lesión Exp. cuidador Reexp. entumecido excitado FragAgg
1¼femenino
Edad 0¼menor de 18 meses en el momento del trauma
1¼mayores de 18 meses
Agudo/Rep. 0¼el trauma fue agudo, golpe único 1¼el
trauma fue derogado o crónico 0¼el sujeto
Lesión no resultó herido en el trauma
1¼el sujeto resultó herido físicamente en el trauma
Ingenio/Exper. 0¼sujeto presenció pero no experimentó directamente el trauma
1¼sujeto experimentó directamente el trauma 0¼cuidador no fue
Amenaza al cuidador amenazado en el trauma 1¼cuidador fue amenazado en el
trauma
Reexp.¼Recuento de síntomas del grupo de reexperimentación
Adormecer¼Entumecimiento del conteo de síntomas del grupo de respuesta/evitación excitante¼
Recuento de síntomas del grupo de hiperexcitación FragAgg¼Recuento de síntomas del grupo de
nuevos miedos/agresiones
29Uno de los objetivos de un estudio de Mulloy y McNicholas (A-26) fue comparar la ventilación y el intercambio de gases
durante el sueño y el ejercicio en la enfermedad pulmonar obstructiva crónica (EPOC). Los investigadores también
querían determinar si los estudios de ejercicio podrían ayudar en la predicción de la desaturación nocturna en la
EPOC. Los sujetos (13 hombres, 6 mujeres) eran pacientes ambulatorios que asistían a una clínica respiratoria
ambulatoria. La edad media de los pacientes, todos ellos con EPOC grave y estable, fue de 64,8 años con una
desviación estándar de 5,2. Entre los datos recopilados se encontraban mediciones de las siguientes variables:
aTratada como variable dependiente en los análisis de los autores. IMC¼índice de masa corporal; Pao2¼tensión arterial de
oxígeno: Paco2¼
presión de dióxido de carbono arterial; VEF1¼volumen espiratorio forzado en 1 segundo; São2¼saturación arterial de oxígeno.
Ejercicios para usar con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.El objetivo de un estudio de Gyurcsik et al. (A-27) fue examinar la utilidad de las metas relacionadas con el ejercicio
acuático, la autoeficacia de tareas y la autoeficacia de programación para predecir la asistencia al ejercicio acuático de
personas con artritis. Los investigadores recopilaron datos sobre 142 sujetos que participaban en los programas
acuáticos de la Arthritis Foundation. La variable de resultado fue el porcentaje de sesiones a las que se asistió durante
un período de 8 semanas (ATTEND). Las siguientes variables predictoras son todos valores centrados. Por lo tanto,
para cada participante, la media de todos los participantes se resta de la puntuación individual. Las variables son:
GOALDIFF: los valores más altos indican el establecimiento de objetivos de mayor participación. GOALSPEC: los valores
más altos indican una mayor especificidad de los objetivos relacionados con el ejercicio acuático. INTER: interacción de
GOALDIFF y GOALSPEC.
TSE: los valores más altos indican la confianza de los participantes en sus habilidades para asistir a clases acuáticas.
SSE: los valores más altos indican la confianza de los participantes en sus habilidades para realizar ocho tareas relacionadas
programar ejercicio en su rutina diaria durante 8 semanas.
MESES: meses de participación en ejercicios acuáticos antes del inicio del estudio.
Con el conjunto de datos AQUATICS, realice una regresión múltiple para predecir ATTEND con cada una de
las variables anteriores. ¿Qué es el coeficiente de correlación múltiple? ¿Qué variables son significativas para
predecir ATTEND? ¿Cuáles son tus conclusiones?
2.Rodehorst (A-28) realizó un estudio prospectivo de 212 maestros de escuelas primarias rurales. La principal
variable de resultado fue la intención de los maestros de manejar a los niños que presentaban síntomas de
asma en sus aulas. Esta variable se midió con una pregunta de un solo ítem que utilizó una escala tipo Likert
de siete puntos (INTENT, con posibles respuestas de 1¼extremadamente probable a 7¼ extremadamente
improbable). Rodehorst usó las siguientes variables como variables independientes para predecir la
INTENCIÓN:
SS¼Apoyo social. Las puntuaciones van de 7 a 49, y las puntuaciones más altas indican una mayor percepción
apoyo social para el manejo de niños con asma en un entorno escolar.
ATT¼Actitud. Las puntuaciones oscilan entre 15 y 90, y las puntuaciones más altas indican actitudes más favorables
hacia el asma.
REFERENCIAS 597
SABER¼Conocimiento. Los puntajes van de 0 a 24, y los puntajes más altos indican un nivel general más alto.
conocimientos sobre el asma.
NIÑO¼Número de niños con asma que el maestro ha tenido en su clase durante su
toda la carrera docente.
SE¼Autoeficacia. Las puntuaciones van de 12 a 60, y las puntuaciones más altas indican una mayor autoeficacia.
para el manejo de niños con asma en el ámbito escolar.
año¼Años de experiencia docente.
Con los datos MAESTROS, use el análisis de regresión paso a paso para seleccionar las variables más útiles para
incluir en un modelo para predecir la INTENCIÓN.
3.Consulte los datos de pérdida de peso de 588 pacientes con cáncer y 600 controles sanos (WGTLOSS). La pérdida de peso
entre los pacientes con cáncer es un fenómeno bien conocido. De interés para los médicos es el papel que juegan en
el proceso las anomalías metabólicas. Una investigación sobre las relaciones entre estas variables arrojó datos sobre
el recambio de proteínas en todo el cuerpo (Y)y porcentaje de peso corporal ideal para la altura (X).Los sujetos eran
pacientes con cáncer de pulmón y controles sanos de la misma edad. Seleccione una muestra aleatoria simple de
tamaño 15 de cada grupo y haga lo siguiente:
(a)Dibuje un diagrama de dispersión de los datos de muestra usando diferentes símbolos para cada uno de los dos grupos.
(C)Trace las dos líneas de regresión en el diagrama de dispersión. ¿Se puede concluir que las dos poblaciones
muestreadas difieren con respecto al recambio medio de proteínas cuando se tiene en cuenta el porcentaje de
peso ideal?
¿Se puede concluir que existe una interacción entre el estado de salud y el porcentaje de peso corporal ideal? Prepara
una interpretación verbal de los resultados de tu análisis y compara tus resultados con los de tus compañeros de
clase.
REFERENCIAS
Referencias de metodología
1. segundoRUCELBOWERMANy RICHARDA'CONNELL,Modelos Estadísticos Lineales: Un Enfoque Aplicado,2ª ed. PWS-Kent
Publishing, Boston, 1990.
2. DÁVIDOWHOSMERy STANLEYLEMESHOW,Regresión logística aplicada,2ª ed. Wiley, Nueva York, 2000.
3. DÁVIDOG KLEINBAUM,Regresión logística: un texto de autoaprendizaje,Nueva York, Springer, 1994.
4. República DominicanaBUEYy EJ S.NELL,Análisis de Datos Binarios,2ª ed. Chapman and Hall/CRC, Nueva York, 1989.
5. NJ NAGELKERKE, “Nota sobre una definición general del coeficiente de determinación”,Biometrika, 78 (1991), 691–
692.
Aplicaciones Referencias
A-1. Centro Estatal de Estadísticas de Salud de Carolina del Norte e Instituto Howard W. Odum para la Investigación en Ciencias Sociales de la
Universidad de Carolina del Norte en Chapel Hill, datos de nacimiento establecidos para 2001 encontrados enwww.irss.unc.edu/ncvital/
bfd1down.html. Todo el muestreo y la codificación realizados por John Holcomb y no representan los hallazgos del Centro o Instituto.
A-4. METROO YOJ. K.RANTZ, ILANAB.KUTINSKY, AÚLTIMA ESCALERADROBERTSON, y PHILIPSMEHLER, "Efectos de la metadona relacionados con la dosis
en la prolongación del intervalo QT en una serie de pacientes con Torsade de Pointes",Farmacoterapia, 23 (2003), 802–805.
A-5. ROBERTOA. R.EISS, CURTISEHSAA, DEBORÁL. G.RIFFIS, BERNADETTEPAGORTER, y MARIOANNTARA, “Punto de atención
versus Monitoreo de Laboratorio de Pacientes que Reciben Diferentes Terapias Anticoagulantes,”Farmacoterapia 22, (2002),
677–685.
A-6. GRAMOWisconsin-RYUNGSEN, mSÍL. W.YKLEy J.ACLENEAZAUSZNIEWSKI, “Cuidadores de niños adultos coreanos de adultos
mayores con demencia”,Revista de Enfermería Gerontológica, 29 (2003), 19–28.
A-7. MNAEIJE, “Factores Antropométricos y Cinemáticos Locales Relacionados con la Apertura Máxima de la Boca en
Individuos Sanos,”Revista de Rehabilitación Oral, 29 (2002), 534–539.
A-8. DanielFCONNOR, RONALDJ. S.TEINGARD, jENNIFERJ. A.NDERSONy RICHARDH. M.ELONI, “Diferencias de género en
Agresión reactiva y proactiva”,Psiquiatría infantil y desarrollo humano, 33 (2003), 279–294.
A-9. DanielHLAMETROONT, mATTEOJBUDOFF, DÁVIDOEMHAVELLE, ROBERTOSHAVELLE, BRUCEHBRENDIMIENTOy J.AMÉS
MHAGAR, "La exploración de calcio coronario agrega valor incremental a los pacientes con pruebas de esfuerzo positivas",
Diario americano del corazón, 143 (2002), 861–867.
A-10. ROBYNGRAMOALLAGHER, SharónMETROCkINLEYy kATLETADRACUP, “Predictores de la Asistencia de las Mujeres a los Programas
de Rehabilitación Cardiaca,”Avances en Enfermería Cardiovascular, 18 (2003), 121–126.
A-11. jOHNHPORCERELLI, ROSEMARIOCOGAN, PAGATRICIAP. W.est, miENANOA. R.OSE, DARISTALAMBRECHE, kARÉNE. W.ILSON,
RICHARDKSEVERSON, y DUNÍAkARANA, “Vitimización violenta de mujeres y hombres: síntomas físicos y
psiquiátricos”,Revista de la Junta Estadounidense de Medicina Familiar, 16 (2003), 32–39.
A-12. DEBRAAJANSEN, y MARIOLkELLER, “Función cognitiva en mujeres ancianas que viven en la comunidad”,Revista de
Enfermería Gerontológica, 29 (2003), 34–43.
A-13. METROARIAMETROATIASy el Centro de Consulta Estadística de la Universidad Estatal de Wright.
A-14. SPYROSKGOLFINOPOULOSy GEORGEB.ARONDITISIS, "Modelos de regresión múltiple: una metodología para evaluar las
concentraciones de trihalometano en el agua potable a partir de las características del agua sin tratar"Quimiosfera,
47 (2002), 1007–1018.
A-15. YTAkata, TANSAI, SAWANO, THAMASAKI, Y. YOSHITAKE, Y. K.IMURA, K. S.ONOKI, MWAkisaka, M. F.UKUHARA,
y T. T.AKEHARA, "Relación de la aptitud física con la masticación en una población de 80 años de edad",Enfermedades bucales, 10
(2004), 44–49.
A-16. G. V.ARELA, N.NOVOA, MFJYO ME -NEZy G. S.ANTOS, “Aplicabilidad del riesgo de regresión logística (LR)
Modelado para la toma de decisiones en la resección del cáncer de pulmón”,Cirugía cardiovascular y torácica interactiva, 2 (
2003), 12–15.
A-17. CH DAVIES, N. F.ERRARA, y SEHardiendo, “b-La función de los receptores adrenérgicos cambia con la edad del sujeto en los
miocitos de un ventrículo humano que no falla.Investigación cardiovascular, 31 (1996), 152–156.
A-18. WILLIAMLHAYTON, jOHANNESkNEER, RONALDGRAMORAÍZy kLAÚSSTOECKEL, “Influencia de la maduración y el crecimiento en la
farmacocinética de cefetamet pivoxil: dosificación racional para lactantes”Agentes antimicrobianos y quimioterapia,
40 (1996), 567–574.
A-19. WLHAYTON, CRUDOALSTAD, E. T.HURMANN-NORTEIELSEN, TKUFAAS, J. K.NEER, RJ AMBROS, SUUGSTAD, E. M.ONN,
EBEXTRAÑOy K. S.TOECKEL, “Farmacocinética de cefetamet intravenoso y cefetamet pivoxil oral en niños,”
Agentes antimicrobianos y quimioterapia, 35 (1991), 720–725. Errata,36 (1992), 2575.
A-20. MPDUCHARME, DJEPREMIOS, PJMCnorteAMARAy K. S.TOECKEL, “Biodisponibilidad de formulaciones de jarabe y
tabletas de cefetamet pivoxil,”Agentes antimicrobianos y quimioterapia, 37 (1993), 2706–2709.
A-21. METROARIE-LOURDESFILS-AYO ME, mICHAELJ. E.CKARDT, DÁVIDOTGEORGE, gERALDLBFILA, ICAMIONETAMETROESFUERZO, y MARKKU
LINNOILA, "Los alcohólicos de inicio temprano tienen niveles más bajos de ácido 5-hidroxiindolacético en el líquido cefalorraquídeo que los
alcohólicos de inicio tardío",Archivos de Psiquiatría General, 53 (1996), 211–216.
A-22. T. A.brahamsson, V. N.ERMÉ, EMTRO €MQVIST, B. A.KERBLOM, A. L.EGNEHED, K. P.ETTERSONy A. W.ESTÁNmiRIKSSON,
“Efecto antitrombótico del inhibidor de PAI-1 en ratas que recibieron endotoxina”,Trombosis y hemostasia, 75 (1996), 118–126.
A-23. DÁVIDOBPOÍDOy JTSYLVESTER, "Lesión vascular en pulmones aislados de ovejas: papel de la isquemia, la perfusión
extracorpórea y el oxígeno"American Journal of Respiratory and Critical Care Medicine, 153 (1996), 196–202.
A-24. miMMANUELBALZAMO, PAGIERREjOANNY, jEANGRAMOUILLAUMESTEINBERG, CHARLESOHÍGADO, y YVESjAMMÉS, "Mecánico
La ventilación aumenta la concentración de la sustancia P en los nervios vago, simpático y frénico.American
Journal of Respiratory and Critical Care Medicine, 153 (1996), 153–157.
A-25. METROICHAELS. S.ANIMANDOAy CHARLESH ZEANAH, “Expresión de síntomas y variables traumáticas en niños menores
de 48 meses”,Revista de salud mental infantil, 16 (1995), 259–270.
REFERENCIAS 599
A-26. miITHNEMETROULLOYy WALTERARTMCnorteICOLAS, “Ventilación e intercambio de gases durante el sueño y el ejercicio en la EPOC
grave”Cofre, 109 (1996), 387–394.
A-27. norteANCYCGYURCSIK, PAGAULAESTABROOKS, y MELISAJ. F.RAHM-TEMPLAR, "Metas relacionadas con el ejercicio y la autoeficacia
como correlatos del ejercicio acuático en personas con artritis",Investigación y atención de la artritis, 49 (2003), 306–
313.
A-28. TKSOYRODEHURST, "La intención de los maestros de escuelas primarias rurales de manejar a los niños con síntomas de asma",
Enfermería Pediátrica, 29 (2003), 184-194.
CAPÍTULO 12
EL CHI-CUADRADO
DISTRIBUCIÓN Y ANÁLISIS DE
FRECUENCIAS
Este capítulo explora las técnicas que se usan comúnmente en el análisis de datos de
conteo o frecuencia. Los usos de la distribución chi-cuadrado, que se mencionó
brevemente en el Capítulo 6, se analizan e ilustran con mayor detalle. Además, las
técnicas estadísticas que se utilizan con frecuencia en los estudios epidemiológicos
se presentan y demuestran por medio de ejemplos.
TEMAS
12.1INTRODUCCIÓN
12.2LAS PROPIEDADES MATEMÁTICAS DE LA DISTRIBUCIÓN CHI-CUADRADO
12.3PRUEBAS DE BONDAD DE AJUSTE
12.4PRUEBAS DE INDEPENDENCIA
12.5PRUEBAS DE HOMOGENEIDAD
12.8RESUMEN
600
12.2 LAS PROPIEDADES MATEMÁTICAS DE LA DISTRIBUCIÓN CHI-CUADRADO 601
12.1 INTRODUCCIÓN
En los capítulos sobre estimación y prueba de hipótesis, se hace una breve mención de la
distribución chi-cuadrado en la construcción de intervalos de confianza y la prueba de hipótesis
relativas a la varianza de una población. Esta distribución, que es una de las distribuciones más
utilizadas en aplicaciones estadísticas, tiene muchos otros usos. Algunas de las más comunes se
presentan en este capítulo junto con una descripción más completa de la distribución en sí, que
sigue en la siguiente sección.
La distribución de chi-cuadrado es la técnica estadística empleada con más
frecuencia para el análisis de datos de conteo o frecuencia. Por ejemplo, podemos
saber de una muestra de pacientes hospitalizados cuántos son hombres y cuántos
son mujeres. Para la misma muestra, también podemos saber cuántos tienen
cobertura de seguro privado, cuántos tienen seguro de Medicare y cuántos reciben
asistencia de Medicaid. Es posible que deseemos saber, para la población de la que
se extrajo la muestra, si el tipo de cobertura de seguro difiere según el género. Para
otra muestra de pacientes, podemos tener frecuencias para cada categoría de
diagnóstico representada y para cada área geográfica representada. Quizá
queramos saber si en la población de la que se extrajo el mismo existe una relación
entre zona de residencia y diagnóstico.
Hay otras técnicas estadísticas que se pueden usar para analizar datos de frecuencia en un esfuerzo
por responder otros tipos de preguntas. En este capítulo también aprenderemos acerca de estas técnicas.
yi-metro
z i¼ (12.2.1)
s
Cada valor dezpuede elevarse al cuadrado para obtenerz2. Cuando investigamos la distribución
muestral dez2, encontramos que sigue una distribución chi-cuadrado con 1 grado de libertad. Eso es,
- y -metro-2
Xd1Þ
2 ¼ ¼z2
s
valor deya la variable normal estándarzy cuadrado como antes. Si los valores resultantes dez2
para cada muestra se suman, podemos designar esta suma por
- y1-metro-2 - y-metro-2
2
Xd2Þ
2 ¼ þ ¼z21þz2 2
s s
1 1 tudk=2Þ-1mi-dtu=2Þ;
Fdtu¼ 2k=2 tu >0
k (12.2.3)
- 1 !
2
Las formas de las distribuciones chi-cuadrado para varios valores dekse muestran en la figura
6.9.1. Observamos en esta figura que las formas parak¼1 yk¼2 son bastante diferentes de la forma
general de la distribución parak >2. También vemos en esta figura que chi-cuadrado asume valores
entre 0 e infinito. No puede tomar valores negativos, ya que es la suma de valores que se han elevado
al cuadrado. Una última característica de la distribución de chi-cuadrado que vale la pena señalar es
que la suma de dos o más variables independientes de chi-cuadrado también sigue una distribución
de chi-cuadrado.
sentido restringido. Lo usamos para referirnos a una comparación de una distribución de muestra con
alguna distribución teórica que se supone describe la población de la que proviene la muestra. La
justificación de nuestro uso de la distribución en estas situaciones se debe a Karl Pearson (1), quien
demostró que la distribución chi-cuadrado puede usarse como una prueba de la concordancia entre la
observación y la hipótesis siempre que los datos estén en forma de frecuencias. . Un tratamiento
extenso de la distribución chi-cuadrado se encuentra en el libro de Lancaster (2). Nikulin y Greenwood
(3) ofrecen consejos prácticos para realizar pruebas de chi-cuadrado.
La estadística de prueba de chi-cuadrado El estadístico de prueba para las pruebas de chi-cuadrado que
discutir en este capítulo es
" #
X dOi- mi2iÞ
X2¼ (12.2.4)
mii
igual a cero para cada par de frecuencias observadas y esperadas. Tal resultado daría un
valor deX2igual a cero, y seríamos incapaces de rechazarH0.
Cuando hay desacuerdo entre las frecuencias observadas y las frecuencias que uno esperaría
dado queH0es cierto, al menos uno de losOi- miitérminos en la Ecuación 12.2.4 será un número
distinto de cero. En general, cuanto más pobre es el acuerdo entre losOiy elmii, mayores o más
frecuentes serán estos valores distintos de cero. Como se señaló anteriormente, si el acuerdo entre el
Oiy elmiies lo suficientemente pobre (lo que resulta en una cantidad suficientemente grandeX2
valor,) podremos rechazarH0.
Cuando hay desacuerdo entre un par de frecuencias observadas y esperadas, la
diferencia puede ser positiva o negativa, según cuál de las dos frecuencias sea mayor. Desde la
medida de acuerdo,X2, es una suma de cantidades componentes cuyas magnitudes dependen
de la diferenciaOi- mii, las diferencias positivas y negativas deben tener el mismo peso. Esto se
logra elevando al cuadrado cadaOi- miidiferencia. Dividir las diferencias al cuadrado por la
frecuencia esperada adecuada convierte la cantidad en un término que se mide en unidades
originales. Agregar estos individuosdOi- miÞ2=Eitérminos rendimientosX i 2, una estadística de
resumen que refleja el alcance de la concordancia general entre las frecuencias observadas y
esperadas.
PAG
La regla de decisiónLa cantidad ½ðOi- miiÞ 2=Eiserá pequeño si lo observado
y las frecuencias esperadas están muy juntas y serán grandes si las diferencias son grandes.
El valor calculado deX2se compara con el valor tabulado deX2conk - r grados de
libertad. La regla de decisión, entonces, es: RechazarH0siX2es mayor o igual al
tabuladoX2por el valor elegido dea.
Como hemos señalado, una prueba de bondad de ajuste es adecuada cuando se desea decidir
si una distribución de frecuencias observada es incompatible con alguna distribución
preconcebida o hipotética.
12.3 PRUEBAS DE BONDAD DE AJUSTE 605
Solución:
Colesterol
Nivel (mg/dl) Número de sujetos
100,0–124,9 1
125,0–149,9 3
150,0–174,9 8
175,0–199,9 18
200,0–224,9 6
225,0–249,9 4
250,0–274,9 4
275,0–299,9 3
Fuente: Datos proporcionados por cortesía de Carole W.
Cranor y Dale B. Christensen, "The Asheville Project: Short-
Term Outcomes of a Community Pharmacy Diabetes Care
Program"Diario de la Asociación Farmacéutica Americana,43
(2003), 149–159.
606 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
3. Hipótesis.
H0: En la población de la que se extrajo la muestra, el colesterol
los niveles se distribuyen normalmente.
HA: La población muestreada no se distribuye normalmente.
4. Estadística de prueba. La estadística de prueba es
" #
XdO
k i- mi
iÞ2
X2¼
i¼1
mii
- X¼198:67
s¼41:31
X0 X
FIGURA 12.3.1Una distribución normal que muestra la frecuencia relativa de ocurrencia de valores
menores o iguales aX0. El área sombreada representa la frecuencia relativa de ocurrencia de valores
iguales o menores queX0.
Por ejemplo, para obtener la frecuencia relativa esperada de ocurrencia de valores en el intervalo
100.0 a 124.9 se procede de la siguiente manera:
100:0 - 198:67
Elzvalor correspondiente aX¼100:0 esz¼ ¼ -2:39
41:31
125:0 - 198:67
Elzvalor correspondiente aX¼125:0 esz¼ ¼ -1:78
41:31
En la tabla D del apéndice encontramos que el área a la izquierda de -2:39 es 0,0084 y el área a
la izquierda de -1:78 es 0,0375. El área entre -1:78 y -2:39 es igual a . 0375 - .0084¼ .0291, que es
igual a la frecuencia relativa esperada de ocurrencia de los niveles de colesterol en el intervalo
de 100,0 a 124,9. Esto nos dice que si la hipótesis nula es cierta, es decir, si los niveles de
colesterol se distribuyen normalmente, debemos esperar que el 2,91 por ciento de los valores
de nuestra muestra estén entre 100,0 y 124,9. Cuando multiplicamos nuestro tamaño de
muestra total, 47, por .0291, encontramos que la frecuencia esperada para el intervalo es 1.4.
Cálculos similares darán las frecuencias esperadas para los otros intervalos como se muestra
en la Tabla 12.3.2.
zdXi-X-Þ=s en el
límite inferior Pariente esperado Esperado
Intervalo de clases de Intervalo Frecuencia Frecuencia
<100 . 0084 .4
1.8
100,0–124,9 - 2.39 . 0291 1.4
125,0–149,9 - 1.78 . 0815 3.8
150,0–174,9 - 1.18 . 1653 7.8
175,0–199,9 - . 57 . 2277 10.7
200,0–224,9 . 03 . 2269 10.7
225,0–249,9 . 64 . 1536 7.2
250,0–274,9 1.24 . 0753 3.5
275,0–299,9 1.85 . 0251 1.2
1.5
300.0 y mayor 2.45 . 0071 .3
608 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
Observado Esperado
Frecuencia Frecuencia
2
Intervalo de clases (Oi) (MIi) dOi- miiÞ =mii
<100 0 .4
1.8 . 356
100,0–124,9 1 1.4
125,0–149,9 3 3.8 . 168
150,0–174,9 8 7.8 . 005
175,0–199,9 18 10.7 4.980
200,0–224,9 6 10.7 2.064
225,0–249,9 4 7.2 1.422
250,0–274,9 4 3.5 . 071
275,0–299,9 3 1.2
1.5 1.500
300.0 y 0 .3
mayor que
Total 47 47 10.566
12.3 PRUEBAS DE BONDAD DE AJUSTE 609
AlternativasAunque uno encuentra con frecuencia en la literatura el uso de chi cuadrado para
probar la normalidad, no es la prueba más apropiada para usar cuando la distribución hipotética es
continua. La prueba de Kolmogorov-Smirnov, descrita en el capítulo 13, se diseñó especialmente para
pruebas de bondad de ajuste que involucran distribuciones continuas.
Número de
Número de pacientes medicos Número total de pacientes
De 25 que prefieren reportando esto Prefiriendo el dolor nuevo
un nuevo analgésico Número Relevista por Doctor
0 5 0
1 6 6
2 8 dieciséis
3 10 30
4 10 40
5 15 75
6 17 102
7 10 70
8 10 80
9 9 81
10 o más 0 0
Nos interesa determinar si estos datos son o no compatibles con la hipótesis de que
fueron extraídos de una población que sigue una distribución binomial. Nuevamente,
empleamos una prueba de bondad de ajuste chi-cuadrado.
Solución: Dado que el parámetro binomial,pag,no se especifica, debe estimarse a partir de los
datos de la muestra. Un total de 500 pacientes de los 2500 pacientes que participaron
en el estudio dijeron que preferían el nuevo analgésico, por lo que nuestra estimación
puntual depages p̂¼500=2500¼ .20. Las frecuencias relativas esperadas se pueden
obtener evaluando la función binomial
FdX¼25CXd.2ÞXd.8Þ25-X
Fd0¼25Cod:2Þod:8Þ25-o
Esto se puede hacer más fácilmente consultando la Tabla B del Apéndice, donde vemos que
PAGdX¼0Þ ¼ .0038. La frecuencia relativa de ocurrencia de muestras de tamaño 25 en las
que ningún paciente prefiere el nuevo analgésico es .0038. Para obtener la frecuencia
esperada correspondiente, multiplicamos .0038 por 100 para obtener .38. Cálculos similares
producen las frecuencias esperadas restantes que, junto con las frecuencias observadas, se
muestran en la Tabla 12.3.5. Vemos en esta tabla
Número de
Número de Informes de médicos
Pacientes de 25 que Este número Esperado
prefieren nuevos dolores (Observado Relativo Esperado
calmante Frecuencia,Oi) Frecuencia Frecuenciamii
0 5 . 0038 . 38
11 2.74
1 6 . 0236 2.36
2 8 . 0708 7.08
3 10 . 1358 13.58
4 10 . 1867 18.67
5 15 . 1960 19.60
6 17 . 1633 16.33
7 10 . 1109 11.09
8 10 . 0623 6.23
9 9 . 0295 2.95
10 o más 0 . 0173 1.73
que la primera frecuencia esperada es menor que 1, por lo que seguimos la sugerencia de
Cochran y combinamos este grupo con el segundo grupo. Cuando hacemos esto, todas las
frecuencias esperadas son mayores que 1.
A partir de los datos, calculamos
1 2 24 5 47 4 70 3
2 3 25 3 48 2 71 5
3 4 26 2 49 2 72 4
4 5 27 4 50 3 73 1
5 3 28 4 51 4 74 1
6 2 29 3 52 2 75 6
7 3 30 5 53 3 76 3
8 0 31 1 54 1 77 3
9 1 32 3 55 2 78 5
10 0 33 2 56 3 79 2
11 1 34 4 57 2 80 1
12 0 35 2 58 5 81 7
13 6 36 5 59 2 82 7
14 4 37 0 60 7 83 1
15 4 38 6 61 8 84 5
dieciséis 4 39 4 62 3 85 1
(Continuación)
612 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
17 3 40 4 63 1 86 4
18 4 41 5 64 3 87 4
19 3 42 1 sesenta y cinco 1 88 9
20 3 43 3 66 0 89 2
21 3 44 1 67 3 90 3
22 4 45 2 68 2
23 3 46 3 69 1
Solución: Para obtener las frecuencias esperadas, primero obtenemos las frecuencias relativas
esperadas evaluando la función de Poisson dada por la Ecuación 4.4.1 para cada
entrada en la columna de la izquierda de la Tabla 12.3.7. Por ejemplo, la primera
frecuencia relativa esperada se obtiene evaluando
mi-330
Fd0¼
0!
Podemos usar la Tabla C del Apéndice para encontrar esta y todas las demás frecuencias
relativas esperadas que necesitamos. Cada una de las frecuencias relativas esperadas
Número de
Número de Días Este Número
Admisiones de emergencia de emergencia
en un día Admisiones Ocurridas
0 5
1 14
2 15
3 23
4 dieciséis
5 9
6 3
7 3
8 1
9 1
10 o más 0
Total 90
12.3 PRUEBAS DE BONDAD DE AJUSTE 613
Número de
Número de Días este Esperado
Emergencia Número Relativo Esperado dOi- miiÞ2
admisiones Ocurrió,Oi Frecuencia Frecuencia mii
" #
XdOi- mi iÞ
2
d5 - 4:50Þ2 d2 - 1:08Þ2
X2¼ ¼ þ þ ¼3:664
mii 4:50 1:08
También observamos que las últimas tres frecuencias esperadas son menores que 1,
por lo que deben combinarse para evitar tener frecuencias esperadas menores que 1.
Esto significa que solo tenemos nueve categorías efectivas para calcular los grados de
libertad. Dado que el parámetro,yo,se especificó en la hipótesis nula, no perdemos un
grado de libertad por razones de estimación, por lo que los grados de libertad
apropiados son 9 - 1¼8. Al consultar la Tabla F del Apéndice, encontramos que el valor
crítico deX2para 8 grados de libertad y a¼ .05 es 15,507, por lo que no podemos
rechazar la hipótesis nula en el nivel de 0,05 o, en realidad, en cualquier nivel
razonable de significación (pag > .10). Concluimos, por lo tanto, que las admisiones de
emergencia en este hospital pueden seguir una distribución de Poisson conyo¼3. Al
menos los datos observados no arrojan ninguna duda sobre esa hipótesis.
Solución:
XdOi- mi iÞ2
X2¼
mii
Número de
Casos Reportados
Mes de la gripe
diciembre de 2005 62
enero de 2006 84
febrero de 2006 17
marzo de 2006 dieciséis
abril de 2006 21
Total 200
Fuente:http://www.southernnevadahealthdistrict.org/
epidemiology/disease_statistics.htm.
12.3 PRUEBAS DE BONDAD DE AJUSTE 615
40
30
20
10
0
Categoría 1 2 3 4 5
Prueba Contribución
EJEMPLO 12.3.5
Se cree que cierto rasgo humano se hereda de acuerdo con la proporción 1:2:1 para
homocigotos dominantes, heterocigotos y homocigotos recesivos. Un examen de una muestra
aleatoria simple de 200 individuos arrojó la siguiente distribución del rasgo: dominante, 43;
heterocigotos, 125; y recesivo, 32. Deseamos saber si estos datos aportan suficiente evidencia
para poner en duda la creencia sobre la distribución del rasgo.
Solución:
" #
XdO-EÞ2
X2¼
mi
EJERCICIOS
12.3.1La siguiente tabla muestra la distribución de las determinaciones de ácido úrico realizadas en 250 pacientes.
Pruebe la bondad de ajuste de estos datos a una distribución normal conmetro¼5:74 ys¼2:01. Dejara¼ .01.
<1 1 6 a 6,99 45
1 a 1,99 5 7 a 7.99 30
2 a 2,99 15 8 a 8.99 22
3 a 3,99 24 9 a 9.99 10
4 a 4,99 43 10 o más 5
5 a 5,99 50
Total 250
12.3.2Los siguientes datos se recopilaron en 300 niñas de ocho años. Pruebe, al nivel de significancia de .05,
la hipótesis nula de que los datos se extraen de una población normalmente distribuida. La media muestral y
la desviación estándar calculadas a partir de datos agrupados son 127,02 y 5,08.
Total 300
12.3.3La hoja frontal de los registros de los pacientes que se mantiene en un departamento de salud local contiene 10 entradas.
Una muestra de 100 registros reveló la siguiente distribución de entradas erróneas:
Número de erróneos
Entradas de 10 Número de registros
0 8
1 25
2 32
3 24
4 10
5 o más 1
Total 100
618 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
Pruebe la bondad de ajuste de estos datos a la distribución binomial conpag¼ .20. Encuentra elpagvalor para esta
prueba.
12.3.4En un estudio realizado por Byers et al. (A-2), los investigadores probaron un modelo de Poisson para la distribución de
las puntuaciones de las actividades de la vida diaria (AVD) después de un programa de prehabilitación de 7 meses
diseñado para prevenir el deterioro funcional entre las personas mayores físicamente frágiles que viven en la
comunidad. ADL midió la capacidad de las personas para realizar tareas esenciales, como caminar dentro de la casa,
bañarse, vestirse la parte superior e inferior del cuerpo, trasladarse de una silla, ir al baño, alimentarse y arreglarse.
El método de calificación utilizado en este estudio asignó un valor de 0 para ninguna ayuda (personal) y ninguna
dificultad, 1 para dificultad pero sin ayuda y 2 para ayuda independientemente de la dificultad. Las puntuaciones se
sumaron para producir una puntuación global que oscilaba entre 0 y 16 (para ocho tareas). Hubo 181 sujetos que
completaron el estudio. Supongamos que usamos el método de puntuación de los autores para evaluar el estado de
otro grupo de 181 sujetos en relación con sus actividades de la vida diaria. Supongamos que se obtuvieron los
siguientes resultados.
0 74 11.01 7 4 2.95
1 27 30.82 8 3 1.03
2 14 43.15 9 2 0.32
3 14 40.27 10 3 0.09
4 11 28.19 11 4 0.02
5 7 15.79 12 o más 13 0.01
6 5 7.37
Fuente: Datos hipotéticos basados en el procedimiento informado por Amy L. Byers, Heather
Allore, Thomas M. Gill y Peter N. Peduzzi, “Application of Negative Binomial Modeling for Discrete
Outcomes: A Case Study in Aging Research”Revista de Epidemiología Clínica, 56 (2003), 559–564.
Pruebe la hipótesis nula de que estos datos se extrajeron de una distribución de Poisson conyo¼2:8. Dejar a
¼ .01.
12.3.5Los siguientes son los números de un organismo particular encontrado en 100 muestras de agua de un
estanque:
0 15 4 5
1 30 5 4
2 25 6 1
3 20 7 0
Total 100
Pruebe la hipótesis nula de que estos datos se extrajeron de una distribución de Poisson. Determina elpagvalor para
esta prueba.
12.4 PRUEBAS DE INDEPENDENCIA 619
12.3.6Un equipo de investigación realizó una encuesta en la que los sujetos eran fumadores adultos. A cada sujeto de una
muestra de 200 se le pidió que indicara en qué medida estaba de acuerdo con la afirmación: “Me gustaría dejar de
fumar”. Los resultados fueron los siguientes:
¿Se puede concluir sobre la base de estos datos que, en la población muestreada, las opiniones no se
distribuyen por igual en los cuatro niveles de acuerdo? Sea .05 la probabilidad de cometer un error tipo I y
encuentre elpagvalor.
Otro uso, y quizás el más frecuente, de la distribución chi-cuadrado es probar la hipótesis nula de que
dos criterios de clasificación, cuando se aplican al mismo conjunto de entidades, son independientes.
Decimos que dos criterios de clasificación son independientes si la distribución de un criterio es la
misma sin importar cuál sea la distribución del otro criterio. Por ejemplo, si el nivel socioeconómico y
el área de residencia de los habitantes de una determinada ciudad son independientes, esperaríamos
encontrar la misma proporción de familias en los grupos socioeconómicos bajo, medio y alto en todas
las áreas de la ciudad.
Segundo
criterio de Primer Criterio del Nivel de Clasificación
Clasificación
Nivel 1 2 3 ... C Total
.. .. ..
. . ... ... ... ... .
r norter1 norter2 norter3 ... norterc norter:
Segundo
criterio de Primer Criterio del Nivel de Clasificación
Clasificación
Nivel 1 2 3 ... C Total
- n1:--n .1-
norte norte
Para obtener la frecuencia esperada para la Celda 11, multiplicamos esta probabilidad por el número
total de sujetos,norte.Es decir, la frecuencia esperada para la Celda 11 viene dada por
- n -- -
1: norte. 1
dnorteÞ
norte norte
dnorte1:Þðnorte.1Þ
norte
Entonces, en general, vemos que para obtener la frecuencia esperada para una celda dada,
multiplicamos el total de la fila en la que se encuentra la celda por el total de la columna en la que se
encuentra la celda y dividimos el producto por el gran total.
12.4 PRUEBAS DE INDEPENDENCIA 621
EJEMPLO 12.4.1
En 1992, el Servicio de Salud Pública de EE. UU. y los Centros para el Control y la Prevención de
Enfermedades recomendaron que todas las mujeres en edad fértil consuman 400metrog de ácido
fólico al día para reducir el riesgo de tener un embarazo afectado por un defecto del tubo neural
como la espina bífida o la anencefalia. En un estudio de Stepanuk et al. (A-3), 693 gestantes llamaron a
un servicio de información teratológica sobre el uso de suplementos de ácido fólico. Los
investigadores querían determinar si el uso de ácido fólico antes de la concepción y la raza son
independientes. Los datos aparecen en la Tabla 12.4.3.
Solución:
Sí No Total
3. Hipótesis.
H0: La raza y el uso de ácido fólico antes de la concepción son independientes. H
A: Las dos variables no son independientes.
Dejara¼ .05.
" #
Xk dOi- miiÞ2
X2¼
i¼1
mii
Sí No Total
Análisis informáticoLa computadora se puede usar con ventaja para calcularX2para pruebas
de independencia y pruebas de homogeneidad. La figura 12.4.1 muestra el procedimiento y la
impresión del ejemplo 12.4.1 cuando el programa MINITAB para calcularX2de tablas de
contingencia. Los datos se ingresaron en las Columnas 1 y 2 de MINITAB, correspondientes a
las columnas de la Tabla 12.4.3.
Podemos usar SAS®para obtener un análisis y una impresión de los datos de la tabla de
contingencia utilizando la sentencia PROC FREQ. La Figura 12.4.2 muestra un SAS parcial®impresión
que refleja el análisis de los datos del ejemplo 12.4.1.
Datos:
C1: 260 15 7
C2: 299 41 14
Producción:
C1 C2 Total
1 260 299 559
247.86 311.14
2 15 41 56
24.83 31.17
3 7 14 21
9.31 11.69
FIGURA 12.4.1Procedimiento MINITAB y salida para el análisis de chi-cuadrado de datos en la Tabla 12.4.3.
624 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
El S.A.S. Sistema
El FRECUENCIA Procedimiento
carrera fólico
Frecuencia
Por ciento
Fila porcentaje
Tenga en cuenta que el SAS®La impresión muestra, en cada celda, el porcentaje que representa la
frecuencia de celda del total de su fila, su total de columna y el total general. También se muestra, para cada
total de fila y columna, el porcentaje que representa el total del total general. Además deX2estadística, SAS®
da el valor de varias otras estadísticas que se pueden calcular a partir de los datos de la tabla de
contingencia. Uno de ellos, el estadístico chi-cuadrado de Mantel-Haenszel, se analizará en una sección
posterior de este capítulo.
La tabla de contingencia 2 - 2A veces, cada uno de los dos criterios de clasificación puede
dividirse en solo dos categorías o niveles. Cuando los datos se clasifican de esta manera, el
resultado es una tabla de contingencia que consta de dos filas y dos columnas. Tal tabla se
conoce comúnmente como una tabla 2 - 2. El valor deX2puede calcularse calculando primero las
frecuencias de celda esperadas de la manera discutida anteriormente. Sin embargo, en el caso
de una tabla de contingencia 2 - 2,X2puede calcularse mediante la siguiente fórmula abreviada:
nortedanuncio - acÞ2
X2¼ (12.4.1)
daþCÞðbþdÞðaþbÞðCþdÞ
dóndea B C,ydson las frecuencias de celda observadas como se muestra en la Tabla 12.4.5.
Cuando aplicamos eldr-1ÞðC -1Þregla para hallar grados de libertad en una tabla 2 - 2, el
resultado es 1 grado de libertad. Ilustremos esto con un ejemplo.
1 a b aþb
2 C d Cþd
EJEMPLO 12.4.2
Según Silver y Aiello (A-4), las caídas son motivo de gran preocupación entre los supervivientes de la poliomielitis. Los
investigadores querían determinar el impacto de una caída en los cambios de estilo de vida. La Tabla 12.4.6 muestra
los resultados de un estudio de 233 sobrevivientes de polio sobre si el miedo a caerse resultó en cambios en el estilo
de vida.
Solución:
" #
Xk dOi- miiÞ2
X2¼
i¼1
mii
233½ð131Þð36Þ - ð52Þð14Þ2
X2¼ ¼31:7391
d145Þð88Þð183Þð50Þ
TABLA 12.4.6 Tabla de contingencia para los datos del ejemplo 12.4.2
Sí No Total
Fuente: JK Silver y DD Aiello, “Polio Survivors: Falls and Subsecuente Injuries,” Revista
estadounidense de medicina física y rehabilitación, 81 (2002), 567–570.
12.4 PRUEBAS DE INDEPENDENCIA 627
norteDJanuncio - acj-.5norteÞ2
X2corregido¼ (12.4.2)
daþCÞðbþdÞðaþbÞðCþdÞ
En general, se acepta que no es necesaria ninguna corrección para las tablas de contingencia más
grandes. Aunque la corrección de Yates para las tablas 2 - 2 se ha utilizado mucho en el pasado, los
investigadores más recientes han cuestionado su uso. Como resultado, algunos médicos
desaconsejan su uso.
Podemos, como cuestión de interés, aplicar la corrección a nuestro ejemplo actual.
Usando la Ecuación 12.4.2 y los datos de la Tabla 12.4.6, podemos calcular
Como era de esperar, con una muestra tan grande, la diferencia en los dos resultados no es
dramática.
1.Se selecciona una sola muestra de una población de interés y los sujetos u objetos se clasifican
de forma cruzada sobre la base de las dos variables de interés.
2.El fundamento para calcular las frecuencias de celda esperadas se basa en la ley de
probabilidad, que establece que si dos eventos (aquí los dos criterios de clasificación) son
independientes, la probabilidad de que ocurran juntos es igual al producto de sus
probabilidades individuales.
3.Las hipótesis y conclusiones se expresan en términos de la independencia (o falta de
independencia) de dos variables.
628 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
EJERCICIOS
En los ejercicios que siguen, realice la prueba al nivel de significación indicado y determine lapag
valor.
12.4.1En el estudio de Silver y Aiello (A-4) citado en el Ejemplo 12.4.2, un objetivo secundario fue determinar si la
frecuencia de las caídas era independiente del uso de la silla de ruedas. La siguiente tabla proporciona los
datos de caídas y uso de silla de ruedas entre los sujetos del estudio.
Sí No
Fallers 62 121
no caídas 18 32
Fuente: JK Silver y DD Aiello, “Polio Survivors: Falls and
Subsecuente Injuries,”Revista estadounidense de medicina física y
rehabilitación, 81 (2002), 567–570.
¿Estos datos proporcionan evidencia suficiente para garantizar la conclusión de que el uso de sillas de ruedas y las caídas están
12.4.2La infección del sitio quirúrgico esternal (SSI) después de la cirugía de injerto de derivación de la arteria coronaria es una complicación que
aumenta la morbilidad del paciente y los costos para los pacientes, los pagadores y el sistema de atención médica.
Segal y Anderson (A-5) realizaron un estudio que examinó dos tipos de preparación preoperatoria de la piel antes de
realizar una cirugía a corazón abierto. Estas dos preparaciones utilizaron yodo acuoso y yodo insoluble con los
siguientes resultados.
Comparación de Acuoso
y preparaciones insolubles
yodo acuoso 14 94
yodo insoluble 4 97
Fuente: Cynthia G. Segal y Jacqueline J. Anderson, “Preoperatorio de preparación de
la piel de pacientes cardíacos”Revista AORN, 76 (2002), 821–827.
¿Estos datos proporcionan suficiente evidencia en ela¼ .05 nivel para justificar la conclusión de que el tipo de
preparación de la piel y la infección están relacionados?
12.4.3Los efectos secundarios de los medicamentos antiinflamatorios no esteroideos (AINE) incluyen problemas
relacionados con la úlcera péptica, la función renal y la enfermedad hepática. En 1996, el Colegio Americano
de Reumatología emitió y difundió pautas que recomendaban pruebas de referencia (CBC, panel hepático y
pruebas renales) al prescribir AINE. Rothenberg y Holcomb (A-6) realizaron un estudio para determinar si los
médicos que participaban en una base de datos nacional de registros médicos computarizados realizaban las
pruebas de referencia recomendadas cuando recetaban AINE. Los investigadores clasificaron a los médicos
del estudio en cuatro categorías: los que practican medicina interna, medicina familiar, medicina familiar
académica y grupos de múltiples especialidades. Los datos aparecen en la siguiente tabla.
EJERCICIOS 629
Pruebas de referencia
¿Los datos anteriores brindan suficiente evidencia para que concluyamos que el tipo de práctica y el desempeño de
las pruebas de referencia están relacionados? Usara¼ .01.
12.4.4Boles y Johnson (A-7) examinaron las creencias de los adolescentes sobre el tabaquismo y el peso. Los
encuestados clasificaron su peso en tres categorías: bajo peso, sobrepeso o apropiado. El estado de
tabaquismo se clasificó de acuerdo con la respuesta a la pregunta: "¿Actualmente fuma, es decir, uno o más
cigarrillos por día?" La siguiente tabla muestra los resultados de un estudio telefónico de adolescentes en el
grupo de edad de 12 a 17 años.
De fumar
Sí No
bajo peso 17 97
Exceso de peso 25 142
Adecuado 96 816
Fuente: Sharon M. Boles y Patrick B. Johnson, "Gender, Weight Concerns, and Adolescent
Smoking"Revista de enfermedades adictivas, 20 (2001), 5–14.
¿Proporcionan los datos suficiente evidencia para sugerir que la percepción del peso y el tabaquismo están
relacionados en los adolescentes?a¼ .05.
12.4.5Una muestra de 500 estudiantes universitarios participó en un estudio diseñado para evaluar el nivel de conocimiento de los
estudiantes universitarios sobre un determinado grupo de enfermedades comunes. La siguiente tabla muestra a los
estudiantes clasificados por mayor área de estudio y nivel de conocimiento del grupo de enfermedades:
Conocimiento de Enfermedades
¿Estos datos sugieren que existe una relación entre el conocimiento del grupo de enfermedades y el principal
campo de estudio de los estudiantes universitarios de los que se extrajo la presente muestra? Dejara¼ .05.
12.4.6La siguiente tabla muestra los resultados de una encuesta en la que los sujetos fueron una muestra de 300 adultos
residir en un área metropolitana determinada. Se pidió a cada sujeto que indicara cuál de las tres políticas
favorecían con respecto a fumar en lugares públicos.
630 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
Política favorecida
Graduado de la Universidad 5 44 23 3 75
Graduado de preparatoria 15 100 30 5 150
Graduado de la escuela primaria 15 40 10 10 75
¿Se puede concluir a partir de estos datos que, en la población muestreada, existe una relación entre el nivel
educativo y la actitud hacia el tabaquismo en lugares públicos? Dejara¼ .05.
Una característica de los ejemplos y ejercicios presentados en la última sección es que, en cada caso,
se supuso que la muestra total había sido extraída antes de clasificar las entidades de acuerdo con los
dos criterios de clasificación. Es decir, el número observado de entidades que caen en cada celda se
determinó después de extraer la muestra. Como resultado, los totales de fila y columna son
cantidades aleatorias que no están bajo el control del investigador. Pensamos en la muestra extraída
en estas condiciones como una sola muestra extraída de una sola población. En ocasiones, sin
embargo, los totales de las filas o las columnas pueden estar bajo el control del investigador; es decir,
el investigador puede especificar que se extraigan muestras independientes de cada una de varias
poblaciones. En este caso, se dice que un conjunto de totales marginales esfijado,mientras que el otro
conjunto, correspondiente al criterio de clasificación aplicado a las muestras, esaleatorio.El primer
procedimiento, como hemos visto, conduce a una prueba de independencia de chi-cuadrado. La
última situación conduce a un chi-cuadradoprueba de homogeneidad.Las dos situaciones no solo
involucran diferentes procedimientos de muestreo; conducen a diferentes preguntas e hipótesis
nulas. La prueba de independencia se refiere a la pregunta: ¿Son independientes los dos criterios de
clasificación? La prueba de homogeneidad se ocupa de la pregunta: ¿Se extraen las muestras de
poblaciones que son homogéneas con respecto a algún criterio de clasificación? En este último caso,
la hipótesis nula establece que las muestras se extraen de la misma población. A pesar de estas
diferencias en concepto y procedimiento de muestreo, las dos pruebas son matemáticamente
idénticas, como vemos cuando consideramos el siguiente ejemplo.
Cálculo de frecuencias esperadasLas categorías de fila o las categorías de columna pueden representar
las diferentes poblaciones de las que se extraen las muestras. Si, por ejemplo, se muestrean tres poblaciones,
pueden designarse como poblaciones 1, 2 y 3, en cuyo caso estas etiquetas pueden servir como encabezados
de fila o columna. Si la variable de interés tiene tres categorías, digamos,un, b,yC,estas etiquetas pueden
servir como encabezados para filas o columnas, lo que no se use para las poblaciones. Si usamos una
notación similar a la adoptada para la Tabla 12.4.2, la tabla de contingencia para esta situación, con las
columnas utilizadas para representar las poblaciones, se muestra como la Tabla 12.5.1. Antes de calcular
nuestra estadística de prueba, necesitamos las frecuencias esperadas para cada una de las celdas de la tabla
12.5.1. Si las poblaciones son realmente
12.5 PRUEBAS DE HOMOGENEIDAD 631
TABLA 12.5.1 Una tabla de contingencia para datos para una prueba
de homogeneidad de chi-cuadrado
Población
homogéneo, o, de manera equivalente, si las muestras se extraen todas de la misma población, con
respecto a las categoríasun, b,yC,nuestra mejor estimación de la proporción en la población
combinada que pertenece a la categoríaAesnorteA:= n.De la misma manera, si las tres poblaciones son
homogéneas, interpretamos que esta probabilidad se aplica a cada una de las poblaciones
individualmente. Por ejemplo, bajo la hipótesis nula,norteA. es nuestra mejor estimación de la
probabilidad de que un sujeto elegido al azar de la población combinada pertenezca a la categoríaA.
Esperaríamos, entonces, encontrarnorte.1dnorteA:=nÞde aquellos en la muestra de la población 1 para
pertenecer a la categoríaUn.2dnorteA:=nÞde aquellos en la muestra de la población 2 a pertenecer a la
categoríaA,ynorte.3dnorteA:=nÞde los de la muestra de la población 3 a pertenecer a la categoríaA.
Estos cálculos producen las frecuencias esperadas para la primera fila de la Tabla 12.5.1. Un
razonamiento y cálculos similares producen las frecuencias esperadas para las otras dos filas.
Vemos nuevamente que el procedimiento abreviado de multiplicar los totales marginales apropiados
y dividirlos por el total general produce las frecuencias esperadas para las celdas.
A partir de los datos de la tabla 12.5.1 calculamos el siguiente estadístico de prueba:
" #
XdO
k i- miiÞ2
X2¼
i¼1
mii
EJEMPLO 12.5.1
La narcolepsia es una enfermedad que implica alteraciones del ciclo sueño-vigilia. Los miembros de la
Sociedad Alemana de Migraña y Dolor de Cabeza (A-8) estudiaron la relación entre los dolores de cabeza por
migraña en 96 sujetos diagnosticados con narcolepsia y 96 controles sanos. Los resultados se muestran en la
Tabla 12.5.2. Deseamos saber si podemos concluir, sobre la base de estos datos,
Sí No Total
Sujetos narcolépticos 21 75 96
Controles saludables 19 77 96
Fuente: The DMG Study Group, "Migraña y narcolepsia idiopática: un estudio de casos y controles"
Cefalagia, 23 (2003), 786–789.
632 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
que la población con narcolepsia y las poblaciones sanas representadas por las muestras no son
homogéneas con respecto a la frecuencia de la migraña.
Solución:
Prueba de chi-cuadrado
No Sí Todo
No 77 19 96
76.00 20.00 96.00
Sí 75 21 96
76.00 20.00 96.00
1.Se identifican dos o más poblaciones de antemano y se extrae una muestra independiente
de cada una.
2.Los sujetos u objetos de muestra se colocan en categorías apropiadas de la variable de
interés.
3.El cálculo de las frecuencias esperadas de las celdas se basa en el razonamiento de que si las
poblaciones son homogéneas como se establece en la hipótesis nula, la mejor estimación de la
probabilidad de que un sujeto u objeto caiga en una categoría particular de la variable de interés se
puede obtener mediante agrupando los datos de la muestra.
dónde -pagse obtiene agrupando los datos de las dos muestras independientes disponibles para el
análisis.
Supongamos, por ejemplo, que en una prueba deH0:pag1¼pag2contraHA:pag16¼pag2, los datos de la muestra
fueron los siguientes:norte1¼100; pag1¼ .60;norte2¼120; pag2¼ .40. Cuando agrupamos los datos de la muestra
tenemos
. 60d100Þþ.40d120Þ 108
- pag¼ ¼ ¼ .4909
100þ120 220
y
. 60 - .40
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼2:95469
d.4909Þð.5091Þ d.4909Þð.5091Þ
þ
100 120
lo cual es significativo al nivel .05 ya que es mayor que el valor crítico de 1.96.
634 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
Característica Presente
Muestra Sí No Total
1 60 40 100
2 48 72 120
220½ð60Þð72Þ - ð40Þð48Þ2
X2¼ ¼8:7302
d108Þð112Þð100Þð120Þ
lo cual es significativo al nivel .05 porque es mayor que el valor crítico de 3.841. Vemos,
pues, que llegamos a la misma conclusión por ambos métodos. esto no es sorprendente
porque, como se explica en la Sección 12.2,X2 d1Þ¼z2. Tomamos nota de que 8:7302¼ ð2:95469Þ2y
eso 3:841¼ ð1:96Þ2.
EJERCICIOS
En los ejercicios que siguen, realice la prueba al nivel de significación indicado y determine lapag
valor.
12.5.1Consulte el estudio de Carter et al. [A-9], que investigó el efecto de la edad de aparición del trastorno bipolar en el curso
de la enfermedad. Una de las variables estudiadas fue la historia familiar de los sujetos. La Tabla 3.4.1 muestra la
frecuencia de antecedentes familiares de trastornos del estado de ánimo en los dos grupos de interés: edad de inicio
temprana (18 años o menos) y edad de inicio tardía (más de 18 años).
Negativo (A) 28 35 63
Trastorno bipolar (B) 19 38 57
Unipolar (C) 41 44 85
Unipolares y bipolares (D) 53 60 113
¿Podemos concluir sobre la base de estos datos que los sujetos de 18 años o menos difieren de los sujetos mayores de 18 con
respecto a los antecedentes familiares de trastornos del estado de ánimo? Dejara¼ .05.
EJERCICIOS 635
12.5.2Coughlin et al. (A-10) examinó las prácticas de detección de mama y cuello uterino de mujeres hispanas y no
hispanas en condados que se aproximan a la región fronteriza sur de EE. UU. El estudio utilizó datos de las
encuestas del Sistema de Vigilancia de Factores de Riesgo del Comportamiento de adultos de 18 años o más
realizadas en 1999 y 2000. La siguiente tabla muestra el número de observaciones de mujeres hispanas y no
hispanas que se habían realizado una mamografía en los últimos 2 años. clasificación cruzada por estado
civil.
Deseamos saber si podemos concluir sobre la base de estos datos que el estado civil y el origen étnico
(hispano y no hispano) en los condados fronterizos del sur de los Estados Unidos no son homogéneos. Dejara
¼ .05.
12.5.3Swor et al. (A-11) examinó la efectividad del entrenamiento en reanimación cardiopulmonar (RCP) en personas mayores
de 55 años. Compararon las tasas de retención de habilidades de los sujetos en este grupo de edad que completaron
un curso de instrucción de RCP tradicional con aquellos que recibieron reanimación cardiopulmonar solo con
compresiones torácicas (CC-CPR). Se evaluaron grupos independientes 3 meses después del entrenamiento.
Entre los 27 sujetos que recibieron RCP tradicional, 12 fueron calificados como competentes. En el grupo CC-CPR, 15 de 29
fueron calificados como competentes. ¿Proporcionan estos datos evidencia suficiente para que concluyamos que las dos
poblaciones no son homogéneas con respecto a la calificación de competencia 3 meses después de la capacitación? Dejara¼ .
05.
12.5.4En un estudio de contaminación del aire, se seleccionó una muestra aleatoria de 200 hogares de cada una de
dos comunidades. A un encuestado de cada hogar se le preguntó si a alguien en el hogar le molestaba o no
la contaminación del aire. Las respuestas fueron las siguientes:
Comunidad Sí No Total
I 43 157 200
Yo 81 119 200
¿Pueden los investigadores concluir que las dos comunidades difieren con respecto a la variable de interés?
Dejara¼ .05.
636 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
12.5.5En una muestra aleatoria simple de 250 trabajadores industriales con cáncer, los investigadores encontraron que 102 habían
trabajado en trabajos clasificados como de "alta exposición" con respecto a los agentes causantes de cáncer sospechosos. Del
resto, 84 habían trabajado en trabajos de “exposición moderada” y 64 no habían experimentado ninguna exposición conocida
debido a sus trabajos. En una muestra aleatoria simple independiente de 250 trabajadores industriales de la misma área que
no tenían antecedentes de cáncer, 31 trabajaban en trabajos de "alta exposición", 60 trabajaban en trabajos de "exposición
moderada" y 159 trabajaban en trabajos que no implicaban una exposición conocida a sustancias sospechosas. agentes
cancerígenos. ¿Parece a partir de estos datos que las personas que trabajan en trabajos que los exponen a posibles agentes
causantes de cáncer tienen un mayor riesgo de contraer cáncer? Dejara¼ .05.
A veces tenemos datos que se pueden resumir en una tabla de contingencia 2 - 2, pero estos datos se
derivan de muestras muy pequeñas. La prueba de chi-cuadrado no es un método de análisis
apropiado si no se cumplen los requisitos mínimos de frecuencia esperados. Si, por ejemplo,nortees
menos de 20 o sinorteestá entre 20 y 40 y una de las frecuencias esperadas es menor que 5, se debe
evitar la prueba de chi-cuadrado.
A mediados de la década de 1930, Fisher (7, 8), Irwin (9) y Yates (10) propusieron casi
simultáneamente una prueba que puede usarse cuando no se cumplen los requisitos de tamaño de la
prueba de chi-cuadrado. La prueba ha llegado a ser conocida como laPrueba exacta de Fisher.Se
llama exacto porque, si se desea, permite calcular la probabilidad exacta de obtener los resultados
observados o resultados más extremos.
Arreglo de datosCuando usamos la prueba exacta de Fisher, organizamos los datos en forma
de una tabla de contingencia 2 - 2 como la Tabla 12.6.1. Organizamos las frecuencias de tal
manera queA > By elija la característica de interés para quea=A > b=B.
Algunos teóricos creen que la prueba exacta de Fisher es apropiada solo cuando ambos totales
marginales de la tabla 12.6.1 están fijados por el experimento. Este modelo específico no parece surgir con
mucha frecuencia en la práctica. Muchos experimentadores, por lo tanto, usan la prueba cuando ambos
totales marginales no son fijos.
Con Sin
Muestra Característica Característica Total
1 a un - un A
2 b b-b B
HipótesisLas siguientes son las hipótesis nulas que se pueden probar y sus
alternativas.
1. (dos caras)
H0: La proporción con la característica de interés es la misma en ambas poblaciones;
eso es,pag1¼pag2.
HA: La proporción con la característica de interés no es la misma en ambos
poblaciones;pag16¼pag2.
2. (Unilateral)
H0: La proporción con la característica de interés en la población 1 es menor o
igual a la proporción en la población 2;pag1 pag2.
1. Prueba bilateral.Introduzca la tabla J conun, b,ya.Si el valor observado debes igual o menor
que el número entero en una columna dada, rechazarH0a un nivel de significancia igual al
doble del nivel de significación que se muestra en la parte superior de esa columna. Por
ejemplo, supongamos A¼8,B¼7,a¼7, y el valor observado debes 1. Podemos rechazar la
hipótesis nula en el 2d.05Þ ¼ .10, el 2d.025Þ ¼ .05, y el 2d.01Þ ¼ .02 niveles de
significación, pero no en el 2d.005Þ ¼ .01 nivel.
2. Prueba unilateral.Introduzca la tabla J conun, b,ya.Si el valor observado debes menor o igual que
el número entero en una columna dada, rechazarH0en el nivel de significación que se muestra
en la parte superior de esa columna. Por ejemplo, supongamos queA¼dieciséis,B¼8,a¼4, y el
valor observado debes 3. Podemos rechazar la hipótesis nula en los niveles de significancia de
.05 y .025, pero no en los niveles de .01 o .005.
dónde
b, A-a,yb - bson todas mayores o iguales a 5. Alternativamente, cuando los tamaños de muestra son lo
suficientemente grandes, podemos probar la hipótesis nula mediante la prueba de chi-cuadrado.
Otras lecturasLa prueba exacta de Fisher ha sido objeto de cierta controversia entre los estadísticos.
Algunos sienten que la suposición de totales marginales fijos no es realista en la mayoría de las
aplicaciones prácticas. La controversia entonces se centra en si la prueba es apropiada cuando ambos
totales marginales no son fijos. Para una discusión más detallada de este y otros puntos, consulte los
artículos de Barnard (13–15), Fisher (16) y Pearson (17).
Sweetland (18) comparó los resultados de usar la prueba de chi-cuadrado con los obtenidos
usando la prueba exacta de Fisher para muestras de tamañoAþB¼3 aAþB¼69. Encontró un acuerdo
cercano cuandoAyBeran de tamaño similar y la prueba era unilateral.
Carr (19) presenta una extensión de la prueba exacta de Fisher a más de dos muestras de igual
tamaño y da un ejemplo para demostrar los cálculos. Neave (20) presenta la prueba exacta de Fisher
en un nuevo formato; la prueba se trata como una prueba de independencia más que de
homogeneidad. Ha preparado cuadros extensos para usar con su enfoque.
Dupont (21) analiza la sensibilidad de la prueba exacta de Fisher a perturbaciones
menores en tablas de contingencia 2 - 2.
EJEMPLO 12.6.1
El propósito de un estudio de Justesen et al. (A-12) fue evaluar la eficacia a largo plazo de tomar
indinavir/ritonavir dos veces al día en combinación con dos inhibidores nucleósidos de la transcriptasa
inversa en sujetos con VIH que se dividieron en dos grupos. El grupo 1 estaba formado por pacientes
que no tenían antecedentes de tomar inhibidores de la proteasa (PI Na€he). El grupo 2 estaba
formado por pacientes que tenían un historial previo de tomar un inhibidor de la proteasa (PI
Experimentado). La Tabla 12.6.2 muestra si estos sujetos permanecieron en el régimen durante las
120 semanas de seguimiento. Queremos saber si podemos concluir que los pacientes clasificados en
el grupo 1 tienen menor probabilidad que los sujetos del grupo 2 de permanecer en el régimen
durante 120 semanas.
TABLA 12.6.2 Estado del régimen a las 120 semanas para PI Na€
Sujetos con experiencia en cinco y PI que toman indinavir/
ritonavir como se describe en el ejemplo 12.6.1
permaneció en
el Régimen
durante 120 semanas
Total Sí No
1 (PI Na€he) 9 2 7
2 (PA con experiencia) 12 8 4
Total 21 10 11
Sí No Total
Solución:
Contar
Se mantuvo
Sí No Total
Pruebas de chi-cuadrado
Varios programas de software estadístico realizan los cálculos para la prueba exacta de Fisher. La
figura 12.6.1 muestra los resultados del ejemplo 12.6.1 calculados por SPSS. el exactopag El valor se
proporciona tanto para una prueba unilateral como para una bilateral. Con base en estos resultados, no
podemos rechazarH0(pagvalor >.05), tal como lo hicimos usando las tablas estadísticas en el Apéndice. Tenga
en cuenta que, además de la prueba exacta de Fisher, se proporcionan varias pruebas alternativas. El lector
debe ser consciente de que estas pruebas alternativas no son apropiadas si se han violado los supuestos en
los que se basan.
EJERCICIOS
12.6.1El objetivo de un estudio realizado por Tahmassebi y Curzon (A-13) fue determinar si el babeo en niños con
parálisis cerebral se debe a hipersalivación. Uno de los procedimientos hacia ese fin fue examinar la
capacidad amortiguadora salival de niños y controles con parálisis cerebral. La siguiente tabla da
los resultados.
12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL 641
Capacidad de almacenamiento
Parálisis cerebral 2 8
Control 3 7
Fuente: JF Tahmassebi y MEJ Curzon, "La causa del babeo en niños
con parálisis cerebral: ¿hipersalivación o defecto de deglución?"
Revista Internacional de Odontología Pediátrica, 13 (2003), 106–111.
Pruebe si hay una diferencia significativa entre los niños con parálisis cerebral y los controles con respecto a la capacidad
amortiguadora alta o baja. Dejara¼ .05 y encuentra elpagvalor.
12.6.2En un estudio realizado por Xiao y Shi (A-14), los investigadores estudiaron el efecto del jugo de arándano en el tratamiento
y prevención deHelicobacter pyloriinfección en ratones. La erradicación deHelicobacter pylori resulta en la
curación de las úlceras pépticas. Los investigadores compararon el tratamiento con jugo de arándano con
“terapia triple (amoxicilina, subcitrato de bismuto y metronidazol) en ratones infectados conHelicobacter
pylori.Después de 4 semanas, examinaron a los ratones para determinar la frecuencia de erradicación de la
bacteria en los dos grupos de tratamiento. La siguiente tabla muestra los resultados.
Triple terapia 8 2
Jugo de arándano 2 8
Fuente: Shu Dong Xiao y Tong Shi, "¿Es efectivo el jugo de arándano en el tratamiento y la
prevención deHelicobacter pyloriinfección de ratones”,Revista china de enfermedades digestivas,
4 (2003), 136–139.
¿Podemos concluir, sobre la base de estos datos, que la triple terapia es más eficaz que el jugo de arándano
para erradicar la bacteria? Dejara¼ .05 y encuentra elpagvalor.
12.6.3En un estudio de Shaked et al. (A-15), los investigadores estudiaron a 26 niños con lesiones pancreáticas cerradas. Estas
lesiones se produjeron por golpe directo en el abdomen, manubrio de bicicleta, caída de altura o accidente
automovilístico. Diecinueve de los pacientes fueron clasificados con lesiones menores y siete con lesiones mayores.
Se sospechó la formación de seudoquistes cuando se desarrollaron signos de deterioro clínico, como aumento del
dolor abdominal, plenitud epigástrica, fiebre y aumento de los niveles de enzimas pancreáticas. En el grupo de
lesiones mayores, seis de los siete niños desarrollaron seudoquistes, mientras que en el grupo de lesiones menores,
tres de los 19 niños desarrollaron seudoquistes. ¿Es esta evidencia suficiente para permitirnos concluir que la
proporción de niños que desarrollan seudoquistes es mayor en el grupo de lesiones mayores que en el grupo de
lesiones menores? Dejara¼ .01.
En el capítulo 8 aprendimos a usar técnicas de análisis de varianza para analizar datos que surgen de
experimentos diseñados, investigaciones en las que al menos una variable se manipula de alguna
manera. Los experimentos diseñados, por supuesto, no son las únicas fuentes de datos que son
642 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
de interés para los médicos y otros profesionales de las ciencias de la salud. Otra clase importante de
investigación científica que se utiliza ampliamente es laestudio observacional.
DEFINICIÓN
Unestudio observacionales una investigación científica en la que no se manipulan
de forma alguna los temas objeto de estudio ni ninguna de las variables de
interés.
DEFINICIÓN
El términofactor de riesgose utiliza para designar una variable que se cree que está
relacionada con alguna variable de resultado. El factor de riesgo puede ser una causa
sospechosa de algún estado específico de la variable de resultado.
En una investigación particular, por ejemplo, la variable de resultado podría ser el estado de los
sujetos en relación con el cáncer y el factor de riesgo podría ser su estado con respecto al
tabaquismo. El modelo se simplifica aún más si las variables son categóricas con solo dos categorías
por variable. Para la variable de resultado, las categorías pueden ser cáncer presente y cáncer
ausente. Con respecto al factor de riesgo, los sujetos pueden clasificarse como fumadores y no
fumadores.
Cuando las variables en los estudios observacionales son categóricas, los datos
correspondientes a las mismas pueden presentarse en una tabla de contingencia, de ahí la inclusión
del tema en el presente capítulo. Limitaremos nuestra discusión a la situación en la que la variable de
resultado y el factor de riesgo son ambas variables dicotómicas.
DEFINICIÓN
Aestudio prospectivoes un estudio observacional en el que se seleccionan dos
muestras aleatorias de sujetos. Una muestra se compone de sujetos que poseen el
factor de riesgo y la otra muestra se compone de sujetos que no poseen el factor
de riesgo. Los sujetos son seguidos hacia el futuro (es decir, son seguidos
prospectivamente), y se lleva un registro del número de sujetos en cada muestra
que, en algún momento, son clasificables en cada una de las categorías de la
variable de resultado.
Los datos resultantes de un estudio prospectivo que involucre dos variables dicotómicas
se pueden mostrar en una tabla de contingencia 2 - 2 que generalmente brinda información
sobre el número de sujetos con y sin el factor de riesgo y el número que sí y no.
12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL 643
Estado de la enfermedad
Presente a b aþb
Ausente C d Cþd
sucumbir a la enfermedad de interés, así como las frecuencias para cada combinación de
categorías de las dos variables.
DEFINICIÓN
Aestudio retrospectivoes el reverso de un estudio prospectivo. Las muestras
se seleccionan de aquellas que caen en las categorías de la variable de
resultado. Luego, el investigador mira hacia atrás (es decir, hace una mirada
retrospectiva) a los sujetos y determina cuáles tienen (o tenían) y cuáles no
tienen (o no tenían) el factor de riesgo.
A partir de los datos de un estudio retrospectivo podemos construir una tabla de contingencia
con frecuencias similares a las que son posibles para los datos de un estudio prospectivo.
En general, el estudio prospectivo es más costoso de realizar que el estudio
retrospectivo. El estudio prospectivo, sin embargo, se parece más a un experimento.
DEFINICIÓN
Riesgo relativoes la relación entre el riesgo de desarrollar una enfermedad entre sujetos
con el factor de riesgo y el riesgo de desarrollar la enfermedad entre sujetos sin el factor
de riesgo.
un =daþbÞ
RCR¼ (12.7.1)
c=dCþdÞ
dóndea B C,ydson como se definen en la Tabla 12.7.1, yRCRindica que el riesgo relativo se
calcula a partir de una muestra que se utilizará como una estimación del riesgo relativo,RR,para
la población de la que se extrajo la muestra.
644 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
pagffiffiffiffi
Interpretación deRREl valor deRRpuede oscilar entre cero e infinito. Un valor de 1 indica que
no existe asociación entre el estado del factor de riesgo y el estado de la variable dependiente.
En la mayoría de los casos, los dos estados posibles de la variable dependiente son enfermedad
presente y enfermedad ausente. Interpretamos unRRde 1 para significar que el riesgo de
adquirir la enfermedad es el mismo para aquellos sujetos con el factor de riesgo y aquellos sin
el factor de riesgo. un valor deRRmayor que 1 indica que el riesgo de adquirir la enfermedad es
mayor entre los sujetos con el factor de riesgo que entre los sujetos sin el factor de riesgo. Un
RRun valor inferior a 1 indica menor riesgo de adquirir la enfermedad entre los sujetos con el
factor de riesgo que entre los sujetos sin el factor de riesgo. Por ejemplo, un factor de riesgo de
2 se entiende que aquellos sujetos con el factor de riesgo tienen el doble de probabilidades de
adquirir la enfermedad en comparación con los sujetos sin el factor de riesgo.
EJEMPLO 12.7.1
En un estudio prospectivo de mujeres embarazadas, Magann et al. (A-16) recopilaron amplia información
sobre el nivel de ejercicio de mujeres trabajadoras embarazadas de bajo riesgo. Un grupo de 217 mujeres no
hizo ejercicio voluntario u obligatorio durante el embarazo, mientras que un grupo de 238 mujeres hizo
mucho ejercicio. Una variable de resultado de interés fue experimentar trabajo de parto prematuro. Los
resultados se resumen en la Tabla 12.7.2.
Deseamos estimar el riesgo relativo de trabajo de parto prematuro cuando las mujeres embarazadas hacen mucho
ejercicio.
22=238 . 0924
RCR¼ ¼ ¼1:1
18=217 . 0829
TABLA 12.7.2 Sujetas con y sin el factor de riesgo que se convirtieron en casos de trabajo de parto
prematuro
Factor de riesgo Casos de trabajo de parto prematuro No casos de trabajo de parto prematuro Total
Fuente: Everett F. Magann, Sharon F. Evans, Beth Weitz y John Newnham, "Importancia del ejercicio anteparto,
intraparto y neonatal en mujeres trabajadoras embarazadas saludables de bajo riesgo"Obstetricia y Ginecología, 99 (
2002), 466–472.
12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL 645
Estos datos indican que el riesgo de tener un parto prematuro cuando una mujer hace
mucho ejercicio es 1,1 veces mayor que entre las mujeres que no hacen nada de
ejercicio.
Calculamos el intervalo de confianza del 95 por ciento paraRRcomo sigue. Por la
Ecuación 12.4.1, calculamos a partir de los datos de la Tabla 12.7.2:
455½ð22Þð199Þ - ð216Þð18Þ2
X2¼ ¼ .1274
d40Þð415Þð238Þð217Þ
Por la Ecuación 12.7.2, los límites de confianza inferior y superior son, respectivamente,
pagffiffiffiffiffiffiffiffiffi pagffiffiffiffiffiffiffiffiffi
1:11-1:96= :1274¼ :65 y 1:11þ1:96= :1274¼1:86. Como el intervalo incluye
1, concluimos, con un nivel de significancia de .05, que el riesgo de la población puede
ser 1. En otras palabras, concluimos que, en la población, puede no haber un mayor
riesgo de tener un trabajo de parto prematuro cuando una mujer embarazada hace
mucho ejercicio .
Los datos fueron procesados por NCSS. Los resultados se muestran en la Figura
12.7.1. El cálculo del riesgo relativo se muestra en la columna en el extremo derecho
de la salida, junto con los límites de confianza del 95 %. Debido a errores de redondeo,
estos valores difieren ligeramente de los que se dan en el ejemplo. &
Muestra
Presente a b aþb
Ausente C d Cþd
la razón de probabilidades, debemos entender el términoimpares,que es utilizado con frecuencia por aquellos que
hacen apuestas sobre los resultados de los eventos deportivos o participan en otros tipos de actividades de juego.
DEFINICIÓN
Las probabilidades de éxito son la relación entre la probabilidad de éxito y la
probabilidad de fracaso.
Usamos esta definición de probabilidades para definir dos probabilidades que podemos calcular a partir de los datos
que se muestran en la Tabla 12.7.3:
1.La probabilidad de ser un caso (tener la enfermedad) a ser un control (no tener la
enfermedad) entre sujetos con el factor de riesgo es½un =daþbÞ =½b=daþb¼a=b.
2.La probabilidad de ser un caso (tener la enfermedad) a ser un control (no tener la
enfermedad) entre sujetos sin el factor de riesgo es½c=dCþdÞ =½re=dCþd¼c=d.
Ahora definimos la razón de probabilidades que podemos calcular a partir de los datos de un estudio
retrospectivo. Usamos el símboloO CRpara indicar que la medida se calcula a partir de datos de muestra
y se utiliza como una estimación de la razón de probabilidades de la población,O.
DEFINICIÓN
La estimación de la razón de posibilidades de la población es
a=b anuncio
O
CR¼ ¼ (12.7.3)
c=d antes de Cristo
Interpretación del Odds RatioEn el caso de una enfermedad rara, la razón de posibilidades de la población
proporciona una buena aproximación al riesgo relativo de la población. En consecuencia, la razón de probabilidades
de la muestra, al ser una estimación de la razón de probabilidades de la población, proporciona una estimación
indirecta del riesgo relativo de la población en el caso de una enfermedad rara.
La razón de posibilidades puede asumir valores entre cero y1.Un valor de 1 indica que no hay
asociación entre el factor de riesgo y el estado de la enfermedad. Un valor inferior a 1 indica probabilidades
reducidas de la enfermedad entre sujetos con el factor de riesgo. Un valor superior a 1 indica mayores
probabilidades de tener la enfermedad entre los sujetos en los que está presente el factor de riesgo.
EJEMPLO 12.7.2
Toschke et al. (A-17) recopilaron datos sobre el estado de obesidad de niños de 5 a 6 años y el estado
de tabaquismo de la madre durante el embarazo. La Tabla 12.7.4 muestra 3970 sujetos clasificados
como casos o no casos de obesidad y también clasificados según el estado tabáquico de la madre
durante el embarazo (el factor de riesgo). Deseamos comparar las probabilidades de obesidad a los
5-6 años entre aquellos cuya madre fumó durante el embarazo con las probabilidades de obesidad a
los 5-6 años entre aquellos cuya madre no fumó durante el embarazo.
d64Þð3496Þ
O
CR¼ ¼9:62
d342Þð68Þ
Vemos que los niños obesos (casos) tienen 9,62 veces más probabilidades que los
niños no obesos (no casos) de haber tenido una madre que fumó durante todo el
embarazo.
Calculamos el intervalo de confianza del 95 por ciento paraOcomo sigue. Por la
Ecuación 12.4.1 calculamos a partir de los datos de la Tabla 12.7.4
3970½ð64Þð3496Þ - ð342Þð68Þ2
X2¼ ¼217:6831
d132Þð3838Þð406Þð3564Þ
Estado de obesidad
Contar
Estado de obesidad
Estimación de riesgo
95% de confianza
Intervalo
estado_de_fumar
(Ahumado en todo 9.621 6.719 13.775
/Nunca fumé)
Para cohorte Obesidad_ 8.262 5.966 11.441
casos de estado
Para cohorte Obesidad_ . 859 . 823 . 896
estado No casos
N de casos válidos 3970
consciente de otra variable que puede estar asociada con la enfermedad, con el factor de
riesgo, o con ambos de tal manera que se enmascara la verdadera relación entre el estado de la
enfermedad y el factor de riesgo. Tal variable se llamavariable de confusión.Por ejemplo, la
experiencia podría indicar la posibilidad de que la relación entre alguna enfermedad y un factor
de riesgo sospechado difiera entre diferentes grupos étnicos. Entonces trataríamos la
pertenencia étnica como una variable de confusión. Cuando se pueden identificar, es deseable
controlar las variables de confusión para que se pueda calcular una medida inequívoca de la
relación entre el estado de la enfermedad y el factor de riesgo. Una técnica para lograr este
objetivo es el procedimiento de Mantel-Haenszel (22), llamado así en reconocimiento a los dos
hombres que lo desarrollaron. El procedimiento nos permite probar la hipótesis nula de que no
existe asociación entre el estado con respecto a la enfermedad y el estado de los factores de
riesgo. Utilizado inicialmente solo con datos de estudios retrospectivos, el procedimiento de
Mantel-Haenszel también es adecuado para su uso con datos de estudios prospectivos.
daiþbiÞðaiþCiÞ
mii¼ (12.7.5)
nortei
Muestra
Presente ai bi aiþbi
Ausente Ci di Ciþdi
daiþbiÞðCiþdiÞðaiþCiÞðbiþdiÞ
v i¼ (12.7.6)
dnortei-1Þ
i 2
norte
2
PAG
k PAG
k
ai- mii
i¼1
Xmh
2 ¼i¼1 (12.7.7)
PAG
k
vi
i¼1
PAG
k
daidi=niÞ
CRmh¼i¼1
O (12.7.8)
PAG
k
dbiCi=niÞ
i¼1
Cuando usamos el estimador de Mantel-Haenszel dado por la Ecuación 12.7.4, asumimos que, en la
población, la razón de posibilidades es la misma para cada estrato.
Ilustramos el uso de las estadísticas de Mantel-Haenszel con los siguientes
ejemplos.
EJEMPLO 12.7.3
En un estudio de LaMont et al. (A-18), los investigadores recopilaron datos sobre la enfermedad arterial
coronaria obstructiva (OCAD), la hipertensión y la edad entre los sujetos identificados por una prueba de
esfuerzo en cinta rodante como en riesgo. En la Tabla 12.7.6, se presentan recuentos de sujetos en dos
estratos de edad con hipertensión como factor de riesgo y la presencia de OCAD como variable caso/no caso.
Solución:
TABLA 12.7.6 Pacientes estratificados por edad y clasificados por estado relativo a la
hipertensión (el factor de riesgo) y OCAD (variable caso/no caso)
Factor de riesgo
(Hipertensión) Casos (OCAD) no casos Total
Presente 21 11 32
Ausente dieciséis 6 22
Total 37 17 54
Factor de riesgo
(Hipertensión) Casos (OCAD) no casos Total
Presente 50 14 64
Ausente 18 6 24
Total 68 20 88
3. Hipótesis.
H0: No existe asociación entre la presencia de hipertensión
y aparición de OCAD en sujetos de 55 años o menos y sujetos mayores de
55 años.
HA: Existe una relación entre las dos variables.
4. Estadística de prueba.
2
PAG
k PAG
k
ai- mii
i¼1
Xmh
2 ¼i¼1
PAG
k
vi
i¼1
½ð21þ50Þ - ð21:93þ49:45Þ2
Xmh
2 ¼ ¼ .0242
2:87þ3:10
EJEMPLO 12.7.4
Consultemos los datos de la tabla 12.7.6 y calculemos la razón de probabilidades común.
Solución: A partir de los datos estratificados de la Tabla 12.7.6 calculamos el numerador de la razón de la siguiente
manera:
El denominador de la razón es
5:7424
CRmh¼
O ¼ .94
6:1229
El cálculo manual de las estadísticas de prueba de Mantel-Haenszel puede resultar una tarea
engorrosa. Afortunadamente, el investigador puede encontrar alivio en uno de los varios paquetes de
software estadístico disponibles. Para ilustrar, los resultados del uso de SPSS para procesar los datos
del ejemplo 12.7.3 se muestran en la figura 12.7.3. Estos resultados difieren de los dados en el
ejemplo debido al error de redondeo.
EJERCICIOS 653
Contar
Estado de obesidad
asíncrono Sig.
chi-cuadrado d.f. (2 caras)
Estimar . 938
En (estimación) . 064
Estándar Error de In(Estimate) . 412
Asymp. Sig. (2 caras) . 876
asíncrono 95% de confianza Probabilidades comunes Límite inferior . 418
Intervalo Relación Límite superior 2.102
En común) Límite inferior . 871
Razón de probabilidades) Límite superior . 743
EJERCICIOS
12.7.1Davy et al. (A-19) informó los resultados de un estudio sobre la supervivencia del cáncer de cuello uterino. El
los investigadores encontraron que entre los sujetos menores de 50 años, 16 de 371 sujetos no habían sobrevivido durante 1
año después del diagnóstico. En sujetos de 50 años o más, 219 de 376 no habían sobrevivido durante 1 año después del
diagnóstico. Calcule el riesgo relativo de muerte entre sujetos de 50 años o más. ¿Parece a partir de estos datos que las
personas mayores diagnosticadas con cáncer de cuello uterino son propensas a tasas de mortalidad más altas?
654 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
12.7.2El objetivo de un estudio prospectivo de Stenestrand et al. (A-20) fue comparar la tasa de mortalidad
después de un infarto agudo de miocardio (IAM) entre sujetos que recibieron revascularización temprana a la tasa de
mortalidad entre sujetos que recibieron tratamientos conservadores. Entre 2554 pacientes que recibieron revascularización
dentro de los 14 días posteriores al IAM, 84 fallecieron en el año siguiente al IAM. En el grupo de tratamiento conservador
(factor de riesgo presente), 1751 de 19 358 pacientes fallecieron dentro del año posterior al IAM. Calcule el riesgo relativo de
mortalidad en el grupo de tratamiento conservador en comparación con el grupo de revascularización en pacientes que
experimentan IAM.
12.7.3Consulte el Ejemplo 12.7.2. Toschke et al. (A-17), que recolectó datos sobre el estado de obesidad de niños de 5 a
6 años y el estado de tabaquismo de la madre durante el embarazo, también informó sobre otra variable de
resultado: si el niño nació prematuro (37 semanas o menos de gestación). ). La siguiente tabla resume los
resultados de este aspecto del estudio. Se considera el mismo factor de riesgo (fumar durante el embarazo),
pero ahora se define un caso como una madre que dio a luz prematuramente.
Estado de tabaquismo
Durante el embarazo Casos no casos Total
Calcule la razón de posibilidades para determinar si fumar durante el embarazo está relacionado con el parto
prematuro. Use la prueba de independencia chi-cuadrado para determinar si se puede concluir que existe una
asociación entre fumar durante el embarazo y el parto prematuro. Dejara¼ .05.
12.7.4Sugiyama et al. (A-21) examinó los factores de riesgo de enfermedades alérgicas entre escolares de 13 y 14 años
en Japón. Un factor de riesgo de interés fue un historial familiar de comer una dieta desequilibrada.
La siguiente tabla muestra los casos y no casos de niños que presentaron síntomas de rinitis en
presencia y ausencia del factor de riesgo.
Rinitis
¿Cuál es la razón de probabilidad estimada de tener rinitis entre los sujetos con antecedentes familiares de una dieta
desequilibrada en comparación con los que siguen una dieta equilibrada? Calcule el intervalo de confianza del 95 por ciento
para la razón de probabilidades.
12.7.5Según Holben et al. (A-22), “La inseguridad alimentaria implica un acceso o disponibilidad limitados de alimentos o una
capacidad limitada/incierta para adquirir alimentos en formas socialmente aceptables”. Estos investigadores
12.8 RESUMEN 655
recopiló datos sobre 297 familias con un niño en el programa de guardería Head Start en un área rural de Ohio cerca
de Appalachia. La principal variable de resultado del estudio fue el estado del hogar en relación con la seguridad
alimentaria. Los hogares que no tenían seguridad alimentaria se consideran casos. El factor de riesgo de interés fue
la ausencia de un jardín desde el cual un hogar pudiera complementar su suministro de alimentos. En el siguiente
cuadro, los datos están estratificados por la situación laboral del jefe de hogar fuera del hogar.
sin jardin 40 37 77
Jardín 13 38 51
Total 53 75 128
Estrato 2 (No Ocupado Fuera del Hogar)
Total 90 71 161
Fuente: Datos proporcionados por cortesía de David H. Holben, Ph.D. y John P. Holcomb, Jr., Ph.D.
Calcule la razón de posibilidades común de Mantel-Haenszel con estratificación por situación laboral. Utilice la
estadística de la prueba chi-cuadrado de Mantel-Haenszel para determinar si podemos concluir que existe una
asociación entre el factor de riesgo y la inseguridad alimentaria. Dejara¼ .05.
12.8 RESUMEN
En este capítulo se analizan algunos usos de la distribución versátil de chi-cuadrado. Se presentan las
pruebas de bondad de ajuste de chi-cuadrado aplicadas a las distribuciones normal, binomial y de
Poisson. Vemos que el procedimiento consiste en calcular un estadístico
" #
XdOi- mi iÞ
2
X2¼
mii
Además, discutimos e ilustramos en este capítulo otras cuatro técnicas para analizar datos de
frecuencia que se pueden presentar en forma de una tabla de contingencia 2 - 2: la prueba exacta de Fisher,
la razón de probabilidades, el riesgo relativo y el procedimiento de Mantel-Haenszel. . Finalmente, discutimos
los conceptos básicos del análisis de supervivencia e ilustramos los procedimientos computacionales por
medio de dos ejemplos.
Fórmula
Número Nombre Fórmula
yi-metro
12.2.1 Estándar normal aleatorio zi¼
variable s
2 2 2
12.2.2 Distribución chi-cuadrado con XdnorteÞ
2 ¼z 1þz2þ þznorte
nortegrados de libertad
dónde
pag¼ ðaþbÞ=ðAþBÞ
pagffiffiffi
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 657
estadística
3.Explique cómo se calculan los grados de libertad para las pruebas de bondad de ajuste de chi-cuadrado.
4.Enuncie la regla de Cochran para frecuencias esperadas pequeñas en pruebas de bondad de ajuste.
7.¿Cómo se calculan los grados de libertad cuando unX2valor se calcula a partir de una tabla de
contingencia?
658 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
8.Explique la lógica detrás del método de calcular las frecuencias esperadas en una prueba de
independencia.
10Explique la lógica detrás del método de calcular las frecuencias esperadas en una prueba de
homogeneidad.
11¿Cuándo usan los investigadores la prueba exacta de Fisher en lugar de la prueba de chi-cuadrado?
12Defina lo siguiente:
(i)Variable de confusión
15.En un estudio de victimización violenta de mujeres y hombres, Porcerelli et al. (A-23) recopiló
información de 679 mujeres y 345 hombres de 18 a 64 años de edad en varios centros de medicina
familiar en el área metropolitana de Detroit. Los pacientes completaron un cuestionario de historial
de salud que incluía una pregunta sobre victimización. La siguiente tabla muestra los sujetos de la
muestra clasificados en forma cruzada por género y el tipo de victimización violenta reportada. Las
categorías de victimización se definen como no victimización, victimización por pareja (y no por otros),
victimización por persona distinta a la pareja (amigo, familiar o extraño) y quienes reportaron
victimización múltiple.
¿Podemos concluir sobre la base de estos datos que el estado de victimización y el género no son independientes?
Dejara¼ .05.
dieciséis.Consulte el Ejercicio 15. La siguiente tabla muestra los datos informados por Porcerelli et al. para 644 mujeres
afroamericanas y caucásicas. ¿Podemos concluir sobre la base de estos datos que para las mujeres, la raza y el estado
de victimización no son independientes? Dejara¼ .05.
PREGUNTAS DE REPASO Y EJERCICIOS 659
17Una muestra de 150 portadores crónicos de cierto antígeno y una muestra de 500 no portadores reveló las siguientes
distribuciones de grupos sanguíneos:
0 72 230 302
A 54 192 246
B dieciséis 63 79
AB 8 15 23
¿Se puede concluir a partir de estos datos que las dos poblaciones de las que se extrajeron las muestras difieren con
respecto a la distribución de grupos sanguíneos? Dejara¼ .05. ¿Cuál es elpagvalor para la prueba?
18La siguiente tabla muestra 200 hombres clasificados según la clase social y el estado del dolor de cabeza:
Clase social
Grupo de dolor de cabeza A B C Total
¿Estos datos proporcionan evidencia suficiente para indicar que el estado de la cefalea y la clase social están relacionados?
Dejara¼ .05. ¿Cuál es elpagvalor para esta prueba?
19La siguiente es la distribución de frecuencia de las puntuaciones obtenidas en una prueba de aptitud por 175 solicitantes
de un centro de formación en fisioterapia.d-X¼39:71;s¼12:92Þ.
10–14 3 40–44 28
15–19 8 45–49 20
20–24 13 50–54 18
25–29 17 55–59 12
(Continuación)
660 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
30–34 19 60–64 8
35–39 25 65–69 4
Total 175
¿Estos datos proporcionan evidencia suficiente para indicar que la población de puntajes no se distribuye
normalmente? Dejara¼ .05. ¿Cuál es elpagvalor para esta prueba?
20Un departamento de salud local patrocinó un programa de información sobre enfermedades venéreas (VD) que estaba abierto a
estudiantes de tercer y cuarto año de secundaria con edades comprendidas entre los 16 y los 19 años. El director del programa
creía que cada nivel de edad estaba igualmente interesado en saber más sobre la VD. Dado que cada nivel de edad estaba
representado por igual en el área atendida, ella sintió que el mismo interés en VD se reflejaría en la asistencia al programa por
igual nivel de edad. El desglose por edades de los asistentes fue el siguiente:
dieciséis 26
17 50
18 44
19 40
¿Son estos datos incompatibles con la creencia del director del programa de que los estudiantes de los cuatro niveles de edad
están igualmente interesados en VD? Dejara¼ .05. ¿Cuál es elpagvalor para esta prueba?
21Una encuesta de niños menores de 15 años que residen en el área del centro de una ciudad grande se clasificaron según
el grupo étnico y el nivel de hemoglobina. Los resultados fueron los siguientes:
A 80 100 20 200
B 99 190 96 385
C 70 30 10 110
¿Proporcionan estos datos suficiente evidencia para indicar, al nivel de significancia de .05, que las dos variables están
relacionadas? Cuál es elpagvalor para esta prueba?
22Una muestra de casos notificados de paperas en niños en edad preescolar mostró la siguiente distribución por edad:
menos de 1 6
1 20
2 35
3 41
4 48
Total 150
PREGUNTAS DE REPASO Y EJERCICIOS 661
Pruebe la hipótesis de que los casos ocurren con la misma frecuencia en las cinco categorías de edad. Dejara¼ .05.
¿Cuál es elpagvalor para esta prueba?
23A cada uno de una muestra de 250 hombres extraídos de una población de presuntas víctimas de enfermedades articulares se le
preguntó cuál de los tres síntomas le molestaba más. Se hizo la misma pregunta a una muestra de 300 mujeres presuntamente
víctimas de enfermedades articulares. Los resultados fueron los siguientes:
¿Estos datos proporcionan suficiente evidencia para indicar que las dos poblaciones no son homogéneas con
respecto a los principales síntomas? Dejara¼ .05. ¿Cuál es elpagvalor para esta prueba?
Para cada uno de los ejercicios 24 a 34, indique si es adecuada una hipótesis nula de homogeneidad o
una hipótesis nula de independencia.
24Un investigador desea comparar el estado de tres comunidades con respecto a la inmunidad contra la poliomielitis en
niños en edad preescolar. Se extrajo una muestra de niños en edad preescolar de cada una de las tres comunidades.
25En un estudio de la relación entre el tabaquismo y las enfermedades respiratorias, se clasificó una muestra
aleatoria de adultos según el consumo de tabaco y la extensión de los síntomas respiratorios.
26Un médico que deseaba saber más sobre la relación entre el tabaquismo y los defectos congénitos estudia los
registros de salud de una muestra de madres y sus hijos, incluidos los mortinatos y los fetos abortados
espontáneamente cuando es posible.
27Un equipo de investigación en salud cree que la incidencia de depresión es mayor entre las personas con
hipoglucemia que entre las personas que no padecen esta afección.
28En una muestra aleatoria simple de 200 pacientes en tratamiento en un centro de tratamiento de abuso de
drogas, el 60 por ciento pertenecía al grupo étnico I. El resto pertenecía al grupo étnico II. En el grupo étnico
I, 60 estaban siendo tratados por abuso de alcohol (A), 25 por abuso de marihuana (B) y 20 por abuso de
heroína, metadona ilegal o algún otro opioide (C). El resto había abusado de barbitúricos, cocaína,
anfetaminas, alucinógenos o algún otro no opioide además de la marihuana (D). En el grupo étnico II, la
categoría de drogas de abuso y los números involucrados fueron los siguientes:
¿Se puede concluir a partir de estos datos que existe una relación entre el grupo étnico y la elección de la droga de
abuso? Dejara¼ .05 y encuentra elpagvalor.
29Las queratosis solares son lesiones de la piel que se encuentran comúnmente en el cuero cabelludo, la cara, el dorso de
las manos, los antebrazos, las orejas, el cuero cabelludo y el cuello. Son causados por la exposición prolongada al
sol, pero no son cánceres de piel. Chen et al. (A-24) estudió a 39 sujetos asignados al azar (con una proporción de 3 a
1) a la crema de imiquimod y una crema de control. El criterio de efectividad fue tener el 75 por ciento o más del área
lesionada limpia después de 14 semanas de tratamiento. Hubo 21 éxitos entre los 29 sujetos tratados con imiquimod
y tres éxitos entre los 10 sujetos que usaron la crema de control. Los investigadores utilizaron la prueba exacta de
Fisher y obtuvieron unapagvalor de .027. ¿Cuáles son las variables involucradas? ¿Las variables son cuantitativas o
cualitativas? ¿Qué hipótesis nula y alternativa son apropiadas? ¿Cuáles son tus conclusiones?
662 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
30Janardhan et al. (A-25) examinó a 125 pacientes que se sometieron a tratamiento quirúrgico o endovascular por
aneurismas intracraneales. A los 30 días del procedimiento, 17 sujetos experimentaron déficits neurológicos
transitorios/persistentes. Los investigadores realizaron una regresión logística y encontraron que el intervalo de
confianza del 95 por ciento para el cociente de probabilidades del tamaño del aneurisma era de 0,09 a 0,96. El
tamaño del aneurisma se dividió en menos de 13 mm y mayor o igual a 13 mm. Los tumores más grandes indicaron
mayores probabilidades de déficit. Describa las variables en cuanto a si son continuas, discretas, cuantitativas o
cualitativas. ¿Qué conclusiones se pueden sacar de la información dada?
31En un estudio sobre el abandono del hábito de fumar realizado por Gold et al. (A-26), 189 sujetos se
autoseleccionaron en tres tratamientos: solo parche de nicotina (NTP), solo Bupropion SR (B) y parche de
nicotina con Bupropion SR dNTPþBÞ.Los sujetos se agruparon por edad en menores de 50 años, entre 50 y
64, y 65 y más. Hubo 15 sujetos menores de 50 años que eligieron NTP, 26 que eligieron B y 16 que eligieron
NTPþB. En la categoría de 50 a 64 años, seis eligieron NTP, 54 eligieron B y 40 eligieron NTPþB. En la
categoría de mayor edad, seis eligieron NTP, 21 eligieron B y cinco eligieron NTPþB. ¿Qué técnica estadística
estudiada en este capítulo sería apropiada para analizar estos datos? Describa las variables involucradas en
cuanto a si son continuas, discretas, cuantitativas o cualitativas. ¿Qué hipótesis nula y alternativa son
apropiadas? Si cree que tiene suficiente información, realice una prueba de hipótesis completa. ¿Cuáles son
tus conclusiones?
32.Kozinszky y B-artai (A-27) examinaron el uso de anticonceptivos por parte de adolescentes que solicitan un
aborto en Szeged, Hungría. Los sujetos se clasificaron como menores de 20 años o mayores de 20 años. De
las mujeres menores de 20 años, 146 solicitaron un aborto. Del grupo de mayor edad, 1054 solicitaron un
aborto. Un grupo de control estuvo compuesto por visitantes del centro de planificación familiar que no
solicitaron un aborto o acompañantes de mujeres que solicitaron un aborto. En el grupo de control, había
147 mujeres menores de 20 años y 1053 que tenían 20 años o más. Una de las variables de resultado de
interés fue el conocimiento de la anticoncepción de emergencia. Los investigadores informan que, “La
anticoncepción de emergencia fue significativamente [(Mantel–Haenszel)pag < .001] menos conocido entre
las adolescentes que aspiran a abortar en comparación con las mujeres mayores que solicitan un aborto
artificial dO¼ .07Þque el conocimiento relevante de los controles adolescentesdO¼ .10Þ.”Explique el
significado de las estadísticas reportadas. ¿Cuáles son sus conclusiones basadas en la información dada?
33.El objetivo de un estudio de Crosignani et al. (A-28) fue evaluar el efecto del escape del tráfico rodado sobre el
riesgo de leucemia infantil. Estudiaron a 120 niños en el norte de Italia identificados a través de un registro
de cáncer basado en la población (casos). Se tomaron muestras de cuatro controles por caso, emparejados
por edad y sexo, de los archivos de población. Los investigadores utilizaron un modelo de difusión de
benceno para estimar la exposición a los gases de escape del tráfico. En comparación con los niños cuyos
hogares no estaban expuestos a las emisiones del tráfico rodado, la tasa de leucemia infantil fue
significativamente mayor en los niños muy expuestos. Caracterice este estudio en cuanto a si es
observacional, prospectivo o retrospectivo. Describa las variables en cuanto a si son continuas, discretas,
cuantitativas, cualitativas, un factor de riesgo o una variable de confusión. Explique el significado de los
resultados informados.
34.Gallagher et al. (A-29) realizaron un estudio descriptivo para identificar los factores que influyen en la asistencia de las mujeres a los
programas de rehabilitación cardíaca después de un evento cardíaco. Una variable de resultado de interés fue la asistencia real
a dicho programa. Los investigadores reclutaron a mujeres dadas de alta de cuatro hospitales metropolitanos en Sydney,
Australia. De 183 mujeres, solo 57 asistieron a los programas. Los autores informaron razones de probabilidad e intervalos de
confianza en las siguientes variables que afectaron significativamente el resultado: edad al cuadrado (1,72; 1,10–2,70). Las
mujeres mayores de 70 años tenían las probabilidades más bajas, mientras que las mujeres de 55 a 70 años tenían las
probabilidades más altas), control percibido (0,92; 0,85–1,00), empleo (0,20; 0,07–0,58), diagnóstico (6,82, 1,84–25,21, el
cociente de probabilidades fue mayor para las mujeres que experimentaron un injerto de derivación de la arteria coronaria en
comparación con el infarto de miocardio), y evento estresante (.21, .06–.73). Caracterice este estudio en cuanto a si es
observacional, prospectivo o retrospectivo. Describe el
PREGUNTAS DE REPASO Y EJERCICIOS 663
variables en cuanto a si son continuas, discretas, cuantitativas, cualitativas, un factor de riesgo o una variable de
confusión. Explique el significado de las razones de probabilidades informadas.
Para cada uno de los ejercicios del 35 al 51, haga tantos de los siguientes como considere apropiados:
(gramo)Describa la(s) población(es) a las que cree que se aplican sus inferencias.
(h)Indique las suposiciones necesarias para la validez de sus análisis.
35.En un estudio prospectivo, aleatorizado y doble ciego, Stanley et al. (A-30) examinó la eficacia relativa y los efectos
secundarios de la morfina y la petidina, fármacos comúnmente utilizados para la analgesia controlada por el paciente
(PCA). Los sujetos fueron 40 mujeres, entre las edades de 20 y 65 años, sometidas a histerectomía abdominal total.
Los pacientes fueron asignados al azar para recibir morfina o petidina por PCA. Al final del estudio, los sujetos
describieron su apreciación de náuseas y vómitos, dolor y satisfacción por medio de una escala verbal de tres puntos.
Los resultados fueron los siguientes:
Satisfacción
petidina 5 9 6 20
Morfina 9 9 2 20
Total 14 18 8 40
Dolor
Inaguantable/ Leve/
Droga Severo Moderado Ninguno Total
petidina 2 10 8 20
Morfina 2 8 10 20
Total 4 18 18 40
Náuseas
Inaguantable/ Leve/
Droga Severo Moderado Ninguno Total
petidina 5 9 6 20
Morfina 7 8 5 20
Total 12 17 11 40
Fuente: Datos proporcionados por cortesía del Dr. Balraj L. Appadu.
664 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
36.Los datos de detección de un programa estatal de prevención del envenenamiento por plomo entre abril de 1990 y
marzo de 1991 fueron examinados por Sargent et al. (A-31) en un esfuerzo por aprender más sobre los factores de
riesgo de la comunidad para la deficiencia de hierro en niños pequeños. Los sujetos del estudio tenían entre 6 y 59
meses de edad. Entre 1860 niños con apellidos hispanos, 338 tenían deficiencia de hierro. Cuatrocientos cincuenta y
siete de 1139 con apellidos del sudeste asiático y 1034 de 8814 niños con otros apellidos tenían deficiencia de hierro.
37.Para aumentar la comprensión del riesgo de infección por VIH entre pacientes con enfermedades mentales graves, Horwath et al.
(A-32) realizó un estudio para identificar predictores del uso de drogas inyectables entre pacientes que no tenían un trastorno
primario por uso de sustancias. De 192 pacientes reclutados de centros psiquiátricos públicos para pacientes hospitalizados y
ambulatorios, 123 eran hombres. Veintinueve de los hombres y nueve de las mujeres tenían antecedentes de inyección de
drogas ilícitas.
38.Skinner et al. (A-33) realizó un ensayo clínico para determinar si el tratamiento con melfalán, prednisona y
colchicina (MPC) es superior a la colchicina (C) sola. Los sujetos consistieron en 100 pacientes con amiloidosis
primaria. Cincuenta fueron tratados con C y 50 con MPC. Dieciocho meses después del ingreso de la última
persona y 6 años después de iniciado el ensayo, 44 de los que recibieron C y 36 de los que recibieron MPC
habían fallecido.
39.El propósito de un estudio de Miyajima et al. (A-34) fue evaluar los cambios de contaminación de células
tumorales en la médula ósea (MO) y sangre periférica (PB) durante el curso clínico de pacientes con
neuroblastoma avanzado. Su procedimiento involucró la detección de ARNm de tirosina hidroxilasa (TH) para
aclarar la fuente y el momento apropiados para recolectar células madre hematopoyéticas para el trasplante.
Los autores utilizaron la prueba exacta de Fisher en el análisis de sus datos. Si está disponible, lea su artículo y decida
si está de acuerdo en que el texto exacto de Fisher era la técnica adecuada para usar. Si está de acuerdo, duplique su
procedimiento y vea si obtiene los mismos resultados. Si no está de acuerdo, explique por qué.
40Cohen et al. (A-35) investigó la relación entre la seropositividad al VIH y la vaginosis bacteriana en una población
con alto riesgo de adquisición sexual del VIH. Los sujetos fueron 144 trabajadoras sexuales comerciales en
Tailandia, de las cuales 62 eran seropositivas y 109 tenían antecedentes de enfermedades de transmisión
sexual (ETS). En el grupo VIH negativo, 51 tenían antecedentes de ETS.
41.El propósito de un estudio de Lipschitz et al. (A-36) fue examinar, utilizando un cuestionario, las tasas y características del
abuso infantil y las agresiones de adultos en una gran población general de pacientes ambulatorios. Los sujetos
consistieron en 120 pacientes ambulatorios psiquiátricos (86 mujeres, 34 hombres) en tratamiento en una clínica
hospitalaria grande en un área del centro de la ciudad. Cuarenta y siete mujeres y seis hombres denunciaron
incidentes de abuso sexual infantil.
42.Sujetos de un estudio de O'Brien et al. (A-37) consistió en 100 pacientes de bajo riesgo con embarazos bien
fechados. Los investigadores deseaban evaluar la eficacia de un método más gradual para promover el
cambio cervical y el parto. La mitad de las pacientes fueron asignadas al azar para recibir un placebo y el
resto recibió 2 mg de prostaglandina E intravaginal.2(PGE2) durante 5 días consecutivos. Uno de los bebés
nacidos de madres en el grupo experimental y cuatro nacidos de madres en el grupo de control tenían
macrosomía.
43.Los propósitos de un estudio de Adra et al. (A-38) fueron para evaluar la influencia de la vía de parto en el
resultado neonatal en fetos con gastrosquisis y para correlacionar la apariencia ultrasonográfica del intestino
fetal con el resultado posnatal inmediato. Entre los 27 casos de gastrosquisis diagnosticados prenatalmente,
la apariencia ultrasonográfica del intestino fetal fue normal en 15. Se observaron complicaciones
postoperatorias en dos de los 15 y en siete de los casos en los que la apariencia ultrasonográfica no fue
normal.
44.Liu et al. (A-39) realizó encuestas de hogares en áreas de Alabama bajo advertencias de tornado. En una de las encuestas
(encuesta 2) la edad media de los 193 entrevistados fue de 54 años. De estos, el 56,0 por ciento eran
PREGUNTAS DE REPASO Y EJERCICIOS 665
mujeres, el 88,6 por ciento eran blancas y el 83,4 por ciento tenía educación secundaria o superior. Entre la
información recopilada se encontraban datos sobre la actividad de búsqueda de refugio y la comprensión del
término "advertencia de tornado". Ciento veintiocho encuestados indicaron que generalmente buscan refugio
cuando se enteran de una advertencia de tornado. De estos, 118 entendieron el significado de la advertencia de
tornado. Cuarenta y seis de los que dijeron que normalmente no buscaban refugio entendieron el significado del
término.
45.Los propósitos de un estudio de Patel et al. (A-40) fueron para investigar la incidencia del glaucoma agudo de
ángulo cerrado secundario a la dilatación pupilar e identificar métodos de detección para detectar ángulos
en riesgo de oclusión. De 5308 sujetos estudiados, 1287 tenían 70 años o más. Se identificó que diecisiete de
los sujetos mayores y 21 de los sujetos más jóvenes (40 a 69 años de edad) tenían ángulos potencialmente
ocluibles.
46.Voskuyl et al. (A-41) investigó aquellas características (incluido el género masculino) de pacientes con
artritis reumatoide (AR) que están asociadas con el desarrollo de vasculitis reumatoide (VR). Los
sujetos consistieron en 69 pacientes a los que se les había diagnosticado RV y 138 pacientes con AR
en los que no se sospechaba que tuvieran vasculitis. Había 32 hombres en el grupo RV y 38 entre los
pacientes con AR.
47.harris et al. (A-42) realizó un estudio para comparar la eficacia de la colporrafia anterior y la uretropexia
retropúbica realizadas para la incontinencia urinaria de esfuerzo genuina. Los sujetos fueron 76 mujeres que
se habían sometido a una u otra cirugía. Los sujetos de cada grupo eran comparables en edad, estatus
social, raza, paridad y peso. En 22 de los 41 casos notificados como curados la cirugía había sido realizada
por personal asistencial. En 10 de los fracasos, la cirugía había sido realizada por personal asistencial. Todas
las demás cirugías habían sido realizadas por cirujanos residentes.
48.Kohashi et al. (A-43) realizó un estudio en el que los sujetos eran pacientes con escoliosis. Como parte del estudio, 21
pacientes tratados con aparatos ortopédicos se dividieron en dos grupos, el grupo AdnorteA¼12Þy grupo BdnorteB¼9
Þ,sobre la base de ciertos factores de progresión de la escoliosis. Dos pacientes en el grupo A y ocho en el grupo B
exhibieron evidencia de deformidad progresiva, mientras que los demás no.
49.En un estudio de pacientes con neoplasia intraepitelial cervical, Burger et al. (A-44) compararon los que eran
positivos para el virus del papiloma humano (VPH) y los que eran negativos para el VPH con respecto a los
factores de riesgo de infección por VPH. Entre sus hallazgos se encontraban 60 de 91 no fumadores con
infección por VPH y 44 pacientes VPH positivos de 50 que fumaban 21 o más cigarrillos por día.
50Tomás et al. (A-45) realizó un estudio para determinar las correlaciones del cumplimiento de las citas de
seguimiento y el surtido de recetas después de una visita al departamento de emergencias. Entre los 235
encuestados, 158 mantuvieron sus citas. De estos, 98 eran mujeres. De los que faltaron a sus citas, 31 eran
hombres.
51.Los sujetos de un estudio realizado por O'Keefe y Lavan (A-46) fueron 60 pacientes con deterioro cognitivo que
requerían líquidos parenterales durante al menos 48 horas. Los pacientes fueron asignados al azar para
recibir líquidos intravenosos (IV) o subcutáneos (SC). La edad media de los 30 pacientes del
El grupo SC tenía 81 años con una desviación estándar de 6. El 57 % eran mujeres. La edad media del
grupo IV fue de 84 años con una desviación estándar de 7. Se observó agitación relacionada con la
cánula o el goteo en 11 de los pacientes SC y 24 de los pacientes IV.
Ejercicios para usar con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.Consulte los datos sobre tabaquismo, consumo de alcohol, presión arterial y enfermedades respiratorias entre
1200 adultos (FUMAR). Las variables son las siguientes:
666 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS
Seleccione una muestra aleatoria simple de tamaño 100 de esta población y realice un análisis para ver si
puede concluir que existe una relación entre el tabaquismo y los síntomas de enfermedad respiratoria. Dejar
a¼ .05 y determinar elpagvalor para su prueba. Compara tus resultados con los de tus compañeros.
2.Consulte el Ejercicio 1. Seleccione una muestra aleatoria simple de tamaño 100 de la población y realice una
prueba para ver si puede concluir que existe una relación entre el consumo de alcohol y el estado de presión
arterial alta en la población. Dejara¼ .05 y determinar elpagvalor. Compara tus resultados con los de tus
compañeros.
3.Consulte el Ejercicio 1. Seleccione una muestra aleatoria simple de tamaño 100 de la población y realice
una prueba para ver si puede concluir que existe una relación entre el género y el tabaquismo en la
población. Dejara¼ .05 y determinar elpagvalor. Compara tus resultados con los de tus compañeros.
4.Consulte el Ejercicio 1. Seleccione una muestra aleatoria simple de tamaño 100 de la población y realice una
prueba para ver si puede concluir que existe una relación entre el género y el nivel de consumo de alcohol en
la población. Dejara¼ .05 y encuentra elpagvalor. Compara tus resultados con los de tus compañeros.
REFERENCIAS
Referencias de metodología
1. kARLPAGEARSON, “Sobre el criterio de que un sistema dado de desviaciones de lo probable en el caso de un sistema de variables
correlacionadas es tal que puede suponerse razonablemente que ha surgido de un muestreo aleatorio”,The London,
Edinburgh and Dublin Philosophical Magazine and Journal of Science,quinta serie,50 (1900), 157–175. Reimpreso enPrimeros
artículos estadísticos de Karl Pearson,Prensa de la Universidad de Cambridge, 1948.
2. HO LANCASTER,La distribución chi-cuadrada,Wiley, Nueva York, 1969.
3. mIKHAILS. N.IKULINy PRISCILLAP.EJREENWOOD,Una guía para las pruebas de chi-cuadrado,Wiley, Nueva York, 1996.
4. WILLIAMGCOCRAN, "ElX2Prueba de bondad de ajuste”,Anales de estadística matemática, 23 (1952), 315–345.
5. WILLIAMGCOCRAN, “Algunos métodos para fortalecer el comúnX2Pruebas,”biometría, 10 (1954), 417–451.
6. Año fiscalATE, “Tablas de contingencia que involucran números pequeños y laX2Pruebas,”Revista de la Royal Statistical
Society, Suplemento, 1,1934 (Serie B), 217–235.
7. RA FES ELLA,Métodos estadísticos para investigadores,Quinta edición, Oliver and Boyd, Edimburgo, 1934.
8. RA FES ELLA, "La lógica de la inferencia inductiva",Revista de la Royal Statistical Society Serie A, 98 (1935), 39–54.
9. JO IRWIN, “Pruebas de significación para diferencias entre porcentajes basadas en números pequeños”,Metron, 12
(1935), 83–94.
10. Año fiscalATE, “Tablas de contingencia que involucran números pequeños y laX2Prueba,"Revista de la Royal Statistical
Society, Suplemento, 1, (1934), 217–235.
11. DJ F.INNEY, “La prueba de significancia de Fisher-Yates en 2 - 2 tablas de contingencia,”Biometrika, 35 (1948),
145-156.
REFERENCIAS 667
12. R.LATSCHA, "Pruebas de significación en una tabla de contingencia 2 - 2: extensión de la tabla de Finney",Biometrika, 40 (
1955), 74–86.
13. GA BARNARD, “Una nueva prueba para 2 - 2 tablas,”Naturaleza, 156 (1945), 117.
14. GA BARNARD, “Una nueva prueba para 2 - 2 tablas,”Naturaleza, 156 (1945), 783–784.
15. GA BARNARD, “Pruebas de significación para 2 - 2 tablas,”Biometrika, 34 (1947), 123–138.
16. RA FES ELLA, “Una nueva prueba para 2 - 2 tablas,”Naturaleza, 156 (1945), 388.
17. ES PEARSON, "La elección de pruebas estadísticas ilustradas sobre la interpretación de datos clasificados en una tabla 2 - 2",
Biometrika, 34 (1947), 139–167.
18. A. S.HUMEDAL, "Una comparación de la prueba Chi-Square para 1 df y la prueba exacta de Fisher", Rand Corporation,
Santa Mónica, CA, 1972.
19. WENDELLECARR, "Texto exacto de Fisher extendido a más de dos muestras del mismo tamaño",Tecnometría, 22 (1980),
269–270.
20. HENRIARR. N.ALERO, "Una nueva mirada a una vieja prueba",Boletín de Estadística Aplicada, 9 (1982), 165–178.
21. WILLIAMD DSOBRE, "Sensibilidad del texto exacto de Fisher a perturbaciones menores en 2 - 2 tablas de contingencia",
Estadística en Medicina, 5 (1986), 629–635.
22. N. M.ANTELy W. H.AENSZEL, “Aspectos estadísticos del análisis de datos de estudios retrospectivos de enfermedades”,
Revista del Instituto Nacional del Cáncer, 22 (1959), 719–748.
23. N. M.ANTEL, “Pruebas de chi-cuadrado con un grado de libertad: Extensiones del procedimiento de Mantel-Haenszel,” Revista de la
Asociación Estadounidense de Estadística, 58 (1963), 690–700.
Aplicaciones Referencias
A-1. CUN ROLWCRANORy DCERVEZA INGLESAANTES DE CRISTOHRISTENSEN, “El Proyecto Asheville: Resultados a corto plazo de un programa de
atención de la diabetes en una farmacia comunitaria”,Diario de la Asociación Farmacéutica Americana, 43 (2003), 149–159. AMI
A-2. LBSÍ, hCUEROALLORE, THOMASMGENFERMO, y PETERnpEDUZZI, "Aplicación de modelos binomiales negativos para resultados discretos: un
estudio de caso en la investigación sobre el envejecimiento"Revista de Epidemiología Clínica, 56 (2003), 559–564.
A-17. Soy TOSCHKE, SM MONGOMERÍA, ARRIBAfeiffery R.von Kries, “Exposición intrauterina temprana a productos inhalados
por tabaco y obesidad”,Diario Americano de Epidemiología, 158 (2003), 1068–1074.
A-18. DanielHLAMETROONT, mATTEOJBUDOFF, DÁVIDOEMHAVELLE, ROBERTOSHAVELLE, BRUCEHBRENDIMIENTOy J.AMÉS
MHAGAR, "La exploración de calcio coronario agrega valor incremental a los pacientes con pruebas de esfuerzo positivas",
Diario americano del corazón, 143 (2002), 861–867.
A-19. METROARGARETLJDAVY, TOMJDEXTRAÑO, COLINGLReino Unido, y DÁVIDOSEÑORODER, "Cáncer de cuello uterino: efecto del tipo de célula
glandular en el pronóstico, el tratamiento y la supervivencia",Obstetricia y Ginecología, 101 (2003), 38–45.
A-20. A NOSOTROSTENESTRANDAy L. W.ALENTÍN, “Revascularización temprana y supervivencia de 1 año en sobrevivientes de 14 días de
infarto agudo de miocardio,”Lanceta, 359 (2002), 1805–1811.
A-21. TAKAKOSUGIYAMA, kUMIYASUGIYAMA, mASAOTAOD, TAstuoYUKAWA, SOHEIMETROAKINO, y TAKESHIFUKUDA, "Riesgo
Factores para el asma y las enfermedades alérgicas entre los escolares de 13 y 14 años en Japón”,Alergología
Internacional, 51 (2002), 139–150.
A-22. DHOLBÉN, MC MCCLINCY, JP H.olcomby KL DEAN, “Estado de seguridad alimentaria de los hogares en los Apalaches de Ohio
con niños en Head Start”,Diario de la Asociación Dietética Americana, 104 (2004), 238–241.
A-23. jOHNHPORCERELLI, ROSEMARIOCOGAN, PAGATRICIAP. W.est, miENANOA. R.OSE, DARISTALAMBRECHE, kARÉNE. W.ILSON,
RICHARDKSEVERSON, y DUNÍAkARANA, “Vitimización violenta de mujeres y hombres: síntomas físicos y
psiquiátricos”,Revista de la Junta Estadounidense de Medicina Familiar, 16 (2003), 32–39.
A-24. kESPCGALLINA, LEE.UU.METROIEYpunto de acceso, ROBINMETROARCAS, y StephenSHUMACK, “Terapia de corta duración con crema de imiquimod
al 5 % para la queratosis solar: un ensayo controlado aleatorizado”Revista de Dermatología de Australasia, 44 (2003), 250–255.
Este capítulo explora una amplia variedad de técnicas que son útiles cuando se violan
los supuestos subyacentes de las pruebas de hipótesis tradicionales o cuando se
desea realizar una prueba sin hacer suposiciones sobre la población muestreada.
TEMAS
13.1INTRODUCCIÓN
13.2ESCALAS DE MEDIDA
13.3LA PRUEBA DEL SIGNO
670
13.1 INTRODUCCIÓN 671
2. ser capaz de calcular e interpretar una amplia variedad de pruebas no paramétricas comúnmente
utilizadas en la práctica.
3. comprender qué pruebas no paramétricas se pueden usar en lugar de las pruebas estadísticas
paramétricas tradicionales cuando se violan varios supuestos de prueba.
13.1 INTRODUCCIÓN
La mayoría de los procedimientos de inferencia estadística que hemos discutido hasta este punto se
clasifican comoestadísticas paramétricas.Una excepción es nuestro uso de chi-cuadrado, como prueba de
bondad de ajuste y como prueba de independencia. Estos usos de chi-cuadrado se encuentran bajo el título
de estadísticas no paramétricas.
La pregunta obvia ahora es: "¿Cuál es la diferencia?" En respuesta, recordemos la naturaleza de
los procedimientos inferenciales que hemos categorizado comoparamétrico.En cada caso, nuestro
interés se centró en estimar o probar una hipótesis sobre uno o más parámetros poblacionales.
Además, el centro de estos procedimientos era el conocimiento de la forma funcional de la población
de la que se extrajeron las muestras que proporcionaban la base para la inferencia.
Un ejemplo de una prueba estadística paramétrica es la ampliamente utilizadatprueba. Los usos más
comunes de esta prueba son para probar una hipótesis sobre una sola media poblacional o la diferencia
entre dos medias poblacionales. Una de las suposiciones que subyacen al uso válido de esta prueba es que la
población o poblaciones muestreadas tienen una distribución al menos aproximadamente normal.
Como aprenderemos, los procedimientos que analizamos en este capítulo no tienen que ver
con los parámetros de la población o no dependen del conocimiento de la población muestreada.
Estrictamente hablando, solo aquellos procedimientos que prueban hipótesis que no son
afirmaciones sobre parámetros poblacionales se clasifican comono paramétrico,mientras que
aquellos que no hacen ninguna suposición acerca de la población muestreada se denominansin
distribuciónprocedimientos. A pesar de esta distinción, es habitual utilizar los términosno paramétrico
ydistribución gratuitaindistintamente y discutir los diversos procedimientos de ambos tipos bajo el
título estadísticas no paramétricas.Seguiremos esta convención.
La discusión anterior implica las siguientes cuatro ventajas de las estadísticas no
paramétricas.
1.Permiten la prueba de hipótesis que no son afirmaciones sobre los valores de los parámetros de
la población. Algunas de las pruebas de bondad de ajuste de chi-cuadrado y las pruebas de
independencia son ejemplos de pruebas que poseen esta ventaja.
2.Las pruebas no paramétricas se pueden utilizar cuando se desconoce la forma de la población
muestreada.
4.Los procedimientos no paramétricos se pueden aplicar cuando los datos que se analizan consisten
simplemente en clasificaciones o clasificaciones. Es decir, los datos pueden no estar basados en un
672 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
escala de medición lo suficientemente fuerte como para permitir las operaciones aritméticas
necesarias para llevar a cabo procedimientos paramétricos. El tema de las escalas de medición se
analiza con más detalle en la siguiente sección.
Aunque las estadísticas no paramétricas disfrutan de una serie de ventajas, también deben
reconocerse sus desventajas.
1.El uso de procedimientos no paramétricos con datos que pueden manejarse con un procedimiento paramétrico
da como resultado un desperdicio de datos.
2.La aplicación de algunas de las pruebas no paramétricas puede ser laboriosa para muestras
grandes.
Como se señaló en la sección anterior, una de las ventajas de los procedimientos estadísticos no
paramétricos es que se pueden utilizar con datos que se basan en una escala de medición débil. Para
comprender completamente el significado de esta declaración, es necesario conocer y comprender el
significado de la medición y las diversas escalas de medición que se utilizan con mayor frecuencia. En
este punto, el lector puede referirse a la discusión de las escalas de medición en el Capítulo 1.
Los lectores también deben tener en cuenta que otras transformaciones (p. ej., tomar el logaritmo de
los datos originales) pueden normalizar los datos lo suficiente como para que se puedan usar
procedimientos paramétricos estándar en los datos transformados en lugar de usar métodos no
paramétricos.
13.3 LA PRUEBA DEL SIGNO 673
el familiartLa prueba no es estrictamente válida para probar (1) la hipótesis nula de que la media de una
población es igual a algún valor en particular, o (2) la hipótesis nula de que la media de una población de
diferencias entre pares de medidas es igual a cero a menos que el valor relevante las poblaciones están al
menos aproximadamente distribuidas normalmente. El caso 2 se reconocerá como una situación que fue
analizada por la prueba de comparaciones pareadas en el Capítulo 7. Cuando no se pueden hacer los
supuestos de normalidad o cuando los datos disponibles son rangos en lugar de medidas en una escala de
intervalo o razón, el investigador puede desear un procedimiento opcional. Aunque eltse sabe que la prueba
es bastante insensible a las violaciones de la suposición de normalidad, hay ocasiones en las que es deseable
una prueba alternativa.
Una prueba no paramétrica de uso frecuente que no depende de los supuestos delt la
prueba es laprueba de signosEsta prueba se centra en la mediana en lugar de la media como
medida de tendencia central o ubicación. La mediana y la media serán iguales en distribuciones
simétricas. La única suposición que subyace a la prueba es que la distribución de la variable de
interés es continua. Este supuesto descarta el uso de datos nominales.
La prueba de signos recibe su nombre del hecho de que los más y los menos, en lugar de los valores
numéricos, proporcionan los datos sin procesar que se utilizan en los cálculos. Ilustramos el uso de la prueba
de signos, primero en el caso de una sola muestra y luego con un ejemplo que involucra muestras pareadas.
EJEMPLO 13.3.1
Los investigadores querían saber si la instrucción en el cuidado y arreglo personal mejoraría la apariencia de
las niñas con retraso mental. En una escuela para retrasados mentales, 10 niñas seleccionadas al azar
recibieron instrucción especial en cuidado y arreglo personal. Dos semanas después de completar el curso de
instrucción, las niñas fueron entrevistadas por una enfermera y una trabajadora social, quienes asignaron a
cada niña una puntuación basada en su apariencia general. Los investigadores creían que las puntuaciones
alcanzaban el nivel de una escala ordinal. Sentían que aunque una puntuación de, digamos, 8 representaba
una mejor apariencia que una puntuación de 6, no estaban dispuestos a decir que la diferencia entre las
puntuaciones de 6 y 8 era igual a la diferencia entre, digamos, las puntuaciones de 8 y 10; o que la diferencia
entre las puntuaciones de 6 y 8 representó el doble de mejora que la diferencia entre las puntuaciones de 5 y
6. Las puntuaciones se muestran en la Tabla 13.3.1. Queremos saber si podemos concluir que la puntuación
media de la población de la que suponemos que se ha extraído esta muestra es diferente de 5.
1 4 6 6
2 5 7 10
3 8 8 7
4 8 9 6
5 9 10 6
674 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Solución:
Dejara¼ :05.
4. Estadística de prueba.El estadístico de prueba para la prueba de signos es el
número observado de signos más o el número observado de signos menos. La
naturaleza de la hipótesis alternativa determina cuál de estos estadísticos de
prueba es apropiado. En una prueba dada, cualquiera de las siguientes hipótesis
alternativas es posible:
Si la hipótesis alternativa es
HA:PAGðþÞ >PAGð-Þ
HA:PAGðþÞ <PAGð-Þ
HA:PAGðþÞ 6¼PAGð-Þ
TABLA 13.3.2 Puntuaciones superioresðþÞy por debajoð-Þla mediana hipotética basada en los datos
del ejemplo 13.3.1
Chica 1 2 3 4 5 6 7 8 9 10
Puntuación relativa a - 0 þ þ þ þ þ þ þ þ
hipotético
mediana
H0:PAGðþÞ ¼PAGð-Þ ¼ :5
Prueba de signos: datos emparejadosCuando los datos a analizar consisten en observaciones en pares
emparejados y los supuestos que subyacen a latno se cumplen las pruebas, o la escala de medición es débil,
se puede emplear la prueba de signos para probar la hipótesis nula de que la diferencia de la mediana es 0.
Una forma alternativa de enunciar la hipótesis nula es
Una de las puntuaciones coincidentes, por ejemplo,Yi, se resta de la otra puntuación,Xi. SiYies
menos queXi, el signo de la diferencia esþ,y siYies mayor queXi, el signo de la diferencia es -. Si la
diferencia de la mediana es 0, esperaríamos que un par elegido al azar tuviera la misma probabilidad
de producir unþcomo a - cuando se realiza la resta. Podemos enunciar la hipótesis nula, entonces,
como
H0:PAGðþÞ ¼PAGð-Þ ¼ :5
En una muestra aleatoria de pares emparejados, esperaríamos que el número deþ's y -'s sean
aproximadamente iguales. si hay masþ's o más - de los que pueden explicarse solo por casualidad
cuando la hipótesis nula es verdadera, albergaremos algunas dudas sobre la veracidad de nuestra
hipótesis nula. Por medio de la prueba de los signos, podemos decidir cuántos de un signo
constituyen más de lo que puede explicarse solo por casualidad.
13.3 LA PRUEBA DEL SIGNO 677
EJEMPLO 13.3.2
Un equipo de investigación dental deseaba saber si sería beneficioso enseñar a las personas a
cepillarse los dientes. Doce pares de pacientes atendidos en una clínica dental se obtuvieron
emparejando cuidadosamente factores como la edad, el sexo, la inteligencia y las puntuaciones
iniciales de higiene oral. Un miembro de cada pareja recibió instrucciones sobre cómo cepillarse los
dientes y sobre otros asuntos de higiene bucal. Seis meses después, un higienista dental examinó a
los 24 sujetos y les asignó una puntuación de higiene bucal sin saber qué sujetos habían recibido la
instrucción. Una puntuación baja indica un alto nivel de higiene bucal. Los resultados se muestran en
la Tabla 13.3.3.
Solución:
Puntaje
1 1.5 2.0
2 2.0 2.0
3 3.5 4.0
4 3.0 2.5
5 3.5 4.0
6 2.5 3.0
7 2.0 3.5
8 1.5 3.0
9 1.5 2.5
10 2.0 2.5
11 3.0 2.5
12 2.0 2.5
678 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Par 1 2 3 4 5 6 7 8 9 10 11 12
signo de puntuación - 0 - þ - - - - - - þ -
diferencias
X2 k
PAGdk-2j11; :5¼ 11Ckd:5Þ ð:5Þ11-k
k¼0
una muestra se empareja con un miembro de la otra muestra para formar una muestra de pares
emparejados. También hemos visto que la hipótesis alternativa puede conducir a una prueba
unilateral o bilateral. En cualquier caso, nos concentramos en el signo que aparece con menos
frecuencia y calculamos la probabilidad de obtener ese número o menos de ese signo.
Usamos el signo que ocurre con menos frecuencia como nuestra estadística de prueba porque las
probabilidades binomiales en la Tabla B del Apéndice son probabilidades "menores o iguales a". Usando el
signo menos frecuente, podemos obtener la probabilidad que necesitamos directamente de la Tabla B sin
tener que hacer ninguna resta. Si las probabilidades en la Tabla B fueran probabilidades “mayores o iguales
a”, que a menudo se encuentran en las tablas de distribución binomial, usaríamos el signo que ocurre con
mayor frecuencia como nuestra estadística de prueba para aprovechar la conveniencia de obtener la
distribución binomial. probabilidad deseada directamente de la tabla sin tener que hacer ninguna resta. De
hecho, podríamos, en nuestros ejemplos presentes, usar el signo que ocurre con mayor frecuencia como
nuestra estadística de prueba, pero debido a que la Tabla B contiene probabilidades “menores que o iguales
a”, tendríamos que realizar una operación de resta para obtener la probabilidad deseada. Como ilustración,
considere el último ejemplo. Si usamos como nuestra estadística de prueba el signo que ocurre con mayor
frecuencia, es 9, el número de menos. La probabilidad deseada, entonces, es la probabilidad de nueve o más
menos, cuandonorte¼11 ypag¼ :5. Es decir, queremos
PAGdk¼9j11; :5Þ
Sin embargo, dado que la Tabla B contiene probabilidades “menores o iguales a”, debemos obtener
esta probabilidad por resta. Eso es,
dk:5Þ - :5norte
z¼ pffiffiffi (13.3.2)
:5norte
Datos:
C1: 4 5 8 8 9 6 10 7 6 6
Estadística no paramétricos 1 muestra de letrero MTB > Prueba ST 5 C1; SUBC >
Alternativa 0.
TipoC1enVariables.ElegirMediana de pruebay tipo5en el cuadro de
texto. Hacer clicDE ACUERDO.
Producción:
EJERCICIOS
13.3.1A una muestra aleatoria de 15 estudiantes de enfermería se le aplicó una prueba para medir su nivel de autoritarismo con
los siguientes resultados:
1 75 9 82
2 90 10 104
3 85 11 88
4 110 12 124
5 115 13 110
6 95 14 76
7 132 15 98
8 74
Pruebe al nivel de significancia de .05, la hipótesis nula de que la puntuación mediana para la población
muestreada es 100. Determine elpagvalor.
13.4 LA PRUEBA DE RANGO CON SIGNOS DE WILCOXON PARA LOCALIZACIÓN 681
13.3.2Determinar los efectos del jugo de toronja en la farmacocinética de la digoxina oral (un fármaco que a menudo se receta
para las enfermedades del corazón) fue el objetivo de un estudio realizado por Parker et al. (A-1). Siete voluntarios
sanos no fumadores participaron en el estudio. Los sujetos tomaron digoxina con agua durante 2 semanas,
sin digoxina durante 2 semanas y digoxina con jugo de toronja durante 2 semanas. La concentración máxima
promedio de digoxina en plasma (Cmax) cuando los sujetos tomaron digoxina con agua se proporciona en la primera
columna de la siguiente tabla. La segunda columna da la concentración de Cmax cuando los sujetos tomaron
digoxina con jugo de toronja. ¿Podemos concluir sobre la base de estos datos que la concentración de Cmax es
mayor cuando la digoxina se toma con jugo de toronja? Dejara¼ :5.
Cmáx
Sujeto H2O GFJ
1 2.34 3.03
2 2.46 3.46
3 1.87 1.97
4 3.09 3.81
5 5.59 3.07
6 4.05 2.62
Fuente: Datos proporcionados por cortesía
7 6.21 3.44 de Robert B. Parker, Pharm.D.
13.3.3Una muestra de 15 pacientes asmáticos participó en un experimento para estudiar el efecto de un nuevo
tratamiento sobre la función pulmonar. Entre las diversas medidas registradas se encuentran las de volumen
espiratorio forzado (litros) en 1 segundo (FEV1) antes y después de la aplicación del tratamiento. Los
resultados fueron los siguientes:
Sobre la base de estos datos, ¿se puede concluir que el tratamiento es eficaz para aumentar el FEV1?1
¿nivel? Dejara¼ :05 y encuentra elpagvalor.
A veces deseamos probar una hipótesis nula sobre la media de una población, pero por alguna razón
tampocoznites un estadístico de prueba apropiado. Si tenemos una pequeña muestra.dn <30Þde una
población que se sabe que tiene una distribución no normal en términos generales, y el teorema del
límite central no es aplicable, lazSe descarta la estadística. Eltla estadística no es apropiada
682 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
porque la población muestreada no se aproxima lo suficiente a una distribución normal. Cuando nos
enfrentamos a tal situación, generalmente buscamos un procedimiento estadístico no paramétrico
apropiado. Como hemos visto, la prueba de signos puede usarse cuando nuestros datos consisten en
una sola muestra o cuando tenemos datos emparejados. Sin embargo, si los datos para el análisis se
miden al menos en una escala de intervalo, la prueba de signos puede no ser deseable porque no
haría un uso completo de la información contenida en los datos. Un procedimiento más apropiado
podría ser la prueba de rango con signo de Wilcoxon (1), que utiliza las magnitudes de las diferencias
entre las mediciones y un parámetro de ubicación hipotético en lugar de solo los signos de las
diferencias.
HipótesisLas siguientes son las hipótesis nulas (junto con sus alternativas) que pueden
probarse sobre alguna media poblacional desconocidametro0.
di¼Xi-metro0
Si algunaXies igual a la media, por lo quedi¼0, elimina esodide los cálculos y reducir
norterespectivamente.
2.Clasifica lo utilizabledidel más pequeño al más grande sin importar el signo dedi. Es decir,
considere sólo el valor absoluto de ladi, designadajdij,al momento de clasificarlos. Si dos o más
de losjdijson iguales, asigne a cada valor empatado la media de las posiciones de rango que
ocupan los valores empatados. Si, por ejemplo, los tres más pequeñosjdijson todos iguales,
colóquelos en las posiciones de rango 1, 2 y 3, pero asigne a cada uno un rango de d1þ2þ3Þ=3
¼2.
3.Asigne a cada rango el signo de ladique da ese rango.
4.EncontrarTþ, la suma de los rangos con signos positivos, yT-, la suma de los rangos con signos
negativos.
CuandoH0:metro metro0es cierto, esperamos que nuestra muestra arroje un gran valor deTþ.
Por lo tanto, cuando la hipótesis alternativa unilateral establece que la verdadera media poblacional es
menor que la media hipotéticadmetro < metro0Þ,un valor suficientemente pequeño deTþprovocará el
rechazo deH0, yTþes el estadístico de prueba.
CuandoH0:m-m0es cierto, esperamos que nuestra muestra arroje un gran valor deT-. Por lo
tanto, para la alternativa unilateralHA:metro > metro0, un valor suficientemente pequeño deT-
provocará el rechazo deH0yT-es el estadístico de prueba.
Valores criticosLos valores críticos del estadístico de prueba de Wilcoxon se dan en la Tabla K del
Apéndice. Niveles de probabilidad exactos (PAG)se dan con cuatro decimales para todos los posibles
totales de rango (T)que producen un nivel de probabilidad diferente en el cuarto lugar decimal desde
.0001 hasta .5000. Los totales de rango (T)están tabulados para todos los tamaños de muestra de
norte¼5 a travésnorte¼30. Las siguientes son las reglas de decisión para las tres posibles hipótesis
alternativas:
(b)HA:metro < metro0. RechazarH0en elanivel de significación siTþes menor o igual al tabuladoT
paranortey preseleccionadoa.
(C)HA:metro > metro0. RechazarH0en elanivel de significación siT-es menor o igual al tabuladoT
paranortey preseleccionadoa.
EJEMPLO 13.4.1
El gasto cardíaco (litros/minuto) se midió por termodilución en una muestra aleatoria simple de 15
pacientes quirúrgicos posquirúrgicos en posición lateral izquierda. Los resultados fueron los
siguientes:
4,91 4,10 6,74 7,27 7,42 7,50 6,56 4,64
5,98 3,14 3,23 5,80 6,17 5,39 5,77
Deseamos saber si podemos concluir sobre la base de estos datos que la media de la población es
diferente de 5.05.
684 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Solución:
Dejara¼0:05
4. Estadística de prueba.El estadístico de prueba seráTþoT-, el que sea menor.
Llamaremos al estadístico de pruebat
5. Distribución de la estadística de prueba.Los valores críticos de la estadística de
prueba se dan en la Tabla K del Apéndice.
6. Regla de decisión.vamos a rechazarH0si el valor calculado deTes menor o
igual a 25, el valor crítico paranorte¼15, yun =2¼ :0240, el valor más cercano
a .0250 en la Tabla K.
7. Cálculo de la estadística de prueba.El cálculo del estadístico de prueba se muestra
en la Tabla 13.4.1.
8. Decisión estadística.Como 34 es mayor que 25, no podemos
rechazarH0.
9. Conclusión.Concluimos que la media poblacional puede ser 5.05.
10pagvalor.De la Tabla K vemos quepag¼2d:0757Þ ¼ :1514.
Cardíaco
Producción di¼Xi-5:05 rango dejdij Rango firmado dejdij
4.91 - :14 1 -1
4.10 - :95 7 -7
6.74 þ1:69 10 þ10
7.27 þ2:22 13 þ13
7.42 þ2:37 14 þ14
7.50 þ2:45 15 þ15
6.56 þ1:51 9 þ9
4.64 - :41 3 -3
5.98 þ:93 6 þ6
3.14 - 1:91 12 - 12
3.23 - 1:82 11 - 11
5.80 þ:75 5 þ5
6.17 þ1:12 8 þ8
5.39 þ:34 2 þ2
5.77 þ:72 4 þ4
Tþ¼86;T-¼34;T¼34
&
EJERCICIOS 685
Estadística no paramétricos Wilcoxon de 1 muestra MTB > WTEST 5.05 C1; SUBC >
Alternativa 0.
TipoC1enVariables.ElegirMediana de prueba.Escriba 5.05 en el cuadro de
texto. Hacer clicDE ACUERDO .
Producción:
Prueba de rangos con signo de pares emparejados de WilcoxonLa prueba de Wilcoxon puede
usarse con datos pareados en circunstancias en las que no es apropiado usar las
comparaciones pareadastprueba descrita en el Capítulo 7. En tales casos obtener cada uno de
los Dakota del Norteivalores, la diferencia entre cada uno de losnortepares de medidas. si
dejamos metroD¼la media de una población de tales diferencias, podemos seguir el
procedimiento descrito anteriormente para probar cualquiera de las siguientes hipótesis nulas:
H0:metroD¼0,0,HyH 0:metro
0:metro D D-0.
EJERCICIOS
13.4.1Dieciséis animales de laboratorio fueron alimentados con una dieta especial desde el nacimiento hasta las 12 semanas de edad. su peso
las ganancias (en gramos) fueron las siguientes:
63 68 79 64
sesenta y cinco 63 64
sesenta y cinco 76 74 66 66 67 73 69 76
¿Podemos concluir a partir de estos datos que la dieta resulta en un aumento de peso promedio de menos de 70 gramos? Dejar
a¼ :05, y encuentre elpagvalor.
13.4.2Cantantes aficionados y profesionales fueron objeto de un estudio realizado por Grape et al. (A-2). Los investigadores
investigó los posibles efectos beneficiosos del canto sobre el bienestar durante una sola lección de canto. Una de las
variables de interés fue el cambio en el cortisol como resultado de la lección de señas. Utilice los datos de la siguiente
tabla para determinar si, en general, el cortisol (nmol/L) aumenta después de una lección de canto. Dejara¼ :05.
Encuentra elpagvalor.
686 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Sujeto 1 2 3 4 5 6 7 8
13.4.3En un estudio realizado por Zuckerman y Heneghan (A-3), se midieron las tensiones hemodinámicas en sujetos sometidos
a colecistectomía laparoscópica. Una variable de resultado de interés fue el volumen diastólico final ventricular
(LVEDV) medido en mililitros. Una parte de los datos aparecen en la siguiente tabla. La línea de base se refiere a una
medición realizada 5 minutos después de la inducción de la anestesia, y el término "5 minutos" se refiere a una
medición realizada 5 minutos después de la línea de base.
VTSVI (ml)
1 51.7 49.3
2 79.0 72.0
3 78.7 87.3
4 80.3 88.3
5 72.0 103.3
6 85.0 94.0
7 69.7 94.7
8 71.3 46.3
9 55.7 71.7
Fuente: Datos proporcionados por
10 56.3 72.3 cortesía de RS Zuckerman, MD.
¿Podemos concluir, sobre la base de estos datos, que entre los sujetos sometidos a colecistectomía
laparoscópica, los niveles promedio de LVEDV cambian? Dejara¼ :01.
Un procedimiento no paramétrico que se puede usar para probar la hipótesis nula de que se han
extraído dos muestras independientes de poblaciones con medianas iguales es la prueba de la
mediana. La prueba, atribuida principalmente a Mood (2) y Westenberg (3), también es discutida por
Brown y Mood (4).
Ilustramos el procedimiento mediante un ejemplo.
EJEMPLO 13.5.1
¿Los estudiantes de secundaria masculinos urbanos y rurales difieren con respecto a su nivel de salud
mental?
Solución:
Escuela
35 29 25 50
26 50 27 37
27 43 45 34
21 22 46 31
27 42 33
38 47 26
23 42 46
25 32 41
A los estudiantes de una escuela secundaria urbana se les aplicó una prueba para
medir su nivel de salud mental. Los resultados se muestran en la Tabla 13.5.1.
Para determinar si podemos concluir que existe una diferencia, realizamos una
prueba de hipótesis que hace uso de la prueba de la mediana. Supongamos que
elegimos un nivel de significancia de .05.
HA:METROtu6¼METROR
Total dieciséis 12 28
28½ð6Þð4Þ - ð8Þð10Þ2
X2¼ ¼2:33
ddieciséisÞð12Þð14Þð14Þ
Estadística no paramétricos Prueba de la mediana de Mood MTB > Estado de ánimo C1 C2.
Producción:
frecuencias que caen por encima y por debajo de la mediana calculada a partir de muestras combinadas. Si
se cumplen las condiciones en cuanto al tamaño de la muestra y las frecuencias esperadas,X2puede
calcularse y compararse con el valor críticoX2conk-1 grados de libertad.
EJERCICIOS
13.5.1Se revisaron quince registros de pacientes de cada uno de los dos hospitales y se les asignó una puntuación diseñada para medir el
nivel de atención. Las puntuaciones fueron las siguientes:
Hospital A: 99, 85, 73, 98, 83, 88, 99, 80, 74, 91, 80, 94, 94, 98, 80
Hospital B: 78, 74, 69, 79, 57, 78, 79, 68, 59, 91, 89, 55, 60, 55, 79
690 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
¿Concluiría, en el nivel de significancia de .05, que las dos medianas de población son diferentes?
Determina elpagvalor.
¿Concluiría con un nivel de significancia de .05 que las medianas de las dos poblaciones muestreadas son
diferentes? Determina elpagvalor.
La prueba de la mediana discutida en la sección anterior no hace pleno uso de toda la información
presente en las dos muestras cuando la variable de interés se mide al menos en una escala ordinal.
Reducir el contenido de información de una observación a si cae o no por encima o por debajo de la
mediana común es un desperdicio de información. Si, para probar la hipótesis deseada, hay
disponible un procedimiento que hace uso de más información inherente a los datos, ese
procedimiento debe usarse si es posible. Un procedimiento no paramétrico de este tipo que a
menudo se puede usar en lugar de la prueba de la mediana es la prueba de Mann-Whitney (5), a veces
llamada prueba de Mann-Whitney-Wilcoxon. Dado que esta prueba se basa en los rangos de las
observaciones, utiliza más información que la prueba de la mediana.
HipótesisCuando se cumplen estos supuestos, podemos probar la hipótesis nula de que las dos
poblaciones tienen medianas iguales frente a cualquiera de las tres alternativas posibles: (1) las
poblaciones no tienen medianas iguales (prueba bilateral), (2) la mediana de la población 1 es mayor
que la mediana de la población 2 (prueba unilateral), o (3) la mediana de la población 1 es menor que
la mediana de la población 2 (prueba unilateral). Si las dos poblaciones son simétricas, de modo que
dentro de cada población la media y la mediana sean iguales, las conclusiones a las que lleguemos
con respecto a las dos medianas de población también se aplicarán a las dos medias de población. El
siguiente ejemplo ilustra el uso de la prueba de Mann-Whitney.
13.6 LA PRUEBA DE MANN-WHITNEY 691
EJEMPLO 13.6.1
Un investigador diseñó un experimento para evaluar los efectos de la inhalación prolongada de óxido de
cadmio. Quince animales de laboratorio sirvieron como sujetos experimentales, mientras que 10 animales
similares sirvieron como controles. La variable de interés fue el nivel de hemoglobina después del
experimento. Los resultados se muestran en la Tabla 13.6.1. Deseamos saber si podemos concluir que la
inhalación prolongada de óxido de cadmio reduce el nivel de hemoglobina.
Solución:
H0:METROX METROY
HA:METROX< MY
14.4 17.4
14.2 16.2
13.8 17.1
16.5 17.5
14.1 15.0
16.6 16.0
15.9 16.9
15.6 15.0
14.1 16.3
15.3 16.8
15.7
16.7
13.7
15.3
14.0
692 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
X Rango Y Rango
13.7 1
13.8 2
14.0 3
14.1 4.5
14.1 4.5
14.2 6
14.4 7
15.0 8.5
15.0 8.5
15.3 10.5
15.3 10.5
15.6 12
15.7 13
15.9 14
16.0 15
16.2 dieciséis
16.3 17
16.5 18
16.6 19
16.7 20
16.8 21
16.9 22
17.1 23
17.4 24
17.5 25
_____
Total 145
La estadística de prueba es
nortednorteþ1Þ
T¼S - (13.6.1)
2
dóndenortees el numero de muestraXobservaciones ySes la suma de los
rangos asignados a las observaciones muestrales de la población deX
valores. La elección de qué valores de la muestra etiquetamosXes arbitrario
5. Distribución de la estadística de prueba.Los valores críticos de la distribución de la
estadística de prueba se dan en la Tabla L del Apéndice para varios niveles dea.
6. Regla de decisión.Si la mediana de laXla población es, de hecho, más pequeña que la
mediana de laYpoblación, como se especifica en la hipótesis alternativa, esperaríamos
(para tamaños de muestra iguales) la suma de los rangos asignados
13.6 LA PRUEBA DE MANN-WHITNEY 693
H0:METROX-MY
contra
HA:METROX> mY
H0:METROX¼METROY
HA:METROX6¼METROY
Rechazar H0si el valor calculado de T es menor que 45, el valor crítico del estadístico de
prueba para n¼15;metro¼10,ya¼ :05que se encuentra en la tabla L.
15d15þ1Þ
T¼145 - ¼25
2
694 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
T - mn=2
z¼pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi (13.6.2)
Nuevo Méjicodnorteþmetroþ1jÞ=12
y compare el resultado, para determinar su importancia, con los valores críticos de la distribución normal
estándar.
Producción:
C1 norte 15 15.300
Mediana
C2 norte 10 16.550
Mediana
Estimación puntual para ETA1 95,1 ETA2 es 1.300
Porcentaje de IC para ETA1 W 145,0 ETA2 es (2.300, 0.600)
rangos
Estadística de pruebab
X
U de Mann-Whitney 25.000
Wilcoxon W. 145.000
Z 2.775
asíncrono Sig. (2 colas) . 006
Sig exacto. [2*(Sig. de 1 cola)] . 004a
metrodmetroþ2norteþ1Þ
tuþW¼ (13.6.3)
2
EJERCICIOS
13.6.1Cranor y Christensen (A-4) estudiaron a diabéticos asegurados por dos empleadores. Los sujetos del grupo 1 fueron
empleados por la ciudad de Asheville, Carolina del Norte, y los sujetos del grupo 2 fueron empleados por Mission–
Sistema de Salud de St. Joseph. Al comienzo del estudio, los investigadores realizaron la prueba de Mann-
Whitney para determinar si existía una diferencia significativa de peso entre los dos grupos de estudio. Los
datos se muestran en la siguiente tabla.
Libras de peso)
Grupo 1 Grupo 2
¿Podemos concluir, sobre la base de estos datos, que los pacientes de los dos grupos difieren significativamente con
respecto al peso? Dejara¼ :05.
13.6.2Uno de los propósitos de un estudio de Liu et al. (A-5) fue determinar los efectos de MRZ 2/579 (un antagonista del
receptor que se ha demostrado que proporciona actividad neuroprotectora in vivo e in vitro) en neurológicos
EJERCICIOS 697
déficit en ratas Sprague-Dawley. En el estudio, 10 ratas iban a recibir MRZ 2/579 y nueve ratas iban a recibir solución
salina regular. Antes del tratamiento, los investigadores estudiaron los niveles de gases en sangre en los dos grupos
de ratas. La siguiente tabla muestra la pO2niveles para los dos grupos.
112.5 133.3
106.3 106.4
99.5 113.1
98.3 117.2
103.4 126.4
109.4 98.1
108.9 113.4
107.4 116.8
116.5
¿Podemos concluir, sobre la base de estos datos, que, en general, los sujetos que toman solución salina tienen, en promedio,
una pO más baja?2niveles al inicio? Dejara¼ :01.
13.6.3El propósito de un estudio realizado por investigadores de la Clínica Cleveland (Ohio) (A-6) fue determinar si el uso de
Flomax®redujo los efectos secundarios urinarios comúnmente experimentados por los pacientes después del
tratamiento con braquiterapia (implante permanente de semillas radiactivas) para el cáncer de próstata. La siguiente
tabla muestra las puntuaciones del índice de síntomas de la American Urological Association (AUA) para dos grupos
de sujetos después de 8 semanas de tratamiento. Cuanto mayor sea el índice AUA, más grave será la obstrucción e
irritación urinaria.
1 5 11 1 6 12
1 5 11 1 6 12
2 6 11 2 6 13
2 6 11 2 6 14
2 7 12 2 6 17
2 7 12 3 7 18
3 7 13 3 8 19
3 7 14 3 8 20
3 8 dieciséis 3 9 23
4 8 dieciséis 4 9 23
4 8 18 4 10
4 8 21 4 10
4 9 31 5 11
4 9 5 11
4 10 5 12
Fuente: Datos proporcionados por cortesía de Chandana Reddy, MS
¿Podemos concluir, sobre la base de estos datos, que el índice AUA mediano en el Flomax®grupo difiere
significativamente de la mediana del índice AUA del grupo placebo? Dejara¼ :05.
698 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Cuando se desea saber qué tan bien se ajusta la distribución de los datos muestrales a alguna distribución
teórica, una prueba conocida como prueba de bondad de ajuste de Kolmogorov-Smirnov proporciona una
alternativa a la prueba de bondad de ajuste de chi-cuadrado discutida en el Capítulo 12. La prueba recibe su
nombre de A. Kolmogorov y NV Smirnov, dos matemáticos rusos que introdujeron dos pruebas
estrechamente relacionadas en la década de 1930.
El trabajo de Kolmogorov (6) se ocupa del caso de una muestra como se discute aquí. El trabajo
de Smirnov (7) trata el caso de dos muestras cuyo interés se centra en contrastar la hipótesis de que
las distribuciones de las poblaciones biparentales son idénticas. La prueba para la primera situación
se conoce con frecuencia como la prueba de una muestra de Kolmogorov-Smirnov. La prueba para el
caso de dos muestras, comúnmente conocida como la prueba de dos muestras de Kolmogorov-
Smirnov, no se discutirá aquí.
el estadístico de prueba es
que se lee, “Des igual al supremum (mayor), sobre todoX,del valor absoluto de la
diferenciaFSdXÞmenosFTdXÞ.”
Se rechaza la hipótesis nula en elanivel de significación si el valor calculado deDexcede el
valor que se muestra en el Apéndice Tabla M para 1 -a (bilateral) y el tamaño de la muestra
norte.
13.7 PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV-SMIRNOV 699
EJEMPLO 13.7.1
En la tabla 13.7.1 se muestran las determinaciones de glucosa en sangre en ayunas realizadas en 36 varones
adultos no obesos, aparentemente sanos. Deseamos saber si podemos concluir que estos datos no son de
una población distribuida normalmente con una media de 80 y una desviación estándar de 6.
Solución:
Dejara¼ :05.
4. Estadística de prueba.Ver Ecuación 13.7.1.
5. Distribución de la estadística de prueba.Valores críticos del estadístico de prueba para
valores seleccionados dease dan en el Apéndice Tabla M.
75 92 80 80 84 72
84 77 81 77 75 81
80 92 72 77 78 76
77 86 77 92 80 78
68 78 92 68 80 81
87 76 80 87 77 86
700 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Acumulativo
X Frecuencia Frecuencia FSdXÞ
68 2 2 . 0556
72 2 4 . 1111
75 2 6 . 1667
76 2 8 . 2222
77 6 14 . 3889
78 3 17 . 4722
80 6 23 . 6389
81 3 26 . 7222
84 2 28 . 7778
86 2 30 . 8333
87 2 32 . 8889
92 4 36 1.0000
36
X z¼ ðX -80Þ=6 FTdXÞ
68 - 2:00 . 0228
72 - 1:33 . 0918
75 - :83 . 2033
76 - :67 . 2514
77 - :50 . 3085
78 - :33 . 3707
80 . 00 . 5000
81 . 17 . 5675
84 . 67 . 7486
86 1.00 . 8413
87 1.17 . 8790
92 2.00 . 9772
13.7 PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV-SMIRNOV 701
1.00
. 90
68 70 72 74 76 78 80 82 84 86 88 90 92 94
Una precauciónEl lector debe saber que al determinar el valor deD, no siempre es
suficiente calcular y elegir entre los posibles valores dejFSdXÞ -FTdXÞj. La mayor distancia
vertical entre FSdXÞy FTdXÞpuede no ocurrir en un valor observado, x, sino en algún otro
valor de X.Tal situación se ilustra en la figura 13.7.3. Vemos que si sólo los valores dejFSdX
Þ -FTdXÞjen los extremos izquierdos de las barras horizontales, calcularíamos
incorrectamenteDcomoj:2 - :4j ¼ :2. Sin embargo, uno puede ver al examinar el gráfico
que la distancia vertical más grande entreFSdXÞyFTdXÞocurre en el extremo derecho de la
barra horizontal que se origina en el punto correspondiente aX¼ :4, y el valor correcto de
Desj:5 - :2j ¼ :3.
Se puede determinar el valor correcto deDalgebraicamente por cálculo, además de
las diferenciasjFSdXÞ -FTdXÞj,las diferenciasjFSdXi-1Þ -FTdXiÞjpara todos los valores de i¼1;
2; . . . ;rþ1, donder¼el número de valores diferentes deXyFSdX0¼0. El valor correcto de la
estadística de prueba será entonces
1.0
.9
.8
.6
.5
.4
.3
.2
.1
.2 .4 .5 .8 1.0
FIGURA 13.7.3 Gráfico de datos ficticios que muestra el cálculo correcto deD.
EJERCICIOS
13.7.1Los pesos en la autopsia de los cerebros de 25 adultos que padecían cierta enfermedad fueron los siguientes:
¿Se puede concluir a partir de estos datos que la población muestreada no se distribuye normalmente con una media
de 1050 y una desviación estándar de 50? Determina elpagvalor para esta prueba.
13.7.2Los coeficientes intelectuales de una muestra de 30 adolescentes detenidos por abuso de drogas en una determinada jurisdicción metropolitana fueron los
siguientes:
CI
¿Proporcionan estos datos evidencia suficiente de que la muestra de población de puntajes de CI no se distribuye
normalmente con una media de 105 y una desviación estándar de 10? Determina elpagvalor.
13.7.3Para una muestra de sujetos aparentemente normales que sirvieron como controles en un experimento, se
registraron las siguientes lecturas de presión arterial sistólica al comienzo del experimento:
¿Se puede concluir sobre la base de estos datos que la población de presiones arteriales de la
que se extrajo la muestra no se distribuye normalmente conmetro¼150 ys¼12? Determina el
pagvalor.
En el Capítulo 8 analizamos cómo se puede usar el análisis de varianza de una vía para probar la
hipótesis nula de que varias medias poblacionales son iguales. Cuando no se cumplen los supuestos
que subyacen a esta técnica, es decir, cuando las poblaciones de las que se extraen las muestras no se
distribuyen normalmente con varianzas iguales, o cuando los datos para el análisis consisten
únicamente en rangos, una alternativa no paramétrica al análisis unidireccional de varianza se puede
utilizar para probar la hipótesis de parámetros de ubicación iguales. Como se señaló en la Sección
13.5, la prueba de la mediana puede extenderse para acomodar la situación que involucra más de dos
muestras. Sin embargo, una deficiencia de esta prueba es el hecho de que utiliza solo una pequeña
cantidad de la información disponible. La prueba utiliza solo información sobre si las observaciones
están o no por encima o por debajo de un solo número, la mediana de las muestras combinadas. La
prueba no utiliza directamente medidas de cantidad conocida. Hay disponibles varios análogos no
paramétricos del análisis de varianza que utilizan más información al tener en cuenta la magnitud de
13.8 EL ANÁLISIS UNIDIRECCIONAL DE LA VARIANZA POR RANGO DE KRUSKAL-WALLIS 705
cada observación relativa a la magnitud de cualquier otra observación. Quizás el más conocido
de estos procedimientos es el análisis de varianza por rangos de una vía de Kruskal-Wallis (8).
12 Xk R2
H¼ j-3dnorteþ1Þ (13.8.1)
nortednorteþ1Þ nortej
j¼1
EJEMPLO 13.8.1
En un estudio de los efectos pulmonares en cobayos, Lacroix et al. (A-7) expuso cobayos
sensibilizados con ovoalbúmina (OA) al aire normal, benzaldehído o acetaldehído. Al final de la
exposición, los cobayos fueron anestesiados y las respuestas alérgicas fueron evaluadas en
lavado broncoalveolar (BAL). Una de las variables de resultado examinadas fue el recuento de
células eosinófilas, un tipo de glóbulo blanco que puede aumentar con las alergias. La tabla
13.8.1 proporciona el recuento de células de eosinófilos 106para los tres grupos de tratamiento.
¿Podemos concluir que las tres poblaciones representadas por las tres muestras difieren con respecto
al recuento de células de eosinófilos? Podemos concluir así si podemos rechazar la hipótesis nula de que las
tres poblaciones no difieren en el recuento de células de eosinófilos.
706 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Solución:
HA: Al menos una de las poblaciones tiende a exhibir valores más grandes
que al menos una de las otras poblaciones.
Dejara¼ :01.
4. Estadística de prueba.Ver Ecuación 13.8.1.
5. Distribución de la estadística de prueba.Valores críticos deHpara varios tamaños de
muestra yalos niveles se dan en el Apéndice Tabla N.
6. Regla de decisión.La hipótesis nula será rechazada si el valor calculado deHes
tan grande que la probabilidad de obtener un valor tan grande o mayor
cuandoH0es cierto es igual o menor que el nivel de significación elegido,a.
5 2 13
9 3 7
8 4 15
11 6 12
14 1 10
" #
12 d47Þ2 ddieciséisÞ2 d57Þ2
H¼ þ þ - 3d15þ1¼9:14
15ddieciséisÞ 5 5 5
CorbatasCuando ocurren empates entre las observaciones, podemos ajustar el valor deHal
dividirlo por
PAG
T
1- (13.8.2)
norte3-norte
dóndeT¼t3-t.La cartatse utiliza para designar el número de observaciones empatadas en un grupo de valores
empatados. En nuestro ejemplo no hay grupos de valores empatados pero, en general, puede haber varios
grupos de valores empatados dando como resultado varios valores det
El efecto del ajuste por empates suele ser insignificante. Tenga en cuenta también que el
efecto del ajuste es aumentarH,de modo que si no se ajustaHes significativo al nivel elegido, no
es necesario aplicar el ajuste.
TABLA 13.8.3 Valor Neto Contable de Equipo por Cama por Tipo de Hospital
Tipo Hospital
A B C D mi
EJEMPLO 13.8.2
La tabla 13.8.3 muestra el valor contable neto del capital de equipo por cama para una muestra de
hospitales de cada uno de los cinco tipos de hospitales. Deseamos determinar, mediante la prueba de
Kruskal-Wallis, si podemos concluir que el valor contable neto promedio del capital de equipo por
cama difiere entre los cinco tipos de hospitales. Los rangos de los 41 valores, junto con la suma de
rangos para cada muestra, se muestran en la tabla.
" #
12 d68Þ2 d246Þ2 d124Þ2 d159Þ2 d264Þ2
H¼ þ þ þ þ - 3d41þ1Þ
41d41þ1Þ 10 8 9 7 7
¼36:39
Datos:
C1: 12,22 28,44 28,13 38,69 54,91 3,68 4,05 6,47 21,12 3,33 54,36 27,87 66,81 46,27 30,19 C2: 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3
Producción:
Prueba de Kruskal-Wallis en C1
H = 9,14 DF = 2 P = 0,010
EJERCICIOS
Para los siguientes ejercicios, realice la prueba al nivel de significación indicado y determine el pag
valor.
13.8.1En un estudio de sujetos sanos agrupados por edad (más jóvenes: 19 a 50 años, personas mayores: 65 a 75 años
y Longeval: 85 a 102 años), Herrmann et al. (A-8) midieron sus niveles de vitamina B-12 (ng/L). Todos los
sujetos de edad avanzada vivían en casa y podían realizar actividades normales del día a día. La siguiente
tabla muestra los niveles de vitamina B-12 para 50 sujetos del grupo joven, 92 adultos mayores y 90 sujetos
del grupo longevo.
230 241 319 371 566 170 148 149 631 198
477 442 190 460 290 542 1941 409 305 321
561 491 461 440 271 282 128 229 393 2772
347 279 163 520 308 194 145 183 282 428
566 334 377 256 440 445 174 193 273 259
260 247 190 335 238 921 495 161 157 111
(Continuado)
710 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
300 314 375 137 525 1192 460 400 1270 262
230 254 229 452 298 748 548 348 252 161
215 419 193 437 153 187 198 175 262 1113
260 335 294 236 323 350 165 540 381 409
349 455 740 432 205 1365 226 293 162 378
315 297 194 411 248 232 557 196 340 203
257 456 780 268 371 509 166 632 370 221
536 668 245 703 668 357 218 438 483 917
582 240 258 282 197 201 186 368 222 244
293 320 419 290 260 177 346 262 277
569 562 372 286 198 872 239 190 226
325 360 413 143 336 240 241 203
275 357 685 310 421 136 195 369
172 609 136 352 712 359 220 162
2000 740 441 262 461 715 164 95
240 430 423 404 631 252 279 178
235 645 617 380 1247 414 297 530
284 395 985 322 1033 372 474 334
883 302 170 340 285 236 375 521
Fuente: Datos proporcionados por cortesía de W. Herrmann y H. Schorr.
¿Podemos concluir, sobre la base de estos datos, que las poblaciones representadas por estas muestras difieren con
respecto a los niveles de vitamina B-12? Dejara¼ :01.
13.8.2Los siguientes son cargos para pacientes ambulatoriosð-$100Þrealizado a pacientes para determinado procedimiento
quirúrgico por muestras de hospitales ubicados en tres diferentes zonas del país:
Área
I Yo tercero
¿Podemos concluir con un nivel de significancia de .05 que las tres áreas difieren con respecto a los cargos?
13.8.3Un estudio de niños pequeños realizado por Flexer et al. (A-9) publicado en elDiario de audienciaexamina la
efectividad de un campo de sonido FM al enseñar fonética a los niños. En el estudio, los niños en un salón de
clases sin entrenamiento en conciencia fonológica o fonémica (control) se compararon con una clase con
conciencia fonológica y fonémica (PPA) y con una clase que utilizó entrenamiento en conciencia fonológica y
fonémica y el campo de sonido FM (PPA/ FM). Un total de 53 estudiantes de tres aulas preescolares
separadas participaron en este estudio. A los estudiantes se les dio una medida de conciencia fonémica en
preescolar y luego al final del primer semestre de jardín de infantes. Los puntajes de mejora se enumeran en
la siguiente tabla medidos por la prueba de segmentación fonémica de Yopp-Singer.
EJERCICIOS 711
0 1 2 1 19
-1 1 3 3 20
0 2 15 7 21
1 2 18 9 21
4 3 19 11 22
5 6 20 17 22
9 7 5 17 15
9 8 17 17
13 9 18 17
18 18 18 19
0 20 19 22
0 19
Fuente: Datos proporcionados por cortesía de John P. Holcomb, Jr., Ph.D.
Pruebe si hay una diferencia significativa entre los tres grupos. Dejara¼ :05.
13.8.4Consulte el ejemplo 13.8.1. Otra variable de interés para Lacroix et al. (A-7) fue el número de
células alveolares en tres grupos de sujetos expuestos al aire, benzaldehído o acetaldehído. La
siguiente tabla da la información para seis cobayos en cada uno de los tres grupos de tratamiento.
¿Podemos concluir, sobre la base de estos datos, que el número de células alveolares en cobayos sensibilizados con
ovoalbúmina difiere según el tipo de exposición? Dejara¼ :05.
13.8.5La siguiente tabla muestra los niveles de residuos de pesticidas (ppb) en muestras de sangre de cuatro poblaciones de
sujetos humanos. Use la prueba de Kruskal-Wallis para probar con un nivel de significancia de .05 la hipótesis nula de
que no hay diferencia entre las poblaciones con respecto al nivel promedio de residuos de pesticidas.
Población Población
A B C D A B C D
10 4 15 7 44 11 9 4
37 35 5 11 12 7 11 5
12 32 10 10 15 32 9 2
(Continuado)
712 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Población Población
A B C D A B C D
31 19 12 8 42 17 14 6
11 33 6 2 23 8 15 3
9 18 6 5
¿Podemos concluir a partir de estos datos de muestra que el nivel promedio de GGTP de la población difiere entre los
cinco grupos de diagnóstico? Dejara¼ :05 y encuentra elpagvalor.
Así como en ocasiones podemos necesitar un análogo no paramétrico del análisis de varianza unidireccional
paramétrico, también podemos encontrar necesario analizar los datos en una clasificación bidireccional
mediante métodos no paramétricos análogos al análisis de varianza bidireccional. . Tal necesidad puede
surgir porque no se cumplen los supuestos necesarios para el análisis paramétrico de varianza, porque la
escala de medición empleada es débil o porque los resultados
13.9 EL ANÁLISIS DE FRIEDMAN DE DOS VÍAS DE LA VARIANZA POR RANGO 713
se necesitan con urgencia. Una prueba empleada con frecuencia en estas circunstancias es el análisis
bidireccional de varianza por rangos de Friedman (9,10). Esta prueba es adecuada siempre que los
datos se midan, al menos, en una escala ordinal y se puedan organizar significativamente en una
clasificación bidireccional, como se da para el experimento de bloques aleatorios analizado en el
Capítulo 8. El siguiente ejemplo ilustra este procedimiento.
EJEMPLO 13.9.1
Un fisioterapeuta realizó un estudio para comparar tres modelos de estimuladores eléctricos de bajo
voltaje. Se pidió a otros nueve fisioterapeutas que clasificaran los estimuladores en orden de
preferencia. Un rango de 1 indica primera preferencia. Los resultados se muestran en la Tabla 13.9.1.
Deseamos saber si podemos concluir que los modelos no se prefieren por igual.
Solución:
Modelo
Terapeuta A B C
1 2 3 1
2 2 3 1
3 2 3 1
4 1 3 2
5 3 2 1
6 1 2 3
7 2 3 1
8 1 3 2
9 1 3 2
Rj 15 25 14
714 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
12 Xk-
Xr2¼ R2j - 3nortedkþ1Þ (13.9.1)
nkdkþ1Þ j¼1
12 h i
Xr2¼ d15Þ2þ ð25Þ2þ ð14Þ2 - 3d9Þð3þ1¼8:222
9d3Þð3þ1Þ
CorbatasCuando los datos originales consisten en mediciones en un intervalo o una escala de razón en lugar
de rangos, se asignan rangos a las mediciones en función de sus magnitudes relativas dentro de los bloques.
Si se producen empates, a cada valor se le asigna la media de los rangos para los que está empatado.
13.9 EL ANÁLISIS DE FRIEDMAN DE DOS VÍAS DE LA VARIANZA POR RANGO 715
EJEMPLO 13.9.2
La Tabla 13.9.2 muestra las respuestas, en porcentaje de disminución del flujo salival, de 16 animales de
experimentación después de diferentes niveles de dosis de atropina. Los rangos (entre paréntesis) y la suma
de los rangos también se dan en la tabla. Deseamos ver si podemos concluir que los diferentes niveles de
dosis producen respuestas diferentes. Es decir, deseamos probar la hipótesis nula de que no hay diferencia
en la respuesta entre los cuatro niveles de dosis.
12
Xr2¼ d20Þ2þ ð36:5Þ2þ ð44Þ2þ ð59:5Þ2 - 3ddieciséisÞð4þ1¼30:32
dieciséisd4Þð4þ1Þ
Nivel de dosis
Número de animales A B C D
Rj 20 36.5 44 59.5
&
716 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
TipoC3enRespuesta,C1enTratamientoyC2en Bloques.
Hacer clicDE ACUERDO.
Producción:
S 8.22 df 2p 0.017
Est. La suma de
C1 norte Mediana RANGOS
1 9 2.0000 15.0
2 9 2.6667 25,0
3 9 1.3333 14.0
EJERCICIOS
Para los siguientes ejercicios realice la prueba al nivel de significación indicado y determine el pag
valor.
13.9.1La siguiente tabla muestra los puntajes obtenidos por nueve estudiantes de enfermería seleccionados al azar en la evaluación final.
exámenes en tres áreas temáticas:
Área temática
Alumno
Número Fundamentos Fisiología Anatomía
1 98 95 77
2 95 71 79
(Continuado)
EJERCICIOS 717
Área temática
Alumno
Número Fundamentos Fisiología Anatomía
3 76 80 91
4 95 81 84
5 83 77 80
6 99 70 93
7 82 80 87
8 75 72 81
9 88 81 83
Pruebe la hipótesis nula de que los estudiantes de enfermería que constituyen la población de la que se extrajo la
muestra anterior se desempeñan igualmente bien en las tres áreas temáticas frente a la hipótesis alternativa de que
se desempeñan mejor en, al menos, un área. Dejara¼ :05.
13.9.2Quince estudiantes de fisioterapia seleccionados al azar recibieron las siguientes instrucciones: “Suponga
que se casará con una persona con una de las siguientes desventajas (las limitaciones se enumeraron y designaron
con las letras de la A a la J). Clasifique estas desventajas del 1 al 10 de acuerdo con su primera, segunda, tercera (y así
sucesivamente) elección de desventaja para su cónyuge”. Los resultados se muestran en la siguiente tabla.
Desventaja
1 1 3 5 9 8 2 4 6 7 10
2 1 4 5 7 8 2 3 6 9 10
3 2 3 7 8 9 1 4 6 5 10
4 1 4 7 8 9 2 3 6 5 10
5 1 4 7 8 10 2 3 6 5 9
6 2 3 7 9 8 1 4 5 6 10
7 2 4 6 9 8 1 3 7 5 10
8 1 5 7 9 10 2 3 4 6 8
9 1 4 5 7 8 2 3 6 9 10
10 2 3 6 8 9 1 4 7 5 10
11 2 4 5 8 9 1 3 7 6 10
12 2 3 6 8 10 1 4 5 7 9
13 3 2 6 9 8 1 4 7 5 10
14 2 5 7 8 9 1 3 4 6 10
15 2 3 6 7 8 1 5 4 9 10
Pruebe la hipótesis nula de que no hay preferencia por las desventajas frente a la alternativa de que se prefieren algunas
desventajas sobre otras. Dejara¼ :05.
13.9.3Diez sujetos con asma inducida por el ejercicio participaron en un experimento para comparar el efecto protector de un
fármaco administrado en cuatro niveles de dosis. Se usó solución salina como control. La variable de interés fue el
cambio en el FEV1después de la administración de la droga o solución salina. Los resultados fueron los siguientes:
718 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Sujeto Salina 2 10 20 40
¿Se puede concluir sobre la base de estos datos que diferentes niveles de dosis tienen efectos diferentes?
Dejara¼ :05 y encuentra elpagvalor.
Las hipótesis especificadas en (a) conducen a una prueba bilateral y se utilizan cuando se desea
detectar cualquier desviación de la independencia. Las pruebas unilaterales indicadas por (b) y (c) se utilizan,
respectivamente, cuando los investigadores desean saber si pueden concluir que las variables están directa o
inversamente correlacionadas.
5.Sinorteestá entre 4 y 30, compare el valor calculado derscon los valores críticos,rs, de la
Tabla P del Apéndice. Para la prueba bilateral,H0es rechazado en elanivel de significación
sirses mayor querso menos que -rs,dóndersestá en la intersección de la columna
encabezadaun =2 y la fila correspondiente anorte.Para la prueba unilateral conHA
especificando la correlación directa,H0es rechazado en elanivel de significación sirses
mayor quersparaa ynorte.Se rechaza la hipótesis nula en elanivel de significación en la
otra prueba unilateral sirses menos que -rsparaaynorte.
6.Sinortees mayor que 30, se puede calcular
7.Las observaciones empatadas presentan un problema. El uso de la Tabla P es estrictamente válido solo cuando
los datos no contienen ningún empate (a menos que se emplee algún procedimiento aleatorio para
desempatar). En la práctica, sin embargo, la mesa se usa con frecuencia después de que se haya empleado
algún otro método para manejar las ataduras. Si el número de empates es grande, se puede emplear la
siguiente corrección por empates:
t3-t
T¼ (13.10.3)
12
dóndet¼el número de observaciones que están empatadas para algún rango en particular. Cuando se
utiliza este factor de corrección,rsse calcula a partir de
PPA
X2þ y2- d2 i
r s¼ pffiP
ffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffi (13.10.4)
2 X2 y2
en lugar de la Ecuación 13.10.1.
En la Ecuación 13.10.4,
PAG norte3-norte
X
X2 ¼ - TX
12
PAG norte3- norte
X
y2 ¼ - Ty
12
TX¼la suma de los valores deTpara los diversos rangos empatados enXTy¼
la suma de los valores deTpara los diversos rangos empatados enY
La mayoría de las autoridades están de acuerdo en que, a menos que el número de empates sea excesivo, la
corrección hace muy poca diferencia en el valor ders. Cuando el número de empates es pequeño, podemos seguir el
720 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
procedimiento habitual de asignar a las observaciones empatadas la media de los rangos para los que están
empatadas y proceder con los pasos 2 a 6.
EJEMPLO 13.10.1
En un estudio de la relación entre la edad y el EEG, se recogieron datos de 20 sujetos de entre
20 y 60 años. La Tabla 13.10.1 muestra la edad y un valor de salida de EEG particular para cada
uno de los 20 sujetos. El investigador desea saber si se puede concluir que esta salida de EEG en
particular está inversamente correlacionada con la edad.
Solución:
1 20 98
2 21 75
3 22 95
4 24 100
5 27 99
6 30 sesenta y cinco
7 31 64
8 33 70
9 35 85
10 38 74
11 40 68
12 42 66
13 44 71
14 46 62
15 48 69
dieciséis 51 54
17 53 63
18 55 52
19 58 67
20 60 55
13.10 EL COEFICIENTE DE CORRELACIÓN DE RANGO DE SPEARMAN 721
tener los resultados que se muestran en la Tabla 13.10.2. Eldi,d2 i,y di2son exhibidos
en la misma mesa.
Sustitución de los datos de la Tabla 13.10.2 en la Ecuación 13.10.1
da
6d2340Þ
rs¼1 - ¼ -:76
20½ð20Þ2- 1
8. Decisión estadística.Dado que nuestro calculadors¼ -:76 es menor que el
críticors,rechazamos la hipótesis nula.
9. Conclusión.Concluimos que las dos variables están inversamente relacionadas.
10pagvalor.Como -:76 < -0:6586, tenemos para esta pruebapag < :001.
Sujeto
Número Rango (X) Rango (Y) di d2i
1 1 18 - 17 289
2 2 15 - 13 169
3 3 17 - 14 196
4 4 20 - dieciséis 256
5 5 19 - 14 196
6 6 7 -1 1
7 7 6 1 1
8 8 12 -4 dieciséis
9 9 dieciséis -7 49
10 10 14 -4 dieciséis
11 11 10 1 1
12 12 8 4 dieciséis
13 13 13 0 0
14 14 4 10 100
15 15 11 4 dieciséis
Ilustremos ahora el procedimiento para una muestra connorte >30 y algunas observaciones
empatadas.
EJEMPLO 13.10.2
En la Tabla 13.10.3 se muestran las edades y concentraciones (ppm) de cierto mineral en el
tejido de 35 sujetos a quienes se les realizaron autopsias como parte de una gran investigación.
proyecto.
PAG
Las categorias,di,d2 i,y di2se muestran en la Tabla 13.10.4. Probemos, en el nivel .05 de
significación, la hipótesis nula de queXyYson mutuamente independientes frente a la
alternativa bilateral de que no son mutuamente independientes.
6d1788:5Þ
rs¼1 - ¼ :75
35d35Þ2- 1
pffiffiffiffiffiffiffiffiffiffiffiffiffiffi
z¼ :75 35 - 1¼4:37
Mineral Mineral
Sujeto Edad Concentración Sujeto Edad Concentración
Número (X) (Y) Número (X) (Y)
1 82 169.62 19 50 4.48
2 85 48.94 20 71 46.93
3 83 41.16 21 54 30.91
4 64 63.95 22 62 34.27
5 82 21.09 23 47 41.44
6 53 5.40 24 66 109.88
7 26 6.33 25 34 2.78
8 47 4.26 26 46 4.17
9 37 3.62 27 27 6.57
10 49 4.82 28 54 61.73
11 sesenta y cinco 108.22 29 72 47.59
12 40 10.20 30 41 10.46
13 32 2.69 31 35 3.06
14 50 6.16 32 75 49.57
15 62 23.87 33 50 5.55
dieciséis 33 2.70 34 76 50.23
17 36 3.15 35 28 6.81
18 53 60.59
13.10 EL COEFICIENTE DE CORRELACIÓN DE RANGO DE SPEARMAN 723
23- 2 6
TX¼ ¼ ¼ :5
12 12
y un valor de
33- 3 24
TX¼ ¼ ¼2
12 12
PAG
A partir de estos cálculos, tenemos TX¼5d:5Þ þ2¼4:5, de modo que
X 352 - 35
X2 ¼ - 4:5¼3565:5
12
724 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Producción:
Correlaciones (Pearson)
PAG
Dado que no se produjeron empates en elYclasificación, tenemos Ty¼0 y
X
353 - 35
y2¼
- 0¼3570:0
12
PAG
De la tabla 13.10.4 tenemos di2¼1788:5. A partir de estos datos ahora podemos
calcular por la Ecuación 13.10.4
3565:5þ3570:0 - 1788:5
rs¼ ¼ :75
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff
2 d3565:5Þð3570Þ
Vemos que en este caso la corrección por empates no hace ninguna diferencia en
el valor ders. &
Análisis informáticoPodemos usar MINITAB, así como muchos otros paquetes de software
estadístico, para calcular el coeficiente de correlación de Spearman. Para usar MINITAB, primero
debemos hacer que MINITAB clasifique las observaciones y almacene los rangos en columnas
separadas, una para elXrangos y uno para elYrangos Si clasificamos laXyYvalores del ejemplo 13.10.1
y almacenarlos en las columnas 3 y 4, podemos obtener el coeficiente de correlación de rangos de
Spearman con el procedimiento que se muestra en la figura 13.10.1. Otros paquetes de software
como SAS®y SPSS, por ejemplo, clasifica automáticamente las medidas antes de calcular el coeficiente,
eliminando así un paso adicional en el procedimiento.
EJERCICIOS
Para los siguientes ejercicios realice la prueba al nivel de significación indicado y determine el pag
valor.
13.10.1La siguiente tabla muestra 15 áreas geográficas seleccionadas al azar clasificadas por densidad de población y
tasa de mortalidad ajustada por edad. ¿Podemos concluir con un nivel de significancia de .05 que la densidad de población y la tasa de
mortalidad ajustada por edad no son mutuamente independientes?
EJERCICIOS 725
1 8 10 9 6 8
2 2 14 10 14 5
3 12 4 11 7 6
4 4 15 12 1 2
5 9 11 13 13 9
6 3 1 14 15 3
7 10 12 15 11 13
8 5 7
13.10.2La siguiente tabla muestra 10 comunidades clasificadas por dientes cariados, faltantes u obturados (DMF) por cada 100
niños y concentración de fluoruro en ppm en el suministro público de agua:
1 8 1 6 4 7
2 9 3 7 1 10
3 7 4 8 5 6
4 3 9 9 6 5
5 2 8 10 10 2
¿Proporcionan estos datos evidencia suficiente para indicar que el número de dientes de DMF por cada 100 niños tiende a
disminuir a medida que aumenta la concentración de fluoruro? Dejara¼ :05.
13.10.3El propósito de un estudio de Nozawa et al. (A-10) fue evaluar el resultado de la reparación quirúrgica de pars
defecto interarticular por fijación segmentaria con alambre en adultos jóvenes con espondilólisis lumbar. Los autores
citan literatura que indica que la fijación segmentaria con alambre ha tenido éxito en el tratamiento de espondilólisis
de no deportistas y señalan que no existía información sobre los resultados de este tipo de cirugía en deportistas. En
un estudio retrospectivo de sujetos operados entre 1993 y 2000, los autores encontraron 20 sujetos que se habían
sometido a la cirugía. La siguiente tabla muestra la edad (años) en el momento de la cirugía y la duración (meses) de
la atención de seguimiento de estos sujetos.
103 37 38 27
68 27 36 31
62 12 34 24
60 18 30 23
60 18 19 14
(Continuado)
726 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
54 28 19 23
49 25 19 18
44 20 19 29
42 18 17 24
41 30 dieciséis 27
Fuente: Satoshi Nozawa, Katsuji Shimizu, Kei Miyamoto y Mizuo Tanaka, "Reparación del defecto pars interarticularis mediante
fijación segmentaria con alambre en atletas jóvenes con espondilolisis".Revista americana de medicina deportiva, 31 (2003),
págs. 359–364.
¿Podemos concluir, sobre la base de estos datos, que en una población de sujetos similares existe una
asociación entre la edad y la duración del seguimiento? Dejara¼ :05.
13.10.4Consulte el Ejercicio 13.10.3. Nozawa et al. (A-10) también calculó la Asociación Ortopédica Japonesa
puntuación para medir el dolor de espalda (JOA). Los resultados de los 20 sujetos junto con la duración del
seguimiento se muestran en la siguiente tabla. Cuanto mayor sea el número, menor será el grado de dolor.
103 21 38 13
68 14 36 24
62 26 34 21
60 24 30 22
60 13 19 25
54 24 19 23
49 22 19 20
44 23 19 21
42 18 17 25
41 24 dieciséis 21
Fuente: Satoshi Nozawa, Katsuji Shimizu, Kei Miyamoto y Mizuo Tanaka, "Reparación
del defecto pars interarticularis mediante fijación segmentaria con alambre en atletas
jóvenes con espondilolisis".Revista americana de medicina deportiva, 31 (2003), págs.
359–364.
¿Podemos concluir a partir de estos datos que, en general, existe una relación entre la duración del seguimiento y la
puntuación JOA en el momento de la operación? Dejara¼ :05.
13.10.5Butz et al. (A-11) estudiaron el uso de ventilación no invasiva con presión positiva en pacientes con
la esclerosis lateral amiotrófica. Evaluaron el beneficio del procedimiento sobre los síntomas, la calidad de vida y la
supervivencia de los pacientes. Dos variables de interés son PaCO2, presión parcial de dióxido de carbono arterial y
PaO2, presión parcial de oxígeno arterial. La siguiente tabla muestra, para 30 sujetos, los valores de estas variables
(mm Hg) obtenidos a partir de los análisis de gases en sangre arterial de referencia.
34 132 43 105 33 94
42 sesenta y cinco 44.3 113 59,9 60.4
54 72 53,9 69.2 62.6 52.5
48 76 41.8 66.7 54.1 76,9
53.6 67.2 33 67 45.7 65.3
56,9 70,9 43.1 77.5 40.6 80.3
58 73 52.4 65.1 56,6 53.2
45 66 37,9 71 59 71,9
Fuente: M. Butz, KH Wollinsky, U. Widemuth-Catrinescu, A.
Sperfeld, S. Winter, HH Mehrkens, AC Ludolph y H. Schreiber,
“Efectos longitudinales de la ventilación no invasiva con presión
positiva en pacientes con esclerosis lateral amiotrófica, ”Diario
Americano de Rehabilitación Médica, 82 (2003) 597–604.
Sobre la base de estos datos podemos concluir que existe una asociación entre PaCO2y PaO2
¿valores? Dejara¼ :05.
13.10.6Diecisiete pacientes con antecedentes de insuficiencia cardíaca congestiva participaron en un estudio para evaluar la
efectos del ejercicio en diversas funciones corporales. Durante un período de ejercicio, se recopilaron los siguientes
datos sobre el cambio porcentual en la norepinefrina plasmática (Y)y el cambio porcentual en el consumo de oxígeno
(X):
Sujeto X Y Sujeto X Y
1 500 525 10 50 60
2 475 130 11 175 105
3 390 325 12 130 148
4 325 190 13 76 75
5 325 90 14 200 250
6 205 295 15 174 102
7 200 180 dieciséis 201 151
8 75 74 17 125 130
9 230 420
Sobre la base de estos datos, ¿se puede concluir que existe una asociación entre las dos variables? Dejar a¼ :
05.
13.11 NO PARAMÉTRICO
ANÁLISIS DE REGRESIÓN
Cuando no se cumplen los supuestos que subyacen al análisis de regresión lineal simple, como se analiza en
el capítulo 9, podemos emplear procedimientos no paramétricos. En esta sección presentamos estimadores
de la pendiente y el intercepto que son alternativas fáciles de calcular a los estimadores de mínimos
cuadrados descritos en el Capítulo 9.
728 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Estimador de pendiente de TheilTheil (12) propone un método para obtener una estimación
puntual del coeficiente de pendienteb.Suponemos que los datos se ajustan al modelo de
regresión clásico
yi¼b0þb1X1þmii;i¼1; . . . ;norte
b1¼medianaSyo (13.11.1)
EJEMPLO 13.11.1
En la Tabla 13.11.1 se encuentran los niveles de testosterona plasmática (ng/ml) (Y)y niveles de ácido cítrico
seminal (mg/ml) en una muestra de ocho machos adultos. Deseamos calcular la estimación del coeficiente de
pendiente de regresión de población por el método de Theil.
- :6618 . 5037
. 1445 . 5263
. 1838 . 5297
. 2532 . 5348
. 2614 . 5637
. 3216 . 5927
. 3250 . 6801
. 3472 . 8333
. 3714 . 8824
. 3846 . 9836
. 4118 1.0000
. 4264 1.0078
. 4315 1.0227
. 4719 1.0294
&
EJEMPLO 13.11.2
Consulte el ejemplo 13.11.1. Calculemos â1;METROy â2;METROde los datos sobre los niveles de testosterona
y ácido cítrico.
36.4046 59.15
39.3916 61.7086
39.7583 65.5508
41.8931 69.0863
43.7823 69.9415
47.136 73.2952
48.173 73.477
EJERCICIOS
13.11.1Los siguientes son los valores de frecuencia cardíaca (FC: latidos/minuto) y consumo de oxígeno (VO2:
cal/kg/24 h) para nueve lactantes con insuficiencia cardíaca congestiva crónica:
HORA(X): 163 164 156 151 152 167 165 153 155
VO2(Y): 53,9 57,4 41,0 40,0 42,0 64,4 59,1 49,9 43,2
- -
Calcule b̂1; b0 ;y ^
1;METRO b0 2;METRO
13.11.2Los siguientes son los pesos corporales (gramos) y el área de superficie total (cm2) de nueve laboratorio
animales:
Peso corporal (X): Área 660.2 706.0 924.0 936.0 992.1 888.9 999.4 890.3 841.2
de superficie (Y): 781.7 888.7 1038.1 1040.0 1120.0 1071.5 1134.5 965.3 925.0
13.12 RESUMEN
Este capítulo se ocupa de las pruebas estadísticas no paramétricas. Estas pruebas pueden usarse
cuando las suposiciones subyacentes a las pruebas paramétricas no se realizan o cuando los datos a
analizar se miden en una escala demasiado débil para los procedimientos aritméticos necesarios para
las pruebas paramétricas.
Se describen e ilustran nueve pruebas no paramétricas. Excepto por la prueba de bondad
de ajuste de Kolmogorov-Smirnov, cada prueba proporciona una alternativa no paramétrica a
una prueba paramétrica conocida. Hay una serie de otras pruebas no paramétricas disponibles.
Se remite al lector interesado a los numerosos libros dedicados a los métodos no paramétricos,
incluidos los de Gibbons (14) y Pett (15).
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 13 731
Fórmula
Número Nombre Fórmula
k¼0
Prueba de Mann-Whitney
-FTdXi-1Þjg
PAG
13.8.2 Prueba de Kruskal-Wallis T
1-
ajuste estadístico norte3-norte
para corbatas
PAG
13.10.1 Estadística de prueba de correlación de 6 di2
rango de Spearman
rs¼1 -
nortednorte2- 1Þ
732 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
aproximación de la
Correlación de rango de Spearman
2 X2 y2
5.Describa una situación en su área particular de interés en la que se podría utilizar cada una de las siguientes pruebas.
Use datos reales o realistas y pruebe una hipótesis apropiada usando cada prueba.
(a)la prueba del signo
6.Los siguientes son los rangos de las edades (X)de 20 pacientes quirúrgicos y la dosis (Y)de un agente analgésico
requerido para bloquear un segmento espinal.
1 1 11 13
2 7 12 5
3 2 13 11
4 4 14 dieciséis
5 6 15 20
6 8 dieciséis 18
7 3 17 19
8 15 18 17
9 9 19 10
10 12 20 14
Calcularrsy prueba (bilateral) de significación. Dejara¼ :05. Determinar elpagvalor para esta prueba.
7.Otani y Kishi (A-12) estudiaron siete sujetos con edema macular diabético. Midieron el grosor foveald
metrometroÞen siete ojos antes y después de la cirugía de vitrectomía unilateral. Los resultados se
muestran en la siguiente tabla:
1 690 200
2 840 280
3 470 230
4 690 200
5 730 560
6 500 210
7 440 200
Fuente: Datos proporcionados por cortesía de Tomohiro Otani, MD
Utilice la prueba de rango con signo de Wilcoxon para determinar si se debe concluir que la cirugía es
eficaz para reducir el grosor foveal. Dejara¼ :05. ¿Cuál es elpag¿valor?
734 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
8.Los sujetos de un estudio realizado por J. Jose y SR Ell (A-13) fueron 303 voluntarios sanos que autoevaluaron su propio
estado de flujo nasal al indicar si sus vías respiratorias nasales estaban (1) totalmente despejadas, (2) no muy
despejadas, (3 ) muy bloqueado, o (4) totalmente bloqueado. Después de la autoevaluación, se utilizó un medidor In-
Check para medir la tasa de flujo nasal inspiratorio máximo (PINFR, L/min). Los datos sobre 175 sujetos en tres de las
categorías de autoevaluación se muestran en la siguiente tabla. Los autores realizaron una prueba de Kruskal-Wallis
para determinar si estos datos brindan evidencia suficiente para indicar una diferencia en los centros de población de
PINFR entre estos tres grupos de respuesta. Dejara¼ :01. ¿Cuál es el valor estadístico de prueba para esta prueba?
9.Diez sujetos con asma bronquial participaron en un experimento para evaluar la eficacia relativa de tres
fármacos. La siguiente tabla muestra el cambio en FEV1(volumen espirado forzado en 1 segundo) valores
(expresados en litros) 2 horas después de la administración del fármaco:
Droga Droga
Sujeto A B C Sujeto A B C
1 . 00 . 13 . 26 6 . 03 . 18 . 25
2 . 04 . 17 . 23 7 . 05 . 21 . 32
3 . 02 . 20 . 21 8 . 02 . 23 . 38
4 . 02 . 27 . 19 9 . 00 . 24 . 30
5 . 04 . 11 . 36 10 . 12 . 08 . 30
¿Son estos datos suficientes para indicar una diferencia en la eficacia de los medicamentos? Dejara¼ :05. ¿Cuál es elpag valor
para esta prueba?
10Una faceta del plan de estudios de enfermería en la Universidad Estatal de Wright requiere que los estudiantes usen las
matemáticas para realizar los cálculos de dosis apropiados. En un estudio realizado por Wendy Gantt (A-14), a los
estudiantes universitarios de enfermería se les administró una prueba de matemáticas estandarizada para
determinar su aptitud matemática (escala: 0–100). Los estudiantes se dividieron en dos grupos: edad universitaria
tradicional (18–24 años, 26 observaciones) y no tradicional (25 años).þ,ocho observaciones). Los puntajes en la prueba
de matemáticas aparecen en la siguiente tabla:
70 6 88 77
57 79 68 72
85 14 88 54
55 82 92 87
87 45 85 85
(Continuado)
736 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
84 57 56 62
56 91 31 77
68 76 80 86
94 60
Fuente: Datos proporcionados por cortesía de Wendy Gantt y el Centro de Consultoría Estadística de la
Universidad Estatal de Wright.
¿Estos datos proporcionan evidencia suficiente para indicar una diferencia en las medianas de la población? Dejara¼ :05. ¿Cuál
es elpagvalor para esta prueba? Utilice tanto la prueba de la mediana como la prueba de Mann-Whitney y compare los
resultados.
11Los siguientes son los PaCO2(mm Hg) valores en 16 pacientes con enfermedad broncopulmonar:
39, 40, 45, 48, 49, 56, 60, 75, 42, 48, 32, 37, 32, 33, 33, 36
Use la prueba de Kolmogorov-Smirnov para probar la hipótesis nula de que PaCO2valores en la población
muestreada se distribuyen normalmente conmetro¼44 ys¼12
12La siguiente tabla muestra el aporte calórico (cal/día/kg) y el consumo de oxígeno VO2(ml/min/kg) en 10
lactantes:
Caloría Caloría
ingesta (X) VO2(Y) ingesta (X) VO2(Y)
Pruebe la hipótesis nula de que las dos variables son mutuamente independientes contra la alternativa de que están
directamente relacionadas. Dejara¼0:5. Cuál es elpagvalor para esta prueba?
13Mary White (A-15) encuestó a médicos para medir sus opiniones sobre la importancia de la ética en la práctica
médica. La herramienta de medición utilizó una escala de 1 a 5 en la que un valor más alto indica una opinión
más alta sobre la importancia de la ética. Las edades y puntajes de los sujetos del estudio se muestran en la
siguiente tabla. ¿Se puede concluir sobre la base de estos resultados que la edad y el puntaje de ética están
directamente relacionados? Sea .05 la probabilidad de cometer un error tipo I. Cuál es elpag¿valor?
14Dominic Sprott (A-16) realizó un experimento con conejos en el que la variable de resultado fue la
infiltración grasa en la masa del hombro (PFI, medida como porcentaje). Al inicio, a 15 conejos se les
había desprendido un músculo del hombro elegido al azar. Luego se volvió a unir el hombro. Seis
semanas más tarde, se sacrificaron cinco conejos elegidos al azar y se registraron las diferencias en el
PFI entre el hombro vuelto a unir y el hombro no separado (grupo A). Seis meses más tarde, se
sacrificaron los 10 conejos restantes y se registraron de nuevo las diferencias en el PFI entre el
hombro vuelto a unir y el hombro no separado (grupo B).
Grupo A Grupo B
¿Podemos concluir, con un nivel de significación de 0,05, que los tratamientos tienen un efecto diferencial sobre el PFI
entre los dos músculos del hombro? Cuál es elpagvalor para la prueba?
En cada uno de los ejercicios del 15 al 29, haga uno o más de los siguientes que considere
apropiados:
(a)Aplicar una o más de las técnicas discutidas en este capítulo.
(b)Aplicar una o más de las técnicas discutidas en capítulos anteriores.
738 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
15.El propósito de un estudio de Damm et al. (A-17) fue investigar la sensibilidad a la insulina y la secreción de insulina en
mujeres con diabetes gestacional (DMG) previa. Los sujetos fueron 12 mujeres tolerantes a la glucosa de peso normal
(edad media, 36,6 años; desviación estándar, 4,16) con diabetes gestacional previa y 11 controles (edad media, 35
años; desviación estándar, 3,3). Entre los datos recopilados se encuentran los siguientes valores de insulina
plasmática en ayunas (mmol/L). Utilice la prueba de Mann-Whitney para determinar si puede concluir sobre la base
de estos datos que las dos poblaciones representadas difieren con respecto al nivel promedio de insulina en plasma
en ayunas.
dieciséis.Gutín et al. (A-18) compararon tres medidas de composición corporal, incluida la absorciometría de rayos
X de energía dual (DXA). Los sujetos eran niños aparentemente sanos (21 niños y 22 niñas) de entre 9 y 11
años. Entre los datos recopilados se encuentran las siguientes mediciones de los compartimentos de
composición corporal por DXA. Los investigadores estaban interesados en la correlación entre todos los
pares posibles de estas variables.
17La preocupación de un estudio de Crim et al. (A-19) fue el papel potencial del análisis de citometría de flujo del
líquido de lavado broncoalveolar (BALF) en el diagnóstico del rechazo pulmonar agudo. Los investigadores
señalan que estudios previos sugirieron una asociación de rechazo pulmonar agudo con aumentos en CD8þ
linfocitos y aumento de la expresión del antígeno linfocitario humano (HLA)-DR y del receptor de
interleucina-2 (IL-2R). Los sujetos consistieron en receptores de trasplante de pulmón (LT) que no tenían
evidencia histológica de rechazo o infección, voluntarios humanos normales (NORM), voluntarios sanos
receptores de trasplante de corazón (HT) y receptores de trasplante de pulmón que experimentaban rechazo
pulmonar agudo (AR). Entre los datos recopilados se encuentran los siguientes porcentajes de BALF CD8þ
linfocitos que también expresan IL-2R observados en los cuatro grupos de sujetos.
740 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Norma HT LT Arkansas
0 0 1 6 12
2 0 0 6 0
1 5 5 8 9
0 4 0 dieciséis 7
0 6 0 24 2
2 0 5 5 6
3 0 18 3 14
0 4 2 22 10
0 8 2 10 3
1 8 8 0 0
0 8 0
7 3 1
2 4 1
5 4 0
1 18 0
Fuente: Datos proporcionados por cortesía
0 4
de la Dra. Courtney Crim.
18Ichinose et al. (A-20) estudiaron la participación de las taquiquininas endógenas en el estrechamiento de las vías
respiratorias inducido por el ejercicio en pacientes con asma por medio de un antagonista selectivo del receptor de
neuroquinina 1, FK-888. Nueve sujetos (ocho hombres, una mujer) de 18 a 43 años con al menos un 40 por ciento de
caída en la conductancia específica de las vías respiratorias participaron en el estudio. Los siguientes son los datos de
consumo de oxígeno (ml/min) de los sujetos en reposo y durante el ejercicio mientras estaban en tratamiento con un
placebo y FK-888:
Placebo FK-888
19factor de crecimiento transformantea (TGFa),según Tomiya y Fujiwara (A-21), se alega que desempeña un papel
en la progresión maligna así como en el crecimiento celular normal de manera autocrina, y se ha informado
que sus niveles séricos aumentan durante esta progresión. Los presentes investigadores han desarrollado
un ensayo inmunoabsorbente ligado a enzimas (ELISA) para medir el TGF sérico.aniveles en el diagnóstico de
carcinoma hepatocelular (CHC) como complicación de la cirrosis. En un estudio en el que evaluaron la
importancia del TGF séricoaniveles con fines de diagnóstico, recogieron los siguientes
PREGUNTAS DE REPASO Y EJERCICIOS 741
mediciones en las pruebas de función hepática, TGFa (pg/ml) y sueroa-fetoproteína (AFP) (ng/ml) de
pacientes con CHC:
20El objetivo de un estudio de Sakhaee et al. (A-22) fue determinar el contenido corporal de aluminio (A1) de forma
no invasiva utilizando el incremento en el suero y la orina después de la administración intravenosa de
deferoxamina (DFO) en pacientes con cálculos renales y mujeres con osteoporosis en tratamiento a largo
plazo con citrato de potasio (K3Cit) o dicitrato tricálcico (Ca3ciudad2), respectivamente. Los sujetos
consistieron en 10 pacientes con nefrolitiasis de calcio y cinco pacientes con osteoporosis que se
mantuvieron con citrato de potasio o citrato de calcio durante 2 a 8 años, respectivamente, más 16
voluntarios normales sin antecedentes de uso regular de antiácidos que contienen aluminio. Entre los datos
recopilados se encuentran las siguientes mediciones de excreción de aluminio en orina de 24 horasdmetro
g=díaÞantes (PRE) y después (POST) de una infusión de DFO de 2 horas.
21El propósito de un estudio de Dubuis et al. (A-23) fue determinar si el déficit neuropsicológico de los niños con la forma
grave de hipotiroidismo congénito se puede evitar mediante el inicio más temprano de la terapia y dosis más altas de
levotiroxina. Los sujetos consistieron en 10 bebés (de 3 a 24 días de edad) con hipotiroidismo congénito severo y 35
bebés (de 2 a 10 días de edad) con hipotiroidismo congénito moderado. Entre los datos recopilados se encuentran las
siguientes mediciones en plasma T4(nmol/L) niveles en la selección:
T4 T4 T4
Sexo (nmol/L) Sexo (nmol/L) Sexo (nmol/L)
METRO dieciséis F 20 F 62
METRO 57 F 34 METRO 50
METRO 40 F 188 F 40
F 50 F 69 F 116
F 57 F 162 F 80
F 38 F 148 F 97
F 51 F 108 F 51
F 38 F 54 F 84
METRO F 96 F 51
F 60 METRO 76 F 94
METRO 122 METRO 158
METRO 43 F
F 40 METRO 47
F 29 METRO 143
F 83 METRO 128
F 62 METRO 112
METRO 111
¼Datos perdidos.
F 84
Fuente: Datos proporcionados por
METRO 55 cortesía del Dr. Guy Van Vliet.
22Kuna et al. (A-24) realizó un estudio relacionado con las quimiocinas en la rinitis alérgica estacional. Los sujetos
incluyeron 18 individuos atópicos con rinitis alérgica estacional causada por polen de ambrosía. Entre los
datos recopilados sobre estos sujetos se encontraban las siguientes mediciones de histamina y proteína
catiónica de eosinófilos (ECP):
23El propósito de un estudio de Kim et al. (A-25) fue investigar los cambios en serie en los niveles de lipoproteína Lp(a) con
la pérdida de hormonas sexuales femeninas por la menopausia quirúrgica y con la terapia de reemplazo de
estrógenos en las mismas mujeres. Los sujetos fueron 44 mujeres premenopáusicas que se sometieron a una
histerectomía transabdominal (TAH). Treinta y una de las mujeres se sometieron a una TAH y salpingooforectomía
unilateral (USO), y 13 se sometieron a una TAH y salpingooforectomía bilateral (BSO). Las mujeres tenían entre 30 y
53 años de edad. Los sujetos del grupo BSO recibieron 0,625 mg de estrógeno equino conjugado diariamente 2
meses después de la operación. Los siguientes fueron los niveles de colesterol total de los sujetos antes (TC0), 2
meses después (TC2) y 4 meses después (TC4) del procedimiento quirúrgico y la terapia de reemplazo hormonal.
USO USO
Sujeto TC0 TC2 TC4 Sujeto TC0 TC2 TC4
24Velthuis et al. (A-26) realizaron un estudio para evaluar si la combinación de heparina inmovilizada pasivamente y
heparización estándar puede reducir la activación del complemento en pacientes sometidos a una intervención
quirúrgica cardíaca. Los investigadores señalan que los circuitos extracorpóreos recubiertos de heparina reducen la
activación del complemento durante las operaciones cardíacas, pero que se dispone de poca información in vivo
sobre la reducción de la activación de las vías alternativa y clásica. La activación del complemento inicia una respuesta
inflamatoria sistémica durante y después de las operaciones cardíacas y se asocia con eventos fisiopatológicos como
depresión cardíaca posoperatoria, fuga capilar pulmonar y hemólisis. Los sujetos fueron 20 pacientes que se
sometieron a un injerto de derivación cardiopulmonar (CPB) electivo asignados al azar para ser tratados con circuitos
extracorpóreos recubiertos de heparina (H) o circuitos no recubiertos (U). Entre los datos recopilados se encuentran
las siguientes concentraciones del complejo del complemento terminal en plasma (SC5b-9) al inicio, 10 minutos
después del inicio de la CEC, al finalizar la CEC y después de la administración de sulfato de protamina:
25Heijdra et al. (A-27) afirman que muchos pacientes con enfermedad pulmonar obstructiva crónica (EPOC) grave
tienen baja saturación arterial de oxígeno durante la noche. Estos investigadores realizaron un estudio para
determinar si existe una relación causal entre la disfunción de los músculos respiratorios y la saturación
nocturna. Los sujetos fueron 20 (cinco mujeres, 15 hombres) pacientes con EPOC asignados aleatoriamente
para recibir entrenamiento muscular inspiratorio con flujo objetivo (TF-IMT) al 60 por ciento de su presión
bucal inspiratoria máxima (PImáximo) o TF-IMT falso al 10 por ciento de PImáximo. Entre los datos recopilados se
encuentran los siguientes tiempos de resistencia (Tiempo, s) para cada sujeto al inicio del entrenamiento y 10
semanas después:
PREGUNTAS DE REPASO Y EJERCICIOS 745
26Los tres objetivos de un estudio de Wolkin et al. (A-28) fueron para determinar (a) los efectos del tratamiento crónico con
haloperidol sobre el metabolismo cerebral en pacientes esquizofrénicos, (b) la relación entre los síntomas negativos y
los cambios regionales inducidos por haloperidol en la utilización de glucosa cerebral, y (c)
la relación entre el cambio metabólico y el efecto antipsicótico clínico. Los sujetos fueron 18 pacientes masculinos
hospitalizados para veteranos (10 negros, cinco blancos y tres hispanos) con descompensación aguda o crónica de la
esquizofrenia. Los sujetos tenían edades comprendidas entre los 26 y los 44 años, y la duración de la enfermedad
oscilaba entre los 7 y los 27 años. Entre los datos recopilados se encuentran las siguientes puntuaciones previas al
tratamiento en la subprueba de sustitución de dígitos y símbolos del WAIS-R (DSY1RW) y el cambio inducido por
haloperidol en la corteza prefrontal dorsolateral izquierda absoluta (DLLA3V1) y la corteza prefrontal dorsolateral
derecha absoluta (DLRA3V1) medidas en unidades demetromol glucosa/100 g tejido/min:
27El propósito de un estudio de Maltais et al. (A-29) fue comparar y correlacionar el aumento de ácido láctico arterial (La)
durante el ejercicio y la capacidad oxidativa del músculo esquelético en pacientes con enfermedad pulmonar
obstructiva crónica (EPOC) y sujetos control (C). Había nueve sujetos en cada grupo. La edad media de los pacientes
fue de 62 años con una desviación estándar de 5. Los sujetos de control tenían una edad media de 54 años con una
desviación estándar de 3. Entre los datos recopilados se encontraban los
746 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
28Torre et al. (A-30) realizó un estudio para determinar los niveles séricos de nitrito en pacientes pediátricos con infección
por el virus de la inmunodeficiencia humana tipo 1 (VIH-1). Los sujetos incluyeron 10 niños de control sanos (seis
niños y cuatro niñas) con una edad media de 9,7 años y una desviación estándar de 3,3. El resto de los sujetos eran 21
niños nacidos de madres infectadas por el VIH-1. De estos, siete (tres niños y cuatro niñas) estaban afectados por el
SIDA. Tenían una edad media de 6 años con una desviación estándar de 2,8. Los 14 niños restantes (siete niños y siete
niñas) se volvieron seronegativos para el VIH-1 durante el primer año de vida. Su edad media fue de 3,3 años con una
desviación estándar de 2,3 años. Entre los datos recopilados se encuentran los siguientes niveles séricos de nitritod
metromol=LÞ:
29Seghaye et al. (A-31) analizaron la influencia de la aprotinina en dosis bajas sobre la activación del complemento,
la estimulación leucocitaria, la producción de citocinas y la respuesta de fase aguda en niños sometidos a
REFERENCIAS 747
operaciones cardíacas. El criterio de inclusión para el estudio fue un defecto cardíaco congénito no cianótico que
requería un procedimiento quirúrgico primario relativamente simple asociado con un riesgo postoperatorio bajo.
Entre los datos recopilados se encuentran las siguientes mediciones de interleucina-6 (IL-6) y proteína C reactiva
(PCR) obtenidas 4 y 24 horas después de la operación, respectivamente:
Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.El proyecto de ley 2071 (AB 2071) de la Asamblea del Estado de California exigía que los pacientes de las clínicas de
metadona se sometieran a un mínimo de 50 minutos de asesoramiento al mes. Evan Kletter (A-32) recopiló datos
sobre 168 sujetos que estaban continuamente activos en tratamiento a través de los centros de Investigación y
Tratamiento de Adicciones del Área de la Bahía (BAART) durante 1 año antes y 2 años después de la
implementación de AB 2071. Antes de AB 2071, los consejeros del centro BAART pasaban dos sesiones de al
menos 15 minutos por sesión por mes con cada cliente. Los sujetos del estudio también fueron identificados
como consumidores de cocaína. Las observaciones en KLETTER son los porcentajes de falla en una prueba de
drogas de cocaína para cada uno de los sujetos antes y después de AB 2071. Por ejemplo, un valor previo de 60
implica que el paciente falló una prueba de cocaína el 60 por ciento de las veces antes de adopción de AB 2071.
El Dr. Kletter realizó una prueba de suma de rangos de Wilcoxon para determinar si el porcentaje de pruebas
fallidas disminuyó significativamente después de la aprobación de AB 2071. Use los datos para determinar a qué
conclusión pudo llegar. Informe la estadística de prueba ypagvalor.
REFERENCIAS
Referencias de metodología
1. F.RANGOWILCOXÓN, "Comparaciones individuales por métodos de clasificación,"biometría, 1 (1945), 80–83.
2. AM MDOO,Introducción a la Teoría de la Estadística,McGraw-Hill, Nueva York, 1950.
3. J. W.ESTENBERG, “Prueba de significancia para la mediana y el rango intercuartílico en muestras de poblaciones continuas de
cualquier forma,”Procedimientos Koninklijke Nederlandse Akademie Van Wetenschappen, 51 (1948), 252–261.
4. GW BFILAy soy mDOO, “Sobre la mediana de las pruebas de hipótesis lineales”,Actas del Segundo Simposio de Berkeley
sobre Estadística Matemática y Probabilidad,Prensa de la Universidad de California, Berkeley, 1951, 159–166.
5. HB MANAy DR WHITNEY, "En una prueba de si una de dos variables aleatorias es estocásticamente más grande
que la otra",Anales de estadística matemática, 18 (1947), 50–60.
6. AN KOLMOGOROV, “Sulla Determinazione Empirial di una Legge di Distribuizione,”Giornale dell'Institut
Italiano degli Altuari, 4 (1933), 83–91.
7. NV SMIRNOV, “Estimación de la desviación entre funciones de distribución empíricas en dos muestras
independientes” (en ruso),Boletín de la Universidad de Moscú, 2 (1939), 3–16.
748 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN
Aplicaciones Referencias
A-1. ROBERTOBPARKER, RyanYATE, jUDITHESOBERMAN, y CASEYLAIZURA, "Efectos del jugo de toronja en la glicoproteína P
intestinal: evaluación con digoxina en humanos"Farmacoterapia, 23 (2003), 979–987.
A-2. CCRISTINAGRAMOVIOLACIÓN, mARIASANDGREN, LARS-OLAFHANSSON, mATSmiRICSON, y T€oRESTHEORELL, “¿Cantar
¿Promover el bienestar?: un estudio empírico de cantantes profesionales y aficionados durante una lección de canto”, Ciencias
fisiológicas y del comportamiento integradoras, 38 (2003), 65–74.
A-3. RSZUCKERMANy S. H.ENEGHAN, "La duración de la depresión hemodinámica durante la colecistectomía
laparoscópica",Endoscopia quirúrgica, 16 (2002), 1233–1236.
A-4. CUN ROLWCRANORy DCERVEZA INGLESAANTES DE CRISTOHRISTENSEN, “El Proyecto Asheville: Resultados a corto plazo de un
programa de atención de la diabetes en una farmacia comunitaria”,Diario de la Asociación Farmacéutica Americana,
43 (2003), 149–159.
A-5. YITAOLIU, LUDMILABELAYEV, WEIZHAOZHAO, RAULBUSTO, y MYRONDGINSBURG, “MRZ 2(579, una novela
poco competitivoNORTE-Antagonista de metil-D-aspartato, reduce el volumen del infarto y la inflamación del cerebro y mejora el déficit
neurológico después de la isquemia cerebral focal en ratas”,Investigación del cerebro, 862 (2000), 111–119.
A-6. METROOHAMEDAELSHAIKH, jAMÉSC.U.LCHAKER, CHANDANAA. R.REMOLINO, kENNETHANGERMEIER, miRICAKLEINy J.SÍPAG.
CIEZKI, “Tamsulosina profiláctica (Flomax®) en pacientes sometidos a próstata125I Braquiterapia para el Carcinoma de
Próstata. Informe final de un estudio aleatorizado doble ciego controlado con placebo”,Revista internacional de
radiación en oncología, biología, física, (próximo).
A-7. GLACROIX, CALLEISSOT, FROGERIEUX, R. B.EAULIEU, LCORNU, CGILLETA, FROBIDEL, JP LEFE - VRE, y año fiscal BOIS,
“Disminución de la respuesta alérgica pulmonar inducida por ovoalbúmina por exposición al benzaldehído pero no
al acetaldehído en un modelo de conejillo de Indias”Diario de Toxicología y Salud Ambiental, Parte A, 65 (2002), 995–
1012.
A-8. WHERRMANN, H. S.CORO, JP KPNA, SOYtu €LLER, G. S.TEINy J. G.EISEL, “Papel de la homocisteína, cistationina
y medición de ácido metilmalónico para el diagnóstico de la deficiencia de vitaminas en sujetos de edad avanzada”,Revista
europea de investigación clínica, 30 (2000), 1083–1089.
A-9. CarolFLEXER, kCOMIÓkEMPBILEY, ALISAHINKLEY, CHERYLHARKEMAy J.OHN. Holcomb, “Uso de Sound-Field para
Enseñar conciencia fonémica a niños en edad preescolar”,Diario de Audiencia, 55 (3) (2002), 38–44.
A-10. SATOSHInorteOZAWA, kATSUJISHIMIZU, kIEMETROIYAMOTO, y MIZUOTANAKÁ, "Reparación del defecto pars interarticularis mediante fijación
segmentaria con alambre en atletas jóvenes con espondilólisis",Revista estadounidense de medicina deportiva, 31 (2003), 359–
364.
A-11. MBUTZ, KHWOLLINSKY, U. W.IDEMUTO-CATRINESCU, COMOPERFELADO, SUDOESTEENTERRAR, HH MEHRKENS, CA LUDOLFO,
y H. S.CHREIBER, “Efectos longitudinales de la ventilación con presión positiva no invasiva en pacientes con
esclerosis lateral amiotrófica,”Diario Americano de Rehabilitación Médica, 82 (2003), 597–604.
A-12. TOMOHIROOtaniy ShojikISHI, "Un estudio controlado de vitrectomía para el edema macular diabético",Diario
Americano de Oftalmología, 134 (2002), 214–219.
A-13. JJOSEy SR ELL, "La asociación de la permeabilidad nasal subjetiva con el flujo nasal inspiratorio máximo en una gran
población sana"Otorrinolaringología Clínica, 28 (2003), 352–354.
REFERENCIAS 749
Este capítulo proporciona una introducción al análisis de los datos que surgen de estudios
en los que el resultado de interés es el tiempo transcurrido hasta la ocurrencia de un
evento. Este tipo de estudios se han utilizado históricamente para monitorear el tiempo
de supervivencia de los pacientes que enfrentan la posibilidad de morir durante el
estudio, de ahí el uso de la descripción de estas técnicas como “análisis de supervivencia”.
Sin embargo, en este capítulo aprenderemos técnicas que se pueden usar en el contexto
de cualquier resultado donde el tiempo de ocurrencia de un evento es de interés.
Emplearemos técnicas similares a las que aprendimos en capítulos anteriores, incluidos
los métodos para analizar datos de frecuencia, los métodos para desarrollar modelos
lineales para hacer predicciones y temas de estadística no paramétrica.
TEMAS
14.1INTRODUCCIÓN
14.2CENSURACIÓN Y DATOS DE TIEMPO HASTA EL EVENTO
4. comprender cómo desarrollar modelos diseñados para manejar datos de tiempo hasta el evento.
14.1 INTRODUCCIÓN
En muchos estudios, el resultado de interés está relacionado con el momento en que ocurre un evento. En un
entorno clínico, uno puede estar interesado en medir cuánto tiempo un enfermo crónico
750
14.2 CENSURACIÓN Y DATOS DE TIEMPO HASTA EL EVENTO 751
el paciente sobrevive después de recibir un determinado tratamiento. En otro escenario, uno puede estar interesado
en determinar cuál de los tres medicamentos, en comparación con un placebo, proporciona un alivio de los síntomas
con mayor rapidez.
Imagine que una clínica de rehabilitación cardíaca está interesada en determinar si la
inscripción en un programa tradicional de educación para la salud o la inscripción en un programa
que brinda planificación dietética y nutricional junto con educación del paciente es más eficaz para
prevenir la ocurrencia de un segundo infarto de miocardio después de un primer ataque cardíaco. . El
estudio podría comenzar cuando el primer paciente, después de su primer ataque cardíaco, se asigna
aleatoriamente a un programa de tratamiento, con pacientes adicionales inscritos a lo largo del
tiempo. Por el contrario, el estudio podría comenzar con una cohorte de sujetos, cada uno de los
cuales ha tenido su primer ataque cardíaco, que se asignan aleatoriamente a un programa de
tratamiento. En cualquier caso, hay potencialmente tres resultados que podrían ocurrir con cada
paciente, con elevento de interessiendo un segundo infarto. Estos son (1)el paciente tiene un segundo
infarto; (2)el paciente abandona el estudio, convirtiéndose así en unpérdida durante el seguimiento—
que podría ocurrir por una serie de razones, incluida la muerte o la reubicación geográfica, por
ejemplo; o (3)el evento de interés no le ocurre al paciente durante el período de estudio. Estos tres
eventos mutuamente excluyentes son la base para los estudios de análisis de supervivencia.
Aunque la gran mayoría de las investigaciones publicadas que utilizan los métodos de análisis de
supervivencia son de naturaleza clínica, debe mencionarse que también hay muchos usos no clínicos para el análisis
de supervivencia. Con el advenimiento de los programas estadísticos basados en computadora para ayudar con
cálculos complejos, el uso de metodologías de análisis de supervivencia ha aumentado de manera demostrable entre
muchas disciplinas. Por ejemplo, los ingenieros pueden querer saber el tiempo que tarda una batería en perder su
carga, un científico de control de calidad en una planta de fabricación puede querer entender en qué punto las
máquinas necesitan ser recalibradas, o un ecólogo puede querer estimar cuánto cuánto tiempo permanece el
cadáver promedio en un área de estudio antes de ser depurado.
Los datos de medición para los estudios de análisis de supervivencia utilizan el tiempo que tarda en ocurrir
un evento de interés bien definido. Para cada sujeto inscrito en un estudio, el investigador registra la
cantidad de tiempo (esto puede ser meses, días, años o cualquier medida de tiempo) transcurrido entre el
momento en que cada sujeto ingresó al estudio hasta que experimente uno de los tres eventos posibles que
se acaban de presentar: el evento ocurre, el evento no ocurre o el sujeto se pierde durante el seguimiento. La
cantidad total de tiempo entre la inscripción inicial en el estudio y la ocurrencia de uno de los tres resultados
se conoce como el tiempo del sujeto de investigación.tiempo de supervivencia,otiempo hasta el evento.Por lo
tanto, la información recopilada sobre cada tema a menudo se denominadatos de supervivenciaodatos de
tiempo hasta el evento.Además de los datos de supervivencia, también se pueden recopilar covariables,
como la edad, el sexo, el tipo de medicación y la dieta, por ejemplo, para el desarrollo de modelos complejos.
DEFINICIÓN
datos de supervivencia,odatos de tiempo hasta el evento,son medidas del tiempo
transcurrido entre la inscripción inicial en un estudio y la disposición final del sujeto del
estudio. Este tiempo transcurrido podría estar representado por el momento del
diagnóstico inicial o podría estar representado por el momento en que uno
752 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA
Paciente
B
DEFINICIÓN
Datos censuradosestán representados por mediciones para las cuales tenemos alguna
información sobre el tiempo de supervivencia, pero no se conoce el tiempo de supervivencia
exacto.
Los datos censurados pueden ocurrir de varias maneras. Endatos censurados individualmente,un
número fijo de sujetos entran en un estudio al mismo tiempo. Una vez en el estudio, algunos de los sujetos
no experimentarán el evento. Se sabe que su tiempo de supervivencia es un período de tiempo mayor que la
duración del estudio. Esto se conoce comocensura tipo I.También puede ser que por razones de
investigación o éticas, el estudio finalice después de que una cierta proporción de los sujetos experimente la
condición de interés, y la proporción restante no experimentó el evento cuando finalizó el estudio. Se llama
censura tipo II.Cabe señalar que estos conceptos no están relacionados con los conceptos de error Tipo I y
error Tipo II presentados en el Capítulo 7. Otro tipo de censura
14.2 CENSURACIÓN Y DATOS DE TIEMPO HASTA EL EVENTO 753
que puede ocurrir se conoce comodatos progresivamente censuradosen el que el período de estudio es fijo, pero los
sujetos pueden ingresar al experimento en diferentes momentos. Entonces, los pacientes pueden experimentar o no
experimentar el evento de interés, y aquellos que no experimentan el evento tienen tiempos de supervivencia
desconocidos. Se llamacensura tipo III.Los datos para los cuales no se conocen los criterios de valoración exactos, ya
sea porque el sujeto abandonó el estudio, se retiró del estudio o sobrevivió más allá de la finalización del estudio se
denominandatos censurados por la derechaporque los tiempos de supervivencia se extienden más allá de la cola
derecha de la distribución de tiempos de supervivencia. Por el contrario, podríamos tener datos para los cuales no se
conocen los puntos iniciales exactos. Esto podría surgir, por ejemplo, si un sujeto con la condición ingresa al estudio,
pero no se sabe exactamente cuándo se desarrolló la condición en el paciente. Estos datos se conocen comodatos
censurados a la izquierdadebido a que sus tiempos de supervivencia se truncan en el lado izquierdo de la distribución
de la distribución del tiempo de supervivencia, lo que hace que se desconozca la diferencia de tiempo entre el
diagnóstico y la entrada en el estudio. Claramente, los detalles que rodean a los datos censurados son complejos y
requieren un análisis mucho más detallado que el que se cubre en este texto introductorio. Para aquellos interesados
en leer más, sugerimos los libros de Kleinbaum y Klein (1), Lee (2) y Hosmer y Lemeshow (3).
Generalmente, para fines de análisis, se utiliza una variable dicotómica o indicadora para distinguir los
tiempos de supervivencia de aquellos sujetos que experimentan el evento de interés y aquellos que no lo
hacen debido a uno de los mecanismos de censura descritos anteriormente. Por lo general, esta variable se
denominavariables de estado,con un cero que indica que no ocurrió un evento y, por lo tanto, el tiempo de
supervivencia está censurado, y un 1 que indica que sí ocurrió el evento de interés.
En los estudios donde se investigan diferentes tratamientos, estamos interesados en tres
elementos de información para cada sujeto: (1)¿Qué tratamiento se le dio al paciente? (2)¿Durante
cuánto tiempo se observó al paciente? (3)¿Experimentó el paciente el evento de interés durante el
estudio o se censuró el tiempo de supervivencia por algún motivo? En los estudios que no se ocupan
de comparar diferentes condiciones de tratamiento, solo los dos últimos elementos de datos son
relevantes. Además, podemos estar interesados en diferentes covariables asociadas con los
pacientes (p. ej., edad, género, nivel de ingresos) para desarrollar modelos más complejos y, por lo
tanto, podemos desarrollar preguntas basadas en estas covariables de interés.
Con estos tres elementos de información a la mano, junto con cualquier covariable de interés,
podemos, en estudios como el ejemplo del infarto de miocardio mencionado en la Sección 14.1,
estimar la mediana del tiempo de supervivencia del grupo de pacientes que recibió un tratamiento en
comparación con otro. La comparación de diferentes medianas de tratamiento nos permite responder
a la siguiente pregunta: Con base en la información de nuestro estudio, ¿qué tratamiento concluimos
que retrasa por un período de tiempo más largo, en promedio, la ocurrencia de un segundo infarto?
Los datos recopilados en estudios de seguimiento como los que hemos descrito también pueden
usarse para responder otra pregunta de gran interés para el médico: ¿Cuál es la probabilidad
estimada de que un paciente sobreviva durante un período de tiempo específico? O, ¿Hay alguna
diferencia en la supervivencia de hombres y mujeres que han sufrido ataques al corazón? Para el
estudio de infarto de miocardio, el médico puede preguntar: "¿Cuál es la probabilidad de que un
paciente que recibió tratamiento A sobreviva más de 2 años?" Los métodos empleados para
responder a este tipo de preguntas se conocen comoanálisis de supervivenciamétodos.
variable aleatoria que tiene alguna probabilidad de ocurrencia en cada período de tiempo para cada sujeto
en el estudio.
Ya hemos encontrado dos representaciones útiles de distribuciones de probabilidad en el
Capítulo 4. Estas fueron la función de distribución acumulativa y la función de distribución de
probabilidad. Si dejamos que el tiempo del evento sea representado porT,entonces la función de
distribución acumulada deTestá representado porFdtÞ,tal que
Fdt¼PAGdT tÞ (14.2.1)
Sdt¼1FdtÞ (14.2.2)
Ambas distribuciones se ilustran en la Figura 14.2.2. Es la curva de supervivencia lo que generalmente nos
interesa más, y las comparaciones de varias curvas de supervivencia proporcionan un medio estadístico para
comparar cosas como la supervivencia individual y las diferencias en la supervivencia entre diferentes
tratamientos.
1
0.9
0.8
0.7
0.6
Probabilidad
0.5
Pie)
0.4
Calle)
0.3
0.2
0.1
0
0 2 4 6 8 10 12 14 dieciséis 18 20
Tiempo
DFdtÞ DSdtÞ
Fdt¼ ¼ (14.2.4)
Dt Dt
Finalmente, una función que se encuentra a menudo en el análisis de supervivencia es la función de
riesgo, hdtÞ.Esta función se utiliza para definir la probabilidad instantánea de que ocurra un evento dado que
el sujeto ha sobrevivido hasta un tiempo determinado,t.Esta función se define como
Tenga en cuenta que esta función se basa en una probabilidad condicional, en la que estamos interesados
en calcular la probabilidad de que ocurra un evento dado que el sujeto ya ha sobrevivido a un tiempo
definido. La condición de haber sobrevivido hasta un momento dado significa que la probabilidad de
sobrevivir en el futuro está influenciada por haber sobrevivido a períodos de tiempo anteriores. Esta idea
puede ser muy importante en algunos casos, donde sobrevivir a las primeras etapas de una enfermedad
puede disminuir drásticamente el potencial de que ocurra un evento en el futuro cercano. Como ejemplo,
considere el cáncer donde la no recurrencia o la remisión durante un período de 5 años generalmente
aumenta la supervivencia. Esta función también se puede expresar en términos de dos funciones
previamente definidas. Esta expresión es
FdtÞ
hdt¼ (14.2.6)
SdtÞ
Debido a que la función de riesgo puede exceder 1, no es realmente una probabilidad, aunque se basa en la
probabilidad condicional de que ocurra un evento. La función de riesgo a menudo se define en el análisis de
supervivencia mediante una distribución conocida, como lognormal, exponencial o Weibull.
756 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA
distribución. Allison (4) y Kleinbaum y Klein (1) proporcionan excelentes descripciones de los diversos
modelos utilizados para representar funciones de riesgo.
Ahora mostremos cómo podemos usar los datos generalmente recopilados en estudios de seguimiento del
tipo que hemos estado discutiendo para estimar la probabilidad de sobrevivir durante un período de tiempo
específico. El método que utilizamos fue introducido por Kaplan y Meier (5) y por esa razón se llama el
Procedimiento de Kaplan-Meier.Dado que el procedimiento involucra la multiplicación sucesiva de
probabilidades individuales estimadas, a veces se lo denominamétodo de límite de productode estimar las
probabilidades de supervivencia.
Como veremos, los cálculos incluyen los cálculos de proporciones de sujetos en una muestra que
sobreviven durante varios períodos de tiempo. Usamos estas proporciones de muestra como estimaciones
de las probabilidades de supervivencia que esperaríamos observar en la población representada por nuestra
muestra. En términos matemáticos nos referimos al proceso como la estimación de una función de
supervivencia. Las distribuciones de frecuencia y las distribuciones de probabilidad pueden construirse a
partir de los tiempos de supervivencia observados, y estas distribuciones observadas pueden mostrar
evidencia de seguir alguna distribución teórica de forma funcional conocida. Cuando se desconoce la forma
de la distribución muestreada, se recomienda que la estimación de una función de supervivencia se realice
por medio de unatécnica no paramétrica,de los cuales el procedimiento de Kaplan-Meier es uno. Las técnicas
no paramétricas se definen y analizan en detalle en el Capítulo 13.
Usamos estas proporciones, que podemos volver a etiquetar como p̂1; pag2; pag3; . . . ; pagkcomo
estimaciones de la probabilidad de que un sujeto de la población representada por la muestra sobreviva a los
periodos de tiempo 1, 2, 3, . . . ,k,respectivamente.
Para cualquier período de tiempo,yo,donde t k,estimamos la probabilidad de sobrevivir a la
1 tperíodo de tiempo,pagt, como sigue:
número de sujetos que sobreviven al menosdt1Þperiodos de tiempo que también sobreviven altperíodo
pagt¼
número de sujetos vivos al final del período de tiempodt1Þ
(14.3.1)
14.3 EL PROCEDIMIENTO DE KAPLAN-MEIER 757
EJEMPLO 14.3.1
Para evaluar los resultados e identificar predictores de supervivencia, Martini et al. (A-1) revisó su
experiencia total con los tumores malignos primarios del esternón. Clasificaron a los pacientes en
tumores de bajo grado (25 pacientes) o de alto grado (14 pacientes). El evento (estado), el tiempo
hasta el evento (meses) y el grado del tumor para cada paciente se muestran en la Tabla 14.3.1.
Deseamos comparar la experiencia de supervivencia a 5 años de estos dos grupos mediante el
procedimiento de Kaplan-Meier.
Solución: La disposición de los datos y los cálculos necesarios se muestran en la Tabla 14.3.2. Las
entradas para la tabla se obtienen de la siguiente manera.
TABLA 14.3.1 Datos de supervivencia, sujetos con tumores malignos del esternón
TABLA 14.3.2 Disposición de datos y cálculos para el procedimiento de Kaplan-Meier, ejemplo 14.3.1
1 2 3 4 5 6
6 0
8 0
11 1 23 22 22=23¼ :956522 . 956522
15 1
15 1 22 20 20=22¼ :909090 . 869564
26 0
29 1 18 17 17=18¼ :944444 . 780192
34 0
75 0
79 1 14 13 13=14¼ :928571 . 681847
82 0
95 0
102 1 11 10 10=11¼ :909090 . 619860
109 0
109 0
117 0
127 0
129 0
137 0
138 0
155 0
212 1 2 1 1=2¼ :500000 . 309930
337 0
(Continuado)
14.3 EL PROCEDIMIENTO DE KAPLAN-MEIER 759
1 2 3 4 5 6
9 1
9 1 8 6 6=8¼ :750000 . 428572
122 0 1 0
2.La columna 2 contiene una variable indicadora que muestra el estado vital d1¼
fallecido; 0¼vivo o censuradoÞ.
3.En la Columna 3 enumeramos el número de pacientes en riesgo por cada tiempo asociado con la
muerte de un paciente. Solo debemos preocuparnos por los momentos en que ocurren las
muertes porque la tasa de supervivencia no cambia en los momentos censurados.
4.La columna 4 contiene el número de pacientes que quedan vivos justo después de una o
más muertes.
1.0
73%
.8 Grado bajo (norte=25)
.6
.5
.4
.2 7%
Alto grado (norte=14)
0.0
0 12 24 36 48 60 72 84 96 108 120
Tiempo (Meses)
FIGURA 14.3.1Curva de supervivencia de Kaplan-Meier, ejemplo 14.3.1, que muestra la mediana de los tiempos de supervivencia y las tasas
de supervivencia a 5 años (60 meses).
para representar visualmente el tiempo medio de supervivencia y las tasas de supervivencia, como
la tasa de supervivencia a 5 años. El gráfico de los datos de supervivencia acumulados de la Tabla
14.3.2 se muestra en la Figura 14.3.1.
Estas observaciones sugieren fuertemente que la experiencia de supervivencia de los
pacientes con tumores de bajo grado es mucho más favorable que la de los pacientes con tumores
de alto grado. &
EJERCICIOS
14.3.1Cincuenta y tres pacientes con cáncer medular de tiroides (CMT) fueron objeto de un estudio de Dottorini
et al. (A-2), quienes evaluaron el impacto de diferentes factores clínicos, patológicos y el tipo de tratamiento en su
supervivencia. Treinta y dos de los pacientes eran mujeres y la edad media de todos los pacientes fue de 46,11 años
con una desviación estándar de 14,04 (rango 18-35 años). La siguiente tabla muestra el estado de cada paciente en
varios períodos de tiempo después de la cirugía. Calcule la función de supervivencia utilizando el procedimiento de
Kaplan-meier y trace la curva de supervivencia.
1 0 doc 28 6 vivo
2 1 mtc 29 6 vivo
3 1 mtc 30 6 vivo
4 1 mtc 31 6 vivo
5 1 mtc 32 7 mtc
6 1 mtc 33 8 vivo
7 1 mtc 34 8 vivo
8 1 mtc 35 8 vivo
9 1 vivo 36 8 vivo
10 2 mtc 37 8 vivo
(Continuado)
762 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA
11 2 mtc 38 9 vivo
12 2 mtc 39 10 vivo
13 2 vivo 40 11 mtc
14 2 vivo 41 11 doc
15 3 mtc 42 12 mtc
dieciséis 3 mtc 43 12 doc
17 3 vivo 44 13 mtc
18 4 mtc 45 14 vivo
19 4 vivo 46 15 vivo
20 4 vivo 47 dieciséis mtc
21 4 vivo 48 dieciséis vivo
22 5 vivo 49 dieciséis vivo
23 5 vivo 50 dieciséis vivo
24 5 vivo 51 17 doc
25 5 vivo 52 18 mtc
26 6 vivo 53 19 vivo
27 6 vivo
aEl tiempo es el número de años después de la cirugía.
bdoc¼muerto por otras causas; mtc¼muertos de cáncer medular de tiroides.
fuente: Datos proporcionados por cortesía del Dr. Massimo E. Dottorini.
14.3.2Banerji et al. (A-3) siguió a pacientes con diabetes mellitus no insulinodependiente (NIDDM) desde el inicio
de su hiperglucemia original y el inicio de su remisión casi normoglucémica después del tratamiento. Los
sujetos eran hombres y mujeres negros con una edad media de 45,4 años y una desviación estándar de 10,4.
La siguiente tabla muestra la experiencia de recaída/remisión de 62 sujetos. Calcule la función de
supervivencia utilizando el procedimiento de Kaplan-Meier y trace la curva de supervivencia.
3 1 8 2 26 1
3 2 9 2 27 1
3 1 10 1 28 2
3 1 10 1 29 1
3 1 11 2 31 2
4 1 13 1 31 1
4 1 dieciséis 1 33 2
4 1 dieciséis 2 39 2
5 1 17 2 41 1
5 1 18 2 44 1
5 1 20 1 46 1
5 1 22 1 46 2
5 1 22 2 48 1
5 1 22 2 48 2
(Continuado)
14.4 COMPARACIÓN DE CURVAS DE SUPERVIVENCIA 763
5 1 23 1 48 1
6 1 24 2 49 1
6 1 25 2 50 1
6 1 25 2 53 1
7 1 26 1 70 2
8 2 26 1 94 1
8 1
8 2
a1¼sí (el paciente todavía está en remisión); 2¼no (el paciente ha recaído). Fuente: Datos
proporcionados por cortesía de la Dra. Mary Ann Banerji.
El examen de una curva de supervivencia para un solo grupo de individuos es valioso porque permite ver
características que no se ven tan fácilmente al examinar un conjunto de valores tabulados. Esto incluye
visualizar la trayectoria temporal para encontrar períodos de tiempo en los que hubo cambios dramáticos en
la supervivencia, encontrar períodos de tiempo en los que ocurrieron cambios relativamente pequeños o
encontrar la mediana aproximada de la distribución de datos. La construcción de curvas de supervivencia, sin
embargo, encuentra su mayor uso cuando las comparaciones entre las distribuciones de supervivencia son
de interés. Por ejemplo, uno puede desear examinar las diferencias en el tratamiento en el que los sujetos
fueron asignados al azar, o puede desear saber qué medicación retrasa la aparición del evento de interés
durante el período de tiempo más largo.
Los resultados de comparar las experiencias de supervivencia de diferentes grupos no siempre serán
tan dramáticos como los de nuestro ejemplo anterior. Para una comparación objetiva de las experiencias de
supervivencia de diferentes grupos, es deseable que tengamos una técnica objetiva para determinar si son
significativamente diferentes desde el punto de vista estadístico. Sabemos también que los resultados
observados se aplican estrictamente a las muestras en las que se basan los análisis. De mucho mayor interés
es un método para determinar si podemos concluir que existe una diferencia entre las experiencias de
supervivencia en las poblaciones de las que se extrajeron las muestras. En otras palabras, en este punto,
deseamos un método para probar la hipótesis nula de que no hay diferencia en la experiencia de
supervivencia entre poblaciones contra la alternativa de que sí hay diferencia. Tal prueba es proporcionada
por elprueba de rango logarítmico.La prueba de rango logarítmico es una aplicación del procedimiento de
Mantel-Haenszel analizado en la sección 12.7. Mantel (6) propuso la extensión del procedimiento a los datos
de supervivencia. Aunque es posible que deseemos comparar las curvas de supervivencia de muchas
poblaciones, limitaremos nuestra discusión a la comparación de dos grupos: Para realizar esta tarea,
calculamos la estadística de rango logarítmico y procedemos de la siguiente manera:
1.Ordene los tiempos de supervivencia hasta la muerte para ambos grupos combinados, omitiendo los tiempos
censurados. Cada vez constituye un estrato como se define en la Sección 12.7.
2.Para cada estrato o tiempo,ti, construimos una tabla 2 2 en la que la primera fila
contiene el número de muertes observadas, la segunda fila contiene el número de
764 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA
TABLA 14.4.1 Tabla de Contingencia por Estrato (Tiempo)tipara calcular la prueba de rango
logarítmico
pacientes vivos, la primera columna contiene datos para un grupo, por ejemplo, el grupo A, y la
segunda columna contiene datos para el otro grupo, por ejemplo, el grupo B. La tabla 14.4.1 muestra
la tabla para el tiempoti.
3.Para cada estrato, calcule la frecuencia esperada para la celda superior izquierda de su tabla
mediante la Ecuación 12.7.5.
4.Para cada estrato calcularvipor la Ecuación 12.7.6.
5.Finalmente, calcule el estadístico de Mantel-Haenszel (ahora llamado estadístico de rango logarítmico) mediante
la Ecuación 12.7.7.
EJEMPLO 14.4.1
Volvamos a referirnos a los datos sobre tumores malignos primarios del esternón presentados
en el ejemplo 14.3.1. El examen de los datos revela que hay 20 períodos de tiempo (estratos).
Para cada uno de estos debe construirse una tabla 2 2 siguiendo el patrón de la Tabla 14.4.1. La
primera de estas tablas se muestra como Tabla 14.4.2. Por las Ecuaciones 12.7.5 y 12.7.6
calculamosmiiyvicomo sigue:
d0þ1Þð0þ25Þ
mii¼ ¼ :641
39
d0þ1Þð25þ13Þð0þ25Þð1þ13Þ
vi¼ ¼ :230
392d38Þ
Los datos de la Tabla 14.4.2 y datos similares para los otros 19 períodos de tiempo se muestran en
Tabla 14.4.3. Con los datos de la tabla 14.4.3, calculamos el estadístico de rango logarítmico mediante la ecuación 12.7.7 de la
siguiente manera:
d9 17:811Þ2
Xmh
2 ¼ ¼24:724
3:140
Fallecidos 0 1 1
pacientes vivos 25 13 38
Pacientes en riesgo 25 13 39
14.4 COMPARACIÓN DE CURVAS DE SUPERVIVENCIA 765
TABLA 14.4.3 Cálculos intermedios para la prueba de rango logarítmico, ejemplo 14.4.1
0 0 25 25 1 13 14 39 0.641 0.230
2 0 25 25 1 12 13 38 0.658 0.225
3 0 25 25 1 11 12 37 0.676 0.219
4 0 25 25 1 10 11 36 0.694 0.212
6 0 25 25 1 9 10 35 0.714 0.204
7 0 24 24 1 8 9 33 0.727 0.198
9 0 23 23 2 6 8 31 1.484 0.370
11 1 22 23 0 6 6 29 0.793 0.164
12 0 22 22 1 5 6 28 0.786 0.168
15 2 20 22 0 5 5 27 1.630 0.290
dieciséis 0 20 20 1 4 5 25 0.800 0.160
17 0 20 20 1 3 4 24 0.833 0.139
21 1 19 20 0 3 3 23 0.870 0.113
23 0 19 19 1 2 3 22 0.864 0.118
27 0 18 18 1 1 2 20 0.900 0.090
29 1 17 18 0 1 1 19 0.947 0.050
33 1 dieciséis 17 0 1 1 18 0.944 0.052
79 1 13 14 0 1 1 15 0.933 0.062
102 1 10 11 0 1 1 12 0.917 0.076
212 1 1 2 0 0 0 2 1.000 0.000
La referencia a la Tabla F del Apéndice revela que desde 24:724 > 7:879, elpagel valor para esta
prueba es < :005. Por lo tanto, rechazamos la hipótesis nula de que la experiencia de supervivencia es
la misma para pacientes con tumores de bajo grado y tumores de alto grado y concluimos que son
diferentes.
Existen procedimientos alternativos para probar la hipótesis nula de que dos curvas de supervivencia
son idénticas. Incluyen la prueba de Breslow (también llamada prueba de Wilcoxon generalizada) y la prueba
de Tarone-Ware. Ambas pruebas, así como la prueba de rango logarítmico, se analizan en Parmar y Machin
(7) y Allison (4). Al igual que la prueba de rango logarítmico, la prueba de Breslow y la prueba de Tarone-Ware
se basan en las diferencias ponderadas entre el número real y esperado de muertes en los puntos de tiempo
observados. Mientras que la prueba de rango logarítmico clasifica todas las muertes por igual, las pruebas de
Breslow y Tarone-Ware dan más peso a las muertes prematuras. Para el ejemplo 12.8.1, SPSS calcula un valor
de 24:93dpag < :001Þpara el test de Breslow y un valor de 25:22dpag < :001Þpara la prueba de Tarone-Ware.
Kleinbaum (27) analiza otra prueba llamada prueba de Peto. Las fórmulas para esta prueba se encuentran en
Parmar y Machin (7). La prueba de Peto también da más peso a la primera parte de la curva de supervivencia,
donde encontramos el mayor número de sujetos en riesgo. Al elegir una prueba, entonces, los investigadores
que quieran dar más peso a la parte anterior de la curva de supervivencia seleccionarán la prueba de
Breslow, la de Tarone-Ware o la de Peto. De lo contrario, la prueba de rango logarítmico es adecuada.
766 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA
Hemos cubierto solo los conceptos básicos del análisis de supervivencia en esta
sección. El lector que desee profundizar en el tema puede consultar uno o más de
varios libros dedicados al tema, como los de Kleinbaum (8), Lee (9), Marubini y
Valsecchi (10) y Parmar y Machin (7). ).
Análisis informático
Varios de los paquetes de software estadístico disponibles, como SPSS, son capaces de realizar
análisis de supervivencia y construir gráficos de apoyo como se describe en esta sección.
d en los ejemplos 14.3.1 y 14.4.1 es
&
Significara Mediana
Comparaciones generales
EJERCICIOS
14.4.1Si está disponible en su biblioteca, lea el artículo, "Impacto de la obesidad en pacientes con trasplante alogénico de
células madre: un estudio de casos y controles emparejado", por Donald R. Fleming et al. [Diario Americano de
Medicina, 102 (1997), 265–268] y responda las siguientes preguntas:
(a)¿Cómo se determinó el tiempo de supervivencia?
(b)¿Por qué cree que los autores usaron la prueba de Wilcoxon (prueba de Breslow) para comparar las curvas de
supervivencia?
14.4.2Si está disponible en su biblioteca, lea el artículo, "Supervivencia mejorada en pacientes con cáncer de próstata
localmente avanzado tratados con radioterapia y goserelina", de Michel Bolla et al. [Revista de Medicina de
Nueva Inglaterra, 337 (1997), 295–300], y responda las siguientes preguntas:
(a)¿Cómo se determinó el tiempo de supervivencia?
(b)¿Por qué cree que los autores usaron la prueba de rango logarítmico para comparar las curvas de supervivencia?
14.4.3Cincuenta sujetos que completaron un programa de reducción de peso en un gimnasio se dividieron en dos
grupos iguales. Los sujetos del grupo 1 fueron inmediatamente asignados a un grupo de apoyo que se
reunía semanalmente. Los sujetos del grupo 2 no participaron en las actividades del grupo de apoyo. Todos
los sujetos fueron seguidos durante un período de 60 semanas. Se reportaron semanalmente al gimnasio,
donde fueron pesados y se determinó si estaban dentro de la meta. Se consideró que los sujetos estaban
dentro del objetivo si su peso semanal estaba dentro de las 5 libras de su peso al momento de completar el
programa de reducción de peso. La supervivencia se midió desde la fecha de finalización del programa de
reducción de peso hasta la finalización del seguimiento o el punto en el que el sujeto superó el objetivo. Se
observaron los siguientes resultados:
Estado Estado
(GRAMO¼Dentro de la (GRAMO¼Dentro de la
Tiempo Meta Gþ ¼Objetivo superado Tiempo Meta Gþ ¼Objetivo superado
Sujeto (Semanas) L¼perdidos durante el seguimiento) Sujeto (Semanas) L¼perdidos durante el seguimiento)
Grupo 1 Grupo 2
1 60 GRAMO 1 20 GRAMOþ
2 32 L 2 26 GRAMOþ
3 60 GRAMO 3 10 GRAMOþ
4 22 L 4 2 GRAMOþ
5 6 GRAMOþ 5 36 GRAMOþ
6 60 GRAMO 6 10 GRAMOþ
7 60 GRAMO 7 20 GRAMOþ
8 20 GRAMOþ 8 18 L
9 32 GRAMOþ 9 15 GRAMOþ
10 60 GRAMO 10 22 GRAMOþ
11 60 GRAMO 11 4 GRAMOþ
12 8 GRAMOþ 12 12 GRAMOþ
(Continuado)
768 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA
Estado Estado
(GRAMO¼Dentro de la (GRAMO¼Dentro de la
Tiempo Meta Gþ ¼Objetivo superado Tiempo Meta Gþ ¼Objetivo superado
Sujeto (Semanas) L¼perdidos durante el seguimiento) Sujeto (Semanas) L¼perdidos durante el seguimiento)
Grupo 1 Grupo 2
13 60 GRAMO 13 24 GRAMOþ
14 60 GRAMO 14 6 GRAMOþ
15 60 GRAMO 15 18 GRAMOþ
18 24 L 18 22 GRAMOþ
19 34 L 19 8 GRAMOþ
20 60 GRAMO 20 10 L
21 40 L 21 32 GRAMOþ
22 26 L 22 7 GRAMOþ
23 60 GRAMO 23 8 GRAMOþ
24 60 GRAMO 24 28 GRAMOþ
25 52 L 25 7 GRAMOþ
En capítulos anteriores, vimos que los modelos de regresión se pueden usar para medidas de resultado
continuas y para medidas de resultado binarias (regresión logística). Las técnicas de regresión adicionales
están disponibles cuando las medidas dependientes pueden consistir en una combinación de datos de
tiempo hasta el evento u observaciones de tiempo censurado. Volviendo a nuestro ejemplo de un ensayo
clínico de la efectividad de dos medicamentos diferentes para prevenir un segundo infarto de miocardio, es
posible que deseemos controlar las características adicionales de los sujetos inscritos en el estudio. Por
ejemplo, esperaríamos que los sujetos fueran diferentes en sus mediciones de presión arterial sistólica de
referencia, antecedentes familiares de enfermedades cardíacas, peso, masa corporal y otras características.
Dado que todos estos factores pueden influir en la duración del intervalo de tiempo hasta un segundo infarto
de miocardio, nos gustaría tener en cuenta estos factores para determinar la eficacia de los medicamentos. El
método de regresión conocido como regresión de Cox (después de DR Cox (11), quien fue el primero en
proponer el método) o regresión de riesgos proporcionales se puede utilizar para tener en cuenta los efectos
de las mediciones de covariables continuas y discretas (variable independiente) cuando la variable
dependiente posiblemente esté censurada. datos de tiempo hasta el evento.
Describimos esta técnica revisando primero elfunción de riesgode la Sección 14.2, que describe
la probabilidad condicional de que un evento ocurra en un tiempo apenas mayor queticondicionado a
haber sobrevivido sin eventos hasta el momentoti. Esta función a menudo se escribe comoh(ti). El
modelo de regresión requiere que asumamos que las covariables tienen el efecto de
14.5 REGRESIÓN DE COX: EL MODELO DE RIESGOS PROPORCIONALES 769
Los coeficientes de regresión representan el cambio en el peligro que resulta del factor
de riesgo,zyo, que hemos medido. Reorganizar la ecuación anterior muestra que el coeficiente
exponenciado representa la razón de riesgo o la razón de las probabilidades condicionales de
un evento. Esta es la base para nombrar este método. regresión de riesgos proporcionales.Tal
vez recuerde que esta es la misma forma en que obtuvimos la estimación de la razón de
probabilidades a partir del coeficiente estimado cuando analizamos la regresión logística en el
Capítulo 11.
hdtiÞ
¼Expdbz1 i1 þbz2 i2 þ þ bz
k ikÞ (14.5.2)
h0dtiÞ
Para estimar los efectos de las covariables, b̂ requiere el uso de un paquete de software estadístico porque no existe
una única ecuación sencilla que proporcione las estimaciones para este modelo de regresión. La salida de la
computadora generalmente incluye estimaciones de los coeficientes de regresión, estimaciones del error estándar,
estimaciones de la razón de riesgo e intervalos de confianza. Además, la salida de la computadora también puede
proporcionar gráficos de las funciones de riesgo y las funciones de supervivencia para sujetos con diferentes valores
de covariables que son útiles para comparar los efectos de las covariables en la supervivencia.
EJEMPLO 14.5.1
Para determinar si el tiempo de recaída entre los usuarios de drogas está relacionado con la edad del
paciente y/o la droga de elección, Cross (datos clínicos no publicados) revisó una muestra aleatoria de
archivos de casos de usuarios de drogas de alto riesgo en una clínica de tratamiento ambulatorio. Los datos
representan el tiempo autoinformado en que ocurrió la recaída (o el tiempo en que el paciente se perdió
durante el seguimiento), el estado del paciente, el fármaco de elección y la edad del paciente. Los datos se
resumen en la Tabla 14.5.1.
1 12 1 1 21 21 21 1 2 28
2 8 1 1 18 22 41 1 2 31
3 5 1 1 17 23 23 0 2 22
4 17 1 1 17 24 15 1 2 31
5 19 1 1 25 25 15 0 2 25
6 12 0 1 30 26 21 1 2 19
(Continuado)
770 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA
7 10 1 1 dieciséis 27 45 1 2 21
8 11 1 1 23 28 37 1 2 23
9 5 1 1 31 29 51 1 2 15
10 2 1 1 21 30 50 1 2 29
11 10 1 1 19 31 42 1 2 28
12 7 0 1 18 32 21 1 2 31
13 19 1 1 18 33 20 1 2 31
14 11 1 1 21 34 15 1 2 26
15 11 1 1 23 35 40 1 2 28
dieciséis 19 1 1 15 36 39 1 2 31
17 19 1 1 17 37 33 1 2 23
18 24 1 1 21 38 37 1 2 23
19 21 1 1 22 39 15 0 2 29
20 14 1 1 17 40 52 0 2 37
Para este ejemplo, emplearemos los algoritmos del método de regresión de Cox proporcionados en el
software SPSS. Todas las referencias a tablas y figuras en las explicaciones a continuación se refieren a la
Figura 14.5.1, que muestra la salida seleccionada de SPSS para este ejemplo.
1. Prueba general.SPSS proporciona una prueba general de significancia muy similar a la reportada
para la regresión logística que se analiza en el Capítulo 11. En esta prueba, la probabilidad se
usa para comparar un modelo sin parámetros (el modelo nulo) y un modelo con las variables
de interés incluidas. Si hay una diferencia significativa en la función de verosimilitud entre el
modelo con parámetros y el modelo nulo, entonces el modelo de regresión de Cox es
significativo y al menos una de las variables de interés está significativamente relacionada con
la variable de resultado. Un examen de la salida muestra que la prueba ómnibus para los
coeficientes del modelo con la edad y la droga ingresada en el modelo es significativamente
diferente del modelo nulo, conp<.001.
2. Variables en el modelo.A continuación, SPSS proporciona una tabla para cada una de las variables
ingresadas en el modelo. Al igual que un modelo de regresión estándar, se proporcionan el
parámetro del modelo, su error estándar y una prueba de significancia para probar el valor nulo, Ho:b
¼0. Para estos datos, el tipo de fármaco predijo significativamente el tiempo hasta la recaída (p<.001),
pero la edad no (pag¼ .792).
4. Coeficientes de riesgo.Los cocientes de riesgo se proporcionan para cada variable en el modelo. Al igual que en la
regresión logística donde calculamos las razones de probabilidad, las razones de riesgo se encuentran mediante
14.5 REGRESIÓN DE COX: EL MODELO DE RIESGOS PROPORCIONALES 771
Total (puntuación)
– 2 registro Chi-
Probabilidad cuadrado d.f. Sig.
167.407 25.558 2 . 000
Variables en la ecuación
droga
1.0
Opiáceo
Otro
0.8
Supervivencia acumulada
0.6
0.4
0.2
0.0
FIGURA 14.5.1 Resultado del análisis de supervivencia de la regresión de Cox del software SPSS para
el ejemplo 14.5.1.
calculando exp(b).Al examinar la variable droga, donde los opiáceos se usaron como variable
indicadora en SPSS, el riesgo de recaída es casi 8,5 veces más probable para los opiáceos en
comparación con otras drogas, controlando la covariable de la edad. Aunque podemos calcular
el cociente de riesgos instantáneos para la edad de la misma manera que para el fármaco,
suele ser útil para las covariables cuantitativas considerar el cálculo de la función 100(exp(b)1),
que proporciona una estimación del cambio porcentual en el riesgo cuando la covariable
aumenta en una unidad. En el presente ejemplo para la edad, esto conduce a
772 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA
100(.991 1)¼ .9. Por lo tanto, por cada aumento de 1 año en la edad, el riesgo de recaída
disminuye en un promedio de alrededor del 0,9 por ciento.
5. Conclusión.Con base en los resultados de esta muestra limitada, hemos aprendido que la edad del
paciente, aunque no es estadísticamente significativa, sugiere que, en general, la edad puede ser algo
protectora en el sentido de que el riesgo de recaída disminuye con la edad. También hemos
aprendido que aquellos que experimentan adicción a los opiáceos son propensos a recaer mucho
antes en su tratamiento. Los resultados de este estudio preliminar pueden usarse para desarrollar
estudios adicionales para determinar si los programas de tratamiento diferentes, y quizás más
intensivos, son más exitosos para dirigirse a aquellos que experimentan adicción a los opiáceos en
comparación con otras drogas. &
Claramente, la regresión de Cox puede volverse muy compleja a medida que aumenta el
número de variables. Al igual que con los modelos de regresión estándar analizados en los primeros
capítulos, se puede optar por utilizar procedimientos de selección (hacia adelante, hacia atrás o por
pasos) o examinar las interacciones entre las variables de los modelos. Además, se pueden tener
covariables dependientes del tiempo en las que el valor de la covariable puede cambiar en cada
momento de medición. Ejemplos de esto pueden ser el matrimonio o el diagnóstico de una condición
de salud. Estas covariables contrastan con las covariables constantes en el tiempo, que no cambian (p.
ej., género). En resumen, la regresión de Cox es una técnica muy útil para modelar datos de
supervivencia. Para aquellos interesados en leer más, se recomiendan los textos de Kleinbaum y
Klein (1), Lee (2), Hosmer y Lemeshow (3) y Allison (4).
EJERCICIOS
14.5.1En un estudio que examinó el tiempo de aparición del cáncer después de la exposición a la luz ultravioleta en ratas, se utilizó la edad
(meses) como covariable en un modelo de regresión de Cox. En el modelo, la estimación del parámetro para el peso fue de .19
y tuvo unpag-valor de .021. Proporcione una interpretación de la estimación de este parámetro en términos de la razón de
riesgo.
14.5.2En el estudio descrito en el Ejercicio 14.5.1, los investigadores también estaban interesados en saber si había una diferencia entre el
género en el tiempo que tardaba en desarrollarse el cáncer. Para el género, la estimación del parámetro fue de .77 y tuvo un
pag-valor de 0.014. Proporcione una interpretación de la estimación de este parámetro en términos de la razón de riesgo.
14.5.3La intención de un estudio de Weaver et al. (A-4) fue evaluar si las metástasis ocultas en los ganglios linfáticos son
indicadores importantes de la recurrencia de la enfermedad o la supervivencia en pacientes con cáncer de mama. Los datos a continuación
proporcionan algunos de los resultados pertinentes de un modelo de regresión de Cox para estos datos.
Edad (50þvs. <50) Tamaño del tumor 1.69 (1.24, 2.31) . 001
(>2 cm vs. Quimioterapia vs. 2cm)
no 1.32 (.98, 1.76) . 060
quimioterapia Radiación vs. no . 88 (.68, 1.13) . 31
radiación 0.54 (.40, .73) . 001
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 14 773
14.6 RESUMEN
En este capítulo se proporcionó una introducción a los datos de tiempo hasta el evento. En particular, se
introdujo el concepto de censura de datos, en el que no se conocen los tiempos exactos de los sujetos. Se
discutieron las distribuciones útiles en el análisis de supervivencia, incluyendo la función de distribución
acumulada, la función de supervivencia y la función de riesgo. Se discutió el cálculo de las curvas básicas de
supervivencia mediante el procedimiento de Kaplan-Meier, así como los métodos para comparar las curvas
de supervivencia mediante métodos no paramétricos. Se proporcionaron conceptos de regresión utilizando
la regresión de Cox y se proporcionó un análisis detallado de ejemplos. La relación de varios métodos
cubiertos en este capítulo se vinculó a los conceptos aprendidos anteriormente en el texto, incluida la
regresión lineal, el análisis de datos de frecuencia y las estadísticas no paramétricas.
2.Defina lo siguiente:
(a)Cociente de riesgo
(b)Función de riesgo
(C)Función de distribución de probabilidad
(d)función de supervivencia
(mi)Estimación de Kaplan-Meier
4.¿Cuál es la diferencia entre la censura por la derecha y la censura por la izquierda? Proporcione un ejemplo de cada uno.
5.Analice por qué a menudo es preferible utilizar una prueba no paramétrica para comparar las curvas de supervivencia.
7.Si la función de distribución de probabilidad en el momento 5 es igual a 0,25 y la función de supervivencia en el momento 5 es igual
a 0,15, ¿cuál es la función de riesgo en el momento 5?
8.Si encontramos que una medición en el intervalo de tiempo entre el tiempo 2 y el 10 da como resultado una función de
distribución de probabilidad estimada de 0.03, ¿cuál es el cambio estimado en la función de distribución acumulativa?
10Explique por qué la función de distribución acumulativa y la función de supervivencia son imágenes especulares entre sí.
11El objetivo de un estudio de Lee et al. (A-5) fue mejorar la comprensión del comportamiento biológico de los tumores
estromales epitelioides gástricos. Estudiaron las características clínicas, los hallazgos histológicos y la ploidía del ADN
de una serie de tumores para identificar los factores que podrían distinguir entre las variantes benignas y malignas
de estos tumores y tener relevancia para el pronóstico. Cincuenta y cinco pacientes con tumores
PREGUNTAS DE REPASO Y EJERCICIOS 775
se clasificaron según si sus tumores eran malignos de alto grado (grado 2), malignos de bajo grado
(grado 1) o benignos (grado 0). Entre los datos recopilados se encuentran los siguientes:
1 0 0 87 8 0 0 1616
2 0 0 775 9 0 0 mil novecientos ochenta y dos
3 0 0 881 10 0 0 2035
4 0 0 914 11 0 0 2191
5 0 0 1155 12 0 0 2472
6 0 0 1162 13 0 0 2527
7 0 0 1271 14 0 0 2782
15 0 0 3108 36 0 0 7318
dieciséis 0 0 3158 37 0 0 7447
17 0 0 3609 38 0 0 9525
18 0 0 3772 39 0 0 9938
19 0 0 3799 40 0 0 10429
20 0 0 3819 41 1 1 450
21 0 0 4586 42 1 1 556
22 0 0 4680 43 1 1 2102
23 0 0 4989 44 1 0 2756
24 0 0 5675 45 1 0 3496
25 0 0 5936 46 1 1 3990
26 0 0 5985 47 1 0 5686
27 0 0 6175 48 1 0 6290
28 0 0 6177 49 1 0 8490
29 0 0 6214 50 2 1 106
30 0 0 6225 51 2 1 169
31 0 0 6449 52 2 1 306
32 0 0 6669 53 2 1 348
33 0 0 6685 54 2 1 549
34 0 0 6873 55 2 1 973
35 0 0 6951
12Girard et al. (A-6) realizó un estudio para identificar los factores pronósticos de una mejor supervivencia después de la
resección de metástasis pulmonares (PM) aisladas de cáncer colorrectal. Entre los datos recopilados se encuentran
los siguientes con respecto al número de PM resecados, la supervivencia y el resultado de 77 pacientes que se
sometieron a una resección completa en la primera operación torácica:
1 1 24 Vivo 8 1 15 Muerto
2 1 67 Vivo 9 1 10 Muerto
3 1 42 Vivo 10 1 41 Muerto
5 1 37 Muerto 12 1 27 Muerto
15 1 60 Muerto 47 1 54 Muerto
(Continuado)
776 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA
18 1 55 Vivo 50 1 29 Muerto
19 1 46 Muerto 51 1 14 Muerto
27 1 39 Vivo 59 1 43 Muerto
28 1 15 Muerto 60 1 3 Vivo
29 > 1 30 Muerto 61 > 1 20 Muerto
30 1 35 Vivo 62 1 2 Muerto
41 1 18 Muerto 73 1 92 Vivo
42 1 17 Muerto 74 > 1 15 Muerto
46 1 40 Vivo
13En un estudio de Alicikus et al. (A-7), se examinó el control a largo plazo del cáncer de próstata que recibieron
radioterapia en pacientes después de 10 años. Los autores utilizaron el análisis de regresión de Cox para analizar
estos datos, lo que dio como resultado los datos resumidos en la siguiente tabla. Para estos datos:
(a)Calcule las estimaciones de parámetros para el modelo de regresión de Cox.
(b)Proporcione una explicación de las razones de riesgo (HR) y su significado.
(C)Para la edad, proporcione una medida alternativa para el HR y proporcione su significado en términos del cambio
porcentual en años.
REFERENCIAS
Referencias de metodología
1. DÁVIDOG KLEINBAUMy MITCHELkLEIN,Análisis de supervivencia: un texto de autoaprendizaje,Segunda edición, Springer, Nueva York,
2005.
2. miLISATLEE.UU.,Métodos estadísticos para el análisis de datos de supervivencia,Tercera edición, Wiley, Nueva York, 2003.
3. DÁVIDOWHOSMER, JR. y STANLEYLEMESHOW,Análisis de supervivencia aplicado: modelado de regresión de datos de tiempo hasta el
evento,Wiley, Nueva York, 1999.
4. pagAULD.A.LLISON,Análisis de supervivencia usando SAS®: una guía práctica,Segunda edición, SAS Publishing, Cary, NC,
2010.
5. EL KUN PLANy P. M.EIER, “Estimación no paramétrica a partir de observaciones incompletas,”Revista de la Asociación
Estadounidense de Estadística, 53 (1958), 457–481.
6. norteATANMETROANTEL, "Evaluación de los datos de supervivencia y dos nuevas estadísticas de orden de rango que surgen en su
consideración", Informes de quimioterapia del cáncer, 50 (marzo de 1966), 163–170.
7. mAHEESHKB PArmary DÁVIDOMETROAQUIN,Análisis de supervivencia: un enfoque práctico,Wiley, Nueva York, 1995.
8. DÁVIDOG KLEINBAUM,Análisis de supervivencia: un texto de autoaprendizaje,Springer, Nueva York, 1996.
9. miLISATLEE.UU.,Métodos estadísticos para el análisis de datos de supervivencia,Publicaciones Lifetime Learning, Belmont, CA, 1980.
10. miTORREMETROARUBINIy MARIAGRAMORAZIAVALSECCHI,Análisis de datos de supervivencia de ensayos clínicos y estudios observacionales,
Wiley, Nueva York, 1995.
11. DÁVIDORCBUEY, “Modelos de regresión y tablas de vida” (con discusión),Diario de la Sociedad Real de Estadística, B34 (
1972), 187–220.
Referencias de aplicaciones
1. norteAELMETROARTINI, ANDREWGHUVOS, mICHAELEBURT, ROBERTOTHEELAN, mANJITSBAINS, PAGATRICIAMMCCORMACK,
VALERÍAWRUSCH, mICHAELWEBER, ROBERTOJDPROPIEDADy ROBERTOJGInsberg, "Predicciones de supervivencia en
tumores malignos del esternón",Revista de Cirugía Torácica y Cardiovascular, 111 (1996), 96–106.
2. mASSIMOEDOTTORINI, AGNESIOASSI, mARIASIRONÍ, gABRIELESANGALLI, gIANLUIGISPREÁFICO, y yoUIGÍACOLOMBO,
“Análisis multivariado de pacientes con carcinoma medular de tiroides,”Cáncer, 77 (1996), 1556–1565.
3. mARIOANNBANERJI, RochelleLCHAIKEN, y HAROLDE. L.EBOVITZ, "Remisión normoglucémica a largo plazo en sujetos negros
con NIDDM recién diagnosticados",Diabetes, 45 (1996), 337–341.
4. DONALDL. W.EVER, TAkamaruASHIKAGA, DÁVIDOn kTRAPO, jOANEMKELLY, STEWARTJ. A.NDERSON, SETHPHFLECHA,
THOMASBJULIAN, miIZQUIERDOSPMAMUENAS, y NORMALWOLMARK, "Efecto de las metástasis ocultas en la supervivencia en el cáncer de
mama con ganglios negativos",El Diario de Medicina de Nueva Inglaterra, 364 (2011), 412–421.
5. J.OYSYLEE.UU., ANTONIOG. N.ASCIMENTO, mICHAELBFARNELL, J. A.IDANCARNEY, WILLIAMS. H.ARMSEN, y DUANEMETRO.
ILSTRUP, “Tumores epitelioides del estroma gástrico (leiomioblastomas): un estudio de cincuenta y cinco casos”,Cirugía, 118
(1995), 653–661.
6. P.HILIPPEGRAMOirard, mICHELDUCREUX, PAGIERREBALDEYROU, PAGHILIPPELASER, BARROZGRAMOAYET, PAGIERRERUFFIE -, y DOMINICO
GRAMORUNENWALD, “Cirugía de metástasis pulmonares de cáncer colorrectal: análisis de factores pronósticos,”Diario de
Oncología Clínica, 14 (1996), 2047–2053.
7. ZUMREA.ALICIKUS, YOSHIYAYAMADA, ZHIGANGZCOLGAR, XENPAGIE, mARGIEHUNG, mARISAkOLLMEIER, BRETTCBUEY, y
METROICHAELJ.ZELEFSKY, “Resultados a diez años de radioterapia de intensidad modulada y dosis altas para el cáncer de
próstata localizado,”Cáncer, 117 (2010), 1429–1437.
APÉNDICE
TABLAS ESTADÍSTICAS
A-1
A-2 ANEXO TABLAS ESTADÍSTICAS
ANEXO TABLAS ESTADÍSTICAS A-3
A-4 ANEXO TABLAS ESTADÍSTICAS
3GBAPP 12/04/2012 16:43:11 Page 5
A. La Corporación Rand,Un millón de dígitos aleatorios con 1000,000 desviaciones normales,La prensa
libre, Glencoe, IL, 1955.
E. Laboratorios Geigy,Documenta Geigy, Mesas Científicas,Séptima edición, CIBA-Geigy
Limited, Basilea, Suiza, 1970.
FA Hald y SA Sinkbaek, “Tabla de puntos porcentuales de laX2Distribución,"
Skandinavisk Astuartietidskrift,33 (1950), 168–175.
GHO Hartley y ES Pearson,Tablas de biometría para estadísticos,Volumen 1, tercera edición,
Bentley House, Londres, 1970.
HHO Hartley y ES Pearson,Tablas de biometría para estadísticos,Volumen 1, tercera edición,
Bentley House, Londres, 1970.
JES Pearson y HO Hartley,Tablas de biometría para estadísticos,Volumen 1, Tercera Edición,
The Syndics of the Cambridge University Press, 1966. Y R. Latscha, “Tests of
Importancia en una tabla de contingencia 2 - 2: extensión de la tabla de Finney”,biometrika,40
(1953), 74–86.
K. Frank Wilcoxon, SK Katti y Roberta A. Wilcox,Valores críticos y niveles de probabilidad para la prueba de
rango con signo de Wilcoxon,División de Laboratorios Lederle, American Cyanamid Company, Pearl
River, NY, en cooperación con el Departamento de Estadística, Universidad Estatal de Florida,
Tallahassee, Florida, 1963.
LLR Verdooren, "Tablas extendidas de valores críticos para la prueba estadística de Wilcoxon",
biometrika,50 (1963), 177–186. y WJ Conover,Estadística práctica no paramétrica, John
Wiley and Sons, Nueva York, 1971, 384–388.
MLH Miller, "Tabla de puntos porcentuales de las estadísticas de Kolmogorov",Revista de la Asociación
Estadounidense de Estadística,51 (1956), 111–121. y WJ Conover,Estadística práctica no paramétrica,
Tercera edición, John Wiley and Sons, Nueva York, 1999, 547.
NWH Kruskal y WA Wallis, "Uso de rangos en el análisis de varianza de un criterio" Revista de la Asociación
Estadounidense de Estadística,47 (1952), 583–621; fe de erratas,ibídem,48 (1953), 907–911.
OM Friedman, “El uso de rangos para evitar la suposición de normalidad implícita en el análisis de
varianza”,Revista de la Asociación Estadounidense de Estadística,32 (1937), 675–701.
P. Gerald J. Glasser y Robert F. Winter, "Valores críticos del coeficiente de correlación de rangos
para probar la hipótesis de la independencia"biometrika,48 (1961), 444–448.
RESPUESTAS A
EJERCICIOS IMPAR
Capítulo 1
Ejercicios de repaso
7.Situación A
(a)300 hogares (b)todos los hogares en el pequeño pueblo del sur
(C)número de niños en edad escolar niños (d)todo lo que reportó uno o más
presentes (mi)nominal (categorías: 0 niños, 1 niño, etc.)
Situación B
(a)250 pacientes (b)todos los pacientes ingresados en el hospital durante los últimos
año (C)la distancia a la que vive el paciente del hospital (d)250 distancias
(mi)relación
Capitulo 2
2.3.1. (a)
Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia
40 40
30 30
Frecuencia
Frecuencia
20 20
10 10
0 0
0,25 0,75 1,25 1,75 2,25 2,75 0.25 0.75 1.25 1,75 2,25 2.75 3.25
Pindex Pindex
A-107
A-108RESPUESTAS A LOS EJERCICIOS IMPAR
Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia
12 12
10 10
8 8
Frecuencia
Frecuencia
6 6
4 4
2 2
0 0
22,5 27,5 32,5 37,5 42,5 47,5 52,5 17.5 27.5 37.5 47.5 57.5
IMC IMC
2.3.5. (a)
Clase Relativo
Intervalo Frecuencia Frecuencia
0–2 5 0.1111
3–5 dieciséis 0.3556
6–8 13 0.2889
9–11 5 0.1111
12–14 4 0.0889
15-17 2 0.0444
45 1.000
Histograma de Horas
18
dieciséis
14
12
Frecuencia
10
8
6
4
2
0
1 4 7 10 13 dieciséis
Horas
14
12
Frecuencia
10
8
6
4
2
0
–2 1 4 7 10 13 dieciséis 19
Horas
(b)sesgado a la derecha
A-110RESPUESTAS A LOS EJERCICIOS IMPAR
2.3.7. (a)
Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia
Histograma de puntuaciones
50
40
Frecuencia
30
20
10
0
125 155 185 215 245 275 305
Puntuaciones
50
40
Frecuencia
30
20
10
0
95 125 155 185 215 245 275 305 335
Puntuaciones
2.3.9. (a)
1 17 1 1 12 5
2 18 4 2 13 5
4 19 15 4 14 35
9 20 11259 9 15 02445
(6) 21 233447 (4) 16 5678
10 22 2259 12 17 38
6 23 389 10 18 466
3 24 589 7 19 0059
3 20 3
2 21 24
2.3.11. (a)
Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia
50
40
Frecuencia
30
20
10
0
0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 1,05
Relación S/R
50
40
Frecuencia
30
20
10
0
1.15
1.05
1.25
0.15
0.05
0.25
0.35
0,45
0,55
0,65
0.75
0.85
0,95
– 0.05
Relación S/R
46 0 00000000001122233334444555555666666677777778888999
96 1 0011111223444444445568696998
(34) 2
86 3 0011112444445556668999
4
sesenta y cinco 00001122223333444568899
42 5 002334444599
30 6 02236788999
19 7 012289
13 8 0237
9 9 05588
4 10 236
1 11 6
RESPUESTAS A LOS EJERCICIOS IMPAR A-113
Ejercicios de repaso
1 1 8
6 2 11377
12 3 022267
(7) 4 1223388
9 5 158
6 6 02378
1 7
1 8 8
(C)Ver gráfico en la página siguiente (A-113)
(d)67,9%, 96,55%, 100%
A-114RESPUESTAS A LOS EJERCICIOS IMPAR
90
80
70
60
TFG
50
40
30
20
10
1.2
*
1.0 *
*
*
*
0.8
Relación S/R
0.6
0.4
0.2
0.0
RESPUESTAS A LOS EJERCICIOS IMPAR A-115
Histograma de estado
40
30
Frecuencia
20
10
0
60 80 100 120
Estados nutricionales
40
30
Frecuencia
20
10
0
50 75 100 125 150
Estados nutricionales
30 8 000002234444
18 8 56889
13 9 01223
8 9 679
5 10 00
3 10 9
2 11
2 11
2 12 3
1 12
1 13 0
Diagrama de caja de estado
130 *
120 *
110
*
100
90
Estado
80
70
60
50
40 *
Capítulo 3
3.4.1. (a) .6631 (b)marginal (C) .0332 (d)articulación (e) .0493
(F)condicional (g) .3701 (h)regla de suma
3.4.3. (a)drogas masculinas y fraccionadas, .3418 (b)Drogas masculinas o divididas o ambas, .8747
(C)hombre que recibió drogas divididas, .6134 (d)masculino, .6592
3.4.5. .95
3.4.7. .301
3.5.1. (a)Un sujeto que tiene el síntoma (S) y no tiene la enfermedad.
(b)Un sujeto que no tiene S pero tiene la enfermedad. (C) .96
(d) .9848(e) .0595(f) .99996(g) .00628, .999996, .3895, .9996,
. 8753, .9955 (h)el valor predictivo aumenta a medida que la tasa de enfermedad hipotética
aumenta
3.5.3. .9999977
Ejercicios de repaso
3. (a) .2143 (b) .5519 (C) .1536 (d) .4575 (e) .5065
5. (a) .1349 (b) .6111 (C) .3333 (d) .5873 (e) .3571
(f) .6667 (gramo)0 (h) .3269
RESPUESTAS A LOS EJERCICIOS IMPAR A-117
Capítulo 4
4.2.1. (a)
Número de Frecuencia Relativo Acumulativo
Sustancias utilizadas Frecuencia Frecuencia
0 144 . 19 . 19
1 342 . 44 . 63
2 142 . 18 . 81
3 72 . 09 . 90
4 39 . 05 . 95
5 20 . 03 . 98
6 6 . 01 . 99
7 9 . 01 1.00
8 2 . 003 1.003
9 1 . 001 1.004
Total 777 1.004
(b) 0.5
0.4
Frecuencia
0.3
0.2
0.1
0.0
0 1 2 3 4 5 6 7 8 9
Número de sustancias utilizadas
A-118RESPUESTAS A LOS EJERCICIOS IMPAR
1.0
0.9
0.8
0.7
Frecuencia
0.6
0.5
0.4
0.3
0.2
0.1
0 1 2 3 4 5 6 7 8 9
Número de sustancias utilizadas
4.2.3. -X¼1:58,s2¼2:15,s¼1:47
4.3.1. (a) .1484 (b) .8915 (C) .1085 (d) .8080
4.3.3. (a) .2536, (b) .3461 (C) .7330 (d) .9067 (e) .0008
4.3.5.significar¼4:8, variación¼3:264
4.3.7. (a) .5314(b) .3740(C) .0946(d) .9931 (e) .0946
(f) .0069
4.3.9.
Número de Probabilidad,f(x)
éxitos,X
0 3!
d:2Þ3d:8Þ0¼ :008
0!3!
1 3!
d:2Þ2d:8Þ1¼ :096
1!2!
2 3!
d:2Þ1d:8Þ2¼ :384
2!1!
3 3!
d:2Þ0d:8Þ3¼ :512
3!0!
Total 1
Capítulo 5
5.3.1.204, 6.2225
5.3.3. (a) .1841 (b) .7980 (C) .0668
5.3.5. (a) .0020 (b) .1736 (C) .9777 (d) .4041
5.3.7. (a) .9876 (b) .0668 (C) .0668 (d) .6902
5.3.9.
Muestra -
X
6, 8, 10 8.00
6, 8, 12 8.67
6, 8, 14 9.33
6, 10, 12 9.33
6, 10, 14 10.00
6, 12, 14 10.67
8, 10, 12 10.00
8, 10, 14 10.67
8, 12, 14 11.33
10, 12, 14 12.00
metro-X¼10;s-X¼1:333
5.4.1. .3897
5.4.3. .0038
5.4.5. .0139
5.5.1. .1131
5.5.3. .0808
5.5.5. (a) .1539 (b) .3409 (C) .5230
5.6.1. .1056
5.6.3. .7938
A-120RESPUESTAS A LOS EJERCICIOS IMPAR
Ejercicios de repaso
11. .0003
13. .0262
15. .1335
17. .1093
19. .1292
21252
23. .53, .0476
25Al menos aproximadamente normalmente distribuida
27. .9942
29. (a)No (b)Sí (C)No (d)Sí (mi)Sí (F)Sí
Capítulo 6
6.2.1. (a)88, 92 (b)87, 93 (C)86, 94
6.2.3. (a)7.63, 8.87 (b)7,51, 8,99 (C)7.28, 9.22
6.2.5.1603.688, 1891.563; 1576.125, 1919.125; 1521.875, 1973.375
6.3.1. (a)2.1448(b)2.8073(C)1.8946(d)2.0452
6.3.3. (a)1.549, .387 (b)2,64, 4,36; .49, .91 (C)Tasas de difusión de óxido nítrico
se distribuyen normalmente en la población de la que se extrajo la
muestra. (d)más estrecho (mi)más amplio
Ejercicios de repaso
Capítulo 7
7.2.1.RechazarH0porque 2:57 < 2:33,pag¼ :0051 < :01
7.2.3.Fallo para rechazarH0porque :76 < 1:333:pag > :10
7.2.5.si, rechazarH0,z¼5:73 < 1:645:pag < :0001
7.2.7.No, fallar al rechazarH0.t¼1:5 > 1:709: :05 <pag < :10
7.2.9.si, rechazarH0,z¼3:08:pag¼ :0010
7.2.11.z¼4, rechazarH0,pag < :0001
7.2.13.t¼ :1271, falla al rechazarH0.pag > :2
7.2.15.z¼4:18, rechazarH0.pag < :0001
7.2.17.z¼1:67, fallar al rechazarH0.pag¼2d:0475Þ ¼ :095
7.2.19.RechazarH0desdez¼ 4:00:pag < :0001
7.3.1.RechazarH0porque 10:9 < 2:388;pag < :005
7.3.3.RechazarH0porque 9:60 < 2:6591;pag <2d:005Þ
7.3.5.RechazarH0porquez¼3:39 > 1:96:pag¼2d:0003Þ
7.3.7.s2pag¼5421:25;t¼6:66. RechazarH0.pag <2d:005Þ ¼ :010
7.3.9.z¼3:39. RechazarH0.pag¼2d1 :9997Þ ¼ :0006
7.3.11.t¼3:3567. RechazarH0.pag < :01
7.4.1.RechazarH0porque 3:17 > 2:624;pag < :005
7.4.3.RechazarH03:1553 < 1:8125; :005 <pag < :01
7.4.5.RechazarH0desde 4:4580 < 2:4469;pag < :01
7.5.1.RechazarH0desde 1:62 > 1:645:pag¼ :0526
7.5.3.RechazarH0porque 1:77 < 1:645;pag¼ :0384
7.5.5.RechazarH0porquez¼ 2:21;pag¼ :0136
7.6.1.RechazarH0porque 2:86 < 2:58;pag¼ :0042
7.6.3.Fallo para rechazarH0porquez¼1:70 < 1:96;pag¼ :088
7.7.1.no rechazarH0desde 5:142 < 20:723 < 34:267;pag > :01 (prueba bilateral).
7.7.3.X2¼6:75. no rechazarH0.pag > :05 (prueba de dos caras)
7.7.5.X2¼28:8. no rechazarH0.pag > :10
7.7.7.X2¼22:036; :10 >pag > :05
7.8.1.No se puede rechazar porque V:R:¼1:226 < 1:74pag > :10
7.8.3.No, V:R:¼1:83;pag > :10
7.8.5.RechazarH0. V: R:¼4; :02 <pag < :05
7.8.7.V: R:¼2:1417;pag > :10
A-122RESPUESTAS A LOS EJERCICIOS IMPAR
7.9.1.
Alternativa valor del poder
Valor demetro b Función 1b
7.9.3. 1.0
0.8
0.6
Fuerza
0.4
0.2
0.0
515 520 525 530 535 540 545 550
Valores alternativos de mu
1.0
0.8
0.6
Fuerza
0.4
0.2
0.0
4.2 4.4 4.6 4.8 5.0 5.2
Valores alternativos de mu
RESPUESTAS A LOS EJERCICIOS IMPAR A-123
Ejercicios de repaso
47.95,0% IC
d71:9; 26:5Þ
t pagvalor
4:34 0.0001
Prueba demetro¼0 contrametrono¼0
A-124RESPUESTAS A LOS EJERCICIOS IMPAR
Capítulo 8
8.2.1.F = 6,24
pag= .0004
Alfa 0.05
Error Grados de libertad Error 325
Cuadrado medio 1.068347
Valor crítico del rango estudentizado 3.65207
Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
90 - 30 0.1911 - 0.1831 0.5652
90 - 120 0.6346 0.1320 1.1372 ***
90 - 60 0.6386 0.1360 1.1413 ***
30 - 90 - 0.1911 - 0.5652 0.1831
30 - 120 0.4436 - 0.1214 1.0085
30 – 60 0.4476 - 0.1173 1.0125
120 - 90 - 0.6346 - 1.1372 - 0,1320 ***
120 - 30 - 0.4436 - 1.0085 0.1214
120 - 60 0.0040 - 0.6531 0.6611
60 - 90 - 0.6386 - 1.1413 - 0,1320 ***
60 - 30 - 0.4476 - 1.0125 0.1173
60 - 120 - 0.0040 - 0.6611 0.6531
8.2.3.F = 9,36
p = < .0001
Alfa 0.05
Grados de libertad de error 109
RESPUESTAS A LOS EJERCICIOS IMPAR A-125
Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
A-B 455.72 45.73 865.71 ***
A-C 574.54 235.48 913.59 ***
A-D 596.63 287.88 905.39 ***
B-A - 455.72 - 865.71 - 45,73 ***
ANTES DE CRISTO 118.82 - 271.45 509.09
B-D 140.91 - 223.34 505.17
C-A - 574.54 - 913.59 - 235,48 ***
C-B - 118.82 - 509.0 271.45
CD 22.10 - 259.95 304.14
D-A - 596.63 - 905.39 - 287,88 ***
D-B - 140.91 - 505.17 223.34
D-C - 22.10 - 304.14 259.95
8.2.5.F = 9,26
pag= .0009
Alfa 0.05
Error Grados de libertad Error 26
Cuadrado medio 637.384
Valor crítico del rango estudentizado 3.51417
Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
Y - MA 18.16 - 10.67 46.98
S.M 48.13 20.07 76,19 ***
PUEDE - 18.16 - 46,98 10.67
MA - E 29.97 1.15 58,80 ***
E-Y - 48.13 - 76.19 - 20.07 ***
E-MA - 29,97 - 58,80 - 1,15 ***
8.2.7.F = 4,94
pag= .0026
Alfa 0.05
Error Grados de libertad Error 174
Cuadrado medio 0.17783
Valor crítico del rango estudentizado 3.66853
A-126RESPUESTAS A LOS EJERCICIOS IMPAR
Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
0-1 0.10165 - 0.13866 0.34196
0-2 0.17817 - 0.2188 0.37822
Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
0-3 0.35447 0.10511 0,60383 ***
1-0 - 0.10165 - 0.34196 0.13866
1-2 0.07652 - 0.17257 0.32561
1-3 0.25281 - 0.03737 0.54300
2-0 - 0.17817 - 0.37822 0.02188
2-1 - 0.07652 - 0.32561 0.17257
2-3 0.17630 - 0.08154 0.43413
3-0 - 0.35447 - 0.60383 - 0,10511 ***
3-1 - 0.25281 - 0.54300 0.03737
3-2 - 0.17630 - 0.43413 0.08154
8.3.1.V: R:¼19:79;pag < :005
8.3.3.V: R:¼30:22;pag < :005
8.3.5.V: R:¼7:37; :025 >pag > :01
8.3.7.Totald:f:¼Bloque 41 (Perros)d:f:¼5 Tratamientos (Tiempos)d:f:¼6, errord:f:¼ 30
13V: R:¼7:04;pag¼ :000. La media de la muestra para los sujetos sanos es significativamente
diferente de las medias de las categorías B, C y D. Ninguna otra diferencia entre las medias
de la muestra es significativa.
15.V: R:¼1:35;pag¼ :274. No rechacesH0.
17Tabaquismo V:R:¼3:16;pag¼ :052, Agotamiento Vital Grupo
V:R:¼6:84;pag¼ :003, Interacción V:R:¼2:91;pag¼ :032
19V: R:¼4:23;pag < :001
21V: R:¼6:320;pag¼ :008
23V: R:¼3:1187;pag¼ :043. La media de la muestra D es significativamente diferente de la media de la
muestra B. Ninguna otra diferencia entre las medias muestrales es significativa.
RESPUESTAS A LOS EJERCICIOS IMPAR A-127
I - 31.19
33.72
Yo - 0,34 - 4,70
64.58 66.41
tercero 6.00 1,45 - 29,41
66.89 68,91 38,05
IV 16.19 11.64 - 19.21 - 21.61
77.08 79,10 48,24 41.99
47.
Análisis de Varianza para respuesta
Fuente DF SS EM F PAG
sujeto 5 25.78 5.16 4,72 0,018
temperatura 2 30.34 15,17 13,87 0,001
Error 10 10.93 1.09
Total 17 67.06
51.
Análisis de Varianza para Fuente
T3 DF SS EM F PAG
sujeto 11 8967 815 2,55 0,030
día 2 12466 6233 19.50 0.000
Error 22 7033 320
Total 35 28467
A-130RESPUESTAS A LOS EJERCICIOS IMPAR
55.
Análisis de varianza para puntajes de respiración
Fuente DF SS EM F PAG
grupo 2 244.17 122.08 14.50 0.000
Error 38 319.88 8.42
Total 40 564.05
IC del 95 % individual para la media basada
en la desviación estándar agrupada
Nivel norte Significar Desvst ----+----------+----------+---------+--
1 13 13.231 1.739 (------*----- )
2 14 13.786 2.833 (-----*-----)
3 14 18.643 3.713 (------*-----)
----+----------+----------+----------+--
Desv. estándar agrupada = 2.901 12.5 15.0 17.5 20.0
Comparaciones por pares de Tukey
59.
Análisis de Varianza por Edad
Fuente DF SS EM F PAG
Grupo 2 16323.2 8161.6 139.79 0.000
Error 189 11034.7 58.4
Total 191 27357.9
Hija Marido
Marido - 25.959
- 19.170
I Yo
Yo - 94,1
42.8
tercero - 136,2 - 112,9
- 17.4 10.5
63.
Análisis de varianza para fuente de
hematocrito DF SS EM F PAG
Grupo 2 817.5 408.8 20.26 0.000
Error 27 544.8 20.2
Total 29 1362.3
IC del 95 % individual para la media basada
en la desviación estándar agrupada
Nivel norte Significar Desvst --+----------+----------+----------+----
Impostor 10 38.200 2.573 (----*----) 15 40.200
tratado 5.348 (---*---)
Sin tratar 5 53.200 4.604 (------*------)
--+----------+----------+----------+----
Desv. estándar agrupada = 4.492 36.042.048.054.0
Comparaciones por pares de Tukey
sesenta y cinco.Ambos¼rhIGF-IþrhGH
rhGH - 1.5354
2.0754
Capítulo 9
9.3.1. (a)Directo, (b)Directo, (C)Inverso
9.3.3. ŷ¼560þ0:140X
9.3.5. ŷ¼68:6 19:5X
9.3.7. ŷ¼0:193þ0:00628X
9.4.1Vaticinador coef SE Coef T PAG
Constante 559.90 29.13 19.22 0.000
metanfetamina dos 0.13989 0.06033 2.32 0.035
Análisis de variación
Fuente DF SS EM F PAG
Regresión 1 25063 25063 5,38 0,035
error residual 15 69923 4662
Total dieciséis 94986
Análisis de variación
Fuente DF SS EM F PAG
Regresión 1 7098.4 7098.4 19,93 0,004
error residual 6 2137.4 356.2
Total 7 9235.9
Análisis de variación
Fuente DF SS EM F PAG
Regresión 1 0.29509 0.29509 35.18 0.000
error residual 25 0.20972 0.00839
Total 26 0.50481
Intervalo de confianza para b̂10.0041, 0.0085
A-136RESPUESTAS A LOS EJERCICIOS IMPAR
Ejercicios de repaso
Análisis de variación
Fuente DF SS EM F PAG
Regresión 1 523.41 523.41 10.44 0.005
error residual 17 852.38 50.14
Total 18 1375.79
Análisis de variación
Fuente DF SS EM F PAG
Regresión 1 1.6418 1.6418 28.29 0.000
error residual 13 0.7545 0.0580
Total 14 2.3963
23. ŷ¼61:8819þ :509687X;V: R:¼4:285; :10 >pag > :05;t¼2:07; IC del 95% para pag : :
03, 0,79; 110.3022; 87.7773, 132.8271
RESPUESTAS A LOS EJERCICIOS IMPAR A-137
25. ŷ¼37:4564þ :0798X;V: R:¼77:13;pag < :005;t¼8:78; IC del 95% parar: .91, 1;
40.63, 42.27.
29La ecuación de regresión es A =
570 + 0.429 B
La ecuación de regresión es C6 =
4.2 + 0.106 C7
preeclampsia
La ecuación de regresión es C6 =
57.9 - 0.363 C7
RESPUESTAS A LOS EJERCICIOS IMPAR A-139
La ecuación de regresión es C8 =
54.4 - 0.540 C9
43.WL, VO2
La ecuación de regresión es WL =
0,01 + 0,262 VO2
WL, en
La ecuación de regresión es WL =
0.75 + 0.367 AT
WL, ET
La ecuación de regresión es WL =
0.74 + 0.00637 ET
Capítulo 10
10.3.1. ŷ¼31:4þ0:473X1þ1:07X2
10.3.3. ŷ¼13:45þ4:02X1þ281X2
10.3.5. ŷ¼422:00þ11:17X1 :63X2
RESPUESTAS A LOS EJERCICIOS IMPAR A-141
10.4.1.
Análisis de variación
Estimaciones de parámetros
Parámetro Estándar
Variable DF Estimar Error Valor t Pr > |t| 95% de confianza Límites
10.4.3.
Análisis de variación
Fuente DF La suma de Significar
Cuadrícula Cuadrado valor F PR > F
Modelo 2 452.56375 226.28188 7.05 0.0210
Error 7 224.70025 32.10004
Total corregido 9 677.26400
MSE raíz 5.66569 R Plaza 0.6682
Media dependiente 57.16000 Cuadrado R adj. 0.5734
Coef Var 9.91198
Estimaciones de parámetros
Parámetro Estándar
Variable DF Estimar Error Valor t Pr > |t| 95% de confianza Límites
Interceptar 1 13.44923 13.23156 1.02 0.3433 - 17.83843 44.73689
X1 1 4.01680 1.07136 3.75 0.0072 1.48344 6.55016
X2 1 2.81175 1.37859 2.04 0.0808 - 0.44809 6.07160
10.4.5.
Análisis de variación
Fuente DF La suma de Significar
Cuadrícula Cuadrado valor F PR > F
Modelo 2 17018 8508.89242 4.89 0.0175
Error 22 38282 1740.10069
Total corregido 24 55300
MSE raíz 41.71451 R Plaza 0.3077
Media dependiente 537.00000 Cuadrado R adj. 0.2448
Coef Var 7.76807
Estimaciones de parámetros
Parámetro Estándar
Variable DF Estimar Error Valor t Pr > |t| 95% de confianza Límites
Interceptar 1 - 421.99671 339.76199 - 1.24 0.2273 - 1126.61995 282.62653
X1 1 11.16613 3.65523 3.05 0.0058 3.58564 18.74663
X2 1 - 0.63032 0.93826 - 0,67 0.5087 - 2.57615 1.31552
Co-culto 0.360
Rectificación de ADN 0.532 0.303
ARN-Rect 0.202 0.674 0.430
Ejercicios de repaso
(C)
Fuente SS d.f. EM realidad virtual pag
Regresión 1827.004659 2 913.50 69.048 <.005
Residual 158.728641 12 13.23
1985.7333 14
36648.40 14
(C)t1¼4:40;t2¼ :78;t3¼3:53;t4¼2:59
(d)R2 y:1234¼ :842423;Ry:1234¼ :91784
13. (a)correlación
(b)registro de los niveles de adiponectina en plasma
15. (a)correlación
(b)presión inspiratoria estática en la boca
(C)volumen espiratorio forzado, flujo espiratorio máximo y flujo inspiratorio máximo
(d)ambas correlaciones no fueron significativas
(mi)niños y niñas de 7 a 14 años
17
X1 1
X2 . 737( ) 1
X3 . 109 . 244 1
X4 . 760( ) . 698( ) . 316 1
X5 . 556( ) . 608( ) . 273 . 760( ) 1
X6 . 040 . 213 . 136 . 101 . 647( ) 1
X7 . 291 . 289 . 093 . 293 . 412( ) . 231 1
X8 . 570( ) . 659( ) . 227 . 568( ) . 763( ) . 481( ) . 555( ) 1
X9 . 555( ) . 566( ) . 146 . 454( ) . 717( ) . 503( ) . 650( ) . 922( ) 1
X10 . 345 . 508( ) . 419( ) . 455( ) . 640( ) . 377 . 480( ) . 905( ) . 788( ) 1
X11 . 467( ) . 400( ) . 224 . 621( ) . 702( ) . 388( ) . 732( ) . 652( ) . 646( ) . 582( ) 1
X12 . 250 . 260 . 178 . 228 . 448( ) . 390( ) . 778( ) . 641( ) . 717( ) . 667( ) . 796( ) 1
X13 . 271 . 305 . 380 . 346 . 518( ) . 348 . 524( ) . 645( ) . 707( ) . 729( ) . 744( ) . 864( ) 1
19
v1 v2 v3 v4 v5 v6 v7 v8
v1 1
v2 . 123 1
v3 . 115 . 963( ) 1
v4 . 417( ) . 063 . 041 1
v5 . 005 . 102 . 103 . 059 1
v6 . 001 . 270( ) . 295( ) . 036 . 137 1
v7 . 113 . 074 . 076 . 052 . 134 . 061 1
v8 . 077 . 002 . 023 . 146 . 165 . 202 . 032 1
Capítulo 11
11.2.1.movilizador: 0 G-CSF, 1-etopósido
La ecuación de regresión es
conc = 12,9 - 0,0757 edad - 5,48 movilizador
Análisis de variación
Fuente DF SS EM F PAG
Regresión 2 240.02 120.01 7,63 0,002
error residual 41 644.60 15.72
Total 43 884.62
11.2.3.
Análisis de variación
Fuente DF SS EM F PAG
Regresión 2 850164 425082 60.10 0.000
error residual 14 99018 7073
Total dieciséis 949182
11.3.1.
Paso 1 2 3
Constante 51.93 116.07 115.54
MEM 0,66 0,60 0.57
Valor T 5.75 5.87 5.53
Valor P 0.000 0.000 0.000
SOCIALSU - 0.476 - 0.492
Valor T - 5.28 - 5.51
Valor P 0.000 0.000
CGDUR 0.122
Valor T 1.88
Valor P 0.064
S 17.4 15.4 15.2
cuadrados R 25.20 41.92 43.97
R-Cuadrado(adj) 24.44 40.72 42.22
11.3.3.
11.4.1.
Estándar Wald
Parámetro DF Estimar Error chi-cuadrado Pr > ChiSq
Interceptar 1 2.1192 0.1740 148.3439 <.0001
sexo 1 0.0764 0.2159 0.1252 0.7234
Estimaciones de la razón de probabilidades
Ejercicios de repaso
15. ŷ¼1:87þ6:3772X1þ1:9251X2
R2¼ :942
- -
1 siA 1 siB
X2¼ X3 ¼
0 si no 0 si no
La ecuación de regresión es
V = 11,7 + 0,137 W - 11,4 DUMMY1 -11,7 DUMMY2 + 0,226 INTER1 + 0,223
INTER2
Análisis de variación
Fuente DF SS EM F PAG
Regresión 5 2304.47 460.89 153.58 0.000
error residual 41 123.04 3.00
Total 46 2427.51
Fuente DF SS de secuencia
W 1 2265.07
maniquí1 1 5.59
maniquí2 1 0.00
INTER1 1 0,60
INTER2 1 33.20
A-148RESPUESTAS A LOS EJERCICIOS IMPAR
Observaciones inusuales
Capítulo 12
12.3.1.X2¼2:072;pag > :05
12.3.3.X2¼3:417;pag > :10
12.3.5.X2¼2:21;pag > :10
12.4.1.X2¼ :078;pag > :10
12.4.3.X2¼816:410;pag < :005
12.4.5.X2¼42:579;pag < :005
12.5.1.X2¼3:622;d:f:¼3;pag > :10
12.5.3.X2¼ :297;d:f:¼1;pag > :10
12.5.5.X2¼82:373;d:f:¼2;pag < :005
12.6.1.Desdeb¼7 > 3dparaA¼10;B¼10;a¼8Þ;pag >2d:035Þ ¼ :070. No rechaces H0.
Ejercicios de repaso
Dolor
X2¼0:444
d: f:¼2;pag¼0:801
2 celdas con recuentos esperados inferiores a
5,0 Náuseas y vómitos
X2¼0:483
d: f:¼2;pag¼0:785
Capítulo 13
13.3.1.PAG¼ :3036,pag¼ :6072
13.3.3.PAGdX 2j13; :5Þ ¼ :0112. Desde :0112 < :05, rechazarH0:pag¼ :0112
13.4.1.Tþ¼48:5. :1613 <pag < :174
13.4.3.T¼11:5, :1054 <pag < :1308
13.5.1.X2¼16:13,pag < :005.
13.6.1.T¼712:5,pag¼ :2380, Error al rechazarH0.
13.6.3.S¼1772: 5,pag¼ :7566, Error al rechazarH0.
13.7.1.D¼ :3241,pag < :01
13.7.3.D¼ :1319,pag > :20
13.8.1.H¼11:38,pag¼ :003¼3.
13.8.3.H¼18:13,pag < :0001,d:f:¼2.
13.8.5.H¼19:61 (ajustado por empates),pag < :005
13.9.1.X2r¼8:67,pag¼ :01
13.9.3.X2r¼29:38,pag < :005
13.10.1.rs¼0:07,pag > :20
13.10.3.rs¼ :018,norte¼20,pag > :05
13.10.5.rs¼ :43,norte¼30, :01 <pag < :02
13.11.1. b1¼1:429
-
b0 ¼ 176:685
- 1;M
b0 2;M ¼ 176:63
A-150RESPUESTAS A LOS EJERCICIOS IMPAR
Ejercicios de repaso
7.T¼0,norte¼7,pag¼ :0078
9.X2r¼16:2,pag < :005
11D¼ :1587,pag > :20
13rs¼ :09,pag¼ :4532
15.T¼29:5,pag¼0:0263, RechazarH0
17H¼9:02, d: f:¼3,pag¼0:029
H¼9:30, d: f:¼3,pag¼0:026 (ajustado por empates)
19rs¼ :036,pag¼ :802
21T¼62:5,pag¼ :0072, RechazarH0
23USO:X2 r¼3:94,pag¼ :140
OSB:X2r¼4:77,pag¼ :093
25T¼89,pag¼ :0046, RechazarH0
27PFK: T¼38,pag¼ :8598, Error al rechazarH0
Hong Kong: T¼61:5,pag¼ :0703, Error al rechazarH0
LDH: T¼37,pag¼ :7911, Error al rechazarH0
29rs¼ :733,pag¼ :001
capitulo 14
14.3.1
Número de casos: 53 Censurado :34 (64.1 5%) Eventos: 19
percentiles
25.00 50.00 75.00
Valor 18.00 16.00 4.00
Error estándar 1,80 3,76
14.4.3Grupo de apoyo:
Número de casos: 22 Censurado: 0 ( .00%) Eventos: 22
Tiempo de supervivencia Error estándar Intervalo de confianza del 95 %
Significar: 45.09 3.98 ( 37.29, 52.89 )
Mediana: 60.00 . 00 (.,.)
percentiles
25.00 50.00 75.00
Valor 60.00 60.00 26.00
Error estándar . . 6.96
RESPUESTAS A LOS EJERCICIOS IMPAR A-151
percentiles
25.00 50.00 75.00
Valor 22.00 15.00 7.00
Error estándar 3,44 5,29 . 92
14.5.1La variable "peso" fue significativa en este modelo cuando se usó para predecir el tiempo de aparición del
cáncer después de la exposición a la luz ultravioleta. 100dmi:19 1¼20:9%; por lo tanto, por cada
unidad de aumento de peso, el riesgo de tiempo hasta la aparición del cáncer aumenta en un 20,9
%.
14.5.3 (a) Edad:b¼end1:69Þ ¼ :525; Tamaño del tumor:b¼end1:32Þ ¼ :278;
Quimioterapia: b¼end:88Þ ¼ :128; Radiación:b¼end:54Þ ¼ :616.
(b) El riesgo de metástasis aumenta a 1,69 veces para los 50þ,1,32 veces si el tamaño del
tumor es > 2 cm, 0,88 veces para quienes reciben quimioterapia y 0,54 veces para quienes
reciben radiación. Por lo tanto, la edad avanzada y el tamaño tumoral más grande predicen
un aumento de las metástasis, mientras que la quimioterapia y la radiación protegen contra
las metástasis.
Ejercicios de repaso
7.hdtÞ ¼ :25=:15¼1:67
DsdtÞ
9.03¼ ¼ :24
d10 2Þ
11Análisis de supervivencia para DÍAS
Factor GRADO = 1
Tiempo Estado Acumulativo Estándar Acumulativo Número
Supervivencia Error Eventos Restante
450 1 . 8889 . 1048 1 8
556 1 . 7778 . 1386 2 7
2102 1 . 6667 . 1571 3 6
2756 0 3 5
3496 0 3 4
3990 1 . 5000 . 1863 4 3
5686 0 4 2
6290 0 4 1
8490 0 4 0
A-152RESPUESTAS A LOS EJERCICIOS IMPAR
Factor GRADO = 2
Tiempo Estado Acumulativo Estándar Acumulativo Número
Supervivencia Error Eventos Restante
106 1 . 8333 . 1521 1 5
169 1 . 6667 . 1925 2 4
306 1 . 5000 . 2041 3 3
348 1 . 3333 . 1925 4 2
549 1 . 1667 . 1521 5 1
973 1 . 0000 . 0000 6 0
15.2.3
15.3.1 (a) (10–14): 1,3, (15–19): 59,9, (20–24): 126,7, (25–29): 112,6, (30–34): 83,6,
(35–39): 36,5, (40–más): 2,6; (b)2142.1 (C) (10–14): 6.3, (15–19):
305,9, (20–24): 939,2, (25–29): 1502,3, (30–34): 1920,2, (35–39): 2102,9, (40– más):
2142,1 (d)46.7
15.3.3 (a) (10–14): 1.2, (15–19): 58.5, (20–24): 120.2, (24–29): 113.7, (30–34): 84.2,
(35–39): 33,8, (40–44): 6,0, (45 y más): 0,5; (b)2089.6 (C) (10–14):
6.1, (15–19): 298,5, (20–24): 899,6, (25–29): 1468,1, (30–34): 1889,3, (35–39):
2058,2, (40–44): 2088,1, (45 y más): 2089.6 (d)45.6
15.4.1 (a)tasa de inmadurez: 1997—7.3, 2001—8.1 (b)razón de prevalencia: Nevada—
22,2, Estados Unidos—20,5 (C)tasa de incidencia: 14,5 por 100.000
Ejercicios de repaso
9.8.9
11Mortalidad infantil: Total—5,7; blanco—5,3; no blancos: 6,5; Causa de muerte: enfermedad
cardíaca total: 36,8; blanco 37,7; no blancos 32,3 Cáncer total: 23,7; blanco—23,8; no blancos:
23,1 SIDA total: 1,5; blanco .8; no blancos 4,9 Relación de inmadurez: total: 7,0; blanco—6,7;
no blanca: 7,5 Tasa de incidencia de cesárea: total: 22,6; blanco 25,0; no blanco: 18.3
1315,9, 51,6
ÍNDICE
I-1
I-2 ÍNDICE
GRAMO
k
Pruebas de bondad de ajuste, 604–616 Procedimiento de Kaplan-Meier, 756–761
Datos agrupados, 22–37 Prueba de Kolmogorov-Smirnov, 698–703
ventajas y desventajas, 703 y análisis
H por computadora StatXact, 702 tabla
Histograma, 25–28 para, A-99
Hipótesis, 215 Prueba de Kruskal-Wallis, 704–709
alternativa, 216 mesa para, A-l00–A-101
formular, 14 Curtosis, 48–49
nulo, 216
investigación, 215 L
estadística, 216 Mínimos cuadrados, método, 420 Línea
Pruebas de hipótesis, 215–303 de mínimos cuadrados, 420–422 Prueba
mediante intervalo de confianza, 225–226 de Levene, 201, 270 Parámetros de
diferencia entre medias, 236–249 ubicación, 47 Prueba de rango
poblaciones no normales, 242–243 varianzas logarítmico, 763–765 Regresión logística,
de población conocidas, 236–238 varianzas de 569–581 Pérdida durante el seguimiento,
población desconocidas, 238–243 parabi, 751
regresión múltiple, 504–506 parab1, regresión
lineal simple, 427–432 unilateral, 226–228 METRO
modo, 41 Población, 5
Morbilidad, 15-13 finito, 5
medidas, 15-13 a 15-14 Tasa de infinito, 5
mortalidad: muestreado, 164
bebé, 15-7 objetivo, 164
maternal, 15-6 Poder, 272–279
neonatal, 15-7 Precisión, 14, 168
perinatal, 15-7 Valor predictivo negativo, 80
Multicolinealidad, 542 Valor predictivo positivo, 80
Comparación múltiple, 322–326 Estudio prospectivo, 642
Coeficiente de correlación múltiple, Intervalo de predicción
510–513 regresión múltiple, 508–509
Modelo de correlación múltiple, 510–513 regresión lineal simple, 441–442
Regla de multiplicación, 71–72 Tasa de prevalencia, 15-14
Distribución multivariada, 510 Probabilidad, 65–85
Distribución normal multivariada, 510 posteriores, 68
ÍNDICE I-5
q S
Variables cualitativas, 4, 543–556 muestra, 5
Cuartil, 47–48 conveniencia, 165
no aleatorio, 164–165
R al azar, 164–165
R aleatorio simple, 7–10
y diagramas de caja y bigotes, 51 tamaño para controlar los errores de tipo II,
e intervalo de confianza entre dos medias, 277–279
183 tamaño para estimar medias, 189–191 tamaño
Dígitos aleatorios, tabla, A-2 para estimar proporciones, 191–193 estratificado
uso, 9–10 proporcional al tamaño, 13 estratificado
Diseño de bloques completos al azar, 334–346 aleatorio, 12
tabla ANOVA, 338 estratificado sistemático, 12
suposiciones, 337 sistemático, 11
Rango, 43–44 Distribución muestral, 135–160
Transformación de rango, 672 características, 136
Tasa, 15-2 construcción de, 135
Proporción, 15-2 definición, 135
Escala de razón, 6 de diferencia entre medias muestrales, 145–150
Regresión: poblaciones no normales, 148
logística, 569–581 de diferencia entre las proporciones de la muestra,
múltiple, 489–510 154–156
suposiciones, 491 de la media muestral, 136–145
ecuación, 491–492 poblaciones no normales, 139–141 de
modelo, 490–492 proporción muestral, 150–153
I-6 ÍNDICE
S.A.S.: Estadística, 38
y análisis chi-cuadrado, 623–625 y Inferencia estadística, 7, 162
medidas descriptivas, 47 y Estadística, 2
experimento factorial, 367, 368 y Visualización de tallo y hojas, 28–30
prueba de hipótesis, 233, 244–245 y Regresión paso a paso, 560–569
regresión logística, 572–576 y Rango estudentizado, 324
regresión múltiple, 493, 496 y ANOVA tabla de, A-52–A-54
unidireccional, 322 Distribución de estudiantes, 172–177
y medidas repetidas ANOVA, 350–351 y mesa de, A-40
regresión lineal simple y correlación, regla de Sturges, 22
442–443, 450–451 Análisis de supervivencia, 750–776
y prueba HSD de Tukey, 326 y ANOVA tiempos de supervivencia censurados, 752