Está en la página 1de 958

Traducido del inglés al español - www.onlinedoctranslator.

com
DÉCIMA EDICIÓN

BIOSTATÍSTICA
Una base para el análisis en
ciencias de la salud
DÉCIMA EDICIÓN

BIOSTATÍSTICA
Una base para el análisis en
ciencias de la salud

WAYNE W. DANIEL, PH.D.


Profesor Emeritus
Universidad Estatal de Georgia

CHAD L. CROSS, PH.D., PSTAT- R

Estadístico
Oficina de Informática y Analítica
Administración de Salud de Veteranos

Facultad de posgrado asociado


Universidad de Nevada, Las Vegas
VP Y EDITOR EJECUTIVO: laurie rosatone
EDITOR DE ADQUISICIONES: Shannon Corliss
REDACTOR DE PROYECTO: Ellen Keohane
GERENTE DE MARKETING: melanie kurkjian
ASISTENTE DE MARKETING: Patricio Flatley
EDITOR DE FOTOS: Sheena Goldstein
DISEÑADOR: Kenji Ngieng
SERVICIOS DE GESTIÓN DE PRODUCCIÓN: thomson digital
GERENTE DE PRODUCCIÓN ASOCIADO: Joyce Poh
EDITOR DE PRODUCCIÓN: Jolene Ling
CRÉDITO DE LA FOTO DE PORTADA: # ktsimage/iStockphoto
Este libro fue ambientado en 10/12pt, Times Roman por Thomson Digital e impreso y encuadernado por Edwards Brothers Malloy. La
portada fue impresa por Edwards Brothers Malloy.

Este libro está impreso en papel libre de ácido. - 1

Fundada en 1807, John Wiley & Sons, Inc. ha sido una valiosa fuente de conocimiento y comprensión durante más de 200 años, ayudando a
personas de todo el mundo a satisfacer sus necesidades y cumplir sus aspiraciones. Nuestra empresa está construida sobre una base de
principios que incluyen la responsabilidad hacia las comunidades a las que servimos y donde vivimos y trabajamos. En 2008, lanzamos una
Iniciativa de Ciudadanía Corporativa, un esfuerzo global para abordar los desafíos ambientales, sociales, económicos y éticos que
enfrentamos en nuestro negocio. Entre los temas que estamos abordando se encuentran el impacto del carbono, las especificaciones y
adquisiciones del papel, la conducta ética dentro de nuestro negocio y entre nuestros proveedores, y el apoyo comunitario y caritativo.
Para obtener más información, por favor visite nuestro sitio web:www.wiley.com/go/ciudadanía.

Copyright # 2013, 2009, 2005, 1999 John Wiley & Sons, Inc. Todos los derechos reservados. Ninguna parte de esta publicación
puede ser reproducida, almacenada en un sistema de recuperación o transmitida de ninguna forma o por ningún medio, ya
sea electrónico, mecánico, fotocopiado, grabado, escaneado o de otro modo, excepto según lo permitido por las Secciones
107 o 108 de la Ley de derechos de autor de los Estados Unidos de 1976. Act, sin el permiso previo por escrito del Editor o la
autorización mediante el pago de la tarifa correspondiente por copia al Copyright Clearance Center, Inc. 222 Rosewood
Drive, Danvers, MA 01923, sitio webwww.copyright.com. Las solicitudes de autorización al editor deben dirigirse al
Departamento de permisos, John Wiley & Sons, Inc., 111 River Street, Hoboken, NJ 07030-5774, (201)748-6011, fax
(201)748-6008, sitio webhttp://www.wiley.com/go/permisos.

Las copias de evaluación se proporcionan a académicos y profesionales calificados solo con fines de revisión, para su uso en
sus cursos durante el próximo año académico. Estas copias tienen licencia y no pueden venderse ni transferirse a terceros. Al
finalizar el período de revisión, devuelva la copia de evaluación a Wiley. Las instrucciones de devolución y una etiqueta de envío
de devolución sin cargo están disponibles enwww.wiley.com/go/returnlabel. Si ha elegido adoptar este libro de texto para su
uso en su curso, acepte este libro como su copia de escritorio de cortesía. Fuera de los Estados Unidos, comuníquese con su
representante de ventas local.

Datos de catalogación en publicación de la Biblioteca del


Congreso Daniel, Wayne W., 1929-
Bioestadística: una base para el análisis en las ciencias de la salud / Wayne W.
Daniel, Chad Lee Cross. — Décima edición.
paginas cm
Incluye índice.
ISBN 978-1-118-30279-8 (tela)
1. Estadísticas médicas. 2. Biometría. I. Cruz, Chad Lee, 1971- II. Título.
RA409.D35 2013
610.72 07—dc23 2012038459

Impreso en los Estados Unidos de América

10 9 8 7 6 5 4 3 2 1
doctor daniel
A mis hijos, Jean, Carolyn y
John, y a la memoria de
su madre, mi esposa, María.

doctor cruz
A mi esposa Pamela
y a mis hijos, Annabella Grace
y Breanna Fe.
PREFACIO

Esta décima edición deBioestadística: una base para el análisis en las ciencias de la saludfue preparado con el
objetivo de atraer a una amplia audiencia. Las ediciones anteriores del libro han sido utilizadas por los
autores y sus colegas en una variedad de contextos. Para los estudiantes universitarios, esta edición debe
proporcionar una introducción a los conceptos estadísticos para estudiantes de biociencias, ciencias de la
salud y para estudiantes de matemáticas que deseen exponerse a conceptos estadísticos aplicados. Al igual
que sus predecesores, esta edición está diseñada para satisfacer las necesidades de los estudiantes
graduados principiantes en diversos campos, como enfermería, ciencias aplicadas y salud pública, que
buscan una base sólida en métodos cuantitativos. Para los profesionales que ya trabajan en el campo de la
salud, esta edición puede servir como una útil referencia de escritorio.
La amplitud de la cobertura provista en este texto, junto con los cientos de ejercicios prácticos,
permite a los instructores una gran flexibilidad en el diseño de cursos en muchos niveles. Con ese fin,
ofrecemos a continuación algunas ideas sobre la cobertura de temas que hemos encontrado útiles en el
entorno del salón de clases.
Al igual que las ediciones anteriores de este libro, esta edición requiere pocos requisitos
matemáticos más allá de una sólida competencia en álgebra universitaria. Hemos mantenido un
énfasis en la comprensión práctica e intuitiva de los principios en lugar de los conceptos abstractos
que subyacen a algunos métodos y que requieren una mayor sofisticación matemática. Con eso en
mente, nos hemos basado en conjuntos de problemas y ejemplos tomados directamente de la
literatura de ciencias de la salud en lugar de ejemplos artificiales. Creemos que esto hace que el texto
sea más interesante para los estudiantes y más práctico para los profesionales de la salud en ejercicio
que consultan el texto en el desempeño de sus funciones laborales.
Para la mayoría de los ejemplos y técnicas estadísticas cubiertas en esta edición,
analizamos el uso de software de computadora para los cálculos. La experiencia ha informado
nuestra decisión de incluir impresiones de ejemplo de una variedad de software estadístico en
esta edición (p. ej., MINITAB, SAS, SPSS y R). Creemos que la inclusión de ejemplos de estos
paquetes particulares, que generalmente son los más utilizados por los profesionales,
proporciona una rica presentación del material y permite al estudiante la oportunidad de
apreciar las diversas tecnologías utilizadas por los estadísticos en ejercicio.

CAMBIOS Y ACTUALIZACIONES A ESTA EDICIÓN

La mayoría de los capítulos incluyen correcciones y aclaraciones que mejoran el material


que se presenta y lo hacen más legible y accesible para la audiencia. Sin embargo, hicimos
varios cambios y mejoras específicas que creemos que son contribuciones valiosas a esta
edición, y agradecemos a los revisores de la edición anterior por sus comentarios y
sugerencias al respecto.

viii
viii PREFACIO

Los cambios específicos a esta edición incluyen texto adicional sobre medidas de dispersión en
el Capítulo 2, texto adicional y ejemplos usando el programa R en el Capítulo 6, una nueva
introducción a los modelos lineales en el Capítulo 8 que une los conceptos de regresión y ANOVA en
los Capítulos 8–11, la adición de ANOVA de medidas repetidas de dos factores en el Capítulo 8, una
discusión de las similitudes de ANOVA y la regresión en el Capítulo 11, y un extenso texto nuevo y
ejemplos sobre cómo probar el ajuste de los modelos de regresión logística en el Capítulo 11.

Lo más importante de esta nueva edición es un nuevo Capítulo 14 sobre Análisis de


Supervivencia. Este nuevo capítulo nació de las solicitudes de los revisores del texto y de la
experiencia de los autores en cuanto al uso creciente de estos métodos en la investigación aplicada.
En este nuevo capítulo, incluimos parte del material que se encuentra en el Capítulo 12 en ediciones
anteriores, y agregamos material extenso y ejemplos. Brindamos cobertura introductoria de censura,
estimaciones de Kaplan-Meier, métodos para comparar curvas de supervivencia y el modelo de
riesgos proporcionales de regresión de Cox. Debido a este nuevo material, decidimos mover el
contenido del capítulo de estadísticas vitales a un nuevo Capítulo 15 y hacerlo disponible en línea (
www.wiley.com/college/daniel).

IDEAS DE COBERTURA DEL CURSO

En la siguiente tabla ofrecemos algunas sugerencias para la cobertura de temas en una variedad de
contextos, con “X"indicando aquellos capítulos que creemos que son más relevantes para una variedad de
cursos para los cuales este texto es apropiado. El texto ha sido diseñado para ser flexible con el fin de
acomodar varios estilos de enseñanza y varias presentaciones del curso. Aunque el texto está diseñado
teniendo en cuenta la presentación progresiva de los conceptos, algunos de los temas pueden omitirse o
cubrirse brevemente para que el enfoque se pueda centrar en los conceptos importantes para los
instructores.

Curso Capítulos

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Curso de pregrado para estudiantes de X X X X X X X X X O O X O O O
ciencias de la salud

Curso de pregrado en X O O O X X X X X X O X X X O
estadística aplicada para
estudiantes de matemáticas

Primer curso de bioestadística para X X X X X X X X X X O X X X O


estudiantes principiantes de posgrado

Curso de bioestadística para estudiantes X O O O O X X X X X X X X X X


graduados en ciencias de la salud que hayan
completado un curso de introducción a la
estadística

X: Cobertura sugerida; O: Cobertura opcional.


PREFACIO ix

SUPLEMENTOS

Manual de soluciones del instructor.Preparado por el Dr. Chad Cross, este manual incluye soluciones a todos
los problemas que se encuentran en el texto. Este manual está disponible solo para los instructores que han
adoptado el texto.

Manual de soluciones del estudiante.Preparado por el Dr. Chad Cross, este manual incluye soluciones para
todos los ejercicios impares. Este manual se puede empaquetar con el texto a un precio con descuento.

Conjuntos de datos.Más de 250 conjuntos de datos están disponibles en línea para acompañar el texto. Estos
conjuntos de datos incluyen los datos presentados en ejemplos, ejercicios, ejercicios de revisión y los grandes
conjuntos de datos que se encuentran en algunos capítulos. Estos están disponibles en formatos SAS, SPSS y Minitab,
así como en formato CSV para importar a otros programas. Los datos están disponibles para su descarga en

www.wiley.com/college/daniel

Quienes no tengan acceso a Internet pueden comunicarse con Wiley directamente en 111 River Street,
Hoboken, NJ 07030-5774; teléfono: 1-877-762-2974.

EXPRESIONES DE GRATITUD

Muchos revisores, estudiantes y docentes han hecho contribuciones a este texto a través de su
cuidadosa revisión, preguntas inquisitivas y discusión profesional de los temas. En particular, nos
gustaría agradecer al Dr. Sheniz Moonie de la Universidad de Nevada, Las Vegas; el Dr. Roy T. Sabo de
la Universidad Virginia Commonwealth; y al Dr. Derek Webb, Universidad Estatal de Bemidji por sus
útiles comentarios sobre la novena edición de este texto.
Hay tres reconocimientos importantes adicionales que se deben hacer a los contribuyentes
importantes del texto. Dr. Juan. P. Holcomb de la Universidad Estatal de Cleveland actualizó muchos
de los ejemplos y ejercicios que se encuentran en el texto. El Dr. Edward Danial de la Universidad
Estatal de Morgan proporcionó una extensa revisión de la precisión de la novena edición del texto, y
sus valiosos comentarios aportaron mucho al libro. La Dra. Jodi BA McKibben, de la Universidad de
Ciencias de la Salud de los Servicios Uniformados, proporcionó una extensa revisión de la precisión de
la edición actual del libro.
Deseamos reconocer la cooperación de Minitab, Inc. por poner a disposición de los
autores durante muchos años y ediciones del libro las últimas versiones de su software.

Agradecemos a los profesores Geoffrey Churchill y Brian Schott de la Universidad Estatal de


Georgia, quienes escribieron programas de computadora para generar algunas de las tablas del
Apéndice, y a la profesora Lillian Lin, quien leyó y comentó sobre el material de regresión logística en
ediciones anteriores del libro. Además, el Dr. James T. Wassell proporcionó útiles
XPREFACIO

asistencia con algunos de los métodos de análisis de supervivencia presentados en ediciones anteriores del
texto.
Agradecemos a los muchos investigadores en el campo de las ciencias de la salud que publican sus
resultados y, por lo tanto, ponen a disposición datos que brindan una práctica valiosa a los estudiantes de
bioestadística.
Wayne W. Daniel
chad l cruz-

-
Los puntos de vista presentados en este libro son los del autor y no representan necesariamente los puntos de vista del Departamento de
Asuntos de Veteranos de EE. UU.
CONTENIDOS BREVES

1INTRODUCCIÓN A LA BIOSTATÍSTICA 1 11ANÁLISIS DE REGRESIÓN: ALGUNOS


TÉCNICAS ADICIONALES 539
2ESTADÍSTICAS DESCRIPTIVAS 19
12LA DISTRIBUCIÓN CHI-CUADRADO
3ALGUNA PROBABILIDAD BÁSICA Y EL ANÁLISIS DE
CONCEPTOS sesenta y cinco FRECUENCIAS 600

4DISTRIBUCIONES DE PROBABILIDAD 92 13NO PARAMÉTRICO Y


ESTADÍSTICAS SIN DISTRIBUCIÓN 670
5ALGUNAS MUESTRA IMPORTANTES
DISTRIBUCIONES 134 14ANÁLISIS DE SUPERVIVENCIA 750

6ESTIMACION 161 15ESTADÍSTICAS VITALES (ONLINE)


7EVALUACIÓN DE LA HIPÓTESIS 214 ANEXO: TABLAS ESTADÍSTICAS A-1

8ANÁLISIS DE VARIACIÓN 304 RESPUESTAS A LOS EJERCICIOS


IMPAR A-107
9REGRESIÓN LINEAL SIMPLE Y
CORRELACIÓN 413 ÍNDICE I-1

10REGRESIÓN MÚLTIPLE Y
CORRELACIÓN 489

xi
CONTENIDO

1INTRODUCCIÓN A LA BIOSTATÍSTICA 1 Preguntas de repaso y 85


ejercicios Referencias 90
1.1 Introducción 2
1.2 Algunos conceptos básicos 2
1.3 Medida y Escalas de medida 5 4DISTRIBUCIONES DE PROBABILIDAD 92
1.4 Muestreo e inferencia estadística 7
1.5 El método científico y el diseño de 4.1 Introducción 93
experimentos 13 4.2 Distribuciones de probabilidad de
1.6 Informática y análisis bioestadístico 15 variables discretas 93
1.7 Resumen 16 4.3 La distribución binomial 99
Preguntas de repaso y ejercicios 17 4.4 La distribución de Poisson 108
Referencias 18 4.5 Distribuciones de probabilidad continua 113
4.6 La distribución normal 116
4.7 Aplicaciones de distribución normal 122
2ESTADÍSTICAS DESCRIPTIVAS 19 4.8 Resumen 128
Preguntas de repaso y 130
2.1 Introducción 20 ejercicios Referencias 133
2.2 La matriz ordenada 20
2.3 Datos agrupados: la distribución de frecuencias 22
2.4 Estadísticas descriptivas: medidas de 5ALGUNAS MUESTRA IMPORTANTES
tendencia central 38 DISTRIBUCIONES 134
2.5 Estadísticas descriptivas: medidas de dispersión 43
2.6 Resumen 55 5.1 Introducción 134
Preguntas de repaso y ejercicios 57 5.2 Distribuciones de muestreo 135
Referencias 63 5.3 Distribución de la Media Muestral 136
5.4 Distribución de la diferencia entre dos
medias muestrales 145
3ALGUNA PROBABILIDAD BÁSICA 5.5 Distribución de la proporción muestral 150
CONCEPTOS 5.6 Distribución de la diferencia entre dos
sesenta y cinco

proporciones muestrales 154


3.1 Introducción 65 5.7 Resumen 157
3.2 Dos visiones de la probabilidad: objetiva Preguntas de repaso y referencias 158
y subjetiva 66 de ejercicios 160
3.3 Propiedades elementales de la probabilidad 68
3.4 Cálculo de la probabilidad de un evento 69
3.5 Teorema de Bayes, pruebas de detección, 6ESTIMACION 161
sensibilidad, especificidad y valor predictivo
78
positivo y negativo 6.1 Introducción 162
3.6 Resumen 84 6.2 Intervalo de confianza para una media poblacional 165

XIII
xiv CONTENIDO

6.3 EltDistribución 171 8ANÁLISIS DE VARIACIÓN 304


6.4 Intervalo de confianza para la diferencia entre dos
medias poblacionales 177 8.1 Introducción 305
6.5 Intervalo de confianza para una 8.2 El diseño completamente aleatorizado 308
proporción poblacional 185 8.3 El diseño de bloques completos al
6.6 Intervalo de confianza para la diferencia azar 334
entre dos poblaciones 8.4 El diseño de medidas repetidas 346
proporciones 187 8.5 El experimento factorial 358
6.7 Determinación del tamaño de la muestra para estimar 8.6 Resumen 373
las medias 189 Preguntas de repaso y ejercicios 376
6.8 Determinación del tamaño de la muestra para estimar Referencias 408
proporciones 191
6.9 Intervalo de confianza para la varianza de
una distribución normalmente 9REGRESIÓN LINEAL SIMPLE Y
Población 193 CORRELACIÓN 413
6.10 Intervalo de confianza para la razón de las
varianzas de dos poblaciones normalmente 9.1 Introducción 414
distribuidas 198 9.2 El modelo de regresión 414
6.11 Resumen 203 9.3 La ecuación de regresión muestral 417
Preguntas de repaso y ejercicios 205 9.4 Evaluación de la ecuación de regresión 427
Referencias 210 9.5 Uso de la ecuación de regresión 441
9.6 El modelo de correlación 445
9.7 El coeficiente de correlación 446
7EVALUACIÓN DE LA HIPÓTESIS 214 9.8 Algunas precauciones 459
9.9 Resumen 460
7.1 Introducción 215
Preguntas de repaso y ejercicios 464
7.2 Prueba de hipótesis: media poblacional
Referencias 486
única 222
7.3 Prueba de hipótesis: la diferencia entre las medias de
236
dos poblaciones
10REGRESIÓN MÚLTIPLE Y
7.4 Comparaciones por pares 249
CORRELACIÓN 489
7.5 Prueba de hipótesis: una sola proporción
poblacional 257 10.1 Introducción 490
7.6 Prueba de hipótesis: la diferencia entre dos 10.2 El modelo de regresión lineal
proporciones de población 261 múltiple 490
7.7 Prueba de hipótesis: una varianza de 10.3 Obtención de la ecuación de
población única 264 regresión múltiple 492
7.8 Prueba de hipótesis: la razón de dos varianzas de 10.4 Evaluación de la ecuación de
población 267 regresión múltiple 501
7.9 El error de tipo II y la potencia de una 10.5 Uso de la ecuación de
prueba 272 regresión múltiple 507
7.10 Determinación del tamaño de la muestra para controlar los errores
10.6 Resumen del modelo de 510
277
de tipo II
10.7 correlación múltiple 523
7.11 Resumen 280 Preguntas de repaso y ejercicios 525
Preguntas de repaso y ejercicios 282 Referencias 537
Referencias 300
CONTENIDO XV

11ANÁLISIS DE REGRESIÓN: ALGUNOS 13.8 El análisis de varianza de una vía de Kruskal-Wallis


TÉCNICAS ADICIONALES 539 por rangos 704
13.9 El análisis bidireccional de varianza de Friedman por
11.1 Introducción 540 rangos 712
11.2 Variables Cualitativas Independientes 543 13.10 Coeficiente de correlación de rangos
11.3 Procedimientos de selección de variables 560 de Spearman 718
11.4 Regresión logística 569 13.11 Análisis de regresión no paramétrico 727
11.5 Resumen 582 13.12 Resumen 730
Preguntas de repaso y ejercicios 583 Preguntas de repaso y 732
Referencias 597 ejercicios Referencias 747

12LA DISTRIBUCIÓN CHI-CUADRADO Y 14ANÁLISIS DE SUPERVIVENCIA 750


EL ANÁLISIS DE FRECUENCIAS600 14.1 Introducción 750
14.2 Censura y datos de tiempo hasta el evento 751
12.1 Introducción 601
14.3 Procedimiento de Kaplan-Meier 756
12.2 Las propiedades matemáticas de la distribución
14.4 Comparación de curvas de supervivencia 763
chi-cuadrada 601
14.5 Regresión de Cox: el modelo de riesgos
12.3 Pruebas de bondad de ajuste 604
proporcionales 768
12.4 Pruebas de Independencia 619
14.6 Resumen 773
12.5 Pruebas de Homogeneidad 630
Preguntas de repaso y 774
12.6 La prueba exacta de Fisher 636
ejercicios Referencias 777
12.7 Riesgo relativo, razón de posibilidades y
estadístico de Mantel-Haenszel 641
12.8 Resumen 655 15ESTADÍSTICAS VITALES (ONLINE)
Preguntas de repaso y ejercicios 657
Referencias 666 www.wiley.com/college/daniel
15.1 Introducción
15.2 Tasas y proporciones de mortalidad

13NO PARAMÉTRICO Y 15.3 Medidas de fertilidad


ESTADÍSTICAS SIN DISTRIBUCIÓN 670 15.4 Medidas de morbilidad
15.5 Resumen
13.1 Introducción 671 Preguntas de repaso y referencias
13.2 Escalas de medición 672 de ejercicios
13.3 La prueba de los signos 673
13.4 La prueba de los rangos con signo de Wilcoxon para ANEXO: TABLAS ESTADÍSTICAS A-1
la ubicación 681
13.5 La prueba de la mediana 686 RESPUESTAS A LOS EJERCICIOS
13.6 La prueba de Mann-Whitney 690 IMPAR A-107
13.7 La prueba de bondad de ajuste de Kolmogorov-
Smirnov 698 ÍNDICE I-1
CAPÍTULO 1
INTRODUCCIÓN A
BIOSTATÍSTICA

RESUMEN DEL CAPÍTULO

El propósito de este capítulo es proporcionar una descripción general de los conceptos estadísticos
básicos que se utilizan en todo el libro de texto. Un curso de estadística requiere que el estudiante
aprenda muchos términos y conceptos nuevos. Este capítulo sienta las bases necesarias para
comprender los términos y conceptos estadísticos básicos y el papel que desempeñan los estadísticos
en la promoción del conocimiento y los descubrimientos científicos.

TEMAS

1.1INTRODUCCIÓN
1.2ALGUNOS CONCEPTOS BÁSICOS

1.3ESCALAS DE MEDIDA Y MEDIDA


1.4MUESTREO E INFERENCIA ESTADÍSTICA
1.5EL MÉTODO CIENTÍFICO Y EL DISEÑO DE EXPERIMENTOS
1.6INFORMÁTICA Y ANÁLISIS BIOSTATÍSTICO
1.7RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. comprender los conceptos básicos y la terminología de la bioestadística, incluidos los
diversos tipos de variables, medidas y escalas de medida.
2. ser capaz de seleccionar una muestra aleatoria simple y otras muestras científicas de una
población de sujetos.
3. comprender los procesos involucrados en el método científico y el diseño de
experimentos.
4. apreciar las ventajas del uso de computadoras en el análisis estadístico de datos
generados por estudios y experimentos realizados por investigadores en ciencias de
la salud.

1
2 CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA

1.1 INTRODUCCIÓN

Con frecuencia se nos recuerda el hecho de que vivimos en la era de la información.


Apropiadamente, entonces, este libro trata sobre la información: cómo se obtiene, cómo se
analiza y cómo se interpreta. La información que nos concierne la llamamos datos, y los datos
están disponibles para nosotros en forma de números.
Los objetivos de este libro son dos: (1) enseñar al estudiante a organizar y resumir datos,
y (2) enseñar al estudiante cómo tomar decisiones sobre una gran cantidad de datos
examinando solo una pequeña parte de ellos. Los conceptos y métodos necesarios para lograr
el primer objetivo se presentan bajo el título deestadísticas descriptivas,y el segundo objetivo se
alcanza mediante el estudio de lo que se denominaEstadística inferencial. En este capítulo se
analiza la estadística descriptiva. Los capítulos 2 a 5 tratan temas que forman la base de la
inferencia estadística, y la mayor parte del resto del libro trata de la estadística inferencial.

Debido a que este volumen está diseñado para personas que se preparan para una carrera en el
campo de la salud o que ya la están siguiendo, el material ilustrativo y los ejercicios reflejan los problemas y
actividades que estas personas probablemente encontrarán en el desempeño de sus funciones.

1.2 ALGUNOS CONCEPTOS BÁSICOS

Como todos los campos del aprendizaje, la estadística tiene su propio vocabulario. Algunas de las palabras y
frases encontradas en el estudio de la estadística serán nuevas para aquellos que no hayan estado expuestos
previamente al tema. Otros términos, aunque parezcan familiares, pueden tener significados especializados
que son diferentes de los significados que estamos acostumbrados a asociar con estos términos. Los
siguientes son algunos términos que usaremos extensamente en este libro.

DatosLa materia prima de las estadísticas esdatos.Para nuestros propósitos, podemos definir
los datos como números.Los dos tipos de números que usamos en estadística son números
que resultan de la toma—en el sentido usual del término—de unamedición,y las que resultan
del proceso decontando.Por ejemplo, cuando una enfermera pesa a un paciente o le toma la
temperatura, se obtiene una medida que consiste en un número como 150 libras o 100 grados
Fahrenheit. Se obtiene un tipo de número bastante diferente cuando el administrador de un
hospital cuenta el número de pacientes (quizás 20) dados de alta del hospital en un día
determinado. Cada uno de los tres números es undato,y los tres tomados juntos son datos.

EstadísticasEl significado deEstadísticasestá implícito en el apartado anterior. Más


concretamente, sin embargo, podemos decir quela estadística es un campo de estudio
relacionado con (1) la recopilación, organización, resumen y análisis de datos; y (2)el dibujo de
inferencias sobre un cuerpo de datos cuando solo se observa una parte de los datos.
La persona que realiza estas actividades estadísticas debe estar preparada parainterpretary
paracomunicarlos resultados a otra persona según lo exija la situación. En pocas palabras, podemos
decir que los datos son números, los números contienen información y el propósito de las estadísticas
es investigar y evaluar la naturaleza y el significado de esta información.
1.2 ALGUNOS CONCEPTOS BÁSICOS 3

Fuentes de datosLa realización de actividades estadísticas está motivada por la necesidad de


responder a una pregunta. Por ejemplo, los médicos pueden querer respuestas a preguntas sobre los
méritos relativos de los procedimientos de tratamiento competitivos. Los administradores pueden
querer respuestas a preguntas relacionadas con áreas de preocupación como la moral de los
empleados o la utilización de las instalaciones. Cuando determinamos que el enfoque apropiado para
buscar una respuesta a una pregunta requerirá el uso de estadísticas, comenzamos a buscar datos
adecuados que sirvan como materia prima para nuestra investigación. Dichos datos suelen estar
disponibles en una o más de las siguientes fuentes:

1. Registros mantenidos de forma rutinaria.Es difícil imaginar cualquier tipo de organización que no mantenga
registros de las transacciones diarias de sus actividades. Los registros médicos de los hospitales, por ejemplo,
contienen inmensas cantidades de información sobre los pacientes, mientras que los registros contables de
los hospitales contienen una gran cantidad de datos sobre las actividades comerciales de las instalaciones.
Cuando surge la necesidad de datos, debemos buscarlos primero entre los registros que se llevan de forma
rutinaria.

2. Encuestas.Si los datos necesarios para responder una pregunta no están disponibles en los registros
que se llevan de forma rutinaria, la fuente lógica puede ser una encuesta. Supongamos, por ejemplo,
que el administrador de una clínica desea obtener información sobre el modo de transporte utilizado
por los pacientes para visitar la clínica. Si los formularios de admisión no contienen una pregunta
sobre el modo de transporte, podemos realizar una encuesta entre los pacientes para obtener esta
información.

3. Experimentos.Con frecuencia, los datos necesarios para responder una pregunta están disponibles solo
como resultado de un experimento. Una enfermera puede desear saber cuál de varias estrategias es
la mejor para maximizar el cumplimiento del paciente. La enfermera podría realizar un experimento
en el que se prueben diferentes estrategias para motivar el cumplimiento con diferentes pacientes. La
evaluación posterior de las respuestas a las diferentes estrategias podría permitir a la enfermera
decidir cuál es la más eficaz.

4. Fuentes externas.Es posible que los datos necesarios para responder una pregunta ya existan en
forma de informes publicados, bancos de datos disponibles comercialmente o literatura de
investigación. En otras palabras, podemos encontrar que alguien más ya ha hecho la misma
pregunta, y la respuesta obtenida puede ser aplicable a nuestra situación actual.

BioestadísticaLas herramientas de la estadística se emplean en muchos campos: negocios,


educación, psicología, agricultura y economía, por mencionar solo algunos. Cuando los datos
analizados se derivan de las ciencias biológicas y la medicina, utilizamos el término
bioestadísticapara distinguir esta aplicación particular de herramientas y conceptos
estadísticos. Esta área de aplicación es la preocupación de este libro.

VariableSi, al observar una característica, encontramos que toma diferentes valores en diferentes
personas, lugares o cosas, llamamos a la característica unavariable.Hacemos esto por la sencilla razón
de que la característica no es la misma cuando se observa en diferentes poseedores de la misma.
Algunos ejemplos de variables incluyen la presión arterial diastólica, la frecuencia cardíaca, la altura
de los hombres adultos, el peso de los niños en edad preescolar y las edades de los pacientes
atendidos en una clínica dental.
4CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA

Variables CuantitativasAVariable cuantitativaes uno que se puede medir en el sentido habitual.


Podemos, por ejemplo, obtener medidas sobre la altura de hombres adultos, el peso de niños en
edad preescolar y las edades de los pacientes atendidos en una clínica dental. Estos son ejemplos de
variables cuantitativas.Las mediciones realizadas sobre variables cuantitativas transmiten información
sobre la cantidad.

Variables CualitativasAlgunas características no se pueden medir en el sentido en que se


miden la altura, el peso y la edad. Muchas características pueden categorizarse únicamente,
como, por ejemplo, cuando a una persona enferma se le da un diagnóstico médico, se designa
a una persona como perteneciente a un grupo étnico, o se dice que una persona, lugar u objeto
posee o no posee algún característica de interés. En tales casos medir consiste en categorizar.
Nos referimos a variables de este tipo comovariables cualitativas.Las mediciones realizadas en
variables cualitativas transmiten información sobre el atributo.

Si bien, en el caso de las variables cualitativas, no se logra la medición en el sentido habitual de


la palabra, podemos contar el número de personas, lugares o cosas pertenecientes a diversas
categorías. Un administrador de hospital, por ejemplo, puede contar el número de pacientes
admitidos durante un día bajo cada uno de los diversos diagnósticos de admisión. Estos conteos, o
frecuenciascomo se les llama, son los números que manipulamos cuando nuestro análisis involucra
variables cualitativas.

Variable aleatoriaCada vez que determinamos la altura, el peso o la edad de un individuo, el


resultado suele denominarsevalorde la variable respectiva. Cuando los valores obtenidos
surgen como resultado de factores aleatorios, de modo que no pueden predecirse con
exactitud de antemano, la variable se denominavariable aleatoria.Un ejemplo de una variable
aleatoria es la altura de un adulto. Cuando nace un niño, no podemos predecir exactamente su
altura en la madurez. La estatura adulta alcanzada es el resultado de numerosos factores
genéticos y ambientales. Los valores resultantes de los procedimientos de medición a menudo
se denominan observacionesomediciones.

Variable aleatoria discretaLas variables se pueden caracterizar más en cuanto a si son


discretoocontinuo.Dado que las definiciones matemáticamente rigurosas de variables
discretas y continuas están más allá del nivel de este libro, ofrecemos, en cambio,
definiciones no rigurosas y damos un ejemplo de cada una.
Una variable discreta se caracteriza por lagunas o interrupciones en los valores que puede
asumir.Estos desfases o interrupciones indican la ausencia de valores entre los valores particulares
que puede asumir la variable. Algunos ejemplos ilustran el punto. El número de admisiones diarias en
un hospital general es una variable aleatoria discreta, ya que el número de admisiones de cada día
debe estar representado por un número entero, como 0, 1, 2 o 3. El número de admisiones en un día
determinado no puede ser un número como 1,5, 2,997 o 3,333. El número de dientes cariados,
faltantes o obturados por niño en una escuela primaria es otro ejemplo de una variable discreta.

Variable aleatoria continuaUna variable aleatoria continua no posee los espacios o


interrupciones característicos de una variable aleatoria discreta.Una variable aleatoria
continua puede asumir cualquier valor dentro de un intervalo relevante especificado
1.3 MEDIDA Y ESCALAS DE MEDIDA 5

de valores asumidos por la variable. Los ejemplos de variables continuas incluyen las diversas
medidas que se pueden realizar en individuos, como la altura, el peso y la circunferencia del
cráneo. No importa qué tan cerca estén las alturas observadas de dos personas, por ejemplo,
podemos, teóricamente, encontrar a otra persona cuya altura se encuentre en algún punto
intermedio.
Sin embargo, debido a las limitaciones de los instrumentos de medición disponibles, las
observaciones sobre variables que son inherentemente continuas se registran como si fueran
discretas. La altura, por ejemplo, generalmente se registra con precisión de un cuarto, media o
pulgada entera, mientras que, con un dispositivo de medición perfecto, dicha medición podría
hacerse tan precisa como se desee.

PoblaciónLa persona promedio piensa en una población como una colección de entidades, generalmente
personas. Sin embargo, una población o colección de entidades puede consistir en animales, máquinas,
lugares o células. Para nuestros propósitos, definimos unpoblación de entidades como la mayor colección de
entidades por las que tenemos interés en un momento determinado.Si tomamos una medida de alguna
variable sobre cada una de las entidades de una población, generamos una población de valores de esa
variable. Podemos, por tanto, definir unpoblación de valores como la colección más grande de valores de una
variable aleatoria por la que tenemos interés en un momento particular.Si, por ejemplo, estamos interesados
en los pesos de todos los niños matriculados en el sistema de escuelas primarias de un determinado
condado, nuestra población se compone de todos estos pesos. Si nuestro interés radica solo en los pesos de
los estudiantes de primer grado en el sistema, tenemos una población diferente: los pesos de los estudiantes
de primer grado matriculados en el sistema escolar. Por lo tanto, las poblaciones están determinadas o
definidas por nuestra esfera de interés. Las poblaciones pueden serfinito oinfinito.Si una población de
valores consiste en un número fijo de estos valores, se dice que la población esfinito.Si, por el contrario, una
población consiste en una sucesión interminable de valores, la población es uninfinitouno.

MuestraUna muestra puede definirse simplemente comouna parte de una población.Supongamos que
nuestra población consiste en los pesos de todos los niños de escuela primaria matriculados en un
determinado sistema escolar del condado. Si recolectamos para el análisis los pesos de solo una fracción de
estos niños, tenemos solo una parte de nuestra población de pesos, es decir, tenemos unamuestra.

1.3 MEDICIÓN Y
ESCALAS DE MEDIDA

En la discusión anterior usamos la palabramediciónvarias veces en su sentido habitual, y


presumiblemente el lector entendió claramente el significado pretendido. La palabramedición,
sin embargo, se le puede dar una definición más científica. De hecho, existe todo un cuerpo de
literatura científica dedicada al tema de la medición. Parte de esta literatura se ocupa también
de la naturaleza de los números que resultan de las mediciones. Las autoridades en el tema de
la medición hablan de escalas de medición que dan como resultado la categorización de las
mediciones según su naturaleza. En esta sección definimos la medida y las cuatro escalas de
medida resultantes. Una discusión más detallada del tema se encuentra en los escritos de
Stevens (1,2).
6CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA

MediciónEsto puede definirse como la asignación de números a objetos o eventos de acuerdo


con un conjunto de reglas. Las diversas escalas de medición resultan del hecho de que la
medición puede llevarse a cabo bajo diferentes conjuntos de reglas.

La Escala NominalLa escala de medida más baja es laescala nominal.Como su nombre lo


indica, consiste en “nombrar” las observaciones o clasificarlas en varias categorías mutuamente
excluyentes y colectivamente exhaustivas. La práctica de utilizar números para distinguir entre
los diversos diagnósticos médicos constituye una medida en una escala nominal. Otros
ejemplos incluyen dicotomías como hombre-mujer, sano-enfermo, menor de 65 años-65 años o
más, niño-adulto y casado-soltero.

La escala ordinalCuando las observaciones no sólo difieren de una categoría a otra, sino que pueden clasificarse de acuerdo con algún criterio, se dice

que se miden en una escala ordinal. Los pacientes convalecientes pueden clasificarse como sin mejoría, mejoría y mucha mejoría. Las personas pueden

clasificarse según su nivel socioeconómico en bajo, medio o alto. La inteligencia de los niños puede estar por encima del promedio, promedio o por

debajo del promedio. En cada uno de estos ejemplos, los miembros de cualquier categoría se consideran todos iguales, pero los miembros de una

categoría se consideran inferiores, peores o más pequeños que los de otra categoría, que a su vez guarda una relación similar con otra categoría. Por

ejemplo, un paciente que ha mejorado mucho tiene mejor salud que uno clasificado como mejorado, mientras que un paciente que ha mejorado está en

mejores condiciones que uno que no ha mejorado. Por lo general, es imposible inferir que la diferencia entre los miembros de una categoría y la

siguiente categoría adyacente es igual a la diferencia entre los miembros de esa categoría y los miembros de la siguiente categoría adyacente. El grado

de mejora entre no mejorado y mejorado probablemente no sea el mismo que entre mejorado y muy mejorado. La implicación es que si se hiciera un

desglose más fino que diera como resultado más categorías, estas también podrían ordenarse de manera similar. La función de los números asignados

a los datos ordinales es ordenar (o clasificar) las observaciones de menor a mayor y, por lo tanto, el término El grado de mejora entre no mejorado y

mejorado probablemente no sea el mismo que entre mejorado y muy mejorado. La implicación es que si se hiciera un desglose más fino que diera como

resultado más categorías, estas también podrían ordenarse de manera similar. La función de los números asignados a los datos ordinales es ordenar (o

clasificar) las observaciones de menor a mayor y, por lo tanto, el término El grado de mejora entre no mejorado y mejorado probablemente no sea el

mismo que entre mejorado y muy mejorado. La implicación es que si se hiciera un desglose más fino que diera como resultado más categorías, estas

también podrían ordenarse de manera similar. La función de los números asignados a los datos ordinales es ordenar (o clasificar) las observaciones de

menor a mayor y, por lo tanto, el términoordinal.

La escala de intervaloElescala de intervaloes una escala más sofisticada que la nominal u


ordinal en el sentido de que con esta escala no solo es posible ordenar medidas, sino que
también se conoce la distancia entre dos medidas cualesquiera. Sabemos, digamos, que la
diferencia entre una medida de 20 y una medida de 30 es igual a la diferencia entre las medidas
de 30 y 40. La capacidad de hacer esto implica el uso de una unidad de distancia y un punto
cero, los cuales son arbitrarios. El punto cero seleccionado no es necesariamente un cero
verdadero, ya que no tiene que indicar una ausencia total de la cantidad que se mide. Quizás el
mejor ejemplo de una escala de intervalo es la forma en que se suele medir la temperatura
(grados Fahrenheit o Celsius). La unidad de medida es el grado, y el punto de comparación es el
“cero grados, ” que no indica falta de calor. La escala de intervalo, a diferencia de las escalas
nominal y ordinal, es una escala verdaderamente cuantitativa.

La escala de razónEl nivel más alto de medición es elescala de proporción.Esta escala se caracteriza
por el hecho de que se puede determinar tanto la igualdad de razones como la igualdad de intervalos.
Fundamental para la escala de razón es un verdadero punto cero. La medición de rasgos tan
familiares como la altura, el peso y la longitud hace uso de la escala de proporción.
1.4 MUESTREO E INFERENCIA ESTADÍSTICA 7

1.4 MUESTREO Y
INFERENCIA ESTADÍSTICA

Como se señaló anteriormente, uno de los propósitos de este libro es enseñar los conceptos de inferencia estadística,
que podemos definir de la siguiente manera:

DEFINICIÓN
La inferencia estadística es el procedimiento mediante el cual llegamos a una
conclusión sobre una población sobre la base de la información contenida en una
muestra que se ha extraído de esa población.

Hay muchos tipos de muestras que se pueden extraer de una población. Sin embargo, no
todos los tipos de muestras pueden usarse como base para hacer inferencias válidas sobre una
población. En general, para poder hacer una inferencia válida sobre una población, necesitamos una
muestra científica de la población. También hay muchos tipos de muestras científicas que se pueden
extraer de una población. El más simple de ellos es elmuestra aleatoria simple.En esta sección
definimos una muestra aleatoria simple y le mostramos cómo extraer una de una población.

Si usamos la letranortepara designar el tamaño de una población finita y la letranortePara designar el


tamaño de una muestra, podemos definir una muestra aleatoria simple de la siguiente manera:

DEFINICIÓN
Si una muestra de tamañonortese extrae de una población de tamañonortede tal manera que
toda muestra posible de tamañonortetiene la misma probabilidad de ser seleccionada, la
muestra se denomina muestra aleatoria simple.

La mecánica de extraer una muestra para satisfacer la definición de una muestra aleatoria
simple se llamamuestreo aleatorio simple.
Demostraremos el procedimiento del muestreo aleatorio simple en breve, pero primero
consideremos el problema de si muestrearcon reemplazoosin reemplazo.Cuando se emplea el muestreo con
reemplazo, todos los miembros de la población están disponibles en cada sorteo. Por ejemplo, suponga que
estamos extrayendo una muestra de una población de antiguos pacientes hospitalizados como parte de un
estudio de duración de la estancia. Supongamos que el muestreo implica seleccionar de los estantes del
departamento de registros médicos una muestra de historias clínicas de pacientes dados de alta. En el
muestreo con reemplazo, procederíamos de la siguiente manera: seleccionar un cuadro para estar en la
muestra, registrar la duración de la estadía y devolver el cuadro al estante. La tabla vuelve a estar en la
“población” y puede volver a dibujarse en algún sorteo posterior, en cuyo caso se registrará nuevamente la
duración de la estadía. En el muestreo sin reemplazo, no devolveríamos un gráfico dibujado al estante
después de registrar la duración de la estadía, sino que lo dejaríamos a un lado hasta que se extraiga toda la
muestra. Siguiendo este procedimiento, un gráfico dado podría aparecer en la muestra solo una vez. Como
regla, en la práctica, el muestreo siempre se realiza sin reemplazo. El significado y las consecuencias de esto
se explicarán más adelante, pero primero veamos cómo se selecciona una muestra aleatoria simple. Para
asegurar la verdadera aleatoriedad de la selección, necesitaremos seguir algún procedimiento objetivo. Sin
duda querremos evitar
8CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA

usar nuestro propio juicio para decidir qué miembros de la población constituyen una muestra
aleatoria. El siguiente ejemplo ilustra un método para seleccionar una muestra aleatoria simple de
una población.

EJEMPLO 1.4.1
Oro et al. (A-1) estudiaron la eficacia para dejar de fumar de bupropion SR, un parche de nicotina, o
ambos, cuando se administran junto con la terapia cognitivo-conductual. Los pacientes consecutivos
que dieron su consentimiento se asignaron a uno de los tres tratamientos. Con fines ilustrativos,
consideremos todos estos sujetos como una población de tamañonorte¼189. Deseamos seleccionar
una muestra aleatoria simple de tamaño 10 de esta población cuyas edades se muestran en la Tabla
1.4.1.

TABLA 1.4.1 Edades de 189 sujetos que participaron en un estudio para dejar de fumar

Núm. de sujeto Edad Núm. de sujeto Edad Núm. de sujeto Edad Núm. de sujeto Edad

1 48 49 38 97 51 145 52
2 35 50 44 98 50 146 53
3 46 51 43 99 50 147 61
4 44 52 47 100 55 148 60
5 43 53 46 101 63 149 53
6 42 54 57 102 50 150 53
7 39 55 52 103 59 151 50
8 44 56 54 104 54 152 53
9 49 57 56 105 60 153 54
10 49 58 53 106 50 154 61
11 44 59 64 107 56 155 61
12 39 60 53 108 68 156 61
13 38 61 58 109 66 157 64
14 49 62 54 110 71 158 53
15 49 63 59 111 82 159 53
dieciséis 53 64 56 112 68 160 54
17 56 sesenta y cinco 62 113 78 161 61
18 57 66 50 114 66 162 60
19 51 67 64 115 70 163 51
20 61 68 53 116 66 164 50
21 53 69 61 117 78 165 53
22 66 70 53 118 69 166 64
23 71 71 62 119 71 167 64
24 75 72 57 120 69 168 53
25 72 73 52 121 78 169 60
26 sesenta y cinco 74 54 122 66 170 54
27 67 75 61 123 68 171 55
28 38 76 59 124 71 172 58
(Continuación)
1.4 MUESTREO E INFERENCIA ESTADÍSTICA 9

Núm. de sujeto Edad Núm. de sujeto Edad Núm. de sujeto Edad Núm. de sujeto Edad

29 37 77 57 125 69 173 62
30 46 78 52 126 77 174 62
31 44 79 54 127 76 175 54
32 44 80 53 128 71 176 53
33 48 81 62 129 43 177 61
34 49 82 52 130 47 178 54
35 30 83 62 131 48 179 51
36 45 84 57 132 37 180 62
37 47 85 59 133 40 181 57
38 45 86 59 134 42 182 50
39 48 87 56 135 38 183 64
40 47 88 57 136 49 184 63
41 47 89 53 137 43 185 sesenta y cinco

42 44 90 59 138 46 186 71
43 48 91 61 139 34 187 71
44 43 92 55 140 46 188 73
45 45 93 61 141 46 189 66
46 40 94 56 142 48
47 48 95 52 143 47
48 49 96 54 144 43
Fuente: Datos proporcionados por cortesía de Paul B. Gold, Ph.D.

Solución: Una forma de seleccionar una muestra aleatoria simple es usar una tabla de números aleatorios como la que se muestra en el Apéndice, Tabla A. Como primer

paso, localizamos un punto de partida aleatorio en la tabla. Esto se puede hacer de varias maneras, una de las cuales es apartar la mirada de la página mientras se

toca con la punta de un lápiz. El punto de inicio aleatorio es el dígito más cercano a donde el lápiz tocó la página. Supongamos que seguir este procedimiento

condujo a un punto de inicio aleatorio en la Tabla A en la intersección de la fila 21 y la columna 28. El dígito en este punto es 5. Dado que tenemos 189 valores para

elegir, solo podemos usar los números aleatorios Del 1 al 189. Será conveniente elegir números de tres dígitos para que los números del 001 al 189 sean los

únicos números elegibles. El primer número de tres dígitos, que comienza en nuestro punto de partida aleatorio, es 532, un número que no podemos usar. El

siguiente número (descendente) es 196, que nuevamente no podemos usar. Bajemos más allá de 196, 372, 654 y 928 hasta llegar a 137, un número que podemos

usar. La edad del sujeto 137 de la Tabla 1.4.1 es 43, el primer valor en nuestra muestra. Registramos el número aleatorio y la edad correspondiente en la Tabla

1.4.2. Registramos el número aleatorio para realizar un seguimiento de los números aleatorios seleccionados. Como queremos muestrear sin reemplazo, no

queremos incluir dos veces la edad del mismo individuo. Proceder de la manera recién descrita nos lleva a los nueve números aleatorios restantes y sus

correspondientes edades que se muestran en la Tabla 1.4.2. Note que cuando llegamos al final de la columna, simplemente nos movemos sobre tres dígitos y 928

hasta llegar al 137, número que podemos utilizar. La edad del sujeto 137 de la Tabla 1.4.1 es 43, el primer valor en nuestra muestra. Registramos el número

aleatorio y la edad correspondiente en la Tabla 1.4.2. Registramos el número aleatorio para realizar un seguimiento de los números aleatorios seleccionados.

Como queremos muestrear sin reemplazo, no queremos incluir dos veces la edad del mismo individuo. Proceder de la manera recién descrita nos lleva a los nueve

números aleatorios restantes y sus correspondientes edades que se muestran en la Tabla 1.4.2. Note que cuando llegamos al final de la columna, simplemente

nos movemos sobre tres dígitos y 928 hasta llegar al 137, número que podemos utilizar. La edad del sujeto 137 de la Tabla 1.4.1 es 43, el primer valor en nuestra

muestra. Registramos el número aleatorio y la edad correspondiente en la Tabla 1.4.2. Registramos el número aleatorio para realizar un seguimiento de los

números aleatorios seleccionados. Como queremos muestrear sin reemplazo, no queremos incluir dos veces la edad del mismo individuo. Proceder de la manera

recién descrita nos lleva a los nueve números aleatorios restantes y sus correspondientes edades que se muestran en la Tabla 1.4.2. Note que cuando llegamos al

final de la columna, simplemente nos movemos sobre tres dígitos Registramos el número aleatorio para realizar un seguimiento de los números aleatorios

seleccionados. Como queremos muestrear sin reemplazo, no queremos incluir dos veces la edad del mismo individuo. Proceder de la manera recién descrita nos lleva a los nueve números aleatorios rest
10 CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA

TABLA 1.4.2 Muestra de 10


edades extraídas de las edades
de la Tabla 1.4.1

Aleatorio Muestra
Número Número de asunto Edad

137 1 43
114 2 66
155 3 61
183 4 64
185 5 sesenta y cinco

028 6 38
085 7 59
181 8 57
018 9 57
164 10 50

al 028 y suba por la columna. Podríamos haber comenzado en la parte superior con el
número 369.
Por lo tanto, hemos extraído una muestra aleatoria simple de tamaño 10 de una
población de tamaño 189. En discusiones futuras, siempre que se use el término
muestra aleatoria simple, se entenderá que la muestra se ha extraído de esta manera
o de una manera equivalente. &

La discusión anterior sobre el muestreo aleatorio se presenta debido al importante papel que
juega el proceso de muestreo en el diseñoEstudios de investigaciónyexperimentosLa metodología y
los conceptos empleados en los procesos de muestreo se describirán con más detalle en la Sección
1.5.

DEFINICIÓN
Un estudio de investigación es un estudio científico de un fenómeno de interés. Los
estudios de investigación implican el diseño de protocolos de muestreo, la recopilación y el
análisis de datos y la obtención de conclusiones válidas basadas en los resultados de los
análisis.

DEFINICIÓN
Los experimentos son un tipo especial de estudio de investigación en el que se realizan
observaciones después de que se hayan llevado a cabo manipulaciones específicas de las
condiciones; proporcionan la base para la investigación científica.

A pesar de la tremenda importancia del muestreo aleatorio en el diseño de estudios de


investigación y experimentos, hay algunas ocasiones en las que el muestreo aleatorio puede no ser el
método más apropiado para usar. En consecuencia, se deben considerar otros métodos de muestreo.
La intención aquí no es proporcionar una revisión exhaustiva de los métodos de muestreo, sino
1.4 MUESTREO E INFERENCIA ESTADÍSTICA 11

en lugar de familiarizar al estudiante con dos métodos de muestreo adicionales que se emplean en las
ciencias de la salud,muestreo sistemáticoymuestreo aleatorio estratificado.Los lectores interesados pueden
consultar los libros de Thompson (3) y Levy y Lemeshow (4) para obtener una descripción general detallada
de varios métodos de muestreo y explicaciones sobre cómo se calculan las estadísticas muestrales cuando
estos métodos se aplican en estudios de investigación y experimentos.

Muestreo SistemáticoUn método de muestreo muy utilizado en la investigación sanitaria es el muestreo


sistemático. Los registros médicos, que contienen datos sin procesar que se utilizan en la investigación de la
atención médica, generalmente se almacenan en un sistema de archivos o en una computadora y, por lo
tanto, son fáciles de seleccionar de manera sistemática. Utilizando la metodología de muestreo sistemático,
un investigador calcula el número total de registros necesarios para el estudio o experimento en cuestión.
Luego se emplea una tabla de números aleatorios para seleccionar un punto de partida en el sistema de
archivos. El registro ubicado en este punto de partida se llama registroX.Se selecciona un segundo número,
determinado por el número de registros deseados, para definir el intervalo de muestreo (llame a este
intervalok). En consecuencia, el conjunto de datos consistiría en registrosx, xþk, xþ2k, xþ3k,y así
sucesivamente, hasta obtener el número necesario de registros.

EJEMPLO 1.4.2
Continuando con el estudio de Gold et al. (A-1) ilustrado en el ejemplo anterior, imagina que
queremos una muestra sistemática de 10 sujetos de los enumerados en la Tabla 1.4.1.

Solución: Para obtener un punto de partida, volveremos a utilizar la Tabla A del Apéndice. Con
fines ilustrativos, supongamos que el punto de partida aleatorio en la Tabla A fue la
intersección de la fila 10 y la columna 30. El dígito es un 4 y servirá como nuestro
punto de partida. punto,X.Dado que comenzamos en el tema 4, quedan 185 temas
restantes (es decir, 189-4) para elegir. Como deseamos seleccionar 10 sujetos, un
método para definir el intervalo de muestra,k,sería tomar 185/10¼18.5. Para
asegurarse de que habrá suficientes sujetos, se acostumbra a redondear este cociente
hacia abajo y, por lo tanto, redondearemos el resultado a 18. La muestra resultante se
muestra en la Tabla 1.4.3.

TABLA 1.4.3 Muestra de 10 edades seleccionadas usando una


muestra sistemática de las edades en la Tabla 1.4.1

Número de sujeto seleccionado sistemáticamente Edad

4 44
22 66
40 47
58 53
76 59
94 56
112 68
130 47
148 60
166 64
&
12 CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA

Muestreo aleatorio estratificadoUna situación común que se puede encontrar en una población
bajo estudio es aquella en la que las unidades de muestra se encuentran juntas en forma agrupada.
En ocasiones, cuando las unidades de muestra no están inherentemente agrupadas, puede ser
posible y deseable agruparlas con fines de muestreo. En otras palabras, puede ser deseable dividir
una población de interés en grupos, oEstratos,en el que las unidades muestrales dentro de un estrato
particular son más similares entre sí que con las unidades muestrales que componen los otros
estratos. Después de estratificar la población, se acostumbra tomar una muestra aleatoria
independientemente de cada estrato. Esta técnica se llamamuestreo aleatorio estratificado.La
muestra resultante se denominamuestra aleatoria estratificada.Aunque los beneficios del muestreo
aleatorio estratificado pueden no ser fácilmente observables, lo más frecuente es que las muestras
aleatorias tomadas dentro de un estrato tengan mucha menos variabilidad que una muestra aleatoria
tomada en todos los estratos. Esto es cierto porque las unidades de muestra dentro de cada estrato
tienden a tener características similares.

EJEMPLO 1.4.3
Los centros hospitalarios de trauma reciben calificaciones según sus capacidades para tratar diversos traumas. En
este sistema, un centro de traumatología de nivel 1 es el nivel más alto de atención traumatológica disponible y un
centro de traumatología de nivel 4 es el nivel más bajo de atención traumatológica disponible. Imagine que estamos
interesados en estimar la tasa de supervivencia de las víctimas de trauma tratadas en hospitales dentro de un área
metropolitana grande. Suponga que el área metropolitana tiene un centro de trauma de nivel 1, nivel 2 y nivel 3.
Deseamos tomar muestras de pacientes de estos centros de trauma de tal manera que el tamaño total de la muestra
sea de 30.

Solución: Suponemos que las tasas de supervivencia de los pacientes pueden


depender de manera significativa del trauma que experimentaron y, por lo
tanto, del nivel de atención que reciben. Como resultado, una muestra
aleatoria simple de todos los pacientes de trauma, sin tener en cuenta el
centro en el que fueron tratados, puede no representar verdaderas tasas de
supervivencia, ya que los pacientes reciben atención diferente en los
distintos centros de trauma. Una forma de estimar mejor la tasa de
supervivencia es tratar cada centro de trauma como un estrato y luego
seleccionar al azar 10 archivos de pacientes de cada uno de los tres centros.
Este procedimiento se basa en el hecho de que sospechamos que las tasas
de supervivencia dentro de los centros de trauma son menos variables que
las tasas de supervivencia en los centros de trauma. Por lo tanto, &

Cabe señalar que con frecuencia se emplean dos ligeras modificaciones de la técnica de
muestreo estratificado. Para ilustrar, considere nuevamente el ejemplo del centro de trauma. En
primer lugar, se podría haber seleccionado una muestra sistemática de expedientes de pacientes de
cada centro de trauma (estrato). Tal muestra se llamamuestra sistemática estratificada.
La segunda modificación del muestreo estratificado implica seleccionar la muestra de un
estrato dado de tal manera que el número de unidades de muestra seleccionadas de ese estrato sea
proporcional al tamaño de la población de ese estrato. Supongamos, en nuestro ejemplo de centro de
trauma, que el centro de trauma de nivel 1 trató a 100 pacientes y los centros de trauma de nivel 2 y 3
trataron solo 10 cada uno. En ese caso, seleccionando una muestra aleatoria de 10 de
1.5 EL MÉTODO CIENTÍFICO Y EL DISEÑO DE EXPERIMENTOS 13

cada centro de trauma sobrerrepresenta a los centros de trauma con cargas de pacientes más pequeñas.
Para evitar este problema, ajustamos el tamaño de la muestra tomada de un estrato para que sea
proporcional al tamaño de la población del estrato. Este tipo de muestreo se llamamuestreo estratificado
proporcional al tamaño.Las muestras dentro del estrato pueden ser aleatorias o sistemáticas, como se
describió anteriormente.

EJERCICIOS

1.4.1Usando la tabla de números aleatorios, seleccione un nuevo punto de partida aleatorio y extraiga otra muestra
aleatoria simple de tamaño 10 de los datos de la Tabla 1.4.1. Registre las edades de los sujetos en esta nueva
muestra. Guarde sus datos para uso futuro. ¿Cuál es la variable de interés en este ejercicio? ¿Qué escala de
medición se utilizó para obtener las medidas?

1.4.2Seleccione otra muestra aleatoria simple de tamaño 10 de la población representada en la Tabla 1.4.1. Compare
los sujetos de esta muestra con los de la muestra extraída en el ejercicio 1.4.1. ¿Hay algún sujeto que
apareció en ambas muestras? ¿Cuántos? Compare las edades de los sujetos en las dos muestras. ¿Cuántas
edades en la primera muestra se duplicaron en la segunda muestra?

1.4.3Usando la tabla de números aleatorios, seleccione una muestra aleatoria y una muestra sistemática, cada una de tamaño 15,
de los datos de la Tabla 1.4.1. Compare visualmente las distribuciones de las dos muestras. ¿Parecen
similares? ¿Cuál parece ser la mejor representación de los datos?

1.4.4Construya un ejemplo en el que sería apropiado utilizar un muestreo estratificado. Discuta cómo usaría el
muestreo aleatorio estratificado y el muestreo estratificado proporcional al tamaño con este ejemplo.
¿Cuál crees que representaría mejor a la población que describiste en tu ejemplo? ¿Por qué?

1.5 EL MÉTODO CIENTÍFICO Y EL DISEÑO


DE EXPERIMENTOS

Los análisis de datos que utilizan una amplia gama de métodos estadísticos juegan un papel importante en
los estudios científicos. La sección anterior destacó la importancia de obtener muestras de manera científica.
Las técnicas de muestreo apropiadas aumentan la probabilidad de que los resultados de los análisis
estadísticos de un conjunto de datos proporcionen resultados válidos y científicamente defendibles. Debido a
la importancia de la recopilación adecuada de datos para respaldar el descubrimiento científico, es necesario
considerar la base de dicho descubrimiento: elmétodo científico-y explorar el papel de las estadísticas en el
contexto de este método.

DEFINICIÓN
El método científico es un proceso mediante el cual se recopila, analiza e
informa información científica para producir resultados imparciales y
reproducibles en un esfuerzo por proporcionar una representación precisa de
los fenómenos observables.

El método científico es reconocido universalmente como la única forma verdaderamente aceptable de


producir una nueva comprensión científica del mundo que nos rodea. Se basa en unenfoque empírico,en que
las decisiones y los resultados se basan en datos. Hay varios elementos clave
14 CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA

asociado al método científico, y los conceptos y técnicas de la estadística juegan un papel


destacado en todos estos elementos.

Hacer una observaciónPrimero, unobservaciónestá hecho de un fenómeno o un grupo de


fenómenos. Esta observación conduce a la formulación de preguntas o incertidumbres que pueden
ser respondidas de manera científicamente rigurosa. Por ejemplo, es fácilmente observable que el
ejercicio regular reduce el peso corporal en muchas personas. También es fácilmente observable que
cambiar la dieta puede tener un efecto similar. En este caso, hay dos fenómenos observables, el
ejercicio regular y el cambio de dieta, que tienen el mismo punto final. La naturaleza de este criterio
de valoración puede determinarse mediante el uso del método científico.

Formulando una HipótesisEn el segundo paso del método científico, un hipótesisestá


formulado para explicar la observación y para hacer cuantitativapredicciones de nuevas
observaciones. A menudo, las hipótesis se generan como resultado de una extensa
investigación de antecedentes y revisiones de la literatura. El objetivo es producir
hipótesis que sean científicamente sólidas. Las hipótesis pueden establecerse como
Hipótesis de investigaciónohipótesis estadísticas.Las definiciones explícitas de estos
términos se dan en el Capítulo 7, que analiza la ciencia de probar hipótesis. Baste decir
por ahora que una hipótesis de investigación del ejemplo de pérdida de peso sería una
declaración como, "El ejercicio parece reducir el peso corporal". Ciertamente, no hay nada
incorrecto en esta conjetura, pero carece de una base verdaderamente cuantitativa para
probarla. Se puede formular una hipótesis estadística usando terminología cuantitativa de
la siguiente manera: “La pérdida promedio (media) de peso corporal de las personas que
hacen ejercicio es mayor que la pérdida promedio (media) de peso corporal de las
personas que no hacen ejercicio”. En esta declaración, se supone que una medida
cuantitativa, el valor "promedio" o "promedio", es mayor en la muestra de pacientes que
hacen ejercicio.

Diseñar un experimentoEl tercer paso del método científico implica diseñando un


experimentoque producirá los datos necesarios para probar válidamente una hipótesis
estadística apropiada. Este paso del método científico, como el del análisis de datos, requiere la
pericia de un estadístico. Los experimentos mal diseñados son la principal causa de resultados
inválidos y conclusiones injustificadas. Además, la mayoría de los estudios cuestionados por
expertos se cuestionan sobre la base de la idoneidad o inadecuación del diseño de
investigación del estudio.
Quienes diseñan adecuadamente los experimentos de investigación hacen todo lo posible para
garantizar que la medición del fenómeno de interés sea tanto exacta como precisa.Exactitudse refiere
a la corrección de una medida.Precisión,por otro lado, se refiere a la consistencia de una medida.
Cabe señalar que en las ciencias sociales, el términovalideza veces se usa para significar precisión y
quefiabilidadse usa a veces para significar precisión. En el contexto del ejemplo de pérdida de peso
dado anteriormente, la báscula utilizada para medir el peso de los participantes del estudio sería
precisa si la medición se valida con una báscula que esté debidamente calibrada. Sin embargo, si la
escala está fuera deþ3 libras, entonces el peso de cada participante sería 3 libras más pesado; las
medidas serían precisas en el sentido de que cada una estaría equivocada porþ3 libras, pero las
medidas no serían precisas. Las mediciones que son inexactas o imprecisas pueden invalidar los
resultados de la investigación.
1.6 COMPUTADORAS Y ANÁLISIS BIOSTATÍSTICO 15

El diseño de un experimento depende del tipo de datos que deben recopilarse para probar una
hipótesis específica. Como se discutió en la Sección 1.2, los datos se pueden recopilar o poner a disposición a
través de una variedad de medios. Sin embargo, para gran parte de la investigación científica, el estándar
para la recopilación de datos es la experimentación. Una verdaddiseño experimentales aquel en el que los
sujetos de estudio son asignados al azar a ungrupo experimental (ogrupo de tratamiento)y ungrupo de
controlque no está directamente expuesto a un tratamiento. Continuando con el ejemplo de la pérdida de
peso, se podría asignar aleatoriamente una muestra de 100 participantes a dos condiciones usando los
métodos de la Sección 1.4. Se asignaría una muestra de 50 de los participantes a un programa de ejercicio
específico y se controlaría a los 50 restantes, pero se les pediría que no hicieran ejercicio durante un período
de tiempo específico. Al final de este experimento se pudieron comparar las pérdidas de peso medias
(medias) de los dos grupos. La razón por la que los diseños experimentales son deseables es que si se
controlan todos los demás factores potenciales, unrelación causa-efectopuede ser probado; es decir, en
igualdad de condiciones, podríamos concluir o dejar de concluir que el grupo experimental perdió peso como
resultado del ejercicio.
La complejidad potencial de los diseños de investigación requiere experiencia estadística,
y el Capítulo 8 destaca algunos diseños experimentales de uso común. Para una discusión más
profunda de los diseños de investigación, el lector interesado puede consultar los textos de
Kuehl (5), Keppel y Wickens (6) y Tabachnick y Fidell (7).

ConclusiónEn la ejecución de un estudio de investigación o experimento, uno esperaría haber


recopilado los datos necesarios para sacar conclusiones, con cierto grado de confianza, sobre las
hipótesis que se plantearon como parte del diseño. A menudo ocurre que las hipótesis deben
modificarse y volver a probarse con nuevos datos y un diseño diferente. Cualesquiera que sean las
conclusiones del proceso científico, sin embargo, los resultados rara vez se consideran concluyentes.
Es decir, los resultados deben serreplicado,a menudo un gran número de veces, antes de que se les
conceda credibilidad científica.

EJERCICIOS

1.5.1Usando el ejemplo de la pérdida de peso como punto final, discuta cómo usaría el método científico para probar
la observación de que el cambio en la dieta está relacionado con la pérdida de peso. Incluya todos los pasos,
incluida la hipótesis a probar y el diseño de su experimento.

1.5.2Continuando con el Ejercicio 1.5.1, considere cómo usaría el método científico para probar la observación de que
tanto el ejercicio como el cambio en la dieta están relacionados con la pérdida de peso. Incluya todos los
pasos, prestando especial atención a cómo podría diseñar el experimento y qué hipótesis serían
comprobables dado su diseño.

1.6 COMPUTADORAS Y
ANÁLISIS BIOSTATÍSTICO

El uso generalizado de las computadoras ha tenido un tremendo impacto en la investigación en


ciencias de la salud en general y en el análisis bioestadístico en particular. La necesidad de realizar
cálculos aritméticos largos y tediosos como parte del análisis estadístico de datos vive solo en el
dieciséis CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA

memoria de aquellos investigadores y profesionales cuyas carreras son anteriores a la llamada


revolución informática. Las computadoras pueden realizar más cálculos de manera más rápida
y precisa que los técnicos humanos. El uso de computadoras hace posible que los
investigadores dediquen más tiempo a mejorar la calidad de los datos brutos y la interpretación
de los resultados.
El predominio actual de las microcomputadoras y la abundancia de programas de software
estadístico disponibles han revolucionado aún más la computación estadística. El lector en busca de
un paquete de software estadístico puede desear consultarEl Estadístico Americano,una publicación
trimestral de la Asociación Estadounidense de Estadística. Los paquetes de software estadístico se
revisan periódicamente y se anuncian en el periódico.
Las computadoras actualmente en el mercado están equipadas con capacidades de generación de
números aleatorios. Como alternativa al uso de tablas impresas de números aleatorios, los investigadores
pueden usar computadoras para generar los números aleatorios que necesitan. En realidad, los números
"aleatorios" generados por la mayoría de las computadoras son en realidadnúmeros pseudoaleatorios
porque son el resultado de una fórmula determinista. Sin embargo, como señala Fishman (8), los números
parecen servir satisfactoriamente para muchos propósitos prácticos.
La utilidad de la computadora en las ciencias de la salud no se limita al análisis
estadístico. El lector interesado en conocer más sobre el uso de las computadoras en las
ciencias de la salud encontrará los libros de Hersh (4), Johns (5), Miller et al. (6) y Saba y
McCormick (7) útiles. Quienes deseen obtener el máximo beneficio de Internet pueden
consultar los librosGuía de Internet para médicos (13) yInformática en Enfermería Guía de
Internet para Enfermeras (14). Los desarrollos actuales en el uso de computadoras en biología,
medicina y campos relacionados se informan en varias publicaciones periódicas dedicadas al
tema. Algunos de estos periódicos sonInformática en biología y medicina, Informática e
investigación biomédica, Revista internacional de informática biomédica, Métodos y programas
informáticos en biomedicina, Aplicaciones informáticas en biociencias,y Informática en
Enfermería.
A lo largo de este libro se utilizan impresiones de computadora para ilustrar el uso de
computadoras en el análisis bioestadístico. MINITAB, SPSS, R y SAS®Para este propósito se han
utilizado paquetes de software estadístico para la computadora personal.

1.7 RESUMEN

En este capítulo presentamos al lector los conceptos básicos de estadística. Definimos la estadística como un
área de estudio relacionada con la recopilación y descripción de datos y con la realización de inferencias
estadísticas. Definimos la inferencia estadística como el procedimiento mediante el cual llegamos a una
conclusión sobre una población sobre la base de la información contenida en una muestra extraída de esa
población. Aprendimos que un tipo básico de muestra que nos permitirá hacer inferencias válidas es la
muestra aleatoria simple. Aprendimos a usar una tabla de números aleatorios para extraer una muestra
aleatoria simple de una población.
Se proporcionan al lector las definiciones de algunos términos básicos, como variable y
muestra, que se utilizan en el estudio de la estadística. También discutimos la medición y
definimos cuatro escalas de medición: nominal, ordinal, de intervalo y de razón. el lector es
PREGUNTAS DE REPASO Y EJERCICIOS 17

también introdujo el método científico y el papel de la estadística y el estadístico en este


proceso.
Finalmente, discutimos la importancia de las computadoras en el desempeño de las actividades
involucradas en la estadística.

PREGUNTAS DE REPASO Y EJERCICIOS

1.Explique qué se entiende por estadística descriptiva.

2.Explique qué se entiende por estadística inferencial.

3.Definir:
(a)Estadísticas (b)Bioestadística
(C)Variable (d)Variable cuantitativa
(mi)variable cualitativa (F)Variable aleatoria
(gramo)Población (h)Población finita
(i)Población infinita (j)Muestra
(k)Variable discreta (l)Variable continua
(metro)Muestra aleatoria simple (norte)Muestreo con reemplazo
(o)Muestreo sin reemplazo

4.Definir la palabramedición.
5.Enumere, describa y compare las cuatro escalas de medida.

6.Para cada una de las siguientes variables, indique si es cuantitativa o cualitativa y especifique la
escala de medida que se emplea al tomar medidas en cada una:
(a)Posición de clase de los miembros de esta clase entre sí
(b)Diagnóstico de admisión de pacientes ingresados en una clínica de salud mental

(C)Pesos de bebes nacidos en un hospital durante un año


(d)Género de los bebés nacidos en un hospital durante un año
(mi)Amplitud de movimiento de la articulación del codo de estudiantes matriculados en un plan de estudios universitario de ciencias de la salud

(F)Temperatura axilar de lactantes de un día nacidos en un hospital

7.Para cada una de las siguientes situaciones, responda las preguntas de la a a la e:


(a)¿Cuál es la muestra en el estudio?
(b)¿Cual es la población?
(C)¿Cuál es la variable de interés?
(d)¿Cuántas medidas se utilizaron para calcular los resultados informados?
(mi)¿Qué escala de medida se utilizó?
Situación A. Un estudio de 300 hogares en un pequeño pueblo del sur reveló que el 20 por ciento tenía al menos un
niño en edad escolar presente.
Situación B. Un estudio de 250 pacientes ingresados en un hospital durante el último año reveló que, en
promedio, los pacientes vivían a 15 millas del hospital.

8.Considere las dos situaciones dadas en el Ejercicio 7. Para la Situación A, describa cómo usaría una muestra aleatoria
estratificada para recopilar los datos. Para la Situación B, describa cómo usaría el muestreo sistemático de los
registros de pacientes para recopilar los datos.
18 CAPÍTULO 1 INTRODUCCIÓN A LA BIOSTATÍSTICA

REFERENCIAS

Referencias de metodología
1. SS STEVENS, "En la teoría de las escalas de medición,"Ciencias, 103 (1946), 677–680.
2. SS STEVENS, "Matemáticas, Medida y Psicofísica", en SS Stevens (ed.),manual de psicología experimental,
Wiley, Nueva York, 1951.
3. STEVENK THOMPSON,Muestreo (2ª ed.), Wiley, Nueva York, 2002.
4. pagAULS. L.EVYy STANLEYLEMESHOW,Muestreo de Poblaciones: Métodos y Aplicaciones (3.ª ed.), Wiley, Nueva
York, 1999.
5. ROBERTODE ACUERDOUEHL,Principios estadísticos del diseño y análisis de la investigación (2ª ed.), Duxbury Press, Belmont, CA, 1999.

6. gEOFFREYkEPPELy THOMASD. W.GALLETA,Diseño y análisis: manual de un investigador (4.ª ed.), Prentice Hall, Upper
Saddle River, Nueva Jersey, 2004.
7. BARBARAG. T.ABACHNICKy yoINDAS. F.IDEAL,Diseños Experimentales usando ANOVA,Thomson, Belmont, California, 2007.
8. gEORGES. F.ISMAN,Conceptos y Métodos en Simulación Digital de Eventos Discretos,Wiley, Nueva York, 1973.
9. WILLIAMRHERSH,Recuperación de información: una perspectiva de atención médica,Springer, Nueva York, 1996.
10. mERIDALJOHNS,Gestión de la información para las profesiones de la salud,Editorial Delmar, Albany, Nueva York, 1997.
11. mARVINJ. M.ILLER, kENRICWHammond, y MATTEOGHILE(eds.),informática de salud mental,Springer, Nueva York,
1996.
12. VIRGINIAKSABAy kATLETASOYCCORMICK,Fundamentos de la informática para enfermeras,McGraw-Hill, Nueva York,
1996.
13. LEE.UU.HANCOCK,Guía de Internet para médicos,Lippincott Williams & Wilkins Publishers, Filadelfia, 1996.
14. LESLIEH NICOLLy TEENAHOUELLETTE,Computers in Nursing's Nurses' Guide to the Internet, 3.ª ed., Lippincott
Williams & Wilkins Publishers, Filadelfia, 2001.

Aplicaciones Referencias
A-1. PAGAULBGVIEJO, ROBERTOnrUBEYy RICHARDTHARVEY, “Estudio comparativo naturalista y autoasignado de bupropion SR, un
parche de nicotina o ambos para el tratamiento para dejar de fumar en la atención primaria”Revista estadounidense
sobre adicciones, 11 (2002), 315–331.
CAPÍTULO 2
ESTADÍSTICAS DESCRIPTIVAS

RESUMEN DEL CAPÍTULO

Este capítulo presenta un conjunto de procedimientos básicos y medidas estadísticas para


describir datos. Los datos generalmente consisten en una gran cantidad de mediciones u
observaciones que son demasiado numerosas o complicadas para comprenderlas
mediante una simple observación. Por lo tanto, este capítulo presenta varias técnicas que
incluyen la construcción de tablas, presentaciones gráficas y cálculos estadísticos básicos
que brindan formas de condensar y organizar la información en un conjunto de medidas
descriptivas y dispositivos visuales que mejoran la comprensión de datos complejos.

TEMAS

2.1INTRODUCCIÓN
2.2LA MATRIZ ORDENADA
2.3DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS

2.4ESTADÍSTICA DESCRIPTIVA: MEDIDAS DE TENDENCIA CENTRAL


2.5ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN
2.6RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. Comprender cómo se pueden organizar y mostrar los datos de manera adecuada.
2. comprender cómo reducir los conjuntos de datos a unas pocas medidas descriptivas útiles.
3. ser capaz de calcular e interpretar medidas de tendencia central, como la media, la
mediana y la moda.
4. ser capaz de calcular e interpretar medidas de dispersión, como el rango, la varianza y
la desviación estándar.

19
20 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

2.1 INTRODUCCIÓN

En el Capítulo 1 dijimos que la toma de una medida y el proceso de contar producen números que
contienen información. El objetivo de quien aplica las herramientas de la estadística a estos números
es determinar la naturaleza de esta información. Esta tarea se hace mucho más fácil si los números
están organizados y resumidos. Cuando se toman medidas de una variable aleatoria en las entidades
de una población o muestra, los valores resultantes se ponen a disposición del investigador o
estadístico como una masa de datos desordenados. Las mediciones que no han sido organizadas,
resumidas o manipuladas de otra manera se denominandatos sin procesar. A menos que el número
de observaciones sea extremadamente pequeño, es poco probable que estos datos en bruto
proporcionen mucha información hasta que se hayan puesto en algún tipo de orden.
En este capítulo aprendemos varias técnicas para organizar y resumir datos de modo que
podamos determinar más fácilmente qué información contienen. Lo último en resumen de
datos es el cálculo de un solo número que de alguna manera transmite información importante
sobre los datos a partir de los cuales se calculó. Estos números únicos que se utilizan para
describir datos se denominanmedidas descriptivas.Después de estudiar este capítulo, podrá
calcular varias medidas descriptivas tanto para poblaciones como para muestras de datos.

El propósito de este capítulo es equiparlo con las habilidades que le permitirán


manipular la información, en forma de números, que encuentre como profesional de
las ciencias de la salud. Cuanto mejor pueda manipular dicha información, mejor
comprenderá el entorno y las fuerzas que generan la información.

2.2 LA MATRIZ ORDENADA

Un primer paso en la organización de datos es la preparación de una matriz ordenada. Unmatriz ordenadaes
una lista de los valores de una colección (ya sea población o muestra) en orden de magnitud desde el valor
más pequeño hasta el valor más grande. Si el número de medidas a pedir es de un tamaño apreciable, es
muy deseable el uso de una computadora para preparar la matriz ordenada.
Una matriz ordenada permite determinar rápidamente el valor de la medida más
pequeña, el valor de la medida más grande y otros datos sobre los datos de la matriz que
podrían necesitarse rápidamente. Ilustramos la construcción de un arreglo ordenado con los
datos discutidos en el ejemplo 1.4.1.

EJEMPLO 2.2.1
La Tabla 1.4.1 contiene una lista de las edades de los sujetos que participaron en el estudio para dejar
de fumar discutido en el Ejemplo 1.4.1. Como puede verse, esta tabla desordenada requiere una
búsqueda considerable para que podamos determinar información tan elemental como la edad de los
sujetos más jóvenes y mayores.

Solución: La Tabla 2.2.1 presenta los datos de la Tabla 1.4.1 en forma de matriz ordenada.
Haciendo referencia a la Tabla 2.2.1 podemos determinar rápidamente la edad del
sujeto más joven (30) y la edad del sujeto más viejo (82). También notamos fácilmente
que alrededor de un tercio de los sujetos tienen 50 años de edad o menos.
2.2 LA MATRIZ ORDENADA 21

TABLA 2.2.1 Matriz ordenada de edades de los sujetos de la Tabla 1.4.1

30 34 35 37 37 38 38 38 38 39 39 40 40 42 42
43 43 43 43 43 43 44 44 44 44 44 44 44 45 45
45 46 46 46 46 46 46 47 47 47 47 47 47 48 48
48 48 48 48 48 49 49 49 49 49 49 49 50 50 50
50 50 50 50 50 51 51 51 51 52 52 52 52 52 52
53 53 53 53 53 53 53 53 53 53 53 53 53 53 53
53 53 54 54 54 54 54 54 54 54 54 54 54 55 55
55 56 56 56 56 56 56 57 57 57 57 57 57 57 58
58 59 59 59 59 59 59 60 60 60 60 61 61 61 61
61 61 61 61 61 61 61 62 62 62 62 62 62 62 63
63 64 64 64 64 64 64 sesenta y cinco sesenta y cinco 66 66 66 66 66 66
67 68 68 68 69 69 69 70 71 71 71 71 71 71 71
72 73 75 76 77 78 78 78 82

&

Análisis informáticoSi los cálculos adicionales y la organización de un conjunto de datos deben realizarse a
mano, el trabajo puede facilitarse trabajando a partir de una matriz ordenada. Si los datos van a ser
analizados por una computadora, puede que no sea deseable preparar una matriz ordenada, a menos que se
necesite para fines de referencia o para algún otro uso. Una computadora no necesita que su usuario
construya primero una matriz ordenada antes de ingresar datos para la construcción de distribuciones de
frecuencia y la realización de otros análisis. Sin embargo, casi todos los paquetes estadísticos de
computadora y los programas de hojas de cálculo contienen una rutina para clasificar los datos en orden
ascendente o descendente. Consulte la Figura 2.2.1, por ejemplo.

Diálogo comando de sion:

Datos Clasificar MTB > Ordenar C1 C2;


SUBC> Por C1.

FIGURA 2.2.1Cuadro de diálogo MINITAB para el Ejemplo 2.2.1.


22 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

2.3 DATOS AGRUPADOS: LA


DISTRIBUCIÓN DE FRECUENCIAS

Aunque un conjunto de observaciones puede hacerse más comprensible y significativo por medio de
una matriz ordenada, se puede lograr un resumen más útil agrupando los datos. Antes de los días de
las computadoras, uno de los principales objetivos al agrupar grandes conjuntos de datos era facilitar
el cálculo de diversas medidas descriptivas, como porcentajes y promedios. Debido a que las
computadoras pueden realizar estos cálculos en grandes conjuntos de datos sin agrupar primero los
datos, el objetivo principal de agrupar datos ahora es resumir. Hay que tener en cuenta que los datos
contienen información y que la síntesis es una forma de facilitar la determinación de la naturaleza de
esta información. También se debe ser consciente de que reducir una gran cantidad de información
para resumir los datos de manera sucinta conlleva el potencial de perder inadvertidamente cierta
cantidad de especificidad con respecto al conjunto de datos subyacente. Por lo tanto, es importante
agrupar los datos lo suficiente como para que las grandes cantidades de información se reduzcan a
resúmenes comprensibles. Al mismo tiempo, los datos deben resumirse en la medida en que las
complejidades útiles de los datos no sean fácilmente obvias.
Para agrupar un conjunto de observaciones, seleccionamos un conjunto de intervalos contiguos que no se
superponen de modo que cada valor del conjunto de observaciones pueda colocarse en uno, y solo uno, de los
intervalos. Estos intervalos se conocen generalmente comointervalos de clase.
Una de las primeras consideraciones cuando se van a agrupar los datos es cuántos
intervalos incluir. Muy pocos intervalos son indeseables debido a la pérdida de información
resultante. Por otro lado, si se utilizan demasiados intervalos, no se cumplirá el objetivo de
resumen. La mejor guía para esto, así como para otras decisiones a tomar al agrupar datos, es
su conocimiento de los datos. Puede ser que los intervalos de clase hayan sido determinados
por precedentes, como en el caso de las tabulaciones anuales, cuando los intervalos de clase de
años anteriores se mantienen con fines comparativos. Una regla empírica comúnmente
seguida establece que no debe haber menos de cinco intervalos ni más de 15. Si hay menos de
cinco intervalos, los datos se han resumido demasiado y la información que contienen se ha
perdido. Si hay más de 15 intervalos,
Aquellos que necesiten una guía más específica en cuanto a decidir cuántos intervalos de
clase emplear pueden usar una fórmula dada por Sturges (1). Esta fórmula da k¼1þ3:322d
registro10norteÞ,dóndekrepresenta el número de intervalos de clase ynortees el número de
valores en el conjunto de datos bajo consideración. La respuesta obtenida aplicando regla de
Sturgesno debe considerarse como final, sino solo como una guía. El número de intervalos de
clase especificados por la regla debe aumentarse o disminuirse por conveniencia y una
presentación clara.
Supongamos, por ejemplo, que tenemos una muestra de 275 observaciones que
queremos agrupar. El logaritmo en base 10 de 275 es 2.4393. La aplicación de la fórmula de
Sturges da k¼1þ3:322d2:4393Þ '9. En la práctica, otras consideraciones podrían hacer que
usemos ocho o menos o quizás 10 o más intervalos de clase.
Otra cuestión que debe decidirse se refiere a la amplitud de los intervalos de clase. Los
intervalos de clase generalmente deben tener el mismo ancho, aunque a veces esto es imposible de
lograr. Este ancho se puede determinar dividiendo el rango pork,el número de intervalos de clase.
Simbólicamente, el ancho del intervalo de clase viene dado por

R
w¼ (2.3.1)
k
2.3 DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS 23

dóndeR (el rango) es la diferencia entre la observación más pequeña y la más grande en el conjunto
de datos, ykse define como arriba. Como regla general, este procedimiento produce un ancho que es
inconveniente para su uso. Nuevamente, podemos ejercer nuestro buen juicio y seleccionar un ancho
(usualmente cercano al dado por la Ecuación 2.3.1) que sea más conveniente.
Hay otras reglas generales que son útiles para establecer intervalos de clase útiles. Cuando la
naturaleza de los datos los hace apropiados, los anchos de intervalo de clase de 5 unidades, 10
unidades y anchos que son múltiplos de 10 tienden a hacer que el resumen sea más comprensible.
Cuando se emplean estos anchos, generalmente es una buena práctica que el límite inferior de cada
intervalo termine en cero o 5. Por lo general, los intervalos de clase se ordenan de menor a mayor; es
decir, el primer intervalo de clase contiene las medidas más pequeñas y el último intervalo de clase
contiene las medidas más grandes. Cuando este sea el caso, el límite inferior del primer intervalo de
clase debe ser igual o menor que la medida más pequeña del conjunto de datos, y el límite superior
del último intervalo de clase debe ser igual o mayor que la medida más grande.

La mayoría de los paquetes estadísticos permiten a los usuarios cambiar de forma interactiva el número de
intervalos de clase y/o los anchos de clase, de modo que se puedan obtener rápidamente varias visualizaciones de los
datos. Esta característica permite a los usuarios ejercer su juicio para decidir qué pantalla de datos es la más
adecuada para un propósito determinado. Usemos las 189 edades que se muestran en la Tabla 1.4.1 y dispuestas en
la Tabla 2.2.1 para ilustrar la construcción de una distribución de frecuencias.

EJEMPLO 2.3.1
Deseamos saber cuántos intervalos de clase debe haber en la distribución de frecuencia de los datos.
También queremos saber qué tan anchos deben ser los intervalos.

Solución: Para tener una idea del número de intervalos de clase a utilizar, podemos aplicar la regla de
Sturges para obtener

k¼1þ3:322dregistro 189Þ
¼1þ3:322d2:2764618Þ
- 9
Ahora dividamos el rango por 9 para tener una idea sobre el ancho del intervalo
de clase. Tenemos

R 82 - 30 52
¼ ¼ ¼5:778
k 9 9

Es evidente que un ancho de intervalo de clase de 5 o 10 será más conveniente de


usar, así como más significativo para el lector. Supongamos que nos decidimos por 10. Ahora
podemos construir nuestros intervalos. Dado que el valor más pequeño en la Tabla 2.2.1 es
30 y el valor más grande es 82, podemos comenzar nuestros intervalos con 30 y terminar con
89. Esto da los siguientes intervalos:

30–39
40–49
50–59
60–69
24 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

70–79
80–89

Vemos que hay seis de estos intervalos, tres menos que el número sugerido
por la regla de Sturges.
A veces es útil referirse al centro, llamado elpunto medio,de un intervalo
de clase. El punto medio de un intervalo de clase se determina obteniendo la
suma de los límites superior e inferior del intervalo de clase y dividiendo por 2.
Así, por ejemplo, se encuentra que el punto medio del intervalo de clase 30–39 es
d30þ39Þ=2¼34:5. &

Cuando agrupamos datos manualmente, determinar el número de valores que caen en cada
intervalo de clase es simplemente una cuestión de mirar la matriz ordenada y contar el número de
observaciones que caen en los distintos intervalos. Cuando hacemos esto para nuestro ejemplo,
tenemos la Tabla 2.3.1.
Una tabla como la Tabla 2.3.1 se llamadistribución de frecuencias.Esta tabla muestra la forma
en que se distribuyen los valores de la variable entre los intervalos de clase especificados. Al
consultarlo, podemos determinar la frecuencia de ocurrencia de valores dentro de cualquiera de los
intervalos de clase mostrados.

Frecuencias relativasA veces puede ser útil conocer la proporción, en lugar del número, de
valores que caen dentro de un intervalo de clase particular. Obtenemos esta información
dividiendo el número de valores en el intervalo de clase particular por el número total de
valores. Si en nuestro ejemplo queremos saber la proporción de valores entre 50 y 59, ambos
inclusive, dividimos 70 entre 189, obteniendo .3704. Así decimos que 70 de 189, o 70/189, o
.3704, de los valores están entre 50 y 59. Multiplicando .3704 por 100 nos da el porcentaje de
valores entre 50 y 59. Entonces podemos decir que El 37,04 por ciento de los sujetos tiene entre
50 y 59 años. Podemos referirnos a la proporción de valores que caen dentro de un intervalo de
clase como lafrecuencia relativa de ocurrenciade valores en ese intervalo. En la Sección 3.2
veremos que una frecuencia relativa puede interpretarse también como la probabilidad de
ocurrencia dentro del intervalo dado. Esta probabilidad de ocurrencia también se llama
probabilidad experimentalo elprobabilidad empírica.

TABLA 2.3.1 Distribución de frecuencias de las edades de


189 sujetos que se muestran en las tablas 1.4.1 y 2.2.1

Intervalo de clases Frecuencia

30–39 11
40–49 46
50–59 70
60–69 45
70–79 dieciséis

80–89 1
Total 189
2.3 DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS 25

TABLA 2.3.2 Distribuciones de frecuencia, frecuencia acumulada, frecuencia relativa y


frecuencia relativa acumulada de las edades de los sujetos descritos en el ejemplo 1.4.1

Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia

30–39 11 11 . 0582 . 0582


40–49 46 57 . 2434 . 3016
50–59 70 127 . 3704 . 6720
60–69 45 172 . 2381 . 9101
70–79 dieciséis 188 . 0847 . 9948
80–89 1 189 . 0053 1.0001

Total 189 1.0001

Nota: Las frecuencias no suman 1,0000 exactamente debido al redondeo.

Al determinar la frecuencia de valores que caen dentro de dos o más intervalos de clase,
obtenemos la suma del número de valores que caen dentro de los intervalos de clase de interés. De
manera similar, si queremos conocer la frecuencia relativa de ocurrencia de valores que caen dentro
de dos o más intervalos de clase, sumamos las respectivas frecuencias relativas. Podemos sumar, o
recoger en montón,las frecuencias y frecuencias relativas para facilitar la obtención de información
sobre la frecuencia o frecuencia relativa de valores dentro de dos o más intervalos de clase contiguos.
La Tabla 2.3.2 muestra los datos de la Tabla 2.3.1 junto con losfrecuencias acumuladas,elfrecuencias
relativas,yfrecuencias relativas acumuladas.
Suponga que estamos interesados en la frecuencia relativa de los valores entre 50 y 79.
Usamos la columna de frecuencia relativa acumulada de la tabla 2.3.2 y restamos .3016 de .
9948, obteniendo .6932.
Podemos usar un paquete estadístico para obtener una tabla similar a la que se muestra en la
Tabla 2.3.2. Las tablas obtenidas del software MINITAB y SPSS se muestran en la Figura 2.3.1.

El histogramaPodemos mostrar una distribución de frecuencias (o una distribución de frecuencias


relativas) gráficamente en forma dehistograma,que es un tipo especial de gráfico de barras.
Cuando construimos un histograma los valores de la variable en consideración están
representados por el eje horizontal, mientras que el eje vertical tiene como escala la frecuencia (o
frecuencia relativa si se desea) de ocurrencia. Sobre cada intervalo de clase en el eje horizontal se
erige una barra rectangular, o celda, como se le llama a veces, de modo que la altura corresponda a la
frecuencia respectiva cuando los intervalos de clase tienen el mismo ancho. Las celdas de un
histograma deben estar unidas y, para lograr esto, debemos tener en cuenta los verdaderos límites
de los intervalos de clase para evitar que se produzcan espacios entre las celdas de nuestro gráfico.

El nivel de precisión observado en los datos notificados que se miden en una escala continua
indica cierto orden de redondeo. El orden de redondeo refleja la preferencia personal del reportero o
las limitaciones del instrumento de medición empleado. Cuando se construye una distribución de
frecuencias a partir de los datos, los límites del intervalo de clase suelen reflejar el grado de precisión
de los datos sin procesar. Esto se ha hecho en nuestro ejemplo ilustrativo.
26 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

Caja de diálogo: Comando de sesión:

Estadística Mesas Conteo de variables individuales MTB > Tally C2;


SUBC> cuenta;
TipoC2enVariables.ControlarRecuentos, porcentajes, recuentos SUBC> CumCounts;
acumulativos,yPorcentajes acumulativosen Mostrar.Hacer clic SUBC> porcentajes;
DE ACUERDO. SUBC> CumPercents;

Producción:

Tally para Variables Discretas: C2

Salida de MINITAB Salida SPSS


Recuento C2 Cont. Acum. Porcentaje Pct. Acum. Válido Acumulativo
0 11 11 5.82 5.82 Frecuencia Por ciento Por ciento Por ciento

1 46 57 24,34 30,16 Válido 30-39 11 5.8 5.8 5.8


2 70 127 37,04 67,20 40-49 46 24.3 24.3 30.2
3 45 172 23.81 91.01 50-59 70 37.0 37.0 67.2
4 dieciséis 188 8.47 99.47 60-69 45 23.8 23.8 91.0
70-79 8.5 8.5 99.5
5 1 189 0.53 100.00
dieciséis

80-89 1 .5 .5 100.0
n= 189 Total 189 100.0 100.0

FIGURA 2.3.1Distribución de frecuencia, frecuencias acumuladas, porcentaje y porcentaje acumulativo de las


edades de los sujetos descritos en el Ejemplo 1.4.1 según la construcción de MINITAB y SPSS.

Sabemos, sin embargo, que algunos de los valores que caen en el intervalo de segunda clase, por ejemplo,
cuando se miden con precisión, probablemente serían un poco menos de 40 y algunos serían un poco más
de 49. Considerando la continuidad subyacente de nuestra variable, y suponiendo que los datos se
redondearon al número entero más próximo, nos parece conveniente pensar en 39,5 y 49,5 como los
verdaderos límites de este segundo intervalo. Entonces, tomamos los verdaderos límites para cada uno de
los intervalos de clase como se muestra en la Tabla 2.3.3.
Si construimos un gráfico usando estos límites de clase como la base de nuestros rectángulos, no
habrá espacios y tendremos el histograma que se muestra en la figura 2.3.2. Usamos MINITAB para construir
este histograma, como se muestra en la Figura 2.3.3.
Nos referimos al espacio encerrado por los límites del histograma como eláreadel
histograma. A cada observación se le asigna una unidad de esta área. Como tenemos 189
observaciones, el histograma consta de un total de 189 unidades. Cada celda contiene una
cierta proporción del área total, dependiendo de la frecuencia. La segunda celda, por ejemplo,
contiene 46/189 del área. Esta, como hemos aprendido, es la frecuencia relativa de ocurrencia
de valores entre 39.5 y 49.5. De esto vemos que las subáreas del histograma definidas por las
celdas corresponden a las frecuencias de aparición de valores entre los límites de la escala
horizontal de las áreas. La relación entre una subárea particular y el área total del histograma
es igual a la frecuencia relativa de ocurrencia de valores entre los puntos correspondientes en
el eje horizontal.
2.3 DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS 27

TABLA 2.3.3 Los datos de la Tabla 2.3.1 que 70


muestran los límites de clase verdaderos
60

Límites de clase real Frecuencia 50

Frecuencia
29,5–39,5 11 40
39,5–49,5 46
30
49,5–59,5 70
59,5–69,5 45 20
69,5–79,5 dieciséis

79,5–89,5 1 10

Total 189 0
34,5 44,5 54,5 64,5 74,5 84,5
Edad
FIGURA 2.3.2Histograma de edades de
189 sujetos de la Tabla 2.3.1.

El polígono de frecuenciaUna distribución de frecuencias se puede representar gráficamente de otra


forma más mediante unPolígono de frecuencia,que es un tipo especial de gráfico lineal. Para dibujar un
polígono de frecuencias, primero colocamos un punto sobre el punto medio de cada intervalo de clase
representado en el eje horizontal de un gráfico como el que se muestra en la Figura 2.3.2. La altura de un
punto dado sobre el eje horizontal corresponde a la frecuencia del intervalo de clase relevante. Conectar los
puntos con líneas rectas produce el polígono de frecuencia. La Figura 2.3.4 es el polígono de frecuencia para
los datos de edad en la Tabla 2.2.1.
Tenga en cuenta que el polígono se reduce al eje horizontal en los extremos en los
puntos que serían los puntos medios si hubiera una celda adicional en cada extremo del
histograma correspondiente. Esto permite encerrar el área total. El área total bajo el polígono
de frecuencia es igual al área bajo el histograma. La Figura 2.3.5 muestra el polígono de
frecuencia de la Figura 2.3.4 superpuesto al histograma de la Figura 2.3.2. Esta figura le permite
ver, para el mismo conjunto de datos, la relación entre las dos formas gráficas.

Caja de diálogo: Comando de sesión:

Grafico Histograma Simple DE ACUERDO MTB > Histograma 'Edad';


SUBC> punto medio 34,5:84,5/10;
TipoEdadenVariables gráficas:Hacer clicDE ACUERDO. SUBC> Bar.

Ahora haga doble clic en el histograma y haga clic enAgrupaciónPestaña. Tipo


34,5:84,5/10 pulg.Punto medio/Posiciones de puntos de corte: Hacer clicDE
ACUERDO.

FIGURA 2.3.3Cuadro de diálogo de MINITAB y comando de sesión para construir un histograma a partir de datos
sobre edades en el Ejemplo 1.4.1.
28 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

70 70

60 60

50 50
Frecuencia

Frecuencia
40 40

30 30

20 20

10 10

0 0
24,5 34,5 44,5 54,5 64,5 74,5 84,5 94,5 24,5 34,5 44,5 54,5 64,5 74,5 84,5 94,5
Edad Edad
FIGURA 2.3.4Polígono de frecuencias para las edades de FIGURA 2.3.5Histograma y polígono de frecuencias para las
189 sujetos mostrados en la Tabla 2.2.1. edades de 189 sujetos que se muestran en la Tabla 2.2.1.

Exhibiciones de tallo y hojasOtro dispositivo gráfico que es útil para representar conjuntos
de datos cuantitativos es elexhibición de tallo y hojas.Una pantalla de tallo y hojas se parece
mucho a un histograma y tiene el mismo propósito. Una representación de tallo y hojas
construida correctamente, como un histograma, brinda información sobre el rango del
conjunto de datos, muestra la ubicación de la mayor concentración de mediciones y revela la
presencia o ausencia de simetría. Una ventaja de la visualización de tallo y hojas sobre el
histograma es el hecho de que conserva la información contenida en las mediciones
individuales. Esta información se pierde cuando las medidas se asignan a los intervalos de clase
de un histograma. Como se hará evidente, otra ventaja de las pantallas de tallo y hojas es el
hecho de que pueden construirse durante el proceso de conteo, por lo que se elimina el paso
intermedio de preparar una matriz ordenada.
Para construir una representación de tallo y hojas, dividimos cada medida en dos partes. La primera
parte se llamaprovenir,y la segunda parte se llamahoja.El tallo consta de uno o más de los dígitos iniciales de
la medida, y la hoja está compuesta de uno o más de los dígitos restantes. Todos los números particionados
se muestran juntos en una sola pantalla; los tallos forman una columna ordenada con el tallo más pequeño
en la parte superior y el más grande en la parte inferior. Incluimos en la columna de tallo todos los tallos
dentro del rango de los datos incluso cuando una medición con ese tallo no está en el conjunto de datos. Las
filas de la pantalla contienen las hojas, ordenadas y listadas a la derecha de sus respectivos tallos. Cuando las
hojas constan de más de un dígito, se pueden eliminar todos los dígitos posteriores al primero. Los decimales
cuando están presentes en los datos originales se omiten en la visualización de tallo y hojas. Los tallos están
separados de sus hojas por una línea vertical. Así vemos que una representación de tallo y hojas también es
un arreglo ordenado de los datos.

Las visualizaciones de tallo y hojas son más efectivas con conjuntos de datos relativamente pequeños.
Por regla general, no son adecuados para su uso en informes anuales u otras comunicaciones dirigidas al
público en general. Son principalmente valiosos para ayudar a los investigadores y a los tomadores de
decisiones a comprender la naturaleza de sus datos. Los histogramas son más apropiados para publicaciones
de circulación externa. El siguiente ejemplo ilustra la construcción de una pantalla de tallo y hojas.
2.3 DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS 29

Provenir Hoja

3 04577888899
4 0022333333444444455566666677777788888889999999
5 0000000011112222223333333333333333344444444444555666666777777788999999
6 000011111111111222222233444444556666667888999
7 0111111123567888
8 2
FIGURA 2.3.6Visualización de tallo y hojas de las edades de 189 sujetos que se muestran en la Tabla 2.2.1 (unidad de tallo
¼10, unidad de hoja¼1).

EJEMPLO 2.3.2
Usemos los datos de edad que se muestran en la Tabla 2.2.1 para construir una representación de tallo y hojas.

Solución: Como todas las medidas son números de dos dígitos, tendremos tallos de un
dígito y hojas de un dígito. Por ejemplo, la medida 30 tiene un tallo de 3 y una
hoja de 0. La figura 2.3.6 muestra la visualización de tallo y hojas para los datos.
El paquete de software estadístico MINITAB se puede usar para construir
presentaciones de tallo y hojas. El procedimiento y la salida de MINITAB se muestran
en la Figura 2.3.7. El subcomando de incremento especifica la distancia de un tallo al
siguiente. Los números en la columna de salida más a la izquierda de la Figura 2.3.7

Caja de diálogo: Comando de sesión:

Grafico Tallo y hojas MTB > Tallo y hoja 'Edad'; SUBC>


Incremento 10.
TipoEdadenVariables gráficas.Tipo10enIncremento. Hacer clicDE
ACUERDO.

Producción:

Visualización de tallo y hojas: Edad

Tallo y hoja de la edad norte = 189


Unidad de hoja = 1.0

11 3 04577888899
57 4 002233333334444444455566666677777788888889999999
(70) 5 000000000000001111122223333333333333333333344444444445556666666121111111111111111111111111111111111111111
62 6
17 7 0111111123567888
1 8 2

FIGURA 2.3.7Representación de tallo y hojas preparada por MINITAB a partir de los datos sobre las edades de los sujetos que se
muestran en la Tabla 2.2.1.
30 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

Tallo y hoja de Edad norte = 189


Unidad de hoja = 1.0
2 3 04
11 3 577888899
28 4 00223333334444444
57 4 55566666677777788888889999999
(46) 5 00000000111122222223333333333333333344444444444
86 5 555666666777777788999999
62 6 0000111111111111222222233444444
32 6 556666667888999
17 7 0111111123
7 7 567888
1 8 2

FIGURA 2.3.8Representación de tallo y hojas preparada por MINITAB a partir de los datos sobre las edades de los sujetos que se
muestran en la Tabla 2.2.1; ancho de intervalo de clase¼5.

proporcionar información sobre el número de observaciones (hojas) en una línea


dada y por encima o el número de observaciones en una línea dada y por debajo.
Por ejemplo, el número 57 en la segunda línea muestra que hay 57
observaciones (u hojas) en esa línea y la que está arriba. El número 62 en la
cuarta línea desde arriba nos dice que hay 62 observaciones en esa línea y todas
las de abajo. El número entre paréntesis nos dice que hay 70 observaciones en
esa línea. Los paréntesis marcan la línea que contiene la observación del medio si
el número total de observaciones es impar o las dos observaciones del medio si
el número total de observaciones es par.
Elþal final de la tercera línea en la Figura 2.3.7 indica que la frecuencia para
esa línea (grupo de edad de 50 a 59 años) excede la capacidad de la línea y que
hay al menos una hoja adicional que no se muestra. En este caso, la frecuencia
para el grupo de edad de 50 a 59 años fue de 70. La línea contiene solo 65 hojas,
por lo que laþindica que hay cinco hojas más, el número 9, que no se muestran.
&

Una forma de evitar exceder la capacidad de una línea es tener más líneas. Esto se logra
acortando la distancia entre líneas, es decir, disminuyendo el ancho de los intervalos de clase. Para el
presente ejemplo, podemos usar anchos de intervalo de clase de 5, de modo que la distancia entre las
líneas sea 5. La figura 2.3.8 muestra el resultado cuando se usa MINITAB para producir la
representación de tallo y hojas.

EJERCICIOS

2.3.1En un estudio de la práctica del cuidado oral en el hogar y las razones para buscar atención dental entre personas en
diálisis renal, Atassi (A-1) estudió a 90 sujetos en diálisis renal. El estado de higiene bucal de todos los sujetos se
examinó utilizando un índice de placa con un rango de 0 a 3 (0¼sin depósitos de placa blanda,
EJERCICIOS 31

3¼abundantes depósitos de placa blanda). La siguiente tabla muestra las puntuaciones del índice de placa para los 90
sujetos.
1,17 2,50 2,00 2,33 1,67 1,33
1,17 2,17 2,17 1,33 2,17 2,00
2,17 1,17 2,50 2,00 1,50 1,50
1,00 2,17 2,17 1,67 2,00 2,00
1,33 2,17 2,83 1,50 2,50 2,33 0,33
2,17 1,83 2,00 2,17 2,00
1.00 2,17 2,17 1,33 2,17 2,50
0.83 1,17 2,17 2,50 2,00 2,50
0.50 1,50 2,00 2,00 2,00 2,00
1,17 1,33 1,67 2,17 1,50 2,00
1,67 0,33 1,50 2,17 2,33 2,33
1.17 0.00 1,50 2,33 1,83 2,67
0.83 1,17 1,50 2,17 2,67 1,50
2.00 2,17 1,33 2,00 2,33 2,00
2.17 2.17 2.00 2.17 2.00 2.17
Fuente: Datos proporcionados por cortesía de
Farhad Atassi, DDS, MSc, FICOI.

(a)Utilice estos datos para preparar:


Una distribución de frecuencia
Una distribución de frecuencias relativas Una
distribución de frecuencias acumuladas
Una distribución de frecuencia relativa acumulada Un
histograma
Un polígono de frecuencia

(b)¿Qué porcentaje de las medidas son menos de 2.00?


(C)¿Qué proporción de los sujetos tienen medidas mayores o iguales a 1.50?
(d)¿Qué porcentaje de las medidas están entre 1,50 y 1,99 inclusive?
(mi)¿Cuántas de las medidas son mayores que 2.49?
(F)¿Qué proporción de las medidas son menores que 1.0 o mayores que 2.49?
(gramo)Alguien elige una medida al azar de este conjunto de datos y le pide que adivine el valor.
¿Cuál sería tu respuesta? ¿Por qué?
(h)Las distribuciones de frecuencias y sus histogramas se pueden describir de varias maneras dependiendo de su
forma. Por ejemplo, pueden ser simétricos (la mitad izquierda es al menos aproximadamente una imagen especular
de la mitad derecha), sesgados hacia la izquierda (las frecuencias tienden a aumentar a medida que las medidas
aumentan de tamaño), sesgados hacia la derecha (las frecuencias tienden a aumentar). disminuye a medida que las
medidas aumentan de tamaño), o en forma de U (las frecuencias son altas en cada extremo de la distribución y
pequeñas en el centro). ¿Cómo describiría la distribución actual?

2.3.2Janardhan et al. (A-2) realizaron un estudio en el que midieron los aneurismas intracraneales (AII) incidentales en 125
pacientes. Los investigadores examinaron las complicaciones posteriores al procedimiento y concluyeron que
Los AII pueden tratarse de manera segura sin causar mortalidad y con una tasa de complicaciones menor que la
reportada anteriormente. Los siguientes son los tamaños (en milímetros) de los 159 AII de la muestra.

8,1 10,0 5,0 7,0 10,0 3,0


20,0 4,0 4,0 6,0 6,0 7,0
(Continuación)
32 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

10.0 4.0 3.0 5.0 6.0 6.0


6.0 6.0 6.0 5.0 4.0 5.0
6,0 25,0 10,0 14,0 6.0 6.0
4,0 15,0 5,0 5,0 8.0 19.0
21,0 8,3 7,0 8,0 5.0 8.0
5.0 7.5 7.0 10.0 15.0 8.0
10.0 3.0 15.0 6.0 10.0 8.0
7.0 5.0 10.0 3.0 7.0 3.3
15.0 5.0 5.0 3.0 7.0 8.0
3.0 6.0 6,0 10,0 15,0 6.0
3.0 3.0 7,0 5,0 4,0 9.2
16.0 7.0 8,0 5,0 10,0 10,0
9.0 5.0 5,0 4,0 8,0 4,0
3.0 4.0 5.0 8.0 30,0 14,0
15.0 2.0 8,0 7,0 12,0 4,0
3,8 10,0 25,0 8.0 9.0 14.0
30,0 2,0 10.0 5.0 5.0 10.0
22,0 5,0 5.0 3.0 4.0 8.0
7.5 5.0 8.0 3.0 5.0 7.0
8.0 5.0 9.0 11.0 2.0 10.0
6.0 5.0 5.0 12.0 9.0 8.0
15.0 18.0 10.0 9.0 5.0 6.0
6.0 8.0 12,0 10,0 5.0
5.0 16.0 8.0 5.0 8.0
4.0 16.0 3.0 7,0 13,0
Fuente: Datos proporcionados por cortesía
de Vallabh Janardhan, MD

(a)Utilice estos datos para preparar:


Una distribución de frecuencia
Una distribución de frecuencias relativas Una
distribución de frecuencias acumuladas
Una distribución de frecuencia relativa acumulada Un
histograma
Un polígono de frecuencia

(b)¿Qué porcentaje de las medidas están entre 10 y 14,9 inclusive?


(C)¿Cuántas observaciones son menos de 20?
(d)¿Qué proporción de las medidas son mayores o iguales a 25?
(mi)¿Qué porcentaje de las medidas son menores que 10.0 o mayores que 19.95?
(F)Consulte el Ejercicio 2.3.1, parte h. Describa la distribución del tamaño de los aneurismas en esta muestra.

2.3.3Hoekema et al. (A-3) estudiaron la morfología craneofacial de pacientes diagnosticados con síndrome de apnea
obstructiva del sueño (SAOS) en sujetos varones sanos. Una de las variables demográficas que recopilaron los
investigadores para todos los sujetos fue el índice de masa corporal (que se calcula dividiendo el peso en kg por el
cuadrado de la altura del paciente en cm). Los siguientes son los valores de IMC de 29 sujetos con OSAS.

33.57 27.78 40.81


38.34 29.01 47.78
26.86 54.33 28.99
(Continuación)
EJERCICIOS 33

25.21 30.49 27.38


36.42 41.50 29.39
24.54 41.75 44.68
24.49 33.23 47.09
29.07 28.21 42.10
26.54 27.74 33.48
31.44 30.08
Fuente: Datos proporcionados por
cortesía de A. Hoekema, DDS

(a)Utilice estos datos para construir:


Una distribución de frecuencia
Una distribución de frecuencias relativas Una
distribución de frecuencias acumuladas
Una distribución de frecuencia relativa acumulada Un
histograma
Un polígono de frecuencia

(b)¿Qué porcentaje de las medidas son menos de 30?


(C)¿Qué porcentaje de las medidas están entre 40,0 y 49,99 inclusive?
(d)¿Qué porcentaje de las medidas son mayores que 34.99?
(mi)Describa estos datos con respecto a la simetría y la asimetría como se explicó en el Ejercicio 2.3.1, parte h.
(F)¿Cuántas de las medidas son menos de 40?
2.3.4David Holben (A-4) estudió los niveles de selenio en la carne de res criada en una región baja en selenio de los Estados Unidos. El
objetivo del estudio fue comparar los niveles de selenio en la carne de res criada en la región con los niveles de selenio en la
carne de venado cocida, la ardilla y la carne de res de otras regiones de los Estados Unidos. Los datos a continuación son los
niveles de selenio calculados sobre una base de peso seco enmetrog=100 g para una muestra de 53 bovinos criados en la
región.

11.23 15.82
29.63 27.74
20.42 22.35
10.12 34.78
39.91 35.09
32.66 32.60
38.38 37.03
36.21 27.00
16.39 44.20
27.44 13.09
17.29 33.03
56.20 9.69
28.94 32.45
20.11 37.38
25.35 34.91
21.77 27.99
31.62 22.36
32.63 22.68
30.31 26.52
46.16 46.01
(Continuación)
34 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

56.61 38.04
24.47 30.88
29.39 30.04
40.71 25.91
18.52 18.54
27.80 25.51
19.49
Fuente: Datos proporcionados por
cortesía de David Holben, Ph.D.

(a)Utilice estos datos para construir:


Una distribución de frecuencia
Una distribución de frecuencias relativas Una
distribución de frecuencias acumuladas
Una distribución de frecuencia relativa acumulada Un
histograma
Un polígono de frecuencia

(b)Describa estos datos con respecto a la simetría y la asimetría como se explicó en el Ejercicio 2.3.1, parte h.
(C)¿Cuántas de las medidas son mayores que 40?
(d)¿Qué porcentaje de las medidas son menos de 25?
2.3.5La siguiente tabla muestra el número de horas que 45 pacientes hospitalizados durmieron después de la administración de un
determinado anestésico.

7 10 12 4 8 7 3 8 5
12 11 3 8 1 1 13 10 4
4 5 5 8 7 7 3 2 3
8 13 1 7 17 3 4 5 5
3 1 17 10 4 7 7 11 8

(a)A partir de estos datos construir:


Una distribución de frecuencia
Una distribución de frecuencias relativas
Un histograma
Un polígono de frecuencia

(b)Describa estos datos en relación con la simetría y la asimetría, como se explicó en el Ejercicio 2.3.1, parte h.

2.3.6Los siguientes son el número de bebés nacidos durante un año en 60 hospitales comunitarios.

30 55 27 45 56 48 45 49 32 57 47 56 37 55 52 34 54 54 42 32
59 35 46 24 57 32 26 40 28 53 54 29 42 42 54 53 59 39 56 59
59 58 49 53 30 53 21 34 28 50 52 57 43 46 54 31 22 31 24 24
57 29

(a)A partir de estos datos construir:


Una distribución de frecuencia
Una distribución de frecuencias relativas
Un histograma
Un polígono de frecuencia

(b)Describa estos datos en relación con la simetría y la asimetría, como se explicó en el Ejercicio 2.3.1, parte h.
EJERCICIOS 35

2.3.7En un estudio de los niveles de resistencia física de estudiantes universitarios masculinos de primer año, se recopilaron las siguientes

puntuaciones compuestas de resistencia basadas en varias rutinas de ejercicio.

254 281 192 260 212 179 182 210 225 179 181 149
235 239 258 166 180 188 135 233 159 223 186 190
220 204 198 190 151 157 204 238 219 211 245 151
222 187 134 193 264 312 165 194 205 229 191 200
206 193 218 198 198 265 222 264 214 227 190 212
249 175 205 220 201 203 172 234 241 149 164 225
1972 195 195 227 230 168 232 232 252 210 178 159
191 175 236 152 258 214 278 252 173 187 189 237
283 205 184 184 218 213 172 159 217 249 196 223
203 212 169 187 204 180 261 236 155 215 197 210
191 124 199 235 139 231 251 206 172 228 193 130
173 236 215 228 188 195 240 163 117 197 206 198
208 217 205 212 218
116 182 243 217
183 204 186 134

(a)A partir de estos datos construir:


Una distribución de frecuencia
Una distribución de frecuencias relativas
Un polígono de frecuencias
un histograma

(b)Describa estos datos en relación con la simetría y la asimetría, como se explicó en el Ejercicio 2.3.1, parte h.

2.3.8Las siguientes son las edades de 30 pacientes atendidos en la sala de emergencias de un hospital un viernes por la noche.
Construya una representación de tallo y hojas a partir de estos datos. Describa estos datos en relación con la simetría y la
asimetría, como se explicó en el Ejercicio 2.3.1, parte h.

35 32 21 43 39 60
36 12 54 45 37 53
45 23 64 10 34 22
36 45 55 44 55 46
22 38 35 56 45 57

2.3.9Los siguientes son los cargos de urgencias realizados a una muestra de 25 pacientes en dos hospitales de la ciudad.
Construya una representación de tallo y hojas para cada conjunto de datos. ¿Qué sugiere una comparación de las dos
pantallas con respecto a los dos hospitales? Describa los dos conjuntos de datos con respecto a la simetría y la
asimetría como se explicó en el Ejercicio 2.3.1, parte h.

Hospital A

249.10 202.50 222.20 214.40 205.90


214.30 195.10 213.30 225.50 191.40
201.20 239.80 245.70 213.00 238.80
171.10 222.00 212.50 201.70 184.90
248.30 209.70 233.90 229.80 217.90
36 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

Hospital B

199.50 184.00 173.20 186.00 214.10


125.50 143.50 190.40 152.00 165.70
154.70 145.30 154.60 190.30 135.40
167.70 203.40 186.70 155.30 195.90
168.90 166.70 178.60 150.20 212.40

2.3.10Consulte las edades de los pacientes discutidas en el Ejemplo 1.4.1 y mostradas en la Tabla 1.4.1.
(a)Use anchos de intervalo de clase de 5 y construya:
Una distribución de frecuencia
Una distribución de frecuencias relativas Una
distribución de frecuencias acumuladas
Una distribución de frecuencia relativa acumulada Un
histograma
Un polígono de frecuencia

(b)Describa estos datos con respecto a la simetría y la asimetría como se explicó en el Ejercicio 2.3.1, parte h.

2.3.11Los objetivos de un estudio de Skjelbo et al. (A-5) fueron para examinar (a) la relación entre el metabolismo de la
cloroguanida y la eficacia en la profilaxis de la malaria y (b) el metabolismo de la mefenitoína y su relación
con el metabolismo de la cloroguanida entre los tanzanos. A partir de la información proporcionada por las
muestras de orina de los 216 sujetos, los investigadores calcularon la proporción de orina sin cambios
S-mefenitoína aR-mefenitoína (S/Rrelación). Los resultados fueron los siguientes:

0.0269 0.0400 0.0550 0.0550 0.0650 0.0670 0.0700 0.0760 0.0720


0.0850 0.0870 0.0870 0.0880 0.0900 0.0900 0.0990 0.0990 0.0990
0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990
0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990
0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990
0.1000 0.1020 0.1050 0.1050 0.1080 0.1080 0.1090 0.1090 0.1040
0.1090 0.1190 0.1200 0.1230 0.1240 0.1340 0.1340 0.1370 0.1160
0.1460 0.1480 0.1490 0.1490 0.1500 0.1500 0.1500 0.1550 0.1390
0.1570 0.1600 0.1650 0.1650 0.1670 0.1670 0.1690 0.1710 0.1540
0.1720 0.1740 0.1780 0.1780 0.1790 0.1810 0.1880 0.1890 0.1677
0.1890 0.1920 0.1950 0.1970 0.2070 0.2100 0.2100 0.2140 0.1790
0.2150 0.2160 0.2260 0.2390 0.2400 0.2420 0.2430 0.2450 0.2010
0.2450 0.2460 0.2470 0.2540 0.2570 0.2600 0.2620 0.2650 0.2290
0.2650 0.2710 0.2800 0.2800 0.2870 0.2880 0.2940 0.2970 0.2460
0.2990 0.3000 0.3070 0.3100 0.3110 0.3140 0.3190 0.3400 0.2680
0.3440 0.3480 0.3490 0.3520 0.3530 0.3570 0.3630 0.3660 0.2980
0.3830 0.3900 0.3960 0.3990 0.4080 0.4090 0.4090 0.4100 0.3210
0.4160 0.4210 0.4260 0.4290 0.4300 0.4360 0.4370 0.4390 0.3630
0.4410 0.4410 0.4430 0.4680 0.4810 0.4870 0.4910 0.4980 0.4080
0.5030 0.5060 0.5340 0.5340 0.5460 0.5480 0.5480 0.5490 0.4290
0.5550 0.5930 0.6010 0.6240 0.6280 0.6380 0.6600 0.6720 0.4540
0.5220
0.5920
0.6820
(Continuación)
EJERCICIOS 37

0.6870 0.6900 0.6910 0.6940 0.7040 0.7120 0.7200 0.7280


0.7860 0.7950 0.8040 0.8200 0.8350 0.8770 0.9090 0.9520
0.9530 0.9830 0.9890 1,0120 1,0260 1,0320 1,0620 1,1600
Fuente: Datos proporcionados por cortesía de Erik Skjelbo, MD

(a)A partir de estos datos, construya las siguientes distribuciones: frecuencia, frecuencia relativa, frecuencia
acumulada y frecuencia relativa acumulada; y las siguientes gráficas: histograma, polígono de frecuencias y
diagrama de tallo y hojas.
(b)Describa estos datos con respecto a la simetría y la asimetría como se explicó en el Ejercicio 2.3.1, parte h.
(C)Los investigadores definieron como metabolizadores lentos de mefenitoína a cualquier sujeto con unaS/R
proporción de mefenitoína superior a 0,9. ¿Cuántos y qué porcentaje de los sujetos eran metabolizadores
lentos?
(d)¿Cuántos y qué porcentaje de los sujetos tenían proporciones inferiores a 0,7? ¿Entre .3 y .6999
inclusive? ¿Mayor que .4999?

2.3.12Schmidt et al. (A-6) realizó un estudio para investigar si la autotransfusión de células mediastínicas
sangre podría reducir el número de pacientes que necesitan transfusión de sangre homóloga y reducir la
cantidad de sangre homóloga transfundida si se usaran criterios de transfusión fijos. La siguiente tabla
muestra las alturas en centímetros de los 109 sujetos de los cuales 97 eran hombres.

1.720 1.710 1.700 1.655 1.800 1.700


1.730 1.700 1.820 1.810 1.720 1.800
1.800 1.800 1.790 1.820 1.800 1.650
1.680 1.730 1.820 1.720 1.710 1.850
1.760 1.780 1.760 1.820 1.840 1.690
1.770 1.920 1.690 1.690 1.780 1.720
1.750 1.710 1.690 1.520 1.805 1.780
1.820 1.790 1.760 1.830 1.760 1.800
1.700 1.760 1.750 1.630 1.760 1.770
1.840 1.690 1.640 1.760 1.850 1.820
1.760 1.700 1.720 1.780 1.630 1.650
1.660 1.880 1.740 1.900 1.830
1.600 1.800 1.670 1.780 1.800
1.750 1.610 1.840 1.740 1.750
1.960 1.760 1.730 1.730 1.810
1.810 1.775 1.710 1.730 1.740
1.790 1.880 1.730 1.560 1.820
1.780 1.630 1.640 1.600 1.800
1.800 1.780 1.840 1.830
1.770 1.690 1.800 1.620
Fuente: Datos proporcionados por cortesía de Erik Skjelbo, MD

(a)Para estos datos construya las siguientes distribuciones: frecuencia, frecuencia relativa, frecuencia
acumulada y frecuencia relativa acumulada; y las siguientes gráficas: histograma, polígono de frecuencias y
diagrama de tallo y hojas.
(b)Describa estos datos con respecto a la simetría y la asimetría como se explicó en el Ejercicio 2.3.1, parte h.
(C)¿Cómo se explica la forma de la distribución de estos datos?
(d)¿Qué altura tenía el 6,42 por ciento más alto de los sujetos?
(mi)¿Qué altura tenía el 10,09 por ciento más bajo de los sujetos?
38 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

2.4 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS


DE TENDENCIA CENTRAL

Aunque las distribuciones de frecuencia tienen propósitos útiles, hay muchas situaciones que
requieren otros tipos de resumen de datos. Lo que necesitamos en muchos casos es la capacidad de
resumir los datos por medio de un solo número llamadomedida descriptiva.Las medidas descriptivas
se pueden calcular a partir de los datos de una muestra o de los datos de una población. Para
distinguirlos tenemos las siguientes definiciones:

DEFINICIONES
1. Una medida descriptiva calculada a partir de los datos de una muestra se llama
estadística.
2. Una medida descriptiva calculada a partir de los datos de una población se
llamaparámetro.

Se pueden calcular varios tipos de medidas descriptivas a partir de un conjunto de datos.


En este capítulo, sin embargo, limitamos la discusión amedidas de tendencia centralymedidas
de dispersión.Consideramos medidas de tendencia central en esta sección y medidas de
dispersión en la siguiente.
En cada una de las medidas de tendencia central, de las cuales discutimos tres, tenemos un
solo valor que se considera típico del conjunto de datos como un todo. Las medidas de tendencia
central transmiten información sobre el valor medio de un conjunto de valores. Como veremos, la
palabrapromediose puede definir de diferentes maneras.
Las tres medidas de tendencia central más utilizadas son lasignificar,el
mediana,y elmodo.

Significado aritmeticoLa medida de tendencia central más conocida es la media aritmética. Es


la medida descriptiva que la mayoría de la gente tiene en mente cuando habla del “promedio”.
El adjetivoaritméticadistingue esta media de otras medias que se pueden calcular. Ya que no
estamos cubriendo estos otros medios en este libro, nos referiremos a la media aritmética
simplemente como elsignificar.La media se obtiene sumando todos los valores de una
población o muestra y dividiendo por el número de valores que se suman.

EJEMPLO 2.4.1
Deseamos obtener la edad media de la población de 189 sujetos representados en la Tabla 1.4.1.

Solución:Procedemos de la siguiente manera:

48þ35þ46þ þ73þ66
edad Media¼ ¼55:032
189 &

Los tres puntos en el numerador representan los valores que no mostramos para guardar
espacio.
2.4 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE TENDENCIA CENTRAL 39

Fórmula general para la mediaSerá conveniente si podemos generalizar el procedimiento


para obtener la media y, además, representar el procedimiento en una forma notacional más
compacta. Empecemos por designar la variable aleatoria de interés con la letra mayúsculaX.En
nuestra presente ilustración dejamosXrepresentan la variable aleatoria edad. Los valores
específicos de una variable aleatoria serán designados por la letra minúsculaX.Para distinguir
un valor de otro, adjuntamos un subíndice alXy que el subíndice se refiera al primero, al
segundo, al tercer valor, y así sucesivamente. Por ejemplo, de la tabla 1.4.1 tenemos

X1¼48;X2¼35; . . . ;X189¼66

En general, un valor típico de una variable aleatoria será designado porXiy el valor final, en una población
finita de valores, porXnorte, dóndenortees el número de valores en la población. Finalmente, usaremos la letra
griegametropara representar la media de la población. Ahora podemos escribir la fórmula general para una
media de población finita de la siguiente manera:

PAG
norte

Xi
metro¼i¼1 (2.4.1)
norte

PAGnorte
El símbolo i¼1nos indica que sumemos todos los valores de la variable desde el primero hasta el último. Este
símboloS,llamó alsigno de suma,se usará extensamente en este libro. Cuando por el
contexto es obvio qué valores deben agregarse, los símbolos arriba y abajoSserá omitido.

La media de la muestraCuando calculamos la media de una muestra de valores, se sigue el


procedimiento recién descrito con algunas modificaciones en la notación. Usamos -Xpara
designar la media muestral ynortepara indicar el número de valores en la muestra. Entonces, la
media muestral se expresa como
PAG
norte

Xi
- X¼i¼1 (2.4.2)
norte

EJEMPLO 2.4.2
En el Capítulo 1 seleccionamos una muestra aleatoria simple de 10 sujetos de la población de sujetos
representada en la Tabla 1.4.1. Calculemos ahora la edad media de los 10 sujetos de nuestra muestra.

Solución: Recordamos (ver Tabla 1.4.2) que las edades de los 10 sujetos de nuestra muestra eran
X1¼43;X2¼66;X3¼61;X4¼64;X5¼sesenta y cinco;X6¼38;X7¼59;X8¼57; X9¼57;X10¼50. La
sustitución de nuestros datos de muestra en la Ecuación 2.4.2 da

PAGnorte

Xi
i¼1 43þ66þ þ50
- X¼ ¼ ¼56
norte 10 &
40 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

Propiedades de la mediaLa media aritmética posee ciertas propiedades, algunas


deseables y otras no tan deseables. Estas propiedades incluyen lo siguiente:

1.Unicidad. Para un conjunto dado de datos existe una y sólo una media aritmética.
2.Sencillez. La media aritmética es fácil de entender y fácil de calcular.
3.Dado que todos y cada uno de los valores de un conjunto de datos entran en el cálculo de la media, se
ven afectados por cada valor. Los valores extremos, por lo tanto, tienen influencia sobre la media y, en
algunos casos, pueden distorsionarla tanto que se vuelve indeseable como medida de tendencia
central.

Como ejemplo de cómo los valores extremos pueden afectar la media, considere la siguiente
situación. Suponga que se encuesta a los cinco médicos que ejercen en un área para determinar sus
cargos por un determinado procedimiento. Suponga que informan estos cargos: $75, $75, $80, $80 y
$280. Se encuentra que el cargo medio de los cinco médicos es de $118, un valor que no es muy
representativo del conjunto de datos en su conjunto. El único valor atípico tuvo el efecto de inflar la
media.

MedianaLa mediana de un conjunto finito de valores es aquel valor que divide el conjunto en
dos partes iguales de manera que el número de valores iguales o mayores que la mediana es
igual al número de valores iguales o menores que la mediana. Si el número de valores es impar,
la mediana será el valor medio cuando todos los valores se hayan ordenado en orden de
magnitud. Cuando el número de valores es par, no hay un solo valor medio. En cambio, hay dos
valores medios. En este caso, la mediana se toma como la media de estos dos valores medios,
cuando todos los valores se han ordenado en el orden de sus magnitudes. En otras palabras, la
observación mediana de un conjunto de datos es ladnorteþ1Þ=2º cuando se haya ordenado la
observación. Si, por ejemplo, tenemos 11 observaciones, la mediana es lad11þ1Þ=2¼6ª
observación ordenada. Si tenemos 12 observaciones la mediana es el d12þ1Þ=2¼6:5
observación ordenada y es un valor a medio camino entre las observaciones ordenadas 6 y 7.

EJEMPLO 2.4.3
Ilustremos encontrando la mediana de los datos en la Tabla 2.2.1.

Solución: Los valores ya están ordenados, por lo que solo necesitamos encontrar los dos
valores medios. El valor medio es eldnorteþ1Þ=2¼ ð189þ1Þ=2¼190=2¼95 uno.
Contando desde el valor más pequeño hasta el 95, vemos que es 54. Así, la
mediana de edad de los 189 sujetos es 54 años. &

EJEMPLO 2.4.4
Deseamos encontrar la mediana de edad de los sujetos representados en la muestra descrita en el
ejemplo 2.4.2.

Solución: Ordenar las 10 edades en orden de magnitud de menor a mayor da 38, 43, 50,
57, 57, 59, 61, 64, 65, 66. Dado que tenemos un número par de edades, hay
2.4 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE TENDENCIA CENTRAL 41

no hay valor medio. Los dos valores medios, sin embargo, son 57 y 59. La
mediana, entonces, esd57þ59Þ=2¼58. &

Propiedades de la MedianaLas propiedades de la mediana incluyen lo siguiente:


1.Unicidad. Como ocurre con la media, solo hay una mediana para un conjunto de datos
dado.
2.Sencillez. La mediana es fácil de calcular.
3.No se ve afectado tan drásticamente por los valores extremos como la media.

El modoLa moda de un conjunto de valores es aquel valor que ocurre con mayor frecuencia. Si todos
los valores son diferentes no hay moda; por otro lado, un conjunto de valores puede tener más de
una moda.

EJEMPLO 2.4.5
Encuentre la edad modal de los sujetos cuyas edades se dan en la Tabla 2.2.1.

Solución: Un recuento de las edades en la Tabla 2.2.1 revela que la edad 53 ocurre con mayor
frecuencia (17 veces). La moda para esta población de edades es 53. &

Para un ejemplo de un conjunto de valores que tiene más de una moda,


consideremos un laboratorio con 10 empleados cuyas edades son 20, 21, 20, 20, 34, 22,
24, 27, 27 y 27. Podríamos decir que estos datos tienen dos modas, 20 y 27. La muestra
que consta de los valores 10, 21, 33, 53 y 54 no tiene moda ya que todos los valores son
diferentes.
La moda también se puede utilizar para describir datos cualitativos. Por ejemplo, supongamos que los
pacientes atendidos en una clínica de salud mental durante un año determinado recibieron uno de los
siguientes diagnósticos: retraso mental, síndrome cerebral orgánico, psicosis, neurosis y trastorno de
personalidad. El diagnóstico que ocurre con mayor frecuencia en el grupo de pacientes se denominaría
diagnóstico modal.
Una propiedad atractiva de una distribución de datos ocurre cuando la media, la
mediana y la moda son todas iguales. La conocida "curva en forma de campana" es una
representación gráfica de una distribución para la cual la media, la mediana y la moda son
todas iguales. Gran parte de la inferencia estadística se basa en esta distribución, la más común
de las cuales es la distribución normal. La distribución normal se presenta en la Sección 4.6 y se
analiza con más detalle en los capítulos siguientes. Otra distribución común de este tipo es lat-
distribución, que se introduce en la Sección 6.3.

OblicuidadLas distribuciones de datos pueden clasificarse en función de si son simétricas o


asimétricas. Si una distribución es simétrica, la mitad izquierda de su gráfico (histograma o
polígono de frecuencias) será una imagen especular de su mitad derecha. Cuando la mitad
izquierda y la mitad derecha del gráfico de una distribución no son imágenes especulares entre
sí, la distribución es asimétrica.
42 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

DEFINICIÓN
Si la gráfica (histograma o polígono de frecuencias) de una distribución es asimétrica, se
dice que la distribución essesgadoSi una distribución no es simétrica porque su gráfica
se extiende más a la derecha que a la izquierda, es decir, si tiene una cola larga a la
derecha, decimos que la distribución essesgado a la derechao essesgada positivamente.
Si una distribución no es simétrica porque su gráfica se extiende más a la izquierda que
a la derecha, es decir, si tiene una cola larga a la izquierda, decimos que la distribución
es sesgado a la izquierdao essesgada negativamente.

Una distribución estará sesgada a la derecha, o positivamente sesgada, si su media es mayor que su
moda. Una distribución tendrá un sesgo hacia la izquierda, o un sesgo negativo, si su media es menor que su
moda. La asimetría se puede expresar de la siguiente manera:

norte norte
pffiffiffiPAG pffiffiffiPAG
norte dXi- -XÞ3 norte dXi- -XÞ3
i¼1 i¼1
Oblicuidad¼ - 3=2
¼ pffiffiffiffiffiffiffiffiffiffiffiffi (2.4.3)
PAG
norte
dn-1Þ n-1s3
dXi- -XÞ2
i¼1

En la Ecuación 2.4.3,ses la desviación estándar de una muestra como se define en la Ecuación 2.5.4. La
mayoría de los paquetes estadísticos de computadora incluyen esta estadística como parte de una impresión
estándar. Un valor de asimetría > 0 indica asimetría positiva y un valor de asimetría < 0 indica asimetría
negativa. En la Figura 2.4.1 se muestra una ilustración de la asimetría.

EJEMPLO 2.4.6
Considere las tres distribuciones que se muestran en la figura 2.4.1. Dado que los histogramas
representan conteos de frecuencia, los datos pueden recrearse fácilmente e ingresarse en un paquete
estadístico. Por ejemplo, la observación de la distribución "Sin sesgo" arrojaría los siguientes datos:

FIGURA 2.4.1Tres histogramas que ilustran la asimetría.


2.5 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN 43

las distribuciones sesgadas de manera similar. Usando el software SPSS, se obtuvieron las
siguientes estadísticas descriptivas para estas tres distribuciones

Sin sesgo sesgo a la derecha Sesgo a la izquierda

Significar 8.0000 6.6667 8.3333


Mediana 8.0000 6.0000 9.0000
Modo 8.00 5.00 10.00
Oblicuidad . 000 . 627 - . 627
&

2.5 ESTADÍSTICAS DESCRIPTIVAS:


MEDIDAS DE DISPERSIÓN

Eldispersiónde un conjunto de observaciones se refiere a la variedad que exhiben. Una medida de


dispersión transmite información sobre la cantidad de variabilidad presente en un conjunto de datos.
Si todos los valores son iguales, no hay dispersión; si no son todos iguales, la dispersión está presente
en los datos. La cantidad de dispersión puede ser pequeña cuando los valores, aunque diferentes,
están muy juntos. La Figura 2.5.1 muestra los polígonos de frecuencia para dos poblaciones que
tienen medias iguales pero cantidades diferentes de variabilidad. La población B, que es más variable
que la población A, está más dispersa. Si los valores están muy dispersos, la dispersión es mayor.
Otros términos utilizados como sinónimos de dispersión incluyenvariación, dispersión,ydispersión.

El rangoUna forma de medir la variación en un conjunto de valores es calcular la rango.El


rango es la diferencia entre el valor más grande y el más pequeño en un conjunto de
observaciones. Si denotamos el rango porR,el mayor valor porXL, y el valor más pequeño porXS,
calculamos el rango de la siguiente manera:

R¼XL- XS (2.5.1)

Población A

Población B

metro

FIGURA 2.5.1Dos distribuciones de frecuencia con medias iguales pero diferentes cantidades de
dispersión.
44 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

EJEMPLO 2.5.1
Deseamos calcular el rango de edades de los sujetos de la muestra discutidos en la Tabla 2.2.1.

Solución: Dado que el sujeto más joven de la muestra tiene 30 años y el mayor 82,
calculamos que el rango es

R¼82 - 30¼52 &

La utilidad de la gama es limitada. El hecho de que tenga en cuenta solo dos valores hace que sea una
mala medida de dispersión. La principal ventaja de usar el rango es la simplicidad de su cálculo. Dado
que el rango, expresado como una sola medida, brinda información mínima sobre un conjunto de
datos y, por lo tanto, tiene un uso limitado, a menudo es preferible expresar el rango como un par de
números.½XS;XL, en el cualXSyXLson los valores más pequeño y más grande en el conjunto de datos,
respectivamente. Para los datos del ejemplo 2.5.1, podemos expresar el rango como el par de
números [30, 82]. Aunque esta no es la expresión tradicional para el rango, es intuitivo imaginar que
el conocimiento de los valores mínimo y máximo en este conjunto de datos transmitiría más
información que saber solo que el rango es igual a 52. Un número infinito de distribuciones, cada una
con valores mínimos y máximos bastante diferentes, puede tener un rango de 52.

la varianzaCuando los valores de un conjunto de observaciones se encuentran cerca de su media, la


dispersión es menor que cuando están dispersos en un amplio rango. Dado que esto es cierto, sería
intuitivamente atractivo si pudiéramos medir la dispersión relativa a la dispersión de los valores sobre su
media. Tal medida se realiza en lo que se conoce como eldiferencia.Al calcular la varianza de una muestra de
valores, por ejemplo, restamos la media de cada uno de los valores, elevamos al cuadrado las diferencias
resultantes y luego sumamos las diferencias al cuadrado. Esta suma de las desviaciones al cuadrado de los
valores de su media se divide por el tamaño de la muestra, menos 1, para obtener la varianza de la muestra.
Alquilers2representan la varianza de la muestra, el procedimiento se puede escribir en forma notacional de la
siguiente manera:

PAG
norte

dXi- -XÞ2
s2¼i¼1
(2.5.2)
n-1

Por lo tanto, es fácil ver que la varianza se puede describir como la desviación cuadrada promedio de
los valores individuales de la media de ese conjunto. Puede parecer poco intuitivo en esta etapa que
las diferencias en el numerador se eleven al cuadrado. Sin embargo, considere una distribución
simétrica. Es fácil imaginar que si calculamos la diferencia de cada punto de datos en la distribución a
partir del valor medio, la mitad de las diferencias serían positivas y la mitad negativas, lo que daría
como resultado una suma que sería cero. Una varianza de cero sería una medida no informativa para
cualquier distribución de números, excepto una en la que todos los valores son iguales. Por lo tanto,
el cuadrado de cada diferencia se usa para asegurar un numerador positivo y, por lo tanto, una
medida de dispersión mucho más valiosa.

EJEMPLO 2.5.2
Ilustremos calculando la varianza de las edades de los sujetos discutidos en el
Ejemplo 2.4.2.
2.5 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN 45

Solución: d43 - 56Þ2þ ð66 - 56Þ2þ þ ð50 - 56Þ2


s2 ¼
9
810
¼ ¼90
9 &

Grados de libertadLa razón de dividir porn-1 en lugar denorte,como podríamos haber esperado, es
la consideración teórica referida comogrados de libertad.Al calcular la varianza, decimos que tenemos
n-1grados de libertad.Razonamos de la siguiente manera. La suma de las desviaciones de los valores
de su media es igual a cero, como puede verse. Si conocemos los valores den-1 de las desviaciones de
la media, conocemos el norteth uno, ya que se determina automáticamente debido a la necesidad de
todosnortevalores para sumar a cero. Desde un punto de vista práctico, dividir las diferencias al
cuadrado porn-1 en lugar de nortees necesario para utilizar la varianza muestral en los
procedimientos de inferencia que se analizan más adelante. El concepto de grados de libertad será
revisado en un capítulo posterior. Los estudiantes interesados en profundizar en el tema en este
momento deben consultar el artículo de Walker (2).
Cuando calculamos la varianza de una población finita denortevalores, se siguen los
procedimientos descritos anteriormente excepto que restamosmetrode cadaXy dividir pornorteen vez
denorte-1. Si dejamoss2representan la varianza de la población finita, la fórmula es la siguiente:

PAG
norte

dXi-metroÞ2
s2¼i¼1
(2.5.3)
norte

Desviación EstándarLa varianza representa unidades al cuadrado y, por tanto, no es una medida
apropiada de dispersión cuando queremos expresar este concepto en términos de las unidades
originales. Para obtener una medida de dispersión en unidades originales, simplemente tomamos la
raíz cuadrada de la varianza. El resultado se llamaDesviación Estándar.En general, la desviación
estándar de una muestra viene dada por

vffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
arriba
norte

tu dxi - -xÞ2
pffiffiffiffi t i¼1
s¼s2¼ (2.5.4)
n-1

La desviación estándar de una población finita se obtiene sacando la raíz cuadrada de la


cantidad obtenida por la Ecuación 2.5.3, y se representa pors.

El coeficiente de variaciónLa desviación estándar es útil como medida de variación dentro de


un conjunto dado de datos. Sin embargo, cuando se desea comparar la dispersión en dos
conjuntos de datos, comparar las dos desviaciones estándar puede conducir a resultados
erróneos. Puede ser que las dos variables involucradas se midan en unidades diferentes. Por
ejemplo, podemos desear saber, para cierta población, si los niveles de colesterol sérico,
medidos en miligramos por 100 ml, son más variables que el peso corporal, medido en libras.
Además, aunque se utilice la misma unidad de medida, los dos medios pueden ser bastante
diferentes. Si comparamos la desviación estándar de los pesos de los niños de primer grado con la
desviación estándar de los pesos de los estudiantes de primer año de secundaria, podemos encontrar
que la última desviación estándar es numéricamente mayor que la primera, porque los pesos mismos
son mayores, no porque la dispersión es mayor.
46 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

Lo que se necesita en situaciones como estas es una medida de variación relativa en


lugar de una variación absoluta. Tal medida se encuentra en elcoeficiente de variación,que
expresa la desviación estándar como porcentaje de la media. La fórmula está dada por

s
CV:¼ ð100Þ% (2.5.5)
-X

Vemos que, dado que la media y las desviaciones estándar se expresan en la misma
unidad de medida, la unidad de medida se cancela al calcular el coeficiente de variación. Lo que
tenemos, entonces, es una medida que es independiente de la unidad de medida.

EJEMPLO 2.5.3
Supongamos que dos muestras de machos humanos arrojan los siguientes resultados:

Muestra 1 Muestra 2

Edad 25 años 11 años


Peso medio 145 libras 80 libras
Desviación Estándar 10 libras 10 libras

Deseamos saber cuál es más variable, los pesos de los de 25 años o los de los de
11 años.
Solución: Una comparación de las desviaciones estándar podría llevar a la conclusión de que las dos
muestras poseen la misma variabilidad. Sin embargo, si calculamos los coeficientes de
variación, tenemos para los jóvenes de 25 años

10
CV:¼ d100¼6:9%
145

y para los de 11 años

10
CV:¼ d100¼12:5%
80

Si comparamos estos resultados, obtenemos una impresión bastante diferente. Está


claro a partir de este ejemplo que la variación es mucho mayor en la muestra de 11
años que en la muestra de 25 años. &

El coeficiente de variación también es útil para comparar los resultados obtenidos por
diferentes personas que realizan investigaciones que involucran la misma variable. Dado que el
coeficiente de variación es independiente de la escala de medición, es una estadística útil para
comparar la variabilidad de dos o más variables medidas en diferentes escalas. Podríamos, por
ejemplo, usar el coeficiente de variación para comparar la variabilidad en los pesos de una
muestra de sujetos cuyos pesos se expresan en libras con la variabilidad en los pesos de otra
muestra de sujetos cuyos pesos se expresan en kilogramos.
2.5 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN 47

Variable NN* Media SE Media StDev Mínimo Q1 Mediana Máximo Q3


C1 10 0 56,00 3,00 9,49 38,00 48,25 58,00 64,25 66,00

FIGURA 2.5.2Impresión de medidas descriptivas calculadas a partir de la muestra de edades en el


Ejemplo 2.4.2, paquete de software MINITAB.

Análisis informáticoLos paquetes de software de computadora brindan una variedad de


posibilidades en el cálculo de medidas descriptivas. La Figura 2.5.2 muestra una copia impresa
de las medidas descriptivas disponibles del paquete MINITAB. Los datos consisten en las
edades del Ejemplo 2.4.2.
en la impresiónq1yq3son el primer y tercer cuartil, respectivamente. Estas medidas se
describen más adelante en este capítulo. N representa el número de observaciones de datos y
N representa el número de valores faltantes. El término SEMEAN significaError estandar de la
media.Esta medida se discutirá en detalle en un capítulo posterior. La Figura 2.5.3 muestra,
para los mismos datos, el SAS®impresión obtenida mediante la instrucción PROC MEANS.

Percentiles y cuartilesLa media y la mediana son casos especiales de una familia de parámetros
conocidos comoparámetros de ubicación.Estas medidas descriptivas se llaman parámetros de
ubicación porque se pueden usar para designar ciertas posiciones en el eje horizontal cuando se
grafica la distribución de una variable. En ese sentido, los llamados parámetros de ubicación “ubican”
la distribución en el eje horizontal. Por ejemplo, una distribución con una mediana de 100 se ubica a la
derecha de una distribución con una mediana de 50 cuando se representan gráficamente las dos
distribuciones. Otros parámetros de ubicación incluyen percentiles y cuartiles. Podemos definir un
percentil de la siguiente manera:

DEFINICIÓN
Dado un conjunto denorteobservacionesX1;X2; . . .Xnorte, elpagpercentilPAGes el valor
deXtal quepagpor ciento o menos de las observaciones son menores quePAG yd100 -
pagÞpor ciento o menos de las observaciones son mayores quePAG.

El procedimiento MEDIOS
Variable de análisis: Edad
norte Significar Desv estándar Mínimo Máximo
10 56.0000000 9.4868330 38.0000000 66.0000000

coeficiente de
Error estándar Suma Diferencia Variación
3.0000000 560.0000000 90.0000000 16.9407732

FIGURA 2.5.3Impresión de medidas descriptivas calculadas a partir de la muestra de edades en el


Ejemplo 2.4.2, SAS®paquete de software.
48 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

Subíndices enPAGsirven para distinguir un percentil de otro. El percentil 10, por


ejemplo, se designaPAG10, el 70 se designaPAG70, etcétera. El percentil 50 es la
mediana y se designaPAG50. El percentil 25 a menudo se conoce como elprimer
cuartil y denotadoq1. El percentil 50 (la mediana) se conoce como el segundo ocuartil
medioy escritoq2, y el percentil 75 se conoce como eltercer cuartil, Q3.
Cuando deseamos encontrar los cuartiles para un conjunto de datos, se utilizan las siguientes fórmulas:

9
q1¼
norteþ1
>
4
la observación ordenada >
>
>
=
2dnorteþ1Þ norteþ1
q2¼ ¼ la observación ordenada
>
(2.5.6)
4 2 >
>
>
3dnorteþ1Þ ;
q3¼ la observación ordenada
4

Cabe señalar que las ecuaciones que se muestran en 2.5.6 determinan las posiciones de los cuartiles
en un conjunto de datos, no los valores de los cuartiles. También se debe tener en cuenta que,
aunque existe una forma universal de calcular la mediana (q2), hay una variedad de formas de calcular
q1, y q2valores. Por ejemplo, SAS proporciona un total de cinco formas diferentes de calcular los
valores de los cuartiles, y otros programas implementan incluso métodos diferentes. Para una
discusión de los diversos métodos para calcular cuartiles, los lectores interesados pueden consultar
el artículo de Hyndman y Fan (3). Para ilustrar, observe que la impresión en MINITAB en la Figura 2.5.2
muestraq1¼48.25 yq3¼64.25, mientras que el programaRda los valoresq1¼52.75 y q3¼63.25.

Rango intercuartilComo hemos visto, el rango proporciona una medida cruda de la


variabilidad presente en un conjunto de datos. Una desventaja del rango es el hecho de que se
calcula a partir de solo dos valores, el más grande y el más pequeño. Una medida similar que
refleja la variabilidad entre el 50 por ciento medio de las observaciones en un conjunto de datos
es larango intercuartil.

DEFINICIÓN
El rango intercuartílico (RIC) es la diferencia entre el tercer y el primer
cuartil: es decir,
IQR¼q3-q1 (2.5.7)

Un IQR grande indica una gran cantidad de variabilidad entre el 50 por ciento medio de las
observaciones relevantes, y un IQR pequeño indica una pequeña cantidad de variabilidad entre
las observaciones relevantes. Dado que tales declaraciones son bastante vagas, es más
informativo comparar el rango intercuartílico con el rango de todo el conjunto de datos. Se
puede hacer una comparación formando la relación entre el IQR y el rango (R)y multiplicando
por 100. Es decir, 100 (IQR/R)nos dice qué porcentaje es el IQR del rango total.

curtosisAsí como podemos describir una distribución en términos de asimetría, podemos describir
una distribución en términos de curtosis.
2.5 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN 49

DEFINICIÓN
curtosises una medida del grado en que una distribución tiene un "pico" o es plana en
comparación con una distribución normal cuyo gráfico se caracteriza por una
apariencia en forma de campana.

Una distribución, en comparación con una distribución normal, puede poseer una proporción
excesiva de observaciones en sus colas, por lo que su gráfica presenta una apariencia achatada. Se
dice que tal distribución esplaticúrtico.Por el contrario, una distribución, en comparación con una
distribución normal, puede tener una menor proporción de observaciones en sus colas, de modo que
su gráfico muestre una apariencia más puntiaguda. Se dice que tal distribución esleptocúrtico.Se dice
que una distribución normal o en forma de campana esmesocúrtico.
La curtosis se puede expresar como

PAG norte
PAG norte

norte dXi- -XÞ4 norte dXi- -XÞ4


i¼1
curtosis¼ -i¼1 2
- 3¼ - 3 (2.5.8)
PAG
norte
dn-1Þ2s4
dXi- -XÞ2
i¼1

El cálculo manual usando la Ecuación 2.5.8 generalmente no es necesario, ya que la mayoría de los
paquetes estadísticos calculan y reportan información sobre la curtosis como parte de las estadísticas
descriptivas para un conjunto de datos. Tenga en cuenta que cada una de las dos partes de la
Ecuación 2.5.8 se ha reducido en 3. Una distribución perfectamente mesocúrtica tiene una medida de
curtosis de 3 según la ecuación. La mayoría de los algoritmos informáticos reducen la medida en 3,
como se hace en la Ecuación 2.5.8, de modo que la medida de curtosis de una distribución
mesocúrtica será igual a 0. Entonces, una distribución leptocúrtica tendrá una medida de curtosis > 0,
y una distribución platicúrtica distribución tendrá una medida de curtosis < 0. Tenga en cuenta que no
todos los paquetes de computadora hacen este ajuste. En tales casos, las comparaciones con una
distribución mesocúrtica se realizan contra 3 en lugar de contra 0.

EJEMPLO 2.5.4
Considere las tres distribuciones que se muestran en la Figura 2.5.4. Dado que los histogramas
representan conteos de frecuencia, los datos pueden recrearse fácilmente e ingresarse en un paquete
estadístico. Por ejemplo, la observación de la distribución "mesokúrtica" arrojaría los siguientes datos:
1, 2, 2, 3, 3, 3, 3, 3, . . . , 9, 9, 9, 9, 9, 10, 10, 11. Los valores se pueden obtener de las otras
distribuciones de manera similar. Usando el software SPSS, se obtuvieron las siguientes estadísticas
descriptivas para estas tres distribuciones:

mesocúrtico leptocúrtico platicúrtico

Significar 6.0000 6.0000 6.0000


Mediana 6.0000 6.0000 6.0000
Modo 6.00 6.00 6.00
curtosis . 000 . 608 - 1.158
&
50 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

FIGURA 2.5.4Tres histogramas que representan la curtosis.

Diagramas de caja y bigotesUn dispositivo visual útil para comunicar la información contenida en
un conjunto de datos es eldiagrama de caja y bigotes.La construcción de un diagrama de caja y
bigotes (a veces llamado, simplemente,diagrama de caja)hace uso de los cuartiles de un conjunto de
datos y puede lograrse siguiendo estos cinco pasos:

1.Representa la variable de interés en el eje horizontal.


2.Dibuje un cuadro en el espacio sobre el eje horizontal de tal manera que el extremo izquierdo del
cuadro se alinee con el primer cuartilq1y el extremo derecho de la caja se alinea con el tercer
cuartilq3.
3.Divide la caja en dos partes por una línea vertical que se alinea con la medianaq2.
4.Dibuja una línea horizontal llamadabigotedesde el extremo izquierdo del cuadro hasta un punto que se
alinee con la medida más pequeña del conjunto de datos.

5.Dibuja otra línea horizontal, o bigote, desde el extremo derecho del cuadro hasta un punto que se alinee
con la medida más grande del conjunto de datos.

El examen de un diagrama de caja y bigotes para un conjunto de datos revela información


sobre la cantidad de dispersión, la ubicación de la concentración y la simetría de los datos.
El siguiente ejemplo ilustra la construcción de un diagrama de caja y bigotes.

EJEMPLO 2.5.5
Evans et al. (A-7) examinó el efecto de la velocidad sobre las fuerzas de reacción del suelo (GRF)
en perros con cojera por un ligamento cruzado craneal desgarrado. Los perros fueron
paseados y trotados sobre una plataforma de fuerza, y se registró el GRF durante una
determinada fase de su actuación. La Tabla 2.5.1 contiene 20 medidas de fuerza donde cada
valor mostrado es la media de cinco medidas de fuerza por perro al trote.

TABLA 2.5.1 Mediciones de GRF al trote de 20 perros con ligamento cojo

14.6 24.3 24,9 27,0 27.2 27.4 28.2 28.8 29,9 30.7
31.5 31.6 32.3 32.8 33.3 33.6 34.3 36,9 38.3 44.0
Fuente: Datos proporcionados por cortesía de Richard Evans, Ph.D.
2.5 ESTADÍSTICAS DESCRIPTIVAS: MEDIDAS DE DISPERSIÓN 51

14 dieciséis 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46
Mediciones de GRF
FIGURA 2.5.5Diagrama de caja y bigotes para el ejemplo 2.5.5.

Solución: Las medidas más pequeña y más grande son 14,6 y 44,
respectivamente. El primer cuartil es elq1¼ ð20þ1Þ=4¼Medida 5:25,
que es 27:2þ ð:25Þð27:4 - 27:2¼27:25. La mediana es laq2þ ð20þ1Þ=
2¼ 10:5ª medida o 30:7þ ð:5Þð31:5 - 30:7¼31:1; y el tercer cuartil es
elq3þ3d20þ1Þ=4¼Medida 15:75, que es igual a 33:3þ ð:75Þð33:6 -
33:3¼33:525. El rango intercuartílico es IQR¼33:525 - 27:25¼6:275. El
rango es 29.4 y el IQR es 100d6:275=29:4¼21 por ciento del rango. El
diagrama de caja y bigotes resultante se muestra en la Figura 2.5.5.
&

El examen de la figura 2.5.5 revela que el 50 por ciento de las medidas están entre 27 y
33, los valores aproximados del primer y tercer cuartil, respectivamente. La barra vertical
dentro de la caja muestra que la mediana es aproximadamente 31.
Muchos paquetes de software estadístico tienen la capacidad de construir diagramas de caja y
bigotes. La Figura 2.5.6 muestra una construida por MINITAB y otra construida por NCSS a partir de los datos
de la Tabla 2.5.1. El procedimiento para producir la gráfica MINTAB se muestra en la Figura 2.5.7. Los
asteriscos en la Figura 2.5.6 nos alertan sobre el hecho de que el conjunto de datos contiene un valor
inusualmente grande y otro inusualmente pequeño, llamadovalores atípicosLos valores atípicos son los
perros que generaron fuerzas de 14,6 y 44. La figura 2.5.6 ilustra el hecho de que los diagramas de caja y
bigotes pueden mostrarse tanto vertical como horizontalmente.
Un valor atípico, o una observación típica, se puede definir de la siguiente manera.

45 45
*
40

35 35

30
Fuerza

25 25

20

15
* 15

FIGURA 2.5.6Diagrama de caja y bigotes construido por MINITAB (izquierda) y por R (derecha) a partir de los datos de
la Tabla 2.5.1.
52 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

Caja de diálogo: Comando de sesión:

Estadística AED diagrama de caja Simple MTB > Boxplot 'Fuerza';


Hacer clicDE ACUERDO. SUBC> Caja IQR;
SUBC> Valor atípico.
TipoFuerzaVariables gráficas. Hacer clic
DE ACUERDO.

FIGURA 2.5.7Procedimiento MINITAB para producir la Figura 2.5.6.

DEFINICIÓN
Unparte aisladaes una observación cuyo valor,X,excede el valor del tercer
cuartil en una magnitud superior a 1,5 (IQR) o es inferior al valor del
primer cuartil en una magnitud superior a 1,5 (IQR). Es decir, una
observación dex > q3þ1:5dIQRÞo una observación de x < Q1- 1:5dIQRÞse
llama un valor atípico.

Para los datos de la Tabla 2.5.1 podemos usar los valores previamente calculados deq1;q3
, y IQR para determinar cuán grande o pequeño tendría que ser un valor para ser considerado
un valor atípico. Los cálculos son los siguientes:

X <27:25 - 1:5d6:275¼17:8375 yX >33:525þ1:5d6:275¼42:9375

Entonces, para los datos de la Tabla 2.5.1, un valor observado inferior a 17,8375 o superior a
42,9375 se consideraría un valor atípico.
el sas®La sentencia PROC UNIVARIATE se puede utilizar para obtener un diagrama de caja y
bigotes. La declaración también produce otras medidas y presentaciones descriptivas, incluidos
diagramas de tallo y hojas, medias, varianzas y cuartiles.

Análisis exploratorio de datosLos diagramas de caja y bigotes y los diagramas de tallo y hojas son
ejemplos de lo que se conoce comoanálisis exploratorio de datostecnicas Estas técnicas, que se
hicieron populares como resultado del trabajo de Tukey (4), permiten al investigador examinar datos
de manera que revelan tendencias y relaciones, identifican características únicas de conjuntos de
datos y facilitan su descripción y resumen.

EJERCICIOS

Para cada uno de los conjuntos de datos en los siguientes ejercicios, calcule (a) la media, (b) la mediana, (c) la
moda, (d) el rango, (e) la varianza, (f) la desviación estándar, (g) ) el coeficiente de variación, y (h) el rango
intercuartílico. Trata cada conjunto de datos como una muestra. Para aquellos ejercicios para los que crea
que sería apropiado, construya un diagrama de caja y bigotes y analice la utilidad para comprender la
naturaleza de los datos que proporciona este dispositivo. Para cada ejercicio, seleccione la medida de
tendencia central que considere más apropiada para describir los datos. Da razones para justificar tu
elección.
EJERCICIOS 53

2.5.1Porcellini et al. (A-8) estudiaron a 13 pacientes con VIH que fueron tratados con terapia antirretroviral de gran
actividad (HAART) durante al menos 6 meses. La célula T CD4 cuenta 106=Lal inicio del estudio para los 13
sujetos se enumeran a continuación.

230 205 313 207 227 245 173


58 103 181 105 301 169
Fuente: Simona Porcellini, Guiliana Vallanti, Silvia Nozza, Guido
Poli, Adriano Lazzarin, Guiseppe Tambussi, Antonio Grassia,
“Potencial timopoyético mejorado en individuos infectados por
VIH con TARGA mediante administración intermitente de IL-2,”
SIDA, 17 (2003), 1621–1630.

2.5.2Shair y Jasper (A-9) investigaron si la disminución del retorno venoso en ratas jóvenes afectaría las
vocalizaciones ultrasónicas (USV). Su investigación no mostró cambios significativos en el número de
vocalizaciones ultrasónicas cuando se extrajo sangre de la vena cava superior o de la arteria carótida.
Otra variable importante medida fue la frecuencia cardíaca (bmp) durante la extracción de sangre.
La siguiente tabla presenta la frecuencia cardíaca de siete crías de rata del experimento que involucra la arteria
carótida.

500 570 560 570 450 560 570


Fuente: Harry N. Shair y Anna Jasper, "El retorno venoso
disminuido no es suficiente ni necesario para provocar la
vocalización ultrasónica de crías de ratas infantiles"
Neurociencia conductual, 117 (2003), 840–853.

2.5.3Butz et al. (A-10) evaluaron la duración del beneficio derivado del uso de ventilación con presión positiva no invasiva en
pacientes con esclerosis lateral amiotrófica sobre los síntomas, la calidad de vida y la supervivencia. Una de las
variables de interés es la presión parcial de dióxido de carbono arterial (PaCO2). Los valores a continuación (mm Hg)
reflejan el resultado de las pruebas de referencia en 30 sujetos según lo establecido por los análisis de gases en
sangre arterial.

40,0 47,0 34,0 42,0 54,0 48,0 53,6 56,9 58,0 45,0
54,5 54,0 43,0 44,3 53,9 41,8 33,0 43,1 52,4 37,9
34,5 40,1 33,0 59,9 62,6 54,1 45,7 40,6 56,6 59,0
Fuente: M. Butz, KH Wollinsky, U. Widemuth-Catrinescu, A. Sperfeld,
S. Winter, HH Mehrkens, AC Ludolph y H. Schreiber, "Efectos longitudinales de la
ventilación con presión positiva no invasiva en pacientes con esclerosis lateral
amiotrófica".Diario Americano de Rehabilitación Médica, 82 (2003), 597–604.

2.5.4Según Almidón et al. (A-11), los injertos de tendones isquiotibiales han sido el “eslabón débil” en la
reconstrucción del ligamento cruzado anterior. En un estudio de laboratorio controlado, compararon dos
técnicas de reconstrucción: un tornillo de interferencia o un manguito central y un tornillo en el lado tibial.
Para ocho rodillas cadavéricas, las siguientes medidas representan la fuerza requerida (en newtons) a la que
se produjo el fallo inicial de las hebras del injerto para la técnica de tornillo y manguito central.

172,5 216,63 212,62 98,97 66,95 239,76 19,57 195,72


Fuente: David W. Starch, Jerry W. Alexander, Philip C. Noble, Suraj Reddy y David M. Lintner, “Fijación
de injerto de tendón de la corva de múltiples hebras con un tornillo de interferencia tibial estándar o
de cuatro cuadrantes central para la reconstrucción del ligamento cruzado anterior. ”El Diario
Americano de Medicina Deportiva, 31 (2003), 338–344.
54 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

2.5.5Cardosi et al. (A-12) realizó una revisión retrospectiva de 4 años de 102 mujeres sometidas a histerectomía
radical por cáncer cervical o endometrial. Se observó infección del tracto urinario asociada al catéter en 12 de
los sujetos. A continuación se muestra el número de días postoperatorios hasta el diagnóstico de la infección
para cada sujeto que experimentó una infección.

16104915 6 15
8191122 13 17
Fuente: Richard J. Cardosi, Rosemary Cardosi, Edward
C. Grendys Jr., James V. Fiorica y Mitchel S. Hoffman,
“Morbilidad infecciosa del tracto urinario con
Cateterismo vesical después de histerectomía radical”,Revista
americana de obstetricia y ginecología,
189 (2003), 380–384.

2.5.6El propósito de un estudio de Nozawa et al. (A-13) fue evaluar el resultado de la reparación quirúrgica del defecto de la pars
interarticularis mediante fijación segmentaria con alambre en adultos jóvenes con espondilólisis lumbar. Los autores
encontraron que históricamente la fijación segmentaria con alambre ha tenido éxito en el tratamiento de espondilólisis de
personas que no son deportistas, pero no existía información sobre los resultados de este tipo de cirugía en deportistas. En un
estudio retrospectivo, los autores encontraron 20 sujetos que se sometieron a la cirugía entre 1993 y 2000. Para estos sujetos,
los datos a continuación representan la duración en meses de la atención de seguimiento después de la operación.

103 68 62 60 60 54 49 44 42 41
38 36 34 30 19 19 19 19 17 dieciséis

Fuente: Satoshi Nozawa, Katsuji Shimizu, Kei Miyamoto y Mizuo


Tanaka, “Reparación del defecto pars interarticularis
por Fijación Segmental con Alambre en Atletas Jóvenes con Espondilólisis,”
Revista americana de medicina deportiva, 31 (2003), 359–364.

2.5.7Ver Ejercicio 2.3.1.


2.5.8Ver Ejercicio 2.3.2.
2.5.9Ver Ejercicio 2.3.3.
2.5.10Ver Ejercicio 2.3.4.
2.5.11Ver Ejercicio 2.3.5.
2.5.12Ver Ejercicio 2.3.6.
2.5.13Ver Ejercicio 2.3.7.
2.5.14En un estudio piloto, Huizinga et al. (A-14) quería obtener más información sobre los aspectos psicosociales
Consecuencias para los hijos de un padre con cáncer. Para el estudio, 14 familias participaron en entrevistas
semiestructuradas y completaron cuestionarios estandarizados. A continuación se muestra la edad del padre
enfermo con cáncer (en años) para las 14 familias.

37 48 53 46 42 49 44
38 32 32 51 51 48 41
Fuente: Gea A. Huizinga, Winette TA van der Graaf, Annemike Visser, Jos S.
Dijkstra y Josette EHM Hoekstra-Weebers, "Consecuencias psicosociales para
los hijos de un padre con cáncer"Enfermería oncológica, 26 (2003), 195–202.
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 2 55

2.6 RESUMEN

En este capítulo se explican varios procedimientos estadísticos descriptivos. Estos incluyen la


organización de datos por medio de la matriz ordenada, la distribución de frecuencias, la
distribución de frecuencias relativas, el histograma y el polígono de frecuencias. Se describen
los conceptos de tendencia central y variación, junto con los métodos para calcular sus medidas
más comunes: la media, la mediana, la moda, el rango, la varianza y la desviación estándar. El
lector también es introducido a los conceptos de asimetría y curtosis, y al análisis exploratorio
de datos a través de una descripción de diagramas de tallo y hojas y diagramas de caja y
bigotes.
Hacemos hincapié en el uso de la computadora como herramienta para calcular medidas descriptivas y
construir varias distribuciones a partir de grandes conjuntos de datos.

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 2

Fórmula
Número Nombre Fórmula

2.3.1 Ancho de intervalo de clase R



utilizando la regla de Sturges k

2.4.1 Media de una población PAG


norte

Xi
metro¼i¼1
norte

2.4.2 Oblicuidad norte


pffiffiffiPAG norte
pffiffiffiPAG
norte dXi- -XÞ3 norte dXi- -XÞ3
i¼1
Oblicuidad¼
- 3¼
i¼1pffiffiffiffiffiffiffiffiffiffiffi ð

PAG
norte 2 n-1Þn-1s3

dXi- -XÞ2
i¼1

2.4.2 Media de una muestra PAG


norte

Xi
- X¼i¼1
norte

2.5.1 Rango R¼XL- Xs

2.5.2 Varianza de la muestra PAG


norte

dXi- -XÞ2
s2¼i¼1
n-1

2.5.3 Varianza de la población PAG


norte

dXi-metroÞ2
s2¼i¼1
norte

(Continuación)
56 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

2.5.4 Desviación Estándar vffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi


arriba norte

tudXi- -XÞ2
s2¼ ti¼1
pffiffiffiffi


n-1

2.5.5 Coeficiente de variación s


CV:¼ ð100Þ%
-X

2.5.6 Ubicación del cuartil en 1


q1 ¼ dnorteþ1Þ
matriz ordenada 4
1
q2¼ dnorteþ1Þ
2
3
q3¼ dnorteþ1Þ
4

2.5.7 Rango intercuartil IQR¼q3-q1

2.5.8 curtosis PAG


norte
PAG norte

dXi- -XÞ4 norte dXi- -XÞ4


i¼1
curtosis¼ -i¼1 2 - 3¼ - 3
PAGnorte
dn-1Þ2s4
dXi- -XÞ2
i¼1

Clave de símbolo CV:¼coeficiente de variación IQR¼Rango

intercuartil k¼número de intervalos de

clase metro¼media de la población

norte¼tamaño de la poblacion norte¼

tamaño de la muestra

dn-1¼grados de libertad q1
¼primer cuartil
q2¼segundo cuartil¼mediana
q3¼tercer cuartil R¼rango

s¼Desviación Estándar s2
¼varianza muestral
s2¼varianza de la población Xi¼i

elobservación de datos XL¼punto

de datos más grande XS¼punto

de datos más pequeño

- X¼muestra promedio

w¼ancho de clase
PREGUNTAS DE REPASO Y EJERCICIOS 57

PREGUNTAS DE REPASO Y EJERCICIOS

1.Definir:
(a)Exhibición de tallo y hojas (b)Diagrama de caja y bigotes
(C)percentil (d)Cuartilla
(mi)Parámetro de ubicación (F)Análisis exploratorio de datos
(gramo)matriz ordenada (h)Distribución de frecuencias
(i)Distribución de frecuencias relativas (j)Estadística
(k)Parámetro (l)Polígono de frecuencia
(metro)Límites de clase verdaderos (norte)Histograma

2.Definir y comparar las características de la media, la mediana y la moda.


3.¿Cuáles son las ventajas y limitaciones del rango como medida de dispersión?

4.Explique la justificación del uson-1 para calcular la varianza de la muestra.

5.¿Cuál es el propósito del coeficiente de variación?

6.¿Cuál es el propósito de la regla de Sturges?

7.¿Cuál es otro nombre para el percentil 50 (cuartil segundo o medio)?


8.Describa de su campo de estudio una población de datos donde sería útil el conocimiento de la tendencia
central y la dispersión. Obtenga valores sintéticos reales o realistas de esta población y calcule la media, la
mediana, la moda, la varianza y la desviación estándar.

9.Recopile un conjunto de datos reales o realistas de su campo de estudio y construya una distribución de frecuencias, una
distribución de frecuencias relativas, un histograma y un polígono de frecuencias.

10Calcule la media, la mediana, la moda, la varianza y la desviación estándar de los datos del ejercicio 9.

11Encuentre un artículo en una revista de su campo de estudio en el que se haya calculado alguna medida de
tendencia central y dispersión.

12El propósito de un estudio de Tam et al. (A-15) fue investigar el manejo de la silla de ruedas en personas con lesión de la médula
espinal (LME) de nivel inferior y controles sanos. Los sujetos utilizaron una silla de ruedas modificada para incorporar una
superficie de asiento rígida para facilitar las medidas experimentales especificadas. La medición de la presión de la interfaz se
registró mediante el uso de una alfombra sensible a la presión de alta resolución con una resolución espacial de 4 sensores por
centímetro cuadrado pegada en el soporte rígido del asiento. Durante las condiciones estáticas de sedestación, se registraron
presiones promedio debajo de las tuberosidades isquiáticas. Los datos para las mediciones de la tuberosidad isquiática
izquierda (en mm Hg) para los grupos SCI y control se muestran a continuación.

Control 131 115 124 131 122 117 88 114 150 169

LME 60 150 130 180 163 130 121 119 130 148
Fuente: Eric W. Tam, Arthur F. Mak, Wai Nga Lam, John H. Evans y York Y. Chow,
“Movimiento pélvico y distribución de la presión de interfaz durante la propulsión manual
en silla de ruedas”Archivos de Medicina Física y Rehabilitación, 84 (2003), 1466–1472.

(a)Encuentre la media, la mediana, la varianza y la desviación estándar de los controles.


(b)Encuentre la media, la varianza de la mediana y la desviación estándar para el grupo SCI.
58 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

(C)Construya un diagrama de caja y bigotes para los controles.


(d)Construya un diagrama de caja y bigotes para el grupo SCI.
(mi)¿Cree que hay una diferencia en las lecturas de presión para los controles y los sujetos con SCI en este estudio?

13Johnson et al. (A-16) realizó una revisión retrospectiva de 50 fetos que se sometieron a cierre de mielomeningocele fetal
abierto. Los datos a continuación muestran la edad gestacional en semanas de los 50 fetos que se sometieron al
procedimiento.

25 25 26 27 29 29 29 30 30 31
32 32 32 33 33 33 33 34 34 34
35 35 35 35 35 35 35 35 35 36
36 36 36 36 36 36 36 36 36 36
36 36 36 36 36 36 36 36 37 37
Fuente: Mark P. Johnson, Leslie N. Sutton, Natalie Rintoul, Timothy M. Crombleholme,
Alan W. Flake, Lori J. Howell, Holly L. Hedrick, R. Douglas Wilson y N. Scott Adzick,
“Reparación del mielomeningocele fetal : Resultados clínicos a corto plazo,” Revista
americana de obstetricia y ginecología, 189 (2003), 482–487.

(a)Construya un diagrama de tallo y hojas para estas edades gestacionales.

(b)Con base en el diagrama de tallo y hojas, ¿qué palabra usarías para describir la naturaleza de los datos?
(C)¿Por qué crees que el diagrama de tallo y hojas se ve así?
(d)Calcule la media, la mediana, la varianza y la desviación estándar.

14La siguiente tabla muestra la distribución por edades de la cantidad de muertes en el estado de Nueva York debido a
accidentes de residentes de 25 años o más.

Número de muertes
Años de edad) Debido a Accidentes

25–34 393
35–44 514
45–54 460
55–64 341
65–74 365
75–84 616
85–94 618
Fuente: Departamento de Salud del Estado de Nueva York,
Estadísticas Vitales del Estado de Nueva York, 2000, Tabla 32:
Información resumida de defunciones por edad.
Puede incluir muertes por accidente de adultos mayores de 94
años.

Para estos datos, construya una distribución de frecuencias acumuladas, una distribución de frecuencias relativas y una
distribución de frecuencias relativas acumuladas.

15.Krieser et al. (A-17) examinó la tasa de filtración glomerular (TFG) en receptores pediátricos de trasplante renal.
La TFG es un parámetro importante de la función renal evaluada en receptores de trasplante renal.
Las siguientes son mediciones de 19 sujetos de GFR medidas con ácido dietilentriamina
pentaacético. (Nota: algunos sujetos se midieron más de una vez).
PREGUNTAS DE REPASO Y EJERCICIOS 59

18 42
21 43
21 43
23 48
27 48
27 51
30 55
32 58
32 60
32 62
36 67
37 68
41 88
42 63
Fuente: Datos proporcionados por cortesía de DMZ Krieser, MD

(a)Calcule la media, la mediana, la varianza, la desviación estándar y el coeficiente de variación.


(b)Construya una representación de tallo y hojas.

(C)Construya un diagrama de caja y bigotes.


(d)¿Qué porcentaje de las mediciones está dentro de una desviación estándar de la media? ¿Dos desviaciones
estándar? ¿Tres desviaciones estándar?

dieciséis.Los siguientes son los niveles de cistatina C (mg/L) para los pacientes descritos en el Ejercicio 15 (A-17). La
cistatina C es una proteína básica catiónica que se investigó por su relación con los niveles de GFR. Además,
también se dan los niveles de creatinina. (Nota: algunos sujetos se midieron más de una vez).

Cistatina C (mg/L) Creatinina (mmol/L)

1.78 4.69 0.35 0.14


2.16 3.78 0.30 0.11
1.82 2.24 0.20 0.09
1.86 4.93 0.17 0.12
1.75 2.71 0.15 0.07
1.83 1.76 0.13 0.12
2.49 2.62 0.14 0.11
1.69 2.61 0.12 0.07
1.85 3.65 0.24 0.10
1.76 2.36 0.16 0.13
1.25 3.25 0.17 0.09
1.50 2.01 0.11 0.12
2.06 2.51 0.12 0.06
2.34
Fuente: Datos proporcionados por cortesía de DMZ Krieser, MD

(a)Para cada variable, calcule la media, la mediana, la varianza, la desviación estándar y el coeficiente de
variación.
(b)Para cada variable, construya un diagrama de tallo y hojas y un diagrama de caja y bigotes.
(C)¿Qué conjunto de medidas es más variable, la cistatina C o la creatinina? ¿En qué basas tu
respuesta?
60 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

17Da tres sinónimos de variación (variabilidad).


18La siguiente tabla muestra la distribución por edades de los nacidos vivos en el condado de Albany, Nueva York, para el año 2000.

edad de la madre Número de nacidos vivos

10–14 7
15–19 258
20–24 585
25–29 841
30–34 981
35–39 526
40–44 99
45–49 4
Fuente: Departamento de Salud del Estado de Nueva York, Estadísticas
vitales anuales 2000, Tabla 7, Nacidos vivos por condado de residencia
y edad de la madre.
Puede incluir nacidos vivos de madres mayores de 49 años.

Para estos datos, construya una distribución de frecuencias acumuladas, una distribución de frecuencias relativas y una
distribución de frecuencias relativas acumuladas.

19Spivack (A-18) investigó la gravedad de la enfermedad asociada conC. dificultaden pacientes pediátricos hospitalizados.
Una de las variables que examinaron fue la cantidad de días que los pacientes experimentaron diarrea. Los datos de
los 22 sujetos del estudio aparecen a continuación. Calcule la media, la mediana, la varianza y la desviación estándar.

3 11 3 4 14 2 4 5 3 11 2
2 3 2 1 1 7 2 1 1 3 2
Fuente: Jordan G. Spivack, Stephen C. Eppes y Joel D. Klien,
“Clostridium Difficile–Diarrea asociada en un hospital
pediátrico”,Pediatría Clínica, 42 (2003), 347–352.

20Exprese en palabras las siguientes propiedades de la media muestral:


(a)Sdx - -xÞ2¼un mínimo
(b)nx¼SX
(C)Sdx - -x¼0
21Tu instructor de estadística te dice el primer día de clases que habrá cinco exámenes durante el trimestre. A
partir de los puntajes de estas pruebas para cada estudiante, el instructor calculará una medida de tendencia
central que servirá como calificación final del curso del estudiante. Antes de realizar el primer examen, debe
elegir si desea que su calificación final sea la media o la mediana de los cinco puntajes del examen. ¿Cuál
escogerías? ¿Por qué?

22Considere los siguientes posibles intervalos de clase para usar en la construcción de una distribución de frecuencia de los
niveles de colesterol sérico de los sujetos que participaron en un cribado masivo:

(a)50–74 (b)50–74 (C)50–75


75–99 75–99 75–100
100–149 100–124 100–125
150–174 125–149 125–150
PREGUNTAS DE REPASO Y EJERCICIOS 61

175–199 150–174 150–175


200–249 175–199 175–200
250–274 200–224 200–225
etc. 225–249 225–250
etc. etc.

¿Qué conjunto de intervalos de clase crees que es más apropiado para el propósito? ¿Por qué? Indique
específicamente para cada uno por qué cree que los otros dos son menos deseables.

23En una prueba de estadística, se pidió a los estudiantes que construyeran una distribución de frecuencia de los niveles de
creatina en sangre (unidades/litro) para una muestra de 300 sujetos sanos. La media fue 95 y la desviación estándar
fue 40. Los estudiantes utilizaron los siguientes intervalos de clase:

(a)1 (d)15
(b)5 (mi)20
(C)10 (F)25
Comente sobre la idoneidad de estas elecciones de anchos.

24Dé un ejemplo relacionado con las ciencias de la salud de una población de mediciones para las cuales la media
sería una mejor medida de tendencia central que la mediana.

25Dé un ejemplo relacionado con las ciencias de la salud de una población de mediciones para las cuales la mediana sería
una mejor medida de tendencia central que la media.

26Indique para las siguientes variables cuál cree que sería una mejor medida de tendencia central, la
media, la mediana o la moda, y justifique su elección:
(a)Ingresos anuales de enfermeras prácticas con licencia en el sureste.
(b)Diagnósticos de pacientes atendidos en el servicio de urgencias de un hospital de una gran ciudad.

(C)Pesos de jugadores de baloncesto masculino de secundaria.

27Consulte el Ejercicio 2.3.11. Calcule la media, la mediana, la varianza, la desviación estándar, el primer cuartil, el tercer
cuartil y el rango intercuartílico. Construya un diagrama de caja de los datos. ¿Son iguales la moda, la mediana y la
media? Si no, explique por qué. Discuta los datos en términos de variabilidad. Compare el IQR con el rango. ¿Qué te
dice la comparación sobre la variabilidad de las observaciones?

28Consulte el Ejercicio 2.3.12. Calcule la media, la mediana, la varianza, la desviación estándar, el primer cuartil, el tercer
cuartil y el rango intercuartílico. Construya un diagrama de caja de los datos. ¿Son iguales la moda, la mediana y la
media? Si no, explique por qué. Discuta los datos en términos de variabilidad. Compare el IQR con el rango. ¿Qué te
dice la comparación sobre la variabilidad de las observaciones?

29Thilothammal et al. (A-19) diseñó un estudio para determinar la eficacia de la vacuna BCG (bacillus Calmette-Gu-
erin) en la prevención de la meningitis tuberculosa. Entre los datos recopilados sobre cada sujeto se
encontraba una medida del estado nutricional (peso real expresado como porcentaje del peso esperado para
la altura real). La siguiente tabla muestra los valores del estado nutricional de los 107 casos estudiados.

73.3 54.6 82.4 76.5 72.2 73.6 74.0


80.5 71.0 56,8 80.6 100.0 79.6 67.3
50.4 66,0 83.0 72.3 55.7 64.1 66.3
50,9 71.0 76.5 99.6 79.3 76,9 96,0
64.8 74.0 72.6 80.7 109.0 68.6 73.8
74.0 72.7 65,9 73.3 84.4 73.2 70.0
72.8 73.6 70.0 77.4 76.4 66.3 50.5
62 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

72.0 97.5 130.0 68.1 86.4 70.0 73.0


59.7 89.6 76,9 74.6 67.7 91,9 55,0
90,9 70.5 88.2 70.5 74.0 55.5 80.0
76,9 78.1 63.4 58.8 92.3 100.0 84.0
71.4 84.6 123.7 93.7 76,9 79.6
45.6 92.5 65,6 61.3 64.5 72.7
77.5 76,9 80.2 76,9 88.7 78.1
60.6 59.0 84.7 78.2 72.4 68.3
67.5 76,9 82.6 85.4 65.7 65,9
Fuente: Datos proporcionados por cortesía del Dr. N. Thilothammal.

(a)Para estos datos, calcule las siguientes medidas descriptivas: media, mediana, moda, varianza,
desviación estándar, rango, primer cuartil, tercer cuartil y IQR.
(b)Construya los siguientes gráficos para los datos: histograma, polígono de frecuencia, diagrama de tallo y hojas y diagrama
de caja.

(C)Discuta los datos en términos de variabilidad. Compare el IQR con el rango. ¿Qué te dice la
comparación sobre la variabilidad de las observaciones?
(d)¿Qué proporción de las medidas están dentro de una desviación estándar de la media? ¿Dos
desviaciones estándar de la media? ¿Tres desviaciones estándar de la media?
(mi)¿Qué proporción de las medidas son menos de 100?
(F)¿Qué proporción de las medidas son menos de 50?

Ejercicios para usar con grandes conjuntos de datos disponibles en el siguiente sitio web:www.wiley.com/
college/daniel

1.Consulte el conjunto de datos NCBIRTH800. El Centro Estatal de Estadísticas de Salud de Carolina del Norte y el Instituto
Howard W. Odum para la Investigación en Ciencias Sociales de la Universidad de Carolina del Norte en Chapel Hill
(A-20) ponen a disposición del público datos sobre nacimientos y muertes infantiles de todos los niños nacidos en el
estado de North carolina Se puede acceder a estos datos enwww.irss.unc.edu/ncvital/bfd1down.html. Los registros
de nacimientos se remontan a 1968. Este completo conjunto de datos de nacimientos en 2001 contiene 120.300
registros. Los datos representan una muestra aleatoria de 800 de esos nacimientos y variables seleccionadas. Las
variables son las siguientes:

Etiqueta de variables Descripción

PLURALIDAD Número de hijos nacidos del embarazo Sexo


SEXO del hijod1¼masculino; 2¼femeninoÞ Edad de
MAGO la madre (años)
SEMANAS Semanas completas de gestación (semanas)
MARITAL Estado civild1¼casado; 2¼no casadoÞ
MAMÁ DE CARRERAS Raza de la madre (0¼otro no blanco, 1¼Blanco; 2¼Negro; 3¼indio
americano, 4¼Chino; 5¼Japonés; 6¼Hawaiano; 7¼filipino; 8¼otro asiático
o isleño del Pacífico)
HISPMOMÁ Madre de origen hispano (C¼Cubano; METRO¼Mexicano; norte¼No hispano,
O¼otro hispano y desconocido, P¼Puertorriqueños¼Centro=Sudamericano, U
¼no clasificable) Peso ganado durante el embarazo (libras) 0¼madre no fumó
GANADO durante el embarazo 1¼la madre fumo durante el embarazo
FUMAR
REFERENCIAS 63

BEBER 0¼madre no consumió alcohol durante el embarazo 1¼


la madre consumió alcohol durante el embarazo Peso
TONS del niño (onzas)
TGRAMOS Peso del niño (gramos)
BAJO 0¼el bebé no tenía bajo peso al nacer 1¼el
bebé tenía bajo peso al nacer 0¼el bebé no
ESTRENO era prematuro 1¼el bebé fue prematuro
Prematuro definido a las 36 semanas o
antes

Para las variables de MAGO, SEMANAS, GANADAS, TONOS y TGRAMOS:0

1.Calcule la media, la mediana, la desviación estándar, el IQR y el rango.

2.Para cada uno, construya un histograma y comente la forma de la distribución.

3.¿Se parecen mucho los histogramas de TOUNCES y TGRAMS? ¿Por qué?


4.Construya diagramas de caja y bigotes para las cuatro variables.

5.Construya diagramas de caja y bigotes uno al lado del otro para la variable de TOUNCES para mujeres
que admitieron fumar y mujeres que no admitieron fumar. ¿Ve alguna diferencia en el peso al nacer
en los dos grupos? ¿Qué grupo tiene más variabilidad?

6.Construya diagramas de caja y bigotes uno al lado del otro para la variable de MAGE para mujeres casadas y no
casadas. ¿Ves una diferencia en las edades en los dos grupos? ¿Qué grupo tiene más variabilidad?
¿Son sorprendentes los resultados?

7.Calcule la asimetría y la curtosis del conjunto de datos. ¿Qué indican?

REFERENCIAS

Referencias de metodología
1. HASTURGES, "La elección de un intervalo de clase",Revista de la Asociación Estadounidense de Estadística, 21 (1926), 65–
66.
2. hELENMWALKER, "Grados de libertad,"Revista de Psicología Educativa, 31 (1940), 253–269.
3. Rtransmisión exteriorJ HYNDMANy YANÁNFUN, “Cuantiles de muestra en paquetes estadísticos,”El Estadístico Americano, 50 (1996),
361–365.
4. jOHNWTUKEY,Análisis exploratorio de datos,Addison-Wesley, Reading, MA, 1977.

Aplicaciones Referencias
A-1. FARHADATASSI, “Cuidado oral en el hogar y las razones para buscar atención dental por parte de personas en diálisis
renal”, Revista de práctica dental contemporánea, 3 (2002), 031–041.
A-2. VALABHjANARDHAN, ROBERTOFRIEDLANDER, hPREMIORIINA, y PHILIPmiDWINSTIEG, “Identificación de pacientes en riesgo de
Morbilidad posprocedimiento después del tratamiento de aneurismas intracraneales incidentales: el papel del tamaño y la ubicación del
aneurisma”,Enfoque neuroquirúrgico, 13 (2002), 1–8.
A-3. AHOEKEMA, BHOVINGA, B. S.TEGENGA, y LGM De BONT, "Morfología craneofacial y apnea obstructiva del sueño:
un análisis cefalométrico"Revista de Rehabilitación Oral, 30 (2003), 690–696.
64 CAPÍTULO 2 ESTADÍSTICAS DESCRIPTIVAS

A-4. DÁVIDOS.SOLBÉN, "Contenido de selenio de venado, ardilla y carne de res comprada o producida en Ohio, una región baja en
selenio de los Estados Unidos",Revista de ciencia de los alimentos, 67 (2002), 431–433.
A-5. miRIKSKJELBO, THEONESTOKMUTABINGWA, IBBYGBJERG, kARÍNK. N.IELSEN, LARSF GRAMy kSOYBROSEN,
“Metabolismo de la cloroguanida en relación con la eficacia en la profilaxis de la malaria y laS-Oxidación de
mefenitoína en tanzanos”,Farmacología clínica y terapéutica, 59 (1996), 304–311.
A-6. HENRIKSCHMIDT, PAGOULmiRIKMETROORTENSEN, SARÉNLARSFALSGAARD, y miSTHERAJENSEN, “Autotransfusión después
El injerto de derivación de la arteria coronaria reduce a la mitad el número de pacientes que necesitan transfusiones de sangre”,Anales de
Cirugía Torácica, 61 (1996), 1178–1181.
A-7. RICHARDmiFURGONETAS, WANDAGRAMOORDÓN, y McomoCONZEMIO, "Efecto de la velocidad sobre las fuerzas de reacción del
suelo en perros con cojera atribuible al desgarro del ligamento cruzado craneal",Diario Americano de Investigación
Veterinaria, 64 (2003), 1479–1481.
A-8. SimonaPAGORCELINI, gUILIANAVALLANTÍ, SILVIAnorteOZA, gUIDOPAGOLI, ADRIANOLAzzarín, gUISEPPETAMBUSSI, y
ANTONIOGRAMORASIA, "Potencial timopoyético mejorado en individuos infectados por VIH avirémicos con HAART mediante la
administración intermitente de IL-2",SIDA, 17 (2003) 1621-1630.
A-9. HARRYn.s.CABELLOy unNNAjASPER, "El retorno venoso disminuido no es suficiente ni necesario para provocar la vocalización
ultrasónica de las crías de ratas lactantes",Neurociencia conductual, 117 (2003), 840–853.
A-10. MBUTZ, KHWOLLINSKY, U. W.IDEMUTO-CATRINESCU, COMOPERFELADO, SUDOESTEENTERRAR, HH MEHRKENS, CA
LUDOLFO, y H. S.CHREIBER, “Efectos longitudinales de la ventilación con presión positiva no invasiva en
pacientes con esclerosis lateral amiotófica,”Diario Americano de Rehabilitación Médica, 82 (2003),
597–604.
A-11. DÁVIDOWSTARCH, jERRYWALEXANDER, PAGHILIPCNOBLEA, SURAJRREMOLINO, y DÁVIDOMLINTERNO, “Multitrenzado
Fijación del injerto del tendón de la corva con un tornillo de interferencia tibial estándar o de cuatro cuadrantes centrales para
la reconstrucción del ligamento cruzado anterior.Revista americana de medicina deportiva, 31 (2003), 338–344.
A-12. RICHARDJCARDOSI, ROSEMARIOCARDOSI, miENANOCGRENDYSJr., J.AMÉSV. F.IORICA, y MITCHELS. H.OFICIAL,
“Morbilidad infecciosa del tracto urinario con cateterismo vesical prolongado después de histerectomía radical”
Revista americana de obstetricia y ginecología, 189 (2003), 380–384.
A-13. SATOSHInorteOZAWA, kATSUJISHIMIZU, kIEMETROIYAMOTO, y MIZUOTANAKÁ, "Reparación del defecto pars interarticularis mediante fijación
segmentaria con alambre en atletas jóvenes con espondilólisis",Revista estadounidense de medicina deportiva, 31 (2003),
359–364.
A-14. GRAMOEE. UU.AHUIZINGA, WINETTETA van der GRAAF, ANEMIKEVISSER, jsistema operativoDAKOTA DEL SURIJKSTRAy J.OSETTEEHM
HOEKSTRA-WEEBERES, “Consecuencias psicosociales para los hijos de un padre con cáncer”,Enfermería oncológica, 26
(2003), 195–202.
A-15. miRICWTSOY, ARTHURFMAlaska, WAInorteGeorgiaLSOY, jOHNÉLFURGONETAS, y YORKY CCÓMO, "Movimiento pélvico y distribución de
la presión de interfaz durante la propulsión manual de una silla de ruedas",Archivos de Medicina Física y
Rehabilitación, 84 (2003), 1466–1472.
A-16. METROARCAPJOHNSON, LESLIEn.s.UTON, norteATALIARINTOUL, TIMOTEOMCROMBLEHOLME, ALANWFLAGO, LO YO
J HO BIEN, hOLLYLHEDRICK, RDOUGLASWILSON, y N. S.COTTADZICK, “Reparación del mielomeningocele fetal:
resultados clínicos a corto plazo,”Revista americana de obstetricia y ginecología, 189 (2003), 482–487.

A-17. DMZ KRIESER, AR ROSENBERG, G KAINER, y D. N.AIDOO, "La relación entre la creatinina sérica, la cistatina C sérica y
la tasa de filtración glomerular en receptores de trasplante renal pediátrico: un estudio piloto" Trasplante
Pediátrico, 6 (2002), 392–395.
A-18. jORDÁNG. S.PIVACO, StephenCESPPy J.OELD. K.DERECHO DE RETENCIÓN, “Clostridium difficile&mdash;Diarrea asociada en un
hospital pediátrico,”Pediatría Clínica, 42 (2003), 347–352.
A-19. NTHILO TAMMAL, PVKRISHNAMURTHY, DESMONDK. R.UNYANy K. B.ANU, “¿La vacuna BCG previene la meningitis
tuberculosa?”Archives of Disease in Childhood, 74 (1996), 144–147.
A-20. Centro Estatal de Estadísticas de Salud de Carolina del Norte e Instituto Howard W. Odum para la Investigación en Ciencias Sociales de la
Universidad de Carolina del Norte en Chapel Hill. Conjunto de datos de nacimiento para 2001 encontrado enwww.irss.unc.edu/ncvital/
bfd1down.html. Todos los cálculos fueron realizados por John Holcomb y no representan los hallazgos del Centro o Instituto.
CAPÍTULO 3
ALGUNA PROBABILIDAD BÁSICA
CONCEPTOS

RESUMEN DEL CAPÍTULO

La probabilidad sienta las bases para la inferencia estadística. Este capítulo proporciona una
breve descripción general de los conceptos de probabilidad necesarios para comprender los
temas tratados en los capítulos siguientes. También proporciona un contexto para comprender
las distribuciones de probabilidad utilizadas en la inferencia estadística e introduce al
estudiante a varias medidas que se encuentran comúnmente en la literatura médica (p. ej., la
sensibilidad y la especificidad de una prueba).

TEMAS

3.1INTRODUCCIÓN
3.2DOS PERSPECTIVAS DE LA PROBABILIDAD: OBJETIVA Y SUBJETIVA
3.3PROPIEDADES ELEMENTALES DE LA PROBABILIDAD

3.4CÁLCULO DE LA PROBABILIDAD DE UN EVENTO


3.5TEOREMA DE BAYES, PRUEBAS DE TAMIZAJE, SENSIBILIDAD,
ESPECIFICIDAD Y VALOR PREDICTIVO POSITIVO Y NEGATIVO
3.6RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. comprender la frecuencia clásica, relativa y la probabilidad subjetiva.
2. comprender las propiedades de la probabilidad y las reglas de probabilidad seleccionadas.
3. ser capaz de calcular la probabilidad de un evento.
4. ser capaz de aplicar el teorema de Bayes al calcular los resultados de las pruebas de detección.

3.1 INTRODUCCIÓN

La teoría de la probabilidad proporciona la base para la inferencia estadística. Sin embargo,


esta teoría, que es una rama de las matemáticas, no es el interés principal de este libro y, en
consecuencia, aquí sólo se discuten sus conceptos fundamentales. Estudiantes que deseen

sesenta y cinco
66 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

seguir este tema debe consultar los muchos libros sobre probabilidad disponibles en la mayoría de las
bibliotecas de colegios y universidades. Se recomiendan los libros de Gut (1), Isaac (2) y Larson (3). Los
objetivos de este capítulo son ayudar a los estudiantes a adquirir alguna habilidad matemática en el
área de probabilidad y ayudarlos a desarrollar una comprensión de los conceptos más importantes. El
progreso en este sentido contribuirá enormemente a su éxito en la comprensión de los
procedimientos de inferencia estadística presentados más adelante en este libro.
El concepto de probabilidad no es ajeno a los trabajadores de la salud y se encuentra con frecuencia
en la comunicación cotidiana. Por ejemplo, podemos escuchar a un médico decir que un paciente tiene una
probabilidad de 50 a 50 de sobrevivir a una determinada operación. Otro médico puede decir que está 95 por
ciento seguro de que un paciente tiene una enfermedad en particular. Una enfermera de salud pública puede
decir que nueve de cada diez veces cierto cliente faltará a una cita. Como sugieren estos ejemplos, la mayoría
de las personas expresan las probabilidades en términos de porcentajes. Al tratar matemáticamente las
probabilidades, es más conveniente expresar las probabilidades como fracciones. (Los porcentajes resultan
de multiplicar las fracciones por 100). Así, medimos la probabilidad de que ocurra algún evento por un
número entre cero y uno. Cuanto más probable sea el evento, más cerca estará el número de uno; y cuanto
más improbable sea el evento, más cerca estará el número de cero. Un evento que no puede ocurrir tiene
una probabilidad de cero, y un evento que es seguro que ocurrirá tiene una probabilidad de uno.

Los investigadores de las ciencias de la salud se preguntan continuamente si los resultados de sus
esfuerzos podrían haber ocurrido solo por casualidad o si alguna otra fuerza estaba operando para producir
los efectos observados. Por ejemplo, supongamos que seis de cada diez pacientes que padecen alguna
enfermedad se curan después de recibir un determinado tratamiento. ¿Es probable que se haya producido
tal tasa de curación si los pacientes no hubieran recibido el tratamiento, o es evidencia de un verdadero
efecto curativo por parte del tratamiento? Veremos que preguntas como estas pueden responderse
mediante la aplicación de los conceptos y leyes de probabilidad.

3.2 DOS PERSPECTIVAS DE LA


PROBABILIDAD: OBJETIVA Y SUBJETIVA

Hasta hace relativamente poco tiempo, los estadísticos y matemáticos pensaban en la probabilidad
sólo como unobjetivofenómeno derivado de procesos objetivos.
El concepto deprobabilidad objetivapueden clasificarse aún más bajo los
encabezados de (1)clásico,oa priori, probabilidad,y (2) elFrecuencia relativa,o
posteriormente, concepto de probabilidad.

Probabilidad clásicaEl tratamiento clásico de la probabilidad se remonta al siglo XVII y al


trabajo de dos matemáticos, Pascal y Fermat. Gran parte de esta teoría se desarrolló a partir de
los intentos de resolver problemas relacionados con los juegos de azar, como los que implican
tirar los dados. Ejemplos de juegos de azar ilustran muy bien los principios involucrados en la
probabilidad clásica. Por ejemplo, si se lanza un dado justo de seis caras, la probabilidad de que
se observe un 1 es igual a 1=6 y es la misma para las otras cinco caras. Si se elige una carta al
azar de una baraja bien barajada de cartas ordinarias, la probabilidad de sacar un corazón es
13=52. Probabilidades como estas se calculan mediante procesos de razonamiento abstracto.
No es necesario tirar un dado o sacar una carta para calcular
3.2 DOS PERSPECTIVAS DE LA PROBABILIDAD: OBJETIVA Y SUBJETIVA 67

estas probabilidades. Al tirar el dado, decimos que cada uno de los seis lados esigualmente probable a observarse si
no hay razón para favorecer a cualquiera de los seis lados. De manera similar, si no hay razón para favorecer el sorteo
de una carta en particular de una baraja de cartas, decimos que cada una de las 52 cartas tiene la misma probabilidad
de ser sacada. Podemos definir la probabilidad en el sentido clásico de la siguiente manera:

DEFINICIÓN
Si un evento puede ocurrir ennortemaneras mutuamente excluyentes e igualmente
probables, y simetrode estos poseen un rasgoMI,la probabilidad de que ocurrami es
igual am=N.

si leemosPAGdmiÞcomo “la probabilidad deMI,"podemos expresar esta definición como

metro
PAGdmi¼ (3.2.1)
norte

Probabilidad de frecuencia relativaEl enfoque de probabilidad de frecuencia relativa


depende de la repetibilidad de algún proceso y la capacidad de contar el número de
repeticiones, así como el número de veces que ocurre algún evento de interés. En este contexto
podemos definir la probabilidad de observar alguna característica,MI,de un evento de la
siguiente manera:

DEFINICIÓN
Si algún proceso se repite un gran número de veces,norte,y si algún
evento resultante con la característicamiocurremetroveces, la frecuencia
relativa de ocurrencia deMI,m=n,será aproximadamente igual a la
probabilidad deMI.

Para expresar esta definición en forma compacta, escribimos

metro
PAGdmi¼ (3.2.2)
norte

Sin embargo, debemos tener en cuenta que, en sentido estricto,m=nes solo una estimación dePAGdmiÞ.

Probabilidad subjetivaA principios de la década de 1950, LJ Savage (4) dio un impulso considerable
a lo que se denomina el concepto “personalista” o subjetivo de probabilidad. Este punto de vista
sostiene que la probabilidad mide la confianza que un individuo particular tiene en la verdad de una
proposición particular. Este concepto no se basa en la repetibilidad de ningún proceso. De hecho, al
aplicar este concepto de probabilidad, se puede evaluar la probabilidad de un evento que solo puede
ocurrir una vez, por ejemplo, la probabilidad de que se descubra una cura para el cáncer en los
próximos 10 años.
Aunque la visión subjetiva de la probabilidad ha disfrutado de una mayor atención a lo largo de los
años, no ha sido completamente aceptada por los estadísticos que tienen orientaciones tradicionales.
68 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

Métodos bayesianosLos métodos bayesianos reciben su nombre en honor al reverendo Thomas


Bayes (1702-1761), un clérigo inglés interesado en las matemáticas. Los métodos bayesianos son un
ejemplo de probabilidad subjetiva, ya que toma en consideración el grado de creencia que se tiene en
la posibilidad de que ocurra un evento. Mientras que las probabilidades basadas en conceptos
clásicos o de frecuencia relativa están diseñadas para permitir que se tomen decisiones únicamente
sobre la base de los datos recopilados, los métodos bayesianos hacen uso de lo que se conoce como
probabilidades previasyprobabilidades posteriores.

DEFINICIÓN
Elprobabilidad previade un evento es una probabilidad basada en el conocimiento
previo, la experiencia previa o los resultados derivados de la actividad previa de
recopilación de datos.

DEFINICIÓN
Elprobabilidad posteriorde un evento es una probabilidad obtenida mediante el uso de
nueva información para actualizar o revisar una probabilidad anterior.

A medida que se recopilan más datos, es probable que se sepa más acerca de la probabilidad “verdadera” del
evento que se está considerando. Aunque la idea de actualizar las probabilidades con base en nueva
información contrasta directamente con la filosofía detrás de la probabilidad de frecuencia de ocurrencia, los
conceptos bayesianos se usan ampliamente. Por ejemplo, las técnicas bayesianas han encontrado una
aplicación reciente en la construcción de filtros de spam de correo electrónico. Típicamente, la aplicación de
conceptos bayesianos hace uso de una fórmula matemática llamadaTeorema de Bayes.En la Sección 3.5
empleamos el teorema de Bayes en la evaluación de los datos de la prueba de detección diagnóstica.

3.3 PROPIEDADES ELEMENTALES DE


LA PROBABILIDAD

En 1933, el matemático ruso AN Kolmogorov (5) formalizó el enfoque axiomático de la


probabilidad. La base de este enfoque está incorporada en tres propiedades a partir de las
cuales se construye todo un sistema de teoría de la probabilidad mediante el uso de la lógica
matemática. Las tres propiedades son las siguientes.

1.Dado algún proceso (o experimento) connorteresultados mutuamente excluyentes (llamados


eventos),mi1;mi2; . . . ;minorte, la probabilidad de cualquier eventomiise le asigna un número no
negativo. Eso es,

PAGdmiiÞ -0 (3.3.1)

En otras palabras, todos los eventos deben tener una probabilidad mayor o igual a cero,
un requisito razonable en vista de la dificultad de concebir una probabilidad negativa. Un
concepto clave en la declaración de esta propiedad es el concepto demutuamente excluyentes
resultados. Se dice que dos eventos son mutuamente excluyentes si no pueden ocurrir
simultáneamente.
3.4 CÁLCULO DE LA PROBABILIDAD DE UN EVENTO 69

2.La suma de las probabilidades de los resultados mutuamente excluyentes es igual a 1.

PAGdmi1Þ þPAGdmi2Þ þ - - - þPAGdminorte¼1 (3.3.2)

Esta es propiedad deagotamientoy se refiere al hecho de que el observador de un


proceso probabilístico debe tener en cuenta todos los eventos posibles, y cuando se toman
todos juntos, su probabilidad total es 1. El requisito de que los eventos sean mutuamente
excluyentes es especificar que los eventosmi1;mi2; . . . ;minorteno se superpongan; es decir, dos
de ellos no pueden ocurrir al mismo tiempo.
3.Considere dos eventos mutuamente excluyentes,miiymij. La probabilidad de que ocurra
cualquiera de los dosmiiomijes igual a la suma de sus probabilidades individuales.

- - --
EDUCACIÓN FÍSICAiþmij¼PAGdmiiÞ þEDUCACIÓN FÍSICAj (3.3.3)

Supongamos que los dos eventos no fueran mutuamente excluyentes; es decir, supongamos que
pudieran ocurrir al mismo tiempo. Al intentar calcular la probabilidad de que ocurra cualquiera de los dos mii
omijse descubriría el problema de la superposición y el procedimiento podría volverse bastante complicado.
Este concepto será discutido más adelante en la siguiente sección.

3.4 CÁLCULO DE LA PROBABILIDAD DE UN


EVENTO

Ahora hacemos uso de los conceptos y técnicas de las secciones anteriores para calcular las
probabilidades de eventos específicos. Se introducirán ideas adicionales según sea necesario.

EJEMPLO 3.4.1
El objetivo principal de un estudio de Carter et al. (A-1) fue investigar el efecto de la edad de inicio del
trastorno bipolar en el curso de la enfermedad. Una de las variables investigadas fue la historia familiar de
trastornos del estado de ánimo. La Tabla 3.4.1 muestra la frecuencia de antecedentes familiares de

TABLA 3.4.1 Frecuencia de antecedentes familiares de trastorno del estado de ánimo


por grupo de edad entre sujetos bipolares

Antecedentes familiares de trastornos del estado de ánimo Temprano¼18(MI) Más tarde > 18(L) Total

Negativo (A) 28 35 63
Trastorno bipolar (B) 19 38 57
Unipolar (C) 41 44 85
Unipolares y bipolares (D) 53 60 113

Total 141 177 318


Fuente: Tasha D. Carter, Emanuela Mundo, Sagar V. Parkh y James L. Kennedy, "Early Age at
Onset as a Risk Factor for Poor Outcome of Bipolar Disorder"Revista de Investigación
Psiquiátrica, 37 (2003), 297–303.
70 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

trastornos del estado de ánimo en los dos grupos de interés (edad temprana de inicio definida como 18 años
o menos y edad tardía de inicio definida como posterior a los 18 años). Supongamos que elegimos una
persona al azar de esta muestra. ¿Cuál es la probabilidad de que esta persona tenga 18 años o menos?

Solución: A los efectos de ilustrar el cálculo de probabilidades, consideramos que este grupo de
318 sujetos es el grupo más grande por el que tenemos interés. En otras palabras,
para este ejemplo, consideramos a los 318 sujetos como una población. Suponemos
que Early y Later son categorías mutuamente excluyentes y que la probabilidad de
seleccionar a cualquier persona es igual a la probabilidad de seleccionar a cualquier
otra persona. Definimos la probabilidad deseada como el número de sujetos con la
característica de interés (Early) dividido por el número total de sujetos. Podemos
escribir el resultado en notación de probabilidad de la siguiente manera:

PAGdmi¼número de sujetos tempranos = número total de sujetos


¼141=318¼ :4434 &

La probabilidad condicionalEn ocasiones, el conjunto de “todos los resultados posibles” puede


constituir un subconjunto del grupo total. En otras palabras, el tamaño del grupo de interés puede
verse reducido por condiciones no aplicables al grupo total. Cuando las probabilidades se calculan
con un subconjunto del grupo total como denominador, el resultado es unla probabilidad condicional.
La probabilidad calculada en el ejemplo 3.4.1, por ejemplo, puede considerarse como una
probabilidad incondicional, ya que el tamaño del grupo total sirvió como denominador. No se
impusieron condiciones para restringir el tamaño del denominador. También podemos pensar en
esta probabilidad como unaprobabilidad marginalya que uno de los totales marginales se utilizó
como numerador.
Podemos ilustrar el concepto de probabilidad condicional remitiéndonos nuevamente a la tabla
3.4.1.

EJEMPLO 3.4.2
Supongamos que elegimos un sujeto al azar de los 318 sujetos y encontramos que tiene 18 años o menos (
MI).¿Cuál es la probabilidad de que este sujeto sea uno que no tenga antecedentes familiares de trastornos
del estado de ánimo (A)?

Solución: El número total de asignaturas deja de ser de interés, ya que, con la selección de una
asignatura Temprana, se eliminan las asignaturas Tardías. Entonces, podemos definir la
probabilidad deseada de la siguiente manera: ¿Cuál es la probabilidad de que un sujeto no
tenga antecedentes familiares de trastornos del estado de ánimo (A),dado que el tema
seleccionado es Temprano (MI)?Esta es una probabilidad condicional y se escribe comoPAGd
AjmiÞen el que la línea vertical se lee "dado". Los 141 sujetos tempranos se convierten en el
denominador de esta probabilidad condicional, y 28, el número de sujetos tempranos sin
antecedentes familiares de trastornos del estado de ánimo, se convierte en el numerador.
Nuestra probabilidad deseada, entonces, es

PAGdAjmi¼28=141¼ :1986 &


3.4 CÁLCULO DE LA PROBABILIDAD DE UN EVENTO 71

Probabilidad conjuntaA veces queremos encontrar la probabilidad de que un sujeto


elegido al azar de un grupo de sujetos posea dos características al mismo tiempo. Tal
probabilidad se conoce comoprobabilidad conjunta.Ilustramos el cálculo de una
probabilidad conjunta con el siguiente ejemplo.

EJEMPLO 3.4.3
Volvamos a referirnos a la Tabla 3.4.1. ¿Cuál es la probabilidad de que una persona escogida al azar de los
318 sujetos sea Temprano (mi) yserá una persona que no tiene antecedentes familiares de trastornos del
estado de ánimo (A)?

Solución: La probabilidad que estamos buscando se puede escribir en notación simbólica como
PAGdE\AÞen el que el símbolo \ se lee como "intersección" o "y". La declaraciónE\A
indica la ocurrencia conjunta de condicionesmiyA.El número de sujetos que satisfacen
ambas condiciones deseadas se encuentra en la Tabla 3.4.1 en la intersección de la
columna etiquetadamiy la fila etiquetadaA y se ve que es 28. Dado que la selección se
hará del conjunto total de sujetos, el denominador es 318. Por lo tanto, podemos
escribir la probabilidad conjunta como

PAGdE\A¼28=318¼ :0881 &

La regla de la multiplicaciónUna probabilidad puede calcularse a partir de otras


probabilidades. Por ejemplo, una probabilidad conjunta se puede calcular como el producto de
una probabilidad marginal apropiada y una probabilidad condicional apropiada. Esta relación
se conoce como laregla de multiplicaciónde probabilidad Ilustramos con el siguiente ejemplo.

EJEMPLO 3.4.4
Deseamos calcular la probabilidad conjunta de Edad temprana al inicio (MI)y antecedentes familiares
negativos de trastornos del estado de ánimo (A)del conocimiento de una probabilidad marginal apropiada y
una probabilidad condicional apropiada.

Solución: La probabilidad que buscamos esPAGdE\AÞ.Ya hemos calculado una probabilidad


marginal,PAGdmi¼141=318¼ :4434, y una probabilidad condicional, PAGdAjmi¼
28=141¼ :1986. Sucede que estas son probabilidades marginales y condicionales
apropiadas para calcular la probabilidad conjunta deseada. Ahora podemos calcular
PAGdE\A¼PAGdmiÞPAGdAjmiÞ ¼ ð:4434Þð:1986Þ ¼ :0881. Esto, notamos, es, como se
esperaba, el mismo resultado que obtuvimos anteriormente paraPAGdE\AÞ.&

Podemos establecer la regla de la multiplicación en términos generales de la siguiente manera: Para dos eventos cualesquiera
AyB,

PAGdA\B¼PAGdBÞPAGdAjBÞ; siPAGdBÞ 6¼0 (3.4.1)

Para los mismos dos eventosAyB,la regla de la multiplicación también se puede escribir como PAGd
A\B¼PAGdAÞPAGdBjAÞ;siPAGdAÞ 6¼0.
Vemos que a través de la manipulación algebraica, la regla de la multiplicación establecida en la
Ecuación 3.4.1 puede usarse para encontrar cualquiera de las tres probabilidades en su declaración si se
conocen las otras dos. Podemos, por ejemplo, encontrar la probabilidad condicionalPAGdAjBÞpor
72 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

divisorPAGdA\BÞporPAGdBÞ.Esta relación nos permite definir formalmente la probabilidad condicional de la


siguiente manera.

DEFINICIÓN
Ella probabilidad condicionaldeAdadoBes igual a la probabilidad de
A\Bdividido por la probabilidad deB,dada la probabilidad deB no es
cero

Eso es,
PAGdA\BÞ
PAGdAjB¼ ; PAGdBÞ 6¼0 (3.4.2)
PAGdBÞ

Ilustramos el uso de la regla de la multiplicación para calcular una probabilidad condicional con el
siguiente ejemplo.

EJEMPLO 3.4.5
Deseamos usar la Ecuación 3.4.2 y los datos de la Tabla 3.4.1 para encontrar la probabilidad condicional, PAG
dAjmiÞ

Solución:De acuerdo con la Ecuación 3.4.2,

PAGdAjmi¼PAGdA \ EÞ=PAGdmiÞ &

antes encontramosPAGdE\A¼PAGdA \ E¼28=318¼ :0881. También hemos determinado que


PAGdmi¼141=318¼ :4434. Usando estos resultados podemos calcularPAGdAjmi¼ :0881=:4434
¼ :1987, que, como era de esperar, es el mismo resultado que obtuvimos usando las
frecuencias directamente de la Tabla 3.4.1. (La ligera discrepancia se debe al redondeo).

La regla de la sumaLa tercera propiedad de la probabilidad dada anteriormente establece que la


probabilidad de que ocurra uno u otro de dos eventos mutuamente excluyentes es igual a la suma de
sus probabilidades individuales. Supongamos, por ejemplo, que elegimos una persona al azar de las
318 representadas en la Tabla 3.4.1. ¿Cuál es la probabilidad de que esta persona tenga una edad
temprana al inicio?dmiÞo Edad tardía de iniciodLÞ?Establecemos esta probabilidad en símbolos como
PAGdmi [ LÞ,donde el símbolo [ se lee como "unión" o "o". Dado que las dos condiciones de edad son
mutuamente excluyentes,PAGdE \ LÞ ¼ ð141=318Þ þ ð177=318¼ :4434þ :5566¼1.

¿Qué pasa si dos eventos no son mutuamente excluyentes? Este caso está cubierto por lo que se conoce como
elregla de suma,que puede enunciarse de la siguiente manera:

DEFINICIÓN
Dados dos eventosAyB,la probabilidad de que el eventoA,o eventoB,o ambos
ocurren es igual a la probabilidad de que el eventoAocurre, más la probabilidad de
que el eventoBocurre, menos la probabilidad de que los eventos ocurran
simultáneamente.
3.4 CÁLCULO DE LA PROBABILIDAD DE UN EVENTO 73

La regla de la suma se puede escribir

PAGdun [ segundo¼PAGdAÞ þPAGdBÞPAGdA\BÞ (3.4.3)

cuando los eventosAyBno puede ocurrir simultáneamente,PAGdA\BÞa veces se denomina "o


exclusivo", yPAGdun [ segundo¼0. Cuando los eventosAyBpuede ocurrir simultáneamente, PAGdun
[ segundoÞa veces se llama "o inclusivo", y usamos la regla de la suma para calcular PAGdun
[ segundoÞ.Ilustremos el uso de la regla de la suma mediante un ejemplo.

EJEMPLO 3.4.6
Si seleccionamos una persona al azar de los 318 sujetos representados en la Tabla 3.4.1, ¿cuál es la probabilidad de
que esta persona sea un sujeto de edad temprana de inicio (MI)o no tendrá antecedentes familiares de trastornos del
estado de ánimo (A)¿o ambos?

Solución: La probabilidad que buscamos esPAGdmi [ unÞ.Por la regla de la suma expresada


por la Ecuación 3.4.3, esta probabilidad se puede escribir comoPAGdmi [ un¼
PAGdmiÞ þPAGdAÞPAGdE\AÞ.Ya hemos encontrado quePAGdmi¼141=318¼
:4434 yPAGdE\A¼28=318¼ :0881. A partir de la información de la Tabla 3.4.1
calculamosPAGdA¼63=318¼ :1981. Sustituyendo estos resultados en la ecuación
dePAGdmi [ unÞtenemosPAGdmi [ unÞ ¼ :4434þ :1981 :5534. :0881¼
&

Tenga en cuenta que los 28 sujetos que sonambosTempranoyno tienen antecedentes familiares de
trastornos del estado de ánimo se incluyen en los 141 que son Tempranos así como en los 63 que no tienen
antecedentes familiares de trastornos del estado de ánimo. Dado que, al calcular la probabilidad, estos 28 se
agregaron dos veces al numerador, deben restarse una vez para superar el efecto de duplicación o
superposición.

Eventos independientesSuponga que, en la Ecuación 3.4.2, se nos dice que el eventoBha ocurrido,
pero que este hecho no tiene efecto sobre la probabilidad deA.Es decir, suponga que la probabilidad
de eventoAes el mismo independientemente de si o noBocurre. En esta situación, PAGdAjB¼PAGdAÞ.
En tales casos decimos queAyBsoneventos independientes.Entonces, la regla de multiplicación para
dos eventos independientes se puede escribir como

PAGdA\B¼PAGdAÞPAGdBÞ; PAGdAÞ 6¼0; PAGdBÞ 6¼0 (3.4.4)

Así, vemos que si dos eventos son independientes, la probabilidad de que ocurran
juntos es igual al producto de las probabilidades de que ocurran individualmente.
Tenga en cuenta que cuando dos eventos con probabilidades distintas de cero son independientes, cada una de las
siguientes afirmaciones es verdadera:

PAGdAjB¼PAGdAÞ; PAGdBjA¼PAGdBÞ; PAGdA\B¼PAGdAÞPAGdBÞ

Dos eventos no son independientes a menos que todas estas afirmaciones sean verdaderas. Es importante
tener en cuenta que los términosindependienteymutuamente excluyentesno significan lo mismo.
Ilustremos el concepto de independencia mediante el siguiente ejemplo.
74 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

EJEMPLO 3.4.7
En cierta clase de secundaria, compuesta por 60 niñas y 40 niños, se observa que 24 niñas y 16
niños usan anteojos. Si se elige al azar a un estudiante de esta clase, la probabilidad de que el
estudiante use anteojos,EDUCACIÓN FÍSICA),es 40=100, o .4.

(a)¿Cuál es la probabilidad de que un estudiante elegido al azar use anteojos, dado que el
estudiante es un niño?

Solución: Al usar la fórmula para calcular una probabilidad condicional, encontramos que esto
es

PAGdmi \ segundoÞ 16=100


PAGdmijB¼ ¼ ¼ :4
PAGdBÞ 40=100

Por lo tanto, la información adicional de que un estudiante es un niño no altera la


probabilidad de que el estudiante use anteojos, yPAGdmi¼PAGdmijBÞ.Decimos
que los eventos siendo un niño y usando anteojos para este grupo son
independientes. También podemos demostrar que el hecho de llevar gafas,MI, y
nosiendo un chico,B - también son independientes de la siguiente manera:
- Þ 24=100 24
PAGdmi \ segundo
-Þ ¼
PAGdmijB
- Þ ¼ 60=100 ¼ 60 ¼ :4
PAGdB

(b)¿Cuál es la probabilidad de que ocurran conjuntamente los eventos de usar anteojos y


ser niño?

Solución:Usando la regla dada en la Ecuación 3.4.1, tenemos

PAGdmi \ segundo¼PAGdBÞPAGdmijBÞ

pero, como hemos demostrado que los eventosmiyBson independientes podemos reemplazar PAGdmijBÞ
porEDUCACIÓN FÍSICA)para obtener, por la Ecuación 3.4.4,

PAGdmi \ segundo¼PAGdBÞPAGdmiÞ

40 40
¼
100 100
¼ :dieciséis &

Eventos ComplementariosAnteriormente, utilizando los datos de la Tabla 3.4.1, calculamos la


probabilidad de que una persona elegida al azar de los 318 sujetos sea un sujeto de edad temprana
de inicio comoPAGdmi¼141=318¼ :4434. Encontramos que la probabilidad de una edad de inicio
tardía esPAGdL¼177=318¼ :5566. Se encontró que la suma de estas dos probabilidades es igual a 1.
Esto es cierto porque los eventos que son Edad de inicio temprana y Edad de inicio tardía son eventos
complementarios.En general, podemos hacer la siguiente declaración sobre eventos
complementarios. La probabilidad de un eventoAes igual a 1 menos la probabilidad de su
3.4 CÁLCULO DE LA PROBABILIDAD DE UN EVENTO 75

complemento, que se escribeA - y

-Þ ¼1PAGdAÞ
PAGdA (3.4.5)

Esto se sigue de la tercera propiedad de la probabilidad ya que el evento,A,y su


complemento,A- son mutuamente excluyentes.

EJEMPLO 3.4.8
Suponga que de 1200 admisiones a un hospital general durante cierto período de tiempo, 750 son
- es igual a 1200 menos 750, o
admisiones privadas. Si los designamos como conjuntoA,entoncesA
450. Podemos calcular

PAGdA¼750=1200¼ :625

y
-Þ ¼450=1200¼ :375
PAGdA

y mira eso
-Þ ¼1
PAGdA PAGdAÞ

:375¼1 :625
:375¼ :375
&

Probabilidad marginalAnteriormente usamos el términoprobabilidad marginalpara referirse a una


probabilidad en la que el numerador de la probabilidad es un total marginal de una tabla como la
Tabla 3.4.1. Por ejemplo, cuando calculamos la probabilidad de que una persona elegida al azar de las
318 personas representadas en la Tabla 3.4.1 sea un sujeto de edad temprana de inicio, el numerador
de la probabilidad es el número total de sujetos tempranos, 141. Por lo tanto, PAGdmi¼141=318¼ :
4434. Podemos definir la probabilidad marginal de manera más general de la siguiente manera:

DEFINICIÓN
Dada alguna variable que se puede descomponer enmetrocategorías
designadas porA1;A2; . . . ;Ai; . . . ;Ametroy otra variable conjunta que se
descompone ennortecategorías designadas porB1; B2; . . . ;Bj; . . . ;Bnorte, la
probabilidad marginal deAi;PAGdAiÞ,es igual a la suma de las
probabilidades conjuntas deAicon todas las categorías deB.Eso es,
- -
PAGdAi¼SPensilvaniai\ Bj; para todos los valores dej (3.4.6)

El siguiente ejemplo ilustra el uso de la Ecuación 3.4.6 en el cálculo de una probabilidad


marginal.

EJEMPLO 3.4.9
Deseamos usar la ecuación 3.4.6 y los datos de la tabla 3.4.1 para calcular la probabilidad marginal
EDUCACIÓN FÍSICA).
76 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

Solución: La variable edad de inicio se divide en dos categorías, Temprano para el inicio 18 años
o menos (MI)y Tardío para el inicio que ocurre a una edad mayor de 18 años
(L).La variable antecedentes familiares de trastornos del estado de ánimo se divide en cuatro
categorías: antecedentes familiares negativos (A),solo trastorno bipolar (B),trastorno
unipolar solamente (C),y sujetos con antecedentes de trastorno unipolar y bipolar (D).La
categoría Temprano ocurre junto con las cuatro categorías de la variable antecedentes
familiares de trastornos del estado de ánimo. Las cuatro probabilidades conjuntas que se
pueden calcular son

PAGdE\A¼28=318¼ :0881 PAGd


mi \ segundo¼19=318¼ :0597
PAGdmi \ c¼41=318¼ :1289
PAGdE \ D¼53=318¼ :1667

Obtenemos la probabilidad marginalEDUCACIÓN FÍSICA)sumando estas cuatro probabilidades conjuntas de la

siguiente manera:

PAGdmi¼PAGdE\AÞ þPAGdmi \ segundoÞ þPAGdmi \ cÞ þPAGdE \ DÞ

¼ :0881þ :0597þ :1289þ :1667 ¼ :


4434 &

El resultado, como era de esperar, es el mismo que se obtiene utilizando el total marginal de
Early como numerador y el número total de sujetos como denominador.

EJERCICIOS

3.4.1En un estudio de victimización violenta de mujeres y hombres, Porcerelli et al. (A-2) recopiló información de 679
mujeres y 345 hombres de 18 a 64 años en varios centros de medicina familiar en el área metropolitana de
Detroit. Los pacientes completaron un cuestionario de historial de salud que incluía una pregunta sobre
victimización. La siguiente tabla muestra los sujetos de la muestra clasificados en forma cruzada por sexo y el
tipo de victimización violenta reportada. Las categorías de victimización se definen como no victimización,
victimización por la pareja (y no por otros), victimización por personas distintas a la pareja (amigos, familiares
o extraños) y quienes reportaron victimización múltiple.

Sin victimización Socios no socios Victimización Múltiple Total

Mujer 611 34 dieciséis 18 679


Hombres 308 10 17 10 345

Total 919 44 33 28 1024


Fuente: Datos proporcionados por cortesía de John H. Porcerelli, Ph.D., Rosemary Cogan, Ph.D.

(a)Supongamos que elegimos un sujeto al azar de este grupo. ¿Cuál es la probabilidad de que este sujeto sea
una mujer?
(b)¿Cómo llamamos a la probabilidad calculada en el inciso a?
(C)Muestre cómo calcular la probabilidad solicitada en el inciso a por dos métodos adicionales.
EJERCICIOS 77

(d)Si elegimos un sujeto al azar, ¿cuál es la probabilidad de que el sujeto sea una mujer y haya sufrido abuso
por parte de su pareja?
(mi)¿Cómo llamamos a la probabilidad calculada en el inciso d?
(F)Supongamos que elegimos a un hombre al azar. Con esta información, ¿cuál es la probabilidad de que haya sufrido abuso
por parte de personas que no son su pareja?

(gramo)¿Cómo llamamos a la probabilidad calculada en la parte f?


(h)Supongamos que elegimos un tema al azar. ¿Cuál es la probabilidad de que sea un hombre o alguien que
experimentó abuso por parte de una pareja?
(i)¿Cómo llamamos al método por el cual obtuviste la probabilidad en la parte h?

3.4.2Fernando et al. (A-3) estudió el uso compartido de drogas entre usuarios de drogas inyectables en el sur del Bronx en la ciudad de
Nueva York. Los usuarios de drogas en la ciudad de Nueva York usan el término "dividir una bolsa" o "bajarse en una bolsa"
para referirse a la práctica de dividir una bolsa de heroína u otras sustancias inyectables. Una práctica común incluye dividir las
drogas después de disolverlas en una olla común, un procedimiento con un riesgo considerable de VIH. Aunque esta práctica
es común, se sabe poco sobre la prevalencia de tales prácticas. Los investigadores preguntaron a los usuarios de drogas
inyectables en cuatro vecindarios del sur del Bronx si alguna vez "consumieron" drogas en bolsas o inyecciones. Los resultados
clasificados por género y práctica de desdoblamiento se detallan a continuación:

Género Drogas divididas Nunca divida las drogas Total

Masculino 349 324 673


Femenino 220 128 348

Total 569 452 1021


Fuente: Daniel Fernando, Robert F. Schilling, Jorge Fontdevila y
Nabila El-Bassel, "Predictors of Sharing Drugs between Injection
Drug Users in the South Bronx: Implications for HIV
Transmission"Revista de Drogas Psicoactivas, 35 (2003), 227–236.

(a)¿Cuántas probabilidades marginales se pueden calcular a partir de estos datos? Indique cada uno en notación de
probabilidad y haga los cálculos.
(b)¿Cuántas probabilidades conjuntas se pueden calcular? Indique cada uno en notación de probabilidad y haga los
cálculos.
(C)¿Cuántas probabilidades condicionales se pueden calcular? Indique cada uno en notación de probabilidad y haga
los cálculos.
(d)Usa la regla de la multiplicación para encontrar la probabilidad de que una persona escogida al azar nunca divida
las drogas y sea mujer.
(mi)¿Cómo llamamos a la probabilidad calculada en el inciso d?
(F)Usa la regla de la multiplicación para encontrar la probabilidad de que una persona elegida al azar sea hombre,
dado que admite dividir las drogas.
(gramo)¿Cómo llamamos a la probabilidad calculada en la parte f?

3.4.3Consulte los datos del Ejercicio 3.4.2. Enuncie las siguientes probabilidades con palabras y calcule:
(a)PAGdHombre \ Drogas divididasÞ

(b)PAGdMasculino [ Dividir DrogasÞ

(C)PAGdMasculinojDrogas divididasÞ

(d)PAG(Masculino)
78 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

3.4.4Laveist y Nuru-Jeter (A-4) realizaron un estudio para determinar si la concordancia racial médico-paciente
se asociaba con una mayor satisfacción con la atención. Con ese fin, recopilaron una muestra nacional
de encuestados afroamericanos, caucásicos, hispanos y asiáticoamericanos. La siguiente tabla
clasifica la raza de los sujetos así como la raza de su médico:

carrera del paciente

Africano- Asiático-
Carrera del médico caucásico Americano Hispano Americano Total

Blanco 779 436 406 175 1796


Afroamericano 14 162 15 5 196
Hispano 19 17 128 2 166
Asiático = Isleño del Pacífico 68 75 71 203 417
Otro 30 55 56 4 145

Total 910 745 676 389 2720


Fuente: Thomas A. Laveist y Amani Nuru-Jeter, "¿Está la concordancia de raza médico-paciente asociada con una mayor
satisfacción con la atención?"Revista de Salud y Comportamiento Social, 43 (2002), 296–306.

(a)¿Cuál es la probabilidad de que un sujeto seleccionado al azar tenga un médico asiático = isleño del
Pacífico?
(b)¿Cuál es la probabilidad de que un sujeto afroamericano tenga un médico
afroamericano?
(C)¿Cuál es la probabilidad de que un sujeto seleccionado al azar en el estudio sea asiático-estadounidense y tenga un
médico asiático = isleño del Pacífico?
(d)¿Cuál es la probabilidad de que un sujeto elegido al azar sea hispano o tenga un médico
hispano?
(mi)Utilice el concepto de eventos complementarios para encontrar la probabilidad de que un sujeto elegido
al azar en el estudio no tenga un médico blanco.

3.4.5Si la probabilidad de ser zurdo en cierto grupo de personas es .05, ¿cuál es la probabilidad de ser diestro
(suponiendo que no haya ambidestreza)?

3.4.6La probabilidad es .6 de que un paciente seleccionado al azar de los residentes actuales de cierto hospital sea un hombre.
La probabilidad de que el paciente sea un hombre que se va a operar es .2. Se encuentra que un paciente
seleccionado al azar de los residentes actuales es un hombre; ¿Cuál es la probabilidad de que el paciente esté en el
hospital para la cirugía?

3.4.7En cierta población de pacientes hospitalarios, la probabilidad es .35 de que un paciente seleccionado al azar tenga una enfermedad
cardíaca. La probabilidad es de .86 de que un paciente con enfermedad cardíaca sea fumador. ¿Cuál es la probabilidad de que
un paciente seleccionado al azar de la población sea fumador?ytiene enfermedad del corazón?

3.5 TEOREMA DE BAYES, PRUEBAS DE TAMIZAJE,


SENSIBILIDAD, ESPECIFICIDAD Y VALOR PREDICTIVO
POSITIVO Y NEGATIVO

En el campo de las ciencias de la salud, una aplicación ampliamente utilizada de las leyes y conceptos de probabilidad
se encuentra en la evaluación de pruebas de detección y criterios diagnósticos. De interés para los médicos es una
mayor capacidad para predecir correctamente la presencia o ausencia de una enfermedad particular de
3.5 TEOREMA DE BAYES, PRUEBAS DE DETECCIÓN, SENSIBILIDAD, ESPECIFICIDAD 79

conocimiento de los resultados de las pruebas (positivo o negativo) y/o el estado de los síntomas de
presentación (presentes o ausentes). También es de interés la información sobre la probabilidad de
resultados positivos y negativos de las pruebas y la probabilidad de la presencia o ausencia de un síntoma
particular en pacientes con y sin una enfermedad particular.
En nuestra consideración de las pruebas de detección, debemos ser conscientes del hecho de que no siempre
son infalibles. Es decir, un procedimiento de prueba puede producir unafalso positivoo unfalso negativo.

DEFINICIÓN
1. Un falso positivo resulta cuando una prueba indica un estado positivo cuando el
verdadero estado es negativo.
2. Un resultado falso negativo cuando una prueba indica un estado negativo cuando el
verdadero estado es positivo.

En resumen, las siguientes preguntas deben responderse para evaluar la utilidad de los
resultados de las pruebas y el estado de los síntomas para determinar si un sujeto tiene o no alguna
enfermedad:

1.Dado que un sujeto tiene la enfermedad, ¿cuál es la probabilidad de un resultado positivo en la prueba
(o la presencia de un síntoma)?

2.Dado que un sujeto no tiene la enfermedad, ¿cuál es la probabilidad de un resultado negativo en


la prueba (o la ausencia de un síntoma)?
3.Dada una prueba de detección positiva (o la presencia de un síntoma), ¿cuál es la probabilidad de que el
sujeto tenga la enfermedad?

4.Dado un resultado negativo en la prueba de detección (o la ausencia de un síntoma), ¿cuál es la


probabilidad de que el sujeto no tenga la enfermedad?

Supongamos que tenemos para una muestra denortetemas (dondenortees un número grande) la
información que se muestra en la Tabla 3.5.1. La tabla muestra para estosnortesujetos su estado con
respecto a una enfermedad y los resultados de una prueba de detección diseñada para identificar sujetos
con la enfermedad. Las entradas de las celdas representan el número de sujetos que caen en las categorías
definidas por los encabezados de fila y columna. Por ejemplo,aes el número de sujetos que tienen la
enfermedad y cuyo resultado de la prueba de detección fue positivo.
Como hemos aprendido, se pueden calcular una variedad de estimaciones de probabilidad a partir de
la información que se muestra en una tabla de doble entrada como la Tabla 3.5.1. Por ejemplo, podemos

TABLA 3.5.1 Muestra denorteSujetos (Dondenortees grande)


Clasificación cruzada según el estado de la enfermedad y el resultado
de la prueba de detección

Enfermedad

Resultado de la prueba Presente (D) Ausente (D- ) Total

Positivo (t) a b aþb


Negativo (T-) C d Cþd

Total aþC bþd norte


80 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

calcular la estimación de probabilidad condicionalPAGdTjD¼un =daþCÞ.Esta relación es una


estimación de lasensibilidadde la prueba de detección.

DEFINICIÓN
La sensibilidad de una prueba (o síntoma) es la probabilidad de un resultado positivo
de la prueba (o la presencia del síntoma) dada la presencia de la enfermedad.

También podemos calcular la estimación de probabilidad condicionalPAGdT-jD -Þ ¼re=dbþdÞ.


Esta relación es una estimación de laespecificidadde la prueba de detección.

DEFINICIÓN
La especificidad de una prueba (o síntoma) es la probabilidad de un resultado negativo
de la prueba (o ausencia del síntoma) dada la ausencia de la enfermedad.

A partir de los datos de la Tabla 3.5.1, respondemos a la Pregunta 3 calculando la estimación de


probabilidad condicionalPAGdDjTÞ.Esta razón es una estimación de una probabilidad llamadavalor predictivo
positivode una prueba de cribado (o síntoma).

DEFINICIÓN
El valor predictivo positivo de una prueba de cribado (o síntoma) es la
probabilidad de que un sujeto tenga la enfermedad dado que el sujeto tiene un
resultado positivo en la prueba de cribado (o tiene el síntoma).

-
Del mismo modo, la relaciónPAGdD jT-Þes una estimación de la probabilidad condicional de que un sujeto
no tiene la enfermedad dado que el sujeto tiene un resultado negativo en la prueba de
detección (o no tiene el síntoma). La probabilidad estimada por esta razón se llamavalor
predictivo negativode la prueba de tamizaje o síntoma.

DEFINICIÓN
El valor predictivo negativo de una prueba de detección (o síntoma) es la
probabilidad de que un sujeto no tenga la enfermedad, dado que el sujeto
tiene una prueba de detección negativa (o no tiene el síntoma).

Las estimaciones del valor predictivo positivo y el valor predictivo negativo de una prueba (o
síntoma) se pueden obtener a partir del conocimiento de la sensibilidad y especificidad de una prueba
(o síntoma) y la probabilidad de la enfermedad relevante en la población general. Para obtener estas
estimaciones de valor predictivo, hacemos uso del teorema de Bayes. El siguiente enunciado del
teorema de Bayes, empleando la notación establecida en la Tabla 3.5.1, da el valor predictivo positivo
de una prueba de cribado (o síntoma):

PAGdTjDÞPAGdDÞ
PAGdDjT¼ (3.5.1)
PAGdTjDÞPAGdDÞ þPAGdTjD - -Þ
ÞPAGdD
3.5 TEOREMA DE BAYES, PRUEBAS DE DETECCIÓN, SENSIBILIDAD, ESPECIFICIDAD 81

Es instructivo examinar la composición de la Ecuación 3.5.1. Recordamos de la Ecuación


3.4.2 que la probabilidad condicionalPAGdDjTÞes igual aPAGdD \ TÞ=PAGdTÞ.Para entender la
lógica del teorema de Bayes, debemos reconocer que el numerador de la Ecuación 3.5.1
representaPAGdD \ TÞy que el denominador representaPAGdTÞ.Sabemos por la regla de
probabilidad de la multiplicación dada en la Ecuación 3.4.1 que el numerador de la Ecuación
3.5.1,PAGdTjDÞPAGdDÞ,es igual aPAGdD \ TÞ.
Ahora demostremos que el denominador de la Ecuación 3.5.1 es igual aPAGdTÞ.
Conocemos ese eventoTes el resultado de la clasificación de un sujeto como positivo con
respecto a una prueba de detección (o clasificado como que tiene el síntoma). Un sujeto
clasificado como positivo puede tener la enfermedad o no tenerla. Por lo tanto, la ocurrencia de
Tes el resultado de que un sujeto tenga la enfermedad y sea positivo½PAGdD \ TÞo no tener la
enfermedad y ser positivo½PAGdD
- \TÞ.Estos dos eventos son mutuamente excluyentes (su intersección
ción es cero), y en consecuencia, por la regla de la suma dada por la Ecuación 3.4.3, podemos
escribir

PAGdT¼PAGdD \ TÞ þPAGdD - \TÞ (3.5.2)

Como, por la regla de la multiplicación,PAGdD \ T¼PAGdTjDÞPAGdDÞyPAGdD - \T¼


PAGdTjD - Þ,podemos reescribir la Ecuación 3.5.2 como
- ÞPAGdD


PAGdT¼PAGdTjDÞPAGdDÞ þPAGdTjD - ÞPAGdD (3.5.3)

que es el denominador de la Ecuación 3.5.1.


Note, también, que el numerador de la Ecuación 3.5.1 es igual a la sensibilidad por la tasa
(prevalencia) de la enfermedad y el denominador es igual a la sensibilidad por la tasa de la
enfermedad más el término1 menos la sensibilidadveces el término1 menos la tasa de la enfermedad.
Así, vemos que el valor predictivo positivo se puede calcular a partir del conocimiento de la
sensibilidad, la especificidad y la tasa de la enfermedad.
La evaluación de la Ecuación 3.5.1 responde a la Pregunta 3. Para responder a la Pregunta 4
seguimos una línea de razonamiento ahora familiar para llegar al siguiente enunciado del teorema de
Bayes:

PAGdT-jD - Þ
- jT-¼
PAGdD
- ÞPAGdD
(3.5.4)
PAGdT-jD - Þ þPAGdT-jDÞPAGdDÞ
- ÞPAGdD

La ecuación 3.5.4 nos permite calcular una estimación de la probabilidad de que un sujeto que da
negativo en la prueba (o no tiene síntomas) no tenga la enfermedad, que es el valor predictivo
negativo de una prueba de detección o un síntoma.
Ilustramos el uso del teorema de Bayes para calcular un valor predictivo positivo
con el siguiente ejemplo.

EJEMPLO 3.5.1
Un equipo de investigación médica deseaba evaluar una prueba de detección propuesta para la enfermedad
de Alzheimer. La prueba se administró a una muestra aleatoria de 450 pacientes con enfermedad de
Alzheimer ya una muestra aleatoria independiente de 500 pacientes sin síntomas de la enfermedad.
82 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

Las dos muestras se extrajeron de poblaciones de sujetos de 65 años o más. Los


resultados son los siguientes:

¿Diagnóstico de alzhéimer?

Resultado de la prueba Sí (D) -)


No (D Total

Positivo (T) 436 5 441


Negativo (T-) 14 495 509

Total 450 500 950

Usando estos datos, estimamos que la sensibilidad de la prueba esPAGdTjD¼436=450¼ :97. Se estima
que la especificidad de la prueba esPAGdT-jD -Þ ¼495=500¼ :99. Ahora usamos los resultados de
el estudio para calcular el valor predictivo positivo de la prueba. Es decir, deseamos estimar la
probabilidad de que un sujeto que da positivo en la prueba tenga la enfermedad de Alzheimer. A
partir de los datos tabulados calculamosPAGdTjD¼436=450¼ :9689 yPAGdTjD -Þ ¼5=500¼ :01.
La sustitución de estos resultados en la Ecuación 3.5.1 da

d:9689ÞPAGdDÞ
PAGdDjT¼ (3.5.5)
d:9689ÞPAGdDÞ þ ð:01ÞPAGdD- Þ

Vemos que el valor predictivo positivo de la prueba depende de la tasa de la enfermedad en la


población relevante en general. En este caso, la población relevante consiste en sujetos que tienen 65
años de edad o más. Hacemos hincapié en que la tasa de enfermedad en la población general
relevante,P(D),no se puede calcular a partir de los datos de la muestra, ya que se extrajeron dos
muestras independientes de dos poblaciones diferentes. Debemos buscar en otra parte una
estimación deP(D). Evans et al. (A-5) estimó que el 11,3 por ciento de la población estadounidense de
65 años o más tiene la enfermedad de Alzheimer. Cuando sustituimos esta estimación deP(D)en la
Ecuación 3.5.5 obtenemos

d:9689Þð:113Þ
PAGdDjT¼ ¼ :93
d:9689Þð:113Þ þ ð:01Þð1:113Þ

Como vemos, en este caso, el valor predictivo de la prueba es muy alto.


De manera similar, consideremos ahora el valor predictivo negativo de la prueba. Ya hemos
calculado todas las entradas necesarias a excepción dePAGdT-jD¼14=450¼ :0311. Usando los valores
obtenidos anteriormente y nuestro nuevo valor, encontramos

- jT¼ d:99Þð1:113Þ
PAGdD ¼ :996
d:99Þð1 :113Þ þ ð:0311Þð:113Þ

Como vemos, el valor predictivo negativo también es bastante alto. &


Traducido del inglés al español - www.onlinedoctranslator.com

EJERCICIOS 83

EJERCICIOS

3.5.1Un equipo de investigación médica desea evaluar la utilidad de cierto síntoma (llámeloS)en el diagnóstico de una
determinada enfermedad. En una muestra aleatoria de 775 pacientes con la enfermedad, 744 informaron
tener el síntoma. En una muestra aleatoria independiente de 1380 sujetos sin la enfermedad, 21 informaron
que tenían el síntoma.
(a)En el contexto de este ejercicio, ¿qué es un falso positivo?
(b)¿Qué es un falso negativo?
(C)Calcule la sensibilidad del síntoma.
(d)Calcular la especificidad del síntoma.
(mi)Suponga que se sabe que la tasa de la enfermedad en la población general es. 001. ¿Cuál es el
valor predictivo positivo del síntoma?
(F)¿Cuál es el valor predictivo negativo del síntoma?
(gramo)Encuentre el valor predictivo positivo y el valor predictivo negativo para el síntoma para las
siguientes tasas hipotéticas de enfermedad: .0001, .01 y .10.
(h)¿Qué concluye acerca del valor predictivo del síntoma sobre la base de los resultados obtenidos en
el inciso g?

3.5.2En un artículo titulado "Desgarros meniscales en asa de cubo de la rodilla: sensibilidad y especificidad de los signos de resonancia magnética",
Dorsay y Helms (A-6) realizaron un estudio retrospectivo de 71 rodillas escaneadas por resonancia magnética. Uno de los indicadores que
examinaron fue la ausencia del "signo de la pajarita" en la resonancia magnética como evidencia de un desgarro del menisco en asa de
cubo o "tipo asa de cubo". En el estudio, la cirugía confirmó que 43 de los 71 casos eran desgarros en asa de balde. Los casos pueden
clasificarse de forma cruzada según el estado del "signo de la pajarita" y los resultados quirúrgicos de la siguiente manera:

rasgar quirúrgicamente Desgarro confirmado quirúrgicamente como

confirmado (D) No presentedD- Þ Total

Prueba positiva 38 10 48
(signo de pajarita ausente) (T)
Prueba negativa 5 18 23
(signo de pajarita presente)dT-Þ

Total 43 28 71
Fuente: Theodore A. Dorsay y Clyde A. Helms, "Desgarros meniscales en asa de cubo de la rodilla: sensibilidad y especificidad de los
signos de resonancia magnética"Radiología esquelética, 32 (2003), 266–272.

(a)¿Cuál es la sensibilidad de la prueba para ver si el signo de la corbata de lazo ausente indica un desgarro de menisco?

(b)¿Cuál es la especificidad de la prueba para ver si el signo de la corbata de lazo ausente indica un desgarro de menisco?

(C)¿Qué información adicional necesitaría para determinar el valor predictivo de la prueba?

3.5.3Oexle et al. (A-7) calculó el valor predictivo negativo de una prueba para portadores de deficiencia de ornitina transcarbamilasa
ligada al cromosoma X (OTCD, un trastorno del ciclo de la urea). Una prueba conocida como "prueba de alopurinol" se usa a
menudo como un dispositivo de detección de posibles portadores cuyos familiares son pacientes con OTCD. Citaron un estudio
de Brusilow y Horwich (A-8) que estimó la sensibilidad de la prueba de alopurinol como
. 927. Oexle et al. ellos mismos estimaron la especificidad de la prueba de alopurinol en .997. También
estimaron la prevalencia en la población de individuos con TOCD en 1=32000. Utilice esta información
y el teorema de Bayes para calcular el valor predictivo negativo de la prueba de detección de
alopurinol.
84 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

3.6 RESUMEN

En este capítulo se presentaron algunas de las ideas y conceptos básicos de probabilidad. El objetivo
ha sido proporcionar una “sensación” suficiente del tema para que los aspectos probabilísticos de la
inferencia estadística puedan entenderse y apreciarse más fácilmente cuando se presente este tema
más adelante.
Definimos probabilidad como un número entre 0 y 1 que mide la
posibilidad de que ocurra algún evento. Distinguimos entre probabilidad
subjetiva y probabilidad objetiva. La probabilidad objetiva se puede categorizar
aún más como probabilidad de frecuencia clásica o relativa. Después de
enunciar las tres propiedades de la probabilidad, definimos e ilustramos el
cálculo de los siguientes tipos de probabilidades: marginal, conjunta y
condicional. También aprendimos cómo aplicar las reglas de suma y
multiplicación para encontrar ciertas probabilidades. Aprendimos el significado
de eventos independientes, mutuamente excluyentes y complementarios.
Aprendimos el significado de especificidad, sensibilidad, valor predictivo positivo
y valor predictivo negativo aplicados a una prueba de detección o síntoma de
enfermedad. Finalmente,

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 3

Número de fórmula Nombre Fórmula

3.2.1 Probabilidad clásica PAGdmi¼


metro

norte

3.2.2 Frecuencia relativa PAGdmi¼


metro

probabilidad norte

3.3.1–3.3.3 Propiedades de probabilidad PAGdmiiÞ -0

PAGdmi1Þ þPAGdmi2Þ þ - - - þPAGdminorte¼1


- - --
EDUCACIÓN FÍSICAiþmij¼PAGdmiiÞ þEDUCACIÓN FÍSICAj

3.4.1 Regla de multiplicación PAGdA\B¼PAGdBÞPAGdAjB¼PAGdAÞPAGdBjAÞ

3.4.2 La probabilidad condicional PAGdA\BÞ


PAGdAjB¼
PAGdBÞ

3.4.3 Regla de suma PAGdun [ segundo¼PAGdAÞ þPAGdBÞPAGdA\BÞ

3.4.4 eventos independientes PAGdA\B¼PAGdAÞPAGdBÞ

3.4.5 Eventos complementarios -Þ ¼1PAGdAÞ


PAGdA

PAG
3.4.6 Probabilidad marginal PAGdAi¼ PAGdAi\ BjÞ

Sensibilidad de una prueba de tamizaje


a
PAGdTjD¼
daþCÞ
Especificidad de una prueba de cribado d
PAGdT-jD -Þ ¼
dbþdÞ
PREGUNTAS DE REPASO Y EJERCICIOS 85

3.5.1 Valor predictivo positivo de una PAGdTjDÞPAGdDÞ


PAGdDjT¼
prueba de cribado -Þ
PAGdTjDÞPAGdDÞ þPAGdTjD- ÞPAGdD

3.5.2 Valor predictivo negativo de una PAGdT-jD -Þ


- jT-¼
PAGdD
- ÞPAGdD

prueba de cribado PAGdT-jD - Þ þPAGdT-jDÞPAGdDÞ


- ÞPAGdD

Clave de símbolo D¼enfermedad


mi¼Evento
metro¼el número de veces que un eventomiiocurre
norte¼tamaño de la muestra o el número total de veces que ocurre un proceso norte¼
Tamaño de la población o el número total de eventos mutuamente excluyentes e
igualmente probables

PAGdA ¼un evento complementario; la probabilidad de un eventoun, no
ocurriendo
PAGdmii¼probabilidad de algún eventomiiocurriendo
PAGdA\B¼una declaración de "intersección" o "y"; la probabilidad de
un eventoun yun eventoBocurriendo
PAGdun [ segundo¼una declaración de "unión" o "o"; la probabilidad de un evento
un oun eventoBo ambos ocurren
PAGdAjB¼una declaración condicional; la probabilidad de un eventoA
ocurriendodado queun eventoBya ha ocurrido T¼resultados de la
prueba

PREGUNTAS DE REPASO Y EJERCICIOS

1.Defina lo siguiente:
(a)Probabilidad (b)Probabilidad objetiva
(C)Probabilidad subjetiva (d)Probabilidad clásica
(mi)El concepto de frecuencia relativa de probabilidad (F)Eventos mutuamente excluyentes
(gramo)Independencia (h)Probabilidad marginal
(i)Probabilidad conjunta (j)La probabilidad condicional
(k)La regla de la suma (l)La regla de la multiplicación
(metro)Eventos complementarios (norte)Falso positivo
(o)Falso negativo (pag)Sensibilidad
(q)especificidad (R)Valor predictivo positivo
(s)Valor predictivo negativo (t)teorema de bayes

2.Nombra y explica las tres propiedades de la probabilidad.

3.Coughlin et al. (A-9) examinó las prácticas de detección de mama y cuello uterino de mujeres hispanas y no
hispanas en condados que se aproximan a la región fronteriza sur de EE. UU. El estudio utilizó datos de las
encuestas del Sistema de Vigilancia de Factores de Riesgo del Comportamiento de adultos de 18 años o más
realizados en 1999 y 2000. La siguiente tabla informa el número de observaciones de mujeres hispanas y no
hispanas que se habían realizado una mamografía en los últimos 2 años. clasificación cruzada con el estado
civil.
86 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

Estado civil Hispano no hispano Total

actualmente casado 319 738 1057


Divorciado o Separado 130 329 459
Viudo 88 402 490
Nunca casado o viviendo como 41 95 136
una pareja no casada

Total 578 1564 2142


Fuente: Steven S. Coughlin, Robert J. Uhler, Thomas Richards y Katherine M. Wilson,
“Prácticas de detección de cáncer de mama y de cuello uterino entre mujeres hispanas
y no hispanas que residen cerca de la frontera entre Estados Unidos y México, 1999–
2000”Salud Familiar y Comunitaria, 26 (2003), 130–139.

(a)Seleccionamos al azar un sujeto que se realizó una mamografía. ¿Cuál es la probabilidad de que esté
divorciada o separada?
(b)Seleccionamos al azar un sujeto que se hizo una mamografía y descubrimos que es hispana. Con esa
información, ¿cuál es la probabilidad de que esté casada?
(C)Seleccionamos al azar un sujeto que se realizó una mamografía. ¿Cuál es la probabilidad de que no sea
hispana y esté divorciada o separada?
(d)Seleccionamos al azar un sujeto que se realizó una mamografía. ¿Cuál es la probabilidad de
que sea hispana o viuda?
(mi)Seleccionamos al azar un sujeto que se realizó una mamografía. ¿Cuál es la probabilidad de que no esté
casada?

4.Swor et al. (A-10) analizó la efectividad del entrenamiento en reanimación cardiopulmonar (RCP) en personas mayores de 55 años.
Compararon las tasas de retención de habilidades de los sujetos en este grupo de edad que completaron un curso de
instrucción de RCP tradicional con aquellos que recibieron reanimación cardiopulmonar con compresiones torácicas
únicamente (CC-CPR). Se evaluaron grupos independientes 3 meses después del entrenamiento. La siguiente tabla muestra los
números de retención de habilidades con respecto a la competencia general según lo evaluado por las calificaciones de video
realizadas por dos evaluadores de video.

Calificación general
Competente RCP CC-RCP Total

Sí 12 15 27
No 15 14 29

Total 27 29 56
Fuente: Robert Swor, Scott Compton, Fern Vining, Lynn Ososky Farr,
Sue Kokko, Rebecca Pascual y Raymond E. Jackson, "Un ensayo
controlado aleatorizado de RCP solo con compresión torácica para
adultos mayores: un estudio piloto"Reanimación, 58 (2003), 177–185.

(a)Encuentre las siguientes probabilidades y explique su significado:


1.Un sujeto seleccionado al azar se inscribió en la clase CC-CPR.
2.Un sujeto seleccionado al azar fue calificado como competente.
3.Un sujeto seleccionado al azar fue calificado como competente y se inscribió en el curso de RCP.
4.Un sujeto seleccionado al azar fue calificado como competente o se inscribió en CC-CPR.
5.Un sujeto seleccionado aleatoriamente fue calificado como competente dado que se inscribió en el curso CC-
CPR.
PREGUNTAS DE REPASO Y EJERCICIOS 87

(b)Definimos los siguientes eventos como


A¼una asignatura inscrita en el curso B de RCP¼
un sujeto inscrito en el curso CC-CPR C¼un
sujeto fue evaluado como competente D¼un
sujeto fue evaluado como no competente
Luego explica por qué cada una de las siguientes ecuaciones es o no un enunciado verdadero:
1.PAGdA \ C¼PAGdC \ AÞ 2.PAGdun [ segundo¼PAGdsegundo [ unÞ

3.PAGdA¼PAGdUN [ CÞ þPAGdA [ DÞ 4.PAGdANTES DE CRISTO¼PAGdBÞ þPAGdCÞ

5.PAGdDjA¼PAGdDÞ 6.PAGdC\B¼PAGdCÞPAGdBÞ
7.PAGdA\B¼0 8.PAGdC\B¼PAGdBÞPAGdCjBÞ
9.PAGdA \ D¼PAGdAÞPAGdAjDÞ

5.Pillman et al. (A-11) estudiaron pacientes con breves episodios agudos de psicosis. Los investigadores
clasificaron a los sujetos en cuatro tipos de personalidad: obsesivo, asténico = poca confianza en sí mismo,
asténico = mucha confianza en sí mismo, nervioso = tenso e indeterminable. La siguiente tabla clasifica estos
tipos de personalidad en tres grupos de sujetos: aquellos con trastornos psicóticos agudos y transitorios
(ATPD), aquellos con esquizofrenia "positiva" (PS) y aquellos con trastorno esquizoafectivo bipolar (BSAD):

Tipo de personalidad ATPD (1) PD (2) BSA (3) Total

obsesivo (O) 9 2 6 17
Asténico = baja confianza en sí mismo (A) 20 17 15 52
Asténico = alto Seguro de sí mismo (S) 5 3 8 dieciséis

nervioso = tenso (NORTE) 4 7 4 15


Indeterminable (tu) 4 13 9 26

Total 42 42 42 126
Fuente: Frank Pillmann, Raffaela Bloink, Sabine Balzuweit, Annette Haring y Andreas
Marneros, “Personalidad e interacciones sociales en pacientes con psicosis aguda breve”
Revista de enfermedades nerviosas y mentales, 191 (2003), 503–508.

Encuentre las siguientes probabilidades si un sujeto en este estudio se elige al azar:


(a)CORREOS) (b)PAGdA [2Þ (C)PAG(1) -Þ
(d)PAGdA
(mi)PAGdAj3Þ (F)PAGd-3Þ (gramo)PAGd2 \ 3Þ (h)PAGd2jAÞ

6.Cierto departamento de salud del condado ha recibido 25 solicitudes para una vacante que existe para una enfermera
de salud pública. De estos solicitantes, 10 tienen más de 30 años y 15 tienen menos de 30. Diecisiete tienen títulos de
licenciatura únicamente y ocho tienen títulos de maestría. De los menores de 30 años, seis tienen maestrías. Si se
hace una selección al azar entre estos 25 solicitantes, ¿cuál es la probabilidad de que una persona mayor de 30 añoso
¿Se seleccionará una persona con una maestría?

7.La siguiente tabla muestra 1000 solicitantes de la escuela de enfermería clasificados de acuerdo con los puntajes obtenidos en un
examen de ingreso a la universidad y la calidad de la escuela secundaria de la que se graduaron, según la calificación de un
grupo de educadores:

Calidad de las escuelas secundarias

Puntaje Pobre (PAG) Promedio (A) Superior (S) Total

Bajo (L) 105 60 55 220


Medio (METRO) 70 175 145 390
Alto (H) 25 sesenta y cinco 300 390

Total 200 300 500 1000


88 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

(a)Calcule la probabilidad de que un solicitante escoja al azar de este grupo:


1.Obtuvo una calificación baja en el examen.
2.Egresado de un bachillerato superior.
3.Obtuvo una calificación baja en el examen y se graduó de una escuela secundaria superior.
4.Obtuvo una calificación baja en el examen dado que se graduó de una escuela secundaria
superior.
5.Obtuvo un puntaje alto o se graduó de una escuela secundaria superior.
(b)Calcula las siguientes probabilidades:

1.PENSILVANIA) 2.P(H) 3.PM)


4.PAGdAjHÞ 5.PAGdM\PÞ 6.dHjSÞ

8.Si la probabilidad de que una enfermera de salud pública encuentre un cliente en casa es 0,7, ¿cuál es la probabilidad (suponiendo
independencia) de que en dos visitas domiciliarias realizadas en un día ambos clientes estén en casa?

9.Por una variedad de razones, los resultados de enfermedades autoinformados se utilizan con frecuencia sin verificación
en la investigación epidemiológica. En un estudio de Parikh-Patel et al. (A-12), los investigadores observaron la
relación entre los casos de cáncer autoinformados y los casos reales. Usaron los datos de cáncer autoinformados de
un Estudio de Maestros de California y validaron los casos de cáncer usando los datos del Registro de Cáncer de
California. La siguiente tabla informa sus hallazgos para el cáncer de mama:

Cáncer reportado (A) Cáncer en Registro (B) Cáncer no en el registro Total

Sí 2991 2244 5235


No 112 115849 115961

Total 3103 118093 121196

Fuente: Arti Parikh-Patel, Mark Allen, William E. Wright y el Comité Directivo del Estudio de Docentes de California, “Validación
de los cánceres autoinformados en el Estudio de Docentes de California”Diario Americano de Epidemiología, 157 (2003), 539–
545.

(a)DejarAser el caso de informar sobre el cáncer de mama en el Estudio de Maestros de California. Encuentre la
probabilidad deAen este estudio.
(b)DejarBser el caso de tener cáncer de mama confirmado en el Registro de Cáncer de California. Encuentre la
probabilidad deBen este estudio.
(C)EncontrarPAGdA\BÞ

(d)EncontrardAjBÞ
(mi)EncontrarPAGdBjAÞ

(F)Encuentre la sensibilidad de usar el cáncer de mama autoinformado como predictor de cáncer de mama real en el
registro de California.
(gramo)Encuentre la especificidad de usar el cáncer de mama autoinformado como predictor de cáncer de mama real en el
registro de California.

10En cierta población, la probabilidad de que un sujeto seleccionado al azar haya estado expuesto a
cierto alérgeno y experimente una reacción al alérgeno es .60. La probabilidad es 0,8 de que un
sujeto expuesto al alérgeno experimente una reacción alérgica. Si se selecciona un sujeto al
azar de esta población, ¿cuál es la probabilidad de que haya estado expuesto al alérgeno?

11Suponga que el 3 por ciento de las personas en una población de adultos ha intentado suicidarse. También se
sabe que el 20 por ciento de la población vive por debajo del nivel de pobreza. Si estos dos eventos son
PREGUNTAS DE REPASO Y EJERCICIOS 89

independiente, ¿cuál es la probabilidad de que una persona seleccionada al azar de la población haya intentado
suicidarse?yestar viviendo por debajo del nivel de pobreza?

12En cierta población de mujeres, el 4 por ciento ha tenido cáncer de mama, el 20 por ciento son fumadoras y el 3
por ciento son fumadoras y han tenido cáncer de mama. Se selecciona una mujer al azar de la población.
¿Cuál es la probabilidad de que haya tenido cáncer de mama o fume o ambos?

13La probabilidad de que una persona seleccionada al azar de una población presente el síntoma clásico de cierta
enfermedad es .2, y la probabilidad de que una persona seleccionada al azar tenga la enfermedad es .23.
La probabilidad de que una persona que tiene el síntoma también tenga la enfermedad es .18. Una persona
seleccionada al azar de la población no tiene el síntoma. ¿Cuál es la probabilidad de que la persona tenga la
enfermedad?

14Para una determinada población definimos los siguientes eventos para la edad de la madre al momento del
parto:A¼ menores de 20 años;B¼20–24 años;C¼25–29 años;D¼30–44 años. son los eventosA B C,yD por
pares mutuamente excluyentes?

15.Consulte el ejercicio 14. Exprese en palabras el eventomi¼ ðun [ segundoÞ.

dieciséis.Consulte el ejercicio 14. Exprese en palabras el eventoF¼ ðANTES DE CRISTOÞ.

17Consulte el ejercicio 14. Comente el evento.GRAMO¼ ðA\BÞ.

18Para una determinada población definimos los siguientes eventos con respecto a los niveles de lipoproteínas
plasmáticas (mg=dl):A¼ (10–15);B¼ ð-30Þ;C¼ ð20Þ.son los eventosAyB¿mutuamente excluyentes?Ay ¿C? By
¿C?Explique su respuesta a cada pregunta.

19Consulte el ejercicio 18. Indique con palabras el significado de los siguientes eventos:

(a)un [ segundo (b)A\B (C)A \ C (d)UN [ C

20Consulte el ejercicio 18. Indique con palabras el significado de los siguientes eventos:

(a)A- (b)B- (C)C-

21Rothenberg et al. (A-13) investigó la eficacia del uso del sonómetro Sahara de Hologic, un dispositivo portátil que
mide la densidad mineral ósea (DMO) en el tobillo, para predecir una fractura. Utilizaron un valor de
densidad mineral ósea estimado por Hologic de 0,57 como punto de corte. Los resultados de la investigación
arrojaron los siguientes datos:

Fractura confirmada
Presente (D) No presentedD- Þ Total

DMO¼ :57dTÞ 214 670 884


DMO > :57dT-Þ 73 330 403

Total 287 1000 1287


Fuente: Datos proporcionados por cortesía de Ralph J. Rothenberg, MD,
Joan L. Boyd, Ph.D. y John P. Holcomb, Ph.D.

(a)Calcule la sensibilidad de utilizar un valor de DMO de 0,57 como valor límite para predecir fracturas e
interprete sus resultados.
(b)Calcule la especificidad de utilizar un valor de DMO de 0,57 como valor de corte para predecir fracturas e interprete
sus resultados.
90 CAPÍTULO 3 ALGUNOS CONCEPTOS BÁSICOS DE PROBABILIDAD

22Verma et al. (A-14) examinó el uso de la prueba ELISA con heparina-PF4 para la trombocitopenia inducida por heparina
(TIH) en pacientes en estado crítico. Usando el ensayo de liberación de C-serotonina (SRA) como la forma de validar
HIT, los autores encontraron que en 31 pacientes que dieron negativo por SRA, 22 también dieron negativo por
heparina-PF4 ELISA.
(a)Calcule la especificidad de la prueba ELISA de heparina-PF4 para HIT.
(b)Usando una "sensibilidad derivada de la literatura" del 95 por ciento y una probabilidad previa de ocurrencia de HIT como
3.1 por ciento, encuentre el valor predictivo positivo.
(C)Usando la misma información que en la parte (b), encuentre el valor predictivo negativo.

23La sensibilidad de una prueba de detección es .95 y su especificidad es .85. La tasa de la enfermedad para la que se
utiliza la prueba es de 0,002. ¿Cuál es el valor predictivo positivo de la prueba?

Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
Consulte la muestra aleatoria de 800 sujetos del registro de nacimientos de Carolina del Norte que investigamos en los
ejercicios de revisión del Capítulo 2.

1.Cree una tabla que cruce los recuentos de madres en las clasificaciones de si el bebé fue
prematuro o no (PREMIO) y si la madre admitió haber fumado durante el embarazo
(SMOKE) o no.
(a)Encuentre la probabilidad de que una madre en esta muestra admita que fuma.
(b)Encuentre la probabilidad de que una madre en esta muestra haya tenido un bebé prematuro.
(C)Encuentre la probabilidad de que una madre de la muestra haya tenido un bebé prematuro dado que la
madre admitió que fumaba.
(d)Encuentre la probabilidad de que una madre de la muestra haya tenido un bebé prematuro dado que la madre
no admitió fumar.
(mi)Encuentre la probabilidad de que una madre de la muestra haya tenido un bebé prematuro o que la madre
no admitiera que fumaba.
2.Cree una tabla que cruce los conteos del estado civil de cada madre (MATRIMONIO) y si tuvo
un bebé con bajo peso al nacer (BAJO).
(a)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra tenga un bebé con bajo peso al nacer.
(b)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra esté casada.
(C)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra tuviera un hijo con bajo peso al nacer
dado que estaba casada.
(d)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra tuviera un hijo con bajo peso al nacer
dado que no estaba casada.
(mi)Encuentre la probabilidad de que una madre seleccionada al azar en esta muestra tuviera un hijo con bajo peso al
nacer y la madre estuviera casada.

REFERENCIAS

Referencias de metodología
1. unLLANGRAMOUtah,Un curso intermedio de probabilidad,Springer-Verlag, Nueva York, 1995.
2. RICHARDISAAC,Los placeres de la probabilidad,Springer-Verlag, Nueva York, 1995.
3. hAROLDJ. L.INCENDIO PROVOCADO,Introducción a la probabilidad,Addison-Wesley, Reading, MA, 1995.
4. LJ SPROMEDIO,Fundamentos de Estadística,Segunda edición revisada, Dover, Nueva York, 1972.
5. AN KOLMOGOROV,Fundamentos de la Teoría de la Probabilidad,Chelsea, Nueva York, 1964 (edición original en alemán
publicada en 1933).
REFERENCIAS 91

Aplicaciones Referencias
A-1. TASHADCARTER, miMANUELAMETRODESHACER, SAGARVPARCAy J.AMÉSLkENNEDY, “La edad temprana de inicio como factor de riesgo
de mala evolución del trastorno bipolar”,Revista de Investigación Psiquiátrica, 37 (2003), 297–303.
A-2. jOHNHPORCERELLI, ROSEMARIOCOGAN, PAGATRICIAP. W.est, miENANOA. R.OSE, DARISTALAMBRECHE, kARÉNE. W.ILSON,
RICHARDKSEVERSON, y DUNÍAkARANA, “Vitimización violenta de mujeres y hombres: síntomas físicos y
psiquiátricos”,Revista de la Junta Estadounidense de Medicina Familiar, 16 (2003), 32–39.
A-3. DanielFERNANDO, ROBERTOFSESPELUZNANTE, jORGEFONTDEVILA, y NÁBILAmiL-BASSEL, “Predictores de compartir drogas
entre usuarios de drogas inyectables en el sur del Bronx: implicaciones para la transmisión del VIH”,Revista de Drogas
Psicoactivas, 35 (2003), 227–236.
A-4. THOMASA. L.AVEÍSTAy unMANÍnorteURU-JETER, “¿La concordancia racial médico-paciente está asociada con una mayor
satisfacción con la atención?”Revista de Salud y Comportamiento Social, 43 (2002), 296–306.
A-5. DA EFURGONETAS, PASCHERR, NR CAceptar, MS ALBERT, HH FUNKENSTEIN, LA SMITO, LEHEBERT, TTWETLE,
LG BRANCHO, M. C.CÓMO, CHHENNEKENS, y JO TAYLOR, "Prevalencia estimada de la enfermedad de Alzheimer en los Estados
Unidos",Trimestral de Milbank, 68 (1990), 267–289.
A-6. THéodoroADORSAYy CLYDEAHOLMOS, "Roturas de menisco en asa de cubo de la rodilla: sensibilidad y especificidad de los signos de
resonancia magnética"Radiología esquelética, 32 (2003), 266–272.
A-7. kONRADOEXLE, LUISABONAFE, y BCOMERSTENMANN, "Observación sobre la utilidad y las tasas de error de la prueba de
alopurinol para detectar la deficiencia leve de ornitina transcarbamilasa",Genética Molecular y Metabolismo, 76 (
2002), 71–75.
A-8. SO BRUSILOW, ALHORIGINAL, “Enzimas del ciclo de la urea”, en: CR SCRIVER, AL BEAUDET, WS SLY, DVTODO
(Editor),Las bases metabólicas y moleculares de las enfermedades hereditarias,8.ª ed., McGraw-Hill, Nueva York, 2001, págs.
1909–1963.
A-9. STEVENSCOUGHLIN, ROBERTOJ. U.HLER, THOMASRCHARDOSy kATERINAMWILSON, “Cáncer de mama y de cuello uterino
Prácticas de detección entre mujeres hispanas y no hispanas que residen cerca de la frontera entre Estados Unidos y
México, 1999–2000”,Salud Familiar y Comunitaria, 26 (2003), 130–139.
A-10. ROBERTOSWOR, SCOTTCOMPTON, FERNVENTRADA, LYNNOSOSKYFARR, SUEkOKKO, REBECCAPAGASCUALy RAYMONDMI.
jACKSON, "Un ensayo controlado aleatorizado de RCP solo con compresión torácica para adultos mayores: un estudio piloto"
Reanimación, 58 (2003), 177–185.
A-11. FRANGOPAGILLMANN, RAFFAELABL ~ gruñir, SABINEBALZUWEIT, ANNETTEHUN ANILLO, y ANDREASMETROARNEROS, "Personalidad
e interacciones sociales en pacientes con psicosis breves agudas”,El Diario de Enfermedades Nerviosas y Mentales, 191 (2003),
503–508.
A-12. AITRPAGARIKH-PAGATEL, mARCAALLEN, WILLIAME. W.BIEN, y el Comité Directivo del Estudio de Maestros de California, “Validación de
los cánceres autoinformados en el Estudio de Maestros de California”,Diario Americano de Epidemiología, 157 (2003), 539–545.

A-13. RALFAJROTHENBERG, jOANLBOYDy J.OHNPHolcomb, "Ultrasonido cuantitativo del calcáneo como herramienta de detección para
detectar osteoporosis: diferentes rangos de referencia para mujeres caucásicas, mujeres afroamericanas y hombres
caucásicos"Revista de Densitometría Clínica, 7 (2004), 101–110.
A-14. ACORRERKVERMA, mARCOLEVINO, StephenJCARTERy J.OHNG KELTON, “Frecuencia de trombocitopenia inducida por herparina
en pacientes en cuidados intensivos,”Farmacoterapia, 23 (2003), 645–753.
CAPÍTULO 4
DISTRIBUCIONES DE PROBABILIDAD

RESUMEN DEL CAPÍTULO

Las distribuciones de probabilidad de variables aleatorias asumen papeles importantes en los


análisis estadísticos. Dado que muestran todos los valores posibles de una variable aleatoria y
las probabilidades asociadas con estos valores, las distribuciones de probabilidad se pueden
resumir de manera que permitan a los investigadores tomar decisiones objetivas fácilmente
con base en muestras extraídas de las poblaciones que representan las distribuciones. Este
capítulo presenta distribuciones de probabilidad discretas y continuas de uso frecuente que se
utilizan en capítulos posteriores para hacer inferencias estadísticas.

TEMAS

4.1INTRODUCCIÓN
4.2DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES DISCRETAS

4.3LA DISTRIBUCIÓN BINOMIAL


4.4LA DISTRIBUCIÓN DE VENENO
4.5DISTRIBUCIONES DE PROBABILIDAD CONTINUA
4.6LA DISTRIBUCIÓN NORMAL
4.7APLICACIONES DE DISTRIBUCIÓN NORMAL
4.8RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. comprender distribuciones discretas seleccionadas y cómo usarlas para calcular
probabilidades en problemas del mundo real.
2. comprender distribuciones continuas seleccionadas y cómo usarlas para calcular
probabilidades en problemas del mundo real.
3. ser capaz de explicar las similitudes y diferencias entre las distribuciones del tipo
discreto y del tipo continuo y cuándo es apropiado el uso de cada una.

92
4.2 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES DISCRETAS 93

4.1 INTRODUCCIÓN

En el capítulo anterior presentamos los conceptos básicos de probabilidad, así como los métodos para
calcular la probabilidad de un evento. Nos basamos en estos conceptos en el presente capítulo y
exploramos formas de calcular la probabilidad de un evento en condiciones algo más complejas. En
este capítulo veremos que la relación entre los valores de una variable aleatoria y las probabilidades
de su ocurrencia se puede resumir por medio de un dispositivo llamadoDistribución de probabilidad.
Una distribución de probabilidad puede expresarse en forma de tabla, gráfico o fórmula. El
conocimiento de la distribución de probabilidad de una variable aleatoria proporciona al clínico y al
investigador una poderosa herramienta para resumir y describir un conjunto de datos y para llegar a
conclusiones sobre una población de datos sobre la base de una muestra de datos extraída de la
población.

4.2 DISTRIBUCIONES DE PROBABILIDAD


DE VARIABLES DISCRETAS

Comencemos nuestra discusión sobre las distribuciones de probabilidad considerando la distribución de


probabilidad de una variable discreta, que definiremos de la siguiente manera:

DEFINICIÓN
ElDistribución de probabilidadde una variable aleatoria discreta es una tabla, gráfico,
fórmula u otro dispositivo utilizado para especificar todos los valores posibles de una
variable aleatoria discreta junto con sus respectivas probabilidades.

Si representamos la distribución de probabilidad discreta porpagdXÞ,entoncespagdX¼


PAGdX¼XÞes la probabilidad de que la variable aleatoria discreta X asuma un valorX.

EJEMPLO 4.2.1
En un artículo que aparece en elDiario de la Asociación Dietética Americana,Holben et al. (A-1) analizó el
estado de la seguridad alimentaria en las familias de la región de los Apalaches en el sur de Ohio. El
propósito del estudio fue examinar las tasas de hambre de las familias con niños en un programa local de
Head Start en Athens, Ohio. El instrumento de la encuesta incluía el Módulo de Encuesta de Seguridad
Alimentaria de los Hogares de EE. UU. de 18 preguntas para medir el hambre y la seguridad alimentaria.
Además, se preguntó a los participantes cuántos programas de asistencia alimentaria habían utilizado en los
últimos 12 meses. La Tabla 4.2.1 muestra el número de programas de asistencia alimentaria utilizados por los
sujetos de esta muestra.
Deseamos construir la distribución de probabilidad de la variable discretaX,dónde X¼número
de programas de asistencia alimentaria utilizados por los sujetos del estudio.

Solución: los valores deXsonX1¼1;X2¼2; . . . ;X7¼7, yX8¼8. Calculamos las


probabilidades de estos valores dividiendo sus respectivas frecuencias
por el total, 297. Así, por ejemplo,pagdX1¼PAGdX¼X1¼62=297¼ :2088.
94 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

TABLA 4.2.1 Número de programas de


asistencia utilizados por familias con niños en
programas Head Start en el sur de Ohio

Número de programas Frecuencia

1 62
2 47
3 39
4 39
5 58
6 37
7 4
8 11

Total 297
Fuente: Datos proporcionados por cortesía de David H.
Holben, Ph.D. y John P. Holcomb, Ph.D.

TABLA 4.2.2 Distribución de probabilidad de los


programas utilizados por las familias entre los
sujetos descritos en el ejemplo 4.2.1

Número de programas (X) PAGdX¼XÞ

1 . 2088
2 . 1582
3 . 1313
4 . 1313
5 . 1953
6 . 1246
7 . 0135
8 . 0370

Total 1.0000

Mostramos los resultados en la Tabla 4.2.2, que es la distribución de probabilidad


deseada. &

Alternativamente, podemos presentar esta distribución de probabilidad en forma de gráfico,


como en la Figura 4.2.1. En la Figura 4.2.1, la longitud de cada barra vertical indica la probabilidad del
valor correspondiente deX.
Se observará en la Tabla 4.2.2 que los valores depagdX¼PAGdX¼XÞson todos positivos,
todos son menores que 1 y su suma es igual a 1. Estos no son fenómenos peculiares de este
ejemplo en particular, sino que son características de todas las distribuciones de probabilidad
de variables discretas. SiX1;X2;X3; . . . ;Xkson todos los valores posibles de la aleatoria discreta
4.2 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES DISCRETAS 95

0.25

0.20

0.15

Probabilidad
0.10

0.05

0.00
1 2 3 4 5 6 7 8
X(número de programas de asistencia)

FIGURA 4.2.1Representación gráfica de la distribución de


probabilidad que se muestra en la Tabla 4.2.1.

variableX,entonces podemos dar las siguientes dos propiedades esenciales de una distribución de
probabilidad de una variable discreta:

d1Þ 0PAG-PAGdX¼XÞ -1
d2Þ PAGdX¼X¼1; para todosX

El lector también notará que cada una de las probabilidades en la Tabla 4.2.2 es la
frecuencia relativa de ocurrenciadel valor correspondiente deX.
Con su distribución de probabilidad disponible para nosotros, podemos hacer declaraciones de
probabilidad con respecto a la variable aleatoriaX.Ilustramos con algunos ejemplos.

EJEMPLO 4.2.2
¿Cuál es la probabilidad de que una familia seleccionada al azar utilice tres programas de asistencia?

Solución: Podemos escribir la probabilidad deseada comopagd3¼PAGdX¼3Þ.Vemos en la


Tabla 4.2.2 que la respuesta es .1313. &

EJEMPLO 4.2.3
¿Cuál es la probabilidad de que una familia seleccionada al azar use uno o dos programas?

Solución: Para responder a esta pregunta, usamos la regla de la suma para eventos mutuamente
excluyentes. Usando la notación de probabilidad y los resultados de la Tabla 4.2.2,
escribimos la respuesta comoPAGd1 [ 2¼PAGd1Þ þPAGd2Þ ¼ :2088þ :1582¼ :3670: &
96 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

TABLA 4.2.3 Distribución de probabilidad acumulada del número de


programas utilizados por las familias entre los sujetos descritos en
el ejemplo 4.2.1

Número de programas (X) Frecuencia acumuladaPAGdx-xÞ

1 . 2088
2 . 3670
3 . 4983
4 . 6296
5 . 8249
6 . 9495
7 . 9630
8 1.0000

Distribuciones AcumulativasA veces será más conveniente trabajar con eldistribución de


probabilidad acumuladade una variable aleatoria. La distribución de probabilidad acumulada
para la variable discreta cuya distribución de probabilidad se da en la Tabla 4.2.2 puede
obtenerse sumando sucesivamente las probabilidades,PAGdX¼XiÞ,dado en la última columna.
La probabilidad acumulada deXise escribe comoFdXi¼PAGdx-xiÞ.Da la probabilidad de queXes
menor o igual a un valor especificado,Xi.
La distribución de probabilidad acumulada resultante se muestra en la Tabla 4.2.3. El gráfico de
la distribución de probabilidad acumulada se muestra en la Figura 4.2.2. La gráfica de una distribución
de probabilidad acumulada se llamaojiva.En la Figura 4.2.2 la gráfica deF(x) consta únicamente de las
líneas horizontales. Las líneas verticales solo le dan al gráfico una apariencia conectada. La longitud
de cada línea vertical representa la misma probabilidad que la de la línea correspondiente en la Figura
4.2.1. Por ejemplo, la longitud de la línea vertical enX¼3 en la Figura 4.2.2 representa la misma
probabilidad que la longitud de la línea erigida enX¼3 en la Figura 4.2.1, o .1313 en la escala vertical.

1.0

0.9

0.8

0.7

0.6
F(X)

0.5
0.4

0.3

0.2

0.1
0.0
1 2 3 4 5 6 7 8
X(número de programas)
FIGURA 4.2.2Distribución de probabilidad acumulada del número de programas de
asistencia entre los sujetos descritos en el Ejemplo 4.2.1.
4.2 DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES DISCRETAS 97

Consultando la distribución de probabilidad acumulada podemos responder rápidamente a


preguntas como las de los siguientes ejemplos.

EJEMPLO 4.2.4
¿Cuál es la probabilidad de que una familia escogida al azar use dos o menos programas de
asistencia?

Solución: La probabilidad que buscamos se puede encontrar directamente en la Tabla 4.2.3


leyendo la probabilidad acumulada opuestaX¼2, y vemos que es .3670. Eso es,
PAGdX -2Þ ¼ :3670. También podemos encontrar la respuesta al inspeccionar la
Figura 4.2.2 y determinar la altura de la gráfica (medida en el eje vertical) por
encima del valorX¼2. &

EJEMPLO 4.2.5
¿Cuál es la probabilidad de que una familia seleccionada al azar use menos de cuatro programas?

Solución: Dado que una familia que usó menos de cuatro programas usó uno, dos o
tres programas, la respuesta es la probabilidad acumulada de 3. Es decir,
PAGdX <4¼PAGdX -3Þ ¼ :4983. &

EJEMPLO 4.2.6
¿Cuál es la probabilidad de que una familia seleccionada al azar use cinco o más programas?

Solución: Para encontrar la respuesta hacemos uso del concepto de probabilidades


complementarias. El conjunto de familias que utilizaron cinco o más programas es el
complemento del conjunto de familias que utilizaron menos de cinco (es decir, cuatro
o menos) programas. La suma de las dos probabilidades asociadas con estos
conjuntos es igual a 1. Escribimos esta relación en notación de probabilidad comoPAG
dX -5Þ þPAGdX -4¼1: Por lo tanto,PAGdX -5¼1PAGdX -4¼1 :6296¼ :3704. &

EJEMPLO 4.2.7
¿Cuál es la probabilidad de que una familia seleccionada al azar use entre tres y cinco
programas, inclusive?

Solución: PAGdX -5Þ ¼ :8249 es la probabilidad de que una familia utilice entre uno y cinco
programas, inclusive. Para obtener la probabilidad de entre tres y cinco
programas, restamos, de .8249, la probabilidad de dos o menos. Usando la
notación de probabilidad, escribimos la respuesta comoPAGd3 -X -5¼PAGdX -5Þ
PAGdX -2Þ ¼ :8249 :3670¼ :4579. &

La distribución de probabilidad dada en la Tabla 4.2.1 se desarrolló a partir de la experiencia real, por
lo que encontrar otra variable que siga esta distribución sería una coincidencia. La probabilidad
98 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

sin embargo, las distribuciones de muchas variables de interés pueden determinarse o asumirse
sobre la base de consideraciones teóricas. En secciones posteriores, estudiamos en detalle tres de
estas distribuciones de probabilidad teóricas: labinomio,elveneno,y elnormal.

Media y varianza de distribuciones de probabilidad discretasEl


la media y la varianza de una distribución de probabilidad discreta se pueden encontrar fácilmente usando el
fórmulas a continuación.
X
metro¼ XPdXÞ (4.2.1)
X X
s2¼ dXmetroÞ2pagdX¼ X2pagdXÞ metro2 (4.2.2)

dóndep(x)es la frecuencia relativa de una variable aleatoria dadaX.La desviación estándar es


simplemente la raíz cuadrada positiva de la varianza.

EJEMPLO 4.2.8
¿Cuáles son la media, la varianza y la desviación estándar de la distribución del ejemplo 4.2.1?

Solución:
metro¼ ð1Þð:2088Þ þ ð2Þð:1582Þ þ ð3Þð:1313Þ þ s2 þ ð8Þð:0370¼3:5589
¼ ð1 3:5589Þ2d:2088Þ þ ð2 3:5589Þ2d:1582Þ þ ð3 3:5589Þ2d:1313Þ
þ þ ð8 3:5589Þ2d:0370¼3:8559
Por lo tanto, podemos concluir que el número medio de progpag rafimar
ffiffiffiffisffiffiffiuffiffiffitffiiffiffilized fue 3.5589 con un
varianza de 3.8559. La desviación estándar es por lo tanto 3:8559¼1:9637 programas.&

EJERCICIOS

4.2.1.En un estudio de Cross et al. (A-2), a los pacientes que estaban involucrados en el tratamiento de problemas con el juego
se les preguntó acerca de las adicciones concurrentes a las drogas y el alcohol. Sea la variable aleatoria discretaX
representan el número de sustancias adictivas concurrentes utilizadas por los sujetos. La Tabla 4.2.4 resume la
distribución de frecuencias para esta variable aleatoria.
(a)Construya una tabla de la frecuencia relativa y la frecuencia acumulada para esta distribución
discreta.
(b)Construya un gráfico de la distribución de probabilidad y un gráfico que represente la distribución de
probabilidad acumulada para estos datos.

4.2.2.Consulte el Ejercicio 4.2.1.


(a)¿Cuál es la probabilidad de que un individuo seleccionado al azar use cinco sustancias adictivas?
(b)¿Cuál es la probabilidad de que un individuo seleccionado al azar use menos de tres sustancias
adictivas?
(C)¿Cuál es la probabilidad de que un individuo seleccionado al azar use más de seis sustancias
adictivas?
(d)¿Cuál es la probabilidad de que un individuo seleccionado al azar use entre dos y cinco sustancias
adictivas, inclusive?

4.2.3.Consulte el Ejercicio 4.2.1. Encuentre la media, la varianza y la desviación estándar de esta distribución de frecuencia.
4.3 LA DISTRIBUCIÓN BINOMIAL 99

TABLA 4.2.4 Número de sustancias adictivas concurrentes usadas por


pacientes en programas seleccionados de tratamiento de juegos de azar

Número de sustancias utilizadas Frecuencia

0 144
1 342
2 142
3 72
4 39
5 20
6 6
7 9
8 2
9 1
Total 777

4.3 LA DISTRIBUCIÓN BINOMIAL

ElDistribución binomiales una de las distribuciones de probabilidad más comunes en estadística


aplicada. La distribución se deriva de un proceso conocido comojuicio de Bernoulli, nombrado en
honor al matemático suizo James Bernoulli (1654-1705), quien hizo importantes contribuciones en el
campo de la probabilidad, incluida, en particular, la distribución binomial. Cuando un proceso o
experimento aleatorio, llamado ensayo, puede dar como resultado solo uno de dos resultados
mutuamente excluyentes, como muerto o vivo, enfermo o sano, a término o prematuro, el ensayo se
denomina ensayo de Bernoulli.

El proceso de BernoulliUna secuencia de ensayos de Bernoulli forma unproceso de Bernoulli


bajo las siguientes condiciones.

1.Cada prueba da como resultado uno de dos resultados posibles, mutuamente excluyentes. Uno de los
posibles resultados se denota (arbitrariamente) como un éxito, y el otro se denota como un fracaso.

2.La probabilidad de éxito, denotada porpag,permanece constante de ensayo en ensayo. La


probabilidad de una falla, 1pag,se denota porq.
3.Los juicios son independientes; es decir, el resultado de cualquier juicio en particular no se ve afectado
por el resultado de cualquier otro juicio.

EJEMPLO 4.3.1
Estamos interesados en poder calcular la probabilidad deXéxitos ennorteEnsayos de Bernoulli. Por ejemplo,
si examinamos todos los registros de nacimiento del Centro Estatal de Estadísticas de Salud de Carolina del
Norte (A-3) para el año calendario 2001, encontramos que el 85.8 por ciento de los embarazos tuvieron parto
en la semana 37 o más tarde. Nos referiremos a esto como un nacimiento a término. Con ese porcentaje,
podemos interpretar la probabilidad de un nacimiento registrado en la semana 37 o posterior como . 858. Si
seleccionamos al azar cinco registros de nacimiento de esta población, ¿cuál es la probabilidad de que
exactamente tres de los registros sean de nacimientos a término?
100 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

Solución: Designemos la ocurrencia de un registro de un nacimiento a término (F) como un “éxito”, y


apresurémonos a agregar que un nacimiento prematuro (P) no es un fracaso, pero la
investigación médica indica que los niños nacidos en la semana 36 o antes están en riesgo
de complicaciones médicas. Si estamos buscando registros de nacimiento de partos
prematuros, estos se designarían como éxitos y los registros de nacimiento a término
completo se designarían como fracasos.
También será conveniente asignar el número 1 a un éxito (registro de
parto a término) y el número 0 a un fracaso (registro de parto prematuro).
El proceso que eventualmente resulta en un registro de nacimiento lo consideramos un
proceso de Bernoulli.
Suponga que los cinco registros de nacimiento seleccionados dieron como resultado esta secuencia de

nacimientos a término:

FPFFP
En forma codificada escribiríamos esto como

10110
Dado que la probabilidad de éxito se denota porpagy la probabilidad de falla se
denota porq,la probabilidad de la secuencia anterior de resultados se encuentra por
medio de la regla de la multiplicación para ser

PAGd1; 0; 1; 1; 0¼pqppq¼q2pag3

La regla de la multiplicación es apropiada para calcular esta probabilidad ya que estamos


buscando la probabilidad de un término completo y un término prematuro y un término
completo y un término completo y un prematuro, en ese orden o, en otras palabras, la
probabilidad conjunta de los cinco eventos. Para simplificar, se han utilizado comas, en lugar
de notación de intersección, para separar los resultados de los eventos en el enunciado de
probabilidad.
La probabilidad resultante es la de obtener la secuencia específica de resultados
en el orden mostrado. Sin embargo, no nos interesa el orden de ocurrencia de los
registros de nacimientos a término y prematuros, sino, como ya se ha dicho, la
probabilidad de ocurrencia de exactamente tres registros de nacimientos a término de
cinco seleccionados al azar. registros. En lugar de ocurrir en la secuencia que se
muestra arriba (llámela secuencia número 1), también podrían ocurrir tres éxitos y dos
fallas en cualquiera de las siguientes secuencias adicionales:

Número Secuencia

2 11100
3 10011
4 11010
5 11001
6 10101
7 01110
8 00111
9 01011
10 01101
4.3 LA DISTRIBUCIÓN BINOMIAL 101

Cada una de estas secuencias tiene la misma probabilidad de ocurrir, y esta


probabilidad es igual aq2pag3, la probabilidad calculada para la primera secuencia
mencionada.
Cuando tomamos una sola muestra de tamaño cinco de la población
especificada, obtenemos solo una secuencia de éxitos y fracasos. La pregunta ahora
es: ¿Cuál es la probabilidad de obtener el número de secuencia 1 o el número de
secuencia 2? . . o el número de secuencia 10? Por la regla de la suma sabemos que esta
probabilidad es igual a la suma de las probabilidades individuales. En el presente
ejemplo necesitamos sumar los 10q2pag3's o, de manera equivalente, multiplicarq2pag
3por 10. Ahora podemos responder a nuestra pregunta original: ¿Cuál es la
probabilidad, en una muestra aleatoria de tamaño 5, extraída de la población
especificada, de observar tres éxitos (registro de un nacimiento a término) y dos
fracasos (registro de un parto a término)? nacimiento prematuro)? Ya que en la
población,pag¼ :858;q¼ ð1pagÞ ¼ ð1:858Þ ¼ :142 la respuesta a la pregunta es

10d:142Þ2d:858Þ3¼10d:0202Þð:6316Þ ¼ :1276
&

Procedimiento para muestras grandes: uso de combinacionesPodemos fácilmente


Anticipe que, a medida que aumenta el tamaño de la muestra, enumerar el número de secuencias se vuelve
cada vez más difícil y tedioso. Lo que se necesita es un método fácil de contar el número de secuencias. Dicho
método se proporciona mediante una fórmula de conteo que nos permite determinar rápidamente cuántos
subconjuntos de objetos se pueden formar cuando usamos en los subconjuntos diferentes números de los
objetos que componen el conjunto del que se seleccionan los objetos. Cuando el orden de los objetos en un
subconjunto es irrelevante, el subconjunto se denomina combinación de objetos. Cuando el orden de los
objetos en un subconjunto importa, nos referimos al subconjunto como una permutación de objetos. Aunque
las permutaciones de objetos se usan a menudo en la teoría de la probabilidad, no se usarán en nuestra
discusión actual. Si un conjunto consta de norteobjetos, y deseamos formar un subconjunto deXobjetos de
estosnorteobjetos, sin tener en cuenta el orden de los objetos en el subconjunto, el resultado se denomina
combinación.Por ejemplo, definimos una combinación de la siguiente manera cuando la combinación se
forma tomandoXobjetos de un conjunto denorteobjetos.

DEFINICIÓN
Una combinación denorteobjetos tomadosXa la vez es un subconjunto desordenado deX del
norteobjetos.

El número de combinaciones denorteobjetos que se pueden formar tomandoXde ellos a la vez


está dada por
¡norte!
norteCX¼ (4.3.1)
¡X!dnorte XÞ!

dónde¡X!,leerXfactorial, es el producto de todos los números enteros deXhasta 1. Es decir,


¡X!¼XdX1ÞðX2Þ. . . d1Þ.Observamos que, por definición, 0!¼1:
Volvamos a nuestro ejemplo en el que tenemos una muestra denorte¼5 registros de nacimiento y
estamos interesados en encontrar la probabilidad de que tres de ellos sean de nacimientos a término.
102 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

TABLA 4.3.1 La Distribución Binomial

Número de éxitos,X Probabilidad,FdXÞ

0 norteC0qnorte
0pag0

1 norteC1qnorte
1pag1

2 norteC2qnorte
2pag2

.. ..
. .
X
X CXq Xpag
norte norte

.. ..
. .
nortepagnorte
norte norteCnorteqnorte

Total 1

La ecuación 4.3.1 encuentra que el número de secuencias en nuestro ejemplo es

5! 54321 120
norteC3¼ ¼ ¼ ¼10
3!d5 3Þ! d3 2 1Þð2 1Þ 12

En nuestro ejemplo dejamosX¼3, el número de éxitos, de modo quenx¼2, el número de fallas.


Entonces podemos escribir la probabilidad de obtener exactamenteXéxitos ennortejuicios como

FdX¼norteCXqnxpagX¼norteCXpagXqnxparaX¼0; 1; 2; . . . ;norte (4.3.2)


¼0; en otra parte

Esta expresión se llama distribución binomial. En la Ecuación 4.3.2FdX¼PAGdX¼


XÞ, dóndeXes la variable aleatoria, el número de éxitos ennortejuicios UsamosFdXÞ
en vez dePAGdX¼XÞpor su compacidad y por su uso casi universal.
Podemos presentar la distribución binomial en forma tabular como en la Tabla 4.3.1. Establecemos el
hecho de que la Ecuación 4.3.2 es una distribución de probabilidad mostrando lo siguiente:

1.FdXÞ -0 para todos los valores reales deX.Esto se sigue del hecho de quenorteypagson no
negativos y, por lo tanto,norteCX;pagX, yd1pagÞnxson todas no negativas y, por lo tanto,
su producto es mayor o igual a cero. PAG
PAG
2. FdX¼1. Esto se ve como cierto si reconocemos que norteCXqnxpagXes igual a
½ð1pagÞ þpagnorte¼1norte¼1, la conocida expansión binomial. Si el binomiodqþpagÞnortese
expande, tenemos

nortednorte 1Þ
dqþ pag¼q
Þnorte norteþn qnorte
1pag1
þ qnorte 2 pag2þ þn q1pagnorte 1þpagnorte
2

Si comparamos los términos de la expansión, término por término, con elFdXÞen la Tabla 4.3.1
vemos que son, término por término, equivalentes, ya que
Fd0¼norteC0qnorte0pag0¼qnorte

Fd1¼norteC1qnorte1pag1¼n qnorte1pag
4.3 LA DISTRIBUCIÓN BINOMIAL 103

2 nortednorte 1Þq 2
Fd2¼ norteC 2q
norte
2pag¼ norte2pag

2
.. .. ..
. . .
norte norte
Fdnorte¼ norteC norteq nortepagnorte¼pag

EJEMPLO 4.3.2
Como otro ejemplo del uso de la distribución binomial, los datos del Centro Estatal de Estadísticas de
Salud de Carolina del Norte (A-3) muestran que el 14 por ciento de las madres admitieron fumar uno o
más cigarrillos por día durante el embarazo. Si se selecciona una muestra aleatoria de tamaño 10 de
esta población, ¿cuál es la probabilidad de que contenga exactamente cuatro madres que admitieron
haber fumado durante el embarazo?

Solución: Consideramos que la probabilidad de que una madre admita que fuma es .14. Usando la
Ecuación 4.3.2 encontramos
6
Fd4¼ 10C4d:86Þ ð:14Þ4

10!
¼ d:4045672Þð:0003842Þ
4!6!
¼ :0326 &

Tabla BinomialEl cálculo de una probabilidad usando la Ecuación 4.3.2 puede ser una tarea
tediosa si el tamaño de la muestra es grande. Afortunadamente, las probabilidades para
diferentes valores denorte, pag,yXhan sido tabulados, de modo que solo necesitamos consultar
una tabla apropiada para obtener la probabilidad deseada. La Tabla B del Apéndice es una de
las muchas tablas disponibles. Da la probabilidad de queXes menor o igual a algún valor
especificado. Es decir, la tabla da las probabilidades acumulativas deX¼0 hasta cierto número
positivo especificado de éxitos.
Ilustremos el uso de la tabla usando el Ejemplo 4.3.2, donde se deseaba encontrar la
probabilidad de queX¼4 cuandonorte¼10 ypag¼ :14. Basándonos en nuestro conocimiento de
las distribuciones de probabilidad acumulada de la sección anterior, sabemos quePAGdX¼4Þse
puede encontrar restandoPAGdX -3ÞdePAGdX -4Þ.Si en la tabla B ubicamospag¼ :14 para norte
¼10, encontramos quePAGdX -4Þ ¼ :9927 yPAGdX -3Þ ¼ :9600. Restando el último del primero
da: 9927: 9600¼ :0327, que casi concuerda con nuestro cálculo manual (discrepancia debido al
redondeo).
Con frecuencia nos interesa determinar probabilidades, no valores específicos de
X,pero para intervalos tales como la probabilidad de queXestá entre, digamos, 5 y 10. Ilustremos con
un ejemplo.

EJEMPLO 4.3.3
Suponga que se sabe que el 10 por ciento de cierta población es daltónico. Si se extrae una muestra
aleatoria de 25 personas de esta población, use la Tabla B en el Apéndice para encontrar la
probabilidad de que:

(a)Cinco o menos serán daltónicos.


104CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

Solución: Esta probabilidad es una entrada en la tabla. No es necesario sumar ni


restar,PAGdX -5Þ ¼ :9666.
(b)Seis o más serán daltónicos.

Solución: No podemos encontrar esta probabilidad directamente en la tabla. Para encontrar la


respuesta, usamos el concepto de probabilidades complementarias. La probabilidad de que
seis o más sean daltónicos es el complemento de la probabilidad de que cinco o menos sean
daltónicos. Es decir, este conjunto es el complemento del conjunto especificado en el inciso
a; por lo tanto,

PAGdX -6¼1PAGdX -5¼1 :9666¼ :0334


(C)Entre seis y nueve inclusive serán daltónicos.

Solución: Hallamos esto restando la probabilidad de queXes menor o igual a 5 de


la probabilidad de queXes menor o igual a 9. Es decir,
PAGd6 -X -9¼PAGdX -9Þ PAGdX -5Þ ¼ :9999 :9666¼ :0333

(d)Dos, tres o cuatro serán daltónicos.

Solución:Esta es la probabilidad de queXes entre 2 y 4 inclusive.

PAGd2 -X -4¼PAGdX -4ÞPAGdX -1Þ ¼ :9020 :2712¼ :6308 &

Uso de la tabla B cuandopag > :5La tabla B no da probabilidades para los valores depag
mayor que .5. Sin embargo, podemos obtener probabilidades de la Tabla B, replanteando el
problema en términos de la probabilidad de una falla, 1pag,en lugar de en términos de la
probabilidad de éxito,pag.Como parte de la reafirmación, también debemos pensar en
términos del número de fallas,no,en lugar del número de éxitos,X.Podemos resumir esta idea
de la siguiente manera:
PAGdX¼Xjnorte; pag > :50¼PAGdX¼nxjnorte;1pagÞ (4.3.3)

En palabras, la Ecuación 4.3.3 dice: “La probabilidad de queXes igual a algún valor especificado
dado el tamaño de la muestra y una probabilidad de éxito mayor que .5 es igual a la
probabilidad de queXes igual anxdado el tamaño de la muestra y la probabilidad de falla de 1
pag:"A los efectos de utilizar la tabla binomial, tratamos la probabilidad de falla como si fuera la
probabilidad de éxito. Cuandopages mayor que .5, podemos obtener probabilidades
acumulativas de la Tabla B usando la siguiente relación:

PAGdx-xjnorte; pag > :50¼PAGdX-nxjnorte;1pagÞ (4.3.4)

Finalmente, usar la Tabla B para encontrar la probabilidad de queXes mayor o igual a algunaXcuando
PAG > :5, usamos la siguiente relación:

PAGdx-xjnorte; pag > :50¼PAGdX-nxjnorte;1pagÞ (4.3.5)


4.3 LA DISTRIBUCIÓN BINOMIAL 105

EJEMPLO 4.3.4
Según una encuesta de junio de 2003 realizada por el proyecto Massachusetts Health Benchmarks
(A-4), aproximadamente el 55 por ciento de los residentes respondieron “problema grave” a la
pregunta: “Algunas personas piensan que la obesidad infantil es un problema de salud nacional. ¿Qué
opinas? ¿Es un problema muy serio, algo problemático, no muy problemático o no es un problema en
absoluto?”. Suponiendo que la probabilidad de dar esta respuesta a la pregunta es .55 para cualquier
residente de Massachusetts, use la Tabla B para encontrar la probabilidad de que si se eligen 12
residentes al azar:

(a)Exactamente siete responderán "problema grave".

Solución: Replanteamos el problema de la siguiente manera: ¿Cuál es la probabilidad de que un residente


seleccionado al azar dé una respuesta que no sea "problema grave" de exactamente cinco
residentes de 12, si el 45 por ciento de los residentes da una respuesta que no sea "problema
grave". Encontramos la respuesta de la siguiente manera:

PAGdX¼5jnorte¼12;pag¼ :45¼PAGdX -5Þ PAGdX -4Þ


¼ :5269 :3044¼ :2225

(b)Cinco hogares o menos responderán “problema grave”.

Solución:La probabilidad que queremos es

PAGdX -5jnorte¼12;pag¼ :55¼PAGdX -12 5jnorte¼12;pag¼ :45Þ


¼PAGdX -7jnorte¼12;pag¼ :45
¼1 PAGdX -6jnorte¼12;pag¼ :45Þ
¼1 :7393¼ :2607

(C)Ocho o más hogares responderán “problema grave”.

Solución:La probabilidad que queremos es

PAGdX -8jnorte¼12;pag¼ :55¼PAGdX -4jnorte¼12;pag¼ :45Þ ¼ :3044


&

La Figura 4.3.1 proporciona una representación visual de la solución a las tres partes del
Ejemplo 4.3.4.

Los parámetros binomialesLa distribución binomial tiene dos parámetros,nortey


pag.Son parámetros en el sentido de que son suficientes para especificar una distribución binomial.
La distribución binomial es realmente una familia de distribuciones con cada valor posible denortey
pagdesignando a un miembro diferente de la familia. La media y la varianza de la distribución
binomial sonmetro¼notario públicoys2¼notario públicod1pagÞ,respectivamente.
Estrictamente hablando, la distribución binomial es aplicable en situaciones donde
el muestreo es de una población infinita o de una población finita con reemplazo. Dado
que en la práctica real las muestras suelen extraerse sin reemplazo de poblaciones finitas,
surge la pregunta de si la distribución binomial es adecuada en estas circunstancias. Que
el binomio sea apropiado o no depende de cuán drástico sea el efecto de estas
condiciones sobre la constancia depagde juicio en juicio. Generalmente se acepta
106 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGURA 4.3.1Representación esquemática de las soluciones del Ejemplo 4.3.4 (los números relevantes de éxitos y
fracasos en cada caso están encerrados en un círculo).

que cuandonortees pequeño en relación conNORTE,el modelo binomial es apropiado. Algunos escritores dicen que nortees
pequeño en relación connortesinortees al menos 10 veces más grande quenorte.
La mayoría de los programas de software estadístico permiten el cálculo de probabilidades
binomiales con una computadora personal. EXCEL, por ejemplo, se puede usar para calcular probabilidades
individuales o acumulativas para valores específicos dex, n,ypag.Supongamos que deseamos encontrar las
probabilidades individuales paraX¼0 a travésX¼6 cuandonorte¼6 ypag¼ :3. Ingresamos los números del 0 al
6 en la Columna 1 y procedemos como se muestra en la Figura 4.3.2. Podemos seguir un procedimiento
similar para encontrar las probabilidades acumuladas. Para esta ilustración, usamos MINITAB y colocamos
los números del 1 al 6 en la Columna 1. Procedemos como se muestra en la Figura 4.3.3.

Usando el siguiente comando de celda:

DISTR.BINOM(A*, 6, .3, falso),donde A* es la referencia de celda apropiada

Obtenemos la siguiente salida:

0 0.117649
1 0.302526
2 0.324135
3 0.185220
4 0.059535
5 0.010206
6 0.000729

FIGURA 4.3.2Cálculo en Excel de probabilidades binomiales individuales paraX¼0 a travésX¼6


cuandonorte¼6 ypag¼ :3:
EJERCICIOS 107

Datos:

C1: 0 1 2 3 4 5 6

Caja de diálogo: Comando de sesión:

Calcular Distribuciones de probabilidad MTB > CDF C1;


Binomio SUBC> BINOMIAL 6 0.3.

ElegirProbabilidad acumulada.Tipo6enNúmero de
intentos.Tipo0.3enProbabilidad de éxito.Elegir Columna de
entraday tipoC1.Hacer clicDE ACUERDO.

Producción:

Función de distribución acumulativa

Binomial con n 6yp 0.300000

X P( X < X)
0.00 0.1176
1.00 0.4202
2.00 0.7443
3.00 0.9295
4.00 0.9891
5.00 0.9993
6.00 1.0000

FIGURA 4.3.3Cálculo con MINITAB de probabilidades binomiales acumulativas paraX¼0 a travésX¼ 6


cuandonorte¼6 ypag¼ :3.

EJERCICIOS

En cada uno de los siguientes ejercicios, suponga quenortees lo suficientemente grande en relación connorteque la
distribución binomial puede usarse para encontrar las probabilidades deseadas.

4.3.1Según los datos recopilados por el Centro Nacional de Estadísticas de Salud y puestos a disposición del público en la base
de datos Sample Adult (A-5), una estimación del porcentaje de adultos a los que en algún momento de su vida se les
ha dicho que tienen hipertensión es 23,53. por ciento. Si seleccionamos una muestra aleatoria simple de 20
adultos estadounidenses y suponga que la probabilidad de que a cada uno le hayan dicho que tiene hipertensión es
. 24, encuentre la probabilidad de que el número de personas en la muestra a las que se les ha dicho que
tienen hipertensión sea:

(a)exactamente tres (b)tres o más


(C)Menos de tres (d)Entre tres y siete, inclusive
108 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

4.3.2Consulte el Ejercicio 4.3.1. ¿Cuántos adultos a los que se les ha dicho que tienen hipertensión esperaría
encontrar en una muestra de 20?

4.3.3Consulte el Ejercicio 4.3.1. Supongamos que seleccionamos una muestra aleatoria simple de cinco adultos. Utilice la Ecuación 4.3.2
para encontrar la probabilidad de que, en la muestra, el número de personas a las que se les ha dicho que tienen hipertensión
sea:

(a)Cero (b)Más de uno


(C)Entre uno y tres, inclusive (d)dos o menos
(mi)Cinco

4.3.4La misma base de datos de encuestas citada en el ejercicio 4.3.1 (A-5) muestra que el 32 por ciento de los adultos estadounidenses
indicaron que se han hecho la prueba del VIH en algún momento de su vida. Considere una muestra aleatoria simple de 15
adultos seleccionados en ese momento. Encuentre la probabilidad de que el número de adultos que han sido examinados para
El VIH en la muestra sería:
(a)Tres (b)menos de cinco
(C)Entre cinco y nueve, inclusive (d)Más de cinco, pero menos de 10
(mi)seis o más

4.3.5Consulte el Ejercicio 4.3.4. Encuentre la media y la varianza del número de personas a las que se les hizo la prueba del VIH en muestras de

tamaño 15.

4.3.6Consulte el Ejercicio 4.3.4. Supongamos que tomáramos una muestra aleatoria simple de 25 adultos hoy y encontráramos que dos
se han hecho la prueba del VIH en algún momento de su vida. ¿Sería sorprendente estos resultados? ¿Por qué o por qué no?

4.3.7Coughlin et al. (A-6) estimó que el porcentaje de mujeres que viven en condados fronterizos a lo largo del sur de los
Estados Unidos con México (condados designados en California, Arizona, Nuevo México y Texas) que tienen menos de
una educación secundaria es 18.7. Suponga que la probabilidad correspondiente es .19. Supongamos que
seleccionamos tres mujeres al azar. Encuentre la probabilidad de que el número con menos de una educación
secundaria sea:

(a)exactamente cero (b)exactamente uno


(C)Más de uno (d)dos o menos
(mi)Dos o tres (F)exactamente tres

4.3.8En una encuesta de estudiantes de enfermería que cursan una maestría, el 75 por ciento afirmó que espera ser
promovido a un puesto más alto dentro de un mes después de recibir el título. Si este porcentaje se cumple para toda
la población, encuentre, para una muestra de 15, la probabilidad de que el número que espera una promoción dentro
de un mes después de recibir su título sea:

(a)Seis (b)al menos siete


(C)no más de cinco (d)Entre seis y nueve, inclusive

4.3.9Dado el binomioPAG
todos los parámetrospag¼ :8 ynorte¼3, muestre por medio de la expansión binomial dada en
Tabla 4.3.1 que FdX¼1.

4.4 LA DISTRIBUCIÓN DE POISSON

La siguiente distribución discreta que consideramos es laDistribución de veneno,llamado así por el


matemático francés Simeon Denis Poisson (1781-1840), a quien generalmente se le atribuye la
publicación de su derivación en 1837. Esta distribución se ha utilizado ampliamente como
4.4 LA DISTRIBUCIÓN DE POISSON 109

modelo de probabilidad en biología y medicina. Haight (1) presenta un catálogo bastante extenso de
tales aplicaciones en el Capítulo 7 de su libro.
SiXes el número de ocurrencias de algún evento aleatorio en un intervalo de tiempo o espacio
(o algún volumen de materia), la probabilidad de queXocurrirá está dada por

miyoyoX
FdX¼ ; X¼0; 1; 2; . . . (4.4.1)
¡X!

la letra griegayo (lambda) se llama el parámetro de la distribución y es el número


promedio de ocurrencias del evento aleatorio en el intervalo (o volumen). El símbolo
mies la constante (a cuatro decimales) 2.7183.
PAG
Se puede demostrar queFdXÞ -0 por cadaXy eso XFdX¼1 para que la distribución
satisface los requisitos para una distribución de probabilidad.

El proceso de PoissonHemos visto que la distribución binomial resulta de un conjunto de


suposiciones sobre un proceso subyacente que produce un conjunto de observaciones numéricas.
Tal, también, es el caso de la distribución de Poisson. Las siguientes declaraciones describen lo que se
conoce comoproceso de veneno.

1.Las ocurrencias de los eventos son independientes. La ocurrencia de un evento en un intervalo.1


de espacio o tiempo no tiene efecto sobre la probabilidad de una segunda ocurrencia del
evento en el mismo intervalo o en cualquier otro.
2.Teóricamente, debe ser posible un número infinito de ocurrencias del evento en el
intervalo.
3.La probabilidad de que ocurra una sola vez el evento en un intervalo dado es
proporcional a la longitud del intervalo.
4.En cualquier porción infinitesimalmente pequeña del intervalo, la probabilidad de que ocurra
más de una vez el evento es insignificante.

Una característica interesante de la distribución de Poisson es el hecho de que la media y la


varianza son iguales. Ambos están representados por el símboloyo

Cuándo usar el modelo de PoissonLa distribución de Poisson se emplea como modelo cuando
se realizan recuentos de eventos o entidades que se distribuyen aleatoriamente en el espacio o
el tiempo. Uno puede sospechar que cierto proceso obedece a la ley de Poisson, y bajo esta
suposición se pueden calcular las probabilidades de ocurrencia de eventos o entidades dentro
de alguna unidad de espacio o tiempo. Por ejemplo, bajo los supuestos de que la distribución
de algún parásito entre los miembros individuales del huésped sigue la ley de Poisson, uno
puede, con el conocimiento del parámetroyo,calcular la probabilidad de que un huésped
individual seleccionado al azar produzcaXnúmero de parásitos. En un capítulo posterior
aprenderemos cómo decidir si es plausible la suposición de que un proceso específico obedece
a la ley de Poisson. Un uso adicional de la distribución de Poisson en la práctica ocurre cuando
nortees grande ypages pequeño. En este caso, la distribución de Poisson se puede utilizar para

1Para simplificar, la distribución de Poisson se analiza en términos de intervalos, pero se implican otras unidades, como el
volumen de materia.
110 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

aproximar la distribución binomial. En otras palabras,

miyoyoX
norteCXpagXqnx ;X¼0; 1; 2; . . .
¡X!
dóndeyo¼notario público:

Para ilustrar el uso de la distribución de Poisson para calcular probabilidades,


consideremos los siguientes ejemplos.

EJEMPLO 4.4.1
En un estudio de anafilaxia inducida por fármacos entre pacientes que tomaban bromuro de
rocuronio como parte de su anestesia, Laake y Røttingen (A-7) encontraron que la aparición de
anafilaxia seguía un modelo de Poisson conyo¼12 incidentes por año en Noruega. Encuentre la
probabilidad de que en el próximo año, entre los pacientes que reciben rocuronio, exactamente tres
experimenten anafilaxia.

Solución:Por la Ecuación 4.4.1, encontramos que la respuesta es

mi12123
PAGdX¼3¼ ¼ :00177
3! &

EJEMPLO 4.4.2
Consulte el Ejemplo 4.4.1. ¿Cuál es la probabilidad de que al menos tres pacientes en el próximo
año experimenten anafilaxia si se administra rocuronio con anestesia?

Solución: Podemos usar el concepto de eventos complementarios en este caso. DesdePAGdX -2Þ
es el complemento dePAGdX -3Þ,tenemos

PAGdX -3¼1 PAGdX -2¼1 ½PAGdX¼0Þ þPAGdX¼1Þ þPAGdX¼2Þ


-
mi12120 mi12121 mi12122
¼1 þ þ
0! 1! 2!
¼1 ½:00000614þ :00007373þ :00044238
¼1 :00052225
¼ :99947775
&

En los ejemplos anteriores, las probabilidades se evaluaron directamente a partir de la ecuación. Sin
embargo, podemos usar la Tabla C del Apéndice, que da probabilidades acumulativas para varios
valores deyoyX.

EJEMPLO 4.4.3
En el estudio de cierto organismo acuático, se tomó una gran cantidad de muestras de un
estanque y se contó la cantidad de organismos en cada muestra. El número promedio de
4.4 LA DISTRIBUCIÓN DE POISSON 111

Se encontró que los organismos por muestra eran dos. Suponiendo que el número de organismos sigue una
distribución de Poisson, encuentre la probabilidad de que la siguiente muestra contenga uno o menos
organismos.

Solución: En la tabla C vemos que cuandoyo¼2, la probabilidad de queX -1 es .406. Eso es,
PAGdX -1j2Þ ¼ :406. &

EJEMPLO 4.4.4
Consulte el Ejemplo 4.4.3. Encuentre la probabilidad de que la próxima muestra que se tome contenga exactamente
tres organismos.

Solución:

PAGdX¼3j2¼PAGdX -3ÞPAGdX -2Þ ¼ :857 :677¼ :180


&

Datos:

C1: 0 1 2 3 4 5 6

Caja de diálogo: Comando de sesión:

Calcular Distribuciones de probabilidad veneno BTT > PDF C1;


SUBC > Poisson .70.
ElegirProbabilidad.Tipo.70enSignificar.ElegirColumna de entraday tipoC1.
Hacer clicDE ACUERDO.

Producción:

Función de densidad de probabilidad

Veneno con mu 0.700000

X P( X X)
0.00 0.4966
1.00 0.3476
2.00 0.1217
3.00 0.0284
4.00 0.0050
5.00 0.0007
6.00 0.0001

FIGURA 4.4.1Cálculo MINITAB de probabilidades de Poisson individuales paraX¼0 a travésX¼6 yyo¼:7.


112 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

Usando comandos encontrados en:

Análisis Otro Calculadora de probabilidad

Obtenemos la siguiente salida:

0 <= X Prob(x <= X)


0 0.4966
1 0.8442
2 0.9659
3 0.9942
4 0.9992
5 0.9999
6 1.0000

FIGURA 4.4.2Cálculo MINITAB de probabilidades de Poisson acumuladas paraX¼0 a


travésX¼6 yyo¼ :7.

EJEMPLO 4.4.5
Consulte el Ejemplo 4.4.3. Encuentre la probabilidad de que la próxima muestra que se tome contenga más
de cinco organismos.

Solución: Dado que el conjunto de más de cinco organismos no incluye cinco, estamos
preguntando por la probabilidad de que se observen seis o más organismos. Esto
se obtiene restando de uno la probabilidad de observar cinco o menos. Eso es,

PAGdX >5j2¼1PAGdX -5¼1:983¼ :017


&

Las probabilidades de Poisson se pueden obtener de la mayoría de los paquetes de software estadístico. Para ilustrar
el uso de MINITAB para este propósito, suponga que deseamos encontrar las probabilidades individuales paraX¼0 a
travésX¼6 cuandoyo¼ :7. Introducimos los valores deXen la Columna 1 y proceda como se muestra en la Figura 4.4.1.
Obtenemos las probabilidades acumuladas para los mismos valores deXyyo como se muestra en la Figura 4.4.2.

EJERCICIOS

4.4.1Singh et al. (A-8) analizó la aparición de hemangioma capilar retiniano (RCH) en pacientes con enfermedad de
von Hippel-Lindau (VHL). El RCH es un tumor vascular benigno de la retina. Usando una revisión retrospectiva
de una serie de casos consecutivos, los investigadores encontraron que la cantidad de tumores RCH
4.5 DISTRIBUCIONES DE PROBABILIDAD CONTINUA 113

incidentes siguieron una distribución de Poisson conyo¼4 tumores por ojo para pacientes con VHL. Utilizando este
modelo, encuentre la probabilidad de que en un paciente con VHL seleccionado al azar:
(a)Hay exactamente cinco casos de tumores por ojo.
(b)Hay más de cinco casos de tumores por ojo.
(C)Hay menos de cinco casos de tumores por ojo.
(d)Hay entre cinco y siete casos de tumores por ojo, inclusive.
4.4.2Tubert-Bitter et al. (A-9) encontró que la cantidad de reacciones gastrointestinales graves informadas al Comité
Británico de Seguridad de la Medicina fue de 538 para 9 160 000 recetas del fármaco antiinflamatorio
piroxicam. Esto corresponde a una tasa de 0,058 reacciones gastrointestinales por cada 1000 recetas escritas.
Usando un modelo de Poisson para la probabilidad, conyo¼ :06, encuentre la probabilidad de
(a)Exactamente una reacción gastrointestinal en 1000 recetas
(b)Exactamente dos reacciones gastrointestinales en 1000 recetas
(C)Sin reacciones gastrointestinales en 1000 prescripciones
(d)Al menos una reacción gastrointestinal en 1000 prescripciones

4.4.3Si la media de accidentes graves por año en una fábrica grande (donde el número de empleados se
mantiene constante) es cinco, encuentre la probabilidad de que en el año actual haya:

(a)Exactamente siete accidentes (b)Diez o más accidentes


(C)sin accidentes (d)Menos de cinco accidentes

4.4.4En un estudio de la efectividad de un insecticida contra cierto insecto, se roció una gran área de tierra. Posteriormente, se
examinó el área en busca de insectos vivos seleccionando cuadrados al azar y contando el número de insectos vivos
por cuadrado. La experiencia pasada ha demostrado que el número promedio de insectos vivos por cuadrado
después de rociar es de 0,5. Si el número de insectos vivos por cuadrado sigue una distribución de Poisson, encuentre
la probabilidad de que un cuadrado seleccionado contenga:

(a)Exactamente un insecto vivo (b)Sin insectos vivos


(C)Exactamente cuatro insectos vivos (d)Uno o más insectos vivos.

4.4.5En una determinada población se diagnostican una media de 13 nuevos casos de cáncer de esófago cada año. Si
la incidencia anual de cáncer de esófago sigue una distribución de Poisson, encuentre la probabilidad de que
en un año determinado el número de casos nuevos de cáncer de esófago sea:

(a)exactamente 10 (b)al menos ocho


(C)no más de 12 (d)Entre nueve y 15, inclusive
(mi)menos de siete

4.5 DISTRIBUCIONES DE
PROBABILIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta ahora, la binomial y la de Poisson, son


distribuciones de variables discretas. Consideremos ahora distribuciones de variables aleatorias
continuas. En el Capítulo 1 establecimos que una variable continua es aquella que puede asumir
cualquier valor dentro de un intervalo específico de valores asumidos por la variable. En consecuencia,
entre dos valores cualesquiera asumidos por una variable continua, existe un número infinito de
valores.
114 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

Para ayudarnos a comprender la naturaleza de la distribución de una variable aleatoria


continua, consideremos los datos presentados en la Tabla 1.4.1 y la Figura 2.3.2. En la tabla tenemos
189 valores de la variable aleatoria edad. El histograma de la Figura 2.3.2 se construyó ubicando
puntos específicos en una línea que representaba la medida de interés y erigiendo una serie de
rectángulos, cuyos anchos eran las distancias entre dos puntos específicos en la línea, y cuyas alturas
representaban el número de valores de la variable que cae entre los dos puntos especificados. Los
intervalos definidos por dos puntos especificados consecutivos los llamamos intervalos de clase.
Como se señaló en el Capítulo 2, las subáreas del histograma corresponden a las frecuencias de
ocurrencia de los valores de la variable entre los límites de la escala horizontal de estas subáreas. Esto
proporciona una forma de calcular la frecuencia relativa de aparición de valores entre dos puntos
especificados: simplemente determine la proporción del área total del histograma que se encuentra
entre los puntos especificados. Esto se puede hacer más convenientemente consultando las columnas
de frecuencia relativa o frecuencia relativa acumulada de la Tabla 2.3.2.

Imagine ahora la situación en la que el número de valores de nuestra variable aleatoria es muy
grande y el ancho de nuestros intervalos de clase se hace muy pequeño. El histograma resultante podría
parecerse al que se muestra en la Figura 4.5.1.
Si tuviéramos que conectar los puntos medios de las celdas del histograma en la Figura 4.5.1 para
formar un polígono de frecuencia, claramente tendríamos una figura mucho más suave que el polígono de
frecuencia de la Figura 2.3.4.
En general, como el número de observaciones,norte,tiende a infinito, y el ancho de los
intervalos de clase tiende a cero, el polígono de frecuencia tiende a una curva suave como la
que se muestra en la Figura 4.5.2. Estas curvas suaves se utilizan para representar gráficamente
las distribuciones de variables aleatorias continuas. Esto tiene algunas consecuencias
importantes cuando tratamos con distribuciones de probabilidad. Primero, el área total bajo la
curva es igual a uno, como ocurría con el histograma, y la frecuencia relativa de aparición de
valores entre dos puntos cualesquiera de laX-eje es igual al área total delimitada por la curva, el
X-eje, y líneas perpendiculares erigidas en los dos puntos en elX-eje. Ver Figura 4.5.3. El

F(X)

X
FIGURA 4.5.1Un histograma resultante de una gran cantidad de valores y
pequeños intervalos de clase.
4.5 DISTRIBUCIONES DE PROBABILIDAD CONTINUA 115

F(X)

X
FIGURA 4.5.2Representación gráfica de una distribución
continua.

Probabilidad decualquier valor específicode la variable aleatoria escero.Esto parece lógico, ya que un
valor específico está representado por un punto en laX-eje y el área sobre un punto es cero.

Encontrar el área bajo una curva suaveCon un histograma, como hemos visto,
Las subáreas de interés se pueden encontrar agregando áreas representadas por las celdas. No
tenemos celdas en el caso de una curva suave, por lo que debemos buscar un método alternativo
para encontrar subáreas. Tal método es proporcionado por el cálculo integral. Para encontrar el área
bajo una curva suave entre dos puntosayb,elfunción de densidadse integra deaab.Afunción de
densidades una fórmula utilizada para representar la distribución de una variable aleatoria continua.
La integración es el caso límite de la suma, pero no realizaremos ninguna integración, ya que el nivel
de matemáticas involucrado está más allá del alcance de este libro. Como veremos más adelante,
para todas las distribuciones continuas que consideraremos, habrá una manera más fácil de
encontrar áreas bajo sus curvas.
Aunque la definición de una distribución de probabilidad para una variable aleatoria
continua está implícita en la discusión anterior, a modo de resumen, la presentamos de forma
más compacta como sigue.

DEFINICIÓN
Una función no negativaf(x)se llama distribución de probabilidad (a veces
llamada función de densidad de probabilidad) de la variable aleatoria
continuaXsi el área total delimitada por su curva y elX -eje es igual a 1 y si el
subárea bajo la curva delimitada por la curva, el X -eje y perpendiculares
erigidas en dos puntos cualesquieraaybdar la probabilidad de queXesta entre
los puntosayb.

F(X)

a b X
FIGURA 4.5.3Gráfica de una distribución continua que
muestra el área entreayb.
116 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

Así, la probabilidad de que una variable aleatoria continua asuma valores entrea ybse
denota porPAGdun < X < segundoÞ.

4.6 LA DISTRIBUCIÓN NORMAL

Llegamos ahora a la distribución más importante de todas las estadísticas: ladistribución


normal.La fórmula para esta distribución fue publicada por primera vez por Abraham De
Moivre (1667–1754) el 12 de noviembre de 1733. Muchos otros matemáticos ocupan un lugar
destacado en la historia de la distribución normal, incluido Carl Friedrich Gauss (1777–1855). A
la distribución se le suele llamardistribución gaussianaen reconocimiento a sus contribuciones.

La densidad normal viene dada por

1
FdXÞ ¼ pffiffiffiffiffimidXmetroÞ2=2s2; 1 <X <1 (4.6.1)
2PD
En la Ecuación 4.6.1,pagymison las constantes familiares, 3.14159 . . . y 2.71828
. . . , respectivamente, que se encuentran con frecuencia en matemáticas. Los dos parámetros de la
distribución sonmetro,la media, ys,la desviación estándar. Para nuestros propósitos podemos pensar
enmetroysde una distribución normal, respectivamente, como medidas de tendencia central y
dispersión, como se analiza en el Capítulo 2. Sin embargo, dado que una variable aleatoria con
distribución normal es continua y toma valores entre1yþ1,su media y desviación estándar pueden
definirse más rigurosamente; pero tales definiciones no pueden darse sin usar el cálculo. El gráfico de
la distribución normal produce la familiar curva en forma de campana que se muestra en la Figura
4.6.1.

Características de la Distribución NormalLos siguientes son algunos


características importantes de la distribución normal.

1.es simétrica respecto a su media,metro.Como se muestra en la Figura 4.6.1, la curva a cada lado
demetroes una imagen especular del otro lado.
2.La media, la mediana y la moda son todas iguales.
3.El área total bajo la curva por encima de laX-eje es una unidad cuadrada. Esta característica
se deriva del hecho de que la distribución normal es una distribución de probabilidad.
Debido a la simetría ya mencionada, el 50 por ciento del área está a la derecha de una
perpendicular erigida en el medio y el 50 por ciento está a la izquierda.

m X
FIGURA 4.6.1Gráfico de una distribución normal.
4.6 LA DISTRIBUCIÓN NORMAL 117

. 68

. 16 1σ 1σ.dieciséis

m_1σ m m+1σ X
(a)

. 95

. 025 . 025
2σ 2σ

m_2σ m m+2σ X
(b)

. 997

. 0015 3σ 3σ . 0015

m_3σ m m+3σ X
(C)
FIGURA 4.6.2Subdivisión del área bajo la curva normal (las áreas son
aproximadas).

4.Si erigimos perpendiculares a una distancia de 1 desviación estándar de la media en ambas


direcciones, el área encerrada por estas perpendiculares, elX-eje, y la curva será
aproximadamente el 68 por ciento del área total. Si extendemos estos límites laterales
una distancia de dos desviaciones estándar a cada lado de la media, se encerrará
aproximadamente el 95 por ciento del área, y si los extendemos una distancia de tres
desviaciones estándar, se encerrará aproximadamente el 99,7 por ciento del área total. .
Estas áreas aproximadas se ilustran en la Figura 4.6.2.
5.La distribución normal está completamente determinada por los parámetrosmetroys.En otras
palabras, se especifica una distribución normal diferente para cada valor diferente demetroys.
Diferentes valores demetroDesplace la gráfica de la distribución a lo largo de laX-eje como se
muestra en la Figura 4.6.3. Diferentes valores desdetermine el grado de planitud o pico de la
gráfica de la distribución como se muestra en la Figura 4.6.4. Por las características de estos
dos parámetros,metrose refiere a menudo como unparámetro de ubicaciónysse refiere a
menudo como unparámetro de forma
118 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

m1 m2 m3 X
m1<m2<m3

FIGURA 4.6.3Tres distribuciones normales con diferentes medias pero la misma cantidad de
variabilidad.

σ1

σ2

σ3

σ1<σ2<σ3 X

FIGURA 4.6.4 Tres distribuciones normales con diferentes desviaciones estándar pero la
misma media.

La distribución normal estándarLa última característica mencionada de la distribución


normal implica que la distribución normal es realmente una familia de distribuciones en
las que un miembro se distingue de otro sobre la base de los valores demetroys.El
miembro más importante de esta familia es eldistribución normal estándarodistribución
normal unitaria,como a veces se le llama, porque tiene una media de 0 y una desviación
estándar de 1. Puede obtenerse de la Ecuación 4.6.1 creando una variable aleatoria.

z¼ ðXmetroÞ=s (4.6.2)

La ecuación para la distribución normal estándar se escribe

1
FdzÞ ¼ pffiffiffiffiffimiz2=2; 1 <z <1 (4.6.3)
2pag

El gráfico de la distribución normal estándar se muestra en la Figura 4.6.5.


Elz-La transformación demostrará ser útil en los ejemplos y aplicaciones que siguen. Este
valor dezdenota, para un valor de una variable aleatoria, el número de desviaciones estándar
por encima de ese valorðþzÞo por debajodzÞla media, que en este caso es 0. Por ejemplo, unaz-
transformación que da un valor dez¼1 indica que el valor deXutilizado en la transformación es 1
desviación estándar por encima de 0. Un valor dez¼1 indica que el valor deXutilizada en la
transformación es 1 desviación estándar por debajo de 0. Esta propiedad se ilustra en los
ejemplos de la Sección 4.7.
4.6 LA DISTRIBUCIÓN NORMAL 119

σ=1

m=0 z
FIGURA 4.6.5La distribución normal estándar.

0 z0 z

FIGURA 4.6.6Área dada por el Apéndice Tabla D.

Para encontrar la probabilidad de queztoma un valor entre dos puntos cualesquiera de laz-eje,
digamos,z0yz1, debemos encontrar el área delimitada por las perpendiculares erigidas en estos
puntos, la curva y el eje horizontal. Como mencionamos anteriormente, las áreas bajo la curva de una
distribución continua se encuentran integrando la función entre dos valores de la variable. En el caso
de la normal estándar, entonces, para encontrar el área entrez0yz1directamente, necesitaríamos
evaluar la siguiente integral:

Zz1
1
pffiffiffiffiffimiz2=2dz
z0 2pag

Aunque no existe una solución de forma cerrada para la integral, podemos usar métodos
numéricos de cálculo para aproximar las áreas deseadas debajo de la curva con la precisión
deseada. Afortunadamente, no tenemos que preocuparnos por tales asuntos, ya que hay tablas
disponibles que brindan los resultados de cualquier integración en la que podamos estar
interesados. La Tabla D en el Apéndice es un ejemplo de estas tablas. En el cuerpo de la Tabla D
se encuentran las áreas bajo la curva entre1y los valores dezse muestra en la columna más a la
izquierda de la tabla. El área sombreada de la Figura 4.6.6 representa el área listada en la tabla
como entre1yz0, dóndez0es el valor especificado dez.
Ahora ilustramos el uso de la Tabla D con varios ejemplos.

EJEMPLO 4.6.1
Dada la distribución normal estándar, encuentre el área bajo la curva, arriba de
laz-eje entrez¼ 1yz¼2.
120 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

0 2 z
FIGURA 4.6.7La distribución normal estándar que muestra el
área entrez¼ 1yz¼2.

Solución: Será útil hacer un dibujo de la distribución normal estándar y sombrear el área
deseada, como en la Figura 4.6.7. si ubicamosz¼2 en la Tabla D y leemos la
entrada correspondiente en el cuerpo de la tabla, encontramos que el área
deseada es .9772. Podemos interpretar esta zona de varias maneras. Podemos
interpretarlo como la probabilidad de que unzelegidos al azar de la población de
z's tendrá un valor entre1y 2. También podemos interpretarlo como la frecuencia
1yese
relativa de ocurrencia (o proporción) de valores dezentre 2, o podemos
97,72 decir
por ciento de
losz's tiene un valor entre 1y 2. &

EJEMPLO 4.6.2
¿Cuál es la probabilidad de que unzelegidos al azar de la población dez's tendrá
un valor entre 2:55 yþ2:55?

Solución: La Figura 4.6.8 muestra el área deseada. La tabla D nos da el área entre1 y 2,55,
que se encuentra ubicando 2,5 en la columna más a la izquierda de la tabla y
luego moviéndose hasta llegar a la entrada en la columna encabezada por 0,05.
Encontramos que esta área es .9946. Si miramos el dibujo que dibujamos, vemos
que esta es más área de la deseada. Necesitamos restar de .9946 el área a la
izquierda de 2:55. La referencia a la Tabla D muestra que el área a la izquierda de
2:55 es .0054. Por lo tanto, la probabilidad deseada es

PAGd2:55 <z <2:55Þ ¼ :9946 :0054¼ :9892

_2.55 0 2.55 X
FIGURA 4.6.8 Curva normal estándar que muestra
PAGd2:55 <z <2:55Þ. &
4.6 LA DISTRIBUCIÓN NORMAL 121

_2.74 0 1.53 z
FIGURA 4.6.9Curva normal estándar que muestra la proporción de
zvalores entrez¼2:74 yz¼1:53.

Supongamos que nos piden encontrar la probabilidad de quezes entre 2:55 y 2:55
inclusive. La probabilidad deseada se expresa comoPAGd2:55 -z-2:55Þ.Dado que, como
señalamos en la Sección 4.5,PAGdz¼z0¼0;PAGd2:55 -z-2:55¼PAGd2:55 <z <2:55Þ ¼ :9892.

EJEMPLO 4.6.3
¿Qué proporción dezlos valores están entre 2:74 y 1.53?

Solución:La Figura 4.6.9 muestra el área deseada. Encontramos en la tabla D que el área entre
1y 1.53 es .9370, y el área entre1y 2:74 es .0031. Para obtener la
probabilidad deseada restamos .0031 de .9370. Eso es,
PAGd2:74 -z-1:53Þ ¼ :9370 :0031¼ :9339 &

EJEMPLO 4.6.4
Dada la distribución normal estándar, encuentrePAGdz-2:71Þ.

Solución: El área deseada se muestra en la Figura 4.6.10. Obtenemos el área a la


derecha de z¼2:71 restando el área entre 1y 2,71 de 1. Así,
PAGdz-2:71¼1 PAGdz-2:71Þ

¼1 :9966
¼ :0034

0 2.71 z
FIGURA 4.6.10Distribución normal estándar que muestra
PAGdz-2:71Þ.
&
122 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 4.6.5
Dada la distribución normal estándar, encuentrePAGd:84 -z-2:45Þ.

Solución: El área que estamos buscando se muestra en la Figura 4.6.11. Primero


1y .84.
obtenemos el área entre1y 2.45 y de eso restar el área entre En otras
palabras,

PAGd:84 -z-2:45¼PAGdz-2:45Þ PAGdz-:84Þ

¼ :9929 :7995
¼ :1934

0 .84 2.45 z
FIGURA 4.6.11Curva normal estándar que muestra
PAGd:84 -z-2:45Þ.
&

EJERCICIOS

Dada la distribución normal estándar, encuentre:


4.6.1El área bajo la curva entrez¼0 yz¼1:43
4.6.2La probabilidad de que unzelegido al azar tendrá un valor entrez¼ 2:87 yz¼2:64
4.6.3PAGdz-:55Þ 4.6.4PAGdz-:55Þ
4.6.5PAGdz < 2:33Þ 4.6.6PAGdz <2:33Þ

4.6.7PAGd 1:96 -z-1:96Þ 4.6.8PAGd2:58 -z-2:58Þ


4.6.9PAGd 1:65 -z-1:65Þ 4.6.10PAGdz¼ :74Þ

Dadas las siguientes probabilidades, encuentrez1:

4.6.11PAGdz - z1Þ ¼ :0055 4.6.12PAGd2:67 -z - z1Þ ¼ :9718


4.6.13PAGdz > z1Þ ¼ :0384 4.6.14PAGdz1-z-2:98Þ ¼ :1117
4.6.15PAGdz1-z - z1Þ ¼ :8132

4.7 APLICACIONES DE DISTRIBUCIÓN NORMAL

Aunque su importancia en el campo de la estadística es indiscutible, se debe tener en cuenta que la


distribución normal no es una ley a la que se adhieren todas las características medibles que ocurren en la
naturaleza. Es cierto, sin embargo, que muchas de estas características son aproximadamente
4.7 APLICACIONES DE DISTRIBUCIÓN NORMAL 123

Normalmente distribuido. En consecuencia, aunque ninguna de las variables encontradas en la


práctica tiene una distribución normal precisa, la distribución normal se puede usar para modelar la
distribución de muchas variables que son de interés. El uso de la distribución normal como modelo
nos permite hacer declaraciones de probabilidad útiles acerca de algunas variables de manera mucho
más conveniente que si se tuviera que usar un modelo más complicado.
La estatura humana y la inteligencia humana se citan con frecuencia como ejemplos de variables que
tienen una distribución aproximadamente normal. Por otro lado, muchas distribuciones relevantes para el
campo de la salud no pueden describirse adecuadamente mediante una distribución normal. Siempre que se
sabe que una variable aleatoria tiene una distribución aproximadamente normal, o cuando, en ausencia de
un conocimiento completo, se considera razonable hacer esta suposición, el estadístico recibe una gran
ayuda en sus esfuerzos por resolver problemas prácticos relacionados con esta variable. . Tenga en cuenta,
sin embargo, que "normal" en este contexto se refiere a las propiedades estadísticas de un conjunto de datos
y de ninguna manera connota normalidad en el sentido de salud o condición médica.

Hay varias otras razones por las que la distribución normal es tan importante en las
estadísticas, y éstas se considerarán a su debido tiempo. Por ahora, veamos cómo podemos
responder preguntas simples de probabilidad sobre variables aleatorias cuando sabemos, o estamos
dispuestos a suponer, que tienen, al menos, una distribución aproximadamente normal.

EJEMPLO 4.7.1
El Uptimer es un monitor de actividad liviano hecho a medida que funciona con baterías y que registra la
cantidad de tiempo que una persona pasa en posición vertical. En un estudio de niños de 8 a 15 años,
Eldridge et al. (A-10) estudió a 529 niños con un desarrollo normal, cada uno de los cuales usó el Uptimer
continuamente durante un período de 24 horas que incluía un día escolar típico. Los investigadores
encontraron que la cantidad de tiempo que los niños pasaban en posición vertical seguía una distribución
normal con una media de 5,4 horas y una desviación estándar de 1,3 horas. Suponga que este hallazgo se
aplica a todos los niños de 8 a 15 años de edad. Encuentre la probabilidad de que un niño seleccionado al
azar pase menos de 3 horas en posición vertical en un período de 24 horas.

Solución: Primero hagamos un dibujo de la distribución y sombreemos el área correspondiente


a la probabilidad de interés. Esto se ha hecho en la Figura 4.7.1.

σ=1.3

X
3.0 m=5.4
FIGURA 4.7.1 Distribución normal para aproximar
distribución de la cantidad de tiempo que los niños pasan en
posición vertical (media y desviación estándar estimada).
124 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

σ=1.3

X
3.0 5.4

σ=1

_ 1.85 z
0
FIGURA 4.7.2Distribución normal del tiempo de permanencia en posición vertical
(X)y la distribución normal estándar (z).

Si nuestra distribución fuera la distribución normal estándar con una


media de 0 y una desviación estándar de 1, podríamos hacer uso de la tabla D y
encontrar la probabilidad con poco esfuerzo. Afortunadamente, es posible que
cualquier distribución normal se transforme fácilmente en la normal estándar. Lo
que hacemos es transformar todos los valores deXa los valores correspondientes
dez.Esto significa que la media deXdebe convertirse en 0, la media dez.En la
Figura 4.7.2 se muestran ambas distribuciones. Debemos determinar qué valor
dez,decir,z0, corresponde a unXde 3.0. Esto se hace usando la fórmula 4.6.2,z¼ ðX
metroÞ=s, que transforma cualquier valor deXen cualquier distribución normal al
valor correspondiente dezen la distribución normal estándar. Para el presente
ejemplo tenemos

3:0 5:4
z¼ ¼ 1:85
1:3

El valor dez0buscamos, entonces, es 1:85. &

Examinemos estas relaciones más de cerca. Se ve que la distancia de la media, 5.4, a laX-
valor de interés, 3.0, es 3:0 5:4¼2:4, que es una distancia de 1,85 desviaciones estándar.
cuando nos transformamosXvalores azvalores, la distancia delzvalor de interés de su
media, 0, es igual a la distancia de la correspondienteXvalor de su media, 5,4, en unidades
de desviación estándar. Hemos visto que esta última distancia es de 1,85 desviaciones
estándar. En elzdistribución, una desviación estándar es igual a 1 y, en consecuencia, el
punto en lazescala situada a una distancia de 1,85 desviaciones estándar por debajo de 0
esz¼1:85, el resultado obtenido al emplear la fórmula. Por consulta
4.7 APLICACIONES DE DISTRIBUCIÓN NORMAL 125

En la tabla D, encontramos que el área a la izquierda dez¼1:85 es .0322. Podemos resumir esta discusión de
la siguiente manera:

3:0 5:4
PAGdX <3:0¼PAG z< ¼PAGdz < 1:85Þ ¼ :0322
1:3

Para responder a la pregunta original, decimos que la probabilidad es .0322 de que un niño seleccionado al
azar tenga un tiempo de actividad de menos de 3.0 horas.

EJEMPLO 4.7.2
Diskin et al. (A-11) estudió los metabolitos comunes del aliento, como el amoníaco, la acetona,
el isopreno, el etanol y el acetaldehído, en cinco sujetos durante un período de 30 días. Cada
día, se tomaron muestras de aliento y se analizaron temprano en la mañana al llegar al
laboratorio. Para el sujeto A, una mujer de 27 años, la concentración de amoníaco en partes por
billón (ppb) siguió una distribución normal durante 30 días con media 491 y desviación estándar
119. ¿Cuál es la probabilidad de que en un día aleatorio, el amoníaco del sujeto concentración
está entre 292 y 649 ppb?

Solución: En la Figura 4.7.3 se muestra la distribución de las concentraciones de amoníaco y la z


distribución a la que transformamos los valores originales para determinar las
probabilidades deseadas. Encontramos elzvalor correspondiente a unXde 292 por

292 491
z¼ ¼ 1:67
119

σ=119

292 491 649 X

σ=1

_1.67 0 1.33 z
FIGURA 4.7.3Distribución de la concentración de amoníaco (X)y la
distribución normal estándar correspondiente (z).
126 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

Del mismo modo, paraX¼649 tenemos

649 491
z¼ ¼1:33
119

De la tabla D encontramos el área entre1y 1:67 para ser .0475 y el


área entre1y 1.33 para ser .9082. El área deseada es la diferencia
entre estos, :9082 :0475¼ :8607. Para resumir,

292 491 649 491


PAGd292 -X -649¼PAG - z-
119 119
¼PAGd 1:67 -z-1:33Þ 1 -
¼PAGd z-1:33Þ PAGð 1 -z- 1:67Þ

¼ :9082 :0475

¼ :8607

Entonces, la probabilidad solicitada en nuestra pregunta original es .8607. &

EJEMPLO 4.7.3
En una población de 10 000 de los niños descritos en el ejemplo 4.7.1, ¿cuántos esperaría
que estuvieran de pie más de 8,5 horas?

Solución: Primero encontramos la probabilidad de que un niño seleccionado al azar de la


población permanezca erguido más de 8.5 horas. Eso es,

8:5 5:4
PAGdX -8:5¼PAG z- ¼PAGdz-2:38¼1 :9913¼ :0087
1:3

De 10.000 personas esperaríamos 10; 000d:0087¼87 para pasar más de


8,5 horas de pie. &

Podemos usar MINITAB para calcular las probabilidades normales estándar acumulativas. Suponga
que deseamos encontrar las probabilidades acumuladas para los siguientes valores dez:
3; 2; 1; 0; 1; 2; y 3. Introducimos los valores dezen la Columna 1 y proceda como se muestra
en la Figura 4.7.4.
Las dos secciones anteriores se centraron ampliamente en la distribución normal, la
distribución de probabilidad continua más importante y utilizada con mayor frecuencia. Aunque
gran parte de lo que se tratará en los siguientes capítulos utiliza esta distribución, no es la única
distribución de probabilidad continua importante. Presentaremos varias otras distribuciones
continuas más adelante en el texto, a saber, ladistribución t,eldistribución de chi-cuadrado,y el
Distribución F.Los detalles de estas distribuciones se discutirán en los capítulos en los que los
necesitemos para pruebas inferenciales.
EJERCICIOS 127

Datos:

C1: -3 -2 -1 0 1 2 3

Caja de diálogo: Comando de sesión:

Calcular Distribuciones de probabilidad Normal MTB > CDF C1;


SUBC> Normal 0 1.
ElegirProbabilidad acumulada.ElegirColumna de entrada y tipoC1.
Hacer clicDE ACUERDO.

Producción:

Función de distribución acumulativa


normales con significar 0 y estándar
desviación 1.00000

X PAG(X < X)
3.0000 0.0013
2.0000 0.0228
1.0000 0.1587
0.0000 0.5000
1.0000 0.8413
2.0000 0.9772
3.0000 0.9987

FIGURA 4.7.4Cálculo MINITAB de probabilidades normales estándar acumuladas.

EJERCICIOS

4.7.1Para otro sujeto (un hombre de 29 años) en el estudio de Diskin et al. (A-11), los niveles de acetona se distribuyeron
normalmente con una media de 870 y una desviación estándar de 211 ppb. Encuentre la probabilidad de que en un
día dado el nivel de acetona del sujeto sea:
(a)Entre 600 y 1000 ppb
(b)Más de 900 ppb
(C)Menos de 500 ppb
(d)Entre 900 y 1100 ppb
4.7.2En el estudio de las huellas dactilares, una característica cuantitativa importante es el recuento total de crestas de los 10
dedos de un individuo. Suponga que los recuentos totales de crestas de los individuos de una determinada población
tienen una distribución aproximadamente normal con una media de 140 y una desviación estándar de 50. Halle la
probabilidad de que un individuo elegido al azar de esta población tenga un recuento de crestas de:
(a)200 o más
(b)Menos de 100
128 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

(C)Entre 100 y 200


(d)Entre 200 y 250
(mi)En una población de 10 000 personas, ¿cuántas esperaría que tuvieran un recuento de crestas de 200 o
más?

4.7.3Una de las variables recopiladas en los datos del Registro de Nacimientos de Carolina del Norte (A-3) son las libras
ganadas durante el embarazo. De acuerdo con los datos de todo el registro de 2001, la cantidad de libras ganadas
durante el embarazo se distribuyó de forma aproximadamente normal con una media de 30,23 libras y una
desviación estándar de 13,84 libras. Calcule la probabilidad de que una madre seleccionada al azar en Carolina del
Norte en 2001 ganara:

(a)Menos de 15 libras durante el embarazo (b)Más de 40 libras


(C)Entre 14 y 40 libras (d)Menos de 10 libras
(mi)Entre 10 y 20 libras

4.7.4Suponga que la duración promedio de la estadía en un hospital para enfermedades crónicas de cierto tipo de paciente es de 60 días
con una desviación estándar de 15. Si es razonable suponer una distribución aproximadamente normal de la duración de la
estadía, encuentre la probabilidad de que un paciente seleccionado al azar de este grupo tendrá un tiempo de permanencia:

(a)Más de 50 días (b)Menos de 30 días


(C)Entre 30 y 60 días (d)Más de 90 días

4.7.5Si los valores de colesterol total para cierta población tienen una distribución aproximadamente normal con una
media de 200 mg = 100 ml y una desviación estándar de 20 mg = 100 ml, encuentre la probabilidad de que un
individuo elegido al azar de esta población tenga un valor de colesterol :

(a)Entre 180 y 200 mg=100 ml (b)Más de 225 mg = 100 ml


(C)Menos de 150 mg = 100 ml (d)Entre 190 y 210 mg=100 ml

4.7.6Dada una población distribuida normalmente con una media de 75 y una varianza de 625, encuentre:

(a)PAGd50 -X -100Þ (b)PAGdX >90Þ


(C)PAGdX <60Þ (d)PAGdX -85Þ
(mi)PAGd30 -X -110Þ

4.7.7Los pesos de cierta población de mujeres adultas jóvenes tienen una distribución aproximadamente normal con
una media de 132 libras y una desviación estándar de 15. Calcule la probabilidad de que un sujeto
seleccionado al azar de esta población pese:

(a)Más de 155 libras (b)100 libras o menos


(C)Entre 105 y 145 libras

4.8 RESUMEN

En este capítulo se desarrollan más los conceptos de probabilidad descritos en el capítulo


anterior. Se discuten los conceptos de variables aleatorias discretas y continuas y sus
distribuciones de probabilidad. En particular, se examinan con considerable detalle dos
distribuciones de probabilidad discretas, la binomial y la de Poisson, y una distribución de
probabilidad continua, la normal. Hemos visto cómo estas distribuciones teóricas nos permiten
hacer enunciados de probabilidad sobre determinadas variables aleatorias que son de interés
para el profesional sanitario.
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 4 129

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 4

Fórmula
Número Nombre Fórmula
PAG
4.2.1 Media de una distribución de metro¼ XPdXÞ
frecuencias

PAG
4.2.2 Varianza de una distribución s2¼ dX metroÞ2pagdXÞ

de frecuencias o PAG
s2¼ X pagdXÞ 2 metro2

4.3.1 combinación de objetos ¡norte!


norteCX¼
¡X!dnorte1Þ!

4.3.2 Función de distribución binomial FdX¼norteCXpagXqnx;X¼0; 1; 2; . . .

4.3.3–4.3.5 Igualdades de probabilidad PAGdX¼Xjnorte; pag - :50¼PAGdX¼norte Xjnorte;1 pagÞ


binomial tabuladas
PAGdx-xjnorte; pag > :50¼PAGdX-n Xjnorte;1 pagÞ
PAGdx-xjnorte; pag > :50¼PAGdX-n Xjnorte;1 pagÞ
4.4.1 Función de distribución de Poisson miyoyoX
FdX¼ ;X¼0; 1; 2; . . .
¡X!
4.6.1 Función de distribución normal 1 <X <1
1 dX
FdXÞ ¼ pffiffiffiffiffiffiffiffimi
metroÞ2=2s2;
1 <m <1
2PD s >0
4.6.2 z-transformación Xmetro

s
4.6.3 Función de distribución normal 1 z =2;
FdzÞ ¼ pffiffiffiffiffimi
2
1 <z <1
estándar 2pag
Clave de símbolo norteCX¼acombinacióndenorteeventos tomadosXa la
vez mi¼constante de Euler¼2:71828 . . . FdX¼funcion
deX
yo¼el parámetro de la distribución de Poisson
norte¼tamaño de la muestra o el número total de veces que ocurre un proceso
pag¼probabilidad binomial de "éxito"
pagdX¼probabilidad discreta de variable aleatoriaX q
¼1pag¼probabilidad binomial de “fallo” pag¼Pi¼
constante¼3:14159 . . . s¼desviación estándar de
población s2¼varianza de la población metro¼media
de la población

X¼una cantidad de valor individual deXX


¼variable aleatoria
z¼transformación normal estándar
130 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

PREGUNTAS DE REPASO Y EJERCICIOS

1.¿Qué es una variable aleatoria discreta? Dé tres ejemplos que sean de interés para el profesional de la
salud.

2.¿Qué es una variable aleatoria continua? Dé tres ejemplos de interés para el profesional de la salud.

3.Definir la distribución de probabilidad de una variable aleatoria discreta.

4.Definir la distribución de probabilidad de una variable aleatoria continua.

5.¿Qué es una distribución de probabilidad acumulada?

6.¿Qué es un ensayo de Bernoulli?

7.Describe la distribución binomial.


8.Da un ejemplo de una variable aleatoria que creas que sigue una distribución binomial.

9.Describa la distribución de Poisson.

10Da un ejemplo de una variable aleatoria que creas que se distribuye de acuerdo con la ley de Poisson.

11Describe la distribución normal.


12Describa la distribución normal estándar y diga cómo se usa en estadística.

13Da un ejemplo de una variable aleatoria que creas que tiene, al menos aproximadamente, una distribución normal.

14Usando los datos de su respuesta a la Pregunta 13, demuestre el uso de la distribución normal estándar para responder
preguntas de probabilidad relacionadas con la variable seleccionada.

15.Kanjanarat et al. (A-12) estiman que la tasa de eventos adversos prevenibles por medicamentos (ADE) en los hospitales es
del 35,2 por ciento. Los ADE prevenibles suelen ser el resultado de una atención inadecuada o errores de medicación,
que incluyen errores de comisión y errores de omisión. Suponga que se eligen al azar 10 pacientes hospitalizados
que experimentan un ADE. Dejarpag¼ :35, y calcule la probabilidad de que:
(a)Exactamente siete de esos eventos de drogas fueron prevenibles
(b)Más de la mitad de esos eventos de drogas fueron prevenibles
(C)Ninguno de esos eventos de drogas fue prevenible.
(d)Entre tres y seis inclusive eran prevenibles
dieciséis.En una encuesta realizada por el Centro de Investigación Pew en 2003 (A-13), una muestra nacional de adultos respondió la
siguiente pregunta: “En general, ¿está usted muy a favor, a favor, en contra o muy en contra? . . ¿Haciendo que sea legal que
los médicos proporcionen a los pacientes con enfermedades terminales los medios para terminar con sus vidas? Los resultados
mostraron que el 43 por ciento de los sujetos de la muestra respondieron "muy a favor" o "a favor" de esta pregunta.
Si se eligen al azar 12 sujetos representados por esta muestra, calcule la probabilidad de que:
(a)Exactamente dos de los encuestados responden “muy a favor” o “a favor”
(b)No más de dos de los encuestados responden “muy a favor” o “a favor”
(C)Entre cinco y nueve respuestas inclusive “muy a favor” o “a favor”

17En un estudio de Thomas et al. (A-14) Se utilizó la distribución de Poisson para modelar el número de pacientes
por mes derivados a un oncólogo. Los investigadores utilizan una tasa de 15,8 pacientes por mes que son
derivados al oncólogo. Utilice la Tabla C del Apéndice y una tasa de 16 pacientes por mes para calcular la
probabilidad de que en un mes:
(a)Exactamente 10 pacientes son derivados a un oncólogo
(b)Entre cinco y 15 inclusive son referidos a un oncólogo
(C)Más de 10 son derivados a un oncólogo
PREGUNTAS DE REPASO Y EJERCICIOS 131

(d)Menos de ocho son derivados a un oncólogo


(mi)Menos de 12, pero más de ocho son derivados a un oncólogo

18En promedio, dos estudiantes por hora se presentan para recibir tratamiento en la sala de primeros auxilios de una escuela primaria grande.

(a)¿Cuál es la probabilidad de que durante una hora determinada acudan tres estudiantes a la sala de primeros auxilios para ser
atendidos?

(b)¿Cuál es la probabilidad de que durante una hora dada dos o menos estudiantes se presenten en la sala de primeros auxilios?

(C)¿Cuál es la probabilidad de que durante una hora dada entre tres y cinco estudiantes, inclusive, se presenten en la
sala de primeros auxilios?

19Una encuesta de Harris Interactive realizada en el otoño de 2002 (A-15) a través de una encuesta telefónica nacional de
adultos preguntó: "¿Cree que se debería permitir que los adultos usen legalmente marihuana con fines médicos si su
médico se la receta, o cree que la marihuana debería seguir siendo ilegal incluso para fines médicos?
Los resultados mostraron que el 80 por ciento de los encuestados respondió "Sí" a la pregunta anterior. Suponiendo que el 80
por ciento de los estadounidenses respondiera “Sí” a la pregunta anterior, encuentre la probabilidad cuando se eligen ocho
estadounidenses al azar de que:

(a)Seis o menos dijeron "Sí" (b)Siete o más dijeron “Sí”


(C)Los ocho dijeron "Sí" (d)Menos de cuatro dijeron “Sí”
(mi)Entre cuatro y siete inclusive dijeron “Sí”

20En un estudio de la relación entre la vacunación contra el sarampión y el síndrome de Guillain-Barr-e (GBS),
Silveira et al. (A-16) utilizó un modelo de Poisson en el examen de la aparición de GBS durante los períodos
de latencia después de las vacunas. Llevaron a cabo su estudio en Argentina, Brasil, Chile y Colombia.
Encontraron que durante el período de latencia, la tasa de GBS fue de 1,28 casos por día. Usando esta estimación
redondeada a 1.3, encuentre la probabilidad en un día dado de:

(a)No hay casos de SGB (b)Al menos un caso de SGB


(C)Menos de cinco casos de GBS

21Los coeficientes intelectuales de las personas admitidas en una escuela pública para retrasados mentales tienen una distribución
aproximadamente normal con una media de 60 y una desviación estándar de 10.

(a)Encuentre la proporción de personas con coeficientes intelectuales superiores a 75.

(b)¿Cuál es la probabilidad de que un individuo elegido al azar tenga un coeficiente intelectual entre 55 y 75?
(C)EncontrarPAGd50 -X -70Þ:

22Una supervisora de enfermería descubrió que las enfermeras del personal, en promedio, completan una determinada tarea en 10 minutos. Si
los tiempos requeridos para completar la tarea tienen una distribución aproximadamente normal con una desviación estándar de 3
minutos, encuentre:

(a)La proporción de enfermeras que completan la tarea en menos de 4 minutos


(b)La proporción de enfermeras que requieren más de 5 minutos para completar la tarea
(C)La probabilidad de que una enfermera a la que se le acaba de asignar la tarea la complete en 3 minutos

23Las puntuaciones obtenidas en cierta prueba de aptitud por estudiantes de enfermería tienen una distribución aproximadamente
normal con una media de 500 y una varianza de 10 000.

(a)¿Qué proporción de los que toman la prueba obtienen una puntuación inferior a 200?

(b)Una persona está a punto de tomar la prueba. ¿Cuál es la probabilidad de que obtenga una puntuación de
650 o más?
(C)¿Qué proporción de puntajes se encuentran entre 350 y 675?

24Dada una variable binomial con una media de 20 y una varianza de 16, encuentrenorteypag.
132 CAPÍTULO 4 DISTRIBUCIONES DE PROBABILIDAD

25Supongamos que una variableXse distribuye normalmente con una desviación estándar de 10. Dado que .0985 de los
valores deXson mayores que 70, ¿cuál es el valor medio de¿X?

26Dada la variable aleatoria normalmente distribuidaX,encontrar el valor numérico dektal que PAGd
metroks -X -metroþksÞ ¼ :754.

27Dada la variable aleatoria normalmente distribuidaXcon media 100 y desviación estándar 15, encuentre
el valor numérico dektal que:
(a)PAGdX-kÞ ¼ :0094
(b)PAGdX-kÞ ¼ :1093
(C)PAGd100 -X-kÞ ¼ :4778
(d)PAGdk0-X-kÞ ¼ :9660, dondek0ykson equidistantes demetro

28Dada la variable aleatoria normalmente distribuidaXcons¼10 yPAGdX -40Þ ¼ :0080, encontrarmetro.

29Dada la variable aleatoria normalmente distribuidaXcons¼15 yPAGdX -50Þ ¼ :9904, encontrarmetro.

30Dada la variable aleatoria normalmente distribuidaXcons¼5 yPAGdX -25Þ ¼ :0526, encontrarmetro.

31Dada la variable aleatoria normalmente distribuidaXconmetro¼25 yPAGdX -10Þ ¼ :0778, encontrars.

32.Dada la variable aleatoria normalmente distribuidaXconmetro¼30 yPAGdX -50Þ ¼ :9772, encontrars.

33.Explique por qué cada una de las siguientes medidas es o no el resultado de un ensayo de Bernoulli:
(a)El género de un niño recién nacido.
(b)La clasificación de la condición de un paciente hospitalario como estable, crítica, regular, buena o mala
(C)El peso en gramos de un niño recién nacido.

34.Explique por qué cada una de las siguientes medidas es o no el resultado de un ensayo de Bernoulli:
(a)El número de procedimientos quirúrgicos realizados en un hospital en una semana.
(b)La temperatura de un paciente del hospital en grados centígrados

(C)Los signos vitales de un paciente hospitalizado registrados como normales o anormales

35.Explique por qué cada una de las siguientes distribuciones es o no una distribución de probabilidad:

(a) (b)
X PAGdX¼XÞ X PAGdX¼XÞ

0 0.15 0 0.15
1 0.25 1 0.20
2 0.10 2 0.30
3 0.25 3 0.10
4 0.30

(C) (d)
X PAGdX¼XÞ X PAGdX¼XÞ

0 0.15 1 0.15
1 0:20 0 0.30
2 0.30 1 0.20
3 0.20 2 0.15
4 0.15 3 0.10
4 0.10
REFERENCIAS 133

REFERENCIAS

Referencias de metodología
1. F.RANGOAHDERECHO,manual de la distribución de poisson,Wiley, Nueva York, 1967.

Aplicaciones Referencias
A-1. DÁVIDOS.SOLBÉN, mEGANCMCCLINCYy J.OHNPHolcomb, “Estado de seguridad alimentaria de los hogares en los
Apalaches de Ohio con niños en Head Start”,Diario de la Asociación Dietética Americana, 104 (2004), 238–
241.
A-2. CTENÍALCROSS, BOBERNHARD, ANNERDE OTRO MODO, mELANIEMETROULLÍN, y ANNABELLEjANAIRO,"Investigación y
Evaluación del problema del juego: Informe anual de Nevada, abril de 2006–abril de 2007”, Informe final de la subvención a la
División de Salud y Servicios Humanos de Nevada.
A-3. Centro Estatal de Estadísticas de Salud de Carolina del Norte e Instituto Howard W. Odum para la Investigación en Ciencias
Sociales de la Universidad de Carolina del Norte en Chapel Hill. Conjunto de datos de nacimiento para 2001 encontrado en
www.irss.unc.edu/ncvital/ bfd1down.html. Todos los cálculos fueron realizados por John Holcomb y no representan los
hallazgos del Centro o Instituto.
A-4. Encuesta de la Universidad de Massachusetts, realizada del 29 de mayo al 2 de junio de 2003. Datos proporcionados por Massachusetts
Health Benchmarks.http://www.healthbenchmarks.org/Poll/June2003Survey.cfm.
A-5. Centro Nacional de Estadísticas de Salud (2001) Documentación de archivos de datos, Encuesta Nacional de Entrevistas de
Salud, CD Serie 10, No. 16A, Centro Nacional de Estadísticas de Salud, Hyattsville, Maryland. Todos los cálculos son
responsabilidad de John Holcomb y no reflejan los esfuerzos de NCHS.
A-6. STEVENSCOUGHLIN, ROBERTOJ. U.HLER, THOMASRCHARDOSy kATERINAMWILSON, “Cáncer de mama y de cuello uterino
Prácticas de detección entre mujeres hispanas y no hispanas que residen cerca de la frontera entre Estados Unidos y
México, 1999–2000”,Salud Familiar Comunitaria, 26 (2003), 130–139.
A-7. JH LAAKEy JA RøTTINGEN, “Rocuronio y anafilaxia: un desafío estadístico”,Acta Anasthesiologica
Scandinavica, 45 (2001), 1196–1203.
A-8. ACORRERD. S.INGH, mAHNAZnorteOURI, CarolLSHIELOS, jERRYCOMOHIELOS, y ANDREWFSMITO, “Retina Capilar
hemangioma,”Oftalmología, 10 (2001), 1907–1911.
A-9. PAGUNA ESCALATUBERT-BITTER, BERNARDOBEGAUD, YOLAMETROÓRDEN, ANIZACHASLERÍA, y FRANCOISEHARAMBURU,
“Comparación de la toxicidad de dos fármacos en el marco de la notificación espontánea: un enfoque de intervalo de
confianza”Revista de Epidemiología Clínica, 49 (1996), 121–123.
A-10. SERLDRIDGE, MGALEA, SOYCCOY, R. W.OLFE, H. y K. G.RAHAM, “Valores normativos del tiempo de actividad en niños de 8 a 15
años”,Medicina del desarrollo y neurología infantil, 45 (2003), 189–193.
A-11. ANNMDISKIN, PAGATRIKS9PANEL, y DÁVIDOSMITO, "Variación temporal de amoníaco, acetona, isopreno y etanol en el
aliento: un estudio cuantitativo SIFT-MS durante 30 días"Medición fisiológica, 24 (2003), 107–119.
A-12. PAGENKARNkANJANARAT, ALMUTG. W.INTERSTEIN, THOMASEJOHNS, RANDYCHATTON, RICARDOGRAMOONZALEZ-ROTI,
y RICHARDSIGUAL, "Naturaleza de los eventos adversos prevenibles de medicamentos en hospitales: una revisión de la literatura",Diario
Americano de Farmacia del Sistema de Salud, 60 (2003), 1750-1759.
A-13. Encuesta del Pew Research Center realizada por Princeton Survey Research Associates, del 24 de junio al 8 de julio de 2003.
Datos proporcionados por el Roper Center for Public Opinion Research.www.kaisernetwork.org/health_poll/hpoll_index. cfm.

A-14. SJTHOMAS, MVWILLIAMS, NG BUrnet, y CR BAKER, "¿Cuánta capacidad excedente se requiere para mantener
tiempos de espera bajos?"Oncología clínica, 13 (2001), 24–28.
A-15. Time, encuesta de Cable News Network realizada por Harris Associates, 22 y 23 de octubre de 2002. Datos proporcionados por
el Roper Center for Public Opinion Research.www.kaisernetwork.org/health_poll/hpoll_index.cfm.
A-16. CLAUDIOMETRO.ADSILVEIRA, DÁVIDOEMALISBURY, y CORIADelawareqUADROS, “Vacunación contra el sarampión y síndrome de
Guillain-Barr-e”,La lanceta,349 (1997), 14–16.
CAPÍTULO 5
ALGUNAS DISTRIBUCIONES DE
MUESTREO IMPORTANTES

RESUMEN DEL CAPÍTULO

Este capítulo une los fundamentos de la estadística aplicada: medidas descriptivas,


probabilidad básica y procedimientos inferenciales. Este capítulo también incluye
una discusión de uno de los teoremas más importantes en estadística, el teorema del
límite central. Los estudiantes pueden encontrar útil revisar este capítulo de vez en
cuando mientras estudian los capítulos restantes del libro.

TEMAS

5.1INTRODUCCIÓN
5.2DISTRIBUCIONES DE MUESTREO

5.3DISTRIBUCIÓN DE LA MEDIA MUESTRAL


5.4DISTRIBUCIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS MUESTRAL
5.5DISTRIBUCIÓN DE LA PROPORCIÓN DE LA MUESTRA

5.6DISTRIBUCIÓN DE LA DIFERENCIA ENTRE DOS PROPORCIONES DE MUESTRA


5.7RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. ser capaz de construir una distribución muestral de una estadística.
2. entender cómo usar una distribución de muestreo para calcular probabilidades básicas.
3. comprender el teorema del límite central y cuándo aplicarlo.
4. comprender los conceptos básicos del muestreo con reemplazo y sin reemplazo.

5.1 INTRODUCCIÓN

Antes de examinar el tema de este capítulo, repasemos los puntos principales de lo que
hemos cubierto hasta ahora. El capítulo 1 presenta algunas estadísticas básicas y útiles.

134
5.2 DISTRIBUCIONES DE MUESTREO 135

vocabulario y discute los conceptos básicos de la recopilación de datos. En el Capítulo 2, se


enfatiza la organización y el resumen de los datos. Es aquí donde encontramos los
conceptos de tendencia central y dispersión y aprendemos a calcular sus medidas
descriptivas. En el Capítulo 3, se nos presentan las ideas fundamentales de probabilidad, y
en el Capítulo 4 consideramos el concepto de distribución de probabilidad. Estos
conceptos son fundamentales para comprender la inferencia estadística, el tema que
comprende la mayor parte de este libro.
Este capítulo sirve como puente entre el material anterior, que es esencialmente de
naturaleza descriptiva, y la mayoría de los temas restantes, que han sido seleccionados del área
de la inferencia estadística.

5.2 DISTRIBUCIONES DE MUESTREO

El tema de este capítulo esdistribuciones de muestreo.No se puede exagerar la importancia de una


comprensión clara de las distribuciones de muestreo, ya que este concepto es la clave para comprender la
inferencia estadística. Las distribuciones muestrales tienen dos propósitos: (1) nos permiten responder
preguntas de probabilidad sobre estadísticas muestrales, y (2) proporcionan la teoría necesaria para que los
procedimientos de inferencia estadística sean válidos. En este capítulo usamos distribuciones muestrales
para responder preguntas de probabilidad sobre estadísticas muestrales. Recordamos del capítulo 2 que una
estadística muestral es una medida descriptiva, como la media, la mediana, la varianza o la desviación
estándar, que se calcula a partir de los datos de una muestra. En los capítulos siguientes, veremos cómo las
distribuciones muestrales hacen válidas las inferencias estadísticas.
Comenzamos con la siguiente definición.

DEFINICIÓN
La distribución de todos los valores posibles que puede asumir alguna estadística,
calculada a partir de muestras del mismo tamaño extraídas al azar de la misma
población, se denomina distribución.distribución muestralde esa estadística.

Distribuciones de muestreo: ConstrucciónLas distribuciones de muestreo pueden ser


construida empíricamente al muestrear de una población discreta y finita. Para construir una
distribución muestral se procede de la siguiente manera:

1.De una población finita de tamañoNORTE,extraer al azar todas las muestras posibles de tamañonorte.

2.Calcule la estadística de interés para cada muestra.


3.Enumere en una columna los diferentes valores observados distintos de la estadística, y en otra
columna enumere la frecuencia correspondiente de ocurrencia de cada valor observado
distinto de la estadística.

La construcción real de una distribución muestral es una empresa formidable si la población


tiene un tamaño apreciable y es una tarea imposible si la población es infinita. En tales casos, las
distribuciones de muestreo pueden aproximarse tomando una gran cantidad de muestras de un
tamaño determinado.
136 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

Distribuciones de muestreo: características importantespor lo general somos


interesado en saber tres cosas acerca de una distribución muestral dada: susignificar,es
diferencia,y esforma funcional (cómo se ve cuando se grafica).
Podemos reconocer la dificultad de construir una distribución muestral de acuerdo con los pasos
dados anteriormente cuando la población es grande. También nos encontramos con un problema al
considerar la construcción de una distribución muestral cuando la población es infinita. Lo mejor que
podemos hacer experimentalmente en este caso es aproximar la distribución muestral de una estadística.

Ambos problemas pueden obviarse por medio de las matemáticas. Aunque los
procedimientos involucrados no son compatibles con el nivel matemático de este texto, las
distribuciones de muestreo se pueden derivar matemáticamente. El lector interesado puede
consultar uno de los muchos libros de texto de estadística matemática, por ejemplo, Larsen y
Marx (1) o Rice (2).
En las secciones que siguen, se analizan algunas de las distribuciones
muestrales más frecuentes.

5.3 DISTRIBUCIÓN DE LA MEDIA MUESTRAL

Una distribución muestral importante es la distribución de la media muestral. Veamos cómo


podríamos construir la distribución muestral siguiendo los pasos descritos en la sección
anterior.

EJEMPLO 5.3.1
Supongamos que tenemos una población de tamañonorte¼5, que consta de las edades de cinco niños que
son pacientes ambulatorios en un centro comunitario de salud mental. Las edades son las siguientes:
¼6;X2¼8;X3¼10;X4¼12, yX5¼14. La media,metro,de esta población es igual a
X1PAG
Xi=N¼10 y la varianza es

PAG 2
dXi-metroÞ 40
s2¼ ¼ ¼8
norte 5

Calculemos otra medida de dispersión y designémosla por capitalScomo


sigue:

PAG 2
dXi-metroÞ 40
S2¼ ¼ ¼10
norte-1 4

Nos referiremos a esta cantidad nuevamente en el próximo capítulo. Deseamos construir la


distribución muestral de la media muestral, -X,basado en muestras de tamañonorte¼2 extraídos de
esta población.

Solución: Extraigamos todas las muestras posibles de tamañonorte¼2 de esta población. Estas
muestras, junto con sus medias, se muestran en la Tabla 5.3.1.
5.3 DISTRIBUCIÓN DE LA MEDIA MUESTRAL 137

TABLA 5.3.1 Todas las muestras posibles de tamañonorte¼2 de una población de tamaño norte¼5.
Muestras por encima o por debajo del resultado de la diagonal principal cuando el muestreo es sin
reemplazo. Las medias de la muestra están entre paréntesis

Segundo Sorteo

6 8 10 12 14

6 6, 6 6, 8 6, 10 6, 12 6, 14
(6) (7) (8) (9) (10)
8 8, 6 8, 8 8, 10 8, 12 8, 14
(7) (8) (9) (10) (11)
primer sorteo 10 10, 6 10, 8 10, 10 10, 12 10, 14
(8) (9) (10) (11) (12)
12 12, 6 12, 8 12, 10 12, 12 12, 14
(9) (10) (11) (12) (13)
14 14, 6 14, 8 14, 10 14, 12 14, 14
(10) (11) (12) (13) (14)

CUADRO 5.3.2 Muestreo


Distribución deX - calculado
de Muestras en la Tabla 5.3.1

Relativo
X- Frecuencia Frecuencia

6 1 1/25
7 2 2/25
8 3 3/25
9 4 4/25
10 5 5/25
11 4 4/25
12 3 3/25
13 2 2/25
14 1 1/25

Total 25 25/25

Vemos en este ejemplo que, cuando el muestreo es con reemplazo, hay 25


muestras posibles. En general, cuando el muestreo es con reemplazo, el número
de muestras posibles es igual anortenorte.
Podemos construir la distribución muestral de -Xenumerando los
diferentes valores de -Xen una columna y su frecuencia de aparición en otra,
como en la Tabla 5.3.2. &

Vemos que los datos de la tabla 5.3.2 satisfacen los requisitos para una distribución de
probabilidad. Las probabilidades individuales son todas mayores que 0 y su suma es igual a 1.
138 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

FIGURA 5.3.1Distribución de la población y distribución muestral deX-.

Anteriormente se dijo que por lo general estamos interesados en la forma funcional de una
distribución de muestreo, su media y su varianza. Ahora consideramos estas características para la
distribución muestral de la media muestral, -X.

Muestreo Distribución deX - : Forma FuncionalMiremos el


distribución de -Xtrazado como un histograma, junto con la distribución de la población,
los cuales se muestran en la Figura 5.3.1. Notamos la diferencia radical en apariencia
entre el histograma de la población y el histograma de la distribución muestral de
- X.Mientras que el primero se distribuye uniformemente, el segundo asciende gradualmente hasta un pico y
luego desciende con perfecta simetría.

Muestreo Distribución deX - : SignificarAhora calculemos la media, que


llamarámetro-X, de nuestra distribución muestral. Para ello sumamos las 25 medias muestrales y las
dividimos por 25. Así,

PAG
- Xi 6þ7þ7þ8þ - - - þ14 250
metro-X¼ ¼ ¼10
norte ¼
norte
25 25

Observamos con interés que la media de la distribución muestral de -Xtiene el mismo


valor que la media de la población original.
5.3 DISTRIBUCIÓN DE LA MEDIA MUESTRAL 139

Muestreo Distribución deX - : VarianzaFinalmente, podemos calcular el


varianza de -X,que llamamoss-2Xcomo sigue:

PAG
d-Xi-metro-X 2 Þ
s2- X¼
nortenorte

d6 - 10Þ2þ ð7 - 10Þ2þ ð7 - 10Þ2þ - - - þ ð14 - 10Þ2


¼
25
100
¼ ¼4
25

Observamos que la varianza de la distribución muestral no es igual a la varianza de la


población. Sin embargo, es interesante observar que la varianza de la distribución muestral es
igual a la varianza poblacional dividida por el tamaño de la muestra utilizada para obtener la
distribución muestral. Eso es,

s2 8
s2- X¼ ¼ ¼4
norte 2
pffiffiffi pffiffiffi
La raíz cuadrada de la varianza de la distribución muestral, Error s2- X¼s= nortese llama el
estandar de la mediao, simplemente, elError estándar.
Estos resultados no son coincidencias sino ejemplos de las características de las distribuciones
muestrales en general, cuando el muestreo es con reemplazo o cuando el muestreo es de una
población infinita. Para generalizar, distinguimos entre dos situaciones: muestreo de una población
con distribución normal y muestreo de una población con distribución no normal.

Muestreo Distribución deX - : Muestreo de Normalmente Distrib-


Poblaciones seleccionadasCuando el muestreo es de una población normalmente distribuida,
la distribución de la media muestral tendrá las siguientes propiedades:

1.La distribución de -Xserá normal.


2.El significado,metro-X, de la distribución de -Xserá igual a la media de la población de la que
se extrajeron las muestras.
3.la varianza,s2 - Xde la distribución de -Xserá igual a la varianza de la población
dividido por el tamaño de la muestra.

Muestreo de poblaciones no distribuidas normalmentePara el caso


donde el muestreo es de una población distribuida no normalmente, nos referimos a un importante
teorema matemático conocido como elteorema del límite central.La importancia de este teorema en
la inferencia estadística puede resumirse en el siguiente enunciado.

El teorema del límite central


Dada una población de cualquier forma funcional no normal con una mediametroy varianza finita s2,
la distribución muestral de -x, calculada a partir de muestras de tamaño n de esta población, tendrá
una mediametroy varianzas2=n y tendrá una distribución aproximadamente normal cuando el tamaño
de la muestra sea grande.
140 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

Una formulación matemática del teorema del límite central es que la distribución de

- X -metro
pffiffiffi
s=norte

se aproxima a una distribución normal con media 0 y varianza 1 comon !1.Tenga en cuenta que el teorema
del límite central nos permite tomar muestras de poblaciones distribuidas de forma no normal con una
garantía de aproximadamente los mismos resultados que se obtendrían si las poblaciones estuvieran
distribuidas normalmente, siempre que tomemos una muestra grande.
La importancia de esto se hará evidente más adelante cuando aprendamos que una distribución de muestreo
distribuida normalmente es una herramienta poderosa en la inferencia estadística. En el caso de la media de la
muestra, estamos seguros de que al menos hay una distribución de muestreo aproximadamente normalmente
distribuida bajo tres condiciones: (1) cuando el muestreo proviene de una población normalmente distribuida; (2)
cuando el muestreo es de una población que no se distribuye normalmente y nuestra muestra es grande; y (3)
cuando el muestreo es de una población cuya forma funcional es desconocida para nosotros siempre que el tamaño
de nuestra muestra sea grande.
La pregunta lógica que surge en este punto es: ¿Qué tan grande debe ser la muestra para que
se aplique el teorema del límite central? No hay una respuesta única, ya que el tamaño de la muestra
necesaria depende del grado de no normalidad presente en la población. Una regla general establece
que, en la mayoría de las situaciones prácticas, una muestra de tamaño 30 es satisfactoria. En general,
la aproximación a la normalidad de la distribución muestral de -Xmejora cada vez más a medida que
aumenta el tamaño de la muestra.

Muestreo sin reemplazoLos resultados anteriores se han dado asumiendo que el muestreo es con
reemplazo o que las muestras se extraen de poblaciones infinitas. En general, no tomamos muestras
con reemplazo y, en la mayoría de las situaciones prácticas, es necesario tomar muestras de una
población finita; por lo tanto, necesitamos familiarizarnos con el comportamiento de la distribución
muestral de la media muestral en estas condiciones. Antes de hacer declaraciones generales, veamos
nuevamente los datos de la tabla 5.3.1. La muestra significa que el resultado cuando el muestreo es
sin reposición son los que están por encima de la diagonal principal, que son los mismos que los que
están por debajo de la diagonal principal, si ignoramos el orden en que se extrajeron las
observaciones. Vemos que hay 10 muestras posibles. En general, cuando se toman muestras de
tamañonortede una población finita de tamañonortesin reemplazo, e ignorando el orden en que se
extraen los valores muestrales, el número de muestras posibles viene dado por la combinación de
nortecosas tomadasnortea la vez En nuestro ejemplo actual tenemos

¡NORTE! 5! 5 - 4 - 3!
norteCnorte¼ ¼ ¼ ¼10 muestras posibles:
¡norte!dn - nÞ! 2!3! 2!3!

La media de las 10 medias muestrales es


PAG
- Xi 7þ8þ9þ - - - þ13 100
metro-X¼ ¼ ¼ ¼10
norteCnorte 10 10
Vemos que una vez más la media de la distribución muestral es igual a la media
poblacional.
5.3 DISTRIBUCIÓN DE LA MEDIA MUESTRAL 141

Se encuentra que la varianza de esta distribución muestral es

PAG
- X2Þ
d-Xi-metro 30
s2- X¼ ¼ ¼3
norteCnorte 10

y notamos que esta vez la varianza de la distribución muestral no es igual a la


varianza de la población dividida por el tamaño de la muestra, ya ques2 - X¼36¼8=2¼4. Hay,
sin embargo, una relación interesante que descubrimos al multiplicars2=npor dn - n
Þ=ðnorte-1Þ.Eso es,

s2 n - n 8 5-2
- ¼ - ¼3
norte-1
norte 2 4

Este resultado nos dice que si multiplicamos la varianza de la distribución muestral que se
obtendría si el muestreo fuera con reemplazo, por el factordn - nÞ=ðnorte-1Þ,obtenemos el
valor de la varianza de la distribución muestral que resulta cuando el muestreo es sin
reemplazo. Podemos generalizar estos resultados con la siguiente afirmación.

Cuando el muestreo es sin reemplazo de una población finita, la distribución de muestreo de


-x tendrá una mediametroy varianza

s2 n - n
s2- X¼ -
norte norte-1

Si el tamaño de la muestra es grande, se aplica el teorema del límite central y la distribución


muestral de:Xtendrá una distribución aproximadamente normal.

La corrección de población finitaEl factordn - nÞ=ðnorte-1Þse denomina corrección de


población finita y puede ignorarse cuando el tamaño de la muestra es pequeño en
comparación con el tamaño de la población. Cuando la población es mucho mayor que la
muestra, la diferencia entres2=nyds2=nÞ½ðn - nÞ=ðnorte-1Þserá despreciable. Imagine una
población de tamaño 10 000 y una muestra de esta población de tamaño 25; la corrección por
población finita sería igual ad10; 000 - 25Þ=ð9999Þ ¼ :9976. Para multiplicars2=npor .9976 es
casi equivalente a multiplicarlo por 1. La mayoría de los estadísticos practicantes no usan la
corrección de población finita a menos que la muestra sea más del 5 por ciento del tamaño de
la población. Es decir, la corrección por población finita generalmente se ignora:05.
cuandon=n

La distribución muestral deX - : Un resumenResumamos la


características de la distribución muestral de -Xbajo dos condiciones.

1.El muestreo es de una población distribuida normalmente con una varianza de población
conocida:
(a)metro-X¼metropffiffiffi

(b)s-X¼s=norte
(C)La distribución muestral de -Xes normal.
142 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

2.El muestreo proviene de una población distribuida de manera no normal con una varianza de población conocida:

(a)metro-X¼metropffiffiffi
(b)s-X¼s= norte;cuando n=n :05
n-n
rffiffiffiffiffiffiffiffiffiffiffiffiffi pffiffiffi
s-X¼ ðs= norteÞ ; de lo contrario
norte-1
(C)La distribución muestral de -Xes aproximadamente normal.

AplicacionesComo veremos en los capítulos siguientes, el conocimiento y la comprensión de las


distribuciones muestrales serán necesarios para comprender los conceptos de inferencia estadística.
La aplicación más sencilla de nuestro conocimiento de la distribución muestral de la media muestral
consiste en calcular la probabilidad de obtener una muestra con una media de alguna magnitud
específica. Ilustremos con algunos ejemplos.

EJEMPLO 5.3.2
Suponga que se sabe que en cierta población humana grande, la longitud del cráneo tiene una
distribución aproximadamente normal con una media de 185,6 mm y una desviación estándar de 12,7
mm. ¿Cuál es la probabilidad de que una muestra aleatoria de tamaño 10 de esta población tenga una
media mayor que 190?

Solución: Sabemos que la muestra única que se está considerando es una de todas las muestras
posibles de tamaño 10 que se pueden extraer de la población, de modo que la media
que produce es una de las siguientes:X's que constituye la distribución muestral de -X
que, teóricamente, podría derivarse de esta población.
Cuando decimos que la población tiene una distribución aproximadamente
normal, suponemos que la distribución muestral de -Xestarán, para todos los efectos
prácticos, normalmente distribuidos. También sabemos que la media y el estándar
desviación de la distribución muestral son iguales a 185.6 y
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
pffiffiffiffiffi

d12:7Þ2=10¼12:7= 10¼4:0161, respectivamente. Suponemos que el pop-


ulación es grande en relación con la muestra, por lo que se puede ignorar la corrección de
población finita.
En el Capítulo 4 aprendemos que siempre que tengamos una variable aleatoria que
se distribuye normalmente, podemos transformarla muy fácilmente a la distribución normal
estándar. Nuestra variable aleatoria ahorapag isffi-xffiffi,la media de su distribución esmetro-X,
y su desviación estándar ess-X¼s=norte.Al modificar adecuadamente la
fórmula dada anteriormente, llegamos a la siguiente fórmula para
transformar la distribución normal de:Xa la distribución normal estándar:
- X -metro
z¼ pffiffi-ffX (5.3.1)
s= norte
&

La probabilidad que responde a nuestra pregunta está representada por el área a la derecha
de:X¼190 bajo la curva de la distribución muestral. Esta área es igual al área a la derecha de

190 - 185:6 4:4


z¼ ¼ ¼1:10
4:0161 4:0161
5.3 DISTRIBUCIÓN DE LA MEDIA MUESTRAL 143

FIGURA 5.3.2Distribución de la población, distribución muestral y distribución normal estándar,


Ejemplo 5.3.2: (a)distribución de la población; (b)distribución de muestreo deX-para muestras
de tamaño 10; (C)distribución normal estándar.

Al consultar la tabla normal estándar, encontramos que el área a la derecha de 1.10 es .1357; por
tanto, decimos que la probabilidad es .1357 de que una muestra de tamaño 10 tenga una media
mayor que 190.
La Figura 5.3.2 muestra la relación entre la población original, la distribución
muestral de -Xy la distribución normal estándar.

EJEMPLO 5.3.3
Si la media y la desviación estándar de los valores de hierro sérico para hombres sanos son 120 y 15
microgramos por 100 ml, respectivamente, ¿cuál es la probabilidad de que una muestra aleatoria de
50 hombres normales produzca una media entre 115 y 125 microgramos por 100 ml?

Solución: No se especifica la forma funcional de la población de valores de hierro sérico, pero


dado que tenemos un tamaño de muestra mayor a 30, hacemos uso de la central
144 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

teorema del límite y transforme la distribución de muestreo aproximadamente normal resultante


pag ibffiffiuffiffitffiion de -X (que tiene una media de 120 y una desviación estándar de
15 = 50¼2:1213) a la normal estándar. La probabilidad que buscamos es

-
115 - 120 125 - 120
PAGd115 - X 125¼PAG z
2:12 2:12
¼PAGd-2:36 z 2:36Þ
¼ :9909 - :0091
¼ :9818 &

EJERCICIOS

5.3.1La Encuesta Nacional de Examen de Salud y Nutrición de 1988–1994 (NHANES III, A-1) estimó que el nivel medio de
colesterol sérico para mujeres estadounidenses de 20 a 74 años de edad es de 204 mg/dl. La estimación de la
desviación estándar fue de aproximadamente 44. Usando estas estimaciones como la mediametroy desviación
estándarspara la población de EE. UU., considere la distribución muestral de la media muestral basada en muestras
de tamaño 50 extraídas de mujeres en este grupo de edad. ¿Cuál es la media de la distribución muestral? ¿El error
estándar?

5.3.2El estudio citado en el Ejercicio 5.3.1 informó un nivel de colesterol sérico medio estimado de 183 para mujeres de 20 a 29
años. La desviación estándar estimada fue de aproximadamente 37. Use estas estimaciones como la mediametroy
desviación estándarspara la población estadounidense. Si se extrae una muestra aleatoria simple de tamaño 60 de
esta población, calcule la probabilidad de que el nivel de colesterol sérico medio de la muestra sea:

(a)Entre 170 y 195 (b)Por debajo de 175


(C)Mayor que 190

5.3.3Si los valores de ácido úrico en varones adultos normales tienen una distribución aproximadamente normal con una media y una
desviación estándar de 5,7 y 1 mg por ciento, respectivamente, calcule la probabilidad de que una muestra de tamaño 9
produzca una media:

(a)mayor que 6 (b)entre 5 y 6


(C)Menos de 5.2

5.3.4Wright et al. [A-2] utilizó la Encuesta Nacional de Examen de Salud y Nutrición de 1999–2000 (NHANES) para
estimar la ingesta dietética de 10 nutrientes clave. Uno de esos nutrientes era el calcio (mg). Encontraron en
todos los adultos de 60 años o más una ingesta media diaria de calcio de 721 mg con una desviación
estándar de 454. Utilizando estos valores para la media y la desviación estándar de la población de EE. UU.,
calcule la probabilidad de que una muestra aleatoria de tamaño 50 tenga un sentido:
(a)Más de 800 mg (b)Menos de 700 mg
(C)Entre 700 y 850 mg

5.3.5En el estudio citado en el Ejercicio 5.3.4, los investigadores encontraron que la ingesta media de sodio en hombres y
mujeres de 60 años o más era de 2940 mg con una desviación estándar de 1476 mg. Utilice estos valores para la
media y la desviación estándar de la población de EE. UU. y encuentre la probabilidad de que una muestra aleatoria
de 75 personas de la población tenga una media:

(a)Menos de 2450 mg (b)Más de 3100 mg


(C)Entre 2500 y 3300 mg (d)Entre 2500 y 2900 mg
5.4 DISTRIBUCIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS MUESTRAL 145

5.3.6Dada una población distribuida normalmente con una media de 100 y una desviación estándar de 20, encuentre las
siguientes probabilidades con base en una muestra de tamaño 16:

(a)PAGd-X 100Þ (b)PAGd-X 110Þ


(C)PAGd96 - X 108Þ

5.3.7Dadometro¼50;s¼16, ynorte¼64, encuentra:

(a)PAGd45 -X 55Þ (b)PAGd-X >53Þ


(C)PAGd-X <47Þ (d)PAGd49 -X 56Þ

5.3.8Suponga que una población consta de los siguientes valores: 1, 3, 5, 7, 9. Construya la distribución
muestral de -Xbasado en muestras de tamaño 2 seleccionadas sin reemplazo. Encuentre la media y la
varianza de la distribución muestral.

5.3.9Utilice los datos del ejemplo 5.3.1 para construir la distribución muestral de:Xbasado en muestras de tamaño 3
seleccionadas sin reemplazo. Encuentre la media y la varianza de la distribución muestral.

5.3.10Utilice los datos citados en el Ejercicio 5.3.1. Imagine que tomamos muestras de tamaño 5, 25, 50, 100 y 500 de las
mujeres de este grupo de edad.
(a)Calcule el error estándar para cada uno de estos escenarios de muestreo.
(b)Discuta cómo el tamaño de la muestra afecta las estimaciones del error estándar calculadas en la parte (a) y las
implicaciones potenciales que esto puede tener en la práctica estadística.

5.4 DISTRIBUCIÓN DE LA DIFERENCIA ENTRE


DOS MEDIAS MUESTRAL

Frecuentemente el interés de una investigación se centra en dos poblaciones.


Específicamente, un investigador puede desear saber algo acerca de la diferencia
entre las medias de dos poblaciones. En una investigación, por ejemplo, un
investigador puede desear saber si es razonable concluir que las medias de dos
poblaciones son diferentes. En otra situación, el investigador puede desear conocer
la magnitud de la diferencia entre las medias de dos poblaciones. Un equipo de
investigación médica, por ejemplo, puede querer saber si el nivel medio de colesterol
sérico es más alto en una población de oficinistas sedentarios que en una población
de trabajadores. Si los investigadores pueden concluir que las medias de la población
son diferentes, es posible que deseen saber en qué medida difieren.

Muestreo de poblaciones normalmente distribuidasLa siguiente


El ejemplo ilustra la construcción y las características de la distribución muestral de la diferencia entre
las medias muestrales cuando el muestreo proviene de dos poblaciones normalmente distribuidas.

EJEMPLO 5.4.1
Supongamos que tenemos dos poblaciones de individuos: una población (población 1) ha
experimentado alguna condición que se cree que está asociada con el retraso mental y la
otra población (población 2) no ha experimentado la condición. La distribución de
146 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

Se cree que las puntuaciones de inteligencia en cada una de las dos poblaciones tienen una distribución
aproximadamente normal con una desviación estándar de 20.
Supongamos, además, que tomamos una muestra de 15 individuos de cada población y
calculamos para cada muestra la puntuación media de inteligencia con los siguientes resultados:X1¼
92 y -X2¼105. Si no hay diferencia entre las dos poblaciones, con respecto a sus verdaderos puntajes
promedio de inteligencia, ¿cuál es la probabilidad de observar una diferencia tan grande o mayor?d-X
1- -X2Þentre medias muestrales?

Solución: Para responder a esta pregunta necesitamos conocer la naturaleza de la


distribución muestral de la estadística relevante, ladiferencia entre dos medias
muestrales, -x1- -X2. Observe que buscamos una probabilidad asociada con la
diferencia entre dos medias de muestra en lugar de una sola media. &

Muestreo Distribución deX - 1-X - 2: ConstrucciónAunque, en la práctica,


Si bien no intentaríamos construir la distribución muestral deseada, podemos
conceptualizar la forma en que podría hacerse cuando el muestreo es de poblaciones
finitas. Comenzaríamos seleccionando de la población 1 todas las muestras posibles de
tamaño 15 y calculando la media de cada muestra. Sabemos que habríanorteCnorte1 1 semejante
muestras dondenorte1es el tamaño de la población ynorte1¼15. De manera similar, seleccionaríamos todas
las muestras posibles de tamaño 15 de la población 2 y calcularíamos la media para cada una de estas
muestras. Luego tomaríamos todos los pares posibles de medias muestrales, uno de la población 1 y otro de
la población 2, y tomaríamos la diferencia. La Tabla 5.4.1 muestra los resultados de seguir este
procedimiento. Tenga en cuenta que los 1 y 2 en la última línea de esta tabla no son exponentes, sino
indicadores de la población 1 y 2, respectivamente.

Muestreo Distribución deX - 1-X - 2: Característicases la distribución


ción de las diferencias entre las medias muestrales que buscamos. Si graficamos las diferencias
muestrales contra su frecuencia de ocurrencia, obtendríamos una distribución normal con una
media igual ametro1-metro2, la diferencia entre las medias de las dos poblaciones, y una
varianza igual as2 1=n1þs2 2=n2. Es decir, el error estándar de la diferencia entre

TABLA 5.4.1 Mesa de trabajo para construir la distribución de la diferencia entre dos medias
muestrales

Muestras Muestras Muestra Muestra Todo posible


de de Medio Medio diferencias
Población 1 Población 2 Población 1 Población 2 Entre Medios

norte11 norte12 X-11 X-12 X-11-X-12


norte21 norte22 X-21 X-22 X-11-X-22
norte31 norte32 X-31 X-32 X-11-X-32
- - - - -
- - - - -
- - - - -
nortenorte 1 1
1 C norte
norte
norte
2 C norte2
2 X- C 1
norte1 norte1
X-norte
2 C 2 2
norte X-norte
1 C norte1
1 - X-norte
2 C 2 2
norte
5.4 DISTRIBUCIÓN DE LA DIFERENCIA ENTRE DOS MEDIAS MUESTRAL 147

FIGURA 5.4.1Gráfica de la distribución muestral deX-1-X-2cuando no hay diferencia entre medias


poblacionales, Ejemplo 5.4.1.

qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

las medias muestrales serían iguales a s21=n1þs2 2=n2. Cabe señalar que estos
Las propiedades transmiten dos puntos importantes. Primero, las medias de dos distribuciones
se pueden restar una de la otra, o sumar, usando operaciones aritméticas estándar. En
segundo lugar, dado que la varianza general de la distribución muestral se verá afectada por
ambas distribuciones contribuyentes, las varianzas siempre se sumarán incluso si estamos
interesados en la diferencia de las medias. Este último hecho supone que las dos
distribuciones son independientes entre sí.
Para nuestro ejemplo actual, tendríamos una distribución normal con una media de
0 (si no hay diferencia entre las medias de las dos poblaciones) y una varianza de
½ð20Þ2=15þ ½ð20Þ2=15¼53:3333. El gráfico de la distribución muestral se muestra en la Figura
5.4.1.

Convirtiendo a zSabemos que la distribución normal descrita en el ejemplo 5.4.1 puede


transformarse en la distribución normal estándar mediante una modificación de una fórmula
previamente aprendida. La nueva fórmula es la siguiente:

d-X1- -X2Þ - ðmetro1-metro 2Þ


z¼ sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi (5.4.1)
s21 s2
þ2
norte1 norte2

El área bajo la curva de -X1- -X2correspondiente a la probabilidad que buscamos es el área


a la izquierda de -X1- -X2¼92 - 105¼ -13. Elzel valor correspondiente a -13, suponiendo que no
hay diferencia entre las medias de la población, es

- 13 - 0 - 13 - 13
¼ -1:78
z¼sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼ pffiffiffiffiffiffiffiffiffi ¼

53:3 7:3
d20Þ2 d20Þ2
þ
15 15

Al consultar la Tabla D, encontramos que el área bajo la curva normal estándar a la izquierda de
- 1:78 es igual a .0375. En respuesta a nuestra pregunta original, decimos que si no hay
148 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

diferencia entre las medias de la población, la probabilidad de obtener una diferencia entre las
medias de la muestra igual o mayor que 13 es .0375.

Muestreo de poblaciones normalesEl procedimiento que acabamos de seguir es válido


incluso cuando los tamaños de muestra,norte1ynorte2, son diferentes y cuando la población
variaciones,s21ys2 2tener diferentes valores. Los resultados teóricos en los que se basa este procedimiento
se basa se puede resumir de la siguiente manera.

Dadas dos poblaciones normalmente distribuidas con mediasmetro1ymetro2y variacioness2 1


ys2 2, respectivamente, la distribución muestral de la diferencia, -x1- -X2, Entre los
medias de muestras independientes de tamaño n1y N2extraído de estas poblaciones es
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

distribuida normalmente con mediametro1-metro2y varianza s21=n1þs2 2=n2.

Muestreo de poblaciones no normalesMuchas veces un investigador es


enfrenta uno u otro de los siguientes problemas: la necesidad de (1) tomar muestras de poblaciones
distribuidas de manera no normal, o (2) tomar muestras de poblaciones cuyas formas funcionales no
se conocen. Una solución a estos problemas es tomar muestras grandes, ya que cuando los tamaños
de las muestras son grandes se aplica el teorema del límite central y la distribución de la diferencia
entre dos medias muestrales tiene una distribución al menos aproximadamente normal.
con una media igual ametro1-metro2y una variación des2 1=nþs
1 2 2=n2. Para encontrar probabilidades
asociado con valores específicos de la estadística, entonces, nuestro procedimiento sería el mismo
que se da cuando el muestreo es de poblaciones normalmente distribuidas.

EJEMPLO 5.4.2
Supongamos que se ha establecido que para cierto tipo de cliente la duración promedio de una visita
domiciliaria de una enfermera de salud pública es de 45 minutos con una desviación estándar de 15 minutos,
y que para un segundo tipo de cliente la visita domiciliaria promedio es de 30 minutos de duración con una
desviación estándar de 20 minutos. Si una enfermera visita aleatoriamente a 35 clientes de la primera y 40 de
la segunda población, ¿cuál es la probabilidad de que la duración promedio de la visita domiciliaria difiera
entre los dos grupos en 20 minutos o más?

Solución: No se hace mención de la forma funcional de las dos poblaciones, por lo que
supongamos que se desconoce esta característica, o que las poblaciones no se
distribuyen normalmente. Dado que los tamaños de muestra son grandes (superiores
a 30) en ambos casos, recurrimos a los resultados del teorema del límite central para
responder a la pregunta planteada. Sabemos que la diferencia entre las medias de las
muestras tiene una distribución al menos aproximadamente normal con la siguiente
media y varianza:

metro-X1--
X 2
¼metro1-metro2¼45 - 30¼15

s2 s22 d15Þ2 d20Þ2


s2- X --X ¼1 þ ¼ þ ¼16:4286
1 2
norte1 norte2 35 40
EJERCICIOS 149

FIGURA 5.4.2Distribución muestral deX-1-X-2y la correspondiente distribución normal estándar,


ejemplo de visita domiciliaria.

El área bajo la curva de -X1- -X2que buscamos es esa área a la derecha de 20.
El valor correspondiente dezen el estándar normal es

d-X1- -X2Þ - ðmetro1-metro 2Þ 20 - 15 5


z¼ sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi ¼ pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi ¼ ¼1:23
16:4286 4:0532
s21 s 22
þ
norte1 norte2

En la tabla D encontramos que el área a la derecha dez¼1:23 es 1 -


:8907¼ :1093. Decimos, entonces, que la probabilidad de que las visitas
aleatorias de la enfermera resulten en una diferencia entre las dos medias
igual o mayor a 20 minutos es .1093. La curva de -X1- -X2y la curva normal
estándar correspondiente se muestran en la Figura 5.4.2. &

EJERCICIOS

5.4.1El estudio citado en los Ejercicios 5.3.1 y 5.3.2 proporciona los siguientes datos sobre los niveles de colesterol sérico en
mujeres estadounidenses:

Población Edad Significar Desviación Estándar

A 20–29 183 37.2


B 30–39 189 34.7
150 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

Utilice estas estimaciones como la mediametroy desviación estándarspara las respectivas poblaciones estadounidenses.
Supongamos que seleccionamos una muestra aleatoria simple de tamaño 50 independientemente de cada población. ¿Cuál es
la probabilidad de que la diferencia entre las medias de la muestra -XB- -XAserán más de 8?

5.4.2En el estudio citado en los Ejercicios 5.3.4 y 5.3.5, los niveles de calcio en hombres y mujeres de 60 años o
más se resumen en la siguiente tabla:

Significar Desviación Estándar

Hombres 797 482


Mujer 660 414

Utilice estas estimaciones como la mediametroy desviación estándarspara las poblaciones de EE. UU. para estos
grupos de edad. Si tomamos una muestra aleatoria de 40 hombres y 35 mujeres, ¿cuál es la probabilidad de obtener
una diferencia entre las medias muestrales de 100 mg o más?

5.4.3Dadas dos poblaciones distribuidas normalmente con medias y varianzas iguales des2 1¼100 y
s22¼80, ¿cuál es la probabilidad de que muestras de tamañonorte1¼25 ynorte2¼16 dará un valor de -X1- -X2
mayor o igual a 8?
5.4.4Dadas dos poblaciones distribuidas normalmente con medias y varianzas iguales des2 1¼240 y
s22¼350, ¿cuál es la probabilidad de que muestras de tamañonorte1¼40 ynorte2¼35 dará un valor de
- X1- -X2tan grande como o más grande que 12?

5.4.5Para una población de niños de 17 años y niñas de 17 años, las medias y las desviaciones estándar,
respectivamente, de sus valores de espesor del pliegue cutáneo subescapular son los siguientes: niños, 9,7 y 6,0;
niñas, 15,6 y 9,5. De las poblaciones se seleccionan muestras aleatorias simples de 40 niños y 35 niñas. ¿Cuál es la
probabilidad de que la diferencia entre las medias de la muestra -Xchicas- -XNiñosserá mayor que 10?

5.5 DISTRIBUCIÓN DE LA
PROPORCIÓN DE LA MUESTRA

En las secciones anteriores nos hemos ocupado de las distribuciones muestrales de estadísticos
calculados a partir de variables medidas. Sin embargo, con frecuencia nos interesa la distribución
muestral de una estadística, como una proporción muestral, que resulta de conteos o datos de
frecuencia.

EJEMPLO 5.5.1
Los resultados [A-3] de la Encuesta nacional de examen de salud y nutrición (NHANES) de 2009–2010
muestran que el 35,7 % de los adultos estadounidenses mayores de 20 años son obesos (obesos
definidos con un índice de masa corporal mayor o igual a 30,0). Designamos esta proporción de la
población comopag¼ :357. Si seleccionamos al azar 150 individuos de esta población, ¿cuál es la
probabilidad de que la proporción de obesos en la muestra sea tan grande como .40?

Solución: Para responder a esta pregunta, necesitamos conocer las propiedades de la


distribución muestral de la proporción muestral. Designaremos la proporción
muestral con el símbolo p̂.
5.5 DISTRIBUCIÓN DE LA PROPORCIÓN DE LA MUESTRA 151

Reconocerá la similitud entre este ejemplo y los presentados en la Sección


4.3, que trata de la distribución binomial. La variable obesidad es unavariable
dicotómica,ya que un individuo puede clasificarse en una u otra de dos
categorías mutuamente excluyentes: obeso o no obeso. En la Sección 4.3, se nos
dio información similar y se nos pidió que encontráramos el número con la
característica de interés, mientras que aquí buscamos la proporción en la
muestra que posee la característica de interés. Podríamos con una tabla
suficientemente grande de probabilidades binomiales, como la Tabla B,
determinar la probabilidad asociada con el número correspondiente a la
proporción de interés. Como veremos, esto no será necesario, ya que existe un
procedimiento alternativo, cuando los tamaños de muestra son grandes, que
generalmente es más conveniente. &

Muestreo Distribución de p̂: ConstrucciónLa distribución muestral de


una proporción muestral se construiría experimentalmente exactamente de la misma manera
que se sugirió en el caso de la media aritmética y la diferencia entre dos medias. De la
población, que suponemos finita, tomaríamos todas las muestras posibles de un tamaño dado
y para cada muestra calcularíamos la proporción muestral, p̂. Luego, prepararíamos una
distribución de frecuencias de p̂ enumerando los diferentes valores distintos de p̂ junto con sus
frecuencias de ocurrencia. Esta distribución de frecuencias (así como la correspondiente
distribución de frecuencias relativas) constituiría la distribución muestral de p̂.

Muestreo Distribución de p̂: CaracterísticasCuando el tamaño de la muestra


es grande, la distribución de las proporciones muestrales tiene una distribución aproximadamente
normal en virtud del teorema del límite central. La media de la distribución,metropag, es decir, la
media de todas las proporciones muestrales posibles, será igual a la población verdadera
proporción,pag,y la varianza de la distribución,s2 pag, será igual apagd1 -pagÞ=norteo
pq=n,dóndeq¼1 -pag.Para responder preguntas de probabilidad sobrepag,entonces, usamos la
siguiente fórmula:

p̂ - p
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi (5.5.1)
pagd1 -pagÞ

norte

La pregunta que surge ahora es: ¿Qué tan grande debe ser el tamaño de la muestra para que el uso
de la aproximación normal sea válido? Un criterio ampliamente utilizado es que ambosnotario públicoy norte
d1 -pagÞdebe ser mayor que 5, y cumpliremos con esa regla en este texto.
Ahora estamos en condiciones de responder a la pregunta sobre la obesidad en la muestra de
150 individuos de una población en la que el 35,7 por ciento son obesos. Ya que ambosnotario público
y norted1 -pagÞson mayores que 5d150 :357¼53:6 y 150:643¼96:5Þ,podemos decir que, en
este caso, p̂ tiene una distribución aproximadamente normal con una mediametropag;¼pag¼ :357 y
s2pag¼pagd1 -pagÞ=norte¼ ð:357Þð:643Þ=150¼ :00153. La probabilidad que buscamos es el área bajo
la curva de p̂ que está a la derecha de .40. Esta área es igual al área bajo el estándar
152CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

curva normal a la derecha de

p̂ - p :40 - :357
¼1:10
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼ pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

pagd1 -pagÞ :00153


norte

La transformación a la distribución normal estándar se ha realizado de la manera


habitual. El valor dezse encuentra dividiendo la diferencia entre un valor de una estadística y su
media por el error estándar de la estadística. Usando la tabla D encontramos que el área a la
derecha dez¼1:10 es 1 - :8643¼ :1357. Podemos decir, entonces, que la probabilidad de
observar p̂ :40 en una muestra aleatoria de tamañonorte¼150 de una población en la que
pag¼ :357 es .1357.

Corrección por ContinuidadLa aproximación normal se puede mejorar usando elcorrección


por continuidad,un dispositivo que hace un ajuste por el hecho de que una distribución discreta
se está aproximando a una distribución continua. Supongamos que dejamos X¼notario público,
el número en la muestra con la característica de interés cuando la proporción es p̂. Para aplicar
la corrección por continuidad, calculamos

Xþ :5
- pag
zC¼ pag ; nffiffiffiffiffiffiffiffiffiffiffi parax <np
(5.5.2)
pq=n
o
X - :5
- pag
zC¼ pag ; nffiffiffiffiffiffiffiffiffiffiffi parax > np
(5.5.3)
pq=n

dóndeq¼1 -pag.La corrección por continuidad no hará una gran diferencia cuandonortees
largo. En el ejemplo anteriornotario público¼150d:4¼60, y

60 - :5
- :357
zC¼pffiffiffiffi1ffiffiffi5ffiffi0ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼1:01

d:357Þð:643Þ=150

yPAGðp̂ :40¼1 - :8461¼ :1539, resultado no muy diferente del obtenido


sin la corrección por continuidad. Este ajuste no suele hacerse a mano, ya que la mayoría de los programas
informáticos estadísticos aplican automáticamente la corrección de continuidad adecuada cuando es
necesario.

EJEMPLO 5.5.2
Blanche Mikhail [A-4] estudió el uso de la atención prenatal entre mujeres afroamericanas de bajos
ingresos. Encontró que solo el 51 por ciento de estas mujeres tenían atención prenatal adecuada.
Supongamos que para una población similar de mujeres afroamericanas de bajos ingresos,
EJERCICIOS 153

El 51 por ciento tuvo atención prenatal adecuada. Si se extraen al azar 200 mujeres de esta
población, ¿cuál es la probabilidad de que menos del 45 por ciento haya recibido atención
prenatal adecuada?

Solución: Podemos suponer que la distribución muestral de p̂ es aproximadamente normalmente


distribuido conmetropag¼ :51 ys2pag¼ ð:51Þð:49Þ=200¼ :00125. Calculamos

:45 - :51 - :06


z¼ pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi ¼ ¼ -1:70
:00125 :0353

El área a la izquierda de -1:70 bajo la curva normal estándar es 0,0446. Por lo


tanto,PAGðp̂ :45¼PAGdz - 1:70Þ ¼ :0446. &

EJERCICIOS

5.5.1Smith et al. [A-5] realizó un análisis retrospectivo de los datos de 782 pacientes elegibles admitidos con infarto de
miocardio en un centro de servicios cardíacos de 46 camas. De estos pacientes, 248 (32 por ciento) informaron
un infarto de miocardio pasado. Usa .32 como la proporción de la población. Suponga que se eligen al azar
50 sujetos de la población. ¿Cuál es la probabilidad de que más del 40 por ciento informen infartos de
miocardio previos?

5.5.2En el estudio citado en el Ejercicio 5.5.1, el 13 por ciento de los pacientes del estudio informaron episodios previos de accidente
cerebrovascular o ataque isquémico transitorio. Utilice el 13 por ciento como la estimación de la prevalencia de accidente
cerebrovascular o ataque isquémico transitorio dentro de la población. Si se eligen al azar 70 sujetos de la población, ¿cuál es la
probabilidad de que el 10 por ciento o menos informen una incidencia de accidente cerebrovascular o ataque isquémico
transitorio?

5.5.3En el informe NHANES de 1999-2000, los investigadores estimaron que el 64 por ciento de los adultos
estadounidenses de 20 a 74 años tenían sobrepeso u obesidad (sobrepeso: IMC 25–29, obesidad: IMC 30 o
más). Use esta estimación como la proporción de la población de adultos estadounidenses de 20 a 74 años. Si
se seleccionan al azar 125 sujetos de la población, ¿cuál es la probabilidad de que el 70 por ciento o más
tenga sobrepeso u obesidad?

5.5.4Gallagher et al. [A-6] informó sobre un estudio para identificar los factores que influyen en la asistencia de las mujeres a
los programas de rehabilitación cardíaca. Descubrieron que a las 12 semanas posteriores al alta, solo el 64 por ciento
de las mujeres elegibles asistieron a dichos programas. Usando el 64 por ciento como una estimación del porcentaje
de asistencia de todas las mujeres elegibles, encuentre la probabilidad de que en una muestra de 45 mujeres
seleccionadas al azar de la población de mujeres elegibles, menos del 50 por ciento asista a los programas.

5.5.5Dada una población en la quepag¼ :6 y una muestra aleatoria de esta población de tamaño 100, encuentre:

(a)PAGðp̂ :sesenta y cincoÞ (b)PAGðp̂ :58Þ


(C)PAGd:56 pag :63Þ

5.5.6Se sabe que el 35 por ciento de los miembros de una determinada población padecen una o más enfermedades
crónicas. ¿Cuál es la probabilidad de que en una muestra de 200 sujetos seleccionados al azar de esta
población, 80 o más tengan al menos una enfermedad crónica?
154 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

5.6 DISTRIBUCIÓN DE LA DIFERENCIA ENTRE


DOS PROPORCIONES DE MUESTRA

A menudo, hay dos proporciones de población en las que estamos interesados y deseamos evaluar
la probabilidad asociada con una diferencia en las proporciones calculadas a partir de muestras
extraídas de cada una de estas poblaciones. La distribución muestral relevante es la distribución de la
diferencia entre las dos proporciones muestrales.

Distribución muestral de p̂1- pag2: CaracterísticasEl personaje-


Las características de esta distribución de muestreo se pueden resumir de la siguiente manera:

Si muestras aleatorias independientes de tamaño n1ynorte2se extraen de dos


poblaciones de variables dicotómicas donde las proporciones de observaciones con la
característica de interés en las dos poblaciones son p1y P2, respectivamente, la
distribución de la diferencia entre proporciones muestrales, p̂1- pag2, es
aproximadamente normal con media

metropag1-pag¼pag1-pag 2
2

y varianza

pagd1
1 -pag1Þ pagd1
2 - pag2Þ
s2pag1-pag 2
¼ þ
norte1 norte2

cuando n1y N2son grandes.

Consideramosnorte1ynorte2suficientemente grande cuandonorte1pag1;norte2pag2;norte1d1 -pag1Þ,ynorte2d1 -pag2Þ


son todos mayores que 5.

Distribución muestral de p̂1- pag2: ConstrucciónPara controlar físicamente


Para construir la distribución muestral de la diferencia entre dos proporciones
muestrales, procederíamos de la manera descrita en la Sección 5.4 para construir la
distribución muestral de la diferencia entre dos medias.
Dadas dos poblaciones suficientemente pequeñas, se extraerían, de la población 1, todas las
muestras aleatorias simples posibles de tamañonorte1y calcule, a partir de cada conjunto de datos
muestrales, la proporción muestral p̂1. De la población 2, se extraerían de forma independiente todas
las muestras aleatorias simples posibles de tamañonorte2y calcule, para cada conjunto de datos
muestrales, la proporción muestral p̂2. Uno calcularía las diferencias entre todos los pares posibles de
proporciones muestrales, donde un número de cada par era un valor de p̂1y el otro un valor de p̂2. La
distribución muestral de la diferencia entre las proporciones de la muestra, entonces, consistiría en
todas esas diferencias distintas, acompañadas de sus frecuencias (o frecuencias relativas) de
ocurrencia. Para poblaciones finitas o infinitas grandes, se podría aproximar la distribución muestral
de la diferencia entre las proporciones de la muestra extrayendo una gran cantidad de muestras
aleatorias simples independientes y procediendo de la manera que se acaba de describir.
5.6 DISTRIBUCIÓN DE LA DIFERENCIA ENTRE DOS PROPORCIONES DE MUESTRA 155

Para responder preguntas de probabilidad sobre la diferencia entre dos proporciones de


muestra, usamos la siguiente fórmula:

ðp̂ - p̂ Þ - ðpag ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi1-pag2Þ


z¼rffiffiffiffiffi1ffiffiffiffiffiffi2 (5.6.1)
pag1d1 -pag1Þ 2 pag
Þ2
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff pagd1 -
þ
norte1 norte2

EJEMPLO 5.6.1
La Encuesta Nacional de Entrevistas de Salud de 1999, publicada en 2003 [A-7], informó que el 28 por ciento
de los sujetos que se identificaron a sí mismos como blancos dijeron que habían experimentado dolor
lumbar durante los tres meses anteriores a la encuesta. Entre los sujetos de origen hispano, el 21 por ciento
reportó dolor de espalda baja. Supongamos que .28 y .21 son las proporciones de las respectivas razas que
reportaron dolor lumbar en los Estados Unidos. ¿Cuál es la probabilidad de que muestras aleatorias
independientes de tamaño 100 extraídas de cada una de las poblaciones den un valor de p̂1- pag2tan grande
como .10?

Solución: Suponemos que la distribución muestral de p̂1- pag2es aproximadamente normal con
media
metropag1-pag
2
¼ :28 - :21¼ :07

y varianza
d:28Þð:72Þ d:21Þð:79Þ
s2 ¼ þ
pag1-pag2
100 100
¼ :003675

El área correspondiente a la probabilidad que buscamos es el área bajo la curva


de p̂1- pag2a la derecha de .10. La transformación a la distribución normal
estándar da
ðp̂1- pag2Þ - ðpag :10 - :07
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi1-pag2Þ
z¼rffiffiffiffiffiffiffiffiffiffiffi uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff¼

pag1d1 -pag1Þ 2 pag


Þ2 :003675
pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi ¼ :49 pagd1 -
þ
norte1 norte2

Consultando la tabla D, encontramos que el área bajo la curva normal estándar que se
encuentra a la derecha dez¼ :49 es 1 - :6879¼ :3121. La probabilidad de observar una
diferencia tan grande como .10 es, entonces, .3121. &

EJEMPLO 5.6.2
En la Encuesta Nacional de Entrevistas de Salud de 1999 [A-7], los investigadores encontraron que entre los adultos
estadounidenses de 75 años o más, el 34 por ciento había perdido todos sus dientes naturales y para los adultos
estadounidenses de 65 a 74 años, el 26 por ciento había perdido todos sus dientes naturales. Suponga que estas
proporciones son los parámetros para los Estados Unidos en esos grupos de edad. Si se extrae una muestra aleatoria
de 200 adultos de 65 a 74 años y una muestra aleatoria independiente de 250 adultos de 75 años o más de
156 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

estas poblaciones, calcule la probabilidad de que la diferencia en el porcentaje de pérdida total de dientes
naturales sea inferior al 5 por ciento entre las dos poblaciones.

Solución: Suponemos que la distribución muestral p̂1- pag2es aproximadamente normal. La


diferencia media en las proporciones de los que pierden todos sus dientes es

metropag1-pag
2
¼ :34 - :26¼ :08

y la varianza es

pagd1
1 - pag1Þpag d:34Þð:66Þ d:26Þð:74Þ
s2pag ¼ þ2d1 -pag2Þ ¼ þ ¼ :00186
-pag
1 2
norte1 norte2 250 200

El área de interés bajo la curva de p̂1- pag2es que a la izquierda de .05. El


correspondientezel valor es

:05 -d:08Þ
z¼ pffiffiffiffiffiffiffiffiffiffiffiffiffiffi ¼ -:70
:00186

Consultando la Tabla D, encontramos que el área a la izquierda dez¼ -:70 es .2420.&

EJERCICIOS

5.6.1Según la Oficina del Censo de EE. UU. de 2000 [A-8], en 2000, el 9,5 por ciento de los niños en el estado de Ohio
no estaban cubiertos por un seguro de salud privado o gubernamental. En el estado vecino de Pensilvania, el
4,9 por ciento de los niños no estaban cubiertos por un seguro de salud. Supongamos que estas
proporciones son parámetros para las poblaciones infantiles de los respectivos estados. Si se extrae una
muestra aleatoria de niños de tamaño 100 de la población de Ohio y una muestra aleatoria independiente de
tamaño 120 de la población de Pensilvania, ¿cuál es la probabilidad de que las muestras produzcan una
diferencia, p̂1- pag2de .09 o más?

5.6.2En el informe citado en el Ejercicio 5.6.1 [A-8], la Oficina del Censo indicó que para los estadounidenses en el grupo de edad de 18 a
24 años, el 64.8 por ciento tenía seguro médico privado. En el grupo de edad de 25 a 34 años, el porcentaje fue de 72,1.
Suponga que estos porcentajes son los parámetros de población en esos grupos de edad para los Estados Unidos.
Supongamos que seleccionamos una muestra aleatoria de 250 estadounidenses del grupo de edad de 18 a 24 años y una
muestra aleatoria independiente de 200 estadounidenses del grupo de edad de 25 a 34 años; encuentre la probabilidad de que
p̂2- pag1es inferior al 6 por ciento.

5.6.3A partir de los resultados de una encuesta realizada por la Oficina de Estadísticas Laborales de EE. UU. [A-9], se estimó que el 21 por
ciento de los trabajadores empleados en el noreste participaron en programas de beneficios de atención médica que incluían
atención de la vista. El porcentaje en el Sur fue del 13 por ciento. Suponga que estos porcentajes son parámetros de población
para las respectivas regiones de EE. UU. Suponga que seleccionamos una muestra aleatoria simple de 120 trabajadores del
noreste y una muestra aleatoria simple independiente de 130 trabajadores del sur.
¿Cuál es la probabilidad de que la diferencia entre proporciones muestrales, p̂1- pag2, estará entre .04
y .20?
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 5 157

5.7 RESUMEN

Este capítulo se ocupa de las distribuciones muestrales. Se introduce el concepto de una


distribución de muestreo y se cubren las siguientes distribuciones de muestreo importantes:

1.La distribución de la media de una sola muestra.


2.La distribución de la diferencia entre dos medias muestrales.
3.La distribución de una proporción muestral.
4.La distribución de la diferencia entre dos proporciones muestrales.

Hacemos hincapié en la importancia de este material e instamos a los lectores a asegurarse de que lo
entienden antes de continuar con el siguiente capítulo.

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 5

Número de fórmula Nombre Fórmula

5.3.1 z-transformación para media muestral X


-- metro
Z¼ pffiffiffi-X
s=norte

5.4.1 z-transformación para la - 1- X


dX - 2Þ
diferencia entre dos medias
Z¼ s2Þ - ðmetro1-metro

1 s22
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi s2
þ
norte1 norte2

5.5.1 z-transformación para p̂ - p


Z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
proporción muestral pagd1 -pagÞ

norte

5.5.2 Corrección de continuidad cuandox <np Xþ :5


- pag
ZC¼ pagnffiffiffiffiffiffiffiffiffiffiffi

pq=n
5.5.3 Corrección de continuidad cuandox > np Xþ :5
þpag
ZC¼ pagnffiffiffiffiffiffiffiffiffiffiffi

pq=n
5.6.1 z-transformacion de la diferencia ðp̂ - p̂ Þ - ðpagÞ
ZC¼rffiffiffiffiffi1ffiffiffiffiffiffiffiffiffiffiffi2ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi1ffiffiffiffiffiffiffiffiffiffiffi2ffiffiffiffiffiffiffiffiffi
entre dos proporciones pag1d1 -pag1Þ pagd1 - pag
Þ2
2
þ
norte1 norte2

Clave de símbolo metroi¼media de la poblacióni


metro-X¼media de la distribución muestral si -xni¼
tamaño de muestra para muestraide la poblacióni
pagi¼proporción para la poblacióni
pagi¼proporción para la muestraide la poblacióni
s2i¼varianza para la poblacióni
- i¼media de la muestraide la poblacióni
X
z¼variable aleatoria normal estándar
158 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

PREGUNTAS DE REPASO Y EJERCICIOS

1.¿Qué es una distribución muestral?

2.Explique cómo se puede construir una distribución muestral a partir de una población finita.

3.Describa la distribución muestral de la media muestral cuando el muestreo es con reemplazo de una población
normalmente distribuida.

4.Explique el teorema del límite central.

5.¿En qué difiere la distribución muestral de la media muestral, cuando el muestreo es sin reemplazo, de
la distribución muestral obtenida cuando el muestreo es con reemplazo?

6.Describe la distribución muestral de la diferencia entre dos medias muestrales.

7.Describa la distribución muestral de la proporción muestral cuando se extraen muestras grandes.

8.Describa la distribución muestral de la diferencia entre dos medias muestrales cuando se extraen muestras
grandes.

9.Explique el procedimiento que seguiría para construir la distribución muestral de la diferencia entre
proporciones muestrales con base en muestras grandes de poblaciones finitas.

10Suponga que se sabe que el tiempo de respuesta de los sujetos sanos a un estímulo particular es una variable
aleatoria distribuida normalmente con una media de 15 segundos y una varianza de 16. ¿Cuál es la
probabilidad de que una muestra aleatoria de 16 sujetos tenga un tiempo de respuesta medio? de 12
segundos o más?

11Jansen et al. [A-10] estudió a estadounidenses de 60 años o más. Estimaron que el índice de masa corporal medio de las mujeres
mayores de 60 años con músculo esquelético normal era de 23,1 con una desviación estándar de 3,7. Usando estos valores
como la media poblacional y la desviación estándar para mujeres mayores de 60 años con índice de músculo esquelético
normal, encuentre la probabilidad de que 45 mujeres seleccionadas al azar en este rango de edad con índice de músculo
esquelético normal tengan un IMC medio superior a 25.

12En el estudio citado en el ejercicio de revisión 11, los investigadores informaron que el IMC promedio para hombres de 60
años o más con un índice de músculo esquelético normal era de 24,7 con una desviación estándar de 3,3. Usando
estos valores como la media de la población y la desviación estándar, encuentre la probabilidad de que 50 hombres
seleccionados al azar en este rango de edad con un índice de músculo esquelético normal tengan un IMC medio
inferior a 24.

13Con la información de los Ejercicios de repaso 11 y 12, calcule la probabilidad de que la diferencia en el IMC
medio de 45 mujeres y 50 hombres seleccionados de forma independiente y al azar de las respectivas
poblaciones exceda de 3.

14En los resultados publicados por Wright et al. [A-2] según los datos del estudio NHANES de 1999–2000 mencionado en los
Ejercicios 5.4.1 y 5.4.2, los investigadores informaron sobre su examen de los niveles de hierro. El nivel medio de
hierro para mujeres de 20 a 39 años fue de 13,7 mg con una desviación estándar estimada de 8,9 mg. Utilizándolos
como valores poblacionales para mujeres de 20 a 39 años, calcule la probabilidad de que una muestra aleatoria de
100 mujeres tenga un nivel medio de hierro inferior a 12 mg.

15.Consulte el ejercicio de repaso 14. El nivel medio de hierro para los hombres entre las edades de 20 y 39 años es
17,9 mg con una desviación estándar estimada de 10,9 mg. Usando 17.9 y 10.9 como parámetros de población,
encuentre la probabilidad de que una muestra aleatoria de 120 hombres tenga un nivel medio de hierro superior a
19 mg.
PREGUNTAS DE REPASO Y EJERCICIOS 159

dieciséis.Utilizando la información de los ejercicios de repaso 14 y 15, y suponiendo muestras aleatorias independientes de tamaño
100 y 120 para mujeres y hombres, respectivamente, calcule la probabilidad de que la diferencia en los niveles medios de
hierro de la muestra sea mayor que 5 mg.

17Los resultados de la Encuesta Nacional de Entrevistas de Salud de 1999 publicada en 2003 [A-7] mostraron que entre
Adultos estadounidenses de 60 años o más, al 19 por ciento les había dicho un médico u otro proveedor de
atención médica que tenían algún tipo de cáncer. Si usamos esto como el porcentaje de todos los adultos
mayores de 65 años que viven en los Estados Unidos, ¿cuál es la probabilidad de que entre 65 adultos
elegidos al azar, su médico u otro proveedor de atención médica le haya dicho a más del 25 por ciento que
tienen cancer?

18Consulte el ejercicio de repaso 17. La tasa de cáncer informada para mujeres de 65 años o más es del 17 por ciento.
Usando esta estimación como el porcentaje verdadero de todas las mujeres de 65 años o más a quienes un
proveedor de atención médica les ha dicho que tienen cáncer, encuentre la probabilidad de que si se seleccionan al
azar 220 mujeres de la población, más del 20 por ciento habrá sido dijeron que tienen cáncer.

19Consulte el ejercicio de repaso 17. La tasa de cáncer para hombres de 65 años o más es del 23 por ciento. Use esta
estimación como el porcentaje de todos los hombres de 65 años o más a quienes un proveedor de atención médica
les ha dicho que tienen cáncer. Calcule la probabilidad de que, entre 250 hombres seleccionados al azar, a menos del
20 por ciento se les haya dicho que tienen cáncer.

20Use la información de los Ejercicios de repaso 18 y 19 para encontrar la probabilidad de que la diferencia en los
porcentajes de cáncer entre hombres y mujeres sea menor al 5 por ciento cuando se seleccionan al azar 220
mujeres y 250 hombres de 65 años o más.

21¿Cuántas muestras aleatorias simples (sin reemplazo) de tamaño 5 se pueden seleccionar de una población de
tamaño 10?

22Se estima por el NHANES 1999-2000 [A-7] que entre los adultos de 18 años o más, el 53 por ciento nunca ha
fumado. Suponga que la proporción de adultos estadounidenses que nunca han fumado es 0,53. Considere
la distribución muestral de la proporción muestral basada en muestras aleatorias simples de tamaño 110
extraídas de esta población. ¿Cuál es la forma funcional de la distribución muestral?

23Consulte el ejercicio 22. Calcule la media y la varianza de la distribución muestral.

24Consulte el ejercicio 22. ¿Cuál es la probabilidad de que una sola muestra aleatoria simple de tamaño 110
extraída de esta población produzca una proporción muestral menor que .50?

25En una población de sujetos que murieron de cáncer de pulmón después de la exposición al asbesto, se encontró que el
número medio de años transcurridos entre la exposición y la muerte fue de 25. La desviación estándar fue de 7 años.
Considere la distribución muestral de las medias muestrales con base en muestras de tamaño 35 extraídas de esta
población. ¿Cuál será la forma de la distribución muestral?

26Consulte el ejercicio 25. ¿Cuáles serán la media y la varianza de la distribución muestral?

27Consulte el ejercicio 25. ¿Cuál es la probabilidad de que una sola muestra aleatoria simple de tamaño 35 extraída
de esta población produzca una media entre 22 y 29?

28Para cada una de las siguientes poblaciones de mediciones, indique si la distribución muestral de la media
muestral tiene una distribución normal, una distribución aproximadamente normal o una distribución
aproximadamente normal cuando se calcula a partir de muestras de tamaño (A) 10, (B) 50 y (C) ) 200.
(a)El logaritmo de las proporciones metabólicas. La población se distribuye normalmente.
(b)Tono vagal en reposo en adultos sanos. La población se distribuye normalmente.
(C)Acción de la insulina en sujetos obesos. La población no se distribuye normalmente.
160 CAPÍTULO 5 ALGUNAS DISTRIBUCIONES MUESTRALES IMPORTANTES

29Para cada una de las siguientes situaciones de muestreo, indique si la distribución muestral de la proporción
muestral puede aproximarse mediante una distribución normal y explique por qué o por qué no.

(a)pag¼ :50;norte¼8 (b)pag¼ :40;norte¼30


(C)pag¼ :10;norte¼30 (d)pag¼ :01;norte¼1000
(mi)pag¼ :90;norte¼100 (F)pag¼ :05;norte¼150

REFERENCIAS

Referencias de metodología
1. R.ICHARDJ. L.ARSENy MRAÍZ DE FLORENCIALMARX,Una introducción a la estadística matemática y sus aplicaciones,2.ª ed., Prentice-
Hall, Englewood Cliffs, Nueva Jersey, 1986.
2. jOHNA. R.HIELO,Estadística Matemática y Análisis de Datos,2ª ed., Duxbury, Belmont, CA, 1995.

Aplicaciones Referencias
A-1. La Tercera Encuesta Nacional de Examen de Salud y Nutrición, NHANES III (1988–94), Tabla 2. Centro Nacional de
Estadísticas de Salud, División de Servicios de Datos, Hyattsville, MD. Disponible enhttp://www.cdc.gov/nchs/about/
major/nhanes/datatablelink.htm.
A-2. jACQUELINED. W.BIEN, CEIS-YyoWESP, jOCELYNkENNEDY-STEPHENSONy R. B.ETENEmiRVIN, “Ingesta dietética de
Diez nutrientes clave para la salud pública, Estados Unidos: 1999–2000”, Centro Nacional de Estadísticas de Salud. Datos
Avanzados de Estadísticas Vitales y de Salud, N° 334 (2003).
A-3. CYNTIAL. O.GDEN, mARGARETDCARROLLO, BRIANK. K.ÉLy kATERINAM. F.LEGAL, “Prevalencia de la obesidad en los Estados Unidos,
2009–2010”, Centro Nacional de Estadísticas de Salud, Resumen de datos No. 82,http://www.cdc.gov/nchs/data/
databriefs/db82.pdf.
A-4. BLANCHEMETROIKHAIL, "Utilización de la atención prenatal entre mujeres afroamericanas de bajos ingresos",Revista de Enfermería
de Salud Comunitaria, 17 (2000), 235–246.
A-5. jAMÉSPDMITO, RAJENDRAH. M.EHTA, SUGATAKDCOMO, THOMASTEFS, DEANJ. K.ARAVITO, PAGAMELALRUSMAN, DÁVIDO
BRUCKMANy kSOYAEAGLE, "Efectos de la admisión a fin de mes sobre la duración de la estadía y la calidad de la atención entre
pacientes hospitalizados con infarto de miocardio",Diario Americano de Medicina, 113 (2002), 288–293.
A-6. ROBYNGRAMOALLAGHER, SharónMETROCkINLEYy kATLETADRACUP, "Predictor de la asistencia de las mujeres a los programas de
rehabilitación cardíaca",Avances en Enfermería Cardiovascular, 18 (2003), 121–126.
A-7. JR PLEISy RCOLES, “Resumen de estadísticas de salud para adultos de EE. UU.: Encuesta nacional de entrevistas de salud, 1999”,
Centro Nacional de Estadísticas de Salud.Estadísticas vitales y de salud, 10 (212), (2003).
A-8. Oficina del Censo de EE.UU,Informes de población actual,P60–215, según se informa en Statistical Abstract of the United States:
2002 (118th edition), US Bureau of the Census, Washington, DC, 2002, Table Nos. 137–138.
A-9. Oficina de Estadísticas Laborales de EE. UU.,Noticias,USDL 01–473, según se informa en Statistical Abstract of the United States:
2002 (118th edition), US Bureau of the Census, Washington, DC, 2002, Table No. 139.
A-10. IUNjANSSEN, STEVENBHCAMPO EYMy ROBERTOROSS, "La masa muscular esquelética relativa baja (sacopenia) en las personas
mayores está asociada con el deterioro funcional y la discapacidad física",Diario de la Sociedad Americana de
Geriatría, 50 (2002), 889–896.
CAPÍTULO 6
ESTIMACION

RESUMEN DEL CAPÍTULO

Este capítulo cubre la estimación, uno de los dos tipos de inferencia estadística. Como se
discutió en capítulos anteriores, las estadísticas, como las medias y las varianzas, se
pueden calcular a partir de muestras extraídas de poblaciones. Estas estadísticas sirven
como estimaciones de los parámetros de población correspondientes. Esperamos que
estas estimaciones difieran en cierta medida de los parámetros que estiman. Este capítulo
presenta procedimientos de estimación que toman en cuenta estas diferencias,
proporcionando así una base para los procedimientos de inferencia estadística discutidos
en los capítulos restantes del libro.

TEMAS

6.1INTRODUCCIÓN
6.2INTERVALO DE CONFIANZA PARA UNA MEDIA POBLACIONAL

6.3ELtDISTRIBUCIÓN
6.4INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS
POBLACIONALES
6.5INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN DE LA POBLACIÓN

6.6INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES DE


POBLACIÓN
6.7DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA MEDIOS DE ESTIMACIÓN

6.8DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LAS PROPORCIONES

6.9INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA POBLACIÓN NORMALMENTE


DISTRIBUIDA

6.10INTERVALO DE CONFIANZA PARA LA RAZÓN DE LAS VARIACIONES DE DOS


POBLACIONES NORMALMENTE DISTRIBUIDAS
6.11RESUMEN

161
162 CAPÍTULO 6 ESTIMACIÓN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. comprender la importancia y los principios básicos de la estimación.
2. ser capaz de calcular estimaciones de intervalo para una variedad de parámetros.
3. ser capaz de interpretar un intervalo de confianza tanto desde un punto de vista práctico como
probabilístico.
4. comprender las propiedades y usos básicos de latdistribución, distribución chi-
cuadrado yFdistribución.

6.1 INTRODUCCIÓN

Llegamos ahora a una consideración deEstimacion,la primera de las dos áreas generales de inferencia
estadística. La segunda área general,evaluación de la hipótesis,se examina en el capítulo siguiente.
Aprendimos en el Capítulo 1 que la estadística inferencial se define de la siguiente manera.

DEFINICIÓN
Inferencia estadísticaes el procedimiento por el cual llegamos a una conclusión
sobre una población sobre la base de la información contenida en una muestra
extraída de esa población.

El proceso de estimación consiste en calcular, a partir de los datos de una muestra, algún
estadístico que se ofrece como una aproximación del parámetro correspondiente de la
población de la que se extrajo la muestra.
El fundamento de la estimación en el campo de las ciencias de la salud se basa en la suposición de
que los trabajadores de este campo tienen interés en los parámetros, como las medias y las proporciones, de
varias poblaciones. Si este es el caso, hay una buena razón por la que se debe confiar en los procedimientos
de estimación para obtener información sobre estos parámetros. Muchas poblaciones de interés, aunque
finitas, son tan grandes que un examen del 100 por ciento sería prohibitivo desde el punto de vista del costo.

Suponga que el administrador de un gran hospital está interesado en la edad media de los pacientes
ingresados en su hospital durante un año determinado. Puede considerar demasiado costoso revisar los
registros de todos los pacientes admitidos durante ese año en particular y, en consecuencia, optar por
examinar una muestra de los registros a partir de la cual puede calcular una estimación de la edad media de
los pacientes admitidos ese año.
Un médico de práctica general puede estar interesado en saber qué proporción de cierto
tipo de individuo, tratado con un fármaco particular, sufre efectos secundarios indeseables. Sin
duda, su concepto de población consiste en todas aquellas personas que alguna vez han sido o
serán tratadas con esta droga. Aplazar una conclusión hasta que se haya observado a toda la
población podría tener un efecto adverso en su práctica.
Estos dos ejemplos han implicado un interés en estimar, respectivamente, una
media poblacional y una proporción poblacional. Otros parámetros, cuya estimación
cubriremos en este capítulo, son la diferencia entre dos medias, la diferencia entre dos
proporciones, la varianza de la población y la razón de dos varianzas.
6.1 INTRODUCCIÓN 163

Encontraremos que para cada uno de los parámetros que discutimos, podemos calcular dos tipos de
estimación: una estimación puntual y una estimación de intervalo.

DEFINICIÓN
Apunto estimadoes un único valor numérico utilizado para estimar el
parámetro de población correspondiente.

DEFINICIÓN
Unestimación de intervaloconsta de dos valores numéricos que definen un rango
de valores que, con un grado específico de confianza, muy probablemente incluye
el parámetro que se estima.

Estos conceptos se desarrollarán en las secciones siguientes.

Elegir un estimador apropiadoTenga en cuenta que un solo valor calculado se ha


denominado comoestimar.La regla que nos dice cómo calcular este valor, o estimación, es
referido como unestimador.Los estimadores generalmente se presentan como fórmulas. Por ejemplo,
PAG
Xi
- X¼
norte

es un estimador de la media poblacional,metro.El único valor numérico que resulta de evaluar


esta fórmula se denomina estimación del parámetro.metro.
En muchos casos, un parámetro puede ser estimado por más de un estimador. Por ejemplo,
podríamos usar la mediana muestral para estimar la media poblacional. Entonces, ¿cómo decidimos
qué estimador usar para estimar un parámetro dado? La decisión se basa en una medida objetiva o
un conjunto de criterios que reflejan alguna propiedad deseada de un estimador particular. Cuando
se mide contra estos criterios, algunos estimadores son mejores que otros. Uno de estos criterios es
la propiedad deimparcialidad

DEFINICIÓN
Un estimador, digamos,T,del parámetrotuse dice que es imparcialestimador
detusiE(T) =tu

mi(t)se lee, “el valor esperado deT.”Para una población finita,mi(t)se obtiene tomando el
valor medio deTcalculada a partir de todas las muestras posibles de un tamaño dado que
pueden extraerse de la población. Eso es,midT¼metroT.Para una población infinita,mi(t)se
define en términos de cálculo.
En el capítulo anterior hemos visto que la media muestral, la proporción muestral, la
diferencia entre dos medias muestrales y la diferencia entre dos proporciones muestrales son
estimaciones no sesgadas de sus parámetros correspondientes. Esta propiedad estaba implícita
cuando se decía que los parámetros eran las medias de las respectivas distribuciones
muestrales. Por ejemplo, dado que la media de la distribución muestral de -Xes igual ametro, lo
sabemos -Xes un estimador insesgado demetro.Los otros criterios de buenos estimadores no
164 CAPÍTULO 6 ESTIMACIÓN

ser discutido en este libro. El lector interesado los encontrará cubiertos en detalle en la mayoría de los textos
de estadística matemática.

Poblaciones muestreadas y poblaciones objetivoel investigador de la salud


quien utiliza procedimientos de inferencia estadística debe ser consciente de la diferencia entre
dos tipos de población: la población muestreada y la población objetivo.

DEFINICIÓN
Elpoblación muestreadaes la población de la que realmente se extrae una
muestra.

DEFINICIÓN
Elpoblación objetivoes la población sobre la que se desea hacer una
inferencia.

Estas dos poblaciones pueden o no ser iguales. Los procedimientos de inferencia


estadística permiten hacer inferencias sobre poblaciones muestreadas (siempre que se hayan
empleado métodos de muestreo adecuados). Solo cuando la población objetivo y la población
muestreada son las mismas es posible utilizar procedimientos de inferencia estadística para
llegar a conclusiones sobre la población objetivo. Si la población muestreada y la población
objetivo son diferentes, el investigador puede llegar a conclusiones sobre la población objetivo
solo sobre la base de consideraciones no estadísticas.
Supongamos, por ejemplo, que un investigador desea evaluar la efectividad de algún método para
tratar la artritis reumatoide. La población diana está formada por todos los pacientes que padecen la
enfermedad. No es práctico extraer una muestra de esta población. Sin embargo, el investigador puede
seleccionar una muestra de todos los pacientes con artritis reumatoide atendidos en alguna clínica
específica. Estos pacientes constituyen la población muestreada y, si se utilizan métodos de muestreo
adecuados, se pueden hacer inferencias sobre esta población muestreada sobre la base de la información de
la muestra. Si el investigador desea hacer inferencias sobre todos los que padecen artritis reumatoide, debe
confiar en medios no estadísticos para hacerlo. Quizás el investigador sabe que la población muestreada es
similar, con respecto a todas las características importantes, a la población objetivo. Eso es, el investigador
puede saber que la edad, el sexo, la gravedad de la enfermedad, la duración de la enfermedad, etc., son
similares en ambas poblaciones. Y sobre la base de este conocimiento, el investigador puede estar dispuesto
a extrapolar sus hallazgos a la población objetivo.
En muchas situaciones, la población muestreada y la población objetivo son idénticas;
cuando este es el caso, las inferencias sobre la población objetivo son sencillas. El investigador,
sin embargo, debe ser consciente de que este no es siempre el caso y no caer en la trampa de
sacar inferencias injustificadas sobre una población que es diferente de la que se muestra.

Muestras aleatorias y no aleatoriasEn los ejemplos y ejercicios de este libro, suponemos que los datos
disponibles para el análisis provienen de muestras aleatorias. La estricta validez de los procedimientos
estadísticos discutidos depende de esta suposición. En muchos casos, en aplicaciones del mundo real, es
imposible o poco práctico utilizar muestras verdaderamente aleatorias. En los experimentos con animales,
por ejemplo, los investigadores suelen utilizar cualquier animal disponible de los proveedores o de su propio
ganado reproductor. Si los investigadores tuvieran que depender de
6.2 INTERVALO DE CONFIANZA PARA UNA MEDIA POBLACIONAL 165

material seleccionado al azar, se llevaría a cabo muy poca investigación de este tipo. Una vez más, las
consideraciones no estadísticas deben desempeñar un papel en el proceso de generalización. Los
investigadores pueden afirmar que las muestras realmente utilizadas son equivalentes a muestras aleatorias
simples, ya que no hay razón para creer que el material realmente utilizado no sea representativo de la
población sobre la cual se desean inferencias.
En muchos proyectos de investigación en salud, se emplean muestras de conveniencia, en lugar de
muestras aleatorias. Es posible que los investigadores tengan que confiar en sujetos voluntarios o en sujetos
fácilmente disponibles, como los estudiantes en sus clases. Las muestras obtenidas de dichas fuentes son
ejemplos demuestras de conveniencia.Nuevamente, las generalizaciones deben hacerse sobre la base de
consideraciones no estadísticas. Las consecuencias de tales generalizaciones, sin embargo, pueden ser útiles
o pueden variar desde engañosas hasta desastrosas.
En algunas situaciones, es posible introducir la aleatorización en un experimento aunque
los sujetos disponibles no se seleccionen aleatoriamente de una población bien definida. Al
comparar dos tratamientos, por ejemplo, cada sujeto puede ser asignado al azar a uno u otro
de los tratamientos. Las inferencias en tales casos se aplican a los tratamientos y no a los
sujetos y, por lo tanto, las inferencias son válidas.

6.2 INTERVALO DE CONFIANZA


PARA UNA MEDIA POBLACIONAL

Supongamos que los investigadores desean estimar la media de alguna población normalmente distribuida.
Extraen una muestra aleatoria de tamañonortede la población y calcular -X,que utilizan como una estimación
puntual demetro.Aunque este estimador demetroposee todas las cualidades de un buen estimador, sabemos
que debido a que el muestreo aleatorio involucra inherentemente el azar, -Xno se puede esperar que sea
igual ametro.
Sería mucho más significativo, por lo tanto, estimarmetropor un intervalo que de
alguna manera comunica información sobre la magnitud probable demetro.

Distribuciones de muestreo y estimaciónPara obtener una estimación de intervalo,


debemos basarnos en nuestro conocimiento de las distribuciones muestrales. En el presente caso,
debido a que nos interesa la media muestral como estimador de la media poblacional, debemos
recordar lo que sabemos acerca de la distribución muestral de la media muestral.
En el capítulo anterior aprendimos que si el muestreo es de una población distribuida
normalmente, la distribución muestral de la media muestral se distribuirá normalmente con
un sentidometro-Xigual a la media de la poblaciónmetro,y una variacións2 - Xigual as2= n.Podríamos tramar
la distribución de muestreo si supiéramos dónde ubicarla en el -X-eje. A partir de nuestro conocimiento de las
distribuciones normales, en general, sabemos aún más acerca de la distribución de
- Xen este caso. Sabemos, por ejemplo, que independientemente de dónde esté la distribución de -Xse
encuentra, aproximadamente el 95 por ciento de los valores posibles de -Xque constituyen la distribución
están dentro de dos desviaciones estándar de la media. Los dos puntos que están a dos desviaciones
estándar de la media sonm-2s-Xymetroþ2s-X, de modo que el intervalom-2s-Xcontendrá aproximadamente el
95 por ciento de los valores posibles de -X.Lo sabemosmetroy por lo tanto metro-X, son desconocidos, pero
podemos colocar arbitrariamente la distribución muestral de -Xsobre el -X-eje.
Como no sabemos el valor demetro,no se logra mucho con la expresiónm-2s-X.
Sin embargo, tenemos una estimación puntual demetro,cual es -X.Podría ser
166 CAPÍTULO 6 ESTIMACIÓN

(1 _α) = .95

α/2 α/2
2 σX 2σX

m X

X1

X2
X3

X4

X5

FIGURA 6.2.1El intervalo de confianza del 95 por ciento parametro.

útil para construir un intervalo sobre esta estimación puntual de¿metro?La respuesta es sí.
Supongamos que construimos intervalos sobre cada valor posible de -Xcalculado a partir de todas las
muestras posibles de tamañonortede la población de interés. Tendríamos un gran número de
intervalos de la forma -X -2s-Xcon anchos todos iguales al ancho del intervalo sobre la incógnitametro.
Aproximadamente el 95 por ciento de estos intervalos tendrían centros dentro del -2s-Xintervalo sobre
metro.Cada uno de los intervalos cuyos centros caen dentro de 2s-Xdemetrocontendríametro.Estos
conceptos se ilustran en la Figura 6.2.1, en la que vemos que:X; -X3, y -X4
todos caen dentro del intervalo sobremetro,y, en consecuencia, los 2s-Xintervalos sobre estas medias
muestrales incluyen el valor demetro.La muestra significa -X2y -X5no caigas dentro de los 2s-X
intervalo sobremetro,y los 2s-Xintervalos sobre ellos no incluyenmetro.

EJEMPLO 6.2.1
Suponga que un investigador, interesado en obtener una estimación del nivel promedio de alguna
enzima en cierta población humana, toma una muestra de 10 individuos, determina el nivel de la
enzima en cada uno y calcula una media muestral de:X¼22. Suponga además que se sabe que la
variable de interés tiene una distribución aproximadamente normal con una varianza de 45.
Deseamos estimarmetro.

Solución:Un intervalo de confianza aproximado del 95 por ciento parametroes dado por

- X -2s-X
rffiffiffiffiffi

45
22 - 2
10
22 - 2d2:1213Þ
17:76; 26:24 &
6.2 INTERVALO DE CONFIANZA PARA UNA MEDIA POBLACIONAL 167

Componentes de estimación de intervaloExaminemos la composición de la estimación por intervalo


construida en el ejemplo 6.2.1. Contiene en su centro la estimación puntual demetro.El 2 lo
reconocemos como un valor de la distribución normal estándar que nos dice dentro de cuántos
errores estándar se encuentran aproximadamente el 95 por ciento de los valores posibles de:X. Este
valor dezse conoce como elcoeficiente de fiabilidad.El último componente,s-X, es el error estándar o la
desviación estándar de la distribución muestral de -X.En general, entonces, una estimación de
intervalo se puede expresar de la siguiente manera:

estimador -dcoeficiente de fiabilidadÞ ðError estándarÞ (6.2.1)


En particular, cuando el muestreo es de una distribución normal con varianza conocida, una
estimación de intervalo parametropuede expresarse como

- x - zd1-un =2Þs-X (6.2.2)

dóndezd1-un =2Þes el valor deza la izquierda del cual se encuentra 1 -un =2 y a la derecha de la cual se
encuentra un =2 del área bajo su curva.

Interpretación de los intervalos de confianza¿Cómo interpretamos el intervalo dado por la


Expresión 6.2.2? En el presente ejemplo, donde el coeficiente de confiabilidad es igual a 2,
decimos que en el muestreo repetido, aproximadamente el 95 por ciento de los intervalos
construidos por la Expresión 6.2.2 incluirán la media de la población. Esta interpretación se
basa en la probabilidad de ocurrencia de diferentes valores de -X.Podemos generalizar esta
interpretación si designamos el área total bajo la curva de -Xque está fuera del intervalom-2s-X
comoay el área dentro del intervalo como 1 -ay dar lo siguienteinterpretación probabilísticade
Expresión 6.2.2.

Interpretación Probabilística
En muestreo repetido, de una población distribuida normalmente con una desviación estándar
conocida,100d1 -aÞporcentaje de todos los intervalos de la forma -x - zd1-un =2Þs-Xincluirá a la
larga la media de la poblaciónmetro.

La cantidad 1 -a,en este caso .95, se llama elcoeficiente de confianza (o nivel de


confianza), y el intervalo -x - zd1-un =2Þs-Xse llama unintervalo de confianzaparametro.Cuando d1 -
aÞ ¼ :95, el intervalo se denomina intervalo de confianza del 95 por ciento parametro.En el
presente ejemplo, decimos que estamos 95 por ciento seguros de que la media de la población
está entre 17,76 y 26,24. Esto se llama elinterpretación prácticade Expresión 6.2.2. En general,
se puede expresar de la siguiente manera.

Interpretación Práctica
Cuando el muestreo es de una población distribuida normalmente con desviación estándar
conocida, estamos100d1 -aÞpor ciento seguro de que el único intervalo calculado,
- x - zd1-un =2Þs-X,contiene la media de la poblaciónmetro.

En el ejemplo dado aquí, podríamos preferir, en lugar de 2, el valor más exacto dez,
1,96, correspondiente a un coeficiente de confianza de 0,95. Los investigadores pueden usar cualquier
coeficiente de confianza que deseen; los valores más utilizados son .90, .95 y .99, que tienen factores
de confiabilidad asociados, respectivamente, de 1.645, 1.96 y 2.58.
168 CAPÍTULO 6 ESTIMACIÓN

PrecisiónLa cantidad que se obtiene al multiplicar el factor de confiabilidad por el error


estándar de la media se denominaprecisiónde la estimación. Esta cantidad también se llama
margen de error.

EJEMPLO 6.2.2
Un fisioterapeuta deseaba estimar, con un 99 por ciento de confianza, la fuerza máxima media de un
músculo en particular en cierto grupo de individuos. Está dispuesto a suponer que las puntuaciones
de fuerza se distribuyen aproximadamente normalmente con una varianza de 144. Una muestra de 15
sujetos que participaron en el experimento arrojó una media de 84,3.

Solución: Elzel valor correspondiente a un coeficiente de confianza de .99 se encuentra en el Apéndice


Tabla D tpago ffibffiffiffi 2.58. Este es nuestro coeficiente de fiabilidad. El error estándar es s-X¼12 =
15¼3:0984. Nuestro intervalo de confianza del 99 por ciento parametro,entonces es

84:3 - 2:58d3:0984Þ

84:3 - 8:0
76:3; 92:3

Decimos que estamos 99 por ciento seguros de que la media de la población está
entre 76.3 y 92.3 ya que, en muestreo repetido, el 99 por ciento de todos los intervalos
que podrían construirse de la manera que acabamos de describir incluiría la media de
la población. &

Las situaciones en las que la variable de interés tiene una distribución aproximadamente normal con una
varianza conocida son bastante raras. El propósito de los ejemplos anteriores, que suponían que existían
estas condiciones ideales, era establecer los antecedentes teóricos para construir intervalos de confianza
para las medias de población. En la mayoría de las situaciones prácticas, las variables no tienen una
distribución aproximadamente normal o no se conocen las varianzas de la población, o ambas cosas. El
ejemplo 6.2.3 y la sección 6.3 explican los procedimientos que están disponibles para usar en situaciones
menos que ideales, pero más comunes.

Muestreo de poblaciones no normalesComo se ha señalado, no siempre será


posible o prudente suponer que la población de interés se distribuye normalmente. Gracias al teorema del
límite central, esto no nos detendrá si somos capaces de seleccionar una muestra lo suficientemente grande.
Hemos aprendido que para muestras grandes, la distribución muestral de:Xtiene una distribución
aproximadamente normal, independientemente de cómo se distribuya la población original.

EJEMPLO 6.2.3
La puntualidad de los pacientes en la asistencia a las citas es de interés para un equipo de investigación. En un
estudio de flujo de pacientes a través de los consultorios de médicos generales, se encontró que una muestra de 35
pacientes llegaba 17,2 minutos tarde a las citas, en promedio. Investigaciones anteriores habían demostrado que la
desviación estándar era de unos 8 minutos. Se consideró que la distribución de la población no era normal. ¿Cuál es el
intervalo de confianza del 90 por ciento parametro,la verdadera cantidad media de tiempo atrasado para las citas?
6.2 INTERVALO DE CONFIANZA PARA UNA MEDIA POBLACIONAL 169

Solución: Como el tamaño de la muestra es bastante grande (más de 30) y como se conoce la
desviación estándar de la población, nos basamos en el teorema del límite central y
asumimos la distribución muestral de:Xaproximadamente distribuida normalmente. De la
Tabla D del Apéndice encontramos el coeficiente de confiabilidad correspondiente a un
coeficiente de confianzapag ieffinffiffitffiffi de .90 para ser alrededor de 1.645, si interpolamos. El
el error estándar ess-X¼8= 35¼1:3522, de modo que nuestro intervalo de confianza del 90 por ciento
parametroes
17:2 - 1:645d1:3522Þ
17:2 - 2:2
15:0; 19:4 &

Con frecuencia, cuando la muestra es lo suficientemente grande para la aplicación del teorema del
límite central, se desconoce la varianza de la población. En ese caso, usamos la varianza muestral
como reemplazo de la varianza poblacional desconocida en la fórmula para construir un intervalo de
confianza para la media poblacional.

Análisis informáticoCuando se desean intervalos de confianza, se puede ahorrar mucho tiempo si se


usa una computadora, que se puede programar para construir intervalos a partir de datos sin
procesar.

EJEMPLO 6.2.4
Los siguientes son los valores de actividad (micromoles por minuto por gramo de tejido) de
cierta enzima medida en tejido gástrico normal de 35 pacientes con carcinoma gástrico.

. 360 1.189 . 614 . 788 . 273 2.464 . 571


1.827 . 537 . 374 . 449 . 262 . 448 . 971
. 372 . 898 . 411 . 348 1.925 . 550 . 622
. 610 . 319 . 406 . 413 . 767 . 385 . 674
. 521 . 603 . 533 . 662 1.177 . 307 1.499

Deseamos usar el paquete de software de computadora MINITAB para construir un intervalo de confianza
del 95 por ciento para la media de la población. Supongamos que sabemos que la varianza de la población es
.36. No es necesario suponer que la población de valores muestreada se distribuye normalmente ya que el
tamaño de la muestra es lo suficientemente grande para la aplicación del teorema del límite central.

Solución: Ingresamos los datos en la Columna 1 y procedemos como se muestra en la Figura 6.2.2. Estas

instrucciones le dicen a la computadora que el factor de confiabilidad esz,que se desea un intervalo

de confianza del 95 por ciento, que la desviación estándar de la población es 0,6 y que los datos

están en la Columna 1. El resultado nos dice que la media muestral es 0,718, lapagsffiffiffimple spag
la desviación de taffinffiffidffiffiard es .511, y el error estándar de la media,
s=nortees :6= 35¼ :101. &

Tenemos un 95 por ciento de confianza en que la media de la población está entre .519 y .917.
Los intervalos de confianza se pueden obtener mediante el uso de muchos otros paquetes de
software. Usuarios de SAS®, por ejemplo, puede querer usar la salida de PROC MEANS o PROC
UNIVARIATE para construir intervalos de confianza.
170 CAPÍTULO 6 ESTIMACIÓN

Caja de diálogo: Comando de sesión:

Estadística Estadísticas básicas 1-muestra z BTT > ZINTERVAL 95 .6 C1

TipoC1enMuestras en Columnas. Tipo.6en


Desviación Estándar.Hacer clicDE ACUERDO.

Producción:

Una muestra Z: C1

La desviación estándar asumida 0.600

Variable norte Significar Desvst SE medio 95,0 % CI


micromoles 35 0.718 0.511 0.101 ( 0.519, 0.917)

FIGURA 6.2.2Procedimiento de MINITAB para construir un intervalo de confianza del 95 por ciento para una
media poblacional, Ejemplo 6.2.4.

Estimaciones alternativas de tendencia centralComo se señaló anteriormente, el


la media es sensible a los valores extremos, aquellos valores que se desvían considerablemente de la
mayoría de las mediciones en un conjunto de datos. A veces se los denominavalores atípicosTambién
señalamos anteriormente que la mediana, debido a que no es tan sensible a las medidas extremas, a veces
se prefiere a la media como medida de tendencia central cuando hay valores atípicos. Por la misma razón,
podemos preferir usar la mediana muestral como estimador de la mediana poblacional cuando deseamos
hacer una inferencia sobre la tendencia central de una población. No solo podemos usar la mediana de la
muestra como una estimación puntual de la mediana de la población, sino que también podemos construir
un intervalo de confianza para la mediana de la población. La fórmula no se da aquí, pero se puede encontrar
en el libro de Rice (1).

Media recortadaLos estimadores que no son sensibles a los valores atípicos se denominanestimadores
robustos.Otra medida robusta y estimador de tendencia central es lamedia recortada.Para un conjunto de
datos de muestra que contienenortemedidas calculamos el 100aporcentaje de media recortada de la
siguiente manera:

1.Ordena las medidas.


2.Descartar los 100 más pequeñosapor ciento y el mayor 100apor ciento de las
medidas. El valor recomendado deaes algo entre .1 y .2.
3.Calcule la media aritmética de las medidas restantes.
Tenga en cuenta que la mediana puede considerarse como una media recortada al 50 por ciento.

EJERCICIOS

Para cada uno de los siguientes ejercicios, construya intervalos de confianza de 90, 95 y 99 por ciento para la
media de la población y establezca las interpretaciones prácticas y probabilísticas de cada uno. Indique qué
interpretación cree que sería más apropiada usar al discutir los intervalos de confianza con
6.3 ELtDISTRIBUCIÓN 171

alguien que no haya tenido un curso de estadística, y exponga el motivo de su elección. Explica por
qué los tres intervalos que construyes no tienen el mismo ancho. Indique cuál de los tres intervalos
preferiría utilizar como estimación de la media de la población y exponga el motivo de su elección.

6.2.1.Deseamos estimar el número promedio de latidos del corazón por minuto para una determinada población. Se encontró
que el número promedio de latidos cardíacos por minuto para una muestra de 49 sujetos es 90. Suponga que estos
49 pacientes constituyen una muestra aleatoria y que la población se distribuye normalmente con una desviación
estándar de 10.

6.2.2.Deseamos estimar el nivel medio de bilirrubina indirecta en suero de lactantes de 4 días de edad. Se encontró que la media para una
muestra de 16 lactantes era de 5,98 mg/100 cc. Suponga que los niveles de bilirrubina en lactantes de 4 días tienen una
distribución aproximadamente normal con una desviación estándar de 3,5 mg/100 cc.

6.2.3.En un estudio de la duración de la hospitalización realizado por varios hospitales cooperantes, se extrajo una muestra aleatoria de
64 pacientes con úlcera péptica de una lista de todos los pacientes con úlcera péptica que alguna vez ingresaron en los
hospitales participantes y se determinó la duración de la hospitalización por ingreso para cada uno. Se encontró que la
duración media de la hospitalización fue de 8,25 días. Se sabe que la desviación estándar de la población es de 3 días.

6.2.4.Una muestra de 100 varones adultos aparentemente normales, de 25 años, tenía una presión arterial sistólica media de
125. Se cree que la desviación estándar de la población es 15.

6.2.5.Algunos estudios de la enfermedad de Alzheimer (EA) han mostrado un aumento en14CO2producción en pacientes con la
enfermedad. En uno de esos estudios, lo siguiente14CO2los valores se obtuvieron de 16 muestras de biopsia
neocortical de pacientes con EA.

1009 1280 1180 1255 1547 2352 1956 1080


1776 1767 1680 2050 1452 2857 3100 1621
Suponga que la población de tales valores se distribuye normalmente con una desviación estándar de 350.

6.3 ELtDISTRIBUCIÓN

En la Sección 6.2, se describió un procedimiento para construir un intervalo de confianza para una
media poblacional. El procedimiento requiere el conocimiento de la varianza de la población de la que
se extrae la muestra. Puede parecer algo extraño que uno pueda tener conocimiento de la varianza
de la población y no saber el valor de la media de la población. De hecho, es el caso habitual, en
situaciones como las que se han presentado, que se desconoce la varianza de la población, así como
la media de la población. Esta condición presenta un problema con respecto a la construcción de
intervalos de confianza. Aunque, por ejemplo, la estadística

- X -metro
z¼ pffiffiffi
s= norte

se distribuye normalmente cuando la población se distribuye normalmente y se distribuye al menos


aproximadamente normalmente cuandonortees grande, independientemente de la forma funcional
de la población, no podemos hacer uso de este hecho porqueses desconocido. Sin embargo, no todo
está perdido, y la solución más lógica al problema es la que se sigue. Usamos la muestra
Desviación Estándar
qffiX
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

s¼ dXi- -XÞ2=ðn-1Þ
172 CAPÍTULO 6 ESTIMACIÓN

para reemplazars.Cuando el tamaño de la muestra es grande, digamos mayor a 30, nuestra fe enscomo una
aproximación dessuele ser sustancial, y puede estar debidamente justificado el uso de la teoría de la
distribución normal para construir un intervalo de confianza para la media de la población. En ese caso,
procedemos como se indica en la Sección 6.2.
Es cuando tenemos muestras pequeñas que se nos hace obligatorio encontrar un
procedimiento alternativo para construir intervalos de confianza.
A raíz del trabajo de Gosset (2), escribiendo bajo el seudónimo de “Estudiante”, una alternativa,
conocida comodistribución t de Student,generalmente abreviado adistribución de t,está disponible
para nosotros.
La cantidad
- X -metro
t¼ pffiffiffi (6.3.1)
s= norte

sigue esta distribución.

Propiedades de latDistribuciónEltLa distribución tiene las siguientes


propiedades.
1.Tiene una media de 0.
2.Es simétrica respecto a la media.
3.En general, tiene una varianza mayor que 1, pero la varianza se aproxima a 1 a medida que
el tamaño de la muestra se vuelve grande. Paradf >2, la varianza de latla distribución es
df =ddf-2Þ,dónded.f.son los grados de libertad. Alternativamente, ya que aquíd.f.¼ n-1
paranorte >3, podemos escribir la varianza de latdistribución comodn-1Þ=ðn-3Þ.
4.La variabletrangos desde -1aþ1.
5.Eltdistribución es realmente una familia de distribuciones, ya que hay una distribución
diferente para cada valor muestral den-1, el divisor usado en computacións2.
Recordamos quen-1 se conoce como grados de libertad. La Figura 6.3.1 muestrat
distribuciones correspondientes a varios valores de grados de libertad.

Grados de libertad = 30

Grados de libertad = 5

Grados de libertad = 2

t
FIGURA 6.3.1Eltdistribución para diferentes valores de grados de libertad.
6.3 ELtDISTRIBUCIÓN 173

Distribución normal
tdistribución

X
FIGURA 6.3.2Comparación de distribución normal ytdistribución.

6.En comparación con la distribución normal, latla distribución es menos puntiaguda en el centro y
tiene colas más gruesas. La Figura 6.3.2 compara eltdistribución con la normal.
7.Eltdistribución se aproxima a la distribución normal comon-1 tiende a infinito.

EltLa distribución, como la normal estándar, ha sido tabulada extensamente. Una de estas
tablas se proporciona como Tabla E en el Apéndice. Como veremos, debemos tener en cuenta tanto el
coeficiente de confianza como los grados de libertad cuando usamos la tabla de latdistribución.
Puede usar MINITAB para graficar eltdistribución (para valores de grados de libertad
especificados) y otras distribuciones. Después de designar el eje horizontal siguiendo las instrucciones
en el cuadro Establecer datos con patrones, elija la ruta del menú Calc y luego Probability
Distributions. Finalmente, haga clic en la distribución deseada y siga las instrucciones. Utilice el
cuadro de diálogo Trazar para trazar el gráfico.

Uso de intervalos de confianzatEl procedimiento general para construir intervalos de


confianza no se ve afectado por tener que usar eltdistribución en lugar de la distribución
normal estándar. Todavía hacemos uso de la relación expresada por

estimador -dcoeficiente de fiabilidadÞ ðerror estándar del estimadorÞ

Lo que es diferente es la fuente del coeficiente de confiabilidad. Ahora se obtiene de la tabla de lat
distribución en lugar de la tabla de distribución normal estándar. Para ser más especifico,cuando el
muestreo es de una distribución normal cuya desviación estándar,s,se desconoce, el100d1 -aÞ
intervalo de confianza porcentual para la media de la población,metro,es dado por

s
- x - td1-un =2Þpffiffiffi (6.3.2)
norte

Resaltamos que un requisito para el uso estrictamente válido de latdistribución es que la muestra
debe ser extraída de una distribución normal. Sin embargo, la experiencia ha demostrado que se
pueden tolerar desviaciones moderadas de este requisito. Como consecuencia, elt la distribución se
utiliza incluso cuando se sabe que la población original se desvía un poco de la normalidad. La
mayoría de los investigadores requieren que sea sostenible una suposición de, al menos, una
distribución de la población en forma de montículo.

EJEMPLO 6.3.1
Maffulli et al. (A-1) estudiaron la eficacia de las terapias tempranas de movilización del tobillo y carga
de peso después de la reparación aguda de una rotura del tendón de Aquiles. una de las variables
174 CAPÍTULO 6 ESTIMACIÓN

midieron después del tratamiento la fuerza isométrica del músculo gastrocsoleo. En 19 sujetos, la
fuerza isométrica media del miembro operado (en newtons) fue de 250,8 con una desviación estándar
de 130,9. Suponemos que estos 19 pacientes constituyen una muestra aleatoria de una población de
sujetos similares. Deseamos utilizar estos datos de muestra para estimar para la población la fuerza
isométrica media después de la cirugía.

Solución: Podemos usar la media muestral, 250.8, como una estimación puntual de la media
poblacional pero, debido a que se desconoce la desviación estándar de la población,
debemos suponer que la población de valores tiene una distribución al menos
aproximadamente normal antes de construir un intervalo de confianza parametro.
Supongamos que tal suposición es razonable y que un 95 por ciento de confianza en
pagerffivffiffi al es deseopagedffiffiffi.ffiffi Tenemos nuestro estimador, -X,y nuestro error estándar es
s = norte¼130:9= 19¼30:0305. Ahora necesitamos encontrar el coeficiente de
confiabilidad, el valor detasociado con un coeficiente de confianza de .95 yn-1¼18
grados de libertad. Dado que un intervalo de confianza del 95 por ciento deja 0,05 del
área bajo la curva detpara ser dividido equitativamente entre las dos colas,
necesitamos el valor deta la derecha del cual se encuentra .025 del área. Localizamos
en el Apéndice Tabla E la columna encabezadat:975. Este es el valor deta la izquierda del
cual se encuentra .975 del área bajo la curva. El área a la derecha de este valor es igual
al .025 deseado. Ahora ubicamos el número 18 en la columna de grados de libertad. El
valor en la intersección de la fila con la etiqueta 18 y la columna con la etiquetat:975es el
tnosotros buscamos. Este valor deyo,que es nuestro coeficiente de confiabilidad, se
encuentra que es 2.1009. Ahora construimos nuestro intervalo de confianza del 95 por
ciento de la siguiente manera:

250:8 - 2:1009d30:0305Þ
250:8 - 63:1
187:7; 313:9
&

Este intervalo puede interpretarse tanto desde el punto de vista probabilístico como práctico. Estamos 95 por
ciento seguros de que la verdadera población significa,metro,está en algún lugar entre 187.7 y 313.9 porque,
en muestreo repetido, el 95 por ciento de los intervalos construidos de manera similar incluiránmetro.

Decidir entrezytCuando construimos un intervalo de confianza para la media de una población,


debemos decidir si usar un valor dezo un valor detcomo el factor de confiabilidad. Para hacer una
elección adecuada, debemos considerar el tamaño de la muestra, si la población muestreada se
distribuye normalmente y si se conoce la varianza de la población. La Figura 6.3.3 proporciona un
diagrama de flujo que se puede usar para decidir rápidamente si el factor de confiabilidad debe serzo
t.

Análisis informáticoSi desea que MINITAB construya un intervalo de confianza para


una media poblacional cuando eltstatistic es el factor de confiabilidad apropiado, el
comando es TINTERVAL. En Windows, elija 1-Sampletdel menú Estadísticas básicas.
EJERCICIOS 175

Población
Sí normalmente No
¿repartido?

Muestra Muestra
Sí tamaño No Sí tamaño No
¿grande? ¿grande?

Población Población Población Población


oi t ayotupag
norte oPAG
Sí diferencia No Sí diferencia No Sí diferencia No Sí yyo
yo a metro
diferenciar onorte No
¿conocido? ¿conocido? ¿conocido? d mi
t tubi rt si d
¿conocido?

z t z t z z * *

o Se aplica el teorema del límite central

FIGURA 6.3.3Diagrama de flujo para usar al decidir entrezytal hacer inferencias sobre las medias de la
población. (Utilice un procedimiento no paramétrico. Consulte el Capítulo 13).

EJERCICIOS

6.3.1.Utilizar eltdistribución para encontrar el factor de confiabilidad para un intervalo de confianza basado en los siguientes
coeficientes de confianza y tamaños de muestra:

a b C d

Coeficiente de confianza . 95 . 99 . 90 . 95
Tamaño de la muestra 15 24 8 30

6.3.2.En un estudio de los efectos de la enfermedad de Alzheimer temprana en la memoria no declarativa, Reber et al. (A-2) usó la prueba
de fluidez de categoría para establecer la persistencia de referencia y la memoria semántica y las habilidades lingüísticas. Los
ocho sujetos de la muestra obtuvieron puntajes en la prueba de fluidez de categoría de 11, 10, 6, 3, 11, 10, 9,
11. Suponga que los ocho sujetos constituyen una muestra aleatoria simple de una población normalmente
distribuida de sujetos similares con enfermedad de Alzheimer temprana.
(a)¿Cuál es la estimación puntual de la media poblacional?
(b)¿Cuál es la desviación estándar de la muestra?
(C)¿Cuál es el error estándar estimado de la media muestral?
(d)Construya un intervalo de confianza del 95 por ciento para la puntuación de la prueba de fluidez de la categoría media de la población.

(mi)¿Cuál es la precisión de la estimación?


(F)Indique la interpretación probabilística del intervalo de confianza que construyó.
(gramo)Indique la interpretación práctica del intervalo de confianza que construyó.

6.3.3.Pedroletti et al. (A-3) informaron la velocidad máxima de difusión de óxido nítrico en una muestra de 15
escolares asmáticos y 15 controles como media - error estándar de la media. Para los niños asmáticos, ellos
176 CAPÍTULO 6 ESTIMACIÓN

reportaron 3:5 - 0:4 nL=s (nanolitros por segundo) y para sujetos de control reportaron 0:7 - :1 nL=s.
Para cada grupo, determine lo siguiente:
(a)¿Cuál fue la desviación estándar de la muestra?
(b)¿Cuál es el intervalo de confianza del 95 por ciento para la velocidad máxima media de difusión de óxido nítrico de la
población?

(C)¿Qué suposiciones son necesarias para la validez del intervalo de confianza que construyó?
(d)¿Cuáles son las interpretaciones prácticas y probabilísticas del intervalo que construyó?
(mi)¿Qué interpretación sería más apropiada para usar cuando se analizan los intervalos de confianza con
alguien que no ha tomado un curso de estadística? Indique las razones de su elección.
(F)Si tuviera que construir un intervalo de confianza del 90 por ciento para la media de la población a partir de la
información proporcionada aquí, ¿el intervalo sería más ancho o más estrecho que el intervalo de confianza del 95
por ciento? Explique su respuesta sin construir realmente el intervalo.
(gramo)Si tuviera que construir un intervalo de confianza del 99 por ciento para la media de la población a partir de la
información proporcionada aquí, ¿el intervalo sería más ancho o más estrecho que el intervalo de confianza del 95
por ciento? Explique su respuesta sin construir realmente el intervalo.

6.3.4.La preocupación de un estudio de Beynnon et al. (A-4) fueron nueve sujetos con desgarros crónicos del
ligamento cruzado anterior (LCA). Una de las variables de interés fue la laxitud anteroposterior, donde
valores más altos indican mayor inestabilidad de la rodilla. Los investigadores encontraron que entre los
sujetos con rodillas con LCA deficiente, el valor medio de laxitud fue de 17,4 mm con una desviación estándar
de 4,3 mm.
(a)¿Cuál es el error estándar estimado de la media?
(b)Construya el intervalo de confianza del 99 por ciento para la media de la población de la cual se puede
suponer que los nueve sujetos son una muestra aleatoria.
(C)¿Cuál es la precisión de la estimación?
(d)¿Qué suposiciones son necesarias para la validez del intervalo de confianza que construyó?

6.3.5.Una muestra de 16 niñas de diez años tenía un peso medio de 71,5 y una desviación estándar de 12 libras.
respectivamente. Suponiendo normalidad, encuentre los intervalos de confianza de 90, 95 y 99 por ciento parametro.

6.3.6.Los sujetos de un estudio de Dugoff et al. (A-5) eran 10 pasantes de obstetricia y ginecología en el Centro de
Ciencias de la Salud de la Universidad de Colorado. Los investigadores querían evaluar la competencia en la
realización de exámenes clínicos de mama. Una de las medidas de referencia fue el número de tales
exámenes realizados. Los siguientes datos dan el número de exámenes de mama realizados para esta
muestra de 10 internas.

Número de pasante No. de Exámenes de Senos Realizados

1 30
2 40
3 8
4 20 Fuente: Lorraine Dugoff, Mauritha R. Everett,
5 26 Louis Vontver y Gwyn E. Barley, “Evaluación de
6 35 las habilidades de examen pélvico y mamario
7 35 de los internos en
8 20 Obstetricia y Ginecología y Medicina
9 25 Interna”,Revista americana de
obstetricia y ginecología, 189 (2003),
10 20
655–658.
6.4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 177

Construya un intervalo de confianza del 95 por ciento para la media de la población de la que se puede
suponer que se han extraído los sujetos del estudio.

6.4 INTERVALO DE CONFIANZA PARA LA


DIFERENCIA ENTRE DOS MEDIAS
POBLACIONALES

A veces surgen casos en los que nos interesa estimar la diferencia entre dos medias
poblacionales. De cada una de las poblaciones se extrae una muestra aleatoria independiente y,
a partir de los datos de cada una, las medias muestrales -X1y -X2, respectivamente, se calculan.
Aprendimos en el capítulo anterior que el estimador -X1- -X2produce una estimación no sesgada
demetro-1-metro2, la- diferencia entre las medias de la población. La varianza de la
estimador ess21=n1þs2 2=n2. También sabemos por el Capítulo 5 que, dependiendo de la
condiciones, la distribución de muestreo de -X1- -X2puede tener, al menos, una distribución
aproximadamente normal, de modo que en muchos casos hacemos uso de la teoría relevante para las
distribuciones normales para calcular un intervalo de confianza parametro1-metro2. Cuando se conocen las
varianzas de la población, el 100d1 -aÞintervalo de confianza porcentual parametro1-metro2es dado por

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

s21 s 22
d-X1- -X2Þ -z1-un =2 norte1 þ (6.4.1)
norte2

Un examen de un intervalo de confianza para la diferencia entre las medias poblacionales


proporciona información útil para decidir si es probable o no que las dos medias poblacionales
sean iguales. Cuando el intervalo construido no incluye cero, decimos que el intervalo
proporciona evidencia de que las medias de las dos poblaciones no son iguales. Cuando el
intervalo incluye cero, decimos que las medias de la población pueden ser iguales.
Ilustremos un caso donde el muestreo es de las distribuciones normales.

EJEMPLO 6.4.1
Un equipo de investigación está interesado en la diferencia entre los niveles de ácido úrico en suero
en pacientes con y sin síndrome de Down. En un gran hospital para el tratamiento de personas con
problemas mentales, una muestra de 12 personas con síndrome de Down arrojó una media de
- X1¼4:5mg=100ml. En un hospital general se encontró que una muestra de 15 individuos normales de
la misma edad y sexo tenía un valor medio de -X2¼3:4. Si es razonable suponer que las dos
poblaciones de valores se distribuyen normalmente con varianzas iguales a 1 y 1.5, encuentre el
intervalo de confianza del 95 por ciento parametro1-metro2.

Solución: Para una estimación puntual demetro1-metro2, usamos -X1- -X2¼4:5 - 3:4¼1:1. El
coeficiente de confiabilidad correspondiente a .95 se encuentra en la Tabla D del
Apéndice como 1.96. El error estándar es
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

s21 s2 1 1:5
s-X1--X2 ¼ þ 2¼ þ ¼ :4282
norte1 norte2 12 15
178 CAPÍTULO 6 ESTIMACIÓN

Entonces, el intervalo de confianza del 95 por ciento es

1:1 - 1:96d:4282Þ
1:1 - :84
d:26; 1:94Þ

Decimos que estamos 95 por ciento seguros de que la verdadera


diferencia, metro1-metro2, está entre 0,26 y 1,94 porque, en un muestreo
repetido, el 95 por ciento de los intervalos construidos de esta manera incluiría la
diferencia entre las medias verdaderas.
Como el intervalo no incluye el cero, concluimos que las medias de las dos
poblaciones no son iguales. &

Muestreo de poblaciones no normalesLa construcción de una confi-


intervalo de confianza para la diferencia entre dos medias de población cuando el muestreo es de
poblaciones no normales procede de la misma manera que en el ejemplo 6.4.1 si los tamaños de muestra
norte1ynorte2son grandes. Nuevamente, esto es un resultado del teorema del límite central. Si se desconocen
las varianzas de la población, usamos las varianzas de la muestra para estimarlas.

EJEMPLO 6.4.2
A pesar del conocimiento común de los efectos adversos de hacerlo, muchas mujeres continúan
fumando durante el embarazo. Mayhew et al. (A-6) examinó la efectividad de un programa para
dejar de fumar para mujeres embarazadas. La media de cigarrillos fumados diariamente al
cierre del programa por las 328 mujeres que completaron el programa fue de 4,3 con una
desviación estándar de 5,22. Entre 64 mujeres que no completaron el programa, la media de
cigarrillos fumados por día al final del programa fue de 13 con una desviación estándar de 8,97.
Deseamos construir un intervalo de confianza del 99 por ciento para la diferencia entre las
medias de las poblaciones de las que se supone que se seleccionaron las muestras.

Solución: No se da información sobre la forma de la distribución de cigarrillos fumados por día.


Sin embargo, dado que nuestros tamaños de muestra son grandes, el teorema del
límite central nos asegura que la distribución muestral de la diferencia entre las
medias muestrales tendrá una distribución aproximadamente normal incluso si la
distribución de la variable en las poblaciones no tiene una distribución normal.
Podemos usar este hecho como justificación para usar elzestadístico como el factor de
confiabilidad en la construcción de nuestro intervalo de confianza. Además, dado que
no se dan las desviaciones estándar de la población, usaremos las desviaciones
estándar de la muestra para estimarlas. La estimación puntual de la diferencia entre
las medias de la población es la diferencia entre las medias de la muestra, 4:3 - 13:0¼
- 8:7. En la Tabla D del Apéndice encontramos que el factor de confiabilidad es 2.58. El
error estándar estimado es
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

5:222 8:972
s-X1--X2¼ þ ¼1:1577
328 64
6.4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 179

Por la Ecuación 6.4.1, nuestro intervalo de confianza del 99 por ciento para la diferencia entre
las medias de la población es

- 8:7 - 2:58d1:1577Þ
ð-11:7; -5:7Þ
Estamos seguros en un 99 por ciento de que la media de cigarrillos que fuman al
día las mujeres que completan el programa es entre 5,7 y 11,7 más baja que la
media de las mujeres que no completan el programa. &

EltDistribución y la diferencia entre mediasCuando


las varianzas poblacionales son desconocidas, y deseamos estimar la diferencia entre dos medias
poblacionales con un intervalo de confianza, podemos usar eltdistribución como fuente del factor de
confiabilidad si se cumplen ciertos supuestos. Debemos saber, o estar dispuestos a asumir, que las
dos poblaciones muestreadas se distribuyen normalmente. Con respecto a las varianzas
poblacionales, distinguimos entre dos situaciones: (1) la situación en la que las varianzas
poblacionales son iguales y (2) la situación en la que no son iguales. Consideremos cada situación por
separado.

Población Varianzas IgualesSi se justifica la suposición de varianzas poblacionales iguales, las dos
varianzas muestrales que calculamos a partir de nuestras dos muestras independientes pueden
considerarse estimaciones de la misma cantidad, la varianza común. Parece lógico, entonces, que de
alguna manera deberíamos capitalizar esto en nuestro análisis. Hacemos precisamente eso y
obtenemos unestimación agrupadade la varianza común. Esta estimación combinada se obtiene
calculando el promedio ponderado de las dos varianzas de la muestra. Cada varianza muestral se
pondera por sus grados de libertad. Si los tamaños de muestra son iguales, este promedio ponderado
es la media aritmética de las dos varianzas de muestra. Si los dos tamaños de muestra son diferentes,
el promedio ponderado aprovecha la información adicional proporcionada por la muestra más
grande. La estimación agrupada viene dada por la fórmula

dnorte1- 1Þs12þ ðnorte2- 1Þs22


2 ¼
spag (6.4.2)
norte1þnorte2- 2

Entonces, el error estándar de la estimación viene dado por


sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

spag
2 s2pag
s-X1--X2¼ þ (6.4.3)
norte1 norte2

y los 100d1 -aÞintervalo de confianza porcentual parametro1-metro2es dado por


sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

spag
2 spag
2
d-X1- -X2Þ -td1-un =2Þ norte1 þ (6.4.4)
norte2

El número de grados de libertad utilizados para determinar el valor deta utilizar en la construcción del
intervalo esnorte1þnorte2- 2, el denominador de la Ecuación 6.4.2. Interpretamos este intervalo de la
manera habitual.
Los métodos que se pueden usar para llegar a una decisión sobre la igualdad de las varianzas
de la población se analizan en las Secciones 6.10 y 7.8.
180 CAPÍTULO 6 ESTIMACIÓN

EJEMPLO 6.4.3
El propósito de un estudio de Granholm et al. (A-7) fue determinar la efectividad de un
programa integrado de tratamiento ambulatorio de diagnóstico dual para sujetos con
enfermedades mentales. Los autores estaban abordando el problema del abuso de
sustancias entre las personas con trastornos mentales graves. Se realizó una revisión
retrospectiva de las historias clínicas de 50 referencias consecutivas de pacientes al
programa de Abuso de Sustancias/Enfermedad Mental en el Sistema de Atención Médica
de VA San Diego. Una de las variables de resultado examinadas fue el número de días de
tratamiento hospitalario por trastorno psiquiátrico durante el año siguiente a la
finalización del programa. Entre 18 sujetos con esquizofrenia, el número medio de días de
tratamiento fue de 4,7 con una desviación estándar de 9,3. Para 10 sujetos con trastorno
bipolar, el número medio de días de tratamiento del trastorno psiquiátrico fue de 8,8 con
una desviación estándar de 11,5.

Solución: Primero usamos la Ecuación 6.4.2 para calcular la estimación agrupada de la varianza común
de la población.

-
d18 - 1Þ9:32þ ð10 - 1Þð11:5Þ2
2 ¼
spag ¼102:33
18þ10 - 2

Cuando ingresamos la Tabla E del Apéndice con 18þ10 - 2¼26 grados de libertad y un nivel
de confianza deseado de .95, encontramos que el factor de confiabilidad es 2.0555. Por la
Expresión 6.4.4 calculamos el intervalo de confianza del 95 por ciento para la diferencia entre
las medias de la población de la siguiente manera:

rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

102:33 102:33
d4:7 - 8:8Þ -2:0555 þ
18 10
- 4:1 - 8:20
d-12.3, 4.1Þ

Estamos seguros en un 95 por ciento de que la diferencia entre las medias de la


población se encuentra entre -12:3 y 4,10. Podemos decir esto porque sabemos que si
tuviéramos que repetir el estudio muchas, muchas veces y calcular los intervalos de
confianza de la misma manera, alrededor del 95 por ciento de los intervalos incluiría la
diferencia entre las medias de la población.
Dado que el intervalo incluye cero, concluimos que las medias de la población pueden
ser iguales. &

Las varianzas de la población no son igualesCuando no se puede concluir que las varianzas de
dos poblaciones de interés son iguales, aunque se suponga que las dos poblaciones están
normalmente distribuidas, no es adecuado utilizar eltdistribución como se acaba de esbozar en la
construcción de intervalos de confianza.
Como regla práctica en problemas aplicados, se puede desear asumir la desigualdad de
varianzas si la relación entre la varianza mayor y la menor excede de 2; sin embargo, en la Sección
6.10 se describe una prueba más formal.
6.4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 181

Una solución al problema de las varianzas desiguales fue propuesta por Behrens (3) y
posteriormente verificada y generalizada por Fisher (4,5). Las soluciones también han sido
propuestas por Neyman (6), Scheff-e (7,8) y Welch (9,10). El problema es discutido en detalle por
Cochran (11).
El problema gira en torno al hecho de que la cantidad

d-X1- -X2Þ - ðmetro 2Þ


sffi ffiffiffi
ffi ffi ffiffiffi
ffi ffi ffi ffi -metro
ffi1ffi

s2 spag
2
pagþ
norte1 norte2

no sigue untdistribución connorte1þnorte2- 2 grados de libertad cuando las varianzas poblacionales


no son iguales. En consecuencia, eltLa distribución no se puede utilizar de la forma habitual para
obtener el factor de fiabilidad del intervalo de confianza de la diferencia entre las medias de dos
poblaciones que tienen varianzas desiguales. La solución propuesta por Cochran consiste
de calcular el factor de confiabilidad,t0 1-un =2, por la siguiente fórmula:

w1t1þw2t2
t1-un
0 =2¼ (6.4.5)
w1þw2

dóndew1¼s12=n1;w2¼s2 2=n2;t1¼t1-un =2paranorte1- 1 grados de libertad, yt2¼t1-un =2


paranorte2- 1 grados de libertad. Un aproximado de 100d1 -aÞintervalo de confianza porcentual para metro1-
metro2es dado por

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

s12 s22
d-X1- -X2Þ -t0d1-un =2Þ þ (6.4.6)
norte1 norte2

También se pueden hacer ajustes al coeficiente de confiabilidad reduciendo el número de grados de


libertad en lugar de modificarten la forma que acabamos de demostrar. Muchos programas de
computadora calculan un coeficiente de confiabilidad ajustado de esta manera.

EJEMPLO 6.4.4
Reexaminemos los datos presentados en el Ejemplo 6.4.3 del estudio de Granholm et al. (A-7).
Recuerde que entre los 18 sujetos con esquizofrenia, el número medio de días de tratamiento fue de
4,7 con una desviación estándar de 9,3. En el grupo de tratamiento del trastorno bipolar de 10 sujetos,
el número medio de días de tratamiento del trastorno psiquiátrico fue de 8,8 con una desviación
estándar de 11,5. Suponemos que las dos poblaciones de número de días de trastorno psiquiátrico se
distribuyen aproximadamente normalmente. Ahora supongamos, sin embargo, que las dos varianzas
de población no son iguales. Deseamos construir un intervalo de confianza del 95 por ciento para la
diferencia entre las medias de las dos poblaciones representadas por las muestras.

Solución: Usaremost0como se encuentra en la Ecuación 6.4.5 para el factor de confiabilidad. La


referencia a la Tabla E del Apéndice muestra que con 17 grados de libertad y 1 - :05=2
¼ :975;t1¼2:1098. Del mismo modo, con 9 grados de libertad y
182 CAPÍTULO 6 ESTIMACION

Población
Sí normalmente No
¿repartido?

Muestra Muestra
Sí tamaños No Sí tamaños No
¿grande? ¿grande?

Población Población Población Población


Sí variaciones No Sí variaciones No Sí variaciones No Sí variaciones No
¿conocido? ¿conocido? ¿conocido? ¿conocido?

Sí =? No Sí =? No Sí =? No Sí =? No Sí =? No Sí =? No Sí =? No Sí =? No

z z t t' z z t t' z z z t' * * * *

o o Se aplica el teorema del límite central

z z

FIGURA 6.4.1Diagrama de flujo para usar al decidir si el factor de confiabilidad debe serz, t,ot0
al hacer inferencias sobre la diferencia entre las medias de dos poblaciones. (Utilice un
procedimiento no paramétrico. Consulte el Capítulo 13).

1 - :05=2¼ :975;t2¼2:2622. ahora calculamos


- -
9:32=18d2:1098Þ þ 11:52=10d2:2622Þ
t 0¼ - - ¼2:2216
9:32=18þ 11:52=10

Mediante la Expresión 6.4.6 ahora construimos el intervalo de confianza del 95 por ciento
para la diferencia entre las dos medias de población.
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

9:32 11:52
d4:7 - 8:8Þ -2:2216 þ
18 10
d4:7 - 8:8Þ -2:2216d4:246175Þ
- 13:5; 5:3

Dado que el intervalo incluye cero, concluimos que las dos medias poblacionales
pueden ser iguales.
En la figura 6.4.2 se proporciona un ejemplo de este tipo de cálculo
utilizando el programa R, que utiliza la aproximación de Welch al problema de las
varianzas desiguales. Observe que hay una ligera diferencia en los extremos del
intervalo. &

Cuando se construye un intervalo de confianza para la diferencia entre dos medias de


población, se puede usar la Figura 6.4.1 para decidir rápidamente si el factor de confiabilidad debe ser
z, t,ot0.
Traducido del inglés al español - www.onlinedoctranslator.com

EJERCICIOS 183

Código R :
> tsum.test(media.x¼4.7, sx¼9.3, nx¼18, media.y¼8.8, sí¼11.5, Nueva York¼10, alternativa¼
“dos.lados”, mu¼0, var.igual¼FALSO, nivel conf.¼0,95)

RSalida :
Prueba t de dos muestras modificada de Welch

datos: x e y resumidos
t¼-0.9656, gl¼15.635, valor p¼0.349
hipótesis alternativa: la verdadera diferencia de medias no es igual a 0

Intervalo de confianza del 95 por ciento:


- 13.118585 4.918585
estimaciones de muestra:

media de x media de y
4.7 8.8

FIGURA 6.4.2Programe el cálculo de ejemplo R para el intervalo de confianza entre dos medias suponiendo
varianzas desiguales utilizando los datos del Ejemplo 6.4.4.

EJERCICIOS

Para cada uno de los siguientes ejercicios, construya intervalos de confianza de 90, 95 y 99 por ciento para la
diferencia entre las medias de las poblaciones. En su caso, establezca los supuestos que hacen que su
método sea válido. Indique las interpretaciones prácticas y probabilísticas de cada intervalo que construya.
Considere las variables bajo consideración en cada ejercicio y establezca qué uso cree que los investigadores
podrían hacer de sus resultados.
6.4.1.Iannelo et al. (A-8) realizó un estudio que examinó las concentraciones de ácidos grasos libres en 18 sujetos delgados y 11
sujetos obesos. Los sujetos delgados tenían un nivel medio de 299metroEq/L con un error estándar de la media de
30, mientras que los sujetos obesos tenían una media de 744metroEq/L con un error estándar de la media de 62.

6.4.2.Chan et al. (A-9) desarrolló un cuestionario para evaluar el conocimiento del cáncer de próstata. Hubo un total de 36 preguntas a las
que los encuestados podían responder "de acuerdo", "en desacuerdo" o "no sé". Las puntuaciones pueden oscilar entre 0 y 36.
Las puntuaciones medias de los participantes caucásicos del estudio fueron 20,6 con una desviación estándar
de 5,8, mientras que la puntuación media de los hombres afroamericanos fue de 17,4 con una desviación estándar de
5,8. El número de participantes caucásicos en el estudio fue de 185 y el número de afroamericanos fue de 86.

6.4.3.Los objetivos de un estudio de van Vollenhoven et al. (A-10) fueron para examinar la eficacia de etanercept solo y
etanercept en combinación con metotrexato en el tratamiento de la artritis reumatoide. Los investigadores realizaron
un estudio retrospectivo utilizando datos de la base de datos STURE, que recopila datos de eficacia y seguridad para
todos los pacientes que inician tratamientos biológicos en los principales hospitales de Estocolmo, Suecia. Los
investigadores identificaron a 40 sujetos a los que se les recetó etanercept solo ya 57 sujetos a los que se les
administró etanercept con metotrexato. Utilizando una escala analógica visual de 100 mm (cuanto mayor sea el valor,
mayor será el dolor), los investigadores encontraron que después de 3 meses
de tratamiento, la puntuación media del dolor fue de 36,4 con un error estándar de la media de 5,5 para los sujetos que
tomaban solo etanercept. En la muestra que recibió etanercept más metotrexato, la puntuación media fue de 30,5 con un error
estándar de la media de 4,6.

6.4.4.El propósito de un estudio de Nozawa et al. (A-11) fue determinar la efectividad de la fijación segmentaria con
alambre en atletas con espondilólisis. Entre 1993 y 2000, 20 atletas (6 mujeres y 14 hombres)
184 CAPÍTULO 6 ESTIMACIÓN

con espondilólisis lumbar fueron tratados quirúrgicamente con la técnica. La siguiente tabla proporciona el puntaje
de evaluación de la Asociación Ortopédica Japonesa (JOA) para el síndrome de dolor lumbar para hombres y mujeres
antes de la cirugía. La puntuación más baja indica menos dolor.

Género Puntuaciones JOA

Femenino 14, 13, 24, 21, 20, 21


Masculino 21, 26, 24, 24, 22, 23, 18, 24, 13, 22, 25, 23, 21, 25
Fuente: Satoshi Nozawa, Katsuji Shimizu, Kei Miyamoto y Mizuo Tanaka,
"Reparación del defecto pars interarticularis mediante fijación segmentaria con
alambre en atletas jóvenes con espondilolisis".Revista americana de medicina
deportiva, 31 (2003), 359–364.

6.4.5.Krantz et al. (A-12) investigó los efectos relacionados con la dosis de metadona en sujetos con torsade de
pointes, una taquicardia ventricular polimórfica. En el estudio de 17 sujetos, nueve estaban siendo tratados
con metadona por dependencia de opiáceos y ocho por dolor crónico. La dosis media diaria de metadona en
el grupo de dependencia de opiáceos fue de 541 mg/día con una desviación estándar de 156, mientras que el
grupo de dolor crónico recibió una dosis media de 269 mg/día con una desviación estándar de 316.

6.4.6.Las mediciones del diámetro transversal en los corazones de machos y hembras adultos dieron los siguientes resultados:

Grupo Tamaño de la muestra X


- (cm) s (cm)

machos 12 13.21 1.05


Hembras 9 11.00 1.01

Suponga poblaciones normalmente distribuidas con varianzas iguales.

6.4.7.Veinticuatro animales de experimentación con deficiencia de vitamina D se dividieron por igual en dos grupos. El grupo 1
recibió tratamiento consistente en una dieta que aportaba vitamina D. El segundo grupo no recibió tratamiento. Al
finalizar el período experimental se realizaron determinaciones de calcio sérico con los siguientes resultados:

Grupo tratado: - X¼11:1 mg = 100 ml;s¼1:5


Grupo no tratado: - X¼7:8 mg = 100 ml;s¼2:0

Suponga poblaciones normalmente distribuidas con varianzas iguales.

6.4.8.A dos grupos de niños se les realizaron pruebas de agudeza visual. El grupo 1 estuvo compuesto por 11 niños que reciben
su atención médica de médicos privados. El puntaje promedio para este grupo fue 26 con una desviación estándar de
5. El grupo 2 estaba compuesto por 14 niños que reciben atención médica del departamento de salud y tuvo un
puntaje promedio de 21 con una desviación estándar de 6. Suponga poblaciones distribuidas normalmente con
varianzas iguales.

6.4.9.La estancia media de una muestra de 20 pacientes dados de alta de un hospital general fue de 7 días con una
desviación estándar de 2 días. Una muestra de 24 pacientes dados de alta de un hospital de enfermedades
crónicas tuvo una estadía promedio de 36 días con una desviación estándar de 10 días. Suponga poblaciones
normalmente distribuidas con varianzas desiguales.

6.4.10.En un estudio de los factores que se cree que son responsables de los efectos adversos del tabaquismo en los humanos
reproducción, se realizaron determinaciones del nivel de cadmio (nanogramos por gramo) en tejido de placenta de un
6.5 INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN DE LA POBLACIÓN 185

muestra de 14 madres fumadoras y una muestra aleatoria independiente de 18 madres no fumadoras. Los
resultados fueron los siguientes:

No fumadores: 10,0, 8,4, 12,8, 25,0, 11,8, 9,8, 12,5, 15,4, 23,5,
9.4, 25.1, 19.5, 25.5, 9.8, 7.5, 11.8, 12.2, 15.0

fumadores: 30.0, 30.1, 15.0, 24.1, 30.5, 17.8, 16.8, 14.8,


13.4, 28.5, 17.5, 14.4, 12.5, 20.4

¿Parece probable que el nivel medio de cadmio sea mayor entre los fumadores que entre los no fumadores? ¿Por qué
llegas a esta conclusión?

6.5 INTERVALO DE CONFIANZA PARA UNA


PROPORCIÓN DE LA POBLACIÓN

Muchas preguntas de interés para el trabajador de la salud se relacionan con las proporciones de la
población. ¿Qué proporción de pacientes que reciben un tipo particular de tratamiento se recupera? ¿Qué
proporción de una población tiene cierta enfermedad? ¿Qué proporción de una población es inmune a una
determinada enfermedad?
Para estimar una proporción poblacional se procede de la misma manera que para
estimar una media poblacional. Se extrae una muestra de la población de interés y se calcula la
proporción muestral, p̂. Esta proporción muestral se utiliza como estimador puntual de la
proporción poblacional. Un intervalo de confianza se obtiene mediante la fórmula general

estimador -dcoeficiente de fiabilidadÞ ðerror estándar del estimadorÞ

En el capítulo anterior vimos que cuando ambosnotario públicoynorted1 -pagÞson mayores que 5,
podemos considerar que la distribución muestral de p̂ está bastante cerca de la distribución normal.
Cuando se cumple esta condición, nuestro coeficiente de confiabilidad es un valor dezdel estándar
ufffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff

distribución normal. El error estándar, como hemos visto, es igual aspag¼pagd1 -pagÞ=norte.
Desdepag,el parámetro que estamos tratando de estimar es desconocido, debemos usar p̂ como una estimación.
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff

Así, estimamosspagpor pagd1 - p̂Þ=norte,y nuestro 100d1 -aÞintervalo de confianza porcentual


parapages dado por
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff

p - z1-un =2 pagd1 - p̂Þ=norte (6.5.1)

Damos a este intervalo tanto la interpretación probabilística como la práctica.

EJEMPLO 6.5.1
El Pew Internet and American Life Project (A-13) informó en 2003 que el 18 por ciento de los usuarios
de Internet lo han utilizado para buscar información sobre tratamientos o medicamentos
experimentales. La muestra estuvo compuesta por 1220 usuarios adultos de Internet, y la información
se recopiló a través de entrevistas telefónicas. Deseamos construir un intervalo de confianza del 95
por ciento para la proporción de usuarios de Internet en la población muestreada que han buscado
información sobre tratamientos o medicamentos experimentales.
186 CAPÍTULO 6 ESTIMACIÓN

Solución: Supondremos que los 1220 sujetos fueron muestreados de forma aleatoria. La
mejor estimación puntual de la proporción de la población es p̂¼ :18. El tamaño
de la muestra y nuestra estimación depagson de suficiente magnitud para
justificar el uso de la distribución normal estándar en la construcción de un
intervalo de confianza. El coeficiente de fiabilidad correspondiente a una confi-
nivel de dencia de .95 es 1.96, y nuestra estimación del error estándarspages
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff

p̂ð1 - p̂Þ=norte¼ d:18Þð:82Þ=1220¼ :0110. El 95 por ciento de confianza


intervalo parapag,en base a estos datos, es

:18 - 1:96d:0110Þ
:18 - :022
:158; :202
Estamos 95 por ciento seguros de que la proporción de la poblaciónpagestá entre .158 y .202
porque, en muestreo repetido, alrededor del 95 por ciento de los intervalos construidos de la
misma manera que el presente intervalo único incluiría el verdadero
pag.Sobre la base de estos resultados, esperaríamos, con un 95 por ciento de confianza, encontrar
que entre el 15,8 y el 20,2 por ciento de los usuarios adultos de Internet lo hayan utilizado para
obtener información sobre medicamentos o tratamientos experimentales. &

EJERCICIOS

Para cada uno de los siguientes ejercicios, indique las interpretaciones prácticas y probabilísticas del intervalo que
construya. Identifique cada componente del intervalo: estimación puntual, coeficiente de confiabilidad y error
estándar. Explique por qué los coeficientes de confiabilidad no son los mismos para todos los ejercicios.

6.5.1.Luna et al. (A-14) estudiaron pacientes ventilados mecánicamente en la unidad de cuidados intensivos de seis hospitales
de Buenos Aires, Argentina. Los investigadores encontraron que de 472 pacientes ventilados mecánicamente, 63
tenían evidencia clínica de neumonía asociada al ventilador (NAV). Construya un intervalo de confianza del 95 por
ciento para la proporción de todos los pacientes con ventilación mecánica en estos hospitales que se espera que
desarrollen VAP.

6.5.2.Ondas Q en el electrocardiograma, según Schinkel et al. (A-15), a menudo se considera que reflejan un miocardio
con cicatrices irreversibles. Sin embargo, estos investigadores afirman que hay algunos indicios de que
puede haber tejido viable residual en las regiones con infarto de ondas Q. Su estudio de 150 pacientes con
infarto de onda Q electrocardiográfico crónico encontró 202 regiones de onda Q disfuncionales.
Con la ecocardiografía de estrés con dobutamina (DSE), notaron que 118 de estas 202 regiones eran viables con la
información de la prueba DSE. Construya un intervalo de confianza del 90 por ciento para la proporción de regiones
viables que cabría esperar encontrar en una población de regiones de ondas Q disfuncionales.

6.5.3.En un estudio de von zur Muhlen et al. (A-16), se estudiaron 136 sujetos con síncope o casi síncope. El síncope es la
pérdida temporal de la conciencia debido a una disminución repentina del flujo sanguíneo al cerebro. De estos
sujetos, 75 también reportaron tener enfermedad cardiovascular. Construya un intervalo de confianza del 99 por
ciento para la proporción poblacional de sujetos con síncope o casi síncope que también tienen enfermedad
cardiovascular.

6.5.4.En una muestra aleatoria simple de 125 varones desempleados y desertores de la escuela secundaria entre 16 y 21 años
inclusive, 88 manifestaron ser consumidores habituales de bebidas alcohólicas. Construya un intervalo de confianza
del 95 por ciento para la proporción de la población.
6.6 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES 187

6.6 INTERVALO DE CONFIANZA PARA LA


DIFERENCIA ENTRE DOS
PROPORCIONES POBLACIONALES

La magnitud de la diferencia entre dos proporciones de población suele ser de interés. Podemos querer
comparar, por ejemplo, hombres y mujeres, dos grupos de edad, dos grupos socioeconómicos o dos grupos
de diagnóstico con respecto a la proporción que posee alguna característica de interés. Un estimador puntual
no sesgado de la diferencia entre dos proporciones poblacionales es proporcionado por la diferencia entre
proporciones muestrales, p̂1- pag2. Como hemos visto, cuandonorte1ynorte2son grandes y las proporciones
de la población no están demasiado cerca de 0 o 1, se aplica el teorema del límite central y se puede emplear
la teoría de la distribución normal para obtener intervalos de confianza. El error estándar de la estimación
por lo general debe ser estimado por
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

pag1d1 - p̂1Þ pagd1


2 - pag^2Þ
s^pag1-pag2 ¼ þ
norte1 norte2

porque, por regla general, las proporciones de la población son desconocidas. un 100d1 -aÞpor ciento
intervalo de confianza parapag1-pag2es dado por
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

pag1d1 - p̂1Þ pagd1


2 - pag^2Þ
ðp̂1- pag2Þ -z1-un =2 þ (6.6.1)
norte1 norte2

Podemos interpretar este intervalo tanto desde el punto de vista probabilístico como práctico.

EJEMPLO 6.6.1
Connor et al. (A-17) investigó las diferencias de género en la agresión proactiva y reactiva en una
muestra de 323 niños y adolescentes (68 mujeres y 255 hombres). Los sujetos procedían de
remisiones consecutivas no solicitadas a un centro de tratamiento residencial y una clínica de
psicofarmacología pediátrica que atiende a un hospital terciario y una facultad de medicina. En la
muestra, 31 de las mujeres y 53 de los hombres denunciaron abuso sexual. Deseamos construir un
intervalo de confianza del 99 por ciento para la diferencia entre las proporciones de abuso sexual en
las dos poblaciones muestreadas.

Solución: Las proporciones muestrales para mujeres y hombres son, respectivamente, p̂F¼
31=68¼ :4559 y p̂METRO¼53=255¼ :2078. La diferencia entre las proporciones de la
muestra es p̂F- pagMETRO¼ :4559 - :2078¼ :2481. El estándar estimado
error de la diferencia entre las proporciones de la muestra es
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

d:4559Þð:5441Þ d:2078Þð:7922Þ
spagF-pag¼ þ
METRO
68 255
¼ :0655

El factor de confiabilidad de la Tabla D del Apéndice es 2.58, por lo que nuestro intervalo de
confianza, por la Expresión 6.6.1, es

:2481 - 2:58d:0655Þ
:0791; :4171
188 CAPÍTULO 6 ESTIMACIÓN

Estamos 99 por ciento seguros de que para las poblaciones muestreadas, la


proporción de casos de abuso sexual denunciado entre mujeres supera la proporción
de casos de abuso sexual denunciado entre hombres en algún lugar entre .0791 y
.4171.
Como el intervalo no incluye el cero, concluimos que las dos
proporciones de población no son iguales. &

EJERCICIOS

Para cada uno de los siguientes ejercicios, indique las interpretaciones prácticas y probabilísticas del intervalo que
construya. Identifique cada componente del intervalo: estimación puntual, coeficiente de confiabilidad y error
estándar. Explique por qué los coeficientes de confiabilidad no son los mismos para todos los ejercicios.

6.6.1.Horwitz et al. (A-18) estudió a 637 personas que fueron identificadas por registros judiciales de 1967 a 1971 por
haber sufrido abuso o negligencia. Para un grupo de control, ubicaron a 510 sujetos que de niños asistieron
a la misma escuela primaria y vivían dentro de un radio de cinco cuadras de aquellos en el grupo abusado/
abandonado. En el grupo abusado/abandonado y el grupo de control, 114 y 57 sujetos, respectivamente,
habían desarrollado trastornos de personalidad antisocial a lo largo de sus vidas. Construya un intervalo de
confianza del 95 por ciento para la diferencia entre las proporciones de sujetos que desarrollan trastornos
antisociales de la personalidad que cabría esperar encontrar en las poblaciones de sujetos de las que se
supone que proceden los sujetos de este estudio.

6.6.2.El objetivo de un ensayo controlado aleatorio de Adab et al. (A-19) fue determinar si proporcionar a las mujeres
información adicional sobre las ventajas y desventajas de la detección del cáncer de cuello uterino aumentaría su
disposición a hacerse la prueba. Un grupo de tratamiento de 138 mujeres recibió un folleto sobre la detección que
contenía más información (riesgo individual promedio de cáncer de cuello uterino, probabilidad de resultado positivo,
la posibilidad de resultados falsos positivos/negativos, etc.) que el folleto estándar desarrollado por el Servicio Nacional de
Salud Británico que recibieron 136 mujeres en un grupo de control. En el grupo de tratamiento, 109 mujeres indicaron que
querían hacerse la prueba de detección del cáncer de cuello uterino, mientras que en el grupo de control, 120 indicaron que
querían hacerse la prueba de detección. Construya un intervalo de confianza del 95 por ciento para la diferencia de
proporciones de las dos poblaciones representadas por estas muestras.

6.6.3.Spetus et al. (A-20) realizó un estudio aleatorizado simple ciego para sujetos con enfermedad arterial coronaria estable.
Asignaron al azar a los sujetos en dos grupos de tratamiento. Al primer grupo se le optimizaron los medicamentos
actuales para la angina, y al segundo grupo se le redujeron los medicamentos existentes y luego comenzó con
diltiazem de acción prolongada a 180 mg/día. Los investigadores realizaron varias pruebas para determinar
si hubo diferencias significativas en los dos grupos de tratamiento al inicio del estudio. Una de las características de
interés fue la diferencia en los porcentajes de sujetos que habían informado antecedentes de insuficiencia cardíaca
congestiva. En el grupo en el que se optimizaron los medicamentos actuales, 16 de 49 sujetos informaron
antecedentes de insuficiencia cardíaca congestiva. En los sujetos que recibieron diltiazem, 12 de los 51 sujetos
informaron antecedentes de insuficiencia cardíaca congestiva. Indique las suposiciones que considere necesarias y
construya un intervalo de confianza del 95 por ciento para la diferencia entre las proporciones de quienes informaron
insuficiencia cardíaca congestiva dentro de las dos poblaciones de las que suponemos que se seleccionaron estos
grupos de tratamiento.

6.6.4.Estudiar la diferencia en la adherencia al tratamiento farmacológico entre sujetos con depresión que recibieron tratamiento habitual.
atención y los que recibieron atención en un modelo de atención colaborativa fue el objetivo de un estudio realizado por Finley
et al. (A-21). El modelo de atención colaborativa enfatizó el papel de los farmacéuticos clínicos en la gestión de la
farmacoterapia y el seguimiento del tratamiento. De los 50 sujetos que recibieron atención habitual, 24 se adhirieron al
régimen de medicamentos prescritos, mientras que 50 de 75 sujetos en el modelo de atención colaborativa
6.7 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA LA ESTIMACIÓN DE LOS MEDIOS 189

adherido al régimen farmacológico. Construya un intervalo de confianza del 90 por ciento para la diferencia en las
proporciones de adherencia para las poblaciones de sujetos representados por estas dos muestras.

6.7 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA


LA ESTIMACIÓN DE LOS MEDIOS

La cuestión de qué tamaño de muestra tomar surge al principio de la planificación de cualquier encuesta o
experimento. Esta es una pregunta importante que no debe tomarse a la ligera. Tomar una muestra más
grande de la que se necesita para lograr los resultados deseados es un desperdicio de recursos, mientras
que muestras muy pequeñas a menudo conducen a resultados que no tienen ningún uso práctico.
Consideremos, entonces, cómo se puede proceder para determinar el tamaño de la muestra que se necesita
en una situación dada. En esta sección presentamos un método para determinar el tamaño muestral
requerido para estimar una media poblacional, y en la siguiente sección aplicamos este método al caso de
determinación del tamaño muestral cuando el parámetro a estimar es una proporción poblacional. Mediante
ampliaciones sencillas de estos métodos, se pueden determinar los tamaños de muestra necesarios para
situaciones más complicadas.

ObjetivosLos objetivos en la estimación de intervalos son obtener intervalos estrechos con alta
confiabilidad. Si observamos los componentes de un intervalo de confianza, vemos que el ancho del
intervalo está determinado por la magnitud de la cantidad

dcoeficiente de fiabilidadÞ ðerror estándar del estimadorÞ

ya que el ancho total del intervalo es el doble de esta cantidad. Hemos aprendido que esta cantidad
suele denominarse precisión de la estimación o margen de error. Para un error estándar dado,
aumentar la confiabilidad significa un mayor coeficiente de confiabilidad. Pero un coeficiente de
confiabilidad mayor para un error estándar fijo genera un intervalo más amplio.
Por otro lado, si fijamos el coeficiente de confiabilidad, la única forma de reducir el anchopag
thffiffiffi del intervalo es reducir el error estándar. Como el error estándar es igual a s=norte;y desdes
es una constante, la única forma de obtener un error estándar pequeño es tomar una muestra
grande. ¿Qué tan grande es una muestra? Eso depende del tamaño des,la desviación estándar de la
población, el grado deseado de confiabilidad y el ancho del intervalo deseado.
Supongamos que queremos un intervalo que se extiendadunidades a cada lado del estimador.
Podemos escribir

d¼ ðcoeficiente de fiabilidadÞ ðerror estándar del estimadorÞ (6.7.1)

Si el muestreo va a ser con reemplazo, de una población infinita, o de una población lo


suficientemente grande como para justificar que ignoremos la corrección de la población finita, la
Ecuación 6.7.1 se convierte en
s
d¼zpffiffiffi (6.7.2)
norte

que, una vez resueltonorte,da

z2s2
norte¼ (6.7.3)
d2
190 CAPÍTULO 6 ESTIMACIÓN

Cuando el muestreo es sin reemplazo de una población finita pequeña, se requiere la corrección de
población finita y la Ecuación 6.7.1 se convierte en

rffiffiffiffiffiffiffiffiffiffiffiffiffi

s n-n
d¼zpffiffiffi (6.7.4)
norte norte-1

que, una vez resueltonorte,da

Nueva Zelanda2s2
norte¼ (6.7.5)
d2dnorte-1Þ þz2s2

Si se puede ignorar la corrección de población finita, la Ecuación 6.7.5 se reduce a la


Ecuación 6.7.3.

Estimacións2 Las fórmulas para el tamaño de la muestra requieren el conocimiento des2pero, como
se ha señalado, la varianza de la población es, por regla general, desconocida. Como resultado,s2tiene
que ser estimado. Las fuentes de estimación más utilizadas paras2son los siguientes:

1.Apilotoo una muestra preliminar puede extraerse de la población, y la varianza calculada a partir de esta
muestra puede utilizarse como una estimación des2. Las observaciones utilizadas en la muestra piloto
pueden contarse como parte de la muestra final, de modo quen (el tamaño de muestra calculado) -
norte1(el tamaño de la muestra piloto)¼norte2(el número de observaciones necesarias para satisfacer
el requisito de tamaño total de la muestra).

2.Estimaciones des2puede estar disponible a partir de estudios anteriores o similares.

3.Si se piensa que la población de la que se va a extraer la muestra tiene una distribución
aproximadamente normal, se puede utilizar el hecho de que el rango es
aproximadamente igual a seis desviaciones estándar y calcularsR=6. Este método requiere
algún conocimiento del valor más pequeño y más grande de la variable en la población.

EJEMPLO 6.7.1
Un nutricionista del departamento de salud, que desea realizar una encuesta entre una población de
adolescentes para determinar su ingesta diaria promedio de proteínas (medida en gramos), busca el
consejo de un bioestadístico en relación con el tamaño de la muestra que debe tomarse.
¿Qué procedimiento sigue el bioestadístico para ayudar al nutricionista? Antes de
que el estadístico pueda ayudar al nutricionista, este último debe proporcionar tres
elementos de información: (1) el ancho deseado del intervalo de confianza, (2) el nivel de
confianza deseado y (3) la magnitud de la varianza de la población. .

Solución: Supongamos que al nutricionista le gustaría un intervalo de unos 10 gramos de ancho;


es decir, la estimación debe estar dentro de unos 5 gramos de la media de la población
en cualquier dirección. En otras palabras, se desea un margen de error de 5 gramos.
Supongamos también que se decide un coeficiente de confianza de 0,95 y que, por
experiencia pasada, el nutricionista considera que la desviación estándar de la
población es probablemente de unos 20 gramos. El estadístico ahora tiene
6.8 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR LAS PROPORCIONES 191

la información necesaria para calcular el tamaño de la muestra:z¼1:96;s¼20


yd¼5. Supongamos que la población de interés es grande para que el
estadístico pueda ignorar la corrección de población finita y usar la Ecuación
6.7.3. Al hacer las sustituciones adecuadas, el valor denortese encuentra que
es

d1:96Þ2d20Þ2
norte¼
d5Þ2
¼61:47

Se aconseja al nutricionista que tome una muestra de tamaño 62. Al calcular el


tamaño de una muestra mediante la Ecuación 6.7.3 o la Ecuación 6.7.5, redondeamos al
siguiente número entero más grande si los cálculos arrojan un número que no es un número
entero. &

EJERCICIOS

6.7.1.El administrador de un hospital desea estimar el peso medio de los bebés que nacen en su hospital. ¿De qué tamaño
debe tomarse una muestra de registros de nacimiento si quiere un intervalo de confianza del 99 por ciento de 1 libra
de ancho? Suponga que una estimación razonable deses 1 libra. ¿Qué tamaño de muestra se requiere si el coeficiente
de confianza se reduce a .95?

6.7.2.El director de la sección de control de la rabia en el departamento de salud de una ciudad desea extraer una muestra de los
registros del departamento de mordeduras de perros reportadas durante el último año para estimar la edad promedio de las
personas mordidas. Quiere un intervalo de confianza del 95 por ciento, estará satisfecho con dejard¼2:5 y, a partir de estudios
anteriores, estima que la desviación estándar de la población es de unos 15 años. ¿De qué tamaño debe extraerse una
muestra?

6.7.3.A un médico le gustaría saber el valor medio de glucosa en sangre en ayunas (miligramos por 100 ml) de los pacientes
atendidos en una clínica de diabetes en los últimos 10 años. Determine el número de registros que el médico debe
examinar para obtener un intervalo de confianza del 90 por ciento parametrosi el ancho deseado del intervalo es de 6
unidades y una muestra piloto arroja una varianza de 60.

6.7.4.Para los pacientes con esclerosis múltiple deseamos estimar la edad media a la que se diagnosticó la enfermedad por primera vez.
Queremos un intervalo de confianza del 95 por ciento que tenga 10 años de ancho. Si la varianza de la población
es 90, ¿qué tamaño debe tener nuestra muestra?

6.8 DETERMINACIÓN DEL TAMAÑO DE LA


MUESTRA PARA ESTIMAR LAS PROPORCIONES

El método para determinar el tamaño de la muestra cuando se estima una proporción de la población
es esencialmente el mismo que se describe para estimar la media de la población. Hacemos uso del
hecho de que la mitad del intervalo deseado,d,puede establecerse igual al producto del coeficiente de
confiabilidad y el error estándar.
Suponiendo que el muestreo aleatorio y las condiciones que garantizan la normalidad aproximada de
la distribución de p̂ conduce a la siguiente fórmula paranortecuando el muestreo es con
192 CAPÍTULO 6 ESTIMACIÓN

reemplazo, cuando el muestreo es de una población infinita, o cuando la población muestreada es lo


suficientemente grande como para hacer innecesario el uso de la corrección de población finita,

z2pq
norte¼ (6.8.1)
d2

dóndeq¼1 -pag:
Si no se puede ignorar la corrección por población finita, la fórmula adecuada paranortees

Nueva Zelanda2pq
norte¼ (6.8.2)
d2dnorte-1Þ þz2pq

:05 lapuede
Cuandonortees grande en comparación conn (eso es,n=n la corrección población finita
ignorarse, y la Ecuación 6.8.2 se reduce a la Ecuación 6.8.1.

EstimaciónpagComo vemos, ambas fórmulas requieren el conocimiento depag,la proporción en la


población que posee la característica de interés. Dado que este es el parámetro que estamos tratando
de estimar, obviamente será desconocido. Una solución a este problema es tomar una muestra piloto
y calcular una estimación para usar en lugar depagen la fórmula paranorte. A veces, un investigador
tendrá alguna noción de un límite superior parapagque se puede utilizar en la fórmula. Por ejemplo,
si se desea estimar la proporción de alguna población que tiene una cierta discapacidad, podemos
sentir que la verdadera proporción no puede ser mayor que, digamos, 0,30. Luego sustituimos .30 por
pagen la fórmula paranorte.Si es imposible llegar a una mejor estimación, uno puede establecerpag
igual a .5 y resolver paranorte. Desdepag¼ :5 en la fórmula da el valor máximo denorte,este
procedimiento dará una muestra lo suficientemente grande para la confiabilidad deseada y el ancho
del intervalo. Sin embargo, puede ser más grande de lo necesario y resultar en una muestra más
costosa que si una mejor estimación depag había estado disponible. Este procedimiento debe
utilizarse sólo si no se puede llegar a una mejor estimación depag.

EJEMPLO 6.8.1
Se está planeando una encuesta para determinar qué proporción de familias en un área determinada
son médicamente indigentes. Se cree que la proporción no puede ser mayor a .35. Se desea un
intervalo de confianza del 95 por ciento cond¼ :05. ¿Qué tamaño de muestra de familias se debe
seleccionar?

Solución:Si se puede ignorar la corrección por población finita, tenemos

d1:96Þ2d:35Þð:sesenta y cincoÞ
norte¼ ¼349:59
d:05Þ2

El tamaño de muestra necesario, entonces, es 350. &


6.9 INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA POBLACIÓN NORMALMENTE DISTRIBUIDA 193

EJERCICIOS

6.8.1.Un epidemiólogo desea saber qué proporción de adultos que viven en un área metropolitana grande tienen el
subtipo ayr del virus de la hepatitis B. Determine el tamaño de la muestra que se requeriría para estimar la
verdadera proporción dentro de .03 con un 95 por ciento de confianza. En un área metropolitana similar, se
informa que la proporción de adultos con la característica es de 0,20. Si los datos de otra área metropolitana
no estuvieran disponibles y no se pudiera obtener una muestra piloto, ¿qué tamaño de muestra se
requeriría?

6.8.2.Se planea una encuesta para determinar qué proporción de los estudiantes de secundaria en un sistema escolar
metropolitano ha fumado marihuana regularmente. Si no hay estimación depagestá disponible a partir de
estudios previos, no se puede extraer una muestra piloto, se desea un coeficiente de confianza de .95, yd¼ :
04, determine el tamaño de muestra apropiado. ¿Qué tamaño de muestra se requeriría si se deseara una
confianza del 99 por ciento?

6.8.3.El administrador de un hospital desea saber qué proporción de pacientes dados de alta no está satisfecho con la
atención recibida durante la hospitalización. ¿De qué tamaño debe extraerse una muestra si permitimosd¼ :
05, el coeficiente de confianza es .95 y no hay más información disponible? ¿Qué tamaño debe tener la
muestra sipagse aproxima por .25?

6.8.4.Una agencia de planificación de la salud desea saber, para cierta región geográfica, qué proporción de pacientes
ingresados en hospitales para el tratamiento de traumatismos mueren en el hospital. Se desea un intervalo
de confianza del 95 por ciento, el ancho del intervalo debe ser 0,06 y la proporción de la población, a partir de
otra evidencia, se estima en 0,20. ¿Qué tamaño de muestra se necesita?

6.9 INTERVALO DE CONFIANZA PARA LA


VARIANZA DE UNA POBLACIÓN
NORMALMENTE DISTRIBUIDA

Estimación puntual de la varianza de la poblaciónEn secciones anteriores se


Se ha sugerido que cuando se desconoce la varianza de una población, la varianza de la
muestra puede usarse como estimador. Es posible que se haya preguntado acerca de la calidad
de este estimador. Hemos discutido solo un criterio de calidad, la falta de sesgo, así que
veamos si la varianza de la muestra es un estimador sin sesgo de la varianza de la población.
Para ser imparcial, el valor promedio de la varianza de la muestra sobre todas las muestras
posibles debe ser igual a la varianza de la población. Es decir, la expresiónmids2¼s2debe
sostener Para ver si esta condición se cumple para una situación particular, consultemos el
ejemplo de construcción de una distribución muestral que se da en la Sección 5.3. En la Tabla
5.3.1 tenemos todas las muestras posibles de tamaño 2 de la población que consta de los
valores 6, 8, 10, 12 y 14. Se recordará que se calcularon dos medidas de dispersión para esta
población de la siguiente manera:

PAG PAG
dX-metroÞ 2
i dX i-metroÞ2
s2¼ ¼8 y S2¼ ¼10
norte norte-1

PAG
Si calculamos la varianza muestrals2¼ dXi- -XÞ2=ðn-1Þpara cada uno de los posibles
muestras que se muestran en la Tabla 5.3.1, obtenemos las varianzas muestrales que se muestran en la Tabla 6.9.1.
194 CAPÍTULO 6 ESTIMACIÓN

TABLA 6.9.1 Varianzas calculadas a partir de las muestras


mostradas en la Tabla 5.3.1

Segundo Sorteo

6 8 10 12 14

6 0 2 8 18 32
8 2 0 2 8 18
primer sorteo 10 8 2 0 2 8
12 18 8 2 0 2
14 32 18 8 2 0

Muestreo con reemplazoSi el muestreo es con reemplazo, el valor esperado des2se obtiene
tomando la media de todas las varianzas muestrales en la Tabla 6.9.1. Cuando hacemos esto,
tenemos
PAG
- s2 0þ2þ þ2þ0 200
mi2¼ i¼ ¼ ¼8
nortenorte 25 25

y vemos, por ejemplo, que wPAG


el muestreo de gallinas es con reemplazomids2¼s2, dóndes2¼
PAG
dXi- -XÞ2=ðn-1Þys2¼ ðXi-metroÞ2=N.

Muestreo sin reemplazoSi consideramos el caso donde el muestreo es sin


reemplazo, el valor esperado des2se obtiene tomando la media de todas las
varianzas por encima (o por debajo) de la diagonal principal. Eso es,
PAG
s2 2þ8þ þ2
- 100
mi2¼ i¼ ¼ ¼10
10
norteCnorte 10
PAG
que, como vemos, no es igual as2, pero es igual aS2¼ dXi-metroÞ 2=ðnorte-1Þ.
Estos resultados son ejemplos de principios generales, ya que se puede demostrar que, en general,

mids2¼s2 cuando el muestreo es con reemplazo


mids2¼S2 cuando el muestreo es sin reemplazo

Cuandonortees largo,norte-1 ynorteserá aproximadamente igual y, en consecuencia,s2


yS2será aproximadamente igual. PAG
Estos resultados justifican nuestro uso des2¼ dXi- -XÞ2=ðn-1Þal calcular el
varianza de la muestra. De paso, notemos que aunques2es un estimador insesgado de s2;sno es un
estimador insesgado des.El sesgo, sin embargo, disminuye rápidamente a medida quenorte aumenta

Estimación por intervalos de la varianza de una poblaciónCon una estimación puntual


disponibles, es lógico indagar sobre la construcción de un intervalo de confianza para una
varianza poblacional. Si tenemos éxito en la construcción de un intervalo de confianza paras2
dependerá de nuestra capacidad para encontrar una distribución de muestreo adecuada.
6.9 INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA POBLACIÓN NORMALMENTE DISTRIBUIDA 195

gl = 1

0.4

0.3 gl = 2

0.2 gl = 4

gl = 10

0.1

0.0

0 2 4 6 8 10 12 14
FIGURA 6.9.1Distribuciones chi-cuadrado.
(Fuente: Gerald van Belle, Lloyd D. Fisher, Patrick J. Heagerty y Thomas Lumley, Biostatistics: A Methodology for
the Health Sciences, 2nd Ed., # 2004 John Wiley & Sons, Inc. Este material se reproduce con autorización de John
Wiley & Sons, Inc.)

La distribución chi-cuadradaIntervalos de confianza paras2generalmente se basan en la


distribución muestral dedn-1Þs2= s2. Si muestras de tamañonortese extraen de una población
normalmente distribuida, esta cantidad tiene una distribución conocida comochi-cuadradodX2Þ
distribuciónconn-1 grados de libertad. Como diremos más sobre esta distribución en el capítulo
12, solo decimos aquí que es la distribución que la cantidaddn-1Þs2= s2sigue y que es útil para
encontrar intervalos de confianza paras2cuando se cumple el supuesto de que la población se
distribuye normalmente.
La Figura 6.9.1 muestra distribuciones chi-cuadrado para varios valores de grados de libertad.
Los percentiles de la distribución de chi-cuadrado se dan en la Tabla F del Apéndice. Los títulos de las
columnas dan los valores deX2a la izquierda del cual se encuentra una proporción del área total bajo
la curva igual al subíndice deX2. Las etiquetas de las filas son los grados de libertad.
Para obtener un 100d1 -aÞintervalo de confianza porcentual paras2, primero obtenemos el 100
d1 -aÞintervalo de confianza porcentual paradn-1Þs2= s2. Para ello, seleccionamos los valores de X2de
la Tabla F del Apéndice de tal manera queun =2 está a la izquierda del valor más pequeño yun =2 está
a la derecha del valor mayor. En otras palabras, los dos valores deX2son seleccionados de tal manera
quease divide por igual entre las dos colas de la distribución. Podemos designar
estos dos valores deX2comoX2 un =2yX2 1-dun =2Þ, respectivamente. los 100d1 -aÞpor ciento
intervalo de confianza paradn-1Þs2= s2, entonces está dada por

dn-1Þs2
Xun
2 =2< <X2 1-dun =2Þ
s2
196 CAPÍTULO 6 ESTIMACIÓN

Ahora manipulamos esta expresión de tal manera que obtenemos una expresión con s2
solo como término medio. Primero, dividamos cada término pordn-1Þs2Llegar

X2 1 X21-dun =2Þ
< <
un =2

dn-1Þs2 s2 dn-1Þs2

Si tomamos el recíproco de esta expresión, tenemos

dn-1Þs2 dn-1Þs2
> s 2>
X2 un =2
X1-dun
2 =2Þ

Tenga en cuenta que la dirección de las desigualdades cambió cuando tomamos los recíprocos. Si
invertimos el orden de los términos, tenemos

dn-1Þs2 dn-1Þs2
<s2< (6.9.1)
X1-dun
2 =2Þ
X2 un =2

cual es el 100d1 -aÞintervalo de confianza porcentual paras2. Si sacamos la raíz cuadrada de cada
término en la Expresión 6.9.1, tenemos los siguientes 100d1 -aÞintervalo de confianza porcentual para
s,la desviación estándar de la población:

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

dn-1Þs2 dn-1Þs2
<s < (6.9.2)
X1-dun
2 =2Þ
X2 un =2

EJEMPLO 6.9.1
En un estudio sobre la eficacia de una dieta sin gluten en familiares de primer grado de pacientes con
diabetes tipo I, Hummel et al. (A-22) colocó a siete sujetos en una dieta sin gluten durante 12 meses.
Antes de la dieta, tomaron medidas de referencia de varios anticuerpos y autoanticuerpos, uno de los
cuales fue el autoanticuerpo de insulina relacionado con la diabetes (IAA). Los niveles de IAA se
midieron mediante un ensayo de radioenlace. Los siete sujetos tenían unidades IAA de

9:7; 12:3; 11:2; 5:1; 24:8; 14:8; 17:7

Deseamos estimar a partir de los datos de esta muestra la varianza de las unidades IAA en la
población de la que se extrajo la muestra y construir un intervalo de confianza del 95 por ciento
para esta estimación.

Solución: La muestra arrojó un valor des2¼39:763. Los grados de libertad son


n-1¼6: Los valores apropiados deX2del Apéndice Tabla F son
EJERCICIOS 197

X12-dun =2Þ¼14:449 yX2 un =2¼1:237. Nuestro intervalo de confianza del 95 por ciento para
s2es

6d39:763Þ 6d39:763Þ
<s2 <
14:449 1:237

16:512 <s2< 192:868

El intervalo de confianza del 95 por ciento parases

4:063 <s <13:888

Estamos seguros en un 95 por ciento de que los parámetros que se estiman se encuentran
dentro de los límites especificados, porque sabemos que, a la larga, en muestreos repetidos,
el 95 por ciento de los intervalos construidos como se ilustra incluiría los parámetros
respectivos. &

Algunas precaucionesAunque este método de construcción de intervalos de confianza para s2es


ampliamente utilizado, no está exento de inconvenientes. Primero, la suposición de la normalidad de
la población de la que se extrae la muestra es crucial, y los resultados pueden ser engañosos si se
ignora la suposición.
Otra dificultad con estos intervalos resulta del hecho de que el estimador no está en el
centro del intervalo de confianza, como es el caso del intervalo de confianza parametro.Esto se
debe a que la distribución chi-cuadrado, a diferencia de la normal, no es simétrica. La
implicación práctica de esto es que el método para la construcción de intervalos de confianza
paras2, que se acaba de describir, no produce los intervalos de confianza más cortos posibles.
Tate y Klett (12) dan tablas que pueden usarse para superar esta dificultad.

EJERCICIOS

6.9.1.Un estudio de Aizenberg et al. (A-23) examinó la eficacia de sildenafilo, una potente fosfodiesterasa
inhibidor, en el tratamiento de hombres de edad avanzada con disfunción eréctil inducida por tratamiento
antidepresivo para el trastorno depresivo mayor. Las edades de los 10 participantes en el estudio fueron

74; 81; 70; 70; 74; 77; 76; 70; 71; 72

Suponga que los sujetos de esta muestra constituyen una muestra aleatoria simple extraída de una población de
sujetos similares. Construya un intervalo de confianza del 95 por ciento para la varianza de las edades de los sujetos
de la población.

6.9.2.Borden et al. (A-24) realizó experimentos en rodillas cadavéricas para probar la eficacia de varias técnicas de reparación
de meniscos. Las muestras se cargaron en un dispositivo servohidráulico y se sometieron a tensión hasta que
fallaron. La prueba biomecánica se realizó utilizando una tasa de carga lenta para simular las tensiones a las que
podría estar sujeto el menisco medial durante los primeros ejercicios de rehabilitación y las actividades de la vida
diaria. Una de las medidas es la cantidad de desplazamiento que se produce. De los 12 especímenes que recibieron la
sutura de colchonero vertical y el método FasT-FIX, los valores de desplazamiento
198 CAPÍTULO 6 ESTIMACIÓN

medidas en milímetros son 16,9, 20,2, 20,1, 15,7, 13,9, 14,9, 18,0, 18,5, 9,2, 18,8, 22,8, 17,5. Construya un
intervalo de confianza del 90 por ciento para la varianza del desplazamiento en milímetros para una
población de sujetos que reciben estas técnicas de reparación.

6.9.3.Se realizaron determinaciones forzadas de capacidad vital en 20 varones adultos sanos. La varianza de la muestra fue
1,000,000. Construya intervalos de confianza del 90 por ciento paras2ys.

6.9.4.En un estudio de tiempos de tránsito miocárdico, se obtuvieron tiempos de tránsito de aparición en una muestra de 30
pacientes con enfermedad arterial coronaria. Se encontró que la varianza de la muestra era 1.03. Construya
intervalos de confianza del 99 por ciento paras2ys.

6.9.5.Una muestra de 25 hombres sanos física y mentalmente participó en un experimento de sueño en el que se registró el
porcentaje del tiempo total de sueño de cada participante en una determinada etapa del sueño. La varianza calculada
a partir de los datos de la muestra fue de 2,25. Construya intervalos de confianza del 95 por ciento paras2
ys.
6.9.6.Se realizaron determinaciones de hemoglobina en 16 animales expuestos a un químico dañino. Se registraron
las siguientes observaciones: 15.6, 14.8, 14.4, 16.6, 13.8, 14.0, 17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4, 13.9, 14.8,
17.5. Construya intervalos de confianza del 95 por ciento paras2ys.

6.9.7.Veinte muestras de aire tomadas en el mismo sitio durante un período de 6 meses mostraron las siguientes cantidades de
partículas en suspensión (microgramos por metro cúbico de aire):

68223632
42242838
30442827
28434550
79745721
Considere estas medidas como una muestra aleatoria de una población de medidas normalmente
distribuidas y construya un intervalo de confianza del 95 por ciento para la varianza de la población.

6.10 INTERVALO DE CONFIANZA PARA LA


RAZÓN DE LAS VARIACIONES DE DOS
POBLACIONES NORMALMENTE
DISTRIBUIDAS

Con frecuencia es de interés comparar dos varianzas, y una forma de hacerlo es formar su
relación,s21= s22. Si dos varianzas son iguales, su razón será igual a 1. Usualmente no lo haremos
conocer las varianzas de las poblaciones de interés y, en consecuencia, cualquier comparación que hagamos
se basará en las varianzas de la muestra. En otras palabras, es posible que deseemos estimar la razón de las
varianzas de dos poblaciones. Aprendimos en la Sección 6.4 que el uso válido de latdistribución para
construir un intervalo de confianza para la diferencia entre dos medias poblacionales requiere que las
varianzas poblacionales sean iguales. El uso de la razón de dos varianzas de población para determinar la
igualdad de varianzas se ha formalizado en una prueba estadística. La distribución de esta prueba
proporciona valores de prueba para determinar si la razón excede el valor 1 en una medida lo
suficientemente grande como para concluir que las varianzas no son iguales. La prueba se denomina Prueba
F-max de Hartley (13) o Prueba de relación de varianza de Zar (14). Muchos programas de computadora
proporcionan alguna prueba formalizada de la igualdad de varianzas, de modo que la suposición de igualdad
de varianzas asociada con muchas de las pruebas en los siguientes capítulos puede ser
6.10 INTERVALO DE CONFIANZA PARA LA RAZÓN DE LAS VARIACIONES DE DOS POBLACIONES NORMALMENTE DISTRIBUIDAS 199

(10;∞)
1.0
(10; 50)
(10; 10)
0.8
(10; 4)

0.6

F(X)
0.4

0.2

0.0
0 0.5 1,0 1,5 2,0 2,5 3,0 3,5 4,0
F
FIGURA 6.10.1ElFdistribución para varios grados de libertad.
(DeDocumenta Geigy, Mesas Científicas,Séptima edición, 1970. Cortesía de Ciba-Geigy Limited, Basilea,
Suiza.)

examinado. Si el intervalo de confianza para la razón de dos varianzas poblacionales incluye 1, concluimos que las dos
varianzas poblacionales pueden, de hecho, ser iguales. Una vez más, dado que esta es una forma
de inferencia, debemos confiar en alguna distribución de muestreo, y esta vez la distribución de
s12= s12=s2 2= s22se utiliza siempre que se cumplan ciertos supuestos. Los supuestos son
esos21ys2 2se calculan a partir de muestras independientes de tamañonorte1ynorte2respectivamente, dibujado
de dos poblaciones normalmente distribuidas. Usamoss2 1para designar el mayor de los dos
varianzas de la muestra.

- -
ElFDistribuciónSi se cumplen los supuestos,s2 1= s12=s2 2= s22sigue un
distribución conocida comodistribución F.Aplazamos una discusión más completa de esta distribución
hasta el capítulo 8, pero tenga en cuenta que esta distribución depende de dos grados de
valores de libertad, uno correspondiente al valor denorte1- 1 utilizado en computacións2 1y el
otra correspondiente al valor denorte2- 1 utilizado en computacións2 2.
Estos suelen ser referidos
a como elnumerador grados de libertady elgrados de libertad del denominador. La Figura
6.10.1 muestra algunosFdistribuciones para varias combinaciones de grados de libertad de
numerador y denominador. La tabla G del apéndice contiene, para combinaciones específicas
de grados de libertad y valores dea;Fvalores a la derecha de los cuales se encuentraun =2 del
área bajo la curva deF.

Un intervalo de confianza paras2 1= s22 Para encontrar el 100d1 -aÞporcentaje de confianza


intervalo paras21= s22, comenzamos con la expresión

s12= s2
Fun =2< 1<F Þ
s22= s22
1-dun =2

dóndeFun =2yF1-dun =2Þson los valores de laFmesa a la izquierda y a la derecha de la cual,


respectivamente, se encuentraun =2 del área bajo la curva. El término medio de esta expresión se
puede reescribir de modo que la expresión completa sea
s12 s2
Fun =2< 2<F1-dun =Þ 2
s22 s21
200 CAPÍTULO 6 ESTIMACIÓN

Si dividimos pors2 1= s22, tenemos

Fun =2< s2 F 1-dun =2Þ


2<
s12= s22 s21 s12= s22

Tomando los recíprocos de los tres términos da

s12= s22 s21 s12=s22


> >
Fun =2 s22 F1-dun =2Þ

y si invertimos el orden, tenemos los siguientes 100d1 -aÞintervalo de confianza porcentual


paras21= s22:

s12= s22 s21 s21= s22


< < (6.10.1)
F1-dun =2Þ s22 Fun =2

EJEMPLO 6.10.1
Allen y Gross (A-25) examinan la fuerza de los flexores de los dedos de los pies en sujetos con fascitis plantar
(dolor de espolón en el talón o dolor general en el talón), una condición común en pacientes con problemas
musculoesqueléticos. La inflamación de la fascia plantar suele ser costosa de tratar y frustrante tanto para el
paciente como para el médico. Una de las medidas de referencia fue el índice de masa corporal (IMC). Para
las 16 mujeres del estudio, la desviación estándar del IMC fue de 8,1 y para los cuatro hombres del estudio, la
desviación estándar fue de 5,9. Deseamos construir un intervalo de confianza del 95 por ciento para el
cociente de las varianzas de las dos poblaciones de las que suponemos que se extrajeron estas muestras.

Solución:Tenemos la siguiente información:


norte1¼dieciséis norte2¼4

s12¼ ð8:1Þ2¼65:61 s22¼ ð5:9Þ2¼34:81


d.f.1¼numerador grados de libertad¼norte1- 1¼15 d.f.2
¼grados de libertad del denominador¼norte2- 1¼3
a ¼ :05
F:025 ¼ :24096 F:975¼14:25

Ahora estamos listos para obtener nuestro intervalo de confianza del 95 por ciento para
s21= s22sustituyendo los valores apropiados en la Expresión 6.10.1:

65:61=34:81 s21 65:61=34:81


< <
14:25 s22 :24096

s2
:1323 < 1< 7:8221
s22
6.10 INTERVALO DE CONFIANZA PARA LA RAZÓN DE LAS VARIACIONES DE DOS POBLACIONES NORMALMENTE DISTRIBUIDAS 201

Damos a este intervalo las interpretaciones probabilísticas y prácticas


apropiadas.
Dado que el intervalo de .1323 a 7.8221 incluye 1, podemos concluir que
las dos varianzas de población pueden ser iguales. &

HallazgoF1-dun =2ÞyFun =2 Llegados a este punto debemos hacer una digresión engorrosa, pero
inevitable, y explicar cómo los valoresF:975¼14:25 yF:025¼ :Se obtuvieron 24096. El valor deF:975en
la intersección de la columna encabezadad.f.1¼15 y la fila etiquetadad.f.2¼3 es 14.25. Si
tuviéramos una tabla más extensa de losFdistribución, encontrar F:025no sería ningún problema;
simplemente encontraríamosF:025como encontramosF:975. Tomaríamos el valor en la
intersección de la columna con el encabezado 15 y la fila con el encabezado 3. Para incluir todos
los percentiles posibles deFsería una mesa muy larga. Afortunadamente, sin embargo, existe
una relación que nos permite calcular los valores percentiles más bajos de nuestra tabla
limitada. La relación es la siguiente:

1
Fa;d.f. 1;df2 ¼ (6.10.2)
F1-a;d.f.2;df1

Procedemos de la siguiente manera.

Intercambie los grados de libertad del numerador y el denominador y localice el valor


apropiado deF.Para el problema en cuestión ubicamos 4.15, que está en la intersección de la columna
con el encabezado 3 y la fila con el 15. Ahora tomamos el recíproco de este valor, 1=4:15¼ :24096. En
resumen, el límite de confianza inferior (LCL) y el límite de confianza superior
límite (UCL)s21= s22son como sigue:

s12 1
LCL¼
s22Fd1-un =2Þ;d.f. ;df
1 2

s12F1-dun =2Þ;d.f. ;df


UCL¼ 2 1

s22

En el libro de Daniel (15) se pueden encontrar procedimientos alternativos para hacer


inferencias sobre la igualdad de dos varianzas cuando las poblaciones muestreadas no se distribuyen
normalmente.

Algunas precaucionesSimilar a la discusión en la sección anterior sobre la construcción de intervalos de


confianza paras2, la suposición de normalidad de las poblaciones de las que se extraen las muestras es
crucial para obtener intervalos correctos para la razón de varianzas discutida en esta sección.
Afortunadamente, la mayoría de los programas informáticos estadísticos ofrecen alternativas a la relación F,
como la prueba de Levene, cuando no se puede suponer que las distribuciones subyacentes se distribuyen
normalmente. Computacionalmente, la prueba de Levene usa una medida de distancia desde una mediana
de muestra en lugar de una media de muestra, eliminando así la suposición de normalidad.
202 CAPÍTULO 6 ESTIMACIÓN

EJERCICIOS

6.10.1.El propósito de un estudio de Moneim et al. (A-26) fue para examinar las amputaciones del pulgar del equipo de lazada en
los rodeos. Los investigadores revisaron 16 casos de amputaciones de pulgar. De estos, 11 fueron amputaciones
completas mientras que cinco fueron incompletas. El tiempo de isquemia es el tiempo que se suministra oxígeno
insuficiente al pulgar amputado. Los tiempos de isquemia (horas) para 11 sujetos que experimentaron amputaciones
completas fueron

4:67; 10:5; 2:0; 3:18; 4:00; 3:5; 3:33; 5:32; 2:0; 4:25; 6:0

Para cinco víctimas de amputación incompleta del pulgar, los tiempos de isquemia fueron

3:0; 10:25; 1:5; 5:22; 5:0

Trate los dos conjuntos de datos informados como datos de muestra de las dos poblaciones como se describe.
Construya un intervalo de confianza del 95 por ciento para la razón de las dos varianzas de población desconocidas.

6.10.2.El objetivo de un estudio de Horesh et al. (A-27) fue explorar la hipótesis de que algunas formas de
las conductas suicidas entre los adolescentes están relacionadas con la ira y la impulsividad. La muestra estuvo compuesta por
65 adolescentes ingresados en una unidad psiquiátrica de adolescentes adscrita a una universidad. Los investigadores
utilizaron la Escala de control de impulsividad (ICS, A-28) donde los números más altos indican grados más altos de
impulsividad y las puntuaciones pueden variar de 0 a 45. Los 33 sujetos clasificados como suicidas tenían una desviación
estándar de la puntuación ICS de 8,4 mientras que los 32 sujetos no suicidas los sujetos tenían una desviación estándar de 6,0.
Suponga que estos dos grupos constituyen muestras aleatorias simples independientes de dos poblaciones de sujetos
similares. Suponga también que las puntuaciones de la ICS en estas dos poblaciones se distribuyen normalmente. Encuentre el
intervalo de confianza del 99 por ciento para la razón de las dos varianzas poblacionales de puntajes en el ICS.

6.10.3.Los valores del índice de accidente cerebrovascular se analizaron estadísticamente para dos muestras de
pacientes que padecían infarto de miocardio. Las varianzas de la muestra fueron 12 y 10. Hubo 21 pacientes
en cada muestra. Construya el intervalo de confianza del 95 por ciento para la razón de las dos varianzas de
población.

6.10.4.Treinta y dos asfásicos adultos que buscaban terapia del habla se dividieron por igual en dos grupos. Grupo 1
recibió el tratamiento 1 y el grupo 2 recibió el tratamiento 2. Análisis estadístico del tratamiento
las puntuaciones de efectividad arrojaron las siguientes variaciones:s2 1¼8;s2 2¼15. Construye el 90 por ciento
intervalo de confianza paras2 2= s21.

6.10.5.Se calcularon las varianzas de la muestra para los volúmenes corrientes (mililitros) de dos grupos de pacientes que sufrían
por comunicación interauricular. Los resultados y tamaños de muestra fueron los siguientes:

norte1¼31;s21¼35; 000
norte2¼41;s22¼20; 000

Construya el intervalo de confianza del 95 por ciento para la razón de las dos varianzas de población.

6.10.6.Se registraron las respuestas de glucosa a la glucosa oral en 11 pacientes con enfermedad de Huntington (grupo 1)
y 13 sujetos control (grupo 2). El análisis estadístico de los resultados arrojó la siguiente muestra
varianzas:s2 1¼105;s2 2¼148. Construya el intervalo de confianza del 95 por ciento para la razón de los dos
varianzas de la población.
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 6 203

6.10.7.Mediciones de secreción gástrica de ácido clorhídrico (miliequivalentes por hora) en 16 pacientes normales
sujetos y 10 sujetos con úlcera duodenal arrojaron los siguientes resultados:

Sujetos normales: 6.3, 2.0, 2.3, 0.5, 1.9, 3.2, 4.1, 4.0, 6.2, 6.1, 3.5, 1.3, 1.7, 4.5, 6.3, 6.2
Sujetos de úlcera: 13.7, 20.6, 15.9, 28.4, 29.4, 18.4, 21.1, 3.0, 26.2, 13.0

Construya un intervalo de confianza del 95 por ciento para la razón de las dos varianzas de población. ¿Qué supuestos
se deben cumplir para que este procedimiento sea válido?

6.11 RESUMEN

Este capítulo se ocupa de una de las principales áreas de la inferencia estadística: la estimación.
Se cubren tanto la estimación puntual como la estimación por intervalos. Los conceptos y
métodos involucrados en la construcción de intervalos de confianza se ilustran para los
siguientes parámetros: medias, la diferencia entre dos medias, proporciones, la diferencia entre
dos proporciones, varianzas y la razón de dos varianzas. Además, aprendimos en este capítulo
cómo determinar el tamaño de muestra necesario para estimar una media poblacional y una
proporción poblacional en niveles específicos de precisión.
También aprendimos en este capítulo que las estimaciones por intervalos de los parámetros de la población son más
deseables que las estimaciones puntuales porque las declaraciones de confianza se pueden adjuntar a las estimaciones por
intervalos.

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 6

Fórmula
Número Nombre Fórmula

6.2.1 Expresión de una estimación de estimador -dcoeficiente de fiabilidadÞ


intervalo ðerror estándar del estimadorÞ

6.2.2 Estimación de intervalo parametro - x - zd1-un =2Þs-X


cuandoses conocida

6.3.1 t-transformación - X -metro


t¼ pffiffiffi
s = norte

6.3.2 Estimación de intervalo parametro


s
- x - td1-un =2Þ¼ pffiffiffi
cuandoses desconocido norte

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.4.1 Estimación de intervalo para
s21 s 22
la diferencia entre dos d-X1- -X2Þ -zd1-un =2Þ þ
norte1 norte2
población significa cuando
s1ys2son conocidos

6.4.2 2
Estimación de la varianza agrupada dnorte1- 1Þs21þ ðnorte2- 1Þs 2
2 ¼
spag
norte1þnorte2- 2
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.4.3 Error estándar de estimación
spag
2 spag
2
sd-X1--XÞ
2 ¼
þ
norte1 norte2

(Continuación)
204 CAPÍTULO 6 ESTIMACIÓN

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.4.4 Estimación de intervalo para
spag
2 s2pag
la diferencia entre dos d-X1- -X2Þ -td1-un =2Þ þ
norte1 norte2
población significa cuando
s1es desconocido

6.4.5 Corrección de Cochran para el w1t1þw2t2


td1-un
0 =2Þ¼
coeficiente de confiabilidad w1þw2
cuando las varianzas no son
iguales
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.4.6 Estimación del intervalo usando la
s12 s22
corrección de Cochran parat d-X1- -X2Þ -t0d1-un =2Þ þ
norte1 norte2

uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff
6.5.1 Estimación de intervalo para p - zd1-un =2Þ pagd1 - p̂Þ=norte
una proporción de población
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.6.1 Estimación de intervalo para
pag1d1 - p̂1Þ pagd1
2 - pag^2Þ
la diferencia entre dos ðp̂1- pag2Þ -zd1-un =2Þ þ
norte1 norte2
proporciones de población

6.7.1–6.7.3 Determinación del tamaño de la d¼ ðcoeficiente de fiabilidadÞ ðError estándarÞ


muestra al muestrear con s
reemplazo d¼zpffiffiffi
norte

;
z2s2
norte¼
d2
rffiffiffiffiffiffiffiffiffiffiffiffiffi
6.7.4–6.7.5 Determinación del tamaño de s n-n
d¼zpffiffiffi
la muestra al muestrear sin norte-1
norte

reemplazo
;
Nueva Zelanda2s2
norte¼
d2dnorte-1Þ þz2s2

6.8.1 Determinación del tamaño de la muestra z2pq


norte¼
para proporciones cuando
d2
muestreo con
reemplazo
6.8.2 Determinación del tamaño de la muestra Nueva Zelanda2s2
norte¼
para proporciones cuando
d2dnorte-1Þ þz2s2
muestreo sin
reemplazo
6.9.1 Estimación de intervalo paras2 dn-1Þs2 dn-1Þs2
<s2 <
X1-dun
2 =2Þ X2 dun =2Þ

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
6.9.2 Estimación de intervalo paras
dn-1Þs2 dn-1Þs2
<s <
X1-dun
2 =2Þ X2 dun =2Þ

6.10.1 Estimación de intervalo para la s12= s22 s 21 s12= s22


< <
razón de dos varianzas
F1-dun =2Þ s22 Fun =2
PREGUNTAS DE REPASO Y EJERCICIOS 205

6.10.2 Relación entreF 1


Fa;d.f. 1;df2 ¼
proporciones
F1-a;d.f.2;df1
Símbolo a¼Tasa de error tipo 1 X2¼
Llave Distribución chi-cuadrado
d¼componente de error de estimación de
intervalo d.f.¼grados de libertad F¼
Distribución F
metro¼media de la población norte¼

tamaño de la muestra

pag¼proporción para la población q


¼ ð1 -pagÞ
pag¼proporción estimada para la muestra s
2¼varianza de la población
s¼desviación estándar de población s
-X¼Error estándar
s¼desviación estándar de la muestra
spag¼desviación estándar agrupada t
¼Estudiantest-transformación t0¼
Corrección de Cochran at
- X¼media de la muestra
z¼distribución normal estándar

PREGUNTAS DE REPASO Y EJERCICIOS

1.¿Qué es la inferencia estadística?

2.¿Por qué la estimación es un tipo importante de inferencia?

3.¿Qué es una estimación puntual?

4.Explique el significado de imparcialidad.

5.Defina lo siguiente:
(a)Coeficiente de fiabilidad (b)Coeficiente de confianza (C)Precisión
(d)Error estándar (mi)Estimador (F)Margen de error

6.Dé la fórmula general para un intervalo de confianza.

7.Enuncie las interpretaciones probabilística y práctica de un intervalo de confianza.

8.¿De qué sirve el teorema del límite central en la estimación?

9.Describe eltdistribución.
10¿Cuáles son los supuestos que subyacen al uso de latdistribución al estimar una sola media poblacional?

11¿Qué es la corrección por población finita? ¿Cuándo se puede ignorar?

12¿Cuáles son los supuestos que subyacen al uso de latdistribución al estimar la diferencia entre las medias
de dos poblaciones?
206 CAPÍTULO 6 ESTIMACIÓN

13Los análisis de gases en sangre arterial realizados en una muestra de 15 hombres adultos físicamente activos arrojaron la
siguiente PaO en reposo2valores:

75; 80; 80; 74; 84; 78; 89; 72; 83; 76; 75; 87; 78; 79; 88

Calcule el intervalo de confianza del 95 por ciento para la media de la población.

14¿Qué proporción de pacientes con asma son alérgicos al polvo doméstico? En una muestra de 140, el 35 por ciento tuvo reacciones
cutáneas positivas. Construya el intervalo de confianza del 95 por ciento para la proporción de la población.

15.Se realizó una encuesta de higiene industrial en una gran área metropolitana. De 70 plantas de fabricación de cierto tipo visitadas,
21 recibieron una calificación de "pobre" con respecto a la ausencia de riesgos de seguridad. Construya un intervalo de
confianza del 95 por ciento para la proporción de la población que merece una calificación de "pobre".

dieciséis.Consulte el problema anterior. ¿Qué tamaño de muestra se necesitaría para estimar la proporción de la población
dentro de 0,05 con un 95 por ciento de confianza (0,30 es la mejor estimación disponible depag):
(a)¿Si se puede ignorar la corrección de población finita?
(b)Si no se ignora la corrección por población finita ynorte¼1500?

17En una encuesta dental realizada por un equipo de salud dental del condado, se pidió a 500 adultos que indicaran el
motivo de su última visita al dentista. De los 220 que tenían menos de la educación secundaria, 44 dijeron que fueron
por razones preventivas. De los 280 restantes, que tenían estudios secundarios o superiores, 150 manifestaron que
acudían por motivos preventivos. Construya un intervalo de confianza del 95 por ciento para la diferencia entre las
dos proporciones de población.

18Un equipo de investigación del cáncer de mama recopiló los siguientes datos sobre el tamaño del tumor:

Tipo de tumor norte -X s

A 21 3,85cm 1,95cm
B dieciséis 2,80cm 1,70cm

Construya un intervalo de confianza del 95 por ciento para la diferencia entre las medias de la población.

19Cierto fármaco resultó ser eficaz en el tratamiento de la enfermedad pulmonar en 180 de 200 casos tratados.
Construya el intervalo de confianza del 90 por ciento para la proporción de la población.

20Setenta pacientes con úlceras por estasis en la pierna se dividieron aleatoriamente en dos grupos iguales. Cada grupo
recibió un tratamiento diferente para el edema. Al final del experimento, la eficacia del tratamiento se midió en
términos de reducción del volumen de las patas determinado por el desplazamiento del agua. Las medias y las
desviaciones estándar para los dos grupos fueron las siguientes:

Grupo (Tratamiento) -X s

A 95cc 25
B 125 cc 30

Construya un intervalo de confianza del 95 por ciento para la diferencia en las medias de la población.

21¿Cuál es el nivel promedio de bilirrubina sérica de los pacientes ingresados en un hospital para el tratamiento de la hepatitis? Una
muestra de 10 pacientes arrojó los siguientes resultados:

20:5; 14:8; 21:3; 12:7; 15:2; 26:6; 23:4; 22:9; 15:7; 19:2
Construya un intervalo de confianza del 95 por ciento para la media de la población.
PREGUNTAS DE REPASO Y EJERCICIOS 207

22Las determinaciones de los niveles de pH de la saliva se realizaron en dos muestras aleatorias independientes de escolares de
séptimo grado. Los niños de la muestra A no tenían caries, mientras que los niños de la muestra B tenían una alta incidencia de
caries. Los resultados fueron los siguientes:

A: 7.14, 7.11, 7.61, 7.98, 7.21, 7.16, 7.89 B: 7.36, 7.04, 7.19, 7.41, 7.10, 7.15, 7.36,
7.24, 7.86, 7.47, 7.82, 7.37, 7.66, 7.62, 7.65 7.57, 7.64, 7.00, 7.25, 7.19
Construya un intervalo de confianza del 90 por ciento para la diferencia entre las medias de la población. Suponga
que las varianzas de la población son iguales.

23Se recetó el fármaco A a una muestra aleatoria de 12 pacientes que padecían insomnio. Una muestra aleatoria
independiente de 16 pacientes con la misma dolencia recibió el fármaco B. El número de horas de sueño
experimentadas durante la segunda noche después de iniciado el tratamiento fue el siguiente:

A: 3.5, 5.7, 3.4, 6.9, 17.8, 3.8, 3.0, 6.4, 6.8, 3.6, 6.9, 5.7
B: 4.5, 11.7, 10.8, 4.5, 6.3, 3.8, 6.2, 6.6, 7.1, 6.4, 4.5, 5.1,
3.2, 4.7, 4.5, 3.0
Construya un intervalo de confianza del 95 por ciento para la diferencia entre las medias de la población. Suponga
que las varianzas de la población son iguales.

24El objetivo de un estudio de Crane et al. (A-29) fue examinar la eficacia, seguridad y satisfacción materna de (a)
misoprostol oral y (b) oxitocina intravenosa para la inducción del parto en mujeres con ruptura prematura de
membranas a término. Los investigadores asignaron aleatoriamente a las mujeres a los dos tratamientos. Para las 52
mujeres que recibieron misoprostol oral, el tiempo medio en minutos hasta el trabajo de parto activo fue de 358
minutos con una desviación estándar de 308 minutos. Para las 53 mujeres que tomaban oxitocina, el tiempo medio
fue de 483 minutos con una desviación estándar de 144 minutos. Construya un intervalo de confianza del 99 por
ciento para la diferencia en el tiempo medio hasta el trabajo de parto activo para estos dos medicamentos diferentes.
¿Qué suposiciones se deben hacer sobre los datos informados? Describe la población sobre la que se puede
hacer una inferencia.

25Durante un período de 2 años, 34 mujeres europeas con diabetes gestacional previa fueron reclutadas
retrospectivamente de las bases de datos prenatales del oeste de Londres para un estudio realizado por Kousta et al.
(A-30). Una de las medidas para estas mujeres fue la concentración de ácidos grasos no esterificados en ayunas
(NEFA) medida enmetromol=L. En la muestra de 34 mujeres, el nivel medio de NEFA fue 435 con una desviación
estándar muestral de 215,0. Construya un intervalo de confianza del 95 por ciento para el nivel medio de NEFA en
ayunas para una población de mujeres con diabetes gestacional. Indique todas las suposiciones necesarias sobre los
datos y sujetos informados.

26Scheid et al. (A-31) entrevistó a 387 mujeres que se sometieron a un examen gratuito de densidad mineral ósea. Las
preguntas se centraron en los antecedentes de tabaquismo. Se preguntó a los sujetos que se sometían a la terapia de
reemplazo hormonal (TRH) y a los sujetos que no se sometían a la TRH si alguna vez habían sido fumadores
habituales. En el grupo de TRH, el 29,3 por ciento de 220 mujeres afirmó que en algún momento de su vida fumaba
habitualmente. En el grupo sin TRH, el 17,3 por ciento de 106 mujeres respondió positivamente a haber sido
fumadora habitual en algún momento de su vida. (Sesenta y una mujeres optaron por no responder la pregunta).
Construya un intervalo de confianza del 95 por ciento para la diferencia en los porcentajes de fumadores para las dos
poblaciones de mujeres representadas por los sujetos del estudio. ¿Qué supuestos sobre los datos son necesarios?

27El propósito de un estudio de Elliott et al. (A-32) fue evaluar la prevalencia de la deficiencia de vitamina D en mujeres que
viven en hogares de ancianos. La muestra consistió en 39 mujeres en un centro de enfermería especializada de 120
camas. Se invitó a participar a mujeres mayores de 65 años que fueran residentes de larga duración si no tenían
diagnóstico de cáncer terminal o enfermedad metastásica. En la muestra, 23 mujeres tenían niveles de 25-
hidroxivitamina D de 20 ng/ml o menos. Construya un intervalo de confianza del 95 por ciento para el porcentaje de
mujeres con deficiencia de vitamina D en la población que se supone que está representada por esta muestra.
208 CAPÍTULO 6 ESTIMACIÓN

28En un estudio sobre el papel de las grasas de la dieta en la etiología de la cardiopatía isquémica, los sujetos
fueron 60 hombres de entre 40 y 60 años que habían sufrido recientemente un infarto de miocardio y 50
hombres aparentemente sanos del mismo grupo de edad y clase social. Una variable de interés en el estudio
fue la proporción de ácido linoleico (LA) en los ácidos grasos de triglicéridos plasmáticos de los sujetos. Los
datos de esta variable fueron los siguientes:

Sujetos con infarto de miocardio

Sujeto LA Sujeto LA Sujeto LA Sujeto LA

1 18.0 2 17.6 3 9.6 4 5.5


5 16.8 6 12.9 7 14.0 8 8.0
9 8.9 10 15.0 11 9.3 12 5.8
13 8.3 14 4.8 15 6.9 dieciséis 18.3
17 24.0 18 16.8 19 12.1 20 12.9
21 16.9 22 15.1 23 6.1 24 16.6
25 8.7 26 15.6 27 12.3 28 14.9
29 16.9 30 5.7 31 14.3 32 14.1
33 14.1 34 15.1 35 10.6 36 13.6
37 16.4 38 10.7 39 18.1 40 14.3
41 6.9 42 6.5 43 17.7 44 13.4
45 15.6 46 10.9 47 13.0 48 10.6
49 7.9 50 2.8 51 15.2 52 22.3
53 9.7 54 15.2 55 10.1 56 11.5
57 15.4 58 17.8 59 12.6 60 7.2

Sujetos sanos

Sujeto LA Sujeto LA Sujeto LA Sujeto LA

1 17.1 2 22,9 3 10.4 4 30,9


5 32.7 6 9.1 7 20.1 8 19.2
9 18.9 10 20.3 11 35.6 12 17.2
13 5.8 14 15.2 15 22.2 dieciséis 21.2
17 19.3 18 25.6 19 42.4 20 5.9
21 29.6 22 18.2 23 21.7 24 29.7
25 12.4 26 15.4 27 21.7 28 19.3
29 16.4 30 23.1 31 19.0 32 12.9
33 18.5 34 27.6 35 25,0 36 20.0
37 51.7 38 20.5 39 25,9 40 24.6
41 22.4 42 27.1 43 11.1 44 32.7
45 13.2 46 22.1 47 13.5 48 5.3
49 29,0 50 20.2

Construya el intervalo de confianza del 95 por ciento para la diferencia entre las medias de la población. ¿Qué
sugieren estos datos acerca de los niveles de ácido linoleico en las dos poblaciones muestreadas?

29El propósito de un estudio realizado por Tahmassebi y Curzon (A-33) fue comparar la tasa de flujo salival
promedio entre sujetos con parálisis cerebral y entre sujetos en un grupo de control. Cada grupo tenía 10
sujetos. La siguiente tabla proporciona el caudal medio en ml/minuto, así como el error estándar.
PREGUNTAS DE REPASO Y EJERCICIOS 209

Grupo Tamaño de la muestra Media ml/minuto Error estándar

Parálisis cerebral 10 0.220 0.0582


Control 10 0.334 0.1641

SFuente: JF Tahmassebi y MEJ Curzon, "La causa del babeo en niños con parálisis cerebral:
¿hipersalivación o defecto de deglución?"Revista Internacional de Odontología Pediátrica,
13 (2003), 106–111.

Construya el intervalo de confianza del 90 por ciento para la diferencia en la tasa de flujo salival promedio para las dos
poblaciones de sujetos representadas por los datos de la muestra. Indique las suposiciones necesarias para que este sea un
intervalo de confianza válido.

30Culligan et al. (A-34) compararon los resultados a largo plazo de dos tratamientos: (a) un procedimiento de Burch
modificado y (b) un procedimiento de cabestrillo para la incontinencia de esfuerzo con uretra de baja presión. Treinta
y seis mujeres participaron en el estudio con 19 en el grupo de tratamiento de Burch y 17 en el grupo de tratamiento
de procedimiento de cabestrillo. Una de las medidas de resultado a los tres meses de la cirugía fue la presión máxima
de cierre uretral (cm H2O). En el grupo de Burch la media y la desviación estándar fueron 16,4 y 8,2 cm,
respectivamente. En el grupo de cabestrillo, la media y la desviación estándar fueron 39,8 y 23,0, respectivamente.
Construya el intervalo de confianza del 99 por ciento para la diferencia en la presión de cierre uretral máxima media
para las dos poblaciones representadas por estos sujetos. Indique todas las suposiciones necesarias.

31En general, se prefieren los intervalos de confianza estrechos a los anchos. Podemos estrechar un intervalo
usando un pequeño coeficiente de confianza. Para un conjunto dado de otras condiciones, ¿qué sucede con
el nivel de confianza cuando usamos un coeficiente de confianza pequeño? ¿Qué pasaría con el ancho del
intervalo y el nivel de confianza si usáramos un coeficiente de confianza de cero?

32.En general, se prefiere un alto nivel de confianza a un bajo nivel de confianza. Para un conjunto dado de otras
condiciones, supongamos que establecemos nuestro nivel de confianza en 100 por ciento. ¿Cuál sería el efecto de tal
elección sobre la amplitud del intervalo?

33.Los sujetos de un estudio de Borland et al. (A-35) eran niños con dolor agudo. Treinta y dos niños que se
presentaron en una sala de emergencias se inscribieron en el estudio. Cada niño usó la escala analógica
visual para calificar el dolor en una escala de 0 a 100 mm. La puntuación media del dolor fue de 61,3 mm con
un intervalo de confianza del 95 % de 53,2 mm a 69,4 mm. ¿Cuál sería el factor de confiabilidad apropiado
para el intervalo,zot?Justifique su elección. ¿Cuál es la precisión de la estimación? ¿El margen de error?

34.¿El delirio aumenta la estancia hospitalaria? Esa fue la pregunta de investigación investigada por McCusker et al.
(A-36). Los investigadores tomaron muestras de 204 pacientes con delirio prevalente y 118 sin delirio. La
conclusión del estudio fue que los pacientes con delirio prevalente no tenían una estancia media mayor en
comparación con aquellos sin delirio. ¿Cuál era la población objetivo? ¿La población muestreada?

35.Evaluar la autolimitación de la conducción en relación con el rendimiento de la visión fue el objetivo de un estudio de West et al.
(A-37). Los investigadores estudiaron a 629 conductores actuales de 55 años o más durante 2 años. Las variables de interés
fueron el comportamiento al volante, la salud, la función física y la función visual. Los sujetos formaban parte de un estudio de
visión más amplio en el Instituto de Investigación del Ojo Smith-Kettlewell. Una conclusión del estudio fue que los adultos
mayores con cambios tempranos en la función de la visión espacial y la percepción de profundidad parecen reconocer sus
limitaciones y restringen su conducción. ¿Cuál era la población objetivo? ¿La población muestreada?

36.En un estudio piloto realizado por Ayouba et al. (A-38), los investigadores estudiaron a 123 niños nacidos de madres infectadas por
el VIH-1 en Yaound-e, Camerún. A las mujeres embarazadas asesoradas y que dieron su consentimiento se les administró una
dosis única de nevirapina al comienzo del trabajo de parto. A los bebés se les administró un jarabe que contenía nevirapina
dentro de las primeras 72 horas de vida. Los investigadores encontraron que se consideró que el 87 por ciento de los niños no
estaban infectados entre las 6 y las 8 semanas de edad. ¿Cuál es la población objetivo? ¿Cuál es la población muestreada?
210 CAPÍTULO 6 ESTIMACIÓN

37.Consulte el Ejercicio 2.3.11. Construya un intervalo de confianza del 95 por ciento para la media de la poblaciónS/R
relación. ¿Deberías usartozcomo el coeficiente de confiabilidad? ¿Por qué? Describa la población sobre la cual se
pueden hacer inferencias basadas en este estudio.

38.Consulte el Ejercicio 2.3.12. Construya un intervalo de confianza del 90 por ciento para la altura media de la población.
¿Deberías usartozcomo el coeficiente de confiabilidad? ¿Por qué? Describa la población sobre la cual se pueden hacer
inferencias basadas en este estudio.

Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel

1.Consulte los datos del registro de nacimientos de Carolina del Norte NCBIRTH800 con 800 observaciones (consulte el
Ejercicio 1 de datos grandes en el Capítulo 2). Calcule los intervalos de confianza del 95 por ciento para lo siguiente:

(a)el porcentaje de hijos varones


(b)la edad media de una madre que da a luz
(C)el peso medio ganado durante el embarazo
(d)el porcentaje de madres que admiten fumar durante el embarazo
(mi)la diferencia en el peso promedio ganado entre madres fumadoras y no fumadoras
(F)la diferencia en el peso promedio al nacer en gramos entre madres casadas y no casadas
(gramo)la diferencia en el porcentaje de bebés con bajo peso al nacer entre madres casadas y no casadas

2.Consulte los niveles de colesterol sérico para 1000 sujetos (CHOLEST). Seleccione una muestra aleatoria
simple de tamaño 15 de esta población y construya un intervalo de confianza del 95 por ciento para la
media de la población. Compara tus resultados con los de tus compañeros. ¿Qué suposiciones son
necesarias para que su procedimiento de estimación sea válido?
3.Consulte los niveles de colesterol sérico para 1000 sujetos (CHOLEST). Seleccione una muestra aleatoria
simple de tamaño 50 de la población y construya un intervalo de confianza del 95 por ciento para la
proporción de sujetos en la población que tienen lecturas superiores a 225. Compare sus resultados con
los de sus compañeros de clase.
4.Refiérase a los pesos de 1200 bebés nacidos en un hospital comunitario (BEBE WGTS). Extraiga una muestra
aleatoria simple de tamaño 20 de esta población y construya un intervalo de confianza del 95 por ciento para la
media de la población. Compara tus resultados con los de tus compañeros. ¿Qué suposiciones son necesarias
para que su procedimiento de estimación sea válido?
5.Refiérase a los pesos de 1200 bebés nacidos en un hospital comunitario (BEBE WGTS). Extraiga una
muestra aleatoria simple de tamaño 35 de la población y construya un intervalo de confianza del 95 por
ciento para la media de la población. Compare este intervalo con el construido en el Ejercicio 4.
6.Refiérase a las alturas de 1000 niños de doce años (BOY HGTS). Seleccione una muestra aleatoria simple de tamaño
15 de esta población y construya un intervalo de confianza del 99 por ciento para la media de la población. ¿Qué
suposiciones son necesarias para que este procedimiento sea válido?
7.Refiérase a las alturas de 1000 niños de doce años (BOY HGTS). Seleccione una muestra aleatoria simple de
tamaño 35 de la población y construya un intervalo de confianza del 99 por ciento para la media de la
población. Compare este intervalo con el construido en el Ejercicio 5.

REFERENCIAS

Referencias de metodología
1. jOHNA. R.HIELO,Estadística Matemática y Análisis de Datos,2ª ed., Duxbury, Belmont, CA, 1988.
2. WS GOSSET("Estudiante"), "El error probable de una media",Biometrika, 6 (1908), 1–25.
REFERENCIAS 211

3. WV BEHRENS, “Ein Beitrag zu Fehlerberechnung bei wenige Beobachtungen,”Landwirtsschaftliche Jahrbu


€cher, 68 (1929), 807–837.
4. RA FES ELLA, “La comparación de muestras con varianzas posiblemente desiguales”,Anales de eugenesia, 9 (1939), 174–
180.
5. RA FES ELLA, “El enfoque asintótico de la integral de Behrens con más tablas para ladprueba de significación”,
Anales de eugenesia, 11 (1941), 141-172.
6. J. N.EYMAN, "Argumento fiduciario y la teoría de los intervalos de confianza",Biometrika, 32 (1941), 128-150.
7. H. S.CHEF - , “Sobre las soluciones del problema de Behrens-Fisher basado en lat-Distribución,"Anales de Matemática

Estadísticas, 14 (1943), 35–44.


8. H. S.CHEF - , "Una nota sobre el problema de Behrens-Fisher",Anales de estadística matemática, 15 (1944), 430–432.

9. BL WELCH, "La importancia de la diferencia entre dos medias cuando las varianzas de la población son
desiguales",Biometrika, 29 (1937), 350–361.
10. BL WELCH, "La generalización del 'problema del estudiante cuando están involucradas varias varianzas de población
diferentes",Biometrika, 34 (1947), 28–35.
11. WILLIAMGCOCRAN, “Niveles de significancia aproximados de la prueba de Behrens-Fisher,”biometría, 20 (1964),
191-195.
12. RF TCOMIÓy GW KLETÓN, “Intervalos de confianza óptimos para la varianza de una distribución normal,”Revista de la
Asociación Estadounidense de Estadística, 54 (1959), 674–682.
13. HO HARTLEY, "La relación F máxima como prueba abreviada para la heterogeneidad de las varianzas",Biometrika, 37 (
1950), 308–312.
14. JHZArkansas,Análisis bioestadístico,4.ª ed., Prentice-Hall, Upper Saddle River, NJ, 1999.
15. WAYNEWDaniel,Estadística no paramétrica aplicada,2ª ed., PWS-KENT, Boston, 1989.

Aplicaciones Referencias
A-1. norteICOLAMETROAFFULLI, CHERLYTALLON, jUN HIJOWONG, kSOYPAGESPy ROBERTOBFUGAS, “Soporte de peso temprano y
Movilización del tobillo después de la reparación abierta de desgarros agudos de sustancia media del tendón de Aquiles”,Revista
americana de medicina deportiva, 31 (2003), 692–700.
A-2. PAGAULJREBER, LUCYSOYARTINEZ, y SANDRAWEINTRAUB, "Aprendizaje artificial de la gramática en la enfermedad de
Alzheimer",Neurociencia cognitiva, afectiva y conductual, 3 (2003), 145–153.
A-3. CHRISTOPHEPAGEDROLETTI, marianaH€oGMAN, PAGEKKAMETROERILA€INÉN, LENNARTS. N.ORDVALL, gUNILLAHEDLIN, y
kCUAJARAVIVIR, “Capacidad de difusión de óxido nítrico en las vías respiratorias y concentración en la mucosa de escolares
asmáticos”Investigación pediátrica, 54 (2003), 496–501.
A-4. BRUCEDBEYNNON, BradenC. F.LEMING, DÁVIDOLCHURCHILL, y DanielBFILA, “El Efecto de Anterior
Deficiencia del ligamento cruzado y refuerzo funcional en la traslación de la tibia en relación con el fémur durante la
carga y la ausencia de peso”,Revista americana de medicina deportiva, 31 (2003), 99–105.
A-5. LORRENADUGOFF, mAURITHAREVERETT, LOUISVONTVER, y GWYNEBARLEY, "Evaluación de las habilidades de examen
pélvico y mamario de los internos en obstetricia y ginecología y medicina interna",Revista americana de
obstetricia y ginecología, 189 (2003), 655–658.
A-6. DIONNEMETROAYHEW, kARÉNMPERRÍN, y WFINSTRUCHEN, “Análisis de un programa para dejar de fumar Healthy Start”,Revista
estadounidense de estudios de salud, 17 (2002), 186–190.
A-7. miRICGRAMORANHOLM, ROBERTOANTHELLI, RITAMETROONTEIRO, jOHNSEVCIK, y MARILYNSTOLER, “Breve integrado
El tratamiento ambulatorio de diagnóstico dual reduce las hospitalizaciones psiquiátricas”,Revista estadounidense sobre adicciones, 12 (
2003), 306–313.
A-8. SILVIAIANNELO, ANTONINACAVALERI, PAGAOLINAMETROILAZZO, SANTICANTARELLA, y FRANCESCOBELFIORE, “Ayuno Bajo
Nivel de triglicéridos séricos como marcador precoz de trastornos autoinmunes”,Medscape Medicina general, 5 (3)
(2003).
A-9. miVELYNCY Chan, SALIADOW. V.ERNÓN, FREDERICKT. O'DONNEL, CHULAhn, ANTONYGRAMORESINGER, y DONNIEw
AGeorgia, “Consentimiento informado para la detección del cáncer con antígeno prostático específico: ¿qué tan bien reciben el
mensaje los hombres?”Diario Americano de Salud Pública, 93 (2003), 779–785.
A-10. RONALDF.CAMIONETAVOLLENHOVEN, SOFIAmiRESTAM, ANDSHARJU, jOHANBrata, y yoARSkLARESKOG, “Etanercept
Versus Etanercept más metotrexato: un estudio basado en registros que sugiere que la combinación es clínicamente
más eficaz”,Investigación y terapia de la artritis, 5 (2003), R347–R351.
212 CAPÍTULO 6 ESTIMACIÓN

A-11. SATOSHInorteOZAWA, kATSUJISHIMIZU, kIEMETROIYAMOTO, y MIZUOTANAKÁ, "Reparación del defecto pars interarticularis
mediante fijación segmentaria con alambre en atletas jóvenes con espondilólisis",Revista americana de medicina
deportiva, 31 (2003), 359–364.
A-12. METROO YOJ. K.RANTZ, ILANAB.KUTINSKY, AÚLTIMA ESCALERADROBERTSON, y PHILIPSMEHLER, "Efectos de la metadona relacionados con la dosis
en la prolongación del intervalo QT en una serie de pacientes con Torsade de Pointes",Farmacoterapia, 23 (2003), 802–805.

A-13. SUSANNAHFBUEYy DEBORÁFELLOS, "Las búsquedas de salud y el correo electrónico se han vuelto más comunes, pero hay espacio
para mejorar en las búsquedas y el acceso general a Internet".Pew Internet y proyecto de vida estadounidense,
www.pewinternet.org/PPF/r/95/report_display.asp.
A-14. CARLOSMLUNA, DanielBLANZACO, mICHAELS. N.IDERMAN, WALTERARMETROATARUCCO, norteATALIOCBAREDES, PAGABLO
DESMERY, FERNANDOPAGALIZAS, gUILLERMOMETROENGA, FERNANDORiOS, y CARLOSAPEZTEGUIA, "Resolución de
Neumonía asociada al ventilador: evaluación prospectiva de la puntuación clínica de infección pulmonar como
predictor clínico temprano de resultados”,Medicina de Cuidados Críticos, 31 (3) (2003), 676–682.
A-15. ADESGARRARFL SCHINQUEL, jEROENJBHACHA, miRICBOERSMA, ABDOUmiLHENDY, miLENICVOURVOURI, jsistema operativoRTC RÖLANDT,
y DENPAGOLDERMANS, “Evaluación de la viabilidad miocárdica residual en regiones con infarto electrocardiográfico
crónico con onda Q”,Diario americano del corazón, 144 (2002), 865–869.
A-16. FRIEDERIKE VON ZURMETROUHLEN, WEILUMqUAN, DÁVIDOJ. D'APUERTA, y TEXTRAÑOJCOHEN, “Un estudio del seno carotídeo
Pruebas de masaje y mesa basculante con la cabeza hacia arriba en pacientes con síncope y casi síncope”,Diario de Cardiología
Invasiva, 14 (2002), 477–482.
A-17. DanielFCONNOR, RONALDJ. S.TEINGARD, jENNIFERJ. A.NDERSONy RICHARDH. M.ELONI, Jr., “Diferencias de género
en Agresión Reactiva y Proactiva,”Psiquiatría infantil y desarrollo humano, 33 (2003), 279–294.
A-18. ALLANVHORWITZ, CAthySPATZWIDOM, jMIENTESMETROCLAUGHLIN, y HELENERPREGUNTARWHITE, "El impacto de
Abuso y negligencia infantil en la salud mental de los adultos: un estudio prospectivo”,Revista de Salud y Comportamiento
Social, 42 (2001), 184–201.
A-19. PALENGUADO, TMARSHALL, A. R.CASA, BRANDHAWA, H. S.ANGHA, y N.B.HANGÚ, "Ensayo controlado aleatorio del efecto de la información
basada en la evidencia sobre la disposición de las mujeres a participar en la detección del cáncer de cuello uterino", Revista de
Epidemiología y Salud Comunitaria, 57 (2003), 589–593.
A-20. jOHNCOMOPERTO, TSOYkEWHURST, CYNTIAMDOUGHERDAD, y PAULnorteICOL, "Prueba de la eficacia de convertir a los pacientes a
medicamentos antianginosos de acción prolongada: la calidad de vida en la investigación sobre la angina" Diario
americano del corazón, 141 (2001), 550–558.
A-21. PAGUN TRUCORFINLEY, hEIDIR. R.ES, jOANTPONT, SEstados UnidosL. G.ESS, CLEVANTAR ENLOUIE, SCOTTABULL, jANELLEY LEE.UU., y
LES UNABERO, "Impacto de un modelo de atención colaborativa sobre la depresión en un entorno de atención primaria: un
ensayo controlado aleatorio"Farmacoterapia, 23 (9) (2003), 1175–1185.
A-22. METROICHAELHUMMEL, miZIOBONIFACIO, hEIKEESASERKE, y ANETAG ZIEGLER, "La eliminación del gluten dietético no reduce los
títulos de autoanticuerpos asociados a la diabetes tipo 1 en sujetos de alto riesgo",Cuidado de la diabetes, 25 (2002),
1111–1116.
A-23. DVOAIZENBERG, ABRAHAMWEIZMAN, y YORAMBARAK, "Sildenafil para la disfunción eréctil inducida por inhibidores selectivos de la
recaptación de serotonina en pacientes deprimidos de sexo masculino de edad avanzada"Revista de Terapia Sexual y Marital,
29 (2003), 297–303.
A-24. PAGETERBORDENAR, jOHNnorteYLAND, DÁVIDONM CABORTAR, y DÁVIDOPAGIENKOWSKI, “Comparación biomecánica del sistema de
sutura de reparación de menisco FasT-Fix con suturas de colchonero verticales y flechas de menisco,”Revista
americana de medicina deportiva, 31 (2003), 374–378.
A-25. RACHELJALLENy MICHAELTGROSS, "Fuerza de los flexores del dedo del pie y rango de movimiento de extensión pasiva de la
primera articulación metatarsofalángica en personas con fascitis plantar"Revista de fisioterapia ortopédica y
deportiva, 33 (2003), 468–477.
A-26. METROOHEBSMONEIM, kEIKHOSRÓWFIROOZBAKHSH, DOMINICOGRAMOROSS, STEVEND. Y.JOVEN, y GEORGEOMER, "Pulgar
Amputaciones de Team Roping,”Revista americana de medicina deportiva, 31 (2003), 728–735.
A-27. norteETAHORESH, ISRAELORACH, DORONGRAMOOTRO, mEIRmiFRATI, y ALANAPTER, “Comparación de los suicidios
Comportamiento de pacientes adolescentes hospitalizados con trastorno límite de la personalidad y depresión mayor.Revista de
enfermedades nerviosas y mentales, 191 (2003), 582–588.
A-28. R. P.LUTCHIK, y hCAMIONETAPAGRAAG, "La medición de la tendencia suicida, la agresividad y la impulsividad",
Neurofarmacología Clínica, 9(suplemento) (1989), 380–382.
A-29. jOANMG CRANÉ, TEN UNDELANEY, y DONNAHUTCHENS, “Misoprostol oral para la ruptura prematura de membranas a
término”,Revista americana de obstetricia y ginecología, 189 (2003), 720–724.
REFERENCIAS 213

A-30. miLENIkOSTA, norteATASHAJ. L.CONCIENCIA, IUNF GODSLAND, ANNAPAGENNY, VICTORANYAOKU, BARBARASOYILLAUER,


miESTERCELA, DESMONDG. J.OHNSTON, StephenROBINSON, y MARCASOYCCARTÍSTICO, "Resistencia a la insulina y disfunción de las
células beta en mujeres europeas normoglucémicas con antecedentes de diabetes gestacional",Endocrinología
clínica, 59 (2003), 289–297.
A-31. DEWEYC. S.CHEID, marioTCOLEMANy ROBERTOMHAMM, "¿Afectan las percepciones de riesgo y la calidad de vida el uso de la terapia de
reemplazo hormonal por parte de las mujeres posmenopáusicas?"Revista de la Junta Estadounidense de Medicina Familiar, 16
(2003), 270–277.
A-32. METROARIOEELLIOTT, norteNIECBINKLEY, mOLLYCARNÉS, DÁVIDOR ZINMERSIÓN, kSOYPAGETERSEN, kAthykPNA, jESSICAj
BEHLKE, norteANCYAHMANN, y MARIOAKIESER, “Riesgos de fracturas para mujeres en cuidados a largo plazo: alta prevalencia
de osteoporosis del calcáneo e hipovitaminosis D,”Farmacoterapia, 23 (2003), 702–710.
A-33. JF TAHMASSEBIy MEJCURZÓN, “La causa del babeo en niños con parálisis cerebral: ¿hipersalivación o defecto de
deglución?”Revista Internacional de Odontología Pediátrica, 13 (2003), 106–111.
A-34. PAGUN TRUCOJCULLIGAN, ROGERPGOLDBERG, y PETERKSY, "Un ensayo controlado aleatorio que compara un procedimiento de
Burch modificado y un cabestrillo suburetral: seguimiento a largo plazo",Revista Internacional de Uroginecología, 14
(2003), 229–233.
A-35. METROEREDITHLBORLANDO, IUNjACOBS, y GARIOGRAMOEELHOE, "El fentanilo intranasal reduce el dolor agudo en niños en el
departamento de emergencias: un estudio de seguridad y eficacia",Medicina de Urgencias, 14 (2002), 275–280.
A-36. jANEMETROCCusker, mARTINGCVIEJO, norteANDINIDENDUKURI, y miRICBELZILE, “¿El delirio aumenta la estancia
hospitalaria?”Diario de la Sociedad Americana de Geriatría, 51 (2003), 1539–1546.
A-37. CATERINAG. W.est, gINNYGRAMOILDENGORIN, gUNILLAHAEGERSTROMPAGORTNOY, LO YOA. L.OTT, mARILYNESCUELLO, y
jOHNABRABÍN, “Autorestricción de la visión y la conducción en adultos mayores”,Diario de la Sociedad Americana de
Geriatría, 51 (2003), 1348–1355.
A-38. AHIDJOATUBA, gILBERTTES, PAGUN TRUCOCUNIN, YACOUBAFOUPOUAPOUOGNI, miLISABETHMETROENU, ANFUMBOM
kFUTURO, jOCELYNThonnon, gABRIELASCARLATTI, mARCELMETROONNY-LOBE - , norteICOLEmiTEKI, CHARLESkOUANFACK,

METROICHELETARDÍO, ROBERTOLSUPLIR LAS DEFICIENCIAS, mAURICEnorteKAM, ANNEESPRESTAR, FRANCOSOISEBARRE - - SINOUSSI, PAGAULMV MARTIN,
y miRICnorteERRIENET, “Baja tasa de transmisión maternoinfantil del VIH-1 después de la intervención con nevirapina en
un programa piloto de salud pública en Yaound-e, Camerún”,Diario del Síndrome de Inmunodeficiencia Adquirida,
34 (2003), 274–280.
CAPÍTULO 7
EVALUACIÓN DE LA HIPÓTESIS

RESUMEN DEL CAPÍTULO

Este capítulo cubre la prueba de hipótesis, la segunda de dos áreas generales de


inferencia estadística. La prueba de hipótesis es un tema con el que usted, como
estudiante, probablemente esté familiarizado. La estimación de intervalos, discutida en el
capítulo anterior, y la prueba de hipótesis se basan en conceptos similares. De hecho, los
intervalos de confianza se pueden utilizar para llegar a las mismas conclusiones a las que
se llega mediante el uso de pruebas de hipótesis. Este capítulo proporciona un formato,
seguido a lo largo del resto de este libro, para realizar una prueba de hipótesis.

TEMAS

7.1INTRODUCCIÓN
7.2PRUEBA DE HIPÓTESIS: UNA ÚNICA MEDIA POBLACIONAL
7.3PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS MEDIAS DE POBLACIÓN

7.4COMPARACIONES POR PARES

7.5PRUEBA DE HIPÓTESIS: UNA PROPORCIÓN ÚNICA DE LA POBLACIÓN

7.6PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS PROPORCIONES DE


POBLACIÓN
7.7PRUEBA DE HIPÓTESIS: UNA VARIACIÓN ÚNICA DE LA POBLACIÓN

7.8PRUEBA DE HIPÓTESIS: LA RAZÓN DE LAS VARIACIONES DE DOS POBLACIONES

7.9EL ERROR TIPO II Y EL PODER DE UNA PRUEBA


7.10DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA CONTROLAR LOS ERRORES TIPO II

7.11RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. comprender cómo plantear correctamente una hipótesis nula y alternativa y realizar una prueba de
hipótesis estructurada.
2. comprender los conceptos de error tipo I, error tipo II y la potencia de una prueba.
3. ser capaz de calcular e interpretar z,yo,F, y estadísticas de prueba de chi-cuadrado para hacer
inferencias estadísticas.
4. entender cómo calcular e interpretarpagvalores.

214
7.1 INTRODUCCIÓN 215

7.1 INTRODUCCIÓN

Un tipo de inferencia estadística, la estimación, se analiza en el capítulo anterior. El otro tipo, la


prueba de hipótesis, es el tema de este capítulo. Como ocurre con la estimación, laEl propósito de la
prueba de hipótesis es ayudar al médico, investigador o administrador a llegar a una conclusión sobre
una población mediante el examen de una muestra de esa población.La estimación y la prueba de
hipótesis no son tan diferentes como parece por el hecho de que la mayoría de los libros de texto
dedican un capítulo separado a cada una. Como explicaremos más adelante, se pueden usar los
intervalos de confianza para llegar a las mismas conclusiones a las que se llega al usar los
procedimientos de prueba de hipótesis discutidos en este capítulo.

Conceptos básicosEn esta sección se presentan algunos de los conceptos básicos esenciales para la
comprensión de la prueba de hipótesis. Los detalles específicos de las pruebas particulares se darán
en las secciones siguientes.

DEFINICIÓN
Ahipótesispuede definirse simplemente comoun enunciado sobre una o más
poblaciones.

La hipótesis se ocupa con frecuencia de los parámetros de las poblaciones sobre las que se
hace el enunciado. El administrador de un hospital puede plantear la hipótesis de que la estancia
media de los pacientes ingresados en el hospital es de 5 días; una enfermera de salud pública puede
plantear la hipótesis de que un programa educativo en particular resultará en una mejor
comunicación entre la enfermera y el paciente; un médico puede formular la hipótesis de que un
determinado fármaco será eficaz en el 90 por ciento de los casos en los que se utilice. Por medio de la
prueba de hipótesis se determina si tales afirmaciones son o no compatibles con los datos
disponibles.

Tipos de hipótesisLos investigadores se ocupan de dos tipos de hipótesis: hipótesis


de investigación e hipótesis estadísticas.

DEFINICIÓN
Elhipótesis de la investigaciónes la conjetura o suposición que motiva la
investigación.

Puede ser el resultado de años de observación por parte del investigador. Una enfermera de
salud pública, por ejemplo, pudo haber notado que ciertos clientes respondían más fácilmente a un
tipo particular de programa de educación para la salud. Un médico puede recordar numerosos casos
en los que ciertas combinaciones de medidas terapéuticas fueron más eficaces que cualquiera de
ellas sola. Los proyectos de investigación a menudo resultan del deseo de tales profesionales de la
salud de determinar si sus teorías o sospechas pueden o no ser respaldadas cuando se someten a los
rigores de la investigación científica.
216 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Las hipótesis de investigación conducen directamente a hipótesis estadísticas.

DEFINICIÓN
Hipótesis estadísticasson hipótesis que se formulan de tal manera que pueden
ser evaluadas mediante técnicas estadísticas apropiadas.

En este libro, las hipótesis en las que nos centraremos son hipótesis estadísticas.
Supondremos que las hipótesis de investigación para los ejemplos y ejercicios ya han sido
consideradas.

Pasos de la prueba de hipótesisPor conveniencia, la prueba de hipótesis se presentará


como un procedimiento de diez pasos. No hay nada mágico o sagrado en este formato en
particular. Simplemente divide el proceso en una secuencia lógica de acciones y decisiones.

1. Datos.Debe entenderse la naturaleza de los datos que forman la base de los


procedimientos de prueba, ya que esto determina la prueba particular a emplear.
Debe determinarse si los datos consisten en conteos o mediciones, por ejemplo.
2. Supuestos.Como aprendimos en el capítulo sobre estimación, diferentes suposiciones conducen
a modificaciones de los intervalos de confianza. Lo mismo es cierto en la prueba de hipótesis:
un procedimiento general se modifica dependiendo de los supuestos. De hecho, las mismas
suposiciones que son importantes en la estimación son importantes en la prueba de hipótesis.
Hemos visto que estos incluyen supuestos sobre la normalidad de la distribución de la
población, la igualdad de las varianzas y la independencia de las muestras.

3. Hipótesis.Hay dos hipótesis estadísticas involucradas en la prueba de hipótesis, y estas


deben establecerse explícitamente. Elhipótesis nulaes elhipótesis a probar.Se designa
con el símboloH0. La hipótesis nula a veces se denomina hipótesis de no diferencia,ya que
es una declaración de acuerdo con (o sin diferencia de) condiciones que se presumen
verdaderas en la población de interés. En general, la hipótesis nula se establece con el
propósito expreso de desacreditarla. En consecuencia, el complemento de la conclusión a
la que el investigador busca llegar se convierte en el enunciado de la hipótesis nula. En el
proceso de prueba, la hipótesis nula se rechaza o no se rechaza. Si no se rechaza la
hipótesis nula, diremos que los datos en los que se basa la prueba no proporcionan
evidencia suficiente para provocar el rechazo. Si el procedimiento de prueba conduce al
rechazo, diremos que los datos disponibles no son compatibles con la hipótesis nula,
pero apoyan alguna otra hipótesis. El hipótesis alternativaes una declaración de lo que
creeremos que es cierto si los datos de nuestra muestra nos hacen rechazar la hipótesis
nula. Por lo general, la hipótesis alternativa y la hipótesis de investigación son las mismas
y, de hecho, los dos términos se usan indistintamente. Designaremos la hipótesis
alternativa con el símboloHA.

Reglas para establecer hipótesis estadísticasCuando las hipótesis son del


tipo considerado en este capítulo una indicación de igualdaddcualquiera¼; -;o -Þdebe
aparecer en la hipótesis nula. Supongamos, por ejemplo, que queremos responder a la
7.1 INTRODUCCIÓN 217

pregunta: ¿Podemos concluir que cierta media poblacional no es 50? La


hipótesis nula es
H0:metro¼50

y la alternativa es
HA:metro6¼50

Supongamos que queremos saber si podemos concluir que la media de la población es mayor que 50.
Nuestras hipótesis son

H0:m-50 HA:metro >50

Si queremos saber si podemos concluir que la media poblacional es menor que 50, las
hipótesis son

H0:m-50 HA:m <50

En resumen, podemos enunciar las siguientes reglas empíricas para decidir qué
enunciado se incluye en la hipótesis nula y qué enunciado se incluye en la hipótesis
alternativa:

(a)Lo que usted espera o espera poder concluir como resultado de la prueba por lo general
debe colocarse en la hipótesis alternativa.
(b)La hipótesis nula debe contener un enunciado de igualdad, ya sea¼; -;o -.
(C)La hipótesis nula es la hipótesis que se prueba.
(d)Las hipótesis nula y alternativa son complementarias. Es decir, los dos juntos agotan
todas las posibilidades en cuanto al valor que puede asumir el parámetro hipotético.

Una precauciónCabe señalar que ni la prueba de hipótesis ni la inferencia estadística, en


general, conducen a la prueba de una hipótesis; simplemente indica si la hipótesis está
respaldada o no por los datos disponibles. Cuando fallamos en rechazar una hipótesis nula, por
lo tanto, no decimos que es verdadera, sino que puede ser verdadera. Cuando hablamos de
aceptar una hipótesis nula, tenemos en mente esta limitación y no queremos transmitir la idea
de que aceptar implica prueba.

4. Estadística de prueba.La estadística de prueba es alguna estadística que se puede calcular a partir de
los datos de la muestra. Como regla, hay muchos valores posibles que la estadística de prueba puede
asumir, dependiendo el valor particular observado de la muestra particular extraída. Como veremos,
el estadístico de prueba sirve como tomador de decisiones, ya que la decisión de rechazar o no la
hipótesis nula depende de la magnitud del estadístico de prueba. Un ejemplo de una estadística de
prueba es la cantidad

-X metro
z¼ pffiffi0ff (7.1.1)
s= norte
218 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

dóndemetro0es un valor hipotético de una media poblacional. Este estadístico de prueba está relacionado con el
estadístico

-X metro
z¼ pffiffiffi (7.1.2)
s= norte

con el que ya estamos familiarizados.

Fórmula general para la estadística de pruebaLa siguiente es una fórmula general para un
estadístico de prueba que será aplicable en muchas de las pruebas de hipótesis discutidas en este
libro:

estadística relevante parámetro hipotético


Estadística de prueba¼
error estándar de la estadística relevante

pffiffiffi
En la Ecuación 7.1.1, -Xes la estadística relevante,metro0es el parámetro hipotético, ys= el error nortees

estándar de -X,la estadística correspondiente.

5. Distribución de la estadística de prueba.Se ha señalado que la clave de la inferencia estadística es


la distribución muestral. Se nos recuerda esto nuevamente cuando se hace necesario
especificar la distribución de probabilidad del estadístico de prueba. La distribución del
estadístico de prueba.

-X metro
z¼ pffiffi0ff
s= norte

por ejemplo, sigue la distribución normal estándar si la hipótesis nula es verdadera y se


cumplen los supuestos.
6. Regla de decisión.Todos los valores posibles que puede asumir el estadístico de prueba son puntos en
el eje horizontal del gráfico de distribución del estadístico de prueba y se dividen en dos grupos; un
grupo constituye lo que se conoce como elregión de rechazoy el otro grupo forma elregión de no
rechazo.Los valores del estadístico de prueba que forman la región de rechazo son aquellos valores
que tienen menos probabilidades de ocurrir si la hipótesis nula es verdadera, mientras que los valores
que componen la región de aceptación tienen más probabilidades de ocurrir si la hipótesis nula es
verdadera.La regla de decisión nos dice que rechacemos la hipótesis nula si el valor del estadístico de
prueba que calculamos de nuestra muestra es uno de los valores en la región de rechazo y que no
rechacemos la hipótesis nula si el valor calculado del estadístico de prueba es uno de los valores en la
región de no rechazo.

Nivel significativoLa decisión sobre qué valores van a la región de rechazo y cuáles van a la
región de no rechazo se toma sobre la base de la deseadanivel de significancia,diseñado pora.El
términonivel de significanciarefleja el hecho de que las pruebas de hipótesis a veces se
denominan pruebas de significación, y se dice que un valor calculado del estadístico de prueba
que cae en la región de rechazo essignificativo.El nivel de importancia,a,especifica el área bajo
la curva de la distribución de la estadística de prueba que está por encima de los valores en el
eje horizontal que constituye la región de rechazo.
7.1 INTRODUCCIÓN 219

DEFINICIÓN
Elnivel de significanciaaes una probabilidad y, de hecho, es laprobabilidad de
rechazar una hipótesis nula verdadera.

Dado que rechazar una hipótesis nula verdadera constituiría un error, parece
razonable que hagamos pequeña la probabilidad de rechazar una hipótesis nula
verdadera y, de hecho, eso es lo que se hace. Seleccionamos un pequeño valor deapara
hacer pequeña la probabilidad de rechazar una hipótesis nula verdadera. Los valores más
frecuentes deason .01, .05 y .10.

Tipos de erroresEl error que se comete cuando se rechaza una hipótesis nula verdadera se
llamaerror tipo I.Elerror de tipo IIes el error que se comete cuando no se rechaza una hipótesis
nula falsa. La probabilidad de cometer un error tipo II se designa porb.
Siempre que rechazamos una hipótesis nula siempre existe el riesgo concomitante de cometer un
error tipo I, rechazando una hipótesis nula verdadera. Cada vez que fallamos en rechazar una hipótesis nula,
el riesgo de fallar en rechazar una hipótesis nula falsa siempre está presente. Hacemosa pequeño, pero
generalmente no ejercemos ningún control sobreb,aunque sabemos que en la mayoría de las situaciones
prácticas es mayor quea.
Nunca sabemos si hemos cometido uno de estos errores cuando rechazamos o no rechazamos
una hipótesis nula, ya que se desconoce el verdadero estado de cosas. Si el procedimiento de prueba
conduce al rechazo de la hipótesis nula, podemos consolarnos con el hecho de que hicimosa pequeña
y, por tanto, la probabilidad de cometer un error tipo I era pequeña. Si no rechazamos la hipótesis
nula, no conocemos el riesgo concurrente de cometer un error tipo II, ya quebgeneralmente se
desconoce pero, como se ha señalado, sabemos que, en la mayoría de las situaciones prácticas, es
más grande quea.
La Figura 7.1.1 muestra, para varias condiciones de una prueba de hipótesis, las posibles acciones que
puede tomar un investigador y las condiciones bajo las cuales se cometerá cada uno de los dos tipos de
error. La tabla que se muestra en esta figura es un ejemplo de lo que generalmente se conoce comomatriz
de confusión.

7. Cálculo de la estadística de prueba.A partir de los datos contenidos en la muestra, calculamos un


valor de la estadística de prueba y lo comparamos con las regiones de rechazo y no rechazo que
ya se han especificado.
8. Decisión estadística.La decisión estadística consiste en rechazar o no rechazar la
hipótesis nula. Se rechaza si el valor calculado del estadístico de prueba cae en el

Condición de hipótesis nula

Verdadero FALSO

Fallar a Acción correcta Error tipo II


rechazarH0
Posible
Acción
RechazartH0 error tipo I Acción correcta

FIGURA 7.1.1Condiciones bajo las cuales se pueden cometer errores tipo I y tipo II.
220 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

región de rechazo, y no se rechaza si el valor calculado del estadístico de prueba cae en la


región de no rechazo.
9. Conclusión.SiH0es rechazada, concluimos queHAes verdad. SiH0no se rechaza, concluimos
queH0puede ser verdad.
10pagvalores.ElpagEl valor es un número que nos dice qué tan inusuales son los resultados de nuestra muestra,
dado que la hipótesis nula es verdadera. ApagEl valor que indica que es poco probable que se hayan
producido los resultados de la muestra, si la hipótesis nula es verdadera, proporciona una justificación para
dudar de la veracidad de la hipótesis nula.

DEFINICIÓN
Avalor pes la probabilidad de que el valor calculado de un estadístico de prueba sea al menos
tan extremo como un valor especificado del estadístico de prueba cuando la hipótesis nula es
verdadera. Por lo tanto, lavalor pes el valor más pequeño deapara lo cual podemos rechazar
una hipótesis nula.

Resaltamos que cuando no se rechaza la hipótesis nula no se debe decir que se acepta la
hipótesis nula. Deberíamos decir que la hipótesis nula “no se rechaza”. Evitamos usar la palabra
“aceptar” en este caso porque podemos haber cometido un error tipo II. Dado que, con
frecuencia, la probabilidad de cometer un error de tipo II puede ser bastante alta, no queremos
comprometernos a aceptar la hipótesis nula.
La figura 7.1.2 es un diagrama de flujo de los pasos que seguimos cuando realizamos una hipótesis.
prueba.

Propósito de la prueba de hipótesisEl propósito de la prueba de hipótesis es ayudar a los


administradores y médicos a tomar decisiones. La decisión administrativa o clínica suele
depender de la decisión estadística. Si se rechaza la hipótesis nula, la decisión administrativa o
clínica suele reflejarlo, en el sentido de que la decisión es compatible con la hipótesis
alternativa. Lo contrario suele ser cierto si no se rechaza la hipótesis nula. La decisión
administrativa o clínica, sin embargo, puede adoptar otras formas, como la decisión de
recopilar más datos.
También enfatizamos que los procedimientos de prueba de hipótesis resaltados en el resto de
este capítulo generalmente examinan el caso de datos normalmente distribuidos o casos donde los
procedimientos son apropiados porque se aplica el teorema del límite central. En la práctica, no es
raro que las muestras sean pequeñas en relación con el tamaño de la población, o que tengan
muestras muy sesgadas y, por lo tanto, se viole el supuesto de normalidad. Métodos para manejar
esta situación, es decirsin distribuciónométodos no paramétricos,se examinan en detalle en el
capítulo 13. La mayoría de los paquetes de computadora incluyen un procedimiento analítico (por
ejemplo, la prueba de Shapiro-Wilk o Anderson-Darling) para probar la normalidad. Es importante que
dichas pruebas se lleven a cabo antes del análisis de los datos. Además, cuando se prueban dos
muestras, existe la suposición implícita de que las varianzas son iguales. Las pruebas para esta
suposición se proporcionan en la Sección 7.8. Finalmente, cabe señalar que las pruebas de hipótesis,
al igual que los intervalos de confianza, son relativamente
7.1 INTRODUCCIÓN 221

Evaluar
datos

Rdover
asumir pciones

Calle ate
hipotético tesis

Sel etc.
tecalle
estati palos

mío
Desalentar

bución
distribuir
de test
estati palos

ate
Calle

sión
decidir
tu le

tutarde
Calcular

tecalle
estati palos

No Hacer
rechazarH0
estadístico RechazarH0
decisión

ConcluirH0 ConcluirHA
puede ser verdad es verdad

FIGURA 7.1.2Pasos en el procedimiento de prueba de hipótesis.

sensible al tamaño de las muestras que se analizan, y se debe tener cuidado al interpretar los
resultados que involucran tamaños de muestra muy pequeños.
Sin embargo, debemos enfatizar en este punto que el resultado de la prueba estadística
es solo una pieza de evidencia que influye en la decisión administrativa o clínica. La decisión
estadística no debe interpretarse como definitiva, sino que debe considerarse junto con toda la
demás información relevante disponible para el experimentador.
Con estos comentarios generales como antecedentes, ahora discutimos hipótesis específicas
pruebas
222 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

7.2 PRUEBA DE HIPÓTESIS: UNA


ÚNICA MEDIA POBLACIONAL

En esta sección consideramos la prueba de una hipótesis sobre la media de una población bajo tres
condiciones diferentes: (1) cuando el muestreo es de una población de valores distribuida
normalmente con varianza conocida; (2) cuando el muestreo proviene de una población normalmente
distribuida con varianza desconocida, y (3) cuando el muestreo proviene de una población que no
tiene una distribución normal. Aunque la teoría para las condiciones 1 y 2 depende de poblaciones
distribuidas normalmente, es una práctica común hacer uso de la teoría cuando las poblaciones
relevantes solo tienen una distribución aproximadamente normal. Esto es satisfactorio siempre que la
salida de la normalidad no sea drástica. Cuando el muestreo es de una población distribuida
normalmente y se conoce la varianza de la población, el estadístico de prueba para probarH0:metro¼
metro0es

-X metro
z¼ pffiffiffi (7.2.1)
s= norte

que cuandoH0es cierto, se distribuye como la normal estándar. Los ejemplos 7.2.1 y 7.2.2
ilustran la prueba de hipótesis en estas condiciones.

Muestreo de poblaciones normalmente distribuidas: Población


Desviaciones conocidasComo hicimos en el capítulo 6, nuevamente enfatizamos que las situaciones
en las que la variable de interés se distribuye normalmente con una varianza conocida son raras. El
siguiente ejemplo, sin embargo, servirá para ilustrar el procedimiento.

EJEMPLO 7.2.1
Los investigadores están interesados en la edad media de una determinada población. Digamos que
se hacen la siguiente pregunta: ¿Podemos concluir que la media de edad de esta población es
diferente de los 30 años?

Solución: Con base en nuestro conocimiento de la prueba de hipótesis, respondemos que pueden
concluir que la edad media es diferente de 30 si pueden rechazar la hipótesis nula de que la
media es igual a 30. Usemos el procedimiento de prueba de hipótesis de diez pasos que se
da en el sección anterior para ayudar a los investigadores a llegar a una conclusión.

1. Datos.Los datos disponibles para los investigadores son las edades de una
muestra aleatoria simple de 10 individuos extraídos de la población de
interés. De esta muestra una media de -X¼27 ha sido calculado.
2. Supuestos.Se supone que la muestra proviene de una población cuyas edades
se distribuyen aproximadamente normalmente. Supongamos también que la
población tiene una varianza conocida des2¼20
3. Hipótesis.La hipótesis a contrastar, o hipótesis nula, es que la edad
media de la población es igual a 30 años. La hipótesis alternativa es
7.2 PRUEBA DE HIPÓTESIS: UNA ÚNICA MEDIA POBLACIONAL 223

que la edad media de la población no es igual a 30 años. Nótese que estamos


identificando con la hipótesis alternativa la conclusión a la que quieren llegar los
investigadores, por lo que si los datos permiten rechazar la hipótesis nula, la
conclusión de los investigadores tendrá más peso , ya que la probabilidad
correspondiente de rechazar una hipótesis nula verdadera será pequeña. Nos
aseguraremos de esto asignando un pequeño valor aa,la probabilidad de cometer
un error tipo I. Podemos presentar las hipótesis relevantes en forma compacta de
la siguiente manera:

H0:metro¼30
HA:metro6¼30

4. Estadística de prueba.Dado que estamos probando una hipótesis sobre la media de una
población, dado que suponemos que la población tiene una distribución normal y dado
que se conoce la varianza de la población, nuestro estadístico de prueba está dado por la
Ecuación 7.2.1.

5. Distribución de la estadística de prueba.Con base en nuestro conocimiento de las


distribuciones muestrales y la distribución normal, sabemos que el estadístico de
prueba se distribuye normalmente con una media de 0 y una varianza de 1, siH0es
verdad. Hay muchos valores posibles del estadístico de prueba que la situación
actual puede generar; uno por cada muestra posible de tamaño 10 que se pueda
extraer de la población. Dado que extraemos solo una muestra, solo tenemos uno
de estos valores posibles en el que basar una decisión.

6. Regla de decisión.La regla de decisión nos dice que rechacemosH0si el valor calculado de
la estadística de prueba cae en la región de rechazo y falla en rechazarH0
si cae en la región de no rechazo. Ahora debemos especificar las regiones de
rechazo y no rechazo. Podemos comenzar preguntándonos qué magnitud de
valores del estadístico de prueba provocará el rechazo deH0. Si la hipótesis nula es
falsa, puede ser porque la media de la población es menor que 30 o porque la
media de la población es mayor que 30. Por lo tanto, los valores suficientemente
pequeños o suficientemente grandes del estadístico de prueba provocarán el
rechazo de la hipótesis nula. hipótesis. Queremos que estos valores extremos
constituyan la región de rechazo. ¿Qué tan extremo debe ser un valor posible del
estadístico de prueba para calificar para la región de rechazo? La respuesta
depende del nivel de significación que elijamos, es decir, del tamaño de la
probabilidad de cometer un error tipo I. Digamos que queremos que la
probabilidad de rechazar una hipótesis nula verdadera seaa¼ :05. Dado que
nuestra región de rechazo constará de dos partes, valores suficientemente
pequeños y valores suficientemente grandes del estadístico de prueba, parte dea
tendrá que asociarse con los valores grandes y parte con los valores pequeños.
Parece razonable que dividamosapor igual y dejarun =2¼ :025 estar asociado con
valores pequeños yun =2¼ :025 estar asociado con valores grandes.
224 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Valor crítico de la estadística de prueba

¿Qué valor del estadístico de prueba es tan grande que, cuando la hipótesis nula es verdadera, la
probabilidad de obtener un valor tan grande o mayor es .025? En otras palabras, ¿cuál es el valor dez¿a la
derecha de la cual se encuentra .025 del área bajo la distribución normal estándar? El valor deza la derecha
del cual se encuentra .025 del área es el mismo valor que tiene .975 del área entre él y1.Buscamos en el
cuerpo de la Tabla D del Apéndice hasta que encontramos .975 o su valor más cercano y leemos las entradas
marginales correspondientes para obtener nuestrazvalor. En el presente ejemplo el valor dezes 1,96. Un
razonamiento similar nos llevará a encontrar 1:96 como el valor del estadístico de prueba tan pequeño que
cuando la hipótesis nula es verdadera, la probabilidad de obtener un valor tan pequeño o menor es .025.
Nuestra región de rechazo, entonces, consiste en todos los valores del estadístico de prueba iguales o
mayores a 1.96 y menores o iguales a 1:96. La región de no rechazo consta de todos los valores intermedios.
Podemos establecer la regla de decisión para esta prueba de la siguiente manera:rechazar H0si el valor
calculado de la estadística de prueba es -1:96o
- 1:96. De lo contrario, no rechacesH0. Las regiones de rechazo y no rechazo se muestran en
la figura 7.2.1. Los valores del estadístico de prueba que separan las regiones de rechazo y no
rechazo se denominanvalores criticosdel estadístico de prueba, y la región de rechazo a veces
se denominaregión crítica.
La regla de decisión nos dice que calculemos un valor del estadístico de prueba a partir
de los datos de nuestra muestra y rechacemosH0si obtenemos un valor que es igual o mayor a
1.96 o igual o menor a 1:96 y no logramos rechazarH0si obtenemos cualquier otro valor. El valor
deay, por lo tanto, la regla de decisión debe decidirse antes de recopilar los datos. Esto evita
que se nos acuse de permitir que los resultados de la muestra influyan en nuestra elección dea.
Esta condición de objetividad es muy deseable y debe preservarse en todas las pruebas.

7. Cálculo de la estadística de prueba. De nuestra muestra calculamos

27 30 3
z¼pffiffiffiffiffiffiffiffiffiffiffiffiffi¼ ¼2:12
20=10 1:4142

8. Decisión estadística.Siguiendo la regla de decisión, podemos rechazar la


hipótesis nula ya que 2:12 está en la región de rechazo. Nosotros

s=1

. 95
a/2= .025 a/2 = .025

_1.96 0 1.96 z

Región de rechazo no rechazo Región de rechazo


región
FIGURA 7.2.1Regiones de rechazo y no rechazo para el ejemplo 7.2.1.
7.2 PRUEBA DE HIPÓTESIS: UNA ÚNICA MEDIA POBLACIONAL 225

puede decir que el valor calculado del estadístico de prueba es significativo


en el nivel .05.
9. Conclusión.Concluimos quemetrono es igual a 30 y que nuestras
actuaciones administrativas o clínicas estén de acuerdo con esta
conclusión.
10pagvalores.En lugar de decir que un valor observado del estadístico de prueba
es significativo o no, la mayoría de los escritores en la literatura de
investigación prefieren informar la probabilidad exacta de obtener un valor
tan extremo o más extremo que el observado si la hipótesis nula es
verdadera. En el presente caso, estos escritores darían el valor calculado del
estadístico de prueba junto con la declaraciónpag¼ :0340. La declaraciónpag
¼ :0340 significa que la probabilidad de obtener un valor tan extremo como
2.12 en cualquier dirección, cuando la hipótesis nula es verdadera, es . 0340.
El valor .0340 se obtiene de la Tabla D del Apéndice y es la probabilidad de
observar unz-2:12 o unz-2:12 cuando la hipótesis nula es verdadera. Eso es
cuandoH0es cierto, la probabilidad de obtener un valor deztan grande como o
mayor que 2.12 es .0170, y la probabilidad de observar un valor deztan
pequeño como o más pequeño que
2:12 es .0170. La probabilidad de que ocurra uno u otro de estos
eventos, cuandoH0es verdadera, es igual a la suma de las dos
probabilidades individuales, y por lo tanto, en el presente ejemplo,
decimos que pag¼ :0170þ :0170¼ :0340.

Recuerda que elpagvalor para una prueba puede definirse también


como el valor más pequeño deapor lo que se puede rechazar la hipótesis
nula. Dado que, en el Ejemplo 7.2.1, nuestropagvalor es .0340, sabemos que
podríamos haber elegido unavalor tan pequeño como .0340 y aun así han
rechazado la hipótesis nula. Si hubiéramos elegido unamenor que .0340, no
habríamos podido rechazar la hipótesis nula. Una regla general que vale la
pena recordar, entonces, es esta:si el valor de p es menor o igual quea,
rechazamos la hipótesis nula; si el valor p es mayor quea,no rechazamos la
hipótesis nula.
el reportaje depagvalores como parte de los resultados de una investigación es
más informativo para el lector que afirmaciones como "la hipótesis nula se rechaza en
el nivel de significancia de .05" o "los resultados no fueron significativos en el nivel de
.05". Reportando elpagEl valor asociado con una prueba le permite al lector saber cuán
común o cuán raro es el valor calculado de la estadística de prueba dado queH0es
verdad. &

PruebasH0por medio de un intervalo de confianzaAnteriormente, dijimos que


uno puede usar intervalos de confianza para probar hipótesis. En el ejemplo 7.2.1 usamos un
procedimiento de prueba de hipótesis para probarH0:metro¼30 contra la alternativa,HA:metro
6¼30. Pudimos rechazarH0porque el valor calculado de la estadística de prueba cayó en la
región de rechazo.
226 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Veamos cómo podríamos haber llegado a esta misma conclusión usando un 100d1aÞ intervalo de
confianza porcentual. El intervalo de confianza del 95 por ciento parametroes

27 pffiffiffiffiffiffiffiffiffiffiffiffiffi 1:96 20=10

27 1:96d1:414Þ
27 2:7714
d24:2286; 29:7714Þ

Como este intervalo no incluye 30, decimos que 30 no es candidato para la media que estamos
estimando y, por lo tanto,metrono es igual a 30 yH0se rechaza. Esta es la misma conclusión
alcanzada por medio del procedimiento de prueba de hipótesis.
Si el parámetro hipotético, 30, hubiera estado dentro del intervalo de confianza del 95
por ciento, habríamos dicho queH0no se rechaza en el nivel de significancia de .05. En general,al
probar una hipótesis nula por medio de un intervalo de confianza bilateral, rechazamos H0en el
anivel de significación si el parámetro hipotético no está contenido dentro de la100d1aÞ
intervalo de confianza porcentual. Si el parámetro hipotético está contenido dentro del
intervalo, H0no puede ser rechazado en elanivel de significancia.

Pruebas de hipótesis unilateralesLa prueba de hipótesis ilustrada por el ejemplo 7.2.1 es un


ejemplo de unaprueba de dos caras,llamado así porque la región de rechazo se divide entre los
dos lados o colas de la distribución de la estadística de prueba. Una prueba de hipótesis puede
serUnilateral,en cuyo caso toda la región de rechazo está en una u otra cola de la distribución.
El uso de una prueba unilateral o bilateral depende de la naturaleza de la pregunta que haga el
investigador.
Si tanto los valores grandes como los pequeños provocan el rechazo de la hipótesis nula, se indica
una prueba bilateral. Cuando solo valores suficientemente "pequeños" o solo valores suficientemente
"grandes" causarán el rechazo de la hipótesis nula, se indica una prueba unilateral.

EJEMPLO 7.2.2
Consulte el Ejemplo 7.2.1. Supongamos que, en lugar de preguntar si podrían concluir quemetro6¼30,
los investigadores habían preguntado: ¿Podemos concluir quem <30? A esta pregunta
responderíamos que pueden concluir así si pueden rechazar la hipótesis nula de quem-30

Solución: Repasemos el procedimiento de diez pasos para llegar a una decisión basada en una prueba
unilateral.

1. Datos.Ver el ejemplo anterior.


2. Supuestos.Ver el ejemplo anterior.
3. Hipótesis.

H0:m-30
HA:m <30

La desigualdad en la hipótesis nula implica que la hipótesis nula consta de


un número infinito de hipótesis. La prueba se realizará únicamente
7.2 PRUEBA DE HIPÓTESIS: UNA ÚNICA MEDIA POBLACIONAL 227

en el punto de igualdad, ya que se puede demostrar que siH0se rechaza cuando


la prueba se hace en el punto de igualdad, se rechazaría si la prueba se hiciera
para cualquier otro valor demetroindicado en la hipótesis nula.
4. Estadística de prueba.

-X metro
z¼ pffiffi0ff
s= norte

5. Distribución de la estadística de prueba.Ver el ejemplo anterior.


6. Regla de decisión.Usemos de nuevoa¼ :05. Para determinar dónde ubicar la región
de rechazo, preguntémonos qué magnitud de valores provocaría el rechazo de la
hipótesis nula. Si nos fijamos en las hipótesis, vemos que valores suficientemente
pequeños provocarían rechazo y que valores grandes tenderían a reforzar la
hipótesis nula. Querremos que nuestra región de rechazo esté donde están los
valores pequeños, en la cola inferior de la distribución. Esta vez, dado que
tenemos una prueba unilateral, todosairá en la cola de la distribución. Al
consultar la Tabla D del Apéndice, encontramos que el valor deza la izquierda de
la cual se encuentra 0,05 del área bajo la curva normal estándar es 1:645 después
de la interpolación. Nuestras regiones de rechazo y no rechazo ahora están
especificadas y se muestran en la Figura 7.2.2.
Nuestra regla de decisión nos dice que rechacemosH0si el valor calculado de la
estadística de prueba es menor o igual a 1:645.

7. Cálculo de la estadística de prueba.A partir de nuestros datos calculamos

27 30
z¼pffiffiffiffiffiffiffiffiffiffiffiffiffi¼2:12
20=10

8. Decisión estadística.Podemos rechazar la hipótesis nula ya que


2:12 < 1:645.
9. Conclusión.Concluimos que la media de la población es menor que 30 y actuamos
en consecuencia.
10pagvalor.Elpagvalor para esta prueba es .0170, ya quePAGdz-2:12Þ,cuandoH0
es cierto, es .0170 como se indica en la Tabla D del Apéndice cuando determinamos el

s=1

. 95
. 05

_1.645 0 z

Región de rechazo Región de no rechazo

FIGURA 7.2.2Regiones de rechazo y no rechazo para el ejemplo 7.2.2.


228 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

magnitud del área a la izquierda de 2:12 bajo la curva normal estándar. Se


puede probar una hipótesis nula unilateral por medio de un intervalo de
confianza unilateral. Sin embargo, no cubriremos la construcción e
interpretación de este tipo de intervalo de confianza en este libro.

Si la pregunta del investigador hubiera sido: "¿Podemos concluir que la media es


mayor que 30?", Seguir el procedimiento de diez pasos anterior habría llevado a una
prueba unilateral con toda la región de rechazo en la cola superior de la distribución
de el estadístico de prueba y un valor crítico deþ1:645. &

Muestreo de una población normalmente distribuida: Población


Varianza desconocidaComo ya hemos señalado, la varianza de la población generalmente se desconoce en
situaciones reales que involucran inferencia estadística sobre la media de una población. Cuando el muestreo
es de una población aproximadamente normal con una varianza desconocida, el estadístico de prueba para
probarH0:metro¼metro0es

-X metro
t¼ pffiffiffi0 (7.2.2)
s= norte

que cuandoH0es cierto, se distribuye como Student'stconnorte1 grados de libertad. El siguiente


ejemplo ilustra el procedimiento de prueba de hipótesis cuando se supone que la población está
normalmente distribuida y se desconoce su varianza. Esta es la situación habitual que se encuentra en
la práctica.

EJEMPLO 7.2.3
Nakamura et al. (A-1) estudiaron sujetos con desgarros del ligamento colateral medial (MCL) y del
ligamento cruzado anterior (LCA). Entre febrero de 1995 y diciembre de 1997, 17 pacientes
consecutivos con lesiones agudas combinadas de LCA y LCM de grado III fueron tratados por el
mismo médico en el centro de investigación. Una de las variables de interés fue el tiempo en días
entre la ocurrencia de la lesión y la primera resonancia magnética (RM). Los datos se muestran en la
Tabla 7.2.1. Deseamos saber si podemos concluir que el número medio de días entre la lesión y la
resonancia magnética inicial no es de 15 días en una población que se supone que está representada
por estos datos de muestra.

TABLA 7.2.1 Número de días hasta la RM para sujetos con desgarros de MCL y ACL

Sujeto Días Sujeto Días Sujeto Días Sujeto Días

1 14 6 0 11 28 dieciséis 14
2 9 7 10 12 24 17 9
3 18 8 4 13 24
4 26 9 8 14 2
5 12 10 21 15 3
Fuente: Norimasa Nakamura, Shuji Horibe, Yukyoshi Toritsuka, Tomoki Mitsuoka, Hideki Yoshikawa y Konsei Shino,
“Lesión aguda del ligamento colateral medial de grado III de la rodilla asociada con desgarro del ligamento cruzado
anterior”Revista americana de medicina deportiva, 31 (2003), 261–267.
7.2 PRUEBA DE HIPÓTESIS: UNA ÚNICA MEDIA POBLACIONAL 229

Solución: Podremos concluir que la media de días de la población no es 15 si


podemos rechazar la hipótesis nula de que la media de la población es
igual a 15.
1. Datos.Los datos consisten en el número de días hasta la resonancia magnética en 17 sujetos como se
describió anteriormente.

2. Supuestos.Los 17 sujetos constituyen una muestra aleatoria simple de una


población de sujetos similares. Suponemos que el número de días hasta la
RM en esta población tiene una distribución aproximadamente normal.
3. Hipótesis.
H0:metro¼15
HA:metro6¼15

4. Estadística de prueba.Dado que se desconoce la varianza de la población, nuestro estadístico de


prueba viene dado por la Ecuación 7.2.2.

5. Distribución de la estadística de prueba.Nuestra estadística de prueba se


distribuye como Student'stconnorte1¼17 1¼16 grados de libertad siH0es verdad.
6. Regla de decisión.Dejara¼ :05. Como tenemos una prueba de dos caras, ponemos un =2
¼ :025 en cada cola de la distribución de nuestro estadístico de prueba. Elt los valores a
la derecha y a la izquierda de los cuales se encuentra .025 del área son 2.1199 y
2:1199. Estos valores se obtienen de la Tabla E del Apéndice. Las
regiones de rechazo y no rechazo se muestran en la Figura 7.2.3.
La regla de decisión nos dice que calculemos un valor del
estadístico de prueba y rechacemosH0si el calculadotes mayor o igual a
2.1199 o menor o igual a 2:1199.
7. Cálculo de la estadística de prueba.A partir de nuestros datos de muestra,
calculamos una media muestral de 13,2941 y una desviación estándar muestral
de 8,88654. Sustituyendo estas estadísticas en la Ecuación 7.2.2 da

13:2941 15 1:7059
t¼ pffiffiffiffiffi ¼ ¼ :791
8:88654= 17 2:1553

. 95

. 025 . 025

– 2.1199 0 2.1199 t

Región de rechazo no rechazo Región de rechazo


región
FIGURA 7.2.3 Regiones de rechazo y no rechazo para el ejemplo 7.2.3.
230 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

pag/2 > .10 pag/2 > .10

. 10 . 10

– 1.337 –.791 0 .791 1.337 t


pag> .20

FIGURA 7.2.4Determinación depagvalor para el Ejemplo 7.2.3.

8. Decisión estadística.no rechazarH0, ya que .791 cae en la región de


no rechazo.
9. Conclusión.Nuestra conclusión, en base a estos datos, es que la media de la
población de la que procede la muestra puede ser 15.
10valor p.el exactopagEl valor para esta prueba no se puede obtener de la Tabla E del
Apéndice ya que datvalores sólo para percentiles seleccionados. ElpagSin
embargo, el valor se puede establecer como un intervalo. Encontramos que :791
es menor que 1:337, el valor deta la izquierda de la cual se encuentra 0,10 del
área bajo eltcon 16 grados de libertad. En consecuencia, cuandoH0es cierto, la
probabilidad de obtener un valor dettan pequeño como o menor que :791 es
mayor que .10. Eso esPAGdt-:791Þ > :10. Dado que la prueba fue de dos caras,
debemos permitir la posibilidad de un valor calculado del estadístico de prueba
tan grande en la dirección opuesta al observado. La Tabla E del Apéndice revela
quePAGdt-:791Þ > :10 también. Elpagentonces el valor es pag > :20. De hecho,
Excel calcula elpagvalor para ser .4403. La Figura 7.2.4 muestra elpagvalor para
este ejemplo.

Si en el ejemplo anterior las hipótesis hubieran sido

H0:m-15
HA:m <15

el procedimiento de prueba habría conducido a una prueba unilateral con toda la


región de rechazo en la cola inferior de la distribución, y si las hipótesis hubieran sido

H0:m-15
HA:metro >15

habríamos tenido una prueba unilateral con toda la región de rechazo en la cola
superior de la distribución. &

Muestreo de una población que no está normalmente distribuida


Si, como suele ser el caso, la muestra en la que basamos nuestra prueba de hipótesis sobre la media de una
población proviene de una población que no se distribuye normalmente, podemos, si nuestra muestra es
grande (granpag r tffihffiffian o igual a 30), aprovecha el teorema del límite central y
usarz¼ ð-Xmetro0Þ=ðs=norteÞcomo estadístico de prueba. Si la desviación estándar de la población no es
7.2 PRUEBA DE HIPÓTESIS: UNA ÚNICA MEDIA POBLACIONAL 231

conocido, la práctica habitual es utilizar la desviación estándar de la muestra como una estimación. La estadística de
prueba para probarH0:metro¼metro0, entonces es

-X metro
z¼ pffiffiffi0 (7.2.3)
s= norte

que cuandoH0es cierto, se distribuye aproximadamente como la distribución normal estándar sinorte
es largo. La justificación para usarspara reemplazarses que la muestra grande, necesaria para que se
aplique el teorema del límite central, producirá una desviación estándar de la muestra que se
aproxima muchos.

EJEMPLO 7.2.4
El objetivo de un estudio de Klingler et al. (A-2) fue determinar cómo el reconocimiento y la percepción
de los síntomas influyen en la presentación clínica en función de la raza. Caracterizaron los síntomas y
el comportamiento de búsqueda de atención en pacientes afroamericanos con dolor torácico
atendidos en el departamento de emergencias. Uno de los signos vitales de presentación fue la
presión arterial sistólica. Entre 157 hombres afroamericanos, la presión arterial sistólica media fue de
146 mm Hg con una desviación estándar de 27. Deseamos saber si, sobre la base de estos datos,
podemos concluir que la presión arterial sistólica media para una población africana -Hombres
americanos es mayor a 140.

Solución: Diremos que los datos sí aportan evidencia suficiente para concluir que la media
poblacional es superior a 140 si podemos rechazar la hipótesis nula de que la
media es inferior o igual a 140. Se puede realizar la siguiente prueba:

1. Datos.Los datos consisten en puntajes de presión arterial sistólica de 157


hombres afroamericanos con:X¼146 ys¼27
2. Supuestos.Los datos constituyen una muestra aleatoria simple de una
población de hombres afroamericanos que acuden a un servicio de
urgencias con síntomas similares a los de la muestra. No estamos
dispuestos a asumir que los valores de presión arterial sistólica se
distribuyen normalmente en dicha población.
3. Hipótesis.
H0:m-140
HA:metro >140

4. Estadística de prueba.El estadístico de prueba viene dado por la Ecuación 7.2.3, ya queses
desconocido.

5. Distribución de la estadística de prueba.Debido al teorema del límite central, el estadístico de prueba


tiene, en el peor de los casos, una distribución aproximadamente normal conmetro¼0 si H0es verdad.

6. Regla de decisión.Dejara¼ :05. El valor crítico del estadístico de prueba es


1.645. Las regiones de rechazo y no rechazo se muestran en la figura 7.2.5.
RechazarH0si se calculaz-1:645.
232 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

. 05

0 1.645 z

Región de no rechazo Región de rechazo

FIGURA 7.2.5Regiones de rechazo y no rechazo para el ejemplo 7.2.4.

7. Cálculo de la estadística de prueba.

146 140 6
z¼ pffiffiffiffiffiffiffiffi ¼ ¼2:78
27= 157 2:1548

8. Decisión estadística.RechazarH0desde 2:78 > 1:645.


9. Conclusión.Concluya que la presión arterial sistólica media para la
población muestreada es mayor que 140.
10pagvalor.Elpagel valor para esta prueba es 1:9973¼ :0027, ya que como se muestra
en la Tabla D del Apéndice, el área (.0027) a la derecha de 2.78 es menor que .05,
el área a la derecha de 1.645. &

Procedimientos para otras condicionesSi se hubiera conocido la varianza de la población,


el procedimiento habría sido idéntico al anterior excepto que el valor conocido des,en lugar del
valor de la muestras,habría sido utilizado en el denominador de la estadística de prueba
calculada.
Dependiendo de lo que los investigadores desearan concluir, se podría haber realizado una
prueba bilateral o unilateral, con la región de rechazo en la cola inferior de la distribución, utilizando
los datos anteriores.
Al probar una hipótesis sobre la media de una sola población, podemos usar la figura 6.3.3
para decidir rápidamente si el estadístico de prueba eszot.

Análisis informáticoPara ilustrar el uso de computadoras en la prueba de hipótesis,


consideremos el siguiente ejemplo.

EJEMPLO 7.2.5
Las siguientes son las circunferencias de la cabeza (centímetros) al nacer de 15 bebés:

33,38 32,15 33,99 34,10 33,97


34,34 33,95 33,85 34,23 32,73
33,46 34,13 34,45 34,19 34,05
Deseamos probarH0:metro¼34:5 contraHA:metro6¼34:5.
EJERCICIOS 233

Caja de diálogo: Comando de sesión:

Estadística Estadísticas básicas T de 1 muestra BTT > PRUEBA T 34.5 C1

TipoC1enMuestras en columnas.Tipo34.5 en elPromedio


de pruebacaja. Hacer clicDE ACUERDO .

Producción:

T de una muestra: C1

PRUEBA DE MU 34.5 VS NO 34.5


VARIABLE norte SIGNIFICAR DESVEST SE SIGNIFICAR 95% CI T PAG
C1 15 33.7980 0.6303 0.1627 (33.4490, 34.1470) 4,31 0,001

FIGURA 7.2.6Procedimiento MINITAB y salida para el Ejemplo 7.2.5.

Solución: Suponemos que los supuestos para el uso de latse cumplen las estadísticas. Ingresamos los datos
en la Columna 1 y procedemos como se muestra en la Figura 7.2.6.
Para indicar que una prueba es unilateral en Windows, haga clic en el
Opcionesy luego elija "menor que" o "mayor que" según corresponda en el
Alternativacaja. Sizes la estadística de prueba apropiada, elegimos 1-
Muestrazdel menú Estadísticas básicas. El resto de los comandos son los
mismos que para eltprueba.
Aprendemos de la impresión que el valor calculado de la estadística de prueba
es 4:31 y elpagel valor para la prueba es .0007. S.A.S.®los usuarios pueden usar la
salida de PROC MEANS o PROC UNIVARIATE para realizar pruebas de hipótesis.
Cuando tanto elzestadística y latestadístico son estadísticos de prueba
inapropiados para usar con los datos disponibles, se puede desear usar una técnica no
paramétrica para probar una hipótesis sobre una sola medida de tendencia central de
la población. Uno de estos procedimientos, la prueba de signos, se analiza en el
capítulo 13. &

EJERCICIOS

Para cada uno de los siguientes ejercicios, lleve a cabo el procedimiento de prueba de hipótesis de diez pasos para el
nivel de significancia dado. Para cada ejercicio, según corresponda, explique por qué eligió una prueba unilateral o
una prueba bilateral. Discuta cómo cree que los investigadores y/o los médicos podrían usar los resultados de su
prueba de hipótesis. ¿Qué decisiones y/o acciones clínicas y/o de investigación cree que serían apropiadas a la luz de
los resultados de su prueba?

7.2.1Escobar et al. (A-3) realizó un estudio para validar una versión traducida del cuestionario del índice de
osteoartritis de las universidades de Western Ontario y McMaster (WOMAC) utilizado con pacientes de habla
hispana con osteoartritis de cadera o rodilla. Para las 76 mujeres clasificadas con dolor severo de cadera, el
234 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

La puntuación de función media de WOMAC (en una escala de 0 a 100, donde un número más alto indica menos
función) fue de 70,7 con una desviación estándar de 14,6. Deseamos saber si podemos concluir que la puntuación
funcional media para una población de mujeres similares con dolor intenso de cadera es inferior a 75. Seaa¼ :01.

7.2.2Un estudio de Thienprasiddhi et al. (A-4) examinó una muestra de 16 sujetos con glaucoma de ángulo abierto y
defectos de hemicampo unilaterales. Las edades (años) de los sujetos fueron:

62 62 68 48 51 60 51 57 57 41 62 50 53 34 62 61

Fuente: Phamornsak Thienprasiddhi, Vivienne C. Greenstein,


Candice S. Chen, Jeffrey M. Liebmann, Robert Ritch y Donald C.
Hood, "Respuestas de potenciales evocados visuales multifocales
en pacientes con glaucoma con defectos de hemicampo
unilaterales"Diario Americano de Oftalmología, 136 (2003), 34–40.

¿Podemos concluir que la edad media de la población de la que se supone que se ha extraído la
muestra es inferior a 60 años? Dejara¼ :05.

7.2.3El propósito de un estudio de Lugli-e et al. (A-5) fue investigar el estado oral de un grupo de pacientes
diagnosticados con talasemia mayor (TM). Una de las medidas de resultado fue el índice de dientes cariados,
perdidos y obturados (CPOD). En una muestra de 18 pacientes el valor medio del índice CPOD fue de 10,3 con
una desviación estándar de 7,3. ¿Es esta evidencia suficiente para permitirnos concluir que el índice CPOD
medio es superior a 9,0 en una población de sujetos similares? Dejara¼ :10

7.2.4Se estudió una muestra de 25 registros de pacientes atendidos en un hospital de enfermedades crónicas en
forma ambulatoria. El número medio de visitas ambulatorias por paciente fue de 4,8 y la desviación estándar
de la muestra fue de 2. ¿Se puede concluir a partir de estos datos que la media poblacional es mayor que
cuatro visitas por paciente? Sea .05 la probabilidad de cometer un error tipo I. ¿Qué supuestos son
necesarios?

7.2.5En una muestra de 49 adolescentes que sirvieron como sujetos en un estudio inmunológico, una variable de
interés fue el diámetro de la reacción de la prueba cutánea a un antígeno. La media muestral y la desviación estándar
fueron eritema de 21 y 11 mm, respectivamente. ¿Se puede concluir a partir de estos datos que la media de la
población es menor que 30? Dejara¼ :05.

7.2.6Nueve animales de laboratorio fueron infectados con cierta bacteria y luego inmunosuprimidos. El número medio de
organismos recuperados más tarde de las muestras de tejido fue de 6,5 (datos codificados) con una desviación
estándar de 0,6. ¿Se puede concluir a partir de estos datos que la media de la población es mayor que 6?
Dejara¼ :05. ¿Qué suposiciones son necesarias?

7.2.7Una muestra de 25 estudiantes de enfermería de primer año obtuvo una puntuación media de 77 en una prueba
diseñada para medir la actitud hacia el paciente moribundo. La desviación estándar de la muestra fue 10.
¿Proporcionan estos datos evidencia suficiente para indicar, en el nivel de significación de .05, que la media de la
población es menor que 80? ¿Qué supuestos son necesarios?

7.2.8Queremos saber si podemos concluir que la ingesta calórica diaria media en la población rural adulta de un país
en desarrollo es inferior a 2000. Una muestra de 500 tenía una media de 1985 y una desviación estándar de
210. Seaa¼ :05.

7.2.9Una encuesta de 100 hospitales de tamaño similar reveló un censo diario promedio en el servicio de pediatría de
27 con una desviación estándar de 6,5. ¿Estos datos proporcionan evidencia suficiente para indicar que la
media de la población es mayor que 25? Dejara¼ :05.
EJERCICIOS 235

7.2.10Después de un programa de capacitación de supervisión hospitalaria de una semana de duración, 16 administradores auxiliares del
hospital obtuvieron una puntuación media de 74 en una prueba administrada como parte de la evaluación del programa de
capacitación. La desviación estándar de la muestra fue 12. ¿Se puede concluir a partir de estos datos que la media de la
población es mayor que 70? Dejara¼ :05. ¿Qué suposiciones son necesarias?

7.2.11Se seleccionó una muestra aleatoria de 16 informes de emergencia de los archivos de un servicio de ambulancias. El
tiempo medio (calculado a partir de los datos de la muestra) necesario para que las ambulancias lleguen a sus
destinos fue de 13 minutos. Suponga que la población de tiempos se distribuye normalmente con
una varianza de 9. ¿Podemos concluir en el nivel de significancia de .05 que la media de la población es mayor que 10
minutos?

7.2.12Los siguientes datos son los consumos de oxígeno (mililitros) durante la incubación de una muestra aleatoria de
15 suspensiones celulares:

14.0, 14.1, 14.5, 13.2, 11.2, 14.0, 14.1, 12.2,


11.1, 13.7, 13.2, 16.0, 12.8, 14.4, 12.9

¿Proporcionan estos datos evidencia suficiente al nivel de significancia de .05 de que la media poblacional no
es 12 ml? ¿Qué supuestos son necesarios?

7.2.13¿Podemos concluir que el valor medio de ventilación voluntaria máxima para universitarios aparentemente sanos
mayores no son 110 litros por minuto? Una muestra de 20 arrojó los siguientes valores:

132, 33, 91, 108, 67, 169, 54, 203, 190, 133,
96, 30, 187, 21, 63, 166, 84, 110, 157, 138

Dejara¼ :01. ¿Qué supuestos son necesarios?

7.2.14Las siguientes son las presiones arteriales sistólicas (mm Hg) de 12 pacientes en tratamiento farmacológico para
hipertensión:

183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158

¿Podemos concluir sobre la base de estos datos que la media de la población es menor que 165? Dejara¼ :05. ¿Qué
suposiciones son necesarias?

7.2.15¿Podemos concluir que la edad media de muerte de los pacientes con enfermedad de células falciformes homocigotas es menor
de 30 años? Una muestra de 50 pacientes arrojó las siguientes edades en años:

15,5 2,0 45,1 1,7 .8 1,1 18,2 9,7 28,1 18,2


27,6 45,0 1,0 66,4 2,0 67,4 2,5 61,7 16,2 31,7
6,9 13,5 1,9 31,2 9,0 2,6 29,7 13,5 2,6 14,4
20,7 30,9 36,6 1,1 23,6 . 9 7,6 23,5 6,3 40,2
23,7 4,8 33,2 27,1 36,7 3,2 38,0 3,5 21,8 2,4

Dejara¼ :05. ¿Qué suposiciones son necesarias?

7.2.16Los siguientes son valores de presión intraocular (mm Hg) registrados para una muestra de 21 sujetos ancianos:

14,5 12,9 14,0 16,1 12,0 17,5 14,1 12,9 17,9 12,0
16,4 24,2 12,2 14,4 17,0 10,0 18,5 20,8 16,2 14,9
19.6

¿Podemos concluir a partir de estos datos que la media de la población de la que se extrajo la muestra es
mayor que 14? Dejara¼ :05. ¿Qué suposiciones son necesarias?
236 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

7.2.17Suponga que se sabe que las puntuaciones de CI de cierta población de adultos tienen una distribución
aproximadamente normal con una desviación estándar de 15. Una muestra aleatoria simple de 25 adultos extraída
de esta población tuvo una puntuación media de CI de 105. Sobre la base de estos datos ¿Podemos concluir que la
puntuación media de CI de la población no es 100? Sea la probabilidad de cometer un error tipo I
ser .05.

7.2.18Un equipo de investigación está dispuesto a suponer que las presiones arteriales sistólicas en cierta población de
hombres tienen una distribución aproximadamente normal con una desviación estándar de 16. Una muestra
aleatoria simple de 64 hombres de la población tenía una lectura de presión arterial sistólica media de 133. .05 nivel
de significación, ¿proporcionan estos datos evidencia suficiente para concluir que la media de la población es mayor
que 130?

7.2.19Una muestra aleatoria simple de 16 adultos extraída de cierta población de adultos arrojó un peso medio de 63
kg. Suponga que los pesos en la población tienen una distribución aproximadamente normal con una
varianza de 49. ¿Los datos de la muestra brindan evidencia suficiente para concluir que el peso medio de la
población es menor que 70 kg? Sea .01 la probabilidad de cometer un error tipo I.

7.3 PRUEBA DE HIPÓTESIS: LA


DIFERENCIA ENTRE DOS MEDIAS
POBLACIONALES

La prueba de hipótesis que implica la diferencia entre dos medias poblacionales se


emplea con mayor frecuencia para determinar si es razonable o no concluir que las dos
medias poblacionales son desiguales. En tales casos, se puede formular una u otra de las
siguientes hipótesis:

1.H0:metro1 metro2¼0; HA:metro1 metro26¼0

2.H0:metro1 metro2- 0; HA:metro1 metro2< 0

3.H0:metro1 metro2- 0; HA:metro1 metro2> 0

Sin embargo, es posible probar la hipótesis de que la diferencia es igual, mayor


o igual, o menor o igual que algún valor distinto de cero.
Como se hizo en la sección anterior, la prueba de hipótesis que involucre la diferencia entre
dos medias poblacionales se analizará en tres contextos diferentes: (1) cuando el muestreo proviene
de poblaciones distribuidas normalmente con varianzas poblacionales conocidas, (2) cuando el
muestreo proviene de poblaciones distribuidas normalmente con varianzas poblacionales
desconocidas, y (3) cuando el muestreo es de poblaciones que no están normalmente distribuidas.

Muestreo de poblaciones normalmente distribuidas: Población


Desviaciones conocidasCuando cada una de dos muestras aleatorias simples independientes ha sido
extraída de una población distribuida normalmente con una varianza conocida, el estadístico de prueba para
probar la hipótesis nula de medias poblacionales iguales es

d-X1 -X2Þ dmetro1 metro2Þ0


z¼ sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi (7.3.1)
s21 s22
þ
norte1 norte2
7.3 PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 237

donde el subíndice 0 indica que la diferencia es un parámetro hipotético. CuandoH0


es cierto que el estadístico de prueba de la Ecuación 7.3.1 se distribuye como la normal estándar.

EJEMPLO 7.3.1
Los investigadores desean saber si los datos que han recopilado brindan evidencia suficiente
para indicar una diferencia en los niveles medios de ácido úrico en suero entre individuos
normales e individuos con síndrome de Down. Los datos consisten en lecturas de ácido úrico en
suero de 12 personas con síndrome de Down y 15 personas normales. Los medios son -X1¼ 4:5
mg/100 ml y -X2¼3:4mg/100ml.

Solución: Diremos que los datos muestrales proporcionan evidencia de que las medias
poblacionales no son iguales si podemos rechazar la hipótesis nula de que las medias
poblacionales son iguales. Lleguemos a una conclusión por medio del procedimiento
de prueba de hipótesis de diez pasos.

1. Datos.Ver enunciado del problema.


2. Supuestos.Los datos constituyen dos muestras aleatorias simples
independientes, cada una extraída de una población normalmente
distribuida con una varianza igual a 1 para la población con síndrome de
Down y 1,5 para la población normal.
3. Hipótesis.
H0:metro1 metro2¼0
HA:metro1 metro26¼0

Una forma alternativa de plantear las hipótesis es la siguiente:

H0:metro1¼metro2

HA:metro16¼metro2

4. Estadística de prueba.El estadístico de prueba viene dado por la Ecuación 7.3.1.

5. Distribución de la estadística de prueba.Cuando la hipótesis nula es verdadera, el


estadístico de prueba sigue la distribución normal estándar.

6. Regla de decisión.Dejara¼ :05. Los valores críticos dezson 1:96. RechazarH0


a menos que 1:96 <zcalculado< 1:96. Las regiones de rechazo y no rechazo se
muestran en la Figura 7.3.1.
7. Cálculo de la estadística de prueba.

d4:5 3:4Þ0 1:1


¼2:57
z¼uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff¼

1=12þ1:5=15 :4282

8. Decisión estadística.RechazarH0, desde 2:57 > 1:96.


9. Conclusión.Concluya que, sobre la base de estos datos, existe una indicación
de que las medias de las dos poblaciones no son iguales.
10pagvalor.Para esta prueba,pag¼ :0102.
238 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

s=1

_1.96 0 1.96 z

Región de rechazo Región de no rechazo Región de rechazo

FIGURA 7.3.1Regiones de rechazo y no rechazo para el ejemplo 7.3.1 &

Un intervalo de confianza del 95 por ciento parametro1 metro2 En el capitulo anterior


el intervalo de confianza del 95 por ciento parametro1 metro2, calculado a partir de los mismos datos, fue
resultó ser .26 a 1.94. Dado que este intervalo no incluye el 0, decimos que el 0 no es
candidato para la diferencia entre las medias de las poblaciones y concluimos que la
diferencia no es cero. Así llegamos a la misma conclusión por medio de un intervalo de
confianza.

Muestreo de poblaciones normalmente distribuidas: Población


Desviaciones desconocidasComo hemos aprendido, cuando se desconocen las varianzas de la
población, existen dos posibilidades. Las dos varianzas de población pueden ser iguales o pueden ser
desiguales. Consideremos primero el caso en el que se sabe, o es razonable suponer, que son iguales.
En la Sección 7.8 se describe una prueba de la hipótesis de que las varianzas de dos poblaciones son
iguales.

Población Varianzas IgualesCuando se desconocen las varianzas de la población, pero se


supone que son iguales, recordamos del Capítulo 6 que es apropiado agrupar las varianzas de
la muestra por medio de la siguiente fórmula:

dnorte1 1Þsþ2ðnorte 2 1Þs22


2 ¼
spag
1

norte þnorte
1 2 2

Cuando cada una de dos muestras aleatorias simples independientes ha sido extraída de una población
distribuida normalmente y las dos poblaciones tienen varianzas iguales pero desconocidas, el estadístico de
prueba para probarH0:metro1¼metro2es dado por

d-X1 - X2Þ ðmetro metro2Þ0


t¼ sffiffiffiffiffiffiffiffiffiffiffiffi1ffiffiffiffi (7.3.2)
spag
2 spag
2
þ
norte1 norte2

que cuandoH0es cierto, se distribuye como Student'stconnorte1þnorte2 2 grados de libertad.


7.3 PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 239

EJEMPLO 7.3.2
El propósito de un estudio de Tam et al. (A-6) fue investigar el manejo de sillas de ruedas en personas
con lesión de la médula espinal (SCI) de nivel inferior y controles sanos (C). Los sujetos utilizaron una
silla de ruedas modificada para incorporar una superficie de asiento rígida para facilitar las medidas
experimentales especificadas. La medición de la presión de la interfaz se registró mediante el uso de
un tapete sensible a la presión de alta resolución con una resolución espacial de cuatro sensores por
centímetro cuadrado pegado al soporte rígido del asiento. Durante las condiciones estáticas de
sedestación, se registraron las presiones promedio debajo de las tuberosidades isquiáticas (la parte
inferior de los huesos pélvicos). Los datos para las mediciones de la tuberosidad isquiática izquierda
(en mm Hg) para los grupos SCI y control se muestran en la Tabla 7.3.1. Deseamos saber si podemos
concluir, sobre la base de estos datos, que, en general,

Solución:

1. Datos.Ver enunciado del problema.


2. Supuestos.Los datos constituyen dos muestras aleatorias simples independientes
de mediciones de presión, una muestra de una población de sujetos de control y
la otra muestra de una población con lesión de la médula espinal de nivel
inferior. Supondremos que las medidas de presión en ambas poblaciones tienen
una distribución aproximadamente normal. Se desconocen las varianzas de la
población, pero se supone que son iguales.
3. Hipótesis.H0:metroC-metroLME;HA:metroC<metroLME.
4. Estadística de prueba.El estadístico de prueba viene dado por la Ecuación 7.3.2.

5. Distribución de la estadística de prueba.Cuando la hipótesis nula es verdadera, el estadístico de


prueba sigue el método de Student.tdistribución connorte1þnorte2 2 grados de
libertad.
6. Regla de decisión.Dejara¼ :05. El valor crítico detes 1:7341. RechazarH0
a menos quetcalculado> 1:7341.
7. Cálculo de la estadística de prueba.A partir de los datos de muestra calculamos

- XC¼126:1;sC¼21:8; -XLME¼133:1;sLME¼32:2

A continuación, agrupamos las varianzas muestrales para obtener

9d21:8Þ2þ9d32:2Þ2
spag
2 ¼ ¼756:04
9þ9

TABLA 7.3.1 Presiones (mm Hg) debajo de la pelvis durante condiciones estáticas para el ejemplo
7.3.2

Control 131 115 124 131 122 117 88 114 150 169
LME 60 150 130 180 163 130 121 119 130 148
Fuente: Eric W. Tam, Arthur F. Mak, Wai Nga Lam, John H. Evans y York Y. Chow, “Movimiento pélvico y distribución de
la presión de interfaz durante la propulsión manual en silla de ruedas”Archivos de Medicina Física y Rehabilitación, 84
(2003), 1466–1472.
240 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

ahora calculamos
d126:1 133:1Þ0 t¼
:569
rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼

756:04 756:04
þ
10 10

8. Decisión estadística.No logramos rechazarH0, desde 1:7341 < :569; es


decir, :569 cae en la región de no rechazo.
9. Conclusión.Sobre la base de estos datos, no podemos concluir que la presión media de la
población sea menor para los sujetos sanos que para los sujetos con lesión medular.

10pagvalor.Para esta prueba,pag > :10 usando la Tabla E, o .5764 usando una
computadora desde 1:330 < :569. &

Varianzas poblacionales desigualesCuando se han extraído dos muestras aleatorias simples


independientes de poblaciones normalmente distribuidas con varianzas desconocidas y desiguales, el
estadístico de prueba para probarH0:metro1¼metro2es

d-X1 - X2Þ dmetro metro2Þ0


t0 ¼ s fiffi
ffiffiffiffiffiffiffiffiffiffi1ffiffiffiffi (7.3.3)
s12 s2
þ2
norte1 norte2

El valor crítico det0por unanivel de significación y una prueba bilateral es aproximadamente

w1t1þw2t2
t10 dun =2Þ¼ (7.3.4)
w1þw2

dóndew1¼s2 1=n1;w2¼s2 2=n2;t1¼t1dun =2Þparanorte1 1 grados de libertad, yt2¼


t1dun =2Þparanorte2 1 grados de libertad. El valor crítico det0para una prueba unilateral es
encontrado por computaciónt0 1apor la Ecuación 7.3.4, usandot1¼t1aparanorte1 1 grados de libertad
yt2¼t1aparanorte2 1 grados de libertad.
Para una prueba de dos colas, rechaceH0si el valor calculado det0es mayor o
igual al valor crítico dado por la Ecuación 7.3.4 o menor o igual al negativo de ese
valor.
Para una prueba unilateral con la región de rechazo en la cola derecha de la distribución de
muestreo, rechaceH0si el calculadot0es igual o mayor que el críticot0. Para una prueba unilateral con
una región de rechazo de cola izquierda, rechaceH0si el valor calculado det0es igual o menor que el
negativo de la críticat0calculado por la adaptación indicada de la Ecuación 7.3.4.

EJEMPLO 7.3.3
Dernellis y Panaretou (A-7) examinaron sujetos con hipertensión y sujetos de control sanos. Una
de las variables de interés fue el índice de rigidez aórtica. Las medidas de esta variable se
calcularon a partir del diámetro aórtico evaluado por ecocardiografía en modo M y la presión
arterial medida por un esfigmomanómetro. En general, los médicos desean
7.3 PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 241

reducir la rigidez aórtica. En los 15 pacientes hipertensos (grupo 1), el índice de rigidez aórtica medio
fue de 19,16 con una desviación estándar de 5,29. En los 30 sujetos control (grupo 2), el índice de
rigidez aórtica medio fue de 9,53 con una desviación estándar de 2,69. Deseamos determinar si las
dos poblaciones representadas por estas muestras difieren con respecto al índice medio de rigidez
aórtica.

Solución:

1. Datos.Los tamaños de las muestras, las medias y las desviaciones estándar de las muestras son:

norte1¼15; - X1¼19:16; s1¼5:29


norte2¼30; - X2¼9:53; s2¼2:69

2. Supuestos.Los datos constituyen dos muestras aleatorias independientes,


una de una población de sujetos hipertensos y otra de una población
control. Suponemos que los valores de rigidez aórtica tienen una
distribución aproximadamente normal en ambas poblaciones. Las varianzas
de la población son desconocidas y desiguales.
3. Hipótesis.

H0:metro1 metro2¼0
HA:metro1 metro26¼0

4. Estadística de prueba.El estadístico de prueba viene dado por la Ecuación 7.3.3.

5. Distribución de la estadística de prueba.La estadística dada por la Ecuación 7.3.3


no sigue la de Student.tdistribución. Por lo tanto, obtenemos sus valores críticos
por la Ecuación 7.3.4.
6. Regla de decisión.Dejara¼ :05. Antes de la computaciónt0nosotros calculamos
w1¼ ð5:29Þ2=15¼1:8656 yw2¼ ð2:69Þ2=30¼ :2412. En el Apéndice Tabla E
encontramos quet1¼2:1448 yt2¼2:0452. Por la Ecuación 7.3.4 calculamos

1:8656d2:1448Þ þ :2412d2:0452Þ
t0¼ ¼2:133
1:8656þ :2412

Nuestra regla de decisión, entonces, es rechazarH0si el calculadotes - 2:133 o


- 2:133.
7. Cálculo de la estadística de prueba.Por la Ecuación 7.3.3 calculamos

d19:16 9:53Þ0 ¼ 9:63


t0 ¼6:63
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼
1:4515
d5:29Þ2 d2:69Þ2
þ
15 30
242 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

8. Decisión estadística.Como 6:63 > 2:133, rechazamosH0.


9. Conclusión.Sobre la base de estos resultados concluimos que las medias de las dos
poblaciones son diferentes.
10pagvalor.para esta pruebapag < :05; programa R calcula este valor para ser < .
00001. &

Muestreo de poblaciones que no están normalmente distribuidas


Cuando el muestreo proviene de poblaciones que no están normalmente distribuidas, los resultados del
teorema del límite central pueden emplearse si los tamaños de muestra son grandes (por ejemplo, -30). Esto
permitirá el uso de la teoría normal ya que la distribución de la diferencia entre medias muestrales será
aproximadamente normal. Cuando cada una de dos grandes muestras aleatorias simples independientes ha
sido extraída de una población que no está normalmente distribuida, el estadístico de prueba para probarH0:
metro1¼metro2es

d-X1 - X2Þ dmetro metro2Þ0


z¼ sffiffi ffiffiffiffiffiffiffiffiffiffiffi1ffiffiffi (7.3.5)
2
s21 s
þ2
norte1 norte2

que cuandoH0es cierto, sigue la distribución normal estándar. Si se conocen las varianzas de la
población, se utilizan; pero si se desconocen, como suele ser el caso, se utilizan como estimaciones las
varianzas muestrales, que necesariamente se basan en muestras grandes. Las varianzas de la
muestra no se agrupan, ya que la igualdad de las varianzas de la población no es una suposición
necesaria cuando elzse utiliza la estadística.

EJEMPLO 7.3.4
El objetivo de un estudio de Sairam et al. (A-8) fue identificar el papel de varios estados de
enfermedad y factores de riesgo adicionales en el desarrollo de trombosis. Uno de los objetivos
del estudio fue determinar si había diferentes niveles del anticuerpo IgG anticardiolipina en
sujetos con y sin trombosis. La Tabla 7.3.2 resume los hallazgos de los investigadores:

TABLA 7.3.2 Niveles de IgG para sujetos con y sin trombosis para el ejemplo 7.3.4

Nivel medio de IgG


Grupo (ml/unidad) Tamaño de la muestra Desviación Estándar

Trombosis 59.01 53 44.89


Sin trombosis 46.61 54 34.85

Fuente: S. Sairam, BA Baethge y T. McNearney, "Análisis de factores de riesgo y enfermedades


comórbidas en el desarrollo de trombosis en pacientes con anticuerpos anticardiolipina".
Reumatología clínica, 22 (2003), 24–29.
7.3 PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 243

Deseamos saber si podemos concluir, sobre la base de estos resultados, que, en general, las
personas con trombosis tienen, en promedio, niveles de IgG más altos que las personas sin
trombosis.

Solución:

1. Datos.Ver declaración de ejemplo.


2. Supuestos.Las estadísticas se calcularon a partir de dos muestras independientes
que se comportan como muestras aleatorias simples de una población de
personas con trombosis y una población de personas que no tienen trombosis.
Dado que se desconocen las varianzas de la población, utilizaremos las varianzas
de la muestra en el cálculo del estadístico de prueba.
3. Hipótesis.
H0:metroT metroNuevo Testamento- 0

HA:metroT metroNuevo Testamento> 0

o alternativamente,

H0:metroT-metroNuevo Testamento

HA:metroT>metroNuevo Testamento

4. Estadística de prueba.Como tenemos muestras grandes, el teorema del límite central nos
permite usar la Ecuación 7.3.5 como estadístico de prueba.

5. Distribución de la estadística de prueba.Cuando la hipótesis nula es verdadera, el estadístico de


prueba se distribuye aproximadamente como la normal estándar.

6. Regla de decisión.Dejara¼ :01. Esta es una prueba unilateral con un valor


crítico dezigual a 2,33. RechazarH0sizcalculado- 2:33.
7. Cálculo de la estadística de prueba.

59:01 46:61
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼1:59

44:892 34:852
þ
53 54

8. Decisión estadística.Fallo para rechazarH0, desdez¼1:59 está en la región de


no rechazo.
9. Conclusión.Estos datos indican que, en promedio, las personas con trombosis
y las personas sin trombosis pueden no tener niveles diferentes de IgG.

10pagvalor.Para esta prueba,pag¼ :0559. Al probar una hipótesis sobre la diferencia


entre las medias de dos poblaciones, podemos usar la figura 6.4.1 para decidir
rápidamente si el estadístico de prueba debe serzot. &

Podemos usar MINITAB para realizar dos muestrastpruebas Para ilustrar, consultemos
los datos de la Tabla 7.3.1. Ponemos los datos para sujetos de control y médula espinal
244 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Caja de diálogo: Comando de sesión:

Estadística Estadísticas básicas T de 2 muestras MTB > TwoSample 95.0 C1 C2 SUBC>


Alternativa 1,
ElegirMuestras en diferentes columnas.TipoC1 en SUBC> agrupados.
PrimeroyC2enSegundo.Haga clic en elOpcionesy
seleccione "menor que" en elAlternativascaja. Controlar
Suponga varianzas iguales.Hacer clicDE ACUERDO.

Producción:

Prueba T de dos muestras y CI: C, SCI

T de dos muestras para C vs SCI


norte Significar Desvst SE Significar

C 10 126.1 21.8 6.9


LME 10 133.1 32.2 10

Diferencia MU C Mu LME
Estimación de diferencia: 7.0
Límite superior del 95% para la diferencia: 14.3
Prueba T de diferencia 0 (frente a <): Valor T 0.57 Valor P 0.288
DF 18
Ambos usan Desv. estándar agrupada 27.5

FIGURA 7.3.2Procedimiento MINITAB y salida para dos muestrastprueba, Ejemplo 7.3.2


(datos en la Tabla 7.3.1).

sujetos lesionados en la Columna 1 y la Columna 2, respectivamente, y proceda como se muestra en la Figura


7.3.2.
el sas®paquete estadístico realiza eltprueba de igualdad de medias poblacionales bajo ambos
supuestos con respecto a las varianzas poblacionales: que son iguales y que no son iguales. Tenga en
cuenta que SAS®designa elpagvalor como Pr >jtj.La salida predeterminada es un pagvalor para una
prueba de dos caras. El investigador que usa SAS®debe dividir esta cantidad por la mitad cuando la
prueba de hipótesis es unilateral. el sas®El paquete también prueba la igualdad de las varianzas de la
población como se describe en la Sección 7.8. La Figura 7.3.3 muestra el SAS®salida para el Ejemplo
7.3.2.

Alternativas azytA veces ni elzestadística ni latstatistic es un estadístico de prueba apropiado


para usar con los datos disponibles. Cuando tal es el caso, se puede desear utilizar una técnica
no paramétrica para probar una hipótesis sobre la diferencia entre dos medidas de población
de tendencia central. El estadístico de prueba de Mann-Whitney y la prueba de la mediana,
discutidos en el Capítulo 13, son alternativas de uso frecuente a lazy tEstadísticas.
EJERCICIOS 245

El Sistema SAS
El Procedimiento de PRUEBAT

Estadísticas CL inferior CL superior


Más bajo CL superior CL Estándar Estándar Estándar Estándar

Variable grupo N media Significar Significar desarrollador desarrollador desarrollador Errar


---------------------------------------------------------------------------------
presión C 10 110,49 126,1 141,71 15,008 21.82 39.834 6.9
presión SCI 10 110,08 133,1 156,12 22,133 32,178 58,745 10,176
diferencia de presión (1–2) 32.83 7 18.83 20.773 27.491 40.655 12.294

Pruebas T
---------------------------------------------------------------------------------
Variable Método variaciones DF Valor t Pr > |t|
presión agrupados Igual 18 0.57 0.5761
presión Satterthwaite Desigual 15.8 0.57 0.5771

Igualdad de Varianzas
---------------------------------------------------------------------------------
Variable Método Núm DF Guarida DF Valor F PR > F
presión Doblada F 9 9 2.17 0.2626

FIGURA 7.3.3S.A.S.®salida para el Ejemplo 7.3.2 (datos en la Tabla 7.3.1).

EJERCICIOS

En cada uno de los siguientes ejercicios, complete el procedimiento de prueba de hipótesis de diez pasos.
Indique los supuestos que son necesarios para que su procedimiento sea válido. Para cada ejercicio, según
corresponda, explique por qué eligió una prueba unilateral o bilateral. Discuta cómo cree que los
investigadores o los médicos podrían usar los resultados de su prueba de hipótesis. ¿Qué decisiones o
acciones clínicas o de investigación cree que serían apropiadas a la luz de los resultados de su prueba?

7.3.1Los sujetos de un estudio de Dabonneville et al. (A-9) incluyó una muestra de 40 hombres que afirmaron practicar una variedad de
actividades deportivas (multideporte). El índice de masa corporal (IMC) medio de estos hombres fue de 22,41 con una
desviación estándar de 1,27. Una muestra de 24 jugadores masculinos de rugby tenía un IMC medio de 27,75 con una
desviación estándar de 2,64. ¿Existe evidencia suficiente para afirmar que, en general, los jugadores de rugby tienen un IMC
más alto que los hombres que practican varios deportes? Dejara¼ :01.

7.3.2El propósito de un estudio realizado por Ingle y Eastell (A-10) fue examinar la densidad mineral ósea (DMO) y las
propiedades de ultrasonido de mujeres con fracturas de tobillo. Los investigadores reclutaron a 31 mujeres
posmenopáusicas con fracturas de tobillo y 31 mujeres posmenopáusicas sanas para que sirvieran como
controles. Una de las medidas de referencia fue el índice de rigidez del Aquiles lunar. El índice de rigidez
medio para el grupo con fractura de tobillo fue de 76,9 con una desviación estándar de 12,6. En el grupo
control, la media fue de 90,9 con una desviación estándar de 12,5. ¿Proporcionan estos datos evidencia
suficiente para permitirle concluir que, en general, el índice de rigidez medio es más alto en
246 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

mujeres posmenopáusicas sanas que en mujeres posmenopáusicas con fracturas de tobillo? Dejar a
¼ :05.

7.3.3Hoekema et al. (A-11) estudiaron la morfología craneofacial de 26 pacientes masculinos con síndrome de apnea
obstructiva del sueño (SAOS) y 37 sujetos masculinos sanos (sin SAOS). Una de las variables de interés fue la
longitud desde el punto más superoanterior del cuerpo del hueso hioides hasta la horizontal de Frankfort
(medida en milímetros).

Longitud (mm) Sin SAOS Longitud (mm) SAOS

96.80 97.00 101.00 88.95 105.95 114.90 113.70


100.70 97.70 88.25 101.05 114.90 114.35 116.30
94.55 97.00 92.60 92.60 110.35 112.25 108.75
99.65 94.55 98.25 97.00 123.10 106.15 113.30
109.15 106.45 90.85 91.95 119.30 102.60 106.00
102.75 94.55 95.25 88.95 110.00 102.40 101.75
97.70 94.05 88.80 95.75 98.95 105.05
92.10 89.45 101.40 114.20 112.65
91.90 89.85 90.55 108.95 128.95
89.50 98.20 109.80 105.05 117.70

Fuente: Datos proporcionados por cortesía de A. Hoekema, DDS

¿Estos datos proporcionan evidencia suficiente para permitirnos concluir que las dos poblaciones
muestreadas difieren con respecto a la longitud desde el hueso hioides hasta la horizontal de Frankfort?
Dejar a¼ :01.

7.3.4¿Podemos concluir que los pacientes con hipertensión primaria (HP), en promedio, tienen niveles de colesterol total más
altos que los pacientes normotensos (NT)? Esta fue una de las investigaciones de interés para Rossi et al. (A-12). En la
siguiente tabla se encuentran las mediciones de colesterol total (mg/dl) para 133 pacientes con HP y 41 pacientes con
NT. ¿Podemos concluir que los pacientes con HP tienen, en promedio, niveles de colesterol total más altos que los
pacientes con NT? Dejara¼ :05.

Colesterol total (mg/dl)

Pacientes hipertensos primarios Pacientes normotensos

207 221 212 220 190 286 189


172 223 260 214 245 226 196
191 181 210 215 171 187 142
221 217 265 206 261 204 179
203 208 206 247 182 203 212
241 202 198 221 162 206 163
208 218 210 199 182 196 196
199 216 211 196 225 168 189
185 168 274 239 203 229 142
235 168 223 199 195 184 168
214 214 175 244 178 186 121
134 203 203 214 240 281
226 280 168 236 222 203
(Continuado)
EJERCICIOS 247

Colesterol total (mg/dl)

Pacientes hipertensos primarios Pacientes normotensos


222 203 178 249 117 177 135
213 225 217 212 252 179 161
272 227 200 259 203 194
185 239 226 189 245 206
181 265 207 235 218 219
238 228 232 239 152 173
141 226 182 239 231 189
203 236 215 210 237 194
222 195 239 203 196
221 284 210 188 212
180 183 207 237 168
276 266 224 231 188
226 258 251 222 232
224 214 212 174 242
206 260 201 219 200
Fuente: Datos proporcionados por cortesía de Gian Paolo Rossi, MD, FACC, FAHA

7.3.5GarcS ~ao y Cabrita (A-13) querían evaluar la capacidad del farmacéutico comunitario para influir positivamente
en los resultados de la terapia con medicamentos antihipertensivos a través de un programa de atención
farmacéutica en Portugal. Ochenta y dos sujetos con hipertensión esencial fueron asignados aleatoriamente
a un grupo de intervención o de control. El grupo de intervención recibió un seguimiento mensual por parte
de un farmacéutico investigador para controlar la presión arterial, evaluar la adherencia al tratamiento,
prevenir, detectar y resolver problemas relacionados con los medicamentos y fomentar medidas no
farmacológicas para el control de la presión arterial. Los cambios después de 6 meses en la presión arterial
diastólica (pre post, mm Hg) se dan en la siguiente tabla para pacientes en cada uno de los dos grupos.

Grupo de Intervención Grupo de control

20 4 12 dieciséis 0 4 12 0
2 24 6 10 12 2 2 8
36 6 24 dieciséis 18 2 0 10
26 2 42 10 0 8 0 14
2 8 20 6 8 10 4 8
20 8 14 6 10 0 12 0
2 dieciséis 2 2 8 6 4 2
14 14 10 8 14 10 28 8
30 8 2 dieciséis 4 2 18 dieciséis

18 20 18 12 2 2 12 12
6 6
Fuente: Datos proporcionados por cortesía de Jose GarcS ~ao, MS, Pharm.D.

Sobre la base de estos datos, ¿qué debe concluir el investigador? Dejara¼ :05.

7.3.6Se administró una prueba diseñada para medir las actitudes de las madres hacia sus experiencias de trabajo de parto y parto a dos
grupos de nuevas madres. La muestra 1 (asistentes) había asistido a clases prenatales realizadas en el local
248 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Departamento de salud. La muestra 2 (no asistentes) no asistió a las clases. Los tamaños de muestra y las medias y
desviaciones estándar de los puntajes de las pruebas fueron los siguientes:

Muestra norte -
X s

1 15 4.75 1.0
2 22 3.00 1.5

¿Estos datos proporcionan evidencia suficiente para indicar que los asistentes, en promedio, obtienen una puntuación más alta que los que

no asisten? Dejara¼ :05.

7.3.7Las determinaciones del nivel de cortisol se realizaron en dos muestras de mujeres durante el parto. Los sujetos del grupo 1 se
sometieron a una cesárea de emergencia después del parto inducido. Sujetas del grupo 2 que dieron a luz por cesárea o por
vía vaginal después de un trabajo de parto espontáneo. Los tamaños de muestra, los niveles medios de cortisol y las
desviaciones estándar fueron los siguientes:

Muestra norte -
X s

1 10 435 sesenta y cinco

2 12 645 80

¿Estos datos proporcionan evidencia suficiente para indicar una diferencia en los niveles medios de cortisol en las
poblaciones representadas? Dejara¼ :05.

7.3.8Los niveles de protoporfirina se midieron en dos muestras de sujetos. La muestra 1 constaba de 50 alcohólicos varones
adultos con sideroblastos anulares en la médula ósea. La muestra 2 constaba de 40 varones adultos no alcohólicos
aparentemente sanos. Los niveles medios de protoporfirina y las desviaciones estándar para las dos muestras fueron
los siguientes:

Muestra -
X s

1 340 250
2 45 25

¿Se puede concluir sobre la base de estos datos que los niveles de protoporfirina son más altos en la
población alcohólica representada que en la población no alcohólica? Dejara¼ :01.

7.3.9Un investigador estaba interesado en saber si los bebés prematuros con acidosis metabólica tardía y los bebés
prematuros sin la afección difieren con respecto a los niveles de una determinada sustancia química en la orina.
Los niveles medios, las desviaciones estándar y los tamaños de muestra para las dos muestras estudiadas fueron los
siguientes:

Muestra norte -
X s

Con condición 35 8.5 5.5


sin condición 40 4.8 3.6

¿Qué debe concluir el investigador sobre la base de estos resultados? Dejara¼ :05.
7.4 COMPARACIONES POR PARES 249

7.3.10Los investigadores querían saber si podían concluir que dos poblaciones de bebés difieren con respecto
para significar la edad en la que caminaban solos. Se recogieron los siguientes datos (edades en meses):

Muestra de la población A: 9.5, 10.5, 9.0, 9.75, 10.0, 13.0,


10,0, 13,5, 10,0, 9,5, 10,0, 9,75
Muestra de la población B: 12.5, 9.5, 13.5, 13.75, 12.0, 13.75,
12,5, 9,5, 12,0, 13,5, 12,0, 12,0

¿Qué deberían concluir los investigadores? Dejara¼ :05.

7.3.11¿La privación sensorial tiene un efecto en la frecuencia de ondas alfa de una persona? Veinte voluntarios
los sujetos fueron divididos aleatoriamente en dos grupos. Los sujetos del grupo A fueron sometidos a un período de
privación sensorial de 10 días, mientras que los sujetos del grupo B sirvieron como controles. Al final del período
experimental, se midió el componente de frecuencia de ondas alfa de los electroencefalogramas de los sujetos. Los
resultados fueron los siguientes:

Grupo A: 10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4
Grupo B: 11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9

Dejara¼ :05.

7.3.12¿Podemos concluir que, en promedio, los linfocitos y las células tumorales difieren en tamaño? Los siguientes son
los diámetros de las celdasdmetrometroÞde 40 linfocitos y 50 células tumorales obtenidas de biopsias de tejido de
pacientes con melanoma:

linfocitos

9.0 9.4 4.7 4.8 8.9 4.9 8.4 5.9


6.3 5.7 5.0 3.5 7.8 10.4 8.0 8.0
8.6 7.0 6.8 7.1 5.7 7.6 6.2 7.1
7.4 8.7 4.9 7.4 6.4 7.1 6.3 8.8
8.8 5.2 7.1 5.3 4.7 8.4 6.4 8.3

Células Tumorales

12,6 14,6 16,2 23,9 23,3 17,1 20,0 21,0 19,1 19,4
16,7 15,9 15,8 16,0 17,9 13,4 19,1 16,6 18,9 18,7
20,0 17,8 13,9 22,1 13,9 18,3 22,8 13,0 17,9 15,2
17,7 15,1 16,9 16,4 22,8 19,4 19,6 18,4 18,2 20,7
16,3 17,7 18,1 24,3 11,2 19,5 18,6 16,4 16,1 21,5

Dejara¼ :05.

7.4 COMPARACIONES POR PARES

En nuestra discusión anterior sobre la diferencia entre las medias de dos poblaciones, se supuso que
las muestras eran independientes. Un método frecuentemente empleado para evaluar la efectividad
de un tratamiento o procedimiento experimental es aquel que hace uso de
250 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

observaciones resultantes de muestras no independientes. Una prueba de hipótesis basada en este tipo de
datos se conoce comocomparaciones pareadasprueba.

Razones para el emparejamientoCon frecuencia sucede que no existen verdaderas diferencias entre
dos poblaciones con respecto a la variable de interés, pero la presencia de fuentes extrañas de
variación puede provocar el rechazo de la hipótesis nula de no diferencia. Por otro lado, las
verdaderas diferencias también pueden estar enmascaradas por la presencia de factores extraños.
Supongamos, por ejemplo, que deseamos comparar dos protectores solares.
Hay al menos dos formas en las que se puede llevar a cabo el experimento. Un
método sería seleccionar una muestra aleatoria simple de sujetos para recibir
protector solar A y una muestra aleatoria simple e independiente de sujetos para
recibir protector solar B. Enviamos a los sujetos a la luz del sol durante un período de
tiempo específico, luego de lo cual mediremos la cantidad de daño de los rayos del
sol. Supongamos que empleamos este método, pero sin darnos cuenta, la mayoría
de los sujetos que reciben protector solar A tienen tez más oscura que es
naturalmente menos sensible a la luz solar. Digamos que después de completar el
experimento encontramos que los sujetos que recibieron protector solar A sufrieron
menos daño solar.
Una mejor manera de diseñar el experimento sería seleccionar solo una muestra aleatoria simple de
sujetos y dejar que cada miembro de la muestra reciba ambos protectores solares. Podríamos, por ejemplo,
asignar aleatoriamente los protectores solares al lado izquierdo o derecho de la espalda de cada sujeto y
cada sujeto recibiría ambos protectores solares. Después de un período específico de exposición al sol,
mediríamos la cantidad de daño solar en cada mitad de la espalda. Si la mitad de la espalda que recibe el
protector solar A tendiera a estar menos dañada, podríamos atribuir con mayor confianza el resultado al
protector solar, ya que en cada caso ambos protectores solares se aplicaron a la piel igualmente pigmentada.

El objetivo de las pruebas de comparaciones pareadas es eliminar un número máximo de


fuentes de variación extraña haciendo que los pares sean similares con respecto a tantas variables
como sea posible.
Las observaciones relacionadas o emparejadas se pueden obtener de varias maneras. Los mismos
sujetos pueden medirse antes y después de recibir algún tratamiento. Los compañeros de camada del mismo
sexo pueden ser asignados al azar para recibir un tratamiento o un placebo. Los pares de gemelos o
hermanos pueden asignarse aleatoriamente a dos tratamientos de tal manera que los miembros de un solo
par reciban tratamientos diferentes. Al comparar dos métodos de análisis, el material a analizar puede
dividirse en partes iguales de modo que la mitad se analice con un método y la otra mitad con el otro. O se
pueden formar parejas emparejando individuos en alguna característica, por ejemplo, destreza digital, que
está estrechamente relacionada con la medida de interés, digamos, puntajes posteriores al tratamiento en
alguna prueba que requiera manipulación digital.
En lugar de realizar el análisis con observaciones individuales, usamosdi, la
diferencia entre pares de observaciones, como la variable de interés.
Cuando elnortediferencias de muestra calculadas a partir de lanortelos pares de mediciones
constituyen una muestra aleatoria simple de una población de diferencias normalmente distribuida, la
estadística de prueba para probar hipótesis sobre la diferencia de medias de la poblaciónmetrodes

d-metrod0
t¼ (7.4.1)
sd-
7.4 COMPARACIONES POR PARES 251

dónded-es el mismopagdiferencia de medias pffiffiffie,metrod 0


es la media hipotética de la población
diferencia,sd-¼sd= norte, nortees el número de diferencias de muestra, ysdes el estándar
desviación de las diferencias muestrales. CuandoH0es cierto, el estadístico de prueba se distribuye
como Student'stconnorte1 grados de libertad.
Aunque para empezar tenemos dos muestras, digamos, antes de los niveles y después de los niveles, no
tenemos que preocuparnos por la igualdad de varianzas, como ocurre con las muestras independientes, ya que
nuestra variable es la diferencia entre las lecturas en el mismo individuo o individuos emparejados, y, por lo tanto,
sólo una variable está involucrada. La aritmética involucrada en realizar una prueba de comparaciones pareadas, por
lo tanto, es la misma que para realizar una prueba que involucre una sola muestra como se describe en la Sección 7.2.

El siguiente ejemplo ilustra los procedimientos involucrados en una comparación pareada.


prueba.

EJEMPLO 7.4.1
John M. Morton et al. (A-14) examinó la función de la vesícula biliar antes y después de la
fundoplicatura, una cirugía que se usa para evitar que el contenido del estómago regrese al esófago
(reflujo), en pacientes con enfermedad por reflujo gastroesofágico. Los autores midieron la
funcionalidad de la vesícula biliar calculando la fracción de eyección de la vesícula biliar (GBEF) antes y
después de la fundoplicatura. El objetivo de la fundoplicatura es aumentar el GBEF, que se mide como
un porcentaje. Los datos se muestran en la Tabla 7.4.1. Deseamos saber si estos datos proporcionan
evidencia suficiente para permitirnos concluir que la fundoplicatura aumenta el funcionamiento de
GBEF.

Solución: Diremos que se proporciona evidencia suficiente para que concluyamos que la
fundoplicatura es efectiva si podemos rechazar la hipótesis nula de que la media
poblacional cambiametrodes diferente de cero en la dirección apropiada. Podemos
llegar a una conclusión por medio del procedimiento de prueba de hipótesis de diez
pasos.

1. Datos.Los datos consisten en el GBEF para 12 individuos, antes y después de la


fundoplicatura. Realizaremos el análisis estadístico de las diferencias en GBEF
preoperatorio y postoperatorio. Podemos obtener las diferencias de una de dos
maneras: restando los porcentajes preoperatorios de los porcentajes posoperatorios o
restando los porcentajes posoperatorios de los porcentajes preoperatorios. Nos deja

TABLA 7.4.1 Función de la vesícula biliar en pacientes con presentaciones de


enfermedad por reflujo gastroesofágico antes y después del tratamiento

preoperatorio (%) 22 63.3 96 9.2 3.1 50 33 69 64 18.8 0 34


Postoperatorio (%) 63,5 91,5 59 37,8 10,1 19,6 41 87,8 86 55 88 40
Fuente: John M. Morton, Steven P. Bowers, Tananchai A. Lucktong, Samer Mattar, W. Alan Bradshaw, Kevin E. Behrns,
Mark J. Koruda, Charles A. Herbst, William McCartney, Raghuveer K. Halkar, C. Daniel Smith y Timothy M. Farrell,
"Función de la vesícula biliar antes y después de la fundoplicatura"Revista de Cirugía Gastrointestinal, 6 (2002), 806–
811.
252 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

obtenga las diferencias restando los porcentajes preoperatorios de los porcentajes


posoperatorios. Eldi¼Las diferencias postoperatorias preoperatorias son:

41,5, 28,2, 37:0, 28,6, 7,0, 30:4, 8,0, 18,8, 22,0, 36,2, 88,0, 6,0

2. Supuestos.Las diferencias observadas constituyen una muestra aleatoria


simple de una población normalmente distribuida de diferencias que
podrían generarse bajo las mismas circunstancias.
3. Hipótesis.La forma en que establecemos nuestras hipótesis nula y alternativa debe
ser consistente con la forma en que restamos medidas para obtener las
diferencias. En el presente ejemplo, queremos saber si podemos concluir que la
fundoplicatura es útil para aumentar el porcentaje de GBEF. Si es efectivo para
mejorar el GBEF, esperaríamos que los porcentajes postoperatorios tiendan a ser
más altos que los porcentajes preoperatorios. Si, por lo tanto, restamos los
porcentajes preoperatorios de los porcentajes postoperatorios dposoperatorio
preoperatorioÞ,esperaríamos que las diferencias tiendan a ser positivas. Además,
esperaríamos que la media de una población de tales diferencias fuera positiva.
Entonces, bajo estas condiciones, preguntar si podemos concluir que la
fundoplicatura es efectiva es lo mismo que preguntar si podemos concluir que la
diferencia de medias poblacionales es positiva (mayor que cero).

Las hipótesis nula y alternativa son las siguientes:

H0:metrod-0
HA:metrod>0

Si hubiéramos obtenido las diferencias restando los porcentajes postoperatorios de los pesos
preoperatoriosdpostoperatorio preoperatorioÞ,nuestras hipótesis habrían sido

H0:metrod-0
HA:metrod<0

Si la pregunta hubiera sido tal que se hubiera indicado una prueba de dos caras,
las hipótesis habrían sido

H0:metrod¼0
HA:metrod6¼0

independientemente de la forma en que restamos para obtener las diferencias.

4. Estadística de prueba.El estadístico de prueba apropiado viene dado por la Ecuación 7.4.1.

5. Distribución de la estadística de prueba.Si la hipótesis nula es verdadera, el


estadístico de prueba se distribuye como Student'stconnorte1 grados de libertad.
6. Regla de decisión.Dejara¼ :05. El valor crítico detes 1.7959. RechazarH0si
se calculates mayor o igual que el valor crítico. Las regiones de rechazo
y no rechazo se muestran en la Figura 7.4.1.
7.4 COMPARACIONES POR PARES 253

a= .05

0 1.7959 t

Región de no rechazo Región de rechazo

FIGURA 7.4.1Regiones de rechazo y no rechazo para el


ejemplo 7.4.1.

7. Cálculo de la estadística de prueba.Desde elnorte¼12 diferenciasdi,


calculamos las siguientes medidas descriptivas:

PAG
di
þ d28:2Þ þ ð 37:0Þ þ d41:5 Þ
þ ð6:0Þ 216:9
d-¼ ¼ ¼ ¼18:075
norte 12 12
PAG PAG PAG
ddi d-Þ2 di2 d di2Þ 12d15669:49Þ d216:9Þ2
norte
sd2 ¼ ¼ ¼ ¼1068:0930
1 1Þ
norte d12Þð11Þ nortednorte

18:075 0 18:075
¼1:9159
t¼uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff¼

1068:0930=12 9:4344

8. Decisión estadística.RechazarH0, ya que 1.9159 está en la región de rechazo.

Prueba T emparejada y CI: C2, C1

Pareado T para C2 - C1

norte Significar Desvst SE medio


C2 12 56.6083 27.8001 8.0252
C1 12 38.5333 30.0587 8.6772
Diferencia 12 18.0750 32.6817 9.4344

Límite inferior del 95 % para la diferencia de medias: 1,1319


Prueba T de diferencia de medias 0 (frente a 0): Valor T 0,041 1.92 Valor P

FIGURA 7.4.2Procedimiento MINITAB y salida para prueba de comparaciones pareadas, Ejemplo 7.4.1
(datos en la Tabla 7.4.1).
254 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

9. Conclusión.Podemos concluir que el procedimiento de funduplicatura aumenta el


funcionamiento de GBEF.
10pagvalor.Para esta prueba, :025 <pag < :05, desde 1:7959 < 1:9159 < 2:2010.
MINITAB proporciona lapagvalor como .041 (Figura 7.4.2). &

Un intervalo de confianza parametrod Un intervalo de confianza del 95 por ciento parametrodtal vez
obtenido de la siguiente manera:

d-t1 dun =2Þsd-

18:075 uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff 2:2010 1068:0930=12

18:075 20:765
d2:690; 38:840Þ

El uso dezSi, en el análisis de datos apareados, se conoce la varianza poblacional de las


diferencias, el estadístico de prueba apropiado es

d- metro
z¼ pffidfiffi (7.4.2)
sd= norte

Es poco probable quesdserá conocido en la práctica.


Si el supuesto de distribución normaldi's no se puede hacer, el teorema del límite central se
puede emplear sinortees largo. En tales casos, el estadístico de prueba es la Ecuación 7.4.2, consd
usado para estimarsdcuando, como suele ser el caso, este último es desconocido.

DesventajasEl uso de la prueba de comparaciones pareadas no está exento de problemas. Si se


utilizan diferentes sujetos y se asignan al azar a dos tratamientos, se puede involucrar un tiempo y un
gasto considerables en nuestro intento de emparejar a los individuos en una o más variables
relevantes. Otro precio que pagamos por usar comparaciones pareadas es la pérdida de grados de
libertad. Si no usamos observaciones pareadas, tenemos 2norte2 grados de libertad disponibles en
comparación connorte1 cuando usamos el procedimiento de comparaciones pareadas.
En general, al decidir si usar o no el procedimiento de comparaciones por pares, uno debe
guiarse por la economía involucrada, así como por la consideración de las ganancias que se
obtendrán en términos de controlar la variación extraña.

Alternativassi ningunoznites un estadístico de prueba apropiado para usar con los datos disponibles, es
posible que desee considerar el uso de alguna técnica no paramétrica para probar una hipótesis sobre una
diferencia de medianas. La prueba del signo, discutida en el Capítulo 13, es candidata para su uso en tales
casos.

EJERCICIOS

En los siguientes ejercicios, lleve a cabo el procedimiento de prueba de hipótesis de diez pasos en el nivel de
significación especificado. Para cada ejercicio, según corresponda, explique por qué eligió una prueba unilateral o
una prueba bilateral. Discuta cómo cree que los investigadores o los médicos podrían usar los resultados de su
prueba de hipótesis. ¿Qué decisiones o acciones clínicas o de investigación cree que serían apropiadas a la luz de los
resultados de su prueba?
EJERCICIOS 255

7.4.1Ellen Davis Jones (A-15) estudió los efectos de la terapia de reminiscencia para mujeres mayores con depresión.
Estudió a 15 mujeres de 60 años o más que residían durante 3 meses o más en un centro de atención a largo
plazo de vida asistida. Para este estudio, la depresión se midió con el Geriatric Depression
Escala (GDS). Las puntuaciones más altas indican síntomas de depresión más graves. Los participantes recibieron terapia de
reminiscencia para el cuidado a largo plazo, que utiliza fotografías familiares, álbumes de recortes y recuerdos personales para
estimular la memoria y la conversación entre los miembros del grupo. Las puntuaciones de depresión previas al tratamiento y
posteriores al tratamiento se dan en la siguiente tabla. ¿Podemos concluir, con base en estos datos, que los sujetos que
participan en la terapia de reminiscencia experimentan, en promedio, una disminución en las puntuaciones de depresión de
GDS? Dejara¼ :01.

Pre–GDS: 12 10 dieciséis 2 12 18 11 dieciséis dieciséis 10 14 21 9 19 20


Post–GDS: 11 10 11 3 9 13 8 14 dieciséis 10 12 22 9 dieciséis 18
Fuente: Datos proporcionados por cortesía de Ellen Davis Jones, ND, RN, FNP-C.

7.4.2Beney et al. (A-16) evaluaron el efecto del seguimiento telefónico en la dimensión bienestar físico de la calidad de vida
relacionada con la salud en pacientes con cáncer. Una de las principales variables de resultado se midió mediante la
subescala de bienestar físico de la Escala General de Evaluación Funcional de la Terapia del Cáncer (FACT-G). Una
puntuación más alta indica un mayor bienestar físico. La siguiente tabla muestra la puntuación FACT-G inicial y la
puntuación de seguimiento para evaluar el bienestar físico durante los 7 días posteriores al alta del hospital a
domicilio para 66 pacientes que recibieron una llamada telefónica entre 48 y 72 horas después del alta que les dio a
los pacientes la oportunidad de discutir medicamentos, problemas y consejos.
¿Existe evidencia suficiente para indicar que la calidad del bienestar físico disminuye significativamente en la primera
semana del alta entre los pacientes que reciben una llamada telefónica? Dejara¼ :05.

Base Hacer un seguimiento Base Hacer un seguimiento

Sujeto HECHO-G HECHO-G Sujeto HECHO-G HECHO-G

1 dieciséis 19 34 25 14
2 26 19 35 21 17
3 13 9 36 14 22
4 20 23 37 23 22
5 22 25 38 19 dieciséis

6 21 20 39 19 15
7 20 10 40 18 23
8 15 20 41 20 21
9 25 22 42 18 11
10 20 18 43 22 22
11 11 6 44 7 17
12 22 21 45 23 9
13 18 17 46 19 dieciséis

14 21 13 47 17 dieciséis

15 25 25 48 22 20
dieciséis 17 21 49 19 23
17 26 22 50 5 17
18 18 22 51 22 17
19 7 9 52 12 6
20 25 24 53 19 19
21 22 15 54 17 20
22 15 9 55 7 6
(Continuación)
256 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Base Hacer un seguimiento Base Hacer un seguimiento

Sujeto HECHO-G HECHO-G Sujeto HECHO-G HECHO-G

23 19 7 56 27 10
24 23 20 57 22 dieciséis

25 19 19 58 dieciséis 14
26 21 24 59 26 24
27 24 23 60 17 19
28 21 15 61 23 22
29 28 27 62 23 23
30 18 26 63 13 3
31 25 26 64 24 22
32 25 26 sesenta y cinco 17 21
33 28 28 66 22 21
Fuente: Datos proporcionados por cortesía de Johnny Beney, Ph.D. y E. Beth Devine, Pharm.D.,
MBA et al.

7.4.3El propósito de una investigación de Morley et al. (A-17) fue evaluar la eficacia analgésica de una dosis diaria de
metadona oral en pacientes con síndromes de dolor neuropático crónico. Los investigadores utilizaron una
escala analógica visual (0-100 mm, un número más alto indica un dolor más alto) para clasificar la intensidad
máxima del dolor a lo largo del día. Cada sujeto tomó 20 mg de metadona o un placebo cada día durante 5
días. Los sujetos no sabían qué tratamiento estaban tomando. La siguiente tabla proporciona las
puntuaciones medias de la intensidad máxima del dolor durante los 5 días con metadona y los 5 días con
placebo. ¿Estos datos brindan suficiente evidencia, al nivel de significancia de .05, para indicar que, en
general, la intensidad máxima del dolor es menor en los días en que se toma metadona?

Sujeto Metadona Placebo

1 29.8 57.2
2 73.0 69.8
3 98.6 98.2
4 58.8 62.4
5 60.6 67.2
6 57.2 70.6
7 57.2 67.8
8 89.2 95.6 Fuente: John S. Morley, John Bridson, Tim P. Nash, John B. Miles,
9 97.0 98.4 Sarah White y Matthew K. Makin, “La dosis baja de metadona
10 49.8 63.2 tiene un efecto analgésico en el dolor neuropático: un ensayo
cruzado controlado aleatorio doble ciego ,” Medicina paliativa, 17
11 37.0 63.6
(2003), 576–587.

7.4.4Woo y McKenna (A-18) investigaron el efecto de la terapia ultravioleta B (UVB) de banda ancha y la crema
tópica de calcipotriol usadas juntas en áreas de psoriasis. Una de las variables de resultado es el
Psoriasis Area and Severity Index (PASI). La siguiente tabla proporciona los puntajes PASI para 20
sujetos medidos al inicio y después de ocho tratamientos. ¿Proporcionan estos datos evidencia
suficiente, al nivel de significancia de .01, para indicar que la terapia de combinación reduce
puntajes PASI?
7.5 PRUEBA DE HIPÓTESIS: UNA PROPORCIÓN ÚNICA DE LA POBLACIÓN 257

después de las 8

Sujeto Base Tratos

1 5.9 5.2
2 7.6 12.2
3 12.8 4.6
4 16.5 4.0
5 6.1 0.4
6 14.4 3.8
7 6.6 1.2
8 5.4 3.1
9 9.6 3.5
10 11.6 4.9
11 11.1 11.1
12 15.6 8.4
13 6.9 5.8
14 15.2 5.0
15 21.0 6.4
dieciséis 5.9 0.0
17 10.0 2.7
18 12.2 5.1
19 20.2 4.8
20 6.2 4.2 Fuente: Datos proporcionados por cortesía de WK Woo, MD

7.4.5Uno de los propósitos de una investigación de Porcellini et al. (A-19) fue investigar el efecto sobre el recuento de
células T CD4 de la administración intermitente de interleucina (IL-2) además de la terapia antirretroviral de
gran actividad (HAART). La siguiente tabla muestra el recuento de células T CD4 al inicio y luego nuevamente
después de 12 meses de terapia HAART con IL-2. ¿Muestran los datos, al nivel de 0,05, un cambio significativo
en el recuento de células T CD4?

Sujeto 1 2 3 4 5 6 7

Recuento de células T CD4 al ingresod 106=LÞ 173 58 103 181 105 301 169
Recuento de células T CD4 al final del seguimiento 257 108 315 362 141 549 369
d106=LÞ

Fuente: Simona Procellini, Giuliana Vallanti, Silvia Nozza, Guido Poli, Adraino Lazzarin, Guiseppe Tabussi y Antonio
Grassia, "Potencial timopoyético mejorado en individuos infectados por el VIH con TARGA mediante administración
intermitente de IL-2"SIDA, 17 (2003), 1621–1630.

7.5 PRUEBA DE HIPÓTESIS: UNA


PROPORCIÓN ÚNICA DE LA POBLACIÓN

La prueba de hipótesis sobre proporciones poblacionales se lleva a cabo de la misma manera que para las
medias cuando se cumplen las condiciones necesarias para usar la curva normal. Se pueden hacer pruebas
unilaterales o bilaterales, dependiendo de la pregunta que se haga. Cuando una muestra
258 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

suficientemente grande para la aplicación del teorema del límite central, como se analiza en la sección 5.5, está
disponible para el análisis, el estadístico de prueba es

pag
z¼rffiffiffiffiffiffiffiffi0fiffi (7.5.1)
pag0q0

norte

que cuandoH0es cierto, se distribuye aproximadamente como la normal estándar.

EJEMPLO 7.5.1
Wagenknecht et al. (A-20) recopiló datos sobre una muestra de 301 mujeres hispanas que vivían en
San Antonio, Texas. Una variable de interés fue el porcentaje de sujetos con alteración de la glucosa
en ayunas (GAI). IFG se refiere a una etapa metabólica intermedia entre la homeostasis normal de la
glucosa y la diabetes. En el estudio, 24 mujeres fueron clasificadas en la etapa IFG. El artículo cita
estimaciones de población para IFG entre mujeres hispanas en Texas como 6.3 por ciento. ¿Existe
evidencia suficiente para indicar que la población de mujeres hispanas en San Antonio tiene una
prevalencia de IFG superior al 6.3 por ciento?

Solución:

1. Datos.Los datos se obtienen de las respuestas de 301 individuos de los


cuales 24 poseían la característica de interés; es decir, p̂¼24=301 ¼ :
080.
2. Supuestos.Los sujetos del estudio pueden tratarse como una muestra aleatoria
simple de una población de sujetos similares, y la distribución muestral de p̂
tiene una distribución aproximadamente normal de acuerdo con el teorema del
límite central.
3. Hipótesis.
H0:pag - :063
HA:pag > :063

Realizamos la prueba en el punto de igualdad. La conclusión a la que llegaremos será


la misma a la que llegaríamos si realizáramos la prueba usando cualquier
otro valor hipotético depagmayor que .063. SiH0es verdad,pag¼ :063
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff

y el error estándarspag¼ ð:063Þð:937Þ=301. Nótese que usamos el valor


hipotético depagen informáticaspag. Hacemos esto porque toda la prueba se
basa en la suposición de que la hipótesis nula es verdadera. Para usar la
proporción muestral, p̂, en el cálculospagno sería consistente con este
concepto.
4. Estadística de prueba.El estadístico de prueba viene dado por la Ecuación 7.5.1.

5. Distribución de la estadística de prueba.Si la hipótesis nula es verdadera, el estadístico de


prueba tiene una distribución aproximadamente normal con una media de cero.

6. Regla de decisión.Dejara¼ :05. El valor crítico dezes 1.645. RechazarH0si


el calculadozes - 1:645.
7.5 PRUEBA DE HIPÓTESIS: UNA PROPORCIÓN ÚNICA DE LA POBLACIÓN 259

7. Cálculo de la estadística de prueba.

:080 :063
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼1:21

d:063Þð:937Þ
301

8. Decisión estadística.no rechazarH0desde 1:21 < 1:645.


9. Conclusión.No podemos concluir que en la población muestreada la
proporción de IFG sea superior al 6,3 por ciento.
10pagvalor.pag¼ :1131. &

Las pruebas que involucran una sola proporción se pueden llevar a cabo usando una variedad
de programas de computadora. Los resultados de MINITAB y NCSS, utilizando los datos del Ejemplo
7.5.1, se muestran en la Figura 7.5.1. Cabe señalar que los resultados variarán ligeramente, debido a
errores de redondeo, si los cálculos se realizan a mano. También debe tenerse en cuenta que algunos
programas, como NCSS, utilizan una corrección de continuidad para calcular laz-valor, y por lo tanto
los valores estadísticos de prueba y correspondientepaglos valores difieren ligeramente de la salida
de MINITAB.

Salida de MINITAB

Prueba y CI para una proporción

Prueba de p 0.063 contra p 0.063

95% inferior
Muestra X norte Muestra p Atado Valor Z Valor P
1 24 301 0.079734 0.054053 1.19 0.116

Utilizando la aproximación normal.

Salida NCSS

Aproximación normal usando (P0)

Alternativa Valor Z problema Decisión


Hipótesis Nivel (5%)
PAG P0 1.0763 0.281780 Aceptar H0
PAG
P0 1.0763 0.859110 Aceptar H0
PAG
P0 1.0763 0.140890 Aceptar H0

FIGURA 7.5.1Salida de MINITAB y NCSS parcial para los datos del ejemplo 7.5.1.
260 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

EJERCICIOS

Para cada uno de los siguientes ejercicios, lleve a cabo el procedimiento de prueba de hipótesis de diez pasos en el
nivel de significación designado. Para cada ejercicio, según corresponda, explique por qué eligió una prueba
unilateral o bilateral. Discuta cómo cree que los investigadores o los médicos podrían usar los resultados de su
prueba de hipótesis. ¿Qué decisiones o acciones clínicas o de investigación cree que serían apropiadas a la luz de los
resultados de su prueba?

7.5.1Jacquemyn et al. (A-21) realizó una encuesta entre ginecólogos-obstetras de la región de Flandes y
obtuvo 295 respuestas. De los que respondieron, 90 indicaron que habían realizado al menos
una cesárea a pedido cada año. ¿Proporciona este estudio suficiente evidencia para que
concluyamos que menos del 35 por ciento de los ginecólogos-obstetras en la región de Flandes
realizan al menos una cesárea a pedido cada año? Dejara¼ :05.

7.5.2En un artículo de la revistaSalud y Lugar,Hui y Bell (A-22) encontraron que entre 2428 niños de 7 a 12 años, 461
tenían sobrepeso u obesidad. Sobre la base de este estudio, ¿podemos concluir que más del 15 por ciento de
los niños de 7 a 12 años en la población muestreada son obesos o tienen sobrepeso? Dejar a¼ :05.

7.5.3Becker et al. (A-23) realizó un estudio con una muestra de 50 mujeres de etnia fijiana. Las mujeres completaron
un cuestionario de autoinforme sobre la dieta y las actitudes hacia la forma y el cambio del cuerpo.
Los investigadores encontraron que cinco de los encuestados reportaron al menos episodios semanales de
atracones durante los 6 meses anteriores. ¿Es esta evidencia suficiente para concluir que menos del 20 por
ciento de la población de mujeres fiyianas se involucra al menos en episodios semanales de atracones? Dejar
a¼ :05.

7.5.4El siguiente cuestionario fue completado por una muestra aleatoria simple de 250 ginecólogos. El número que
marca cada respuesta se muestra en la casilla correspondiente.

1.Cuando tiene la opción, ¿qué procedimiento prefiere para obtener muestras de endometrio?
(a)Dilatación y curetaje 175
(b)Aspiración Vobra 75

2.¿Ha visto a una o más mujeres embarazadas durante el último año que sabía que tenían niveles elevados
de plomo en la sangre?
(a)Sí 25
(b)No 225

3.¿Informa rutinariamente a sus pacientes embarazadas que fuman sobre los posibles peligros del
tabaquismo para el feto?
(a)Sí 238
(b)No 12

¿Podemos concluir a partir de estos datos que en la población muestreada más del 60 por ciento prefiere la dilatación
y el legrado para obtener muestras de endometrio? Dejara¼ :01.

7.5.5Consulte el Ejercicio 7.5.4. ¿Podemos concluir a partir de estos datos que en la población muestreada menos del 15 por
ciento ha visto (durante el último año) una o más mujeres embarazadas con niveles elevados de plomo en la sangre?
Dejara¼ :05.

7.5.6Consulte el Ejercicio 7.5.4. ¿Podemos concluir a partir de estos datos que más del 90 por ciento conocen
sus pacientes embarazadas que fuman con los peligros sospechosos de fumar para el feto? Dejar a¼ :
05.
7.6 PRUEBA DE HIPÓTESIS: LA DIFERENCIA ENTRE DOS PROPORCIONES DE POBLACIÓN 261

7.6 PRUEBA DE HIPÓTESIS: LA


DIFERENCIA ENTRE DOS
PROPORCIONES DE POBLACIÓN

La prueba más frecuente empleada en relación con la diferencia entre dos proporciones de
población es que su diferencia sea cero. Sin embargo, es posible probar que la diferencia es
igual a algún otro valor. Se pueden realizar pruebas tanto unilaterales como bilaterales.

Cuando la hipótesis nula a contrastar espag1 pag2¼0, estamos hipotetizando que el


dos proporciones de población son iguales. Usamos esto como justificación para combinar los
resultados de las dos muestras para obtener una estimación combinada de la proporción común
hipotética. Si se adopta este procedimiento, se calcula

X1þX2;
¼
- pag y - q¼1 - pag
norte1þnorte2

dóndeX1yX2son los números en la primera y segunda muestra, respectivamente, que poseen la


característica de interés. Esta estimación conjunta depag¼pag1¼pag2se usa en computacion
spag1 pag,la
2
posición estimada ard error del estimador, como sigue:

fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

- pagd1 -pagÞ -pagd1 -


spag1pag
2
¼ pagÞ þ (7.6.1)
norte1 norte2

El estadístico de prueba se convierte en

ðp̂1 pag2Þ ðpag1 pag2Þ0


z¼ (7.6.2)
spag1pag2

que se distribuye aproximadamente como la normal estándar si la hipótesis nula es verdadera.

EJEMPLO 7.6.1
El síndrome de Noonan es una condición genética que puede afectar el corazón, el crecimiento, la
coagulación de la sangre y el desarrollo mental y físico. Noonan et al. (A-24) examinó la estatura de hombres
y mujeres con síndrome de Noonan. El estudio contenía 29 adultos masculinos y 44 femeninos. Uno de los
valores de corte utilizados para evaluar la estatura fue el tercer percentil de la talla adulta. Once de los
hombres cayeron por debajo del percentil 3 de la estatura masculina adulta, mientras que 24 de las mujeres
cayeron por debajo del percentil 3 de la estatura adulta femenina. ¿Proporciona este estudio pruebas
suficientes para concluir que, entre los sujetos con síndrome de Noonan, las mujeres tienen más
probabilidades que los hombres de caer por debajo del respectivo tercer percentil de estatura adulta? Dejar a
¼ :05.
262 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Solución:

1. Datos.Los datos consisten en información sobre el estado de altura de los hombres


y mujeres con síndrome de Noonan como se describe en el enunciado del
ejemplo.
2. Supuestos.Suponemos que los pacientes del estudio constituyen muestras
aleatorias simples independientes de poblaciones de hombres y mujeres
con síndrome de Noonan.
3. Hipótesis.

H0:pagF-pagMETRO o pagFpag METRO- 0

HA:pagF>pagMETRO o pagFpag METRO> 0

dóndepagFes la proporción de mujeres por debajo del tercer percentil de la altura de


la mujer adulta ypagMETROes la proporción de hombres por debajo del tercer percentil
de la estatura masculina adulta.

4. Estadística de prueba.El estadístico de prueba viene dado por la Ecuación 7.6.2.

5. Distribución de la estadística de prueba.Si la hipótesis nula es verdadera, la estadística de


prueba se distribuye aproximadamente como la normal estándar.

6. Regla de decisión.Dejara¼ :05. El valor crítico dezes 1.645. RechazarH0si


se calculazes mayor que 1.645.
7. Cálculo de la estadística de prueba.A partir de los datos de muestra calculamos
pagF¼24=44¼ :545; pagMETRO¼11=29¼ :379, y -pag¼ ð24þ11Þ=ð44þ29¼
:479. Entonces, el valor calculado del estadístico de prueba es

d:545 :379Þ
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼1:39

d:479Þð:521Þ d:479Þð:521Þ
þ
44 29

8. Decisión estadística.Fallo para rechazarH0desde 1:39 < 1:645.


9. Conclusión.En la población general de adultos con síndrome de Noonan puede que
no haya diferencia en la proporción de hombres y mujeres que tienen estaturas
por debajo del tercer percentil de la estatura adulta.
10pagvalor.para esta pruebapag¼ :0823.
&

Las pruebas que involucran dos proporciones, utilizando los datos del ejemplo 7.6.1, se pueden
realizar con una variedad de programas de computadora. Los resultados de MINITAB y NCSS se muestran en
la Figura 7.6.1. Una vez más, cabe señalar que, debido a los errores de redondeo, los resultados variarán
ligeramente si los cálculos se realizan a mano.
EJERCICIOS 263

Salida de MINITAB

Prueba y CI para dos proporciones

Muestra X norte Muestra p


1 24 44 0.545455
2 11 29 0.379310

Diferencia pag (1) pag (2)


Estimación por diferencia: 0.166144
Límite inferior del 95 % para la diferencia: 0.0267550
Prueba de diferencia 0 (vs > 0): Z 1.39 Valor P 0.082

Salida NCSS

Prueba Prueba Prueba problema Concluir H1


Nombre Estadísticas Estadística Nivel a las 5%

Distribución Valor ¿Significado?


Prueba Z Normal 1.390 0.0822 No

FIGURA 7.6.1Salida de MINITAB y NCSS parcial para los datos del ejemplo 7.6.1.

EJERCICIOS

En cada uno de los siguientes ejercicios utilice el procedimiento de prueba de hipótesis de diez pasos. Para
cada ejercicio, según corresponda, explique por qué eligió una prueba unilateral o bilateral. Discuta cómo
cree que los investigadores o los médicos podrían usar los resultados de su prueba de hipótesis. ¿Qué
decisiones o acciones clínicas o de investigación cree que serían apropiadas a la luz de los resultados de su
prueba?

7.6.1Ho et al. (A-25) utilizó entrevistas telefónicas de encuestados seleccionados al azar en Hong Kong para obtener
información sobre las percepciones de los individuos sobre la salud y el historial de tabaquismo. Entre 1222
fumadores masculinos actuales, 72 informaron que tenían una salud "mala" o "muy mala", mientras que 30 de los
282 ex fumadores informaron que tenían una salud "mala" o "muy mala". ¿Es esta evidencia suficiente para permitir
concluir que entre los hombres de Hong Kong existe una diferencia entre los fumadores actuales y los exfumadores
con respecto a la proporción que se percibe a sí misma como de salud “mala” y “muy mala”? Dejara¼ :01.

7.6.2Landolt et al. (A-26) examinó las tasas de trastorno de estrés postraumático (TEPT) en madres y padres. Los
padres fueron entrevistados 5 a 6 semanas después de un accidente o un nuevo diagnóstico de cáncer o
diabetes mellitus tipo I para su hijo. Veintiocho de los 175 padres entrevistados y 43 de las 180 madres
264 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

entrevistados cumplieron con los criterios para el TEPT actual. ¿Existe evidencia suficiente para que podamos concluir que los
padres tienen menos probabilidades de desarrollar TEPT que las madres cuando un niño está traumatizado por un accidente,
un diagnóstico de cáncer o un diagnóstico de diabetes? Dejara¼ :05.

7.6.3en unriñón internacionalartículo, Avram et al. (A-27) informaron sobre un estudio en el que participaron 529 pacientes de
hemodiálisis y 326 pacientes de diálisis peritoneal. Encontraron que al inicio 249 sujetos en el grupo de tratamiento
de hemodiálisis eran diabéticos, mientras que al inicio 134 de los sujetos en el grupo de diálisis peritoneal eran
diabéticos. ¿Existe una diferencia significativa en la prevalencia de la diabetes al inicio del estudio entre los dos
grupos de este estudio? Dejara¼ :05. ¿Qué implica su hallazgo con respecto a la significancia de la muestra acerca de
las poblaciones de sujetos?

7.6.4En un estudio de obesidad se obtuvieron los siguientes resultados de muestras de hombres y mujeres entre las edades
de 20 y 75 años:

norte número de sobrepeso

machos 150 21
Hembras 200 48

¿Podemos concluir a partir de estos datos que en las poblaciones muestreadas hay una diferencia en las
proporciones que tienen sobrepeso? Dejara¼ :05.

7.7 PRUEBA DE HIPÓTESIS: UNA VARIACIÓN


ÚNICA DE LA POBLACIÓN

En la Sección 6.9 examinamos cómo es posible construir un intervalo de confianza para la varianza de
una población normalmente distribuida. Los principios generales presentados en esa sección pueden
emplearse para probar una hipótesis sobre la varianza de una población. Cuando los datos
disponibles para el análisis consisten en una muestra aleatoria simple extraída de una población
normalmente distribuida, el estadístico de prueba para probar hipótesis sobre la varianza de una
población es

X2¼ ðnorte1Þs2= s2 (7.7.1)

que cuandoH0es cierto, se distribuye comoX2connorte 1 grados de libertad.

EJEMPLO 7.7.1
El propósito de un estudio de Wilkins et al. (A-28) fue para medir la eficacia de la hormona de crecimiento
humana recombinante (rhGH) en niños con quemaduras en el área total de la superficie corporal
> 40 por ciento En este estudio, 16 sujetos recibieron inyecciones diarias en casa de rhGH. Al inicio del
estudio, los investigadores querían conocer los niveles actuales del factor de crecimiento similar a la insulina
(IGF-I) antes de la administración de rhGH. La varianza muestral de los niveles de IGF-I (en ng/ml) fue de
670,81. Deseamos saber si podemos concluir a partir de estos datos que la varianza de la población no es
600.
7.7 PRUEBA DE HIPÓTESIS: UNA VARIACIÓN ÚNICA DE LA POBLACIÓN 265

Solución:

1. Datos.Ver declaración en el ejemplo.


2. Supuestos.La muestra del estudio constituye una muestra aleatoria simple de
una población de niños similares. Los niveles de IGF-I se distribuyen
normalmente.
3. Hipótesis.
H0:s2¼600
HA:s26¼600

4. Estadística de prueba.El estadístico de prueba viene dado por la Ecuación 7.7.1.

5. Distribución de la estadística de prueba.Cuando la hipótesis nula es verdadera, el


estadístico de prueba se distribuye comoX2connorte1 grados de libertad.

6. Regla de decisión.Dejara¼ :05. Valores críticos deX2son 6.262 y 27.488.


RechazarH0a menos que el valor calculado de la estadística de prueba esté
entre 6,262 y 27,488. Las regiones de rechazo y no rechazo se muestran en
la Figura 7.7.1.
7. Cálculo de la estadística de prueba.

15d670:81Þ
X2¼ ¼16:77
600

8. Decisión estadística.no rechazarH0desde 6:262 < 16:77 < 27:488.


9. Conclusión.Con base en estos datos, no podemos concluir que la
varianza de la población no sea 600.
10pagvalor.La determinación de lapagEl valor de esta prueba se complica por el hecho
de que tenemos una prueba bilateral y una distribución muestral asimétrica.
Cuando tenemos una prueba bilateral y una distribución muestral simétrica
como la normal estándar oyo,podemos, como hemos visto, duplicar el unilateral
pagvalor. Los problemas surgen cuando intentamos

. 025
. 025

0 6.262 27.488
X2
15

Región de rechazo Región de no rechazo Región de rechazo

FIGURA 7.7.1 Regiones de rechazo y no rechazo para el ejemplo 7.7.1.


266 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

haga esto con una distribución de muestreo asimétrica como la distribución chi-
cuadrado. En esta situación, el unilateralpagEl valor se informa junto con la
dirección de la desviación observada de la hipótesis nula. De hecho, este
procedimiento puede seguirse en el caso de distribuciones muestrales
simétricas. El precedente, sin embargo, parece favorecer la duplicación de la
unilateral pagvalor cuando la prueba es bilateral e involucra una distribución de
muestreo simétrica.
Para el presente ejemplo, entonces, podemos reportar elpagvalor de la
siguiente manera: pag > :05 (prueba bilateral). Los datos de la muestra sugieren
una varianza de la población superior a 600, pero la prueba no respalda
firmemente esta hipótesis.
Si el problema se plantea en términos de la desviación estándar de la población, se puede
elevar al cuadrado la desviación estándar de la muestra y realizar la prueba como se indicó
anteriormente. &

Pruebas unilateralesAunque este fue un ejemplo de una prueba de dos caras, las pruebas de una cara
también se pueden hacer mediante la modificación lógica del procedimiento dado aquí.

ParaHA:s2>s2 0;rechazarH0si se calculaX2-X2 1 a


ParaHA:s2<s2 0;rechazarH0si se calculaX2-X2 a

Las pruebas que involucran una sola varianza de población se pueden realizar utilizando el software MINITAB.
La mayoría de los demás programas informáticos estadísticos carecen de procedimientos para realizar estas pruebas
directamente. El resultado de MINITAB, utilizando los datos del Ejemplo 7.7.1, se muestra en la Figura 7.7.2.

Prueba y CI para una varianza

Estadísticas

norte Desvst Diferencia


dieciséis 25,9 671

Intervalos de confianza del 95 %

IC para IC para
Método Desvst Diferencia
Estándar (19.1, 40.1) (366, 1607)

Pruebas

Método chi-cuadrado DF Valor P


Estándar 16.77 15 0.666

FIGURA 7.7.2Salida de MINITAB para los datos del Ejemplo 7.7.1.


7.8 PRUEBA DE HIPÓTESIS: LA RAZÓN DE DOS VARIACIONES DE POBLACIÓN 267

EJERCICIOS

En cada uno de los siguientes ejercicios, lleve a cabo el procedimiento de prueba de diez pasos. Para cada ejercicio,
según corresponda, explique por qué eligió una prueba unilateral o bilateral. Discuta cómo cree que los
investigadores o los médicos podrían usar los resultados de su prueba de hipótesis. ¿Qué decisiones o acciones
clínicas o de investigación cree que serían apropiadas a la luz de los resultados de su prueba?

7.7.1Recuerde el Ejemplo 7.2.3, donde Nakamura et al. (A-1) sujetos estudiados con colateral medial aguda
Lesión del ligamento (MCL) con desgarro del ligamento cruzado anterior (LCA). Las edades de los 17 sujetos fueron:

31; 26; 21; 15; 26; dieciséis; 19; 21; 28; 27; 22; 20; 25; 31; 20; 25; 15

Use estos datos para determinar si hay evidencia suficiente para concluir que en una población de
sujetos similares, la varianza de las edades de los sujetos no es de 20 años. Dejara¼ :01.

7.7.2Robinson et al. (A-29) estudió a nueve sujetos que se sometieron a un procedimiento de deflector para la transposición de
las grandes arterias (TGA). Al inicio del estudio, la resistencia vascular sistémica (RVS) (medida en WU m2) los valores
en reposo arrojaron una desviación estándar de 28. ¿Podemos concluir a partir de estos datos que la varianza de la
RVS de una población de sujetos similares con TGA no es 700? Dejara¼ :10

7.7.3Se registraron los valores de capacidad vital para una muestra de 10 pacientes con obstrucción crónica grave de las vías
respiratorias. La varianza de las 10 observaciones fue .75. Pruebe la hipótesis nula de que la varianza de la población
es 1.00. Dejara¼ :05.

7.7.4Se registraron los valores de hemoglobina (g por ciento) para una muestra de 20 niños que formaban parte de un estudio
de leucemia aguda. La varianza de las observaciones fue de 5. ¿Estos datos proporcionan evidencia suficiente para
indicar que la varianza de la población es mayor que 4? Dejara¼ :05.

7.7.5Una muestra de 25 administradores de grandes hospitales participó en un estudio para investigar la naturaleza y el
alcance de la frustración y la tensión emocional asociada con el trabajo. Cada participante recibió una prueba
diseñada para medir el grado de tensión emocional que experimentó como resultado de los deberes y
responsabilidades asociados con el trabajo. La varianza de las puntuaciones fue de 30. ¿Se puede concluir a partir de
estos datos que la varianza de la población es mayor que 25? Dejara¼ :05.

7.7.6En un estudio en el que los sujetos eran 15 pacientes que sufrían enfermedad sarcoide pulmonar, se realizaron
determinaciones de gases en sangre. La varianza del Pao2(mm Hg) fue de 450. Pruebe la hipótesis nula de
que la varianza de la población es mayor que 250. Seaa¼ :05.

7.7.7El análisis del líquido amniótico de una muestra aleatoria simple de 15 mujeres embarazadas arrojó las
siguientes medidas de proteína total (gramos por 100 ml) presente:

:69; 1:04; :39; :37; :64; :73; :69; 1:04;


:83; 1:00; :19; :61; :42; :20; :79

¿Estos datos proporcionan suficiente evidencia para indicar que la varianza de la población es mayor que .05?
Dejara¼ :05. ¿Qué suposiciones son necesarias?

7.8 PRUEBA DE HIPÓTESIS: LA RAZÓN DE DOS


VARIACIONES DE POBLACIÓN

Como hemos visto, el uso de latdistribución en la construcción de intervalos de confianza y en la


prueba de hipótesis para la diferencia entre dos medias poblacionales supone que las varianzas
poblacionales son iguales. Por regla general, las únicas pistas disponibles sobre las magnitudes de
268 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

las varianzas respectivas son las varianzas calculadas a partir de muestras tomadas de las
poblaciones. Nos gustaría saber si la diferencia que, indudablemente, existirá entre las
varianzas muestrales es indicativa de una diferencia real en las varianzas poblacionales, o si la
diferencia es de tal magnitud que podría haberse producido por pura casualidad cuando la las
varianzas de la población son iguales.
Dos métodos de análisis químico pueden dar los mismos resultados en promedio. Puede ser,
sin embargo, que los resultados producidos por un método sean más variables que los resultados del
otro. Nos gustaría algún método para determinar si es probable que esto sea cierto.

Prueba de relación de varianzaLas decisiones sobre la comparabilidad de las varianzas de dos poblaciones
generalmente se basanen la prueba de la razón de varianza,que es una prueba de la hipótesis nula de que
dos varianzas poblacionales son iguales. Cuando probamos la hipótesis de que las varianzas de dos
poblaciones son iguales, estamos, en efecto, probando la hipótesis de que su razón es igual a 1.
Aprendimos en el capítulo anterior que, cuando se cumplen ciertos supuestos, el
cantidads21= s21=s2 2= s22se distribuye comoFconnorte1 1 numerador grados de libertad y
norte2 1 denominador grados de libertad. Si estamos hipotetizando ques2 1¼s2 2, asumimos
que la hipótesis es verdadera, y las dos varianzas se anulan en la expresión anterior dejando
s12= s22, que sigue el mismoFdistribución. El radios2 1= s22será designado VR para
relación de varianza.

Para una prueba bilateral, seguimos la convención de colocar la varianza muestral más grande
en el numerador y obtener el valor crítico deFparaun =2 y los grados de libertad apropiados. Sin
embargo, para una prueba unilateral, cuál de las dos varianzas de la muestra debe colocarse en el
numerador está predeterminado por el enunciado de la hipótesis nula. por ejemplo, para
la hipótesis nula de ques2 1= s22, el estadístico de prueba apropiado es V:R:¼s2 1= s22. El critico
valor deFse obtiene pora (noun =2) y los grados de libertad apropiados. en me gusta
manera, si la hipótesis nula es ques2 1-s2 2, el estadístico de prueba apropiado es V:R:¼s2 2= s21.
En todos los casos, la regla de decisión es rechazar la hipótesis nula si la VR calculada es
igual o mayor que el valor crítico deF.

EJEMPLO 7.8.1
Borden et al. (A-30) compararon técnicas de reparación de meniscos utilizando muestras de rodilla de
cadáver. Una de las variables de interés fue la carga al fracaso (en newtons) para las rodillas fijadas
con la técnica FasT-FIX (grupo 1) y el método de sutura vertical (grupo 2). Cada técnica se aplicó a seis
especímenes. La desviación estándar para el método FasT-FIX fue de 30,62 y la desviación estándar
para el método de sutura vertical fue de 11,37. ¿Podemos concluir que, en general, la varianza de la
carga en la falla es mayor para la técnica FasT-FIX que para el método de sutura vertical?

Solución:

1. Datos.Véase el enunciado del ejemplo.


2. Supuestos.Cada muestra constituye una muestra aleatoria simple de una
población de sujetos similares. Las muestras son independientes. Suponemos
que las cargas de falla en ambas poblaciones tienen una distribución
aproximadamente normal.
7.8 PRUEBA DE HIPÓTESIS: LA RAZÓN DE DOS VARIACIONES DE POBLACIÓN 269

. 05

0 5.05 F(5, 5)

Región de no rechazo Región de rechazo

FIGURA 7.8.1 Regiones de rechazo y no rechazo,


Ejemplo 7.8.1.

3. Hipótesis.
H0:s2 1-s2 2

HA:s2 1>s2 2

4. Estadística de prueba.

s2
V: R:¼1 (7.8.1)
s22

5. Distribución de la estadística de prueba.Cuando la hipótesis nula es verdadera, el estadístico de


prueba se distribuye comoFconnorte1 1 numerador ynorte2 1
denominador grados de libertad.
6. Regla de decisión.Dejara¼ :05. El valor crítico deF,de la Tabla G del Apéndice, es
5.05. Tenga en cuenta que si la tabla G no contiene una entrada para los grados
de libertad del numerador dados, usamos la columna más cercana en valor a los
grados de libertad del numerador dados. RechazarH0si V:R: - 5:05. Las regiones
de rechazo y no rechazo se muestran en la figura 7.8.1.
7. Cálculo de la estadística de prueba.

d30:62Þ2
V: R:¼ ¼7:25
d11:37Þ2

8. Decisión estadística.rechazamosH0, desde 7:25 > 5:05; es decir, la


relación calculada cae en la región de rechazo.
9. Conclusión.La variabilidad de la carga de falla es mayor cuando se utiliza el método
FasT-FIX que el método de sutura vertical.
10pagvalor.Debido a que el VR calculado de 7.25 es mayor que 5.05, elpag valor
para esta prueba es inferior a 0,05. Excel calcula estopagvalor ser. 0243.

&

Se pueden usar varios programas de computadora para probar la igualdad de dos varianzas. Los
resultados de estos programas diferirán según la prueba que se utilice. Vimos en la Figura 7.3.3,
270 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

por ejemplo, que el sistema SAS utiliza un procedimiento de prueba F plegado. MINITAB utiliza dos pruebas
diferentes. La primera es una prueba F bajo el supuesto de normalidad, y la otra es una prueba de Levene
modificada (1) que se utiliza cuando no se puede asumir la normalidad. SPSS utiliza una prueba de Levene sin
modificar (2). Independientemente de las opciones, estas pruebas generalmente se consideran superiores a
la prueba de razón de varianza que se presenta en el Ejemplo 7.8.1. La discusión de las matemáticas detrás
de estas pruebas está más allá del alcance de este libro, pero se da un ejemplo para ilustrar estos
procedimientos, ya que los resultados de estas pruebas a menudo se proporcionan automáticamente como
salidas cuando se usa un programa de computadora para llevar a cabo una prueba.t-prueba.

EJEMPLO 7.8.2
Usando los datos del ejemplo 7.3.2, estamos interesados en probar si la suposición de la igualdad de
varianzas se puede asumir antes de realizar unat-prueba. Para facilitar la discusión, los datos se
reproducen a continuación (Tabla 7.8.1):

TABLA 7.8.1 Presiones (mm Hg) debajo de la pelvis durante condiciones estáticas para el ejemplo
7.3.2

Control 131 115 124 131 122 117 88 114 150 169
LME 60 150 130 180 163 130 121 119 130 148

Los resultados parciales de MINITAB, SAS y SPSS se muestran en la figura 7.8.2. Independientemente de la
prueba o el programa que se utilice, no podemos rechazar la hipótesis nula de igualdad de varianzas.
H0:s2 1¼s2 2porque todopagvalores > 0:05. Ahora podemos proceder con unt-prueba bajo el
suposición de varianzas iguales. &

Salida de MINITAB Salida SPSS

Prueba F Prueba de Levene para


Estadística de prueba 0.46 Igualdad de Varianzas
Valor P 0.263
F Sig.
Prueba de Levene
. 664 . 482
Estadística de prueba 0.49
Valor P 0.495

Salida SAS

Igualdad de Varianzas

Variable Método Núm DF Guarida DF Valor F PR F


presión F plegada 9 9 2.17 0.2626

FIGURA 7.8.2Salidas parciales de MINITAB, SPSS y SAS para probar la igualdad de dos varianzas
de población.
EJERCICIOS 271

EJERCICIOS

En los siguientes ejercicios realice la prueba de los diez pasos. Para cada ejercicio, según corresponda, explique por
qué eligió una prueba unilateral o bilateral. Discuta cómo cree que los investigadores o los médicos podrían usar los
resultados de su prueba de hipótesis. ¿Qué decisiones o acciones clínicas o de investigación cree que serían
apropiadas a la luz de los resultados de su prueba?

7.8.1Dora et al. (A-31) investigó las dimensiones del canal espinal en 30 sujetos sintomáticos con hernia de disco
seleccionados para una discectomía y 45 individuos asintomáticos. Los investigadores querían saber si las
dimensiones del canal espinal son un factor de riesgo significativo para el desarrollo de la ciática. Con ese fin,
midieron la dimensión del canal espinal entre las vértebras L3 y L4 y obtuvieron una media de 17,8 mm en el
grupo de discectomía con una desviación estándar de 3,1. En el grupo control, la media fue de 18,5 mm con
una desviación estándar de 2,8 mm. ¿Existe evidencia suficiente para indicar que en poblaciones relevantes la
varianza para sujetos sintomáticos con hernia de disco es mayor que la varianza para sujetos de control?
Dejara¼ :05.

7.8.2Nagy et al. (A-32) estudiaron a 50 pacientes estables que ingresaron por herida de bala que atravesaba el
mediastino. De estos, se consideró que ocho tenían una lesión mediastínica y 42 no. La desviación estándar
de las edades de los ocho sujetos con lesión mediastínica fue de 4,7 años y la desviación estándar de las
edades de los 42 sin lesión fue de 11,6 años. ¿Podemos concluir a partir de estos datos que la varianza de la
edad es mayor para una población de sujetos similares sin lesión en comparación con una población con
lesión mediastínica? Dejara¼ :05.

7.8.3Se administró una prueba diseñada para medir el nivel de ansiedad a una muestra de pacientes masculinos y femeninos
justo antes de someterse al mismo procedimiento quirúrgico. Los tamaños de muestra y las varianzas calculadas a
partir de las puntuaciones fueron los siguientes:

Hombres: norte¼dieciséis;s2¼

Hembras: 150 norte¼21;s2¼275

¿Proporcionan estos datos evidencia suficiente para indicar que en las poblaciones representadas las
puntuaciones de las mujeres son más variables que las de los hombres? Dejara¼ :05.

7.8.4En un experimento para evaluar los efectos de la exposición al humo del cigarrillo en ratas, 11 animales
estuvieron expuestos y 11 animales de control no estuvieron expuestos al humo de los cigarrillos sin
filtro. Al final del experimento, se realizaron mediciones de la frecuencia del latido ciliar (latidos/min a
20 C) en cada animal. La varianza para el grupo expuesto fue de 3400 y 1200 para el grupo no
expuesto. ¿Estos datos indican que en las poblaciones representadas las varianzas son diferentes?
Dejara¼ :05.

7.8.5Se comparó la eficacia de dos fármacos analgésicos sobre la base del tiempo transcurrido entre la
administración del fármaco y el cese del dolor. Trece pacientes recibieron el fármaco 1 y 13
recibió el fármaco 2. Las varianzas de la muestra fuerons2 1¼64 ys2 2¼16. Pruebe la hipótesis nula de que los dos
las varianzas de las poblaciones son iguales. Dejara¼ :05.

7.8.6Se realizaron determinaciones del volumen de células empaquetadas en dos grupos de niños con cardiopatía congénita
cianótica. Los tamaños de muestra y las varianzas fueron los siguientes:

Grupo norte s2

1 10 40
2 dieciséis 84
272 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

¿Estos datos proporcionan evidencia suficiente para indicar que la varianza de la población 2 es mayor que la
varianza de la población 1? Dejara¼ :05.

7.8.7Muestras aleatorias simples independientes de dos cepas de ratones utilizadas en un experimento produjeron las
siguientes mediciones de los niveles de glucosa en plasma después de una experiencia traumática:

Cepa A: 54; 99; 105; 46; 70; 87; 55; 58; 139; 91
Cepa B: 93; 91; 93; 150; 80; 104; 128; 83; 88; 95; 94; 97

¿Estos datos proporcionan evidencia suficiente para indicar que la varianza es mayor en la población de ratones de la
cepa A que en la población de ratones de la cepa B? Dejara¼ :05. ¿Qué suposiciones son necesarias?

7.9 EL ERROR TIPO II Y LA


POTENCIA DE UNA PRUEBA

En nuestra discusión sobre la prueba de hipótesis, nuestro enfoque ha estado ena,la


probabilidad de cometer un error tipo I (rechazar una hipótesis nula verdadera). Le hemos
prestado poca atenciónb,la probabilidad de cometer un error de tipo II (no rechazar una
hipótesis nula falsa). Hay una razón para esta diferencia de énfasis. Para una prueba dada,aes
un número único asignado por el investigador antes de realizar la prueba. Es una medida del
riesgo aceptable de rechazar una hipótesis nula verdadera. Por otro lado,bpuede asumir uno
de muchos valores. Supongamos que deseamos probar la hipótesis nula de que algún
parámetro de la población es igual a algún valor específico. SiH0es falso y no lo rechazamos,
cometemos un error tipo II. Si el valor hipotético del parámetro no es el valor verdadero, el
valor deb (la probabilidad de cometer un error tipo II) depende de varios factores: (1) el valor
real del parámetro de interés, (2) el valor hipotético del parámetro, (3) el valor dea, y (4) el
tamaño de la muestra,norte.para fijoaynorte,entonces, podemos, antes de realizar una prueba
de hipótesis, calcular muchos valores debpostulando muchos valores para el parámetro de
interés dado que el valor hipotético es falso.
Para una prueba de hipótesis dada, es de interés saber qué tan bien la prueba controla los
errores de tipo II. SiH0es de hecho falso, nos gustaría saber la probabilidad de que lo rechacemos. El
fuerzade una prueba, designado 1b,proporciona esta información deseada. la cantidad 1bes la
probabilidad de que rechacemos una hipótesis nula falsa; puede calcularse para cualquier valor
alternativo del parámetro sobre el que estamos probando una hipótesis. Por lo tanto, 1bes la
probabilidad de que tomemos la acción correcta cuandoH0es falso porque el valor verdadero del
parámetro es igual al que calculamos 1b.Para una prueba dada, podemos especificar cualquier
número de valores posibles del parámetro de interés y para cada uno calcular el valor de 1b.El
resultado se llamafunción de poderLa gráfica de una función de potencia, llamadacurva de potencia,
es un dispositivo útil para evaluar rápidamente la naturaleza del poder de una prueba determinada. El
siguiente ejemplo ilustra los procedimientos que usamos para analizar el poder de una prueba.

EJEMPLO 7.9.1
Supongamos que tenemos una variable cuyos valores arrojan una desviación estándar de la población de 3,6.
De la población seleccionamos una muestra aleatoria simple de tamañonorte¼100. Seleccionamos un valor
dea¼ :05 para las siguientes hipótesis:

H0:metro¼17:5;HA:metro6¼17:5
7.9 EL ERROR TIPO II Y LA POTENCIA DE UNA PRUEBA 273

Solución: Cuando estudiamos la potencia de una prueba, ubicamos las regiones de rechazo y no
rechazo en el -Xescala en lugar de lazescala. Encontramos los valores críticos de -X para una
prueba bilateral utilizando las siguientes fórmulas:

s
- Xtu¼metro0þzpffiffiffi (7.9.1)
norte

y
s
- XL¼metro0 zpffiffiffi (7.9.2)
norte

dónde -Xtuy -XLson los valores críticos superior e inferior, respectivamente, de -X;
þzyzson los valores críticos dez;ymetro0es el valor hipotético demetro. Para
nuestro ejemplo, tenemos

d3:6Þ
- Xtu¼17:50þ1:96 ¼17:50þ1:96d:36Þ
d10Þ
¼17:50þ :7056¼18:21

- XL¼17:50 1:96d:36¼17:50 :7056¼16:79

Suponer queH0es falso, es decir, quemetrono es igual a 17.5. En ese caso,


metroes igual a algún valor distinto de 17,5. No sabemos el valor real de
metro.Pero siH0Es falso,metroes uno de los muchos valores que son mayores o
menores que 17.5. Suponga que la verdadera media poblacional esmetro1¼16:5.
Entonces la distribución muestral de -X1también es aproximadamente normal,
con metro-X¼metro¼16:5. A esto lo llamamos distribución muestralFd-X1Þ,y
llamamos distribución muestral bajo la hipótesis nulaFd-X0Þ.
b,la probabilidad del error de tipo II de no rechazar un nulo falso
hipótesis, es el área bajo la curva deFd-X1Þque se superpone a la región de
no rechazo especificada enH0. Para determinar el valor deb,encontramos el
área debajoFd-X1Þ,sobre el -Xeje, y entre -X¼16:79 y -X¼18:21. El valor debes
igual aPAGd16:79 - -X -18:21Þcuandometro¼16:5. esto es lo mismo que

16:79 16:5 18:21 16:5 :29 1:71


PAG - z- ¼PAG - z-
:36 :36 :36 :36
¼PAGd:81 -z-4:75Þ
1 :7910¼ :2090

Así, la probabilidad de tomar una acción apropiada (es decir, rechazar H0)
cuando la hipótesis nula establece quemetro¼17:5, pero de hechometro¼16:5, es
274 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

FIGURA 7.9.1Tamaño debpara valores seleccionados paraH1para el Ejemplo 7.9.1.

1:2090¼ :7910. Como hemos señalado,metropuede ser uno de un gran número de


valores posibles cuandoH0Es falso. La figura 7.9.1 muestra un gráfico de varias de
estas posibilidades. La Tabla 7.9.1 muestra los valores correspondientes deby 1b (que
son aproximados), junto con los valores debpara algunas alternativas adicionales.

Tenga en cuenta que en la Figura 7.9.1 y la Tabla 7.9.1 esos valores demetrobajo
la hipótesis alternativa que están más cerca del valor demetroespecificado porH0tener
asociados más grandesbvalores. por ejemplo, cuandometro¼18 bajo la hipótesis
alternativa,b¼ :7190; y cuandometro¼19:0 bajoHA,b¼ :0143. La potencia de la prueba
para estas dos alternativas, entonces, es 1:7190¼ :2810 y 1:0143¼ :9857,
respectivamente. Mostramos la potencia de la prueba de forma gráfica
7.9 EL ERROR TIPO II Y LA POTENCIA DE UNA PRUEBA 275

TABLA 7.9.1 Valores deby 1bpara valores


alternativos seleccionados demetro1, Ejemplo
7.9.1

Valores posibles demetroBajo


HACuandoH0Es falso b 1b

16.0 0.0143 0.9857


16.5 0.2090 0.7910
17.0 0.7190 0.2810
18.0 0.7190 0.2810
18.5 0.2090 0.7910
19.0 0.0143 0.9857

1 -b
1.00
0.90
0.80
0.70
0,60
0.50
0.40
0.30
0.20
0.10
0
16.0 17.0 18.0 19.0
Valores alternativos demetro

FIGURA 7.9.2Curva de potencia para el ejemplo 7.9.1.

en una curva de potencia, como en la Figura 7.9.2. Tenga en cuenta que cuanto más alta es la curva, mayor
es la potencia. &

Aunque sólo un valor deaestá asociado con una prueba de hipótesis dada, hay muchos valores deb,uno para
cada valor posible demetrosimetro0no es el verdadero valor demetrocomo se hipotetiza. A menos que los
valores alternativos demetroson mucho más grandes o más pequeños quemetro0,bes relativamente grande
en comparación cona.Por lo general, usamos procedimientos de prueba de hipótesis con más frecuencia en
aquellos casos en los que, cuandoH0es falso, el valor verdadero del parámetro es bastante cercano al valor
hipotético. En la mayoría de los casos,b,la probabilidad calculada de no poder rechazar una hipótesis nula
falsa, es mayor quea,la probabilidad de rechazar una hipótesis nula verdadera. Estos hechos son compatibles
con nuestra afirmación de que una decisión basada en una hipótesis nula rechazada es más concluyente que
una decisión basada en una hipótesis nula que no se rechaza. La probabilidad de equivocarse en el último
caso es generalmente mayor que la probabilidad de equivocarse en el primer caso.

La Figura 7.9.2 muestra la apariencia en forma de V de una curva de potencia para una prueba de dos
caras. En general, una prueba bilateral que discrimine bien entre el valor del parámetro enH0
y valores enH1da como resultado una curva de potencia estrecha en forma de V. Una amplia curva en forma de V
276 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

indica que la prueba discrimina pobremente sobre un intervalo relativamente amplio de valores
alternativos del parámetro.

Curvas de potencia para pruebas unilateralesLa forma de una curva de potencia para una prueba
unilateral con la región de rechazo en la cola superior es una S alargada. Si la región de rechazo de una
prueba unilateral está ubicada en la cola inferior de la distribución, la curva de potencia toma la forma de una
S alargada inversa. El siguiente ejemplo muestra la naturaleza de la curva de potencia para una prueba
unilateral.

EJEMPLO 7.9.2
El tiempo medio que los empleados de laboratorio tardan ahora en realizar una determinada tarea en
una máquina es de 65 segundos, con una desviación estándar de 15 segundos. Los tiempos tienen
una distribución aproximadamente normal. Los fabricantes de una nueva máquina afirman que su
máquina reducirá el tiempo medio necesario para realizar la tarea. El supervisor de control de calidad
diseña una prueba para determinar si debe o no creer en la afirmación de los fabricantes de la nueva
máquina. Ella elige un nivel de significación dea¼0:01 y selecciona al azar a 20 empleados para
realizar la tarea en la nueva máquina. Las hipótesis son

H0:m-sesenta y cinco;HA:m <sesenta y cinco

El supervisor de control de calidad también desea construir una curva de potencia para la prueba.

Solución: El supervisor de control de calidad calcula, por ejemplo, el siguiente


valor de 1bpor la alternativametro¼55. El valor crítico de 1 para la b
prueba es
15
65 2:33pffiffiffiffiffi¼57
20

Encontramosbcomo sigue:

57 55
b¼PAGd-X >57jmetro¼55¼P z > pffiffiffiffiffi ¼PAGdz > :60Þ
15= 20
¼1:7257¼ :2743

En consecuencia, 1b¼1:2743¼ :7257. La figura 7.9.3 muestra el cálculo


deb.Cálculos similares para otros valores alternativos demetro

b=0.2743
a=0.01

X–
55 57 sesenta y cinco

FIGURA 7.9.3 bcalculado parametro¼55.


7.10 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA CONTROLAR ERRORES TIPO II 277

1 -b

1.00
0.90
0.80
0.70
0,60
0.50
0.40
0.30
0.20
0.10

51 53 55 57 59 61 63 sesenta y cinco

Valores alternativos demetro

FIGURA 7.9.4Curva de potencia para el ejemplo 7.9.2.

también dan valores de 1b.Cuando se grafica contra los valores demetro,estos dan la curva
de potencia que se muestra en la Figura 7.9.4. &

Curvas características de funcionamientoOtra forma de evaluar una prueba es observar su


característica de funcionamiento (JEFE)curva.Para construir una curva OC, trazamos valores de
b,en lugar de 1b,a lo largo del eje vertical. Así, una curva OC es el complemento de la
correspondiente curva de potencia.

EJERCICIOS

Construya y grafique la función de potencia para cada una de las siguientes situaciones.

7.9.1H0:m-516; HA:metro >516; norte¼dieciséis;s¼32;a¼0:05:

7.9.2H0:metro¼3; HA:metro6¼3; norte¼100;s¼1;a¼0:05:

7.9.3H0:m-4:25; HA:metro >4:25; norte¼81;s¼1:8;a¼0:01:

7.10 DETERMINACIÓN DEL TAMAÑO DE LA


MUESTRA PARA CONTROLAR ERRORES TIPO II

En el Capítulo 6 aprendió cómo encontrar los tamaños de muestra necesarios para construir
intervalos de confianza para medias y proporciones de población para niveles de confianza
específicos. Aprendiste en el Capítulo 7 que los intervalos de confianza se pueden usar para probar
hipótesis. El método para determinar el tamaño de la muestra presentado en el Capítulo 6 tiene en
cuenta la probabilidad de un error tipo I, pero no un error tipo II, ya que el nivel de confianza está
determinado por el coeficiente de confianza, 1a.
278 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

En muchos procedimientos de inferencia estadística, el investigador desea considerar tanto el error


de tipo II como el error de tipo I al determinar el tamaño de la muestra. Para ilustrar el procedimiento, nos
referimos nuevamente al ejemplo 7.9.2.

EJEMPLO 7.10.1
En el ejemplo 7.9.2, las hipótesis son

H0:m-sesenta y cinco; HA:m <sesenta y cinco

La desviación estándar de la población es 15 y la probabilidad de un error tipo I se establece en


.01. Supongamos que queremos la probabilidad de fallar en rechazarH0dbÞser .05 siH0es falsa
porque la verdadera media es 55 en lugar de la hipotética 65. ¿Qué tamaño de muestra
necesitamos para realizar, simultáneamente, los niveles deseados deay¿b?

Solución: Paraa¼ :01 ynorte¼20;bes igual a .2743. El valor crítico es 57. Bajo las nuevas
condiciones, el valor crítico es desconocido. Llamemos a este nuevo valor crítico
C.Dejarmetro0Sea la media hipotética ymetro1la media bajo la hipótesis alternativa.
Podemos transformar cada una de las distribuciones de muestreo relevantes de -X, el
que tiene una media demetro0y el que tiene una media demetro1a unzdistribución. Por
lo tanto, podemos convertirCa unzvalor en la escala horizontal de cada una de las dos
distribuciones normales estándar. Cuando transformamos la distribución muestral de -
Xque tiene un medio demetro0a la distribución normal estándar, la llamamosz eso
resultaz0. Cuando transformamos la distribución de muestreo -Xque tiene un medio de
metro1a la distribución normal estándar, la llamamoszeso resultaz1. La figura 7.10.1
representa la situación descrita hasta ahora.
Podemos expresar el valor críticoCcomo una función dez0ymetro0y
también en función dez1ymetro1. Esto da las siguientes ecuaciones:
s
C¼metro0 z0pffiffiffi (7.10.1)
norte

s
C¼metro1þz1pffiffiffi (7.10.2)
norte

b
a
X–
metro1 C metro0

z
0 z1
z
z0 0
FIGURA 7.10.1 Representación gráfica de las relaciones en la determinación
del tamaño de la muestra para controlar los errores de tipo I y tipo II.
EJERCICIOS 279

Igualamos los lados derechos de estas ecuaciones y resolvemos paranorte,


para obtener

dz0þz1Þs2
norte¼ (7.10.3)
dmetro0 metro1Þ

Encontrarnortepara nuestro ejemplo ilustrativo, sustituimos las cantidades


apropiadas en la Ecuación 7.10.3. Tenemosmetro0¼sesenta y cinco,metro1¼55, ys¼15. De la
Tabla D del Apéndice, el valor dezque tiene .01 del área a su izquierda es 2:33. El valor dez
que tiene .05 del área a su derecha es 1.645. Ambosz0yz1se toman como positivos.
Determinamos siCse encuentra por encima o por debajo de cualquierametro0ometro1
cuando sustituimos en las Ecuaciones 7.10.1 y 7.10.2. Así, calculamos

d2:33þ1:645Þð15Þ2
norte¼ ¼35:55
d65 55Þ

Necesitaríamos una muestra de tamaño 36 para lograr los niveles deseados deayb
cuando elegimosmetro1¼55 como el valor alternativo demetro.
ahora calculamosC,el valor crítico para la prueba y establecer una regla de
decisión apropiada. EncontrarC,podemos sustituir valores numéricos conocidos en la
Ecuación 7.10.1 o en la Ecuación 7.10.2. Con fines ilustrativos, resolvemos ambas
ecuaciones paraC.Primero tenemos
15
C¼65 2:33 ¼59:175
pffiffiffiffiffi

36
De la Ecuación 7.10.2, tenemos

15
C¼55 1:645 ¼59:1125
pffiffiffiffiffi

36
La diferencia entre los dos resultados se debe a un error de redondeo.
La regla de decisión, cuando usamos el primer valor deC,es como sigue:

Seleccione una muestra de tamaño 36 y calcule -x, si -x - 59:175, rechace H0.Si


- x > 59:175, no rechace H0.
Hemos limitado nuestra discusión sobre el error de tipo II y la potencia de una
prueba al caso de una media poblacional. Los conceptos se extienden a casos que
involucran otros parámetros. &

EJERCICIOS

7.10.1DadoH0:metro¼516;HA:metro >516;norte¼dieciséis;s¼32;a¼ :05: Dejab¼ :10 ymetro1¼520, y encontrar


norteyC.Indique la regla de decisión apropiada.

7.10.2DadoH0:m-4:500;HA:metro >4:500;norte¼dieciséis;s¼ :020;a¼ :01: Dejab¼ :05 ymetro1¼4:52,


y encontrarnorteyC.Indique la regla de decisión apropiada.

7.10.3DadoH0:m-4:25;HA:metro >4:25;norte¼81;s¼1:8;a¼ :01: Dejab¼ :03 ymetro1¼5:00,


y encontrarnorteyC.Indique la regla de decisión apropiada.
280 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

7.11 RESUMEN

En este capítulo se discuten los conceptos generales de la prueba de hipótesis. Se sugiere un


procedimiento general para llevar a cabo una prueba de hipótesis que consta de los siguientes diez
pasos.

1.Descripción de los datos.

2.Declaración de supuestos necesarios.


3.Enunciado de hipótesis nula y alternativa.
4.Especificación del estadístico de prueba.

5.Especificación de la distribución del estadístico de prueba.


6.Enunciado de la regla de decisión.
7.Cálculo de la estadística de prueba a partir de datos de muestra.

8.La decisión estadística basada en los resultados de la muestra.

9.Conclusión.
10Determinación depagvalor.

Una serie de pruebas de hipótesis específicas se describen en detalle y se ilustran con ejemplos
apropiados. Estos incluyen pruebas relacionadas con las medias de población, la diferencia entre dos
medias de población, comparaciones pareadas, proporciones de población, la diferencia entre dos
proporciones de población, una varianza de población y la razón de dos varianzas de población.
Además, analizamos el poder de una prueba y la determinación del tamaño de la muestra para
controlar los errores de tipo I y tipo II.

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 7

Número de fórmula Nombre Fórmula

7.1.1, 7.1.2, 7.2.1 z-transformación -X metro


z¼ pffiffi0ff
(usando cualquierametroometro0) s= norte

7.2.2 t-transformación -X metro


t¼ pffiffiffi0
s= norte

7.2.3 - Xmetro

Estadística de prueba cuando
pffiffiffi0
muestreo de un s = norte

población que no se
distribuye normalmente

7.3.1 Estadística de prueba cuando d-X1 - X2Þ dmetro1 metro



0
z¼ sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
muestreo de normalmente
s21 s22
poblaciones distribuidas: þ
norte1 norte2
varianzas de población
conocido
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 7 281

7.3.2 Estadística de prueba cuando d-X1 - XÞ ðmetro metro2Þ0, dónde


t¼ s2ffiffiffiffiffiffiffiffiffiffiffiffi1ffiffiffiffi

muestreo de normalmente
spag
2 s2pag
poblaciones distribuidas: þ
norte1 norte2
varianzas de población
desconocido e igual
dnorte1 1Þsþ2ðnorte
1 2 1Þs22
spag
2 ¼
norte1þnorte2 2

7.3.3, 7.3.4 Estadística de prueba cuando d-X1 - X2Þ ðmetro1 metroÞ


2
t0¼ sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi 0, dónde
muestreo de normalmente
s2 s22
poblaciones distribuidas: 1þ
norte1 norte2
varianzas de población
desconocido y desigual
w1t1þw2 t2
t01dun =2Þ¼
w1þw2

7.3.5 Muestreo de d-X1 - X2Þ dmetro metro 2Þ0


z¼ sffiffiffiffiffiffiffiffiffiffiffiffiffi1ffiffiffi
poblaciones que no se
s21 s22
distribuyen normalmente þ
norte1 norte2

7.4.1 Estadístico de prueba para d-metrod0



diferencias pareadas cuando el sd-
la varianza de la población es
desconocido

7.4.2 Estadístico de prueba para d-metro

diferencias pareadas cuando el


z¼ pffidfiffi
sd=norte
la varianza de la población es
conocido

7.5.1 Estadístico de prueba para una pag


z¼rffiffiffiffiffiffiffiffi0fiffi
sola proporción de población pag0q0

norte

7.6.1, 7.6.2 Estadístico de prueba para ðp̂1 pag2Þ ðpag1 pag2Þ0, dónde

la diferencia entre dos spag1pag2
proporciones de población
X1 þX2, y
- pag¼
norte1þnorte2

rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

- pagd1 -pagÞ -pagd1 -


spag1 pag¼
2 pagÞ þ
norte1 norte2

7.7.1 Estadístico de prueba para una dnorte1Þs2


X2 ¼
sola varianza de población s2
7.8.1 Relación de varianza s12
V: R:¼
s22
(Continuado)
282 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

7.9.1, 7.9.2 Valores críticos superior e s


- Xtu¼metroþzpffiffiffi
0
inferior para -X norte

s
- XL¼metro0 zpffiffiffi
norte

7.10.1, 7.10.2 Valor crítico para s s


C¼metro0 z0pffiffiffi ¼metro 1þz1pffiffiffi
determinación de la muestra norte norte

tamaño a controlar
errores tipo II

7.10.3 2
Tamaño de muestra para dzþz
0 1Þs
norte¼
controlar errores tipo II
dmetro0 metro1Þ

Clave de símbolo a¼tasa de error tipo


1 C¼valor crítico
X2¼distribución chi-cuadrado d-¼
diferencia promedio metro¼media
de la población metro0¼media
hipotética norte¼tamaño de la
muestra
pag¼proporción para la población
- pag¼proporción
promedio q¼ ð1pagÞ
pag¼proporción estimada para la muestra
s2¼varianza de la población
s¼desviación estándar de población s
d-¼error estándar de diferencia s-X¼
Error estándar
s¼desviación estándar de la muestra
sd-¼desviación estándar de la diferencia spag
¼desviación estándar agrupada t¼
Estudiantest-transformación t0¼Corrección
de Cochran at
- X¼media de la muestra
- XL¼límite inferior del valor crítico para -X
- Xtu¼límite superior del valor crítico para
-xz¼transformación normal estándar

PREGUNTAS DE REPASO Y EJERCICIOS

1.¿Cuál es el propósito de la prueba de hipótesis?

2.¿Qué es una hipótesis?

3.Enumere y explique cada paso en el procedimiento de prueba de hipótesis de diez pasos.


Traducido del inglés al español - www.onlinedoctranslator.com

PREGUNTAS DE REPASO Y EJERCICIOS 283

4.Definir:
(a)error tipo I (b)Error tipo II
(C)El poder de una prueba (d)Función de potencia
(mi)Curva de potencia (F)Curva característica de funcionamiento

5.Explique la diferencia entre las curvas de potencia para pruebas unilaterales y bilaterales.

6.Explique cómo se decide qué enunciado entra en la hipótesis nula y qué enunciado entra en la
hipótesis alternativa.

7.¿Cuáles son los supuestos que subyacen al uso de latestadística en la prueba de hipótesis sobre una sola
media? ¿La diferencia entre dos medios?

8.¿Cuándo puede elzestadística se utilizará para probar hipótesis acerca de


(a)¿significa una sola población?
(b)la diferencia entre dos medias poblacionales?
(C)una sola proporción de la población?
(d)la diferencia entre dos proporciones de población?

9.Al probar una hipótesis sobre la diferencia entre las medias de dos poblaciones, ¿cuál es la razón detrás de
agrupar las varianzas de la muestra?

10Explique la razón detrás del uso de la prueba de comparaciones pareadas.

11Proporcione un ejemplo de su campo de interés donde sería apropiada una prueba de comparaciones pareadas. Utilizar
datos reales o realistas y realizar una prueba de hipótesis adecuada.

12Dé un ejemplo de su campo de interés donde sería apropiado probar una hipótesis sobre la diferencia
entre dos medias de población. Use datos reales o realistas y lleve a cabo el procedimiento de prueba
de hipótesis de diez pasos.

13Resuelva el ejercicio 12 para una sola media poblacional.

14Haz el ejercicio 12 para una sola proporción de población.

15.Haz el ejercicio 12 para la diferencia entre dos proporciones de población.

dieciséis.Haz el ejercicio 12 para una varianza de población.

17Haz el ejercicio 12 para la razón de dos varianzas de población.

18Ochsenk€uhn et al. (A-33) estudiaron el nacimiento por fecundación in vitro (FIV) y el nacimiento por concepción
espontánea. En la muestra, hubo 163 nacimientos únicos resultantes de FIV con un peso medio al nacer de
3071 gy una desviación estándar de la muestra de 761 g. Entre los 321 nacimientos únicos resultantes de la
concepción espontánea, el peso medio al nacer fue de 3172 g con una desviación estándar de 702 g.
Determinar si estos datos proporcionan evidencia suficiente para que podamos concluir que el peso medio al
nacer en gramos de los nacimientos únicos resultantes de la FIV es más bajo, en general, que el peso medio
al nacer de los nacimientos únicos resultantes de la concepción espontánea.
Dejara¼ :10

19William Tindall (A-34) realizó un estudio retrospectivo de los registros de pacientes que recibían atención por
hipercolesterolemia. La siguiente tabla proporciona mediciones del colesterol total para pacientes antes y 6
semanas después de tomar una estatina. ¿Existe suficiente evidencia en ela¼ :01 nivel de significancia para
que nosotros concluyamos que el fármaco resultaría en una reducción del colesterol total en una población
de pacientes con hipercolesterolemia similar?
284 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Identificación. No. Antes Después Identificación. No. Antes Después Identificación. No. Antes Después

1 195 125 37 221 191 73 205 151


2 208 164 38 245 164 74 298 163
3 254 152 39 250 162 75 305 171
4 226 144 40 266 180 76 262 129
5 290 212 41 240 161 77 320 191
6 239 171 42 218 168 78 271 167
7 216 164 43 278 200 79 195 158
8 286 200 44 185 139 80 345 192
9 243 190 45 280 207 81 223 117
10 217 130 46 278 200 82 220 114
11 245 170 47 223 134 83 279 181
12 257 182 48 205 133 84 252 167
13 199 153 49 285 161 85 246 158
14 277 204 50 314 203 86 304 190
15 249 174 51 235 152 87 292 177
dieciséis 197 160 52 248 198 88 276 148
17 279 205 53 291 193 89 250 169
18 226 159 54 231 158 90 236 185
19 262 170 55 208 148 91 256 172
20 231 180 56 263 203 92 269 188
21 234 161 57 205 156 93 235 172
22 170 139 58 230 161 94 184 151
23 242 159 59 250 150 95 253 156
24 186 114 60 209 181 96 352 219
25 223 134 61 269 186 97 266 186
26 220 166 62 261 164 98 321 206
27 277 170 63 255 164 99 233 173
28 235 136 64 275 195 100 224 109
29 216 134 sesenta y cinco 239 169 101 274 109
30 197 138 66 298 177 102 222 136
31 253 181 67 265 217 103 194 131
32 209 147 68 220 191 104 293 228
33 245 164 69 196 129 105 262 211
34 217 159 70 177 142 106 306 192
35 187 139 71 211 138 107 239 174
36 265 171 72 244 166
Fuente: Datos proporcionados por cortesía de William Tindall, Ph.D. y el Centro de Consultoría de la Universidad
Estatal de Wright.

20El objetivo de un estudio de van Vollenhoven et al. (A-35) fue examinar la eficacia de Etanercept solo y Etanercept
en combinación con metotrexato en el tratamiento de la artritis reumatoide. Realizaron un estudio
retrospectivo utilizando datos de la base de datos STURE, que recopila datos de eficacia y seguridad para
todos los pacientes que inician tratamientos biológicos en los principales hospitales de Estocolmo, Suecia.
Los investigadores identificaron a 40 sujetos a los que se les recetó Etanercept solo ya 57 a los que se les
administró Etanercept con metotrexato. Una de las medidas de resultado fue el número de articulaciones
inflamadas. La siguiente tabla proporciona el número medio de articulaciones inflamadas en los dos grupos,
así como el error estándar de la media. ¿Existe suficiente evidencia en el
PREGUNTAS DE REPASO Y EJERCICIOS 285

a¼ :05 nivel de significación para que concluyamos que hay una diferencia en el recuento medio de articulaciones
inflamadas en las poblaciones relevantes?

Tratamiento Significar Error estándar de la media

etanercept 5.56 0.84


Etanercept más metotrexato 4.40 0.57

21Miyazaki et al. (A-36) examinó las tasas sin recurrencia de la extirpación con varicectomía y la extirpación con
escleroterapia para el tratamiento de venas varicosas primarias. El grupo de varicectomía constaba de 122
extremidades en las que se realizó el procedimiento, y el grupo de escleroterapia constaba de 98 extremidades en las
que se realizó ese procedimiento. Después de 3 años, 115 extremidades del grupo de varicectomía y 87 extremidades
del grupo de escleroterapia estaban libres de recurrencia. ¿Es esta evidencia suficiente para concluir que no hay
diferencia, en general, en la tasa libre de recurrencia entre los dos procedimientos para tratar las venas varicosas?
Dejara¼ :05.

22Recuerde el estudio, informado en el Ejercicio 7.8.1, en el que Dora et al. (A-37) investigó las dimensiones
del canal espinal en 30 sujetos sintomáticos con hernia de disco seleccionados para una discectomía y
45 individuos asintomáticos (grupo de control). Una de las áreas de interés fue determinar si existe
una diferencia entre los dos grupos en el área transversal del canal espinal (cm2) entre las vértebras
L5/S1. Los datos de la tabla siguiente se simulan para ser consistentes con los resultados informados
en el documento. ¿Estos datos simulados nos brindan evidencia para concluir que existe una
diferencia en el área transversal del canal espinal entre una población de sujetos con hernias de disco
y una población de aquellos que no tienen hernias de disco? Dejar a¼ :05.

Grupo de hernia discal Grupo de control

2,62 2,57 1,98 3,21 3,59 3,72 4,30 2,87 3,87 2,73 5,28
1,60 1,80 3,91 2,56 1,53 1,33 2,36 3,67 1,64 3,54 3,63
2,39 2,67 3,53 2,26 2,82 4,26 3,08 3,32 4,00 2,76 3,58
2,05 1,19 3,01 2,39 3,61 3,11 3,94 4,39 3,73 2,22 2,73
2,09 3,79 2,45 2,55 2,10 5,02 3,62 3,02 3,15 3,57 2,37
2,28 2,33 2,81 3,70 2,61 5,42 3,35 2,62 3,72 4,37 5,28
4,97 2,58 2,25 3,12 3,43
3,95 2,98 4,11 3,08 2,22
Fuente: Datos simulados.

23Iannelo et al. (A-38) investigaron las diferencias entre los niveles de triglicéridos en sujetos obesos sanos
(control) y sujetos obesos con hepatitis B o C activa crónica. Los niveles de triglicéridos de 208 controles
obesos tenían un valor medio de 1,81 con un error estándar de la media de 0,07 mmol/L. Los 19 sujetos con
hepatitis obesos tenían una media de 0,71 con un error estándar de la media de 0,05. ¿Es esta evidencia
suficiente para concluir que, en general, existe una diferencia en los niveles promedio de triglicéridos entre
sujetos obesos sanos y sujetos obesos con hepatitis B o C? Dejara¼ :01.

24Los estudiantes de jardín de infantes fueron los participantes en un estudio realizado por Susan Bazyk et al. (A-39). Los
investigadores estudiaron las habilidades motoras finas de 37 niños que recibían terapia ocupacional. Usaron un
índice de habilidades motoras finas que midió el uso de la mano, la coordinación ojo-mano y la destreza manual.
286 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

antes y después de 7 meses de terapia ocupacional. Los valores más altos indican habilidades motoras finas más fuertes. Las
puntuaciones aparecen en la siguiente tabla.

Sujeto Pre Correo Sujeto Pre Correo

1 91 94 20 76 112
2 61 94 21 79 91
3 85 103 22 97 100
4 88 112 23 109 112
5 94 91 24 70 70
6 112 112 25 58 76
7 109 112 26 97 97
8 79 97 27 112 112
9 109 100 28 97 112
10 115 106 29 112 106
11 46 46 30 85 112
12 45 41 31 112 112
13 106 112 32 103 106
14 112 112 33 100 100
15 91 94 34 88 88
dieciséis 115 112 35 109 112
17 59 94 36 85 112
18 85 109 37 88 97
19 112 112
Fuente: Datos proporcionados por cortesía de Susan Bazyk, MHS

¿Se puede concluir sobre la base de estos datos que después de 7 meses, las habilidades motoras finas en una
población de sujetos similares serían más fuertes? Dejara¼ :05. Determinar elpagvalor.

25Una encuesta de 90 mujeres que dieron a luz recientemente en las listas de un departamento de bienestar del condado
reveló que 27 tenían antecedentes de infección intraparto o posparto. Pruebe la hipótesis nula de que la proporción
de la población con antecedentes de infección intraparto o posparto es menor o igual a .25. Dejar a¼ :05. Determinar
elpagvalor.

26En una muestra de 150 admisiones hospitalarias de emergencia con un diagnóstico determinado, 128 mencionaron el
vómito como síntoma de presentación. ¿Proporcionan estos datos suficiente evidencia para indicar, en el nivel de
significancia de .01, que la proporción de la población es menor que .92? Determina elpagvalor.

27Un equipo de investigación midió el volumen corriente en 15 animales de experimentación. La media y la desviación
estándar fueron 45 y 5 cc, respectivamente. ¿Estos datos proporcionan evidencia suficiente para indicar que la media
poblacional es mayor que 40 cc? Dejara¼ :05.

28Una muestra de ocho pacientes ingresados en un hospital con diagnóstico de cirrosis biliar tenía un nivel medio de IgM
de 160,55 unidades por mililitro. La desviación estándar de la muestra fue de 50. ¿Estos datos proporcionan evidencia
suficiente para indicar que la media de la población es mayor que 150? Dejara¼ :05. Determinar elpagvalor.

29Algunos investigadores han observado una mayor resistencia de las vías respiratorias en los fumadores que en los no fumadores.
Suponga que un estudio, realizado para comparar el porcentaje de retención traqueobronquial de partículas en gemelos
monocigóticos discordantes fumadores, arroja los siguientes resultados:
PREGUNTAS DE REPASO Y EJERCICIOS 287

Porcentaje de retención Porcentaje de retención

Doble para fumadores Doble para no fumadores Doble para fumadores Doble para no fumadores

60.6 47.5 57.2 54.3


12.0 13.3 62.7 13.9
56,0 33.0 28.7 8.9
75.2 55.2 66,0 46.1
12.5 21,9 25.2 29.8
29.7 27,9 40.1 36.2

¿Apoyan estos datos la hipótesis de que el aclaramiento traqueobronquial es más lento en los fumadores? Dejar a¼ :
05. Determinar elpagvalor para esta prueba.

30Se midieron los niveles circulantes de estrona en una muestra de 25 mujeres posmenopáusicas después de un
tratamiento con estrógenos. La media muestral y la desviación estándar fueron 73 y 16, respectivamente. Con un
nivel de significación de 0,05, ¿se puede concluir sobre la base de estos datos que la media de la población es
superior a 70?

31Las determinaciones de resistencia vascular sistémica se realizaron en una muestra de 16 pacientes con insuficiencia
cardíaca congestiva crónica mientras recibían un tratamiento particular. La media muestral y la desviación estándar
fueron 1600 y 700, respectivamente. Con un nivel de significación de .05, ¿estos datos proporcionan evidencia
suficiente para indicar que la media de la población es menor que 2000?

32.La longitud media al nacer de 14 niños varones fue de 53 cm con una desviación estándar de 9 cm. ¿Se puede
concluir sobre la base de estos datos que la media de la población no es de 50 cm? Sea .10 la probabilidad de
cometer un error tipo I.

Para cada uno de los estudios descritos en los ejercicios 33 a 38, responda tantas de las siguientes
preguntas como sea posible: (a) ¿Cuál es la variable de interés? (b) ¿El parámetro de interés es una media, la
diferencia entre dos medias (muestras independientes), una diferencia de medias (datos pareados), una
proporción o la diferencia entre dos proporciones (muestras independientes)? (c) ¿Cuál es la población
muestreada? (d) ¿Cuál es la población objetivo? (e) ¿Cuáles son las hipótesis nula y alternativa? (f) ¿La
alternativa es de un solo lado (cola izquierda), de un solo lado (cola derecha) o de dos lados? (g) ¿Qué errores
tipo I y tipo II son posibles? (h) ¿Cree que se rechazó la hipótesis nula? Explica por qué o por qué no.

33.Durante un período de un año, Hong et al. (A-40) estudiaron a todos los pacientes que acudieron al
servicio de cirugía con posible apendicitis. Ciento ochenta y dos pacientes con posible apendicitis se
asignaron al azar a evaluación clínica (AC) sola oa evaluación clínica y TC abdominal/pélvica. Un caso
verdadero positivo resultó en una laparotomía que reveló una lesión que requería operación.
Un caso verdadero negativo no requirió una operación en la evaluación de seguimiento de una semana. Al cierre del estudio,
no encontraron diferencias significativas en la duración de la estancia hospitalaria para los dos grupos de tratamiento.

34.Recuerde el estudio informado en el Ejercicio 7.8.2 en el que Nagy et al. (A-32) estudiaron a 50 pacientes
estables ingresados por herida de bala que atravesaba el mediastino. Descubrieron que ocho de los sujetos
tenían una lesión mediastínica, mientras que 42 no tenían tal lesión. Realizaron una alumnatprueba para
determinar si había una diferencia en la edad media (años) entre los dos grupos. el reportadopagel valor fue
.59.

35.Dykstra et al. (A-41) estudiaron 15 pacientes mujeres con frecuencia urinaria con o sin
incontinencia. Las mujeres fueron tratadas con toxina botulínica tipo B (BTX-B). Atprueba de la
288 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

La diferencia pre/post en la frecuencia indicó que estos 15 pacientes experimentaron un promedio de 5,27 episodios
de frecuencia menos por día después del tratamiento con BTX-B. Elpagvalor para la prueba fue inferior a 0,001.

36.Recuerde el estudio informado en el Ejercicio 6.10.2 en el que Horesh et al. (A-42) investigó el comportamiento
suicida entre adolescentes. Además de la impulsividad, los investigadores estudiaron la desesperanza entre
los 33 sujetos del grupo suicida y los 32 sujetos del grupo no suicida. Las medias de los dos grupos en la
Escala de desesperanza de Beck fueron 11,6 y 5,2, respectivamente, y latvalor para la prueba fue de 5,13.

37.Mauksch et al. (A-43) encuestó a 500 pacientes consecutivos (de 18 a 64 años de edad) en una clínica de atención primaria que
atiende solo a pacientes sin seguro y de bajos ingresos. Utilizaron preguntas de autoinforme sobre por qué los pacientes
acudían a la clínica y otras herramientas para clasificar a los sujetos según tuvieran o no enfermedades mentales graves. En
comparación con los pacientes sin una enfermedad mental importante actual, los pacientes con una enfermedad mental
importante actual informaron significativamentedpag < :001Þmás preocupaciones, enfermedades crónicas, factores
estresantes, formas de maltrato y síntomas físicos.

38.Un estudio de Hosking et al. (A-44) fue diseñado para comparar los efectos del alendronato y el risedronato en la
densidad mineral ósea (DMO). Una de las medidas de resultado fue el aumento porcentual de la DMO a los
12 meses. El alendronato produjo un cambio porcentual significativamente mayor (4,8 %) en la BMD que el
risedronato (2,8 %) con unpagvalor < :001.

39.Para cada una de las siguientes situaciones, identifique los errores tipo I y tipo II y las acciones correctas.
(a)H0: Un nuevo tratamiento no es más efectivo que el tradicional.
(1)Adopte el nuevo tratamiento cuando el nuevo sea más efectivo.
(2)Continuar con el tratamiento tradicional cuando el nuevo sea más efectivo.
(3)Continuar con el tratamiento tradicional cuando el nuevo no sea más efectivo.
(4)Adoptar el nuevo tratamiento cuando el nuevo no sea más efectivo.
(b)H0: Un nuevo procedimiento de fisioterapia es satisfactorio.
(1)Emplear un nuevo procedimiento cuando no es satisfactorio.
(2)No emplee un nuevo procedimiento cuando no sea satisfactorio.
(3)No emplee un nuevo procedimiento cuando sea satisfactorio.
(4)Emplear un nuevo procedimiento cuando sea satisfactorio.
(C)H0: Una tanda de producción de un fármaco es de calidad satisfactoria.

(1)Rechazar una tirada de calidad satisfactoria.


(2)Aceptar una tirada de calidad satisfactoria.
(3)Rechazar una tirada de calidad insatisfactoria.
(4)Aceptar una tirada de calidad insatisfactoria.

Para cada uno de los estudios descritos en los ejercicios 40 a 55, haga lo siguiente:
(a)Realice un análisis estadístico de los datos (incluidas las pruebas de hipótesis y la construcción de
intervalos de confianza) que crea que generarían información útil para los investigadores.
(b)Indique todas las suposiciones que sean necesarias para validar su análisis.
(C)Encontrarpagvalores para todas las estadísticas de prueba calculadas.

(d)Describa la(s) población(es) sobre las que cree que serían aplicables las inferencias basadas en su
análisis.

40Un estudio de Bell (A-45) investigó la hipótesis de que la alteración del sistema endocrino de la vitamina D en los
negros resulta de la reducción de la 25-hidroxivitamina D sérica y que la alteración se revierte con el
tratamiento oral con 25-hidroxivitamina D.3. Los ocho sujetos (tres hombres y cinco mujeres) fueron
estudiados sin tratamiento (control) y después de haber recibido 25-hidroxivitamina D3durante 7 días
PREGUNTAS DE REPASO Y EJERCICIOS 289

(25-OHD3). Las siguientes son las determinaciones de calcio urinario (mg/d) para los ocho sujetos bajo las dos
condiciones.

Sujeto Control 25-OHD3

A 66 98
B 115 142
C 54 78
D 88 101
mi 82 134
F 115 158
GRAMO 176 219
H 46 60 Fuente: Datos proporcionados por cortesía
del Dr. Norman H. Bell.

41.Montner et al. (A-46) realizaron estudios para evaluar los efectos de la hiperhidratación potenciada con glicerol (GEH)
sobre la resistencia en el rendimiento ciclista. Los 11 sujetos, de 22 a 40 años de edad, pedaleaban regularmente al
menos 75 millas por semana. Los siguientes son los volúmenes de producción de orina antes del ejercicio (ml)
después de la ingestión de glicerol y agua:

Experimental, ml Testigo, ml
Sujeto # (Glicerol) (Placebo)

1 1410 2375
2 610 1610
3 1170 1608
4 1140 1490
5 515 1475
6 580 1445
7 430 885
8 1140 1187
9 720 1445
10 275 890
11 875 1785 Fuente: Datos proporcionados por
cortesía del Dr. Paul Montner.

42.D'Alessandro et al. (A-47) deseaba saber si la hiperreactividad de las vías respiratorias (HR) preexistente
predispone a los sujetos a un resultado más grave después de la exposición al cloro. Los sujetos eran
voluntarios sanos entre las edades de 18 y 50 años que fueron clasificados como con y sin HR.
Los siguientes son los FEV1y mediciones de la resistencia específica de las vías respiratorias (Sraw) tomadas en los
sujetos antes y después de la exposición al cloro gaseoso adecuadamente diluido:

Sujetos hiperreactivos

Pre-Exposición Después de la exposición

Sujeto VEF1 Sraw VEF1 Sraw

1 3.0 5.80 1.8 21.4


2 4.1 9.56 3.7 12.5
3 3.4 7.84 3.0 14.3
4 3.3 6.41 3.0 10.9
5 3.3 9.12 3.0 17.1
290 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

sujetos normales

Pre-Exposición Después de la exposición

Sujeto VEF1 Sraw VEF1 Sraw

1 4.3 5.52 4.2 8.70


2 3.9 6.43 3.7 6.94
3 3.6 5.67 3.3 10.00
4 3.6 3.77 3.5 4.54
5 5.1 5.53 4.9 7.37 Fuente: Datos proporcionados por
cortesía del Dr. Paul Blanc.

43.Notando la escasez de información sobre el efecto del estrógeno en la composición de ácidos grasos de la membrana plaquetaria,
Ranganath et al. (A-48) realizó un estudio para examinar la posibilidad de que se presenten cambios en mujeres
posmenopáusicas y que éstos puedan ser reversibles con el tratamiento con estrógenos. Las 31 mujeres reclutadas para el
estudio no habían menstruado durante al menos 3 meses o tenían síntomas de la menopausia. Ninguna mujer estaba en
ninguna forma de terapia de reemplazo hormonal (TRH) en el momento en que fue reclutada. Los siguientes son los valores de
ácido linoleico de la membrana plaquetaria antes y después de un período de TRH:

Sujeto Antes Después Sujeto Antes Después Sujeto Antes Después

1 6.06 5.34 12 7.65 5.55 23 5.04 4.74


2 6.68 6.11 13 4.57 4.25 24 7.89 7.48
3 5.22 5.79 14 5.97 5.66 25 7.98 6.24
4 5.79 5.97 15 6.07 5.66 26 6.35 5.66
5 6.26 5.93 dieciséis 6.32 5.97 27 4.85 4.26
6 6.41 6.73 17 6.12 6.52 28 6.94 5.15
7 4.23 4.39 18 6.05 5.70 29 6.54 5.30
8 4.61 4.20 19 6.31 3.58 30 4.83 5.58
9 6.79 5.97 20 4.44 4.52 31 4.71 4.10
10 6.16 6.00 21 5.51 4.93
11 6.41 5.35 22 8.48 8.80
Fuente: Datos proporcionados por cortesía del Dr. L. Ranganath.

44.El propósito de un estudio de Goran et al. (A-49) fue examinar la precisión de algunas técnicas de composición
corporal ampliamente utilizadas para niños mediante el uso de la técnica de absorciometría de rayos X de
energía dual (DXA). Los sujetos eran niños entre las edades de 4 y 10 años. Las siguientes son mediciones de
masa grasa tomadas en los niños mediante tres técnicas: DXA, grosor del pliegue cutáneo (ST) y resistencia
bioeléctrica (BR):

Sexo
DXA CALLE BR (1¼Masculino; 0¼Femenino)

3.6483 4.5525 4.2636 1


2.9174 2.8234 6.0888 0
7.5302 3.8888 5.1175 0
6.2417 5.4915 8.0412 0
10.5891 10.4554 14.1576 0
9.5756 11.1779 12.4004 0
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 291

Sexo
DXA CALLE BR (1¼Masculino; 0¼Femenino)

2.4424 3.5168 3.7389 1


3.5639 5.8266 4.3359 1
1.2270 2.2467 2.7144 1
2.2632 2.4499 2.4912 1
2.4607 3.1578 1.2400 1
4.0867 5.5272 6.8943 0
4.1850 4.0018 3.0936 1
2.7739 5.1745 1
4.4748 3.6897 4.2761 0
4.2329 4.6807 5.2242 0
2.9496 4.4187 4.9795 0
2.9027 3.8341 4.9630 0
5.4831 4.8781 5.4468 0
3.6152 4.1334 4.1018 1
5.3343 3.6211 4.3097 0
3.2341 2.0924 2.5711 1
5.4779 5.3890 5.8418 0
4.6087 4.1792 3.9818 0
2.8191 2.1216 1.5406 1
4.1659 4.5373 5.1724 1
3.7384 2.5182 4.6520 1
4.8984 4.8076 6.5432 1
3.9136 3.0082 3.2363 1
12.1196 13.9266 16.3243 1
15.4519 15.9078 18.0300 0
20.0434 19.5560 21.7365 0
9.5300 8.5864 4.7322 1
2.7244 2.8653 2.7251 1
3.8981 5.1352 5.2420 0
4.9271 8.0535 6.0338 0
3.5753 4.6209 5.6038 1
6.7783 6.5755 6.6942 1
3.2663 4.0034 3.2876 0
1.5457 2.4742 3.6931 0
2.1423 2.1845 2.4433 1
4.1894 3.0594 3.0203 1
1.9863 2.5045 3.2229 1
3.3916 3.1226 3.3839 1
2.3143 2.7677 3.7693 1
1.9062 3.1355 12.4938 1
3.7744 4.0693 5.9229 1
2.3502 2.7872 4.3192 0
4.6797 4.4804 6.2469 0
4.7260 5.4851 7.2809 0
4.2749 4.4954 6.6952 0
2.6462 3.2102 3.8791 0
(Continuación)
292 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Sexo
DXA CALLE BR (1¼Masculino; 0¼Femenino)

2.7043 3.0178 5.6841 0


4.6148 4.0118 5.1399 0
3.0896 3.2852 4.4280 0
5.0533 5.6011 4.3556 0
6.8461 7.4328 8.6565 1
11.0554 13.0693 11.7701 1
4.4630 4.0056 7.0398 0
2.4846 3.5805 3.6149 0
7.4703 5.5016 9.5402 0
8.5020 6.3584 9.6492 0
6.6542 6.8948 9.3396 1
4.3528 4.1296 6.9323 0
3.6312 3.8990 4.2405 1
4.5863 5.1113 4.0359 1
2.2948 2.6349 3.8080 1
3.6204 3.7307 4.1255 1
2.3042 3.5027 3.4347 1
4.3425 3.7523 4.3001 1
4.0726 3.0877 5.2256 0
1.7928 2.8417 3.8734 1
4.1428 3.6814 2.9502 1
5.5146 5.2222 6.0072 0
3.2124 2.7632 3.4809 1
5.1687 5.0174 3.7219 1
3.9615 4.5117 2.7698 1
3.6698 4.9751 1.8274 1
4.3493 7.3525 4.8862 0
2.9417 3.6390 3.4951 1
5.0380 4.9351 5.6038 0
7.9095 9.5907 8.5024 0
1.7822 3.0487 3.0028 1
3.4623 3.3281 2.8628 1
11.4204 14.9164 10.7378 1
1.2216 2.2942 2.6263 1
2.9375 3.3124 3.3728 1
4.6931 5.4706 5.1432 0
8.1227 7.7552 7.7401 0
10.0142 8.9838 11.2360 0
2.5598 2.8520 4.5943 0
3.7669 3.7342 4.7384 0
4.2059 2.6356 4.0405 0
6.7340 6.6878 8.1053 0
3.5071 3.4947 4.4126 1
2.2483 2.8100 3.6705 0
Datos perdidos.
7.1891 5.4414 6.6332 0
Fuente: Datos proporcionados por
6.4390 3.9532 5.1693 0
cortesía del Dr. Michael I. Goran.
PREGUNTAS DE REPASO Y EJERCICIOS 293

45.Hartard et al. (A-50) realizó un estudio para determinar si un determinado régimen de entrenamiento puede
contrarrestar la pérdida de densidad ósea en mujeres con osteopenia posmenopáusica. Las siguientes son
mediciones de fuerza para cinco grupos musculares tomadas en 15 sujetos antes (B) y después (A) de 6 meses de
entrenamiento:

Prensa de piernas Flexor de cadera extensor de cadera

Sujeto (B) (A) (B) (A) (B) (A)

1 100 180 8 15 10 20
2 l55 195 10 20 12 25
3 115 150 8 13 12 19
4 130 170 10 14 12 20
5 120 150 7 12 12 15
6 60 140 5 12 8 dieciséis

7 60 100 4 6 6 9
8 140 215 12 18 14 24
9 110 150 10 13 12 19
10 95 120 6 8 8 14
11 110 130 10 12 10 14
12 150 220 10 13 15 29
13 120 140 9 20 14 25
14 100 150 9 10 15 29
15 110 130 6 9 8 12

Abductor de brazo aductor del brazo

Sujeto (B) (A) (B) (A)

1 10 12 12 19
2 7 20 10 20
3 8 14 8 14
4 8 15 6 dieciséis

5 8 13 9 13
6 5 13 6 13
7 4 8 4 8
8 12 15 14 19
9 10 14 8 14
10 6 9 6 10
11 8 11 8 12
12 8 14 13 15
13 8 19 11 18
14 4 7 10 22
15 4 8 8 12
Fuente: Datos proporcionados por cortesía del Dr. Manfred Hartard.

46.Vitaca et al. (A-51) realizaron un estudio para determinar si la posición supina o la posición sentada empeoran los flujos
espiratorios forzados estáticos y las mediciones de la mecánica pulmonar. Los sujetos tenían edades
294 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

personas que vivían en un hogar de ancianos que estaban clínicamente estables y sin evidencia clínica de
enfermedades cardiorrespiratorias. Entre los datos recopilados se encuentran los siguientes FEV1valores
porcentuales para sujetos en posturas sentadas y supinas:

Sesión Supino Sesión Supino

64 56 103 94
44 37 109 92
44 39 99 99
40 43 169 165
32 32 73 66
70 61 95 94
82 58 99 99
74 48 73 58
91 63
Fuente: Datos proporcionados por cortesía del Dr. M. Vitacca.

47.El propósito de una investigación de Young et al. (A-52) fue examinar la eficacia y seguridad de un cabestrillo suburetral
en particular. Los sujetos eran mujeres que experimentaban incontinencia de esfuerzo y que también cumplían con
otros criterios. Entre los datos recopilados se encuentran los siguientes valores de capacidad cistométrica pre y
postoperatoria (ml):

Pre Correo Pre Correo Pre Correo Pre Correo

350 321 340 320 595 557 475 344


700 483 310 336 315 221 427 277
356 336 361 333 363 291 405 514
362 447 339 280 305 310 312 402
361 214 527 492 200 220 385 282
304 285 245 330 270 315 274 317
675 480 313 310 300 230 340 323
367 330 241 230 792 575 524 383
387 325 313 298 275 140 301 279
535 325 323 349 307 192 411 383
328 250 438 345 312 217 250 285
557 410 497 300 375 462 600 618
569 603 302 335 440 414 393 355
260 178 471 630 300 250 232 252
320 362 540 400 379 335 332 331
405 235 275 278 682 339 451 400
351 310 557 381
Fuente: Datos proporcionados por cortesía del Dr. Stephen B. Young.

48.Diamante et al. (A-53) deseaba saber si se debe utilizar la evaluación cognitiva para ayudar a seleccionar
candidatos apropiados para la rehabilitación hospitalaria integral. Estudiaron una muestra de pacientes de
rehabilitación geriátrica utilizando estrategias de medición estandarizadas. Entre los datos recopilados se
encuentran los siguientes puntajes de admisión y alta realizados por los sujetos en el Mini Examen del Estado
Mental (MMSE):
PREGUNTAS DE REPASO Y EJERCICIOS 295

Admisión Descargar Admisión Descargar

9 10 24 26
11 11 24 30
14 19 24 28
15 15 25 26
dieciséis 17 25 22
dieciséis 15 26 26
dieciséis 17 26 28
dieciséis 17 26 26
17 14 27 28
17 18 27 28
17 21 27 27
18 21 27 27
18 21 27 27
19 21 28 28
19 25 28 29
19 21 28 29
19 22 28 29
19 19 29 28
20 22 29 28
21 23 29 30
22 22 29 30
22 19 29 30
22 26 29 30
23 21 29 30
24 21 30 30
24 20
Fuente: Datos proporcionados por cortesía del Dr. Stephen N. Macciocchi.

49.En un estudio para explorar la posibilidad de alteración hormonal en el asma, Weinstein et al. (A-54) recopilaron
datos sobre 22 mujeres posmenopáusicas con asma y 22 mujeres posmenopáusicas de la misma edad sin
asma. Los siguientes son los valores de sulfato de dehidroepiandrosterona (DHEAS) recopilados por los
investigadores:

sin asma con asma sin asma con asma

20.59 87.50 15.90 166.02


37.81 111.52 49.77 129.01
76.95 143.75 25.86 31.02
77.54 25.16 55.27 47.66
19.30 68.16 33.83 171.88
35.00 136.13 56.45 241.88
146.09 89.26 19.91 235.16
166.02 96.88 24.92 25.16
96.58 144.34 76.37 78.71
24.57 97.46 6.64 111.52
53.52 82.81 115.04 54.69

Fuente: Datos proporcionados por cortesía del Dr. Robert E. Weinstein.


296 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

50La motivación para un estudio de Gruber et al. (A-55) fue el deseo de encontrar un marcador sérico
potencialmente útil en la artritis reumatoide (AR) que refleje los mecanismos patogénicos
subyacentes. Midieron, entre otras variables, los niveles circulantes de gelatinasa B en suero y líquido
sinovial (LS) de pacientes con AR y de sujetos control. Los resultados fueron los siguientes:

Suero Líquido sinovial Suero Líquido sinovial

Control
REAL ACADEMIA DE BELLAS ARTES Control AR Control
REAL ACADEMIA DE BELLAS ARTES Control AR

26,8 23.4 71.8 3.0 36.7


19.1 30.5 29.4 4.0 57.2
249.6 10.3 185.0 3.9 71.3
53.6 8.0 114.0 6.9 25.2
66.1 7.3 69.6 9.6 46.7
52.6 10.1 52.3 22.1 30,9
14.5 17.3 113.1 13.4 27.5
22.7 24.4 104.7 13.3 17.2
43.5 19.7 60.7 10.3
25.4 8.4 116.8 7.5
29.8 20.4 84,9 31.6
27.6 16.3 215.4 30.0
106.1 16.5 33.6 42.0
76.5 22.2 158.3 20.3
Fuente: Datos proporcionados por cortesía del Dr. Darius Sorbi.

51.Benini et al. (A-56) realizó un estudio para evaluar la gravedad de la acidificación esofágica en la acalasia luego de una
dilatación exitosa del cardias y para determinar qué factores están asociados con la acidificación esofágica patológica
en tales pacientes. Veintidós sujetos, de los cuales siete eran hombres; con edades comprendidas entre los 28 y los
78 años. Sobre la base de los criterios establecidos se clasificaron como refluxers o no refluxers. Los siguientes son
los valores de depuración de ácido (min/reflujo) para los 22 sujetos:

Reflujadores no reflujo

8.9 2.3
30.0 0.2
23.0 0.9
6.2 8.3
11.5 0.0
0.9
0.4
2.0
0.7
3.6
0.5
1.4
0.2
0.7
17.9
2.1
Fuente: Datos proporcionados por
0.0
cortesía del Dr. Luigi Benini.
PREGUNTAS DE REPASO Y EJERCICIOS 297

52.El objetivo de un estudio de Baker et al. (A-57) fue determinar si la deformación médica altera los efectos in vitro del
plasma de pacientes con preeclampsia en la función de las células endoteliales para producir un paradigma similar al
estado de la enfermedad in vivo. Los sujetos fueron 24 mujeres embarazadas nulíparas antes del parto, de las cuales
12 tenían preeclampsia y 12 eran pacientes embarazadas normales. Entre los datos recopilados se encuentran las
siguientes edades gestacionales (semanas) al momento del parto:

preeclampsia embarazadas normales

38 40
32 41
42 38
30 40
38 40
35 39
32 39
38 41
39 41
29 40
29 40
Fuente: Datos proporcionados por
32 40 cortesía del Dr. James M. Roberts.

53.Zisselman et al. (A-58) realizaron un estudio para evaluar el uso de benzodiazepinas y el tratamiento de la depresión antes del
ingreso a una unidad de psiquiatría geriátrica para pacientes internados en una muestra de pacientes de edad avanzada. Entre
los datos recopilados se encuentran las siguientes puntuaciones de trastornos del comportamiento en 27 pacientes tratados
con benzodiazepinas (W) y 28 que no lo eran (WO).

W WO

. 00 1.00 . 00 . 00
. 00 1.00 . 00 10.00
. 00 . 00 . 00 . 00
. 00 . 00 . 00 18.00
. 00 10.00 . 00 . 00
. 00 2.00 . 00 2.00
. 00 . 00 5.00
. 00 . 00
. 00 4.00
. 00 1.00
4.00 2.00
3.00 . 00
2.00 6.00
. 00 . 00
10.00 . 00
2.00 1.00
. 00 2.00
9.00 1.00
. 00 22.00
1.00 . 00
Fuente: Datos proporcionados por
16.00 . 00
cortesía del Dr. Yochi Shmuely.
298 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

54.El objetivo de un estudio de Reinecke et al. (A-59) fue investigar la actividad funcional y la expresión del sarcolema Naþ
=Ca2þintercambio en el corazón humano que falla. Los investigadores obtuvieron muestras del ventrículo izquierdo
de corazones humanos defectuosos de 11 pacientes masculinos (edad promedio de 51 años) que se sometieron a un
trasplante cardíaco. Se obtuvieron corazones de control que no fallaban de donantes de órganos (cuatro mujeres,
dos hombres, edad media 41 años) cuyos corazones no podían trasplantarse por razones no cardíacas. Los siguientes
son los Naþ=Ca2þmediciones de la actividad del intercambiador para los pacientes con insuficiencia cardíaca terminal
(CHF) y controles que no fallan (NF).

NF francos suizos

0.075 0.221
0.073 0.231
0.167 0.145
0.085 0.112
0.110 0.170
0.083 0.207
0.112
0.291
0.164
0.195
0.185

Fuente: Datos proporcionados por cortesía del Dr. Hans Reinecke.

55.Reichmann et al. (A-60) realizó un estudio con el propósito de demostrar que los síntomas negativos son prominentes en
pacientes con enfermedad de Alzheimer y son distintos de la depresión. Las siguientes son puntuaciones realizadas
en la Escala para la Evaluación de Síntomas Negativos en la Enfermedad de Alzheimer por pacientes con enfermedad
de Alzheimer (PT) y sujetos de comparación de edad avanzada, cognitivamente intactos, normales (C).

PT C

19 6
5 5
36 10
22 1
1 1
18 0
24 5
17 5
7 4
19 6
5 6
2 7
14 5
9 3
34 5
13 12
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 299

PT C

0 0
21 5
30 1
43 2
19 3
31 19
21 3
41 5
24
3 Fuente: Datos proporcionados por
cortesía del Dr. Andrew C. Coyne.

Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.Consulte los datos de creatina fosfoquinasa en 1005 sujetos (PCKDATA). A los investigadores les gustaría saber si las
situaciones psicológicamente estresantes provocan un aumento en los niveles de creatina fosfoquinasa (CPK) sérica
entre individuos aparentemente sanos. Para ayudar a los investigadores a tomar una decisión, seleccione una
muestra aleatoria simple de esta población, realice un análisis apropiado de los datos de la muestra y proporcione un
informe narrativo de sus hallazgos y conclusiones. Compara tus resultados con los de tus compañeros.

2.Consulte los datos de tiempo de protrombina de 1000 lactantes (PROTHROM). Seleccione una muestra aleatoria simple
de tamaño 16 de cada una de estas poblaciones y realice una prueba de hipótesis adecuada para determinar si se
debe concluir que las dos poblaciones difieren con respecto al tiempo medio de protrombina.
Dejara¼ :05. Compara tus resultados con los de tus compañeros. ¿Qué suposiciones son necesarias para la
validez de la prueba?

3.Consulte los datos de la circunferencia de la cabeza de 1000 sujetos emparejados (HEADCIRC). Seleccione una muestra
aleatoria simple de tamaño 20 de la población y realice una prueba de hipótesis adecuada para determinar si se
puede concluir que los sujetos con la anomalía cromosómica sexual tienden a tener cabezas más pequeñas que los
sujetos normales. Dejara¼ :05. Construya un intervalo de confianza del 95 por ciento para la diferencia de medias de
la población. ¿Qué supuestos son necesarios? Compara tus resultados con los de tus compañeros.

4.Consulte los datos de hemoglobina de 500 niños con anemia por deficiencia de hierro y 500 niños
aparentemente sanos (HEMOGLOB). Seleccione una muestra aleatoria simple de tamaño 16 de la población A
y una muestra aleatoria simple independiente de tamaño 16 de la población B. ¿Los datos de su muestra
proporcionan suficiente evidencia para indicar que las dos poblaciones difieren con respecto al valor medio
de Hb? Dejar a¼ :05. ¿Qué supuestos son necesarios para que su procedimiento sea válido? Compara tus
resultados con los de tus compañeros.

5.Consulte los puntajes de destreza manual de 500 niños con discapacidades de aprendizaje y 500 niños sin
discapacidades de aprendizaje conocidas (MANDEXT). Seleccione una muestra aleatoria simple de tamaño 10
de la población A y una muestra aleatoria simple independiente de tamaño 15 de la población B.
¿Proporcionan sus muestras suficiente evidencia para concluir que los niños con problemas de aprendizaje,
en promedio, tienen puntajes de destreza manual más bajos que niños sin problemas de aprendizaje? Dejara
¼ :05. ¿Qué supuestos son necesarios para que su procedimiento sea válido? Compara tus resultados con los
de tus compañeros.
300 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

REFERENCIAS

Referencias de metodología
1. MB BFILAy AB FORSYTHE, “Pruebas Robustas para la Igualdad de Varianzas,”Revista de la Asociación Estadounidense de
Estadística, 69 (1974), 364–367.
2. H. L.NOCHE, "Pruebas robustas para la igualdad de varianzas", en I. Olkin, ed.,Contribuciones a la Probabilidad y Estadística, Prensa
de la Universidad de Stanford, Palo Alto, CA, 1960, 278–292.

Aplicaciones Referencias
A-1. norteORIMASAnorteAKAMURA, SHUJIHORIBE, YUKYOSHITORITSUKA, TOMOKIMETROITSUOKA, hIDEKIYOSHIKAWAy kONSEI
SHINO, “Lesión aguda del ligamento colateral medial de grado III de la rodilla asociada con desgarro del ligamento
cruzado anterior,”Revista americana de medicina deportiva, 31 (2003), 261–267.
A-2. DIANEkLINGLER, ROBYAGRAMOREEN-WEIR, DÁVIDOnorteERENZ, SUZANNÉHAVSTAD, hPREMIOS. R.osmán, LEONARDOCETNER,
SEmirSHAH, FRANCESWEMBARCAR, y STEVENBORZAK, "Las percepciones del dolor torácico difieren según la raza",Diario americano del
corazón, 144 (2002), 51–59.
A-3. AESCOBAR, JMQUINTANA, ABILBAO, J. A.ZKARATE, y JI Gtu €ENAGA, “Validación de la Versión Española de la
Cuestionario WOMAC para pacientes con osteoartritis de cadera o rodilla”,Reumatología clínica, 21 (2002), 466–471.
A-4. PAGHAMORNSAKTHIENPRASAIDDHI, VIVIENNECGREENSTEIN, CANDICESCGALLINA, jEFREYMLIEBMANN, ROBERTORPICAR, y
DONALDCHDOO, "Respuestas de potenciales evocados visuales multifocales en pacientes con glaucoma con defectos de
hemicampo unilaterales"Diario Americano de Oftalmología, 136 (2003), 34–40. FP Lfeo
A-5. -, gUGLIELMOCAMPUS, CDEIOLA, MG MELA, y D. G.ALLISAI, “Condición Oral, Química de la Saliva,
y niveles salivales deStreptococcus mutansen pacientes talasémicos”,Investigaciones orales clínicas, 6 (2002), 223–
226.
A-6. miRICWTSOY, ARTHURFMAlaska, WAInorteGeorgiaLSOY, jOHNÉLFURGONETAS, y YORKY CCÓMO, "Movimiento pélvico y distribución de
la presión de interfaz durante la propulsión manual de una silla de ruedas",Archivos de Medicina Física y
Rehabilitación, 84 (2003), 1466–1472.
A-7. jOHNDERNELISy MARIAPAGANARETOU, “Efectos de la terapia de reemplazo tiroideo sobre la presión arterial en
pacientes con hipertensión e hipotiroidismo,”Diario americano del corazón, 143 (2002), 718–724.
A-8. S. S.AIRAM, BA BAETHGE, y T. M.CnorteGANAR, “Análisis de factores de riesgo y enfermedades comórbidas en el desarrollo
de trombosis en pacientes con anticuerpos anticardiolipina,”Reumatología clínica, 22 (2003), 24–29.
A-9. METROICHELDABONNEVILLE, PAGAULBertón, PAGHILIPPEVASLIN, y NICOLEFELMANN, “Las 5 M en Running Field Test:
Probar y volver a probar la confiabilidad en hombres y mujeres capacitados”,Revista Europea de Fisiología Aplicada, 88 (2003),
353–360.
A-10. BM INGLEy R. E.ASTELL, "Mediciones óseas específicas del sitio en pacientes con fractura de tobillo",Osteoporosis
Internacional, 13 (2002), 342–347.
A-11. AHOEKEMA, BHOVINGA, B. S.TEGENGA, y LGM DmiBONT, "Morfología craneofacial y apnea obstructiva pronunciada:
un análisis cefalométrico",Revista de Rehabilitación Oral, 30 (2003), 690–696.
A-12. GRAMOIANPAGAOLOROSSI, StefanoTADEI, AGOSTINOVIRDIS, mARTINACAVALLIN, LORENZOGRAMOHIADONI, STEFANIAFUNA VILLA
, DANIELAVERSARI, ISABELLASUDANO, ACHILECPESINA, y ANTONIOSALVETTI, "La t786C y Glu298Asp
Los polimorfismos del gen del óxido nítrico endotelial afectan las respuestas del flujo sanguíneo del antebrazo de los
pacientes hipertensos caucásicos.Revista del Colegio Americano de Cardiología, 41 (2003), 938–945.
A-13. jOSEGRAMOARCOSA~ Oy jOSECABRITA, “Evaluación de un Programa de Atención Farmacéutica a Hipertensos en Zonas Rurales
Portugal,"Diario de la Asociación Farmacéutica Americana, 42 (2002), 858–864.
A-14. jOHNMMORTON, STEVENPBORAS, TANANCHAIA. L.UCKTONG, SAMÉRICAMETROESENCIA DE ROSAS, WALANBRADSHAW, kEVINEB
EHRNS, mARCAJ. K.ORUDA, CHARLESAHERBST, WILLIAMMETROCCARTNEY, RAGHUVEERKHALKAR, CDanielSMITO, y
TIMOTEOM. F.ARRELL, “Función de la vesícula biliar antes y después de la funduplicatura,”Revista de Cirugía
Gastrointestinal, 6 (2002), 806–811.
A-15. miLLENDAvisjUNOS, "Terapia de reminiscencia para mujeres mayores con depresión: efectos de la clasificación de las intervenciones de
enfermería en el cuidado a largo plazo de vida asistida"Revista de Enfermería Gerontológica, 29 (2003), 26–33.
A-16. jOHNNYBENEY, EBETHDEVINO, VALBYCCÓMO, ROBERTOJIGNOFFO, LES UNMETROITSUNAGA, mEN UNSHAHKARAMI, Alex
METROCMETROILLAN, y yoES UNABERO. “Efecto del Seguimiento Telefónico en la Dimensión Bienestar Físico de la Calidad
de Vida en Pacientes con Cáncer”Farmacoterapia, 22 (2002), 1301–1311.
REFERENCIAS 301

A-17. jOHNSMORLEY, jOHNBRIDSON, TSOYP. N.CENIZA, jOHNBMILES, SARAHWHITE, y MATTEOKMPARECIDO, "Dosis baja
La metadona tiene un efecto analgésico en el dolor neuropático: un ensayo cruzado controlado, aleatorizado y doble
ciego.Medicina paliativa, 17 (2003), 576–587.
A-18. WK WOOy KE MCkENNA, “Combinación de fototerapia ultravioleta B TL01 y calcipotriol tópico para la psoriasis: un
ensayo clínico prospectivo, aleatorizado y controlado con placebo,”Revista británica de dermatología, 149 (2003),
146–150.
A-19. SimonaPAGORCELINI, gIULIANAVALLANTÍ, SILVIAnorteOZA, gUIDOPAGOLI, ADRENAJELAzzarín, gUISEPPETABUSI, y
ANTONIOGRAMORASIA, "Potencial timopoyético mejorado en individuos infectados por el VIH avirémicos con HAART mediante la
administración intermitente de IL-2",SIDA, 17 (2003), 1621–1630.
A-20. LYNNEE. W.AGENKNECHT, CARLDLANGEFELD, ANNLSCHERZINGER, jENFERMOMNRAÍZ DE FLORENCIA, STEVENMHAFFNER,
METROOHAMMEDFSAADy RICHARDNBERGMAN, “Sensibilidad a la insulina, secreción de insulina y grasa abdominal”, Diabetes,
52 (2003), 2490–2496.
A-21. YVESjAQUEMINA, FATIMAAHANKOUR, y GUYMETROARTENS, "Preferencia personal de los obstetras flamencos con
respecto al modo de parto y la actitud hacia la cesárea a pedido",Revista europea de obstetricia y
ginecología y biología reproductiva, 111 (2003), 164–166.
A-22. LIHinterfaz de usuarioy A. C.OLINBANA, “Sobrepeso y Obesidad en Niños de Shenzhen, República Popular de China,”
Salud y Lugar, 9 (2003), 371–376.
A-23. ANNEEBECKER, REBECCAABURBELL, kESAIAnorteAVARA, y StephenP.EJILMAN, "Comida compulsiva y trastorno por atracón compulsivo en una
sociedad indígena a pequeña escala: la visión desde Fiji",Revista Internacional de Trastornos de la Alimentación, 34 (2003),
423–431.
A-24. jACQUELINEUNOONÁN, RENSKERFABRICANTES DE AAIJ, y BryanDHTODO, "Estatura adulta en el síndrome de Noonan",
Revista americana de genética médica, 123A (2003), 68–71.
A-25. SAIYENHO, TAIHEN GLSOY, RICHARDFCAMPAÑA, y miENANODENISjANO, “Tabaquismo y salud percibida en chinos de Hong
Kong”,Ciencias Sociales y Medicina, 57 (2003), 1761–1770.
A-26. METROARKUSA. L.ANDOLT, mARGARETEVOLLRATH, kARÍNRIBI, hANSPETERP.EJNEHM, y FELIXHSENNHAUSER,
“Incidencia y Asociaciones de Síntomas de Estrés Postraumático de Padres e Hijos en Pacientes Pediátricos,”Revista
de Psicología y Psiquiatría Infantil, 44 (2003), 1199–1207.
A-27. METROORELLMETROICHAELAVRAM, DanielBLAUSTEIN, PAGAULA. F.EIN, norteAVEENGRAMOOEL, jYOTIPRAKASCSOMBRERO, y NEAL
METROITTMAN, "La hemoglobina predice la supervivencia a largo plazo en pacientes en diálisis: un estudio longitudinal de un
solo centro de 15 años y una tendencia de correlación entre la prealbúmina y la hemoglobina",Riñón Internacional, 64 (2003),
A-28. 6–11. jUDYP. W.ILKINS, ohCICATRIZESUMAN, DEBABENJAMÍN, y DÁVIDONHEMDON, "Comparación del cumplimiento autoinformado y
monitoreado de la inyección diaria de hormona de crecimiento humano en niños quemados"Quemaduras, 29 (2003), 697–701.

A-29. B. R.OBINSON, CT HEISE, JW MOORE, J. A.NELLA, EMOKOLOSKI, y E. E.SHAGHPOUR, “Terapia de reducción de la poscarga en
pacientes después de una operación de deflector intraauricular para la transposición de las grandes arterias,”
Cardiología Pediátrica, 23 (2003), 618–623.
A-30. PAGETERBORDENAR, jOHNnorteYLAND, DÁVIDONM CABORTAR, y DÁVIDOPAGIENOWSKI, “Comparación biomecánica del sistema de
sutura de reparación de menisco FasT-FIX con colchón vertical y flechas de menisco,”Revista americana de medicina
deportiva, 31 (2003), 374–378.
A-31. CLAUDIODora, BCOMERWA €LCHLI, ACHIMENEAmiLFERING, IMREGRAMOAlabama, DOMINIKWEISHAUPT, y NORBERTOBOOS, "El
Importancia de las dimensiones del canal espinal para discriminar las hernias de disco sintomáticas de las asintomáticas”,
Revista Europea de Columna Vertebral, 11 (2002), 575–581.
A-32. kIMBERLYK. N.AGY, ROXANAR. R.OBERTS, ROBERTOFSMITO, kIMBERLYTJOSEPH, gARIO, C. A.norte, FAránBOKHARI, y
jOHNBARRETTO, "Heridas de bala transmediastínicas: ¿los pacientes 'estables' son realmente estables?"Revista mundial
de cirugía, 26 (2002), 1247–1250.
A-33. ROBERTOOCHSENKU €hn, THOMASSTROWITZKI, mONIKAGRAMOUrtner, ALEXANDERSTRAUSS, ANDREASSCHULZE, hERMANN
HPPE, y PETERHILEMANNS, "Complicaciones del embarazo, riesgos obstétricos y resultado neonatal en embarazos únicos
y gemelares después de GIFT y FIV",Archivos de Ginecología y Obstetricia, 268 (2003), 256–261. William Tindall y el
A-34. Centro de Consultoría de la Universidad Estatal de Wright (2003).
A-35. RONALDF.CAMIONETAVOLLENHOVEN, SOFIAmiRESTAM, ANDSHARJU, jOHANBrata, y yoARSkLARESKOG, “Etanercept
Versus Etanercept más metotrexato: un estudio basado en registros que sugiere que la combinación es clínicamente
más eficaz”,Investigación y terapia de la artritis, 5 (2003), R347–R351.
A-36. kICOMETROIYAZAKI, TOSHIYAnorteISHIBE, FUMIHIROSATA, TAKAHIROIAMI, FAVÍOAKTÚ HACES, jORGEFLORES, YASUMASAj
METROIYAZAKIy kEISHUYASUDA, “Operación de extirpación con escleroterapia para venas varicosas primarias debido al
reflujo de la vena safena mayor: resultados de tres años,”Revista mundial de cirugía, 27 (2003), 551–553.
302 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

A-37. CLAUDIODora, BCOMERWA €LCHLI, ACHIMENEAmiLFERING, IMREGRAMOAlabama, DOMINIKWEISHAUPT, y NORBERTOBOOS, "El


Importancia de las dimensiones del canal espinal para discriminar las hernias de disco sintomáticas de las asintomáticas”,
Revista Europea de Columna Vertebral, 11 (2002), 575–581.
A-38. SILVIAIANNELO, ANTONINACAVALERI, PAGAOLINAMETROILAZZO, SANTICANTARELLA, y FRANCESCOBELFIORE, “Ayuno Bajo
Nivel de triglicéridos séricos como marcador precoz de trastornos autoinmunes”,Medscape Medicina general, 5 (3)
(2003).
A-39. SEstados UnidosBAZYK, PAGAULAMETROICHAUD, glennyGRAMOOODMAN, y PAULAPAGAPLICACIÓN, "Integración de los servicios de terapia ocupacional en un
plan de estudios de jardín de infantes: una mirada a los resultados". Presentado aRevista estadounidense de terapia ocupacional, 30 de
junio de 2004.
A-40. jOHNJ HONG, StephenMCOHN, APETERmiKEH, mARTINnorteEWMAN, mOISESSALAMA, y SUZANNÉDLEBLANG, "A
Estudio prospectivo aleatorizado de evaluación clínica versus tomografía computarizada para el diagnóstico de
apendicitis aguda”,Infecciones quirúrgicas, 4 (2003), 231–239.
A-41. DENNISDYKSTRA, ALmiNRIQUEZ, y MICHAELVCALLEJÓN, “Tratamiento de la vejiga hiperactiva con toxina botulínica tipo B:
un estudio piloto”Revista Internacional de Uroginecología, 14 (2003), 424–426.
A-42. norteETAHORESH, ISRAELORACH, DORONGRAMOOTRO, mEIRmiFRATI, y ALANAPTER, “Comparación de los suicidios
Comportamiento de pacientes adolescentes hospitalizados con trastorno límite de la personalidad y depresión mayor.Revista de
enfermedades nerviosas y mentales, 191 (2003), 582–588.
A-43. LARRYBMAUKSCH, WAYNEJ. K.ATÓN, jOANROSS, SUZANNÉMTUCKER, miENANOWALKERy J.UNA REDCAMERON,
“El contenido de una población de atención primaria sin seguro y de bajos ingresos: incluida la agenda del paciente”,Revista de
la Junta Estadounidense de Medicina Familiar, 16 (2003), 278–289.
A-44. DÁVIDOHOSKING, SILVANOADAMI, DIETERFELSENBERG, jORGECANNATAAINDIA, mATIVA €LIMA€KI, LAURENTEBENBAMOU,
jEAN-YVESREGINSTER, CarolYACIK, ANDREARYBAK-FEGLIN, RICHARDAPETRUSCHKE, LUNAZARU, y ARTHURC.
SANTORA, "Comparación del cambio en la resorción ósea y la densidad mineral ósea con alendronato una vez a la semana y
risedronato diario: un estudio aleatorizado controlado con placebo"Opinión de investigación médica actual, 19 (2003), 383–
394.
A-45. norteORMANHBANA, "La 25-hidroxivitamina D3[r] revierte la alteración del sistema endocrino de vitamina D en los
negros",El Diario Americano de Medicina, 99 (diciembre de 1995), 597–599.
A-46. PMONTNER, DM STARCO, ML RIEDESEL, GMURATA, R. R.OBERGS, MTIMMS, y TW CPALETO, "La hidratación con glicerol antes del
ejercicio mejora el tiempo de resistencia en bicicleta",Revista Internacional de Medicina Deportiva, 17 (1996), 27–33.
A-47. ALESSANDRAD'ALESSANDRO, WSONkUSHNER, hOFERTAWONG, hOMERABOUSHEY, y PAULDBLANC, “Exagerado
Respuestas a la inhalación de cloro entre personas con hiperreactividad inespecífica de las vías respiratorias”,Cofre, 109 (1996), 331–337.

A-48. LR RANGANATH, JACHRISTOFIDES, JWWBIEN, y V. M.ARCAS, “Efecto de la terapia de reemplazo hormonal en la composición de
ácidos grasos de la membrana plaquetaria,”Revista de Endocrinología, 148 (1996), 207–212.
A-49. METROICHAELYO GORAN, PAGATRICIADRISCOLL, RACHELjOHNSON, TSOYR. N.AGY, y GARIOHUNTER, “Calibración cruzada de
Técnicas de composición corporal contra la absorciometría de rayos X de energía dual en niños pequeños”,Diario
Americano de Nutrición Clínica, 63 (1996), 299–305.
A-50. METROANFREDOHARTARDO, PAGAULHABER, DIANAILIEVA, miLISABETHPAGREISINGER, gEORGSEIDLy J.OHANNESHUBER,
“Entrenamiento Sistemático de Fuerza como Modelo de Intervención Terapéutica,”Revista estadounidense de medicina física y
rehabilitación, 75 (1996), 21–28.
A-51. MVITACCA, E. C.LINI, W. S.PASSINI, LSCAGLIA, P. N.EGRINI, y A. QUADRI, “¿La posición supina empeora la función
respiratoria en sujetos de edad avanzada?”Gerontología, 42 (1996), 46–53.
A-52. StephenPORJOVEN, PAGETERLROSENBLATT, DIANEMPINGETON, ALLISONEHPREMIO, y StephenPBAKER, "El
Cabestrillo suburetral de malla Mersilene: una evaluación clínica y urodinámica”,Diario americano de obstetricia y
ginecología, 173 (1995), 1719–1726.
A-53. PAGAULTDIAMANTE, gERALDFELSENTHAL, StephenNMACCIOCCHI, DONNAHBÚLTIMO, y DENISELALIADO-CENSAYO,
“Efecto del deterioro cognitivo en el resultado de la rehabilitación”,Revista estadounidense de medicina física y
rehabilitación, 75 (1996), 40–43.
A-54. ROBERTOE. W.EINSTEIN, CATERINAA. L.OBOCKI, SharónGRAMORAVETT, hILLMANHMU, RONALDnorteEGRICH, jONATÁN
HERBST, DAnaGRAMOREENBERG, y DÁVIDOR. P.IEPER, "Disminución de los niveles de esteroides sexuales suprarrenales en ausencia
de supresión de glucocorticoides en mujeres asmáticas posmenopáusicas",Revista de Alergia e Inmunología Clínica, 97 (1996),
1–8.
A-55. BARRYL. G.GOMA, DARIOSORBI, DEBORÁLFRENCHE, mARIOJ. M.ARQUESA, gERARDJ. N.UOVO, RICHARDR. K.EW, y
LEONARDOA.ARBEIT, "Niveles de MMP-9 (gelatinasa B) en suero marcadamente elevados en la artritis reumatoide: un
marcador de laboratorio potencialmente útil"Inmunología Clínica e Inmunopatología, 78 (1996), 161–171.
REFERENCIAS 303

A-56. LIGUIBENINI, CARLOSEMBENINI, gRETACASTELLANI, miNICOBARDELLI, mARIATERESABRENTEGANI, PAGIERGIORGIO


GRAMOIORGETTI, y yoTALÓVANTINI, “Acidificación esofágica patológica y dilatación neumática en pacientes
acalásicos: ¿demasiado o insuficiente?”Enfermedades y Ciencias Digestivas, 41 (1996), 365–371.
A-57. PAGHILIPNBAKER, CHRISTOPHERPDTRANKO, SANDRATDAVIDGE, PAGAULDAKOTA DEL SURAVIESy J.AMÉSSEÑOROBERTS,
“El estrés mecánico elimina los efectos del plasma de pacientes con preeclampsia en las células endoteliales”
Diario americano de obstetricia y ginecología, 174 (1996), 703–706.
A-58. METROARCOH ZISSELMAN, BARRYWROVNER, y YOCHISHMUELY, “Uso de benzodiacepinas en ancianos antes de la
hospitalización psiquiátrica”,Psicosomática, 37 (1996), 38–42.
A-59. HRespuestaREINECKE, ROLLANDIASTRUDER, ROLLANDIAVMEJOR, jURGENTEHOLTZ, y HOLMODREXLER, “Cardíaco Na+/California2+
Actividad de intercambio en pacientes con insuficiencia cardíaca en etapa terminal”,Investigación cardiovascular, 31 (1996), 48–54.
A-60. WILLIAMEREICHMAN, ANDREWC COYNE, SATISHAMIRNENI, BRUNOMETROOLINO, y SANDRAmiGAN, "Negativo
Síntomas en la enfermedad de Alzheimer”,Diario Americano de Psiquiatría, 153 (1996), 424–426.
CAPÍTULO 8
ANÁLISIS DE VARIACIÓN

RESUMEN DEL CAPÍTULO

Este capítulo presenta el primero de una serie de capítulos dedicados a los modelos
lineales. El tema de este capítulo, el análisis de la varianza, proporciona una
metodología para dividir la varianza total calculada a partir de un conjunto de datos
en componentes, cada uno de los cuales representa la cantidad de la varianza total
que se puede atribuir a una fuente específica de variación. Los resultados de esta
partición se pueden usar para estimar y probar hipótesis sobre las varianzas y
medias de la población. En este capítulo centramos nuestra atención en la prueba de
hipótesis de medias. Específicamente, discutimos la prueba de diferencias entre
medias cuando hay interés en más de dos poblaciones o dos o más variables. Las
técnicas discutidas en este capítulo son ampliamente utilizadas en las ciencias de la
salud.

TEMAS

8.1INTRODUCCIÓN
8.2EL DISEÑO TOTALMENTE ALEATORIZADO
8.3EL DISEÑO DE BLOQUE COMPLETO ALEATORIZADO
8.4EL DISEÑO DE MEDIDAS REPETIDAS
8.5EL EXPERIMENTO FACTORIAL
8.6RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. comprender los conceptos estadísticos básicos relacionados con los modelos lineales.
2. comprender cómo la variación total en un conjunto de datos se puede dividir en diferentes
componentes.
3. ser capaz de comparar las medias de más de dos muestras simultáneamente.
4. comprender las pruebas de comparación múltiple y cuándo es apropiado su uso.
5. comprender los diseños experimentales de uso común.

304
8.1 INTRODUCCIÓN 305

8.1 INTRODUCCIÓN

En los capítulos anteriores se han examinado los conceptos básicos de estadística, y


proporcionan una base para éste y los siguientes capítulos. En este capítulo y los tres
siguientes, proporcionamos una descripción general de dos de las herramientas analíticas más
utilizadas por los estadísticos aplicados, el análisis de varianza y la regresión lineal. Los
fundamentos conceptuales de estas herramientas analíticas son modelos estadísticos que
brindan representaciones útiles de las relaciones entre varias variables simultáneamente.

Modelos linealesUn modelo estadístico es una representación matemática de las relaciones entre
variables. Más específicamente, para los propósitos de este libro, un modelo estadístico se usa con
mayor frecuencia para describir cómo las variables aleatorias se relacionan entre sí en un contexto en
el que el valor de unovariable de resultado,a menudo referido con la letra "y,”puede ser modelado
como una función de uno o másvariables explicativas,a menudo referido con la letra "X."De esta
manera, estamos interesados en determinar cuánta variabilidad en los resultados puede explicarse
por variables aleatorias que se midieron o controlaron como parte de un experimento. El modelo
lineal se puede expandir fácilmente a la forma más generalizada, en la que incluimos múltiples
variables de resultado simultáneamente. Estos modelos se denominan modelos lineales generales y
se pueden encontrar en libros de estadística más avanzados.

DEFINICIÓN
Unvariable de resultadoestá representado por el conjunto de valores medidos
que resultan de un experimento o algún otro proceso estadístico. Un variable
explicativa,por otro lado, es una variable que es útil para predecir el valor de
la variable de resultado.

Un modelo lineal es cualquier modelo que es lineal en los parámetros que definen el modelo.
Podemos representar tales modelos genéricamente en la forma:

Yj¼b0þb1X1jþb2X2jþ . . . þbkXkjþmij (8.1.1)

En esta ecuación,bjrepresenta los coeficientes en el modelo ymijrepresenta un error aleatorio. Por lo tanto,
cualquier modelo que se pueda representar de esta forma, donde los coeficientes son constantes y el orden
algebraico del modelo es uno, se considera un modelo lineal. Aunque a primera vista esta ecuación puede
parecer abrumadora, en realidad es generalmente fácil encontrar valores para los parámetros utilizando
álgebra o cálculo básico, como veremos a medida que avanza el capítulo.
Veremos muchas representaciones de modelos lineales en esta y otras formas en los próximos
capítulos. En particular, nos enfocaremos en el uso de modelos lineales para analizar datos utilizando
el análisis de varianza para probar diferencias entre medias, regresión para hacer predicciones y
correlación para comprender asociaciones entre variables. En el contexto del análisis de varianza, las
variables predictoras sonvariables de clasificaciónse utilizan para definir factores de interés (p. ej.,
diferenciar entre un grupo de control y un grupo de tratamiento), y en el contexto de la correlación y
la regresión lineal, las variables predictoras suelen ser variables continuas, o al menos variables a un
nivel más alto que las clases nominales. Aunque los propósitos subyacentes de estas tareas pueden
parecer bastante diferentes, estudiar estas técnicas y
306 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

la estructura de los modelos utilizados para representarlos demostrará ser valiosa para
comprender algunas de las estadísticas inferenciales más utilizadas.

Análisis de variaciónEste capítulo se ocupa deAnálisis de variación,que puede definirse como


una técnica mediante la cual la variación total presente en un conjunto de datos se divide en
dos o más componentes. Asociada a cada uno de estos componentes se encuentra una fuente
de variación específica, por lo que en el análisis es posible conocer la magnitud de las
contribuciones de cada una de estas fuentes a la variación total.
El desarrollo del análisis de varianza (ANOVA) se debe principalmente al trabajo de
RA Fisher (1), cuyas contribuciones a la estadística, que abarcan los años 1912 a 1962, han tenido una
tremenda influencia en el pensamiento estadístico moderno (2,3).

AplicacionesEl análisis de varianza encuentra su aplicación más amplia en el análisis de datos


derivados de experimentos. Los principios del diseño de experimentos están bien tratados en
muchos libros, incluidos los de Hinkelmann y Kempthorne (4), Montgomery (5) y Myers y Well
(6). No estudiamos este tema en detalle, ya que para hacerle justicia se requeriría como mínimo
un capítulo adicional. Sin embargo, algunos de los conceptos importantes en el diseño
experimental se harán evidentes cuando analicemos el análisis de varianza.

El análisis de varianza se usa para dos propósitos diferentes: (1) para estimar y probar
hipótesis sobre las varianzas de la población, y (2) para estimar y probar hipótesis sobre las
medias de la población. Nos interesa aquí el último uso. Sin embargo, como veremos, nuestras
conclusiones con respecto a las medias dependerán de las magnitudes de las varianzas
observadas.
Los conceptos y técnicas que cubrimos bajo el título de análisis de varianza son extensiones de
los conceptos y técnicas cubiertos en el Capítulo 7. En el Capítulo 7 aprendimos a probar la hipótesis
nula de que dos medias son iguales. En este capítulo aprenderemos a probar la hipótesis nula de que
tres o más medias son iguales. Mientras que, por ejemplo, lo que aprendimos en el Capítulo 7 nos
permite determinar si podemos concluir que dos tratamientos difieren en efectividad, lo que
aprendemos en este capítulo nos permite determinar si podemos concluir que tres o más
tratamientos difieren en efectividad. El siguiente ejemplo ilustra algunas ideas básicas involucradas
en la aplicación del análisis de varianza. Estos serán ampliados y elaborados más adelante en este
capítulo.

EJEMPLO 8.1.1
Supongamos que deseamos saber si tres fármacos difieren en su eficacia para reducir el colesterol
sérico en sujetos humanos. Algunos sujetos reciben el fármaco A, algún fármaco B y algún fármaco C.
Después de un período de tiempo específico, se toman medidas para determinar hasta qué punto se
redujo el colesterol sérico en cada sujeto. Encontramos que la cantidad en la que se redujo el
colesterol sérico no es la misma en todos los sujetos. En otras palabras, hay variabilidad entrelas
medidas. ¿Por qué, nos preguntamos, las medidas no son todas iguales? Presumiblemente, una de las
razones por las que no son iguales es que los sujetos recibieron diferentes medicamentos. Ahora
observamos las medidas de los sujetos que recibieron el fármaco A. Encontramos que la cantidad en
la que se redujo el colesterol sérico no es la misma entre estos sujetos. Encontramos que este es el
caso cuando observamos las medidas de los sujetos.
8.1 INTRODUCCIÓN 307

que recibieron la droga B y aquellos sujetos que recibieron la droga C. Vemos que hay
variabilidadentre las medidasdentrolos grupos de tratamiento. ¿Por qué, nos volvemos a
preguntar, estas medidas no son iguales? Entre las razones que me vienen a la mente están las
diferencias en la composición genética de los sujetos y las diferencias en sus dietas. A través de
un análisis de lavariabilidadque hemos observado, podremos llegar a una conclusión respecto a
la equivalencia de la eficacia de los tres fármacos. Para ello empleamos las técnicas y conceptos
del análisis de varianza. &

VariablesEn nuestro ejemplo aludimos a tres tipos de variables. Encontramos que estas
variables están presentes en todas las situaciones en las que el uso del análisis de varianza es
apropiado. Primero, tenemos elvariable de tratamiento,que en nuestro ejemplo era “droga”.
Teníamos tres “valores” de esta variable, droga A, droga B y droga C. El segundo tipo de
variable al que nos referimos es lavariable de respuesta.En el ejemplo, es un cambio en el
colesterol sérico. La variable de respuesta es la variable que esperamos que muestre diferentes
valores cuando se emplean diferentes "valores" de la variable de tratamiento. Finalmente,
tenemos las otras variables que mencionamos: composición genética y dieta. Estos se llaman
variables extrañas.Estas variables pueden tener un efecto sobre la variable de respuesta, pero
no son el foco de nuestra atención en el experimento. La variable de tratamiento es la variable
de interés principal, y la pregunta que debe responderse es: ¿Los diferentes "valores" de la
variable de tratamiento resultan en diferencias, en promedio, en la variable de respuesta?

suposicionesSubyacente al uso válido del análisis de varianza como herramienta de inferencia


estadística hay un conjunto de supuestos fundamentales. Aunque un experimentador no debe
esperar encontrar todos los supuestos cumplidos a la perfección, es importante que el usuario de las
técnicas de análisis de varianza sea consciente de los supuestos subyacentes y sea capaz de reconocer
cuándo no se cumplen sustancialmente. Debido a que los experimentos en los que todas las
suposiciones se cumplen perfectamente son raros, los resultados del análisis de varianza deben
considerarse aproximados en lugar de exactos. Estas suposiciones se señalan en puntos apropiados
en las siguientes secciones.
Analizamos el análisis de varianza tal como se utiliza para analizar los resultados de dos
diseños experimentales diferentes, el diseño completamente al azar y el diseño de bloques completos
al azar. Además de estos, se da el concepto de experimento factorial mediante su uso en un diseño
completamente al azar. Estos no agotan las posibilidades. Se puede encontrar una discusión de
diseños adicionales en las referencias (4–6).

El procedimiento ANOVAEn nuestra presentación del análisis de varianza para los diferentes
diseños, seguimos el procedimiento de diez pasos presentado en el Capítulo 7. Lo siguiente es una
reafirmación de los pasos del procedimiento, incluidos algunos conceptos nuevos necesarios para su
adaptación al análisis de varianza.

1. Descripción de los datos.Además de describir los datos de la forma habitual, mostramos los
datos de muestra en forma tabular.
2. Supuestos.Junto con los supuestos que subyacen al análisis, presentamos el modelo para
cada diseño que discutimos. El modelo consiste en una representación simbólica de un
valor típico de los datos que se analizan.
3. Hipótesis.
308 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

4. Estadística de prueba.

5. Distribución de la estadística de prueba.

6. Regla de decisión.
7. Cálculo de la estadística de prueba. Los resultados de los cálculos aritméticos serán
resumido en una tabla llamada tabla de análisis de varianza (ANOVA). Las entradas en la
tabla facilitan la evaluación de los resultados del análisis.
8. Decisión estadística.
9. Conclusión.
10. Determinación depagvalor.

Discutimos estos pasos con mayor detalle en la Sección 8.2.

El uso de las computadorasLos cálculos requeridos por el análisis de varianza son más largos y
complicados que los que hemos encontrado en los capítulos anteriores. Por esta razón, la
computadora asume un papel importante en el análisis de la varianza. Todos los ejercicios que
aparecen en este capítulo son aptos para el análisis por computadora y pueden resolverse con los
paquetes estadísticos mencionados en el Capítulo 1. El resultado de los paquetes estadísticos puede
variar ligeramente del presentado en este capítulo, pero esto no debería representar un problema
importante para quienes que utilizan una computadora para analizar los datos de los ejercicios. Los
conceptos básicos de análisis de varianza que presentamos aquí deben proporcionar los
antecedentes necesarios para comprender la descripción de los programas y su salida en cualquiera
de los paquetes estadísticos.

8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO

Vimos en el Capítulo 7 cómo es posible probar la hipótesis nula de que no hay diferencia entre las
medias de dos poblaciones. No es raro que el investigador esté interesado en probar la hipótesis nula
de que no hay diferencia entre las medias de varias poblaciones. El estudiante que se encuentre por
primera vez con este problema podría estar inclinado a sugerir que todos los pares posibles de
medias muestrales se prueben por separado mediante el test de Student.tprueba. Supongamos que
hay cinco poblaciones involucradas. El número de posibles pares de medias muestrales es5C2¼10.
Como la cantidad de trabajo involucrada en llevar a cabo tantostpruebas es sustancial, valdría la pena
si estuviera disponible una alternativa más eficiente para el análisis. Una consecuencia más
importante de realizar todos los posiblestpruebas, sin embargo, es que es muy probable que lleve a
una conclusión falsa.
Supongamos que extraemos cinco muestras de poblaciones que tienen medias iguales. Como
hemos visto, serían 10 pruebas si hiciéramos por separado cada una de las posibles pruebas. Si
seleccionamos un nivel de significación dea¼ :05 para cada prueba, la probabilidad de no rechazar
una hipótesis de no diferencia en cada caso sería :95. Por la regla de probabilidad de la multiplicación,
si las pruebas fueran independientes entre sí, la probabilidad de no rechazar una hipótesis de
ninguna diferencia en los 10 casos seríad:95Þ10¼ :5987. La probabilidad de rechazar al menos una
hipótesis de no diferencia, entonces, sería 1 - :5987¼ :4013. Como sabemos que la hipótesis nula es
verdadera en todos los casos en este ejemplo ilustrativo, rechazar la hipótesis nula constituye la
comisión de un error tipo I. A la larga, entonces, en
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 309

Probando todos los posibles pares de medias de cinco muestras, cometeríamos un error de
tipo I el 40 por ciento de las veces. El problema se complica aún más en la práctica, ya que tres
o mástlas pruebas basadas en los mismos datos no serían independientes entre sí.
Queda claro, entonces, que se necesita algún otro método para probar una diferencia
significativa entre varias medias. El análisis de varianza proporciona dicho método.

ANOVA unidireccionalEl tipo más simple de análisis de varianza es el conocido como Análisis de
varianza de una sola vía,en el que sólo una fuente de variación, ofactor,es investigado. Es una
extensión a tres o más muestras de latprocedimiento de prueba (discutido en el Capítulo 7) para usar
con dos muestras independientes. Dicho de otra manera, podemos decir que eltLa prueba para usar
con dos muestras independientes es un caso especial de análisis de varianza de una vía.

En una situación típica, queremos usar un análisis de varianza de una vía para probar la
hipótesis nula de que tres o más tratamientos son igualmente efectivos. El experimento
necesario está diseñado de tal manera que los tratamientos de interés se asignan
completamente al azar a los sujetos u objetos sobre los que se van a realizar las mediciones
para determinar la eficacia del tratamiento. Por esta razón el diseño se llamadiseño
experimental completamente al azar.
Podemos asignar aleatoriamente sujetos a tratamientos de la siguiente manera. Supongamos
que tenemos 16 sujetos disponibles para participar en un experimento en el que deseamos comparar
cuatro fármacos. Numeramos a los sujetos del 01 al 16. Luego vamos a una tabla de números
aleatorios y seleccionamos 16 números consecutivos no duplicados entre 01 y 16. Para ilustrar,
usemos la Tabla A del Apéndice y un punto de inicio aleatorio que, digamos, está en la intersección de
la Fila 4 y las Columnas 11 y 12. El número de dos dígitos en esta intersección es 98. Los 16 números
consecutivos de dos dígitos siguientes (moviéndose hacia abajo) entre 01 y 16 son 16, 09, 06, 15, 14,
11 , 02, 04, 10, 07, 05, 13, 03, 12, 01 y 08. Asignamos los sujetos 16, 09, 06 y 15 al fármaco A; sujetos
14, 11, 02 y 04 al fármaco B; sujetos 10, 07, 05 y 13 al fármaco C; y los sujetos 03, 12, 01 y 08 al
fármaco D. Hacemos hincapié en que el número de sujetos en cada grupo de tratamiento no tiene por
qué ser el mismo. La figura 8.2.1 ilustra el esquema de asignación aleatoria.

Disponible
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 dieciséis
asignaturas

Aleatorio
dieciséis 09 06 15 14 11 02 04 10 07 05 13 03 12 01 08
números

dieciséis 09 06 15 14 11 02 04 10 07 05 13 03 12 01 08

Tratamiento A B C D
FIGURA 8.2.1Asignación de sujetos a tratamientos, diseño completamente al azar.
310 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

TABLA 8.2.1 Tabla de Valores Muestrales para el Diseño


Completamente Aleatorizado

Tratamiento

1 2 3 ... k

X11 X12 X13 ... X1k


X21 X22 X23 ... X2k
X31 X32 X33 ... X3k
.. ..
. . ... ... ...

Xnorte11 Xnorte22 Xnorte33 ... Xnortekk

Total T:1 T:2 T:3 ... T-k T::

Significar X-:1 X-:2 X-::3 ... X--k X-::

Pasos de la prueba de hipótesisUna vez que decidimos que el diseño completamente


aleatorizado es el diseño apropiado, podemos continuar con los pasos de prueba de hipótesis.
Discutimos esto en detalle primero, y seguimos con un ejemplo.

1. Descripción de los datos.Las mediciones (u observaciones) resultantes de un diseño


experimental completamente aleatorizado, junto con las medias y los totales que se pueden
calcular a partir de ellas, se pueden mostrar por conveniencia como en la Tabla 8.2.1. Los
símbolos utilizados en la Tabla 8.2.1 se definen de la siguiente manera:

Xyo¼elila observación resultante de lajtratamiento


dhay un total dektratosÞ
i ¼1; 2; . . . ;nortej; j¼1; 2; . . . ;k
Xnortej

T:j¼ Xyo¼totales de losjtratamiento


i¼1
T:j
- X:j¼ ¼media de lajtratamiento
nortej

Xk kX j
Xnorte
T::¼ T:j¼ Xyo¼total de todas las observaciones
j¼1 j¼1i¼1

T::; Xk
- X--¼ norte¼ nortej
norte
j¼1

2. Supuestos.Antes de establecer las suposiciones, especifiquemos el modelo para el


experimento descrito aquí.

El modeloComo ya se señaló, un modelo es una representación simbólica de un valor típico de un


conjunto de datos. Para escribir el modelo para el diseño experimental completamente aleatorizado,
comencemos identificando un valor típico del conjunto de datos representado por la muestra que se
muestra en la Tabla 8.2.1. Usamos el símboloXyopara representar este valor típico.
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 311

El modelo de análisis de varianza de una vía se puede escribir de la siguiente manera:

Xyo¼metroþtjþmiyo; i¼1; 2; . . . ;nortej; j¼1; 2; . . . ;k (8.2.1)

Los términos en este modelo se definen de la siguiente manera:

1.metrorepresenta la media de todoskpoblación significa y se llamagran media.


2.tjrepresenta la diferencia entre la media dejla población y la gran media y se
llama laefecto del tratamiento
3.miyorepresenta la cantidad en que una medida individual difiere de la media de la
población a la que pertenece y se denominatérmino de error.

Componentes del modeloAl observar nuestro modelo, podemos ver que una observación típica
del conjunto total de datos bajo estudio se compone de (1) la gran media, (2) un efecto de tratamiento
y (3) un término de error que representa la desviación de la observación. de la media de su grupo.

En la mayoría de las situaciones sólo estamos interesados en elktratamientos representados en


nuestro experimento. Cualquier inferencia que hagamos se aplica solo a estos tratamientos. No deseamos
extender nuestra inferencia a una colección más grande de tratamientos. Cuando ponemos tal restricción en
nuestros objetivos de inferencia, nos referimos a nuestro modelo como elmodelo de efectos fijos,o modelo 1.
La discusión en este libro se limita a este modelo.

Supuestos del ModeloLos supuestos para el modelo de efectos fijos son los
siguientes:
(a)Elkconjuntos de datos observados constituyenkmuestras aleatorias independientes de las
respectivas poblaciones.
(b)Cada una de las poblaciones de las que proceden las muestras se distribuye normalmente con
mediametrojy varianzas2 j.
(C)Cada una de las poblaciones tiene la misma varianza. Eso es,s2 1¼s2 2¼ . . .s2 k¼s2el
varianza común.
PAG
(d)Eltjson constantes desconocidas y tj¼0 ya que la suma de todas las desviaciones de lametroj
de su medio,metro,es cero
(mi)Elmiyotienen una media de 0, ya que la media deXyoesmetroj.
(F)Elmiyotienen una varianza igual a la varianza delXyo, desde elmiyoyXyodifieren solo por una
constante; es decir, la varianza del error es igual as2, la varianza común especificada en el
supuesto c.
(gramo)Elmiyose distribuyen normalmente (e independientemente).

3. Hipótesis.Probamos la hipótesis nula de que todas las medias de población o tratamiento son iguales
contra la alternativa de que los miembros de al menos un par no son iguales. Podemos formular las
hipótesis formalmente de la siguiente manera:

H0:metro1¼metro2¼ - - - ¼metrok

HA:no todometrojson iguales


312 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

s21= s22= . . = s2k

metro1=metro2=...=metrok

FIGURA 8.2.2Imagen de las poblaciones representadas en un


diseño completamente al azar cuandoH0es cierto y se
cumplen los supuestos.

Si las medias de la población son iguales, cada efecto de tratamiento es igual a cero, por lo que,
alternativamente, las hipótesis pueden establecerse como

H0:tj¼0; j¼1; 2; . . . ;k
HA:no todotj¼0

SiH0es verdadero y se cumplen los supuestos de varianzas iguales y poblaciones normalmente


distribuidas, una imagen de las poblaciones se verá como la Figura 8.2.2. CuandoH0
es cierto que las medias de las poblaciones son todas iguales y las poblaciones están centradas
en el mismo punto (la media común) en el eje horizontal. Si todas las poblaciones están
distribuidas normalmente con varianzas iguales, las distribuciones serán idénticas, de modo
que al dibujar sus dibujos, cada uno se superpone a cada uno de los otros, y un solo dibujo los
representa a todos suficientemente.
CuandoH0es falsa puede ser falsa porque una de las medias de la población es diferente
a las demás, que son todas iguales. O, quizás, todas las medias de población son diferentes.
Estas son sólo dos de las posibilidades cuandoH0Es falso. Hay muchas otras combinaciones
posibles de medios iguales y desiguales. La figura 8.2.3 muestra una imagen de las poblaciones
cuando se cumplen los supuestos, peroH0es falsa porque no hay dos medias poblacionales
iguales.
4. Estadística de prueba.El estadístico de prueba para el análisis de varianza unidireccional es una
razón de varianza calculada, que designamos por VR como hicimos en el Capítulo 7. Los dos

metro1 metro2 metrok

FIGURA 8.2.3 Imagen de las poblaciones representadas en un


diseño completamente al azar cuando se cumplen los supuestos de
igualdad de varianzas y poblaciones normalmente distribuidas, peroH0es
falsa porque ninguna de las medias de la población es igual.
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 313

las varianzas a partir de las cuales se calcula VR se calculan a su vez a partir de los datos
de la muestra. Los métodos por los cuales se calculan se darán en la discusión que sigue.

5. Distribución de la estadística de prueba.Como se discutió en la Sección 7.8, VR se distribuye


como el Fdistribución cuandoH0es cierto y se cumplen los supuestos.
6. Regla de decisión.En general, la regla de decisión es: rechazar la hipótesis nula
si el valor calculado de VR es igual o mayor que el valor crítico deFpara el
elegidoanivel.
7. Cálculo de la estadística de prueba.Hemos definido el análisis de varianza como un proceso mediante
el cual la variación total presente en un conjunto de datos se divide en componentes que son
atribuibles a diferentes fuentes. El términovariaciónutilizado en este contexto se refiere a lasuma de
las desviaciones al cuadrado de las observaciones de su media,osuma de cuadrados para abreviar.

Los cálculos iniciales realizados en ANOVA de una vía consisten en dividir la variación
total presente en los datos observados en sus componentes básicos, cada uno de los cuales es
atribuible a una fuente identificable.
Aquellos que usan una computadora para los cálculos pueden desear omitir la siguiente discusión de
los cálculos involucrados en la obtención de la estadística de prueba.

La suma total de cuadradosAntes de que podamos hacer cualquier partición, primero debemos obtener la
suma total de los cuadrados. La suma total de cuadrados es la suma de los cuadrados de las desviaciones de
las observaciones individuales de la media de todas las observaciones tomadas en conjunto. Estesuma total
de cuadradosSe define como

Xk X nortej - -
acero inoxidable¼ Xyo- -X::2 (8.2.2)
j¼1 i¼1

dóndeSnortei¼1
j nos dice que sumemos las desviaciones al cuadrado para cada grupo de tratamiento, ySk j¼1Cuéntanos

para agregar elktotales de grupo obtenidos aplicandoSnortej i¼1. El lector reconocerá la ecuación
8.2.2 como el numerador de la varianza que se puede calcular a partir del conjunto completo de
observaciones tomadas en conjunto.

La suma de cuadrados de los grupos internosAhora vamos a mostrar cómo calcular el


primera de las dos componentes de la suma total de cuadrados.
El primer paso en las llamadas de cálculo para realizar ciertos cálculosdentrocada grupo.
Estos cálculos implican computar dentro de cada grupo la suma de las desviaciones al cuadrado
de las observaciones individuales de su media. Cuando estos cálculos se han realizado dentro
de cada grupo, obtenemos la suma de los resultados de los grupos individuales. Esta
componente de la variación se llamadentro de grupos suma de cuadradosy puede ser
designado SSW.Esta cantidad a veces se denominaresidualoerrorsuma de cuadrados. La
expresión para estos cálculos se escribe de la siguiente manera:

Xk X nortej - -2
SSO¼ Xyo- -X:j (8.2.3)
j¼1 i¼1
314 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

La suma de cuadrados entre gruposPara obtener el segundo componente de la suma total de


cuadrados, calculamos para cada grupo la desviación al cuadrado de la media del grupo de la gran
media y multiplicamos el resultado por el tamaño del grupo. Finalmente, sumamos estos resultados
sobre todos los grupos. Esta cantidad es una medida de la variación entre grupos y se conoce como la
suma de cuadrados entre gruposoSSA.La fórmula para calcular esta cantidad es la siguiente:

Xk- -2
SSA¼ nortej-X:j- -X:: (8.2.4)
j¼1

En resumen, entonces, hemos encontrado que la suma total de cuadrados es igual a la suma
de la suma de cuadrados entre y dentro. Expresamos esta relación de la siguiente manera:

acero inoxidable¼SSAþSSO

A partir de las sumas de cuadrados que ahora hemos aprendido a calcular, es posible obtener dos
estimaciones de la varianza común de la población,s2. Se puede demostrar que cuando se cumplen
los supuestos y las medias de la población son todas iguales, tanto la suma de cuadrados entre como
la suma de cuadrados dentro, cuando se dividen por sus respectivos grados de libertad, producen
estimaciones independientes e insesgadas des2.

La primera estimación des2 Dentro de cualquier muestra,

Xnortej - -
Xyo- -X:j2
i¼1
nortej-1

proporciona una estimación no sesgada de la varianza real de la población de la que procede la muestra.
Bajo el supuesto de que las varianzas de la población son todas iguales, podemos agrupar lask estimaciones
para obtener

X j -
Xknorte -
Xyo- -X:j2
RSU¼j¼1i¼1 (8.2.5)
Xk - -
nortej-1
j¼1

Esta es nuestra primera estimación des2y puede llamarse elvariación dentro de los grupos,ya
que es la suma de los cuadrados de la Ecuación 8.2.3 dentro de los grupos dividida por los
grados de libertad apropiados. El estudiante reconocerá esto como una extensión dekmuestras
del procedimiento de combinación de varianzas encontrado en los Capítulos 6 y 7 cuando las
varianzas de dos muestras se combinaron para usar eltdistribución. La cantidad en la Ecuación
8.2.5 se suele denominar dentro de los gruposcuadrado medioen lugar de la varianza dentro de
los grupos.
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 315

El cuadrado medio dentro de los grupos es una estimación válida des2sólo si las varianzas de la
población son iguales. No es necesario, sin embargo, paraH0cierto para que el cuadrado medio dentro de los
grupos sea una estimación válida des2; es decir, las estimaciones cuadráticas medias dentro de los gruposs2
independientemente de siH0es verdadero o falso, siempre que las varianzas de la población sean iguales.

La segunda estimación des2 La segunda estimación des2se puede obtener de


la fórmula familiar para la varianza de las medias muestrales,s2 - X¼s2= n.Si solucionamos esto
ecuación paras2, la varianza de la población de la que se extrajeron las muestras, tenemos

s2¼nortes2- X (8.2.6)

Una estimación imparcial des2 - Xcalculado a partir de datos de muestra es proporcionado por

k-
PAG -2
- X:j- -X::
j¼1
k-1

Si sustituimos esta cantidad en la Ecuación 8.2.6, obtenemos la estimación deseada des2,

k-
PAG -2
norte - X:j- -X::
j¼1
MSA¼ (8.2.7)
k-1

El lector reconocerá el numerador de la Ecuación 8.2.7 como la suma de cuadrados entre


grupos para el caso especial cuando todos los tamaños de muestra son iguales. Esta suma de
cuadrados cuando se divide por los grados de libertad asociadosk-1 se conoce como elentre grupos
media cuadrática.
Cuando los tamaños de muestra no son todos iguales, una estimación des2basado en la variabilidad entre las
medias muestrales es proporcionado por

PAG
k - -2
nortej-X:j- -X::

MSA¼j¼1 (8.2.8)
k-1

Si, de hecho, la hipótesis nula es verdadera, esperaríamos que estas dos estimaciones des2estar
bastante cerca en magnitud. Si la hipótesis nula es falsa, es decir, si todas las medias poblacionales no son
iguales, esperaríamos que el cuadrado medio entre grupos, que se calcula usando las desviaciones al
cuadrado de las medias muestrales de la media general, sea mayor que el cuadrado medio entre grupos.
grupos significan el cuadrado.
Para comprender el análisis de varianza, debemos darnos cuenta de que el cuadrado medio
entre grupos proporciona una estimación válida des2cuando el supuesto de igual población
316 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

se cumplen las varianzasy cuando h0es verdad. Ambas condiciones, una hipótesis nula verdadera y varianzas
poblacionales iguales, deben cumplirse para que el cuadrado medio entre grupos sea una estimación válida
des2.

La relación de varianzaLo que tenemos que hacer ahora es comparar estas dos estimaciones de s2,
y hacemos esto calculando la siguiente razón de varianza, que es la estadística de prueba deseada:

entre grupos cuadrático medio MSA


V: R:¼ ¼
dentro de grupos cuadrático medio RSU

Si las dos estimaciones son casi iguales, VR estará cerca de 1. Una relación cercana a 1 tiende a
respaldar la hipótesis de medias poblacionales iguales. Si, por el contrario, el cuadrado medio entre
grupos es considerablemente mayor que el cuadrado medio dentro de los grupos, VR será
considerablemente mayor que 1. Un valor de VR suficientemente mayor que 1 pondrá en duda la
hipótesis de medias poblacionales iguales.
Sabemos que debido a los caprichos del muestreo, incluso cuando la hipótesis nula es verdadera, es
poco probable que los cuadrados medios entre y dentro de los grupos sean iguales. Entonces, debemos
decidir qué tan grande debe ser la diferencia observada antes de que podamos concluir que la diferencia se
debe a algo más que a la fluctuación de muestreo. En otras palabras, ¿qué tan grande es el valor de VR
requerido para que estemos dispuestos a concluir que la diferencia observada entre nuestras dos
estimaciones des2¿No es el resultado de la casualidad solamente?

ElFPruebaPara responder a la pregunta que acabamos de plantear, debemos considerar el muestreo


- distribución de la razón de dos varianzas muestrales. En el capítulo 6 aprendimos que la cantidad
s12= s12=s2 2= s22sigue una distribución conocida comoFdistribución cuando la muestra
las varianzas se calculan a partir de muestras aleatorias e independientes de poblaciones
normales. ElFLa distribución, introducida por RA Fisher a principios de la década de 1920, se ha
convertido en una de las distribuciones más utilizadas en las estadísticas modernas. Ya nos
hemos familiarizado con su uso para construir intervalos de confianza y probar hipótesis acerca
de las varianzas de la población. En este capítulo, veremos que es la distribución fundamental
para el análisis de varianza. Por esta razón, la relación que denominamos VR se denomina con
frecuencia comoF,y el procedimiento de prueba es frecuentemente llamado elFprueba. Es de
interés señalar que laFdistribución es el cociente de dos distribuciones Chi-cuadrado.
En el Capítulo 7, aprendimos que, cuando las varianzas de la población son iguales, se cancelan
en la expresións2 1= s21=s2 2= s22, partidas2 1= s22, que a su vez se distribuye comoF.ElF
distribución es realmente una familia de distribuciones, y el particularFLa distribución que
usamos en una situación dada depende del número de grados de libertad asociados con la
varianza muestral en el numerador (grados de libertad del numerador)y el número de grados
de libertad asociados con la varianza muestral en el denominador (grados de libertad del
denominador).
Una vez que el apropiadoFha determinado la distribución, el tamaño de la VR
observada que provocará el rechazo de la hipótesis de varianzas poblacionales
iguales depende del nivel de significación elegido. El nivel de significación elegido
determina el valor crítico deF,el valor que separa la región de no rechazo de la región
de rechazo.
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 317

TABLA 8.2.2 Tabla de análisis de varianza para el diseño completamente al azar

Fuente de grados de Diferencia


Variación Suma de cuadrados Libertad Cuadrado medio Relación

PAG
k - -2 MSA
Entre muestras SSA¼ nortej X--j- X-:: k-1 MSA¼SSA=dk-1Þ V:R-¼
j¼1 RSU
-
k PAG
PAG nortej
-2
Dentro de las muestras SSO¼ Xyo- X--j N-k RSU¼SSW=dN - kÞ
j¼1i¼1

PAG
kPAG
norte - j -2
Total acero inoxidable¼ X yo- X-:: norte-1
j¼1i¼1

Como hemos visto, calculamos VR en situaciones de este tipo colocando el cuadrado medio de
los grupos en el numerador y el cuadrado medio de los grupos en el denominador, de modo que los
grados de libertad del numerador sean iguales adk-1Þ,el número de grupos menos 1, y el valor de los
grados de libertad del denominador es igual a

!
Xk- - Xk
nortej-1 ¼ nortej -k¼N - k
j¼1 j¼1

La tabla ANOVALos cálculos que realizamos se pueden resumir y mostrar en una


tabla como la Tabla 8.2.2, que se denomina tabla ANOVA.
8. Decisión estadística.Para llegar a una decisión, debemos comparar nuestra VR
calculada con el valor crítico deF,que obtenemos ingresando la Tabla G del Apéndice
conk-1 numerador grados de libertad yN - kgrados de libertad del denominador.

Si el VR calculado es igual o mayor que el valor crítico deF,rechazamos la hipótesis


nula. Si el valor calculado de VR es menor que el valor crítico deF,no rechazamos la
hipótesis nula.

Explicación de una hipótesis nula rechazadaHay dos posibles explicaciones


ciones para una hipótesis nula rechazada. Si la hipótesis nula es verdadera, es decir, si las dos
varianzas muestrales son estimaciones de una varianza común, sabemos que la probabilidad de
obtener un valor de VR igual o mayor que el valor críticoFes igual a nuestro nivel de significación
elegido. cuando rechazamosH0podemos, si lo deseamos, concluir que la hipótesis nula es verdadera y
suponer que debido al azar obtuvimos un conjunto de datos que dio lugar a un evento raro. Por otro
lado, podemos preferir tomar la posición de que nuestro gran valor VR calculado no representa un
evento raro provocado por la casualidad sino que, en cambio, refleja el hecho de que algo distinto de
la casualidad está operando. Entonces concluimos que tenemos una hipótesis nula falsa.

Es esta última explicación la que solemos dar para los valores calculados de VR que
exceden el valor crítico deF.En otras palabras, si el valor calculado de VR es mayor que el
valor crítico deF,rechazamos la hipótesis nula.
318 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Se recordará que la hipótesis original que nos propusimos probar era

H0:metro1¼metro2¼ - - - ¼metrok

¿El rechazo de la hipótesis sobre varianzas implica un rechazo de la hipótesis de medias poblacionales
iguales? La respuesta es sí. Un gran valor de VR resultó del hecho de que el cuadrado medio entre
grupos era considerablemente mayor que el cuadrado medio dentro de los grupos. Dado que el
cuadrado medio entre grupos se basa en la dispersión de las medias muestrales sobre su media
(llamada media general), esta cantidad será grande cuando haya una gran discrepancia entre los
tamaños de las medias muestrales. Entonces, debido a esto, un valor significativo de VR nos dice que
rechacemos la hipótesis nula de que todas las medias poblacionales son iguales.

9. Conclusión.cuando rechazamosH0, concluimos que no todas las medias poblacionales son


iguales. Cuando fallamos en rechazarH0, concluimos que las medias poblacionales no son
significativamente diferentes entre sí.
10. Determinación depagvalor.

EJEMPLO 8.2.1
Las carnes de caza, incluidas las del venado de cola blanca y las ardillas grises orientales, son
utilizadas como alimento por familias, cazadores y otras personas por motivos de salud, culturales o
personales. Un estudio realizado por David Holben (A-1) evaluó el contenido de selenio de la carne de
venado de cola blanca (venado) y ardilla gris (ardilla) en libertad obtenida de una región baja en
selenio de los Estados Unidos. Estos valores de contenido de selenio también se compararon con los
de la carne vacuna producida dentro y fuera de la misma región. Queremos saber si los niveles de
selenio son diferentes entre los cuatro grupos de carne.

Solución:

1. Descripción de los datos.Contenido de selenio de venado crudo (VEN), carne de ardilla


(SQU), carne de res criada en la región (RRB) y carne de res criada fuera de la región
(NRB), enmetrog=100 g de peso seco, se muestran en la Tabla 8.2.3. Un gráfico de los
datos en forma deGráfica de puntosse muestra en la Figura 8.2.4. Tal gráfico destaca
las características principales de los datos y pone de manifiesto las diferencias claras
en los niveles de selenio entre las diferentes carnes.

TABLA 8.2.3 Contenido de selenio, enmetrog=100g, de cuatro tipos diferentes de carne

Tipo de carne

VEN SQU RRB NRB

26.72 14.86 37.42 37.57 11.23 15.82 44. 33


28.58 16.47 56.46 25.71 29.63 27.74 76.86
29.71 25.19 51.91 23.97 20.42 22.35 4.45
26.95 37.45 62.73 13.82 10.12 34.78 55.01
10.97 45.08 4.55 42.21 39.91 35.09 58.21
21.97 25.22 39.17 35.88 32.66 32.60 74.72
(Continuado)
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 319

Tipo de carne

VEN SQU RRB NRB

14.35 22.11 38.44 10.54 38.38 37.03 11.84


32.21 33.01 40.92 27.97 36.21 27.00 139.09
19.19 31.20 58.93 41.89 16.39 44.20 69.01
30.92 26.50 61.88 23.94 27.44 13.09 94.61
10.42 32.77 49.54 49.81 17.29 33.03 48.35
35.49 8.70 64.35 30.71 56.20 9.69 37.65
36.84 25.90 82.49 50.00 28.94 32.45 66.36
25.03 29.80 38.54 87.50 20.11 37.38 72.48
33.59 37.63 39.53 68.99 25.35 34.91 87.09
33.74 21.69 21.77 27.99 26.34
18.02 21.49 31.62 22.36 71.24
22.27 18.11 32.63 22.68 90.38
26.10 31.50 30.31 26.52 50.86
20.89 27.36 46.16 46.01
29.44 21.33 56.61 38.04
24.47 30.88
29.39 30.04
40.71 25.91
18.52 18.54
27.80 25.51
19.49

Fuente: Datos proporcionados por cortesía de David H. Holben, Ph.D.

2. Supuestos.Suponemos que los cuatro conjuntos de datos constituyen muestras


aleatorias simples independientes de las cuatro poblaciones indicadas.
Suponemos que las cuatro poblaciones de mediciones se distribuyen
normalmente con varianzas iguales.

VEN

SQU
tipo de carne

RRB

NRB
0 20 40 60 80 100 120 140
Contenido de selenio (metrog/100 g de peso seco)

FIGURA 8.2.4 Contenido de selenio de cuatro tipos de carne. VEN¼venado, SQU¼ardilla, RRB¼
carne de res criada en la región y NRB¼carne de res criada fuera de la región.
320 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

TABLA 8.2.4 Tabla ANOVA para el Ejemplo 8.2.1

Fuente SS d.f. EM F

Entre muestras 21261.82886 3 7087.27629 27.00


Dentro de las muestras 36747.22674 140 262.48019
Total 58009.05560 143

3. Hipótesis.H0:metro1¼metro2¼metro3¼metro4(En promedio, las cuatro carnes tienen el


mismo contenido de selenio).

HA: No todometro's son iguales (Al menos una carne produce un contenido
promedio de selenio diferente del contenido promedio de selenio de al menos
otra carne).

4. Estadística de prueba.El estadístico de prueba es V:R:¼MSA=RSM.

5. Distribución de la estadística de prueba.SiH0es verdadera y se cumplen los


supuestos, la VR sigue laFdistribución con 4 - 1¼3 numerador grados de
libertad y 144 - 4¼140 grados de libertad en el denominador.
6. Regla de decisión.Supongamos que dejamosa¼ :01. El valor crítico deFde la
Tabla G del Apéndice es < 3:95. La regla de decisión, entonces, es rechazarH
0si la estadística VR calculada es igual o superior a 3,95.

7. Cálculo de la estadística de prueba.Por la Ecuación 8.2.2 calculamos

acero inoxidable¼58009:05560

Por la Ecuación 8.2.4 calculamos

SSA¼21261:82886

SSO¼58009:05560 - 21261:82886¼36747:22674

Los resultados de nuestros cálculos se muestran en la Tabla 8.2.4.


8. Decisión estadística.Dado que nuestro calculadoFde 27.00 es mayor que 3.95
rechazamosH0.
9. Conclusión.Ya que rechazamosH0, concluimos que la hipótesis alternativa es
verdadera. Es decir, concluimos que los cuatro tipos de carne no tienen
todos el mismo contenido promedio de selenio.
10pagvalor.Desde las 27:00 > 3:95;pag < :01 para esta prueba. &

Una palabra de precauciónEl diseño completamente al azar es simple y, por lo tanto, ampliamente
utilizado. Sin embargo, debe usarse solo cuando las unidades que reciben los tratamientos son
homogéneas. Si las unidades experimentales no son homogéneas, el investigador debe considerar un
diseño alternativo como uno de los que se discutirán más adelante en este capítulo.
En nuestro ejemplo ilustrativo, los tratamientos son tratamientos en el sentido habitual de la palabra.
Sin embargo, este no es siempre el caso, ya que el término "tratamiento" como se usa en el diseño
experimental es bastante general. Podríamos, por ejemplo, desear estudiar la respuesta a la misma
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 321

Caja de diálogo: Comando de sesión:

Estadística ANOVA Unidireccional (sin apilar) BTT>AOVONEWAY C1-C4

TipoC1-C4enrespuestas (en columnas separadas) Hacer clicDE


ACUERDO.

Producción:

ANOVA unidireccional: NRB, RRB, SQU, VEN

Análisis de Varianza para Selenio

Fuente DF SS EM F PAG
Tipo de carne 3 21262 7087 27,00 0,000
Error 140 36747 262
Total 143 58009

IC del 95 % individual para la media

Basado en Desv. estándar agrupada


Nivel norte Significar Desvst -------+----------+--------+----------
NRB 19 62.05 31.15 (----*----)
RRB 53 29.08 10.38 (--*--)
SQU 30 43,25 19,51 (---*---)
VEN 42 25,88 8,03 (--*---)
- - - - - - - + - - - - - - - - - - + - - - - - - - - + - - - - - - - - - - - 30
StDeV agrupado = 16,20 45 60

FIGURA 8.2.5Procedimiento MINITAB y salida para el Ejemplo 8.2.1.

tratamiento (en el sentido usual de la palabra) de varias razas de animales. Sin embargo, nos
referiríamos a la raza del animal como el "tratamiento".
También debemos señalar que, aunque las técnicas de análisis de varianza se aplican más a
menudo a los datos resultantes de experimentos controlados, las técnicas también pueden usarse
para analizar los datos recopilados por una encuesta, siempre que se cumplan razonablemente los
supuestos subyacentes.

Análisis informáticoLa figura 8.2.5 muestra el procedimiento de computadora y la salida para el


ejemplo 8.2.1 proporcionada por un programa de análisis de varianza unidireccional que se encuentra
en el paquete MINITAB. Los datos se ingresaron en las Columnas 1 a 4. Cuando compara la tabla
ANOVA en esta impresión con la que se proporciona en la Tabla 8.2.4, ve que la impresión usa la
etiqueta "factor" en lugar de "entre muestras". Los diferentes tratamientos se mencionan en la
impresión como niveles. Así el nivel 1¼tratamiento 1, nivel 2¼tratamiento 2, y así sucesivamente. La
impresión da las medias de las cuatro muestras y las desviaciones estándar, así como el conjunto
322 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

El Sistema SAS

Procedimiento de análisis de varianza

Variable dependiente: selen

La suma de
Fuente DF Cuadrícula Cuadrado medio F Valor PR > F
Modelo 3 21261.82886 7087.27629 27.00 <.0001
Error 140 36747.22674 262.48019
corregido Total 143 58009.05560
R Plaza coeficiente Var Raíz MSE selen Significar

0.366526 45.70507 16.20124 35.44736

FIGURA 8.2.6SAS parcial®impresión para el Ejemplo 8.2.1.

Desviación Estándar. Esta última cantidad es igual a la raíz cuadrada del cuadrado medio del error que se
muestra en la tabla ANOVA. Finalmente, la salida de la computadora brinda representaciones gráficas de los
intervalos de confianza del 95% para la media de cada una de las cuatro poblaciones representadas por los
datos de la muestra.
La figura 8.2.6 contiene un SAS parcial®impresión resultante del análisis de los datos del
Ejemplo 8.2.1 mediante el uso del SAS®enunciado PROC ANOVA. S.A.S.®calcula algunas
cantidades adicionales como se muestra en la salida. R Plaza¼SSA=SST. Esta cantidad nos dice
qué proporción de la variabilidad total presente en las observaciones se explica por las
diferencias en respuesta a los tratamientos. CV:¼100 (raíz MSE/selen media). Root MSE es la raíz
cuadrada de MSW, y selen mean es la media de todas las observaciones.
Tenga en cuenta que la estadística de prueba VR está etiquetada de manera diferente por diferentes
programas de software estadístico. MINITAB, por ejemplo, usa F en lugar de VR SAS®utiliza la etiqueta Valor
F.
Un dispositivo útil para mostrar características importantes de un conjunto de datos analizados mediante un
análisis de varianza unidireccional es un gráfico que consta de diagramas de caja uno al lado del otro. Para cada
muestra se construye un diagrama de caja usando el método descrito en el Capítulo 2. La Figura 8.2.7 muestra los
diagramas de caja uno al lado del otro para el Ejemplo 8.2.1. Tenga en cuenta que en la Figura 8.2.7 la variable de
interés está representada por el eje vertical en lugar del eje horizontal.

AlternativasSi los datos disponibles para el análisis no cumplen con los supuestos para el
análisis de varianza de una vía como se analiza aquí, se puede considerar el uso del
procedimiento de Kruskal-Wallis, una técnica no paramétrica que se analiza en el Capítulo 13.

Prueba de diferencias significativas entre pares individuales de mediasCuando el análisis


de la varianza conduce al rechazo de la hipótesis nula de que no hay diferencia entre las
medias de la población, surge naturalmente la pregunta de qué pares de medias son
diferentes. De hecho, el deseo, la mayoría de las veces, es realizar una prueba de
significación en todos y cada uno de los medios de tratamiento. por ejemplo, en
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 323

150
*

Selenio (metrog/100 g)
100

*
50

0
NRB RRB SQU VEN
tipo de carne

FIGURA 8.2.7Diagramas de caja uno al lado del otro para el ejemplo 8.2.1.

Ejemplo 8.2.1, donde hay cuatro tratamientos, podemos desear saber, después de rechazar H0:metro1
¼metro2¼metro3¼metro4, cuál de las seis posibles hipótesis individuales debe rechazarse. El
experimentador, sin embargo, debe tener cuidado al probar diferencias significativas entre las medias
individuales y siempre debe asegurarse de que el procedimiento sea válido. El tema crítico en el
procedimiento es el nivel de significancia. Aunque la probabilidad,a,de rechazar una hipótesis nula
verdadera para la prueba en su conjunto se hace pequeña, la probabilidad de rechazar al menos una
hipótesis verdadera cuando se prueban varios pares de medias es, como hemos visto, mayor quea.
Existen varios procedimientos de comparación múltiple comúnmente utilizados en la práctica. A
continuación, ilustramos dos procedimientos populares, a saber, la prueba HSD de Tukey y el método
de Bonferroni. Se remite al estudiante interesado a los libros de Hsu (7) y Westfall et al. (8) para
técnicas adicionales.

Prueba HSD de TukeyA lo largo de los años se han sugerido varios procedimientos para hacer comparaciones
múltiples. Un procedimiento de comparación múltiple desarrollado por Tukey (9) se usa con frecuencia para
probar la hipótesis nula de que todos los posibles pares de medias de tratamiento son iguales cuando las
muestras son todas del mismo tamaño. Cuando se emplea esta prueba, seleccionamos un nivel de
significación general dea.la probabilidad esa,entonces, que una o más de las hipótesis nulas es falsa.

La prueba de Tukey, que generalmente se conoce como HSD (diferencia honestamente


significativa) prueba, hace uso de un solo valor contra el cual se comparan todas las diferencias. Este
valor, llamado HSD, está dado por

rffiffiffiffiffiffiffiffiffiffiffi

MSE
HSD¼qa;k;Nk (8.2.9)
norte

dóndeaes el nivel de significación elegido,kes el número de medias en el experimento,nortees


el número total de observaciones en el experimento,nortees el número de observaciones en un
tratamiento, MSE es el error o dentro del cuadrado medio de la tabla ANOVA, yqse obtiene
ingresando la Tabla H del Apéndice cona,k,yN - k.
324 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

la estadisticaq,tabulado en la Tabla H del Apéndice, se conoce como el estadístico de rango


estudentizado. Se define como la diferencia entre las medias de tratamiento más grande y más
pequeña de un ANOVA (es decir, es el rango de las medias de tratamiento) dividida por el cuadrado
medio del error sobrenorte,el número de observaciones en un tratamiento. El rango estudentizado es
discutido en detalle por Winer (10).
Se calculan todas las diferencias posibles entre pares de medias y se declara significativa
cualquier diferencia que produzca un valor absoluto que supere a HSD.

Prueba de Tukey para tamaños de muestra desigualesCuando las muestras no son todas del
mismo tamaño, como en el caso del Ejemplo 8.2.1, la prueba HSD de Tukey dada por la
Ecuación 8.2.9 no es aplicable. El mismo Tukey (9) y Kramer (11), sin embargo, han extendido el
procedimiento de Tukey al caso donde los tamaños de muestra son diferentes. Su
procedimiento, que a veces se denomina método Tukey-Kra-mer, consiste en reemplazarMSE/n
en la Ecuación 8.2.9 condMSE=2Þ1=norteiþ1=nortej,dóndenorteiynortejson los tamaños de
muestra de los dos grupos a comparar. Si designamos la nueva cantidad por HSD , tenemos
como nuevo criterio de prueba

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

MSE 1 1
HSD¼qa;k;Nk þ (8.2.10)
2 nortei nortej

Cualquier valor absoluto de la diferencia entre dos medias muestrales que exceda HSD se
declara significativo.

Método de BonferroniOtra prueba de comparación múltiple muy utilizada se basa en un


método desarrollado por CE Bonferroni. Al igual que con el método de Tukey, deseamos
mantener un nivel de significación general deapara el total de todas las pruebas por pares. En
el método de Bonferroni, simplemente dividimos el nivel de significancia deseado por el
número de pares individuales que estamos probando. Es decir, en lugar de probar a un nivel de
significación dea,Probamos a un nivel de significación deun =k,dóndekes el número de
comparaciones pareadas. la suma de todosun =klos términos no pueden, entonces,
posiblemente exceder nuestro nivel establecido dea.Por ejemplo, si uno tiene tres muestras, A,
B y C, entonces hay k¼3 comparaciones por pares. Estos sonmetroA¼metroB;metroA¼metroC, y
metroB¼metroC. Si elegimos un nivel de significación dea¼ :05, entonces procederíamos con las
comparaciones y utilizaríamos un nivel de significancia corregido por Bonferroni deun =3¼ :
017. Por lo tanto, nuestro pagel valor no debe ser mayor que :017 para rechazar la hipótesis
nula y concluir que las dos medias difieren.
La mayoría de los paquetes de computadora calculan valores usando el método de
Bonferroni y producen una salida similar al HSD de Tukey u otros procedimientos de
comparación múltiple. En general, estas salidas informan de la corrección realpagvalor
utilizando el método de Bonferroni. Dada la relación básica quepag¼un =k,entonces
algebraicamente podemos multiplicar ambos lados de la ecuación porkpara obtenera¼
paquete.En otras palabras, el totalaes simplemente la suma de todos lospaquetevalores, y el
real corregidopagel valor es simplemente el calculadopagvalor multiplicado por el número de
pruebas que se realizaron.
8.2 EL DISEÑO COMPLETAMENTE ALEATORIZADO 325

EJEMPLO 8.2.2
Ilustremos el uso de la prueba HSD con los datos del Ejemplo 8.2.1.

Solución: El primer paso es preparar una tabla de todas las posibles diferencias (ordenadas)
entre las medias. Los resultados de este paso para el presente ejemplo se muestran en
la Tabla 8.2.5.

Supongamos que dejamosa¼ :05. Entrar en la Tabla H cona¼ :05,k¼4, yN - k¼140,


encontramos queq <3:68. El valor real esq¼3:667, que se puede obtener de SAS®. En
la Tabla 8.2.4 tenemos MSE¼262:4802.
Las hipótesis que se pueden probar, el valor de HSD y la decisión estadística para cada
prueba se muestran en la Tabla 8.2.6.
S.A.S.®utiliza el procedimiento de Tukey para probar la hipótesis de que no hay diferencia entre las
medias de población para todos los pares posibles de medias muestrales. La salida también contiene

TABLA 8.2.5 Diferencias entre medias muestrales


(valor absoluto) para el ejemplo 8.2.2

VEN RRB SQR NRB

VEN – 3.208 17.37 36.171


RRB – 14.163 32.963
SO – 18.801
NRB –

TABLA 8.2.6 Pruebas de comparación múltiple utilizando datos del ejemplo 8.2.1 y HSD

Hipótesis HSO Decisión Estadística


fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

262:4802 1 1
H0:metroVEN¼metroRRB HSD ¼3:677 þ ¼8:68 no rechazarH0
2 42 53
desde 3:208 < 8:68
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

262:4802 1 1
H0:metroVEN¼metroSQU HSD ¼3:677 þ ¼10:04 RechazarH0 desde
2 42 30
17:37 > 10:04
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

262:4802 1 1
H0:metroVEN¼metroNRB HSD ¼3:677 þ ¼11:61 RechazarH0 desde
2 42 19
36:171 > 11:61
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

262:4802 1 1
H0:metroRRB¼metroSQU HSD ¼3:677 þ ¼9:60 RechazarH0 desde
2 53 30
14:163 > 9:60
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

262:4802 1 1
H0:metroRRB¼metroNRB HSD ¼3:677 þ ¼11:23 RechazarH0 desde
2 53 19
32:963 > 11:23
fiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

262:4802 1 1
H0:metroSQU¼metroNRB HSD ¼3:677 þ ¼12:32 RechazarH0 desde
2 30 19
18:801 > 12:32
326 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

El Sistema SAS

Procedimiento de análisis de varianza

Prueba de rango estudentizado de Tukey (HSD) para selen

NOTA: Esta prueba controla la tasa de error experimental Tipo I.

Alfa 0.05
Error Grados de libertad Error 140
Cuadrado medio 262.4802
Valor crítico del rango estudentizado 3.67719

Las comparaciones significativas al nivel de 0,05 se indican mediante ***.

Diferencia
tipo Entre 95% simultáneo
Comparación Medio Límites de confianza

NRB - SQU 18.801 6.449 31.152 ***


NRB - RRB 32.963 21.699 44.228 ***
NRB - VEN 36.171 24.524 47.818 ***
SQU - NRB - 18.801 - 31.152 - 6.449 ***
SQU - RRB 14.163 4.538 23.787 ***
SQU - VEN 17.370 7.300 27.440 ***
RRB - NRB - 32.963 - 44.228 - 21.699 ***
RRB - SQU - 14.163 - 23.787 - 4.538 ***
RRB - VEN 3.208 - 5.495 11.910
VEN - NRB - 36.171 - 47.818 - 24.524 ***
VEN - SQU - 17.370 - 27.440 - 7.300 ***
VEN - RRB - 3.208 - 11.910 5.495

FIGURA 8.2.8S.A.S.®comparaciones múltiples para el ejemplo 8.2.1.

intervalos de confianza para la diferencia entre todos los posibles pares de medias poblacionales. Este
resultado de SAS para el Ejemplo 8.2.1 se muestra en la Figura 8.2.8.
También se puede usar SPSS para realizar comparaciones múltiples mediante una variedad de
métodos, incluido el de Tukey. Los resultados de SPSS para el HSD de Tukey y el método de Bonferroni para
los datos del Ejemplo 8.2.1 se muestran en las Figuras 8.2.9 y 8.2.10, respectivamente. Los resultados
contienen una comparación exhaustiva de las medias muestrales, junto con los errores estándar asociados,
pagvalores e intervalos de confianza del 95%. &
comparaciones múltiples

Variable dependiente: Selenio


Tukey HSD

Significar Intervalo de confianza del 95 %


Diferencia
(I) Carne_tipo (J) Carne_tipo (I–J) Estándar Error Sig. Límite inferior Límite superior

VEN SQU 17.370190* 3.872837210 . 000 27.44017302 7.30020793


RRB 3.2075427 3.346936628 . 773 11.91010145 5.49501609
NRB 36.170840* 4.479316382 . 000 47.81776286 24.52391634

SQU VEN 17.370190* 3.872837210 . 000 7.30020793 27.44017302


RRB 14.162648* 3.701593729 . 001 4.53792509 23.78737051
NRB 18.800649* 4.750167007 . 001 31.15182638 6.44947187

RRB VEN 3.2075427 3.346936628 . 773 5.49501609 11.91010145


SQU 14.162648* 3.701593729 . 001 23.78737051 4.53792509
NRB 32.963297* 4.332113033 . 000 44.22746845 21.69912540

NRB VEN 36.170840* 4.479316382 . 000 24.52391634 47.81776286


SQU 18.800649* 4.750167007 . 001 6.44947187 31.15182638
RRB 32.963297* 4.332113033 . 000 21.69912540 44.22746845

* La diferencia de medias es significativa al nivel .05.

FIGURA 8.2.9Salida de SPSS para el HSD de Tukey usando datos del Ejemplo 8.2.1.

comparaciones múltiples

Variable dependiente: Selenio


Bonferroni

Significar Intervalo de confianza del 95 %


Diferencia
(I) Carne_tipo (J) Carne_tipo (I–J) Estándar Error Sig. Límite inferior Límite superior

VEN RRB 3.20754 3.34694 1.000 12.1648 5.7497


SQU 17.37019* 3.87284 . 000 27.7349 7.0055
NRB 36.17084* 4.47932 . 000 48.1587 24.1830

RRB VEN 3.20754 3.34694 1.000 5.7497 12.1648


SQU 14.16265* 3.70159 . 001 24.0691 4.2562
NRB 32.96330* 4.33211 . 000 44.5572 21.3694

SQU VEN 17.37019* 3.87284 . 000 7.0055 27.7349


RRB 14.16265* 3.70159 . 001 4.2562 24.0691
NRB 18.80065* 4.75017 . 001 31.5134 6.0879

NRB VEN 36.17084* 4.47932 . 000 24.1830 48.1587


RRB 32.96330* 4.33211 . 000 21.3694 44.5572
SQU 18.80065* 4.75017 . 001 6.0879 31.5134

* La diferencia de medias es significativa al nivel .05.

FIGURA 8.2.10Salida de SPSS para el método de Bonferroni usando datos del Ejemplo 8.2.1.

327
328 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

EJERCICIOS

En el ejercicio 8.2.1 a 8.2.7, siga los diez pasos del análisis de la prueba de hipótesis de varianza para ver si puede
concluir que hay una diferencia entre las medias de la población. Dejara¼ :05 por cada prueba. Use el procedimiento
HSD de Tukey para probar diferencias significativas entre pares de medias individuales (si corresponde). usa lo mismo
avalor para elFprueba. Construya un diagrama de puntos y diagramas de caja uno al lado del otro de los datos.

8.2.1.Los investigadores de la Universidad Case Western Reserve (A-2) querían desarrollar e implementar un
transductor, manejable en un entorno clínico, para cuantificar los momentos isométricos producidos en la
articulación del codo por personas con tetraplejía (parálisis o paresia de las cuatro extremidades). El aparato, llamado
transductor de momento del codo (EMT), mide la fuerza que el codo puede ejercer cuando se flexiona. La variable de
salida es el voltaje. La máquina se probó en cuatro ángulos de extensión de codo diferentes, 30, 60, 90 y 120 grados,
en un codo simulado que constaba de dos vigas de aluminio con bisagras. Los datos se muestran en la siguiente
tabla.

Ángulo del codo (grados)

30 60 90 120

- 0.003 1.094 0.000 – 0.001 0.000 - 0.007 0.558 0.003


0.050 1.061 0.053 0.010 0.006 0.012 0.529 0.062
0.272 1.040 0.269 0.028 0.026 - 0.039 0.524 0.287
0.552 1.097 0.555 0.055 0.053 - 0.080 0.555 0.555
1.116 1.080 1.103 0.105 0.108 - 0.118 0.539 1.118
2.733 1.051 2.727 0.272 0.278 - 0.291 0.536 2.763
0.000 1.094 - 0.002 0.553 0.555 - 0.602 0.557 0.006
0.056 1.075 0.052 0.840 0.834 - 0.884 0.544 0.050
0.275 1.035 0.271 1.100 1.106 - 1.176 0.539 0.277
0.556 1.096 0.550 1.647 1.650 - 1.725 1.109 0.557
1.100 1.100 1.097 2.728 2.729 0.003 1.085 1.113
2.723 1.096 2.725 - 0.001 0.005 0.003 1.070 2.759
- 0.003 1.108 0.003 0.014 - 0.023 - 0.011 1.110 0.010
0.055 1.099 0.052 0.027 - 0.037 - 0.060 1.069 0.060
0.273 1.089 0.270 0.057 - 0.046 - 0.097 1.045 0.286
0.553 1.107 0.553 0.111 - 0.134 - 0.320 1.110 0.564
1.100 1.094 1.100 0.276 - 0.297 - 0.593 1.066 1.104
2.713 1.092 2.727 0.555 - 0.589 - 0.840 1.037 2.760
0.007 1.092 0.022 0.832 - 0.876 - 1.168 2.728 - 0.003
- 0.066 1.104 - 0.075 1.099 - 1.157 - 1.760 2.694 - 0.060
- 0.258 1.121 - 0.298 1.651 - 1.755 0.004 2.663 - 0.289
- 0.581 1.106 - 0.585 2.736 - 2.862 0.566 2.724 - 0.585
- 1.162 1.135 - 1.168 0.564 0.000 1.116 2.693 - 1.180
0.008 1.143 0.017 0.556 0.245 2.762 2.670 0.000
- 0.045 1.106 - 0.052 0.555 0.497 0.563 2.720 - 0.034
- 0.274 1.135 - 0.258 0.567 0.001 0.551 2.688 - 0.295
- 0.604 1.156 - 0.548 0.559 0.248 0.551 2.660 - 0.579
- 1.143 1.112 - 1.187 0.551 0.498 0.561 0.556 - 1.165
- 0.004 1.104 0.019 1.107 0.001 0.555 0.560 - 0.019
(Continuado)
EJERCICIOS 329

Ángulo del codo (grados)

30 60 90 120

- 0.050 1.107 - 0.044 1.104 0.246 0.558 0.557 - 0.056


- 0.290 1.107 - 0.292 1.102 0.491 0.551 0.551 - 0.270
- 0.607 1.104 - 0.542 1.112 0.001 0.566 0.564 - 0.579
- 1.164 1.117 - 1.189 1.103 0.262 0.560 0.555 - 1.162
1.105 1.101 1.104 0.527 1.107 0.551
1.103 1.114 0.001 1.104 0.563
1.095 0.260 1.109 0.559
1.100 0.523 1.108 1.113
2.739 - 0.005 1.106 1.114
2.721 0.261 1.102 1.101
2.687 0.523 1.111 1.113
2.732 2.696 1.102 1.113
2.702 2.664 1.107 1.097
2.660 2.722 2.735 1.116
2.743 2.686 2.733 1.112
2.687 2.661 2.659 1.098
2.656 0.548 2.727 2.732
2.733 2.739 0.542 2.722
2.731 2.742 0.556 2.734
2.728 2.747

Fuente: Datos proporcionados por cortesía de SA Snyder, MS

8.2.2.Los pacientes que padecen enfermedades reumáticas u osteoporosis a menudo sufren pérdidas críticas en la densidad mineral ósea
(DMO). El alendronato es un medicamento recetado para desarrollar o prevenir una mayor pérdida de DMO. Holcomb y
Rothenberg (A-3) observaron a 96 mujeres que tomaban alendronato para determinar si existía una diferencia en el cambio
porcentual medio de la DMO entre cinco clasificaciones de diagnóstico primario diferentes.
Los pacientes del grupo 1 fueron diagnosticados con artritis reumatoide (AR). Los pacientes del grupo 2 eran una
colección mixta de pacientes con enfermedades que incluían lupus, granulomatosis de Wegener y poliarteritis, y otras
enfermedades vasculíticas (LUPUS). Los pacientes del grupo 3 tenían polimialgia reumática o artritis temporal
(PMRTA). Los pacientes del grupo 4 tenían artrosis (OA) y los pacientes del grupo 5 tenían osteoporosis (O) sin otras
enfermedades reumáticas identificadas en la historia clínica. Los cambios en la DMO se muestran en la siguiente
tabla.

Diagnóstico

REAL ACADEMIA DE BELLAS ARTES LUPUS PMRTA OA O

11.091 7.412 2.961 - 3.669 11.146 2.937


24.414 5.559 0.293 - 7.816 - 0.838 15.968
10.025 4.761 8.394 4.563 4.082 5.349
- 3.156 - 3.527 2.832 - 0.093 6.645 1.719
6.835 4.839 - 1.369 - 0.185 4.329 6.445
3.321 1.850 11.288 1.302 1.234 20.243
1.493 - 3.933 3.997 5.299 - 2.817 3.290

(Continuado)
330 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Diagnóstico

REAL ACADEMIA DE BELLAS ARTES LUPUS PMRTA OA O

- 1.864 9.669 7.260 10.734 3.544 8.992


5.386 4.659 5.546 1.399 4.160 6.120
3.868 1.137 0.497 1.160 25.655
6.209 7.521 0.592 - 0.247
- 5.640 0.073 3.950 5.372
3.514 - 8.684 0.674 6.721
- 2.308 - 0.372 9.354 9.950
15.981 21.311 2.610 10.820
- 9.646 10.831 5.682 7.280
5.188 3.351 6.605
- 1.892 9.557 7.507
16.553 5.075
0.163
12.767
3.481
0.917
15.853

Fuente: Datos proporcionados por cortesía de John P. Holcomb, Ph.D. y Ralph J. Rothenberg, MD

8.2.3.Ilich-Ernst et al. (A-4) investigó la ingesta dietética de calcio entre una muestra representativa de 113 mujeres sanas de 20 a 88 años
de edad. Los investigadores formaron cuatro grupos de edad de la siguiente manera: Grupo A, 20,0 a 45,9 años; grupo B,
46,0-55,9 años; grupo C, 56,0-65,9 años; y grupo D, mayores de 66 años. El calcio de la ingesta de alimentos se midió en mg/día.
Los datos a continuación son consistentes con las estadísticas resumidas proporcionadas en el documento.

Grupos de edad (años) Grupos de edad (años)

A B C D A B C D

1820 191 724 1652 1020 775


2588 1098 613 1309 805 1393
2670 644 918 1002 631 533
1022 136 949 966 641 734
1555 1605 877 788 760 485
222 1247 1368 472 449
1197 1529 1692 471 236
1249 1422 697 771 831
1520 445 849 869 698
489 990 1199 513 167
2575 489 429 731 824
1426 2408 798 1130 448
1846 1064 631 1034 991
1088 629 1016 1261 590
912 1025 42 994
1383 948 767 1781
(Continuado)
EJERCICIOS 331

Grupos de edad (años) Grupos de edad (años)

A B C D A B C D

1483 1085 752 937


1723 775 804 1022
727 1307 1182 1073
1463 344 1243 948
1777 961 985 222
1129 239 1295 721
944 1676 375
1096 754 1187

8.2.4.Oro et al. (A-5) investigaron la eficacia para dejar de fumar de un parche de nicotina, bupropion SR o ambos, cuando se
administran junto con terapia cognitivo-conductual. Pacientes consecutivos que dan su consentimientodnorte¼164Þ
se asignaron a uno de los tres tratamientos de acuerdo con sus preferencias personales: parche de nicotinadPNT;
norte¼13Þ,bupropión SRdB;norte¼92Þ,y bupropión SR más parche de nicotina dBNTP;norte¼59Þ.En su primera clase
para dejar de fumar, los pacientes calcularon la cantidad de paquetes de cigarrillos que fumaban actualmente por día
y la cantidad de años que fumaban. Los "años del paquete" es el número promedio de paquetes que el sujeto fumó
por día multiplicado por el número de años que el sujeto había fumado. Los resultados se muestran en la siguiente
tabla.

Pack Años

NTP B BNTP

15 8 60 90 8 80
17 10 60 90 15 80
18 15 60 90 25 82
20 20 60 95 25 86
20 22 60 96 25 87
20 24 60 98 26 90
30 25 60 98 30 90
37 26 66 99 34 90
43 27 66 100 35 90
48 29 67 100 36 90
60 30 68 100 40 95
100 30 68 100 45 99
100 35 70 100 45 100
35 70 100 45 102
39 70 105 45 105
40 75 110 48 105
40 75 110 48 105
40 75 120 49 111
40 75 120 52 113
40 76 123 60 120
40 80 125 60 120
45 80 125 60 125
45 80 126 64 125
(Continuado)
332 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Pack Años

NTP B BNTP

45 80 130 64 129
50 80 130 70 130
51 80 132 70 133
52 80 132 70 135
55 84 142 75 140
58 84 157 75 154
60 84 180 76
60 90
Fuente: Datos proporcionados por cortesía de Paul B. Gold, Ph.D.

8.2.5.En un estudio de Wang et al. (A-6), los investigadores examinaron la fortaleza ósea. Recolectaron 10 fémures
cadavéricos de sujetos en tres grupos de edad: jóvenes (19 a 49 años), de mediana edad (50 a 69 años) y
ancianos (70 años o más) [Nota: faltaba un valor en la mediana edad grupo]. Una de las medidas de resultado
(W)fue la fuerza en Newtons necesaria para fracturar el hueso. La siguiente tabla muestra los datos para los
tres grupos de edad.

Joven (Y) Mediana edad (MA) Ancianos (E)

193.6 125.4 59.0


137.5 126.5 87.2
122.0 115.9 84.4
145.4 98.8 78.1
117.0 94.3 51,9
105.4 99.9 57.1
99.9 83.3 54.7
74.0 72.8 78.6
74.4 83.5 53.7
112.8 96,0
Fuente: Datos proporcionados por cortesía de Xiaodu Wang, Ph.D.

8.2.6.En un estudio de 90 pacientes en diálisis renal, Farhad Atassi (A-7) evaluó las prácticas de cuidado oral en el hogar.
Recopiló datos de 30 sujetos que estuvieron en (1) diálisis durante menos de 1 año, (2) diálisis durante 1 a 3 años y (3)
diálisis durante más de 3 años. La siguiente tabla muestra las puntuaciones del índice de placa para estos sujetos.
Una puntuación más alta indica una mayor cantidad de placa.

Grupo 1 Grupo 2 Grupo 3

2.00 2.67 2.83 2.83 1.83 1.83


1.00 2.17 2.00 1.83 2.00 2.67
2.00 1.00 2.67 2.00 1.83 1.33
1.50 2.00 2.00 1.83 1.83 2.17
2.00 2.00 2.83 2.00 2.83 3.00
1.00 2.00 2.17 2.17 2.17 2.33
(Continuado)
EJERCICIOS 333

Grupo 1 Grupo 2 Grupo 3

1.00 2.33 2.17 1.67 2.83 2.50


1.00 1.50 2.00 2.33 2.50 2.83
1.00 1.00 2.00 2.00 2.17 2.83
1.67 2.00 1.67 2.00 1.67 2.33
1.83 . 83 2.33 2.17 2.17 2.33
2.17 . 50 2.00 3.00 1.83 2.67
1.00 2.17 1.83 2.50 2.83 2.00
2.17 2.33 1.67 2.17 2.33 2.00
2.83 2.83 2.17 2.00 2.00 2.00
Fuente: Datos proporcionados por cortesía de Farhad Atassi, DDS, MSC, FICOI.

8.2.7.La trombocitopenia es una condición de plaquetas anormalmente bajas que a menudo ocurre durante la enterocolitis
necrotizante (ECN), una enfermedad grave en los bebés que puede causar daño a los tejidos de los intestinos. Ragazzi
et al. (A-8) investigó las diferencias en el registro10de recuentos de plaquetas en 178 lactantes con NEC. Los pacientes
se agruparon en cuatro categorías de estado NEC. El grupo 0 se refirió a lactantes sin gangrena, el grupo 1 se refirió a
sujetos en quienes la gangrena se limitó a un solo segmento intestinal, el grupo 2 se refirió a pacientes con dos o más
segmentos intestinales de gangrena y el grupo 3 se refirió a pacientes con la mayoría de los pequeños y el intestino
grueso involucrado. La siguiente tabla da el registro10
recuentos de plaquetas para estos sujetos.

Agrupación de gangrena

0 1 2 3

1.97 2.33 2.48 1.38 2.45 1.87 2.37 1.77


0.85 2.60 2.23 1.86 2.60 1.90 1.75 1.68
1.79 1.88 2.51 2.26 1.83 2.43 2.57 1.46
2.30 2.33 2.38 1.99 2.47 1.32 1.51 1.53
1.71 2.48 2.31 1.32 1.92 2.06 1.08 1.36
2.66 2.15 2.08 2.11 2.51 1.04 2.36 1.65
2.49 1.41 2.49 2.54 1.79 1.99 1.58 2.12
2.37 2.03 2.21 2.06 2.17 1.52 1.83 1.73
1.81 2.59 2.45 2.41 2.18 1.99 2.55 1.91
2.51 2.23 1.96 2.23 2.53 2.52 1.80 1.57
2.38 1.61 2.29 2.00 1.98 1.93 2.44 2.27
2.58 1.86 2.54 2.74 1.93 2.29 2.81 1.00
2.58 2.33 2.23 2.00 2.42 1.75 2.17 1.81
2.84 2.34 2.78 2.51 0.79 2.16 2.72 2.27
2.55 1.38 2.36 2.08 1.38 1.81 2.44 2.43
1.90 2.52 1.89 2.46 1.98 1.74
2.28 2.35 2.26 1.66 1.57 1.60
2.33 2.63 1.79 2.51 2.05 2.08
1.77 2.03 1.87 1.76 2.30 2.34
1.83 1.08 2.51 1.72 1.36 1.89
1.67 2.40 2.29 2.57 2.48 1.75
2.67 1.77 2.38 2.30 1.40 1.69
(Continuado)
334 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Agrupación de gangrena

0 1 2 3

1.80 0.70 1.75 2.49


2.16 2.67 1.75
2.17 2.37 1.86
2.12 1.46 1.26
2.27 1.91 2.36
Fuente: Datos proporcionados por cortesía de Simon Eaton, MD

8.2.8.El objetivo de un estudio de Romita et al. (A-9) fue determinar si hay una respuesta diferente
a diferentes bloqueadores de los canales de calcio. Doscientos cincuenta pacientes con hipertensión leve a
moderada fueron asignados al azar a 4 semanas de tratamiento con dosis una vez al día de (1) lercanidipina,
(2) felodipina o (3) nifedipina. Antes del tratamiento y al final de las 4 semanas, se midió la presión arterial
sistólica de cada uno de los sujetos. Luego, los investigadores calcularon el cambio en la presión arterial
sistólica. ¿Cuál es la variable de tratamiento en este estudio? ¿La variable de respuesta? ¿Qué variables
extrañas se te ocurren cuyos efectos estarían incluidos en el término de error? ¿Cuáles son los “valores” de la
variable de tratamiento? Construya una tabla de análisis de varianza en la que especifique para este estudio
las fuentes de variación y los grados de libertad.

8.2.9.Kosmiski et al. (A-10) realizó un estudio para examinar las distribuciones de grasa corporal de hombres infectados y no
infectados por el VIH, tomando y no tomando inhibidores de la proteasa (IP), y habiendo sido diagnosticados y no diagnosticados de lipodistrofia. La lipodistrofia es un síndrome asociado con

el tratamiento del VIH/PI que sigue siendo controvertido. Generalmente se refiere a la acumulación de grasa en el abdomen o vísceras acompañada de resistencia a la insulina, intolerancia a

la glucosa y dislipidemia. En el estudio, 14 sujetos estaban tomando inhibidores de la proteasa y se les diagnosticó lipodistrofia, 12 estaban tomando inhibidores de la proteasa, pero no se les

diagnosticó lipodistrofia, cinco eran VIH positivos, no tomaban inhibidores de la proteasa, ni tenían lipodistrofia diagnosticada, y 43 sujetos eran VIH negativos. y no diagnosticados con

lipodistrofia. Cada uno de los sujetos se sometió a análisis de composición corporal y distribución de grasa mediante absorciometría de rayos X de energía dual y tomografía computarizada.

Luego, los investigadores pudieron examinar el porcentaje de grasa corporal en el tronco. ¿Cuál es la variable de tratamiento? ¿La variable de respuesta? ¿Cuáles son los “valores” de la

variable de tratamiento? ¿Quiénes son los sujetos? ¿Qué variables extrañas se te ocurren cuyos efectos estarían incluidos en el término de error? ¿Cuál fue el propósito de incluir hombres VIH

negativos en el estudio? Construya una tabla ANOVA en la que especifique las fuentes de variación y los grados de libertad para cada una. Los autores informaron un VR calculado de 11,79.

Cuál es el ¿Cuál es la variable de tratamiento? ¿La variable de respuesta? ¿Cuáles son los “valores” de la variable de tratamiento? ¿Quiénes son los sujetos? ¿Qué variables extrañas se te

ocurren cuyos efectos estarían incluidos en el término de error? ¿Cuál fue el propósito de incluir hombres VIH negativos en el estudio? Construya una tabla ANOVA en la que especifique las

fuentes de variación y los grados de libertad para cada una. Los autores informaron un VR calculado de 11,79. Cuál es el ¿Cuál es la variable de tratamiento? ¿La variable de respuesta? ¿Cuáles

son los “valores” de la variable de tratamiento? ¿Quiénes son los sujetos? ¿Qué variables extrañas se te ocurren cuyos efectos estarían incluidos en el término de error? ¿Cuál fue el propósito

de incluir hombres VIH negativos en el estudio? Construya una tabla ANOVA en la que especifique las fuentes de variación y los grados de libertad para cada una. Los autores informaron un

VR calculado de 11,79. Cuál es elpagvalor para la prueba?

8.3 EL DISEÑO DE BLOQUE COMPLETO


ALEATORIZADO

Elbloque completo al azarEl diseño fue desarrollado alrededor de 1925 por RA Fisher, quien buscaba
métodos para mejorar los experimentos de campo agrícola. El diseño de bloques completos al azar es
un diseño en el que las unidades (llamadasunidades experimentales)a los que se aplican los
tratamientos se subdividen en grupos homogéneos denominadosbloques,de modo que el número de
unidades experimentales en un bloque sea igual al número (o algún múltiplo del número) de
tratamientos que se están estudiando. Luego, los tratamientos se asignan aleatoriamente a las
unidades experimentales dentro de cada bloque. Cabe recalcar que cada tratamiento aparece en cada
bloque, y cada bloque recibe todos los tratamientos.
8.3 EL DISEÑO DE BLOQUE COMPLETO ALEATORIZADO 335

ObjetivoEl objetivo de utilizar el diseño de bloques completos al azar es aislar y eliminar del término
de error la variación atribuible a los bloques, mientras se asegura que los medios de tratamiento
estarán libres de efectos de bloque. La efectividad del diseño depende de la capacidad de lograr
bloques homogéneos de unidades experimentales. La capacidad de formar bloques homogéneos
depende del conocimiento que tenga el investigador del material experimental. Cuando el bloqueo se
usa de manera efectiva, el cuadrado medio del error en la tabla ANOVA se reducirá, la VR aumentará y
la posibilidad de rechazar la hipótesis nula mejorará. En los experimentos con animales, la raza del
animal puede utilizarse como factor de bloqueo. Las camadas también se pueden utilizar como
bloques, en cuyo caso un animal de cada camada recibe un tratamiento. En experimentos con seres
humanos, si se desea que se eliminen las diferencias resultantes de la edad, entonces se pueden
agrupar los sujetos según la edad para que una persona de cada edad reciba cada tratamiento. El
diseño de bloques completos al azar también se puede emplear con eficacia cuando un experimento
debe realizarse en más de un laboratorio (bloque) o cuando se requieren varios días (bloques) para
completarlo.
La asignación aleatoria de tratamientos a los sujetos está restringida en el diseño de bloques
completos al azar. Es decir, cada tratamiento debe representarse un número igual de veces (una o
más veces) dentro de cada unidad de bloqueo. En la práctica, esto generalmente se logra asignando
una permutación aleatoria del orden de los tratamientos a los sujetos dentro de cada bloque. Por
ejemplo, si hay cuatro tratamientos que representan tres fármacos y un placebo (fármaco A, fármaco
B, fármaco C y placebo [P]), ¡entonces hay 4!¼24 permutaciones posibles de los cuatro tratamientos:
(A, B, C, P) o (A, C, B, P) o (C, A, P, B), y así sucesivamente. A continuación, se asigna aleatoriamente
una permutación a cada bloque.

VentajasUna de las ventajas del diseño de bloques completos al azar es que es fácil de
entender. Además, ciertas complicaciones que pueden surgir en el curso de un
experimento se manejan fácilmente cuando se emplea este diseño.
Es instructivo señalar aquí que el análisis de comparaciones pareadas presentado en el
Capítulo 7 es un caso especial del diseño de bloques completos al azar. El ejemplo 7.4.1, por ejemplo,
puede tratarse como un diseño de bloques completos al azar en el que los dos puntos en el tiempo
(antes de la operación y después de la operación) son los tratamientos y los individuos en quienes se
tomaron las medidas son los bloques.

Visualización de datosEn general, los datos de un experimento que utiliza el diseño de bloques
completos al azar se pueden mostrar en una tabla como la Tabla 8.3.1. Debe observarse la
siguiente nueva notación en esta tabla:

Xk
totales de losiel bloque¼Ti:¼ Xyo
j¼1

Xk
Xyo
j¼1 T i:
media de laiel bloque¼ -Xi:¼ ¼
k k
Xk X norte

gran total¼T::¼ T-j¼ Ti-


j¼1 i¼1
336 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

TABLA 8.3.1 Tabla de valores muestrales para el diseño de bloques


completos al azar

Tratos

bloques 1 2 3 ... k Total Significar

1 X11 X12 X13 ... X1k T1: X-1:


2 X21 X22 X23 ... X2k T2: X-2:
3 X31 X32 X33 ... X3k T3: X-3:
.. .. ..
. . ... ... ... ... . ...

norte Xnorte1 Xnorte2 Xnorte3 ... Xnk Tnorte- X-norte-

Total T:1 T:2 T:3 ... T-k T::

Significar X-:1 X-:2 X-:3 ... X--k X-::

indicando que el total general puede obtenerse sumando los totales de las filas o sumando los totales de las
columnas.

ANOVA de dos víasLa técnica para analizar los datos de un diseño de bloques
completos al azar se llamaanálisis de varianza de dos víasya que una observación se
categoriza sobre la base de dos criterios: el bloque al que pertenece y el grupo de
tratamiento al que pertenece.
Los pasos para la prueba de hipótesis cuando se utiliza el diseño de bloques completos al azar son los
siguientes:

1. Datos.Después de identificar los tratamientos, los bloques y las unidades experimentales, los
datos, por conveniencia, se pueden mostrar como en la Tabla 8.3.1.
2. Supuestos.El modelo para el diseño de bloques completos al azar y sus
supuestos subyacentes son los siguientes:

El modelo

Xyo¼metroþbiþtjþmiyo
(8.3.1)
i¼1; 2; . . . ;norte; j¼1; 2; . . . ;k

en este modelo

Xyoes un valor típico de la población general. metroes


una constante desconocida.
birepresenta un efecto de bloque que refleja el hecho de que la unidad experimental cayó en eliel
bloquear.

tjrepresenta un efecto de tratamiento, reflejando el hecho de que la unidad experimental recibió


eljº tratamiento.
miyoes un componente residual que representa todas las fuentes de variación distintas de los tratamientos
y bloques
8.3 EL DISEÑO DE BLOQUE COMPLETO ALEATORIZADO 337

Supuestos del Modelo


(a)CadaXyoque se observa constituye una muestra aleatoria independiente de tamaño 1 de uno de
losknpoblaciones representadas.
(b)Cada uno de estosknlas poblaciones se distribuyen normalmente con una mediametroyoy la
misma varianzas2. Esto implica que elmiyose distribuyen normalmente e independientemente
con media 0 y varianzas2.
(C)Los efectos de bloqueo y tratamiento son aditivos. Esta suposición puede interpretarse en el
sentido de que no hayinteracciónentre tratamientos y bloques. En otras palabras, una
combinación particular de tratamiento en bloque no produce un efecto que sea mayor o menor
que la suma de sus efectos individuales. Se puede demostrar que cuando se cumple este
supuesto,
Xk Xnorte

tj¼ bi¼0
j¼1 i¼1

Las consecuencias de una violación de esta suposición son resultados engañosos. Uno no
necesita preocuparse por la violación de la suposición de aditividad a menos que la media más
grande sea más del 50 por ciento mayor que la más pequeña.

Cuando estos supuestos son ciertos, eltjybison un conjunto de constantes fijas y tenemos una
situación que se ajusta al modelo de efectos fijos.

3. Hipótesis.Podemos probar

H0:tj¼0;j¼1; 2; . . . ;k

contra la alternativa
HA: no todotj¼0

Una prueba de hipótesis con respecto a los efectos de bloque generalmente no se lleva a cabo
bajo los supuestos del modelo de efectos fijos por dos razones. Primero, el interés principal está en
los efectos del tratamiento, siendo el propósito habitual de los bloques proporcionar un medio para
eliminar una fuente extraña de variación. Segundo, aunque las unidades experimentales se asignan
aleatoriamente a los tratamientos, los bloques se obtienen de manera no aleatoria.

4. Estadística de prueba.La estadística de prueba es VR

5. Distribución de la estadística de prueba.CuandoH0es verdadera y se cumplen los supuestos, la realidad


virtual sigue unFdistribución.

6. Regla de decisión.Rechazar la hipótesis nula si el valor calculado del estadístico de prueba


VR es igual o mayor que el valor crítico deF.
7. Cálculo de la estadística de prueba.Se puede demostrar que la suma total de cuadrados
para el diseño de bloques completos al azar se puede dividir en tres componentes, cada
uno atribuible a bloques (SSBl), tratamientos (SSTr) y error (EES).Eso es,

acero inoxidable¼SSBlþSSTrþSSE (8.3.2)


338 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Las fórmulas para las cantidades en la Ecuación 8.3.2 son las siguientes:

Xk Xnorte- -2
acero inoxidable¼ Xyo- -X:: (8.3.3)
j¼1 i¼1

Xk X norte

2
SSBl¼ d-Xi-- -X::Þ (8.3.4)
j¼1 i¼1

Xk Xnorte- -
SSTr¼ - X-j- -X::2 (8.3.5)
j¼1 i¼1

SSE¼SST - SSBl - SSTr (8.3.6)

Los grados de libertad apropiados para cada componente de la Ecuación 8.3.2 son

total bloques tratos residualderror


kn -1 ¼ dn-1Þ þ dk-1Þ þ Þ ðn-1Þðk-1Þ

Los grados de libertad residuales, al igual que la suma residual de cuadrados, se pueden obtener por
resta de la siguiente manera:

dkn -1Þ - ðn-1Þ - ðk-1¼kn -1 -norteþ1 -kþ1


¼nortedk-1Þ -1dk-1Þ ¼ ðn-1Þðk-1Þ

La tabla ANOVALos resultados de los cálculos para el diseño de bloques completos al


azar se pueden mostrar en una tabla ANOVA como la Tabla 8.3.2.

8. Decisión estadística.Se puede demostrar que cuando se aplica el modelo de efectos fijos y la
hipótesis nula de ningún efecto de tratamientodtodoti¼0Þes cierto, tanto el cuadrado medio
del error, o residual, como el cuadrado medio de los tratamientos son estimaciones de la
varianza comúns2. Cuando la hipótesis nula es verdadera, por lo tanto, la cantidad

MSTr=MSE
se distribuye comoFconk-1 numerador grados de libertad ydn-1Þ ðk-1Þ grados de
libertad del denominador. La relación de varianza calculada, por lo tanto, se
compara con el valor crítico deF.

TABLA 8.3.2 Tabla ANOVA para el diseño de bloques completos aleatorios

Fuente SS d.f. EM realidad virtual

Tratos SSTr dk-1Þ MSTr¼SSTr=dk-1Þ MSBl¼ MSTr/MSE


bloques SSBl dn-1Þ SSBl=dn-1Þ MSE¼SE=dn-1Þð
Residual SSE dn-1Þðk-1Þ k-1Þ

Total acero inoxidable kn -1


8.3 EL DISEÑO DE BLOQUE COMPLETO ALEATORIZADO 339

9. Conclusión.si rechazamosH0, concluimos que la hipótesis alternativa es verdadera. Si


fallamos en rechazarH0, concluimos queH0puede ser verdad.
10. valor p.
El siguiente ejemplo ilustra el uso del diseño de bloques completos al azar.

EJEMPLO 8.3.1
Un fisioterapeuta deseaba comparar tres métodos para enseñar a los pacientes a usar un
determinado dispositivo protésico. Sintió que la tasa de aprendizaje sería diferente para pacientes de
diferentes edades y deseaba diseñar un experimento en el que se pudiera tener en cuenta la
influencia de la edad.

Solución: El diseño de bloques completos al azar es el diseño apropiado para este


fisioterapeuta.
1. Datos.Tres pacientes en cada uno de los cinco grupos de edad fueron seleccionados para
participar en el experimento, y un paciente en cada grupo de edad fue asignado al azar
a cada uno de los métodos de enseñanza. Los métodos de instrucción constituyen
nuestros tres tratamientos, y los cinco grupos de edad son los bloques. Se obtuvieron
los datos que se muestran en la Tabla 8.3.3.

2. Supuestos.Suponemos que cada una de las 15 observaciones constituye una


muestra aleatoria simple de tamaño 1 de una de las 15 poblaciones definidas por
una combinación de tratamiento en bloque. Por ejemplo, asumimos que el
número 7 en la tabla constituye una respuesta seleccionada al azar de una
población de respuestas que resultaría si una población de sujetos menores de
20 años recibiera el método de enseñanza A. Asumimos que las respuestas en los
15 representan poblaciones se distribuyen normalmente con varianzas iguales.

TABLA 8.3.3 Tiempo (en días) requerido para aprender el uso de un


determinado dispositivo protésico

Método de enseñanza

Grupo de edad A B C Total Significar

Menos de 20 7 9 10 26 8.67
20 a 29 8 9 10 27 9.00
30 a 39 9 9 12 30 10.00
40 a 49 10 9 12 31 10.33
50 y más 11 12 14 37 12.33

Total 45 48 58 151

Significar 9.0 9.6 11.6 10.07


340 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

3. Hipótesis.

H0:tj¼0j¼1; 2; 3 HA: no
todotj¼0

4. Estadística de prueba.El estadístico de prueba es V:R:¼MSTr=MSE.

5. Distribución de la estadística de prueba.CuandoH0es verdadera y se cumplen los


supuestos, la realidad virtual sigue unFdistribución con 2 y 8 grados de libertad.

6. Regla de decisión.Dejara¼ :05. Rechazar la hipótesis nula si el calculado


VR es igual o mayor que el críticoF,que encontramos en la Tabla G del
Apéndice como 4.46.
7. Cálculo de la estadística de prueba.Calculamos las siguientes sumas de
cuadrados:

acero inoxidable¼ ð7 - 10:07Þ2þ ð8 - 10:07Þ2þ - - - þ ð14 - 10:07Þ2¼46:9335

SSBI¼3½ð8:67 - 10:07Þ2þ ð9:00 - 10:07Þ2þ - - - þ ð12:33 - 10:07Þ2¼24:855

SSTr¼5½ð9 - 10:07Þ2þ ð9:6 - 10:07Þ2þ ð11:6 - 10:07Þ2¼18:5335

SSE¼46:9335 - 24:855 - 18:5335¼3:545

Los grados de libertad son totales.¼ ð3Þð5Þ -1¼14, bloques


¼ 5 - 1¼4, tratamientos¼3 - 1¼2, y residual¼ ð5 - 1Þð3 - 1¼
8. Los resultados de los cálculos se pueden mostrar en una tabla ANOVA como
en la Tabla 8.3.4
8. Decisión estadística.Dado que nuestra relación de varianza calculada, 20,91, es
mayor que 4,46, rechazamos la hipótesis nula de que no hay efectos del
tratamiento en el supuesto de que una VR tan grande refleja el hecho de que los
cuadrados medios de las dos muestras no están estimando la misma cantidad. La
única otra explicación para esta gran VR sería que la hipótesis nula es realmente
cierta y acabamos de observar un conjunto inusual de resultados. Descartamos
la segunda explicación a favor de la primera.

TABLA 8.3.4 Tabla ANOVA para el Ejemplo 8.3.1

Fuente SS d.f. EM realidad virtual

Tratos 18.5335 2 9.26675 20.91


bloques 24.855 4 6.21375
Residual 3.545 8 . 443125

Total 46.9335 14
8.3 EL DISEÑO DE BLOQUE COMPLETO ALEATORIZADO 341

9. Conclusión.Concluimos que no todos los efectos de los tratamientos son iguales a cero, o de manera
equivalente, que no todas las medias de los tratamientos son iguales.

10pagvalor.para esta pruebapag < :005. &

Análisis informáticoLa mayoría de los paquetes de software estadístico analizarán los datos de un
diseño de bloques completos aleatorios. Ilustramos la entrada y la salida para MINITAB. Usamos los
datos del experimento para configurar una hoja de trabajo de MINITAB que consta de tres columnas.
La columna 1 contiene las observaciones, la columna 2 contiene números que identifican el bloque al
que pertenece cada observación y la columna 3 contiene números que identifican el tratamiento al
que pertenece cada observación. La figura 8.3.1 muestra la hoja de trabajo de MINITAB para el
ejemplo 8.3.1. La figura 8.3.2 contiene el cuadro de diálogo MINITAB que inicia el análisis y la tabla
ANOVA resultante.
La tabla ANOVA del SAS®La salida para el análisis del Ejemplo 8.3.1 se muestra en la
Figura 8.3.3. Tenga en cuenta que en esta salida el modelo SS es igual a la suma deSSBl y
SSTr.

AlternativasCuando los datos disponibles para el análisis no cumplen con los supuestos del
diseño de bloques completos al azar como se analiza aquí, el procedimiento de Friedman
analizado en el Capítulo 13 puede resultar una alternativa no paramétrica adecuada.

FILA C1 C2 C3
1 7 1 1
2 9 1 2
3 10 1 3
4 8 2 1
5 9 2 2
6 10 2 3
7 9 3 1
8 9 3 2
9 12 3 3
10 10 4 1
11 9 4 2
12 12 4 3
13 11 5 1
14 12 5 2
15 14 5 3

FIGURA 8.3.1Hoja de trabajo de MINITAB para los datos de la figura 8.3.2.


342 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Caja de diálogo: Comando de sesión:

Estadística ANOVA bidireccional MTB > DE DOS VÍAS C1 C2 C3;


SUBC > SIGNIFICA C2 C3.
TipoC1enRespuesta.TipoC2enFactor de filay comprobarMedios de
visualización.TipoC3enFactor de columnay comprobarMedios de
visualización.Hacer clicDE ACUERDO.

Producción:

ANOVA bidireccional: C1 frente a C2, C3

Análisis de Varianza para Fuente C1


DF SS EM F PAG
C2 4 24.933 6.233 14.38 0.001
C3 2 18.533 9.267 21.38 0.001
Error 8 3.467 0.433
Total 14 46.933

IC del 95% individual


C2 Significar ---+----------+-----------+----------+--
1 8.67 (-----*-----)
2 9.00 (-----*-----)
3 10.00 (-----*-----)
4 10.33 (-----*-----)
5 12.33 (-----*-----)
---+----------+-----------+----------+--
9.0010.5012.0013.50

IC del 95% individual


C3 Significar ---+----------+-----------+----------+--
1 9.00 (-----*-----)
2 9.60 (-----*-----)
3 11.60 (----*----)
---+----------+-----------+----------+--
9.00 10.00 11.00 12.00

FIGURA 8.3.2Cuadro de diálogo de MINITAB y salida para el análisis de varianza de dos factores, Ejemplo 8.3.1.

EJERCICIOS

Para los Ejercicios 8.3.1 a 8.3.5 realice el procedimiento de prueba de hipótesis de diez pasos para el análisis de varianza.

8.3.1.El objetivo de un estudio de Brooks et al. (A-11) fue evaluar la eficacia del uso de una cocina virtual para la
formación profesional de personas con problemas de aprendizaje. Veinticuatro estudiantes participaron
EJERCICIOS 343

El Sistema SAS

Procedimiento de análisis de varianza

Dependiente Variable: DÍAS

Fuente DF Suma de cuadrados Cuadrado medio Valor F PR > F

Modelo 6 43.46666667 7.24444444 16.72 0.0004

Error 8 3.46666667 0.43333333

corregido Total 14 46.93333333

R Plaza CV MSE raíz DÍAS Media

0.926136 6.539211 0.65828059 10.06666667

Fuente DF Cuadrado medio Anova SS Valor F PR > F

GRUPO 2 18.53333333 9.26666667 21.38 0.0006


EDAD 4 24.93333333 6.23333333 14.38 0.0010

FIGURA 8.3.3SAS parcial®salida para el análisis del Ejemplo 8.3.1.

en el estudio. Cada participante realizó cuatro tareas de preparación de alimentos y se les calificó según la calidad de la
preparación. Luego, cada participante recibió capacitación vocacional regular en preparación de alimentos (capacitación real),
capacitación virtual usando una pantalla de TV y computadora de una cocina típica, capacitación con libros de trabajo con
materiales de lectura especializados y sin capacitación (para servir como control). Después de cada uno de estos
entrenamientos, los sujetos fueron evaluados en la preparación de alimentos. Las puntuaciones de mejora para cada uno de
los cuatro métodos de entrenamiento se muestran en la siguiente tabla.

Sujeto Real Virtual Libro de trabajo No


No. Capacitación Capacitación Capacitación Capacitación

1 2 10 2 -4
2 4 3 2 1
3 4 13 0 1
4 6 11 2 1
5 5 13 5 1
6 2 0 1 4
7 10 17 2 6
8 5 5 2 2
9 10 4 5 2
10 3 6 9 3
11 11 9 8 7
12 10 9 6 10
13 5 8 4 1
(Continuado)
344 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Sujeto Real Virtual Libro de trabajo No


No. Capacitación Capacitación Capacitación Capacitación

14 8 11 1 1
15 4 8 5 2
dieciséis 11 8 10 2
17 6 11 1 3
18 2 5 1 2
19 3 1 0 -3
20 7 5 0 -6
21 7 10 4 4
22 8 7 -2 8
23 4 9 3 0
24 9 6 3 5
Fuente: Datos proporcionados por cortesía de BM Brooks, Ph.D.

Después de eliminar los efectos del sujeto, ¿podemos concluir que las puntuaciones de mejora difieren entre los métodos de
entrenamiento? Dejara¼ :05.

8.3.2.McConville et al. (A-12) informan los efectos de masticar un chicle de nicotina (que contiene 2 mg de nicotina)
sobre la frecuencia de los tics en pacientes cuyo trastorno de Tourette no se controló adecuadamente con
haloperidol. Las siguientes son las frecuencias de tic bajo cuatro condiciones:

Número de tics durante un período de 30 minutos

Después del final de la masticación

Chicle 0–30 30–60


Paciente Base Masticación Minutos Minutos

1 249 108 93 59
2 1095 593 600 861
3 83 27 32 61
4 569 363 342 312
5 368 141 167 180
6 326 134 144 158
7 324 126 312 260
8 95 41 63 71
9 413 365 282 321
10 332 293 525 455
Fuente: Datos proporcionados por cortesía de Brian J. McConville, M. Harold Fogelson,
Andrew B. Norman, William M. Klykylo, Pat Z. Manderscheid, Karen W. Parker y Paul R.
Sanberg. “Potenciación de la nicotina del haloperidol en la reducción de la frecuencia de
los tics en el trastorno de Tourette”Diario Americano de Psiquiatría, 148 (1991), 793–794.
Copyright # 1991, Asociación Americana de Psiquiatría.

Después de eliminar los efectos del paciente, ¿podemos concluir que el número medio de tics difiere entre las cuatro
condiciones? Dejara¼ :01.

8.3.3.Un equipo de remotivación en un hospital psiquiátrico realizó un experimento para comparar cinco métodos para
remotivar a los pacientes. Los pacientes fueron agrupados según el nivel de motivación inicial. pacientes en cada
EJERCICIOS 345

grupo fueron asignados aleatoriamente a los cinco métodos. Al final del período experimental, los pacientes fueron
evaluados por un equipo compuesto por un psiquiatra, un psicólogo, una enfermera y un trabajador social, ninguno
de los cuales conocía el método al que habían sido asignados los pacientes. El equipo asignó a cada paciente una
puntuación compuesta como medida de su nivel de motivación. Los resultados fueron los siguientes:

Nivel de Inicial Método de remotivación


Motivación
A B C D mi

Nulo 58 68 60 68 64
Muy bajo 62 70 sesenta y cinco 80 69
Bajo 67 78 68 81 70
Promedio 70 81 70 89 74

¿Estos datos proporcionan evidencia suficiente para indicar una diferencia en las puntuaciones medias entre los métodos?
Dejar a¼ :05.

8.3.4.El supervisor de enfermería en un departamento de salud local deseaba estudiar la influencia de la hora del día en la duración de las
visitas domiciliarias del personal de enfermería. Se pensó que las diferencias individuales entre las enfermeras podrían ser
grandes, por lo que se utilizó a la enfermera como factor de bloqueo. El supervisor de enfermería recopiló los siguientes datos:

Duración de la visita domiciliaria por hora del día

Temprano Tarde Temprano Tarde


Enfermero Mañana Mañana Tarde Tarde

A 27 28 30 23
B 31 30 27 20
C 35 38 34 30
D 20 18 20 14

¿Estos datos brindan suficiente evidencia para indicar una diferencia en la duración de la visita domiciliaria entre las
diferentes horas del día? Dejara¼ :05.

8.3.5.Cuatro sujetos participaron en un experimento para comparar tres métodos para aliviar el estrés. Cada sujeto fue
colocado en una situación estresante en tres ocasiones diferentes. Cada vez se utilizó un método diferente para
reducir el estrés con el sujeto. La variable de respuesta es la cantidad de disminución en el nivel de estrés medido
antes y después de la aplicación del tratamiento. Los resultados fueron los siguientes:

Tratamiento

Sujeto A B C

1 dieciséis 26 22
2 dieciséis 20 23
3 17 21 22
4 28 29 36

¿Podemos concluir a partir de estos datos que los tres métodos difieren en efectividad? Dejara¼ :05.
346 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

8.3.6.En un estudio de Valencia et al. (A-13), los efectos de la temperatura y la humedad ambientales en el gasto
energético de 24 horas se midieron mediante calorimetría indirecta de cuerpo entero en ocho hombres
jóvenes de peso normal que usaban ropa ligera estandarizada y seguían un régimen de actividad controlada.
Los efectos de la temperatura se evaluaron mediante mediciones a 20, 23, 26 y 30 grados Celsius con
humedad ambiental ya 20 y 30 grados Celsius con humedad alta. ¿Cuál es la variable de bloqueo? ¿La
variable de tratamiento? ¿Cuántos bloques hay? ¿Cuántos tratamientos? Construya una tabla ANOVA en la
que especifique las fuentes de variabilidad y los grados de libertad para cada una. ¿Qué son las unidades
experimentales? ¿Qué variables extrañas se te ocurren cuyos efectos estarían incluidos en el término de
error?

8.3.7.Hodgson et al. (A-14) realizaron un estudio en el que indujeron la dilatación gástrica en seis perros anestesiados
mantenidos con dosis constantes de isoflurano en oxígeno. Las mediciones cardiopulmonares antes de la
distensión estomacal (línea base) se compararon con las mediciones tomadas durante 0,1, 0,5, 1,0, 1,5, 2,5 y
3,5 horas de distensión estomacal analizando el cambio desde la línea base. Después de distender el
estómago, el índice cardíaco aumentó de 1,5 a 3,5 horas. El volumen sistólico no cambió. Durante la inflación,
se observaron aumentos en la presión arterial sistémica, arterial pulmonar y auricular derecha. La frecuencia
respiratoria no se modificó. PaO2tendía a disminuir durante la dilatación gástrica. ¿Qué son las unidades
experimentales? ¿Los bloques? ¿Variable de tratamiento? ¿Variable(s) de respuesta? ¿Puedes pensar en
alguna variable extraña cuyo efecto contribuiría al término de error? Construya una tabla ANOVA para este
estudio en la que identifique las fuentes de variabilidad y especifique los grados de libertad.

8.4 EL DISEÑO DE MEDIDAS REPETIDAS

Uno de los diseños experimentales más utilizados en el campo de las ciencias de la salud es el diseño
de medidas repetidas.

DEFINICIÓN
Amedidas repetidasEl diseño es aquel en el que se realizan mediciones de la
misma variable sobre cada sujeto en dos o más ocasiones diferentes.

Las diferentes ocasiones durante las cuales se toman las medidas pueden ser puntos en el
tiempo o diferentes condiciones, como diferentes tratamientos.

Cuándo usar medidas repetidasLa motivación habitual para utilizar un diseño de


medidas repetidas es el deseo de controlar la variabilidad entre sujetos. En tal diseño,
cada sujeto sirve como su propio control. Cuando las mediciones se toman solo en dos
ocasiones, tenemos el diseño de comparaciones pareadas que analizamos en el Capítulo
7. Una de las situaciones más frecuentes en las que se usa el diseño de medidas repetidas
es la situación en la que el investigador está preocupado por las respuestas a lo largo del
tiempo. .

VentajasLa principal ventaja del diseño de medidas repetidas es, como se mencionó anteriormente,
su capacidad para controlar variaciones extrañas entre sujetos. Una ventaja adicional es el hecho de
que se necesitan menos sujetos para el diseño de medidas repetidas que
8.4 EL DISEÑO DE MEDIDAS REPETIDAS 347

por un diseño en el que se utilizan diferentes sujetos para cada ocasión en la que se realizan las
mediciones. Supongamos, por ejemplo, que tenemos cuatro tratamientos (en el sentido habitual) o
cuatro puntos en el tiempo en cada uno de los cuales nos gustaría tener 10 mediciones. Si se utiliza
una muestra diferente de sujetos para cada uno de los cuatro tratamientos o puntos en el tiempo, se
requerirían 40 sujetos. Si podemos tomar medidas sobre el mismo sujeto para cada tratamiento o
punto en el tiempo, es decir, si podemos usar un diseño de medidas repetidas, solo se requerirían 10
sujetos. Esto puede ser una ventaja muy atractiva si los sujetos son escasos o costosos de reclutar.

DesventajasUn importante problema potencial del que hay que estar alerta es lo que se
conoce comoefecto de arrastre.Cuando se evalúan dos o más tratamientos, el investigador
debe asegurarse de que la respuesta de un sujeto a un tratamiento no refleje un efecto residual
de tratamientos anteriores. Con frecuencia, este problema puede resolverse dejando suficiente
tiempo entre tratamientos.
Otro posible problema es elefecto de posiciónLa respuesta de un sujeto a un tratamiento
experimentado al final de una secuencia puede ser diferente de la respuesta que habría ocurrido si el
tratamiento hubiera sido el primero en la secuencia. En ciertos estudios, como los que involucran la
participación física de los sujetos, el entusiasmo que es alto al comienzo del estudio puede dar paso al
aburrimiento hacia el final. Una forma de evitar este problema es aleatorizar la secuencia de
tratamientos de forma independiente para cada sujeto.

Diseño de medidas repetidas de un solo factorLa medida repetida más simple


Un diseño seguro es aquel en el que, además de la variable de tratamiento, se considera
una variable adicional. La razón de introducir esta variable adicional es medir y aislar su
contribución a la variabilidad total entre las observaciones. Nos referimos a esta variable
adicional comofactor.

DEFINICIÓN
El diseño de medidas repetidas en el que se introduce un factor adicional en el
experimento se denomina diseño.Diseño unifactorial de medidas repetidas.

Nos referimos al factor adicional comoasignaturas.En el diseño unifactorial de medidas


repetidas, cada sujeto recibe cada uno de los tratamientos. El orden en que los sujetos son expuestos
a los tratamientos, cuando es posible, es aleatorio, y la aleatorización se realiza de forma
independiente para cada sujeto.

suposicionesLos siguientes son los supuestos del diseño de medidas repetidas de un solo
factor que consideramos en este texto. Un diseño en el que se cumplen estos supuestos se
denominaaditivo de efectos fijosdiseño.

1.Los sujetos en estudio constituyen una muestra aleatoria simple de una población de
sujetos similares.
2.Cada observación es una muestra aleatoria simple independiente de tamaño 1 de cada una de
laskn poblaciones, dondenortees el número de sujetos ykes el número de tratamientos a los
que se expone cada sujeto.
348 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

3.Elknlas poblaciones tienen medias potencialmente diferentes, pero todas tienen la misma
varianza.
4.Elklos tratamientos son fijos; es decir, son los únicos tratamientos sobre los que tenemos
interés en la situación actual. No deseamos hacer inferencias a una colección más grande
de tratamientos.
5.No hay interacción entre tratamientos y sujetos; es decir, el tratamiento y los efectos
del sujeto son aditivos.

Los experimentadores pueden encontrar con frecuencia que sus datos no se ajustan a los
supuestos de tratamientos fijos y/o tratamiento aditivo y efectos de sujeto. Para tales casos, se
pueden consultar las referencias al final de este capítulo como guía.
Además de las suposiciones que acabamos de enumerar, se debe tener en cuenta que en un
experimento de medidas repetidas existe la presunción de que deben existir correlaciones entre las medidas
repetidas. Es decir, las mediciones en los tiempos 1 y 2 probablemente estén correlacionadas, al igual que las
mediciones en los tiempos 1 y 3, 2 y 3, y así sucesivamente. Esto es de esperar porque las medidas se toman
en los mismos individuos a lo largo del tiempo.
Una suposición subyacente del diseño ANOVA de medidas repetidas es que todas estas
correlaciones son iguales, una condición denominadasimetría compuesta.Esta suposición, junto con la
suposición 3 sobre varianzas iguales, se conoce como esfericidad.Las violaciones de la suposición de
esfericidad pueden dar como resultado un error de tipo I inflado. La mayoría de los programas de
computadora proporcionan una prueba formal para la suposición de esfericidad junto con métodos
de estimación alternativos si se viola la suposición de esfericidad.

El modeloEl modelo para el diseño de medidas repetidas de factor único aditivo de efectos
fijos es

Xyo¼metroþbiþtjþmiyo
(8.4.1)
i¼1; 2; . . . ;norte; j¼1; 2; . . . ;k

El lector reconocerá este modelo como el modelo para el diseño de bloques completos al azar discutido en la
Sección 8.3. Los sujetos son los bloques. En consecuencia, la notación, la presentación de datos y el
procedimiento de prueba de hipótesis son los mismos que para el diseño de bloques completos al azar como
se presentó anteriormente. El siguiente es un ejemplo de un diseño de medidas repetidas.

EJEMPLO 8.4.1
Licciardona et al. (A-15) examinaron sujetos con dolor lumbar crónico e inespecífico. En este estudio,
18 de los sujetos completaron un cuestionario de encuesta que evaluaba el funcionamiento físico al
inicio y después de 1, 3 y 6 meses. La Tabla 8.4.1 muestra los datos de estos sujetos que recibieron un
tratamiento simulado que parecía ser una manipulación osteopática genuina. Los valores más altos
indican un mejor funcionamiento físico. El objetivo del experimento era determinar si los sujetos
reportarían una mejora con el tiempo a pesar de que el tratamiento que recibieron proporcionaría
una mejora mínima. Deseamos saber si hay una diferencia en los valores medios de la encuesta entre
los cuatro puntos en el tiempo.
8.4 EL DISEÑO DE MEDIDAS REPETIDAS 349

TABLA 8.4.1 Puntuaciones de salud del SF-36 en cuatro puntos


diferentes en el tiempo

Sujeto Base Mes 1 Mes 3 Mes 6

1 80 60 95 100
2 95 90 95 95
3 sesenta y cinco 55 50 45
4 50 45 70 70
5 60 75 80 85
6 70 70 75 70
7 80 80 85 80
8 70 60 75 sesenta y cinco

9 80 80 70 sesenta y cinco

10 sesenta y cinco 30 45 60
11 60 70 95 80
12 50 50 70 60
13 50 sesenta y cinco 80 sesenta y cinco

14 85 45 85 80
15 50 sesenta y cinco 90 70
dieciséis 15 30 20 25
17 10 15 55 75
18 80 85 90 70
Fuente: Datos proporcionados por cortesía de John C. Licciardone.

Solución:

1. Datos.Ver Tabla 8.4.1.


2. Supuestos.Suponemos que se cumplen los supuestos para el diseño de
medidas repetidas de factor único aditivo y efectos fijos.
3. Hipótesis.
H0:metroB¼metroMETRO1¼metroMETRO3¼metroMETRO6

HA:no todometro'son iguales

4. Estadística de prueba.V: R:¼tratamiento MS = error MS.


5. Distribución de la estadística de prueba.Fcon 4 - 1¼3 numerador grados de
libertad y 71 - 3 - 17¼51 grados de libertad en el denominador.
6. Regla de decisión.Dejara¼ :05. El valor crítico deFes 2,80 (obtenido
por interpolación). RechazarH0si el VR calculado es igual o superior
a 2,80.
7. Cálculo de la estadística de prueba.Usamos MINITAB para realizar los cálculos.
Primero ingresamos las mediciones en la Columna 1, los códigos de fila (sujeto)
en la Columna 2, los códigos de tratamiento (período de tiempo) en la Columna 3
y procedemos como se muestra en la Figura 8.4.1.
350 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Caja de diálogo: Comando de sesión:

Estadística ANOVA bidireccional MTB > DE DOS VÍAS C1 C2 C3;


SUBC > SIGNIFICA C2 C3.
TipoC1enRespuesta.TipoC2enFactor de filay comprobarMedios de
visualización.TipoC3enFactor de columnay comprobarMedios de
visualización.Hacer clicDE ACUERDO.

Producción:

ANOVA bidireccional: C1 frente a C2, C3

Análisis de Varianza para Fuente C1


DF SS EM F PAG
C2 17 20238 1190 8.20 0.000
C3 3 2396 799 5.50 0.002
Error 51 7404 145
Total 71 30038

FIGURA 8.4.1Procedimiento MINITAB y salida (tabla ANOVA) para el Ejemplo 8.4.1.

8. Decisión estadística.Desde V:R:¼5:50 es mayor que 2,80, podemos


rechazar la hipótesis nula.
9. Conclusión.Concluimos que hay una diferencia en las medias de las
cuatro poblaciones.
10pagvalor.Como 5.50 es mayor que 4.98, elFvalor pora¼ :005 y d.f.¼40,
elpagel valor es menor que .005.

Figura 8.4.2, muestra el SAS®la salida para el análisis del ejemplo 8.4.1 y la figura 8.4.3 muestra la
salida de SPSS para el mismo ejemplo. Tenga en cuenta que SPSS proporciona cuatro pruebas
potenciales. La primera prueba se utiliza bajo el supuesto de esfericidad y coincide con los resultados
de las Figuras 8.4.1 y 8.4.2. Las siguientes tres pruebas son modificaciones si se viola el supuesto de
esfericidad. Tenga en cuenta que SPSS modifica los grados de libertad para estas tres pruebas, lo que
cambia los cuadrados medios y lapagvalores, pero no el VR Tenga en cuenta que se violó el supuesto
de esfericidad para estos datos, pero que la regla de decisión no cambió, ya que todos lospagLos
valores fueron inferiores aa¼ :05. &

Diseño de medidas repetidas de dos factoresEl ANOVA de medidas repetidas es


no es útil solo para probar medias entre diferentes tiempos de observación. Los análisis se amplían
fácilmente para incluir pruebas de diferencias entre tiempos para diferentes grupos de tratamiento. Como
ejemplo, una clínica puede desear probar un tratamiento con placebo frente a un nuevo tratamiento con
medicamentos. Los investigadores asignarán aleatoriamente a los pacientes a uno de los dos grupos de
tratamiento y obtendrán mediciones a lo largo del tiempo para cada sujeto. al final se interesan
8.4 EL DISEÑO DE MEDIDAS REPETIDAS 351

El ANOVA Procedimiento

Dependiente Variable: sf36

Fuente DF Suma de cuadrados Cuadrado medio Valor F PR > F

Modelo 20 22633.33333 1131.66667 7.79 <.0001

Error 51 7404.16667 145.17974

corregido Total 71 30037.50000

R Plaza Coef Var Raíz MSE sf36 Media

0.753503 18.18725 12.04906 66.25000

Fuente DF Anova SS Media Cuadrado F Valor PR > F

sujeto 17 20237.50000 1190.44118 8.20 <.0001


tiempo 3 2395.83333 798.61111 5.50 0.0024

FIGURA 8.4.2 S.A.S.®salida para el análisis del Ejemplo 8.4.1.

Pruebas de efectos dentro de los sujetos

Medida: MEDIDA_1

Suma Tipo III Significar


Fuente de Cuadrados d.f. Cuadrado F Sig.

factor 1 Esfericidad asumida 2395.833 3 798.611 5.501 . 002


Invernadero-Geisser 2395.833 2.216 1080.998 5.501 . 006
Huynh Feldt 2395.833 2.563 934.701 5.501 . 004
Límite inferior 2395.833 1.000 2395.833 5.501 . 031

Error (factor 1) Esfericidad asumida 7404.167 51 145.180


Invernadero-Geisser 7404.167 37.677 196.515
Huynh Feldt 7404.167 43.575 169.919
Límite inferior 7404.167 17.000 435.539

FIGURA 8.4.3 Salida de SPSS para el análisis del Ejemplo 8.4.1.


352 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

en saber si había diferencias entre los dos tratamientos en sujetos que se


midieron varias veces.

suposicionesLos supuestos del diseño de medidas repetidas de dos factores son los mismos que los
del diseño de medidas repetidas de un factor. Sin embargo, no es raro que haya interacciones entre
los tratamientos en este diseño, una posible violación de la Suposición 5 anterior. Los efectos de
interacción pueden ser interesantes de examinar, pero son complejos de calcular. Por esta razón, y al
nivel de la audiencia a la que se dirige este texto, supondremos que los efectos de interacción, cuando
están presentes, se manejan matemáticamente utilizando un paquete de software estadístico que
proporciona los cálculos correctos para este problema.

El modeloEl modelo para el diseño de medidas repetidas de dos factores debe representar el
hecho de que hay dos factores,AyB,y tienen una interacción potencial. Estas características,
junto con el efecto de bloque y el error, deben tenerse en cuenta en el modelo, que viene dado
por
Xjk¼metroþryoþaiþbjþ ðabdominalesÞyoþmijk
(8.4.2)
i¼1; 2; . . . ;a; j¼1; 2; . . . ;b; k¼1; 2; . . . ;norte

en este modelo

Xjkes un individuo típico de la población total metrouna


constante desconocida ryorepresenta un efecto de bloque

ajrepresenta el efecto principal del factorA b


krepresenta el efecto principal del factorB
dabdominalesÞjkrepresenta el efecto de interacción del factorAy factorizarB

mijkes un componente residual que representa todas las fuentes de variación distintas de los tratamientos
y bloques
Este modelo es muy similar al modelo ANOVA de dos factores presentado en la Sección 8.5.

EJEMPLO 8.4.2
El Mid-Michigan Medical Center (A-16) examinó a 25 sujetos con cáncer de cuello y midió como
una de las variables de resultado un puntaje de condición de salud oral. Los pacientes fueron
divididos aleatoriamente en dos grupos de tratamiento. Estos fueron un tratamiento con
placebo (tratamiento 1) y un grupo de jugo de aloe (tratamiento 2). La salud del cáncer se midió
al inicio y al final de 2, 4 y 6 semanas de tratamiento. El objetivo era discernir si había algún
cambio en la condición de salud oral durante el transcurso del experimento y ver si había
alguna diferencia entre las dos condiciones de tratamiento.

Solución:

1. Datos.Ver Tabla 8.4.2.


2. Supuestos.Suponemos que se cumplen los supuestos para el experimento de
medidas repetidas de dos factores.
8.4 EL DISEÑO DE MEDIDAS REPETIDAS 353

TABLA 8.4.2 Puntuaciones de las condiciones de salud oral en cuatro puntos diferentes en el tiempo
bajo dos condiciones de tratamiento

Tratamiento
1¼placebo
Sujeto 2¼jugo de aloe TotalC1 TotalC2 TotalC3 TotalC4

1 1 6 6 6 7
2 1 9 6 10 9
3 1 7 9 17 19
4 1 6 7 9 3
5 1 6 7 dieciséis 13
6 1 6 6 6 11
7 1 6 11 11 10
8 1 6 11 15 15
9 1 6 9 6 8
10 1 6 4 8 7
11 1 7 8 11 11
12 1 6 6 9 6
13 1 8 8 9 10
14 1 7 dieciséis 9 10
15 2 6 10 11 9
dieciséis 2 4 6 8 7
17 2 6 11 11 14
18 2 6 7 6 6
19 2 12 11 12 9
20 2 5 7 13 12
21 2 6 7 7 7
22 2 8 11 dieciséis dieciséis

23 2 5 7 7 7
24 2 6 8 dieciséis dieciséis

25 2 7 8 10 8
Fuente: Mid-Michigan Medical Center, Midland, Michigan, 1999: Aestudio de la condición oral de los pacientes con cáncer.
Disponible en el dominio público en:http://calcnet.mth.cmich.edu/org/spss/Prj_cancer_data.htm.

3. Hipótesis.
a.H0:ai¼0 i¼1; 2; . . . ;a
Ha:no todoai¼0

b.H0:bj¼0 Ha:no j¼1; 2; . . . ;b


todobj¼0

C.H0:dabdominalesÞyo¼0 Ha:no todod i¼1; 2; . . . ;a; j¼1; 2; . . . ;b


abdominalesÞyo¼0
354 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

4. Estadística de prueba.El estadístico de prueba para cada conjunto de hipótesis es VR

5. Distribución de estadísticas de prueba.CuandoH0es verdadero y se cumplen los


supuestos, cada uno de los estadísticos de prueba se distribuye comoF.Si se
cumplen todos los supuestos para los efectos dentro de los sujetos, tendremosF
con 4 - 1¼3 grados de libertad del numerador para el factor tiempo,d4 - 1Þð2 - 1
¼3 grados de libertad del numerador para el factor de interacción, y d4 - 1Þð25 -
2¼69 grados de libertad del denominador para ambas pruebas; la interpolación
de la Tabla G proporciona una críticaFvalor de 2,74. Además, para el factor entre
sujetos, tendremosd2 - 1¼1 numerador grados de libertad y 25 - 2¼23 grados de
libertad del denominador; La tabla G da la críticaFvalor de 4,28. Si no cumplimos
con los supuestos, específicamente de esfericidad, entonces el programa de
computadora alterará los grados de libertad y por lo tanto el valor crítico para las
comparaciones.
6. Regla de decisión.Dejara¼ :05. RechazarH0si el calculadopagel valor es menor que
a.
7. Cálculo de la estadística de prueba.Utilizamos SPSS para realizar los cálculos.
Ingresamos los datos tal como se muestra en la Tabla 8.4.2, aunque no
necesitamos ingresar el número de "Asunto". El código SPSS y la salida
pertinente se muestran en la Figura 8.4.4.
8. Decisión estadística.SPSS proporciona una prueba formal de esfericidad llamada
"Prueba de esfericidad de Mauchley". Dado que rechazamos el valor nulo de esta
prueba de acuerdo con el resultado de la figura 8.4.2, utilizaremos el estadístico
de prueba "Greenhouse-Geisser". Dado que VR es mayor que el valor crítico de
TotalC, rechazamos la hipótesis nula para esta variable. Sin embargo, tanto los
valores críticos para el efecto de interacción como el factor entre sujetos son
bastante pequeños e inferiores al valor crítico necesario, por lo que no podemos
rechazar estas dos hipótesis nulas.
9. Conclusión.Llegamos a la conclusión de que no hay diferencia estadística entre los tratamientos,
pero que los sujetos tuvieron un cambio en la condición oral a través del tiempo,
independientemente del tratamiento que recibieron.

10pagvalor.Como se ve en la Figura 8.4.4, todospagse proporcionan valores para


cada prueba. Para resumir: desdepag < :001, rechazamos la hipótesis nula
sobre los cambios a través del tiempo. Desdepag¼ :931, no logramos
rechazar la hipótesis nula sobre la interacción del tiempo y el tratamiento.
Desde pag¼ :815, no logramos rechazar la hipótesis nula sobre las
diferencias entre tratamientos.

Aunque el resultado proporcionado en la Figura 8.4.2 puede ser valioso para la interpretación estadística, a
menudo es útil examinar los gráficos para obtener una interpretación visual de los resultados. La Figura 8.4.5
muestra un gráfico de medias marginales frente al tiempo, con líneas que representan cada uno de los
tratamientos. Es evidente que ocurrieron cambios en la condición oral a través del tiempo, pero que los dos
tratamientos fueron muy similares, como puede verse por la proximidad de las dos curvas. Además, es
evidente que se produjo una interacción entre el tiempo y el tratamiento, como lo demuestra el cruce de las
líneas trazadas. &
8.4 EL DISEÑO DE MEDIDAS REPETIDAS 355

Código SPSS
GLM TOTALCIN T0TALCW2 TOTALCW4 T0TALCW6 POR TRT /
WSFACTOR¼TotatC 4 Polinomio /MÉTODO¼TIPOSS(3)

/TRAMA¼PERFIL(TRT TotalCTot3lC TRT) /


EMMEDIOS¼TABLAS (TRT)
/EMMEDIOS¼TABLAS(TotalC) /
EMMEDIOS¼TABLAS(TRT TotalC) /
PR!NT¼DESCRIPTIVO
/CRITERIOS¼ALFA(.O5)
/WSDESIGN¼TotalC
/DISEÑO¼TRT.

Salida parcial de SPSS


Prueba de esfericidad de Mauchlyb

Efecto dentro de los sujetos W de Mauchly Aprox. chi-cuadrado d.f. Sig.


TotalC . 487 15.620 5 . 008

Pruebas de efectos dentro de los sujetos

Tipo 111 Suma


Fuente de Cuadrados d.f. Cuadrado medio F Sig.

TotalC Esfericidad asumida 233.391 3 77.797 13.926 . 000


Invernadero-Geisser 233.391 2.025 115.261 13.926 . 000
Huynh Feldt 233.391 2.318 100.682 13.926 . 000
Límite inferior 233.391 1.000 233.391 13.926 . 001

TotalC TRT Esfericidad asumida 1.231 3 . 410 . 073 . 974


Invernadero-Geisser 1.231 2.025 . 608 . 073 . 931
Huynh Feldt 1.231 2.318 . 531 . 073 . 949
Límite inferior 1.231 1.000 1.231 . 073 . 789

Error(TotalC) Esfericidad asumida 385.469 69 5.587


Invernadero-Geisser 385.469 46.572 8.277
Huynh Feldt 385.469 53.316 7.230
Límite inferior 385.469 23.000 16.760

Pruebas de efectos entre sujetos

Suma Tipo III


Fuente de Cuadrados d.f. Cuadrado medio F Sig.
Interceptar 7637.274 1 7637.274 382.508 . 000

TRT 1.114 1 1.114 . 056 . 815

Error 459.226 23 19.966

FIGURA 8.4.4Código SPSS y salida parcial para el Ejemplo 8.4.2.


356 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

11

10

Media marginal 9

Placebo
8
Jugo de aloe

6
Hora 1 tiempo 2 Tiempo 3 tiempo 4

Total C

FIGURA 8.4.5 Gráfica de Excel de medias marginales frente a la puntuación total de salud oral para los datos de
Ejemplo 8.4.2.

EJERCICIOS

Para los ejercicios 8.4.1 a 8.4.3 realice el procedimiento de prueba de hipótesis de diez pasos. Dejara¼ :05.

8.4.1.Uno de los propósitos de un estudio de Liu et al. (A-17) fue determinar los efectos de MRZ 2/579 sobre el déficit
neurológico en ratas Sprague-Dawley. En este estudio, se midieron 10 ratas en cuatro períodos de tiempo
después de la oclusión de la arteria carótida media y el tratamiento posterior con el no competitivoNORTE-
antagonista de metilo-D-aspartato MRZ 2/579, que estudios previos habían sugerido proporciona actividad
neuroprotectora. La variable de resultado fue una variable de función neurológica medida en una escala de 0
a 12. Un número más alto indica un mayor grado de deterioro neurológico.

Rata 60 minutos 24 horas 48 horas 72 horas

1 11 9 8 4
2 11 7 5 3
3 11 10 8 6
4 11 4 3 2
5 11 10 9 9
6 11 6 5 5
7 11 6 6 6
8 11 7 6 5
9 11 7 5 5
10 11 9 7 7
Fuente: Datos proporcionados por cortesía de Ludmila Belayev, MD

8.4.2.Almidón et al. (A-18) quería mostrar la eficacia de un manguito central de cuatro cuadrantes y un tornillo en la
reconstrucción del ligamento cruzado anterior. Los investigadores realizaron una serie de reconstrucciones en ocho
rodillas cadavéricas. La siguiente tabla muestra las cargas (en newtons) requeridas para lograr diferentes laxitudes
del injerto (mm) para siete especímenes (datos no disponibles para un espécimen) utilizando cinco pesos de carga
diferentes. La laxitud del injerto es la separación (en mm) del fémur y la tibia en los puntos de fijación del injerto.
EJERCICIOS 357

¿Existe suficiente evidencia para concluir que se requieren diferentes cargas para producir diferentes niveles de
laxitud del injerto? Dejara¼ :05.

Laxitud del injerto (mm)

Muestra 1 2 3 4 5

1 297.1 297.1 297.1 297.1 297.1


2 264.4 304.6 336.4 358.2 379.3
3 188.8 188.8 188.8 188.8 188.8
4 159.3 194.7 211.4 222.4 228.1
5 228.2 282.1 282.1 334.8 334.8
6 100.3 105.0 106.3 107.7 108.7
7 116.9 140.6 182.4 209.7 215.4

Fuente: David W. Starch, Jerry W. Alexander, Philip C. Noble, Suraj Reddy y David M. Lintner,
“Fijación de injerto de tendón de la corva de múltiples hebras con un tornillo de interferencia tibial
estándar o de cuatro cuadrantes central para la reconstrucción del ligamento cruzado anterior. ”
Revista americana de medicina deportiva, 31 (2003), 338–344.

8.4.3.Holben et al. (A-19) diseñó un estudio para evaluar la ingesta de selenio en mujeres jóvenes en los años de la pubertad.
Los investigadores estudiaron una cohorte de 16 mujeres durante tres veranos consecutivos. Una de las variables de
resultado fue la ingesta de selenio por día. Los investigadores examinaron los diarios dietéticos de los sujetos en el
transcurso de 2 semanas y luego calcularon la ingesta diaria promedio de selenio. La siguiente tabla muestra los
valores promedio diarios de ingesta de seleniodenmetrog=dÞpara las 16 mujeres en los años 1, 2 y 3 del estudio.

Sujeto Año 1 Año 2 año 3 Sujeto Año 1 Año 2 año 3

1 112.51 121.28 94.99 9 95.05 93.89 73.26


2 106.20 121.14 145.69 10 112.65 100.47 145.69
3 102.00 121.14 130.37 11 103.74 121.14 123.97
4 103.74 90.21 135.91 12 103.74 121.14 135.91
5 103.17 121.14 145.69 13 112.67 104.66 136.87
6 112.65 98.11 145.69 14 106.20 121.14 126.42
7 106.20 121.14 136.43 15 103.74 121.14 136.43
8 83.57 102.87 144.35 dieciséis 106.20 100.47 135.91

Fuente: Datos proporcionados por cortesía de David H. Holben, Ph.D. y John P. Holcomb, Ph.D.

8.4.4.Linke et al. (A-20) estudió siete perros mestizos machos. Indujeron la diabetes inyectando a los animales monohidrato de
aloxano. Los investigadores midieron la glucosa arterial (mg/gl), el lactato arterial (mmol/L), la concentración arterial
de ácidos grasos libres y lab-concentración de ácido hidroxibutírico antes de la inyección de alloxan y nuevamente en
las semanas 1, 2, 3 y 4 después de la inyección. ¿Cuál es la(s) variable(s) de respuesta? Comente el efecto de arrastre y
el efecto de posición, ya que pueden o no ser motivo de preocupación en este estudio. Construya una tabla ANOVA
para este estudio en la que identifique las fuentes de variabilidad y especifique los grados de libertad para cada una.

8.4.5.Werther et al. (A-21) examinó la concentración del factor de crecimiento endotelial vascular (VEGF) en la sangre de pacientes con
cáncer de colon. La investigación sugiere que la inhibición de VEGF puede interrumpir el crecimiento del tumor. Los
investigadores midieron la concentración de VEGF (ng/L) en 10 sujetos y encontraron una tendencia ascendente en
Concentraciones de VEGF durante el tiempo de coagulación medidas al inicio y en las horas 1 y 2. ¿Cuál es la variable
de respuesta? ¿Cuál es la variable de tratamiento? Construya una tabla ANOVA para este estudio en la que identifique
las fuentes de variabilidad y especifique los grados de libertad para cada una.
358 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

8.4.6.Yucha et al. (A-22) realizó un estudio para determinar si la experiencia de los estudiantes de enfermería que fueron asignados a un
hospital domiciliario (HH) difería de la de los tradicionalmente colocados (TP) en hospitales a lo largo de su formación en
enfermería. En la siguiente tabla se proporciona un pequeño subconjunto de datos. En este conjunto de datos, la ubicación en
el hospital es la variable entre sujetos. Ansiedad, medida por el Estado de Ansiedad de Spielberger
La escala (donde los puntajes más altos sugieren niveles más altos de ansiedad) es la variable dentro de los sujetos y se
proporciona en cuatro puntos en el tiempo durante la formación de enfermería. ¿Existe evidencia de que el nivel de ansiedad
cambió con el tiempo para estos estudiantes de enfermería? ¿Hay alguna diferencia en la ansiedad entre los que están en un
hospital domiciliario y los que están en un hospital tradicional? ¿Existe una interacción significativa entre el tipo de colocación y
la ansiedad? Dejara¼ :05.

Sujeto Colocación en hospitales ansiedad 1 ansiedad 2 ansiedad 3 ansiedad 4

1 S.S 51 33 12 31
2 S.S 50 51 50 44
3 S.S sesenta y cinco 58 45 37
4 S.S 43 40 31 51
5 S.S 67 56 50 42
6 S.S 46 69 62 46
7 S.S 29 28 28 43
8 S.S 76 69 62 60
9 S.S 66 39 47 38
10 S.S 56 46 34 31
11 TP 44 48 51 59
12 TP 44 50 54 40
13 TP 54 49 35 46
14 TP 38 38 32 37
15 TP 25 27 25 24
dieciséis TP 61 60 55 66
17 TP 42 51 42 34
18 TP 36 49 49 51
19 TP 52 63 50 64
20 TP 41 55 56 34
Fuente: Datos proporcionados por cortesía de Carolyn B. Yucha, RN, PhD, FAAN.

8.5 EL EXPERIMENTO FACTORIAL

En los diseños experimentales que hemos considerado hasta este punto, nos hemos interesado en los
efectos de una sola variable: los tratamientos. Sin embargo, es frecuente que nos interese estudiar,
simultáneamente, los efectos de dos o más variables. Nos referimos a las variables en las que
estamos interesados comofactoresEl experimento en el que dos o más factores se investigan
simultáneamente se llama experimento.experimento factorial.
Las diferentes categorías designadas de los factores se denominannivelesSupongamos, por
ejemplo, que estamos estudiando el efecto sobre el tiempo de reacción de tres dosis de algún
fármaco. Entonces, se dice que el factor de la droga ocurre en tres niveles. Supongamos que el
segundo factor de interés en el estudio es la edad, y se piensa que se deben incluir dos grupos de
edad, menores de 65 años y mayores de 65 años. Entonces tenemos dos niveles del factor edad. En
general, decimos que el factorAocurre enaniveles y factorBocurre enbniveles
8.5 EL EXPERIMENTO FACTORIAL 359

En un experimento factorial podemos estudiar no sólo los efectos de los factores individuales
sino también, si el experimento se lleva a cabo correctamente, la interacción entre los factores. Para
ilustrar el concepto de interacción, consideremos el siguiente ejemplo.

EJEMPLO 8.5.1
Supongamos, en términos del efecto sobre el tiempo de reacción, que se conoce la verdadera relación entre
tres niveles de dosificación de algún fármaco y la edad de los sujetos humanos que toman el fármaco.
Supongamos además que la edad se presenta en dos niveles: “jóvenes” (menores de 65 años) y “viejos” (65
años o más). Si se conoce la verdadera relación entre los dos factores, sabremos, para los tres niveles de
dosificación, el efecto medio sobre el tiempo de reacción de los sujetos en los dos grupos de edad.
Supongamos que el efecto se mide en términos de reducción del tiempo de reacción a algún estímulo.
Suponga que estos medios son los que se muestran en la Tabla 8.5.1.
Deben tenerse en cuenta las siguientes características importantes de los datos de la Tabla 8.5.1.

1.Para ambos niveles de factorAla diferencia entre las medias de dos niveles cualesquiera de factor
Bes el mismo. Es decir, para ambos niveles de factorA,la diferencia entre medias para los
niveles 1 y 2 es 5, para los niveles 2 y 3 la diferencia es 10, y para los niveles 1 y 3 la diferencia
es 15.
2.Para todos los niveles de factorBla diferencia entre las medias de los dos niveles de factorA
es el mismo. En el presente caso, la diferencia es 5 en los tres niveles de factorB.
3.Una tercera característica se revela cuando los datos se grafican como en la Figura 8.5.1. Observamos
que las curvas correspondientes a los diferentes niveles de un factor son todas paralelas.

Cuando los datos de población poseen las tres características enumeradas anteriormente, decimos que no hay
interacción presente.

TABLA 8.5.1 Reducción media en el tiempo de reacción


(milisegundos) de sujetos en dos grupos de edad en tres
niveles de dosificación de fármacos

FactorB-Dosis de drogas

FactorA-Edad j¼1 j¼2 j¼3

Jovendi¼1Þ metro11¼5 metro12¼10 metro13¼20

Viejodi¼2Þ metro21¼10 metro22¼15 metro23¼25

30 Edad 30 dosis de drogas


Reducción del tiempo de reacción

Reducción del tiempo de reacción

25 a2 25 b3
20 a1 20
15 15 b2
10 10 b1
5 5
0 0
b1 b2 b3 a1 a2
dosis de drogas Edad
FIGURA 8.5.1 Efectos de la edad y de las drogas, sin interacción presente.
360 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

TABLA 8.5.2 Datos de la Tabla 8.5.1 alterados para mostrar el


efecto de un tipo de interacción

FactorB-Dosis de drogas

FactorA-Edad j¼1 j¼2 j¼3

Jovendi¼1Þ metro11¼5 metro12¼10 metro13¼20

Viejodi¼2Þ metro21¼15 metro22¼10 metro23¼5

30 30
Reducción del tiempo de reacción

Reducción del tiempo de reacción


Edad
25 25
20 a1 20 dosis de drogas

15 15 b1
10 10 b2
5 a2 5 b3
0 0
b1 b2 b3 a1 a2
dosis de drogas Edad
FIGURA 8.5.2 Efectos de la edad y de las drogas, interacción presente.

La presencia de interacción entre dos factores puede afectar las características de los datos en
una variedad de formas dependiendo de la naturaleza de la interacción. Ilustramos el efecto de un
tipo de interacción alterando los datos de la Tabla 8.5.1 como se muestra en la Tabla 8.5.2.
Las características importantes de los datos de la Tabla 8.5.2 son las siguientes.

1.La diferencia entre las medias de dos niveles cualesquiera de factorBno es igual para ambos
niveles del factor A. Lo observamos en la Tabla 8.5.2. por ejemplo, que la diferencia entre los
niveles 1 y 2 del factorBes -5 para el grupo de edad joven yþ5 para el grupo de la tercera edad.
2.La diferencia entre las medias de ambos niveles del factor A no es la misma en todos los niveles
del factorB.Las diferencias entre factoresAlas medias son -10, 0 y 15 para los niveles 1, 2 y 3,
respectivamente, del factorB.
3.Las curvas de nivel de los factores no son paralelas, como se muestra en la Figura 8.5.2.

Cuando los datos de población exhiben las características ilustradas en la Tabla 8.5.2 y la
Figura 8.5.2, decimos que hay interacción entre los dos factores. Hacemos hincapié en que el
tipo de interacción ilustrado por el presente ejemplo es sólo uno de los muchos tipos de
interacción que pueden ocurrir entre dos factores. &

En resumen, entonces, podemos decir quehay interacción entre dos factores si un


cambio en uno de los factores produce un cambio en la respuesta en un nivel del otro factor
diferente del producido en otros niveles de este factor.

VentajasLas ventajas del experimento factorial incluyen lo siguiente.


1.Se puede estudiar la interacción de los factores.
2.Hay un ahorro de tiempo y esfuerzo.
8.5 EL EXPERIMENTO FACTORIAL 361

En el experimento factorial todas las observaciones pueden usarse para estudiar los
efectos de cada uno de los factores bajo investigación. La alternativa, cuando se investigan dos
factores, sería realizar dos experimentos diferentes, uno para estudiar cada uno de los dos
factores. Si se hiciera esto, algunas de las observaciones darían información solo sobre uno de
los factores, y el resto daría información solo sobre el otro factor. Para lograr el nivel de
precisión del experimento factorial, se necesitarían más unidades experimentales si los factores
se estudiaran a través de dos experimentos. Se ve, entonces, que 1 experimento de dos
factores es más económico que 2 experimentos de un factor.
3.Debido a que los diversos factores se combinan en un experimento, los resultados tienen un rango de
aplicación más amplio.

El diseño completamente aleatorizado de dos factoresun factorial


El arreglo se puede estudiar con cualquiera de los diseños que se han discutido.
Ilustramos el análisis de un experimento factorial mediante un diseño completamente al
azar de dos factores.

1. Datos.Los resultados de un diseño completamente aleatorizado de dos factores se pueden presentar en forma
tabular como se muestra en la Tabla 8.5.3.
Aquí tenemosaniveles de factoruna, bniveles de factorB,ynorteobservaciones para cada
combinación de niveles. Cada una de lasabdominalescombinaciones de niveles de factorAcon niveles
de factorBes un tratamiento Además de los totales y las medias que se muestran en la Tabla 8.5.3,
observamos que el total y la media de losyolas celdas son

X
norte

Tij-¼ Xjk y - Xij-¼Tij-=n


k¼1

TABLA 8.5.3 Tabla de datos de muestra de un experimento


completamente aleatorizado de dos factores

FactorB

FactorA 1 2 ... b Totales Medio

1 X111 X121 ... X 1b1


..
... . ... ... T1:: X-1::
X11norte X12norte ... X1mil millones

2 X2.11 X221 ... X2b1


.. ..
. ... ... T2:: X-2::
X21norte X22norte ... X2.mil millones

.. ..
... ... ... ... ... .

a Xa11 Xa.21 ... Xabdominales1

.. .. ..
... . . Ta:: X-a::
Xa1norte Xa2norte ... Xabn

Totales T:1: T:2: ... T:b: T...

Medio X-:1: X-:2: ... X-:b: X-...


362 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

respectivamente. el subíndiceiva de 1 aayjva de 1 ab.El número total de


observaciones escoger.
Para mostrar que la Tabla 8.5.3 representa datos de un diseño completamente aleatorizado,
consideramos que cada combinación de niveles de factor es un tratamiento y que tenemosnorte
observaciones para cada tratamiento. Se obtendría un arreglo alternativo de los datos enumerando
las observaciones de cada tratamiento en una columna separada. La tabla 8.5.3 también se puede
usar para mostrar datos de un diseño de bloques aleatorizados de dos factores si consideramos que
la primera observación en cada celda pertenece al bloque 1, la segunda observación en cada celda
pertenece al bloque 2, y así sucesivamente. elenésimoobservación en cada celda, que puede ser
considerada como perteneciente al bloquenorte.
Tenga en cuenta la similitud de la visualización de datos para el experimento factorial como se
muestra en la Tabla 8.5.3 con la visualización de datos de bloques completos aleatorios de la Tabla
8.3.1. El experimento factorial, para que el experimentador pueda probar la interacción, requiere al
menos dos observaciones por celda, mientras que el diseño de bloques completos al azar requiere
solo una observación por celda. Usamos el análisis de varianza de dos vías para analizar los datos de
un experimento factorial del tipo que se presenta aquí.

2. Supuestos.Asumimos un modelo de efectos fijos y un diseño completamente aleatorizado


de dos factores. Para una discusión de otros diseños, consulte las referencias al final de
este capítulo.

El modeloEl modelo de efectos fijos para el diseño completamente aleatorizado de dos factores
se puede escribir como

Xjk¼metroþaiþbjþ ðabdominalesÞyoþmijk
(8.5.1)
i¼1; 2; . . . ;a; j¼1; 2; . . . ;b; k¼1; 2; . . . ;norte

dóndeXjkes una observación típica,metroes una constante,airepresenta un efecto debido al factorA,bj


representa un efecto debido al factorB,dabdominalesÞyorepresenta un efecto debido a la
interacción de factoresAyB,ymijkrepresenta el error experimental.

Supuestos del Modelo


a.Las observaciones en cada uno de losabdominalesLas celdas constituyen una muestra aleatoria
independiente de tamañonorteextraída de la población definida por la combinación particular de los
niveles de los dos factores.

b.Cada una de lasabdominaleslas poblaciones se distribuyen normalmente.

C.Todas las poblaciones tienen la misma varianza.

3. Hipótesis. Se pueden probar las siguientes hipótesis:


a.H0:ai¼0 HA:no i¼1; 2; . . . ;a
todoai¼0
b.H0:bj¼0 HA:no j¼1; 2; . . . ;b
todobj¼0
C.H0:dabdominalesÞyo¼0 HA:no todo i¼1; 2; . . . ;a; j¼1; 2; . . . ;b
dabdominalesÞyo¼0
8.5 EL EXPERIMENTO FACTORIAL 363

Antes de recopilar datos, los investigadores pueden decidir probar solo una de las
hipótesis posibles. En este caso, seleccionan la hipótesis que desean probar, eligen un nivel de
significanciaa,y proceda de la manera familiar y directa. Este procedimiento está libre de las
complicaciones que surgen si los investigadores desean probar las tres hipótesis.
Cuando se prueban las tres hipótesis, la situación se complica por el hecho de que las tres
pruebas no son independientes en el sentido probabilístico. si dejamosaser el nivel de significancia
asociado con la prueba como un todo, ya0;a00;ya000los niveles de significación asociados con las
hipótesis 1, 2 y 3, respectivamente, encontramos

un <1 -d1 -a0Þð1 -a00Þð1 -a000Þ (8.5.2)

Sia0¼a00¼a000¼ :05, entoncesun <1 -d:95Þ3, oun < :143. Esto significa que la probabilidad de
rechazar una o más de las tres hipótesis es menor que .143 cuando se ha elegido un nivel de
significación de .05 para las hipótesis y todas son verdaderas. Para demostrar el procedimiento de
prueba de hipótesis para cada caso, realizamos las tres pruebas. El lector, sin embargo, debe ser
consciente del problema que implica la interpretación de los resultados.

4. Estadística de prueba.El estadístico de prueba para cada conjunto de hipótesis es VR

5. Distribución de la estadística de prueba.CuandoH0es verdadero y se cumplen los supuestos, cada uno de los
estadísticos de prueba se distribuye comoF.

6. Regla de decisión.RechazarH0si el valor calculado del estadístico de prueba es igual o


mayor que el valor crítico deF.
7. Cálculo de la estadística de prueba.Mediante una adaptación del procedimiento utilizado en la partición
de la suma total de cuadrados para el diseño completamente al azar, se puede demostrar que la
suma total de cuadrados bajo el presente modelo se puede dividir en dos partes de la siguiente
manera:

XaX bX norte

2
XaX bX norte-
-X aX bX norte
- -2
dXjk- -X . . . Þ ¼ - Xij-- -X... 2þ Xjk- -X ij-
i¼1j¼1k¼1 i¼1j¼1k¼1 i¼1j¼1k¼1

(8.5.3)

o
acero inoxidable¼SSTrþSSE (8.5.4)

La suma de los cuadrados de los tratamientos se puede dividir en tres partes de la siguiente manera:

XaX bX norte-
-X aX bX norte

- Xyo- -X. . . 2¼ d-Xi::- -X. .2. Þ


i¼1j¼1k¼1 i¼1j¼1k¼1
XabXX norte-
-
þ - X:j:- -X. .2. (8.5.5)
i¼1j¼1k¼1
XaX bX norte-
-2
þ - Xij-- -Xi::- -X:j:þ -X . . .
i¼1j¼1k¼1
364 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

TABLA 8.5.4 Tabla de análisis de varianza para un experimento completamente


aleatorizado de dos factores (modelo de efectos fijos)

Fuente SS d.f. EM realidad virtual

A SSA a -1 MSA¼SSA=da -1Þ MSB¼ MSA=MSE


B SSB b -1 SSB=db -1Þ MSAB¼SSAB=d MSB=MSE
AB SSAB da -1Þðb -1Þ a -1Þðb -1Þ MSAB=MSE
Tratos SSTr ab-1
Residual SSE abdominalesdn-1Þ MSE¼SSE=abdn-1Þ

Total acero inoxidable abn-1

o
SSTr¼SSAþSSBþSSAB

La tabla ANOVALos resultados de los cálculos para el modelo de efectos fijos para un experimento
completamente aleatorizado de dos factores pueden, en general, mostrarse como se muestra en la
Tabla 8.5.4.

8. Decisión estadística.Si las suposiciones establecidas anteriormente son verdaderas, y si


cada hipótesis es verdadera, se puede demostrar que cada uno de los cocientes de
varianza que se muestran en la Tabla 8.5.4 sigue unFdistribución con los grados de
libertad indicados. rechazamosH0si los valores VR calculados son iguales o mayores que
los valores críticos correspondientes determinados por los grados de libertad y los
niveles de significancia elegidos.
9. Conclusión.si rechazamosH0, concluimos queHAes verdad. Si fallamos en rechazarH0,
concluimos queH0puede ser verdad.
10pagvalor.

EJEMPLO 8.5.2
En un estudio sobre la duración de las visitas domiciliarias individuales por parte de enfermeras de salud pública, se
informaron datos sobre la duración de la visita domiciliaria, en minutos, por una muestra de 80 enfermeras. También
se registró la edad de cada enfermera y el tipo de enfermedad de cada paciente visitado. Los investigadores
deseaban obtener de su investigación respuestas a las siguientes preguntas:

1.¿La duración media de la visita domiciliaria difiere entre los diferentes grupos de edad de las enfermeras?

2.¿El tipo de paciente afecta la duración media de la visita domiciliaria?


3.¿Existe interacción entre la edad de la enfermera y el tipo de paciente?

Solución:

1. Datos.Los datos sobre la duración de la visita domiciliaria que se obtuvieron durante el


estudio se muestran en la Tabla 8.5.5.
8.5 EL EXPERIMENTO FACTORIAL 365

TABLA 8.5.5 Duración de la visita domiciliaria en minutos de las enfermeras de salud pública por
grupo de edad de la enfermera y tipo de paciente

FactorB (Grupo de edad de la enfermera) Niveles

FactorA
(Tipo de Paciente) 1 2 3 4
Niveles (20 a 29) (30 a 39) (40 a 49) (50 y más)

1 (cardiaco) 20 25 24 28
25 30 28 31
22 29 24 26
27 28 25 29
21 30 30 32

2 (Cáncer) 30 30 39 40
45 29 42 45
30 31 36 50
35 30 42 45
36 30 40 60

3 (CVA) 31 32 41 42
30 35 45 50
40 30 40 40
35 40 40 55
30 30 35 45

4 (tuberculosis) 20 23 24 29
21 25 25 30
20 28 30 28
20 30 26 27
19 31 23 30

2. Supuestos.Para analizar estos datos, asumimos un modelo de efectos fijos y un


diseño completamente aleatorizado de dos factores.
3. Hipótesis.Para nuestro ejemplo ilustrativo, podemos probar las siguientes
hipótesis sujetas a las condiciones mencionadas anteriormente.

a.H0:a1¼a2¼a3¼a4¼0 HA:no todoai¼0 HA:no


b.H0:b1¼b2¼b3¼b4¼0 todobj¼0 HA:no todod
C.H0:tododabdominalesÞyo¼0 abdominalesÞyo¼0

Dejara¼ :05

4. Estadística de prueba.El estadístico de prueba para cada conjunto de hipótesis es VR

5. Distribución de la estadística de prueba.CuandoH0es verdadero y se cumplen los supuestos,


cada uno de los estadísticos de prueba se distribuye comoF.
366 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

6. Regla de decisión.RechazarH0si el valor calculado del estadístico de prueba es igual


o mayor que el valor crítico deF.Los valores críticos deFpara probar las tres
hipótesis de nuestro ejemplo ilustrativo son 2.76, 2.76 y 2.04, respectivamente.
Dado que los grados de libertad del denominador iguales a 64 no se muestran en
la Tabla G del Apéndice, se usó 60 como grados de libertad del denominador.

7. Cálculo de la estadística de prueba.Usamos MINITAB para realizar


los cálculos. Ponemos las medidas en la Columna 1, la fila (factor
A)códigos en la Columna 2, y la columna (factorB)códigos en la Columna 3. El
contenido de la columna resultante se muestra en la Tabla 8.5.6. La salida de
MINITAB se muestra en la Figura 8.5.3.

TABLA 8.5.6 Contenido de columna para cálculos MINITAB, ejemplo 8.5.2

Fila C1 C2 C3 Fila C1 C2 C3

1 20 1 1 41 31 3 1
2 25 1 1 42 30 3 1
3 22 1 1 43 40 3 1
4 27 1 1 44 35 3 1
5 21 1 1 45 30 3 1
6 25 1 2 46 32 3 2
7 30 1 2 47 35 3 2
8 29 1 2 48 30 3 2
9 28 1 2 49 40 3 2
10 30 1 2 50 30 3 2
11 24 1 3 51 41 3 3
12 28 1 3 52 45 3 3
13 24 1 3 53 40 3 3
14 25 1 3 54 40 3 3
15 30 1 3 55 35 3 3
dieciséis 28 1 4 56 42 3 4
17 31 1 4 57 50 3 4
18 26 1 4 58 40 3 4
19 29 1 4 59 55 3 4
20 32 1 4 60 45 3 4
21 30 2 1 61 20 4 1
22 45 2 1 62 21 4 1
23 30 2 1 63 20 4 1
24 35 2 1 64 20 4 1
25 36 2 1 sesenta y cinco 19 4 1
26 30 2 2 66 23 4 2
27 29 2 2 67 25 4 2
28 31 2 2 68 28 4 2
(Continuado)
8.5 EL EXPERIMENTO FACTORIAL 367

Fila C1 C2 C3 Fila C1 C2 C3

29 30 2 2 69 30 4 2
30 30 2 2 70 31 4 2
31 39 2 3 71 24 4 3
32 42 2 3 72 25 4 3
33 36 2 3 73 30 4 3
34 42 2 3 74 26 4 3
35 40 2 3 75 23 4 3
36 40 2 4 76 29 4 4
37 45 2 4 77 30 4 4
38 50 2 4 78 28 4 4
39 45 2 4 79 27 4 4
40 60 2 4 80 30 4 4

8. Decisión estadística. Las relaciones de varianza son V:R:dA¼997:5=


14:7¼67:86, V:R:dB¼400:4=14:7¼27:24, y V:R:dAB¼ 67:6 = 14:7¼4:60.
Dado que los tres valores calculados de VR. son todos mayores que los
valores críticos correspondientes, rechazamos las tres hipótesis nulas.

9. Conclusión.CuandoH0:a1¼a2¼a3¼a4se rechaza, concluimos que existen


diferencias entre los niveles deA,es decir, diferencias en el tiempo promedio
dedicado a las visitas domiciliarias con diferentes tipos de pacientes. Del
mismo modo, cuandoH0:b1¼b2¼b3¼b4se rechaza, concluimos que existen
diferencias entre los niveles deB,o diferencias en el tiempo medio dedicado
a las visitas domiciliarias entre las diferentes enfermeras agrupadas por
edad. CuandoH0:dabdominalesÞyo¼0 es rechazado, concluimos que los
factoresAyBinteractuar; es decir, diferentes combinaciones de niveles de los
dos factores producen efectos diferentes.
10pagvalor.Como 67.86, 27.24 y 4.60 son todos mayores que los valores críticos deF:995
para los grados de libertad apropiados, lapagvalor para cada una de las pruebas
es inferior a .005. Cuando se rechaza la hipótesis de no interacción, el interés en
los niveles de los factoresAyBpor lo general se subordinan al interés en los
efectos de interacción. En otras palabras, estamos más interesados en aprender
qué combinaciones de niveles son significativamente diferentes.

La Figura 8.5.4 muestra el SAS®salida para el análisis del Ejemplo 8.5.2. &

Hemos tratado solo el caso en el que el número de observaciones en cada celda es el mismo.
Cuando el número de observaciones por celda no es el mismo para todas las celdas, el análisis
se vuelve más complejo.
En tales casos se dice que el diseño está desequilibrado. Para analizar estos diseños con
MINITAB usamos el procedimiento lineal general (GLM). Otros paquetes de software como SAS®
también acomodará tamaños de celda desiguales.
368 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Caja de diálogo: Comando de sesión:

Estadística ANOVA bidireccional MTB > DE DOS VÍAS C1 C2 C3;


SUBC > SIGNIFICA C2 C3.
TipoC1enRespuesta.TipoC2enFactor de filay comprobarMedios de
visualización.TipoC3enFactor de columnay comprobarMedios de
visualización.Hacer clicDE ACUERDO.

Producción:

ANOVA bidireccional: C1 frente a C2, C3

Análisis de Varianza para Fuente C1


DF SS EM F PAG
C2 3 2992.4 997.483 67.94 0.000
C3 3 1201.1 400.350 27.27 0.000
Interacción 9 608.5 67.606 4.60 0.000
Error 64 939.6 14.681
Total 79 5741.5

IC del 95% individual


C2 Significar -+----------+----------+----------+---------
1 26.70 - + (----*-- -)
2 38.25 (----*---)
3 38.30 (----*---)
4 25.45 (----*---)
-+----------+----------+----------+----------+
24.0028.0032.0036.0040.00

IC del 95% individual


C3 Significar ------+----------+----------+----------+----
1 27.85 - - (----*-- -)
2 29.80 (----*---)
3 32.95 (----*---)
4 38.10 (----*---)
------+----------+----------+----------+-----
28.00 31.50 35.00 38.50

FIGURA 8.5.3Procedimiento MINITAB y tabla ANOVA para el Ejemplo 8.5.2.


EJERCICIOS 369

El Sistema SAS

Procedimiento de análisis de varianza

Dependiente Variable: TIEMPO

Fuente DF Sumade Cuadrícula Significar Cuadrado F Valor PR F

Modelo 15 4801.95000000 320.13000000 21.81 0.0001

Error 64 939.60000000 14.68125000

corregido Total 79 5741.55000000

R Plaza CV MSE raíz TIEMPO Promedio

0.836351 11.90866 3.83161193 32.17500000

Fuente DF Anova SS Cuadrado medio F Valor PR F

FACTORB 3 1201.05000000 400.35000000 27.27 0.0001


FACTORA 3 2992.45000000 997.48333333 67.94 0.0001
FACTORB*FACTORA 9 608.450000000 67.60555556 4.60 0.0001

FIGURA 8.5.4S.A.S.®salida para el análisis del Ejemplo 8.5.2.

EJERCICIOS

Para los Ejercicios 8.5.1 a 8.5.4, realice el análisis de varianza, pruebe las hipótesis apropiadas en el .
05 nivel de significación, y determinar elpagvalor asociado a cada prueba.

8.5.1.Uryu et al. (A-23) estudió el efecto de tres dosis diferentes de troglitazonadmetroMETROÞsobre la muerte de las células
neurológicas. La muerte celular provocada por un accidente cerebrovascular se debe en parte a la acumulación de
altas concentraciones de glutamato. Los investigadores querían determinar si diferentes dosis de troglitazona (1.3,
4.5 y 13:5metroM) y diferentes formas de ionesd-yþÞde LY294002, un inhibidor de la PI3-quinasa, daría diferentes
niveles de neuroprotección. Se estudiaron cuatro ratas con cada dosis y nivel de iones, y la variable medida es el
porcentaje de muerte celular en comparación con el glutamato. Por lo tanto, un valor más alto implica menos
neuroprotección. Los resultados se muestran en la siguiente tabla.

Porcentaje comparado troglitazona


al glutamato - LY294002 frente aþLY294002 Dosis (metroMETRO)

73.61 Negativo 1.3


130.69 Negativo 1.3
118.01 Negativo 1.3
140.20 Negativo 1.3
(Continuado)
370 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Porcentaje comparado troglitazona


al glutamato - LY294002 frente aþLY294002 DosisdmetroMETROÞ

97.11 Positivo 1.3


114.26 Positivo 1.3
120.26 Positivo 1.3
92.39 Positivo 1.3
26.95 Negativo 4.5
53.23 Negativo 4.5
59.57 Negativo 4.5
53.23 Negativo 4.5
28.51 Positivo 4.5
30.65 Positivo 4.5
44.37 Positivo 4.5
36.23 Positivo 4.5
- 8:83 Negativo 13.5
25.14 Negativo 13.5
20.16 Negativo 13.5
34.65 Negativo 13.5
- 35:80 Positivo 13.5
- 7:93 Positivo 13.5
- 19:08 Positivo 13.5
5.36 Positivo 13.5
Fuente: Datos proporcionados por cortesía de Shigeko Uryu.

8.5.2.Los investigadores de un centro de trauma deseaban desarrollar un programa para ayudar a las víctimas de trauma con daño cerebral
recuperar un nivel aceptable de independencia. Se realizó un experimento en el que participaron 72
sujetos con el mismo grado de daño cerebral. El objetivo fue comparar diferentes combinaciones de
tratamiento psiquiátrico y fisioterapia. Cada sujeto fue asignado a una de 24 combinaciones
diferentes de cuatro tipos de tratamiento psiquiátrico y seis programas de fisioterapia. Había tres
sujetos en cada combinación. La variable de respuesta es el número de meses transcurridos entre el
inicio de la terapia y el momento en que el paciente pudo funcionar de forma independiente. Los
resultados fueron los siguientes:

Físico Tratamiento psiquiatrico


Programa de Terapia A B C D

11.0 9.4 12.5 13.2


I 9.6 9.6 11.5 13.2
10.8 9.6 10.5 13.5
10.5 10.8 10.5 15.0
Yo 11.5 10.5 11.8 14.6
12.0 10.5 11.5 14.0
12.0 11.5 11.8 12.8
tercero 11.5 11.5 11.8 13.7
11.8 12.3 12.3 13.1
(Continuado)
EJERCICIOS 371

Físico Tratamiento psiquiatrico


Programa de Terapia A B C D

11.5 9.4 13.7 14.0


IV 11.8 9.1 13.5 15.0
10.5 10.8 12.5 14.0
11.0 11.2 14.4 13.0
V 11.2 11.8 14.2 14.2
10.0 10.2 13.5 13.7
11.2 10.8 11.5 11.8
VI 10.8 11.5 10.2 12.8
11.8 10.2 11.5 12.0

¿Se puede concluir sobre la base de estos datos que los diferentes programas de tratamiento psiquiátrico
tienen efectos diferentes? ¿Se puede concluir que los programas de fisioterapia difieren en efectividad? ¿Se
puede concluir que existe interacción entre los programas de tratamiento psiquiátrico y los programas de
fisioterapia? Dejara¼ :05 por cada prueba.

Los ejercicios 8.5.3 y 8.5.4 son opcionales ya que tienen tamaños de celda desiguales. Se recomienda que los datos
para estos se analicen utilizando SAS.®o algún otro paquete de software que acepte tamaños de celda desiguales.

8.5.3.Principal et al. (A-24) afirman: “El dolor de cabeza primario es una condición muy común y que las
enfermeras encuentran en muchos entornos de atención diferentes. Sin embargo, hay una falta
de evidencia sobre si los consejos dados a los pacientes son efectivos y qué mejoras se pueden
esperar en las condiciones”. Los investigadores evaluaron la frecuencia de los dolores de
cabeza al principio y al final del estudio en 19 sujetos de un grupo de intervención (tratamiento
1) y 25 sujetos en un grupo de control (tratamiento 2). Los sujetos del grupo de intervención
recibieron educación sanitaria de una enfermera, mientras que el grupo de control no recibió
educación. En los 6 meses entre la evaluación previa y posterior, los sujetos mantuvieron un
diario de dolor de cabeza. La siguiente tabla da como variable de respuesta la diferencia (pre –
post) en la frecuencia de dolores de cabeza durante los 6 meses para dos factores:

Cambiar en Cambiar en
Frecuencia de Sufridor de migraña Frecuencia de Sufridor de migraña
dolores de cabeza (1 = No, 2 = Sí) Tratamiento dolores de cabeza (1 = No, 2 = Sí) Tratamiento

-2 1 1 -3 2 2
2 2 1 -6 2 2
33 1 1 11 1 2
-6 2 1 64 1 2
6 2 1 sesenta y cinco 1 2
98 1 1 14 1 2
2 2 1 8 1 2
6 2 1 6 2 2
(Continuado)
372 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Cambiar en Cambiar en
Frecuencia de Sufridor de migraña Frecuencia de Sufridor de migraña
dolores de cabeza (1 = No, 2 = Sí) Tratamiento dolores de cabeza (1 = No, 2 = Sí) Tratamiento

33 1 1 14 1 2
-7 2 1 - 11 2 2
-1 2 1 53 1 2
- 12 2 1 26 2 2
12 1 1 3 1 2
64 1 1 15 1 2
36 2 1 3 1 2
6 2 1 41 1 2
4 2 1 dieciséis 1 2
11 2 1 -4 2 2
0 2 1 -6 2 2
9 1 2
9 2 2
-3 2 2
9 2 2
3 1 2
4 2 2
Fuente: Datos proporcionados por cortesía de A. Main, H. Abu-Saad, R. Salt, l. Vlachonikolis, y A. Dowson, "Manejo por parte de enfermeras de la cefalea
primaria: un estudio piloto"Opinión de investigación médica actual, 18 (2002), 471–478.

¿Se puede concluir sobre la base de estos datos que existe una diferencia en la reducción de la frecuencia del dolor de
cabeza entre los grupos de control y tratamiento? ¿Se puede concluir que hay una diferencia en la reducción de la
frecuencia del dolor de cabeza entre los que sufren de migraña y los que no la padecen? ¿Se puede concluir que
existe una interacción entre los tratamientos y el estado de la migraña? Dejara¼ :05 por cada prueba.

8.5.4.El propósito de un estudio de Porcellini et al. (A-25) fue estudiar la diferencia en la respuesta de las células CD4
en pacientes que tomaban terapia antirretroviral altamente activa (TARGA, tratamiento 1) y pacientes que
tomaban TARGA más interleucina intermitente (IL-2, tratamiento 2). Otro factor de interés fue el VIH-
Recuento de ARN en plasma al inicio del estudio. Los sujetos se clasificaron como con menos de 50 copias/ml (plasma
1) o con 50 o más copias/ml (plasma 2). La variable de resultado es el cambio porcentual en el recuento de células T
CD4 desde el inicio hasta los 12 meses de tratamiento. ¿Se puede concluir que hay una diferencia en el cambio
porcentual en el recuento de células T CD4 entre los dos tratamientos? Los resultados se muestran en la siguiente
tabla. ¿Se puede concluir que existe una diferencia en el porcentaje de cambio en el recuento de células T CD4 entre
quienes tienen menos de 50/ml de copias plasmáticas de ARN del VIH y quienes no las tienen? ¿Se puede concluir que
existe interacción entre los tratamientos y los niveles plasmáticos? Dejara¼ :05 por cada prueba.

Cambio porcentual en células T CD4 Tratamiento Plasma

- 12:60 1 1
- 14:60 2 1
28.10 2 1
(Continuado)
8.6 RESUMEN 373

Cambio porcentual en células T CD4 Tratamiento Plasma

77.30 1 1
- 0:44 1 1
50.20 1 1
48.60 2 2
86.20 2 2
205.80 1 2
100.00 1 2
34.30 1 2
82.40 1 2
118.30 1 2
Fuente: Datos proporcionados por cortesía de Simona Porcellini, Guiliana
Vallanti, Silvia Nozza, Guido Poli, Adriano Lazzarin, Guiseppe Tabussi y
Antonio Grassia, “Improved Thymopoietic Potential in Aviremic HIV
Infected Individuals with HAART by Intermittent IL-2 Administration,”SIDA,
17 (2003), 1621–1630.

8.5.5.Un estudio de G-orecka et al. (A-26) evaluaron la forma en que, entre los fumadores de mediana edad, el
diagnóstico de limitación del flujo aéreo (LA) combinado con el consejo de dejar de fumar influye en la tasa
de abandono del hábito tabáquico. Sus preocupaciones eran si tener AL, si el sujeto dejó de fumar con éxito y
si la interacción entre AL y el tabaquismo eran factores significativos con respecto a
a variables basales y variables de capacidad pulmonar al final del estudio. Algunas de las variables de interés
fueron los años previos de tabaquismo (paquete años), la edad en que el sujeto comenzó a fumar por
primera vez, el volumen espiratorio forzado en un segundodVEF1Þ,y capacidad vital forzada (FVC). Hubo 368
sujetos en el estudio. ¿Cuáles son los factores en este estudio? ¿A cuántos niveles ocurre cada uno? ¿Quiénes
son los sujetos? ¿Cuál es (son) la(s) variable(s) de respuesta? ¿Puedes pensar en alguna variable extraña cuyos
efectos estén incluidos en el término de error?

8.5.6.Un estudio de Meltzer et al. (A-27) examinó la respuesta a 5 mg de desloratadina, un antagonista del receptor H1, en
pacientes con alergias estacionales. Durante la temporada de alergias de otoño, 172 sujetos fueron asignados
aleatoriamente para recibir tratamientos de desloratadina y 172 fueron asignados aleatoriamente para recibir
un placebo Los sujetos tomaron la medicación durante 2 semanas, después de lo cual se calcularon los cambios en la
puntuación de los síntomas nasales. Se notó una reducción significativa en el grupo de tratamiento en comparación con el
grupo de placebo, pero el género no fue un factor significativo. ¿Cuáles son los factores en el estudio? ¿A cuántos niveles ocurre
cada uno? ¿Cuál es la variable de respuesta?

8.6 RESUMEN

El propósito de este capítulo es introducir al estudiante a las ideas y técnicas básicas del análisis
de varianza. Dos diseños experimentales, el completamente aleatorizado y el de bloques
completos aleatorizados, se discuten con considerable detalle. Además, se introduce el
concepto de diseños de medidas repetidas y un experimento factorial como se usa con el
diseño completamente al azar. Las personas que deseen profundizar en cualquier aspecto del
análisis de varianza encontrarán de gran utilidad las referencias metodológicas al final del
capítulo.
374 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 8

Fórmula
Número Nombre Fórmula

8.2.1 ANOVA unidireccional Xyo¼metroþtjþmiyo


modelo

8.2.2 Suma total de cuadrados Xk X nortej - -


acero inoxidable¼ Xyo- -X::2
j¼1 i¼1

8.2.3 dentro del grupo Xk X nortej - -


suma de cuadrados SSO¼ Xyo- -X:j2
j¼1 i¼1

8.2.4 entre grupos Xk- -2


suma de cuadrados SSA¼ nortej-X -j - -X::
j¼1

8.2.5 Varianza dentro del grupo X j -


Xknorte -
Xyo- -X-j2
RSU¼j¼1i¼1
Xk - -
nortej-1
j¼1

8.2.6 entre grupos s2¼nortes2- X


varianza yo

8.2.7 entre grupos Xk- -2


varianza II norte - X-j- -X::
j¼1
(tamaños de muestra iguales) MSA¼
k-1

8.2.8 entre grupos Xk- -2


varianza III nortej-X-j- -X::

(tamaños de muestra desiguales) MSA¼j¼1


k-1

rffiffiffiffiffiffiffiffiffiffiffi
8.2.9 HSD de Tukey MSE
(tamaños de muestra iguales)
HSD¼qa;k;Nk
norte

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
8.2.10 HSD de Tukey
MSE 1 1
(tamaños de muestra desiguales) HSD ¼qa;k;Nk þ
2 nortei nortej

8.3.1 ANOVA de dos vías Xyo¼metroþbiþtjþmiyo


modelo

8.3.2 Suma de cuadrados acero inoxidable¼SSBlþSSTrþSSE


representación

(Continuado)
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 8 375

8.3.3 Total de suma de cuadrados Xk Xnorte- -2


acero inoxidable¼ Xyo- -X : :
j¼1 i¼1

8.3.4 Bloque de suma de cuadrados Xk X norte

2
SSBl¼ d-Xi-- -X: :Þ
j¼1 i¼1

8.3.5 Suma de cuadrados Xk Xnorte- -


tratos SSTr¼ - X-j- -X: 2:
j¼1 i¼1

8.3.6 Error de suma de cuadrados SSE¼SST - SSBl - SSTr

8.4.1 Efectos fijos, factor Xyo¼metroþbiþtjþmiyo


único aditivo, ANOVA
de medidas repetidas
modelo

8.4.2 Dos factores repetidos Xjk¼metroþryoþaiþbjþ ðabdominalesÞyoþmijk


modelo de medidas

8.5.1 Completamente de dos factores Xjk¼metroþaiþbjþ ðabdominalesÞyoþmijk


aleatorizado fijo-
modelo factorial de efectos

8.5.2 probabilístico un <1 -d1 -a0Þð1 -a00Þð1 -a000Þ


representacion dea

8.5.3 Suma de cuadrados total I XaX bX norte-


-X aX bX norte
- -2
Xjk - - X: : : 2¼ - Xij-- -X: : :
i¼1j¼1k¼1 i¼1j¼1k¼1
XaX bX norte-
-2
þ Xjk- -X ij-
i¼1j¼1k¼1

8.5.4 Suma de cuadrados total II acero inoxidable¼SSTrþSSE

8.5.5 Suma de cuadrados XaX bX norte-


- 2X a X bX norte

2
partición de tratamiento - Xij-- -X::: ¼ d-Xi::- -X:::Þ
i¼1j¼1k¼1 i¼1j¼1k¼1
XabXX norte-
-2
þ - X-j-- -X:::
i¼1j¼1k¼1
XaX bX norte-
-2
þ - Xij-- -Xi::- -X-j-þ -X :::
i¼1j¼1k¼1

Clave de símbolo a¼Probabilidad de error tipo I ai¼


tratamiento un efecto bj¼efecto del
tratamiento B bi¼efecto de bloque

dabdominalesÞyo¼efecto de interacción

miyo¼término de error

HSD¼honestamente diferencia significativa k


¼número de tratamientos
376 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

metro¼media de la poblacióndo la gran mediaÞ norte¼


número o bloques norteX¼tamaño de la muestra

ryo¼efecto de bloque para medidas repetidas de dos factores


alrededor s2¼diferencia
SSX¼suma de cuadradosddonde X : A¼entre; Licenciado en
Derecho¼bloquear; T¼total; Tr¼tratamiento; W¼dentroÞ ti¼
efecto del tratamiento Xxxx¼medición

PREGUNTAS DE REPASO Y EJERCICIOS

1.Definir análisis de varianza.

2.Describa el diseño completamente al azar.

3.Describa el diseño de bloques al azar.

4.Describe el diseño de medidas repetidas.

5.Describa el experimento factorial tal como se usa en el diseño completamente al azar.

6.¿Cuál es el propósito de la prueba HSD de Tukey?

7.¿Qué es una unidad experimental?

8.¿Cuál es el objetivo del diseño de bloques completos al azar?

9.¿Qué es la interacción?

10¿Qué es un cuadrado medio?

11¿Qué es una tabla ANOVA?


12Para cada uno de los siguientes diseños, describa una situación en su campo particular de interés donde
el diseño sería un diseño experimental apropiado. Usa datos reales o realistas y haz el análisis de
varianza apropiado para cada uno:
(a)Diseño completamente al azar
(b)Diseño de bloques completos al azar
(C)Diseño completamente al azar con un experimento factorial
(d)Diseños de medidas repetidas
- -
13Werther et al. (A-28) examinó lab-recuento de leucocitos 109=L en 51 sujetos con cáncer colorrectal
y 19 controles sanos. Los pacientes con cáncer también se clasificaron en la clasificación de Dukes (A, B, C) para el
cáncer colorrectal que brinda a los médicos una guía sobre el riesgo, después de la cirugía, de que el cáncer regrese
o se propague a otras partes del cuerpo. Una categoría adicional (D) identificó a los pacientes con enfermedad que
no se había resecado por completo. Los resultados se muestran en la siguiente tabla. Realice un análisis de estos
datos en el que identifique las fuentes de variabilidad y especifique los grados de libertad para cada una.
¿Proporcionan estos datos suficiente evidencia para indicar que, en promedio, los recuentos de leucocitos difieren
entre las cinco categorías? Dejara¼ :01 y encuentra elpagvalor. Use el procedimiento de Tukey para probar
diferencias significativas entre pares individuales de medias de muestra.
PREGUNTAS DE REPASO Y EJERCICIOS 377

Saludable A B C D

6.0 7.7 10.4 8.0 9.5


6.3 7.8 5.6 6.7 7.8
5.1 6.1 7.0 9.3 5.7
6.2 9.6 8.2 6.6 8.0
10.4 5.5 9.0 9.3 9.6
4.4 5.8 8.4 7.2 13.7
7.4 4.0 8.1 5.2 6.3
7.0 5.4 8.0 9.8 7.3
5.6 6.5 6.2 6.2
5.3 9.1 10.1
2.6 11.0 9.3
6.3 10.9 9.4
6.1 10.6 6.5
5.3 5.2 5.4
5.4 7.9 7.6
5.2 7.6 9.2
4.3 5.8
4.9 7.0
7.3
4.9
6.9
4.3
5.6
5.1
Fuente: Datos proporcionados por cortesía de Kim Werther, MD, Ph.D.

14En el Ejemplo 8.4.1, examinamos los datos de un estudio realizado por Licciardone et al. (A-15) sobre la manipulación
osteopática como tratamiento del dolor de espalda crónico. Al comienzo de ese estudio, en realidad había 91 sujetos
asignados aleatoriamente a uno de tres tratamientos: tratamiento de manipulación osteopática (OMT), manipulación
simulada (SHAM) o no intervención (CONTROL). Una variable de resultado importante fue la calificación del dolor de
espalda al comienzo del estudio. Los investigadores querían saber si el tratamiento tenía esencialmente el mismo
nivel medio de dolor al comienzo del ensayo. Los resultados se muestran en la siguiente tabla. Los investigadores
utilizaron una escala analógica visual de 0 a 10 cm, donde 10 indicaba "el peor dolor posible". ¿Podemos concluir,
sobre la base de estos datos, que, en promedio, los niveles de dolor difieren en los tres grupos de tratamiento? Dejar
a¼ :05 y encuentra elpagvalor. Si está justificado, use el procedimiento de Tukey para probar las diferencias entre
pares individuales de medias de muestra.

CONTROL IMPOSTOR OMT

2.6 5.8 7.8 3.5


5.6 1.3 4.1 3.4
3.3 2.4 1.7 1.1
4.6 1.0 3.3 0.5
8.4 3.2 4.3 5.1
0.0 0.4 6.5 1.9
2.5 5.4 5.4 2.0
(Continuado)
378 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

CONTROL IMPOSTOR OMT

5.0 4.5 4.0 2.8


1.7 1.5 4.1 3.7
3.8 0.0 2.6 1.6
2.4 0.6 3.2 0.0
1.1 0.0 2.8 0.2
0.7 7.6 3.4 7.3
2.4 3.5 6.7 1.7
3.3 3.9 7.3 7.5
6.6 7.0 2.1 1.6
0.4 7.4 3.7 3.0
0.4 6.5 2.3 6.5
0.9 1.6 4.4 3.0
6.0 1.3 2.8 3.3
6.6 0.4 7.3
6.3 0.7 4.6
7.0 7.9 4.8
1.3 4.9
Fuente: Datos proporcionados por cortesía de JC Licciardone, DO

15.El objetivo de un estudio realizado por Meshack y Norman (A-29) fue evaluar los efectos de las pesas sobre el temblor
postural de la mano relacionado con la autoalimentación en sujetos con enfermedad de Parkinson (EP). A cada uno
de los 16 sujetos se le midió la amplitud del temblor (en mm) en tres condiciones: sosteniendo una cuchara armada
(108 gramos), sosteniendo una cuchara con peso (248 gramos) y sosteniendo la cuchara armada mientras usaba una
muñeca con peso. manguito (470 gramos). Los datos se muestran en la siguiente tabla.

Amplitud del temblor (mm)

Sujeto Cuchara acumulada Cuchara ponderada Cuchara acumuladaþMuñequera

1 . 77 1.63 1.02
2 . 78 . 88 1.11
3 . 17 . 14 . 14
4 . 30 . 27 . 26
5 . 29 . 27 . 28
6 1.60 1.49 1.73
7 . 38 . 39 . 37
8 . 24 . 24 . 24
9 . 17 . 17 . dieciséis

10 . 38 . 29 . 27
11 . 93 1.21 . 90
12 . 63 . 52 . 66
13 . 49 . 73 . 76
14 . 42 . 60 . 29
15 . 19 . 21 . 21
dieciséis . 19 . 20 . dieciséis

Fuente: Rubia P. Meshack y Kathleen E. Norman, "Un ensayo controlado aleatorio de los efectos de los pesos
en la amplitud y frecuencia del temblor postural de la mano en personas con enfermedad de Parkinson"
Rehabilitación Clínica, 16 (2003), 481–492.
PREGUNTAS DE REPASO Y EJERCICIOS 379

¿Se puede concluir sobre la base de estos datos que las tres condiciones experimentales, en promedio, tienen
diferentes efectos sobre la amplitud del temblor? Dejara¼ :05. Determinar elpagvalor.

dieciséis.En un estudio de los efectos pulmonares en cobayos, Lacroix et al. (A-30) expuso a 18 cobayos
sensibilizados con ovoalbúmina y 18 cobayos no sensibilizados a aire normal, benzaldehído y
acetaldehído. Al final de la exposición, los cobayos fueron anestesiados y se evaluaron las respuestas
alérgicas en lavado broncoalveolar (BAL). La siguiente tabla muestra el recuento de células alveolares
106por grupo de tratamiento para cobayos sensibilizados y no sensibilizados con ovoalbúmina.

Sensibilizado con ovoalbúmina Tratamiento Recuento alveolar 106

No acetaldehído 49.90
No acetaldehído 50.60
No acetaldehído 50.35
No acetaldehído 44.10
No acetaldehído 36.30
No acetaldehído 39.15
No aire 24.15
No aire 24.60
No aire 22.55
No aire 25.10
No aire 22.65
No aire 26.85
No benzaldehido 31.10
No benzaldehido 18.30
No benzaldehido 19.35
No benzaldehido 15.40
No benzaldehido 27.10
No benzaldehido 21.90
Sí acetaldehído 90.30
Sí acetaldehído 72.95
Sí acetaldehído 138.60
Sí acetaldehído 80.05
Sí acetaldehído 69.25
Sí acetaldehído 31.70
Sí aire 40.20
Sí aire 63.20
Sí aire 59.10
Sí aire 79.60
Sí aire 102.45
Sí aire 64.60
Sí benzaldehido 22.15
Sí benzaldehido 22.75
Sí benzaldehido 22.15
Sí benzaldehido 37.85
Sí benzaldehido 19.35
Sí benzaldehido 66.70

Fuente: Datos proporcionados por cortesía de G. Lacroix, Docteur en Toxicologie.


380 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Pruebe las diferencias (a) entre los resultados sensibilizados con ovoalbúmina y no sensibilizados, (b) entre las tres
exposiciones diferentes y (c) la interacción. Dejara¼ :05 para todas las pruebas.

17Watanabe et al. (A-31) estudió a 52 trabajadores sanos de mediana edad. Los investigadores utilizaron el
Cuestionario de agotamiento vital de Masstricht para evaluar el agotamiento vital. Según las puntuaciones
resultantes, asignaron sujetos en tres grupos: VE1, VE2 y VE3. VE1 indica la menor cantidad de signos de
agotamiento y VE3 indica la mayor cantidad de signos de agotamiento. Los investigadores también
preguntaron a los sujetos sobre sus hábitos de fumar. El estado de tabaquismo se clasificó de la siguiente
manera: SMOKE1 son no fumadores, SMOKE2 son fumadores leves (20 cigarrillos o menos por día), SMOKE3
son fumadores empedernidos (más de 20 cigarrillos por día). Una de las variables de resultado de interés fue
la amplitud del análisis espectral de alta frecuencia de la variabilidad del ritmo cardíaco observado durante
un chequeo médico anual. Esta variable, HF-amplitud, se utilizó como índice de la función nerviosa
parasimpática.

HF-Amplitud
Estado de tabaquismo

Agotamiento Vital
Grupo HUMO1 HUMO2 HUMO3

VE1 23.33 13.37 16.14 16.83


31.82 9.76 20.80 29.40
10.61 22.24 15.44 6.50
42.59 8.77 13.73 10.18
23.15 20.28 13.86
17.29

VE2 20.69 11.67 44.92 27.91


16.21 30.17 36.89
28.49 29.20 16.80
25.67 8.73 17.08
15.29 9.08 18.77
7.51 22.53 18.33
22.03 17.19
10.27

VE3 9.44 17.59 5.57


19.16 18.90 13.51
14.46 17.37
10.63
13.83

Fuente: Datos proporcionados por cortesía de Takemasa Watanabe, MD, Ph.D.

Realice un análisis de varianza de estos datos y pruebe las tres hipótesis posibles. Dejar a0¼a00
¼a000¼ :05. Determinar elpagvalores.
PREGUNTAS DE REPASO Y EJERCICIOS 381

18Los efectos de la contaminación térmica enCorbicula fluminea (almejas asiáticas) en tres ubicaciones geográficas
diferentes fueron analizadas por John Brooker (A-32). Los datos de muestra sobre la longitud, el ancho y la altura de
la concha de almeja se muestran en la siguiente tabla. Determine si existe una diferencia significativa en la longitud,
la altura o el ancho promedio (medido en mm) de la concha de almeja en las tres ubicaciones diferentes mediante la
realización de tres análisis. ¿Qué inferencias se pueden hacer a partir de sus resultados? ¿Cuáles son los supuestos
que subyacen a sus inferencias? ¿Cuáles son las poblaciones objetivo?

Ubicación 1 Ubicación 2 Ubicación 3

Longitud Ancho Altura Longitud Ancho Altura Longitud Ancho Altura

7.20 6.10 4.45 7.25 6.25 4.65 5.95 4.75 3.20


7.50 5.90 4.65 7.23 5.99 4.20 7.60 6.45 4.56
6.89 5.45 4.00 6.85 5.61 4.01 6.15 5.05 3.50
6.95 5.76 4.02 7.07 5.91 4.31 7.00 5.80 4.30
6.73 5.36 3.90 6.55 5.30 3.95 6.81 5.61 4.22
7.25 5.84 4.40 7.43 6.10 4.60 7.10 5.75 4.10
7.20 5.83 4.19 7.30 5.95 4.29 6.85 5.55 3.89
6.85 5.75 3.95 6,90 5.80 4.33 6.68 5.50 3.90
7.52 6.27 4.60 7.10 5.81 4.26 5.51 4.52 2.70
7.01 5.65 4.20 6.95 5.65 4.31 6.85 5.53 4.00
6.65 5.55 4.10 7.39 6.04 4.50 7.10 5.80 4.45
7.55 6.25 4.72 6.54 5.89 3.65 6.81 5.45 3.51
7.14 5.65 4.26 6.39 5.00 3.72 7.30 6.00 4.31
7.45 6.05 4.85 6.08 4.80 3.51 7.05 6.25 4.71
7.24 5.73 4.29 6.30 5.05 3.69 6.75 5.65 4.00
7.75 6.35 4.85 6.35 5.10 3.73 6.75 5.57 4.06
6.85 6.05 4.50 7.34 6.45 4.55 7.35 6.21 4.29
6.50 5.30 3.73 6.70 5.51 3.89 6.22 5.11 3.35
6.64 5.36 3.99 7.08 5.81 4.34 6.80 5.81 4.50
7.19 5.85 4.05 7.09 5.95 4.39 6.29 4.95 3.69
7.15 6.30 4.55 7.40 6.25 4.85 7.55 5.93 4.55
7.21 6.12 4.37 6.00 4.75 3.37 7.45 6.19 4.70
7.15 6.20 4.36 6.94 5.63 4.09 6.70 5.55 4.00
7.30 6.15 4.65 7.51 6.20 4.74
6.35 5.25 3.75 6.95 5.69 4.29
7.50 6.20 4.65
Fuente: Datos proporcionados por cortesía de John Brooker, MS y el Centro de Consultoría Estadística de la Universidad
Estatal de Wright.

19Eleftherios Kellis (A-33) realizó un experimento con 18 varones púberes. Él registró la actividad
electromiográfica (EMG) en nueve posiciones angulares diferentes del músculo bíceps femoral. Los
valores de EMG se expresan como un porcentaje (0-100 por ciento) del esfuerzo máximo ejercido con
el músculo y representan un promedio en un rango de ángulos de flexión. Las nueve posiciones
corresponden a la prueba de ángulos de flexión de rodilla de 1 a 10, 11 a 20, 21 a 30, 31 a 40, 41 a 50,
51 a 60, 61 a 70, 71 a 80 y 81 a 90. Los resultados se muestran en la siguiente tabla. Para el sujeto 1,
por ejemplo, el valor de 30,96 por ciento representa el porcentaje máximo promedio de esfuerzo en
posiciones angulares de 1 a 10 grados.
382 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Sujeto 1–10 11–20 21–30 31–40 41–50 51–60 61–70 71–80 81–90

1 30.96 11.32 4.34 5.99 8.43 10.50 4.49 10.93 33.26


2 3.61 1.47 3.50 10.25 3.30 3.62 10.14 11.05 8.78
3 8.46 2.94 1.83 5.80 11.59 15.17 13.04 10.57 8.22
4 0,69 1.06 1.39 1.08 0.96 2.52 2.90 3.27 5.52
5 4.40 3.02 3.74 3.83 3.73 10.16 9.31 12.70 11.45
6 4.59 9.80 10.71 11.64 9.78 6.91 8.53 8.30 11.75
7 3.31 3.31 4.12 12.56 4.60 1.88 2.42 2.46 2.19
8 1.98 6.49 2.61 3.28 10.29 7.56 16.68 14.52 13.49
9 10.43 4.96 12.37 24.32 17.16 34.71 35.30 37.03 45.65
10 20.91 20.72 12.70 15.06 12.03 11.31 28.47 26.81 25.08
11 5.59 3.13 2.83 4.31 6.37 13.95 13.48 11.15 30.97
12 8.67 4.32 2.29 6.20 13.01 19.30 9.33 12.30 12.20
13 2.11 1.59 2.40 2.56 2.83 2.55 5.84 5.23 8.84
14 3.82 5.04 6.81 10.74 10.10 13.14 19.39 13.31 12.02
15 39.51 62.34 70.46 20.48 17.38 54.04 25.76 50.32 46.84
dieciséis 3.31 4.95 12.49 9.18 14.00 16.17 25.75 11.82 13.17
17 11.42 7.53 4.65 4.70 7.57 9.86 5.30 4.47 3.99
18 2.97 2.18 2.36 4.61 7.83 17.49 42.55 61.84 39.70

Fuente: Datos proporcionados por cortesía de Eleftherios Kellis, Ph.D.

¿Podemos concluir sobre la base de estos datos que los valores promedio de EMG difieren entre las nueve
ubicaciones angulares? Dejara¼ :05.

20En un estudio del síndrome de Marfan, Pyeritz et al. (A-34) informaron las siguientes puntuaciones de gravedad de pacientes sin
ectasia dural, leve y marcada. ¿Podemos concluir, sobre la base de estos datos, que las puntuaciones medias de gravedad
difieren entre las tres poblaciones representadas en el estudio? Dejara¼ :05 y encuentra elpagvalor. Utilice el procedimiento de
Tukey para probar diferencias significativas entre pares individuales de medias muestrales.

Sin ectasia dural: 18, 18, 20, 21, 23, 23, 24, 26, 26, 27, 28, 29, 29, 29, 30, 30, 30,
30, 32, 34, 34, 38
Ectasia dural leve: 10, 16, 22, 22, 23, 26, 28, 28, 28, 29, 29, 30, 31, 32, 32, 33, 33,
38, 39, 40, 47
Ectasia dural marcada: 17, 24, 26, 27, 29, 30, 30, 33, 34, 35, 35, 36, 39
Fuente: Datos proporcionados por cortesía de Reed E. Pyeritz, MD, Ph.D.

21La siguiente tabla muestra las concentraciones de epinefrina en plasma arterial (nanogramos por mililitro) encontradas
en 10 animales de laboratorio durante tres tipos de anestesia:

Animal
Anestesia 1 2 3 4 5 6 7 8 9 10

A . 28 . 50 . 68 . 27 . 31 . 99 . 26 . 35 . 38 . 34
B . 20 . 38 . 50 . 29 . 38 . 62 . 42 . 87 . 37 . 43
C 1.23 1.34 . 55 1.06 . 48 . 68 1.12 1.52 . 27 . 35

¿Podemos concluir a partir de estos datos que los tres tipos de anestesia, en promedio, tienen efectos
diferentes? Dejara¼ :05.
Traducido del inglés al español - www.onlinedoctranslator.com

PREGUNTAS DE REPASO Y EJERCICIOS 383

22El objetivo de un estudio de Hartman-Maeir et al. (A-35) fue evaluar el conocimiento de los perfiles de déficit entre los pacientes con
accidente cerebrovascular en rehabilitación. Estudió a 35 pacientes con lesión por accidente cerebrovascular en el hemisferio
derecho y 19 pacientes con lesión en el hemisferio izquierdo. También agrupó el tamaño de la lesión como

2¼ “1-3 cm”; 3¼ “3-5 cm”; y 4¼ “5 cm o más”


Una de las variables de resultado fue una medida del desconocimiento total de cada paciente de sus propias limitaciones. Las
puntuaciones oscilaron entre 8 y 24, y las puntuaciones más altas indicaron más desconocimiento.

Puntuación de desconocimiento

Tamaño de la lesión Izquierda Bien


Grupo Hemisferio Hemisferio

2 11 10 8
13 11 10
10 13 9
11 10 9
9 13 9
10 10
9 10
8 9
10 8

3 13 11 10
8 10 11
10 10 12
10 14 11
10 8

4 11 10 11
13 13 9
14 10 19
13 10 10
14 15 9 Fuente: Datos proporcionados por cortesía
8 10 de Adina Hartman-Maeir, Ph.D., OTR

Pruebe la diferencia en el tamaño de la lesión, el hemisferio y la interacción. Dejara¼ :05 para todas las pruebas.

23Se seleccionó una muestra aleatoria de los registros de nacimientos únicos de cada una de cuatro poblaciones. Los pesos
(gramos) de los bebés al nacer fueron los siguientes:

Muestra

A B C D

2946 3186 2300 2286


2913 2857 2903 2938
2280 3099 2572 2952
3685 2761 2584 2348
(Continuado)
384 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Muestra

A B C D

2310 3290 2675 2691


2582 2937 2571 2858
3002 3347 2414
2408 2008
2850
2762

¿Proporcionan estos datos evidencia suficiente para indicar, al nivel de significancia de .05, que las cuatro poblaciones
difieren con respecto al peso medio al nacer? Pruebe si hay una diferencia significativa entre todos los posibles pares
de medias.

24La siguiente tabla muestra las puntuaciones de agresión de 30 animales de laboratorio criados en tres condiciones
diferentes. Se asignó aleatoriamente un animal de cada una de las 10 camadas a cada una de las tres condiciones de
crianza.

Condición de crianza

Extremadamente Moderadamente No
Basura Atestado Atestado Atestado

1 30 20 10
2 30 10 20
3 30 20 10
4 25 15 10
5 35 25 20
6 30 20 10
7 20 20 10
8 30 30 10
9 25 25 10
10 30 20 20

¿Estos datos proporcionan suficiente evidencia para indicar que el nivel de hacinamiento tiene un efecto sobre la
agresión? Dejara¼ :05.

25La siguiente tabla muestra las medidas de capacidad vital de 60 hombres adultos clasificados por ocupación y
grupo de edad:

Ocupación
Grupo de edad A B C D

1 4.31 4.68 4.17 5.75


4.89 6.18 3.77 5.70
4.05 4.48 5.20 5.53
4.44 4.23 5.28 5.97
4.59 5.92 4.44 5.52
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 385

Ocupación
Grupo de edad A B C D

2 4.13 3.41 3.89 4.58


4.61 3.64 3.64 5.21
3.91 3.32 4.18 5.50
4.52 3.51 4.48 5.18
4.43 3.75 4.27 4.15

3 3.79 4.63 5.81 6.89


4.17 4.59 5.20 6.18
4.47 4.90 5.34 6.21
4.35 5.31 5.94 7.56
3.59 4.81 5.56 6.73

Pruebe las diferencias entre ocupaciones, las diferencias entre grupos de edad y la interacción. Dejara¼ :05
para todas las pruebas.

26Complete la siguiente tabla de ANOVA e indique qué diseño se utilizó.

Fuente SS d.f. EM realidad virtual pag

Tratos 154.9199 4
Error

Total 200.4773 39

27Complete la siguiente tabla de ANOVA e indique qué diseño se utilizó.

Fuente SS d.f. EM realidad virtual pag

Tratos 3
bloques 183.5 3
Error 26,0

Total 709.0 15

28Considere la siguiente tabla ANOVA.

Fuente SS d.f. EM realidad virtual pag

A 12.3152 2 6.15759 29.4021 <.005


B 19.7844 3 6.59481 31.4898 <.005
AB 8.94165 6 1.49027 7.11596 <.005
Tratos 41.0413 11
Error 10.0525 48 0.209427

Total 51.0938 59
386 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

(a)¿Qué tipo de análisis se empleó?


(b)¿Qué se puede concluir del análisis? Dejara¼ :05.
29Considere la siguiente tabla ANOVA.

Fuente SS d.f. EM realidad virtual

Tratos 5.05835 2 2.52917 1.0438


Error 65.42090 27 2.4230

(a)¿Qué diseño se empleó?


(b)¿Cuántos tratamientos se compararon?
(C)¿Cuántas observaciones se analizaron?
(d)Con un nivel de significancia de .05, ¿se puede concluir que hay una diferencia entre los tratamientos? ¿Por qué?

30Considere la siguiente tabla ANOVA.

Fuente SS d.f. EM realidad virtual

Tratos 231.5054 2 115.7527 2.824


bloques 98.5000 7 14.0714
Error 573.7500 14 40.9821

(a)¿Qué diseño se empleó?


(b)¿Cuántos tratamientos se compararon?
(C)¿Cuántas observaciones se analizaron?
(d)Con un nivel de significancia de .05, ¿se puede concluir que los tratamientos tienen efectos diferentes? ¿Por qué?

31En un estudio de la relación entre fumar y las concentraciones séricas de colesterol de lipoproteínas de alta
densidad (HDL-C), se recopilaron los siguientes datos (codificados para facilitar el cálculo) de muestras de
hombres adultos que no fumaban, fumadores leves, fumadores moderados, y grandes fumadores.
Deseamos saber si estos datos brindan evidencia suficiente para indicar que las cuatro poblaciones difieren
con respecto a la concentración sérica media de HDL-C. Sea la probabilidad de cometer un error tipo I
. 05. Si se encuentra una diferencia significativa general, determine qué pares de medias de muestras individuales son
significativamente diferentes.

Estado de tabaquismo

no fumadores Luz Moderado Pesado

12 9 5 3
10 8 4 2
11 5 7 1
13 9 9 5
9 9 5 4
9 10 7 6
12 8 6 2
PREGUNTAS DE REPASO Y EJERCICIOS 387

32.Polyzogopoulou et al. (A-36) informan los efectos de la cirugía bariátrica en los niveles de glucosa en ayunas (mmol/L) en 12 sujetos
obesos con diabetes tipo 2 en cuatro momentos: antes de la operación, a los 3 meses, 6 meses y 12 meses. ¿Podemos concluir,
después de eliminar los efectos de los sujetos, que los niveles de glucosa en ayunas difieren con el tiempo después de la
cirugía? Dejara¼ :05.

Núm. de sujeto preoperatorio 3 meses 6 meses 12 meses

1 108.0 200.0 94.3 92.0


2 96.7 119.0 84.0 93.0
3 77.0 130.0 76.0 74.0
4 92.0 181.0 82.5 80.5
5 97.0 134.0 81.0 76.0
6 94.0 163.0 96,0 71.0
7 76.0 125.0 74.0 75.5
8 100.0 189.0 97.0 88.5
9 82.0 282.0 91.0 93.0
10 103.5 226.0 86,0 80.5
11 85.5 145.0 83.5 83.0
12 74.5 156.0 71.0 87.0
Fuente: Datos proporcionados por cortesía de Theodore K. Alexandrides, MD

33.Consulte el ejercicio de revisión 32. Además de estudiar a los 12 sujetos con diabetes tipo 2 (grupo 1),
Polyzogopoulou et al. (A-36) estudiaron cinco sujetos con intolerancia a la glucosa (grupo 2) y ocho sujetos
con tolerancia normal a la glucosa (grupo 3). Los siguientes datos son los niveles de glucosa en ayunas
después de la cirugía de 12 meses para los tres grupos.

Grupo

1.0 92.0
1.0 93.0
1.0 74.0
1.0 80.5
1.0 76.0
1.0 71.0
1.0 75.5
1.0 88.5
1.0 93.0
1.0 80.5
1.0 83.0
1.0 87.0
2.0 79.0
2.0 78.0
2.0 100.0
2.0 76.5
2.0 68.0
3.0 81.5
3.0 75,0
3.0 76.5
(Continuado)
388 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Grupo

3.0 70.5
3.0 69.0
3.0 73.8
3.0 74.0
3.0 80.0
Fuente: Datos proporcionados por cortesía
de Theodore K. Alexandrides, MD

¿Podemos concluir que hay una diferencia entre las medias de los tres grupos? Si es así, ¿qué pares de medias
difieren? Dejara¼ :05 para todas las pruebas.

Para los ejercicios 34 a 38 haz lo siguiente:

(a)Indique qué técnica estudiada en este capítulo (el diseño completamente al azar, el diseño
de bloques al azar, el diseño de medidas repetidas o el experimento factorial) es la adecuada.
(b)Identificar la variable de respuesta y las variables de tratamiento.
(C)Según corresponda, identifique los factores y el número de niveles de cada uno, las variables de bloqueo y los
sujetos.
(d)Enumere cualquier variable extraña cuyos efectos crea que podrían estar incluidos en el término de error.
(mi)Según corresponda, comente los efectos de arrastre y de posición.
(F)Construya una tabla ANOVA en la que indique las fuentes de variabilidad y el número de grados de
libertad para cada una.

34.Johnston y Bowling (A-37) estudiaron el contenido de ácido ascórbico (vitamina C) en varios productos de jugo de naranja. Uno de
los productos examinados fue el jugo listo para beber envasado en un recipiente con tapa de rosca que se puede volver a
sellar. Un análisis analizó el contenido de vitamina C reducida y oxidada del jugo en el momento de la compra y volvió a
analizarlo tres veces por semana durante 4 a 5 semanas.

35.Un estudio de Pittini et al. (A-38) evaluó la efectividad de un plan de estudios basado en un simulador en 30 alumnos que
aprendieron la práctica básica de la amniocentesis. El rendimiento antes y después del entrenamiento se evaluó con
el mismo instrumento. La variable de resultado fue la puntuación post-entrenamiento-puntuación pre-
entrenamiento. Los alumnos se agruparon por años de experiencia de posgrado: PGY 0–2, PGY 3–5, Fellows y
Facultad.

36.Anim-Nyame et al. (A-39) estudió tres conjuntos de mujeres en un esfuerzo por comprender los factores relacionados con la
preeclampsia. Se inscribieron en el estudio 18 mujeres con preeclampsia, 18 mujeres embarazadas normales y 18 controles
emparejados de mujeres no embarazadas. Se obtuvieron muestras de sangre para medir los niveles plasmáticos de factor de
crecimiento endotelial vascular, leptina, TNF-aconcentraciones de proteínas plasmáticas y hemograma completo.

37.En un estudio de lwamoto et al. (A-40) 26 mujeres fueron asignadas aleatoriamente al medicamento alfacalcidol para el
tratamiento de la densidad mineral ósea (DMO) lumbar. La DMO de la columna lumbar se midió al inicio del estudio y
cada año durante 5 años.

38.Inou et al. (A-41) estudió el tipo de célula donante y el genotipo sobre la eficacia de la clonación de células somáticas de
ratón. Realizaron un experimento factorial con dos tipos de células donantes (células de Sertoli o cúmulos)
y seis genotipos. Las variables de resultado fueron la tasa de escisión y la tasa de natalidad de las crías en cada
combinación de tratamiento.
PREGUNTAS DE REPASO Y EJERCICIOS 389

Para los estudios descritos en los ejercicios 39 a 66, haga lo siguiente:

(a)Realice un análisis estadístico de los datos (incluidas las pruebas de hipótesis y la construcción de
intervalos de confianza) que crea que generarían información útil para los investigadores.
(b)Determinarpagvalores para cada estadística de prueba calculada.

(C)Indique todas las suposiciones que sean necesarias para validar su análisis.
(d)Describa la(s) población(es) sobre las que cree que serían aplicables las inferencias basadas en su
análisis.

39.Shirakami et al. (A-42) investigó la importancia clínica de la endotelina (ET), los péptidos natriuréticos y el sistema
renina-angiotensina-aldosterona en el trasplante de hígado pediátrico. Los sujetos eran niños de 6 meses a
12 años que se sometieron a un trasplante de hígado relacionado con la vida debido a atresia biliar
congénita y cirrosis hepática grave. Entre los datos recopilados se encuentran los siguientes niveles de
bilirrubina sérica total (mg/dl) después del trasplante (h-horas, d-días):

Tiempo después de la reperfusión del hígado del donante

preoperatorio Transección del hígado Fase anhepática 1 hora 2 h 4 h 8 h 1 día 2 días 3 días

6.2 1.2 0.9 0.8 1.1 1.5 2 1.4 1.6 1.3


17.6 11.9 9.3 3.5 3 6.1 9 6.3 6.4 6.2
13.2 10.2 7.9 5.3 4.9 3.3 3.6 2.8 1.9 1.9
3.9 3.3 3 2.9 2.3 1.4 1.2 0.8 0.8 0.9
20.8 19.4 9.4 8.4 6.8 7.1 3.7 3.8 3.2
1.8 1.8 1.6 1.4 1.4 1.1 1.9 0.7 0.8 0.7
8.6 6.5 4.8 3.1 2.1 1 1.3 1.5 1.6 3.2
13.4 12 10.1 5.8 5.6 4.5 4.1 3 3.1 3.6
16.8 13.9 8.3 3.7 3.7 2.2 2.1 1.9 3.1 4.1
20.4 17.8 17 10.8 9.3 8.9 7 2.8 3.8 4.8
25 21.5 13.8 7.6 7 5 11,5 12,3 10,1 11,4 4
9.2 6.3 6.8 5.3 4.8 0.2 4,2 3,7 3,5
8 6.5 6.4 4.1 3.8 3.8 3.5 3.1 2.9 2.8
2.9 3 4.1 3.4 3.4 3.7 4.2 3.3 2 1.9
21.3 17.3 13.6 9.2 7.9 7.9 9.8 8.6 4.7 5.5
25 25 24 20,1 19,3 18,6 23,6 25 14,4 20,6
23.3 23.7 15.7 13.2 11 9,6 9,3 7,2 6.3 6.3
17.5 16.2 14.4 12,6 12,7 11,5 10 7.8 5.5 4.9
Falta la observación.
Fuente: Datos proporcionados por cortesía del Dr. Gotaro Shirakami.

Tenga en cuenta que falta una observación en el conjunto de datos. Puede manejar este problema al menos de tres maneras.

(a)Omita el sujeto cuyo dato falta y analice los datos de los 17 sujetos restantes.
(b)Use un paquete de computadora que se ocupe automáticamente de los datos faltantes.

(C)Analice los datos utilizando un procedimiento de datos faltantes. Para un procedimiento de este tipo, véase Jerome L. Myers
y Arnold D. Well,Diseño de Investigación y Análisis Estadístico,Erlbaum Associates, Hillsdale, Nueva Jersey, 1995, págs. 256–258.
390 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

40El propósito de un estudio realizado por Sakakibara y Hayano (A-43) fue examinar el efecto de la respiración lenta
voluntaria sobre la respuesta parasimpática cardíaca a una amenaza (la anticipación de una descarga eléctrica). Los
sujetos fueron 30 estudiantes universitarios sanos cuya edad media era de 23 años con una desviación estándar de
1,5 años. Se asignó aleatoriamente un número igual de sujetos a grupos de respiración lenta (seis hombres, cuatro
mujeres), rápida (siete hombres, tres mujeres) y sin ritmo (cinco hombres, cinco mujeres). Los sujetos de los grupos
de respiración lenta y rápida regularon su frecuencia respiratoria a 8 y 30 cpm, respectivamente. El grupo sin ritmo
respiró espontáneamente. Las siguientes son las puntuaciones de los sujetos en la Puntuación de ansiedad estatal
del Inventario de ansiedad rasgo-estado después de la línea de base y el período de amenaza:

Lento ritmo ritmo rápido sin ritmo


Amenaza de referencia Amenaza de referencia Amenaza de referencia

39 59 37 49 36 51
44 47 40 42 34 71
48 51 39 48 50 37
50 61 47 57 49 53
34 48 45 49 38 52
54 69 43 44 39 56
34 43 32 45 66 67
38 52 27 54 39 49
44 48 44 44 45 sesenta y cinco
Fuente: Datos proporcionados por
39 sesenta y cinco 41 61 42 57 cortesía del Dr. Masahito Sakakibara.

41.Takahashi et al. (A-44) investigaron la correlación de la intensidad de la señal de resonancia magnética con los potenciales evocados
de la médula espinal y la morfología de la médula espinal después de 5 horas de compresión de la médula espinal en gatos.
Veinticuatro gatos adultos se dividieron en cuatro grupos sobre la base de una medida de la función de la médula espinal más
un grupo de control que no se sometió a compresión espinal. Entre los datos recopilados se encuentran los siguientes valores
de relación de compresión [(diámetro sagital/diámetro transversal) 100] después de 5 horas de compresión:

Control 80.542986 Grupo III 36.923077


79.111111 31.304348
70.535714 53.333333
87.323944 55.276382
80.000000 40.725806
82.222222
Grupo IV 66.666667
Grupo I 83.928571 29.565217
84.183673 12.096774
48.181818 34.274194
98.461538 24.000000

Grupo II 30.263158
34.865900
Fuente: Datos proporcionados
43.775100
cortesía del Dr. Toshiaki
82.439024 Takahashi.
PREGUNTAS DE REPASO Y EJERCICIOS 391

42.El objetivo de un estudio de Yamashita et al. (A-45) fue investigar si la pentoxifilina administrada en la solución
de lavado o durante la reperfusión reduciría la lesión pulmonar por isquemia-reperfusión en aloinjertos de
pulmón canino conservados. Se estudiaron tres grupos de animales. No se administró pentoxifilina a los
animales del grupo 1 (C), se administró solo durante el período de reperfusión (P)
a los animales del grupo 2, y se administró solo en la solución de lavado a los animales del grupo 3 (F). Se
realizaron un total de 14 alotrasplantes de pulmón izquierdo. Las siguientes son las lecturas de presión
aórtica para cada animal durante el período de evaluación de 6 horas:

0 60 120 180 240 300 360


Grupo min min min min min min min

C 85.0 100,0 120,0 80.0 72.0 75,0


C 85.0 82,0 80,0 80.0 85.0 80.0 80.0
C 100.0 75,0 85,0 98.0 85.0 80.0 82.0
C 57.0 57,0 57,0 30.0
C 57.0 75,0 52,0 56,0 65,0 95.0 75,0
PAG 112.0 67,0 73,0 90,0 71.0 70.0 66,0
2
PAG 92.0 70,0 90,0 80.0 75,0 80.0
PAG 105.0 62,0 73,0 75,0 70.0 55,0 50.0
PAG 80.0 73,0 50,0 35,0
F 70.0 95,0 105,0 115.0 110.0 105.0 100.0
F 60.0 63,0 140,0 135.0 125.0 130.0 120.0
F 67.0 65,0 75,0 75,0 80.0 80.0 80.0
F 115.0 107.0 90,0 103.0 110.0 112.0 95.0
F 90,0 99,0 102,0 110.0 117.0 118.0 103.0

Falta la observación.
Fuente: Datos proporcionados por cortesía del Dr. Motohiro Yamashita.

43.En un estudio que investiga la biodisponibilidad relativa de betacaroteno (BC) y alfacaroteno (AC) de diferentes
fuentes de zanahorias, Zhou et al. (A-46) utilizaron hurones como animales de experimentación. Entre los
datos recopilados se encuentran las siguientes concentraciones de BC, AC y relaciones molares AC/BC en los
sueros de 24 hurones que recibieron diferentes fuentes de carotenoides durante 3 días en su agua potable:

antes de Cristo C.A. CA/BC


(metromol/g) (metromol/g) (mol/mol)

Jugo sin calentar

0.637 0.506 0.795


0.354 0.297 0.840
0.287 0.249 0.869
0.533 0.433 0.813
0.228 0.190 0.833
0.632 0.484 0.767

Jugo Calentado

0.303 0.266 0.878


0.194 0.180 0.927
(Continuado)
392 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

antes de Cristo C.A. CA/BC


(metromol/g) (metromol/g) (mol/mol)

Jugo Calentado

0.293 0.253 0.864


0.276 0.238 0.859
0.226 0.207 0.915
0.395 0.333 0.843

Cromoplasto sin calentar

0.994 0.775 0.780


0.890 0.729 0.819
0.809 0.661 0.817
0.321 0.283 0.882
0.712 0.544 0.763
0.949 0.668 0.704

Cromoplasto calentado

0.933 0.789 0.845


0.280 0.289 1.031
0.336 0.307 0.916
0.678 0.568 0.837
0.714 0.676 0.947
Fuente: Datos proporcionados
0.757 0.653 0.862
cortesía del Dr. Jin-R. Zhou.

44.Potteiger et al. (A-47) deseaba determinar si la ingesta de citrato de sodio mejoraría el rendimiento en ciclismo y
facilitaría condiciones metabólicas favorables durante el recorrido en bicicleta. Los sujetos fueron ocho
ciclistas competitivos masculinos entrenados cuya edad media era de 25,4 años con una desviación estándar
de 6,5. Cada participante completó una prueba contrarreloj de ciclismo de 30 km en dos condiciones, luego
de la ingestión de citrato de sodio y luego de la ingestión de un placebo. Se recogieron muestras de sangre
antes de la ingestión del tratamiento (PRE-ING); antes del ejercicio (PRE-EX); durante el recorrido en bicicleta
al completar 10, 20 y 30 km; y 15 minutos después del cese del ejercicio (POST-EX). Los siguientes son los
valores de las presiones parciales de oxígeno (PO2) y dióxido de carbono (PCO2) para cada sujeto, bajo cada
condición, en cada tiempo de medición:

(PAGO2) (mmHg)

Tiempos de medición
Sujeto Tratamientoa PRE-ING PRE-EX 10 km 20 km 30 km 15-POST-EX

1 1 42.00 20.00 53.00 51.00 56.00 41.00


1 2 43.00 29.00 58.00 49.00 55.00 56.00
2 1 44.00 38.00 66.00 66.00 76.00 58.00
2 2 40.00 26.00 57.00 47.00 46.00 45.00
3 1 37.00 22.00 59.00 58.00 56.00 52.00

(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 393

(PAGO2) (mmHg)

Tiempos de medición
Sujeto Tratamientoa PRE-ING PRE-EX 10 km 20 km 30 km 15-POST-EX

3 2 36.00 30.00 52.00 65.00 65.00 36.00


4 1 34.00 21.00 65.00 62.00 62.00 59.00
4 2 46.00 36.00 65.00 72.00 72.00 66.00
5 1 36.00 24.00 41.00 43.00 50.00 46.00
5 2 41.00 25.00 52.00 60.00 67.00 54.00
6 1 28.00 31.00 52.00 60.00 53.00 46.00
6 2 34.00 21.00 57.00 58.00 57.00 41.00
7 1 39.00 28.00 72.00 69.00 65.00 72.00
7 2 40.00 27.00 64.00 61.00 57.00 60.00
8 1 49.00 27.00 67.00 61.00 51.00 49.00
8 2 27.00 22.00 56.00 64.00 49.00 34.00

(PAGCO2) (mmHg)

Tiempos de medición
Sujeto Tratamientoa PRE-ING PRE-EX 10 km 20 km 30 km 15-POST-EX

1 1 31.70 30.20 28.20 29.80 28.20 30.10


1 2 24.60 24.40 34.40 35.20 30.90 34.00
2 1 27.10 35,90 31.30 35.40 34.10 42.00
2 2 21.70 37.90 31.90 39.90 45.10 48.00
3 1 37.40 49.60 39.90 39.70 39.80 42.80
3 2 38.40 42.10 40.90 37.70 37.70 45.60
4 1 36.60 45.50 34.80 33.90 34.00 40.50
4 2 39.20 40.20 31.90 32.30 33.70 45,90
5 1 33.70 39.50 32.90 30.50 28.50 37.20
5 2 31.50 37.30 32.40 31.90 30.20 31.70
6 1 35.00 41.00 38.70 37.10 35.80 40.00
6 2 27.20 36.10 34.70 36.30 34.10 40.60
7 1 28.00 36.50 30.70 34.60 34.30 38.60
7 2 28.40 31.30 48.10 43.70 35.10 34.70
8 1 22.90 28.40 25.70 28.20 32.30 34.80
8 2 41.40 41.80 29.50 29,90 31.30 39.00

a1¼Citrato de sodio; 2¼placebo.


Fuente: Datos proporcionados por cortesía del Dr. Jeffrey A. Potteiger.

45.Teitge et al. (A-48) describen un método radiográfico para demostrar la inestabilidad rotuliana. Los 90
sujetos tenían entre 13 y 52 años de edad y se dividieron en los siguientes cuatro grupos según los
hallazgos clínicos relacionados con la naturaleza de la inestabilidad de la rodilla: normal (sin síntomas
o signos relacionados con la rodilla), lateral, medial, e inestabilidad multidireccional. Entre los datos
recopilados se encontraban las siguientes mediciones radiográficas del ángulo de congruencia
(grados):
394 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Normal Lateral Medio multidireccional


-8 4 12 - dieciséis 10 15
- dieciséis 18 -8 - 25 -5 - 26
- 22 5 -8 20 - 10 -8
- 26 -6 - 20 -8 - 12 - 12
-8 32 -5 8 - 14 - 40
12 30 - 10 - 14 - 20
-8 - 10 - 18 - dieciséis

12 28 -4 - 34
- 20 6 - 20 - 14
- 20 9 - 20 -6
-5 10 - 20 - 35
10 20 - 22 - 24
-4 -9 - 15 - 25
-2 - 10 - 10 10
-6 12 -5 - dieciséis

-7 0 -5 - 30
0 35 -6 - 30
-2 -1 - 15
- 15 5 - 25
-5 22 - 10
22 - 20
Fuente: Datos proporcionados por cortesía del Dr. Robert A. Teitge.

46.Un estudio de Ikeda et al. (A-49) fue diseñado para determinar la dosis de aerosol de bromuro de ipratropio que mejora
el rendimiento del ejercicio usando cicloergometría progresiva en pacientes con enfermedad pulmonar obstructiva
crónica estable. La edad media de los 20 sujetos masculinos fue de 69,2 años con una desviación estándar de 4 a 0,6
años. Entre los datos recopilados se encuentran los siguientes: ventilación máxima
VEmáx;Valores L=min en el ejercicio máximo alcanzado para diferentes niveles de dosificación de bromuro de ipratropiod
metrogramoÞ:

Placebo 40 80 160 240

26 24 23 25 28
38 39 43 43 37
49 46 54 57 52
37 39 39 38 38
34 33 37 37 41
42 38 44 44 42
23 26 28 27 22
38 41 44 37 40
37 37 36 38 39
33 35 34 38 36
40 37 40 46 40
52 58 48 58 63
45 48 47 51 38
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 395

Placebo 40 80 160 240

24 30 23 27 30
41 37 39 46 42
56 54 51 58 58
35 51 49 51 46
28 41 37 33 38
28 34 34 35 35
38 40 43 39 45
Fuente: Datos proporcionados por cortesía del Dr. Akihiko Ikeda.

47.Pertovaara et al. (A-50) compararon el efecto de la temperatura de la piel sobre el umbral crítico de temperatura que
provoca el dolor por calor con el efecto de la temperatura de la piel sobre la latencia de respuesta a la primera
sensación de dolor por calor. Los sujetos eran adultos sanos entre las edades de 23 y 54 años. Entre los datos
recopilados se encuentran las siguientes latencias (segundos) de la primera respuesta de dolor inducida por la
estimulación con calor radiante a tres temperaturas diferentes de la piel:

Sujeto 25C 30C 35C

1 6.4 4.5 3.6


2 8.1 5.7 6.3
3 9.4 6.8 3.2
4 6.75 4.6 3.9
5 10 6.2 6.2
6 4.5 4.2 3.4
Fuente: Datos proporcionados por cortesía del Dr. Antti Pertovaara.

48.Knight et al. informaron sobre un estudio para el desarrollo y validación de un método sensible y
específico para cuantificar las concentraciones totales de activina-A. (A-51). Como parte del estudio,
recolectaron las siguientes concentraciones séricas periféricas de activina-A en sujetos humanos de
diferente estado reproductivo: fase folicular normal (FP), fase lútea normal (LP), embarazada (PREG),
ovario hiperestimulado para la fertilización in vivo ( HYP), posmenopáusicas (PM) y varones adultos
normales. Sugerencia: convierta las respuestas en logaritmos antes de realizar el análisis.

FP LP EMBARAZO HYP PM Masculino

134.5 78.0 2674.0 253.1 793.1 196.7


159.2 130.4 945.6 294.3 385.1 190.6
133.2 128.3 5507.6 170.2 270.9 185.3
225.0 166.4 7796.5 219.8 640.3 335.4
146.4 115.2 5077.5 165.8 459.8 214.6
180.5 148.9 4541.9 159.0

Fuente: Datos proporcionados por cortesía del Dr. Philip G. Knight.

49.El propósito de un estudio de Maheux et al. (A-52) fue evaluar el efecto del trabajo sobre la producción de
glucosa y la utilización de glucosa. Los sujetos fueron seis mujeres embarazadas normales. Entre los datos
396 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

se recolectaron las siguientes concentraciones de glucosa durante cuatro etapas del trabajo de parto: fases
latente (A1) y activa (A2) de dilatación cervical, expulsión fetal (B) y expulsión placentaria (C).

A1 A2 B C

3.60 4.40 5.30 6.20


3.53 3.70 4.10 3.80
4.02 4.80 5.40 5.27
4.90 5.33 6.30 6.20
4.06 4.65 6.10 6,90
3.97 5.20 4.90 4.60
Fuente: Datos proporcionados por cortesía del Dr. Pierre C. Maheux.

50Trachtmann et al. (A-53) realizaron estudios (1) para evaluar el efecto del IGF-I humano recombinante (rh) en la nefropatía
crónica por puromicina aminonucleósido (PAN) y (2) para comparar los resultados del tratamiento con rhIGF-I versus
rhGH en un modelo de Glomeruloesclerosis focal y segmentaria. Como parte de los estudios, ratas macho Sprague-
Dawley se dividieron en cuatro grupos: PAN (IA), PANþrhIGF-I (IB), normal (IIA) y normalþrhIGF-I (IIB). Los animales
arrojaron los siguientes datos sobre los niveles de creatinina antes (pre) y después de 4, 8 y 12 semanas de
tratamiento:

Grupo

IA BI IIA IIB

Pre

44 44 44 35
44 44 44 44
44 44 44 44
53 44 44 35
44 44
44 53

4 semanas

97 44 53 44
88 35 44 53
62 44 44 53
53 35 53 44
62 62
53 53

8 semanas

53 53 62 44
53 53 53 62
44 53 62 44
53 44 53 44
62 53
70 62

(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 397

Grupo

IA BI IIA IIB

12 semanas

88 79 53 53
70 79 62 62
53 79 53 53
70 62 62 53
88 79
88 70
Fuente: Datos proporcionados por cortesía del Dr. Howard Trachtman.

51.Doce hombres sanos, de 22 a 35 años de edad, produjeron la siguiente T sérica3dnmol=LÞniveles a las 0800
horas después de 8 (día 1), 32 (día 2) y 56 (día 3) horas de ayuno, respectivamente. Los sujetos fueron
participantes en un estudio de alteraciones inducidas por el ayuno en la secreción pulsátil de glicoproteínas
realizado por Samuels y Kramer (A-54).

Sujeto T3 Día Sujeto T3 Día Sujeto T3 Día Sujeto T3 Día

1 88 1 2 115 1 3 119 1 4 164 1


1 73 2 2 77 2 3 93 2 4 120 2
1 59 3 2 75 3 3 sesenta y cinco 3 4 86 3

Sujeto T3 Día Sujeto T3 Día Sujeto T3 Día Sujeto T3 Día

5 93 1 6 119 1 7 152 1 8 121 1


5 91 2 6 57 2 7 70 2 8 107 2
5 113 3 6 44 3 7 74 3 8 133 3

Sujeto T3 Día Sujeto T3 Día Sujeto T3 Día Sujeto T3 Día

9 108 1 10 124 1 11 102 1 12 131 1


9 93 2 10 97 2 11 56 2 12 83 2
9 75 3 10 74 3 11 58 3 12 66 3
Fuente: Datos proporcionados por cortesía de la Dra. Mary H. Samuels.

52.Para determinar la naturaleza y el alcance de los cambios neuroconductuales asociados con la toxicidad resultante de la
exposición al exceso de hierro (Fe) en la dieta, Sobotka et al. (A-55) utilizaron ratas Sprague-Dawley macho recién
destetadas como sujetos experimentales. Los investigadores asignaron aleatoriamente a los animales, de acuerdo
con los pesos corporales clasificados, a uno de los cinco grupos de dieta diferenciados en función de la cantidad de Fe
presente: control: 35 (1), 350 (2), 3500 (3), 4 (con deficiencia de hierro). ) (4) y 20.000 (5) ppm, respectivamente. Los
siguientes son los pesos corporales de los animales (gramos) al final de las 10 semanas.

Dieta Peso Dieta Peso Dieta Peso

1 396 1 335 1 373


2 368 2 349 4 292
3 319 3 302 5 116
(Continuado)
398 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

Dieta Peso Dieta Peso Dieta Peso

4 241 4 220 4 291


5 138 5 118 5 154
1 331 1 394 4 281
2 325 2 300 5 118
3 331 3 285 4 250
4 232 4 237 5 119
5 116 5 113 4 242
1 349 1 377 5 118
2 364 2 366 4 277
3 392 3 269 5 104
4 310 4 344 5 120
5 131 5 Muerto 5 102
1 341 1 336
2 399 2 379
3 274 3 195
4 319 4 277
5 131 5 148
1 419 1 301
2 373 2 368
3 Muerto 3 308
4 220 4 299
5 146 5 Muerto

Fuente: Datos proporcionados por cortesía del Dr. Thomas J. Sobotka.

53.Hansen (A-56) señala que las concentraciones de bilirrubina cerebral aumentan por la hiperosmolaridad y la hipercarbia,
y que los estudios anteriores no han abordado la cuestión de si el aumento de la bilirrubina cerebral en diferentes
condiciones se debe a los efectos sobre la entrada o la eliminación de la bilirrubina del cerebro. En un estudio,
planteó la hipótesis de que la cinética del aumento de la concentración de bilirrubina cerebral diferiría en la acidosis
respiratoria (hipercarbia) y la hiperosmolaridad. Se sacrificaron cuarenta y cuatro ratas Sprague-Dawley macho
adultas jóvenes en varios períodos de tiempo después de la infusión con bilirrubina.
Los siguientes son los niveles de bilirrubina en sangre.dmetromol=LÞde 11 animales justo antes del sacrificio 60 minutos
después del inicio de la infusión de bilirrubina:

Control S hipercarbia Hiperosmolalidad

30 48 102
94 20 118
78 58 74
52 74
Fuente: Datos proporcionados por cortesía del Dr. Thor Willy Ruud Hansen.

54.Johanson et al. (A-57) compararon los efectos de tratamientos a corto plazo con hormona de crecimiento (GH) y factor de
crecimiento similar a la insulina I (IGF-I) sobre marcadores bioquímicos del metabolismo óseo en hombres con
osteoporosis idiopática. Los sujetos tenían entre 32 y 57 años de edad. Entre los datos recopilados se encontraban las
siguientes concentraciones séricas de proteína de unión a IGF-3 a los 0 y 7 días después de la primera inyección y 1,
4, 8 y 12 semanas después de la última inyección con GH e IGF-I.
PREGUNTAS DE REPASO Y EJERCICIOS 399

Número de paciente Tratamiento 0 Día 7 días 1 semana 4 semanas 8 semanas 12 semanas

1 GH 4507 4072 3036 2484 3540 3480


1 IGF-I 3480 3515 4003 3667 4263 4797
2 GH 2055 4095 2315 1840 2483 2354
2 IGF-I 2354 3570 3630 3666 2700 2782
3 GH 3178 3574 3196 2365 4136 3088
3 IGF-I 3088 3405 3309 3444 2357 3831
4 GH 3464 5874 2929 3903 3367 2938
4 IGF-I 2905 2888 2797 3083 3376 3464
5 GH 4142 4465 3967 4213 4321 4990
5 IGF-I 4990 4590 2989 4081 4806 4435
6 GH 3622 6800 6185 4247 4450 4199
6 IGF-I 3504 3529 4093 4114 4445 3622
7 GH 5390 5188 4788 4602 4926 5793
7 IGF-I 5130 4784 4093 4852 4943 5390
8 GH 3161 4942 3222 2699 3514 2963
8 IGF-I 3074 2691 2614 3003 3145 3161
9 GH 3228 5995 3315 2919 3235 4379
9 IGF-I 4379 3548 3339 2379 2783 3000
10 GH 5628 6152 4415 5251 3334 3910
10 IGF-I 5838 5025 4137 5777 5659 5628
11 GH 2304 4721 3700 3228 2440 2698
11 IGF-I 2698 2621 3072 2383 3075 2822
Fuente: Datos proporcionados por cortesía de la Dra. Anna G. Johansson.

55.El objetivo de un estudio de Strijbos et al. (A-58) fue comparar los resultados de un programa de rehabilitación para pacientes
ambulatorios en un hospital de 12 semanas (grupo 1) con los de un programa de rehabilitación de atención domiciliaria de 12
semanas (grupo 2) en la enfermedad pulmonar obstructiva crónica con limitación del flujo de aire de moderada a grave . Un
grupo de control (grupo 3) no recibió terapia de rehabilitación. Entre los datos recopilados se encuentran las siguientes
puntuaciones de frecuencia respiratoria de los sujetos 18 meses después de la rehabilitación:

Grupo Grupo

1 2 3 1 2 3

12 dieciséis 24 12 dieciséis 24
dieciséis 14 dieciséis 12 12 14
dieciséis 12 18 14 12 15
14 12 18 dieciséis 12 dieciséis

12 18 24 12 12 dieciséis

12 12 24 12 15 18
12 10 18 20 dieciséis

Fuente: Datos proporcionados por cortesía del Dr. Jaap H. Strijbos.

56.Siete hombres sanos (edad media de 27,4 años con una desviación estándar de 4,4) participaron en un estudio
de Lambert et al. (A-59), que midió la absorción intestinal tras la ingestión oral y la perfusión intestinal de un
líquido. Como parte del estudio, los investigadores registraron los siguientes cambios porcentuales en
400 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

volumen de plasma en seis puntos durante 85 minutos de ejercicio en bicicleta en los experimentos de
bebida e infusión:

Sujeto 1 2 3

1 - 8.4151514 - 7.4902674 - 8.02277330


2 - 12.1966790 - 5.1496679 - 10.46486300
3 - 9.7418719 - 5.9062747 - 7.06516950
Bebiendo 4 - 15.0291920 - 14.4165470 - 16.61268200
5 - 5.8845683 - 5.8845683 - 3.57781750
6 - 9.7100000 - 7.5700000 - 3.52995560
7 - 6.9787024 - 6.5752716 - 5.07020210

1 - 13.5391010 - 11.7186910 - 10.77312900


2 - 8.8259516 - 8.9029745 - 6.38160030
3 - 4.2410016 - 1.3448910 - 2.49740390
Infusión 4 - 10.7192870 - 9.7651132 - 11.12140900
5 - 6.9487760 - 2.9830660 1.77828157
6 - 7.1160660 - 5.4111706 - 7.07086340
7 - 7.0497788 - 5.7725485 - 5.18045500

Sujeto 4 5 6

1 - 7.35202650 - 7.89172340 - 7.84726700


2 - 8.40517240 - 9.02789810 5.13333985
3 - 4.19974130 - 3.33795970 - 5.65380700
Bebiendo 4 - 15.36239700 - 17.63314100 - 14.43982000
5 - 5.50433470 - 5.12242600 - 6.26313790
6 - 4.22938570 - 7.86923080 - 7.51168220
7 - 5.94416340 - 5.21535350 - 6.34285620

1 - 11.64145400 - 12.40814000 - 8.26411320


2 - 5.69396590 - 6.38160030 - 7.37350920
3 - 1.01234570 - 5.58572150 - 2.81811090
Infusión 4 - 12.13053100 - 15.98360700 - 12.64667500
5 2.28844839 2.59034233 1.56622058
6 - 8.35430040 - 10.60663700 - 9.45689580
7 - 7.92841880 - 8.38462720 - 8.44542770

Fuente: Datos proporcionados por cortesía del Dr. CV Gisolfi.

57.Romer et al. (A-60) desarrolló una medida de autoinforme del trastorno de ansiedad generalizada (TAG)
para usar con poblaciones de estudiantes universitarios. En los estudios de confiabilidad, los sujetos
de pregrado completaron el cuestionario GAD (GAD-Q), así como el Cuestionario de Preocupación de
Penn State (PSWQ). Las siguientes son las puntuaciones del PSWQ realizadas por cuatro grupos de
sujetos determinados por su estado de GAD: GAD por cuestionario, Estudio II (grupo 1); no TAG por
cuestionario, Estudio II (grupo 2); GAD por cuestionario, Estudio I (grupo 3); y TAG clínico (grupo 4).
PREGUNTAS DE REPASO Y EJERCICIOS 401

Grupo

1 2 3 4
59.0 50.0 46,0 65,0 65,0
51.0 28,0 77.0 62.0 66,0
58.0 43.0 80.0 76.0 69.0
61.0 36,0 60.0 66,0 73.0
64.0 36,0 59.0 78.0 67.0
68.0 30.0 56,0 76.0 78.0
64.0 24.0 44.0 74.0 76.0
67.0 39.0 71.0 73.0 66,0
56,0 29,0 54.0 61.0 55,0
78.0 48.0 64.0 63.0 59.0
48.0 36,0 66,0 75,0 44.0
62.0 38.0 59.0 63.0 68.0
77.0 42.0 68.0 55,0 64.0
72.0 26,0 59.0 67.5 41.0
59.0 35,0 61.0 70.0 54.0
32,0 78.0 70.0 72.0
43.0 70.0 55,0 74.0
55,0 74.0 73.0 59.0
42.0 73.0 80.0 63.0
37.0 79.0 51.0
36,0 79.0 72.0
41.0 61.0 63.0
36,0 61.0 58.0
34,0 72.0 71.0
42.0 67.0
35,0 74.0
51.0 65,0
37.0 68.0
50.0 72.0
39.0 75,0
56,0
Fuente: Datos proporcionados por cortesía del Dr. TD Borkovec.

58.Teniendo en cuenta que los linfomas no Hodgkin (LNH) representan un grupo heterogéneo de enfermedades en las que
el pronóstico es difícil de predecir, Christiansen et al. (A-61) informan sobre los aspectos pronósticos de la molécula
de adhesión intercelular soluble 1 (sICAM-1) en el LNH. Entre los datos recopilados se encontraban los siguientes
niveles séricos de sICAM-1 (ng/ml) en cuatro grupos de sujetos: controles sanos (C), LNH de alto grado (hNHL), LNH
de bajo grado (1NHL) y pacientes con enfermedad de células pilosas. leucemia (HCL).

C hNHL LNH HCL

309 460 844 824 961 581 382


329 222 503 496 1097 601 975
314 663 764 656 1099 572 663
(Continuado)
402 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

C hNHL LNH HCL

254 1235 1088 1038 625 439 429


304 500 470 1050 473 1135 1902
335 739 806 446 654 590 1842
381 1847 482 1218 508 404 314
456 477 734 511 454 382 430
294 818 616 317 889 692 645
450 585 836 334 805 484 637
422 1837 1187 1026 541 438 712
528 362 581 534 655 787 581
461 671 381 292 654 77 860
286 375 699 782 1859 478 448
309 543 1854 1136 619 602 735
226 352 769 476 1837 802
388 443 510 534 568
377 359 571 424 665
310 383 1248 571
261 587 784 420
350 648 514 408
405 782 678 391
319 472 1264 493
289 506 618 1162
310 663 1123 460
227 873 912 1113
206 987 520 572
226 859 1867 653
309 1193 485 1340
382 1836 287 656
325 691 455
522
Fuente: Datos proporcionados por cortesía de la Dra. Ilse Christiansen.

59.Cossette et al. (A-62) examinó el género y el parentesco con respecto al uso de apoyo formal e informal por
parte de los cuidadores y a dos modelos de apoyo. Entre los datos recopilados se encuentran las siguientes
edades de tres grupos de cuidadores de un pariente demente que vive en el hogar: esposos, esposas e hijas
adultas.

Marido Esposa Hija

64 66 73 59 67 40 50
70 58 71 66 67 47 58
55 81 70 80 57 46 46
67 77 71 76 53 45 47
79 76 56 68 50 69 50
67 64 68 53 70 48 53
77 82 76 78 70 53 57
68 85 67 75 50 sesenta y cinco

72 63 66 74 47 50
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 403

Marido Esposa Hija

67 72 67 86 62 43
77 77 72 63 55 59
70 79 72 52 49 44
sesenta y cinco 63 70 55 43 45
sesenta y cinco 80 66 71 44 41
74 70 73 67 47 50
86 85 78 78 57 58
72 76 64 70 49 35
71 67 78 68 50
78 72 59 78 59
71 60 71 59 45
88 74 70 72 50
77 sesenta y cinco 67 73 48
75 53 78 75 51
66 70 67 54 46
80 72 55 sesenta y cinco 62
76 74 64 67 55
67 79 69 83 50
sesenta y cinco 63 59 70 43
62 77 55 72 39
82 78 75 71 50
75 69 68 76 50
80 sesenta y cinco 74 43
74 81 68 28
70 79 69
75 72
Fuente: Datos proporcionados por cortesía de Sylvie Cossette, M.Sc., RN

60Tasaka et al. (A-63) tenga en cuenta queCorynebacterium parvum (CP) aumenta la susceptibilidad a la
endotoxina, que se asocia con una mayor producción de factor de necrosis tumoral (TNF). Investigaron el
efecto del cebado con CP en la patogenia de la lesión pulmonar aguda causada porEscherichia coli
endotoxina (lipopolisacárido [LPS]). Los animales de experimentación consistieron en cobayas hembra
divididas en cuatro grupos. Los animales en dos grupos recibieron un tratamiento de 4 mg/kg de CP 7 días
antes del estudio. Posteriormente, los animales no pretratados recibieron solución salina sola (Control) o
endotoxina (LPSalone). Los grupos pretratados recibieron solución salina (CP-solo) o LPSdPCþLPSÞ.Entre los
datos recopilados se encuentran los siguientes valores de la proporción de tejido pulmonar a plasma del
ensayo de albúmina sérica radioyodada:

Control CP solo LPS solo PCþLPS

0.12503532 0.18191647 0.17669093 0.3651166


0.10862729 0.30887462 0.25344761 0.64062964
0.10552931 0.25011885 0.17372285 0.39208734
0.15587316 0.23858085 0.1786867 0.49942059
0.13672624 0.26558231 0.22209666 0.85718475
0.11290446 0.32298454 0.27064831 0.93030465

Fuente: Datos proporcionados por cortesía del Dr. Sadatomo Tasaka.


404 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

61.Según Takahashi et al. (A-64) investigaciones indican que existe una asociación entre alteraciones en el
metabolismo del calcio y diversas enfermedades óseas en pacientes con otras discapacidades. Usando
sujetos con retraso mental severo (edad promedio de 16 años) que habían vivido en instituciones la mayor
parte de sus vidas, Takahashi et al. examinó la relación entre el cambio óseo y otras variables. Los sujetos se
dividieron en grupos sobre la base de la gravedad del cambio óseo. Entre los datos recopilados se
encuentran los siguientes valores de fosfatasa alcalina sérica (UI/L):

Grado I: 109, 86, 79, 103, 47, 105, 188, 96, 249
Grado II: 86, 106, 164, 146, 111, 263, 162, 111
Grado III: 283, 201, 208, 301, 135, 192, 135, 83, 193, 175, 174, 193, 224, 192,
233
Fuente: Datos proporcionados por cortesía del Dr. Mitsugi Takahashi.

62.Las investigaciones indican que la deficiencia de cobre en la dieta reduce la tasa de crecimiento en ratas. En un estudio relacionado,
Allen (A-65) asignó ratas macho Sprague-Dawley recién destetadas a uno de tres grupos de alimentos: deficientes en cobre
(CuD), adecuadas en cobre (CuA) y alimentadas en pareja (PF). Las ratas en el grupo PF fueron inicialmente emparejadas en
peso con las ratas del grupo CuD y luego alimentadas con el mismo peso de la dieta CuA que el consumido por sus
contrapartes CuD. Después de 20 semanas, se anestesiaron las ratas, se extrajeron muestras de sangre y se extrajeron los
órganos. Como parte del estudio se recopilaron los siguientes datos:

Cuerpo Corazón Hígado Riñón Bazo


peso peso peso peso peso
Rata Dieta (BW)(g) (HW)(g) (LW)(g) (KW)(g) (SO)(g)

1 253.66 0.89 2.82 1.49 0.41


2 400.93 1.41 3.98 2.15 0.76
3 Rumia 355.89 1.24 5.15 2.27 0,69
4 404.70 2.18 4.77 2.99 0.76

6 397.28 0.99 2.34 1.84 0.50


7 421.88 1.20 3.26 2.32 0.79
8 FP 386.87 0.88 3.05 1.86 0.84
9 401.74 1.02 2.80 2.06 0.76
10 437.56 1.22 3.94 2.25 0.75

11 490.56 1.21 4.51 2.30 0.78


12 528.51 1.34 4.38 2.75 0.76
13 CuA 485.51 1.36 4.40 2.46 0.82
14 509.50 1.27 4.67 2.50 0.79
15 489.62 1.31 5.83 2.74 0.81

HW/BW L/B/B/N KW/BW SO/BW ceruloplasmina


Rata Dieta (g/100g) (g/100g) (g/100g) (g/100g) (mg/dl)

1 0.00351 0.01112 0.00587 0.00162 Dakota del Norte

2 0.00352 0.00993 0.00536 0.00190 5.27


3 Rumia 0.00348 0.01447 0.00638 0.00194 4.80
4 0.00539 0.01179 0.00739 0.00188 4.97

(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 405

HW/BW L/B/B/N KW/BW SO/BW ceruloplasmina


Rata Dieta (g/100g) (g/100g) (g/100g) (g/100g) (mg/dl)

6 0.00249 0.00589 0.00463 0.00126 35.30


7 0.00284 0.00773 0.00550 0.00187 39.00
8 FP 0.00227 0.00788 0.00481 0.00217 28.00
9 0.00254 0.00697 0.00513 0.00189 34.20
10 0.00279 0.00900 0.00514 0.00171 45.20

11 0.00247 0.00919 0.00469 0.00159 34.60


12 0.00254 0.00829 0.00520 0.00144 39.00
13 CuA 0.00280 0.00906 0.00507 0.00169 37.10
14 0.00249 0.00917 0.00491 0.00155 33.40
15 0.00268 0.01191 0.00560 0.00165 37.30

nd, sin datos.


Fuente: Datos proporcionados por cortesía de Corrie B. Allen.

63.Hughes et al. (A-66) señalan que las complicaciones sistémicas en la pancreatitis aguda son en gran parte responsables
de la mortalidad asociada a la enfermedad. Señalan además que las citocinas proinflamatorias, particularmente el
TNFa,puede desempeñar un papel central en la pancreatitis aguda al mediar en las secuelas sistémicas. En su
investigación, utilizaron un modelo de infusión de bilis de pancreatitis aguda para mostrar una mejora en la gravedad
de la enfermedad, así como una mejora en la supervivencia general por TNF.ainhibición. El material experimental
consistió en ratas Sprague-Dawley macho adultas con un peso entre 250 y 300 gramos divididas en tres grupos: sin
tratar (solución biliar infundida sin tratamiento); tratados (solución biliar infundida precedida de tratamiento con anti
- TNF policlonalaanticuerpo); y simulado (infundido con solución salina). Entre los datos recopilados se encuentran los
siguientes valores de hematocrito (%) para animales que sobreviven más de 48 horas:

Impostor sin tratar tratado

38 56 40
40 60 42
32 50 38
36 50 46
40 50 36
40 35
38 40
40 40
38 55
40 35
36
40
40
35
45
Fuente: Datos proporcionados por cortesía
del Dr. A. Osama Gaber.

64.Un estudio de Sm-arason et al. (A-67) fue motivado por las observaciones de otros investigadores de que los sueros de
mujeres preeclámpticas dañaron las células endoteliales humanas cultivadas. Los sujetos del presente estudio fueron
mujeres con preeclampsia, mujeres de control emparejadas con embarazos normales y mujeres no embarazadas.
406 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

las mujeres en edad fértil. Entre los datos recopilados se encontraban las siguientes observaciones sobre una
variable relevante medida en sujetos de los tres grupos.

preeclampsia Controles embarazadas Controles de no embarazadas

113.5 91.4 94.5


106.6 95.6 115.9
39.1 113.1 107.2
95.5 100.8 103.2
43.5 88.2 104.7
49.2 92.2 94,9
99.5 78.6 93.0
102.9 96,9 100.4
101.2 91.6 107.1
104.9 108.6 105.5
75.4 77.3 119.3
71.1 100.0 88.2
73,9 61.7 82.2
76.0 83.3 125.0
81.3 103.6 126.1
72.7 92.3 129.1
75.3 98.6 106.9
55.2 85.0 110.0
90.5 128.2 127.3
55,8 88.3 128.6

Fuente: Datos proporcionados por cortesía del Dr. Alexander Sm-arason.

sesenta y cinco.El objetivo de un estudio de LeRoith et al. (A-68) fue evaluar el efecto de una administración de 7 semanas de
GH humana recombinante (rhGH) y factor de crecimiento similar a la insulina humana recombinante (rhIGF-I) por
separado y en combinación sobre la función inmune en monos rhesus hembras de edad avanzada. El ensayo de la
función in vivo del sistema inmunitario se basó en la respuesta a una inmunización con toxoide tetánico. Las
siguientes son las respuestas para los tres grupos de tratamiento y un grupo de control:

Salina rhIGF-I rhGH rhIGF-IþrhGH

11.2 12.2 12.15 11.5


9.0 9.4 11.20 12.4
10.8 10.7 10.60 10.8
10.0 10.8 11.30 11.9
9.1 11.00 11.0
12.6
Fuente: Datos proporcionados por cortesía del Dr. Jack A. Yanowski.

66.Hampl et al. (A-69) tenga en cuenta que el óxido nítrico (NO) inhalado es un vasodilatador pulmonar selectivo. Plantearon
la hipótesis de que una dietilentriamina/NO nebulizada (DETA/NO) permanecería en las vías respiratorias inferiores y
suministraría continuamente suficiente NO para lograr una vasodilatación sostenida en la hipertensión pulmonar
crónica. El material experimental consistió en ratas Sprague-Dawley adultas, machos, libres de patógenos específicos,
divididas aleatoriamente en cuatro grupos: controles normotensos pulmonares, no tratados;
PREGUNTAS DE REPASO Y EJERCICIOS 407

monocrotalina inyectada (para inducir hipertensión) sin tratamiento (MCT); monocrotalina inyectada tratada
con un 5 -metrodosis mol o 50 -metrodosis mol de DETA/NO. Diecinueve días después de inducir
hipertensión pulmonar en los dos grupos de ratas, los investigadores comenzaron el procedimiento de
tratamiento, que duró 4 días. Recolectaron, entre otros datos, las siguientes mediciones sobre el gasto
cardíaco de los animales en los cuatro grupos:

MCTþDETA/NO
Control MCT 5metromol 50metromol

71.8 42.8 72.5 47.1


66.1 53.2 62,9 86.6
67.6 56.1 58,9 56,0
66.4 56.5 69.3
Fuente: Datos proporcionados por cortesía del Dr. Stephen L. Archer.

Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.En Kreiter et al. (A-70) los exámenes de la escuela de medicina se entregaron a través de formato de computadora. Debido a que no
había suficientes estaciones de computadora para evaluar a toda la clase simultáneamente, los exámenes se administraron durante 2
días. Tanto los estudiantes como los docentes se preguntaron si los estudiantes que toman el examen el día 2 podrían tener una
ventaja debido al tiempo de estudio adicional o una brecha en la seguridad del examen. Por lo tanto, los investigadores examinaron
una gran clase médicadnorte¼193Þevaluado durante 2 días con tres exámenes de opción múltiple de 80 ítems de 2 horas. A los
estudiantes se les asignaron días de prueba a través de una asignación pseudoaleatoria. De interés fue si tomar un examen en
particular el día 1 o el día 2 tuvo un impacto significativo en las calificaciones. Use el conjunto de datos MEDSCORES para determinar
si la prueba, el día o la interacción tienen un impacto significativo en los puntajes de la prueba. Dejara¼ :05.

2.Consulte los datos de ácido siálico unido a lípidos séricos en 1400 sujetos (LSADATA). Deseamos realizar un estudio
para determinar si la medición del ácido siálico unido a lípidos (LSA) en suero podría ser útil en la detección del
cáncer de mama. Las mediciones de LSA (mg/dl) son para cuatro poblaciones de sujetos: controles normales, A;
pacientes con enfermedad mamaria benigna, B; pacientes con cáncer de mama primario, C; y pacientes con
cáncer de mama metastásico recurrente, D. Seleccione una muestra aleatoria simple de tamaño 10 de cada
población y realice un análisis adecuado para determinar si podemos concluir que las medias de las cuatro
poblaciones son diferentes. Dejara¼ :05 y determinar elpagvalor. Pruebe todos los posibles pares de medias
muestrales para determinar su significancia. ¿Qué conclusiones se pueden sacar del análisis? Preparar un
informe verbal de los hallazgos. Compara tus resultados con los de tus compañeros.

3.Consulte los datos de la enzima convertidora de angiotensina sérica en 1600 sujetos (SACEDATA). La sarcoidosis,
que se encuentra en todo el mundo, es una enfermedad granulomatosa sistémica de causa desconocida. El
análisis de la enzima convertidora de angiotensina sérica (SACE) es útil en el diagnóstico de sarcoidosis activa. La
actividad de SACE suele estar aumentada en pacientes con la enfermedad, mientras que los niveles normales
ocurren en sujetos que no han tenido la enfermedad, aquellos que se han recuperado y pacientes con otros
trastornos granulomatosos. Los datos son los valores de SACE para cuatro poblaciones de sujetos clasificados
según el estado con respecto a la sarcoidosis: nunca tuvo, A; activo, B; estable, C; recuperado, D. Seleccione una
muestra aleatoria simple de 15 sujetos de cada población y realice un análisis para determinar si puede concluir
que las medias de la población son diferentes. Dejara¼ :05. Use la prueba de Tukey para probar diferencias
significativas entre pares de medias individuales. Prepare un informe escrito sobre sus hallazgos. Compara tus
resultados con los de tus compañeros.
408 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

4.Consulte los datos del factor estimulante de colonias urinarias en 1500 sujetos (CSFDATA). Los datos son los niveles
del factor estimulante de colonias urinarias (LCR) en cinco poblaciones: sujetos normales y sujetos con cuatro
enfermedades diferentes. Cada observación representa el recuento medio de colonias de cuatro placas de una
única muestra de orina de un sujeto determinado. Seleccione una muestra aleatoria simple de tamaño 15 de
cada una de las cinco poblaciones y realice un análisis de varianza para determinar si se puede concluir que las
medias de la población son diferentes. Dejara¼ :05. Use la estadística HSD de Tukey para probar diferencias
significativas entre todos los pares posibles de medias muestrales. Prepare un informe narrativo sobre los
resultados de su análisis. Compara tus resultados con los de tus compañeros.
5.Consulte los datos de glóbulos rojos en 1050 sujetos (RBCDATA). Suponga que usted es un consultor estadístico de
un investigador médico que está interesado en aprender algo sobre la relación entre las concentraciones de
folato en sangre en mujeres adultas y la calidad de su dieta. El investigador tiene disponibles tres poblaciones de
sujetos: aquellos cuya calidad de la dieta es calificada como buena, aquellos cuyas dietas son regulares y aquellos
con dietas deficientes. Para cada sujeto también está disponible su valor de folato de glóbulos rojos (RBC) (en
metrog=litro de glóbulos rojos). Extraiga una muestra aleatoria simple de tamaño 10 de cada población y
determine si el investigador puede concluir que las tres poblaciones difieren con respecto al valor medio de
folato en los glóbulos rojos. Usa la prueba de Tukey para hacer todas las comparaciones posibles. Dejara¼ :05 y
encuentra elpagvalor de cada prueba. Compara tus resultados con los de tus compañeros.

6.Consulte los datos de colesterol sérico en 350 sujetos con tres regímenes dietéticos (SERUMCHO). Un total
de 347 hombres adultos de entre 30 y 65 años participaron en un estudio para investigar la relación
entre el consumo de carne y los niveles de colesterol sérico. Cada sujeto comió carne de res como única
carne durante un período de 20 semanas, cerdo como única carne durante otro período de 20 semanas y
pollo o pescado como única carne durante otro período de 20 semanas. Al final de cada periodo
determinaciones de colesterol séricodmg=100mlÞse realizaron sobre cada tema. Seleccione una muestra
aleatoria simple de 10 sujetos de una población de 350. Use un análisis de varianza de dos vías para
determinar si se debe concluir que existe una diferencia en los niveles de colesterol sérico promedio de
la población entre las tres dietas. Dejara¼ :05. Compara tus resultados con los de tus compañeros.

REFERENCIAS

Referencias de metodología
1. AR FES ELLA,El diseño de experimentos,Octava edición, Oliver and Boyd, Edimburgo, 1966.
2. RA FES ELLA,Contribuciones a la Estadística Matemática,Wiley, Nueva York, 1950.
3. RA FES ELLA,Métodos estadísticos para investigadores,Decimocuarta edición, Hafner, Nueva York, 1973.
4. kLAÚSHINKELMANNy OCICATRIZkEMPTHORNE,Diseño y análisis de experimentos,Edición revisada, Wiley, Nueva York,
1994.
5. DOUGLASCMONGOMERÍA,Diseño y análisis de experimentos,Cuarta edición, Wiley, Nueva York, 1997.
6. J.EROMELMSÍy unRNOLDD. W.ANA,Diseño de Investigación y Análisis Estadístico,Earlbaum Associates, Hillsdale,
Nueva Jersey, 1995.
7. J.UN HIJOCHSU,Comparaciones Múltiples: Teoría y Métodos,Chapman & Hall, Nueva York, 1996.
8. P.ETERH WESFALL, RY TODODTOBÍAS, DTDRROM, RUSSELLD. W.OLFINGER, y YOSEFHOCHBERG,Múltiple
Comparaciones y Pruebas Múltiples,SAS Publishing, Cary, Carolina del Norte, 2001.
9. JW TUKEY, “El problema de las comparaciones múltiples”, Monografía mimeografiada, Universidad de Princeton, 1953;
citado en Yosef Hochberg y Ajit C. Tamhane,Procedimientos de comparación múltiple,John Wiley and Sons, Nueva
York, 1987.
10. BJWINER,Principios estadísticos en diseño experimental, segunda edición,McGraw-Hill, Nueva York, 1971.
11. CY KRAMERO, “Extensión de pruebas de rangos múltiples a medias grupales con tamaños de muestra desiguales,”biometría, 63
(1956), 307–310.
REFERENCIAS 409

Aplicaciones Referencias
A-1 DÁVIDOS.SOLBÉN, "Contenido de selenio de venado, ardilla y carne de res comprada o producida en Ohio, una región baja en
selenio de los Estados Unidos",Revista de ciencia de los alimentos, 67 (2002), 431–433.
A-2 WD MASCUA, WM MURRY, SEÑORINGLEB, KL KILGORE, y SA SNYDER, “Un transductor para medir momentos de codo
isométricos,”Biomecánica clínica, 16 (2001), 918–920.
A-3 jOHNPHolcomby RALFAJROTHENBERG, "La eficacia de alendronato y etidronato en la práctica
clínica" (manuscrito no publicado).
A-4 jASMINKAILICH-MIRNST, RHONDAABROWNBILL, mARTHAA. L.UDEMANNy RONGWEIFtu, “Factores críticos para el hueso
Salud en mujeres de todas las edades: ¿Qué tan importante es la masa muscular?Revista electrónica de salud de la mujer de Medscape, 7
(2002).
A-5 PAGAULBGVIEJO, ROBERTOnrUBEYy RICHARDTHARVEY, “Estudio comparativo naturalista y autoasignado de bupropion SR, un
parche de nicotina o ambos para el tratamiento para dejar de fumar en la atención primaria”Revista estadounidense
sobre adicciones, 11 (2002), 315–331.
A-6 X. W.ESP, X.SGALLINA, X.LI, y C. M.AULIAGRAWAL, “Cambios relacionados con la edad en la red de colágeno y dureza del
hueso,”Hueso, 31 (2002), 1–7.
A-7 FARHADATASSI, “Cuidado oral en el hogar y las razones para buscar atención dental por parte de personas en diálisis renal”,
Revista de práctica dental contemporánea, 3 (2002), 031–041.
A-8 SSOY UNORAGAZZI, AGOSTINOPAGIERRO, mARCAPAGÉTERES, LORELLAFASOLI, y SESTOY ENmiATÓN, “Hemograma completo temprano y
Gravedad de la enfermedad en recién nacidos con enterocolitis necrotizante”,Cirugía Pediátrica Internacional, 19 (2003), 376–
379.
A-9 ROBERTAROMITIR, mARIAIADPAGANSINI, FRANCESCOPAGERTICON, gIAN FRANCOANTONELLI, mARIAVITTORIAPAGITZALIS, y
PAGAOLORIZZÓN, “Efecto comparativo de los FITS de lercanidipina, felodipina y nifedipina sobre la presión arterial y la
frecuencia cardíaca en pacientes con hipertensión arterial de leve a moderada: el estudio de lercanidipina en adultos
(LEAD)”,Revista de Hipertensión Clínica, 5 (2003), 249–253.
A-10 Lkosmiski, D. K.URITZKES, J HAMILTON, T. S.ARPA, K. L.ICHTENSTIEN, J HENFERMOy R. E.CKEL, “La distribución de grasa se altera en
hombres infectados por el VIH sin evidencia clínica del síndrome de lipodistrofia del VIH”,Medicina del VIH, 4 (2003),
235–240.
A-11 BM BTORRES, FD ROSE, EAÁRBOL, y A. E.LLIOT-SCUADRADO, “Evaluación de la eficacia de la formación de personas con
problemas de aprendizaje en un entorno virtual”,Discapacidad y Rehabilitación, 24 (2002), 622–626.
A-12 BRIANJ. M.CCONVILLE, MHAROLDFOGELSON, ANDREWB. N.ORMAN, WILLIAMMKLYKYLO, PAGENZ MANDERSCHEID,
kARÉNWPARKER, y PAULR. S.ANBERG, "Potenciación de la nicotina del haloperidol en la reducción de la frecuencia de los tics en el
trastorno de Tourette",Diario Americano de Psiquiatría, 148 (1991), 793–794.
A-13 YO VALENCIA, GMCnorteEILL, JM BROCKWAY, y JS SMITO, "El efecto de la temperatura y la humedad ambientales en el gasto
energético de 24 horas en los hombres",Revista británica de nutrición, 68 (septiembre de 1992), 319–327. DSHODGSON,
A-14 CI DDESBLOQUEAR, PL CHAPMAN, y JL GCACHONDO, "Respuestas cardiopulmonares a la dilatación gástrica inducida
experimentalmente en perros anestesiados con isoflurano"Diario Americano de Investigación Veterinaria, 53 (junio
de 1992), 938–943.
A-15 jOHNC LICCIARDONE, SCOTTT. S.PEAJE, kIMBERLYG. F.ULDA, DÁVIDOPROSS, jFEPSIU, WILLIAMWPOSADAy J.OHN
SWIFT, Jr., "Tratamiento de manipulación osteopática para el dolor lumbar crónico: un ensayo controlado aleatorio" Columna
vertebral, 28 (2003), 1355–1362.
A-16 Centro Médico Mid-Michigan, Midland, Michigan, 1999; Aestudio de la condición oral de los pacientes con cáncer.Disponible
en línea en:http://calcnet.mth.cmich.edu/org/spss/Prj_cancer_data.htm.
A-17 YITAOLIU, LUDMILABELAYEV, WEIZHAOZHAO, RAULBUSTO, y MYRONDGINSBURG, “MRZ 2/579, una novela
poco competitivoNORTE-Antagonista de metil-D-aspartato, reduce el volumen del infarto y la inflamación del cerebro y mejora el déficit
neurológico después de la isquemia cerebral focal en ratas”,Investigación del cerebro, 862 (2000), 111–119.
A-18 DÁVIDOWSTARCH, jERRYWALEXANDER, PAGHILIPCNOBLEA, SURAJRREMOLINO, y DÁVIDOMLINTERNO, “Multitrenzado
Fijación del injerto del tendón de la corva con un tornillo de interferencia tibial estándar o de cuatro cuadrantes
centrales para la reconstrucción del ligamento cruzado anterior.Revista americana de medicina deportiva, 31 (2003),
A-19 338–344. DHOLBÉN, COMOMITO, JILICH, J. L.ANDOLL, J Holcomb, y V. M.ATKOVIK, "La pubertad no afecta negativamente el
estado de selenio en las mujeres jóvenes",Diario de la Asociación Dietética Americana, 102 (2002), 1082–1087.
A-20 AXELLINKE, gONGZHAO, FABIÓA. R.ECCHIA, jEFREYWILLIAMS, XIAOBINXtu, y THOMASS.SINTZE, "Desplazar en
Absorción de sustrato metabólico por el corazón durante el desarrollo de la diabetes inducida por aloxano”,American Journal
of Physiology: corazón y fisiología circulatoria, 285 (2003), H1007–H1014.
410 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

A-21 K. W.ÉTER, IJCHRISTENSEN, y HJNIELSEN, "Determinación del factor de crecimiento endotelial vascular (VEGF) en
sangre circulante: importancia de VEGF en varios leucocitos y plaquetas"Revista escandinava de
investigación clínica y de laboratorio, 62 (2002), 343–350.
A-22 CarolynPORUCHA, SEstados UnidoskOWALSKI, y CTENÍALCROSS. “Estrés Estudiantil y Rendimiento Académico: Programa Hospital
Domiciliario,”Revista de Educación en Enfermería, 48 (2009), 631–637.
A-23 SHIGEKOtuRYU, jNaciones UnidasHARADA, mARIEHISAMOTO, y TOMIICHIROOAD, "La troglitazona inhibe tanto la neurotoxicidad posterior al glutamato
como la apoptosis inducida por bajo contenido de potasio en las neuronas granulares del cerebelo",Investigación del cerebro, 924 (2002),
229–236.
A-24 SOYAIN, JABU-SAAD, RSalternativa, I. V.LACONICOLIS, y A.D.OWSON, "Manejo por parte de enfermeras de la cefalea primaria: un
estudio piloto",Opinión de investigación médica actual, 18 (2002), 471–478.
A-25 SimonaPAGORCELINI, gUILIANAVALLANTÍ, SILVIAnorteOZA, gUIDOPAGOLI, ADRIANOLAzzarín, gUISEPPETABUSI, y
ANTONIOGRAMORASIA, "Potencial timopoyético mejorado en individuos infectados por VIH avirémicos con HAART mediante la
administración intermitente de IL-2",SIDA, 17 (2003), 1621–1630.
A-26 DOROTAIrRECKA, mICHALBENAREK, APRESAnorteOWINSKI, miLZBIETAPAGUSCINSKA, ANNAGRAMOoljan-GRAMOEREMEKy J.UN
ZIELINSKI, "El diagnóstico de limitación del flujo de aire combinado con consejos para dejar de fumar aumenta la tasa de abandono del
hábito de fumar",Cofre, 123 (2003), 1916–1923.
A-27 miLIMETROELTZER, BRUCEMPRENNER, y ANJULInorteAYAK, "Eficacia y tolerabilidad de 5 mg de desloratadina una vez al día, un
antagonista del receptor H1, en pacientes con evaluación de la rinitis alérgica estacional durante las estaciones
alérgicas de primavera y otoño"Investigaciones clínicas de medicamentos, 21 (2001), 25–32.
A-28 K. W.ÉTER, IJCHRISTENSEN, y HJNIELSEN, "Determinación del factor de crecimiento endotelial vascular (VEGF) en
sangre circulante: importancia de VEGF en varios leucocitos y plaquetas"Revista escandinava de
investigación clínica y de laboratorio, 62 (2002), 343–350.
A-29 RUBIAPMESHACKy kATLETAESORMAN, "Un ensayo controlado aleatorio de los efectos de los pesos en la amplitud y
frecuencia del temblor postural de la mano en personas con enfermedad de Parkinson"Rehabilitación Clínica, 16 (
2003), 481–492.
A-30 GLACROIX, CALLEISSOT, FROGERIEUX, R. B.EAULIEU, LCORNU, CGILLETA, FR OBIDEL, JP LEFEVRE, y año fiscal
BOIS, "Disminución de la respuesta alérgica pulmonar inducida por ovoalbúmina por exposición al benzaldehído pero no al
acetaldehído en un modelo de conejillo de Indias"Revista de Toxicología y Salud Ambiental, Parte A (2002), 995–1012.

A-31 TAKEMASAWATANABE, YOSHIKISUGIYAMA, YOSHIKOSUMI, mISUZUWATANABE, kIYOMITAKEUCHI, FUMIOkOBAYASHI,


y kOICHIkONO, "Efectos del agotamiento vital en las funciones nerviosas autonómicas cardíacas evaluadas por la variabilidad de la frecuencia
cardíaca en reposo en trabajadores masculinos de mediana edad"Revista Internacional de Medicina del Comportamiento, 9 (2002), 68–75.

A-32 jOHNBROCADOR, Datos analizados por el Centro de Consulta Estadística de la Universidad Estatal de Wright, Universidad Estatal de
Wright, Dayton, OH (1997).
A-33 miIZQUIERDOSkellis, Ph.D., "Los niños púberes no pueden relajarse durante el procedimiento de corrección de gravedad
pasiva en el dinamómetro iscinético"Isocinética y ciencia del ejercicio, 10 (2002), 97–105.
A-34 RDEEEPyeritz, miLLIOTK. F.ISMAN, BARBARAABERNHARDT, y STANLEYS. S.IEGELMAN, “La ectasia dural es una
Característica común del síndrome de Marfan”,Diario Americano de Genética Humana, 43 (1988), 726–732. ADINAHARTMAN
A-35 -METROAEIR, norteACHÚMSOROKER, hAPUNTARREN G, y NOMIkZTA, "Conciencia de los déficits en la rehabilitación del accidente
cerebrovascular",Revista de Medicina de Rehabilitación, 34 (2002), 158–164.
A-36 miFTIHIAVPOLYZOGOPOULOU, FOTIOSkALFARENTZOS, APOSTOLOSG. V.AGENAKIS, y THéodoroK. A.LEXANDRIDAS,
“Restauración de la euglucemia y la respuesta normal aguda de la insulina a la glucosa en sujetos obesos con
diabetes tipo 2 después de la cirugía bariátrica”Diabetes, 53 (2003), 1098–1103.
A-37 CarolSJOHNSTONy DL BBÚHO, "Estabilidad del ácido ascórbico en jugos de naranja disponibles comercialmente",
Diario de la Asociación Dietética Americana, 102 (2002), 525–529.
A-38 R. P.ITTINI, HACEREPKESS, KMACUERDO, R. R.EZNICK, J. B.OJOy R. W.INDRIM, “Enseñanza de procedimientos perinatales invasivos:
evaluación de un plan de estudios basado en un simulador de alta fidelidad”,Ultrasonido Obstetricia y Ginecología,
19 (2002), 478–483.
A-39 norteICKANIM-NORTEYAME, jOHNGRAMOAMBLADURA, SURENR. S.ORANNA, mARCAR. J.OHNSON, y PHILIPJ. S.TEER, “Microvascular
La permeabilidad está relacionada con los niveles circulantes del factor de necrosis tumoral-a en la preeclampsia.Investigación
cardiovascular, 58 (2003), 162–169.
A-40 jNaciones UnidasIWAMOTO, TSUYOSHITAKEDA, SHOICHIICHIMURA, y MITSUYOSHItuZAWA, “Efectos del tratamiento de 5 años con
Elcatonina y alfacalcidol sobre la densidad mineral ósea lumbar y la incidencia de fracturas vertebrales en
REFERENCIAS 411

Mujeres posmenopáusicas con osteoporosis: un estudio retrospectivo”,Revista de Ciencias Ortopédicas, 7 (2002),


637–643.
A-41 kIMIKOINOUE, norteARUMIOGONUKI, kEIJIMETROÓQUIDA, YOSHIEYAMAMOTO, kAORUTAKANO, FUMITOSHIISHINO, y ATSUO
OGURA, "Efectos del tipo de célula donante y el genotipo sobre la eficiencia de la clonación de células somáticas de ratón"Biología de la
Reproducción, 69 (2003), 1394-1400.
A-42 GRAMOOTAROSHIRAKAMI, mASAHIROMETROURAKAWA, kOHSHINGÚ, SUSUMUMETROASHIMA, SH.N.I.-ICHISUGA, TATSÚOMETROAGARIBUCHI,
TOYOHIKOohHIGASHI, TSUTOMUSHICHINO, kAZUWAnorteAKAOy kENJIROMETROO YO, "Concentraciones plasmáticas perioperatorias
de endotelina y péptidos natriuréticos en niños sometidos a trasplante de hígado relacionado con la vida", Anestesia
y Analgesia, 82 (1996), 235–240.
A-43 METROASAHITOSAkakibaray jUNICHIROHAYANO, "Efecto de la respiración lenta en la respuesta parasimpática
cardíaca a la amenaza",Medicina Psicosomática, 58 (1996), 32–37.
A-44 TOSHIAKITAKAHASHI, YUJISUTO, SHINSUKEkATO, y miISAKUOHAMA, "Compresión dorsal aguda experimental de la médula espinal del
gato",Columna vertebral, 21 (1996), 166–173.
A-45 METROOTOHIROYAMASHITA, RALFACOMOCHMID, kUNOKABAYASHI, kOEIAOND, jNaciones UnidaskOBAYASHI, jOELDCOPER, y G.
ALEXANDERPAGATTERSON, "La pentoxifilina en solución de lavado mejora la función temprana del aloinjerto de pulmón",Anales de
Cirugía Torácica, 61 (1996), 1055–1061.
A-46 jEN-R. ZHOU, miRICTGUGGERy J.OHNNOSOTROSRDMAN, jR., "La forma cristalina de los carotenos y la matriz alimenticia en la raíz de
zanahoria disminuyen la biodisponibilidad relativa de betacaroteno y alfacaroteno en el modelo de hurón",Diario del Colegio
Americano de Nutrición, 15 (1996), 84–91.
A-47 JA POTTEIGER, GL NICKEL, MJWEBSTER, MD HAUB, y RJ PALMER, "La ingesta de citrato de sodio mejora el rendimiento de
ciclismo de 30 km",Revista Internacional de Medicina Deportiva, 17 (1996), 7–11.
A-48 ROBERTOENEITGE, WADEFAERBER, PAGATRICIADESMETROADRYL, y THOMASMMAtelico, “Radiografías de estrés de la
Articulación patelofemoral”,Revista de cirugía ósea y articular, 78-A (febrero de 1996), 193–203.
A-49 AKIHIKOIKEDA, kOICHInorteISHIMURA, hIROSHIkOYAMA, mITSUHIROTSUKINO, mICHIAKIMETROISHIMA, y TAKATERUIZUMI,
“Estudio de respuesta a la dosis del aerosol de bromuro de ipratropio sobre el rendimiento máximo del ejercicio en pacientes
estables con enfermedad pulmonar obstructiva crónica”Tórax, 51 (1996), 48–53.
A-50 ANTTIPAGERTOVAARA, TOMIkAÚPILA, y MINNAMHA€ € €MALAINÉN, “Influencia de la temperatura de la piel en el dolor por calor
Umbral en humanos,”Investigación experimental del cerebro, 107 (1996), 497–503.
A-51 PGKNOCHE, S. M.UTTUKRISHNA, y NP GHABITACIÓN, "Desarrollo y aplicación de un inmunoensayo enzimático de dos sitios
para la determinación de las concentraciones de activina-A 'total' en suero y líquido folicular",Revista de
Endocrinología, 148 (1996), 267–279.
A-52 PAGIERRECMAHEUX, BRIGITTEBONÍN, ANNEDIZAZO, PAGIERREGRAMOUIMOND, DANIELAMETROONIER, jOSE - miBNUESTROy J.EAN-
LOUISCHIASSON, "Homeostasis de la glucosa durante el parto espontáneo en el embarazo humano normal",Revista de
Endocrinología Clínica y Metabolismo, 81 (1996), 209–215.
A-53 HPREMIOTRACHTMAN, jOHNMETROAESAKA, StephenFEXTRAORDINARIO, ChanMETROA, miLSAVALDERRAMA, jAMÉSCM Chan, y
WINNIEChan, "El efecto del factor de crecimiento I similar a la insulina humana recombinante en la nefropatía crónica por
aminonucleósido de puromicina en ratas"Investigación pediátrica, 39 (1996), 13–19.
A-54 MH SAMUELOSy P. K.RAMERO, "Efectos diferenciales del ayuno a corto plazo sobre la tirotropina pulsátil, la gonadotropina
y la secreción de la subunidad a en hombres sanos: un estudio del Centro de investigación clínica"Revista de
Endocrinología Clínica y Metabolismo, 81 (1996), 32–36.
A-55 TJSOBOTKA, P. W.HITTAKER, JM SOBOTKA, REBRODIE, DY QUANDER, SEÑOROBL, MBRYANT, y CN BARTON, "Disfunciones
neuroconductuales asociadas con la sobrecarga de hierro en la dieta",Fisiología y Comportamiento, 58 (
1996), 213–219.
A-56 THORWILLYRDUUHANSEN, “Entrada y eliminación de bilirrubina del cerebro de rata durante la hipercarbia y la
hiperosmolaridad,”Investigación pediátrica, 39 (1996), 72–76.
A-57 ANNAG. J.OHANSSON, miRIKLINDH, WERNERFBLUM, gEN UNkOLLERUP, ohLEH. SORENSEN, y SVERKERLJUNGHALL,
“Efectos de la hormona de crecimiento y el factor de crecimiento similar a la insulina I en hombres con osteoporosis idiopática”
Revista de Endocrinología Clínica y Metabolismo, 81 (1996), 44–48.
A-58 jAAPHSTRIJBOS, DirkjeS. P.OSTMA, RICHARDALTENA, FERNANDOGRAMOIMENO, y GERARDHKEquipo original €TER, "Una comparación
entre un programa de rehabilitación pulmonar ambulatorio en un hospital y un programa de rehabilitación
pulmonar domiciliaria en pacientes con EPOC”,Cofre, 109 (1996), 366–372.
A-59 médico de cabecera Lámbar, RT CCOLGAR, DJOENSEN, X.SHOLA, RW SUMMEROS, HPSCHEDL, y CVGISOLFI, "Determinación
simultánea de la absorción gástrica e intestinal durante el ciclo de ejercicio en humanos"Revista Internacional de
Medicina Deportiva, 17 (1996), 48–55.
412 CAPÍTULO 8 ANÁLISIS DE LA VARIANZA

A-60 LIZABETROEMER, mARIOBORKOVEC, SharónPAGAOS, y TD BORKOVEC, "Una medida de autodiagnóstico del trastorno de
ansiedad generalizada",Revista de terapia conductual y psiquiatría experimental, 26 (1995), 345–350.
A-61 ILSECcristiansen, CECILIAGRAMOIDLO €F, kARL-METROICHAELkA €LKNER, hRespuestaHAGBERG, hELGEBENNMARKER, y THOMAS
T€oTTERMAN, "Los niveles séricos elevados de ICAM-1 soluble en los linfomas no Hodgkin se correlacionan con la carga tumoral,
la actividad de la enfermedad y otros marcadores de pronóstico",Revista británica de hematología, 92 (1996), 639–646. SYLVIEC
A-62 OSETA, LOuiseLE-VESQUE, y yoIANELAURÍN, “Apoyo informal y formal para los cuidadores de un pariente demente: ¿el género y el
parentesco marcan la diferencia?”Investigación en Enfermería y Salud, 18 (1995), 437–451.
A-63 SADATOMOTASAKA, AKITOSHIISHIZAKA, kOICHISAYAMA, FUMIOSAkamaki, hIDETOSHInorteAKAMURA, TAKESHITERA-SHIMA, YASUHIRO
WLRA, kENZOSOEJIMA, mORIOnorteAKAMURA, hIROAKIMETROATSUBARA, SÉITAROFUJISHIMA, y MINORU
kANAZAWA, “Asesinado por calorCorynebacterium parvummejora la lesión pulmonar por endotoxinas con una mayor
producción de TNF en cobayas”,American Journal of Respiratory and Critical Care Medicine, 153 (1996), 1047–1055.

A-64 METROITSUGITAKAHASHI, hIDEOnorteAGAO, y HIROSIMETROATSUDA, "Estimación del cambio óseo en pacientes con
discapacidad grave",Medicina del Desarrollo y Neurología Infantil, 37 (1995), 1085–1093.
A-65 CORRIEB.ALLEN, "Efectos de la deficiencia de cobre en la dieta sobre la ingesta relativa de alimentos y la eficiencia del crecimiento en ratas"
Fisiología y comportamiento, 59 (1996), 247–253.
A-66 CHRISTOPHERBHUGHES, LILLIANWGABER, ABOUBAKRMETROOyemiL-DEN, hY YOPGREGALO, mALAKkOTB, LINDA
METROANA, y A. O.SAMAGRAMOABER, "La inhibición de TNFa mejora la supervivencia en un modelo experimental de pancreatitis
aguda",Cirujano estadounidense, 62 (1996), 8–13.
A-67 ALEXANDERKSMAMÁ - RAZON, IUNLSARGÉN, y CHRISTOPHERGT REDMAN, “La proliferación de células endoteliales es
Suprimido por plasma pero no por suero de mujeres con preeclampsia”,Diario americano de obstetricia y
ginecología, 174 (1996), 787–793.
A-68 DEREKLmiROITH, jACKYANEWSKI, miRICPAQUETEALDJIAN, miLAINASJAFE, TANYALeROITH, kAthyPAGURDUE, BARBARA
DCOPER, ROBERTOPAGYLE, y WILLIAMADLER, "Los efectos de la hormona de crecimiento y el factor de crecimiento similar a la insulina I en el
sistema inmunológico de los monos hembra de edad avanzada"Endocrinología, 137 (1996), 1071-1079. VA
A-69 -CLAVHAMPL, mARTINTRISTANI-FIROUZI, THOMASCHVENDER, y StephenLARCHER, “Óxido Nítrico Nebulizado/
El aducto nucleófilo reduce la hipertensión pulmonar crónica”,Investigación cardiovascular, 31 (1996), 55–62.
A-70 CKREITER, MW PETERSON, K. F.ERGUSON, y S. E.LLIOTT, "Los efectos de las pruebas en turnos en un examen clínico
computarizado en curso",Educación Médica, 37 (2003), 202–204.
CAPÍTULO 9
REGRESIÓN LINEAL SIMPLE Y
CORRELACIÓN

RESUMEN DEL CAPÍTULO

Este capítulo proporciona una introducción y una descripción general de dos técnicas
comunes para explorar la fuerza de la relación entre dos variables. La primera
técnica, la regresión lineal, nos ayudará a encontrar una forma objetiva de predecir o
estimar el valor de una variable dado el valor de otra variable. La segunda técnica, la
correlación, nos ayudará a encontrar una medida objetiva de la fuerza de la relación
entre dos variables.

TEMAS

9.1INTRODUCCIÓN
9.2EL MODELO DE REGRESIÓN
9.3LA ECUACIÓN DE REGRESIÓN MUESTRA
9.4EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN
9.5USO DE LA ECUACIÓN DE REGRESIÓN
9.6EL MODELO DE CORRELACIÓN
9.7EL COEFICIENTE DE CORRELACIÓN
9.8ALGUNAS PRECAUCIONES

9.9RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. ser capaz de obtener un modelo de regresión lineal simple y usarlo para hacer predicciones.
2. ser capaz de calcular el coeficiente de determinación e interpretar pruebas de
coeficientes de regresión.
3. ser capaz de calcular correlaciones entre variables.
4. comprender en qué se diferencian la regresión y la correlación y cuándo es apropiado el uso de
cada una.

413
414 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

9.1 INTRODUCCIÓN

Al analizar datos para las disciplinas de las ciencias de la salud, encontramos que con frecuencia es
deseable aprender algo sobre la relación entre dos variables numéricas. Nos puede interesar, por
ejemplo, estudiar la relación entre la presión arterial y la edad, la altura y el peso, la concentración de
un fármaco inyectado y la frecuencia cardiaca, el nivel de consumo de algún nutriente y el aumento
de peso, la intensidad de un estímulo y el tiempo de reacción , o ingreso familiar total y gastos de
atención médica. La naturaleza y la fuerza de las relaciones entre variables como estas pueden
examinarse utilizando modelos lineales comoregresiónycorrelación análisis, dos técnicas estadísticas
que, aunque relacionadas, sirven para propósitos diferentes.

RegresiónEl análisis de regresión es útil para evaluar formas específicas de la relación entre
variables, y el objetivo final cuando se emplea este método de análisis suele serpredeciro
estimarel valor de una variable correspondiente a un valor dado de otra variable. Las ideas de la
regresión fueron aclaradas por primera vez por el científico inglés Sir Francis Galton
(1822-1911) en los informes de su investigación sobre la herencia, primero en los guisantes de
olor y luego en la estatura humana. Describió una tendencia de la descendencia adulta, que
tiene padres altos o bajos, a volver a la altura promedio de la población general. Usó por
primera vez la palabrareversión,y despuésregresión,para referirse a este fenómeno.

CorrelaciónEl análisis de correlación, por otro lado, se ocupa de medir la fuerza de la


relación entre las variables. Cuando calculamos medidas de correlación a partir de un
conjunto de datos, nos interesa el grado de lacorrelaciónentre variables. Una vez más, los
conceptos y la terminología del análisis de correlación se originaron con Galton, quien
utilizó por primera vez la palabracorrelaciónen 1888.
En este capítulo nuestra discusión se limita a la exploración de la relación lineal
entre dos variables. Los conceptos y métodos de regresión se cubren primero,
comenzando en la siguiente sección. En la Sección 9.6 se introducen las ideas y técnicas
de correlación. En el próximo capítulo consideraremos el caso donde hay interés en las
relaciones entre tres o más variables.
Los análisis de regresión y correlación son áreas en las que se aprecia más la velocidad y la precisión
de una computadora. Los datos para los ejercicios de este capítulo, por lo tanto, se presentan de una manera
que los hace adecuados para el procesamiento por computadora. Como siempre es el caso, los requisitos de
entrada y las características de salida de los programas y paquetes de software particulares que se utilizarán
deben estudiarse cuidadosamente.

9.2 EL MODELO DE REGRESIÓN

En el típico problema de regresión, como en la mayoría de los problemas de estadística aplicada, los
investigadores tienen disponible para el análisis una muestra de observaciones de alguna población
real o hipotética. Con base en los resultados de su análisis de los datos de la muestra, están
interesados en tomar decisiones sobre la población de la que se supone que se extrajo la muestra. Es
importante, por lo tanto, que los investigadores comprendan la naturaleza de la población en la que
están interesados. Deben saber lo suficiente sobre la población para poder construir un modelo
matemático para su representación o determinar si se ajusta razonablemente.
9.2 EL MODELO DE REGRESIÓN 415

algún modelo establecido. Un investigador a punto de analizar un conjunto de datos


por los métodos de regresión lineal simple, por ejemplo, debe estar seguro de saber
que el modelo de regresión lineal simple es, al menos, una representación
aproximada de la población. Es poco probable que el modelo sea un retrato perfecto
de la situación real, ya que esta característica rara vez se encuentra en modelos de
valor práctico. Un modelo construido de modo que se corresponda con precisión con
los detalles de la situación suele ser demasiado complejo para producir información
de valor. Por otro lado, los resultados obtenidos del análisis de datos que han sido
forzados a un modelo que no encaja tampoco valen nada. Afortunadamente, sin
embargo, un modelo perfectamente ajustado no es un requisito para obtener
resultados útiles. Los investigadores, entonces,

Supuestos subyacentes a la regresión lineal simpleen lo sencillo


modelo de regresión lineal dos variables, generalmente etiquetadasXyY,son de interés La carta
Xsuele utilizarse para designar una variable denominadavariable independiente,ya que
frecuentemente es controlado por el investigador; es decir, valores deXpuede ser seleccionado
por el investigador y, correspondiente a cada valor preseleccionado deX,uno o más valores de
otra variable, etiquetadosY,son obtenidas. La variable,Y,en consecuencia, se denomina variable
dependiente,y hablamos de la regresión deYenX.Los siguientes son los supuestos subyacentes
al modelo de regresión lineal simple.

1.Valores de la variable independienteXse dice que son "fijos". Esto significa que los valores deXson
preseleccionados por el investigador para que en la recolección de los datos no se les permita
variar de estos valores preseleccionados. En este modelo,Xes referido por algunos escritores
como unno aleatoriovariable y por otros comomatemáticovariable. Cabe señalar en este
momento que el enunciado de este supuesto clasifica nuestro modelo como elmodelo de
regresión clásico.El análisis de regresión también se puede llevar a cabo en datos en los queXes
una variable aleatoria.
2.La variableXse mide sin error. Dado que ningún procedimiento de medición es perfecto,
esto significa que la magnitud del error de medición enXes despreciable.
3.Para cada valor deXhay una subpoblación deYvalores. Para que los procedimientos
inferenciales usuales de estimación y prueba de hipótesis sean válidos, estas
subpoblaciones deben estar normalmente distribuidas. Para que se presenten estos
procedimientos se supondrá que elYlos valores se distribuyen normalmente en los
ejemplos y ejercicios que siguen.
4.Las varianzas de las subpoblaciones deYson todos iguales y se denotan pors2.
5.Las medias de las subpoblaciones deYtodos se encuentran en la misma línea recta. Esto se
conoce como elsupuesto de linealidad.Esta suposición puede expresarse simbólicamente como

metroyjX¼b0þb1X (9.2.1)

dóndemetroyjXes la media de la subpoblación deYvalores para un valor particular deX, yb0yb1se


denominan coeficientes de regresión poblacional. Geométricamente,b0y b1representan ely-
intersección y pendiente, respectivamente, de la línea en la que se supone que se encuentran
todas las medias.
416 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

6.ElYLos valores son estadísticamente independientes. En otras palabras, al extraer la muestra, se


supone que los valores deYelegido en un valor deXde ninguna manera depende de los valores
deYelegido a otro valor deX.

Estos supuestos pueden resumirse mediante la siguiente ecuación, que se


denomina modelo de regresión lineal simple:

y¼b0þb1Xþmi (9.2.2)

dóndeyes un valor típico de una de las subpoblaciones deY,b0yb1son como se definen para la
Ecuación 9.2.1, ymise llama término de error. Si resolvemos 9.2.2 parami,tenemos

mi¼y-db0þb1XÞ
(9.2.3)
¼y-metroyjX

y vemos quemimuestra la cantidad por la cualyse desvía de la media de la subpoblación


deYvalores de los que se extrae. Como consecuencia del supuesto de que las
subpoblaciones deYlos valores se distribuyen normalmente con varianzas iguales, lami's
para cada subpoblación se distribuyen normalmente con una varianza igual a la varianza
común de las subpoblaciones deYvalores.
El siguiente acrónimo ayudará al lector a recordar la mayoría de los supuestos necesarios
para la inferencia en el análisis de regresión lineal:

LÍNEA [Lineal (supuesto 5), Independiente (supuesto 6), Normal (supuesto 3),
Varianzas iguales (supuesto 4)]

En la Figura 9.2.1 se da una representación gráfica del modelo de regresión.

F(X,Y)

my|X=β + βX Y
0 1

X1
my|X1

X2
my|X2

X3
my|X3

X4
my|X4
X
FIGURA 9.2.1 Representación del modelo de regresión lineal simple.
9.3 LA ECUACIÓN DE REGRESIÓN DE MUESTRA 417

9.3 LA ECUACIÓN DE REGRESIÓN DE MUESTRA

En la regresión lineal simple, el objeto de interés del investigador es la ecuación de


regresión poblacional, la ecuación que describe la verdadera relación entre la
variable dependienteYy la variable independienteX.La variable designada porYa
veces se le llama elvariable de respuestayXa veces se le llama elvariable predictora.
En un esfuerzo por tomar una decisión con respecto a la forma probable de esta relación, el
investigador extrae una muestra de la población de interés y, utilizando los datos resultantes, calcula
una ecuación de regresión de muestra que forma la base para llegar a conclusiones con respecto a la
ecuación de regresión de población desconocida.

Pasos en el análisis de regresiónEn ausencia de información extensa sobre la naturaleza de


las variables de interés, una estrategia frecuentemente empleada es suponer inicialmente que
están linealmente relacionadas. El análisis posterior, entonces, involucra los siguientes pasos.

1.Determinar si los supuestos subyacentes a una relación lineal se cumplen o no en los datos
disponibles para el análisis.
2.Obtenga la ecuación de la línea que mejor se ajuste a los datos de la muestra.

3.Evalúe la ecuación para obtener una idea de la fuerza de la relación y la


utilidad de la ecuación para predecir y estimar.
4.Si los datos parecen ajustarse satisfactoriamente al modelo lineal, use la ecuación obtenida
de los datos de la muestra para predecir y estimar.

Cuando usamos la ecuación de regresión parapredecir,estaremos prediciendo el valorYes


probable que tenga cuandoXtiene un valor dado. Cuando usamos la ecuación paraestimar,estaremos
estimando la media de la subpoblación deYvalores que se supone que existen a un valor dado deX.
Tenga en cuenta que los datos de muestra utilizados para obtener la ecuación de regresión consisten
en valores conocidos de ambosXyyCuando la ecuación se usa para predecir y estimarY,sólo los valores
correspondientes deXserá conocido Ilustramos los pasos involucrados en el análisis de regresión
lineal simple por medio del siguiente ejemplo.

EJEMPLO 9.3.1
Despr-es et al. (A-1) señalan que la topografía del tejido adiposo (TA) se asocia a
complicaciones metabólicas consideradas como factores de riesgo de enfermedad
cardiovascular. Es importante, afirman, medir la cantidad de AT intraabdominal
como parte de la evaluación del riesgo de enfermedad cardiovascular de un
individuo. Sin embargo, la tomografía computarizada (TC), la única técnica disponible
que mide de manera precisa y confiable la cantidad de TA abdominal profunda, es
costosa y requiere irradiación del sujeto. Además, la técnica no está disponible para
muchos médicos. Despr-es y sus colegas realizaron un estudio para desarrollar
ecuaciones para predecir la cantidad de TA abdominal profunda a partir de
mediciones antropométricas simples. Sus sujetos eran hombres de entre 18 y 42
años que no padecían enfermedades metabólicas que requirieran tratamiento.
418 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

se muestra en la Tabla 9.3.1. Una cuestión de interés es qué tan bien se puede predecir y estimar la TA
abdominal profunda a partir del conocimiento de la circunferencia de la cintura. Esta pregunta es
típica de las que pueden responderse mediante análisis de regresión. Dado que la TA abdominal
profunda es la variable sobre la que deseamos hacer predicciones y estimaciones, es la variable
dependiente. La variable medida de la cintura, cuyo conocimiento se utilizará para realizar las
predicciones y estimaciones, es la variable independiente.

TABLA 9.3.1 Circunferencia de la cintura (cm),X,y AT Abdominal Profunda,Y,de 109 Hombres

Sujeto X Y Sujeto X Y Sujeto X Y

1 74.75 25.72 38 103.00 129.00 75 108.00 217.00


2 72.60 25.89 39 80.00 74.02 76 100.00 140.00
3 81.80 42.60 40 79.00 55.48 77 103.00 109.00
4 83.95 42.80 41 83.50 73.13 78 104.00 127.00
5 74.65 29.84 42 76.00 50.50 79 106.00 112.00
6 71.85 21.68 43 80.50 50.88 80 109.00 192.00
7 80,90 29.08 44 86.50 140.00 81 103.50 132.00
8 83.40 32.98 45 83.00 96.54 82 110.00 126.00
9 63.50 11.44 46 107.10 118.00 83 110.00 153.00
10 73.20 32.22 47 94.30 107.00 84 112.00 158.00
11 71.90 28.32 48 94.50 123.00 85 108.50 183.00
12 75.00 43.86 49 79.70 65.92 86 104.00 184.00
13 73.10 38.21 50 79.30 81.29 87 111.00 121.00
14 79.00 42.48 51 89.80 111.00 88 108.50 159.00
15 77.00 30.96 52 83.80 90.73 89 121.00 245.00
dieciséis 68.85 55.78 53 85.20 133.00 90 109.00 137.00
17 75.95 43.78 54 75.50 41.90 91 97.50 165.00
18 74.15 33.41 55 78.40 41.71 92 105.50 152.00
19 73.80 43.35 56 78.60 58.16 93 98.00 181.00
20 75,90 29.31 57 87.80 88.85 94 94.50 80.95
21 76.85 36.60 58 86.30 155.00 95 97.00 137.00
22 80,90 40.25 59 85.50 70.77 96 105.00 125.00
23 79.90 35.43 60 83.70 75.08 97 106.00 241.00
24 89.20 60.09 61 77.60 57.05 98 99.00 134.00
25 82.00 45.84 62 84.90 99.73 99 91.00 150.00
26 92.00 70.40 63 79.80 27.96 100 102.50 198.00
27 86.60 83.45 64 108.30 123.00 101 106.00 151.00
28 80.50 84.30 sesenta y cinco 119.60 90.41 102 109.10 229.00
29 86.00 78.89 66 119.90 106.00 103 115.00 253.00
30 82.50 64.75 67 96.50 144.00 104 101.00 188.00
31 83.50 72.56 68 105.50 121.00 105 100.10 124.00
32 88.10 89.31 69 105.00 97.13 106 93.30 62.20
33 90.80 78.94 70 107.00 166.00 107 101.80 133.00
34 89.40 83.55 71 107.00 87.99 108 107.90 208.00
35 102.00 127.00 72 101.00 154.00 109 108.50 208.00
36 94.50 121.00 73 97.00 100.00
37 91.00 107.00 74 100.00 123.00

Fuente: Datos proporcionados por cortesía de Jean-Pierre Despre - s, doctorado


9.3 LA ECUACIÓN DE REGRESIÓN DE MUESTRA 419

El diagrama de dispersión

Un primer paso que suele ser útil para estudiar la relación entre dos variables es preparar
undiagrama de dispersiónde los datos como se muestra en la Figura 9.3.1. Los puntos se
grafican asignando valores de la variable independienteXal eje horizontal y valores de la
variable dependienteYal eje vertical.
El patrón formado por los puntos trazados en el diagrama de dispersión generalmente sugiere
la naturaleza básica y la fuerza de la relación entre dos variables. Cuando miramos la Figura 9.3.1, por
ejemplo, los puntos parecen estar dispersos alrededor de una línea recta invisible. El diagrama de
dispersión también muestra que, en general, los sujetos con circunferencias de cintura grandes
también tienen mayores cantidades de TA abdominal profunda. Estas impresiones sugieren que la
relación entre las dos variables puede describirse mediante una línea recta que cruza laY- debajo del
origen y formando un ángulo de aproximadamente 45 grados con elX-eje. Parece que sería sencillo
dibujar, a mano alzada, a través de los puntos de datos la línea que describe la relación entreXyySin
embargo, es muy poco probable que las líneas dibujadas por dos personas sean exactamente iguales.
En otras palabras, por cada persona que dibuje una línea de este tipo a ojo oa mano alzada,
esperaríamos una línea ligeramente diferente. Entonces surge la pregunta de qué línea describe
mejor la relación entre las dos variables. No podemos obtener una respuesta a esta pregunta
inspeccionando las líneas. De hecho, no es probable que ninguna línea a mano alzada

260

240

220

200

180
Área abdominal profunda AT (cm2),Y

160

140

120

100

80

60

40

20

0
0 60 70
sesenta y cinco 75 80 85 90 95 100 105 110 115 120 125
Circunferencia de la cintura (cm),X

FIGURA 9.3.1Diagrama de dispersión de los datos mostrados en la Tabla 9.3.1.


420 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

trazada a través de los datos será la línea que mejor describa la relación entreXyY, ya que las
líneas a mano alzada reflejarán cualquier defecto de visión o juicio de la persona que traza la
línea. Del mismo modo, al juzgar cuál de las dos líneas describe mejor la relación, la evaluación
subjetiva está sujeta a las mismas deficiencias.
Lo que se necesita para obtener la línea deseada es algún método que no esté plagado de
estas dificultades.

La línea de mínimos cuadrados

El método comúnmente empleado para obtener la línea deseada se conoce comométodo de


mínimos cuadrados,y la recta resultante se llamalínea de mínimos cuadrados.La razón para
llamar al método por este nombre se explicará en la discusión que sigue.
Recordamos del álgebra que la ecuación general de una línea recta se puede escribir como

y¼aþbx (9.3.1)

dóndeyes un valor en el eje vertical,Xes un valor en el eje horizontal,aes el punto donde la línea cruza
el eje vertical, ybmuestra la cantidad por la cualycambios por cada unidad cambio enX.Nos referimos
aacomo ely-interceptar ybcomo elpendientede la linea Para dibujar una línea basada en la Ecuación
9.3.1, necesitamos los valores numéricos de las constantesayb.Dadas estas constantes, podemos
sustituir varios valores deXen la ecuación para obtener los valores correspondientes dey.Los puntos
resultantes se pueden trazar. Dado que dos de estas coordenadas determinan una línea recta,
podemos seleccionar dos, ubicarlas en un gráfico y conectarlas para obtener la línea correspondiente
a la ecuación.

Obtención de la línea de mínimos cuadrados

La ecuación de la línea de regresión de mínimos cuadrados se puede obtener a partir de datos de muestra
mediante cálculos aritméticos simples que se pueden realizar a mano utilizando las siguientes ecuaciones
PAG
norte

dXi- -XÞðyi- -yÞ


¼1
b1¼i PAG
norte
(9.3.2)
dXi- -XÞ 2
i¼1

b0¼ -y - b̂1-X (9.3.3)


dóndeXiyyison los valores correspondientes de cada punto de datos (X, Y), -xy -yson los medios de laXy
Yvalores de datos de muestra, respectivamente, y b̂0y B1son las estimaciones de la intersecciónb0y
pendienteb1, respectivamente, de la línea de regresión de la población. Dado que los cálculos
manuales necesarios consumen mucho tiempo, son tediosos y están sujetos a errores, la ecuación de
la línea de regresión se obtiene mejor mediante el uso de un paquete de software de computadora.
Aunque el investigador típico no necesita preocuparse por la aritmética involucrada, el lector
interesado las encontrará discutidas en las referencias enumeradas al final de este capítulo.
Para los datos de la tabla 9.3.1 obtenemos la ecuación de regresión de mínimos cuadrados por medio
de MINITAB. Después de entrar en elXvalores en la Columna 1 y elYvalores en la Columna 2, procedemos
como se muestra en la Figura 9.3.2.
Por ahora, la única información del resultado de la figura 9.3.2 que nos interesa es
la ecuación de regresión. Otra información en la salida se discutirá más adelante.
9.3 LA ECUACIÓN DE REGRESIÓN DE MUESTRA 421

Caja de diálogo: Comando de sesión:

Estadística Regresión Regresión MTB > Nombre C3 = 'FITS1' C4 = 'RESI1' MTB >
TipoyenRespuestayXenPredictores. Hacer clicAlmacenamiento. Regresión 'y' 1 'x';
ControlarDerechos residuales de autoryEncaja. Hacer clicDE SUBC> Se adapta a 'FITS1';
ACUERDO. SUBC> Constante;
SUBC> Derechos residuales de autor 'RESI1'.

Producción:

Análisis de regresión: y versus x La


ecuación de regresión es y = -216 +
3.46 x

Vaticinador coef Desvst. relación t pag


Constante - 215.98 21.80 - 9.91 0.000
X 3.4589 0.2347 14.74 0.000

s = 33,06 R-sq = 67,0% R-cuadrado (ajustado) = 66,7 %

Análisis de Diferencia

FUENTE DF SS EM F pag
Regresión 1 237549 237549 217.28 0.000
Error 107 116982 1093
Total 108 354531

Inusual Observaciones
Obs. X y Adaptar Stdev.Ajuste Residual San Resid
58 86 155.00 82.52 3.43 72.48 2.20R
sesenta y cinco 120 90.41 197.70 7.23 - 107.29 -3.33R
66 120 106.00 198.74 7.29 - 92.74 -2.88R
71 107 87.99 154.12 4.75 - 66.13 -2.02R
97 106 241.00 150.66 4.58 90.34 2.76R
102 109 229.00 161.38 5.13 67.62 2.07R
103 115 253.00 181.79 6.28 71.21 2.19R

R denota una obs. con una gran st. residir

FIGURA 9.3.2Procedimiento y salida de MINITAB para obtener la ecuación de regresión de mínimos cuadrados
a partir de los datos de la tabla 9.3.1.
422 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

De la Figura 9.3.2 vemos que la ecuación lineal para la línea de mínimos cuadrados que
describe la relación entre la circunferencia de la cintura y la AT abdominal profunda puede escribirse,
entonces, como

ŷ¼ -216þ3:46X
Esta ecuación nos dice que dado que b̂0es negativo, la recta cruza elY-eje debajo del origen, y
que desde b̂1la pendiente es positiva, la línea se extiende desde la esquina inferior izquierda del
gráfico hasta la esquina superior derecha. Vemos además que por cada unidad de aumento enx, y
aumenta en una cantidad igual a 3,46. El símbolo ŷ denota un valor deycalculado a partir de la
ecuación, en lugar de un valor observado dey
Sustituyendo dos valores convenientes deXen la Ecuación 9.3.2, podemos obtener las
coordenadas necesarias para dibujar la línea. Supongamos, primero, que dejamosX¼70 y obtener

ŷ¼ -216þ3:46d70¼26:2
si dejamosX¼110 obtenemos

ŷ¼ -216þ3:46d110¼164
La línea, junto con los datos originales, se muestra en la Figura 9.3.3.

260

240

220

200

180
Área abdominal profunda AT (cm2),Y

160

140

120
ŷ= _216 + 3,46X
100

80

60

40

20

0
0 60 70
sesenta y cinco 75 80 85 90 95 100 105 110 115 120 125
Circunferencia de la cintura (cm),X

FIGURA 9.3.3Datos originales y línea de mínimos cuadrados para el ejemplo 9.3.1.


&
EJERCICIOS 423

El criterio de los mínimos cuadradosAhora que hemos obtenido lo que llamamos la línea de
"mejor ajuste" para describir la relación entre nuestras dos variables, necesitamos determinar
por qué criterio se considera mejor. Antes de establecer el criterio, examinemos la figura 9.3.3.
Observamos que, por lo general, la línea de mínimos cuadrados no pasa por los puntos
observados que se trazan en el diagrama de dispersión. En otras palabras, la mayoría de los
puntos observadosdesviarsede la línea en cantidades variables.
La línea que hemos trazado a través de los puntos es mejor en este sentido:

La suma de las desviaciones verticales al cuadrado de los puntos de datos observados (yi)de la línea de mínimos
cuadrados es menor que la suma de las desviaciones verticales al cuadrado de los puntos de datos de cualquier
otra línea.

En otras palabras, si elevamos al cuadrado la distancia vertical desde cada punto observado (yi) a la
línea de mínimos cuadrados y suma estos valores cuadrados para todos los puntos, el total resultante será
más pequeño que el total calculado de manera similar para cualquier otra línea que pueda dibujarse a través
de los puntos. Por esta razón, la recta que hemos trazado se llama recta de mínimos cuadrados.

EJERCICIOS

9.3.1Trace cada una de las siguientes ecuaciones de regresión en papel cuadriculado y establezca siXyYestán directa o
inversamente relacionados.
(a) ŷ¼ -3þ2X
(por¼3þ0:5X
(c) ŷ¼10 - 0:75X
9.3.2Las siguientes puntuaciones representan la evaluación de una enfermera (X)y la evaluación de un médico (Y)de la
condición de 10 pacientes en el momento de la admisión a un centro de trauma.

X: 18 13 18 15 10 12 8 4 7 3
Y: 23 20 18 dieciséis 14 11 10 7 6 4

(a)Construya un diagrama de dispersión para estos datos.

(b)Trace las siguientes ecuaciones de regresión en el diagrama de dispersión e indique cuál cree que se
ajusta mejor a los datos. Indique el motivo de su elección.
(1) ŷ¼8þ0:5X
(2) ŷ¼ -10þ2X
(3)y¼1þ1X
Para cada uno de los siguientes ejercicios (a) dibuje un diagrama de dispersión y (b) obtenga la ecuación de regresión y
grafítela en el diagrama de dispersión.

9.3.3La metadona a menudo se prescribe para el tratamiento de la adicción a los opiáceos y el dolor crónico. Krantz et al.
(A-2) estudiaron la relación entre la dosis de metadona y el intervalo QT corregido (QTc) en 17 sujetos
que desarrollarontorsade de pointes (taquicardia ventricular casi siempre debida a medicamentos). El
QTc se calcula a partir de un electrocardiograma y se mide en mm/seg. Un mayor valor de QTc indica
un mayor riesgo de mortalidad cardiovascular. Una cuestión de interés es qué tan bien se puede
predecir y estimar el valor de QTc a partir del conocimiento de la dosis de metadona. Esta pregunta es
típica de las que pueden responderse mediante análisis de regresión. Como QTc es la variable
424 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

sobre la que deseamos hacer predicciones y estimaciones, es la variable dependiente. La


variable dosis de metadona, cuyo conocimiento se utilizará para realizar las predicciones y
estimaciones, es la variable independiente.

Dosis de metadona Dosis de metadona


(mg/día) QTc (mm/s) (mg/día) QTc (mm/s)

1000 600 650 785


550 625 600 765
97 560 660 611
90 585 270 600
85 590 680 625
126 500 540 650
300 700 600 635
110 570 330 522
sesenta y cinco 540
Fuente: Mori J. Krantz, Ilana B. Kutinsky, Alastair D. Roberston y Philip S. Mehler, “Dose-
Related Effects of Metadone on QT Prolongation in a Series ofpatients with Torsade de
Pointes,”Farmacoterapia, 23 (2003), 802–805.

9.3.4Reiss et al. (A-3) compararon ensayos de laboratorio hospitalarios estándar y en el punto de atención para monitorear
pacientes que recibieron un solo anticoagulante o un régimen que consiste en una combinación de anticoagulantes.
Es bastante común, cuando se comparan dos técnicas de medición, utilizar análisis de regresión en los que una
variable se utiliza para predecir otra. En el presente estudio, los investigadores obtuvieron medidas de la razón
normalizada internacional (INR) mediante análisis de muestras de sangre venosa y capilar recolectadas de 90 sujetos
que tomaban warfarina. El INR, utilizado especialmente cuando los pacientes reciben warfarina, mide la capacidad de
coagulación de la sangre. Las pruebas de INR en el punto de atención se realizaron con el producto de ensayo
CoaguChek. Las pruebas hospitalarias se realizaron con ensayos estándar de laboratorio hospitalario. Los autores
utilizaron el nivel de INR del ensayo del hospital para predecir el nivel de INR de CoaguChek. Las medidas se dan en la
siguiente tabla.

CoaguChek Hospital CoaguChek Hospital CoaguChek Hospital


(Y) (X) (Y) (X) (Y) (X)

1.8 1.6 2.4 1.2 3.1 2.4


1.6 1.9 2.3 2.3 1.7 1.8
2.5 2.8 2.0 1.6 1.8 1.6
1.9 2.4 3.3 3.8 1.9 1.7
1.3 1.5 1.9 1.6 5.3 4.2
2.3 1.8 1.8 1.5 1.6 1.6
1.2 1.3 2.8 1.8 1.6 1.4
2.3 2.4 2.5 1.5 3.3 3.3
2.0 2.1 0.8 1.0 1.5 1.5
1.5 1.5 1.3 1.2 2.2 2.8
2.1 2.4 3.7 1.4 1.1 1.6
1.5 1.5 2.4 1.6 2.6 2.6
(Continuación)
EJERCICIOS 425

CoaguChek Hospital CoaguChek Hospital CoaguChek Hospital


(Y) (X) (Y) (X) (Y) (X)

1.5 1.7 4.1 3.2 6.4 5.0


1.8 2.1 2.4 1.2 1.5 1.4
1.0 1.2 2.3 2.3 3.0 2.8
2.1 1.9 3.1 1.6 2.6 2.3
1.6 1.6 1.5 1.4 1.2 1.2
1.7 1.6 3.6 2.1 2.1 1.9
2.0 1.9 2.5 1.7 1.1 1.1
1.8 1.6 2.1 1.7 1.0 1.0
1.3 4.1 1.8 1.2 1.4 1.5
1.5 1.9 1.5 1.3 1.7 1.3
3.6 2.1 2.5 1.1 1.2 1.1
2.4 2.2 1.5 1.2 2.5 2.4
2.2 2.3 1.5 1.1 1.2 1.3
2.7 2.2 1.6 1.2 2.5 2.9
2.9 3.1 1.4 1.4 1.9 1.7
2.0 2.2 4.0 2.3 1.8 1.7
1.0 1.2 2.0 1.2 1.2 1.1
2.4 2.6 2.5 1.5 1.3 1.1
Fuente: Datos proporcionados por cortesía de Curtis E. Haas, Pharm.D.

9.3.5La digoxina es un fármaco que se suele recetar para tratar enfermedades del corazón. El propósito de un estudio de
Parker et al. (A-4) fue examinar las interacciones de la digoxina con el jugo de toronja común. En un experimento, los
sujetos tomaron digoxina con agua durante 2 semanas, seguido de un período de 2 semanas durante el cual se
suspendió la digoxina. Durante las siguientes 2 semanas, los sujetos tomaron digoxina con jugo de toronja. Para siete
sujetos, la concentración plasmática máxima promedio de digoxina (Cmax) al tomar agua se da en la primera
columna de la siguiente tabla. La segunda columna contiene el cambio porcentual en la concentración de Cmax
cuando los sujetos tomaban digoxina con jugo de toronja [GFJ (cambio %)]. Use el nivel de Cmax cuando tome
digoxina con agua para predecir el cambio porcentual en la concentración de Cmax cuando tome digoxina con jugo
de toronja.

Cmax (ngl/ml) con agua Cambio en Cmax con GFJ (%)

2.34 29.5
2.46 40.7
1.87 5.3
3.09 23.3
5.59 - 45:1
4.05 - 35:3
6.21 - 44:6
2.34 29.5
Fuente: Datos proporcionados por cortesía de Robert B. Parker, Pharm.D.

9.3.6Evans et al. (A-5) examinó el efecto de la velocidad sobre las fuerzas de reacción del suelo (GRF) en perros con cojera por
un ligamento cruzado craneal desgarrado. Los perros fueron paseados y trotados sobre una fuerza
426 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

plataforma y el GRF registrado (en newtons) durante la fase de apoyo. La siguiente tabla contiene 22
medidas de fuerza expresadas como la media de cinco medidas de fuerza por perro al caminar y la
media de cinco medidas de fuerza por perro al trotar. Utilice el valor de GRF al caminar para predecir
el valor de GRF al trotar.

Caminata GRF GRF-Trote Caminata GRF GRF-Trote

31.5 50.8 24,9 30.2


33.3 43.2 33.6 46.3
32.3 44.8 30.7 41.8
28.8 39.5 27.2 32.4
38.3 44.0 44.0 65.8
36,9 60.1 28.2 32.2
14.6 11.1 24.3 29.5
27,0 32.3 31.6 38.7
32.8 41.3 29,9 42.0
27.4 38.2 34.3 37.6
31.5 50.8 24,9 30.2
Fuente: Datos proporcionados por cortesía de Richard Evans, Ph.D.

9.3.7La tasa de filtración glomerular (TFG) es el parámetro más importante de la función renal evaluado en
receptores de trasplantes. Aunque el aclaramiento de inulina se considera la medida estándar de oro
de la TFG, su uso en la práctica clínica es limitado. Krieser et al. (A-6) examinaron la relación entre el
inverso de la cistatina C (una proteína básica catiónica medida en mg/L) y la tasa de filtración
glomerular de inulina medida por el aclaramiento (ml/min/ 1,73 metros2). Los resultados de 27
pruebas se muestran en la siguiente tabla. Use DTPA GFR como predictor de Cistatina C inversa.

DTPA TFG 1/Cistatina C DTPA TFG 1/Cistatina C

18 0.213 42 0.485
21 0.265 42 0.427
21 0.446 43 0.562
23 0.203 43 0.463
27 0.369 48 0.549
27 0.568 48 0.538
30 0.382 51 0.571
32 0.383 55 0.546
32 0.274 58 0.402
32 0.424 60 0.592
36 0.308 62 0.541
37 0.498 67 0.568
41 0.398 68 0.800
88 0.667

Fuente: Datos proporcionados por cortesía de David Krieser, MD


9.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN 427

9.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN

Una vez que se ha obtenido la ecuación de regresión, se debe evaluar para determinar si
describe adecuadamente la relación entre las dos variables y si se puede usar de manera
efectiva con fines de predicción y estimación.

CuandoH0:b1¼0 no es rechazadoSi en la población la relación entreXyYes lineal,b1,


la pendiente de la recta que describe esta relación será positiva, negativa o cero. Sib1
es cero, los datos muestrales extraídos de la población producirán, a largo plazo,
ecuaciones de regresión que tienen poco o ningún valor para propósitos de
predicción y estimación. Además, aunque asumimos que la relación entreXyYes
lineal, es posible que la relación se describa mejor mediante algún modelo no lineal.
Cuando este es el caso, los datos de muestra cuando se ajustan a un modelo lineal
tenderán a producir resultados compatibles con una pendiente de población de cero.
Así, siguiendo una prueba en la que la hipótesis nula de queb1igual a cero no se
rechaza, podemos concluir (asumiendo que no hemos cometido un error tipo II al
aceptar una hipótesis nula falsa) ya sea (1) que aunque la relación entreX yYpuede
ser lineal, no es lo suficientemente fuerte paraXser de mucho valor para predecir y
estimarY,o (2) que la relación entreXyYno es lineal; es decir, algún modelo curvilíneo
proporciona un mejor ajuste a los datos. La figura 9.4.1 muestra los tipos de
relaciones entreXyYen una población que puede evitar el rechazo de la hipótesis nula
de queb1¼0.

CuandoH0:b1¼0 es rechazadoAhora consideremos las situaciones en una población


que pueden conducir al rechazo de la hipótesis nula de queb1¼0. Suponiendo que no
cometemos un error tipo I, se rechaza la hipótesis nula de queb1¼0 puede atribuirse a
una de las siguientes condiciones en la población: (1) la relación es lineal y de fuerza
suficiente para justificar el uso de ecuaciones de regresión muestral para predecir y
estimarYpara valores dados deX;y (2) hay un buen ajuste de los datos a un modelo lineal,
pero algún modelo curvilíneo podría proporcionar un ajuste aún mejor. La Figura 9.4.2
ilustra las dos condiciones de población que pueden conducir al rechazo de H0:b1¼0.

Por lo tanto, vemos que antes de usar una ecuación de regresión muestral para
predecir y estimar, es deseable probarH0:b1¼0. Podemos hacer esto usando el
análisis de varianza y elFestadística o usando eltestadística. Ilustraremos ambos
métodos. Sin embargo, antes de hacer esto, veamos cómo podemos investigar la
fuerza de la relación entreXyy

El coeficiente de determinaciónUna forma de evaluar la fuerza de la ecuación de regresión


es comparar la dispersión de los puntos alrededor de la línea de regresión con la dispersión
alrededor de:y,la media de los valores muestrales deySi tomamos el diagrama de dispersión del
ejemplo 9.3.1 y dibujamos a través de los puntos una línea que interseca elY-eje en -yy es
paralela a laX-eje, podemos obtener una impresión visual de las magnitudes relativas de la
dispersión de los puntos sobre esta línea y la línea de regresión. Esto se ha hecho en la Figura
9.4.3.
428 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

X
(a)

X
(b)
FIGURA 9.4.1 Condiciones en una población que pueden evitar el rechazo de la hipótesis nula
esob1¼0. (a)La relación entreXyYes lineal, perob1está tan cerca de cero que es probable que los datos de la
muestra no produzcan ecuaciones que sean útiles para predecirYcuandoXes dado. (b)La relación entreXyY
no es lineal; un modelo curvilíneo proporciona un mejor ajuste a los datos; No es probable que los datos de
muestra produzcan ecuaciones que sean útiles para predecirYcuandoXes dado.

Parece bastante obvio a partir de la figura 9.4.3 que la dispersión de los puntos alrededor
de la línea de regresión es mucho menor que la dispersión alrededor de -ylínea. No
desearíamos, sin embargo, decidir sobre esta sola base que la ecuación es útil. La situación
puede no ser siempre tan clara, por lo que una medida objetiva de algún tipo sería mucho más
deseable. Tal medida objetiva, llamadacoeficiente de determinación,está disponible.

La desviación totalAntes de definir el coeficiente de determinación, justifiquemos su uso


examinando la lógica detrás de su cálculo. Comenzamos considerando el punto
correspondiente a cualquier valor observado,yi, y midiendo su distancia vertical desde el -
ylínea. Llamamos a esto eldesviación totaly designarlodyi- -yÞ.

La desviación explicadaSi medimos la distancia vertical desde la línea de regresión


hasta el -ylínea, obtenemosðŷi- -yÞ,que se llama eldesviación explicada, ya que
muestra en cuánto se reduce la desviación total cuando la línea de regresión se
ajusta a los puntos.
9.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN 429

X
(a)

X
(b)
FIGURA 9.4.2 Condiciones de la población relativas aXyYque puede causar el rechazo de la
hipótesis nula de queb1¼0. (a)La relación entreXyYes lineal y de fuerza suficiente para justificar el
uso de una ecuación de regresión de muestra para predecir y estimarYpara valores dados deX. (b)Un
modelo lineal proporciona un buen ajuste a los datos, pero algún modelo curvilíneo proporcionaría
un ajuste aún mejor.

Desviación inexplicableFinalmente, medimos la distancia vertical del punto observado


desde la línea de regresión para obtenerdyi- ŷiÞ,que se llama el desviación inexplicable,ya
que representa la porción de la desviación total no “explicada” o explicada por la
introducción de la línea de regresión. Estas tres cantidades se muestran para un valor
típico deYen la Figura 9.4.4. La diferencia entre el valor observado deYy el valor predicho
deY,dyi- ŷiÞ,también se conoce como unresidual. El conjunto de residuos se puede utilizar
para probar la linealidad subyacente y los supuestos de igualdad de varianzas del modelo
de regresión descrito en la Sección 9.2. Este procedimiento se ilustra al final de esta
sección.
Se ve, entonces, que la desviación total para un determinadoyies igual a la suma de las
desviaciones explicadas y no explicadas. Podemos escribir esto simbólicamente como

dyi- -yÞ ¼ ðŷi- -yÞ þ ðyi- ŷiÞ (9.4.1)

total explicado sin explicar


desviación desviación desviación
430 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

260

240

220

200

180
ŷ= _216 + 3,46X
Área abdominal profunda AT (cm2),Y

160

140

120

100
y–=101.89

80

60

40

20

0
0 60 70
sesenta y cinco 75 80 85 90 95 100 105 110 115 120 125
Circunferencia de la cintura (cm),X

FIGURA 9.4.3Diagrama de dispersión, línea de regresión muestral yy-línea para el Ejemplo 9.3.1.

Si medimos estas desviaciones para cada valor deyiy ŷi, al cuadrado de cada desviación, y
sumamos las desviaciones al cuadrado, tenemos
X X X
dyi- -yÞ2¼ ðŷi- -yÞ 2þ dyi- ŷ2 iÞ (9.4.2)

total explicado inexplicable


suma suma suma
de cuadrados de cuadrados de cuadrados

Estas cantidades pueden considerarse medidas de dispersión o variabilidad.

Suma total de cuadradosElsuma total de cuadrados (SST), por ejemplo, es una medida de la
dispersión de los valores observados deYsobre su media -y;es decir, este término es una
medida de la variación total en los valores observados deyEl lector reconocerá este término
como el numerador de la fórmula familiar para la varianza muestral.

Suma de cuadrados explicadaElsuma de cuadrados explicadamide la cantidad de


la variabilidad total en los valores observados deYque se explica por la relación lineal
entre los valores observados deXyyEsta cantidad se conoce también comosuma de
cuadrados por regresión lineal (SSR).
9.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN 431

260

240
inexplicable
desviación
220 (yi– ŷi)

200
Desviación total
Área abdominal profunda AT (cm2),Y 180 (yi– y–)

160 Explicado
desviarse_ion
ŷ= _216 + 3,46X (ŷi- y)
140

120

100
y–=101.89

80

60

40

20

0
0 60 70
sesenta y cinco 75 80 85 90 95 100 105 110 115 120 125
Circunferencia de la cintura (cm),X

FIGURA 9.4.4Diagrama de dispersión que muestra las desviaciones totales, explicadas y no explicadas para un
valor seleccionado deY,Ejemplo 9.3.1.

Suma de cuadrados inexplicableElsuma de cuadrados inexplicablees una medida de la


dispersión de lo observadoYvalores sobre la línea de regresión y a veces se le llamaerror de
suma de cuadrados,o elsuma residual de cuadrados (SSE).Es esta cantidad la que se minimiza
cuando se obtiene la línea de mínimos cuadrados.
Podemos expresar la relación entre los valores de las tres sumas de cuadrados como

acero inoxidable¼RSSþSSE

Los valores numéricos de estas sumas de cuadrados para nuestro ejemplo ilustrativo aparecen en la
tabla de análisis de varianza de la figura 9.3.2. Así, vemos queacero inoxidable¼354531,RSS¼237549,
SSE¼116982, y

354531¼237549þ116982
354531¼354531

Calculadorr2 Es intuitivamente atractivo especular que si una ecuación de regresión hace


un buen trabajo al describir la relación entre dos variables, la suma de cuadrados
explicada o de regresión debería constituir una gran proporción de la suma total de
432 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

cuadrícula. Sería interesante, entonces, determinar la magnitud de esta proporción calculando


la razón entre la suma de cuadrados explicada y la suma total de cuadrados. Esto es
exactamente lo que se hace al evaluar una ecuación de regresión basada en datos de muestra,
y el resultado se llama muestra.coeficiente de determinación, r2. Eso es,
PAG 2
ðŷ RSS
r2¼ PAGi- -yÞ ¼
dyi- -yÞ2 acero inoxidable

En nuestro ejemplo actual tenemos, utilizando los valores de sumas de cuadrados de la Figura 9.3.2,

237549
r2¼ ¼ :67
354531

El coeficiente de determinación muestral mide la proximidad del ajuste de la ecuación de


regresión muestral a los valores observados deyCuando las cantidadesdyi- ŷiÞ,las distancias verticales
de los valores observados deYde las ecuaciones, son pequeñas, la suma de cuadrados no explicada es
pequeña. Esto conduce a una gran suma explicada de cuadrados que conduce, a su vez, a un gran
valor der2. Esto se ilustra en la Figura 9.4.5.
En la Figura 9.4.5(a)vemos que todas las observaciones se encuentran cerca de la línea de
regresión, y esperaríamosr2ser grande De hecho, el calculador2para estos datos es .986, lo que indica
que alrededor del 99 por ciento de la variación total en elyise explica por la regresión.
En la Figura 9.4.5(b)ilustramos un caso en el que elyiestán ampliamente dispersos
alrededor de la línea de regresión, y allí sospechamos quer2es pequeño. el calculador2para los
datos es .403; es decir, menos del 50 por ciento de la variación total en elyise explica por la
regresión.
El mayor valor quer2puede asumir es 1, resultado que ocurre cuando toda la variación en elyise
explica por la regresión. Cuandor2¼1 todas las observaciones caen en la línea de regresión. Esta
situación se muestra en la Figura 9.4.5(C).
El límite inferior der2es 0. Este resultado se obtiene cuando la línea de regresión y la
línea trazada a través de -ycoincidir. En esta situación, ninguna de las variaciones en elyise
explica por la regresión. Figura 9.4.5(d)ilustra una situación en la quer2está cerca de cero.

Cuandor2es grande, entonces, la regresión ha explicado una gran proporción de la


variabilidad total en los valores observados deY,y miramos con favor la ecuación de regresión.
Por otro lado, un pequeñor2lo que indica una falla de la regresión para dar cuenta de una gran
proporción de la variación total en los valores observados deY,tiende a poner en duda la
utilidad de la ecuación de regresión para propósitos de predicción y estimación. Sin embargo,
no emitiremos un juicio final sobre la ecuación hasta que haya sido sometida a una prueba
estadística objetiva.

PruebasH0:b1¼0 con elFEstadísticaEl siguiente ejemplo ilustra un método


para llegar a una conclusión con respecto a la relación entreXyy

EJEMPLO 9.4.1
Consulte el Ejemplo 9.3.1. Queremos saber si podemos concluir que, en la población de la que se
extrajo nuestra muestra,XyYestán relacionados linealmente.
9.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN 433

(a) (b)
Corte ajustado, grander2 Ajuste pobre, pequeñor2

(C) (d)
r2= 1 r2 ← 0

FIGURA 9.4.5 r2como una medida de la cercanía de ajuste de la línea de regresión muestral a la muestra
observaciones.

Solución:Los pasos en el procedimiento de prueba de hipótesis son los siguientes:

1. Datos. Los datos se describieron en la declaración de apertura del Ejemplo


9.3.1.
2. Supuestos.Suponemos que el modelo de regresión lineal simple y sus
supuestos subyacentes, tal como se indica en la Sección 9.2, son aplicables.
3. Hipótesis.
H0:b1¼0
HA:b16¼0
a¼ :05
434 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

TABLA 9.4.1 Tabla ANOVA para regresión lineal simple

Fuente de variación SS d.f. EM realidad virtual

regresión lineal RSS 1 MSR¼SSR=1 MSR/MSE


Residual SSE n-2 MSE¼SE=dn-2Þ

Total acero inoxidable n-1

4. Estadística de prueba.La estadística de prueba es VR como se explica en la discusión que


sigue.
A partir de los tres términos de sumas de cuadrados y sus grados de libertad
asociados, se puede construir la tabla de análisis de varianza de la Tabla 9.4.1.
En general, los grados de libertad asociados con la suma de cuadrados
debido a la regresión es igual al número de constantes en la ecuación de
regresión menos 1. En el caso lineal simple tenemos dos estimaciones,b0y b1; por
lo tanto, los grados de libertad para la regresión son 2 - 1¼1.
5. Distribución de la estadística de prueba.Se puede demostrar que cuando
la hipótesis de no relación lineal entreXyYes cierto, y cuando se
cumplen los supuestos que subyacen a la regresión, la razón obtenida
al dividir el cuadrado medio de la regresión por el cuadrado medio
residual se distribuye comoFcon 1 yn-2 grados de libertad.
6. Regla de decisión.RechazarH0si el valor calculado de VR es igual o
mayor que el valor crítico deF.
7. Cálculo de la estadística de prueba.Como se muestra en la Figura 9.3.2, el valor
calculado deFes 217,28.
8. Decisión estadística.Como 217.28 es mayor que 3.94, el valor crítico deF (
obtenido por interpolación) para 1 y 107 grados de libertad, se rechaza
la hipótesis nula.
9. Conclusión.Concluimos que el modelo lineal proporciona un buen ajuste a los
datos.
10pagvalor.Para esta prueba, desde 217:28 > 8:25, tenemospag < :005.
Examinando la Figura 9.3.2, vemos que, de hecho,pag < .001.
&

Estimación del coeficiente de determinación de la poblaciónEl


El coeficiente de determinación muestral proporciona una estimación puntual der2elcoeficiente
de determinación de la población.El coeficiente de determinación de la población,r2tiene la
misma función relativa a la población quer2tiene a la muestra. Muestra qué proporción de la
población total varía enYse explica por la regresión deYenX.Cuando el número de grados de
libertad es pequeño,r2está sesgado positivamente. Eso es,r2tiende a ser grande. Un estimador
insesgado der2Es provisto por
PAG
dyi- ŷ2 iÞ =ðn-2Þ
~r2¼1 - PAG (9.4.3)
dyi- -yÞ2=ðn-1Þ
9.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN 435

Observe que el numerador de la fracción en la Ecuación 9.4.3 es el cuadrado medio no


explicado y el denominador es el cuadrado medio total. Estas cantidades aparecen en la tabla
de análisis de varianza. Para nuestro ejemplo ilustrativo tenemos, usando los datos de la Figura
9.3.2,

116982=107
~r2¼1 - ¼ :66695
354531=108

Esta cantidad está etiquetada como R-sq(adj) en la Figura 9.3.2 y se reporta como 66.7 por ciento. Vemos que
este valor es menor que

116982
r2¼1 - ¼ :67004
354531

Vemos que la diferencia enr2y ~r2se debe al factordn-1Þ=ðn-2Þ.Cuandonortees grande,


este factor se aproximará a 1 y la diferencia entrer2y ~r2se aproximará a cero.

PruebasH0:b1¼0 con eltEstadísticaCuando los supuestos establecidos en


Se cumple la Sección 9.2, b̂0y B1son estimadores puntuales insesgados de los parámetros
correspondientesb0yb1. Dado que, bajo estos supuestos, las subpoblaciones deYlos valores se
distribuyen normalmente, podemos construir intervalos de confianza y probar hipótesis sobreb
0yb1. Cuando los supuestos de la Sección 9.2 son ciertos, las distribuciones muestrales de b̂0y B1

se distribuyen normalmente con medias y varianzas de la siguiente manera:

metrob
0
¼b 0 (9.4.4)

PAG
s2y=x Xi2
s2b0 ¼ PAG (9.4.5)
norte dXi- -XÞ2

metrob
1
¼b 1 ( 9.4.6)

s2yjX
s2b1 ¼PAG (9.4.7)
dXi- -XÞ2

En las Ecuaciones 9.4.5 y 9.4.7s2 y=xes la varianza no explicada de las subpoblaciones deY
valores.
Con conocimiento de las distribuciones muestrales de b̂0y B1podemos construir
intervalos de confianza y probar hipótesis relativas ab0yb1de la manera habitual.
Inferencias sobreano suelen ser de interés. Por otro lado, como hemos visto, gran parte
del interés se centra en los procedimientos inferenciales con respecto a b̂1. La razón de
esto es el hecho de queb1nos dice mucho sobre la forma de la relación entreXyy CuandoX
yYestán relacionados linealmente a b̂ positivo1indica que, en general,Yaumenta a medida
queX aumenta, y decimos que hay unrelación lineal directaentreXyyUna b negativa1indica
que los valores deYtienden a disminuir a medida que los valores deXaumentar, y decimos
436 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Y Y Y

X X X
(a) (b) (C)
FIGURA 9.4.6Diagramas de dispersión que muestran (a)relación lineal directa, (b)relación lineal
inversa, y (C)ninguna relación lineal entreXyy

que hay unrelación lineal inversaentreXyyCuando no existe una relación lineal


entreXyY, b̂1es igual a cero. Estas tres situaciones se ilustran en
Figura 9.4.6.

La estadística de prueba Para probar hipótesis sobreb1el estadístico de prueba cuandos2 yjXes
conocido es

b1-db1Þ0
z¼ (9.4.8)
sb1

dóndedb1Þ0es el valor hipotético deb1. El valor hipotético deb1no tiene que ser cero,
pero en la práctica, la mayoría de las veces, la hipótesis nula de interés es que b1¼0.

Como una reglas2 yjXes desconocido. Cuando este es el caso, el estadístico de prueba es

b1-db1Þ0
t¼ (9.4.9)
sb1

dóndesbes una estimación desbytse distribuye como Student'stconn-2 grados de


1 1
libertad.
Si la probabilidad de observar un valor tan extremo como el valor del estadístico de prueba calculado
por la Ecuación 9.4.9 cuando la hipótesis nula es verdadera es menor queun =2 (dado que tenemos una
prueba bilateral), se rechaza la hipótesis nula.

EJEMPLO 9.4.2
Consulte el Ejemplo 9.3.1. Deseamos saber si podemos concluir que la pendiente de la
línea de regresión poblacional que describe la relación entre X e Y es cero.

Solución:

1. Datos.Ver Ejemplo 9.3.1.


2. Supuestos.Suponemos que el modelo de regresión lineal simple y sus
supuestos subyacentes son aplicables.
9.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN 437

3. Hipótesis.

H0:b1¼0
HA:b16¼0
a¼ :05
4. Estadística de prueba. El estadístico de prueba viene dado por la Ecuación 9.4.9.

5. Distribución de la estadística de prueba.Cuando se cumplen los supuestos yH0es


cierto, el estadístico de prueba se distribuye como Student'stconn-2 grados de
libertad.
6. Regla de decisión.RechazarH0si el valor calculado detes mayor o
igual a 1.9826 o menor o igual a -1:9826.
7. Cálculo de estadísticas.El resultado de la figura 9.3.2 muestra
que b1¼3:4589,s
1
b¼ :2347, y

3:4589 - 0
t¼ ¼14:74
:2347

8. Decisión estadística.RechazarH0porque 14:74 > 1:9826.


9. Conclusión.Concluimos que la pendiente de la línea de regresión verdadera no es cero.

10pagvalor.Elpagvalor para esta prueba es menor a .01, ya que, cuandoH0es cierto, la


probabilidad de obtener un valor detigual o mayor que 2.6230 (obtenido por
interpolación) es .005, y la probabilidad de obtener un valor dettan pequeño
como -2:6230 o más pequeño también es .005. Como 14.74 es mayor que 2.6230,
la probabilidad de observar un valor dettan grande como o más grande que
14.74 (cuando la hipótesis nula es verdadera) es menor que .005. Doblamos este
valor para obtener 2d:005Þ ¼ :01.
O elFestadística o latla estadística se puede utilizar para probar H0:
b1¼0. El valor de la razón de varianza es igual al cuadrado del valor de la
testadística (es decir,t2¼F)y, por lo tanto, ambas estadísticas conducen a
la misma conclusión. Para el ejemplo actual, vemos que d14:74Þ2¼
217:27, el valor obtenido usando elFestadístico del ejemplo 9.4.1. Por lo
tanto, el correspondientepagel valor será el mismo para con elF
estadística y latestadística.
La implicación práctica de nuestros resultados es que podemos
esperar obtener mejores predicciones y estimaciones deYsi usamos la
ecuación de regresión muestral de lo que obtendríamos si ignoramos la
relación entreXyy El hecho de quebes positivo nos lleva a creer queb1es
positiva y que la relación entreXyYes una relación lineal directa. &

Como ya se ha señalado, la Ecuación 9.4.9 puede usarse para probar la hipótesis nula de que b1
es igual a algún valor distinto de 0. El valor hipotético parab1,db1Þ0se sustituye en la Ecuación
9.4.9. Todas las demás cantidades, así como los cálculos, son los mismos que en el ejemplo
ilustrativo. Los grados de libertad y el método para determinar el significado también son los
mismos.
438 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Intervalo de confianza parab1 Una vez que determinamos que es poco probable, a la luz de la evidencia
de la muestra, queb1es cero, podemos estar interesados en obtener una estimación de intervalo deb1. La
fórmula general para un intervalo de confianza,

estimador -dfactor de confiabilidadÞðerror estándar de la estimaciónÞ

puede ser usado. Al obtener un intervalo de confianza parab1, el estimador es b̂1, el


factor de confiabilidad es algún valor dezot (dependiendo de si o nos2 yjXes conocido), y
el error estándar del estimador es
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

s2yjX
sb 1 ¼ PAG
dXi- -XÞ2

Cuandos2yjXes desconocido,sbse estima por


sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

s2
sb1¼PAGyjX 2
dXi- -XÞ

dóndes2yjX¼MSE
En la mayoría de las situaciones prácticas, nuestro 100d1 -aÞintervalo de confianza porcentual parabes

b1-td1-un =2Þsb1 (9.4.10)

Para nuestro ejemplo ilustrativo, construimos el siguiente intervalo de confianza del 95 por
ciento parab:

3:4589 - 1:9826d:2347Þ
d2:99; 3:92Þ

Interpretamos este intervalo de la manera habitual. Desde el punto de vista probabilístico


decimos que en muestreo repetido el 95 por ciento de los intervalos así construidos incluiránb1.
La interpretación práctica es que estamos 95 por ciento seguros de que el único intervalo
construido incluyeb1.

Uso del intervalo de confianza para probarH0:b1¼0es instructivo para


tenga en cuenta que el intervalo de confianza que construimos no incluye cero, por lo que cero no es
un candidato para el parámetro que se estima. Sentimos, entonces, que es poco probable queb1¼0.
Esto es compatible con los resultados de nuestra prueba de hipótesis en la que rechazamos la
hipótesis nula de queb1¼0. En realidad, siempre podemos probarH0:b1¼0 en elanivel de significancia
construyendo el 100d1 -aÞintervalo de confianza porcentual parab1, y podemos rechazar o dejar de
rechazar la hipótesis sobre la base de si el intervalo incluye cero o no. Si el intervalo contiene cero, no
se rechaza la hipótesis nula; y si el cero no está contenido en el intervalo, rechazamos la hipótesis
nula.

Interpretación de los resultadosDebe enfatizarse que si no se rechaza la hipótesis nula


de queb1¼0 no significa queXyYno están relacionados. No sólo es posible que se haya
cometido un error de tipo II sino que puede ser cierto queXyYestán relacionados de
alguna manera no lineal. Por otro lado, cuando rechazamos la hipótesis nula de queb1¼0,
no podemos concluir que elverdaderorelación entreXyYes lineal. Nuevamente, puede ser
9.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN 439

que aunque los datos se ajustan bastante bien al modelo de regresión lineal (como lo demuestra el
hecho de que la hipótesis nula de queb1¼0 es rechazado), algún modelo no lineal proporcionaría un
ajuste aún mejor. En consecuencia, cuando rechazamosH0esob1¼0, lo mejor que podemos decir es
que se pueden obtener resultados más útiles (discutidos a continuación) al tener en cuenta la
regresión deYenXque en ignorarlo.

Prueba de los supuestos de regresiónLos valores del conjunto de residuos,


dyi- ŷiÞ,para un conjunto de datos se utilizan a menudo para probar los supuestos de linealidad y de
varianzas iguales (supuestos 4 y 5 de la Sección 9.2) que subyacen al modelo de regresión. Esto se
hace graficando los valores de los residuos en ely-eje y los valores pronosticados deysobre elX-eje. Si
estos gráficos muestran una dispersión relativamente aleatoria de puntos por encima y por debajo de
una línea horizontal endyi- ŷi¼0, se supone que estos supuestos se han cumplido para

línea
el

FIGURA 9.4.7Gráficas residuales útiles para probar los supuestos de linealidad y de varianzas iguales del
modelo de regresión. (a)Un patrón aleatorio de puntos que ilustran la no violación de los supuestos. (b)Un
patrón no aleatorio que ilustra una probable violación de la suposición de linealidad.
(C)Un patrón de canalización que ilustra una probable violación de la suposición de igualdad de varianzas.
440 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

FIGURA 9.4.8Gráfica residual de datos del Ejemplo 9.3.1.

Muchos paquetes de computadorapag


prffioffiffivffiffiffiiffidffiffiffie parcelas residuales automáticamente. Estas parcelas suelen utilizar

valores estandarizados (es decir,mii=MSE)de los valores residuales y predichos, pero se interpretan de
la misma manera que los gráficos de valores no estandarizados.

EJEMPLO 9.4.3
Consulte el Ejemplo 9.3.1. Deseamos usar gráficas de residuos para probar las suposiciones de linealidad y
varianzas iguales en los datos.

Solución:En la Figura 9.4.8 se muestra una gráfica de residuos.


Dado que hay una dispersión relativamente igual y aleatoria de puntos por encima y
por debajo del residuodyi- ŷi¼0, se supone que la suposición de linealidad es válida. Sin
embargo, la tendencia de canalización del gráfico sugiere que a medida que aumenta el
valor predicho del área de AT abdominal profunda, también aumenta la cantidad de error.
Esto indica que la suposición de varianzas iguales puede no ser válida para estos datos.
&

EJERCICIOS

9.4.1 a 9.4.5Consulte los Ejercicios 9.3.3 a 9.3.7, y para cada uno haga lo siguiente:
(a)Calcule el coeficiente de determinación.
(b)Prepare una tabla ANOVA y use elFestadístico para probar la hipótesis nula de queb1¼0. Deja a¼ :
05.
(C)Utilizar eltestadístico para probar la hipótesis nula de queb1¼0 en el nivel de significancia de .05.
(d)Determina elpagvalor para cada prueba de hipótesis.
(mi)Exprese sus conclusiones en términos del problema.
(F)Construya el intervalo de confianza del 95 por ciento parab1.
9.5 USO DE LA ECUACIÓN DE REGRESIÓN 441

9.5 USO DE LA ECUACIÓN DE REGRESIÓN

Si los resultados de la evaluación de la ecuación de regresión muestral indican que existe una
relación entre las dos variables de interés, podemos poner en práctica la ecuación de regresión.
Hay dos formas en que se puede utilizar la ecuación. puede ser usado para predecirque valorY
es probable que asuma dado un valor particular deX.Cuando se cumple el supuesto de
normalidad de la Sección 9.2, unintervalo de predicciónpara este valor predicho deYpuede ser
construido.
También podemos usar la ecuación de regresión paraestimarla media de la subpoblación
deYvalores que se supone que existen en cualquier valor particular deX.De nuevo, si se cumple
el supuesto de poblaciones normalmente distribuidas, se puede construir un intervalo de
confianza para este parámetro. El valor predicho deYy la estimación puntual de la media de la
subpoblación deYserá numéricamente equivalente para cualquier valor particular deXpero,
como veremos, el intervalo de predicción será más amplio que el intervalo de confianza.

predecirYpara una dadaXSi se sabe, o si estamos dispuestos a asumir


que se cumplan los supuestos de la Sección 9.2, y cuandos2 yjXes desconocido, entonces el 100d1 -aÞ
intervalo de predicción porcentual paraYes dado por

-
tu
vffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

t 1þ 1 xpag
- -x2
ŷ - td1-un =2ÞsyjX þPAG (9.5.1)
norte dXi- -XÞ2

dóndeXpages el valor particular deXen el que deseamos obtener un intervalo de predicción para
Y y los grados de libertad utilizados en la seleccióntsonn-2.

Estimación de la media deYpara una dadaXlos 100d1 -aÞpor ciento


intervalo de confianza parametroyjX, cuandos2 yjXes desconocido, está dado por

u-
tu xpag
- -x2
t1
ŷ - td1-un =2ÞsyjXnorte þPAG (9.5.2)
dXi- -XÞ2

Usamos MINITAB para ilustrar, para un valor específico deX,el cálculo de un intervalo de confianza del
95 por ciento para la media deYy un intervalo de predicción del 95 por ciento para un individuoY
medición.
Supongamos, para nuestro ejemplo actual, que deseamos hacer predicciones y estimaciones sobre AT
para una circunferencia de cintura de 100 cm. En el cuadro de diálogo de regresión, haga clic en "Opciones".
Ingrese 100 en el cuadro "Intervalo de predicción para nuevas observaciones". Haga clic en "Límites de
confianza" y haga clic en "Límites de predicción".
Obtenemos la siguiente salida:

Adaptar Stdev.Ajuste 95,0% IC 95,0% IP


129.90 3.69 (122.58, 137.23) (63.93, 195.87)
442 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Interpretamos el intervalo de confianza (IC) del 95 por ciento de la siguiente manera.


Si tomamos muestras repetidamente de nuestra población de hombres, realizamos un
análisis de regresión y estimamosmetroyjX¼100con un intervalo de confianza construido de
manera similar, alrededor del 95 por ciento de dichos intervalos incluiría la cantidad media de
TA abdominal profunda para la población. Por esta razón, estamos seguros en un 95 por ciento
de que el único intervalo construido contiene la media de la población y que está entre 122,58 y
137,23.
Nuestra interpretación de un intervalo de predicción (PI) es similar a la interpretación de un intervalo
de confianza. Si tomamos muestras repetidamente, hacemos un análisis de regresión y construimos
intervalos de predicción para hombres que tienen una circunferencia de cintura de 100 cm, alrededor del 95
por ciento de ellos incluirán el valor AT abdominal profundo del hombre. Esta es la interpretación
probabilística. La interpretación práctica es que estamos seguros en un 95 por ciento de que un hombre que
tiene una circunferencia de cintura de 100 cm tendrá un área de TA abdominal profunda de entre 63,93 y
195,87 centímetros cuadrados.
Se pueden calcular intervalos de confianza e intervalos de predicción simultáneos para todos los
puntos posibles a lo largo de una línea de regresión ajustada. Trazar líneas a través de estos puntos
proporcionará una representación gráfica de estos intervalos. Dado que el punto medio de datosdX - ;Y-Þes
siempre incluidos en la ecuación de regresión, como se ilustra en las ecuaciones 9.3.2 y 9.3.3, los
gráficos de los intervalos simultáneos siempre proporcionarán las mejores estimaciones en el medio
de la línea y el error aumentará hacia los extremos de la línea. Esto ilustra el hecho de que la
estimación dentro de los límites del conjunto de datos, llamadointerpolación,es aceptable, pero esa
estimación fuera de los límites del conjunto de datos, llamadaextrapolación,no es aconsejable ya que
el error de predicción puede ser bastante grande. Ver Figura 9.5.1.
La Figura 9.5.2 contiene una impresión parcial del SAS®análisis de regresión lineal simple de los
datos del ejemplo 9.3.1.

Línea ResistenteCon frecuencia, los conjuntos de datos disponibles para el análisis mediante técnicas de
regresión lineal contienen una o más observaciones "inusuales"; es decir, valores deXoy,o ambos, mamá

a mí

FIGURA 9.5.1 Intervalos de confianza simultáneos (a)e intervalos de predicción (b)para los datos en
Ejemplo 9.3.1.
9.5 USO DE LA ECUACIÓN DE REGRESIÓN 443

El Sistema SAS

Modelo: MODEL1
Variable dependiente: Y

Análisis de variación

La suma de Significar

Fuente DF Cuadrícula Cuadrado Valor F Problema>F

Modelo 1 237548.51620 237548.51620 217.279 0.0001


Error 107 116981.98602 1093.28959
Total C 108 354530.50222

Raíz MSE 33.06493 R Plaza 0.6700


Dep Significar 101.89404 Adj R-sq 0.6670
CV 32.45031

Estimaciones de parámetros

Parámetro Estándar T para H0:


DF variable Estimar Error Parámetro =0 Problema > |T|

INTERCEPCIÓN 1 - 215.981488 21.79627076 - 9.909 0.0001


X 1 3.458859 0.23465205 14.740 0.0001

FIGURA 9.5.2Impresión parcial del análisis por computadora de los datos dados en el Ejemplo 9.3.1,
usando el SAS®paquete de software.

observaciones inusuales en la circunferencia de la cintura y los datos de TA abdominal profunda que se muestran en
la Tabla 9.3.1.
El método de mínimos cuadrados para ajustar una línea recta a los datos es sensible a las
observaciones inusuales, y la ubicación de la línea ajustada puede verse afectada sustancialmente por
ellas. Debido a esta característica del método de mínimos cuadrados, se dice que la línea de mínimos
cuadrados resultante carece deresistenciaa la influencia de observaciones inusuales. Se han ideado
varios métodos para tratar este problema, incluido uno desarrollado por John W. Tukey. La línea
resultante se denomina de diversas formas comola linea de tukeyy ellínea resistente.
Basada en medianas, que, como hemos visto, son medidas descriptivas resistentes a los
valores extremos, la metodología de línea resistente es una herramienta de análisis de datos
exploratoria que permite al investigador ajustar rápidamente una línea recta a un conjunto de
datos que consta de pares.x, ymediciones. La técnica consiste en dividir, sobre la base de la
variable independiente, las medidas de la muestra en tres grupos de tamaño lo más parecido
posible: las medidas más pequeñas, las medidas más grandes y las intermedias. La línea
resistente es la línea ajustada de tal manera que hay un número igual de valores
444 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Caja de diálogo: Comando de sesión:

Estadística AED Línea Resistente BTT > Nombre C3 'RESI1' C4 'AJUSTES1'


MTB > RLine C2 C1 'RESI1' 'FITS1'; SUBC>
MaxIteraciones 10.

TipoC2enRespuestayC1enPredictores. ControlarDerechos
residuales de autoryEncaja.Hacer clicDE ACUERDO.

Producción:

Ajuste de línea resistente: C2 versus C1

Pendiente = 3.2869 Nivel = - 203.7868 Media pendiente proporción = 0.690

FIGURA 9.5.3Procedimiento de línea resistente MINITAB y salida para los datos de la Tabla 9.3.1.

por encima y por debajo tanto en el grupo más pequeño como en el grupo más grande. La pendiente
resultante y y-las estimaciones de intercepción son resistentes a los efectos de cualquiera de los extremosy
valores, extremoXvalores, o ambos. Para ilustrar el ajuste de una línea resistente, usamos los datos de la
Tabla 9.3.1 y MINITAB. El procedimiento y la salida se muestran en la Figura 9.5.3.
Vemos en el resultado de la Figura 9.5.3 que la línea resistente tiene una pendiente de 3.2869 y
unay-intercepción de -203:7868. Elrelación de media pendiente,mostrado en la salida como igual a
.690, es un indicador del grado de linealidad entreXyy.Se calcula una pendiente, llamada media
pendiente, para cada mitad de los datos de la muestra. La razón de la media pendiente derecha,bR, y
la media pendiente izquierda,bL, es igual abR=bL. Si la relación entreXyyes recta, las medias pendientes
serán iguales y su relación será 1. Una relación de medias pendientes que no se acerque a 1 indica
una falta de linealidad entreXyy.
Hartwig y Dearing analizan con más detalle la metodología de la línea resistente.
(1), Johnstone y Velleman (2), McNeil (3) y Velleman y Hoaglin (4).

EJERCICIOS

En cada ejercicio hacer referencia al ejercicio anterior correspondiente y, por el valor deXindicado, (a)
construya el intervalo de confianza del 95 por ciento parametroyjXy (b) construya el intervalo de predicción del
95 por ciento paray

9.5.1Consulte el ejercicio 9.3.3 y seaX¼400.


9.5.2Consulte el ejercicio 9.3.4 y seaX¼1:6.
9.5.3Consulte el ejercicio 9.3.5 y seaX¼4:16.
9.5.4Consulte el ejercicio 9.3.6 y seaX¼29:4.
9.5.5Consulte el ejercicio 9.3.7 y seaX¼35.
9.6 EL MODELO DE CORRELACIÓN 445

9.6 EL MODELO DE CORRELACIÓN

En el modelo de regresión clásico, que ha sido el modelo subyacente en nuestra discusión hasta este
punto, soloY,que se ha llamado variable dependiente, se requiere que sea aleatoria. La variableXse
define como una variable fija (no aleatoria o matemática) y se denomina variable independiente.
Recuérdese, también, que bajo este modelo las observaciones se obtienen frecuentemente
preseleccionando valores deXy determinando los valores correspondientes dey
cuando ambosYyXson variables aleatorias, tenemos lo que se llamamodelo de correlación.Por
lo general, bajo el modelo de correlación, las observaciones de la muestra se obtienen seleccionando
una muestra aleatoria de losunidades de asociación (que pueden ser personas, lugares, animales,
momentos, o cualquier otro elemento sobre el que se toman las dos medidas) y tomando en cada uno
una medida deXy una medida deyEn este procedimiento, los valores de Xno son preseleccionados
sino que ocurren al azar, dependiendo de la unidad de asociación seleccionada en la muestra.

Aunque el análisis de correlación no puede llevarse a cabo de manera significativa bajo el


modelo de regresión clásico, el análisis de regresión puede llevarse a cabo bajo el modelo de
correlación. La correlación entre dos variables implica una correlación entre variables que las
pone en pie de igualdad y no distingue entre ellas al referirse a una como variable dependiente
y a la otra como independiente. De hecho, en los procedimientos computacionales básicos, que
son los sPAG igual que para el modo de regresiónPAGl, podemos ajustar una línea recta a la
datos ya sea minimizando dyi- ŷ2 iÞo minimizando dXi- X2iÞ.En otras palabras, nosotros
puede hacer una regresión deXenYasí como una regresión deYenX.La línea ajustada en los dos
casos en general será diferente, y surge una pregunta lógica sobre qué línea ajustar.
Si el objetivo es únicamente obtener una medida de la fuerza de la relación entre las
dos variables, no importa qué línea se ajuste, ya que la medida normalmente calculada
será la misma en ambos casos. Sin embargo, si se desea usar la ecuación que describe la
relación entre las dos variables para los propósitos discutidos en las secciones anteriores,
no importa qué línea se ajuste. La variable para la que deseamos estimar medias o hacer
predicciones debe tratarse como la variable dependiente; es decir, esta variable debe
retroceder sobre la otra variable.

La distribución normal bivariadaBajo el modelo de correlación,XyY


se supone que varían juntos en lo que se denominadistribución conjunta.Si esta distribución conjunta
es una distribución normal, se denomina distribucióndistribución normal bivariada.Se pueden hacer
inferencias con respecto a esta población con base en los resultados de muestras extraídas
adecuadamente de ella. Si, por otro lado, se sabe que la forma de la distribución conjunta no es
normal, o si se desconoce la forma y no hay justificación para asumir la normalidad, los
procedimientos inferenciales no son válidos, aunque se pueden calcular medidas descriptivas.

Supuestos de correlaciónLas siguientes suposiciones deben cumplirse para que las inferencias
sobre la población sean válidas cuando el muestreo es de una distribución bivariada.

1.Para cada valor deXexiste una subpoblación normalmente distribuida deYvalores.


2.Para cada valor deYexiste una subpoblación normalmente distribuida deXvalores.
3.La distribución conjunta deXyYes una distribución normal llamadadistribución normal
bivariada.
446 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

f(X, Y) f(X, Y)

Y X Y X

(a) (b)

f(X, Y)

Y X

(C)
FIGURA 9.6.1Una distribución normal bivariada. (a)Una distribución normal bivariada. (b)Un corte que
muestra una subpoblación normalmente distribuida deYpor dadoX. (c)Un corte que muestra una
subpoblación normalmente distribuida deXpor dadoy

4.Las subpoblaciones deYtodos los valores tienen la misma varianza.


5.Las subpoblaciones deXtodos los valores tienen la misma varianza.

La distribución normal bivariada se representa gráficamente en la Figura 9.6.1. En esta


ilustración vemos que si cortamos el montículo paralelo aYen algún valor deX,el corte revela la
correspondiente distribución normal deyDe manera similar, un corte a través del montículo
paralelo aXen algún valor deYrevela la correspondiente subpoblación normalmente distribuida
deX.

9.7 EL COEFICIENTE DE CORRELACIÓN

La distribución normal bivariada discutida en la Sección 9.6 tiene cinco parámetros,sX,sy,metroX,


metroy, yR.Los primeros cuatro son, respectivamente, las desviaciones estándar y las medias
asociadas con las distribuciones individuales. El otro parámetro,r,se llama la poblacion
9.7 EL COEFICIENTE DE CORRELACIÓN 447

X
FIGURA 9.7.1Diagrama de dispersión parar¼ -1.

coeficiente de correlacióny mide la fuerza de la relación lineal entreX yy

El coeficiente de correlación poblacional es la raíz cuadrada positiva o negativa der2, el


coeficiente de determinación de la población discutido anteriormente, y dado que el coeficiente
de determinación toma valores entre 0 y 1 inclusive,rpuede asumir cualquier valor entre -1 yþ1.
Sir¼1 existe una correlación lineal directa perfecta entre las dos variables, mientras quer¼ -1
indica correlación lineal inversa perfecta. Sir¼0 las dos variables no están linealmente
correlacionadas. el signo dersiempre será el mismo que el signo deb1, la pendiente de la línea
de regresión de la población paraXyy
El coeficiente de correlación de la muestra,r,describe la relación lineal entre las observaciones
de la muestra en dos variables de la misma manera querdescribe la relación en una población. El
coeficiente de correlación de la muestra es la raíz cuadrada del coeficiente de determinación de la
muestra que se definió anteriormente.
Figuras 9.4.5(d)y 9.4.5(C),respectivamente, muestran diagramas de dispersión típicos
donde r!0dr2! 0Þyr¼ þ1dr2¼1Þ.La Figura 9.7.1 muestra un diagrama de dispersión típico donde r
¼ -1.
Normalmente nos interesa saber si podemos concluir quer6¼0, es decir, queX yYestán
linealmente correlacionados. Desdergeneralmente se desconoce, tomamos una muestra
aleatoria de la población de interés, calculamosr,la estimación der,y pruebaH0:r¼0 contra la
alternativar6¼0. El procedimiento se ilustrará en el siguiente ejemplo.

EJEMPLO 9.7.1
El propósito de un estudio de Kwast-Rabben et al. (A-7) fue analizar los potenciales evocados
somatosensoriales (SEP) y sus interrelaciones después de la estimulación de los dedos I, III y V en la mano.
Los investigadores querían establecer criterios de referencia en una población de control. Por lo tanto, se
reclutaron voluntarios sanos para el estudio. En el futuro, esta información podría ser muy valiosa ya que los
SEP pueden proporcionar un método para demostrar alteraciones funcionales en pacientes con sospecha de
lesión de la raíz cervical que tienen dolor y síntomas sensoriales. En el estudio, se aplicó estimulación en los
dedos con una intensidad por debajo del nivel del dolor. Grabaciones de columna
448 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

las respuestas se realizaron con electrodos fijados mediante crema adhesiva para electrodos a
la piel del sujeto. Una de las relaciones de interés fue la correlación entre la altura de un sujeto
(cm) y el pico de latencia espinal (Cv) del SEP. Los datos de 155 mediciones se muestran en la
Tabla 9.7.1.

TABLA 9.7.1 Medidas SEP de altura y columna (Cv) de la estimulación


del dedo I para 155 sujetos descritos en el ejemplo 9.7.1

Altura CV Altura CV Altura CV

149 14.4 168 16.3 181 15.8


149 13.4 168 15.3 181 18.8
155 13.5 168 16.0 181 18.6
155 13.5 168 16.6 182 18.0
156 13.0 168 15.7 182 17.9
156 13.6 168 16.3 182 17.5
157 14.3 168 16.6 182 17.4
157 14.9 168 15.4 182 17.0
158 14.0 170 16.6 182 17.5
158 14.0 170 16.0 182 17.8
160 15.4 170 17.0 184 18.4
160 14.7 170 16.4 184 18.5
161 15.5 171 16.5 184 17.7
161 15.7 171 16.3 184 17.7
161 15.8 171 16.4 184 17.4
161 16.0 171 16.5 184 18.4
161 14.6 172 17.6 185 19.0
161 15.2 172 16.8 185 19.6
162 15.2 172 17.0 187 19.1
162 16.5 172 17.6 187 19.2
162 17.0 173 17.3 187 17.8
162 14.7 173 16.8 187 19.3
163 16.0 174 15.5 188 17.5
163 15.8 174 15.5 188 18.0
163 17.0 175 17.0 189 18.0
163 15.1 175 15.6 189 18.8
163 14.6 175 16.8 190 18.3
163 15.6 175 17.4 190 18.6
163 14.6 175 17.6 190 18.8
164 17.0 175 16.5 190 19.2
164 16.3 175 16.6 191 18.5
164 16.0 175 17.0 191 18.5
164 16.0 176 18.0 191 19.0
165 15.7 176 17.0 191 18.5
165 16.3 176 17.4 194 19.8
(Continuación)
9.7 EL COEFICIENTE DE CORRELACIÓN 449

Altura CV Altura CV Altura CV

165 17.4 176 18.2 194 18.8


165 17.0 176 17.3 194 18.4
165 16.3 177 17.2 194 19.0
166 14.1 177 18.3 195 18.0
166 14.2 179 16.4 195 18.2
166 14.7 179 16.1 196 17.6
166 13.9 179 17.6 196 18.3
166 17.2 179 17.8 197 18.9
167 16.7 179 16.1 197 19.2
167 16.5 179 16.0 200 21.0
167 14.7 179 16.0 200 19.2
167 14.3 179 17.5 202 18.6
167 14.8 179 17.5 202 18.6
167 15.0 180 18.0 182 20.0
167 15.5 180 17.9 190 20.0
167 15.4 181 18.4 190 19.5
168 17.3 181 16.4
Fuente: Datos proporcionados por cortesía de Olga Kwast-Rabben, Ph.D.

Solución:El diagrama de dispersión y la línea de regresión de mínimos cuadrados se muestran en la Figura 9.7.2.
Supongamos que el investigador desea obtener una ecuación de regresión
para usar con fines de estimación y predicción. En ese caso, el coeficiente de
correlación de la muestra se obtendrá mediante los métodos discutidos en el
modelo de regresión.

21

20

19

18
CV (unidades)

17

dieciséis

15

14

13
150 160 170 180 190 200
Altura (cm)
FIGURA 9.7.2Altura y potenciales cervicales (columna vertebral) en la
estimulación del dígito I para los datos descritos en el Ejemplo 9.7.1.
450 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

La ecuación de regresión es Cv =
-3.20 + 0.115 Altura
Vaticinador coef SE coef T PAG
Constante - 3.198 1.016 - 3.15 0.002
Altura 0.114567 0.005792 19.78 0.000
S = 0,8573 R-Sq = 71,9% R-Cuadrado(ajustado) = 71,7 %

Análisis de Diferencia
Fuente DF SS EM F PAG
Regresión 1 287.56 287.56 391.30 0.000
Residual Error 153 112.44 0.73
Total 154 400.00
Inusual Observaciones
Obs. Altura CV Adaptar Ajuste SE Residual Calle residir
39 166 14.1000 15.8199 0.0865 - 1.7199 -2.02R
42 166 13.9000 15.8199 0.0865 - 1.9199 - 2.25R
105 181 15.8000 17.5384 0.0770 - 1.7384 -2.04R
151 202 18.6000 19.9443 0.1706 - 1.3443 - 1,60 X
152 202 18.6000 19.9443 0.1706 - 1.3443 - 1,60 X
153 182 20.0000 17.6529 0.0798 2.3471 2.75R
R denota una observación con un residuo estandarizado grande X denota una observación
cuyo valor X le da una gran influencia.

FIGURA 9.7.3Resultado de MINITAB para el ejemplo 9.7.1 usando el procedimiento de regresión simple.

La ecuación de regresión
Supongamos que deseamos predecir los niveles de Cv a partir del conocimiento de las alturas. En ese caso
tratamos la altura como la variable independiente y el nivel Cv como la variable dependiente y obtenemos la
ecuación de regresiónpagcoeficiente de relación con MINITAB como se muestra en la figura 9.7.3. Para este
ejemplor¼ :719¼ :848. Sabemos queres positivo porque la pendiente de la línea de regresión es positiva.
También podemos usar el procedimiento de correlación de MINITAB para obtenerr como se muestra en la
Figura 9.7.4.
La impresión del SAS®El procedimiento de correlación se muestra en la Figura 9.7.5. Tenga en
cuenta que el SAS®procedimiento da medidas descriptivas para cada variable, así como lapagvalor del
coeficiente de correlación.
Cuando no se disponga de una computadora para realizar los cálculos,rpuede obtenerse
mediante las siguientes fórmulas:
P
tu PAG
vffiffiffiffiffi sififi

tu2
tuberculosis1 Xi2-d XiÞ2=n
r¼ PAG PAG 2 (9.7.1)
yi2-d yÞ =norte
i
9.7 EL COEFICIENTE DE CORRELACIÓN 451

Datos:

C1: Altura
C2: CV

Caja de diálogo: Comando de sesión:

Estadísticas estadísticas básicas Correlación MTB > Correlación C1 C2.

TipoC1 C2enVariables.Hacer clicDE ACUERDO.

PRODUCCIÓN:

Correlaciones: Altura, Cv

Correlación de Pearson de Altura y CV = 0,848 Valor P = 0,000

FIGURA 9.7.4 Procedimiento de MINITAB para el ejemplo 9.7.1 usando el comando de correlación.

El Procedimiento CORR
2 Variables: ALTURA CV

Estadísticas simples

Variable norte Significar Desv estándar Suma Mínimo Máximo


ALTURA 155 175.04516 11.92745 27132 149.00000 202.00000
CV 155 16.85613 1.61165 2613 13.00000 21.00000

Coeficientes de correlación de Pearson, N = 155


Problema > |r| bajo H0: Rho=0

ALTURA CV
ALTURA 1.00000 0.84788
<.0001
CV 0.84788 1.00000
<.0001

FIGURA 9.7.5 S.A.S.®impresión para el Ejemplo 9.7.1.


452 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Una fórmula alternativa para calcularres dado por


PAG PÁGINAS
nx iyi-dX iÞðy iÞ
q pag
r¼ ffiffiffiffi ffffffff
ffi ffiffiffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiqffiffiffiffiP
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffiffiffiffi (9.7.2)
norte Xi2-dX2 Nueva
iÞ York2 i-dy2 iÞ

Una ventaja de esta fórmula es querse puede calcular sin calcular primerob. Este es
el procedimiento deseable cuando no se anticipa que se utilizará la ecuación de regresión.

Recuerde que el coeficiente de correlación muestral,r,siempre tendrá el mismo signo que la


pendiente de la muestra,b. &

EJEMPLO 9.7.2
Consulte el Ejemplo 9.7.1. Deseamos ver si el valor muestral der¼ :848 es de magnitud
suficiente para indicar que, en la población, los niveles de talla y Cv SEP están correlacionados.

Solución:Realizamos una prueba de hipótesis de la siguiente manera.

1. Datos.Vea la discusión inicial del ejemplo 9.7.1.


2. Supuestos. Suponemos que los supuestos dados en la Sección 9.6
son aplicables.
3. Hipótesis.

H0:r¼0
HA:r6¼0

4. Estadística de prueba. Cuandor¼0, se puede demostrar que la prueba apropiada


la estadística es

rffiffiffiffiffiffiffiffiffiffiffiffiffi

n-2
t¼r (9.7.3)
1 -r2
5. Distribución de la estadística de prueba.CuandoH0es verdadero y se cumplen los
supuestos, el estadístico de prueba se distribuye como Student'stdistribución conn-2
grados de libertad.

6. Regla de decisión.si dejamosa¼ :05, los valores críticos deten el presente


ejemplo son -1:9754 (por interpolación). Si, a partir de nuestros datos,
calculamos un valor detque es mayor o igual queþ1:9754 o menor o
igual a -1:9754, rechazaremos la hipótesis nula.
7. Cálculo de la estadística de prueba.Nuestro valor calculado detes

rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

153
t¼ :848 ¼19:787
1 - :719

8. Decisión estadística.Dado que el valor calculado del estadístico de prueba


excede el valor crítico deyo,rechazamos la hipótesis nula.
9.7 EL COEFICIENTE DE CORRELACIÓN 453

9. Conclusión.Concluimos que, en la población, la altura y los niveles de SEP en la columna


vertebral están linealmente correlacionados.

10pagvalor.Desdet¼19:787 > 2:6085 (valor interpolado detpor 153,


. 995), tenemos para esta prueba,pag < :005. &

También se puede notar que la estadística de prueba para el coeficiente de correlación es equivalente
a la estadística de prueba para la pendiente de la línea de regresión. Por lo tanto, al cuadrar latla estadística
en el paso 7 de la solución da como resultado elFestadístico proporcionado en la Figura 9.7.3. Esto puede ser
útil cuando se usa un paquete de computadora que no proporciona rutinariamente eltestadístico para el
coeficiente de correlación (p. ej., SPSS) y uno no desea calcular el estadístico de prueba a mano.

Una prueba para usar cuando la hipótesisres un valor distinto de ceroEl


uso de latla estadística calculada en la prueba anterior es apropiada solo para probarH0:r
¼0. Si se desea probarH0:r¼r0, dónder0es algún valor distinto de cero, debemos usar otro
enfoque. Fisher (5) sugiere querser transformado enzrcomo sigue:

1 1þr
zr¼ en (9.7.4)
2 1 -r
donde ln es un logaritmo natural. Se puede demostrar quezrtiene una distribución aproximadamente normal
con una media dezr¼1 2enfð1þrÞ=ð1 -rÞgy la desviación estándar estimada de

1
szr ¼ pffiffiffiffiffiffiffiffiffiffiffi (9.7.5)
n-3
Para probar la hipótesis nula de queres igual a algún valor distinto de cero, el estadístico de
prueba es
zr-z
Z¼ pag (9.7.6)
1= ffiffiffiffiffiffiffirffiffiffiffiffiffi n-3

que sigue aproximadamente la distribución normal estándar.


Para determinarzrpara un observadoryzrpara una hipótesisr,consultamos la Tabla I,
evitando así el uso directo de logaritmos naturales.
Supongamos que en nuestro ejemplo actual deseamos probar

H0:r¼ :80

contra la alternativa
HA:r6¼ :80

en el nivel de significancia de .05. Al consultar la Tabla I (e interpolar), encontramos que para

r¼ :848; zr¼1:24726

y para
r¼ :80; zr¼1:09861
Nuestro estadístico de prueba, entonces, es

1:24726 - 1:09861
Z¼ ¼1:83
pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

1= 155 - 3
454 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Como 1.83 es menor que el valor crítico dez¼1:96, no podemos rechazarH0. Concluimos que el
coeficiente de correlación de la población puede ser .80.
Para tamaños de muestra inferiores a 25, Fisher'sZla transformación se debe utilizar con precaución,
en todo caso. Se puede utilizar un procedimiento alternativo de Hotelling (6) para tamaños de muestra
iguales o superiores a 10. En este procedimiento, la siguiente transformación derestá empleado:

3zrþr
z¼zr- (9.7.7)
4norte

La desviación estándar dez es


1
sz ¼ pffiffiffiffiffiffiffiffiffiffiffi (9.7.8)
n-1
La estadística de prueba es

z - z pffiffiffiffiffiffiffiffiffiffiffiffi

Z ¼ pffiffiffiffiffiffiffiffiffiffiffiffi ¼ ðz-zÞ n-1 (9.7.9)


1= n-1

dónde
-
3zþr
r
z dpronunciado zeta¼zr-
4norte

Los valores críticos para propósitos de comparación se obtienen de la distribución


normal estándar.
En nuestro ejemplo actual, para probarH0:r¼ :80 en contraHA:r6¼ :80 utilizando la
transformación de Hotelling ya¼ :05, tenemos

3d1:24726Þ þ :848
z ¼1:24726 - ¼1:2339
4d155Þ

3d1:09861Þ þ :8
z ¼1:09861 - ¼1:0920
4d155Þ
pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

Z ¼ ð1:2339 - 1:0920Þ155 - 1¼1:7609

Como 1,7609 es menor que 1,96, no se rechaza la hipótesis nula y se llega a la misma
conclusión que cuando se utiliza la transformación de Fisher.

AlternativasEn algunas situaciones, los datos disponibles para el análisis no cumplen con los
supuestos necesarios para el uso válido de los procedimientos discutidos aquí para probar hipótesis
sobre un coeficiente de correlación poblacional. En tales casos, puede ser más apropiado usar la
técnica de correlación de rangos de Spearman que se analiza en el Capítulo 13.

Intervalo de confianza pararLa transformación de Fisher puede usarse para construir 100d1 -a
Þintervalos de confianza porcentuales paraR.La fórmula general para un intervalo de confianza.

estimador -dfactor de confiabilidadÞðError estándarÞ


EJERCICIOS 455

está empleado. Primero convertimos nuestro estimador,r,azr, construya un intervalo de confianza sobrezr, y
luego reconvertir los límites para obtener un 100d1 -aÞintervalo de confianza porcentual sobreR. Entonces la
fórmula general se convierte en
pffiffiffiffiffiffiffiffiffiffiffiffi

zr-z1=n-3 (9.7.10)

Para nuestro ejemplo actual, el intervalo de confianza del 95 por ciento parazres dado por
- pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

1:24726 - 1:96 1= 155 - 3


d1:08828; 1:40624Þ

Convirtiendo estos límites (por interpolación en la Tabla I del Apéndice), que son valores dezr,
en valores derda

zr r

1.08828 . 7962
1.40624 . 8866

Estamos seguros en un 95 por ciento, entonces, de querestá contenido en el intervalo .7962 a .88866.
Debido a las entradas limitadas en la tabla, estos límites deben considerarse solo aproximados.

EJERCICIOS

En cada uno de los siguientes ejercicios:

(a)Prepare un diagrama de dispersión.

(b)Calcule el coeficiente de correlación de la muestra.

(C)PruebaH0:r¼0 en el nivel de significancia de .05 y establezca sus conclusiones.


(d)Determina elpagvalor para la prueba.
(mi)Construya el intervalo de confianza del 95 por ciento paraR.

9.7.1El propósito de un estudio de Brown y Persley (A-8) fue caracterizar la hepatitis A aguda en pacientes mayores de 40 años.
Realizaron una revisión retrospectiva de las historias clínicas de 20 sujetos a los que se les diagnosticó hepatitis A
aguda, pero que no fueron hospitalizados. De interés fue el uso de la edad (años) para predecir los niveles de
bilirrubina (mg/dl). Se recogieron los siguientes datos.

Años de edad) Bilirrubina (mg/dl) Años de edad) Bilirrubina (mg/dl)

78 7.5 44 7.0
72 12.9 42 1.8
81 14.3 45 .8
59 8.0 78 3.8
64 14.1 47 3.5
48 10.9 50 5.1
46 12.3 57 16.5
(Continuación)
456 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Años de edad) Bilirrubina (mg/dl) Años de edad) Bilirrubina (mg/dl)

42 1.0 52 3.5
58 5.2 58 5.6
52 5.1 45 1.9
Fuente: Datos proporcionados por cortesía de Geri R. Brown, MD

9.7.2Otra variable de interés en el estudio de Reiss et al. (A-3) (ver Ejercicio 9.3.4) fue parcial
tromboplastina (aPTT), la prueba estándar utilizada para controlar la anticoagulación con heparina. Utilice los datos
de la siguiente tabla para examinar la correlación entre los niveles de aPTT medidos por el ensayo de punto de
atención CoaguCheck y el ensayo hospitalario de laboratorio estándar en 90 sujetos que recibieron heparina sola,
heparina con warfarina y warfarina y exoenoxaparina.

warfarina y
heparina warfarina exoenoxaparina
CoaguCheck Hospital CoaguCheck Hospital Hospital CoaguCheck
TTPa TTPa TTPa TTPa TTPa TTPa

49.3 71.4 18.0 77.0 56.5 46.5


57,9 86.4 31.2 62.2 50.7 34,9
59.0 75,6 58.7 53.2 37.3 28,0
77.3 54.5 75.2 53.0 64.8 52.3
42.3 57.7 18.0 45.7 41.2 37.5
44.3 59.5 82.6 81.1 90.1 47.1
90,0 77.2 29.6 40,9 23.1 27.1
55.4 63.3 82,9 75.4 53.2 40.6
20.3 27.6 58.7 55.7 27.3 37.8
28.7 52.6 64.8 54.0 67.5 50.4
64.3 101.6 37,9 79.4 33.6 34.2
90.4 89.4 81.2 62.5 45.1 34.8
64.3 66.2 18.0 36.5 56.2 44.2
89.8 69.8 38.8 32.8 26,0 28.2
74.7 91.3 95.4 68,9 67.8 46.3
150.0 118.8 53.7 71.3 40.7 41.0
32.4 30,9 128.3 111.1 36.2 35.7
20,9 65.2 60.5 80.5 60.8 47.2
89.5 77,9 150.0 150.0 30.2 39.7
44.7 91.5 38.5 46.5 18.0 31.3
61.0 90.5 58,9 89.1 55,6 53.0
36.4 33.6 112.8 66.7 18.0 27.4
52,9 88.0 26.7 29.5 18.0 35.7
57.5 69,9 49.7 47.8 78.3 62.0
39.1 41.0 85.6 63.3 75.3 36.7
74.8 81.7 68.8 43.5 73.2 85.3
32.5 33.3 18.0 54.0 42.0 38.3
125.7 142.9 92.6 100.5 49.3 39.8
77.1 98.2 46.2 52.4 22.8 42.3
143.8 108.3 60.5 93.7 35.8 36,0
Fuente: Datos proporcionados por cortesía de Curtis E. Haas, Pharm.D.
EJERCICIOS 457

9.7.3En el estudio de Parker et al. (A-4) (consulte el Ejercicio 9.3.5), los autores también observaron el cambio en el
AUC (área bajo la curva de la concentración plasmática de digoxina) al comparar los niveles de digoxina
tomados con y sin jugo de toronja. La siguiente tabla proporciona el AUC cuando se consumió digoxina con
agua.dng h = mlÞy el cambio en el AUC en comparación con el cambio en el AUC cuando la digoxina se toma
con jugo de toronja (GFJ, %).

Nivel de agua AUC Cambio en AUC


dng h = mlÞ con GFJ (%)

6.96 17.4
5.59 24.5
5.31 8.5
8.22 20.8
11.91 - 26,7
9.50 - 29,3
11.28 - 16,8
Fuente: Datos proporcionados por cortesía de Robert B. Parker,
Pharm.D.

9.7.4Un artículo de Tuzson et al. (A-9) enArchivos de Medicina Física y Rehabilitacióninformaron los siguientes datos
sobre la velocidad máxima de la rodilla al caminar (medida en grados por segundo) en flexión y extensión
para 18 sujetos con parálisis cerebral.

Flexiónð =sÞ Extensiónð =sÞ

100 100
150 150
210 180
255 165
200 210
185 155
440 440
110 180
400 400
160 140
150 250
425 275
375 340
400 400
400 450
300 300
300 300
320 275
Fuente: Ann E. Tuzson, Kevin P. Granata y Mark
F. Abel, "El umbral de velocidad espástica limita
el rendimiento funcional en la parálisis
cerebral"Archivos de Medicina Física y
Rehabilitación, 84 (2003), 1363–1368.
458 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

9.7.5La esclerosis lateral amiotrófica (ELA) se caracteriza por una disminución progresiva de la función motora. El
proceso degenerativo afecta el sistema respiratorio. Butz et al. (A-10) investigaron el impacto longitudinal de
la ventilación nocturna no invasiva con presión positiva en pacientes con ELA. Antes del tratamiento midieron
la presión parcial de oxígeno arterial (Pao2) y presión parcial de dióxido de carbono arterial (Paco2) en
pacientes con la enfermedad. Los resultados fueron los siguientes:

Paco2 Pao2

40,0 101.0
47.0 69.0
34,0 132.0
42.0 65,0
54.0 72.0
48.0 76.0
53.6 67.2
56,9 70,9
58.0 73.0
45,0 66,0
54.5 80.0
54.0 72.0
43.0 105.0
44.3 113.0
53,9 69.2
41.8 66.7
33.0 67.0
43.1 77.5
52.4 65.1
37,9 71.0
34.5 86.5
40.1 74.7
33.0 94.0
59,9 60.4
62.6 52.5
54.1 76,9 Fuente: M. Butz, KH Wollinsky, U. Widemuth-Catrinescu,
45.7 65.3 A. Sperfeld, S. Winter, HH Mehrkens, AC Ludolph y
40.6 80.3 H. Schreiber, “Efectos longitudinales de los métodos positivos no invasivos

56,6 53.2 Ventilación a presión en pacientes con amiotrofia lateral


Esclerosis,"Diario Americano de Rehabilitación Médica, 82
59.0 71,9
(2003) 597–604.

9.7.6Una muestra aleatoria simple de 15 niños aparentemente sanos entre las edades de 6 meses y 15 años arrojó
los siguientes datos sobre la edad,X,y volumen hepático por unidad de peso corporal (ml/kg),Y:

X Y X Y

.5 41 10.0 26
.7 55 10.1 35
2.5 41 10.9 25
4.1 39 11.5 31
(Continuación)
9.8 ALGUNAS PRECAUCIONES 459

X Y X Y
5.9 50 12.1 31
6.1 32 14.1 29
7.0 41 15.0 23
8.2 42

9.8 ALGUNAS PRECAUCIONES

Los análisis de regresión y correlación son poderosas herramientas estadísticas cuando se emplean
correctamente. Sin embargo, su uso inapropiado solo puede conducir a resultados sin sentido. Para ayudar
en el uso adecuado de estas técnicas, hacemos las siguientes sugerencias:

1.Los supuestos subyacentes al análisis de regresión y correlación deben revisarse


cuidadosamente antes de recopilar los datos. Aunque es raro encontrar que los
supuestos se cumplen a la perfección, los profesionales deben tener alguna idea sobre la
magnitud de la brecha que existe entre los datos a analizar y los supuestos del modelo
propuesto, para que puedan decidir si deben elegir otro. modelo; proceda con el análisis,
pero tenga cuidado en la interpretación de los resultados; o utilice el modelo elegido con
confianza.
2.En el análisis de correlación y regresión lineal simple, las dos variables de interés se
miden en la misma entidad, denominadaunidad de asociación.Si estamos
interesados en la relación entre altura y peso, por ejemplo, estas dos medidas se
toman en el mismo individuo. Por lo general, no tiene sentido hablar de la
correlación, digamos, entre las alturas de un grupo de individuos y los pesos de otro
grupo.
3.No importa qué tan fuerte sea la indicación de una relación entre dos variables, no debe
interpretarse como una de causa y efecto. Si, por ejemplo, un coeficiente de correlación
muestral significativo entre dos variablesXyYse observa, puede significar una de varias
cosas:
(a)Xcausasy
(b)YcausasX.
(C)Algún tercer factor, ya sea directa o indirectamente, causa ambosXyy
(d)Ha ocurrido un evento improbable y se ha generado por casualidad un coeficiente de
correlación muestral grande a partir de una población en la queXyYde hecho, no están
correlacionados.
(mi)La correlación es puramente absurda, una situación que puede surgir cuando las
mediciones deXyYno se toman en una unidad común de asociación.
4.La ecuación de regresión muestral no debe usarse para predecir o estimar fuera del rango de
valores de la variable independiente representada en la muestra. Como se ilustra en la Sección
9.5, esta práctica, llamada extrapolación, es riesgosa. La verdadera relación entre dos variables,
aunque lineal en un intervalo de la variable independiente, a veces puede describirse en el
mejor de los casos como una curva fuera de este intervalo. Si nuestra muestra por casualidad
se extrae solo del intervalo donde la relación es lineal, solo tenemos un
460 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Y
Extrapolación

Extrapolación

X
Intervalo muestreado

FIGURA 9.8.1 Ejemplo de extrapolación.

representación limitada de la población, y proyectar los resultados de la muestra más allá del
intervalo representado por la muestra puede llevar a conclusiones falsas. La figura 9.8.1 ilustra
los posibles peligros de la extrapolación.

9.9 RESUMEN

En este capítulo, se examinan dos herramientas importantes del análisis estadístico, la


regresión lineal simple y la correlación. Se ha sugerido el siguiente esquema para la aplicación
de estas técnicas.

1. Identifique el modelo.Los profesionales deben saber si el modelo de regresión o el modelo


de correlación es el adecuado para responder a sus preguntas.
2. Revisar los supuestos.Se ha señalado varias veces que la validez de las conclusiones
depende de qué tan bien se ajusten los datos analizados al modelo elegido.
3. Obtenga la ecuación de regresión.Hemos visto cómo se obtiene la ecuación de regresión
por el método de los mínimos cuadrados. Aunque los cálculos, cuando se hacen a mano,
son bastante largos, complicados y sujetos a errores, este no es el problema actual que
ha sido en el pasado. Las computadoras ahora están en un uso tan generalizado que el
investigador o estadístico sin acceso a una es la excepción y no la regla. No es necesario
disculparse por largos cálculos para el investigador que tiene una computadora
disponible.
4. Evalúa la ecuación.Hemos visto que la utilidad de la ecuación de regresión
para estimar y predecir se determina mediante el análisis de
9.9 RESUMEN 461

varianza, que prueba la significación del cuadrado medio de la regresión. La fuerza


de la relación entre dos variables bajo el modelo de correlación se evalúa probando
la hipótesis nula de que no hay correlación en la población. Si se puede rechazar
esta hipótesis, podemos concluir, al nivel de significación elegido, que las dos
variables están correlacionadas.
5. Usa la ecuación.Una vez que se ha determinado que es probable que la ecuación de
regresión proporcione una buena descripción de la relación entre dos variables,Xy
Y,se puede utilizar para uno de dos propósitos:
(a)Para predecir qué valorYes probable que asuma, dado un valor particular deX,o
(b)Para estimar la media de la subpoblación deYvalores para un valor particular de
X.

Este tratamiento necesariamente abreviado de la regresión lineal simple y la correlación


puede haber planteado más preguntas de las que ha respondido. Es posible que al lector se le
haya ocurrido, por ejemplo, que una variable dependiente se puede predecir con mayor
precisión utilizando dos o más variables independientes en lugar de una. O, tal vez, él o ella
puede sentir que el conocimiento de la fuerza de la relación entre varias variables puede ser de
más interés que el conocimiento de la relación entre sólo dos variables. La exploración de estas
posibilidades es el tema del próximo capítulo, y la curiosidad del lector en este sentido debería
aliviarse, al menos parcialmente.
Para aquellos que deseen profundizar en el tema del análisis de regresión,
existen excelentes referencias disponibles, incluidas las de Dielman (7), Hocking (8),
Mendenhall y Sincich (9) y Neter et al. (10).

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 9

Fórmula
Número Nombre Fórmula

9.2.1 Suposición de metroyjX¼b0þb1X


linealidad

9.2.2 Lineal simple y¼b0þb1Xþmi


Modelo de regresión

9.2.3 Término de error (residual) mi¼y-db0þb1X¼y-metroyjX

9.3.1 Algebraico y¼aþbx


representación
de una linea recta

9.3.2 Mínimos cuadrados PAGnorte

dXi- -XÞðyi- -yÞ


estimación de la 1
b1¼i¼
pendiente de un PAG
norte

dXi- -XÞ2
línea de regresión
i¼1

(Continuación)
462 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

9.3.3 Estimación de mínimos cuadrados b0¼ -y-b1 ^ -X


de la intersección de una
recta de regresión

9.4.1 Ecuación de desviación dyi- -yÞ ¼ ðŷi- -yÞ þ ðyi- ŷiÞ


PAG PAG PAG
9.4.2 Suma de cuadrados dyi- -yÞ2¼ ðŷi- -yÞ2þ dyi- ŷiÞ2
ecuación
PAG
9.4.3 Estimado dy - ŷ iÞ2=ðn-2Þ
población ~r2¼1 -PAGi
dyi- -yÞ2=ðn-1Þ
coeficiente de
determinación

9.4.4–9.4.7 Medios y megabyte0¼b0


varianzas de PAG
s2yjX Xi2
estimadores puntuales
s2b0 ¼ X
ayb norte

norte dXi- -XÞ2


i¼1

metrob
1
¼b 1

s2yjX
s2b1 ¼ X norte

dXi- -XÞ2
i¼1

9.4.8 zestadística para b1-db1Þ0


probar hipótesis

s b0
acerca deb

9.4.9 testadística para b1-db1Þ0


probar hipótesis

sb0
acerca deb

9.5.1 Predicción -
tu
vffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

1 xpag
- -x2
intervalo paraY
ŷ - td1-un =2Þsy=x t1þ þPAG
para una dadaX norte dXi- -XÞ2

Confianza
sffiffiffiffiffiffiffiffiffiffi-ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
9.5.2
1 X
intervalo para ŷ - td1-un =2ÞsyjX þPAGpag- -X
la media de Y norte dXi- -XÞ
para una X dada
u hp i
9.7.1–9.7.2 Coeficiente de correlación PAG
tu Xi2-d
tuberculosis2

1 XiÞ2=n
r ¼ PAG PAG 2
yi2-d y Þ =norte i

PAG PAG PAG


nxiyi-d X yiÞ
¼qffiffiffiffi qffiffiffiffP
Þð
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi iffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffiffiffiffi ffiffiffiffiffiffiffiffiffiffiffiffiffiffi

Xi2-dXiÞ2
norte Nueva Yorki-dyiÞ2 2
9.9 RESUMEN 463
rffiffiffiffiffiffiffiffiffiffiffiffiffi
9.7.3 testadística para n-2
coeficiente de correlación t¼r
1 -r2
9.7.4 zestadística para 1 1þr
zr¼ en
coeficiente de correlación 2 1 -r
9.7.5 Estándar estimado 1
szpag ¼ pffiffiffiffiffiffiffiffiffiffiffi
desviación parazestadística n-3
9.7.6 r z-z
Zestadística para
Z¼ pag
coeficiente de correlación 1= ffiffiffiffiffiffiffipagffiffiffiffiffiffi n-3

9.7.7 Zestadística para 3zþr


r
z ¼z-r
coeficiente de correlación 4norte

cuandon <25

9.7.8 Desviación estándar para 1


sz
z
¼ pffiffiffiffiffiffiffiffiffiffiffi

n-3
9.7.9 Zestadística para z-j pffiffiffiffiffiffiffiffiffiffiffiffi

Z ¼ pffiffiffiffiffiffiffiffiffiffiffi ¼ ðz - jÞn-1, donde


coeficiente de correlación 1= norte--1
3zpagþr
j ¼Zpag-
4norte

- pffiffiffiffiffiffiffiffiffiffiffiffi
9.7.10 Intervalo de confianza Zr¼Z1=n-3
parar

Clave de símbolo b0¼término de intercepción de regresión


b0¼intercepción de regresión estimada
a¼probabilidad de error tipo I o intersección de regresión b1¼
pendiente de regresión estimada b1¼pendiente de regresión mi¼
término de error

metroX¼media poblacional de estadística=variableX


norte¼tamaño de la muestra

s2X¼varianza poblacional de estadístico=variableX


r¼coeficiente de correlación de la población r¼
coeficiente de correlación de la muestra
r2¼muestra coeficiente de determinación t¼t
estadística
Xi¼valor de la variable independiente eni
- X¼media muestral de la variable independiente yi
¼valor de la variable dependiente eni
- y¼media muestral de la variable
dependiente ŷ¼estimadoyz¼zestadística
464 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

PREGUNTAS DE REPASO Y EJERCICIOS

1.¿Cuáles son los supuestos que subyacen al análisis de regresión lineal simple cuando uno de los objetivos es
hacer inferencias sobre la población de la que se extrajeron los datos de la muestra?

2.¿Por qué la ecuación de regresión se llama ecuación de mínimos cuadrados?

3.Explique el significado de b̂0en la ecuación de regresión muestral.

4.Explique el significado de b̂1en la ecuación de regresión muestral.

5.Explique los siguientes términos:


(a)Suma total de cuadrados
(b)Suma de cuadrados explicada
(C)Suma de cuadrados inexplicable

6.Explique el significado y el método para calcular el coeficiente de determinación.

7.¿Cuál es la función del análisis de varianza en el análisis de regresión?

8.Describa tres formas en las que se puede probar la hipótesis nula de que b̂1¼0.

9.¿Con qué dos propósitos se puede usar una ecuación de regresión?

10¿Cuáles son los supuestos que subyacen al análisis de correlación simple cuando la inferencia es un objetivo?

11¿Qué significa la unidad de asociación en el análisis de regresión y correlación?

12¿Cuáles son las posibles explicaciones para un coeficiente de correlación muestral significativo?

13Explique por qué es riesgoso usar una ecuación de regresión muestral para predecir o estimar fuera del rango
de valores de la variable independiente representada en la muestra.

14Describa una situación en su área particular de interés donde sería útil un análisis de regresión simple. Utilice
datos reales o realistas y realice un análisis de regresión completo.

15.Describa una situación en su área particular de interés donde sería útil un análisis de correlación simple. Utilice
datos reales o realistas y realice un análisis de correlación completo.

En cada uno de los siguientes ejercicios, lleve a cabo el análisis requerido y pruebe las hipótesis en los niveles de
significancia indicados. Calcular elpagvalor de cada prueba.

dieciséis.Un estudio de Scrogin et al. (A-11) fue diseñado para evaluar los efectos de manipulaciones simultáneas
de NaCl y calcio en la dieta sobre la presión arterial, así como las respuestas de la presión arterial y las
catecolaminas al estrés. Los sujetos eran ratas macho hipertensas espontáneamente, sensibles a la sal. Entre
los análisis realizados por los investigadores se encontraba una correlación entre la presión arterial inicial y
la concentración de epinefrina en plasma (E). Se recogieron los siguientes datos sobre estas dos variables.
Dejara¼ :01.

PA PlasmaE PA PlasmaE

163.90 248.00 143.20 179.00


195.15 339.20 166.00 160.40
170.20 193.20 160.40 263.50
171.10 307.20 170.90 184.70
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 465

PA PlasmaE PA PlasmaE

148.60 80.80 150.90 227.50


195.70 550.00 159.60 92.35
151.00 70.00 141.60 139.35
166.20 66.00 160.10 173.80
177.80 120.00 166.40 224.80
165.10 281.60 162.00 183.60
174.70 296.70 214.20 441.60
164.30 217.30 179.70 612.80
152.50 88.00 178.10 401.60
202.30 268.00 198.30 132.00
171.70 265.50

Fuente: Datos proporcionados por cortesía de Karie E. Scrogin.

17Dean Parmalee (A-12) deseaba saber si las calificaciones de fin de año asignadas a los estudiantes de la Escuela de Medicina de la
Universidad Estatal de Wright predicen sus puntajes de la junta de segundo año. La siguiente tabla muestra, para 89
estudiantes, el puntaje de fin de año (PROMEDIO, en porcentaje de 100) y el puntaje en el examen de la junta médica de
segundo año (BOARD).

PROMEDIO JUNTA PROMEDIO JUNTA PROMEDIO JUNTA

95.73 257 85.91 208 82.01 196


94.03 256 85.81 210 81.86 179
91.51 242 85.35 212 81.70 207
91.49 223 85.30 225 81.65 202
91.13 241 85.27 203 81.51 230
90.88 234 85.05 214 81.07 200
90.83 226 84.58 176 80.95 200
90,60 236 84.51 196 80.92 160
90.30 250 84.51 207 80.84 205
90.29 226 84.42 207 80.77 194
89.93 233 84.34 211 80.72 196
89.83 241 84.34 202 80.69 171
89.65 234 84.13 229 80.58 201
89.47 231 84.13 202 80.57 177
88.87 228 84.09 184 80.10 192
88.80 229 83.98 206 79.38 187
88.66 235 83.93 202 78.75 161
88.55 216 83.92 176 78.32 172
88.43 207 83.73 204 78.17 163
88.34 224 83.47 208 77.39 166
87.95 237 83.27 211 76.30 170
87.79 213 83.13 196 75.85 159
87.01 215 83.05 203 75.60 154
86.86 187 83.02 188 75.16 169
86.85 204 82.82 169 74.85 159
86.84 219 82.78 205 74.66 167
(Continuación)
466 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

PROMEDIO JUNTA PROMEDIO JUNTA PROMEDIO JUNTA

86.30 228 82.57 183 74.58 154


86.13 210 82.56 181 74.16 148
86.10 216 82.45 173 70.34 159
85.92 212 82.24 185
Fuente: Datos proporcionados por cortesía de Dean Parmalee, MD y el Centro de consultoría estadística de la
Universidad Estatal de Wright.

Realice un análisis de regresión completo con AVG como variable independiente. Dejara¼ :05 para todas las
pruebas.

18Maria Mathias (A-13) realizó un estudio de niños hiperactivos. Midió la actitud, la hiperactividad y el comportamiento
social de los niños antes y después del tratamiento. La siguiente tabla muestra para 31 sujetos la edad y las
puntuaciones de mejora desde el pretratamiento hasta el postratamiento para la actitud (ATT), el comportamiento
social (SOC) y la hiperactividad (HYP). Una puntuación negativa para HYP indica una mejora en la hiperactividad; una
puntuación positiva en ATT o SOC indica una mejora. Realice un análisis para determinar si existe evidencia que
indique que la edad (años) está correlacionada con alguna de las tres variables de resultado. Dejara¼ :05 para todas
las pruebas.

Núm. de sujeto EDAD ATT HYP SOC

1 9 - 1:2 - 1:2 0.0


2 9 0.0 0.0 1.0
3 13 - 0:4 0.0 0.2
4 6 - 0:4 - 0:2 1.2
5 9 1.0 - 0:8 0.2
6 8 0.8 0.2 0.4
7 8 - 0:6 - 0:2 0.6
8 9 - 1:2 - 0:8 - 0:6
9 7 0.0 0.2 0.8
10 12 0.4 - 0:8 0.4
11 9 - 0:8 0.8 - 0:2
12 10 1.0 - 0:8 1.2
13 12 1.4 - 1:6 0.6
14 9 1.0 - 0:2 - 0:2
15 12 0.8 - 0:8 1.0
dieciséis 9 1.0 0.4 0.4
17 10 0.4 - 0:2 0.6
18 7 0.0 - 0:4 0.6
19 12 1.1 - 0:6 0.8
20 9 0.2 - 0:4 0.2
21 7 0.4 - 0:2 0.6
22 6 0.0 - 3:2 1.0
23 11 0.6 - 0:4 0.0
24 11 0.4 - 0:4 0.0
25 11 1.0 - 0:7 - 0:6
26 11 0.8 - 0:8 0.0
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 467

Núm. de sujeto EDAD ATT HYP SOC

27 11 1.2 0.6 1.0


28 11 0.2 0.0 - 0:2
29 11 0.8 - 1:2 0.3 Fuente: Datos proporcionados por
cortesía de Maria Mathias, MD y el
30 8 0.0 0.0 - 0:4
Centro de Consulta Estadística de la
31 9 0.4 - 0:2 0.2 Universidad Estatal de Wright.

19Un estudio de Triller et al. (A-14) examinó la cantidad de tiempo requerida para que las enfermeras de atención médica domiciliaria
vuelvan a empaquetar los medicamentos de un paciente en varios organizadores de medicamentos (es decir, cajas de
pastillas). Para los 19 pacientes del estudio, los investigadores registraron el tiempo necesario para volver a empaquetar los
medicamentos. También registraron el número de problemas encontrados en la sesión de reenvasado.

reenvasado reenvasado
Número de paciente Nº de problemas Tiempo (Minutos) Número de paciente Nº de problemas Tiempo (Minutos)

1 9 38 11 1 10
2 2 25 12 2 15
3 0 5 13 1 17
4 6 18 14 0 18
5 5 15 15 0 23
6 3 25 dieciséis 10 29
7 3 10 17 0 5
8 1 5 18 1 22
9 2 10 19 1 20
10 0 15
Fuente: Datos proporcionados por cortesía de Darren M. Triller, Pharm.D.

Realice un análisis de regresión completo de estos datos usando la cantidad de problemas para predecir el tiempo que tomó
completar una sesión de reempaquetado. Dejara¼ :05 para todas las pruebas. ¿Qué conclusiones se pueden sacar de su
análisis? ¿Cómo podrían usar sus resultados los proveedores de atención médica?

20Los siguientes son los valores de flujo sanguíneo pulmonar (PBF) y volumen de sangre pulmonar (PBV)
registrados para 16 bebés y niños con cardiopatía congénita:

Y X
PBV (ml/m2) PBF (L/min/m2)

168 4.31
280 3.40
391 6.20
420 17.30
303 12.30
429 13.99
605 8.73
522 8.90
224 5.87
291 5.00
(Continuación)
468 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Y X
PBV (ml/m2) PBF (L/min/m2)

233 3.51
370 4.24
531 19.41
516 16.61
211 7.21
439 11.60

Encuentre la ecuación de regresión que describe la relación lineal entre las dos variables, calculer2y
pruebaH0:b1¼0 por ambosFprueba y eltprueba. Dejara¼ :05.

21Quince especímenes de sueros humanos fueron probados comparativamente para anticuerpos de tuberculina por dos métodos.
Los logaritmos de los títulos obtenidos por los dos métodos fueron los siguientes:

Método

una (X) POR)

3.31 4.09
2.41 3.84
2.72 3.65
2.41 3.20
2.11 2.97
2.11 3.22
3.01 3.96
2.13 2.76
2.41 3.42
2.10 3.38
2.41 3.28
2.09 2.93
3.00 3.54
2.08 3.14
2.11 2.76

Encuentre la ecuación de regresión que describe la relación entre las dos variables, calculer2y prueba
H0:b1¼0 por ambosFprueba y eltprueba.

22La siguiente tabla muestra la ingesta de metilmercurio y los valores de mercurio en sangre entera en 12 sujetos
expuestos a metilmercurio a través del consumo de pescado contaminado:

X Y
Metilo Mercurio en
Ingesta de mercurio Sangre pura
dmetrogHg=díaÞ (ng/g)

180 90
200 120
230 125
410 290
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 469

X Y
Metilo Mercurio en
Ingesta de mercurio Sangre pura
dmetrogHg=díaÞ (ng/g)

600 310
550 290
275 170
580 375
105 70
250 105
460 205
650 480

Encuentre la ecuación de regresión que describe la relación lineal entre las dos variables,
calculer2y pruebaH0:b1¼0 por ambosFytpruebas

23Los siguientes son los pesos (kg) y los niveles de glucosa en sangre (mg/100 ml) de 16 varones adultos aparentemente
sanos:

Peso (X) glucosa (Y)

64.0 108
75.3 109
73.0 104
82.1 102
76.2 105
95.7 121
59.4 79
93.4 107
82.1 101
78,9 85
76.7 99
82.1 100
83,9 108
73.0 104
64.4 102
77.6 87

Encuentre la ecuación de regresión lineal simple y pruebeH0:b1¼0 usando ANOVA y eltprueba. Prueba H0:r¼0 y
construya un intervalo de confianza del 95 por ciento paraR.¿Cuál es el nivel de glucosa pronosticado para un hombre
que pesa 95 kg? Construya el intervalo de predicción del 95 por ciento para su peso. Dejara¼ :05 para todas las
pruebas.

24Las siguientes son las edades (años) y las presiones arteriales sistólicas de 20 adultos aparentemente sanos:

Edad (X) PA (Y) Edad (X) PA (Y)

20 120 46 128
43 128 53 136
63 141 70 146
(Continuación)
470 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Edad (X) PA (Y) Edad (X) PA (Y)

26 126 20 124
53 134 63 143
31 128 43 130
58 136 26 124
46 132 19 121
58 140 31 126
70 144 23 123

Encuentre la ecuación de regresión lineal simple y pruebeH0:b1¼0 usando ANOVA y eltprueba. PruebaH0:r¼0
y construya un intervalo de confianza del 95 por ciento paraR.Encuentre el intervalo de predicción del 95 por
ciento para la presión arterial sistólica de una persona de 25 años. Dejara¼ :05 para todas las pruebas.

25Los siguientes datos se recopilaron durante un experimento en el que se inoculó un patógeno a animales
de laboratorio. Las variables son tiempo en horas después de la inoculación y temperatura en grados
Celsius.

Tiempo Temperatura Tiempo Temperatura

24 38.8 44 41.1
28 39.5 48 41.4
32 40.3 52 41.6
36 40.7 56 41.8
40 41.0 60 41,9

Encuentre la ecuación de regresión lineal simple y pruebeH0:b1¼0 usando ANOVA y eltprueba. Prueba H0:r¼0 y
construya un intervalo de confianza del 95 por ciento paraR.Construya el intervalo de predicción del 95 por ciento
para la temperatura a las 50 horas después de la inoculación. Dejara¼ :05 para todas las pruebas.

Para cada uno de los estudios descritos en los ejercicios 26 a 28, responda tantas de las siguientes preguntas
como sea posible.
(a)¿Cuál es más relevante, el análisis de regresión o el análisis de correlación, o ambas técnicas son
igualmente relevantes?
(b)¿Cuál es la variable independiente?
(C)¿Cuál es la variable dependiente?
(d)¿Cuáles son las hipótesis nula y alternativa apropiadas?
(mi)¿Cree que se rechazó la hipótesis nula? Explica por qué o por qué no.
(F)¿Cuál es el objetivo más relevante, la predicción o la estimación, o son los dos igualmente
relevantes?
(gramo)¿Cuál es la población muestreada?
(h)¿Cuál es la población objetivo?
(i)¿Están las variables directa o inversamente relacionadas?

26Lamarre-Cliche et al. (A-15) afirman: “Se cree que el intervalo QT corregido para la frecuencia cardíaca (QTc) refleja el
equilibrio simpatovagal. También se ha establecido queb-los bloqueadores influyen en el sistema nervioso
autónomo”. Los investigadores realizaron un análisis de correlación para medir la asociación entre el intervalo QTc, la
frecuencia cardíaca, el cambio de la frecuencia cardíaca y la respuesta terapéutica de la presión arterial durante 73
PREGUNTAS DE REPASO Y EJERCICIOS 471

sujetos hipertensos que tomanb-bloqueadores Los investigadores encontraron que la duración del intervalo QTc, la frecuencia
cardíaca previa al tratamiento y el cambio de la frecuencia cardíaca con la terapia no eran buenos predictores de la respuesta
de la presión arterial ab1-selectivob-bloqueadores en sujetos hipertensos.

27Skinner et al. (A-16) realizó una encuesta telefónica transversal para obtener un recuerdo dietético de 24 horas de la
ingesta de alimentos de bebés y niños pequeños, según lo informado por las madres u otros cuidadores principales.
Un hallazgo de interés fue que entre 561 niños pequeños de 15 a 24 meses de edad, la edad en semanas del niño se
relacionó negativamente con la densidad de vitamina C b̂1¼ -:43,pag¼ :01. Al predecir la densidad de calcio, la edad
en semanas del niño produjo un coeficiente de pendiente de -1:47 con unpagde .09.

28Parque et al. (A-17) estudió a 29 sujetos masculinos con cirrosis clínicamente confirmada. Entre otras variables,
midieron los niveles de manganeso en sangre total (MnB), manganeso en plasma (MnP), manganeso en
orina (MnU) y el índice pálido (PI), una medida de la intensidad de la señal en imágenes de resonancia
magnética (IRM) ponderadas en T1. Encontraron un coeficiente de correlación de .559,pag < :01, entre MnB y
PI. Sin embargo, no hubo correlaciones significativas entre MnP y Pi o MnU y Pi (r¼ :353, pag > :05,r¼ :252,
pag > :05, respectivamente).

Para los estudios descritos en los ejercicios 29 a 46, haga lo siguiente:


(a)Realice un análisis estadístico de los datos (incluidas las pruebas de hipótesis y la construcción de
intervalos de confianza) que crea que generarían información útil para los investigadores.
(b)Construya gráficos que crea que serían útiles para ilustrar las relaciones entre las
variables.
(C)Cuando lo crea apropiado, use las técnicas aprendidas en otros capítulos, como el análisis de varianza y la
prueba de hipótesis y la estimación de intervalos con respecto a medias y proporciones.
(d)Determinarpagvalores para cada estadística de prueba calculada.

(mi)Indique todas las suposiciones que sean necesarias para validar su análisis.
(F)Describa la(s) población(es) sobre las que cree que serían aplicables las inferencias basadas en su
análisis.
(gramo)Si está disponible, consulte la referencia citada y compare sus análisis y resultados con los de los
autores.

29Moerloose et al. (A-18) realizó un estudio para evaluar la utilidad clínica de una nueva técnica de
laboratorio (método A) para su uso en el diagnóstico de la embolia pulmonar (EP). El
rendimiento de la nueva técnica se comparó con el de una técnica estándar (método B). Los
sujetos consistieron en pacientes con sospecha clínica de EP que ingresaron en la sala de
emergencias de un hospital universitario europeo. Las siguientes son las medidas obtenidas
por las dos técnicas para 85 pacientes. Los investigadores realizaron dos análisis: (1) en los 85
pares de medidas y (2) en aquellos pares de medidas para los cuales el valor del método B era
inferior a 1000.

B A B A B A

9 119 703 599 2526 1830


84 115 725 610 2600 1880
86 108 727 3900 2770 2100
190 182 745 4050 3100 1780
208 294 752 785 3270 1870
218 226 884 914 3280 2480
251 311 920 1520 3410 1440
(Continuación)
472 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

B A B A B A

252 250 966 972 3530 2190


256 312 985 913 3900 2340
264 403 994 556 4260 3490
282 296 1050 1330 4300 4960
294 296 1110 1410 4560 7180
296 303 1170 484 4610 1390
311 336 1190 867 4810 1600
344 333 1250 1350 5070 3770
371 257 1280 1560 5470 2780
407 424 1330 1290 5576 2730
418 265 1340 1540 6230 1260
422 347 1400 1710 6260 2870
459 412 1530 1333 6370 2210
468 389 1560 1250 6430 2210
481 414 1840 764 6500 2380
529 667 1870 1680 7120 5220
540 486 2070 1310 7430 2650
562 720 2120 1360 7800 4910
574 343 2170 1770 8890 4080
646 518 2270 2240 9930 3840
664 801 2490 1910
670 760 2520 2110
Fuente: Datos proporcionados por cortesía del Dr. Philippe de Moerloose.

30La investigación de Huhtaniemi et al. (A-19) se centró en la calidad de la hormona luteinizante (LH) sérica durante la
maduración puberal en niños. Los sujetos, que consistían en niños sanos que entraban en la pubertad (de 11 años, 5
meses a 12 años), se estudiaron durante un período de 18 meses. Las siguientes son las concentraciones (UI/L) de LH
bioactiva (B-LH) y LH inmunorreactiva (I-LH) en muestras de suero tomadas de los sujetos. Solo se informan aquí las
observaciones en las que la relación B/I de los sujetos fue superior a 3,5.

I-LH B-LH I-LH B-LH

. 104 . 37 . 97 3.63
. 041 . 28 . 49 2.26
. 124 . 64 1 4.55
. 808 2.32 1.17 5.06
. 403 1.28 1.46 4.81
. 27 .9 1.97 8.18
. 49 2.45 . 88 2.48
. 66 2.8 1.24 4.8
. 82 2.6 1.54 3.12
1.09 4.5 1.71 8.4
1.05 3.2 1.11 6
. 83 3.65 1.35 7.2
. 89 5.25 1.59 7.6
. 75 2.9
Fuente: Datos proporcionados por cortesía del Dr. Ilpo T. Huhtaniemi.
PREGUNTAS DE REPASO Y EJERCICIOS 473

31Tsau et al. (A-20) estudiaron la excreción urinaria del factor de crecimiento epidérmico (EGF) en niños normales y en
aquellos con insuficiencia renal aguda (IRA). Se obtuvieron muestras aleatorias de orina seguidas de recolección de
orina de 24 horas de 25 niños. Los sujetos tenían edades comprendidas entre 1 mes y 15 años. La excreción urinaria
de EGF se expresó como una proporción de EGF urinario a concentración de creatinina urinaria (EGF/Cr). Los autores
concluyen a partir de los resultados de su investigación que es razonable utilizar análisis de orina aleatorios para
controlar la excreción de EGF. Las siguientes son las concentraciones de EGF/Cr urinario aleatorias (puntuales) y de 24
horas (pmol/mmol) para los 25 sujetos:

Orina de 24 horas mancha de orina Orina de 24 horas mancha de orina

Sujeto FEAG/Cr (X) FEAG/Cr (y) Sujeto FEAG/Cr (X) FEAG/Cr (y)

1 772 720 14 254 333


2 223 271 15a 93 84
3 494 314 dieciséis 303 512
4 432 350 17 408 277
5a 79 79 18 711 443
6a 155 118 19 209 309
7 305 387 20 131 280
8 318 432 21 165 189
9a 174 97 22 151 101
10 1318 1309 23 165 221
11 482 406 24 125 228
12 436 426 25 232 157
13 527 595
aSujetos con IRA.
Fuente: Datos proporcionados por cortesía del Dr. Yong-Kwei Tsau.

32.Una de las razones de un estudio realizado por Usaj y Starc (A-21) fue el interés en el comportamiento de la cinética del
pH durante condiciones de resistencia a largo plazo y resistencia a corto plazo entre corredores sanos. Los nueve
sujetos que participaron en el estudio eran corredores de maratón de entre 26 y 5 años. Los autores informan que
obtuvieron una buena correlación entre la cinética del pH y la resistencia tanto a corto como a largo plazo.
Los siguientes son los cortos- (VSE) y largo plazo (VLE) velocidades y mediciones de pH sanguíneo para los
sujetos participantes.

VLE VSE Rango de pH

5.4 5.6 . 083


4.75 5.1 .1
4.6 4.6 . 021
4.6 5 . 065
4.55 4.9 . 056
4.4 4.6 . 01
4.4 4.9 . 058
4.2 4.4 . 013
Fuente: Datos proporcionados por
4.2 4.5 . 03 cortesía de Anton Usaj, Ph.D.

33.Frijol et al. (A-22) realizó un estudio para evaluar el rendimiento del procedimiento de isoelectroenfoque/
inmunotransferencia/densitometría láser (IEF/IB/LD) para evaluar la transferrina deficiente en carbohidratos
(CDT) derivada de gotas de sangre seca. Los investigadores evaluaron suero pareado (S) y seco
474 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

muestras de gotas de sangre (DBS) simultáneamente para CDT. La evaluación de CDT sirve como marcador para el
abuso de alcohol. El uso de gotas de sangre seca como fuente de CDT para análisis por IEF/IB/LD da como resultado
un muestreo, almacenamiento y transporte de muestras simplificados. Los siguientes son los valores IEF/IB/LD en
unidades de densitometría (DU) de CDT de 25 muestras de suero y sangre seca:

número de espécimen S DBS número de espécimen S DBS

1 64 23 14 9 13
2 74 38 15 10 8
3 75 37 dieciséis 17 7
4 103 53 17 38 14
5 10 9 18 9 9
6 22 18 19 15 9
7 33 20 20 70 31
8 10 5 21 61 26
9 31 14 22 42 14
10 30 15 23 20 10
11 28 12 24 58 26
12 dieciséis 9 25 31 12 Fuente: Datos proporcionados por cortesía
13 13 7 de la Dra. Pamela Bean.

34.Kato et al. (A-23) midieron la concentración plasmática de adrenomedulina (AM) en pacientes con insuficiencia cardíaca
congestiva crónica debida a diversas enfermedades cardíacas. La AM es un péptido hipotensor que, sobre la base de
otros estudios, dicen los autores, tiene un papel implícito como hormona circulante en la regulación del sistema
cardiovascular. Otros datos recopilados de los sujetos incluyeron concentraciones plasmáticas de hormonas que se
sabe que afectan el sistema cardiovascular. Los siguientes son la AM plasmática (fmol/ml) y la actividad de renina
plasmática (PRA)dng=LsÞvalores para 19 pacientes con insuficiencia cardiaca:

Paciente Sexo Edad SOY PRA


No. d1¼METRO; 2¼FÞ (Años) (fmol/ml) dng=L sÞ

1 1 70 12.11 . 480594
2 1 44 7.306 . 63894
3 1 72 6.906 1.219542
4 1 62 7.056 . 450036
5 2 52 9.026 . 19446
6 2 sesenta y cinco 10.864 1.966824
7 2 64 7.324 . 29169
8 1 71 9.316 1.775142
9 2 61 17.144 9.33408
10 1 68 6.954 . 31947
11 1 63 7.488 1.594572
12 2 59 10.366 . 963966
13 2 55 10.334 2.191842
14 2 57 13 3.97254
15 2 68 6.66 . 52782
dieciséis 2 51 8.906 . 350028
17 1 69 8.952 1.73625
18 1 71 8.034 . 102786 Fuente: Datos proporcionados
19 1 46 13.41 1.13898 cortesía del Dr. Johji Kato.
PREGUNTAS DE REPASO Y EJERCICIOS 475

35.En un estudio informado enArchivos de Enfermedades en la Infancia,Dorado et al. (A-24) probaron la hipótesis de que la
concentración de calprotectina plasmática (PCal) (una proteína citosólica de los neutrófilos liberada durante la
activación o muerte de los neutrófilos) es un indicador temprano y sensible de la inflamación asociada con la
infección bacteriana en la fibrosis quística (FQ). Los sujetos eran niños con FQ confirmada y un grupo de control de
niños de la misma edad y sexo sin la enfermedad. Entre los datos recopilados se encuentran los siguientes
calprotectina plasmáticadmetrogramo=LÞy plasma de cobre (PCu)dmetromol=LÞmediciones. El cobre plasmático es
un índice de respuesta de fase aguda en la fibrosis quística. Los autores informaron un coeficiente de correlación de
0,48 entre la calprotectina plasmática (log10) y plasma de cobre.

FC FC FC
Sujeto Sujeto Sujeto
No. PCal UCP No. PCal UCP No. PCal UCP

1 452 17.46 12 1548 15.31 22 674 18.11


2 590 14.84 13 708 17.00 23 3529 17.42
3 1958 27.42 14 8050 20.00 24 1467 17.42
4 2015 18.51 15 9942 25.00 25 1116 16.73
5 417 15.89 dieciséis 791 13.10 26 611 18.11
6 2884 17.99 17 6227 23.00 27 1083 21.56
7 1862 21.66 18 1473 16.70 28 1432 21.56
8 10471 19.03 19 8697 18.11 29 4422 22.60
9 25850 16.41 20 621 18.80 30 3198 18.91
10 5011 18.51 21 1832 17.08 31 544 14.37
11 5128 22.70

Control Control
Sujeto Sujeto
No. PCal UCP No. PCal UCP

1 674 16.73 17 368 16.73


2 368 16.73 18 674 16.73
3 321 16.39 19 815 19.82
4 1592 14.32 20 598 16.1
5 518 16.39 21 684 13.63
6 815 19.82 22 684 13.63
7 684 17.96 23 674 16.73
8 870 19.82 24 368 16.73
9 781 18.11 25 1148 24.15
10 727 18.11 26 1077 22.30
11 727 18.11 27 518 9.49
12 781 18.11 28 1657 16.10
13 674 16.73 29 815 19.82
14 1173 20.53 30 368 16.73
15 815 19.82 31 1077 22.30
dieciséis 727 18.11

Fuente: Datos proporcionados por cortesía de la Dra. Barbara E. Golden.


476 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

36.Gelb et al. (A-25) realizaron un estudio en el que exploraron la relación entre la limitación del flujo de aire espiratorio de
moderada a grave y la presencia y extensión de enfisema morfológico y puntuado por TC en pacientes ambulatorios
con enfermedad pulmonar obstructiva crónica atendidos consecutivamente. Entre los datos recopilados se
encontraban las siguientes medidas de TC y patología pulmonar (PATH) para la puntuación de enfisema:

Puntuación de TC CAMINO Puntuación de TC CAMINO

5 15 45 50
90 70 45 40
50 20 85 75
10 25 7 0
12 25 80 85
35 10 15 5
40 35 45 40
45 30 37 35
5 5 75 45
25 50 5 5
60 60 5 20
70 60
Fuente: Datos proporcionados por cortesía del Dr. Arthur F. Gelb.

37.El objetivo de un estudio de Witteman et al. (A-26) fue investigar la reactividad de la piel con alérgenos
principales purificados y evaluar la relación con los niveles séricos de anticuerpos de inmunoglobulina E (IgE)
y determinar qué factores adicionales contribuyen al resultado de la prueba cutánea. Los sujetos
consistieron en pacientes con rinitis alérgica, asma alérgica o ambos, que fueron atendidos en un centro
médico europeo. Como parte de su estudio, los investigadores recolectaron, de 23 sujetos, las siguientes
mediciones de IgE específica (UI/ml) y prueba cutánea (ng/ml) en presencia de Lol p 5, un alérgeno purificado
del polen de gramíneas. Deseamos conocer la naturaleza y la fuerza de la relación entre las dos variables. (
Nota:Los autores convirtieron las medidas a logaritmos naturales antes de investigar esta relación).

IgE Prueba de piel

24.87 . 055
12.90 . 041034
9.87 . 050909
8.74 . 046
6.88 . 039032
5.90 . 050909
4.85 . 042142
3.53 . 055
2.25 4.333333
2.14 . 55
1.94 . 050909
1.29 . 446153
. 94 .4
. 91 . 475
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 477

IgE Prueba de piel

. 55 4.461538
. 30 4.103448
. 14 7.428571
. 11 4.461538
. 10 6.625
. 10 49.13043
. 10 36.47058
. 10 52.85714
. 10 47.5
Fuente: Datos proporcionados por
cortesía del Dr. Jaring S. van der Zee.

38.guirnalda et al. (A-27) realizaron una serie de experimentos para delinear la farmacocinética materno-fetal
compleja y los efectos de la zidovudina (AZT) en el babuino materno y fetal instrumentado crónicamente (
Papioespecies) durante la infusión intravenosa en estado estacionario y los regímenes de dosificación en
bolo oral. Entre los datos recopilados se encuentran las siguientes mediciones de dosis (mg/kg/h) y
concentración de AZT en plasma materno en estado estacionario (ng/ml):

AZT AZT
Dosis Concentración Dosis Concentración

2.5 832 2.0 771


2.5 672 1.8 757
2.5 904 0.9 213
2.5 554 0.6 394
2.5 996 0.9 391
1.9 878 1.3 430
2.1 815 1.1 440
1.9 805 1.4 352
1.9 592 1.1 337
0.9 391 0.8 181
1.5 710 0.7 174
1.4 591 1.0 470
1.4 660 1.1 426
1.5 694 0.8 170
1.8 668 1.0 360
1.8 601 0.9 320
Fuente: Datos proporcionados por cortesía de la Dra. Marianne Garland.

39.El propósito de un estudio de Halligan et al. (A-28) fue evaluar la variación diurna de la presión
arterial (PA) en mujeres normotensas y con preeclampsia. Los sujetos eran similares en edad,
peso y duración media de la gestación (35 semanas). Los investigadores recopilaron las
siguientes lecturas de PA. Como parte de su análisis, estudiaron la relación entre las
mediciones medias diurnas y nocturnas y las diferencias día/noche para la PA diastólica y
sistólica en cada grupo.
478 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

C1 C2 C3 C4 C5 C1 C2 C3 C4 C5

0 75 56 127 101 1 94 78 137 119


0 68 57 113 104 1 90 86 139 138
0 72 58 115 105 1 85 69 138 117
0 71 51 111 94 1 80 75 133 126
0 81 61 130 110 1 81 60 127 112
0 68 56 111 101 1 89 79 137 126
0 78 60 113 102 1 107 110 161 161
0 71 55 120 99 1 98 88 152 141
0 sesenta y cinco 51 106 96 1 78 74 134 132
0 78 61 120 109 1 80 80 121 121
0 74 60 121 104 1 96 83 143 129
0 75 52 121 102 1 85 76 137 131
0 68 50 109 91 1 79 74 135 120
0 63 49 108 99 1 91 95 139 135
0 77 47 132 115 1 87 67 137 115
0 73 51 112 90 1 83 64 143 119
0 73 52 118 97 1 94 85 127 123
0 64 62 122 114 1 85 70 142 124
0 64 54 108 94 1 78 61 119 110
0 66 54 106 88 1 80 59 129 114
0 72 49 116 101 1 98 102 156 163
0 83 60 127 103 1 100 100 149 149
0 69 50 121 104 1 89 84 141 135
0 72 52 108 95 1 98 91 148 139
C1¼grupod0¼normotenso; 1¼preeclampsiaÞ;C2¼día diastólica; C3¼noche diastólica; C4¼
sistólica del día; C5¼sistólica nocturna.
Fuente: Datos proporcionados por cortesía del Dr. Aidan Halligan.

40Marcas et al. (A-29) realizó un estudio para determinar los efectos de la pérdida rápida de peso sobre la contracción de la
vesícula biliar y para evaluar los efectos del ursodiol y el ibuprofeno sobre la saturación, la nucleación y el crecimiento
y la contracción. Los sujetos fueron pacientes obesos asignados al azar para recibir ursodiol, ibuprofeno o placebo.
Entre los datos recopilados se encuentran los siguientes valores de índice de saturación de colesterol (CSI) y tiempos
de nucleación (NT) en días de 13 (seis hombres, siete mujeres) sujetos tratados con placebo al final de las 6 semanas:

CSI Nuevo Testamento

1.20 4.00
1.42 6.00
1.18 14.00
. 88 21.00
1.05 21.00
1.00 18.00
1.39 6.00
1.31 10.00
1.17 9.00
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 479

CSI Nuevo Testamento

1.36 14.00
1.06 21.00
1.30 8.00
1.71 2.00
Fuente: Datos proporcionados por
cortesía del Dr. Jay W. Marks.

41.El objetivo de un estudio de Peacock et al. (A-30) fue investigar si la osteoartritis espinal es responsable del hecho de que
la densidad mineral ósea (DMO) de la columna lumbar sea mayor cuando se mide en el plano anteroposterior que
cuando se mide en el plano lateral. Se estudiaron radiografías laterales de la columna de mujeres (rango de edad de
34 a 87 años) que asistieron a un departamento de pacientes ambulatorios de un hospital para la medición de la
densidad ósea y se sometieron a una radiografía de la columna lumbar. Entre los datos recopilados se encuentran las
siguientes mediciones de DMO anteroposterior (A) y lateral (L) (g/cm2):

ABMD LBMD ABMD LBMD ABMD LBMD

. 879 . 577 1.098 . 534 1.091 . 836


. 824 . 622 . 882 . 570 . 746 . 433
. 974 . 643 . 816 . 558 1.127 . 732
. 909 . 664 1.017 . 675 1.411 . 766
. 872 . 559 . 669 . 590 . 751 . 397
. 930 . 663 . 857 . 666 . 786 . 515
. 912 . 710 . 571 . 474 1.031 . 574
. 758 . 592 1.134 . 711 . 622 . 506
1.072 . 702 . 705 . 492 . 848 . 657
. 847 . 655 . 775 . 348 . 778 . 537
1.000 . 518 . 968 . 579 . 784 . 419
. 565 . 354 . 963 . 665 . 659 . 429
1.036 . 839 . 933 . 626 . 948 . 485
. 811 . 572 . 704 . 194 . 634 . 544
. 901 . 612 . 624 . 429 . 946 . 550
1.052 . 663 1.119 . 707 1.107 . 458
. 731 . 376 . 686 . 508 1.583 . 975
. 637 . 488 . 741 . 484 1.026 . 550
. 951 . 747 1.028 . 787
. 822 . 610 . 649 . 469
. 951 . 710 1.166 . 796
1.026 . 694 . 954 . 548
1.022 . 580 . 666 . 545
1.047 . 706
. 737 . 526

Fuente: Datos proporcionados por cortesía del Dr. Cyrus Cooper.

42.Sloan et al. (A-31) tenga en cuenta que la activación simpática cardíaca y la retirada parasimpática dan como resultado aumentos de
la frecuencia cardíaca durante el estrés psicológico. Como indicadores de la actividad adrenérgica cardíaca, la epinefrina (E) y la
norepinefrina (NE) plasmáticas generalmente aumentan en respuesta al desafío psicológico. El análisis espectral de potencia de
la variabilidad del período cardíaco también proporciona estimaciones de la autonomía cardíaca.
480 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

actividad del sistema nervioso. Los autores realizaron un estudio para determinar la relación entre neurohumoral y
dos estimaciones espectrales diferentes de la actividad del sistema nervioso simpático cardíaco durante una línea
base de reposo tranquila y en respuesta a una tarea aritmética psicológicamente desafiante. Los sujetos eran
voluntarios masculinos y femeninos sanos y libres de medicación con una edad media de 37,8 años. Ninguno tenía
antecedentes de enfermedad cardíaca, respiratoria o vascular. Entre los datos recopilados se encuentran las
siguientes mediciones de E, NE, índices espectrales de potencia de baja frecuencia (LF) y muy baja frecuencia (VLF), y
relaciones de baja frecuencia/alta frecuencia (LH/HF). Las mediciones se dan para tres períodos: línea de base (B), una
tarea de aritmética mental (MA) y cambio de línea de base a tarea (DELTA).

Número de paciente mi nordeste LF/HF LF Período FLV

5 3.55535 6.28040 0.66706 7.71886B 7.74600


5 0.05557 0.13960 - 0.48115 - 0.99826 DELTA - 2.23823
5 3.61092 6.41999 0.18591 6.72059 MAMÁ 5.50777
6 3.55535 6.24611 2.48308 7.33729 B 6.64353
6 0.10821 - 0.05374-2.03738-0.77109 DELTA - 1.27196
6 3.66356 6.19236 0.44569 6.56620 MAMÁ 5.37157
7 3.29584 4.91998 - 0.15473 7.86663 B 7.99450
7 0.59598 0.53106 0.14086 - 0.81345 DELTA - 2.86401
7 3.89182 5.45104 - 0.01387 7.05319 MAMÁ 5.13049
8 4.00733 5.97635 1.58951 8.18005 B 5.97126
8 0.29673 0.11947 - 0.11771 - 1.16584 DELTA - 0.39078
8 4.30407 6.09582 1.47180 7.01421 MAMÁ 5.58048
12 3.87120 5.35659 0.47942 6.56488 B 5.94960
12 0.19379 0.03415 DELTA 0.50134
12 0.67321 6.59903 MAMÁ 6.45094
13 3.97029 5.85507 0.13687 6.27444 B 5.58500
13 - 0.20909 0.10851 1.05965 - 0.49619 DELTA - 1.68911
13 3.76120 5.96358 1.19652 5.77825 MAMÁ 3.89589
14 3.63759 5.62040 0.88389 6.08877 B 6.12490
14 0.31366 0.07333 1.06100 1.37098 DELTA - 1.07633
14 3.95124 5.69373 1.94489 7.45975 MAMÁ 5.04857
18 4.44265 5.88053 0.99200 7.52268 B 7.19376
18 0.35314 0.62824 - 0.10297 - 0.57142 DELTA - 2.06150
18 4.79579 6.50877 0.88903 6.95126 MAMÁ 5.13226
19 5.03044 0.62446 6.90677 B 7.39854
19 0.69966 0.09578 0.94413 DELTA - 0.88309
19 2.94444 5.73010 0.72024 7.85090 MAMÁ 6.51545
20 3.91202 5.86363 1.11825 8.26341 B 6.89497
20 - 0.02020 0.21401 - 0.60117 - 1.13100 DELTA - 1.12073
20 3.89182 6.07764 0.51708 7.13241 MAMÁ 5.77424
21 3.55535 6.21860 0.78632 8.74397 B 8.26111
21 0.31585 - 0.52487-1.92114-2.38726 DELTA - 2.08151
21 3.87120 5.69373 - 1.13483 6.35671 MAMÁ 6.17960
22 4.18965 5.76832 - 0.02785 8.66907 B 7.51529
22 0.16705 - 0.05459 0.93349 - 0.89157 DELTA - 1.00414
22 4.35671 5.71373 0.90563 7.77751 MAMÁ 6.51115
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 481

Número de paciente mi nordeste LF/HF LF Período FLV

23 3.95124 5.52545 - 0.24196 6.75330 B 6.93020


23 0.26826 0.16491 - 0.00661 0.18354 DELTA - 1.18912
23 4.21951 5.69036 - 0.24856 6.93684 MAMÁ 5.74108
24 3.78419 5.59842 - 0.67478 6.26453 B 6.45268
24 0.32668 - 0.17347 1.44970 0.52169 DELTA 0.39277
24 4.11087 5.42495 0.77493 6.78622 MAMÁ 6.84545
1 3.36730 6.13123 0.19077 6.75395 B 6.13708
1 0.54473 0.08538 0.79284 0.34637 DELTA - 0.56569
1 3.91202 6.21661 0.98361 7.10031 MAMÁ 5.57139
3 2.83321 5.92158 1.89472 7.92524 B 6.30664
3 1.15577 0.64930 - 0.75686 - 1.58481 DELTA - 1.95636
3 3.98898 6.57088 1.13786 6.34042 MAMÁ 4.35028
4 4.29046 5.73657 1.81816 7.02734 B 7.02882
4 0.14036 0.47000 - 0.26089 - 1.08028 DELTA - 1.43858
4 4.43082 6.20658 1.55727 5.94705 MAMÁ 5.59024
5 3.93183 5.62762 1.70262 6.76859 B 6.11102
5 0.80437 0.67865 - 0.26531 - 0.29394 DELTA - 0.94910
5 4.73620 6.30628 1.43731 6.47465 MAMÁ 5.16192
6 3.29584 5.47227 0.18852 6.49054 B 6.84279
6 - 0.16034 0.27073 - 0.16485 - 1.12558 DELTA - 1.84288
6 3.13549 5.74300 0.02367 5.36496 MAMÁ 4.99991
8 3.25810 5.37064 - 0.09631 7.23131 B 7.16371
8 0.40547 - 0.13953 0.97906 - 0.62894 DELTA - 2.15108
8 3.66356 5.23111 0.88274 6.60237 MAMÁ 5.01263
9 3.78419 5.94542 0.77839 5.86126 B 6.22910
9 0.64663 0.05847 - 0.42774 - 0.53530 DELTA - 2.18430
9 4.43082 6.00389 0.35066 5.32595 MAMÁ 4.04480
10 4.07754 5.87493 2.32137 6.71736 B 6.59769
10 0.23995 - 0.00563-0.25309-0.00873 DELTA - 0.75357
10 4.31749 5.86930 2.06827 6.70863 MAMÁ 5.84412
11 4.33073 5.84064 2.89058 7.22570 B 5.76079
11 - 3.63759-0.01464-1.22533-1.33514 DELTA - 0.55240
11 0.693155.826001.665255.89056 MAMÁ 5.20839
12 3.555356.045011.929778.50684 0.13353 B 7.15797
12 0.12041-0.15464-0.84735 DELTA 0.13525
12 3.688886.165421.775137.65949 MAMÁ 7.29322
13 3.33220 4.63473 - 0.11940 6.35464 B 6.76285
13 1.167611.055630.856210.63251 DELTA - 0.52121
13 4.499815.690360.736816.98716 MAMÁ 6.24164
14 3.258105.963581.104567.01270 B 7.49426
14 0.26353 - 1.20066 DELTA - 3.15046
14 1.36809 5.81204 MAMÁ 4.34381
15 5.42935 6.34564 2.76361 9.48594 B 7.05730
15 - 1.14662 - 1.58468 DELTA - 0.08901
15 1.61699 7.90126 MAMÁ 6.96829
dieciséis 4.11087 6.59441 - 0.23319 6.68269 B 6.76872
dieciséis - 0.06782 - 0.54941 0.34755 - 0.29398 DELTA - 1.80868
(Continuación)
482 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

Número de paciente mi nordeste LF/HF LF Período FLV

dieciséis 4.04305 6.04501 0.11437 6.38871 MAMÁ 4.96004


17 6.28040 1.40992 6.09671 B 4.82671
17 - 0.12766-0.17490-0.05945 DELTA 0.69993
17 6.15273 1.23501 6.03726 MAMÁ 5.52665
18 2.39790 6.03548 0.23183 6.39707 B 6.60421
18 1.06784 0.11299 0.27977 - 0.38297 DELTA - 1.92672
18 3.46574 6.14847 0.51160 6.01410 MAMÁ 4.67749
19 4.21951 6.35784 1.08183 5.54214 B 5.69070
19 0.21131 - 0.00347 0.12485 - 0.54440 DELTA - 1.49802
19 4.43082 6.35437 1.20669 4.99774 MAMÁ 4.19268
20 4.14313 5.73334 0.89483 7.35045 B 6.93974
20 - 0.11778 0.00000 0.17129 - 0.58013 DELTA - 1.72916
20 4.02535 5.73334 1.06612 6.77032 MAMÁ 5.21058
21 3.66356 6.06843 - 0.87315 5.09848 B 6.02972
21 0.20764 - 0.10485 0.41178 - 0.33378 DELTA - 2.00974
21 3.87120 5.96358 - 0.46137 4.76470 MAMÁ 4.01998
22 3.29584 5.95324 2.38399 7.62877 B 7.54359
22 0.36772 0.68139 - 0.75014 - 0.89992 DELTA - 1.25555
22 3.66356 6.63463 1.63384 6.72884 MA 6.28804

¼datos perdidos.
Fuente: Datos proporcionados por cortesía del Dr. Richard P. Sloan.

43.El propósito de un estudio de Chati et al. (A-32) fue determinar el papel del desacondicionamiento físico en las anomalías
metabólicas del músculo esquelético en pacientes con insuficiencia cardíaca crónica (ICC). Los sujetos incluyeron
pacientes ambulatorios con CHF (12 hombres, dos mujeres) de 35 a 74 años de edad. Entre los datos recopilados se
encuentran las siguientes mediciones, durante el ejercicio, de carga de trabajo (WL) en condiciones controladas,
consumo máximo de oxígeno (Vo2), umbral ventilatorio anaeróbico (AT), ambos medidos en ml/kg/min, y tiempo total
de ejercicio (ET) en segundos.

WL vo2 EN hora del Este WL vo2 EN hora del Este

7.557 32.800 13.280 933.000 3.930 22.500 18.500 720.000


3.973 8.170 6.770 255.000 3.195 17.020 8.520 375.000
5.311 16.530 11.200 480.000 2.418 15.040 12.250 480.000
5.355 15.500 10.000 420.000 0.864 7.800 4.200 240.000
6.909 24.470 11.550 960.000 2.703 12.170 8.900 513.000
1.382 7.390 5.240 346.000 1.727 15.110 6.300 540.000
8.636 19.000 10.400 600.000 7.773 21.100 12.500 1200.000

Fuente: Datos proporcionados por cortesía del Dr. Zuka€yo Chati.

44.Czader et al. (A-33) investigó ciertos factores pronósticos en pacientes con linfomas no Hodgkin
centroblásticoscentrocíticos (LNH CB/CC). Los sujetos consistieron en hombres y mujeres entre las
edades de 20 y 84 años en el momento del diagnóstico. Entre los datos recopilados se encuentran las
siguientes mediciones sobre dos factores relevantes, A y B. Los autores informaron una correlación
significativa entre los dos.
Traducido del inglés al español - www.onlinedoctranslator.com

PREGUNTAS DE REPASO Y EJERCICIOS 483

A B A B A B

20.00 . 154 22.34 . 147 48.66 . 569


36.00 . 221 18.00 . 132 20.00 . 227
6.97 . 129 18.00 . 085 17.66 . 125
13.67 . 064 22.66 . 577 14.34 . 089
36.34 . 402 45.34 . 134 16.33 . 051
39.66 . 256 20.33 . 246 18.34 . 100
14.66 . 188 16.00 . 175 26.49 . 202
27.00 . 138 15.66 . 105 13.33 . 077
2.66 . 078 23.00 . 145 6.00 . 206
22.00 . 142 27.33 . 129 15.67 . 153
11.00 . 086 6.27 . 062 32.33 . 549
20.00 . 170 24.34 . 147
22.66 . 198 22.33 . 769
7.34 . 092 11.33 . 130
29.67 . 227 6.67 . 099
11.66 . 159
8.05 . 223
22.66 . 065

Fuente: Datos proporcionados por cortesía de la Dra. Magdalena Czader y la Dra. Anna Porwit-MacDonald.

45.La fleroxacina, un derivado de la fluoroquinolona con un amplio espectro antibacteriano y una potente
actividad in vitro contra bacterias gramnegativas y muchas grampositivas, fue objeto de un estudio
realizado por Reigner y Welker (A-34). Los objetivos de su estudio fueron estimar los valores típicos de
aclaramiento sobre la disponibilidad sistémica (CL/F) y el volumen de distribución sobre la
disponibilidad sistémica (V/F) después de la administración de dosis terapéuticas de fleroxacino e
identificar los factores que influyen en la disposición de fleroxacino y cuantificar el grado en que lo
hacen. Los sujetos fueron 172 voluntarios sanos masculinos y femeninos y pacientes no infectados
que representaban un amplio rango de edad. Entre los datos analizados se encuentran las siguientes
mediciones (ml/min) de CL/F y aclaramiento de creatinina (CLcr). Según los autores,

CL/A CLer CL/A CLer CL/A CLer CL/A CLer

137.000 96.000 77.000 67.700 152.000 109.000 132.000 111.000


106.000 83.000 57.000 51.500 100.000 82.000 94.000 118.000
165.000 100.000 69.000 52.400 86.000 88.000 90.000 111.000
127.000 101.000 69.000 65.900 69.000 67.000 87.000 124.000
139.000 116.000 76.000 60.900 108.000 68.700 48.000 10.600
102.000 78.000 77.000 93.800 77.000 83.200 26.000 9.280
72.000 84.000 66.000 73.800 85.000 72.800 54.000 12.500
86.000 81.000 53.000 99.100 89.000 82.300 36.000 9.860
85.000 77.000 26.000 110.000 105.000 71.100 26.000 4.740
122.000 102.000 89.000 99.900 66.000 56.000 39.000 7.020
76.000 80.000 44.000 73.800 73.000 61.000 27.000 6.570
57.000 67.000 27.000 65.800 64.000 79.500 36.000 13.600
62.000 41.000 96.000 109.000 26.000 9.120 15.000 7.600
90.000 93.000 102.000 76.800 29.000 8.540 138.000 100.000
(Continuación)
484 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

CL/A CLer CL/A CLer CL/A CLer CL/A CLer

165.000 88.000 159.000 125.000 39.100 93.700 127.000 108.000


132.000 64.000 115.000 112.000 75.500 65.600 203.000 121.000
159.000 92.000 82.000 91.600 86.000 102.000 198.000 143.000
148.000 114.000 96.000 83.100 106.000 105.000 151.000 126.000
116.000 59.000 121.000 88.800 77.500 67.300 113.000 111.000
124.000 67.000 99.000 94.000 87.800 96.200 139.000 109.000
76.000 56.000 120.000 91.500 25.700 6.830 135.000 102.000
40.000 61.000 101.000 83.800 89.700 74.800 116.000 110.000
23.000 35.000 118.000 97.800 108.000 84.000 148.000 94.000
27.000 38.000 116.000 100.000 58.600 79.000 221.000 110.000
64.000 79.000 116.000 67.500 91.700 68.500 115.000 101.000
44.000 64.000 87.000 97.500 48.900 20.600 150.000 110.000
59.000 94.000 59.000 45.000 53.500 10.300 135.000 143.000
47.000 96.000 96.000 53.500 41.400 11.800 201.000 115.000
17.000 25.000 163.000 84.800 24.400 7.940 164.000 103.000
67.000 122.000 39.000 73.700 42.300 3.960 130.000 103.000
25.000 43.000 73.000 87.300 34.100 12.700 162.000 169.000
24.000 22.000 45.000 74.800 28.300 7.170 107.000 140.000
65.000 55.000 94.000 100.000 47.000 6.180 78.000 87.100
69.000 42.500 74.000 73.700 30.500 9.470 87.500 134.000
55.000 71.000 70.000 64.800 38.700 13.700 108.000 108.000
39.000 34.800 129.000 119.000 60.900 17.000 126.000 118.000
58.000 50.300 34.000 30.000 51.300 6.810 131.000 109.000
37.000 38.000 42.000 65.900 46.100 24.800 94.400 60.000
32.000 32.000 48.000 34.900 25.000 7.200 87.700 82.900
66.000 53.500 58.000 55.900 29.000 7.900 94.000 99.600
49.000 60.700 30.000 40.100 25.000 6.600 157.000 123.000
40.000 66.500 47.000 48.200 40.000 8.600
34.000 22.600 35.000 14.800 28.000 5.500
87.000 61.800 20.000 14.400

Fuente: Datos proporcionados por cortesía del Dr. Bruno Reinner.

46.Yasu et al. (A-35) utilizaron espectroscopía de resonancia magnética no invasiva para determinar los efectos a corto y
largo plazo de la comisurotomía mitral transvenosa percutánea (PTMC) sobre la capacidad de ejercicio y las
respuestas metabólicas de los músculos esqueléticos durante el ejercicio. Se recogieron datos de 11 pacientes (2
hombres, 9 mujeres) con estenosis mitral sintomática. Su edad media fue de 52 años con una desviación estándar de
11. Entre los datos recopilados se encuentran las siguientes mediciones sobre los cambios en el área de la válvula
mitral (d-MVA) y el consumo máximo de oxígeno (d-Vo2) 3, 30 y 90 días posteriores al PTMC:

Días d-vo2
Sujeto Post-PTMC d-MVA (cm2) (ml/kg/min)

1 3 0,64 0.3
2 3 0.76 - 0:9
3 3 0.3 1.9
4 3 0.6 - 3:1
PREGUNTAS DE REPASO Y EJERCICIOS 485

Días d-vo2
Sujeto Post-PTMC d-MVA (cm2) (ml/kg/min)

5 3 0.3 - 0:5
6 3 0.4 - 2:7
7 3 0.7 1.5
8 3 0.9 1.1
9 3 0.6 - 7:4
10 3 0.4 - 0:4
11 3 0,65 3.8
1 30 0.53 1.6
2 30 0.6 3.3
3 30 0.4 2.6
4 30 0.5
5 30 0.3 3.6
6 30 0.3 0.2
7 30 0,67 4.2
8 30 0.75 3
9 30 0.7 2
10 30 0.4 0.8
11 30 0,55 4.2
1 90 0.6 1.9
2 90 0.6 5.9
3 90 0.4 3.3
4 90 0.6 5
5 90 0.25 0.6
6 90 0.3 2.5
7 90 0.7 4.6
8 90 0.8 4
9 90 0.7 1
10 90 0.38 1.1
11 90 0.53
¼Datos perdidos.
Fuente: Datos proporcionados por cortesía del Dr. Takanori Yasu.

Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel

1.Consulte los datos de 1050 sujetos con edema cerebral (CEREBRAL). El edema cerebral con el consiguiente
aumento de la presión intracraneal suele acompañar a las lesiones resultantes de un traumatismo
craneoencefálico y otras afecciones que afectan negativamente a la integridad del cerebro. Los
tratamientos disponibles para el edema cerebral varían en efectividad y efectos secundarios indeseables.
Uno de estos tratamientos es el glicerol, administrado por vía oral o intravenosa. De interés para los
médicos es la relación entre la presión intracraneal y la concentración plasmática de glicerol. Suponga
que usted es un consultor estadístico con un equipo de investigación que investiga la relación entre estas
dos variables. Seleccione una muestra aleatoria simple de la población y realice el análisis que crea que
sería útil para los investigadores. Presente sus hallazgos y conclusiones en forma narrativa e ilústrelos
con gráficos cuando corresponda. Compara tus resultados con los de tus compañeros.
486 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

2.Consulte los datos de 1050 sujetos con hipertensión esencial (HIPERTENSIÓN). Suponga que es un
consultor estadístico de un equipo de investigación médica interesado en la hipertensión esencial.
Seleccione una muestra aleatoria simple de la población y realice los análisis que considere útiles para
los investigadores. Presente sus hallazgos y conclusiones en forma narrativa e ilústrelos con gráficos
cuando corresponda. Compara tus resultados con los de tus compañeros. Consulte con su instructor
sobre el tamaño de la muestra que debe seleccionar.
3.Consulte los datos de 1200 pacientes con artritis reumatoide (CALCIO). Cien pacientes recibieron el
medicamento en cada nivel de dosis. Suponga que usted es un investigador médico que desea
comprender mejor la naturaleza de la relación entre el nivel de dosis de prednisolona y el calcio corporal
total. Seleccione una muestra aleatoria simple de tres pacientes de cada grupo de nivel de dosis y haga lo
siguiente.
(a)Utilice el número total de pares de observaciones para obtener la ecuación de mínimos cuadrados que
describe la relación entre el nivel de dosis (la variable independiente) y el calcio corporal total.
(b)Dibuja un diagrama de dispersión de los datos y traza la ecuación.
(C)Calcularry prueba de significancia al nivel .05. Encuentra elpagvalor.
(d)Compara tus resultados con los de tus compañeros.

REFERENCIAS

Referencias de metodología
1. F.REDERICKHARTWIGcon BLLUVIAEDPENDIENTES,Análisis exploratorio de datos,Publicaciones Sage, Beverly Hills, 1979.
2. yoAINMJOHNSTONEy PAULF. V.ELLEMAN, “La línea resistente y los métodos de regresión relacionados”,Revista de la Asociación
Estadounidense de Estadística, 80 (1985), 1041–1054.
3. DONALDR. M.CnorteNIE,Análisis interactivo de datos: una introducción práctica,Wiley, Nueva York, 1977.
4. pagAULF. V.ELLEMANy DÁVIDOCHOAGLIN,Aplicaciones, conceptos básicos y computación del análisis de datos exploratorios, Duxbury,
Belmont, California, 1981.
5. RA FES ELLA, “Sobre el error probable de un coeficiente de correlación deducido de una muestra pequeña”,Metron, 1
(1921), 3–21.
6. H. HTELÉFONO, "Nueva luz sobre el coeficiente de correlación y sus transformadas",Revista de la Royal Statistical
Society, Serie B, 15 (1953), 193–232.
7. TERRYEDIELMAN,Análisis de regresión aplicado para negocios y economía,Segunda edición, Duxbury, Belmont, CA,
1996.
8. RONALDRHOCUPAR,Métodos y aplicaciones de modelos lineales: regresión y análisis de varianza, Wiley,
Nueva York, 1996.
9. WILLIAMMETROENDENHALLy TERRYSINCICH,Un Segundo Curso de Estadística: Análisis de Regresión,Quinta edición,
Prentice Hall, Upper Saddle River, NJ, 1996.
10. J.OHNnorteETER, mICHAELHKUTNER, CHRISTOPHERJ. N.ACTSHEIM, y WILLIAMWASERMAN,Lineal Aplicado
modelos de regresión,Tercera edición, Irwin, Chicago, 1996.

Aplicaciones Referencias
A-1. jEAN-PAGIERREDESPRE- S, DENISPAGRUD'HOMME, mARIE-CCRISTINAPAGOULIOT, ANGELOTREMBLAY, y CLAUDEBOUCHARD,
"Estimación de la acumulación de tejido adiposo abdominal profundo a partir de mediciones antropométricas simples en
hombres"Diario Americano de Nutrición Clínica, 54 (1991), 471–477.
A-2. METROO YOJ. K.RANTZ, ILANAB.KUTINSKY, AÚLTIMA ESCALERADROBERSTON, y PHILIPSMEHLER, "Efectos de la metadona relacionados con la dosis
en la prolongación del intervalo QT en una serie de pacientes con Torsade de Pointes",Farmacoterapia, 23 (2003), 802–805.

A-3. ROBERTOA. R.EISS, CURTISEHSAA, DEBORÁL. G.RIFFIS, BERNADETTEPAGORTER, y MARIOANNTARA, “Punto de atención
versus monitoreo de laboratorio de pacientes que reciben diferentes terapias anticoagulantes”,Farmacoterapia, 22
(2002), 677–685.
REFERENCIAS 487

A-4. ROBERTOBPARKER, RyanYATE, jUDITHESOBERMAN, y CASEYLAIZURA, "Efectos del jugo de toronja en la glicoproteína P
intestinal: evaluación con digoxina en humanos"Farmacoterapia, 23 (2003), 979–987.
A-5. RB EFURGONETAS, WGORDÓN, y M. C.ONZEMIO, "Efecto de la velocidad sobre las fuerzas de reacción del suelo en perros con
cojera atribuible al desgarro del ligamento cruzado craneal",Diario Americano de Investigación Veterinaria, 64 (
2003), 1479–1481.
A-6. DÁVIDOkRIESER, ANDREWROSENBERG, y GANUNCIOkAINER, "La relación entre la creatinina sérica, la cistatina C sérica y la
tasa de filtración glomerular en receptores de trasplante renal pediátrico: un estudio piloto"Trasplante
Pediátrico, 6 (2002), 392–395.
A-7. OLGAkDESPERDICIO-RABÉN, ROLFLIBELIUS, y HañoHEIKKILA €, “Potenciales evocados somatosensoriales tras

Estimulación de los Nervios Digitales,”Músculo y nervio, 26 (2002), 533–538.


A-8. GRAMOERIrbFILAy kSOYPAGERSLEY, “Epidemia de hepatitis A en ancianos”,Revista médica del sur, 95 (2002), 826–
833.
A-9. ANNETUZSON, kEVINPGRANATA, y MARCAFABEL, "El umbral de velocidad espástica limita el rendimiento
funcional en la parálisis cerebral",Archivos de Medicina Física y Rehabilitación, 84 (2003), 1363–1368.
A-10. MBUTZ, KHWOLLINSKY, U. W.IDEMUTO-CATRINESCU, COMOPERFELADO, SUDOESTEENTERRAR, HH MEHRKENS, CA LUDOLFO,
y H. S.CHREIBER, “Efectos longitudinales de la ventilación con presión positiva no invasiva en pacientes con
esclerosis lateral amiotrófica,”Diario Americano de Rehabilitación Médica, 82 (2003), 597–604.
A-11. kARIEESCROGIN, DanielCHATTON, y DÁVIDOSOYCCARRON, "Los efectos interactivos del cloruro de sodio y el calcio
dietéticos en las respuestas al estrés cardiovascular",American Journal of Physiology (Regulatory Integrative
Comp. Physiol. 30) 261 (1991), R945–R949.
A-12. DEANPAGARMALÉE, Datos analizados por el Centro de Consulta Estadística de la Universidad Estatal de Wright, Universidad Estatal
de Wright, Dayton, OH (2003).
A-13. METROARIAMETROATIAS, Datos analizados por el Centro de Consulta Estadística de la Universidad Estatal de Wright, Universidad Estatal de
Wright, Dayton, OH (2001).
A-14. DARRENMTRILLADOR, STEVENLCLAUSE, y CHRISTOPHERDOMAREW, "Análisis de las actividades de administración de medicamentos
para pacientes domiciliarios",Diario Americano de Farmacia del Sistema de Salud, 59 (2002), 2356–2359.
A-15. METROAXIMALAMARRE-CLICHE, YVESLACUERDO, jACCES DECHAMPLAIN, LCUPAGMÁS ACEITE, y PIERRELAROCHELA, "Hace
¿El intervalo QTc predice la respuesta a los bloqueadores beta y los bloqueadores de los canales de calcio en los hipertensos?Corazón y
enfermedad, 5 (2003), 244–252.
A-16. jEAND. S.KINNER, PAGAULAZIEGLER, y MICHAELPAGONZA, “Transiciones en los patrones de bebidas de bebés y niños
pequeños”, Diario de la Asociación Dietética Americana, Suplemento, 104 (2004), 45–50.
A-17. norteEUNGHWashingtonPAGARCA, jIkESPPAGARCA, YOUNGHEECHOI, CHEOL-InorteYOO, CHOONGRYEOLLEE.UU., hNaciones UnidasLEE.UU., hyokYUNGkSOY,
SUNG-RYULkSOY, TAE-HMUEjEONG, jUNGSUNPAGARCA, CCOLGADOSIKYOON, y YANGHOkSOY, "El manganeso en sangre completa se correlaciona con
intensidades de señal altas en resonancias magnéticas ponderadas en T en pacientes con cirrosis hepática",Neurotoxicología, 24 (2003),
909–915.
A-18. PAGHILIPPE DEMETROOERLOOSE, SYLVIEDESMARAIS, hENRIBOUNAMEAUX, gUIDOREBER, ARNAUDPAGERROR, gEORGESDUPUY,
y jEAN-LOUISPAGITTET, “Contribución de un nuevo, rápido, individual y cuantitativo automatizado D-Dimer ELISA
para excluir la embolia pulmonar,”Trombosis y hemostasia, 75 (1996), 11–13.
A-19. ILPOTHUHTANIEMI, ANNE-METROAARITHAAVISTO, RAIJAANTTILA, mARTTICOMOIIMES, y yoOEDUNKEL, "Sensible
inmunoensayo yin vitroEl bioensayo demuestra una relación bioactiva/inmunorreactiva constante de la hormona luteinizante
en niños sanos durante la maduración puberal.Investigación pediátrica, 39 (1996), 180–184. YONG-KWEITSAU, jI-NORTEUNSUME, C
A-20. HIUNG-Hinterfaz de usuarioCGALLINA, Rtu-JESPTESP, y Hinterfaz de usuario-CHOLACGALLINA, "Factor de crecimiento epidérmico urinario disminuido
en niños con insuficiencia renal aguda: factor de crecimiento epidérmico/proporción de creatinina no es un parámetro
confiable para la excreción del factor de crecimiento epidérmico urinario",Investigación pediátrica, 39 (1996), 20–24. A.U.SAJy V.
A-21. S.TARC, "Ph sanguíneo y cinética del lactato en la evaluación de la resistencia al correr"Revista Internacional de Medicina
Deportiva, 17 (1996), 34–40.
A-22. PAGAMELABEAN, mARIOSEstados UnidosSUTPHIN, PAGATRICIAnorteNECESARIO, mELKONSAGOPIAN, kARSTENLIEGMANN, CARL
LUDVIGSENy J.AMÉSBPETER, "Evaluación de transferrina deficiente en carbohidratos en manchas de sangre seca",
Alcoholismo: investigación clínica y experimental, 20 (1996), 56–60.
A-23. jOHJIkATO, kOHJIkOBAYASHI, TAKUMAmiTOH, mOHITANAKÁ, kAZÚOkITAMURA, TAKUROHIMAMURA, YASUSHI
kOIWAYA, kENJÍkANGAWA, y TANENAOmiA, “Concentración de adrenomedulina en plasma en pacientes con insuficiencia
cardíaca,”Revista de Endocrinología Clínica y Metabolismo, 81 (1996), 180–183.
A-24. SER GVIEJO, PACLOHESSY, GRUSSELL, y MKFAGERHOL, "Calprotectina como marcador de inflamación en la fibrosis
quística",Archives of Disease in Childhood, 74 (1996), 136–139.
488 CAPÍTULO 9 REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

A-25. ARTHURF GELB, jAMÉSCHOGG, norteESTORLMtu €LLER, mARCAJ. S.CHEIN, jOSEPHkUEI, DONALDPTCENIZAS, jOELD.
miPSTEÍNA, jOZEFkOLLIN, ROBERTOHGREEN, norteEquipo originalZAMEL, WMARCAmiLLIOTT, y yoAIFHAJIAGHAI, "Contribución de
Enfisema y pequeñas vías respiratorias en la EPOC”,Cofre, 109 (1996), 353–359.
A-26. AGNESMWITTEMAN, STEVENOSCINTA, gERRORJ. P.ERDOK, DEMANSA SJAMSOEDIN, hENKMJANSEN, Rtransmisión exteriorC.
AALBERSEy J.UN ANILLOS.VAN DERZEE.UU., "La relación entre RAST y los resultados de las pruebas cutáneas en pacientes con
asma o rinitis: un estudio cuantitativo con alérgenos principales purificados"Revista de Alergia e Inmunología Clínica,
97 (1996), 16–25.
A-27. METROARIANNEGRAMOARLANDA, hAZELHSZETO, SALHADAKOTA DEL SURaniel, PAGAMELAJTPELUCHE, mICHAELMMSÍy RAYMONDI.
STARCO, "Cinética de zidovudina en el babuino preñado",Revista de Síndromes de Inmunodeficiencia Adquirida y
Retrovirología Humana, 11 (1996), 117-127.
A-28. AHALLIGAN, COMOHENNAN, L PCámbar, mDelawareSWIETy DJ TAYLOR, "Diferencia de la presión arterial diurna en la
evaluación de la preeclampsia",Obstetricia y Ginecología, 87 (1996), 205–208.
A-29. jSÍWMARCAS, gEORGEGBONORRIS, y yoESLIEJ. S.CHOENFIELD, "Efectos del ursodiol o el ibuprofeno en la contracción de la
vesícula biliar y la bilis entre pacientes obesos durante la pérdida de peso",Enfermedades y Ciencias Digestivas, 41
(1996), 242–249.
A-30. DJ PEACOCK, EDUCACIÓN FÍSICAGGER, PTAYLOR, MEDIO CAWLEY, y C.C.OPER, “Medición de la densidad ósea lateral en la
osteoartritis de la columna lumbar,”Anales de las enfermedades reumáticas, 55 (1996), 196–198.
A-31. RP SPRÉSTAMO, PASFELIZ, EBAGIELLA, JTBIGGER, ES LOy JM GORMAN, "Relaciones entre las catecolaminas circulantes y
la variabilidad del período cardíaco de baja frecuencia como índices de la actividad simpática cardíaca
durante el estrés mental"Medicina Psicosomática, 58 (1996) 25–31.
A-32. ZReino Unido€ICHATI, FA€ZIEZAnad, CLAUDEjEANDEL, BRIGITTELHERBIER, jEAN-METROARIEmiSCANYE, jACCESROBERTO, y
miTIENNEALIOT, "El desacondicionamiento físico puede ser un mecanismo para las anomalías del metabolismo del fosfato energético del
músculo esquelético en la insuficiencia cardíaca crónica",Diario americano del corazón, 131 (1996), 560–566.
A-33. METROAGDALENACZADER, jOANNAMETROAZUR, mIKAELPAGETTERSON, jUNLILIEMARCA, mATSSTRO €MBERG, BIRGERCHRISTENSSON,
BERNARDOTRIBUKAIT, gERTAUER, AKEO €CALLE, y ANNAPAGORWIT, “Importancia pronóstica de enfermedades proliferativas y
Fracciones apoptóticas en linfomas no hodgkinianos derivados de células del centro del folículo de bajo grado.Cáncer, 77
(1996), 1180–1188.
A-34. BG REIGNERy HAWELKER, “Factores que influyen en la eliminación y distribución de la fleroxacina: Metaanálisis de datos
individuales de 10 estudios farmacocinéticos,”Agentes antimicrobianos y quimioterapia, 40 (1996), 575–580.

A-35. TAKANORIYASU, TAKA'AKIkATSUKI, norteOBUHIROOHMURA, IKUKOnorteAkadá, mAFUMIOWashington, mIKIHISAFUJII, AKIRA


SAKAGUCHI, y MUNEYASUSAITO, "Mejoría retardada en el metabolismo del músculo esquelético y la capacidad de ejercicio
en pacientes con estenosis mitral luego de una mejoría hemodinámica inmediata mediante comisurotomía mitral
transvenosa percutánea",Diario Americano de Cardiología, 77 (1996), 492–497.
CAPÍTULO 10
REGRESIÓN MÚLTIPLE
Y CORRELACIÓN

RESUMEN DEL CAPÍTULO

Este capítulo proporciona extensiones de la regresión lineal simple y los


modelos de correlación bivariada discutidos en el Capítulo 9. Los conceptos y
técnicas discutidos aquí son útiles cuando el investigador desea considerar
simultáneamente las relaciones entre más de dos variables. Aunque los
conceptos, cálculos e interpretaciones asociados con el análisis de datos de
múltiples variables pueden parecer complejos, son extensiones naturales del
material explorado en capítulos anteriores.

TEMAS

10.1 INTRODUCCIÓN
10.2 EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE
10.3 OBTENCIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE
10.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE
10.5 USO DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE
10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE
10.7 RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. entender cómo incluir más de una variable independiente en una ecuación de
regresión.
2. ser capaz de obtener un modelo de regresión múltiple y usarlo para hacer predicciones.
3. ser capaz de evaluar los coeficientes de regresión múltiple y la idoneidad del modelo de
regresión.
4. comprender cómo calcular e interpretar coeficientes de correlación múltiples,
bivariados y parciales.

489
490 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

10.1 INTRODUCCIÓN

En el Capítulo 9 exploramos los conceptos y técnicas para analizar y hacer uso de la relación
lineal entre dos variables. Vimos que este análisis puede conducir a una ecuación lineal que se
puede usar para predecir el valor de alguna variable dependiente dado el valor de una variable
independiente asociada.
La intuición nos dice que, en general, deberíamos poder mejorar nuestra capacidad de predicción al
incluir más variables independientes en dicha ecuación. Por ejemplo, un investigador puede encontrar que
los puntajes de inteligencia de los individuos pueden predecirse a partir de factores físicos como el orden de
nacimiento, el peso al nacer y la duración de la gestación junto con ciertos factores hereditarios y
ambientales externos. La duración de la estancia en un hospital de enfermedades crónicas puede estar
relacionada con la edad, el estado civil, el sexo y los ingresos del paciente, sin mencionar el factor obvio del
diagnóstico. La respuesta de un animal de experimentación a algún fármaco puede depender del tamaño de
la dosis y de la edad y peso del animal. Una supervisora de enfermería puede estar interesada en la fuerza
de la relación entre el desempeño de una enfermera en el trabajo, la puntuación en el examen de la junta
estatal, el expediente académico, y puntaje en alguna prueba de desempeño o aptitud. O un administrador
de hospital que estudie las admisiones de varias comunidades atendidas por el hospital puede estar
interesado en determinar qué factores parecen ser responsables de las diferencias en las tasas de admisión.

Los conceptos y técnicas para analizar las asociaciones entre varias variables son
extensiones naturales de las exploradas en los capítulos anteriores. Los cálculos, como
cabría esperar, son más complejos y tediosos. Sin embargo, como se señaló en el Capítulo
9, esto no presenta un problema real cuando se dispone de una computadora. No es
inusual encontrar investigadores investigando las relaciones entre una docena o más de
variables. Para aquellos que tienen acceso a una computadora, la decisión sobre cuántas
variables incluir en un análisis no se basa en la complejidad y la duración de los cálculos,
sino en consideraciones tales como su significado, el costo de su inclusión y la
importancia de su contribución.
En este capítulo seguimos de cerca la secuencia del capítulo anterior. Primero se
considera el modelo de regresión, seguido de una discusión del modelo de correlación. Al
considerar el modelo de regresión, se cubren los siguientes puntos: una descripción del
modelo, métodos para obtener la ecuación de regresión, evaluación de la ecuación y los usos
que pueden hacerse de la ecuación. En ambos modelos se discuten los posibles procedimientos
inferenciales y sus supuestos subyacentes.

10.2 EL MODELO DE REGRESIÓN


LINEAL MÚLTIPLE

En el modelo de regresión múltiple suponemos que existe una relación lineal entre
alguna variableY,que llamamos la variable dependiente, ykvariables independientes,
X1;X2; . . . ;Xk. Las variables independientes a veces se denominanvariables
explicativas,debido a su uso para explicar la variación enytambién se les llama
variables predictoras,debido a su uso en la prediccióny
10.2 EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE 491

suposicionesLos supuestos subyacentes al análisis de regresión múltiple son los


siguientes.

1.ElXison variables no aleatorias (fijas). Este supuesto distingue el modelo de regresión múltiple del
modelo de correlación múltiple, que se presentará en la Sección 10.6. Esta condición indica que
las inferencias que se extraen de los datos de la muestra se aplican solo al conjunto deXvalores
observados y no a una colección más grande deX's. Bajo el modelo de regresión, el análisis de
correlación no es significativo. Bajo el modelo de correlación que se presentará más adelante,
se pueden aplicar las técnicas de regresión que siguen.
2.Para cada conjunto deXivalores hay una subpoblación deYvalores. Para construir ciertos
intervalos de confianza y probar hipótesis, debe saberse, o el investigador debe estar
dispuesto a asumir, que estas subpoblaciones deYLos valores se distribuyen
normalmente. Como queremos demostrar estos procedimientos inferenciales, en los
ejemplos y ejercicios de este capítulo se hará la suposición de normalidad.
3.Las varianzas de las subpoblaciones deYson todos iguales.
4.ElYlos valores son independientes Es decir, los valores deYseleccionado para un conjunto deXLos valores
no dependen de los valores deYseleccionado en otro conjunto deXvalores.

La ecuación del modeloLos supuestos para el análisis de regresión múltiple pueden establecerse
de manera más compacta como

yj¼b0þb1X1jþb2X2jþ - - - þbkXkjþmij (10.2.1)

dóndeyjes un valor típico de una de las subpoblaciones deYvalores; elbise denominan


coeficientes de regresión;X1j;X2j; . . . ;Xkjson, respectivamente, valores particulares de las
variables independientesX1;X2; . . .Xk;ymijes una variable aleatoria con media 0 y varianzas2;la
varianza común de las subpoblaciones deYvalores. Para construir intervalos de confianza y
probar hipótesis sobre los coeficientes de regresión, asumimos que elmijse distribuyen normal
e independientemente. Las declaraciones sobremijson consecuencia de los supuestos relativos
a las distribuciones deYvalores. Nos referiremos a la Ecuación 10.2.1 como el modelo de
regresión lineal múltiple.
Cuando la Ecuación 10.2.1 consta de una variable dependiente y dos variables
independientes, es decir, cuando el modelo se escribe

yj¼b0þb1X1jþb2X2jþmij (10.2.2)

aaviónen el espacio tridimensional se puede ajustar a los puntos de datos como se ilustra en la Figura
10.2.1. Cuando el modelo contiene más de dos variables independientes, se describe
geométricamente como unhiperplano
En la figura 10.2.1, el observador debe visualizar algunos de los puntos ubicados
por encima del plano y otros por debajo del plano. La desviación de un punto del plano
está representada por

mij¼yj-b0-b1X1j-b2X2j (10.2.3)

En la Ecuación 10.2.2,b0representa el punto donde el plano corta elY-eje; es decir,


representa laY-intercepción del avión.b1mide el cambio promedio enYpor una unidad
492 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

Desviaciones de la

Plano de regresión
avión

X2 X1

FIGURA 10.2.1 Plano de regresión múltiple y dispersión de puntos.

cambiar enX1cuandoX2permanece invariable yb2mide el cambio promedio enYpor un cambio de


unidad enX2cuandoX1permanece sin cambios. Por esta razónb1yb2se conocen como coeficientes
de regresión parcial.

10.3 OBTENCIÓN DE LA ECUACIÓN DE


REGRESIÓN MÚLTIPLE

Estimaciones imparciales de los parámetrosb0;b1; . . . ;bkdel modelo especificado en la Ecuación 10.2.1


se obtienen por el método de mínimos cuadrados. Esto significa que la suma de las desviaciones al
cuadrado de los valores observados deYde la superficie de regresión resultante se minimiza. En el
caso de tres variables, como se ilustra en la figura 10.2.1, la suma de las desviaciones al cuadrado de
las observaciones del plano es mínima cuandob0;b1;yb2se estiman por el método de mínimos
cuadrados. En otras palabras, por el método de mínimos cuadrados, estimaciones muestrales de b0;b1
; . . . ;bkse seleccionan de tal manera que la cantidad

X X- -
j¼2
mi yj-b0-b1X1j-b2X2j- - - - -bkX2 kj

se minimiza. Esta cantidad, conocida como la suma de los cuadrados de los residuos, también puede ser
Escrito como
X X- -2
j¼2
mi yj- ŷj (10.3.1)

indicando el hecho de que la suma de los cuadrados de las desviaciones de los valores observados deYde los
valores deYcalculado a partir de la ecuación estimada se minimiza.
10.3 OBTENCIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE 493

Las estimaciones de los parámetros de regresión múltiple pueden obtenerse mediante


cálculos aritméticos realizados en una calculadora portátil. Este método para obtener las
estimaciones es tedioso, requiere mucho tiempo, está sujeto a errores y es una pérdida de
tiempo cuando se dispone de una computadora. Aquellos interesados en examinar o usar el
enfoque aritmético pueden consultar ediciones anteriores de este texto o las de Snedecor y
Cochran (1) y Steel y Torrie (2), quienes dan ejemplos numéricos para cuatro variables, y
Anderson y Bancroft (3), quienes ilustrar los cálculos involucrados cuando hay cinco variables.
En el siguiente ejemplo, usamos el software SPSS para ilustrar un interesante resumen gráfico
de datos de muestra recopilados en tres variables. Luego usamos MINITAB y SAS para ilustrar
la aplicación del análisis de regresión múltiple.

EJEMPLO 10.3.1
Los investigadores Jansen y Keller (A-1) utilizaron la edad y el nivel educativo para predecir la capacidad para
dirigir la atención (CDA) en sujetos de edad avanzada. CDA se refiere a los mecanismos inhibitorios
neuronales que enfocan la mente en lo que es significativo mientras bloquea las distracciones. El estudio
recopiló información sobre 71 mujeres mayores que vivían en la comunidad con un estado mental normal. La
medida de CDA se calculó a partir de los resultados de medidas visuales y auditivas estándar que requieren la
inhibición de estímulos competitivos y de distracción. En este estudio, las puntuaciones CDA oscilaron entre
- 7:65 a 9.61 con puntajes más altos correspondientes a un mejor funcionamiento atencional. Las
medidas de CDA, edad en años y nivel educativo (años de escolaridad) para 71 sujetos se muestran en
la Tabla 10.3.1. Deseamos obtener la ecuación de regresión múltiple muestral.

TABLA 10.3.1 Puntuaciones CDA, edad y nivel educativo para 71


sujetos descritos en el ejemplo 10.3.1

Edad Nivel educativo CDA Edad Nivel educativo CDA

72 20 4.57 79 12 3.17
68 12 - 3,04 87 12 - 1.19
sesenta y cinco 13 1.39 71 14 0.99
85 14 - 3.55 81 dieciséis - 2.94
84 13 - 2.56 66 dieciséis - 2.21
90 15 - 4.66 81 dieciséis - 0,75
79 12 - 2,70 80 13 5.07
74 10 0.30 82 12 - 5.86
69 12 - 4.46 sesenta y cinco 13 5.00
87 15 - 6.29 73 dieciséis 0,63
84 12 - 4.43 85 dieciséis 2.62
79 12 0.18 83 17 1.77
71 12 - 1.37 83 8 - 3.79
76 14 3.26 76 20 1.44
73 14 - 1.12 77 12 - 5.77
86 12 - 0,77 83 12 - 5.77
69 17 3.73 79 14 - 4.62
66 11 - 5,92 69 12 - 2,03
(Continuación)
494 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

Edad Nivel educativo CDA Edad Nivel educativo CDA

sesenta y cinco dieciséis 5.74 66 14 - 2.22


71 14 2.83 75 12 0.80
80 18 - 2,40 77 dieciséis - 0,75
81 11 - 0.29 78 12 - 4,60
66 14 4.44 83 20 2.68
76 17 3.35 85 10 - 3,69
70 12 - 3.13 76 18 4.85
76 12 - 2.14 75 14 - 0,08
67 12 9.61 70 dieciséis 0,63
72 20 7.57 79 dieciséis 5.92
68 18 2.21 75 18 3.63
102 12 - 2.30 94 8 - 7,07
67 12 1.73 76 18 6.39
66 14 6.03 84 18 - 0,08
75 18 - 0.02 79 17 1.07
91 13 - 7.65 78 dieciséis 5.31
74 15 4.17 79 12 0.30
90 15 - 0,68

Fuente: Datos proporcionados por cortesía de Debra A. Jansen, Ph.D., RN

Antes de analizar los datos usando técnicas de regresión múltiple, es útil


construir gráficas de las relaciones entre las variables. Esto se logra haciendo
gráficas separadas de cada par de variables, (X1,X2), (X1,Y ),y (X2,Y).Un paquete de
software como S y en un formato de matriz como se muestra
Figura 10 en uld esperar una relación negativa

FIGURA 10.3.1Diagrama de dispersión de matriz de SPSS de los datos de la Tabla 10.3.1.


10.3 OBTENCIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE 495

Caja de diálogo: Comando de sesión:

Estadística Regresión Regresión MTB > Nombre C4 = 'SRES1'


TipoYenRespuestayX1 X2 en C5 = 'FITS1' C6 = 'RESI1' MTB >
Predictores. Regresión 'y' 2 'x1' 'x2'; SUBC>
ControlarDerechos residuales de autor. SResiduales `SRES1';
ControlarResidencia estándar. SUBC> Se ajusta a 'FITS1';
ControlarDE ACUERDO. SUBC> Constante;
SUBC> Derechos residuales de autor 'RESI1'.
Producción:

Análisis de regresión: Y versus X1, X2

La ecuación de regresión es Y = 5,49 - 0,184


X1 + 0,611 X2

Vaticinador coef SE Coef T PAG


Constante 5.494 4.443 1.24 0.220
X1 - 0.18412 0.04851 - 3,80 0.000
X2 0.6108 0.1357 4.50 0.000

S = 3.134 R-Sq = 37,1% R-Cuadrado (ajustado) = 35,2 %

Análisis de Diferencia

Fuente DF SS EM F PAG
Regresión 2 393.39 196.69 20.02 0.000
error residual 68 667.97 9.82
Total 70 1061.36

Fuente DF SS de secuencia

X1 1 194.24
X2 1 199.15

Inusual Observaciones
Obs. X1 Y Adaptar Ajuste SE Residual Calle residir
28 67 9.610 0.487 0.707 9.123 2.99R
31 102 - 2.300 - 5.957 1.268 3.657 1.28X
44 80 5.070 - 1.296 0.425 6.366 2.05R
67 94 - 7.070 - 6.927 1.159 - 0.143 - 0.05X

R denota una observación con un residuo estandarizado grande. X denota una


observación cuyo valor X le da una gran influencia.

FIGURA 10.3.2Procedimiento y salida de MINITAB para el ejemplo 10.3.1.


496 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

El Procedimiento REG

Modelo: MODEL1
Variable dependiente: CDA

Análisis de variación

La suma de Significar

Fuente DF Cuadrícula Cuadrado Valor F PR > F

Modelo 2 393.38832 196.69416 20.02 <.0001


Error 68 667.97084 9.82310
corregido Total 70 1061.35915

Raíz MSE 3.13418 R Plaza 0.3706


Dependiente Significar 0.00676 Cuadrado R adj. 0.3521
Coef Var 46360

Parámetro Estimados

Parámetro Estándar
Variable DF Estimar Error t Valor PR > |t|
Interceptar 1 5.49407 4.44297 1.24 0.2205
EDAD 1 - 0.18412 0.04851 - 3,80 0.0003
EDUCAR 1 0.61078 0.13565 4.50 <.0001

FIGURA 10.3.3S.A.S.®salida para el Ejemplo 10.3.1.

entre CDA y Edad y una relación positiva entre CDA y Ed-Level. Veremos que este
es el caso cuando usamos MINITAB para analizar los datos.

Solución: Ingresamos las observaciones sobre edad, nivel educativo y CDA en c1 a c3 y las
nombramosX1,X2, yY,respectivamente. El cuadro de diálogo y el comando de sesión de
MINITAB, así como la salida, se muestran en la Figura 10.3.2. Vemos a partir de la
salida que la ecuación de regresión múltiple muestral, en la notación de la Sección
10.2, es

ŷj¼5:49 - :184X1jþ :611X2j

Otras entradas de salida se discutirán en las secciones siguientes.


La salida de SAS para el Ejemplo 10.3.1 se muestra en la Figura 10.3.3. &

Una vez obtenida la ecuación de regresión múltiple, el siguiente paso consiste en su


evaluación e interpretación. Cubrimos esta faceta del análisis en la siguiente sección.
EJERCICIOS 497

EJERCICIOS

Obtenga la ecuación de regresión para cada uno de los siguientes conjuntos de datos.
10.3.1 Machiel Naeije (A-2) estudió la relación entre la apertura máxima de la boca y las medidas del maxilar
inferior (mandíbula). Midió la variable dependiente, apertura máxima de la boca (MMO, medida en
mm), así como variables predictoras, longitud mandibular (ML, medida en mm) y ángulo de rotación
de la mandíbula (RA, medida en grados) de 35 sujetos.

MMO (Y) ML (X1) AR (X2) MMO (Y) ML (X1) AR (X2)

52.34 100.85 32.08 50.82 90.65 38.33


51.90 93.08 39.21 40.48 92.99 25.93
52.80 98.43 33.74 59.68 108.97 36.78
50.29 102.95 34.19 54.35 91.85 42.02
57.79 108.24 35.13 47.00 104.30 27.20
49.41 98.34 30.92 47.23 93.16 31.37
53.28 95.57 37.71 41.19 94.18 27.87
59.71 98.85 44.71 42.76 89.56 28.69
53.32 98.32 33.17 51.88 105.85 31.04
48.53 92.70 31.74 42.77 89.29 32.78
51.59 88.89 37.07 52.34 92.58 37.82
58.52 104.06 38.71 50.45 98.64 33.36
62.93 98.18 43.89 43.18 83.70 31.93
57.62 91.01 41.06 41.99 88.46 28.32
65.64 96.98 41.92 39.45 94.93 24.82
52.85 97.85 35.25 38.91 96.81 23.88
64.43 96.89 45.11 49.10 93.13 36.17
57.25 98.35 39.44

Fuente: Datos proporcionados por cortesía de M. Naeije, DDS

10.3.2 El cuidado familiar de adultos mayores es más común en Corea que en los Estados Unidos. Hijo et al. (A-3)
estudió a 100 cuidadores de adultos mayores con demencia en Seúl, Corea del Sur. La variable dependiente
fue la carga del cuidador medida por el Inventario de Carga de Corea (KBI). Los puntajes variaron de 28 a
140, y los puntajes más altos indicaron una mayor carga. Las variables explicativas fueron índices que
midieron lo siguiente:

AVD: total de actividades de la vida diaria (puntuaciones bajas indican que los ancianos realizan actividades
independientemente).

MEM: problemas de memoria y conducta (mayores puntuaciones indican más problemas).


COG: deterioro cognitivo (las puntuaciones más bajas indican un mayor grado de deterioro cognitivo).

Los datos reportados son los siguientes:

KBI (Y) AVD (X1) MEM (X2) COG (X3) KBI (Y) AVD (X1) MEM (X2) COG (X3)

28 39 4 18 88 76 50 5
68 52 33 9 54 79 44 11
59 89 17 3 73 48 57 9
91 57 31 7 87 90 33 6
(Continuación)
498 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

KBI (Y) AVD (X1) MEM (X2) COG (X3) KBI (Y)AVD (X1) MEM (X2) COG (X3)

70 28 35 19 47551120
38 34 3 25 60832411
46 42 dieciséis 17 65502125
57 52 6 26 57443118
89 88 41 13 85793020
48 90 24 3 28 24 5 22
74 38 22 13 40402017
78 83 41 11 87351527
43 30 9 24 80 55 9 21
76 45 33 14 49452817
72 47 36 18 57461917
61 90 17 0 32 37 4 21
63 63 14 dieciséis 52 47 29 3
77 34 35 22 42 28 23 21
85 76 33 23 49 61 8 7
31 26 13 18 63 35 31 26
79 68 34 26 89 68 sesenta y cinco 6
92 85 28 10 67 80 29 10
76 22 12 dieciséis 43 43 8 13
91 82 57 3 47 53 14 18
78 80 51 3 70 60 30 dieciséis

103 80 20 18 99 63 22 18
99 81 20 1 53 28 9 27
73 30 7 17 78 35 18 14
88 27 27 27 112 37 33 17
64 72 9 0 52 82 25 13
52 46 15 22 68 88 dieciséis 0
71 63 52 13 63 52 15 0
41 45 26 18 49 30 dieciséis 18
85 77 57 0 42 69 49 12
52 42 10 19 56 52 17 20
68 60 34 11 46 59 38 17
57 33 14 14 72 53 22 21
84 49 30 15 95 sesenta y cinco 56 2
91 89 64 0 57 90 12 0
83 72 31 3 88 88 42 6
73 45 24 19 81 66 12 23
57 73 13 3 104 60 21 7
69 58 dieciséis 15 88 48 14 13
81 33 17 21 115 82 41 13
71 34 13 18 66 88 24 14
91 90 42 6 92 63 49 5
48 48 7 23 97 79 34 3
94 47 17 18 69 71 38 17
57 32 13 15 112 66 48 13
49 63 32 15 88 81 66 1
Fuente: Datos proporcionados por cortesía de Gwi-Ryung Son, RN, Ph.D.
EJERCICIOS 499

10.3.3 En un estudio de factores que se cree que están relacionados con los patrones de ingreso a un gran hospital general,
un administrador obtuvo estos datos en 10 comunidades en el área de captación del hospital:

Índice de
Personas por 1000 Disponibilidad de
Población Admitida Otra Salud Índice de
Durante el período de estudio Servicios indigencia
Comunidad (Y) (X1) (X2)

1 61.6 6.0 6.3


2 53.2 4.4 5.5
3 65.5 9.1 3.6
4 64,9 8.1 5.8
5 72.7 9.7 6.8
6 52.2 4.8 7.9
7 50.2 7.6 4.2
8 44.0 4.4 6.0
9 53.8 9.1 2.8
10 53.5 6.7 6.7

Total 571.6 69,9 55,6

10.3.4 El administrador de un hospital general obtuvo los siguientes datos de 20 pacientes de cirugía durante un estudio
para determinar qué factores parecen estar relacionados con la duración de la estadía:

Postoperatorio preoperatorio
Longitud de Número de corriente Longitud de
Estancia en Días Problemas médicos Estancia en Días
(Y) (X1) (X2)

6 1 1
6 2 1
11 2 2
9 1 3
dieciséis 3 3
dieciséis 1 5
4 1 1
8 3 1
11 2 2
13 3 2
13 1 4
9 1 2
17 3 3
17 2 4
12 4 1
6 1 1
5 1 1
(Continuación)
500 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

Postoperatorio preoperatorio
Longitud de Número de corriente Longitud de
Estancia en Días Problemas médicos Estancia en Días
(Y) (X1) (X2)

12 3 2
8 1 2
9 2 2

Total 208 38 43

10.3.5 Una muestra aleatoria de 25 enfermeras seleccionadas de un registro estatal arrojó la siguiente información sobre la
puntuación de cada enfermera en el examen de la junta estatal y su puntuación final en la escuela. Ambos puntajes se
relacionan con el área de afiliación de la enfermera. Se puso a disposición de la investigadora información adicional sobre el
puntaje obtenido por cada enfermero en una prueba de aptitud, tomada en el momento del ingreso a la escuela de enfermería.
Los datos completos son los siguientes:

Puntaje de la Junta Estatal Puntuación final Puntuación de la prueba de aptitud

(Y) (X1) (X2)

440 87 92
480 87 79
535 87 99
460 88 91
525 88 84
480 89 71
510 89 78
530 89 78
545 89 71
600 89 76
495 90 89
545 90 90
575 90 73
525 91 71
575 91 81
600 91 84
490 92 70
510 92 85
575 92 71
540 93 76
595 93 90
525 94 94
545 94 94
600 94 93
625 94 73

Total 13.425 2263 2053


10.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE 501

10.3.6 Los siguientes datos fueron recolectados en una muestra aleatoria simple de 20 pacientes con hipertensión. las
variables son

Y¼presión arterial mediadmilímetro


hectogramoÞ X1¼edaddañosÞ X2¼pesodkgÞ

X3¼área superficial del cuerpodmetros


cuadradosÞ X4¼duración de la hipertensiónd
añosÞ X5¼pulso basaldlatidosthn=minÞ X6¼
medida de estrés

Paciente Y X1 X2 X3 X4 X5 X6

1 105 47 85.4 1.75 5.1 63 33


2 115 49 94.2 2.10 3.8 70 14
3 116 49 95.3 1.98 8.2 72 10
4 117 50 94.7 2.01 5.8 73 99
5 112 51 89.4 1.89 7.0 72 95
6 121 48 99.5 2.25 9.3 71 10
7 121 49 99.8 2.25 2.5 69 42
8 110 47 90,9 1.90 6.2 66 8
9 110 49 89.2 1.83 7.1 69 62
10 114 48 92.7 2.07 5.6 64 35
11 114 47 94.4 2.07 5.3 74 90
12 115 49 94.1 1.98 5.6 71 21
13 114 50 91.6 2.05 10.2 68 47
14 106 45 87.1 1.92 5.6 67 80
15 125 52 101.3 2.19 10.0 76 98
dieciséis 114 46 94.5 1.98 7.4 69 95
17 106 46 87.0 1.87 3.6 62 18
18 113 46 94.5 1.90 4.3 70 12
19 110 48 90.5 1.88 9.0 71 99
20 122 56 95.7 2.09 7.0 75 99

10.4 EVALUACIÓN DE LA ECUACIÓN DE


REGRESIÓN MÚLTIPLE

Antes de usar una ecuación de regresión múltiple para predecir y estimar, es deseable
determinar primero si, de hecho, vale la pena usarla. En nuestro estudio de la regresión lineal
simple hemos aprendido que la utilidad de una ecuación de regresión puede evaluarse
considerando el coeficiente de determinación de la muestra y la pendiente estimada. Al evaluar
una ecuación de regresión múltiple, enfocamos nuestra atención en lacoeficiente de
determinación múltipley los coeficientes de regresión parcial.

El coeficiente de determinación múltipleEn el Capítulo 9 el coeficiente


ciente de determinación se discute en detalle considerable. El concepto se extiende lógicamente
502 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

al caso de regresión múltiple. La variación total presente en elYlos valores pueden


dividirse en dos componentes: la variación explicada, que mide la cantidad de la variación
total explicada por la superficie de regresión ajustada, y la variación no explicada, que es
la parte de la variación total que no se explica ajustando la superficie de regresión. La
medida de variación en cada caso es una suma de desviaciones al cuadrado. La variación
total es la suma de las desviaciones al cuadradoPAGde-cada o-observación deY
de la media del observadoPAGion-s y -se designa por yj- -y2oSST.El
variación explicada, designada ŷj- -y2oacero inoxidable,es la suma de las desviaciones al cuadrado
de los valores calculados a partir de la media de los observadosYvalores. Esta suma de desviaciones al
cuadrado se llama tPAG él -suma de cuadrados debido a la regresión (SSR).lo inexplicable
2
variación, escrita como yj- ŷj,es la suma de las desviaciones al cuadrado del original
observaciones a partir de los valores calculados. Esta cantidad se conoce como lasuma de
cuadrados sobre la regresióno elerror de suma de cuadrados (SSE).Podemos resumir la relación
entre las tres sumas de cuadrados con la siguiente ecuación:
PAG- - PAG- - PAG- -2
yj- -y2 ¼ ŷj- -y 2þ yj- ŷj
¼
acero inoxidable RSSþSSE
(10.4.1)
suma total de cuadrados ¼ explicadodregresiónÞsuma de cuadrados þ

inexplicablederrorÞsuma de cuadrados

El coeficiente de determinación múltiple,R2 y:12...kse obtiene dividiendo el


suma de cuadrados explicada por la suma total de cuadrados. Eso es,
PAG- -
ŷj- -y2 RSS
Ry:12...k
2 ¼PAG - -2 ¼ (10.4.2)
yj- -y acero inoxidable

el subíndicey:12 . .kindica que en el análisisYse trata como la variable dependiente y laX


variables deX1a través deXkse tratan como las variables independientes. El valor
deR2y:12...kindica qué proporción de la variación total en el observadoYvalores es
explicado por la regresión deYenX1;X2; . . . ;Xk. En otras palabras, podemos decir queR2 y:12...k
es una medida de la bondad de ajuste de la superficie de regresión. Esta cantidad es análoga a
r2, que se calculó en el Capítulo 9.

EJEMPLO 10.4.1
Consulte el Ejemplo 10.3.1. CalcularR2 y:12.

Solución:Para nuestro ejemplo ilustrativo tenemos en la Figura 10.3.1

acero inoxidable¼1061:36

RSS¼ 393:39

SSE¼ 667:97
393:39
Ry:12
2 ¼ ¼ :3706 :371
1061:36
10.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE 503

Decimos que alrededor del 37.1 por ciento de la variación total en elYvalores se
explica por el plano de regresión ajustado, es decir, por la relación lineal con la
edad y el nivel educativo. &

Prueba de la hipótesis de la regresiónPara determinar si el total


regresión es significativa (es decir, para determinar siR2 y:12es significativo), podemos
realice una prueba de hipótesis de la siguiente manera.

1. Datos.La situación de la investigación y los datos generados por la investigación se examinan


para determinar si la regresión múltiple es una técnica adecuada para el análisis.
2. Supuestos.Suponemos que el modelo de regresión múltiple y sus supuestos
subyacentes presentados en la Sección 10.2 son aplicables.
3. Hipótesis.En general, la hipótesis nula esH0:b1¼b2¼b3¼ - - - ¼bk¼0 y la alternativa es
HA: no todobi¼0. En palabras, la hipótesis nula establece que todas las variables
independientes no tienen ningún valor para explicar la variación en la Yvalores.

4. Estadística de prueba.La estadística de prueba adecuada es VR, que se calcula como parte de
un análisis de varianza. La tabla general de ANOVA se muestra en la Tabla 10.4.1. En la Tabla
10.4.1,MSRrepresenta el cuadrado medio debido a la regresión yMSEsignifica el cuadrado
medio de la regresión o, como a veces se le llama, el cuadrado medio del error.

5. Distribución de la estadística de prueba.CuandoH0es verdadera y se cumplen los


supuestos, VR se distribuye comoFconkyn-k-1 grados de libertad.
6. Regla de decisión.RechazarH0si el valor calculado de VR es igual o mayor que el
valor crítico deF.
7. Cálculo de la estadística de prueba.Ver Tabla 10.4.1.
8. Decisión estadística.Rechazar o no rechazarH0de acuerdo con la regla de decisión.
9. Conclusión.si rechazamosH0concluimos que, en la población de la que se extrajo la
muestra, la variable dependiente se relaciona linealmente con las variables
independientes como grupo. Si fallamos en rechazarH0, concluimos que, en la población
de la que se extrajo nuestra muestra, puede no existir una relación lineal entre la
variable dependiente y las variables independientes como grupo.
10pagvalor.Obtenemos elpagvalor de la tabla deFdistribución.
Ilustramos el procedimiento de prueba de hipótesis por medio del siguiente ejemplo.

TABLA 10.4.1 Tabla ANOVA para Regresión Múltiple

Fuente SS d.f. EM realidad virtual

Debido a la regresión RSS k MSR¼SSR=k MSR=MSE


Acerca de la regresión SSE n-k-1 MSE¼SE=dn-k-1Þ

Total acero inoxidable n-1


504 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

EJEMPLO 10.4.2
Deseamos probar la hipótesis nula de que no existe una relación lineal entre las tres variables
discutidas en el ejemplo 10.3.1: puntaje CDA, edad y nivel educativo.

Solución:

1. Datos.Véase la descripción de los datos dada en el Ejemplo 10.3.1.


2. Supuestos.Suponemos que los supuestos discutidos en la Sección
10.2 se cumplen.

3. Hipótesis.
H0: ¼b1¼b2¼0
HA: ¼no todobi¼0
4. Estadística de prueba.La estadística de prueba es VR

5. Distribución de la estadística de prueba.SiH0es verdadero y se cumplen los supuestos, el


estadístico de prueba se distribuye comoFcon 2 numerador y 68 denominador grados
de libertad.

6. Regla de decisión.Usemos un nivel de significación dea¼ :01. La regla de


decisión, entonces, es rechazarH0si el valor calculado de VR es igual o
superior a 4,95 (obtenido por interpolación).
7. Cálculo de la estadística de prueba.El ANOVA para el ejemplo se muestra en la
Figura 10.3.1, donde vemos que el valor calculado de VR es 20.02.
8. Decisión estadística.Como 20.02 es mayor que 4.95, rechazamosH0.
9. Conclusión.Concluimos que, en la población de donde proviene la
muestra, existe una relación lineal entre las tres variables.
10pagvalor.Como 20.02 es mayor que 5.76, elpagel valor de la prueba es inferior
a .005. &

Inferencias sobre el individuob0sCon frecuencia, deseamos evaluar la


fuerza de la relación lineal entreYy las variables independientes individualmente. Es decir,
podemos querer probar la hipótesis nula de quebi¼0 contra la alternativa bi6¼0di¼1; 2; . . . ;kÞ.
La validez de este procedimiento se basa en los supuestos establecidos anteriormente: que
para cada combinación deXivalores existe una subpoblación normalmente distribuida deY
valores con varianzas2.

Pruebas de hipótesis para labi Para probar la hipótesis nula de quebies igual a algún valor
particular, digamos,bi0, la siguientetla estadística se puede calcular:

bi-bi0
t¼ (10.4.3)
sbi

donde los grados de libertad son iguales an-k-1, ysb i


es la desviación estándar de
El bi.
Las desviaciones estándar de b̂ise dan como parte de la salida de la mayoría de los paquetes de
software que hacen análisis de regresión.
10.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE 505

EJEMPLO 10.4.3
Consultemos el Ejemplo 10.3.1 y probemos la hipótesis nula de que la edad (años) es irrelevante para
predecir la capacidad para dirigir la atención (CDA).

Solución:

1. Datos.Ver Ejemplo 10.3.1.


2. Supuestos.Consulte la Sección 10.2.
3. Hipótesis.
H0:b1¼0
HA:b16¼0
Dejara¼ :05

4. Estadística de prueba.Ver Ecuación 10.4.3.

5. Distribución de la estadística de prueba.CuandoH0es verdadero y se cumplen los


supuestos, el estadístico de prueba se distribuye como Student'stcon 68 grados de
libertad.

6. Regla de decisión.RechazarH0si el calculadotes mayor o igual a


1.9957 (obtenido por interpolación) o menor o igual a
- 1:9957.
7. Cálculo de la estadística de prueba.Por la Ecuación 10.4.3 y los datos de la Figura
10.3.2 calculamos

b1- 0 - :18412
t¼ ¼ ¼ -3:80
sb1 :04851

8. Decisión estadística.Se rechaza la hipótesis nula ya que el valor calculado


det, -3:80, es menor que -1:9957.
9. Conclusión.Concluimos, entonces, que existe una relación lineal
entre la edad y el CDA en presencia del nivel educativo.
10pagvalor.Para esta prueba,pag <2d:005Þ ¼ :01 porque -3:80 < -2:6505 (obtenido por
interpolación). Como se muestra en la Figura 10.3.2, elpag-el valor es <.001 para
esta prueba.

&

Ahora, realicemos una prueba similar para el segundo coeficiente de regresión parcial,b2:

H0:b2¼0
HA:b26¼0
a¼ :05
b2- 0 :6108
t¼ ¼ ¼4:50
sb2 :1357
506 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

En este caso también se rechaza la hipótesis nula, ya que 4,50 es mayor que 1,9957.
Concluimos que existe una relación lineal entre el nivel educativo y el CDA en la edad de
presencia, y que el nivel educativo, utilizado de esta manera, es una variable útil para
predecir el CDA. [Para esta prueba,pag <2d:005Þ ¼ :01.

Intervalos de confianza para elbi Cuando el investigador ha llegado a la conclusión de que


un coeficiente de regresión parcial no es 0, puede estar interesado en obtener un intervalo de
confianza para estebi. Intervalos de confianza para labipuede construirse de la manera habitual
utilizando un valor de latdistribución para el factor de confiabilidad y los errores estándar
dados anteriormente.
un 100d1 -aÞintervalo de confianza porcentual parabies dado por

bi t1-dun =2Þ;nk-1sbi

Para nuestro ejemplo ilustrativo, podemos calcular los siguientes intervalos de confianza del 95
por ciento parab1yb2.
El intervalo de confianza del 95 por ciento parab1es

- :18412 1:9957d:04851Þ
- :18412 :0968
d-:28092; - :08732Þ

El intervalo de confianza del 95 por ciento parab2es

:6108 d1:9957Þð:1357Þ

:6108 :2708

d:3400; :8816Þ

Podemos dar a estos intervalos las interpretaciones probabilísticas y prácticas usuales. Estamos
seguros en un 95 por ciento, por ejemplo, de queb2está contenido en el intervalo de .3400 a .8816 ya
que, en muestreo repetido, el 95 por ciento de los intervalos que pueden construirse de esta manera
incluirán el parámetro verdadero.

Algunas precaucionesUno debe ser consciente de los problemas que implica realizar múltiples
pruebas de hipótesis y construir múltiples intervalos de confianza a partir de los mismos datos de
muestra. El efecto sobreade realizar múltiples pruebas de hipótesis a partir de los mismos datos se
analiza en la Sección 8.2. Un problema similar surge cuando se desea construir intervalos de confianza
para dos o más coeficientes de regresión parcial. Los intervalos no serán independientes, por lo que,
en general, no se aplica el coeficiente de confianza tabulado. En otras palabras, todos esos intervalos
no serían 100d1 -aÞintervalos de confianza porcentuales.
Para mantener aproximadamente 100d1 -aÞintervalos de confianza para los coeficientes
de regresión parcial, se deben realizar ajustes en el cálculo de errores en las ecuaciones
anteriores. Estos ajustes a veces se denominantasas de error por familia,y se puede encontrar
en muchos paquetes de software de computadora. El tema es discutido en detalle por Kutner,
et al. (4).
10.5 USO DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE 507

Otro problema que se encuentra a veces en la aplicación de la regresión múltiple es una


aparente incompatibilidad en los resultados de las diversas pruebas de significación que se
pueden realizar. En un problema dado para un nivel de significación dado, se puede observar
una u otra de las siguientes situaciones.

1.R2y todo b̂isignificativo


2.R2y algunos pero no todos b̂isignificativo
3.R2significativo pero ninguno de los b̂isignificativo
4.Todo Bisignificativo pero noR2
5.Un poco de b̂isignificativo, pero no todos niR2
6.NiR2ni ninguna b̂isignificativo
Note que la situación 1 existe en nuestro ejemplo ilustrativo, donde tenemos un significativo R2
y dos coeficientes de regresión significativos. Esta situación no se da en todos los casos. De hecho, la
situación 2 es muy común, especialmente cuando se ha incluido una gran cantidad de variables
independientes en la ecuación de regresión.

EJERCICIOS

10.4.1 Consulte el Ejercicio 10.3.1. (a) Calcular el coeficiente de determinación múltiple; (b) realizar un análisis de varianza; (c)
pruebe la significación de cada b̂idyo >0Þ.Dejara¼ :05 para todas las pruebas de significación y determinar elpagvalor
para todas las pruebas; (d) construya un intervalo de confianza del 95 por ciento para cada pendiente muestral
significativa.

10.4.2 Consulte el Ejercicio 10.3.2. Realice el análisis sugerido en el Ejercicio 10.4.1.

10.4.3 Consulte el Ejercicio 10.3.3. Realice el análisis sugerido en el Ejercicio 10.4.1.

10.4.4 Consulte el Ejercicio 10.3.4. Realice el análisis sugerido en el Ejercicio 10.4.1.

10.4.5 Consulte el Ejercicio 10.3.5. Realice el análisis sugerido en el Ejercicio 10.4.1.

10.4.6 Consulte el Ejercicio 10.3.6. Realice el análisis sugerido en el Ejercicio 10.4.1.

10.5 USO DE LA ECUACIÓN DE


REGRESIÓN MÚLTIPLE

Como aprendimos en el capítulo anterior, se puede usar una ecuación de regresión para obtener un
valor calculado deY, ŷ,cuando un valor particular deXes dado. De manera similar, podemos usar
nuestra ecuación de regresión múltiple para obtener un valor de ŷ cuando se nos dan valores
particulares de dos o másXvariables presentes en la ecuación.
Tal como sucedió en la regresión lineal simple, podemos, en la regresión múltiple, interpretar un valor
de ŷ de una de dos maneras. Primero podemos interpretar ŷ como una estimación de la media de la
subpoblación deYvalores que se supone que existen para combinaciones particulares deXi
valores. Bajo esta interpretación, ŷ se llamaestimar,y cuando se usa para este propósito, la
ecuación se considera como unestimación de la ecuación.La segunda interpretación de ŷ es que
es el valorYes más probable que asuma para valores dados de laXi. En este caso ŷ
508 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

se llama elvalor predichodeY,y la ecuacion se llamaecuación de predicción.En ambos casos, los


intervalos se pueden construir alrededor del valor de ŷ cuando se cumple el supuesto de normalidad
de la Sección 10.2. Cuando ŷ se interpreta como una estimación de la media de una población, el
intervalo se denominaintervalo de confianza,y cuando ŷ se interpreta como un valor predicho de
Y,el intervalo se llamaintervalo de predicción.Ahora veamos cómo se construye cada uno de estos
intervalos.

El intervalo de confianza para la media de una subpoblación de YValores


dados Valores particulares de laXi Hemos visto que un
100d1 -aÞEl intervalo de confianza porcentual para un parámetro puede construirse mediante
el procedimiento general de sumar y restar del estimador una cantidad igual al factor de
confiabilidad correspondiente a 1 -amultiplicado por el error estándar del estimador. También
hemos visto que en la regresión múltiple el estimador es

ŷj¼ b̂0þ b̂1X1jþ b̂2X2jþ - - - þ b̂kXkj (10.5.1)

Si designamos el error estándar de este estimador porsŷ, los 100d1 -aÞintervalo de confianza
porcentual para la media deY,dado especificadoXies como sigue:

ŷj td1-un =2Þ;nk-1sŷj (10.5.2)

El intervalo de predicción para un valor particular deYDado


Valores Particulares de laXi Cuando interpretamos ŷ como el valorYes más probable asumir
cuando los valores particulares de laXise observan, podemos construir un intervalo de
predicción de la misma manera en que se construyó el intervalo de confianza. La única
diferencia entre los dos es el error estándar. El error estándar de la predicción es ligeramente
mayor que el error estándar de la estimación, lo que hace que el intervalo de predicción sea
más amplio que el intervalo de confianza.
Si designamos el error estándar de la predicción pors0 ŷ;los 100d1 -aÞpor ciento
el intervalo de predicción es

ŷj td1-un =2Þ;nk-1s0 ŷj (10.5.3)

los calculos desŷys0 j ŷen


j
el caso de regresión múltiple son complicados y no
ser abordado en este texto. El lector que desee ver cómo se calculan estas estadísticas puede
consultar el libro de Anderson y Bancroft (3), otras referencias enumeradas al final de este
capítulo y el Capítulo 9, y ediciones anteriores de este texto. El siguiente ejemplo ilustra cómo
se puede usar MINITAB para obtener intervalos de confianza para la media deYe intervalos de
predicción para un valor particular dey

EJEMPLO 10.5.1
Nos referimos al ejemplo 10.3.1. Primero, deseamos construir un intervalo de confianza del 95 por ciento
para la puntuación CDA media (Y)en una población de sujetos de 68 años (X1) que completó 12 años de
educación (X2). En segundo lugar, supongamos que tenemos un sujeto que tiene 68 años de edad.
EJERCICIOS 509

y tiene un nivel de educación de 12 años. ¿Cuál predecimos que será la puntuación CDA de este
sujeto?

Solución:La estimación puntual de la puntuación CDA media es

ŷ¼5:494 - :18412d68Þ þ :6108d12Þ ¼ :3034

La predicción puntual, que es la misma que la estimación puntual obtenida


anteriormente, también es

ŷ¼5:494 - :18412d68Þ þ :6108d12Þ ¼ :3034

Para obtener el intervalo de confianza y el intervalo de predicción para los parámetros para
los que acabamos de calcular una estimación puntual y una predicción puntual, usamos MINITAB de
la siguiente manera. Después de ingresar la información para un análisis de regresión de nuestros
datos como se muestra en la Figura 10.3.2, hacemos clic en Opciones en el cuadro de diálogo. En el
cuadro denominado "Intervalos de predicción para nuevas observaciones", escribimos 68 y 12 y
hacemos clic en Aceptar dos veces. Además del análisis de regresión, obtenemos el siguiente
resultado:

Nueva observación Ajuste SE Ajuste 95,0% IC 95,0% IP


1 0,303 0,672 (-1.038, 1.644) (-6.093, 6.699)

Interpretamos estos intervalos de la forma habitual. Veamos primero el


intervalo de confianza. Estamos 95 por ciento seguros de que el intervalo de -1:038 a
1.644 incluye la media de la subpoblación deYvalores para la combinación especificada
deXivalores, ya que este parámetro estaría incluido en aproximadamente el 95 por
ciento de los intervalos que se pueden construir de la manera que se muestra.
Ahora considere el sujeto que tiene 68 años y 12 años de educación.
Estamos 95 por ciento seguros de que este sujeto tendría una puntuación
CDA entre -6:093 y 6,699. El hecho de que el PI sea más ancho que el CI no
debería sorprender. Después de todo, es más fácil estimar la respuesta
media que estimar una observación individual. &

EJERCICIOS

Para cada uno de los siguientes ejercicios calcule layvalor y construya (a) 95 por ciento de confianza y
(b) 95 por ciento de intervalos de predicción para los valores especificados deXi.

10.5.1 Consulte el ejercicio 10.3.1 y seaX1j¼95 yX2j¼35:


10.5.2 Consulte el ejercicio 10.3.2 y seaX1j¼50;X2j¼20, yX3j¼22:
10.5.3 Consulte el ejercicio 10.3.3 y seaX1j¼5 yX2j¼6:
10.5.4 Consulte el ejercicio 10.3.4 y seaX1j¼1 yX2j¼2:
510 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

10.5.5Consulte el ejercicio 10.3.5 y seaX1j¼90 yX2j¼80:


10.5.6Consulte el ejercicio 10.3.6 y seaX1j¼50;X2j¼95:0;X3j¼2:00;X4j¼6:00;X5j¼75, y X6j¼70:

10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE

Señalamos en el capítulo anterior que mientras que el análisis de regresión se ocupa de la


forma de la relación entre las variables, el objetivo del análisis de correlación es
comprender la fuerza de la relación. Esto también es cierto en el caso multivariable, y en
esta sección investigamos métodos para medir la fuerza de la relación entre varias
variables. Primero, sin embargo, definamos el modelo y los supuestos sobre los que
descansa nuestro análisis.

La ecuación del modeloPodemos escribir el modelo de correlación como

yj¼b0þb1X1jþb2X2jþ - - - þbkXkjþmij (10.6.1)

dóndeyjes un valor típico de la población de valores de la variableY,elb's son los coeficientes de


regresión definidos en la Sección 10.2, y losXyoson valores particulares (conocidos) de las
variables aleatoriasXi. Este modelo es similar al modelo de regresión múltiple, pero hay una
distinción importante. En el modelo de regresión múltiple, dado en la Ecuación 10.2.1, elXi
son variables no aleatorias, pero en el modelo de correlación múltiple laXison variables aleatorias. En
otras palabras, en el modelo de correlación hay una distribución conjunta deYy elXique llamamos un
distribución multivariada.Bajo este modelo, las variables ya no se consideran dependientes o
independientes, ya que lógicamente son intercambiables y cualquiera de las dos Xipuede jugar el
papel dey
Por lo general, las muestras aleatorias de unidades de asociación se extraen de una
población de interés y las mediciones deYy elXison hechos.
Se ajusta un plano de mínimos cuadrados o hiperplano a los datos de la muestra
mediante los métodos descritos en la Sección 10.3, y se pueden hacer los mismos usos de la
ecuación resultante. Se pueden hacer inferencias sobre la población de la que se extrajo la
muestra si se puede suponer que la distribución subyacente es normal, es decir, si se puede
suponer que la distribución conjunta deYyXies undistribución normal multivariada.Además, se
pueden calcular medidas muestrales del grado de relación entre las variables y, bajo el
supuesto de que el muestreo es de una distribución normal multivariada, se pueden estimar los
parámetros correspondientes por medio de intervalos de confianza y se pueden realizar
pruebas de hipótesis. . Específicamente, podemos calcular una estimación de lacoeficiente de
correlación múltipleque mide la dependencia entreYy elXi. Esta es una extensión directa del
concepto de correlación entre dos variables que analizamos en el Capítulo 9. También podemos
calcularcoeficientes de correlación parcialque miden la intensidad de la relación entre dos
variables cualesquiera cuando se ha eliminado la influencia de todas las demás variables.

El coeficiente de correlación múltipleComo primer paso en el análisis de la


relaciones entre las variables, nos fijamos en el coeficiente de correlación múltiple.
10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE 511

El coeficiente de correlación múltiple es la raíz cuadrada del coeficiente de determinación


múltiple y, en consecuencia, el valor de la muestra puede calcularse tomando la raíz cuadrada
de la Ecuación 10.4.2. Eso es,
arriba-
-2
tu
rffiffiffiffiffiffiffiffiffi
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ŷj- -y RSS
Ry:12...k¼R2 y:12...k¼t PAG- - ¼ (10.6.2)
yj- -y2 acero inoxidable

Para ilustrar los conceptos y técnicas del análisis de correlación múltiple,


consideremos un ejemplo.

EJEMPLO 10.6.1
Wang et al. (A-4), utilizando fémures humanos cadavéricos de sujetos de 16 a 19 años, investigó las
propiedades de dureza del hueso y las medidas de la red de colágeno dentro del hueso. Dos variables
que miden la red de colágeno son la porosidad (PAG,expresado como porcentaje) y una medida de la
resistencia a la tracción de la red de colágeno (S).La medida de la dureza. (W,Newtons), es la fuerza
requerida para la fractura del hueso. Los 29 fémures cadavéricos utilizados en el estudio estaban
libres de patologías relacionadas con los huesos. Deseamos analizar la naturaleza y la fuerza de la
relación entre las tres variables. Las medidas se muestran en la siguiente tabla.

TABLA 10.6.1 Propiedades de la red de


colágeno y dureza ósea para 29 fémures

W PAG S

193.6 6.24 30.1


137.5 8.03 22.2
145.4 11.62 25.7
117.0 7.68 28,9
105.4 10.72 27.3
99.9 9.28 33.4
74.0 6.23 26.4
74.4 8.67 17.2
112.8 6.91 15.9
125.4 7.51 12.2
126.5 10.01 30.0
115.9 8.70 24.0
98.8 5.87 22.6
94.3 7.96 18.2
99.9 12.27 11.5
83.3 7.33 23,9
72.8 11.17 11.2
83.5 6.03 15.6
59.0 7.90 10.6
(Continuación)
512 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

W PAG S

87.2 8.27 24.7


84.4 11.05 25.6
78.1 7.61 18.4
51,9 6.21 13.5
57.1 7.24 12.2
54.7 8.11 14.8
78.6 10.05 8.9
53.7 8.79 14.9
96,0 10.40 10.3 Fuente: Datos proporcionados por cortesía
89.0 11.72 15.4 de Xiaodu Wang, Ph.D.

Solución: Usamos MINITAB para realizar el análisis de nuestros datos. Los lectores interesados en la
derivación de las fórmulas subyacentes y los procedimientos aritméticos involucrados
pueden consultar los textos enumerados al final de este capítulo y el Capítulo 9, así como las
ediciones anteriores de este texto. Si se desea una ecuación de predicción de mínimos
cuadrados y un coeficiente de correlación múltiple como parte del análisis, podemos
obtenerlos usando el procedimiento de regresión múltiple MINITAB descrito anteriormente.
Cuando hacemos esto con los valores de muestra deY, X1, y X2, almacenado en las Columnas
1 a 3, respectivamente, obtenemos el resultado que se muestra en la Figura 10.6.1.

La ecuación de mínimos cuadrados, entonces, es

ŷj¼35:61þ1:451X1jþ2:3960X2j

La ecuación de regresión es Y = 35,6 +


1,45 X1 + 2,40 X2

Vaticinador coef SE Coef T PAG


Constante 35.61 29.13 1.22 0.232
X1 1.451 2.763 0.53 0.604
X2 2.3960 0.7301 3.28 0.003

S = 27,42 R-Sq = 29,4% R-Cuadrado(ajustado) = 24,0%

Análisis de Diferencia

Fuente DF SS EM F PAG
Regresión 2 8151.1 4075.6 5.42 0.011
error residual 26 19553.5 752.1
Total 28 27704.6

FIGURA 10.6.1Resultado del procedimiento de regresión múltiple de MINITAB para los datos de la
tabla 10.6.1.
10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE 513

Esta ecuación se puede usar con fines de estimación y predicción y se puede


evaluar mediante los métodos discutidos en la Sección 10.4.
Como vemos en la figura 10.6.1, el resultado de la regresión múltiple también
nos da el coeficiente de determinación múltiple, que, en nuestro ejemplo actual, es

Ry2:12¼ :294
El coeficiente de correlación múltiple, por lo tanto, es
pffiffiffiffiffiffiffiffiffiffi
Ry:12¼ :294¼ :542

Interpretación deRy:12
nosotros interpretamosRy:12como una medida de la correlación entre las variables fuerza requerida
para la fractura, porosidad y resistencia de la red de colágeno en la muestra de 29 huesos de fémur
de sujetos de 16 a 19 años. Si nuestros datos constituyen una muestra aleatoria de la población de
tales personas, podemos usarRy:12como una estimación dery:12, el verdadero coeficiente de correlación
múltiple de la población. También podemos interpretarRy:12como el coeficiente de correlación simple
entreyjy ŷ, los valores observados y calculados, respectivamente, de la variable “dependiente”.
Correspondencia perfecta entre los valores observados y calculados deYdará como resultado un
coeficiente de correlación de 1, mientras que la falta total de una relación lineal entre los valores
observados y calculados produce un coeficiente de correlación de 0. El coeficiente de correlación
múltiple siempre recibe un signo positivo.
Podemos probar la hipótesis nula de query:12...k¼0 por computación

Ry:12...k
2 n-k-1
F¼ - (10.6.3)
1 -R2 y:12...k k

El valor numérico obtenido de la Ecuación 10.6.3 se compara con el valor tabulado de


Fconkyn-k-1 grados de libertad. El lector recordará que esto es idéntico a la prueba
deH0:b1¼b2¼ - - - ¼bk¼0 descrito en la Sección 10.4.
Para nuestro ejemplo presente, probemos la hipótesis nula de query:12¼0 contra la
alternativa query:126¼0. Calculamos

:294 29 - 2 - 1
F¼ - ¼5:41
1 - :294 2
Como 5.41 es mayor que 4.27,pag < :025, por lo que podemos rechazar la hipótesis nula en el . 025 de
significación y concluye que la fuerza requerida para la fractura está correlacionada con la porosidad y
la medida de la fuerza de la red de colágeno en la población muestreada.
El valor calculado deFpara las pruebasH0que el coeficiente de correlación múltiple de
población es igual a cero se da en la tabla de análisis de varianza en la figura 10.6.1 y es 5.42.
Los dos valores calculados deFdifieren como resultado de diferencias en el redondeo en los
cálculos intermedios. &

Correlación parcialEl investigador puede desear tener una medida de la fuerza de


la relación lineal entre dos variables cuando se ha eliminado el efecto de las variables
restantes. Tal medida está prevista por lacorrelación parcialcoeficiente.
514 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

Por ejemplo, el coeficiente de correlación de muestra parcialry:12es una medida de la


correlación entreYyX1después de controlar el efecto deX2.
Los coeficientes de correlación parcial se pueden calcular a partir de lacoeficientes de
correlación simples.Los coeficientes de correlación simple miden la correlación entre dos variables
cuando no se ha hecho ningún esfuerzo por controlar otras variables. En otras palabras, son los
coeficientes de cualquier par de variables que se obtendrían mediante los métodos de correlación
simple discutidos en el Capítulo 9.
Supongamos que tenemos tres variables,Y, X1, yX2. El coeficiente de correlación parcial de
la muestra que mide la correlación entreYyX1después de controlar porX2, por ejemplo, se
escribery1:2. En el subíndice, el símbolo a la derecha del punto decimal indica la variable cuyo
efecto se está controlando, mientras que los dos símbolos a la izquierda del punto decimal
indican qué variables se están correlacionando. Para el caso de tres variables, hay otros dos
coeficientes de correlación parcial de muestra que podemos calcular. Ellos son
ry2:1yr12:y.

El coeficiente de determinación parcialEl cuadrado del parcial


coeficiente de correlación se denomina coeficiente de determinación parcial. Proporciona
información útil sobre las interrelaciones entre las variables. Considerarry1:2, Por ejemplo. Es
cuadrado,r2y1:2nos dice qué proporción de la variabilidad restante enYse explica porX1
despuésX2ha explicado la mayor parte de la variabilidad total enYcomo puede

Cálculo de los coeficientes de correlación parcialPara tres variables


pueden calcularse los siguientes coeficientes de correlación simples:

ry1, la correlación simple entreYyX1


ry2, la correlación simple entreYyX2
r12, la correlación simple entreX1yX2
El procedimiento de correlación de MINITAB se puede utilizar para calcular estos coeficientes
de correlación simples, como se muestra en la figura 10.6.2. Como se señaló anteriormente, las
observaciones de muestra se almacenan en las Columnas 1 a 3. Del resultado de la Figura 10.6.2
vemos que r12¼ -:08;ry1¼ :043, yry2¼ :535.
Los coeficientes de correlación parcial de la muestra que se pueden calcular a partir de los
coeficientes de correlación simples en el caso de tres variables son:

1.La correlación parcial entreYyX1después de controlar el efecto deX2:


- - qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

ry1:2¼ry1-ry2r12=d1-r2 y2 Þð1-r212Þ (10.6.4)

2.La correlación parcial entreYyX2después de controlar el efecto deX1:


- - qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

ry2:1¼ry2-ry1r12=d1-r2 y1 Þð1-r212Þ (10.6.5)

3.La correlación parcial entreX1yX2después de controlar el efecto deY:


- - qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

r12:y¼r12-ry1ry2=d1-r2 y1 Þð1-r2y2Þ (10.6.6)


10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE 515

Caja de diálogo: Comando de sesión:

Estadística Estadísticas básicas Correlación BTT> CORRELACIÓN C1-C3

TipoC1-C3enVariables.Hacer clicDE ACUERDO.

Producción:

Y X1
X1 0.043
0.823

X2 0.535 - 0.080
0.003 0.679

Contenido de la celda: correlación de Pearson


Valor P

FIGURA 10.6.2Procedimiento de MINITAB para calcular los coeficientes de correlación simple para los datos
de la tabla 10.6.1.

EJEMPLO 10.6.2
Para ilustrar el cálculo de los coeficientes de correlación parcial de la muestra, consulte el
ejemplo 10.6.1 y calcule los coeficientes de correlación parcial entre las variables fuerza de
fractura (Y ),porosidad (X1), y la fuerza de la red de colágeno (X2).

Solución: En lugar de calcular los coeficientes de correlación parcial a partir de los coeficientes
de correlación simple mediante las Ecuaciones 10.6.4 a 10.6.6, usamos MINITAB para
obtenerlos.
El procedimiento de MINITAB para calcular los coeficientes de correlación
parcial se basa en el hecho de que un coeficiente de correlación parcial dado es
en sí mismo la correlación simple entre dos conjuntos de residuos. Un conjunto
de residuos se obtiene de la siguiente manera. Supongamos que tenemos
medidas en dos variables,X (independiente) yY (dependiente). Obtenemos la
ecuación de predicción de mínimos cuadrados, ŷ¼ b̂0þ b̂X. Para cada valor deX
calculamos un residuo, que es igual adyi- ŷiÞ,la diferencia entre el valor
observado deYy el valor predicho deYasociado con elX.
Ahora, supongamos que tenemos tres variables,X1;X2, yyQueremos calcular
el coeficiente de correlación parcial entreX1yYmientras lo esté agarrando X2
constante. retrocedemosX1enX2y calcular los residuos, que podemos llamar
conjunto residualA.retrocedemosYenX2y calcular los residuos, que podemos
llamar conjunto residualB.El coeficiente de correlación simple que mide la fuerza
de la relación entre el conjunto residualAy conjunto residualBes el coeficiente de
correlación parcial entreX1yYdespués de controlar el efecto deX2.
516 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

Cuando usamos MINITAB, almacenamos cada conjunto de residuos en una


columna diferente para uso futuro en el cálculo de los coeficientes de correlación
simple entre ellos.
Usamos comandos de sesión en lugar de un cuadro de diálogo para
calcular los coeficientes de correlación parcial cuando usamos MINITAB. Con las
observaciones deX1;X2, yYalmacenados en las Columnas 1 a 3, respectivamente,
el procedimiento para los datos de la Tabla 10.6.1 se muestra en la Figura 10.6.3.
La salida muestra query1:2¼ :102;r12:y¼ -:122, yry2:1¼ :541.
Las correlaciones parciales se pueden calcular directamente usando el software
SPSS como se ve en la Figura 10.6.5. Este software muestra, en una tabla sucinta, tanto
el coeficiente de correlación parcial como elpagvalor asociado con cada correlación
parcial. &

Prueba de hipótesis sobre los coeficientes de correlación parcialNosotros


puede probar la hipótesis nula de que cualquiera de los coeficientes de correlación parcial de la
población es 0 por medio de latprueba. Por ejemplo, para probarH0:ry1:2...k¼0, calculamos
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

n-k-1
t¼ry1:2...k 1 -r2 (10.6.7)
y1:2...k

que se distribuye como Student'stconn-k-1 grados de libertad.


Ilustremos el procedimiento para nuestro ejemplo actual probandoH0:ry1:2¼0
contra la alternativa,HA:ry1:26¼0. El calculadotes

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

29 - 2 - 1
t¼ :102 ¼ :523
1 -d:102Þ2

Dado que el calculadotde .523 es más pequeño que el tabuladotde 2,0555 para 26 grados de libertad
ya¼ :05 (prueba de dos caras), no podemos rechazarH0con un nivel de significancia de 0,05 y concluir
que puede no haber correlación entre la fuerza requerida para la fractura y la porosidad después de
controlar el efecto de la fuerza de la red de colágeno. Las pruebas de significación para los otros dos
coeficientes de correlación parcial se dejarán como ejercicio para el lector. Tenga en cuenta quepag
MINITAB calcula los valores para estas pruebas, como se muestra en la Figura 10.6.3.
El paquete de software estadístico SPSS para PC proporciona un procedimiento conveniente
para obtener coeficientes de correlación parcial. Para usar esta función, elija "Analizar" en la barra de
menú, luego "Correlacionar" y, finalmente, "Parcial". Siguiendo esta secuencia de opciones, aparece
en la pantalla el cuadro de diálogo Correlaciones parciales. En el cuadro denominado "Variables:",
ingrese los nombres de las variables para las que se desean correlaciones parciales. En el cuadro
etiquetado como "Controlando por:" ingrese los nombres de la(s) variable(s) que desea controlar.
Seleccione un nivel de significancia de dos colas o de una cola. A menos que se anule la selección de la
opción, se mostrarán los niveles de significación reales. Para el ejemplo 10.6.2, la figura 10.6.4
muestra los coeficientes de correlación parcial calculados por SPSS entre las otras dos variables al
controlar, sucesivamente, porX1(porosidad),X2(fortaleza de la red de colágeno), yY (fuerza requerida
para la fractura).
10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE 517

MTB > regresión C1 1 C2;


SUBC> residuos C4.

MTB > retroceso C3 1 C2; SUBC>


residuos C5.

MTB > regresión C1 1 C3;


SUBC> residuos C6.

MTB > retroceso C2 1 C3; SUBC>


residuos C7.

MTB > regresión C2 1 C1;


SUBC> residuos C8.

MTB > retroceso C3 1 C1; SUBC>


residuos C9.

MTB > corr C4 C5

Correlaciones: C4, C5

Correlación de Pearson de C4 y C5 = 0,102 Valor P = 0,597

MTB > corr C6 C7

Correlaciones: C6, C7

Correlación de Pearson de C6 y C7 = -0,122 Valor P = 0,527

MTB > corr C8 C9

Correlaciones: C8, C9

Correlación de Pearson de C8 y C9 = 0,541 Valor P = 0,002

FIGURA 10.6.3Procedimiento de MINITAB para calcular coeficientes de correlación parcial a partir de los
datos de la tabla 10.6.1.
518 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

Controlando por: X1

X2 Y

X2 1.0000 . 5412
( 0) ( 26)
P= . P= . 003

Y . 5412 1.0000
( 26) ( 0)
P= . 003 P= .

Controlando por: X2

Y X1

Y 1.0000 . 1024
( 0) (26)
P= . P= . 604

X1 . 1024 1.0000
( 26) ( 0)
P= . 604 P= .

Controlando por: Y

X1 X2

X1 1.0000 - . 1225
( 0) ( 26)
P= . P= . 535

X2 - . 1225 1.0000
( 26) ( 0)
P= . 535 P= .

(Coeficiente / (DF) / Significado de 2 colas) “.” se imprime si no se


puede calcular un coeficiente

FIGURA 10.6.4Coeficientes parciales obtenidos con SPSS para Windows, Ejemplo 10.6.2.
10.6 EL MODELO DE CORRELACIÓN MÚLTIPLE 519

Correlaciones

Forzar
Variables de control Fractura (Y) Porosidad (X1)

Resistencia a la tracción (X2) Fuerza a la fractura (Y) Correlación 1.000 . 102


Significado (2 colas) gl . . 604
0 26

Porosidad (X1) Correlación . 102 1.000


Significado (2 colas) gl . 604 .
26 0
(a)

Correlaciones

Porosidad De tensión
Variables de control (X1) Fuerza (X2)

Fuerza de fractura (Y) Porosidad (X1) Correlación 1.000 . 122


Significado (2 colas) gl . . 535
0 26

Resistencia a la tracción (X2) Correlación . 122 1.000


Significado (2 colas) gl . 535 .
26 0

(b)

Correlaciones

De tensión Forzar
Variables de control Fuerza (X2) Fractura (Y)

Porosidad (X1) Resistencia a la tracción (X2) Correlación 1.000 . 541


Significado (2 colas) gl . . 003
0 26

Fuerza de fractura (Y) Correlación . 541 1.000


Significado (2 colas) gl . 003 .
26 0

(C)

FIGURA 10.6.5Coeficientes de correlación parcial para los datos del ejemplo 10.6.1. (a) ry1.2, (b) r12y, y (c)
ry2.1.

Aunque nuestra ilustración del análisis de correlación se limita al caso de tres variables,
los conceptos y técnicas se extienden lógicamente al caso de cuatro o más variables. El número
y la complejidad de los cálculos aumentan rápidamente a medida que aumenta el número de
variables.
520 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

EJERCICIOS

10.6.1 El objetivo de un estudio de Anton et al. (A-5) fue investigar la estructura de correlación de múltiples medidas
de la carga del VIH en muestras de sangre y tejido. Midieron la carga del VIH de cuatro maneras. Dos
mediciones se derivaron de muestras de sangre y dos mediciones se realizaron en tejido rectal. Las dos
medidas de sangre se basaron en ensayos de ADN del VIH y un segundo ensayo de cocultivo que fue una
modificación de la primera medida. Las mediciones tercera y cuarta fueron cuantificaciones de ADN y ARN de
VIH-1 de tejido de biopsia rectal. La siguiente tabla proporciona datos sobre los niveles de VIH de estas
mediciones para 34 sujetos.

ADN del VIH Co-cultura del VIH ADN del VIH Rectal ARN del VIH Rectal
Sangre (Y) Sangre (X1) Tejido (X2) Tejido (X3)

115 . 38 899 56
86 1.65 167 158
19 . dieciséis 73 152
6 . 08 146 35
23 . 02 82 60
147 1.98 2483 1993
27 . 15 404 30
140 . 25 2438 72
345 . 55 780 12
92 . 22 517 5
85 . 09 346 5
24 . 17 82 12
109 . 41 1285 5
5 . 02 380 5
95 . 84 628 32
46 . 02 451 5
25 . 64 159 5
187 . 20 1335 121
5 . 04 30 5
47 . 02 13 30
118 . 24 5 5
112 . 72 625 83
79 . 45 719 70
52 . 23 309 167
52 . 06 27 29
7 . 37 199 5
13 . 13 510 42
80 . 24 271 15
86 . 96 273 45
26 . 29 534 71
53 . 25 473 264
185 . 28 2932 108
30 . 19 658 33
9 . 03 103 5
76 . 21 2339 5

(Continuación)
EJERCICIOS 521

ADN del VIH Co-cultura del VIH ADN del VIH Rectal ARN del VIH Rectal
Sangre (Y) Sangre (X1) Tejido (X2) Tejido (X3)

51 . 09 31 36
73 . 06 158 5
47 . 08 773 5
48 . 12 545 67
dieciséis . 03 5 5
Fuente: Datos proporcionados por cortesía de Peter A. Anton, MD

(a)Calcule los coeficientes de correlación simple entre todos los posibles pares de variables.
(b)Calcule el coeficiente de correlación múltiple entre las cuatro variables. Pruebe la correlación
general para la significación.
(C)Calcule las correlaciones parciales entre el ADN del VIH en sangre y cada una de las otras variables
mientras controla las otras dos. (Estos se denominan coeficientes de correlación parcial de segundo
orden).
(d)Calcule la correlación parcial entre la sangre del cocultivo del VIH y el ADN del VIH, controlando las otras
dos variables.
(mi)Calcule la correlación parcial entre la sangre del cocultivo del VIH y el ARN del VIH, controlando las otras
dos variables.
(F)Calcule las correlaciones parciales entre el ADN del VIH y el ARN del VIH, controlando las otras dos
variables.

10.6.2 Los siguientes datos se obtuvieron en 12 varones entre las edades de 12 y 18 años (todas las medidas están
en centímetros):

Altura Longitud del radio La longitud del fémur

(Y) (X1) (X2)

149.0 21.00 42.50


152.0 21.79 43.70
155.7 22.40 44.75
159.0 23.00 46.00
163.3 23.70 47.00
166.0 24.30 47.90
169.0 24.92 48.95
172.0 25.50 49.90
174.5 25.80 50.30
176.1 26.01 50,90
176.5 26.15 50.85
179.0 26.30 51.10

Total 1992.1 290.87 573.85

(a)Encuentre el coeficiente de correlación múltiple muestral y pruebe la hipótesis nula de query:12¼0.


(b)Encuentre cada uno de los coeficientes de correlación parcial y pruebe cada uno para determinar su significación. Dejara¼ :05 para todas las pruebas.

(C)Determina elpagvalor de cada prueba.


(d)Exprese sus conclusiones.
522 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

10.6.3Se recopilaron los siguientes datos en 15 niñas obesas:

En peso cuerpo magro Media diaria


kilogramos Peso Ingesta calórica
(Y) (X1) (X2)

79.2 54.3 2670


64.0 44.3 820
67.0 47.8 1210
78.4 53,9 2678
66,0 47.5 1205
63.0 43.0 815
65,9 47.1 1200
63.1 44.0 1180
73.2 44.1 1850
66.5 48.3 1260
61,9 43.5 1170
72.5 43.3 1852
101.1 66.4 1790
66.2 47.5 1250
99.9 66.1 1789

Total 1087.9 741.1 22739

(a)Encuentre el coeficiente de correlación múltiple y pruébelo para determinar si es significativo.

(b)Encuentre cada uno de los coeficientes de correlación parcial y pruebe cada uno para determinar su significación. Dejara¼ :05 para todas las pruebas.

(C)Determina elpagvalor de cada prueba.


(d)Exprese sus conclusiones.

10.6.4 Se llevó a cabo un proyecto de investigación para estudiar las relaciones entre inteligencia, afasia y apraxia. Los
sujetos eran pacientes con daño focal en el hemisferio izquierdo. Las puntuaciones en las siguientes variables se
obtuvieron mediante la aplicación de pruebas estándar.

Y¼inteligencia
X1¼apraxia ideomotora X2¼
apraxia constructiva X3¼
volumen de la lesióndpíxelesÞ
X4¼severidad de la afasia
Los resultados se muestran en la siguiente tabla. Encuentre el coeficiente de correlación múltiple y pruebe la
significancia. Dejara¼ :05 y encuentra elpagvalor.

Sujeto Y X1 X2 X3 X4

1 66 7.6 7.4 2296.87 2


2 78 13.2 11.9 2975.82 8
3 79 13.0 12.4 2839.38 11
4 84 14.2 13.3 3136.58 15
(Continuación)
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 10 523

Sujeto Y X1 X2 X3 X4
5 77 11.4 11.2 2470.50 5
6 82 14.4 13.1 3136.58 9
7 82 13.3 12.8 2799.55 8
8 75 12.4 11.9 2565.50 6
9 81 10.7 11.5 2429.49 11
10 71 7.6 7.8 2369.37 6
11 77 11.2 10.8 2644.62 7
12 74 9.7 9.7 2647.45 9
13 77 10.2 10.0 2672.92 7
14 74 10.1 9.7 2640.25 8
15 68 6.1 7.2 1926.60 5

10.7 RESUMEN

En este capítulo examinamos cómo los conceptos y técnicas de regresión lineal simple y
análisis de correlación se extienden al caso de múltiples variables. Se presenta e ilustra el
método de mínimos cuadrados para obtener la ecuación de regresión. Este capítulo
también se ocupa del cálculo de medidas descriptivas, pruebas de significancia y los usos
que se harán de la ecuación de regresión múltiple. Además, se discuten los métodos y
conceptos del análisis de correlación, incluida la correlación parcial.
Cuando no se cumplen los supuestos subyacentes a los métodos de regresión y
correlación presentados en este capítulo y en el anterior, el investigador debe recurrir a
técnicas alternativas como las discutidas en el Capítulo 13.

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 10

Fórmula
Número Nombre Fórmula

10.2.1 Representacion de yj¼b0þb1X1jþb2X2jþ - - - þbkXkjþmij


el multiple
regresión lineal
ecuación

10.2.2 Representación yj¼b0þb1X1jþb2X2jþmij


de los multiples
regresión lineal
ecuación con
dos independientes
Variables

(Continuación)
524 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

10.2.3 Desviación aleatoria mij¼yj-b0-b1X1j-b2X2j


de un punto desde un
plano cuando hay
son dos
independiente
Variables
PAG PAG- -2
10.3.1 suma de cuadrados mi
j¼2 yj- ŷj
derechos residuales de autor

PAG- -2 -
PAG -2 -
PAG -
10.4.1 Suma de cuadrados yj- -y ¼ ŷj- -y þ yj- ŷ2 j
ecuación
acero inoxidable¼RSSþSSE
PAG- -
10.4.2 Coeficiente de ŷj- -y2 RSS
múltiple Ry:12...k
2 ¼PAG- - ¼
yj- -y2 acero inoxidable
determinación

10.4.3 testadística para b 0


probando hipótesis t¼i-bi
sbi
acerca debi

10.5.1 Estimacion ŷj¼ b̂0þ b̂1X1jþ b̂2X2jþ - - - þ b̂kXkj


ecuación para
lineal múltiple
regresión

10.5.2 Intervalo de confianza ŷj td1-un =2Þ;nk-1sŷj


por la media deY
para una dadaX

0
10.5.3 Intervalo de predicción ŷj td1-un =2Þ;nk-1sŷj
paraYpara una dadaX

10.6.1 Múltiple yj¼b0þb1X1jþb2X2jþ - - - þbkXkjþmij


modelo de correlación
vffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ffiffi-ffiffiffiffi

10.6.2 Múltiple arriba-


tu
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ŷj- -y2 qffiffiffiffiffiffi

Ry:12...k RSS
correlación Ry:12...k¼ 2 ¼ tp- -2 ¼
yj- -y
acero inoxidable

coeficiente

10.6.3 Festadística para Ry:12...k


2 norte - k-1
probando el múltiplo F¼ -
1 -R2 y:12...k k
correlación
coeficiente
qffi-ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi-ffiffi-ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi-ffiffi
10.6.4–10.6.6 Correlación parcial
r12:3¼ ðr12-r13r23Þ= 1 -r2 131 -r2 23
entre dos
variables (1 y 2) después
de controlar por
un tercio (3)
PREGUNTAS DE REPASO Y EJERCICIOS 525
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
10.6.7 testadística para n-k-1
probar hipótesis sobre t¼ry1:2...k
1 -r2 y1:2...k
correlación parcial
coeficientes

Clave de símbolo bX¼regresión estimada=coeficiente de correlaciónX bX¼


regresión=coeficiente de correlación mi¼término de error
del modelo
k¼número de variables independientes norte¼
tamaño de la muestra
r12.3¼muestra el coeficiente de correlación parcial entre 1 y 2 después
de controlar por 3
R¼muestra coeficiente de correlación R2¼
coeficiente de determinacion multiple t¼t
estadística
Xi¼valor de la variable independiente eni
- X¼media muestral de la variable independiente yi
¼valor de la variable dependiente eni
- y¼media muestral de la variable
dependiente ŷ¼estimadoyz¼zestadística

PREGUNTAS DE REPASO Y EJERCICIOS

1.¿Cuáles son los supuestos que subyacen al análisis de regresión múltiple cuando se desea inferir acerca de la
población de la que se extrajeron los datos de la muestra?

2.¿Cuáles son los supuestos que subyacen al modelo de correlación cuando la inferencia es un objetivo?

3.Explique completamente los siguientes términos:

(a)Coeficiente de determinación múltiple (b)Coeficiente de correlación múltiple


(C)Coeficiente de correlación simple (d)Coeficiente de correlación parcial

4.Describa una situación en su área particular de interés donde el análisis de regresión múltiple sería útil. Utilice
datos reales o realistas y realice un análisis de regresión completo.

5.Describa una situación en su área particular de interés donde el análisis de correlación múltiple sería útil. Utilice
datos reales o realistas y realice un análisis de correlación completo.

En los ejercicios 6 al 11 realice el análisis indicado y pruebe las hipótesis en los niveles de significación
indicados. Calcular elpagvalor de cada prueba.

6.Aprendimos en el Ejemplo 9.7.1 que el propósito de un estudio de Kwast-Rabben et al. (A-6) fue analizar los potenciales evocados
somatosensoriales (SEP) y sus interrelaciones después de la estimulación de los dedos I, III y V en la mano. Se reclutaron
voluntarios sanos para el estudio. Los investigadores aplicaron estimulación en los dedos con una intensidad por debajo del
nivel del dolor. Los registros de las respuestas espinales se realizaron con electrodos fijados a la piel del sujeto mediante una
crema adhesiva para electrodos. Los resultados se muestran en la siguiente tabla para
526 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

114 temas. Utilice la regresión múltiple para ver qué tan bien puede predecir la latencia espinal máxima (Cv) del SEP
para el dígito I cuando la edad (años) y la longitud del brazo (cm) son las variables predictoras. Evalúa la utilidad de tu
ecuación de predicción.

Edad Largo del brazo Cv Dig.I Edad Largo del brazo Cv Dig.I Edad Largo del brazo Cv Dig.I

35.07 76.5 13.50 32.00 82.0 16.30 42.08 94.0 17.70


35.07 76.5 13.50 32.00 82.0 15.40 40.09 94.0 17.70
21.01 77.0 13.00 38.09 86.5 16.60 40.09 94.0 17.40
21.01 77.0 13.60 38.09 86.5 16.00 42.09 92.5 18.40
47.06 75.5 14.30 58.07 85.0 17.00 20.08 95.0 19.00
47.06 75.5 14.90 58.07 85.0 16.40 50.08 94.5 19.10
26.00 80.0 15.40 54.02 88.0 17.60 50.08 94.5 19.20
26.00 80.0 14.70 48.10 92.0 16.80 47.11 97.5 17.80
53.04 82.0 15.70 48.10 92.0 17.00 47.11 97.5 19.30
53.04 82.0 15.80 54.02 88.0 17.60 26.05 96,0 17.50
43.07 79.0 15.20 45.03 91.5 17.30 26.05 96,0 18.00
39.08 83.5 16.50 45.03 91.5 16.80 43.02 98.0 18.00
39.08 83.5 17.00 35.11 94.0 17.00 43.02 98.0 18.80
43.07 79.0 14.70 26.04 88.0 15.60 32.06 98.5 18.30
29.06 81.0 16.00 51.07 87.0 16.80 32.06 98.5 18.60
29.06 81.0 15.80 51.07 87.0 17.40 33.09 97.0 18.80
50.02 86,0 15.10 26.04 88.0 16.50 33.09 97.0 19.20
25.07 81.5 14.60 35.11 94.0 16.60 35.02 100.0 18.50
25.07 81.5 15.60 52.00 88.5 18.00 35.02 100.0 18.50
25.10 82.5 14.60 44.02 90,0 17.40 26.05 96,0 19.00
47.04 86,0 17.00 44.02 90,0 17.30 26.05 96,0 18.50
47.04 86,0 16.30 24.05 91.0 16.40 25.08 100.5 19.80
37.00 83.0 16.00 24.00 87.0 16.10 25.06 100.0 18.80
37.00 83.0 16.00 24.00 87.0 16.10 25.06 100.0 18.40
34.10 84.0 16.30 24.00 87.0 16.00 25.08 100.5 19.00
47.01 87.5 17.40 24.00 87.0 16.00 30.05 101.0 18.00
47.01 87.5 17.00 53.05 90,0 17.50 30.05 101.0 18.20
30.04 81.0 14.10 53.05 90,0 17.50 36.07 104.5 18.90
23.06 81.5 14.20 52.06 90,0 18.00 36.07 104.5 19.20
23.06 81.5 14.70 52.06 90,0 17.90 35.09 102.0 21.00
30.04 81.0 13.90 53.04 93.0 18.40 35.09 102.0 19.20
78.00 81.0 17.20 22.04 90,0 16.40 21.01 101.5 18.60
41.02 83.5 16.70 22.04 90,0 15.80 21.01 101.5 18.60
41.02 83.5 16.50 46.07 95.5 18.80 40.00 95.5 20.00
28.07 78.0 14.80 46.07 95.5 18.60 42.09 92.5 18.40
28.07 78.0 15.00 47.00 93.5 18.00 42.08 94.0 18.50
36.05 88.0 17.30 47.00 93.5 17.90 35.04 86,0 16.00
35.04 86,0 15.30 39.05 94.5 17.40 36.05 88.0 16.60

Fuente: Datos proporcionados por cortesía de Olga Kwast-Rabben, Ph.D.

7.La siguiente tabla muestra el peso y los niveles de colesterol total y triglicéridos en 15 pacientes con
hiperlipoproteinemia primaria tipo II justo antes del inicio del tratamiento:
PREGUNTAS DE REPASO Y EJERCICIOS 527

X1 X2
Colesterol total triglicéridos
YPeso (kg) (mg/100ml) (mg/100ml)

76 302 139
97 336 101
83 220 57
52 300 56
70 382 113
67 379 42
75 331 84
78 332 186
70 426 164
99 399 205
75 279 230
78 332 186
70 410 160
77 389 153
76 302 139

Calcule el coeficiente de correlación múltiple y pruebe la significación al nivel .05.

8.En un estudio de la relación entre la excreción de creatinina, la altura y el peso, se recopilaron los datos que se
muestran en la siguiente tabla en 20 niños varones:

Creatinina
Excreción
(mg/día) Peso (kg) Altura (cm)
Niño Y X1 X2

1 100 9 72
2 115 10 76
3 52 6 59
4 85 8 68
5 135 10 60
6 58 5 58
7 90 8 70
8 60 7 sesenta y cinco

9 45 4 54
10 125 11 83
11 86 7 64
12 80 7 66
13 sesenta y cinco 6 61
14 95 8 66
15 25 5 57
dieciséis 125 11 81
17 40 5 59
(Continuación)
528 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

Creatinina
Excreción
(mg/día) Peso (kg) Altura (cm)
Niño Y X1 X2
18 95 9 71
19 70 6 62
20 120 10 75

(a)Encuentre la ecuación de regresión múltiple que describe la relación entre estas variables.
(b)CalcularR2y hacer un análisis de varianza.
(C)DejarX1¼10 yX2¼60 y encuentre el valor predicho dey

9.Se realizó un estudio para examinar aquellas variables que se pensaba que estaban relacionadas con la satisfacción
laboral de los empleados hospitalarios no profesionales. Una muestra aleatoria de 15 empleados dio los siguientes
resultados:

codificado Índice de
Puntuación en el trabajo Inteligencia Personal
Satisfacción Puntaje Ajustamiento
Prueba (Y) (X1) (X2)

54 15 8
37 13 1
30 15 1
48 15 7
37 10 4
37 14 2
31 8 3
49 12 7
43 1 9
12 3 1
30 15 1
37 14 2
61 14 10
31 9 1
31 4 5

(a)Encuentre la ecuación de regresión múltiple que describe la relación entre estas variables.
(b)Calcule el coeficiente de determinación múltiple y realice un análisis de varianza.
(C)DejarX1¼10 yX2¼5 y encuentre el valor predicho dey
10Un equipo de investigación médica obtuvo el índice de adiposidad, la insulina basal y los valores de glucosa basal
en 21 sujetos normales. Los resultados se muestran en la siguiente tabla. Los investigadores deseaban
investigar la fuerza de la asociación entre estas variables.
PREGUNTAS DE REPASO Y EJERCICIOS 529

Índice de insulina basal glucosa basal


Adiposidad (metroU/ml) (mg/100ml)
Y X1 X2

90 12 98
112 10 103
127 14 101
137 11 102
103 10 90
140 38 108
105 9 100
92 6 101
92 8 92
96 6 91
114 9 95
108 9 95
160 41 117
91 7 101
115 9 86
167 40 106
108 9 84
156 43 117
167 17 99
165 40 104
168 22 85

Calcule el coeficiente de correlación múltiple y pruebe la significación al nivel .05.

11Como parte de un estudio para investigar la relación entre el estrés y algunas otras variables, se recolectaron los
siguientes datos en una muestra aleatoria simple de 15 ejecutivos corporativos.
(a)Encuentre la ecuación de regresión de mínimos cuadrados para estos datos.

(b)Construya la tabla de análisis de varianza y pruebe la hipótesis nula de ausencia de relación entre las cinco
variables.
(C)Pruebe la hipótesis nula de que cada pendiente en el modelo de regresión es igual a cero.
(d)Encuentre el coeficiente de determinación múltiple y el coeficiente de correlación múltiple. Dejar a¼ :05 y
encuentra elpagvalor de cada prueba.

Anual
Medida de Número de años Salario
Medida de Tamaño de la empresa en la actualidad ( 1000)
Estrés (Y) (X1) Posición (X2) (X3) Edad (X4)

101 812 15 $30 38


60 334 8 20 52
10 377 5 20 27
27 303 10 54 36
(Continuación)
530 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

Anual
Medida de Número de años Salario
Medida de Tamaño de la empresa en la actualidad ( 1000)
Estrés (Y) (X1) Posición (X2) (X3) Edad (X4)

89 505 13 52 34
60 401 4 27 45
dieciséis 177 6 26 50
184 598 9 52 60
34 412 dieciséis 34 44
17 127 2 28 39
78 601 8 42 41
141 297 11 84 58
11 205 4 31 51
104 603 5 38 63
76 484 8 41 30

Para cada uno de los estudios descritos en los ejercicios 12 a 16, responda tantas de las siguientes preguntas
como sea posible:
(a)¿Cuál es más relevante, el análisis de regresión o el análisis de correlación, o ambas técnicas son
igualmente relevantes?
(b)¿Cuál es la variable dependiente?
(C)¿Cuáles son las variables independientes?
(d)¿Cuáles son las hipótesis nula y alternativa apropiadas?
(mi)¿Qué hipótesis nulas crees que fueron rechazadas? ¿Por qué?
(F)¿Cuál es el objetivo más relevante, la predicción o la estimación, o son los dos igualmente relevantes?
Explica tu respuesta.
(gramo)¿Cuál es la población muestreada?
(h)¿Cuál es la población objetivo?
(i)¿Qué variables están relacionadas con qué otras variables? ¿Las relaciones son directas o
inversas?
(j)Escriba la ecuación de regresión usando los números apropiados para las estimaciones de parámetros.
(k)¿Cuál es el valor numérico del coeficiente de determinación múltiple?
(l)Da valores numéricos para cualquier coeficiente de correlación que puedas.

12Hashimoto et al. (A-7) desarrolló un modelo de regresión múltiple para predecir el número de visitas a las salas de
emergencia de los hospitales de la Universidad de Jikei en Tokio para niños que sufrían un ataque de asma. Los
investigadores encontraron que el número de visitas por noche aumentó significativamente cuando las condiciones
climáticas mostraron una rápida disminución debido a una mayor presión barométrica, una mayor temperatura del
aire y una mayor humedad, así como una menor velocidad del viento. El modelo final demostró que el 22 por ciento
de la variación en el número de visitas se explicaba por la variación en las variables predictoras mencionadas
anteriormente con otras ocho variables climáticas significativas.

13La correlación fue uno de los muchos procedimientos discutidos en un estudio informado por Stenvinkel et al. (A-8). En una cohorte
de 204 sujetos con enfermedad renal en etapa terminal, no encontraron correlaciones significativas entre los niveles
logarítmicos de adiponectina plasmática y la edad, ni ninguna correlación significativa entre logaritmo de la adiponectina
plasmática y la tasa de filtración glomerular.
PREGUNTAS DE REPASO Y EJERCICIOS 531

14Van Schuylenbergh et al. (A-9) utilizaron medidas fisiológicas y antropométricas como variables independientes
para predecir el rendimiento en triatlón (expresado en minutos). Diez triatletas se sometieron a extensas
pruebas fisiológicas en natación, ciclismo y carrera. Dentro de las 2 semanas posteriores a la última prueba
de laboratorio, todos los sujetos compitieron en el Campeonato Nacional Universitario de Triatlón. El modelo
de regresión final fue

TP¼130 - 9:2MLSSR -25:9MLSSSþ1:4BLCR

en que TP¼rendimiento de triatlón en minutos, MLSSR¼la velocidad de carrera en MLSS (m/s), MLSSS¼la
velocidad de natación en MLSS y BLCR¼concentración de lactato en sangre en funcionamiento MLSS (mmol/
L). MLSS se refiere al estado estable máximo de lactato y generalmente se reconoce como un buen marcador
de la potencia aeróbica funcional durante el ejercicio prolongado. También difiere para cada actividad física.
Para el modelo anteriorR2¼ :98.

15.Inspiración estática máxima (PImax) la presión bucal es una medida simple de la fuerza de los músculos
respiratorios. Un estudio de Tomalak et al. (A-10) examinó las correlaciones entre las variables con PImax
(medido sentado), volumen espiratorio forzado (FEV), flujo espiratorio máximo (PEF) y flujo inspiratorio
máximo (PIF) en 144 niños y 152 niñas de 7 a 14 años. Los investigadores encontraron PImaxse correlacionó
con FEV, PEF y PIF en niños (pag¼ :001;pag¼ :0055, ypag¼ :002; respectivamente) y para las niñas las
correlaciones también fueron significativas (pag < :001;pag < :001, ypag < :001, respectivamente).

dieciséis.Di Mónaco et al. (A-11) utilizaron regresión múltiple para predecir la densidad mineral ósea del cuello
femoral (entre otras localizaciones). Entre 124 mujeres posmenopáusicas sanas caucásicas, encontraron que
el pesodpag < :001Þ,edaddpag < :01Þ,y recuento total de linfocitosdpag < :001Þfueron útiles para predecir la
densidad mineral ósea. Además,R2¼ :40

Para cada uno de los conjuntos de datos dados en los Ejercicios 17 a 19, haga tantos de los siguientes como considere
apropiados:

(a)Obtenga la ecuación de regresión múltiple de mínimos cuadrados.

(b)Calcule el coeficiente muestral de determinación múltiple.


(C)Calcule el coeficiente muestral de correlación múltiple.
(d)Calcule coeficientes simples de determinación y correlación.
(mi)Calcule los coeficientes de correlación parcial.
(F)Construir gráficos.
(gramo)Formule hipótesis relevantes, realice las pruebas apropiadas y encuentrepagvalores.
(h)Indique las decisiones estadísticas y las conclusiones clínicas que justifican los resultados de sus pruebas de
hipótesis.
(i)Utilice sus ecuaciones de regresión para hacer predicciones y estimaciones sobre la variable dependiente para los
valores seleccionados de las variables independientes.
(j)Construya intervalos de confianza para parámetros de población relevantes.
(k)Describa la(s) población(es) a las que cree que se aplican sus inferencias.

17Pellegrino et al. (A-12) planteó la hipótesis de que la broncoconstricción máxima se puede predecir a partir del efecto
broncomotor de la inhalación profunda y el grado de sensibilidad de las vías respiratorias a la metacolina (MCh). Un
grupo de participantes estaba formado por 26 sujetos sanos o levemente asmáticos (22 hombres,
4 mujeres) que presentaban broncoconstricción limitada a MCh inhalado. La edad media de los pacientes fue de 31
años con una desviación estándar de 8. Había un fumador en el grupo. Entre los datos recopilados sobre cada sujeto
se encontraban las siguientes observaciones sobre diversas variables de medición de la función pulmonar:
532 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

(X2) dX3Þ dX6Þ (X7) (X8) dX9Þ dX10Þ (X11) VEF1 dX12Þ dX13Þ
(X1) VEF1, VEF1= dX4Þ dX5Þ M=P parlamentario PD15VEF1 PD_40Vm50 PD_vicepresidente
40 50 Disminución máx. V_ m50máx. V_p50máx.
VEF1 % pred. CVF;% V_ m50 V_p50 Relación Pendiente (en miligramos) dentradaÞ dentradaÞ (%) diciembreð%Þ diciembreð%Þ

5.22 108.75 83.92 5,30 3,90 1,36 0,75 8.44 8.24 6.34 21.40 55.40 74.40
5.38 123.96 78.54 6,00 3,70 1,62 0,56 7.76 7.00 6.18 15.80 50.80 85.14
3.62 111.04 86.19 3,10 2,85 1,10 0,69 6.92 6.61 5.56 30.40 54.36 83.07
3.94 94,26 85,28 4,10 2,70 1,52 0,44 6.79 8.52 6.38 16.40 29.10 58.50
4.48 104.43 76.58 3.21 3.00 1.07 0,63 8.79 9.74 6.68 27.80 46.30 76.70
5.28 117.33 81.99 5,65 5,55 1.02 0.83 8.98 8.97 8.19 32.60 70.80 90.00
3.80 93,37 76,61 3,75 4,70 0.80 0.50 10.52 10.60 10.04 15.80 35.30 64,90
3.14 104.67 82.63 3.20 3.20 1.00 0.70 6.18 6.58 6.02 37.60 64.10 87.50
5.26 120.09 84.84 6.30 7.40 0.89 0,55 11.85 11.85 11.85 11.70 29.10 41.20
4.87 121.14 89.69 5.50 5.50 1.00 0.56 11.85 11.85 11.85 10.30 16.40 29.70
5.35 124.71 84.65 5,60 7,00 0.80 0.40 11.98 11.98 11.29 0.00 18.00 47.20
4.30 95,98 80,37 5,78 4,90 1,18 0,59 6.48 6.19 5.11 17.00 48.20 79.60
3.75 87,82 65,79 2,26 1,65 1,37 0,53 6.25 7.02 5.03 27.10 39.53 81.80
4.41 112.21 69.78 3,19 2,95 1.08 0.57 7.66 8.08 5.51 24.70 48.80 85,90
4.66 108.37 78.72 5,00 5,90 0.85 0.49 7.79 9.77 6.10 15.00 35.00 70.30
5.19 99.05 73.62 4,20 1,50 2,80 0,63 5.15 5.78 4.72 31.40 61.90 86.70
4.32 122.38 75.13 4,39 3,30 1,33 0,74 6.20 6.34 5.10 28.25 60.30 78.00
4.05 95,97 84,38 3,40 2,50 1,30 0,59 5.64 8.52 5.61 18.20 29.50 46.00
3.23 88,25 87,30 4.00 4.00 1,00 0,71 3.47 3.43 2.77 21.60 64.50 86.00
3.99 105.56 86.74 5,30 2,70 1,96 0,76 6.40 5.20 6.17 22.50 63.00 77.80
4.37 102.34 80.18 3,20 1,80 1,77 0,85 5.05 4.97 5.42 35.30 57.00 78.00
2.67 68.11 65.12 1,70 1,30 1,38 0,91 3.97 3.95 4.11 32.40 58.80 82.40
4.75 103.71 73.08 4,60 3,60 1,21 0,71 6.34 5.29 6.04 18.85 47.50 72.20
3.19 88.12 85.07 3,20 1,80 1,77 0,76 5.08 4.85 5.16 36.20 83.40 93.00
3.29 102.17 92.68 3,80 2,40 1,58 0,50 8.21 6,90 10.60 21.60 28.10 66.70
2.87 95.03 95.67 3,00 3,00 1,00 0,75 6.24 5.99 7.50 27.00 46.70 68.30

V_ m50y V_ p50¼flujos espiratorios forzados máximos y parciales al 50 por ciento de la FVC de control; Relación M=P¼relación de V_ m50a V_p50en control; Pendiente MP
= pendiente de la regresión de decrementos porcentuales de V_ m50y V_ p50registrado durante el desafío de inhalación de MCh; PD15VEF1¼dosis de MCh que
disminuyó el FEV1por el 15 por ciento del control; PD40Vm50y PD40V_p50¼dosis de MCh que disminuyeron V_ m50y vicepresidente50en un 40 por ciento de control
respectivamente; % de disminución máxima = porcentaje de disminución máxima en la meseta. Fuente: Datos proporcionados por cortesía del Dr. Riccardo Pellegrino.

18El propósito de un estudio de O'Brien et al. (A-13) fue para evaluar la función del eje hipotálamo-pituitario-suprarrenal
(HPA) (que se sabe que está alterada en la depresión) en pacientes con enfermedad de Alzheimer (EA)
mediante la prueba de la hormona adrenocorticotrófica (ACTH), que evalúa la función suprarrenal midiendo la
producción de cortisol por parte de la glándula suprarrenal en respuesta a una inyección de ACTH. Los sujetos con AD
(edad media de 69,9 años con una desviación estándar de 9,8) se reclutaron a partir de referencias a una clínica de
memoria del hospital. Los sujetos de control normales consistían en cónyuges de pacientes y residentes de un
albergue de retiro (edad media 73,8 con desviación estándar de 11,6). Había ocho hombres y ocho mujeres en el
grupo AD y 10 hombres y ocho mujeres en el grupo de control. Entre los datos recopilados se encuentran las
siguientes observaciones sobre la edad (C1), la edad de inicio de los sujetos con EA (C2), la duración de la historia de
la enfermedad en meses (C3), la puntuación del examen cognitivo (C4), el nivel máximo de cortisol (C5) y respuesta
hormonal total (C6):
PREGUNTAS DE REPASO Y EJERCICIOS 533

Sujetos de la enfermedad de Alzheimer Control S


C1 C2 C3 C4 C5 C6 C1 C2 C3 C4 C5 C6

73 69 48 75 400.00 44610 70 97 419.00 53175


87 83 48 39 565.00 63855 81 93 470.00 54285
60 54 72 67 307.00 31110 82 93 417.00 47160
62 57 60 64 335.00 36000 57 101 215.00 27120
75 70 48 51 352.00 44760 87 91 244.00 23895
63 60 24 79 426.00 47250 88 88 355.00 33565
81 77 48 51 413.00 51825 87 91 392.00 42810
66 64 24 61 402.00 41745 70 100 354.00 45105
78 73 60 32 518.00 66030 63 103 457.00 48765
72 64 72 61 505.00 49905 87 81 323.00 39360
69 sesenta y cinco 48 73 427.00 55350 73 94 386.00 48150
76 73 36 63 409.00 51960 87 91 244.00 25830
46 41 60 73 333.00 33030 58 103 353.00 42060
77 75 18 63 591.00 73125 85 93 335.00 37425
64 61 36 59 559.00 60750 58 99 470.00 55140
72 69 30 47 511.00 54945 67 100 346.00 50745
68 100 262.00 28440
62 93 271.00 23595

¼No aplica.
Fuente: Datos proporcionados por cortesía del Dr. John T. O'Brien.

19Johnson et al. (A-14) tenga en cuenta que la capacidad de identificar la fuente de información recordada es una
función cognitiva fundamental. Realizaron un experimento para explorar la contribución relativa de las
señales perceptivas y la información de las operaciones cognitivas a los déficits relacionados con la edad en
la discriminación de recuerdos de diferentes fuentes externas (supervisión de fuentes externas). Los sujetos
del experimento incluyeron 96 estudiantes de posgrado y pregrado (41 hombres y 55 mujeres) con edades
comprendidas entre los 18 y los 27 años. Entre los datos recopilados se encuentran los siguientes puntajes
de reconocimiento de desempeño en condiciones de monitoreo de fuente (C1, C2, C3) y puntajes en la
Prueba de reconocimiento facial de Benton (C4), la Escala de inteligencia para adultos de Wechsler—Revisada
(WAIS-R), Bloque WAIS-R Subescala de diseño (C5), Subescala de vocabulario WAIS-R (C6), Prueba de fluidez
verbal de Benton (C7),

C1 C2 C3 C4 C5 C6 C7 C8

0.783 2.63 0.808 25 38 62 67 6


0.909 3.36 0.846 50
0.920 2.14 0.616 23 25 53 47 6
0.727 3.36 0.846 25 40 49 58 6
0.737 2.93 0.731 59
0.600 4.07 0.962 19 50 51 35 6
0.840 3.15 0.885 57
0.850 3.06 0.769 55
0.875 3.72 0.923 24 23 52 35 6
(Continuación)
534 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

C1 C2 C3 C4 C5 C6 C7 C8
0.792 3.15 0.884 50
0.680 4.07 0.962 56
0.731 4.64 1.000 23 30 59 47 3
0.826 1.84 0.616 52
0.609 2.98 0.846 56
0.923 4.64 1.000 53
0.773 3.36 0.846 60
0.714 1.62 0.577 23 43 53 42 6
0.667 3.72 0.923 20 32 59 28 6
0.769 1.40 0.423 51
0.565 3.55 0.885 45
0.824 1.78 0.577 45
0.458 1.90 0.615 21 46 50 47 6
0.840 4.07 0.962 59
0.720 4.07 0.962 53
0.917 3.72 0.923 24 31 43 37 6
0.560 4.07 0.926 62
0.840 4.07 0.962 26 22 50 40 6
0.720 4.07 0.962 52
0.783 1.74 0.577 54
0.696 1.62 0.539 57
0.625 3.72 0.923 22 37 55 40 6
0.737 1.12 0.423 47
0.900 1.92 0.654 22 40 46 42 6
0.565 3.55 0.885 22 43 56 64 6
0.680 4.07 0.962 54
0.760 4.07 0.962 58
0.958 1.90 0.615 24 36 46 43 6
0.652 2.98 0.846 54
0.560 4.07 0.962 56
0.500 1.92 0.654 24 42 45 46 6
0.826 2.63 0.808 60
0.783 2.58 0.808 60
0.783 2.63 0.808 49
0.750 2.14 0.692 22 37 62 58 6
0.913 2.11 0.693 46
0.952 1.49 0.539 26 32 48 36 6
0.800 4.07 0.962 59
0.870 3.55 0.885 48
0.652 1.97 0.654 59
0.640 4.07 0.962 25 36 56 54 6
0.692 4.64 1.000 23 23 58 25 6
0.917 3.72 0.923 55
0.760 4.07 0.962 22 35 52 33 6
0.739 3.55 0.885 24 43 58 43 6
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 535

C1 C2 C3 C4 C5 C6 C7 C8
0.857 3.20 0.808 59
0.727 3.36 0.846 61
0.833 2.80 0.846 56
0.840 4.07 0.962 21 11 49 58 3
0.478 2.27 0.731 60
0.920 4.07 0.962 24 40 64 50 6
0.731 4.64 1.000 20 40 51 50 6
0.920 4.07 0.962 23 50 61 53 6
0.720 4.07 0.962 57
1.000 2.79 0.807 25 47 56 30 6
0.708 3.72 0.923 24 dieciséis 57 42 6
1.000 4.64 1.000 25 48 55 54 6
0.739 3.55 0.885 23 27 57 38 6
0.600 4.20 0.962 22 38 57 33 6
0.962 4.64 1.000 25 37 63 31 6
0.772 2.22 0.731 24 48 51 41 6
0.800 2.92 0.847 24 28 47 45 6
0.923 4.64 1.000 25 45 54 48 6
0.870 3.50 0.885 24 44 54 48 5
0.808 4.64 1.000 24 43 57 58 6
1.000 4.07 0.962 25 30 59 49 6
0.870 3.55 0.885 26 44 61 35 6
0.923 4.64 1.000 52
0.958 2.58 0.808 27 32 52 33 6
0.826 3.50 0.885 21 31 61 44 6
0.962 3.72 0.923 23 31 57 38 6
0.783 3.50 0.885 23 46 60 36 6
0.905 3.20 0.808 23 34 55 37 4
1.000 4.64 1.000 23 33 57 33 6
0.875 3.72 0.923 21 34 55 29 6
0.885 4.07 0.962 52
0.913 2.92 0.846 23 44 57 47 6
0.962 4.07 0.961 24 36 54 43 6
0.682 3.36 0.846 20 41 61 34 1
0.810 2.63 0.769 20 40 57 43 6
0.720 2.79 0.808 25 23 64 43 3
0.875 2.80 0.846 24 43 59 43 2
0.923 3.72 0.924 25 40 58 33 6
0.909 3.36 0.846 24 43 56 41 6
0.920 4.07 0.962 24 50 52 28 6
1.000 3.72 0.923 21 45 64 46 6
0.609 3.50 0.885 22 25 49 35 6
¼Datos perdidos.
Fuente: Datos proporcionados por cortesía de la Dra. Doreen M. De Leonardis.
536 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

Ejercicios para usar con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.Winters et al. (A-15) realizó un estudio con 248 estudiantes de secundaria matriculados en cursos de introducción a
la educación física. Los investigadores querían saber si los constructos de la teoría cognitiva social estaban
correlacionados con el ejercicio físico discrecional en el "tiempo libre". La principal variable de resultado es
STREN, que es la cantidad de días en una semana que un estudiante de secundaria realizó actividad física
extenuante (definida operativamente como ejercicio que resulta en sudoración, dificultad para respirar y
frecuencia cardíaca rápida). Los estudiantes del estudio completaron extensos cuestionarios de los que se
derivaron las siguientes variables:

SELFR100: mide la regulación personal del comportamiento dirigido a objetivos (los valores más altos indican
más orientado a objetivos).
SS100: mide el apoyo social, el estímulo social y la expectativa social que son
proporcionado por amigos y familiares para el ejercicio físico (los valores más altos indican más apoyo).
SSE100: mide la capacidad percibida para superar las barreras al ejercicio (los valores más altos indican
mayor capacidad).
OEVNORM: mide las expectativas de resultados y sus expectativas asociadas de
ejercicio (los valores más altos indican vínculos percibidos más fuertes con los resultados deseados del ejercicio).

Con estos datos (LTEXER),


(a)Calcule la correlación bivariada para cada par de variables e interprete el significado de cada
una.
(b)Utilizando STREN como variable dependiente, calcule el coeficiente de correlación múltiple.
(C)Con STREN como variable dependiente, calcule el coeficiente de correlación parcial para
STREN y SELFR100 después de controlar SS100.
(d)Usando STREN como variable dependiente, calcule el coeficiente de correlación parcial para
STREN y SSE100 después de controlar por OEVNORM.
Tenga en cuenta que hay muchos valores faltantes en este conjunto de datos.

2.Con datos obtenidos de una base de datos nacional sobre el parto, Matulavich et al. (A-16) examinó el
número de cursos de esteroides prescritos que tomó una madre durante el embarazo (ESTEROIDES). El
tamaño del bebé se midió por longitud (cm), peso (gramos) y circunferencia de la cabeza (cm). Calcule la
correlación del número de cursos de esteroides con cada una de las tres variables de resultado. ¿Cuáles
son las hipótesis para sus pruebas? ¿Cuáles son lospag-¿valores? ¿Cuáles son tus conclusiones? (El
nombre del conjunto de datos es STERLENGTH.)
3.Consulte los datos sobre factores de riesgo cardiovascular (RISKFACT). Los sujetos son 1000 hombres que
se dedican a ocupaciones sedentarias. Desea estudiar las relaciones entre los factores de riesgo en esta
población. las variables son

Y¼consumo de oxigeno
X1¼presión arterial sistólicadmilímetro
hectogramoÞ X2¼colesterol totaldmg=dlÞ X
3¼Colesterol HDLdmg=dlÞ X4¼triglicéridosd
mg=dlÞ

Seleccione una muestra aleatoria simple de esta población y realice un análisis estadístico
apropiado. Prepara un informe narrativo de tus hallazgos y compáralos con los de tus
compañeros. Consulte con su instructor sobre el tamaño de la muestra.
REFERENCIAS 537

4.Consulte los datos de 500 pacientes que han buscado tratamiento para el alivio de los síntomas de enfermedades
respiratorias (RESPDIS). Un equipo de investigación médica está realizando un estudio para determinar qué factores
pueden estar relacionados con las enfermedades respiratorias. La variable dependienteYes una medida de la gravedad de
la enfermedad. Un valor mayor indica una condición más grave. Las variables independientes son las siguientes:

X1¼educación (grado más alto completado) X2¼


medida del hacinamiento de las viviendas
X3¼medida de la calidad del aire en el lugar de residencia (un número mayor indica una peor calidad)
X4¼estado nutricional (un número grande indica un mayor nivel de nutrición) X5¼estado de fumadord
0¼fumador; 1¼no fumadorÞ

Seleccione una muestra aleatoria simple de sujetos de esta población y realice un análisis estadístico que
considere valioso para el equipo de investigación. Prepare un informe narrativo de sus resultados y
conclusiones. Utilice ilustraciones gráficas cuando corresponda. Compara tus resultados con los de tus
compañeros. Consulte a su instructor sobre el tamaño de la muestra que debe seleccionar.

REFERENCIAS

Referencias de metodología
1. gEORGEWSNEDECORy WILLIAMGCOCRAN,Métodos de estadística,Sexta edición, Iowa State University Press,
Ames, 1967.
2. ROBERTOGD STEELy jAMÉSHTORRIE,Principios y procedimientos de estadísticas,McGraw-Hill, Nueva York, 1960.
3. RL ANDERSONy TA BANCROFT,Teoría Estadística en la Investigación,McGraw-Hill, Nueva York, 1952.
4. MH KUTNER, CJNACTSHEIM, J. N.ETERy W. L.I,Modelos estadísticos lineales aplicados,Quinta edición, McGraw-Hill/
Irwin, Nueva York, 2005.

Aplicaciones Referencias
A-1. DEBRAAJANSENy MARIOLkELLER, “Función cognitiva en mujeres ancianas que viven en la comunidad”,Revista de
Enfermería Gerontológica, 29 (2003), 34–43.
A-2. MNAEIJE, “Factores Antropométricos y Cinemáticos Locales Relacionados con la Apertura Máxima de la Boca en
Individuos Sanos,”Revista de Rehabilitación Oral, 29 (2002), 534–539.
A-3. GRAMOWisconsin-RYUNGSEN, mSÍL. W.YKLEy J.ACLENEAZAUSZNIEWSKI, “Cuidadores de niños adultos coreanos de adultos
mayores con demencia”,Revista de Enfermería Gerontológica, 29 (2003), 19–28.
A-4. X. W.ESP, X.SGALLINA, X.LI, y C. M.AULIAGRAWAL, “Cambios relacionados con la edad en la red de colágeno y dureza del
hueso,”Hueso, 31 (2002), 1–7.
A-5. PAGETERA.ANTON, RONALDTMITSUYASU, STEVENG DEEKS, DÁVIDOT. S.CADÉN, BRIDGETWAGNER, CCRISTINAHUANG, CATERINA
METROACKEN, DOUGLASDRICHMAN, CINDIACHRISTOPHERSON, FLAVIABORELLINI, RICHARDLAzary kRISTEN
MHEGE, "Múltiples medidas de la carga del VIH en la sangre y los tejidos están correlacionadas entre sí, pero no con el
parámetro clínico en sujetos avirémicos",SIDA, 17 (2003), 53–63.
A-6. OLGAkDESPERDICIO-RABÉN, ROLFLIBELIUS, y HañoHEIKKILA €, “Potenciales evocados somatosensoriales tras
Estimulación de los Nervios Digitales,”Músculo y nervio, 26 (2002), 533–538.
A-7. METROITSUOHASHIMOTO, TAIKIFUKUDA, TETSUYASHIMIZU, SHOUWATANABE, SATOSHIWATANUKI, YOSHIKATSUmiA, y
METROITSUYOSHItuRASHIMA, “Influencia de los factores climáticos en las visitas de emergencia para el ataque de asma infantil”,
Pediatría Internacional, 46 (2004), 48–52.
A-8. PAGETERSTENVINKEL, ALICIAMETROARCHELEWSKA, ROBERTOPAGECOITS-FOIT, ohLOFHEIMBU €RGER, ZHENGZHONGZCOLGAR,
CATERINAHAPAGADO, CELEVACIÓNHOLMES, jOANASAXELSSON, SIVONNEArvidsson, mARTINSDESAFÍO, PAGETERBARANY, BENGT
LTINTO, y yoOuisenorteÓRDENES, "Adiponectina en la enfermedad renal: relación con el fenotipo y la variación genética en
la codificación genética de la adiponectina",Riñón Internacional, 65 (2004), 274–281.
538 CAPÍTULO 10 REGRESIÓN MÚLTIPLE Y CORRELACIÓN

A-9. R. V.UNSCHUYLENBERGH, BVANDÉNmiYNDE, y P. H.ESPEL, “Predicción del rendimiento del triatlón Sprint a partir de pruebas de
laboratorio”,Revista Europea de Fisiología Aplicada, 91 (2004), 94–99.
A-10. WALDEMARTOMALAK, ANDRZEJPAGOGORZELSKIy J.AROSLAWPAGRUSAK, “Valores normales para estática máxima
Presiones inspiratorias y espiratorias en niños sanos”,Neumología pediátrica, 34 (2002), 42–46.
A-11. METROARCODIMETROONACO, FULVIAVALLERO, ROBERTODIMETROONACO, FULVIOMETROAUTINO, y ALBERTOCAVANA, "Total
Recuento de linfocitos y densidad mineral del hueso femoral en mujeres posmenopáusicas”,Revista de metabolismo
mineral óseo, 22 (2004), 58–63.
A-12. RICCARDOPAGELLEGRINO, BENEDETTOVIOLANTE, y VITOBRUSASCO, "Broncoconstricción máxima en humanos: relación con la
inhalación profunda y la sensibilidad de las vías respiratorias"American Journal of Respiratory and Critical Care
Medicine, 153 (1996), 115-121.
A-13. JT O'BRIEN, D. A.MES, ESCHWEITZER, M. M.ASTWYK, y P. C.OLMAN, "La sensibilidad suprarrenal mejorada a la hormona
adrenocorticotrófica (ACTH) es evidencia de hiperactividad del eje HPA en la enfermedad de Alzheimer"
Medicina Psicológica, 26 (1996), 7–14.
A-14. METROARCIAK. J.OHNSON, DOREENMDmiLEONARDIS, SHAHINHARSHTROUDI, y SEstados UnidosA. F.ERGUSON, “Envejecimiento y Soltería
Contra Múltiples Señales en Monitoreo de Fuente,”Psicología y Envejecimiento, 10 (1995), 507–517.
A-15. miRICR. W.INTERÉS, RICKLPETOSA, y THOMASECHARLETON, "Uso de la teoría cognitiva social para explicar el ejercicio
físico discrecional en el 'tiempo libre' entre los estudiantes de secundaria",Diario de Salud Adolescente, 32 (
2003), 436–442.
A-16. ANELAMETROATULAVICH, DONNAMETROILES-CURRY, BARBARAWArner, BOBBAGRAMORAYO, y el Instituto Nacional de Desarrollo Infantil y
Salud. Datos analizados en el Centro de Consultoría Estadística de la Universidad Estatal de Wright.
CAPÍTULO 11
ANÁLISIS DE REGRESIÓN:
ALGUNAS TÉCNICAS ADICIONALES

RESUMEN DEL CAPÍTULO

Este capítulo proporciona una introducción a algunas herramientas y conceptos


adicionales que son útiles en el análisis de regresión. La presentación incluye
ampliaciones de las ideas y técnicas básicas del análisis de regresión que se introdujeron
en los capítulos 9 y 10.

TEMAS

11.1INTRODUCCIÓN
11.2VARIABLES CUALITATIVAS INDEPENDIENTES
11.3PROCEDIMIENTOS DE SELECCIÓN DE VARIABLES

11.4REGRESIÓN LOGÍSTICA
11.5RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. comprender cómo incluir variables cualitativas en un análisis de regresión.
2. comprender cómo utilizar los procedimientos automatizados de selección de variables para desarrollar
modelos de regresión.
3. ser capaz de realizar una regresión logística para variables dependientes dicotómicas y
politómicas.

539
540 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

11.1 INTRODUCCIÓN

Los conceptos básicos y la metodología del análisis de regresión lineal se cubren en los Capítulos 9 y
10. En el Capítulo 9 analizamos la situación en la que el objetivo es obtener una ecuación que se
pueda usar para hacer predicciones y estimaciones sobre alguna variable dependiente a partir del
conocimiento de algunas variables. otra variable única que llamamos variable independiente,
predictora o explicativa. En el Capítulo 10, las ideas y técnicas aprendidas en el Capítulo 9 se amplían
para cubrir la situación en la que se cree que la inclusión de información sobre dos o más variables
independientes producirá una mejor ecuación para hacer predicciones y estimaciones. El análisis de
regresión es una herramienta estadística compleja y poderosa que se emplea ampliamente en la
investigación en ciencias de la salud. Para hacer justicia al tema se requiere más espacio del que está
disponible en un libro de texto de introducción a la estadística. Sin embargo, para el beneficio de
aquellos que deseen una cobertura adicional del análisis de regresión, presentamos en este capítulo
algunos temas adicionales que deberían resultar útiles para el estudiante y el profesional de la
estadística.

Supuestos de regresión revisadosComo aprendimos en los capítulos 9 y 10,


hay varios supuestos que subyacen al uso apropiado de los procedimientos de regresión. A
menudo, hay ciertas medidas que influyen fuertemente en la forma de una distribución o
afectan la magnitud de la varianza de una variable medida. Otras veces, ciertas variables
independientes que se utilizan para desarrollar un modelo están altamente correlacionadas, lo
que lleva al desarrollo de un modelo que puede no ser único o correcto.

Datos no normalesMuchas veces, los datos que se utilizan para construir un modelo de regresión no se
distribuyen normalmente. Uno puede desear explorar la posibilidad de que algunos de los puntos de datos
observados sean valores atípicos o que afecten de manera desproporcionada la distribución de los datos. Tal
investigación puede llevarse a cabo de manera informal mediante la construcción de un diagrama de
dispersión y la búsqueda de observaciones que no parecen encajar con las demás. Alternativamente, muchos
paquetes de computadora producen pruebas formales para evaluar posibles observaciones atípicas en la
variable dependiente o en las variables independientes. Sin embargo, siempre depende del investigador
justificar qué observaciones se eliminarán del conjunto de datos antes del análisis.

A menudo, uno puede desear intentar una transformación de los datos. Las transformaciones
matemáticas son útiles porque no afectan las relaciones subyacentes entre las variables. Dado que las
pruebas de hipótesis para los coeficientes de regresión se basan en estadísticas de distribución
normal, las transformaciones de datos a veces pueden normalizar los datos en la medida necesaria
para realizar dichas pruebas. Las transformaciones simples, como sacar la raíz cuadrada de las
medidas o sacar el logaritmo de las medidas, son bastante comunes.

EJEMPLO 11.1.1
Los investigadores estaban interesados en las concentraciones en sangre de delta-9-tetrahidrocannabinol
(D-9-THC), el componente psicotrópico activo de la marihuana, de 25 sujetos de investigación. Estos datos se
presentan en la Tabla 11.1.1, al igual que estos mismos datos después de usar un registro10
transformación.
11.1 INTRODUCCIÓN 541

TABLA 11.1.1 Datos de una muestra aleatoria de 25 sujetos de investigación


evaluados paraD-9-THC, Ejemplo 11.1.1

No caso. Concentración (metrog/ml) Registro10Concentración (metrog/ml)

1 . 30 - . 52
2 2.75 . 44
3 2.27 . 36
4 2.37 . 37
5 1.12 . 05
6 . 60 - . 22
7 . 61 - . 21
8 . 89 - . 05
9 . 33 - . 48
10 . 85 - . 07
11 2.18 . 34
12 3.59 . 56
13 . 28 - . 55
14 1.90 . 28
15 1.71 . 23
dieciséis . 85 - . 07
17 1.53 . 18
18 2.25 . 35
19 . 88 - . 05
20 . 49 - . 31
21 4.35 . 64
22 . 67 - . 17
23 2.74 . 44
24 . 79 - . 10
25 6.94 . 84

Los diagramas de caja y bigotes del software SPSS para estos datos se muestran en la Figura 11.1.1. Los
datos sin procesar están claramente sesgados y se identifica un valor atípico (observación 25). Un registro10La
transformación, que a menudo es útil para tales datos sesgados, elimina la magnitud del valor atípico y da
como resultado una distribución que es mucho más simétrica con respecto a la mediana. Por lo tanto, los
datos transformados podrían usarse en lugar de los datos sin procesar para construir el modelo de
regresión. Aunque los datos simétricos no necesariamente implican que los datos sean normales, dan como
resultado un modelo más apropiado. Las pruebas formales de normalidad, como se mencionó
anteriormente, siempre deben realizarse antes del análisis. &

Varianzas de error desigualesCuando las varianzas de los términos de error no son iguales, podemos obtener
una ecuación satisfactoria para el modelo, pero, debido a que se viola el supuesto de que las varianzas de
error son iguales, no podremos realizar pruebas de hipótesis apropiadas sobre los coeficientes del modelo.
Tal como sucedió al superar el problema de la no normalidad, las transformaciones de las variables de
regresión pueden reducir el impacto de las varianzas de error desiguales.
542 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

FIGURA 11.1.1Diagramas de caja y patillas de datos del ejemplo 11.1.1.

Variables independientes correlacionadasmulticolinealidades un problema común que surge cuando


se intenta construir un modelo usando muchas variables independientes. La multicolinealidad ocurre
cuando existe un alto grado de correlación entre las variables independientes. Por ejemplo, imagina
que queremos encontrar una ecuación que relacione la altura y el peso con la presión arterial. Una
variable común que se deriva de la altura y el peso se denomina índice de masa corporal (IMC). Si
intentamos encontrar una ecuación que relacione la altura, el peso y el IMC con la presión arterial,
podemos esperar encontrarnos con problemas analíticos porque el IMC, por definición, está
altamente correlacionado con la altura y el peso.
El problema surge matemáticamente cuando se derivan las soluciones para los coeficientes de
regresión. Dado que los datos están correlacionados, es posible que no se encuentren soluciones que sean
únicas para un modelo dado. La solución menos compleja a la multicolinealidad es calcular las correlaciones
entre todas las variables independientes y retener solo aquellas variables que no están altamente
correlacionadas. Una regla general conservadora para eliminar la redundancia en el conjunto de datos es
eliminar las variables que están relacionadas con otras con un coeficiente de correlación significativo
superior a 0,7.

EJEMPLO 11.1.2
Un estudio sobre la obesidad y el síndrome metabólico utilizó datos recopilados de 15 estudiantes e
incluyó la presión arterial sistólica (PAS), el peso y el IMC. Estos datos se presentan en la Tabla 11.1.2.

Las correlaciones para las tres variables se muestran en la Figura 11.1.2. La


correlación muy grande y significativa entre las variables peso e IMC sugiere que incluir
ambas variables en el modelo es inapropiado debido al alto nivel de redundancia en la
información proporcionada por estas variables. Esto tiene sentido lógico ya que el IMC es
una función del peso. El investigador ahora se enfrenta a la tarea de decidir cuál de las
variables retener para construir el modelo de regresión.
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 543

TABLA 11.1.2 Datos de 8 muestras aleatorias de 15 estudiantes

No caso. PAS Peso libras.) IMC

1 126 125 24.41


2 129 130 23.77
3 126 132 20.07
4 123 200 27.12
5 124 321 39.07
6 125 100 20.90
7 127 138 22.96
8 125 138 24.44
9 123 149 23.33
10 119 180 25.82
11 127 184 26.40
12 126 251 31.37
13 122 197 26.72
14 126 107 20.22
15 125 125 23.62

Correlaciones: PAS, Peso, IMC

PAS Peso
Peso 0.289
valor p 0.296

IMC 0.213 0.962


valor p 0.447 0.000

FIGURA 11.1.2Correlaciones calculadas en el software MINITAB para los datos del Ejemplo 11.1.2.
&

11.2 VARIABLES CUALITATIVAS


INDEPENDIENTES

Las variables independientes consideradas en la discusión del Capítulo 10 fueron todas


cuantitativas; es decir, arrojaron valores numéricos que eran cuentas o medidas en el
sentido habitual de la palabra. Por ejemplo, algunas de las variables independientes
utilizadas en nuestros ejemplos y ejercicios fueron la edad, el nivel educativo, la porosidad
del colágeno y la resistencia a la tracción del colágeno. Sin embargo, con frecuencia es
deseable utilizar una o más variables cualitativas como variables independientes en el
modelo de regresión. Las variables cualitativas, se recordará, son aquellas variables cuyos
“valores” son categorías y que transmiten el concepto de atributo más que de monto o
cantidad. La variable estado civil, por ejemplo, es una variable cualitativa cuyas categorías
son “soltero”, “casado”, “viudo” y “divorciado”.
544 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

estado de inmunidad a alguna enfermedad. En ciertas situaciones, un investigador puede sospechar


que incluir una o más variables como estas en la ecuación de regresión contribuiría significativamente
a la reducción de la suma de cuadrados del error y, por lo tanto, proporcionaría estimaciones más
precisas de los parámetros de interés.
Supongamos, por ejemplo, que estamos estudiando la relación entre la variable
dependiente presión arterial sistólica y las variables independientes peso y edad. También
podríamos querer incluir la variable cualitativa sexo como una de las variables independientes.
O supongamos que deseamos comprender mejor la naturaleza de la relación entre la
capacidad pulmonar y otras variables relevantes. Los candidatos para la inclusión en el modelo
pueden consistir en variables cuantitativas como altura, peso y edad, así como variables
cualitativas como sexo, área de residencia (urbana, suburbana, rural) y tabaquismo (fumador
actual, exfumador). , nunca fumó).

Variables ficticiasPara incorporar una variable independiente cualitativa en el


modelo de regresión múltiple, debe cuantificarse de alguna manera. Esto puede
lograrse mediante el uso de lo que se conoce comovariables ficticias.

DEFINICIÓN
Avariable ficticiaes una variable que asume solo un número finito de
valores (como 0 o 1) con el propósito de identificar las diferentes
categorías de una variable cualitativa.

El término “dummy” se utiliza para indicar el hecho de que los valores numéricos (como 0
y 1) asumidos por la variable no tienen un significado cuantitativo sino que se utilizan
simplemente para identificar diferentes categorías de la variable cualitativa en consideración.
Las variables cualitativas a veces se denominanindicadorvariables, y cuando hay sólo dos
categorías, a veces se les llamadicotómicovariables
Los siguientes son algunos ejemplos de variables cualitativas y las variables ficticias utilizadas
para cuantificarlas:

Variable Cualitativa variable ficticia


-
Sexo (masculino, femenino): 1 para hombre
X1¼ :
0 para mujer
-
Lugar de residencia (urbano, rural, suburbano): 1 para urbano
X1¼ :
0 para rural y suburbano
-
X2¼ :
1 para zonas rurales

0 para urbano y suburbano


-
Tabaquismo [fumador actual, exfumador (no ha fumado 1 para fumador actual 0
X1¼ :
durante 5 años o menos), exfumador (no ha fumado durante para lo contrario
más de 5 años), nunca ha fumado]: -
1 para ex fumadord-5 añosÞ 0 de
X2¼ :
lo contrario
-
1 para ex fumadorð>5 añosÞ 0 de
X3¼ :
lo contrario
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 545

Nótese en estos ejemplos que cuando la variable cualitativa tienekcategorías,k-Se deben definir
1 variables ficticias para que todas las categorías se codifiquen correctamente. Esta regla se aplica a
cualquier regresión múltiple que contenga una constante de intersección. La variable sexo, con dos
categorías, se puede cuantificar mediante el uso de una sola variable ficticia, mientras que se
requieren tres variables ficticias para cuantificar la variable tabaquismo, que tiene cuatro categorías.

Los siguientes ejemplos ilustran algunos de los usos de las variables cualitativas en la
regresión múltiple. En el primer ejemplo suponemos que no hay interacción entre las variables
independientes. Dado que la suposición de que no hay interacción no es realista en muchos
casos, ilustramos, en el segundo ejemplo, el análisis que es apropiado cuando se tiene en
cuenta la interacción entre variables.

EJEMPLO 11.2.1
En un estudio de factores que se cree que están asociados con el peso al nacer, se seleccionó una
muestra aleatoria simple de 100 actas de nacimiento del Registro de nacimientos de Carolina del
Norte de 2001 (A-1). La Tabla 11.2.1 muestra, para tres variables, los datos extraídos de cada registro.
Hay dos variables independientes: la duración de la gestación (semanas), que es cuantitativa, y el
tabaquismo de la madre (tabaquismo), una variable cualitativa. La variable dependiente es el peso al
nacer (gramos).

TABLA 11.2.1 Datos de una muestra aleatoria simple de 100 nacimientos del Registro de
nacimientos de Carolina del Norte, ejemplo 11.2.1

No caso. Gramos Semanas Fumar No caso. Gramos Semanas Fumar

1 3147 40 0 51 3232 38 0
2 2977 41 0 52 3317 40 0
3 3119 38 0 53 2863 37 0
4 3487 38 0 54 3175 37 0
5 4111 39 0 55 3317 40 0
6 3572 41 0 56 3714 34 0
7 3487 40 0 57 2240 36 0
8 3147 41 0 58 3345 39 0
9 3345 38 1 59 3119 39 0
10 2665 34 0 60 2920 37 0
11 1559 34 0 61 3430 41 0
12 3799 38 0 62 3232 35 0
13 2750 38 0 63 3430 38 0
14 3487 40 0 64 4139 39 0
15 3317 38 0 sesenta y cinco 3714 39 0
dieciséis 3544 43 1 66 1446 28 1
17 3459 45 0 67 3147 39 1
18 2807 37 0 68 2580 31 0
19 3856 40 0 69 3374 37 0
20 3260 40 0 70 3941 40 0
(Continuación)
546 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

No caso. Gramos Semanas Fumar No caso. Gramos Semanas Fumar

21 2183 42 1 71 2070 37 0
22 3204 38 0 72 3345 40 0
23 3005 36 0 73 3600 40 0
24 3090 40 1 74 3232 41 0
25 3430 39 0 75 3657 38 1
26 3119 40 0 76 3487 39 0
27 3912 39 0 77 2948 38 0
28 3572 40 0 78 2722 40 0
29 3884 41 0 79 3771 40 0
30 3090 38 0 80 3799 45 0
31 2977 42 0 81 1871 33 0
32 3799 37 0 82 3260 39 0
33 4054 40 0 83 3969 38 0
34 3430 38 1 84 3771 40 0
35 3459 41 0 85 3600 40 0
36 3827 39 0 86 2693 35 1
37 3147 44 1 87 3062 45 0
38 3289 38 0 88 2693 36 0
39 3629 36 0 89 3033 41 0
40 3657 36 0 90 3856 42 0
41 3175 41 1 91 4111 40 0
42 3232 43 1 92 3799 39 0
43 3175 36 0 93 3147 38 0
44 3657 40 1 94 2920 36 0
45 3600 39 0 95 4054 40 0
46 3572 40 0 96 2296 36 0
47 709 25 0 97 3402 38 0
48 624 25 0 98 1871 33 1
49 2778 36 0 99 4167 41 0
50 3572 35 0 100 3402 37 1
Fuente: John P. Holcomb, muestra y codificado de los datos del Registro de Nacimiento de Carolina del Norte encontrados enwww.irss.unc.
edu/ ncvital/ bfd1down.html.

Solución: Para el análisis cuantificamos el tabaquismo mediante una variable ficticia que se
codifica como 1 si la madre es fumadora y 0 si no fuma. Los datos de la Tabla 11.2.1 se
representan como un diagrama de dispersión en la Figura 11.2.1. El diagrama de
dispersión sugiere que, en general, los períodos más largos de gestación se asocian
con pesos al nacer más altos.
Para obtener información adicional sobre la naturaleza de estos datos,
podemos ingresarlos en una computadora y emplear un programa apropiado para
realizar análisis adicionales. Por ejemplo, introducimos las observacionesy1¼3147,X11¼
40,X21¼0, para el primer caso;Y2¼2977,X12¼41,X22¼0 para el segundo caso; etcétera. La
figura 11.2.2 muestra la salida de la computadora obtenida con el uso del programa de
regresión múltiple MINITAB.
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 547

5000

4000

Peso al nacer (gramos) 3000

2000

1000

0
25 30 35 40 45 50
Duración de la gestación (semanas)

FIGURA 11.2.1 Pesos al nacer y duración de la gestación para 100 nacimientos: (~) tabaquismo y ( )
madres no fumadoras.

La ecuación de regresión es

gramos 1724 130x1 294x2

Vaticinador coef SE Coef T PAG


Constante 1724.4 558.8 3.09 0.003
semanas (x1) 130.05 14.52 8.96 0.000
humo (x2) 294.4 135.8 2.17 0.033

S 484.6 cuadrados R 46,4% R-Cuadrado(adj) 45,3%

Análisis de variación

FUENTE DF SS EM F PAG
Regresión 2 19689185 9844593 41.92 0.000
error residual 97 22781681 234863
Total 99 42470867

FUENTE DF SS de secuencia

x1 1 18585166
x2 1 1104020

FIGURA 11.2.2Impresión parcial de computadora, análisis de regresión múltiple MINITAB.


Ejemplo 11.2.1.
548 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

Vemos en la impresión que la ecuación de regresión múltiple es

ŷj¼ b̂0þb̂1X1jþb̂2X2j
(11.2.1)
ŷj¼ -1724:4þ130:05X1j-294:4X2j

Para observar el efecto sobre esta ecuación cuando deseamos considerar sólo los
nacimientos de madres fumadoras, dejamosX2j¼1. La ecuación entonces se convierte en

ŷj¼ -1724:4þ130:05X1j-294:4d1Þ
(11.2.2)
¼ -2018:8þ130:05X1j

que tiene uny-intercepto de -2018.8 y una pendiente de 130. Tenga en cuenta que ely-
el intercepto para la nueva ecuación es igual a (b̂0þ b̂1)¼ [-1724.4þ (-294.4)]¼-2018.
Ahora consideremos sólo los nacimientos de madres no fumadoras. cuando dejamos
X2¼0, nuestra ecuación de regresión se reduce a

ŷj¼ -1724:4þ130:05X1j-294d0Þ
(11.2.3)
¼ -1724:4þ130:05X1j

La pendiente de esta ecuación es la misma que la pendiente de la ecuación para


las madres fumadoras, pero lay-las intersecciones son diferentes. Ely-El intercepto de
la ecuación asociada con las madres no fumadoras es mayor que el de las madres
fumadoras. Estos resultados muestran que para esta muestra, los bebés nacidos de

5000

4000
De fumar
madres
Peso al nacer (gramos)

De no fumadores
3000
madres

2000

1000

0
25 30 35 40 45 50
Duración de la gestación (semanas)

FIGURA 11.2.3 Pesos al nacer y duración de la gestación para 100 nacimientos y la regresión ajustada
líneas: (~) fumar y ( ) madres no fumadoras.
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 549

las madres que no fuman pesaron, en promedio, más que los bebés nacidos de
madres que fuman, cuando se toma en cuenta la duración de la gestación. La cantidad
de la diferencia, en promedio, es de 294 gramos. Dicho de otra manera, podemos
decir que para esta muestra, los bebés nacidos de madres fumadoras pesaron, en
promedio, 294 gramos menos que los bebés nacidos de madres no fumadoras,
cuando se toma en cuenta el tiempo de gestación. La figura 11.2.3 muestra el
diagrama de dispersión de los datos originales junto con un gráfico de las dos líneas
de regresión (ecuaciones 11.2.2 y 11.2.3). &

EJEMPLO 11.2.2
En este punto surge una pregunta con respecto a qué inferencias podemos hacer sobre la población
muestreada sobre la base de los resultados muestrales obtenidos en el Ejemplo 11.2.1. En primer
lugar, deseamos saber si la diferencia de muestra de 294 gramos es significativa. En otras palabras,
¿fumar tiene un efecto sobre el peso al nacer? Podemos responder a esta pregunta a través del
siguiente procedimiento de prueba de hipótesis.

Solución:

1. Datos.Los datos son los dados en el Ejemplo 11.2.1.


2. Supuestos.Suponemos que se cumplen los supuestos que subyacen al
análisis de regresión múltiple.
3. Hipótesis.H0:b2¼0;HA:b26¼0. Supongamos que dejamosa¼ .05.
4. Estadística de prueba.La estadística de prueba est¼ (b̂2- 0)/sb̂2.

5. Distribución de la estadística de prueba.Cuando se cumplen los supuestos yH0es cierto


que la estadística de prueba se distribuye como Student'stcon 97 grados de libertad.

6. Regla de decisión.rechazamosH0si el calculadotes mayor o igual


a 1.9848 o menor o igual a -1.9848 (obtenido por interpolación).

7. Cálculo de la estadística de prueba.El valor calculado del estadístico de prueba


aparece en la Figura 11.2.2 como eltrazón para el coeficiente asociado a la
variable que aparece en la Columna 4 de la Tabla 11.2.1. Este coeficiente, por
supuesto, es b̂2. Vemos que el calculadotes -2.17.
8. Decisión estadística.Como -2.17 <-1.9848, rechazamosH0.
9. Conclusión.Concluimos que, en la población muestreada, el hecho de que las
madres fumen está asociado con una reducción en el peso al nacer de sus bebés.

10pagvalor.Para esta prueba tenemospag¼ .033 de la Figura 11.2.2. &

Un intervalo de confianza parab2 Dado que podemos concluir que en la población


muestreada el tabaquismo de las madres sí tiene un efecto sobre el peso al nacer de sus
bebés, ahora podemos preguntarnos sobre la magnitud del efecto. Lo mejor
550 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

La estimación puntual de la diferencia promedio en los pesos al nacer, cuando se tiene en cuenta la duración
de la gestación, es de 294 gramos a favor de los bebés nacidos de madres que no fuman. Podemos obtener
una estimación de intervalo de la cantidad media de la diferencia usando información de la impresión de la
computadora por medio de la siguiente expresión:

b2 tb2

Para un intervalo de confianza del 95%, tenemos

- 294:4 1:9848d135:8Þ
ð-563:9; -24:9Þ

Por lo tanto, estamos seguros en un 95 % de que la diferencia está entre 564 gramos y 25
gramos.

Ventajas de las variables ficticiasEl lector puede haber supuesto correctamente


que un análisis alternativo de los datos del ejemplo 11.2.1 consistiría en ajustar dos
ecuaciones de regresión separadas: una a la submuestra de madres que fuman y
otra a la submuestra de madres que no fuman. Este enfoque, sin embargo, carece de
algunas de las ventajas de la técnica de la variable ficticia y es un procedimiento
menos deseable cuando este último procedimiento es válido. Si podemos justificar la
suposición de que las dos líneas de regresión separadas tienen la misma pendiente,
podemos obtener una mejor estimación de esta pendiente común mediante el uso
de variables ficticias, lo que implica agrupar los datos de las dos submuestras. En el
ejemplo 11.2.1, la estimación con una variable ficticia se basa en un tamaño de
muestra total de 100 observaciones, mientras que las estimaciones separadas se
basarían en una muestra de 85 fumadores y solo 15 no fumadores.

Uso de variables ficticias: interacción presenteAhora consideremos el


situación en la que se supone que está presente la interacción entre las variables. Supongamos,
por ejemplo, que tenemos dos variables independientes: una variable cuantitativaX1y una
variable cualitativa con tres niveles de respuesta que producen las dos variables ficticiasX2yX3. El
modelo sería entonces

yj¼b0þb1X1jþb2X2jþb3X3jþb4X1jX2jþb5X1jX3jþmij (11.2.4)

en el cualb4X1jX2jyb5X1jX3json llamadostérminos de interaccióny representan la interacción entre


las variables independientes cuantitativas y cualitativas. Tenga en cuenta que no es necesario
incluir en el modelo el término que contieneX2jX3j; siempre será cero porque cuandoX2¼1;X3¼0,
y cuandoX3¼1;X2¼0. El modelo de la Ecuación 11.2.4 permite una pendiente diferente yY-
intercepción para cada nivel de la variable cualitativa.
Supongamos que usamos la codificación de variables ficticias para cuantificar la variable cualitativa de la siguiente manera:
-
1 para el nivel 1
X2¼
0 de lo contrario
-
1 para el nivel 2
X3¼
0 de lo contrario
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 551

Las tres ecuaciones de regresión muestral para los tres niveles de la variable cualitativa, entonces, son
las siguientes:

Nivel 1dX2¼1;X3¼0Þ
ŷj¼ b̂0þb̂1X1jþb̂2d1Þþb̂3d0Þþb̂X 4 1jd1Þ þb^
5X1jd0Þ

¼ b̂0þb̂1X1jþb̂2þb̂ 4X1j (11.2.5)


- -
¼ b̂0þb̂2 þ b̂1þb ^ 4X1j

Nivel 2dX2¼0;X3¼1Þ
ŷj¼b ^ 0þb̂1X1jþb̂2d0Þþb̂ 3d1Þ þb^
4X1jd0Þþb̂5X1jd1Þ

¼ b̂0þb ^ 1X1jþb3^þb̂5X 1j (11.2.6)


- -
¼ b̂0þb̂ 3 þb ^1þb̂5X1j

Nivel 3dX2¼0;X3¼0Þ
ŷj¼b ^ 0þb̂ 1X1jþb2^d0Þþb̂3d0Þþb̂4X1jd0Þþb̂5X1jd0Þ
(11.2.7)
¼ b̂0þb̂1X1j

Ilustremos estos resultados mediante un ejemplo.

EJEMPLO 11.2.3
Un equipo de investigadores de salud mental desea comparar tres métodos (A, B y C) para tratar la
depresión severa. También les gustaría estudiar la relación entre la edad y la eficacia del tratamiento,
así como la interacción (si la hay) entre la edad y el tratamiento. Cada miembro de una muestra
aleatoria simple de 36 pacientes, comparable con respecto al diagnóstico y la gravedad de la
depresión, se asignó al azar para recibir el tratamiento A, B o C. Los resultados se muestran en la
Tabla 11.2.2. La variable dependienteYes la efectividad del tratamiento, la variable independiente
cuantitativaX1es la edad del paciente en el cumpleaños más cercano, y la variable independiente tipo
de tratamiento es una variable cualitativa que ocurre en tres niveles. La siguiente codificación de
variable ficticia se utiliza para cuantificar la variable cualitativa:
-
1 para el tratamiento A
X2¼
0 de lo contrario
-
1 para el tratamiento B 0
X3¼
en caso contrario

El diagrama de dispersión para estos datos se muestra en la Figura 11.2.4. La Tabla 11.2.3 muestra los
datos tal como fueron ingresados en una computadora para su análisis. La figura 11.2.5 contiene la
impresión del análisis utilizando el programa de regresión múltiple MINITAB.

Solución: Ahora examinemos la impresión para ver lo que proporciona en cuanto a la


comprensión de la naturaleza de las relaciones entre las variables. La ecuación de
mínimos cuadrados es

ŷj¼6:21þ1:03X1jþ41:3X2jþ22:7X3j- :703X1jX2j- :510X1jX3j


552 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

TABLA 11.2.2 Datos para el Ejemplo 11.2.3

Medida de efectividad Edad Método de tratamiento

56 21 A
41 23 B
40 30 B
28 19 C
55 28 A
25 23 C
46 33 B
71 67 C
48 42 B
63 33 A
52 33 A
62 56 C
50 45 C
45 43 B
58 38 A
46 37 C
58 43 B
34 27 C
sesenta y cinco 43 A
55 45 B
57 48 B
59 47 C
64 48 A
61 53 A
62 58 B
36 29 C
69 53 A
47 29 B
73 58 A
64 66 B
60 67 B
62 63 A
71 59 C
62 51 C
70 67 A
71 63 C

Las tres ecuaciones de regresión para los tres tratamientos son las siguientes:

Tratamiento A (Ecuación 11.2.5)

ŷj¼ ð6:21þ41:3Þ þ ð1:03 - :703ÞX1j


¼47:51þ :327X1j
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 553

80
75
70
sesenta y cinco

60

Eficacia del tratamiento


55
50
45
40
35
30
25

15 20 25 30 35 40 45 50 55 60 65 70 75 80
Edad
FIGURA 11.2.4Diagrama de dispersión de datos para el Ejemplo 11.2.3: ( ) tratamiento A, (~) tratamiento B,
(&)tratamiento c

Tratamiento B (Ecuación 11.2.6)


ŷj¼ ð6:21þ22:7Þ þ ð1:03 - :510ÞX1j
¼28:91þ :520X1j
Tratamiento C (Ecuación 11.2.7)
ŷj¼6:21þ1:03X1j
La Figura 11.2.6 contiene el diagrama de dispersión de los datos originales junto con
las líneas de regresión para los tres tratamientos. La inspección visual de la Figura 11.2.6
sugiere que los tratamientos A y B no difieren mucho con respecto a sus pendientes, pero su
y-las intersecciones son considerablemente diferentes. El gráfico sugiere que el tratamiento
A es mejor que el tratamiento B para pacientes más jóvenes, pero la diferencia es menos
dramática con pacientes mayores. El tratamiento C parece ser decididamente menos
deseable que los tratamientos A y B para los pacientes más jóvenes, pero es casi tan efectivo
como el tratamiento B para los pacientes mayores. Estas impresiones subjetivas son
compatibles con la afirmación de que existe una interacción entre los tratamientos y la edad.

Procedimientos de inferencia

Las relaciones que vemos en la Figura 11.2.6, sin embargo, son resultados de muestra. ¿Qué podemos
concluir acerca de la población de la que se extrajo la muestra?
Para obtener una respuesta, echemos un vistazo a latproporciones en la copia impresa de la computadora en la figura 11.2.5.

Cada uno de estos es el estadístico de prueba.

bi-0

sbi
554 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

TABLA 11.2.3 Datos para el ejemplo 11.2.3 Codificados para análisis por computadora

Y X1 X2 X3 X1X2 X1X3

56 21 1 0 21 0
55 28 1 0 28 0
63 33 1 0 33 0
52 33 1 0 33 0
58 38 1 0 38 0
sesenta y cinco 43 1 0 43 0
64 48 1 0 48 0
61 53 1 0 53 0
69 53 1 0 53 0
73 58 1 0 58 0
62 63 1 0 63 0
70 67 1 0 67 0
41 23 0 1 0 23
40 30 0 1 0 30
46 33 0 1 0 33
48 42 0 1 0 42
45 43 0 1 0 43
58 43 0 1 0 43
55 45 0 1 0 45
57 48 0 1 0 48
62 58 0 1 0 58
47 29 0 1 0 29
64 66 0 1 0 66
60 67 0 1 0 67
28 19 0 0 0 0
25 23 0 0 0 0
71 67 0 0 0 0
62 56 0 0 0 0
50 45 0 0 0 0
46 37 0 0 0 0
34 27 0 0 0 0
59 47 0 0 0 0
36 29 0 0 0 0
71 59 0 0 0 0
62 51 0 0 0 0
71 63 0 0 0 0

para las pruebasH0:bi¼0. Vemos por la Ecuación 11.2.5 que ely-el intercepto de la línea de regresión
para el tratamiento A es igual ab̂0þb̂2. Desde eltrelación de 8,12 para la pruebaH0:b2¼0 es mayor que
el críticotde 2,0423 (paraa¼.05), podemos rechazarH0esob2¼0 y concluya que ely- El intercepto de la
línea de regresión de población para el tratamiento A es diferente dely-intercepto de la línea de
regresión de la población para el tratamiento C, que tiene unay-intercepción deb0. Similarmente,
11.2 VARIABLES CUALITATIVAS INDEPENDIENTES 555

La ecuación de regresión es

y = 6,21 + 1,03 x1 + 41,3 x2 + 22,7 x3 - 0,703 x4 - 0,510 x5

Vaticinador coef Desvst. relación t pag


Constante 6.211 3.350 1.85 0.074
x1 1.03339 0.07233 14.29 0.000
x2 41.304 5.085 8.12 0.000
x3 22.707 5.091 4.46 0.000
x4 - 0.7029 0.1090 - 6.45 0.000
x5 - 0.5097 0.1104 - 4.62 0.000

s = 3.925 R-sq = 91,4% R-cuadrado1adj.2 =90,0%

Análisis de variación

FUENTE DF SS EM F pag
Regresión 5 4932.85 986.57 64.04 0.000
Error 30 462.15 15.40
Total 35 5395.00

FUENTE DF SEC SS
x1 1 3424.43
x2 1 803.80
x3 1 1.19
x4 1 375.00
x5 1 328.42

FIGURA 11.2.5Impresión de computadora, análisis de regresión múltiple MINITAB, Ejemplo 11.2.3.

80 Tratamiento C
75
Tratamiento A
70
Tratamiento B
sesenta y cinco

60
Eficacia del tratamiento

55
50
45
40
35
30
25

15 20 25 30 35 40 45 50 55 60 65 70 75 80
Edad
FIGURA 11.2.6Diagrama de dispersión de los datos del ejemplo 11.2.3 con las líneas de regresión ajustadas: )
(tratamiento A, (~) tratamiento B, (&) tratamiento C.
556 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

desde eltrelación de 4,46 para la pruebaH0:b3¼0 también es mayor que el críticotde 2.0423, podemos concluir
(en el nivel de significancia de .05) que ely-El intercepto de la línea de regresión de la población para el
tratamiento B también es diferente dely-intercepto de la línea de regresión de la población para el
tratamiento C. (Ver lay-intersección de la Ecuación 1l.2.6.)
Ahora consideremos las pendientes. Vemos por la Ecuación 11.2.5 que la pendiente de la línea
de regresión para el tratamiento A es igual a b̂1(la pendiente de la línea para el tratamiento C)þb̂4.
Desde eltrelación de -6.45 para pruebasH0:b4¼0 es menor que el críticotde -2.0423, podemos concluir
(pora¼.05) que las pendientes de las líneas de regresión poblacional para los tratamientos A y C son
diferentes. Del mismo modo, dado que el calculadotproporción para la pruebaH0:b5¼0 también es
menor que -2.0423, concluimos (paraa¼.05) que las líneas de regresión poblacional para los
tratamientos B y C tienen pendientes diferentes (ver la pendiente de la Ecuación 11.2.6). Por lo tanto,
concluimos que existe interacción entre la edad y el tipo de tratamiento. Esto se refleja en la falta de
paralelismo entre las líneas de regresión de la Figura 11.2.6. &

Otra pregunta de interés es la siguiente: ¿La pendiente de la línea de regresión poblacional para el
tratamiento A es diferente de la pendiente de la línea de regresión poblacional para el tratamiento B? Para
responder a esta pregunta se requieren técnicas computacionales más allá del alcance de este texto. Se
remite al lector interesado a libros dedicados específicamente al análisis de regresión.
En la Sección 10.4 se advirtió al lector que existen problemas al hacer inferencias múltiples a partir de
los mismos datos de muestra. Nuevamente, hay libros disponibles sobre análisis de regresión que se pueden
consultar para conocer los procedimientos que se deben seguir cuando se desean inferencias múltiples,
como las que se analizan en esta sección.
Hemos discutido solo dos situaciones en las que el uso de variables ficticias es apropiado.
Modelos más complejos que involucran el uso de una o más variables independientes
cualitativas en presencia de dos o más variables cuantitativas pueden ser apropiados en ciertas
circunstancias. Los modelos más complejos se analizan en los numerosos libros dedicados al
tema del análisis de regresión múltiple.
En este punto, puede ser evidente que existen muchas similitudes entre el uso de un modelo
de regresión lineal con variables ficticias y el enfoque ANOVA básico. En ambos casos, se intenta
modelar la relación entre las variables predictoras y una variable de resultado. En el caso de la
regresión lineal, generalmente estamos más interesados en la predicción, y en ANOVA,
generalmente estamos más interesados en comparar medias. Si el deseo es comparar las medias
usando la regresión, se podría desarrollar un modelo para predecir la respuesta media, digamos
metroi, en lugar de un resultado,yi. Modelar la respuesta media usando regresión con variables
ficticias es equivalente a ANOVA. Para el estudiante interesado, sugerimos el libro de Bowerman y
O'Connell (1), quienes brindan un ejemplo del uso de ambos enfoques para los mismos datos.

EJERCICIOS

Para cada ejercicio haz lo siguiente:

(a)Dibuje un diagrama de dispersión de los datos usando diferentes símbolos para las diferentes variables categóricas.

(b)Utilice la codificación de variables ficticias y la regresión para analizar los datos.

(C)Realice pruebas de hipótesis apropiadas y construya intervalos de confianza apropiados usando su


elección de significación y niveles de confianza.
(d)Encuentra elpagvalor para cada prueba que realice.
EJERCICIOS 557

11.2.1Para los sujetos que se someten a trasplantes de células madre, las células dendríticas (DC) son células presentadoras de antígenos que

son críticos para la generación de respuestas tumorales inmunológicas. Bolwell et al. (A-2) estudió las CD
linfoides en 44 sujetos que se sometieron a un trasplante autólogo de células madre. La variable de resultado
es la concentración de células DC2 medida por citometría de flujo. Una de las variables independientes es la
edad del sujeto (años), y la segunda variable independiente es el método de movilización. Durante la
quimioterapia, 11 sujetos recibieron movilizador del factor estimulante de colonias de granulocitos (G-CSF)
(metrog/kg/día) y 33 recibieron etopósido (2 g=m2). El movilizador es un tipo de célula progenitora sanguínea
que desencadena la formación de las células DC. Los resultados fueron los siguientes:

G-CSF etopósido

corriente continua Edad corriente continua Edad corriente continua Edad corriente continua Edad

6.16 sesenta y cinco 3.18 70 4.24 60 4.09 36


6.14 55 2.58 64 4.86 40 2.86 51
5.66 57 1.69 sesenta y cinco 4.05 48 2.25 54
8.28 47 2.16 55 5.07 50 0.70 50
2.99 66 3.26 51 4.26 23 0.23 62
8.99 24 1.61 53 11.95 26 1.31 56
4.04 59 6.34 24 1.88 59 1.06 31
6.02 60 2.43 53 6.10 24 3.14 48
10.14 66 2.86 37 0,64 52 1.87 69
27.25 63 7.74 sesenta y cinco 2.21 54 8.21 62
8.86 69 11.33 19 6.26 43 1.44 60
Fuente: Datos proporcionados por cortesía de Lisa Rybicki, MS

11.2.2Según Pandey et al. (A-3) El carcinoma de vesícula biliar no es infrecuente. Uno de los principales factores de riesgo para
el cáncer de vesícula biliar es la colelitiasis, la presencia asintomática de cálculos en la vesícula biliar. Los
investigadores realizaron un estudio de casos y controles de 50 sujetos con cáncer de vesícula biliar y 50 sujetos con
colelitiasis. De interés fue la concentración de productos de peroxidación de lípidos en la bilis de la vesícula biliar, una
condición que puede dar lugar al cáncer de vesícula biliar. El producto de peroxidación lipídica melonaldehído (MDA,
metrog=mg) se usó para medir la peroxidación lipídica. Una de las variables independientes consideradas fue la
concentración de citocromo P-450 (CYTO, nmol/mg). Los investigadores utilizaron el estado de la enfermedad (cáncer
de vesícula biliar frente a colelitiasis) y la concentración de citocromo P-450 para predecir la MDA. Se recogieron los
siguientes datos.

colelitiasis Cáncer de vesícula biliar

MDA CITO MDA CITO MDA CITO MDA CITO

0,68 12.60 11.62 4.83 1.60 22.74 9.20 8.99


0.16 4.72 2.71 3.25 4.00 4.63 0,69 5.86
0.34 3.08 3.39 7.03 4.50 9.83 10.20 28.32
3.86 5.23 6.10 9.64 0.77 8.03 3.80 4.76
0.98 4.29 1,95 9.02 2.79 9.11 1.90 8.09
3.31 21.46 3.80 7.76 8.78 7.50 2.00 21.05
1.11 10.07 1.72 3.68 2.69 18.05 7.80 20.22
4.46 5.03 9.31 11.56 0.80 3.92 16.10 9.06
1.16 11.60 3.25 10.33 3.43 22.20 0.98 35.07
(Continuación)
558 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

colelitiasis Cáncer de vesícula biliar

MDA CITO MDA CITO MDA CITO MDA CITO

1.27 9.00 0,62 5.72 2.73 11.68 2.85 29.50


1.38 6.13 2.46 4.01 1.41 19.10 3.50 45.06
3.83 6.06 7.63 6.09 6.08 36.70 4.80 8.99
0.16 6.45 4.60 4.53 5.44 48.30 1.89 48.15
0.56 4.78 12.21 19.01 4.25 4.47 2.90 10.12
1,95 34.76 1.03 9.62 1.76 8.83 0.87 17.98
0.08 15.53 1.25 7.59 8.39 5.49 4.25 37.18
2.17 12.23 2.13 12.33 2.82 3.48 1.43 19.09
0.00 0,93 0.98 5.26 5.03 7.98 6.75 6.05
1.35 3.81 1.53 5.69 7.30 27.04 4.30 17.05
3.22 6.39 3.91 7.72 4.97 16.02 0.59 7.79
1.69 14.15 2.25 7.61 1.11 6.14 5.30 6.78
4.90 5.67 1.67 4.32 13.27 13.31 1.80 16.03
1.33 8.49 5.23 17.79 7.73 10.03 3.50 5.07
0,64 2.27 2.79 15.51 3.69 17.23 4.98 16.60
5.21 12.35 1.43 12.43 9.26 9.29 6.98 19.89

Fuente: Datos proporcionados por cortesía de Manoj Pandey, MD

11.2.3El propósito de un estudio de Krantz et al. (A-4) fue investigar los efectos relacionados con la dosis de metadona
en sujetos contorsades de pointes,una taquicardia ventricular polimórfica. En el estudio de 17 sujetos,
10 eran hombres (sexo¼0) y siete eran mujeres (sexo¼1). La variable de resultado es el intervalo QTc,
una medida del riesgo de arritmia. La otra variable independiente, además del sexo, fue la dosis de
metadona (mg/día). Las mediciones de estas variables para los 17 sujetos fueron las siguientes.

Sexo Dosis (mg/día) QTc (mseg)

0 1000 600
0 550 625
0 97 560
1 90 585
1 85 590
1 126 500
0 300 700
0 110 570
1 sesenta y cinco 540
1 650 785
1 600 765
1 660 611
1 270 600
1 680 625
0 540 650
0 600 635
1 330 522
Fuente: Datos proporcionados por cortesía de Mori J. Krantz, MD
EJERCICIOS 559

11.2.4Consulte el Ejercicio 9.7.2, que describe la investigación de Reiss et al. (A-5), que recolectó muestras de 90
pacientes y midió el tiempo de tromboplastina parcial (aPTT) usando dos métodos diferentes: el ensayo de
punto de atención CoaguChek y el ensayo hospitalario de laboratorio estándar. Los sujetos también fueron
clasificados por su estado de medicación: 30 recibieron heparina sola, 30 recibieron heparina con warfarina,
y 30 recibiendo warfarina y enoxaparina. Los datos son los siguientes.

heparina Heparina y Warfarina Warfarina y Enoxaparina

CoaguChek Hospital CoaguChek Hospital CoaguChek Hospital


TTPa TTPa TTPa TTPa TTPa TTPa

49.3 71.4 18.0 77.0 56.5 46.5


57,9 86.4 31.2 62.2 50.7 34,9
59.0 75,6 58.7 53.2 37.3 28,0
77.3 54.5 75.2 53.0 64.8 52.3
42.3 57.7 18.0 45.7 41.2 37.5
44.3 59.5 82.6 81.1 90.1 47.1
90,0 77.2 29.6 40,9 23.1 27.1
55.4 63.3 82,9 75.4 53.2 40.6
20.3 27.6 58.7 55.7 27.3 37.8
28.7 52.6 64.8 54.0 67.5 50.4
64.3 101.6 37,9 79.4 33.6 34.2
90.4 89.4 81.2 62.5 45.1 34.8
64.3 66.2 18.0 36.5 56.2 44.2
89.8 69.8 38.8 32.8 26,0 28.2
74.7 91.3 95.4 68,9 67.8 46.3
150.0 118.8 53.7 71.3 40.7 41.0
32.4 30,9 128.3 111.1 36.2 35.7
20,9 65.2 60.5 80.5 60.8 47.2
89.5 77,9 150.0 150.0 30.2 39.7
44.7 91.5 38.5 46.5 18.0 31.3
61.0 90.5 58,9 89.1 55,6 53.0
36.4 33.6 112.8 66.7 18.0 27.4
52,9 88.0 26.7 29.5 18.0 35.7
57.5 69,9 49.7 47.8 78.3 62.0
39.1 41.0 85.6 63.3 75.3 36.7
74.8 81.7 68.8 43.5 73.2 85.3
32.5 33.3 18.0 54.0 42.0 38.3
125.7 142.9 92.6 100.5 49.3 39.8
77.1 98.2 46.2 52.4 22.8 42.3
143.8 108.3 60.5 93.7 35.8 36,0
Fuente: Datos proporcionados por cortesía de Curtis E. Haas, Pharm.D.

Utilice la regresión múltiple para predecir el TTPa del hospital a partir del nivel de TTPa de CoaguCheck, así como la
medicación recibida. ¿El conocimiento de la medicación es útil en la predicción? Dejara¼ :05 para todas las pruebas.
560 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

11.3 PROCEDIMIENTOS DE SELECCIÓN DE VARIABLES

Los investigadores de ciencias de la salud que contemplan el uso del análisis de regresión múltiple para
investigar una pregunta generalmente encuentran que tienen una gran cantidad de variables para
seleccionar las variables independientes que se emplearán como predictores de la variable dependiente.
Dichos investigadores querrán incluir en su modelo tantas variables como sea posible para maximizar la
capacidad predictiva del modelo. Sin embargo, el investigador debe darse cuenta de que agregar otra
variable independiente a un conjunto de variables independientes siempre aumenta el coeficiente de
determinación.R2. Por lo tanto, las variables independientes no deben agregarse al modelo de manera
indiscriminada, sino solo por una buena razón. En la mayoría de las situaciones, por ejemplo, algunas
variables predictoras potenciales son más costosas que otras en términos de costos de recopilación de datos.
El investigador consciente de los costos, por lo tanto, no querrá incluir una variable costosa en un modelo a
menos que haya evidencia de que hace una contribución valiosa a la capacidad predictiva del modelo.

El investigador que desee utilizar el análisis de regresión múltiple de la manera más efectiva
debe ser capaz de emplear alguna estrategia para hacer selecciones inteligentes entre las posibles
variables de predicción disponibles. Muchas de estas estrategias están en uso actualmente, y cada
una tiene sus defensores. Las estrategias varían en términos de complejidad y el tedio que implica su
empleo. Desafortunadamente, las estrategias no siempre conducen a la misma solución cuando se
aplican al mismo problema.

Regresión por pasosQuizás la estrategia más utilizada para seleccionar variables independientes
para un modelo de regresión múltiple es el procedimiento paso a paso. El procedimiento consta de
una serie de pasos. En cada paso del procedimiento, se evalúa cada variable en el modelo para ver si,
de acuerdo con los criterios especificados, debe permanecer en el modelo.
Supongamos, por ejemplo, que deseamos realizar una regresión por pasos para un
modelo que contienekvariables predictoras. La medida del criterio se calcula para cada variable.
De todas las variables que no cumplen el criterio de inclusión en el modelo, se elimina del
modelo la que menos cumple el criterio. Si se elimina una variable en este paso, se calcula la
ecuación de regresión para el modelo más pequeño y se calcula la medida del criterio para cada
variable ahora en el modelo. Si alguna de estas variables no cumple con el criterio de inclusión
en el modelo, se elimina la que menos lo cumple. Si se elimina una variable en este paso, la
variable que se eliminó en el primer paso se vuelve a ingresar en el modelo y se continúa con el
procedimiento de evaluación. Este proceso continúa hasta que no se pueden ingresar o
eliminar más variables.
La naturaleza del procedimiento paso a paso es tal que, aunque una variable puede eliminarse
del modelo en un paso, se evalúa para su posible reingreso al modelo en pasos posteriores.

El procedimiento STEPWISE de MINITAB, por ejemplo, utiliza elFestadístico como el


criterio evaluativo para decidir si una variable debe ser eliminada o añadida al modelo. A menos
que se especifique lo contrario, el valor de corte esF¼4. La impresión de los resultados
STEPWISE contienetestadística (la raíz cuadrada deF)en vez deFEstadísticas. En cada paso,
MINITAB calcula unFestadística para cada variable entonces en el modelo. Si elF estadística para
cualquiera de estas variables es menor que el valor de corte especificado (4 si no se especifica
algún otro valor), la variable con el menorFse elimina del modelo. La ecuación de regresión se
reajusta para el modelo reducido, se imprimen los resultados y se
11.3 PROCEDIMIENTOS DE SELECCIÓN DE VARIABLES 561

el procedimiento pasa al paso siguiente. Si no se puede eliminar ninguna variable, el procedimiento intenta
agregar una variable. UnFLa estadística se calcula para cada variable que no está en el modelo. De estas
variables, la de mayor valor asociadoFse añade la estadística, siempre que suFla estadística es mayor que el
valor límite especificado (4 si no se especifica ningún otro valor). La ecuación de regresión se reajusta para el
nuevo modelo, se imprimen los resultados y el procedimiento continúa con el siguiente paso. El
procedimiento se detiene cuando no se puede agregar o eliminar ninguna variable.
El siguiente ejemplo ilustra el uso del procedimiento paso a paso para seleccionar
variables para un modelo de regresión múltiple.

EJEMPLO. 11.3.1
A una directora de enfermería le gustaría usar las características personales de las enfermeras para
desarrollar un modelo de regresión para predecir el desempeño laboral (JOBPER). Las siguientes variables
están disponibles para elegir las variables independientes para incluir en el modelo:

X1¼asertividaddASRVÞ X2¼
entusiasmodENTHÞ X3¼
ambicióndAMBÞ
X4¼habilidades de comunicacióndCOMUNICACIÓNÞ X
5¼habilidades para resolver problemasdPROBLEMAÞ
X6¼iniciativadEN ESOÞ

Deseamos utilizar el procedimiento paso a paso para seleccionar variables independientes de las
disponibles en la tabla para construir un modelo de regresión múltiple para predecir el desempeño
laboral.

Solución: La tabla 11.3.1 muestra las medidas tomadas sobre la variable dependiente
JOBPER y cada una de las seis variables independientes para una muestra de 30
enfermeras.

TABLA 11.3.1 Medidas en siete variables para ejemplos 11.3.1

Y X1 X2 X3 X4 X5 X6

45 74 29 40 66 93 47
sesenta y cinco sesenta y cinco 50 64 68 74 49
73 71 67 79 81 87 33
63 64 44 57 59 85 37
83 79 55 76 76 84 33
45 56 48 54 59 50 42
60 68 41 66 71 69 37
73 76 49 sesenta y cinco 75 67 43
74 83 71 77 76 84 33
(Continuación)
562 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

Y X1 X2 X3 X4 X5 X6

69 62 44 57 67 81 43
66 54 52 67 63 68 36
69 61 46 66 84 75 43
71 63 56 67 60 64 35
70 84 82 68 84 78 37
79 78 53 82 84 78 39
83 sesenta y cinco 49 82 sesenta y cinco 55 38
75 86 63 79 84 80 41
67 61 64 75 60 81 45
67 71 45 67 80 86 48
52 59 67 64 69 79 54
52 71 32 44 48 sesenta y cinco 43
66 62 51 72 71 81 43
55 67 51 60 68 81 39
42 sesenta y cinco 41 45 55 58 51
sesenta y cinco 55 41 58 71 76 35
68 78 sesenta y cinco 73 93 77 42
80 76 57 84 85 79 35
50 58 43 55 56 84 40
87 86 70 81 82 75 30
84 83 38 83 69 79 41

Usamos MINITAB para obtener un modelo útil mediante el procedimiento paso a paso.
Las observaciones sobre la variable dependiente desempeño laboral (JOBPER) y las seis
variables independientes candidatas se almacenan en las columnas 1 a 7 de MINITAB,
respectivamente. La figura 11.3.1 muestra el procedimiento MINITAB apropiado y la
impresión de los resultados.
Para obtener los resultados de la Figura 11.3.1, los valores deFpara entrar yF
para eliminar ambos se configuraron automáticamente en 4. En el paso 1 no hay
variables a considerar para su eliminación del modelo. La variable AMB (Columna 4)
tiene asociada la mayorFestadística, que esF¼ (9.74)2¼94.8676. Dado que 94,8676 es
mayor que 4, se agrega AMB al modelo. En el paso 2, la variable INIT (Columna 7)
califica para agregarse al modelo ya que su asociadoFde (-2.2)2¼4,84 es mayor que 4 y
es la variable con mayor número asociadoFestadística. Se agrega al modelo. Después
del paso 2, no se pudo agregar ni eliminar ninguna otra variable y el procedimiento se
detuvo. Vemos, entonces, que el modelo elegido por el procedimiento paso a paso es
un modelo de dos variables independientes con AMB e INIT como variables
independientes. La ecuación de regresión estimada es

ŷ¼31:96þ :787X3- :45X6 &


11.3 PROCEDIMIENTOS DE SELECCIÓN DE VARIABLES 563

Caja de diálogo: Comando de sesión:

Estadística Regresión paso a paso MTB > Paso a paso C1 C2–C7;


SUBC> FEntrar 4.0;
TipoC1enRespuestayC2-C7enPredictores. SUBC> FReliminar 4.0.

Regresión por pasos

F-para-Entrar: 4.00 F-para-Quitar: 4.00

La respuesta es C1 en 6 predictores, con N = 30

Paso 1 2
Constante 7.226 31.955

C4 0.888 0.787
Relación T 9.74 8.13

C7 - 0,45
Relación T - 2.20

S 5.90 5.53
cuadrados R 77.21 80.68

FIGURA 11.3.1Procedimiento paso a paso de MINITAB y salida para los datos de la tabla 11.3.1.

Para cambiar el criterio para permitir que una variable ingrese al modelo de 4 a algún
otro valork,haga clic en Opciones, luego escriba el valor deseado deken el cuadro Entrar. El
nuevo criterioFla estadística, entonces, esken lugar de 4. Para cambiar el criterio para eliminar
una variable del modelo de 4 a algún otro valork,haga clic en Opciones, luego escriba el valor
deseado deken el cuadro Quitar. debemos elegirkentrar a ser mayor o igual akpara eliminar.

Aunque el procedimiento de selección paso a paso es una técnica común empleada por los investigadores,
hay otros métodos disponibles. A continuación se presenta una breve discusión de dos de estas herramientas. El
modelo final obtenido por cada uno de estos procedimientos es el mismo modelo que se encontró utilizando el
procedimiento paso a paso en el ejemplo 11.3.1.

Selección de reenvíoEsta estrategia está estrechamente relacionada con el procedimiento de


regresión por pasos. Este método construye un modelo usando correlaciones. Se conservan las
variables que cumplen los criterios de inclusión, como en la selección paso a paso. La primera variable
ingresada en el modelo es la que tiene mayor correlación con la variable dependiente. Si esta variable
cumple el criterio de inclusión, se mantiene. La siguiente variable a considerar para su inclusión es la
que tiene la correlación parcial más alta con la variable dependiente. Si cumple con los criterios de
inclusión, se conserva. Este procedimiento continúa hasta que todas las variables independientes han
564 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

sido considerado. El modelo final contiene todas las variables independientes que cumplen los
criterios de inclusión.

Eliminación hacia atrásEste procedimiento de construcción de modelos comienza con todas las
variables del modelo. Esta estrategia también construye un modelo usando correlaciones y un criterio
de inclusión predeterminado basado en elFestadística. La primera variable considerada para su
eliminación del modelo es la que tiene el coeficiente de correlación parcial más pequeño. Si esta
variable no cumple con el criterio de inclusión, se elimina del modelo. La siguiente variable a
considerar para la eliminación es la que tiene la siguiente correlación parcial más baja. Será eliminado
si no cumple con el criterio de inclusión. Este procedimiento continúa hasta que todas las variables
han sido consideradas para su eliminación. El modelo final contiene todas las variables
independientes que cumplen los criterios de inclusión.

EJERCICIOS

11.3.1Consulte los datos del Ejercicio 10.3.2 informados por Son et al. (A-6), que estudió el cuidado familiar en Corea de adultos
mayores con demencia. La variable de resultado, la carga del cuidador (CARGA), se midió mediante el Inventario de
Carga de Corea (KBI), donde las puntuaciones oscilaron entre 28 y 140, y las puntuaciones más altas indicaron una
mayor carga. Realice un análisis de regresión por pasos sobre las siguientes variables independientes informadas por
los investigadores:

CGAGE: edad del cuidador (años)


CGINCOME: ingresos del cuidador (Won-moneda coreana)
CGDUR: cuidador-duración del cuidado (mes)
AVD: total de actividades de la vida diaria donde puntuaciones bajas indican que los ancianos realizan actividades
independientemente.

MEM: problemas de memoria y de comportamiento con puntuaciones más altas que indican más problemas. COG:
deterioro cognitivo con puntuaciones más bajas que indican un mayor grado de deterioro cognitivo.
SOCIALSU: puntuación total de apoyo social percibido (25-175, los valores más altos indican más
apoyo). Los datos reportados son los siguientes.

CAJA INGRESO CGDUR AVD MEM DIENTE SOCIALSU CARGA

41 200 12 39 4 18 119 28
30 120 36 52 33 9 131 68
41 300 60 89 17 3 141 59
35 350 2 57 31 7 150 91
37 600 48 28 35 19 142 70
42 90 4 34 3 25 148 38
49 300 26 42 dieciséis 17 172 46
39 500 dieciséis 52 6 26 147 57
49 309 30 88 41 13 98 89
40 250 60 90 24 3 147 48
(Continuación)
EJERCICIOS 565

CAJA INGRESO CGDUR AVD MEM DIENTE SOCIALSU CARGA

40 300 36 38 22 13 146 74
70 60 10 83 41 11 97 78
49 450 24 30 9 24 139 43
55 300 18 45 33 14 127 76
27 309 30 47 36 18 132 72
39 250 10 90 17 0 142 61
39 260 12 63 14 dieciséis 131 63
44 250 32 34 35 22 141 77
33 200 48 76 33 23 106 85
42 200 12 26 13 18 144 31
52 200 24 68 34 26 119 79
48 300 36 85 28 10 122 92
53 300 12 22 12 dieciséis 110 76
40 300 11 82 57 3 121 91
35 200 8 80 51 3 142 78
47 150 60 80 20 18 101 103
33 180 19 81 20 1 117 99
41 200 48 30 7 17 129 73
43 300 36 27 27 27 142 88
25 309 24 72 9 0 137 64
35 250 12 46 15 22 148 52
35 200 6 63 52 13 135 71
45 200 7 45 26 18 144 41
36 300 24 77 57 0 128 85
52 600 60 42 10 19 148 52
41 230 6 60 34 11 141 68
40 200 36 33 14 14 151 57
45 400 96 49 30 15 124 84
48 75 6 89 64 0 105 91
50 200 30 72 31 3 117 83
31 250 30 45 24 19 111 73
33 300 2 73 13 3 146 57
30 200 30 58 dieciséis 15 99 69
36 250 6 33 17 21 115 81
45 500 12 34 13 18 119 71
32 300 60 90 42 6 134 91
55 200 24 48 7 23 165 48
50 309 20 47 17 18 101 94
37 250 30 32 13 15 148 57
40 1000 21 63 32 15 132 49
40 300 12 76 50 5 120 88
49 300 18 79 44 11 129 54
37 309 18 48 57 9 133 73
47 250 38 90 33 6 121 87
41 200 60 55 11 20 117 47
33 1000 18 83 24 11 140 60
28 309 12 50 21 25 117 sesenta y cinco

(Continuación)
566 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

CAJA INGRESO CGDUR AVD MEM DIENTE SOCIALSU CARGA

33 400 120 44 31 18 138 57


34 330 18 79 30 20 163 85
40 200 18 24 5 22 157 28
54 200 12 40 20 17 143 40
32 300 32 35 15 27 125 87
44 280 66 55 9 21 161 80
44 350 40 45 28 17 142 49
42 280 24 46 19 17 135 57
44 500 14 37 4 21 137 32
25 600 24 47 29 3 133 52
41 250 84 28 23 21 131 42
28 1000 30 61 8 7 144 49
24 200 12 35 31 26 136 63
sesenta y cinco 450 120 68 sesenta y cinco 6 169 89
50 200 12 80 29 10 127 67
40 309 12 43 8 13 110 43
47 1000 12 53 14 18 120 47
44 300 24 60 30 dieciséis 115 70
37 309 54 63 22 18 101 99
36 300 12 28 9 27 139 53
55 200 12 35 18 14 153 78
45 2000 12 37 33 17 111 112
45 400 14 82 25 13 131 52
23 200 36 88 dieciséis 0 139 68
42 1000 12 52 15 0 132 63
38 200 36 30 dieciséis 18 147 49
41 230 36 69 49 12 171 42
25 200 30 52 17 20 145 56
47 200 12 59 38 17 140 46
35 100 12 53 22 21 139 72
59 150 60 sesenta y cinco 56 2 133 95
49 300 60 90 12 0 145 57
51 200 48 88 42 6 122 88
54 250 6 66 12 23 133 81
53 30 24 60 21 7 107 104
49 100 36 48 14 13 118 88
44 300 48 82 41 13 95 115
36 200 18 88 24 14 100 66
64 200 48 63 49 5 125 92
51 120 2 79 34 3 116 97
43 200 66 71 38 17 124 69
54 150 96 66 48 13 132 112
29 309 19 81 66 1 152 88
Fuente: Datos proporcionados por cortesía de Gwi-Ryung Son, RN, Ph.D.
EJERCICIOS 567

11.3.2Machiel Naeije (A-7) identifica variables útiles para predecir la apertura máxima de la boca (MMO,
milímetros) para 35 voluntarios sanos. Las variables examinadas fueron:

EDAD: años
ABAJO_CON: traslación condilar hacia abajo, mm
FORW_CON: traslación condilar hacia adelante, mm 0¼
Género: Mujer, 1¼Longitud mandibular masculina,
MAN_LENG: mm
MAN_WIDT: ancho mandibular, mm

Utilice las siguientes medidas informadas para realizar una regresión paso a paso.

EDAD DOWN_CON FORW_CON GÉNERO MAN_LENG MAN_WIDT MMO

21.00 4.39 14.18 1 100.86 121.00 52.34


26.00 1.39 20.23 0 93.08 118.29 51.90
30.00 2.42 13.45 1 98.43 130.56 52.80
28.00 - . 18 19.66 1 102.95 125.34 50.29
21.00 4.10 22.71 1 108.24 125.19 57.79
20.00 4.49 13.94 0 98.34 113.84 49.41
21.00 2.07 19.35 0 95.57 115.41 53.28
19.00 - . 77 25.65 1 98.86 118.30 59.71
24.00 7.88 18.51 1 98.32 119.20 53.32
18.00 6.06 21.72 0 92.70 111.21 48.53
22.00 9.37 23.21 0 88.89 119.07 51.59
21.00 3.77 23.02 1 104.06 127.34 58.52
20.00 1.10 19.59 0 98.18 111.24 62.93
22.00 2.52 16.64 0 91.01 113.81 57.62
24.00 5.99 17.38 1 96.98 114.94 65.64
22.00 5.28 22.57 0 97.86 111.58 52.85
22.00 1.25 20.89 0 96.89 115.16 64.43
22.00 6.02 20.38 1 98.35 122.52 57.25
19.00 1.59 21.63 0 90.65 118.71 50.82
26.00 6.05 10.59 0 92.99 119.10 40.48
22.00 - 1.51 20.03 1 108.97 129.00 59.68
24.00 - . 41 24.55 0 91.85 100.77 54.35
21.00 6.75 14.67 1 104.30 127.15 47.00
22.00 4.87 17.91 1 93.16 123.10 47.23
22.00 . 64 17.60 1 94.18 113.86 41.19
29.00 7.18 15.19 0 89.56 110.56 42.76
25.00 6.57 17.25 1 105.85 140.03 51.88
20.00 1.51 18.01 0 89.29 121.70 42.77
27.00 4.64 19.36 0 92.58 128.01 52.34
26.00 3.58 16.57 1 98.64 129.00 50.45
23.00 6.64 12.47 0 83.70 130.98 43.18
25.00 7.61 18.52 0 88.46 124.97 41.99
22.00 5.39 11.66 1 94.93 129.99 39.45
31.00 5.47 12.85 1 96.81 132.97 38.91
23.00 2.60 19.29 0 93.13 121.03 49.10

Fuente: Datos proporcionados por cortesía de Machiel Naeije, DDS


568 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

11.3.3Uno de los propósitos de un estudio de Connor et al. (A-8) fue examinar la agresión reactiva entre niños y
adolescentes derivados a un centro de tratamiento residencial. Los investigadores utilizaron la Escala de
calificación proactiva/reactiva, obtenida al presentar tres declaraciones a los médicos que examinaron a los
sujetos. Los encuestados respondieron usando una escala del 1 al 5, donde 5 indica que la declaración casi
siempre se aplica al niño. Un ejemplo de una declaración de agresión reactiva es: “Cuando este niño ha sido
objeto de burlas o amenazas, se enfada con facilidad y contraataca”. La puntuación reactiva fue la respuesta
promedio a tres afirmaciones de este tipo. Con esta variable como variable de resultado, los investigadores
también examinaron lo siguiente: EDAD (años), VERBALIQ (coeficiente intelectual verbal), STIM (uso de
estimulantes), ABUSO DE EDAD (edad cuando se abusó por primera vez), CTQ
(una medida de hiperactividad en la que las puntuaciones más altas indican una mayor hiperactividad),
TOTALHOS (hostilidad total medida por un evaluador, donde los números más altos indican una mayor
hostilidad). Realice una regresión por pasos para encontrar las variables más útiles para predecir la agresión
reactiva en la siguiente muestra de 68 sujetos.

REACTIVO EDAD VERBALIQ STIM ABUSO DE EDAD CTQ TOTALHOS

4.0 17 91 0 0 0 8
3.7 12 94 0 1 29 10
2.3 14 105 0 1 12 10
5.0 dieciséis 97 0 1 9 11
2.0 15 97 0 2 17 10
2.7 8 91 0 0 6 4
2.0 10 111 0 0 6 6
3.3 12 105 0 0 28 7
2.0 17 101 1 0 12 9
4.3 13 102 1 1 8 11
4.7 15 83 0 0 9 9
4.3 15 66 0 1 5 8
2.0 15 90 0 2 3 8
4.0 13 88 0 1 28 8
2.7 13 98 0 1 17 10
2.7 9 135 0 0 30 11
2.7 18 72 0 0 10 9
2.0 13 93 0 2 20 8
3.0 14 94 0 2 10 11
2.7 13 93 0 1 4 8
3.7 dieciséis 73 0 0 11 11
2.7 12 74 0 1 10 7
2.3 14 97 0 2 3 11
4.0 13 91 1 1 21 11
4.0 12 88 0 1 14 9
4.3 13 90 0 0 15 2
3.7 14 104 1 1 10 10
3.0 18 82 0 0 1 7
4.3 14 79 1 3 6 7
1.0 dieciséis 93 0 0 5 8
4.3 dieciséis 99 0 1 21 11

(Continuación)
11.4 REGRESIÓN LOGÍSTICA 569

REACTIVO EDAD VERBALIQ STIM ABUSO DE EDAD CTQ TOTALHOS

2.3 14 73 0 2 8 9
3.0 12 112 0 0 15 9
1.3 15 102 0 1 1 5
3.0 dieciséis 78 1 1 26 8
2.3 9 95 1 0 23 10
1.0 15 124 0 3 0 11
3.0 17 73 0 1 1 10
3.3 11 105 0 0 23 5
4.0 11 89 0 0 27 8
1.7 9 88 0 1 2 8
2.3 dieciséis 96 0 1 5 7
4.7 15 76 1 1 17 9
1.7 dieciséis 87 0 2 0 4
1.7 15 90 0 1 10 12
4.0 12 76 0 0 22 10
5.0 12 83 1 1 19 7
4.3 10 88 1 0 10 5
5.0 9 98 1 0 8 9
3.7 12 100 0 0 6 4
3.3 14 80 0 1 3 10
2.3 dieciséis 84 0 1 3 9
1.0 17 117 0 2 1 9
1.7 12 145 1 0 0 5
3.7 12 123 0 0 1 3
2.0 dieciséis 94 0 2 6 6
3.7 17 70 0 1 11 13
4.3 14 113 0 0 8 8
2.0 12 123 1 0 2 8
3.0 7 107 0 0 11 9
3.7 12 78 1 0 15 11
4.3 14 73 0 1 2 8
2.3 18 91 0 3 8 10
4.7 12 91 0 0 6 9
3.7 15 111 0 0 2 9
1.3 15 71 0 1 20 10
3.7 7 102 0 0 14 9
1.7 9 89 0 0 24 6
Fuente: Datos proporcionados por cortesía de Daniel F. Connor, MD y Lang Lin.

11.4 REGRESIÓN LOGÍSTICA

Hasta ahora, nuestra discusión sobre el análisis de regresión se ha limitado a aquellas situaciones en las que
la variable dependiente es una variable continua, como el peso, la presión arterial o los niveles plasmáticos
de alguna hormona. Gran parte de la investigación en el campo de las ciencias de la salud se
570 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

motivado por el deseo de describir, comprender y hacer uso de la relación entre las
variables independientes y una variable dependiente (o de resultado) que es discreta.
Particularmente abundantes son las circunstancias en las que la variable de resultado es
dicotómica. Una variable dicotómica, recordemos, es una variable que puede asumir sólo
uno de dos valores mutuamente excluyentes. Estos valores suelen codificarseY¼1 para un
éxito yY¼0 para un fracaso o fracaso. Las variables dicotómicas incluyen aquellas cuyos
dos posibles valores son categorías tales como murió-no murió; curado-no curado;
enfermedad ocurrió enfermedad no ocurrió; y fumador-no fumador. El profesional de las
ciencias de la salud que se dedica a la investigación o necesita comprender los resultados
de la investigación realizada por otros encontrará ventajoso tener, al menos, una
comprensión básica deRegresión logística,el tipo de análisis de regresión que suele
emplearse cuando la variable dependiente es dicotómica. El propósito de la presente
discusión es proporcionar al lector este nivel de comprensión. Limitaremos nuestra
presentación al caso en el que sólo exista una variable independiente que puede ser
continua o dicotómica.

El modelo de regresión logísticaRecuerde que en el capítulo 9 nos referimos al análisis de


regresión que involucra solo dos variables como análisis de regresión lineal simple. El modelo
de regresión lineal simple se expresó mediante la ecuación

y¼b0þb1Xþmi (11.4.1)

en el cualyes un valor observado arbitrario de la variable dependiente continua. Cuando el valor


observado deYesmetroyjX, la media de una subpoblación deYvalores para un valor dado deX, la
cantidadmi,la diferencia entre lo observadoYy la línea de regresión (ver Figura 9.2.1) es cero, y
podemos escribir la Ecuación 11.4.1 como

metroyjX¼b0þb1X (11.4.2)

que también se puede escribir como

midyjX¼b0þb1X (11.4.3)

Generalmente, el lado derecho de las Ecuaciones (11.4.1) a (11.4.3) puede asumir cualquier
valor entre menos infinito y más infinito.
Aunque sólo intervienen dos variables, el modelo de regresión lineal simple no es
apropiado cuandoYes una variable dicotómica porque el valor esperado (o la media) deY
es la probabilidad de queY¼1 y, por lo tanto, está limitado al rango de 0 a 1, inclusive. Las
ecuaciones (11.4.1) a (11.4.3), entonces, son incompatibles con la realidad de la situación.

si dejamospag¼PAGdY¼1Þ,entonces la proporciónpag=d1 -pagÞpuede tomar valores


entre 0 y más infinito. Además, el logaritmo natural (ln) depag=d1 -pagÞpuede tomar valores
11.4 REGRESIÓN LOGÍSTICA 571

entre menos infinito y más infinito al igual que el lado derecho de las Ecuaciones 11.4.1 a
(11.4.3). Por lo tanto, podemos escribir

pag
en ¼b0 þbX1 (11.4.4)
1 -pag

La ecuación 11.4.4 se llamamodelo de regresión logísticay la transformación demetroyjX


(eso es,pag)a ln½pag=d1 -pagÞse llama eltransformación logit.La ecuación 11.4.4 también se puede escribir
como

Expdb0þb1XÞ
pag
¼ (11.4.5)
1þExpdb0þb1XÞ

donde exp es el inverso del logaritmo natural.


El modelo de regresión logística es ampliamente utilizado en la investigación en ciencias de la salud.
Por ejemplo, los epidemiólogos utilizan con frecuencia el modelo como un modelo para la probabilidad
(interpretada como el riesgo) de que un individuo adquiera una enfermedad durante un período de tiempo
específico durante el cual él o ella está expuesto a una condición (llamadafactor de riesgo)que se sabe o se
sospecha que está asociado con la enfermedad.

Regresión logística: variable independiente dicotómicaEl


La situación más simple en la que es aplicable la regresión logística es aquella en la que tanto
las variables dependientes como las independientes son dicotómicas. Los valores de la variable
dependiente (o de resultado) generalmente indican si un sujeto adquirió o no una enfermedad
o si el sujeto murió o no. Los valores de la variable independiente indican el estado del sujeto
en relación con la presencia o ausencia de algún factor de riesgo. En la discusión que sigue
asumimos que las dicotomías de las dos variables están codificadas como 0 y 1. Cuando este es
el caso, las variables pueden clasificarse de forma cruzada en una tabla, como la Tabla 11.4.1,
que contiene dos filas y dos columnas. . Las celdas de la tabla contienen las frecuencias de
ocurrencia de todos los posibles pares de valores de las dos variables: (1, 1), (1, 0), (0, 1) y (0, 0).

Un objetivo del análisis de los datos que cumplen estos criterios es una estadística conocida como relación de
probabilidades.Para entender el concepto de razón de probabilidades, debemos entender el términoimpares,

TABLA 11.4.1 Dos variables dicotómicas


clasificadas en cruz cuyos valores se codifican
como 1 y 0

Independiente
Variable (X)
Dependiente
Variable (Y) 1 0

1 norte1;1 norte1;0

2 norte0;1 norte0;0
572 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

que es utilizado con frecuencia por aquellos que hacen apuestas sobre los resultados de los eventos deportivos o participan en
otros tipos de actividades de juego. Usando la terminología de probabilidad, podemos definir las probabilidades de la siguiente
manera.

DEFINICIÓN
La probabilidad de éxito es la relación entre la probabilidad de éxito y la
probabilidad de fracaso.

La razón de probabilidades es una medida de cuánto mayor (o menor) es la probabilidad de que los
sujetos que poseen el factor de riesgo experimenten un resultado particular. Esta conclusión asume que el
resultado es un evento raro. Por ejemplo, cuando el resultado es contraer una enfermedad, la interpretación
de la razón de posibilidades asume que la enfermedad es rara.
Supongamos, por ejemplo, que la variable de resultado es la adquisición o no adquisición de cáncer
de piel y la variable independiente (o factor de riesgo) son los altos niveles de exposición al sol. El análisis de
dichos datos recopilados en una muestra de sujetos podría arrojar una razón de probabilidad de 2, lo que
indica que las probabilidades de cáncer de piel son dos veces mayores entre sujetos con altos niveles de
exposición al sol que entre sujetos sin altos niveles de exposición.
Los paquetes de software de computadora que realizan la regresión logística frecuentemente proporcionan
como parte de su salida estimaciones deb0yb1y el valor numérico de la razón de probabilidades. Resulta que la razón
de probabilidades es igual a exp(b1).

EJEMPLO 11.4.1
LaMont et al. (A-9) evaluó la enfermedad arterial coronaria obstructiva (OCAD) entre 113 hombres y 35
mujeres que se quejaron de dolor en el pecho o posible equivalente a su médico de atención primaria.
La Tabla 11.4.2 muestra la clasificación cruzada de OCAD con género. Deseamos utilizar el análisis de
regresión logística para determinar cuánto mayores son las probabilidades de encontrar OCAD entre
los hombres que entre las mujeres.

Solución: Podemos usar el SAS®paquete de software para analizar estos datos. La variable
independiente es el género y la variable dependiente es el estado con respecto a tener
enfermedad arterial coronaria obstructiva (OCAD). Uso del SAS®produce el comando
PROC LOGIST. como parte de la salida resultante, las estadísticas que se muestran en
la Figura 11.4.1.

TABLA 11.4.2 Casos de enfermedad arterial coronaria


obstructiva (OCAD) clasificados por sexo

Enfermedad machos Hembras Total

OCAD presente 92 15 107


OCAD no presente 21 20 41

Total 113 35 148


Fuente: Datos proporcionados por cortesía de Matthew J. Budoff, MD
11.4 REGRESIÓN LOGÍSTICA 573

El Procedimiento LOGÍSTICO

Análisis de Estimaciones de Máxima Verosimilitud

Parámetro Estimación del DF Estándar Wald


Error chi-cuadrado Pr > ChiSq

Interceptar 1 - 0.2877 0.3416 0.7090 0.3997


sexo 1 1.7649 0.4185 17.7844 <.0001

FIGURA 11.4.1Resultado parcial del uso de SAS®comando PROC LOGISTIC con los datos de la Tabla
11.4.2.

Vemos que la estimación deaes -0.2877 y la estimación deb1es


1.7649. Entonces, la razón de probabilidades estimada esO CR¼Expd1:7649¼5:84. De este modo,
estimamos que las probabilidades de encontrar un caso de enfermedad arterial coronaria
obstructiva son casi seis veces mayores entre los hombres que entre las mujeres. &

Regresión Logística: Variable Independiente ContinuaAhora deja


Consideremos la situación en la que tenemos una variable dependiente dicotómica y una variable
independiente continua. Supondremos que se dispone de un ordenador para realizar los cálculos.
Nuestra discusión, en consecuencia, se centrará en una evaluación de la idoneidad del modelo como
una representación de los datos disponibles, la interpretación de los elementos clave de la impresión
de la computadora y el uso de los resultados para responder preguntas relevantes sobre la relación
entre los dos. variables

EJEMPLO 11.4.2
Según Gallagher et al. (A-10), los programas de rehabilitación cardíaca ofrecen “información, apoyo y
seguimiento para el retorno a las actividades, manejo de síntomas y modificación de factores de
riesgo”. Los investigadores realizaron un estudio para identificar entre las mujeres los factores que
están asociados con la participación en tales programas. Los datos de la Tabla 11.4.3 son las edades
de 185 mujeres dadas de alta de un hospital en Australia que cumplieron con los criterios de
elegibilidad relacionados con el alta por infarto de miocardio, cirugía de derivación arterial,
angioplastia o stent. Deseamos utilizar estos datos para obtener información sobre la relación entre la
edad (años) y la participación en un programa de rehabilitación cardíaca (ATT¼1, si participó, y ATT¼0,
si no). También deseamos saber si podemos usar los resultados de nuestro análisis para predecir la
probabilidad de participación de una mujer si conocemos su edad.

Solución: La variable independiente es la variable continua edad (EDAD), y la variable


dependiente o de respuesta es el estado con respecto a la asistencia a un
programa de rehabilitación cardiaca. La variable dependiente es una variable
dicotómica que puede asumir uno de dos valores: 0¼no asistió, y 1¼hizo
574 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

TABLA 11.4.3 Edades de las mujeres que participan y no participan


en un programa de rehabilitación cardíaca

No participante Participativo
(ATT¼0) (ATT¼1)

50 73 46 74 74 62
59 75 57 59 50 74
42 71 53 81 55 61
50 69 40 74 66 69
34 78 73 77 49 76
49 69 68 59 55 71
67 74 72 75 73 61
44 86 59 68 41 46
53 49 64 81 64 69
45 63 78 74 46 66
79 63 68 sesenta y cinco sesenta y cinco 57
46 72 67 81 50 60
62 64 55 62 61 63
58 72 71 85 64 63
70 79 80 84 59 56
60 75 75 39 73 70
67 70 69 52 73 70
64 73 80 67 sesenta y cinco 63
62 66 79 82 67 63
50 75 71 84 60 sesenta y cinco

61 73 69 79 69 67
69 71 78 81 61 68
74 72 75 74 79 84
sesenta y cinco 69 71 85 66 69
80 76 69 92 68 78
69 60 77 69 61 69
77 79 81 83 63 79
61 78 78 82 70 83
72 62 76 85 68 67
67 73 84 82 59 47
80 64 57
66
Fuente: Datos proporcionados por cortesía de Robyn Gallagher, RN, Ph.D.

asistir. Usamos el SAS®paquete de software para analizar los datos. el sas®


El comando es PROC LOGISTIC, pero si deseamos predecir la asistencia en el
programa cardíaco, debemos usar la opción “descendente” con PROC
LOGISTIC. (Cuando desee predecir el resultado etiquetado como "1" de la
variable dependiente, use la "opción descendente" en SAS®. Consultar
11.4 REGRESIÓN LOGÍSTICA 575

Estándar Wald
Parámetro DF Estimar Error chi-cuadrado Pr > ChiSq

Interceptar 1 1.8744 0.9809 3.6518 0.0560


edad 1 0.0379 0.0146 6.7083 0.0096

FIGURA 11.4.2SAS parcial®impresión del análisis de regresión logística de los datos en la Tabla 11.4.3.

S.A.S.®documentación para obtener más detalles). En la Figura 11.4.2 se muestra una copia
impresa parcial del análisis.
La pendiente de nuestra regresión es -0,0379 y el intercepto es 1,8744. La
ecuación de regresión, entonces, es

ŷi¼1:8744 - :0379Xi

donde ŷi¼en½p̂id1 - p̂iÞy Pies la probabilidad predicha de asistir a


rehabilitación cardíaca para una mujer de edadXi.

Prueba deH0esob1¼0
Llegamos a una conclusión sobre la adecuación del modelo logístico probando la hipótesis nula
de que la pendiente de la línea de regresión es cero. La estadística de prueba esz¼b̂1= sbdónde
zes el estadístico normal estándar, b̂1es la pendiente de la muestra (-.0379), ysbes su s1error
estándar (.0146) como se muestra en la Figura 11.4.2. A partir de estos números1calcularz¼
- . 0379/.0146¼-2.5959, que tiene un lado asociadopagvalor de .0094. Concluimos, por
tanto, que el modelo logístico es adecuado. la plaza dezes chi-cuadrado con 1 grado de
libertad, un estadístico que se muestra en la Figura 11.4.2.

Uso de la regresión logística para estimarpag


Podemos usar la Ecuación 11.4.5 y los resultados de nuestro análisis para estimarpag,la probabilidad
de que una mujer de una edad dada (dentro del rango de edades representado por los datos) asista a
un programa de rehabilitación cardíaca. Supongamos, por ejemplo, que deseamos estimar la
probabilidad de que una mujer de 50 años participe en un programa de rehabilitación. Sustituyendo
50 y los resultados que se muestran en la Figura 11.4.2 en la Ecuación 11.4.5 da

Exp½1:8744 -d:0379Þð50Þ
pag¼ ¼ :49485
1þExp½1:8744 -d:0379Þð50Þ

S.A.S.®calcula las probabilidades estimadas para los valores dados deX.Podemos ver las
probabilidades estimadas de asistir a programas de rehabilitación cardiaca para el rango de edad de
los sujetos inscritos en el estudio en la Figura 11.4.3. Dado que la pendiente fue negativa, vemos una
probabilidad decreciente de asistir a un programa de rehabilitación cardíaca para mujeres mayores.
576 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

0,65

0,60

0,55

0.50
Probabilidad estimada

0,45

0.40

0.35

0.30

0.25

0.20

0.15
30 40 50 60 70 80 90 100
FIGURA 11.4.3Probabilidades estimadas de asistencia por edades dentro del estudio para el
Ejemplo 11.4.2. &

Regresión Logística MúltipleLos profesionales a menudo están interesados en las


relaciones de varias variables independientes con una variable de respuesta. Estas variables
independientes pueden ser continuas o discretas o una combinación de las dos.
Los modelos logísticos múltiples se construyen expandiendo las Ecuaciones (11.4.1) a (11.4.4). Si
comenzamos con la Ecuación 11.4.4, la regresión logística múltiple se puede representar como

pag
en ¼b0 þbX1 1jþ bX
2 2j þ þ bX
k kj (11.4.6)
1 -pag

Usando la transformación logit, ahora tenemos

-
Expb0þb1X1jþb2X2jþ þbkXkj
pag¼ - (11.4.7)
1þExpb0þb1X1jþb2X2jþ þbkXkj

EJEMPLO 11.4.3
Considere los datos presentados en el ejercicio de revisión 24. En este estudio de Fils-Aime et al.
(A-21), se recogieron y clasificaron los datos con respecto al consumo de alcohol. Los sujetos se
clasificaron como de inicio temprano (< 25 años) o tardío (> 25 años) de consumo excesivo de alcohol.
11.4 REGRESIÓN LOGÍSTICA 577

Parámetro B SE Wald DF Sig. Exp(B)

5-HIAA . 013 . 006 5.878 1 . 015 . 987


TRIPTO . 000 . 000 . 000 1 . 983 1.000
Constante 2.076 1.049 3.918 1 . 048 7.970

FIGURA 11.4.4Salida de SPSS para los datos del Ejemplo 11.4.3.

También se obtuvieron los niveles de triptófano (TRYPT) y ácido 5-hidroxiindolacético (5-


HIAA) en líquido cefalorraquídeo (LCR).

Solución: Las variables independientes son las concentraciones de TRYPT y 5-HIAA, y la


variable dependiente es la respuesta dicotómica de inicio de consumo excesivo
de alcohol. Utilizamos el software SPSS para analizar los datos. El resultado se
presenta en la Figura 11.4.4.
La ecuación se puede escribir como

ŷi¼2:076 - :013X1jþ0X2j

Tenga en cuenta que el coeficiente de TRYPT es 0 y, por lo tanto, no juega un papel en el


modelo.

Prueba de H0esob1¼0
Las pruebas de significación de los coeficientes de regresión se pueden obtener directamente de la figura
11.4.4. Tenga en cuenta que tanto la constante (intersección) como las variables 5-HIAA son significativas en
el modelo (ambas tienenpagvalores, anotados como “Sig.” en la tabla, <.05); sin embargo, TRYPT no es
significativo y, por lo tanto, no necesita estar en el modelo, lo que sugiere que no es útil para identificar a los
participantes del estudio con inicio temprano o tardío de alcoholismo.
Como antes, las probabilidades se pueden obtener fácilmente utilizando la Ecuación
11.4.7 y sustituyendo los valores obtenidos del análisis. &

Evaluación de la bondad de ajusteUna pregunta natural que surge al hacer una regresión
logística es: "¿Qué tan bueno es mi modelo?" En la regresión lineal clásica discutimos medidas comoR2
para determinar cuánta variación explica el modelo, con valores deR2acercándose a 1 como un buen
indicador de la adecuación del modelo basado en los predictores elegidos para modelar el resultado.
Dada la naturaleza de la variable de respuesta en la regresión logística, un coeficiente de
determinación no proporciona la misma información que en la regresión lineal. Esto se debe a que en
la regresión logística los valores de los parámetros no se derivan para minimizar las sumas de los
cuadrados, sino que son estimaciones iterativas; por lo tanto, no hay una medida equivalente deR2en
regresión logística. A continuación, brindamos una explicación de algunos enfoques comúnmente
utilizados para evaluar modelos de regresión logística y seguimos estas explicaciones con dos
ejemplos ilustrativos.
Muchos autores han intentado desarrollar lo que se conoce como “pseudo-R2” valores que van
de 0 a 1, donde los valores más altos indican un mejor ajuste. En general, estas medidas son
578 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

basado en comparaciones de un modelo derivado con un modelo que contiene solo una intersección.
En otras palabras, son medidas comparativas diseñadas para indicar "cuánto mejor" es un modelo
con variables predictoras en comparación con un modelo sin predictores. Dos pseudo-R2las
estadísticas fueron desarrolladas por Cox y Snell (4) y Nagelkerke (5). Estos a menudo se proporcionan
en los resultados estándar del software estadístico. El valor de estas medidas es el hecho de que
pueden ser útiles para comparar modelos con diferentes variables predictoras, pero brindan poca
utilidad relativa para examinar un solo modelo. Ambos enfoques se basan en la idea de utilizar una
medida de ajuste conocida como estadística de verosimilitud logarítmica. El logaritmo de
verosimilitud para el modelo de intercepción solamente se usa para representar la suma total de
cuadrados, mientras que el logaritmo de verosimilitud para el modelo con variables predictoras se
usa para representar la suma de cuadrados del error. Los lectores interesados pueden encontrar una
explicación de la estadística de verosimilitud en Hosmer y Lemeshow (2).
Otro enfoque intuitivo es considerar una tabla de clasificación. Con este método, se desarrolla una tabla de contingencia que proporciona

recuentos de frecuencia de la cantidad de puntos de datos que se observaron como 0 o 1 en los datos sin procesar, junto con si los datos sin procesar se

clasificaron como 0 o 1 según la ecuación predictiva. . Entonces se puede estimar cuántos de los puntos de datos se clasificaron correctamente. Como

regla general, clasificar correctamente el 70 por ciento o más se considera evidencia de un modelo satisfactorio desde un punto de vista estadístico. Sin

embargo, es posible que el modelo no proporcione una capacidad predictiva lo suficientemente grande como para ser útil en un sentido práctico. Sin

embargo, surge un problema, ya que la reclasificación de los mismos datos utilizados para construir un modelo con el propio modelo puede sesgar los

resultados. Hay dos formas prácticas de lidiar con este problema. Primero, uno puede usar parte del conjunto de datos para construir el modelo y la otra

parte del conjunto de datos para desarrollar una tabla de clasificación. Esta estrategia, por supuesto, requiere una muestra lo suficientemente grande

como para acomodar adecuadamente las necesidades de ambos procedimientos. Un segundo enfoque es construir un modelo utilizando los datos

disponibles y luego recopilar datos adicionales para probar la idoneidad del modelo utilizando una tabla de clasificación. Esta estrategia también tiene

sus deficiencias, ya que la recopilación de datos adicionales puede llevar mucho tiempo y ser costosa. Un segundo enfoque es construir un modelo

utilizando los datos disponibles y luego recopilar datos adicionales para probar la idoneidad del modelo utilizando una tabla de clasificación. Esta

estrategia también tiene sus deficiencias, ya que la recopilación de datos adicionales puede llevar mucho tiempo y ser costosa. Un segundo enfoque es

construir un modelo utilizando los datos disponibles y luego recopilar datos adicionales para probar la idoneidad del modelo utilizando una tabla de

clasificación. Esta estrategia también tiene sus deficiencias, ya que la recopilación de datos adicionales puede llevar mucho tiempo y ser costosa.

Un tercer enfoque que también tiene un atractivo visual intuitivo es desarrollar una gráfica que
muestre la frecuencia de las observaciones frente a su probabilidad predicha. En este tipo de gráfico, uno
esperaría ver una separación completa de los valores 0 y 1. Cuando hay una clasificación incorrecta de la
variable de resultado, este tipo de gráfico proporciona un medio para determinar dónde ocurrió la
clasificación incorrecta y con qué frecuencia se clasificaron incorrectamente las observaciones.
Finalmente, en un enfoque de uso común conocido como prueba de Hosmer y Lemeshow, se
desarrolla una tabla de frecuencias observadas y esperadas y se usa una prueba de chi-cuadrado para
determinar si existe una desviación significativa entre las frecuencias observadas y esperadas. Para el
lector interesado sugerimos el texto de Hosmer y Lemeshow (2).

EJEMPLO 11.4.4
Considere el modelo de regresión logística que se construyó a partir de los datos del programa de
rehabilitación cardíaca en el ejemplo 11.4.2.
La figura 11.4.5 muestra la salida estándar de SPSS para este modelo de regresión logística. En
esta figura, vemos que tanto Cox and Snell como Nagelkerke pseudo-R2se proporcionan valores. Dado
que ambos son > 0, el modelo con el predictor brinda más información que el modelo de solo
intercepto. Uno puede ver fácilmente que solo el 63% de los datos fueron correctos.
11.4 REGRESIÓN LOGÍSTICA 579

Resumen Modelo
Cox y Snell R. Nagelkerke R

Cuadrado Cuadrado

. 037 . 051

Tabla de clasificacióna

Predicho
att Porcentaje

Observado 0 1 Correcto

att 0 111 10 91.7


1 58 5 7.9
Porcentaje general 63.0

FIGURA 11.4.5Salida parcial de SPSS para el análisis de regresión logística de los datos del Ejemplo
11.4.2.

reclasificados, con aquellos que participan en el programa de rehabilitación mucho peor clasificados
que aquellos que no asistieron al programa. La distribución de frecuencias muestra el gran número
de ATT¼1 sujetos que fueron clasificados erróneamente como ATT¼0 según el modelo. &

EJEMPLO 11.4.5
Considere el modelo de regresión logística que se construyó a partir de los datos del programa de
rehabilitación cardíaca en el ejemplo 11.4.3.
La Figura 11.4.6 muestra la salida estándar de SPSS para este modelo de regresión logística. En esta
figura, vemos que tanto Cox and Snell como Nagelkerke pseudo-R2se proporcionan valores y, dado que
ambos son > 0, el modelo con los predictores proporciona más información que el modelo de solo
intercepción. Se puede ver fácilmente que solo el 69% de los datos se reclasificaron correctamente, con el
modelo reclasificando a aquellos con inicio de consumo excesivo de alcohol en una proporción mucho mayor.
580 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

Resumen Modelo
Cox y Snell R. Nagelkerke R

Cuadrado Cuadrado

0.49 . 069

Tabla de clasificacióna

Predicho
Comienzo Porcentaje

Observado 0 1 Correcto

comienzo 0 2 37 5.1

a. El corte

FIGURA 11.4.6Salida parcial de SPSS para el análisis de regresión logística de los datos del Ejemplo 11.4.3.

tasa más alta que aquellos sin tal inicio. La distribución de frecuencias muestra el gran número de personas
sin inicio de consumo excesivo de alcohol predicho por el modelo para desarrollar inicio temprano de
alcoholismo. &

Regresión logística politómicaHasta ahora hemos limitado nuestra discusión a situaciones en las
que existe una variable de respuesta dicotómica (p. ej., exitoso o no exitoso). A menudo, tenemos una
situación en la que múltiples categorías componen la respuesta. Podemos, por ejemplo, tener sujetos
clasificados como positivos, negativos e indeterminados para una determinada enfermedad (una
respuesta politómica estándar). También puede haber ocasiones en las que tengamos una variable de
respuesta que esté ordenada. Podemos, por ejemplo, clasificar a nuestros sujetos según el IMC en
bajo peso, peso ideal, sobrepeso u obesidad (una respuesta politómica ordinal). El proceso de
modelado es un poco más complejo y requiere el uso de un programa de computadora. Para aquellos
interesados en explorar más a fondo estos valiosos métodos, recomendamos el libro de Hosmer y
Lemeshow (2).
EJERCICIOS 581

Otras lecturasHemos discutido solo los conceptos básicos y las aplicaciones de la regresión logística.
La técnica tiene una aplicación mucho más amplia. El análisis de regresión por pasos se puede utilizar
con la regresión logística. También hay técnicas disponibles para construir intervalos de confianza
para razones de probabilidades. El lector que desee aprender más sobre la regresión logística puede
consultar los libros de Hosmer y Lemeshow (2) y Kleinbaum (3).

EJERCICIOS

11.4.1En un estudio de victimización violenta de mujeres y hombres, Porcerelli et al. (A-11) recopiló información de 679 mujeres
y 345 hombres de 18 a 64 años de edad en varios centros de medicina familiar en el área metropolitana de Detroit.
Los pacientes completaron un cuestionario de historial de salud que incluía una pregunta sobre victimización. La
siguiente tabla muestra los sujetos de muestra clasificados de forma cruzada por género y si el sujeto se identificó a
sí mismo como "golpeado, pateado, puñetazo o lastimado de otra manera por alguien en el último año". Los sujetos
que responden afirmativamente a esa pregunta se clasifican como "victimizados violentamente".
Utilice el análisis de regresión logística para encontrar los coeficientes de regresión y la estimación de la razón de
probabilidades. Escribe una interpretación de tus resultados.

Persecución Mujer Hombres Total

Sin victimización 611 308 919


Violentamente victimizado 68 37 105
Total 679 345 1024
Fuente: John H. Porcerelli, Rosemary Cogan, Patricia P. West, Edward A. Rose, Dawn
Lambrecht, Karen E. Wilson, Richard K. Severson y Dunia Karana, “Vitimización violenta de
mujeres y hombres: síntomas físicos y psiquiátricos, ”Revista de la Junta Estadounidense de
Medicina Familiar, 16 (2003), 32–39.

11.4.2Consulte la investigación de Gallagher et al. (A-10) discutido en el Ejemplo 11.4.2. Otra covariable de
interés fue una puntuación utilizando el Índice de Ansiedad y Depresión Hospitalaria. Un valor más alto para esta
puntuación indica un mayor nivel de ansiedad y depresión. Use los siguientes datos para predecir si una mujer en el
estudio participó en un programa de rehabilitación cardíaca.

Ansiedad hospitalaria
y depresión
Puntuaciones índice para

Índice de Ansiedad y Depresión Hospitalaria Participativo


Puntuaciones para mujeres no participantes Mujer

17 14 19 dieciséis 23 25
7 21 6 9 3 6
19 13 8 22 24 29
dieciséis 15 13 17 13 22
23 21 4 14 26 11
27 12 15 14 19 12
23 9 23 5 25 20
18 29 19 5 15 18
21 4 14 14 22 24
27 18 19 20 13 18
(Continuación)
582 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

Ansiedad hospitalaria
y depresión
Puntuaciones índice para

Índice de Ansiedad y Depresión Hospitalaria Participativo


Puntuaciones para mujeres no participantes Mujer

14 22 17 21 21 8
25 5 13 17 15 10
19 27 14 17 12 17
23 dieciséis 14 10 25 14
6 11 17 13 29 21
8 19 26 10 17 25
15 23 15 20 21 25
30 22 19 3 8 dieciséis

18 25 dieciséis 18 19 23
10 11 10 9 dieciséis 19
29 20 15 10 24 24
8 11 22 5 17 11
12 28 8 15 26 17
27 12 15 13 12 19
12 19 20 dieciséis 19 20
9 18 12 13 17
dieciséis 13 2 23 31
6 12 6 11 0
22 7 14 17 18
10 12 19 29 18
9 14 14 6 15
11 13 19 20
Fuente: Datos proporcionados por cortesía de Robyn Gallagher, RN, Ph.D.

11.5 RESUMEN

Este capítulo se incluye para el beneficio de aquellos que deseen ampliar su comprensión
del análisis de regresión y su capacidad para aplicar técnicas a modelos que son más
complejos que los que se cubren en los Capítulos 9 y 10. En este capítulo presentamos
algunos temas adicionales del análisis de regresión. . Discutimos el análisis que es
apropiado cuando una o más de las variables independientes son dicotómicas. En esta
discusión se presenta el concepto de codificación de variables ficticias. Un segundo tema
que discutimos es cómo seleccionar las variables independientes más útiles cuando
tenemos una larga lista de candidatos potenciales. La técnica que ilustramos para este
propósito es el análisis de regresión por pasos. Finalmente, presentamos los conceptos y
procedimientos básicos que intervienen en el análisis de regresión logística. Abarcamos
dos situaciones:
Dado que los cálculos necesarios para obtener resultados útiles a partir de datos
apropiados para el análisis por medio de las técnicas presentadas en este capítulo son
complicados y consumen mucho tiempo cuando se intentan a mano, se recomienda utilizar una
computadora para trabajar los ejercicios.
Traducido del inglés al español - www.onlinedoctranslator.com

PREGUNTAS DE REPASO Y EJERCICIOS 583

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 11

Fórmula
Número Nombre Fórmula

11.4.1– Representaciones del modelo de y¼b0þb1Xþellos


11.4.3 regresión lineal simple yjX¼b0þb1X
midyjXÞ¼b0þb1X
Hola
11.4.4 Modelo de regresión logística simple
1-pag¼b0þb1X
enpag

11.4.5 Representación alternativa del modelo Expdb0 þb1XÞ


pag¼
de regresión logística simple 1þExpdb0þb1XÞ
h i
11.4.6 Representación alternativa del modelo pag
en 1-pag ¼b0þb1X1jþb2X2jþ þbkXkj
de regresión logística múltiple
-
11.4.7 Representación alternativa del modelo Expb0þb1X1jþb2X2jþ þbkXkj
de regresión logística múltiple
pag¼ -
1þExpb0þb1X1jþb2X2jþ þbkXkj

Símbolo b0¼intercepción de regresión bi¼


Llave coeficiente de regresion mi¼término de
error del modelo de regresión
midyjXÞ¼valor esperado deyenX
Hola
enpag
1-pag¼registrarlo transformación

metroyjX¼significado deyenX
Xi¼valor de la variable independiente eni

PREGUNTAS DE REPASO Y EJERCICIOS

1.¿Qué es una variable cualitativa?

2.¿Qué es una variable ficticia?

3.Explicar e ilustrar la técnica de codificación de variables ficticias.

4.¿Por qué es importante el conocimiento de las técnicas de selección de variables para el investigador en ciencias de la salud?

5.¿Qué es la regresión por pasos?

6.Explique el concepto básico involucrado en la regresión por pasos.

7.¿Cuándo se usa la regresión logística?

8.Escriba y explique los componentes del modelo de regresión logística.

9.Definir la palabraimpares.

10¿Qué es una razón de probabilidades?

11Dé un ejemplo en su campo en el que el análisis de regresión logística sería apropiado cuando la variable
independiente es dicotómica.
584 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

12Dé un ejemplo en su campo en el que el análisis de regresión logística sería apropiado cuando la variable
independiente es continua.

13Encuentre un artículo publicado en el campo de las ciencias de la salud en el que se emplee cada una de las siguientes técnicas:

(a)Codificación de variables ficticias

(b)Regresión paso a paso


(C)Regresión logística
Redacta un informe sobre el artículo en el que identifiques las variables involucradas, el motivo de la elección
de la técnica y las conclusiones a las que llegan los autores a partir de su análisis.

14En el Ejemplo 10.3.1, vimos que el propósito de un estudio de Jansen y Keller (A-12) era predecir la capacidad
para dirigir la atención (CDA) en sujetos de edad avanzada. El estudio recopiló información sobre 71 mujeres
mayores que vivían en la comunidad con un estado mental normal. Las puntuaciones más altas de CDA
indican un mejor funcionamiento atencional. Además de las variables edad y nivel educativo, los
investigadores realizaron una regresión por pasos con dos variables adicionales: IADL, una medida de las
actividades de la vida diaria (los valores más altos indican un mayor número de actividades diarias), y ADS,
una medida de las demandas de atención (mayor valores indican más demandas atencionales). Realice una
regresión por pasos con los datos de la siguiente tabla e informe su modelo final,pagvalores y conclusiones.

CDA Edad Edyrs AIVD ANUNCIOS CDA Edad Edyrs AIVD ANUNCIOS

4.57 72 20 28 27 3.17 79 12 28 18
- 3:04 68 12 27 96 - 1:19 87 12 21 61
1.39 sesenta y cinco 13 24 97 0.99 71 14 28 55
- 3:55 85 14 27 48 - 2:94 81 dieciséis 27 124
- 2:56 84 13 28 50 - 2:21 66 dieciséis 28 42
- 4:66 90 15 27 47 - 0:75 81 dieciséis 28 64
- 2:70 79 12 28 71 5.07 80 13 28 26
0.30 74 10 24 48 - 5:86 82 12 28 84
- 4:46 69 12 28 67 5.00 sesenta y cinco 13 28 43
- 6:29 87 15 21 81 0,63 73 dieciséis 26 70
- 4:43 84 12 27 44 2.62 85 dieciséis 28 20
0.18 79 12 28 39 1.77 83 17 23 80
- 1:37 71 12 28 124 - 3:79 83 8 27 21
3.26 76 14 29 43 1.44 76 20 28 26
- 1:12 73 14 29 30 - 5:77 77 12 28 53
- 0:77 86 12 26 44 - 5:77 83 12 22 69
3.73 69 17 28 47 - 4:62 79 14 27 82
- 5:92 66 11 28 49 - 2:03 69 12 28 77
5.74 sesenta y cinco dieciséis 28 48 - 2:22 66 14 28 38
2.83 71 14 28 46 0.80 75 12 28 28
- 2:40 80 18 28 25 - 0:75 77 dieciséis 27 85
- 0:29 81 11 28 27 - 4:60 78 12 22 82
4.44 66 14 29 54 2.68 83 20 28 34
3.35 76 17 29 26 - 3:69 85 10 20 72
- 3:13 70 12 25 100 4.85 76 18 28 24
- 2:14 76 12 27 38 - 0:08 75 14 29 49
9.61 67 12 26 84 0,63 70 dieciséis 28 29
7.57 72 20 29 44 5.92 79 dieciséis 27 83
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 585

CDA Edad Edyrs AIVD ANUNCIOS CDA Edad Edyrs AIVD ANUNCIOS

2.21 68 18 28 52 3.63 75 18 28 32
- 2:30 102 12 26 18 - 7:07 94 8 24 80
1.73 67 12 27 80 6.39 76 18 28 41
6.03 66 14 28 54 - 0:08 84 18 27 75
- 0:02 75 18 26 67 1.07 79 17 27 21
- 7:65 91 13 21 101 5.31 78 dieciséis 28 18
4.17 74 15 28 90 0.30 79 12 28 38
Fuente: Datos proporcionados por cortesía de Debra Jansen, Ph.D., RN

15.En la siguiente tabla se encuentran el gasto cardíaco (L/min) y el consumo de oxígeno (VO) para una
2
muestra de
adultos (A) y niños (C), que participaron en un estudio diseñado para investigar la relación entre estas
variables. Las medidas se tomaron tanto en reposo como durante el ejercicio. Trate el gasto cardíaco como la
variable dependiente y utilice la codificación de variables ficticias y analice los datos mediante técnicas de
regresión. Explique los resultados. Grafique los datos originales y las ecuaciones de regresión ajustadas.

Cardíaco VO2 Edad Cardíaco VO2


Salida (L/min) (L/min) Grupo Salida (L/min) (L/min) Grupo de edad

4.0 . 21 A 4.0 . 25 C
7.5 . 91 C 6.1 . 22 A
3.0 . 22 C 6.2 . 61 C
8.9 . 60 A 4.9 . 45 C
5.1 . 59 C 14.0 1.55 A
5.8 . 50 A 12.9 1.11 A
9.1 . 99 A 11.3 1.45 A
3.5 . 23 C 5.7 . 50 C
7.2 . 51 A 15.0 1.61 A
5.1 . 48 C 7.1 . 83 C
6.0 . 74 C 8.0 . 61 A
5.7 . 70 C 8.1 . 82 A
14.2 1.60 A 9.0 1.15 C
4.1 . 30 C 6.1 . 39 A

dieciséis.Una muestra aleatoria simple de sujetos normales entre las edades de 6 y 18 arrojó los datos sobre el potasio
corporal total (mEq) y el agua corporal total (litros) que se muestran en la siguiente tabla. Sea el potasio total la
variable dependiente y utilice la codificación de variables ficticias para cuantificar la variable cualitativa. Analizar los
datos utilizando técnicas de regresión. Explique los resultados. Grafique los datos originales y las ecuaciones de
regresión ajustadas.

Cuerpo completo Cuerpo completo Cuerpo completo Cuerpo completo

Potasio Agua Sexo Potasio Agua Sexo

795 13 METRO 950 12 F


1590 dieciséis F 2400 26 METRO

1250 15 METRO 1600 24 F


1680 21 METRO 2400 30 METRO

(Continuación)
586 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

Cuerpo completo Cuerpo completo Cuerpo completo Cuerpo completo

Potasio Agua Sexo Potasio Agua Sexo

800 10 F 1695 26 F
2100 26 METRO 1510 21 F
1700 15 F 2000 27 F
1260 dieciséis METRO 3200 33 METRO

1370 18 F 1050 14 F
1000 11 F 2600 31 METRO

1100 14 METRO 3000 37 METRO

1500 20 F 1900 25 F
1450 19 METRO 2200 30 F
1100 14 METRO

17Los datos que se muestran en la siguiente tabla se recopilaron como parte de un estudio en el que los sujetos eran bebés
prematuros con bajo peso al nacer nacidos en tres hospitales diferentes. Utilice la codificación de variables ficticias y
técnicas de regresión múltiple para analizar estos datos. ¿Podemos concluir que las tres poblaciones hospitalarias de
la muestra difieren con respecto al peso medio al nacer cuando se tiene en cuenta la edad gestacional? ¿Podemos
concluir que existe interacción entre el hospital de nacimiento y la edad gestacional?
Grafique los datos originales y las ecuaciones de regresión ajustadas.

Nacimiento Gestación Hospital Nacimiento Gestación Hospital


Peso (kg) Edad (semanas) de nacimiento Peso (kg) Edad (semanas) de nacimiento

1.4 30 A 1.0 29 C
.9 27 B 1.4 33 C
1.2 33 A .9 28 A
1.1 29 C 1.0 28 C
1.3 35 A 1.9 36 B
.8 27 B 1.3 29 B
1.0 32 A 1.7 35 C
.7 26 A 1.0 30 A
1.2 30 C .9 28 A
.8 28 A 1.0 31 A
1.5 32 B 1.6 31 B
1.3 31 A 1.6 33 B
1.4 32 C 1.7 34 B
1.5 33 B 1.6 35 C
1.0 27 A 1.2 28 A
1.8 35 B 1.5 30 B
1.4 36 C 1.8 34 B
1.2 34 A 1.5 34 C
1.1 28 B 1.2 30 A
1.2 30 B 1.2 32 C

18Consulte el Capítulo 9, Ejercicio de repaso 18. En el estudio citado en ese ejercicio, Maria Mathias (A-13) investigó
la relación entre las edades (EDAD) de los niños y la mejora en las medidas de hiperactividad, actitud y
comportamiento social. En el estudio, los sujetos fueron asignados aleatoriamente a dos tratamientos
diferentes. El grupo de control (TRATAR¼0) recibió terapia estándar para la hiperactividad y el grupo de
tratamiento (TREAT¼1) recibió terapia estándar más terapia con mascotas. los resultados son
PREGUNTAS DE REPASO Y EJERCICIOS 587

se muestra en la siguiente tabla. Cree un gráfico de dispersión con la edad como variable independiente y
ATT (cambio de actitud con números positivos que indican un cambio de actitud positivo) como variable
dependiente. Utilice símbolos diferentes para los dos grupos de tratamiento diferentes. Use técnicas de
regresión múltiple para determinar si la edad, el tratamiento o la interacción son útiles para predecir el ATT.
Reporte sus resultados.

Sujeto TRATAR EDAD ATT Sujeto TRATAR EDAD ATT

1 1 9 - 1:2 17 0 10 0.4
2 1 9 0.0 18 0 7 0.0
3 1 13 - 0:4 19 0 12 1.1
4 1 6 - 0:4 20 0 9 0.2
5 1 9 1.0 21 0 7 0.4
6 1 8 0.8 22 0 6 0.0
7 1 8 - 0:6 23 1 11 0.6
8 1 9 - 1:2 24 1 11 0.4
9 0 7 0.0 25 1 11 1.0
10 0 12 0.4 26 1 11 0.8
11 0 9 - 0:8 27 1 11 1.2
12 0 10 1.0 28 1 11 0.2
13 0 12 1.4 29 1 11 0.8
14 0 9 1.0 30 1 8 0.0
15 0 12 0.8 31 1 9 0.4
dieciséis 0 9 1.0
Fuente: Datos proporcionados por cortesía de Maria Mathias, MD y el Centro de Consulta Estadística de la Universidad Estatal de Wright.

Para cada estudio descrito en los Ejercicios 19 a 21, responda tantas de las siguientes preguntas como sea
posible:
(a)¿Cuál es la variable dependiente?
(b)¿Cuáles son las variables independientes?
(C)¿Cuáles son las hipótesis nula y alternativa apropiadas?
(d)¿Qué hipótesis nulas crees que fueron rechazadas? ¿Por qué?
(mi)¿Cuál es el objetivo más relevante, la predicción o la estimación, o son los dos igualmente relevantes?
Explica tu respuesta.
(F)¿Cuál es la población muestreada?
(gramo)¿Cuál es la población objetivo?
(h)¿Qué variables están relacionadas con qué otras variables? ¿Las relaciones son directas o
inversas?
(i)Escriba la ecuación de regresión usando los números apropiados para las estimaciones de parámetros.
(j)Da valores numéricos para cualquier otra estadística que puedas.
(k)Identifique cada variable en cuanto a si es cuantitativa o cualitativa.
(l)Explique el significado de cualquier estadística para la cual se dan valores numéricos.

19Golfinopoulos y Arhonditsis (A-14) utilizaron un modelo de regresión múltiple en un estudio de trihalometanos (THM) en
agua potable en Atenas, Grecia. Los THM son motivo de preocupación ya que se han relacionado con el cáncer y los
resultados reproductivos. Los investigadores encontraron útil el siguiente modelo de regresión para
588 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

predicción de THM:

THM¼ -:26chlaþ1:57pHþ28:74Hermano -66:72hermano2


- 43:63Sþ1:13espþ2:62TS-:72T CL

Las variables fueron las siguientes:chla¼concentración de clorofila,pH¼escala ácido=base, hermano¼


concentración de bromuro,S¼variable ficticia para el verano,esp¼variable ficticia para la primavera, T
¼Temperatura, yCL¼concentración de cloro. Los investigadores informaronR¼ :52,pag < :001.

20En un estudio de Takata et al. (A-15), los investigadores evaluaron la relación entre la capacidad de masticar y el
número de dientes y las medidas de aptitud física en una muestra de sujetos de 80 años o más en Japón.
Una de las variables de resultado que midió la condición física fue la fuerza extensora de la pierna. Para medir la
capacidad de masticar alimentos, se preguntó a los sujetos sobre su capacidad para masticar 15 alimentos (maní,
pulpo en vinagre y pan francés, entre otros). La consideración de variables como la altura, el peso corporal, el sexo, la
presión arterial sistólica, la albúmina sérica, la concentración de glucosa en ayunas, el dolor de espalda, el
tabaquismo, el consumo de alcohol, el estado civil, el tratamiento médico regular y el ejercicio regular revelaron que
la cantidad de alimentos masticables era significativa. en la predicción de la fuerza extensora de la pierna (b̂1¼ :075;
pag¼ :0366). Sin embargo, en presencia de las otras variables, el número de dientes no fue un predictor significativo.
(b1¼ :003;pag¼ :9373).

21Varela et al. (A-16) examinó a 515 pacientes que se sometieron a resección pulmonar por carcinoma
broncogénico. La variable resultado fue la ocurrencia de morbilidad cardiorrespiratoria después de la cirugía.
Cualquiera de los siguientes eventos postoperatorios indicó morbilidad: atelectasia pulmonar o neumonía,
insuficiencia respiratoria o ventilatoria al alta, necesidad de ventilación mecánica en cualquier momento
después de la extubación en el quirófano, tromboembolismo pulmonar, arritmia, isquemia o infarto de
miocardio e insuficiencia cardíaca clínica. Al realizar una regresión logística por pasos, los investigadores
encontraron que la edad (pag < :001) y volumen espiratorio forzado postoperatorio (pag¼ :003) fueron
estadísticamente significativos en la predicción de la ocurrencia de morbilidad cardiorrespiratoria.

Para cada uno de los conjuntos de datos dados en los Ejercicios 22 a 29, haga tantos de los siguientes como considere
apropiados:

(a)Aplicar una o más de las técnicas discutidas en este capítulo.


(b)Aplicar una o más de las técnicas discutidas en capítulos anteriores.
(C)Construir gráficos.
(d)Formule hipótesis relevantes, realice las pruebas apropiadas y encuentrepagvalores.
(mi)Indique las decisiones estadísticas y las conclusiones clínicas que justifican los resultados de sus pruebas de
hipótesis.
(F)Describa la(s) población(es) a las que cree que se aplican sus inferencias.

22Un estudio de Davies et al. (A-17) fue motivado por el hecho de que, en estudios previos de respuestas
contráctiles ab-agonistas de los receptores adrenérgicos en miocitos individuales de corazones humanos
defectuosos y no defectuosos, habían observado una disminución relacionada con la edad en la respuesta
máxima al isoproterenol, en frecuencias en las que la respuesta máxima a niveles altos de Ca2þen la misma
celda no cambió. Para el presente estudio, los investigadores calcularon el isoproterenol/Ca2þ(ISO/CA) a
partir de mediciones tomadas en miocitos de pacientes con edades comprendidas entre 7 y 70 años. Los
sujetos se clasificaron como mayores (> 50 años) y más jóvenes. Los siguientes son los valores (ISO/CA), la
edad y la fuente de miocitos de los sujetos del estudio. Las fuentes de miocitos se informaron como donante
y biopsia.
PREGUNTAS DE REPASO Y EJERCICIOS 589

Edad ISO/CA Fuente de miocitos

7 1.37 Donante
21 1.39 Donante
28 1.17 Donante

35 0.71 Donante
38 1.14 Donante
50 0,95 Donante

51 0.86 Biopsia
52 0.72 Biopsia
55 0.53 Biopsia
56 0.81 Biopsia
61 0.86 Biopsia
70 0.77 Biopsia

Fuente: Datos proporcionados por cortesía del Dr. Sian E. Harding.

23Hayton et al. (A-18) investigaron la farmacocinética y la biodisponibilidad de cefetamet y cefetamet pivoxil en


lactantes de 3,5 a 17,3 meses de edad que habían recibido el antibiótico durante y después de una cirugía
urológica. Entre los datos farmacocinéticos recopilados se encuentran las siguientes mediciones del volumen
de distribución aparente (V) en estado estacionario. También se muestran datos recopilados previamente
sobre niños de 3 a 12 años (A-19) y adultos (A-20). También se muestran los pesos (W) de los sujetos.

Infantes Niños Adultos

W (kg) V (litros) W (kg) V (litros) W (kg) V (litros)

6.2 2.936 13 4.72 61 19.7


7.5 3.616 14 5.23 80 23.7
7.0 1.735 14 5.85 96 20.0
7.1 2.557 15 4.17 75 19.5
7.8 2.883 dieciséis 5.01 60 19.6
8.2 2.318 17 5.81 68 21.5
8.3 3.689 17 7.03 72.2 21,9
8.5 4.133 17.5 6.62 87 30,9
8.6 2.989 17 4.98 66.5 20.4
8.8 3.500 17.5 6.45
10.0 4.235 20 7.73
10.0 4.804 23 7.67
10.2 2.833 25 9.82
10.3 4.068 37 14.40
10.6 3.640 28 10.90
10.7 4.067 47 15.40
10.8 8.366 29 9.86
11.0 4.614 37 14.40
12.5 3.168
13.1 4.158

Fuente: Datos proporcionados por cortesía del Dr. Klaus Stoeckel.


590 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

24Según Fils-Aime et al. (A-21), las encuestas epidemiológicas han encontrado que el alcoholismo es el trastorno mental o
de abuso de sustancias más común entre los hombres en los Estados Unidos. Fils-Aime y asociados investigaron las
interrelaciones de la edad al inicio del consumo excesivo de alcohol, los antecedentes familiares de alcoholismo, la
comorbilidad psiquiátrica y las concentraciones de metabolitos de monoamina en el líquido cefalorraquídeo (LCR) en
alcohólicos abstinentes que buscaban tratamiento. Los sujetos eran en su mayoría hombres blancos clasificados
como que experimentaron un inicio temprano (25 años o menos) o tardío (mayores de 25 años) de consumo excesivo
de alcohol. Entre los datos recopilados se encuentran las siguientes mediciones de las concentraciones de triptófano
(TRYPT) y ácido 5-hidroxiindolacético (5-HIAA) en LCR (pmol/ml).

Comienzo Comienzo

1¼Temprano 1¼Temprano
5-HIAA TRIPTO 0¼Tarde 5-HIAA TRIPTO 0¼Tarde

57 3315 1 102 3181 1


116 2599 0 51 2513 1
81 3334 1 92 2764 1
78 2505 0 104 3098 1
206 3269 0 50 2900 1
64 3543 1 93 4125 1
123 3374 0 146 6081 1
147 2345 1 96 2972 1
102 2855 1 112 3962 0
93 2972 1 23 4894 1
128 3904 0 109 3543 1
69 2564 1 80 2622 1
20 8832 1 111 3012 1
66 4894 0 85 2685 1
90 6017 1 131 3059 0
103 3143 0 58 3946 1
68 3729 0 110 3356 0
81 3150 1 80 3671 1
143 3955 1 42 4155 1
121 4288 1 80 1923 1
149 3404 0 91 3589 1
82 2547 1 102 3839 0
100 3633 1 93 2627 0
117 3309 1 98 3181 0
41 3315 1 78 4428 0
223 3418 0 152 3303 0
96 2295 1 108 5386 1
87 3232 0 102 3282 1
96 3496 1 122 2754 1
34 2656 1 81 4321 1
98 4318 1 81 3386 1
86 3510 0 99 3344 1
118 3613 1 73 3789 1
84 3117 1 163 2131 1
99 3496 1 109 3030 0
114 4612 1 90 4731 1
(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 591

Comienzo Comienzo

1¼Temprano 1¼Temprano
5-HIAA TRIPTO 0¼Tarde 5-HIAA TRIPTO 0¼Tarde

140 3051 1 110 4581 1


74 3067 1 48 3292 0
45 2782 1 77 4494 0
51 5034 1 67 3453 1
99 2564 1 92 3373 1
54 4335 1 86 3787 0
93 2596 1 101 3842 1
50 2960 1 88 2882 1
118 3916 0 38 2949 1
96 2797 0 75 2248 0
49 3699 1 35 3203 0
133 2394 0 53 3248 1
105 2495 0 77 3455 0
61 2496 1 179 4521 1
197 2123 1 151 3240 1
87 3320 0 57 3905 1
50 3117 1 45 3642 1
109 3308 0 76 5233 0
59 3280 1 46 4150 1
107 3151 1 98 2579 1
85 3955 0 84 3249 1
156 3126 0 119 3381 0
110 2913 0 41 4020 1
81 3786 1 40 4569 1
53 3616 1 149 3781 1
64 3277 1 116 2346 1
57 2656 1 76 3901 1
29 4953 0 96 3822 1
34 4340 1
Fuente: Datos proporcionados por cortesía del Dr. Markku Linnoila.

25El objetivo de un estudio de Abrahamsson et al. (A-22) fue investigar los efectos antitrombóticos de un inhibidor del
inhibidor-1 del activador del plasminógeno (PAI-1) en ratas que recibieron endotoxina. Los sujetos experimentales
fueron ratas macho Sprague-Dawley que pesaban entre 300 y 400 gramos. Entre los datos recopilados se encuentran
las siguientes mediciones sobre la actividad de PAI-1 y el pulmón125Concentración de I en ratas anestesiadas que
recibieron tres fármacos:

Plasma PAI-1 125I-fibrina en los pulmones


drogas Actividad (U/ml) (% de la muestra de referencia)

endotoxina 127 158


175 154
161 118
137 77
219 172
(Continuación)
592 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

Plasma PAI-1 125I-fibrina en los pulmones


drogas Actividad (U/ml) (% de la muestra de referencia)

260 277
203 216
195 169
414 272
244 192

endotoxinaþPRAP¼1 dosis baja 107 49


103 28
248 187
164 109
176 96
230 126
184 148
276 17
201 97
158 86

endotoxinaþPRAP¼1 dosis alta 132 86


130 24
75 17
140 41
166 114
194 110
121 26
111 53
208 71
211 90
Fuente: Datos proporcionados por cortesía del Dr. Tommy Abrahamsson.

26Pearse y Sylvester (A-23) realizaron un estudio para determinar las contribuciones separadas de la isquemia y la perfusión
extracorpórea a la lesión vascular que se produce en pulmones aislados de ovejas y para determinar la dependencia
de oxígeno de esta lesión. Los pulmones se sometieron a isquemia sola, perfusión extracorpórea sola e isquemia y
perfusión extracorpórea. Entre los datos recopilados se encuentran las siguientes observaciones sobre el cambio en
la presión arterial pulmonar (mm Hg) y la permeabilidad vascular pulmonar evaluada mediante la estimación del
coeficiente de reflexión para la albúmina en pulmones perfundidos con y sin isquemia anterior:

Pulmones isquémicos-perfundidos Pulmones perfundidos

Cambiar en Cambiar en
Pulmonar Reflexión Pulmonar Reflexión
Presión Coeficiente Presión Coeficiente

8.0 0.220 34,0 0.693


3.0 0.560 31.0 0.470
10.0 0.550 4.0 0.651
23.0 0.806 48.0 0.999
PREGUNTAS DE REPASO Y EJERCICIOS 593

Pulmones isquémicos-perfundidos Pulmones perfundidos

Cambiar en Cambiar en
Pulmonar Reflexión Pulmonar Reflexión
Presión Coeficiente Presión Coeficiente

15.0 0.472 32,0 0.719


43.0 0.759 27,0 0.902
18.0 0.489 25,0 0.736
27,0 0.546 25,0 0.718
13.0 0.548
0.0 0.467

Fuente: Datos proporcionados por cortesía del Dr. David B. Pearse.

27El propósito de un estudio de Balzamo et al. (A-24) fue investigar, en conejos anestesiados, los efectos de la
ventilación mecánica sobre la concentración de sustancia P (SP) medida por radioinmunoensayo en nervios y
músculos asociados a la ventilación y que participan en la inervación sensorial del aparato respiratorio y del
corazón. SP es un neurotransmisor ubicado en las neuronas sensoriales primarias en los sistemas nerviosos
central y autónomo. Entre los datos recopilados se encuentran las siguientes medidas de concentración de
SP en los nervios vagos cervicales (X) y los ganglios nodosos correspondientes (NG), lados derecho e
izquierdo:

SPXderecho SPNGderecho SPXizquierda SPNGizquierda

0.6500 9.6300 3.3000 1.9300


2.5600 3.7800 0.6200 2.8700
1.1300 7.3900 0.9600 1.3100
1.5500 3.2800 2.7000 5.6400
35.9000 22.0000 4.5000 9.1000
19.0000 22.8000 8.6000 8.0000
13.6000 2.3000 7.0000 8.3000
8.0000 15.8000 4.1000 4.7000
7.4000 1.6000 5.5000 2.5000
3.3000 11.6000 9.7000 8.0000
19.8000 18.0000 13.8000 8.0000
8.5000 6.2000 11.0000 17.2000
5.4000 7.8000 11.9000 5.3000
11.9000 16.9000 8.2000 10.6000
47.7000 35.9000 3.9000 3.3000
14.2000 10.2000 3.2000 1.9000
2.9000 1.6000 2.7000 3.5000
6.6000 3.7000 2.8000 2.5000
3.7000 1.3000

Fuente: Datos proporcionados por cortesía del Dr. Yves Jammes.

28Scheeringa y Zeanah (A-25) examinaron la presencia de trastorno de estrés postraumático (TEPT), la gravedad de
la sintomatología postraumática y el patrón de expresión de los grupos de síntomas en relación con seis
variables independientes que pueden ser importantes para el desarrollo de un trastorno postraumático. en
niños menores de 48 meses de edad. Los siguientes datos fueron recolectados durante el transcurso del
estudio.
594 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

Variables predictoras Variables de respuesta

Ingenio./ Amenaza para

Género Edad Agudo/Rept. Experiencia en lesiones cuidador Reexp. entumecido excitado FragAgg

0 1 0 1 1 1 3 0 0 1
0 1 0 0 0 1 2 2 1 1
1 1 0 0 0 1 3 1 1 1
0 1 0 0 0 1 3 1 0 4
1 0 1 1 1 0 1 3 1 1
1 1 0 1 1 0 3 1 0 1
0 1 0 1 1 0 4 2 0 1
0 1 0 0 1 0 5 2 0 4
1 1 0 0 0 1 2 1 3 2
1 1 1 1 1 0 4 1 0 0
0 0 1 1 1 0 1 3 0 1
1 0 1 0 1 0 1 3 0 2
1 0 1 1 1 0 0 3 0 0
1 1 0 1 1 0 4 1 2 1
1 0 0 1 1 1 3 2 1 3
1 0 0 1 1 1 3 1 2 1
0 1 0 1 1 1 3 1 2 2
0 1 0 0 0 1 5 2 1 1
0 1 0 0 0 1 1 2 2 2
0 1 0 1 1 0 4 4 0 3
1 0 1 1 1 0 2 1 2 3
1 0 0 1 1 1 1 1 2 1
1 1 0 0 0 1 4 1 1 1
0 1 0 0 0 1 3 2 1 0
0 1 0 0 0 1 3 1 2 4
0 1 0 0 0 1 3 1 2 4
0 1 0 0 1 0 2 2 0 0
1 1 0 0 0 1 2 0 3 0
1 1 0 0 0 1 2 0 1 2
0 1 0 1 0 1 2 3 1 3
1 1 1 0 1 0 1 2 1 1
1 1 0 1 1 1 3 2 0 4
1 1 0 0 0 0 2 4 2 0
0 1 0 0 0 1 1 1 0 2
0 0 1 0 0 1 2 3 2 3
0 0 1 0 0 1 3 1 4 3
0 0 1 0 0 1 3 1 2 3
0 0 0 0 1 0 1 1 0 0
1 0 0 0 0 1 4 3 2 3
1 0 0 1 1 0 4 2 3 2
0 0 1 1 1 0 1 2 2 1
PREGUNTAS DE REPASO Y EJERCICIOS 595

Variables predictoras Variables de respuesta

Ingenio./ Amenaza para

Género Edad Agudo/Rept. Lesión Exp. cuidador Reexp. entumecido excitado FragAgg

Llave: Género 0¼masculino

1¼femenino
Edad 0¼menor de 18 meses en el momento del trauma
1¼mayores de 18 meses
Agudo/Rep. 0¼el trauma fue agudo, golpe único 1¼el
trauma fue derogado o crónico 0¼el sujeto
Lesión no resultó herido en el trauma
1¼el sujeto resultó herido físicamente en el trauma
Ingenio/Exper. 0¼sujeto presenció pero no experimentó directamente el trauma
1¼sujeto experimentó directamente el trauma 0¼cuidador no fue
Amenaza al cuidador amenazado en el trauma 1¼cuidador fue amenazado en el
trauma
Reexp.¼Recuento de síntomas del grupo de reexperimentación
Adormecer¼Entumecimiento del conteo de síntomas del grupo de respuesta/evitación excitante¼
Recuento de síntomas del grupo de hiperexcitación FragAgg¼Recuento de síntomas del grupo de
nuevos miedos/agresiones

Fuente: Datos proporcionados por cortesía del Dr. Michael S. Scheeringa.

29Uno de los objetivos de un estudio de Mulloy y McNicholas (A-26) fue comparar la ventilación y el intercambio de gases
durante el sueño y el ejercicio en la enfermedad pulmonar obstructiva crónica (EPOC). Los investigadores también
querían determinar si los estudios de ejercicio podrían ayudar en la predicción de la desaturación nocturna en la
EPOC. Los sujetos (13 hombres, 6 mujeres) eran pacientes ambulatorios que asistían a una clínica respiratoria
ambulatoria. La edad media de los pacientes, todos ellos con EPOC grave y estable, fue de 64,8 años con una
desviación estándar de 5,2. Entre los datos recopilados se encontraban mediciones de las siguientes variables:

más bajo Significar más bajo Caer


Edad PaO2 PaCO2 VEF1 Ex. Dormir Dormir Dormir
a
(años) IMC (mmHg) (mmHg) (% Predicho) São2a São2a São2 São2a

67 23,46 52,5 54 22 74 70.6 56 29.6


62 25,31 57,75 49.575 19 82 85.49 76 11.66
68 23.11 72 43.8 41 95 88.72 82 11.1
61 25.15 72 47.4 38 88 91.11 76 18.45
70 24.54 78 40.05 40 88 92.86 92 0.8
71 25,47 63,75 45.375 31 85 88.95 80 13
60 19,49 80,25 42.15 28 91 94.78 90 4
57 21,37 84,75 40.2 20 91 93.72 89 5.8
69 25,78 68,25 43.8 32 85 90.91 79 13
57 22,13 83,25 43.725 20 88 94.39 86 9.5
74 26,74 57,75 51 33 75 89.89 80 14.11
63 19.07 78 44.175 36 81 93.95 82 13
64 19,61 90,75 40.35 27 90 95.07 92 4
73 30,30 69,75 38.85 53 87 90 76 18
(Continuación)
596 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

más bajo Significar más bajo Caer


Edad PaO2 PaCO2 VEF1 Ex. Dormir Dormir Dormir
(años) IMC (mmHg) (mmHg) (% Predicho) São2a São2a São2a São2a

63 26,12 51,75 46,8 39 67 69.31 46 34,9


62 21.71 72 41.1 27 88 87.95 72 22
67 24,75 84,75 40.575 45 87 92.95 90 2.17
57 25,98 84,75 40.05 35 94 93.4 86 8.45
66 32,00 51,75 53.175 30 83 80.17 71 dieciséis

aTratada como variable dependiente en los análisis de los autores. IMC¼índice de masa corporal; Pao2¼tensión arterial de
oxígeno: Paco2¼
presión de dióxido de carbono arterial; VEF1¼volumen espiratorio forzado en 1 segundo; São2¼saturación arterial de oxígeno.

Fuente: Datos proporcionados por cortesía del Dr. Eithne Mulloy.

Ejercicios para usar con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.El objetivo de un estudio de Gyurcsik et al. (A-27) fue examinar la utilidad de las metas relacionadas con el ejercicio
acuático, la autoeficacia de tareas y la autoeficacia de programación para predecir la asistencia al ejercicio acuático de
personas con artritis. Los investigadores recopilaron datos sobre 142 sujetos que participaban en los programas
acuáticos de la Arthritis Foundation. La variable de resultado fue el porcentaje de sesiones a las que se asistió durante
un período de 8 semanas (ATTEND). Las siguientes variables predictoras son todos valores centrados. Por lo tanto,
para cada participante, la media de todos los participantes se resta de la puntuación individual. Las variables son:

GOALDIFF: los valores más altos indican el establecimiento de objetivos de mayor participación. GOALSPEC: los valores

más altos indican una mayor especificidad de los objetivos relacionados con el ejercicio acuático. INTER: interacción de

GOALDIFF y GOALSPEC.

TSE: los valores más altos indican la confianza de los participantes en sus habilidades para asistir a clases acuáticas.

SSE: los valores más altos indican la confianza de los participantes en sus habilidades para realizar ocho tareas relacionadas
programar ejercicio en su rutina diaria durante 8 semanas.
MESES: meses de participación en ejercicios acuáticos antes del inicio del estudio.

Con el conjunto de datos AQUATICS, realice una regresión múltiple para predecir ATTEND con cada una de
las variables anteriores. ¿Qué es el coeficiente de correlación múltiple? ¿Qué variables son significativas para
predecir ATTEND? ¿Cuáles son tus conclusiones?

2.Rodehorst (A-28) realizó un estudio prospectivo de 212 maestros de escuelas primarias rurales. La principal
variable de resultado fue la intención de los maestros de manejar a los niños que presentaban síntomas de
asma en sus aulas. Esta variable se midió con una pregunta de un solo ítem que utilizó una escala tipo Likert
de siete puntos (INTENT, con posibles respuestas de 1¼extremadamente probable a 7¼ extremadamente
improbable). Rodehorst usó las siguientes variables como variables independientes para predecir la
INTENCIÓN:

SS¼Apoyo social. Las puntuaciones van de 7 a 49, y las puntuaciones más altas indican una mayor percepción
apoyo social para el manejo de niños con asma en un entorno escolar.
ATT¼Actitud. Las puntuaciones oscilan entre 15 y 90, y las puntuaciones más altas indican actitudes más favorables
hacia el asma.
REFERENCIAS 597

SABER¼Conocimiento. Los puntajes van de 0 a 24, y los puntajes más altos indican un nivel general más alto.
conocimientos sobre el asma.
NIÑO¼Número de niños con asma que el maestro ha tenido en su clase durante su
toda la carrera docente.
SE¼Autoeficacia. Las puntuaciones van de 12 a 60, y las puntuaciones más altas indican una mayor autoeficacia.
para el manejo de niños con asma en el ámbito escolar.
año¼Años de experiencia docente.

Con los datos MAESTROS, use el análisis de regresión paso a paso para seleccionar las variables más útiles para
incluir en un modelo para predecir la INTENCIÓN.

3.Consulte los datos de pérdida de peso de 588 pacientes con cáncer y 600 controles sanos (WGTLOSS). La pérdida de peso
entre los pacientes con cáncer es un fenómeno bien conocido. De interés para los médicos es el papel que juegan en
el proceso las anomalías metabólicas. Una investigación sobre las relaciones entre estas variables arrojó datos sobre
el recambio de proteínas en todo el cuerpo (Y)y porcentaje de peso corporal ideal para la altura (X).Los sujetos eran
pacientes con cáncer de pulmón y controles sanos de la misma edad. Seleccione una muestra aleatoria simple de
tamaño 15 de cada grupo y haga lo siguiente:

(a)Dibuje un diagrama de dispersión de los datos de muestra usando diferentes símbolos para cada uno de los dos grupos.

(b)Utilice la codificación de variables ficticias para analizar estos datos.

(C)Trace las dos líneas de regresión en el diagrama de dispersión. ¿Se puede concluir que las dos poblaciones
muestreadas difieren con respecto al recambio medio de proteínas cuando se tiene en cuenta el porcentaje de
peso ideal?

¿Se puede concluir que existe una interacción entre el estado de salud y el porcentaje de peso corporal ideal? Prepara
una interpretación verbal de los resultados de tu análisis y compara tus resultados con los de tus compañeros de
clase.

REFERENCIAS

Referencias de metodología
1. segundoRUCELBOWERMANy RICHARDA'CONNELL,Modelos Estadísticos Lineales: Un Enfoque Aplicado,2ª ed. PWS-Kent
Publishing, Boston, 1990.
2. DÁVIDOWHOSMERy STANLEYLEMESHOW,Regresión logística aplicada,2ª ed. Wiley, Nueva York, 2000.
3. DÁVIDOG KLEINBAUM,Regresión logística: un texto de autoaprendizaje,Nueva York, Springer, 1994.
4. República DominicanaBUEYy EJ S.NELL,Análisis de Datos Binarios,2ª ed. Chapman and Hall/CRC, Nueva York, 1989.
5. NJ NAGELKERKE, “Nota sobre una definición general del coeficiente de determinación”,Biometrika, 78 (1991), 691–
692.

Aplicaciones Referencias
A-1. Centro Estatal de Estadísticas de Salud de Carolina del Norte e Instituto Howard W. Odum para la Investigación en Ciencias Sociales de la
Universidad de Carolina del Norte en Chapel Hill, datos de nacimiento establecidos para 2001 encontrados enwww.irss.unc.edu/ncvital/
bfd1down.html. Todo el muestreo y la codificación realizados por John Holcomb y no representan los hallazgos del Centro o Instituto.

A-2. bbOLWELL, RSOBECKS, BPOHLMAN, SANDRESÉN, K. T.HEIL, S. S.ERAFINO, LRYBICKIy M. K.ALAYCIO,


"Etopósido (VP-16) más G-CSF moviliza diferentes subconjuntos de células dendríticas que G-CSF solo"
Trasplante de médula ósea, 31 (2003), 95–98.
A-3. METROANOJPAGANDEY, LAlabamaBSHARMA, y VIJAYKSHUKLA, “Expresión de citocromo P-450 y peroxidación lipídica en el
cáncer de vesícula biliar,”Revista de Oncología Quirúrgica, 82 (2003), 180–183.
598 CAPÍTULO 11 ANÁLISIS DE REGRESIÓN: ALGUNAS TÉCNICAS ADICIONALES

A-4. METROO YOJ. K.RANTZ, ILANAB.KUTINSKY, AÚLTIMA ESCALERADROBERTSON, y PHILIPSMEHLER, "Efectos de la metadona relacionados con la dosis
en la prolongación del intervalo QT en una serie de pacientes con Torsade de Pointes",Farmacoterapia, 23 (2003), 802–805.

A-5. ROBERTOA. R.EISS, CURTISEHSAA, DEBORÁL. G.RIFFIS, BERNADETTEPAGORTER, y MARIOANNTARA, “Punto de atención
versus Monitoreo de Laboratorio de Pacientes que Reciben Diferentes Terapias Anticoagulantes,”Farmacoterapia 22, (2002),
677–685.
A-6. GRAMOWisconsin-RYUNGSEN, mSÍL. W.YKLEy J.ACLENEAZAUSZNIEWSKI, “Cuidadores de niños adultos coreanos de adultos
mayores con demencia”,Revista de Enfermería Gerontológica, 29 (2003), 19–28.
A-7. MNAEIJE, “Factores Antropométricos y Cinemáticos Locales Relacionados con la Apertura Máxima de la Boca en
Individuos Sanos,”Revista de Rehabilitación Oral, 29 (2002), 534–539.
A-8. DanielFCONNOR, RONALDJ. S.TEINGARD, jENNIFERJ. A.NDERSONy RICHARDH. M.ELONI, “Diferencias de género en
Agresión reactiva y proactiva”,Psiquiatría infantil y desarrollo humano, 33 (2003), 279–294.
A-9. DanielHLAMETROONT, mATTEOJBUDOFF, DÁVIDOEMHAVELLE, ROBERTOSHAVELLE, BRUCEHBRENDIMIENTOy J.AMÉS
MHAGAR, "La exploración de calcio coronario agrega valor incremental a los pacientes con pruebas de esfuerzo positivas",
Diario americano del corazón, 143 (2002), 861–867.
A-10. ROBYNGRAMOALLAGHER, SharónMETROCkINLEYy kATLETADRACUP, “Predictores de la Asistencia de las Mujeres a los Programas
de Rehabilitación Cardiaca,”Avances en Enfermería Cardiovascular, 18 (2003), 121–126.
A-11. jOHNHPORCERELLI, ROSEMARIOCOGAN, PAGATRICIAP. W.est, miENANOA. R.OSE, DARISTALAMBRECHE, kARÉNE. W.ILSON,
RICHARDKSEVERSON, y DUNÍAkARANA, “Vitimización violenta de mujeres y hombres: síntomas físicos y
psiquiátricos”,Revista de la Junta Estadounidense de Medicina Familiar, 16 (2003), 32–39.
A-12. DEBRAAJANSEN, y MARIOLkELLER, “Función cognitiva en mujeres ancianas que viven en la comunidad”,Revista de
Enfermería Gerontológica, 29 (2003), 34–43.
A-13. METROARIAMETROATIASy el Centro de Consulta Estadística de la Universidad Estatal de Wright.
A-14. SPYROSKGOLFINOPOULOSy GEORGEB.ARONDITISIS, "Modelos de regresión múltiple: una metodología para evaluar las
concentraciones de trihalometano en el agua potable a partir de las características del agua sin tratar"Quimiosfera,
47 (2002), 1007–1018.
A-15. YTAkata, TANSAI, SAWANO, THAMASAKI, Y. YOSHITAKE, Y. K.IMURA, K. S.ONOKI, MWAkisaka, M. F.UKUHARA,
y T. T.AKEHARA, "Relación de la aptitud física con la masticación en una población de 80 años de edad",Enfermedades bucales, 10
(2004), 44–49.
A-16. G. V.ARELA, N.NOVOA, MFJYO ME -NEZy G. S.ANTOS, “Aplicabilidad del riesgo de regresión logística (LR)
Modelado para la toma de decisiones en la resección del cáncer de pulmón”,Cirugía cardiovascular y torácica interactiva, 2 (
2003), 12–15.
A-17. CH DAVIES, N. F.ERRARA, y SEHardiendo, “b-La función de los receptores adrenérgicos cambia con la edad del sujeto en los
miocitos de un ventrículo humano que no falla.Investigación cardiovascular, 31 (1996), 152–156.
A-18. WILLIAMLHAYTON, jOHANNESkNEER, RONALDGRAMORAÍZy kLAÚSSTOECKEL, “Influencia de la maduración y el crecimiento en la
farmacocinética de cefetamet pivoxil: dosificación racional para lactantes”Agentes antimicrobianos y quimioterapia,
40 (1996), 567–574.
A-19. WLHAYTON, CRUDOALSTAD, E. T.HURMANN-NORTEIELSEN, TKUFAAS, J. K.NEER, RJ AMBROS, SUUGSTAD, E. M.ONN,
EBEXTRAÑOy K. S.TOECKEL, “Farmacocinética de cefetamet intravenoso y cefetamet pivoxil oral en niños,”
Agentes antimicrobianos y quimioterapia, 35 (1991), 720–725. Errata,36 (1992), 2575.
A-20. MPDUCHARME, DJEPREMIOS, PJMCnorteAMARAy K. S.TOECKEL, “Biodisponibilidad de formulaciones de jarabe y
tabletas de cefetamet pivoxil,”Agentes antimicrobianos y quimioterapia, 37 (1993), 2706–2709.
A-21. METROARIE-LOURDESFILS-AYO ME, mICHAELJ. E.CKARDT, DÁVIDOTGEORGE, gERALDLBFILA, ICAMIONETAMETROESFUERZO, y MARKKU
LINNOILA, "Los alcohólicos de inicio temprano tienen niveles más bajos de ácido 5-hidroxiindolacético en el líquido cefalorraquídeo que los
alcohólicos de inicio tardío",Archivos de Psiquiatría General, 53 (1996), 211–216.
A-22. T. A.brahamsson, V. N.ERMÉ, EMTRO €MQVIST, B. A.KERBLOM, A. L.EGNEHED, K. P.ETTERSONy A. W.ESTÁNmiRIKSSON,
“Efecto antitrombótico del inhibidor de PAI-1 en ratas que recibieron endotoxina”,Trombosis y hemostasia, 75 (1996), 118–126.

A-23. DÁVIDOBPOÍDOy JTSYLVESTER, "Lesión vascular en pulmones aislados de ovejas: papel de la isquemia, la perfusión
extracorpórea y el oxígeno"American Journal of Respiratory and Critical Care Medicine, 153 (1996), 196–202.
A-24. miMMANUELBALZAMO, PAGIERREjOANNY, jEANGRAMOUILLAUMESTEINBERG, CHARLESOHÍGADO, y YVESjAMMÉS, "Mecánico
La ventilación aumenta la concentración de la sustancia P en los nervios vago, simpático y frénico.American
Journal of Respiratory and Critical Care Medicine, 153 (1996), 153–157.
A-25. METROICHAELS. S.ANIMANDOAy CHARLESH ZEANAH, “Expresión de síntomas y variables traumáticas en niños menores
de 48 meses”,Revista de salud mental infantil, 16 (1995), 259–270.
REFERENCIAS 599

A-26. miITHNEMETROULLOYy WALTERARTMCnorteICOLAS, “Ventilación e intercambio de gases durante el sueño y el ejercicio en la EPOC
grave”Cofre, 109 (1996), 387–394.
A-27. norteANCYCGYURCSIK, PAGAULAESTABROOKS, y MELISAJ. F.RAHM-TEMPLAR, "Metas relacionadas con el ejercicio y la autoeficacia
como correlatos del ejercicio acuático en personas con artritis",Investigación y atención de la artritis, 49 (2003), 306–
313.
A-28. TKSOYRODEHURST, "La intención de los maestros de escuelas primarias rurales de manejar a los niños con síntomas de asma",
Enfermería Pediátrica, 29 (2003), 184-194.
CAPÍTULO 12
EL CHI-CUADRADO
DISTRIBUCIÓN Y ANÁLISIS DE
FRECUENCIAS

RESUMEN DEL CAPÍTULO

Este capítulo explora las técnicas que se usan comúnmente en el análisis de datos de
conteo o frecuencia. Los usos de la distribución chi-cuadrado, que se mencionó
brevemente en el Capítulo 6, se analizan e ilustran con mayor detalle. Además, las
técnicas estadísticas que se utilizan con frecuencia en los estudios epidemiológicos
se presentan y demuestran por medio de ejemplos.

TEMAS

12.1INTRODUCCIÓN
12.2LAS PROPIEDADES MATEMÁTICAS DE LA DISTRIBUCIÓN CHI-CUADRADO
12.3PRUEBAS DE BONDAD DE AJUSTE
12.4PRUEBAS DE INDEPENDENCIA
12.5PRUEBAS DE HOMOGENEIDAD

12.6LA PRUEBA EXACTA DE FISHER

12.7RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL

12.8RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. comprender las propiedades matemáticas de la distribución chi-cuadrado.
2. ser capaz de utilizar la distribución chi-cuadrado para las pruebas de bondad de ajuste.
3. ser capaz de construir y utilizar tablas de contingencia para probar la independencia y
la homogeneidad.
4. ser capaz de aplicar la prueba exacta de Fisher para 2 - 2 tablas.
5. comprender cómo calcular e interpretar los conceptos epidemiológicos de riesgo relativo, razones
de probabilidad y la estadística de Mantel-Haenszel.

600
12.2 LAS PROPIEDADES MATEMÁTICAS DE LA DISTRIBUCIÓN CHI-CUADRADO 601

12.1 INTRODUCCIÓN

En los capítulos sobre estimación y prueba de hipótesis, se hace una breve mención de la
distribución chi-cuadrado en la construcción de intervalos de confianza y la prueba de hipótesis
relativas a la varianza de una población. Esta distribución, que es una de las distribuciones más
utilizadas en aplicaciones estadísticas, tiene muchos otros usos. Algunas de las más comunes se
presentan en este capítulo junto con una descripción más completa de la distribución en sí, que
sigue en la siguiente sección.
La distribución de chi-cuadrado es la técnica estadística empleada con más
frecuencia para el análisis de datos de conteo o frecuencia. Por ejemplo, podemos
saber de una muestra de pacientes hospitalizados cuántos son hombres y cuántos
son mujeres. Para la misma muestra, también podemos saber cuántos tienen
cobertura de seguro privado, cuántos tienen seguro de Medicare y cuántos reciben
asistencia de Medicaid. Es posible que deseemos saber, para la población de la que
se extrajo la muestra, si el tipo de cobertura de seguro difiere según el género. Para
otra muestra de pacientes, podemos tener frecuencias para cada categoría de
diagnóstico representada y para cada área geográfica representada. Quizá
queramos saber si en la población de la que se extrajo el mismo existe una relación
entre zona de residencia y diagnóstico.
Hay otras técnicas estadísticas que se pueden usar para analizar datos de frecuencia en un esfuerzo
por responder otros tipos de preguntas. En este capítulo también aprenderemos acerca de estas técnicas.

12.2 LAS PROPIEDADES MATEMÁTICAS DE LA


DISTRIBUCIÓN CHI-CUADRADO

La distribución de chi-cuadrado puede derivarse de distribuciones normales. Supongamos que a partir de


una variable aleatoria normalmente distribuidaYcon mediametroy varianzas2seleccionamos aleatoria e
independientemente muestras de tamañonorte¼1. Cada valor seleccionado se puede transformar a la
variable normal estándarzpor la conocida fórmula

yi-metro
z i¼ (12.2.1)
s

Cada valor dezpuede elevarse al cuadrado para obtenerz2. Cuando investigamos la distribución
muestral dez2, encontramos que sigue una distribución chi-cuadrado con 1 grado de libertad. Eso es,

- y -metro-2
Xd1Þ
2 ¼ ¼z2
s

Supongamos ahora que seleccionamos aleatoria e independientemente muestras de tamañonorte¼2 de la


población normalmente distribuida deYvalores. Dentro de cada muestra podemos transformar cada
602 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

valor deya la variable normal estándarzy cuadrado como antes. Si los valores resultantes dez2
para cada muestra se suman, podemos designar esta suma por

- y1-metro-2 - y-metro-2
2
Xd2Þ
2 ¼ þ ¼z21þz2 2
s s

ya que sigue la distribución chi-cuadrado con 2 grados de libertad, el número de términos


cuadrados independientes que se suman.
El procedimiento puede repetirse para cualquier tamaño de muestra.norte.La suma de los resultantesz2
los valores en cada caso se distribuirán como chi-cuadrado connortegrados de libertad. En general, entonces,

Xd2norteÞ¼z21þz2 2þ þz2 norte


(12.2.2)

sigue la distribución chi-cuadrado connortegrados de libertad. La forma matemática de la


distribución chi-cuadrado es la siguiente:

1 1 tudk=2Þ-1mi-dtu=2Þ;
Fdtu¼ 2k=2 tu >0
k (12.2.3)
- 1 !
2

dóndemies el número irracional 2.71828. . . ykes el número de grados de libertad. la variedadtu


generalmente se designa con la letra griega chi (X)y, por lo tanto, la distribución se llama
distribución chi-cuadrado. Como señalamos en el Capítulo 6, la distribución de chi-cuadrado se
ha tabulado en la Tabla F del Apéndice. Se demuestra el uso adicional de la tabla a medida que
surge la necesidad en las secciones siguientes.
La media y la varianza de la distribución chi-cuadrado sonky 2k,respectivamente. El
valor modal de la distribución esk-2 para valores dekmayor o igual a 2 y es cero parak¼1.

Las formas de las distribuciones chi-cuadrado para varios valores dekse muestran en la figura
6.9.1. Observamos en esta figura que las formas parak¼1 yk¼2 son bastante diferentes de la forma
general de la distribución parak >2. También vemos en esta figura que chi-cuadrado asume valores
entre 0 e infinito. No puede tomar valores negativos, ya que es la suma de valores que se han elevado
al cuadrado. Una última característica de la distribución de chi-cuadrado que vale la pena señalar es
que la suma de dos o más variables independientes de chi-cuadrado también sigue una distribución
de chi-cuadrado.

Tipos de pruebas de chi-cuadradoComo ya se señaló, utilizamos la distribución chi-cuadrado en este


capítulo para probar hipótesis donde los datos disponibles para el análisis están en forma de
frecuencias. Estos procedimientos de prueba de hipótesis se discuten bajo los temas depruebas de
bondad de ajuste, pruebas de independencia,ypruebas de homogeneidad.Descubriremos que, en
cierto sentido, todas las pruebas de chi-cuadrado que empleamos pueden considerarse como
pruebas de bondad de ajuste, ya que prueban la bondad de ajuste de las frecuencias observadas a
frecuencias que uno esperaría. si los datos fueron generados bajo alguna teoría o hipótesis en
particular. Sin embargo, reservamos la frase "bondad de ajuste" para usarla de una manera más
12.2 LAS PROPIEDADES MATEMÁTICAS DE LA DISTRIBUCIÓN CHI-CUADRADO 603

sentido restringido. Lo usamos para referirnos a una comparación de una distribución de muestra con
alguna distribución teórica que se supone describe la población de la que proviene la muestra. La
justificación de nuestro uso de la distribución en estas situaciones se debe a Karl Pearson (1), quien
demostró que la distribución chi-cuadrado puede usarse como una prueba de la concordancia entre la
observación y la hipótesis siempre que los datos estén en forma de frecuencias. . Un tratamiento
extenso de la distribución chi-cuadrado se encuentra en el libro de Lancaster (2). Nikulin y Greenwood
(3) ofrecen consejos prácticos para realizar pruebas de chi-cuadrado.

Frecuencias observadas versus frecuencias esperadasEl estadístico chi-cuadrado es más


apropiado para usar con variables categóricas, como el estado civil, cuyos valores son las
categorías casado, soltero, viudo y divorciado. Los datos cuantitativos utilizados en el cálculo de
la estadística de prueba son las frecuencias asociadas con cada categoría de una o más
variables en estudio. Hay dos conjuntos de frecuencias que nos interesan,frecuencias
observadasyfrecuencias esperadas.Las frecuencias observadas son el número de sujetos u
objetos en nuestra muestra que caen en las diversas categorías de la variable de interés. Por
ejemplo, si tenemos una muestra de 100 pacientes del hospital, podemos observar que 50 son
casados, 30 solteros, 15 viudos y 5 divorciados. Las frecuencias esperadas son el número de
sujetos u objetos en nuestra muestra que esperaríamos observar si alguna hipótesis nula sobre
la variable es cierta. Por ejemplo, nuestra hipótesis nula podría ser que las cuatro categorías de
estado civil están igualmente representadas en la población de la que extrajimos nuestra
muestra. En ese caso esperaríamos que nuestra muestra contuviera 25 pacientes casados, 25
solteros, 25 viudos y 25 divorciados.

La estadística de prueba de chi-cuadrado El estadístico de prueba para las pruebas de chi-cuadrado que
discutir en este capítulo es

" #
X dOi- mi2iÞ
X2¼ (12.2.4)
mii

Cuando la hipótesis nula es verdadera,X2se distribuye aproximadamente comoX2conk - r


grados de libertad. Al determinar los grados de libertad,kes igual al número de grupos para los cuales
están disponibles las frecuencias observadas y esperadas, yres el número de restricciones o
restricciones impuestas a la comparación dada. Se impone una restricción cuando obligamos a que la
suma de las frecuencias esperadas sea igual a la suma de las frecuencias observadas, y se impone una
restricción adicional para cada parámetro que se estima a partir de la muestra.

En la Ecuación 12.2.4,Oies la frecuencia observada para eliª categoría de la variable


de interés, ymiies la frecuencia esperada (dado queH0es cierto) para eliª categoría.
La cantidadX2es una medida del grado en que, en una situación dada, concuerdan los pares de
frecuencias observadas y esperadas. Como veremos, la naturaleza deX2es tal que cuando hay una
estrecha concordancia entre las frecuencias observadas y esperadas es pequeña, y cuando la
concordancia es pobre es grande. En consecuencia, sólo un valor suficientemente grande deX2
provocará el rechazo de la hipótesis nula.
Si existe un acuerdo perfecto entre las frecuencias observadas y las frecuencias que
uno esperaría, dado queH0es cierto, el terminoOi- miien la Ecuación 12.2.4 será
604 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

igual a cero para cada par de frecuencias observadas y esperadas. Tal resultado daría un
valor deX2igual a cero, y seríamos incapaces de rechazarH0.
Cuando hay desacuerdo entre las frecuencias observadas y las frecuencias que uno esperaría
dado queH0es cierto, al menos uno de losOi- miitérminos en la Ecuación 12.2.4 será un número
distinto de cero. En general, cuanto más pobre es el acuerdo entre losOiy elmii, mayores o más
frecuentes serán estos valores distintos de cero. Como se señaló anteriormente, si el acuerdo entre el
Oiy elmiies lo suficientemente pobre (lo que resulta en una cantidad suficientemente grandeX2
valor,) podremos rechazarH0.
Cuando hay desacuerdo entre un par de frecuencias observadas y esperadas, la
diferencia puede ser positiva o negativa, según cuál de las dos frecuencias sea mayor. Desde la
medida de acuerdo,X2, es una suma de cantidades componentes cuyas magnitudes dependen
de la diferenciaOi- mii, las diferencias positivas y negativas deben tener el mismo peso. Esto se
logra elevando al cuadrado cadaOi- miidiferencia. Dividir las diferencias al cuadrado por la
frecuencia esperada adecuada convierte la cantidad en un término que se mide en unidades
originales. Agregar estos individuosdOi- miÞ2=Eitérminos rendimientosX i 2, una estadística de
resumen que refleja el alcance de la concordancia general entre las frecuencias observadas y
esperadas.

PAG
La regla de decisiónLa cantidad ½ðOi- miiÞ 2=Eiserá pequeño si lo observado
y las frecuencias esperadas están muy juntas y serán grandes si las diferencias son grandes.
El valor calculado deX2se compara con el valor tabulado deX2conk - r grados de
libertad. La regla de decisión, entonces, es: RechazarH0siX2es mayor o igual al
tabuladoX2por el valor elegido dea.

Pequeñas frecuencias esperadasCon frecuencia, en las aplicaciones de la prueba de chi-cuadrado,


la frecuencia esperada para una o más categorías será pequeña, tal vez mucho menor que 1. En la
literatura, con frecuencia se señala que la aproximación deX2aX2no es estrictamente válido cuando
algunas de las frecuencias esperadas son pequeñas. Hay desacuerdo entre los escritores, sin
embargo, sobre el tamaño de las frecuencias esperadas permitidas antes de hacer algún ajuste o
abandonarX2a favor de alguna prueba alternativa. Algunos escritores, especialmente los primeros,
sugieren límites inferiores de 10, mientras que otros sugieren que todas las frecuencias esperadas no
deberían ser inferiores a 5. Cochran (4,5), sugiere que para pruebas de bondad de ajuste de
distribuciones unimodales (como la normal ), la frecuencia mínima esperada puede ser tan baja como
1. Si, en la práctica, uno encuentra una o más frecuencias esperadas menores que 1, las categorías
adyacentes pueden combinarse para lograr el mínimo sugerido. La combinación reduce el número de
categorías y, por tanto, el número de grados de libertad. Las sugerencias de Cochran parecen haber
sido seguidas ampliamente por los profesionales en los últimos años.

12.3 PRUEBAS DE BONDAD DE AJUSTE

Como hemos señalado, una prueba de bondad de ajuste es adecuada cuando se desea decidir
si una distribución de frecuencias observada es incompatible con alguna distribución
preconcebida o hipotética.
12.3 PRUEBAS DE BONDAD DE AJUSTE 605

Podemos, por ejemplo, desear determinar si una muestra de valores observados de


alguna variable aleatoria es compatible o no con la hipótesis de que se extrajo de una población
de valores que se distribuyen normalmente. El procedimiento para llegar a una decisión
consiste en colocar los valores en categorías mutuamente excluyentes o intervalos de clase y
observar la frecuencia de aparición de los valores en cada categoría. Luego hacemos uso de
nuestro conocimiento de las distribuciones normales para determinar las frecuencias para cada
categoría que uno podría esperar si la muestra proviniera de una distribución normal. Si la
discrepancia es de tal magnitud que podría deberse al azar, concluimos que la muestra puede
proceder de una distribución normal. De forma similar, Se pueden realizar pruebas de bondad
de ajuste en los casos en que la distribución hipotética sea la binomial, la de Poisson o cualquier
otra distribución. Ilustremos con más detalle con algunos ejemplos de contrastes de hipótesis
de bondad de ajuste.

EJEMPLO 12.3.1La distribución normal


Cranor y Christensen (A-1) realizaron un estudio para evaluar los resultados clínicos, económicos y
humanísticos a corto plazo de los servicios de atención farmacéutica para pacientes con diabetes en
farmacias comunitarias. Para 47 de los sujetos del estudio, los niveles de colesterol se resumen en la
Tabla 12.3.1.
Deseamos saber si estos datos proporcionan suficiente evidencia para indicar que la
muestra no provino de una población normalmente distribuida. Dejara¼ .05

Solución:

1. Datos.Ver Tabla 12.3.1.


2. Supuestos.Suponemos que la muestra disponible para el análisis es una
muestra aleatoria simple.

TABLA 12.3.1 Niveles de colesterol como se


describe en el ejemplo 12.3.1

Colesterol
Nivel (mg/dl) Número de sujetos

100,0–124,9 1
125,0–149,9 3
150,0–174,9 8
175,0–199,9 18
200,0–224,9 6
225,0–249,9 4
250,0–274,9 4
275,0–299,9 3
Fuente: Datos proporcionados por cortesía de Carole W.
Cranor y Dale B. Christensen, "The Asheville Project: Short-
Term Outcomes of a Community Pharmacy Diabetes Care
Program"Diario de la Asociación Farmacéutica Americana,43
(2003), 149–159.
606 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

3. Hipótesis.
H0: En la población de la que se extrajo la muestra, el colesterol
los niveles se distribuyen normalmente.
HA: La población muestreada no se distribuye normalmente.
4. Estadística de prueba. La estadística de prueba es

" #
XdO
k i- mi
iÞ2
X2¼
i¼1
mii

5. Distribución de la estadística de prueba.SiH0es cierto, el estadístico de prueba se


distribuye aproximadamente como chi-cuadrado conk - rgrados de libertad. los valores
dekyrse determinará más adelante.

6. Regla de decisión.vamos a rechazarH0si el valor calculado deX2es igual o


mayor que el valor crítico de chi-cuadrado.
7. Cálculo de la estadística de prueba.Dado que no se especifican la media y la
varianza de la distribución hipotética, se deben utilizar los datos de la
muestra para estimarlas. Estos parámetros, o sus estimaciones, serán
necesarios para calcular la frecuencia que se esperaría en cada intervalo de
clase cuando la hipótesis nula sea verdadera. La media y la desviación
estándar calculadas a partir de los datos agrupados de la tabla 12.3.1 son

- X¼198:67
s¼41:31

Como siguiente paso en el análisis, debemos obtener para cada intervalo


de clase la frecuencia de ocurrencia de los valores que esperaríamos cuando la
hipótesis nula es verdadera, es decir, si la muestra fuera, de hecho, extraída de
una población normalmente distribuida de valores. Para hacer esto, primero
determinamos la frecuencia relativa esperada de aparición de valores para cada
intervalo de clase y luego multiplicamos estas frecuencias relativas esperadas por
el número total de valores para obtener el número esperado de valores para cada
intervalo.

Las frecuencias relativas esperadas


Se recordará de nuestro estudio de la distribución normal que la frecuencia relativa de
ocurrencia de valores iguales o menores que algún valor específico, digamos,X0, de la variable
aleatoria normalmente distribuidaXes equivalente al área bajo la curva y a la izquierda deX0
como se representa por el área sombreada en la Figura 12.3.1. Obtenemos el valor numérico de esta
área convirtiendoX0a una desviación normal estándar por la fórmulaz0¼ ðX0-metroÞ=sy encontrar el
valor apropiado en la Tabla D del Apéndice. Usamos este procedimiento para obtener las frecuencias
relativas esperadas correspondientes a cada uno de los intervalos de clase en la Tabla 12.3.1.
Estimamosmetroyscon -Xyscalculado a partir de los datos de muestra agrupados. El primer paso
consiste en obtenerzvalores correspondientes al límite inferior de cada intervalo de clase. El área
entre dos sucesivaszLos valores darán la frecuencia relativa esperada de aparición de valores para el
intervalo de clase correspondiente.
12.3 PRUEBAS DE BONDAD DE AJUSTE 607

X0 X

FIGURA 12.3.1Una distribución normal que muestra la frecuencia relativa de ocurrencia de valores
menores o iguales aX0. El área sombreada representa la frecuencia relativa de ocurrencia de valores
iguales o menores queX0.

Por ejemplo, para obtener la frecuencia relativa esperada de ocurrencia de valores en el intervalo
100.0 a 124.9 se procede de la siguiente manera:

100:0 - 198:67
Elzvalor correspondiente aX¼100:0 esz¼ ¼ -2:39
41:31
125:0 - 198:67
Elzvalor correspondiente aX¼125:0 esz¼ ¼ -1:78
41:31

En la tabla D del apéndice encontramos que el área a la izquierda de -2:39 es 0,0084 y el área a
la izquierda de -1:78 es 0,0375. El área entre -1:78 y -2:39 es igual a . 0375 - .0084¼ .0291, que es
igual a la frecuencia relativa esperada de ocurrencia de los niveles de colesterol en el intervalo
de 100,0 a 124,9. Esto nos dice que si la hipótesis nula es cierta, es decir, si los niveles de
colesterol se distribuyen normalmente, debemos esperar que el 2,91 por ciento de los valores
de nuestra muestra estén entre 100,0 y 124,9. Cuando multiplicamos nuestro tamaño de
muestra total, 47, por .0291, encontramos que la frecuencia esperada para el intervalo es 1.4.
Cálculos similares darán las frecuencias esperadas para los otros intervalos como se muestra
en la Tabla 12.3.2.

TABLA 12.3.2 Intervalos de clase y frecuencias esperadas para el ejemplo


12.3.1

zdXi-X-Þ=s en el
límite inferior Pariente esperado Esperado
Intervalo de clases de Intervalo Frecuencia Frecuencia

<100 . 0084 .4
1.8
100,0–124,9 - 2.39 . 0291 1.4
125,0–149,9 - 1.78 . 0815 3.8
150,0–174,9 - 1.18 . 1653 7.8
175,0–199,9 - . 57 . 2277 10.7
200,0–224,9 . 03 . 2269 10.7
225,0–249,9 . 64 . 1536 7.2
250,0–274,9 1.24 . 0753 3.5
275,0–299,9 1.85 . 0251 1.2
1.5
300.0 y mayor 2.45 . 0071 .3
608 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Comparación de frecuencias observadas y esperadas


Ahora estamos interesados en examinar las magnitudes de las discrepancias entre las frecuencias
observadas y las frecuencias esperadas, ya que notamos que los dos conjuntos de frecuencias no
concuerdan. Sabemos que incluso si nuestra muestra se extrajera de una distribución normal de
valores, la variabilidad del muestreo por sí sola haría muy poco probable que las frecuencias
observadas y esperadas coincidieran perfectamente. Nos preguntamos, entonces, si las discrepancias
entre las frecuencias observadas y esperadas son lo suficientemente pequeñas como para sentir que
es razonable que hayan ocurrido solo por casualidad, cuando la hipótesis nula es verdadera. Si son de
esta magnitud, no estaremos dispuestos a rechazar la hipótesis nula de que la muestra proviene de
una población normalmente distribuida.
Si las discrepancias son tan grandes que no parece razonable que puedan haber ocurrido
por pura casualidad cuando la hipótesis nula es verdadera, querremos rechazar la hipótesis
nula. El criterio con el que juzgamos si las discrepancias son "grandes" o "pequeñas" lo
proporciona la distribución chi-cuadrado.
Las frecuencias observadas y esperadas junto con cada valor dedOi- miiÞ2=Eise muestran
en la Tabla 12.3.3. La primera entrada en la última columna, por ejemplo, se calcula a partir de
d1 - 1:8Þ2=1:8¼ .356. Los demás valores dedOi- miiÞ2=Eise calculan de manera similar
manera.
PAG
De la Tabla 12.3.3 vemos queX2¼ ½ðOi- miiÞ2=Ei¼10:566. La Apropiada
grados de libertadPAG e número de grupos o intervalos de clase) -3 (para los tres
son 8 (thPAG
restricciones: hacer mii¼ Oi, y estimandometroysde los datos de muestra)¼5.
8. Decisión estadística.cuando comparamosX2¼10:566 con valores deX2en la Tabla F
del Apéndice, vemos que es menor queX2.95¼11:070, de modo que, en el . 05 nivel
de significación, no podemos rechazar la hipótesis nula de que la muestra proviene
de una población normalmente distribuida.

TABLA 12.3.3 Frecuencias observadas y esperadas y


dOi- miÞi 2=miipara el ejemplo 12.3.1

Observado Esperado
Frecuencia Frecuencia
2
Intervalo de clases (Oi) (MIi) dOi- miiÞ =mii

<100 0 .4
1.8 . 356
100,0–124,9 1 1.4
125,0–149,9 3 3.8 . 168
150,0–174,9 8 7.8 . 005
175,0–199,9 18 10.7 4.980
200,0–224,9 6 10.7 2.064
225,0–249,9 4 7.2 1.422
250,0–274,9 4 3.5 . 071
275,0–299,9 3 1.2
1.5 1.500
300.0 y 0 .3
mayor que

Total 47 47 10.566
12.3 PRUEBAS DE BONDAD DE AJUSTE 609

9. Conclusión.Concluimos que en la población muestreada, los niveles de colesterol


pueden seguir una distribución normal.
10pagvalor.Desde 11:070 > 10:566 > 9:236, 0,05 <pag < .10. En otras palabras, la probabilidad
de obtener un valor deX2tan grande como 10.566, cuando la hipótesis nula es verdadera,
está entre .05 y .10. Por lo tanto, concluimos que tal evento no es lo suficientemente raro
como para rechazar la hipótesis nula de que los datos provienen de una distribución
normal. &

A veces los parámetros se especifican en la hipótesis nula. Cabe señalar que si la


media y la varianza de la población se hubieran especificado como parte de la hipótesis
nula en el ejemplo 12.3.1, no habríamos tenido que estimarlas a partir de la muestra y
nuestros grados de libertad habrían sido 8 - 1¼7.

AlternativasAunque uno encuentra con frecuencia en la literatura el uso de chi cuadrado para
probar la normalidad, no es la prueba más apropiada para usar cuando la distribución hipotética es
continua. La prueba de Kolmogorov-Smirnov, descrita en el capítulo 13, se diseñó especialmente para
pruebas de bondad de ajuste que involucran distribuciones continuas.

EJEMPLO 12.3.2La distribución binomial


En un estudio diseñado para determinar la aceptación de un nuevo analgésico por parte de los pacientes, 100
médicos seleccionaron cada uno una muestra de 25 pacientes para participar en el estudio. A cada paciente, después
de probar el nuevo analgésico durante un período de tiempo específico, se le preguntó si era preferible al analgésico
que usaba regularmente en el pasado.
Los resultados del estudio se muestran en la Tabla 12.3.4.

TABLA 12.3.4 Resultados del estudio descrito en el ejemplo 12.3.2

Número de
Número de pacientes medicos Número total de pacientes
De 25 que prefieren reportando esto Prefiriendo el dolor nuevo
un nuevo analgésico Número Relevista por Doctor

0 5 0
1 6 6
2 8 dieciséis

3 10 30
4 10 40
5 15 75
6 17 102
7 10 70
8 10 80
9 9 81
10 o más 0 0

Total 100 500


610 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Nos interesa determinar si estos datos son o no compatibles con la hipótesis de que
fueron extraídos de una población que sigue una distribución binomial. Nuevamente,
empleamos una prueba de bondad de ajuste chi-cuadrado.

Solución: Dado que el parámetro binomial,pag,no se especifica, debe estimarse a partir de los
datos de la muestra. Un total de 500 pacientes de los 2500 pacientes que participaron
en el estudio dijeron que preferían el nuevo analgésico, por lo que nuestra estimación
puntual depages p̂¼500=2500¼ .20. Las frecuencias relativas esperadas se pueden
obtener evaluando la función binomial

FdX¼25CXd.2ÞXd.8Þ25-X

paraX¼0; 1; . . . ; 25. Por ejemplo, para encontrar la probabilidad de que de una


muestra de 25 pacientes ninguno prefiera el nuevo analgésico, cuando en la población
total la verdadera proporción que prefiere el nuevo analgésico es .2, evaluaríamos

Fd0¼25Cod:2Þod:8Þ25-o

Esto se puede hacer más fácilmente consultando la Tabla B del Apéndice, donde vemos que
PAGdX¼0Þ ¼ .0038. La frecuencia relativa de ocurrencia de muestras de tamaño 25 en las
que ningún paciente prefiere el nuevo analgésico es .0038. Para obtener la frecuencia
esperada correspondiente, multiplicamos .0038 por 100 para obtener .38. Cálculos similares
producen las frecuencias esperadas restantes que, junto con las frecuencias observadas, se
muestran en la Tabla 12.3.5. Vemos en esta tabla

TABLA 12.3.5 Cálculos para el Ejemplo 12.3.2

Número de
Número de Informes de médicos
Pacientes de 25 que Este número Esperado
prefieren nuevos dolores (Observado Relativo Esperado
calmante Frecuencia,Oi) Frecuencia Frecuenciamii

0 5 . 0038 . 38
11 2.74
1 6 . 0236 2.36
2 8 . 0708 7.08
3 10 . 1358 13.58
4 10 . 1867 18.67
5 15 . 1960 19.60
6 17 . 1633 16.33
7 10 . 1109 11.09
8 10 . 0623 6.23
9 9 . 0295 2.95
10 o más 0 . 0173 1.73

Total 100 1.0000 100.00


12.3 PRUEBAS DE BONDAD DE AJUSTE 611

que la primera frecuencia esperada es menor que 1, por lo que seguimos la sugerencia de
Cochran y combinamos este grupo con el segundo grupo. Cuando hacemos esto, todas las
frecuencias esperadas son mayores que 1.
A partir de los datos, calculamos

d11 - 2:74Þ2 d8 - 7:08Þ2 d0 - 1:73Þ2


X 2¼ þ þ þ ¼47:624
2:74 7:08 1:73
Los grados de libertad apropiados son 10 (el número de grupos que quedan
después de combinar los dos primeros) menos 2 u 8. Se pierde un grado de libertad
porque forzamos que el total de las frecuencias esperadas sea igual al total de las
frecuencias observadas, y un grado de la libertad se sacrifica porque estimamospagde
los datos de la muestra.
Comparamos nuestro calculadoX2con lo tabuladoX2con 8 grados de libertad y
encuentre que es significativa en el nivel de significancia de .005; eso es, pag < .005.
Rechazamos la hipótesis nula de que los datos provienen de una distribución binomial.
&

EJEMPLO 12.3.3La distribución de Poisson


El administrador de un hospital desea probar la hipótesis nula de que las admisiones de emergencia siguen
una distribución de Poisson conyo¼3. Suponga que durante un período de 90 días el número de admisiones
de emergencia fue como se muestra en la Tabla 12.3.6.

TABLA 12.3.6 Número de admisiones de emergencia a un hospital durante un período de 90


días

Emergencia Emergencia Emergencia Emergencia


Día admisiones Día admisiones Día admisiones Día admisiones

1 2 24 5 47 4 70 3
2 3 25 3 48 2 71 5
3 4 26 2 49 2 72 4
4 5 27 4 50 3 73 1
5 3 28 4 51 4 74 1
6 2 29 3 52 2 75 6
7 3 30 5 53 3 76 3
8 0 31 1 54 1 77 3
9 1 32 3 55 2 78 5
10 0 33 2 56 3 79 2
11 1 34 4 57 2 80 1
12 0 35 2 58 5 81 7
13 6 36 5 59 2 82 7
14 4 37 0 60 7 83 1
15 4 38 6 61 8 84 5
dieciséis 4 39 4 62 3 85 1
(Continuación)
612 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Emergencia Emergencia Emergencia Emergencia


Día admisiones Día admisiones Día admisiones Día admisiones

17 3 40 4 63 1 86 4
18 4 41 5 64 3 87 4
19 3 42 1 sesenta y cinco 1 88 9
20 3 43 3 66 0 89 2
21 3 44 1 67 3 90 3
22 4 45 2 68 2
23 3 46 3 69 1

Los datos de la Tabla 12.3.6 se resumen en la Tabla 12.3.7.

Solución: Para obtener las frecuencias esperadas, primero obtenemos las frecuencias relativas
esperadas evaluando la función de Poisson dada por la Ecuación 4.4.1 para cada
entrada en la columna de la izquierda de la Tabla 12.3.7. Por ejemplo, la primera
frecuencia relativa esperada se obtiene evaluando

mi-330
Fd0¼
0!

Podemos usar la Tabla C del Apéndice para encontrar esta y todas las demás frecuencias
relativas esperadas que necesitamos. Cada una de las frecuencias relativas esperadas

TABLA 12.3.7 Resumen de los datos presentados en la


Tabla 12.3.6

Número de
Número de Días Este Número
Admisiones de emergencia de emergencia
en un día Admisiones Ocurridas

0 5
1 14
2 15
3 23
4 dieciséis

5 9
6 3
7 3
8 1
9 1
10 o más 0

Total 90
12.3 PRUEBAS DE BONDAD DE AJUSTE 613

TABLA 12.3.8 Frecuencias observadas y esperadas y componentes deX2para el ejemplo


12.3.3

Número de
Número de Días este Esperado
Emergencia Número Relativo Esperado dOi- miiÞ2
admisiones Ocurrió,Oi Frecuencia Frecuencia mii

0 5 . 050 4.50 . 056


1 14 . 149 13.41 . 026
2 15 . 224 20.16 1.321
3 23 . 224 20.16 . 400
4 dieciséis . 168 15.12 . 051
5 9 . 101 9.09 . 001
6 3 . 050 4.50 . 500
7 3 . 022 1.98 . 525
9 9
8 1>= . 008 . 72>
=
9 12 . 003 . 27 1.08 . 784
;> >
;
10 o más 0 . 001 . 09

Total 90 1.000 90.00 3.664

se multiplica por 90 para obtener las frecuencias esperadas correspondientes.


Estos valores junto con las frecuencias observadas y esperadas y los
componentes deX2,dOi- miiÞ2=Ei, se muestran en la Tabla 12.3.8, en la que vemos
que

" #
XdOi- mi iÞ
2
d5 - 4:50Þ2 d2 - 1:08Þ2
X2¼ ¼ þ þ ¼3:664
mii 4:50 1:08

También observamos que las últimas tres frecuencias esperadas son menores que 1,
por lo que deben combinarse para evitar tener frecuencias esperadas menores que 1.
Esto significa que solo tenemos nueve categorías efectivas para calcular los grados de
libertad. Dado que el parámetro,yo,se especificó en la hipótesis nula, no perdemos un
grado de libertad por razones de estimación, por lo que los grados de libertad
apropiados son 9 - 1¼8. Al consultar la Tabla F del Apéndice, encontramos que el valor
crítico deX2para 8 grados de libertad y a¼ .05 es 15,507, por lo que no podemos
rechazar la hipótesis nula en el nivel de 0,05 o, en realidad, en cualquier nivel
razonable de significación (pag > .10). Concluimos, por lo tanto, que las admisiones de
emergencia en este hospital pueden seguir una distribución de Poisson conyo¼3. Al
menos los datos observados no arrojan ninguna duda sobre esa hipótesis.

Si el parámetroyodebe estimarse a partir de datos de muestra, la


estimación se obtiene multiplicando cada valorXpor su frecuencia, sumando
estos productos y dividiendo el total por la suma de las frecuencias. &
614 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

EJEMPLO 12.3.4La Distribución Uniforme


La temporada de gripe en el sur de Nevada de 2005 a 2006 se extendió de diciembre a abril, los meses
más fríos del año. El Distrito de Salud del Sur de Nevada informó la cantidad de casos de influenza
prevenibles por vacunación que se muestran en la Tabla 12.3.9. Estamos interesados en saber si la
cantidad de casos de gripe en el distrito se distribuye por igual entre los cinco meses de la temporada
de gripe. Es decir, deseamos saber si los casos de gripe siguen una distribución uniforme.

Solución:

1. Datos.Ver Tabla 12.3.9.


2. Supuestos.Suponemos que los casos de gripe notificados constituyen una muestra
aleatoria simple de los casos de gripe que ocurrieron en el distrito.
3. Hipótesis.
H0: Los casos de gripe en el sur de Nevada se distribuyen uniformemente en los cinco
meses de la temporada de gripe.

HA: Los casos de gripe en el sur de Nevada no se distribuyen uniformemente en el


cinco meses de la temporada de

gripe. Dejara¼ .01.

4. Estadística de prueba.La estadística de prueba es

XdOi- mi iÞ2
X2¼
mii

5. Distribución de la estadística de prueba.SiH0es verdad,X2se distribuye


aproximadamente comoX2cond5 - 1¼4 grados de libertad.
6. Regla de decisión.RechazarH0si el valor calculado deX2es igual o
mayor que 13.277.

TABLA 12.3.9 Casos notificados de influenza prevenible


mediante vacunación en el sur de Nevada, diciembre de
2005 a abril de 2006

Número de
Casos Reportados
Mes de la gripe

diciembre de 2005 62
enero de 2006 84
febrero de 2006 17
marzo de 2006 dieciséis

abril de 2006 21
Total 200
Fuente:http://www.southernnevadahealthdistrict.org/
epidemiology/disease_statistics.htm.
12.3 PRUEBAS DE BONDAD DE AJUSTE 615

Gráfico de valores observados y esperados


90
Esperado
80 Observado
70
60
50
Valor

40
30
20
10
0
Categoría 1 2 3 4 5

Prueba de bondad de ajuste chi-cuadrado para conteos observados en la variable: C1

Prueba Contribución

Categoría Observado Proporción Esperado a Chi-cuadrado


1 62 0.2 40 12.100
2 84 0.2 40 48.400
3 17 0.2 40 13.225
4 dieciséis 0.2 40 14.400
5 21 0.2 40 9.025

norte DF Chi-Cuadrado Valor P


200 4 97.15 0.000

FIGURA 12.3.2Salida de MINITAB para el Ejemplo 12.3.4.

7. Cálculo de la estadística de prueba.Si la hipótesis nula es verdadera, esperaríamos


observar 200=5¼40 cajas por mes. La figura 12.3.2 muestra la impresión de
computadora obtenida de MINITAB. El gráfico de barras muestra las frecuencias
observadas y esperadas por mes. La tabla de chi-cuadrado proporciona las
frecuencias observadas, las frecuencias esperadas basadas en una distribución
uniforme y la contribución de chi-cuadrado individual para cada valor de prueba.

8. Decisión estadística.Desde 97.15, el valor calculado deX2, es mayor que


13.277, con base en estos datos rechazamos la hipótesis nula de una
616 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

distribución uniforme de casos de gripe durante la temporada de gripe en el sur de


Nevada.

9. Conclusión.Concluimos que la ocurrencia de casos de gripe no sigue una


distribución uniforme.
10pagvalor.De la salida de MINITAB vemos quepag¼ .000 (es decir, < .001).
&

EJEMPLO 12.3.5
Se cree que cierto rasgo humano se hereda de acuerdo con la proporción 1:2:1 para
homocigotos dominantes, heterocigotos y homocigotos recesivos. Un examen de una muestra
aleatoria simple de 200 individuos arrojó la siguiente distribución del rasgo: dominante, 43;
heterocigotos, 125; y recesivo, 32. Deseamos saber si estos datos aportan suficiente evidencia
para poner en duda la creencia sobre la distribución del rasgo.

Solución:

1. Datos.Ver enunciado del ejemplo.


2. Supuestos.Suponemos que los datos cumplen con los requisitos para la aplicación
de la prueba de bondad de ajuste chi-cuadrado.
3. Hipótesis.
H0: El rasgo se distribuye según la proporción 1:2:1 para homocigotos
dominante, heterocigoto y homocigoto recesivo. HA:
El rasgo no se distribuye según la relación 1:2:1.
4. Estadística de prueba.La estadística de prueba es

" #
XdO-EÞ2
X2¼
mi

5. Distribución de la estadística de prueba.SiH0es verdad,X2se distribuye como chi-cuadrado


con 2 grados de libertad.

6. Regla de decisión.Supongamos que dejamos que la probabilidad de cometer un


error tipo I sea .05. RechazarH0si el valor calculado deX2es igual o mayor que
5.991.
7. Cálculo de la estadística de prueba.SiH0es cierto, las frecuencias esperadas para las
tres manifestaciones del rasgo son 50, 100 y 50 para dominante, heterocigoto y
recesivo, respectivamente. Como consecuencia,

X2¼ ð43 - 50Þ2=50þ ð125 - 100Þ2=100þ ð32 - 50Þ2=50¼13:71

8. Decisión estadística.Como 13:71 > 5:991, rechazamosH0.


9. Conclusión.Concluimos que el rasgo no se distribuye según la
relación 1:2:1.
10pagvalor.Desde 13:71 > 10:597, elpagel valor de la prueba espag < .005.&
EJERCICIOS 617

EJERCICIOS

12.3.1La siguiente tabla muestra la distribución de las determinaciones de ácido úrico realizadas en 250 pacientes.
Pruebe la bondad de ajuste de estos datos a una distribución normal conmetro¼5:74 ys¼2:01. Dejara¼ .01.

Ácido úrico Observado Ácido úrico Observado


Determinación Frecuencia Determinación Frecuencia

<1 1 6 a 6,99 45
1 a 1,99 5 7 a 7.99 30
2 a 2,99 15 8 a 8.99 22
3 a 3,99 24 9 a 9.99 10
4 a 4,99 43 10 o más 5
5 a 5,99 50

Total 250

12.3.2Los siguientes datos se recopilaron en 300 niñas de ocho años. Pruebe, al nivel de significancia de .05,
la hipótesis nula de que los datos se extraen de una población normalmente distribuida. La media muestral y
la desviación estándar calculadas a partir de datos agrupados son 127,02 y 5,08.

Altura en Observado Altura en Observado


centímetros Frecuencia centímetros Frecuencia

114 a 115,9 5 128 a 129,9 43


116 a 117,9 10 130 a 131,9 42
118 a 119,9 14 132 a 133,9 30
120 a 121,9 21 134 a 135,9 11
122 a 123,9 30 136 a 137,9 5
124 a 125,9 40 138 a 139,9 4
126 a 127,9 45

Total 300

12.3.3La hoja frontal de los registros de los pacientes que se mantiene en un departamento de salud local contiene 10 entradas.
Una muestra de 100 registros reveló la siguiente distribución de entradas erróneas:

Número de erróneos
Entradas de 10 Número de registros

0 8
1 25
2 32
3 24
4 10
5 o más 1

Total 100
618 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Pruebe la bondad de ajuste de estos datos a la distribución binomial conpag¼ .20. Encuentra elpagvalor para esta
prueba.

12.3.4En un estudio realizado por Byers et al. (A-2), los investigadores probaron un modelo de Poisson para la distribución de
las puntuaciones de las actividades de la vida diaria (AVD) después de un programa de prehabilitación de 7 meses
diseñado para prevenir el deterioro funcional entre las personas mayores físicamente frágiles que viven en la
comunidad. ADL midió la capacidad de las personas para realizar tareas esenciales, como caminar dentro de la casa,
bañarse, vestirse la parte superior e inferior del cuerpo, trasladarse de una silla, ir al baño, alimentarse y arreglarse.
El método de calificación utilizado en este estudio asignó un valor de 0 para ninguna ayuda (personal) y ninguna
dificultad, 1 para dificultad pero sin ayuda y 2 para ayuda independientemente de la dificultad. Las puntuaciones se
sumaron para producir una puntuación global que oscilaba entre 0 y 16 (para ocho tareas). Hubo 181 sujetos que
completaron el estudio. Supongamos que usamos el método de puntuación de los autores para evaluar el estado de
otro grupo de 181 sujetos en relación con sus actividades de la vida diaria. Supongamos que se obtuvieron los
siguientes resultados.

Observado Esperado Observado Esperado


X FrecuenciaX Frecuencia X FrecuenciaX Frecuencia

0 74 11.01 7 4 2.95
1 27 30.82 8 3 1.03
2 14 43.15 9 2 0.32
3 14 40.27 10 3 0.09
4 11 28.19 11 4 0.02
5 7 15.79 12 o más 13 0.01
6 5 7.37
Fuente: Datos hipotéticos basados en el procedimiento informado por Amy L. Byers, Heather
Allore, Thomas M. Gill y Peter N. Peduzzi, “Application of Negative Binomial Modeling for Discrete
Outcomes: A Case Study in Aging Research”Revista de Epidemiología Clínica, 56 (2003), 559–564.

Pruebe la hipótesis nula de que estos datos se extrajeron de una distribución de Poisson conyo¼2:8. Dejar a
¼ .01.

12.3.5Los siguientes son los números de un organismo particular encontrado en 100 muestras de agua de un
estanque:

Número de organismos Número de organismos


por muestra Frecuencia por muestra Frecuencia

0 15 4 5
1 30 5 4
2 25 6 1
3 20 7 0

Total 100

Pruebe la hipótesis nula de que estos datos se extrajeron de una distribución de Poisson. Determina elpagvalor para
esta prueba.
12.4 PRUEBAS DE INDEPENDENCIA 619

12.3.6Un equipo de investigación realizó una encuesta en la que los sujetos eran fumadores adultos. A cada sujeto de una
muestra de 200 se le pidió que indicara en qué medida estaba de acuerdo con la afirmación: “Me gustaría dejar de
fumar”. Los resultados fueron los siguientes:

Respuesta: Totalmente de acuerdo Aceptar Discrepar Muy en desacuerdo


Número
Respondiendo: 102 30 60 8

¿Se puede concluir sobre la base de estos datos que, en la población muestreada, las opiniones no se
distribuyen por igual en los cuatro niveles de acuerdo? Sea .05 la probabilidad de cometer un error tipo I y
encuentre elpagvalor.

12.4 PRUEBAS DE INDEPENDENCIA

Otro uso, y quizás el más frecuente, de la distribución chi-cuadrado es probar la hipótesis nula de que
dos criterios de clasificación, cuando se aplican al mismo conjunto de entidades, son independientes.
Decimos que dos criterios de clasificación son independientes si la distribución de un criterio es la
misma sin importar cuál sea la distribución del otro criterio. Por ejemplo, si el nivel socioeconómico y
el área de residencia de los habitantes de una determinada ciudad son independientes, esperaríamos
encontrar la misma proporción de familias en los grupos socioeconómicos bajo, medio y alto en todas
las áreas de la ciudad.

La tabla de contingenciaLa clasificación, según dos criterios, de un conjunto de entidades,


digamos personas, puede mostrarse mediante una tabla en la querfilas representan los
diversos niveles de un criterio de clasificación y elClas columnas representan los distintos
niveles del segundo criterio. Tal tabla generalmente se llamamesa de contingencia,con
dimensiónr-c. La clasificación según dos criterios de una población finita de entidades se
muestra en la Tabla 12.4.1.
Nos interesará probar la hipótesis nula de que en la población los dos criterios
de clasificación son independientes. Si se rechaza la hipótesis, concluiremos que

TABLA 12.4.1 Clasificación bidireccional de una población finita


de entidades

Segundo
criterio de Primer Criterio del Nivel de Clasificación
Clasificación
Nivel 1 2 3 ... C Total

1 norte11 norte12 norte13 ... norte1C norte1.

2 norte21 norte22 norte23 ... norte2C norte2.

3 norte31 norte32 norte33 ... norte3C norte3.

.. .. ..
. . ... ... ... ... .
r norter1 norter2 norter3 ... norterc norter:

Total NORTE.1 NORTE.2 NORTE.3 ... NORTE.C norte


620 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

TABLA 12.4.2 Clasificación bidireccional de una muestra de


entidades

Segundo
criterio de Primer Criterio del Nivel de Clasificación
Clasificación
Nivel 1 2 3 ... C Total

1 norte11 norte12 norte13 ... norte1C norte1.

2 norte21 norte22 norte23 ... norte2C norte2.

3 norte31 norte32 norte33 ... norte3C norte3.


.. ..
. . ... ... ... ...

r norter1 norter2 norter3 ... norterc norter.

Total norte.1 norte.2 norte.3 ... norte.C norte

los dos criterios de clasificación no son independientes. Una muestra de tamañonortese


extraerá de la población de entidades, y la frecuencia de ocurrencia de entidades en la muestra
correspondiente a las celdas formadas por las intersecciones de las filas y columnas de la Tabla
12.4.1 junto con los totales marginales se mostrarán en una tabla como Tabla 12.4.2.

Cálculo de las frecuencias esperadasLa frecuencia esperada, bajo


para cada celda se calcula la hipótesis nula de que los dos criterios de clasificación son
independientes.
Aprendimos en el Capítulo 3 (ver Ecuación 3.4.4) que si dos eventos son independientes,
la probabilidad de que ocurran juntos es igual al producto de sus probabilidades individuales.
Bajo el supuesto de independencia, por ejemplo, calculamos la probabilidad de que uno de los
nortelos sujetos representados en la Tabla 12.4.2 se contarán en la Fila 1 y la Columna 1 de la
tabla (es decir, en la Celda 11) multiplicando la probabilidad de que el sujeto se cuente en la Fila
1 por la probabilidad de que el sujeto se cuente en Columna 1. En la notación de la tabla, el
cálculo deseado es

- n1:--n .1-
norte norte

Para obtener la frecuencia esperada para la Celda 11, multiplicamos esta probabilidad por el número
total de sujetos,norte.Es decir, la frecuencia esperada para la Celda 11 viene dada por

- n -- -
1: norte. 1
dnorteÞ
norte norte

Desde elnorteen uno de los denominadores se cancela en el numeradornorte,esta expresión se reduce a

dnorte1:Þðnorte.1Þ

norte

Entonces, en general, vemos que para obtener la frecuencia esperada para una celda dada,
multiplicamos el total de la fila en la que se encuentra la celda por el total de la columna en la que se
encuentra la celda y dividimos el producto por el gran total.
12.4 PRUEBAS DE INDEPENDENCIA 621

Frecuencias observadas versus frecuencias esperadasLas frecuencias esperadas y


se comparan las frecuencias observadas. Si la discrepancia es suficientemente pequeña, la hipótesis
nula es defendible. Si la discrepancia es suficientemente grande, se rechaza la hipótesis nula y se
concluye que los dos criterios de clasificación no son independientes. La decisión de si la discrepancia
entre las frecuencias observadas y esperadas es lo suficientemente grande como para provocar el
rechazo deH0se hará sobre la base del tamaño de la cantidad calculada cuando usamos la Ecuación
12.2.4, dondeOiymiirefiérase, respectivamente, a las frecuencias observadas y esperadas en las celdas
de la Tabla 12.4.2. Sería más lógico designar las frecuencias observadas y esperadas en estas celdas
porOyoymiyo, pero para mantener la notación simple y evitar la introducción de otra fórmula, hemos
optado por usar la notación más simple. Será útil pensar en las celdas numeradas del 1 alk,donde 1 se
refiere a la celda 11 ykse refiere a la celdarc.Se puede demostrar queX2tal como se define de esta
manera se distribuye aproximadamente comoX2condr-1ÞðC -1Þgrados de libertad cuando la hipótesis
nula es verdadera. Si el valor calculado deX2es igual o mayor que el valor tabulado deX2para algunos

a,se rechaza la hipótesis nula en elanivel de significancia. El procedimiento de prueba de


hipótesis se ilustra con el siguiente ejemplo.

EJEMPLO 12.4.1
En 1992, el Servicio de Salud Pública de EE. UU. y los Centros para el Control y la Prevención de
Enfermedades recomendaron que todas las mujeres en edad fértil consuman 400metrog de ácido
fólico al día para reducir el riesgo de tener un embarazo afectado por un defecto del tubo neural
como la espina bífida o la anencefalia. En un estudio de Stepanuk et al. (A-3), 693 gestantes llamaron a
un servicio de información teratológica sobre el uso de suplementos de ácido fólico. Los
investigadores querían determinar si el uso de ácido fólico antes de la concepción y la raza son
independientes. Los datos aparecen en la Tabla 12.4.3.

Solución:

1. Datos.Ver Tabla 12.4.3.


2. Supuestos.Suponemos que la muestra disponible para el análisis es equivalente a
una muestra aleatoria simple extraída de la población de interés.

TABLA 12.4.3 Raza de la embarazada que llama y uso de ácido


fólico

Uso preconcepcional de ácido fólico

Sí No Total

Blanco 260 299 559


Negro 15 41 56
Otro 7 14 21
Total 282 354 636
Fuente: Kathleen M. Stepanuk, Jorge E. Tolosa, Dawneete Lewis, Victoria Meyers,
Cynthia Royds, Juan Carlos Saogal y Ron Librizzi, “Folic Acid Supplementation Use
Among Women Who Contact a Teratology Information Service”Diario americano de
obstetricia y ginecología, 187 (2002), 964–967.
622 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

3. Hipótesis.
H0: La raza y el uso de ácido fólico antes de la concepción son independientes. H
A: Las dos variables no son independientes.
Dejara¼ .05.

4. Estadística de prueba. La estadística de prueba es

" #
Xk dOi- miiÞ2
X2¼
i¼1
mii

5. Distribución de la estadística de prueba. CuandoH0es verdad,X2esta distribuido


aproximadamente comoX2condr-1ÞðC -1Þ ¼ ð3 - 1Þð2 - 1Þ ¼ ð2Þð1¼ 2
grados de libertad.
6. Regla de decisión.RechazarH0si el valor calculado deX2es igual o
mayor que 5.991.
7. Cálculo de la estadística de prueba.La frecuencia esperada para la primera
celda es d559 - 282Þ=636¼247:86. Las otras frecuencias esperadas se
calculan de manera similar. Las frecuencias observadas y esperadas se
muestran en la Tabla 12.4.4. A partir de las frecuencias observadas y
esperadas podemos calcular
" #
X2¼ PAGdOi- miiÞ2
mii

d260 - 247:86Þ2 d299 - 311:14Þ2 d14 - 11:69Þ2


¼ þ þ...þ
247:86 311:14 11:69
¼ .59461þ .47368þ . . . þ .45647¼9:08960

8. Decisión estadística.rechazamosH0desde 9:08960 > 5:991.


9. Conclusión.Concluimos queH0es falso, y que existe una relación entre la
raza y el uso preconcepcional de ácido fólico.
10pagvalor.Desde 7:378 < 9:08960 < 9:210, .01 <pag < .025.

TABLA 12.4.4 Frecuencias observadas y esperadas para el


ejemplo 12.4.1

Uso preconcepcional de ácido fólico

Sí No Total

Blanco 260 (247,86) 299 (311.14) 559


Negro 15 (24,83) 41 (31.17) 56
Otro 7 (9.31) 14 (11,69) 21

Total 282 354 636


&
12.4 PRUEBAS DE INDEPENDENCIA 623

Análisis informáticoLa computadora se puede usar con ventaja para calcularX2para pruebas
de independencia y pruebas de homogeneidad. La figura 12.4.1 muestra el procedimiento y la
impresión del ejemplo 12.4.1 cuando el programa MINITAB para calcularX2de tablas de
contingencia. Los datos se ingresaron en las Columnas 1 y 2 de MINITAB, correspondientes a
las columnas de la Tabla 12.4.3.
Podemos usar SAS®para obtener un análisis y una impresión de los datos de la tabla de
contingencia utilizando la sentencia PROC FREQ. La Figura 12.4.2 muestra un SAS parcial®impresión
que refleja el análisis de los datos del ejemplo 12.4.1.

Datos:

C1: 260 15 7
C2: 299 41 14

Caja de diálogo: Comando de sesión:

Estadística Mesas Prueba de chi-cuadrado BTT > CHISQUARE C1-C3

TipoC1-C2en Columnas que contienen la tabla. Hacer clicDE


ACUERDO.

Producción:

Prueba Chi-Cuadrado: C1, C2

Los conteos esperados se imprimen debajo de los conteos observados

C1 C2 Total
1 260 299 559
247.86 311.14

2 15 41 56
24.83 31.17

3 7 14 21
9.31 11.69

Total 282 354 636

Chi-cuadrado = 0,595 + 0,474 +


3.892 + 3.100 +
0,574 + 0,457 = 9,091
GL = 2, valor P = 0,011

FIGURA 12.4.1Procedimiento MINITAB y salida para el análisis de chi-cuadrado de datos en la Tabla 12.4.3.
624 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

El S.A.S. Sistema

El FRECUENCIA Procedimiento

Tabla de raza por fólico

carrera fólico
Frecuencia
Por ciento
Fila porcentaje

Columna porcentaje No Sí Total


-------------------------------
Negro 41 15 56
6.45 2.36 8.81
73.21 26.79
11.58 5.32
-------------------------------
Otro 14 7 21
2.20 1.10 3.30
66.67 33.33
3.95 2.48
-------------------------------
Blanco 299 260 559
47.01 40.88 87.89
53.49 46.51
84.46 92.20
-------------------------------
Total 354 282 636
55.66 44.34 100.00

Estadísticas para Tabla de raza por fólico

Estadística DF Valor problema


--------------------------------------------------------------
chi-cuadrado 2 9.0913 0.0106
Probabilidad Relación chi-cuadrado 2 9.4808 0.0087
Mantel—Haenszel chi-cuadrado 1 8.9923 0.0027
Coeficiente phi 0.1196
Coeficiente de contingencia V 0.1187
de Cramer 0.1196

Tamaño de la muestra = 636

FIGURA 12.4.2SAS parcial®impresión para el análisis de chi-cuadrado de los datos del


ejemplo 12.4.1.
12.4 PRUEBAS DE INDEPENDENCIA 625

Tenga en cuenta que el SAS®La impresión muestra, en cada celda, el porcentaje que representa la
frecuencia de celda del total de su fila, su total de columna y el total general. También se muestra, para cada
total de fila y columna, el porcentaje que representa el total del total general. Además deX2estadística, SAS®
da el valor de varias otras estadísticas que se pueden calcular a partir de los datos de la tabla de
contingencia. Uno de ellos, el estadístico chi-cuadrado de Mantel-Haenszel, se analizará en una sección
posterior de este capítulo.

Pequeñas frecuencias esperadasEl problema de las frecuencias esperadas pequeñas


discutido en la sección anterior puede encontrarse al analizar los datos de las tablas de
contingencia. Aunque existe una falta de consenso sobre cómo manejar este problema,
muchos autores actualmente siguen la regla dada por Cochran (5). Él sugiere que para las
tablas de contingencia con más de 1 grado de libertad, se permite una expectativa mínima de 1
si no más del 20 por ciento de las celdas tienen frecuencias esperadas de menos de 5. Para
cumplir con esta regla, las filas y/o columnas adyacentes pueden combinarse cuando hacerlo es
lógico a la luz de otras consideraciones. SiX2se basa en menos de 30 grados de libertad, se
pueden tolerar frecuencias esperadas tan pequeñas como 2. No experimentamos el problema
de las frecuencias esperadas pequeñas en el ejemplo 12.4.1, ya que todas eran mayores que 5.

La tabla de contingencia 2 - 2A veces, cada uno de los dos criterios de clasificación puede
dividirse en solo dos categorías o niveles. Cuando los datos se clasifican de esta manera, el
resultado es una tabla de contingencia que consta de dos filas y dos columnas. Tal tabla se
conoce comúnmente como una tabla 2 - 2. El valor deX2puede calcularse calculando primero las
frecuencias de celda esperadas de la manera discutida anteriormente. Sin embargo, en el caso
de una tabla de contingencia 2 - 2,X2puede calcularse mediante la siguiente fórmula abreviada:

nortedanuncio - acÞ2
X2¼ (12.4.1)
daþCÞðbþdÞðaþbÞðCþdÞ

dóndea B C,ydson las frecuencias de celda observadas como se muestra en la Tabla 12.4.5.
Cuando aplicamos eldr-1ÞðC -1Þregla para hallar grados de libertad en una tabla 2 - 2, el
resultado es 1 grado de libertad. Ilustremos esto con un ejemplo.

TABLA 12.4.5 Una tabla de contingencia 2 - 2

Primer Criterio de Clasificación


Segundo Criterio
de Clasificación 1 2 Total

1 a b aþb
2 C d Cþd

Total aþC bþd norte


626 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

EJEMPLO 12.4.2
Según Silver y Aiello (A-4), las caídas son motivo de gran preocupación entre los supervivientes de la poliomielitis. Los
investigadores querían determinar el impacto de una caída en los cambios de estilo de vida. La Tabla 12.4.6 muestra
los resultados de un estudio de 233 sobrevivientes de polio sobre si el miedo a caerse resultó en cambios en el estilo
de vida.

Solución:

1. Datos.A partir de la información proporcionada, podemos construir la tabla de


contingencia 2 - 2 que se muestra en la Tabla 12.5.6.

2. Supuestos.Suponemos que la muestra es equivalente a una muestra


aleatoria simple.
3. Hipótesis.
H0: El estado de caída y el cambio de estilo de vida debido al miedo a caer son
independiente.
H1: Las dos variables no son independientes.
Dejara¼ .05.
4. Estadística de prueba. La estadística de prueba es

" #
Xk dOi- miiÞ2
X2¼
i¼1
mii

5. Distribución de la estadística de prueba. CuandoH0es verdad,X2esta distribuido


aproximadamente comoX2condr-1ÞðC -1Þ ¼ ð2 - 1Þð2 - 1Þ ¼ ð1Þð1¼ 1
grado de libertad.
6. Regla de decisión.RechazarH0si el valor calculado deX2es igual o
mayor que 3.841.
7. Cálculo de la estadística de prueba.Por la Ecuación 12.4.1 calculamos

233½ð131Þð36Þ - ð52Þð14Þ2
X2¼ ¼31:7391
d145Þð88Þð183Þð50Þ

8. Decisión estadística. rechazamosH0desde 31:7391 > 3:841.

TABLA 12.4.6 Tabla de contingencia para los datos del ejemplo 12.4.2

Hizo cambios en el estilo de vida por miedo a caerse

Sí No Total

Fallers 131 52 183


no caídas 14 36 50

Total 145 88 233

Fuente: JK Silver y DD Aiello, “Polio Survivors: Falls and Subsecuente Injuries,” Revista
estadounidense de medicina física y rehabilitación, 81 (2002), 567–570.
12.4 PRUEBAS DE INDEPENDENCIA 627

9. Conclusión.Concluimos queH0es falso, y que existe una relación


entre experimentar una caída y cambiar el estilo de vida por miedo
a caer.
10pagvalor.Desde 31:7391 > 7:879,pag < .005. &

Pequeñas frecuencias esperadasLos problemas de cómo manejar frecuencias esperadas pequeñas


y tamaños de muestra totales pequeños pueden surgir en el análisis de tablas de contingencia 2 - 2.
Cochran (5) sugiere que elX2No se debe usar la prueba sin <20 o si 20 <n <40 y cualquier frecuencia
esperada es menor que 5. Cuandonorte¼40, se puede tolerar una frecuencia de celda esperada tan
pequeña como 1.

Corrección de YatesLas frecuencias observadas en una tabla de contingencia son


discretas y, por lo tanto, dan lugar a una estadística discreta,X2, que se aproxima por laX2
distribución, que es continua. Yates (6) en 1934 propuso un procedimiento para corregir esto en
el caso de 2 - 2 tablas. La corrección, como se muestra en la Ecuación 12.4.2, consiste en restar
la mitad del número total de observaciones del valor absoluto de la cantidad anuncio - acantes
de cuadrar. Eso es,

norteDJanuncio - acj-.5norteÞ2
X2corregido¼ (12.4.2)
daþCÞðbþdÞðaþbÞðCþdÞ

En general, se acepta que no es necesaria ninguna corrección para las tablas de contingencia más
grandes. Aunque la corrección de Yates para las tablas 2 - 2 se ha utilizado mucho en el pasado, los
investigadores más recientes han cuestionado su uso. Como resultado, algunos médicos
desaconsejan su uso.
Podemos, como cuestión de interés, aplicar la corrección a nuestro ejemplo actual.
Usando la Ecuación 12.4.2 y los datos de la Tabla 12.4.6, podemos calcular

233½jð131Þð36Þ - ð52Þð14Þj - .5d233Þ2


X2¼ ¼29:9118
d145Þð88Þð183Þð50Þ

Como era de esperar, con una muestra tan grande, la diferencia en los dos resultados no es
dramática.

Pruebas de Independencia: CaracterísticasLas características de un chi-


prueba de independencia al cuadrado que la distinguen de otras pruebas de chi-cuadrado son las siguientes:

1.Se selecciona una sola muestra de una población de interés y los sujetos u objetos se clasifican
de forma cruzada sobre la base de las dos variables de interés.
2.El fundamento para calcular las frecuencias de celda esperadas se basa en la ley de
probabilidad, que establece que si dos eventos (aquí los dos criterios de clasificación) son
independientes, la probabilidad de que ocurran juntos es igual al producto de sus
probabilidades individuales.
3.Las hipótesis y conclusiones se expresan en términos de la independencia (o falta de
independencia) de dos variables.
628 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

EJERCICIOS

En los ejercicios que siguen, realice la prueba al nivel de significación indicado y determine lapag
valor.

12.4.1En el estudio de Silver y Aiello (A-4) citado en el Ejemplo 12.4.2, un objetivo secundario fue determinar si la
frecuencia de las caídas era independiente del uso de la silla de ruedas. La siguiente tabla proporciona los
datos de caídas y uso de silla de ruedas entre los sujetos del estudio.

Uso de silla de ruedas

Sí No

Fallers 62 121
no caídas 18 32
Fuente: JK Silver y DD Aiello, “Polio Survivors: Falls and
Subsecuente Injuries,”Revista estadounidense de medicina física y
rehabilitación, 81 (2002), 567–570.

¿Estos datos proporcionan evidencia suficiente para garantizar la conclusión de que el uso de sillas de ruedas y las caídas están

relacionados? Dejara¼ .05.

12.4.2La infección del sitio quirúrgico esternal (SSI) después de la cirugía de injerto de derivación de la arteria coronaria es una complicación que
aumenta la morbilidad del paciente y los costos para los pacientes, los pagadores y el sistema de atención médica.
Segal y Anderson (A-5) realizaron un estudio que examinó dos tipos de preparación preoperatoria de la piel antes de
realizar una cirugía a corazón abierto. Estas dos preparaciones utilizaron yodo acuoso y yodo insoluble con los
siguientes resultados.

Comparación de Acuoso
y preparaciones insolubles

Grupo de preparación Infectado no infectado

yodo acuoso 14 94
yodo insoluble 4 97
Fuente: Cynthia G. Segal y Jacqueline J. Anderson, “Preoperatorio de preparación de
la piel de pacientes cardíacos”Revista AORN, 76 (2002), 821–827.

¿Estos datos proporcionan suficiente evidencia en ela¼ .05 nivel para justificar la conclusión de que el tipo de
preparación de la piel y la infección están relacionados?

12.4.3Los efectos secundarios de los medicamentos antiinflamatorios no esteroideos (AINE) incluyen problemas
relacionados con la úlcera péptica, la función renal y la enfermedad hepática. En 1996, el Colegio Americano
de Reumatología emitió y difundió pautas que recomendaban pruebas de referencia (CBC, panel hepático y
pruebas renales) al prescribir AINE. Rothenberg y Holcomb (A-6) realizaron un estudio para determinar si los
médicos que participaban en una base de datos nacional de registros médicos computarizados realizaban las
pruebas de referencia recomendadas cuando recetaban AINE. Los investigadores clasificaron a los médicos
del estudio en cuatro categorías: los que practican medicina interna, medicina familiar, medicina familiar
académica y grupos de múltiples especialidades. Los datos aparecen en la siguiente tabla.
EJERCICIOS 629

Pruebas de referencia

Tipo de práctica realizadas Sí No

Medicina Interna 294 921


Práctica familiar 98 2862
Práctica familiar académica 50 3064
Grupos multiespecialidad 203 2652
Fuente: Ralph Tothenberg y John P. Holcomb, "Pautas para el control de los AINE: ¿Quién
escuchó?"Diario de Reumatología Clínica, 6 (2000), 258–265.

¿Los datos anteriores brindan suficiente evidencia para que concluyamos que el tipo de práctica y el desempeño de
las pruebas de referencia están relacionados? Usara¼ .01.

12.4.4Boles y Johnson (A-7) examinaron las creencias de los adolescentes sobre el tabaquismo y el peso. Los
encuestados clasificaron su peso en tres categorías: bajo peso, sobrepeso o apropiado. El estado de
tabaquismo se clasificó de acuerdo con la respuesta a la pregunta: "¿Actualmente fuma, es decir, uno o más
cigarrillos por día?" La siguiente tabla muestra los resultados de un estudio telefónico de adolescentes en el
grupo de edad de 12 a 17 años.

De fumar
Sí No

bajo peso 17 97
Exceso de peso 25 142
Adecuado 96 816
Fuente: Sharon M. Boles y Patrick B. Johnson, "Gender, Weight Concerns, and Adolescent
Smoking"Revista de enfermedades adictivas, 20 (2001), 5–14.

¿Proporcionan los datos suficiente evidencia para sugerir que la percepción del peso y el tabaquismo están
relacionados en los adolescentes?a¼ .05.

12.4.5Una muestra de 500 estudiantes universitarios participó en un estudio diseñado para evaluar el nivel de conocimiento de los
estudiantes universitarios sobre un determinado grupo de enfermedades comunes. La siguiente tabla muestra a los
estudiantes clasificados por mayor área de estudio y nivel de conocimiento del grupo de enfermedades:

Conocimiento de Enfermedades

Importante Bien Pobre Total

Pre medico 31 91 122


Otro 19 359 378

Total 50 450 500

¿Estos datos sugieren que existe una relación entre el conocimiento del grupo de enfermedades y el principal
campo de estudio de los estudiantes universitarios de los que se extrajo la presente muestra? Dejara¼ .05.

12.4.6La siguiente tabla muestra los resultados de una encuesta en la que los sujetos fueron una muestra de 300 adultos
residir en un área metropolitana determinada. Se pidió a cada sujeto que indicara cuál de las tres políticas
favorecían con respecto a fumar en lugares públicos.
630 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Política favorecida

No Fumar está permitido No


Alta educación Restricciones en Designado De fumar No
Nivel sobre fumar Solo áreas en absoluto Opinión Total

Graduado de la Universidad 5 44 23 3 75
Graduado de preparatoria 15 100 30 5 150
Graduado de la escuela primaria 15 40 10 10 75

Total 35 184 63 18 300

¿Se puede concluir a partir de estos datos que, en la población muestreada, existe una relación entre el nivel
educativo y la actitud hacia el tabaquismo en lugares públicos? Dejara¼ .05.

12.5 PRUEBAS DE HOMOGENEIDAD

Una característica de los ejemplos y ejercicios presentados en la última sección es que, en cada caso,
se supuso que la muestra total había sido extraída antes de clasificar las entidades de acuerdo con los
dos criterios de clasificación. Es decir, el número observado de entidades que caen en cada celda se
determinó después de extraer la muestra. Como resultado, los totales de fila y columna son
cantidades aleatorias que no están bajo el control del investigador. Pensamos en la muestra extraída
en estas condiciones como una sola muestra extraída de una sola población. En ocasiones, sin
embargo, los totales de las filas o las columnas pueden estar bajo el control del investigador; es decir,
el investigador puede especificar que se extraigan muestras independientes de cada una de varias
poblaciones. En este caso, se dice que un conjunto de totales marginales esfijado,mientras que el otro
conjunto, correspondiente al criterio de clasificación aplicado a las muestras, esaleatorio.El primer
procedimiento, como hemos visto, conduce a una prueba de independencia de chi-cuadrado. La
última situación conduce a un chi-cuadradoprueba de homogeneidad.Las dos situaciones no solo
involucran diferentes procedimientos de muestreo; conducen a diferentes preguntas e hipótesis
nulas. La prueba de independencia se refiere a la pregunta: ¿Son independientes los dos criterios de
clasificación? La prueba de homogeneidad se ocupa de la pregunta: ¿Se extraen las muestras de
poblaciones que son homogéneas con respecto a algún criterio de clasificación? En este último caso,
la hipótesis nula establece que las muestras se extraen de la misma población. A pesar de estas
diferencias en concepto y procedimiento de muestreo, las dos pruebas son matemáticamente
idénticas, como vemos cuando consideramos el siguiente ejemplo.

Cálculo de frecuencias esperadasLas categorías de fila o las categorías de columna pueden representar
las diferentes poblaciones de las que se extraen las muestras. Si, por ejemplo, se muestrean tres poblaciones,
pueden designarse como poblaciones 1, 2 y 3, en cuyo caso estas etiquetas pueden servir como encabezados
de fila o columna. Si la variable de interés tiene tres categorías, digamos,un, b,yC,estas etiquetas pueden
servir como encabezados para filas o columnas, lo que no se use para las poblaciones. Si usamos una
notación similar a la adoptada para la Tabla 12.4.2, la tabla de contingencia para esta situación, con las
columnas utilizadas para representar las poblaciones, se muestra como la Tabla 12.5.1. Antes de calcular
nuestra estadística de prueba, necesitamos las frecuencias esperadas para cada una de las celdas de la tabla
12.5.1. Si las poblaciones son realmente
12.5 PRUEBAS DE HOMOGENEIDAD 631

TABLA 12.5.1 Una tabla de contingencia para datos para una prueba
de homogeneidad de chi-cuadrado

Población

Categoría de variables 1 2 3 Total

A norteA1 norteA2 norteA3 norteA:

B norteB1 norteB2 norteB3 norteB:

C norteC1 norteC2 norteC3 norteC:

Total norte.1 norte.2 norte.3 norte

homogéneo, o, de manera equivalente, si las muestras se extraen todas de la misma población, con
respecto a las categoríasun, b,yC,nuestra mejor estimación de la proporción en la población
combinada que pertenece a la categoríaAesnorteA:= n.De la misma manera, si las tres poblaciones son
homogéneas, interpretamos que esta probabilidad se aplica a cada una de las poblaciones
individualmente. Por ejemplo, bajo la hipótesis nula,norteA. es nuestra mejor estimación de la
probabilidad de que un sujeto elegido al azar de la población combinada pertenezca a la categoríaA.
Esperaríamos, entonces, encontrarnorte.1dnorteA:=nÞde aquellos en la muestra de la población 1 para
pertenecer a la categoríaUn.2dnorteA:=nÞde aquellos en la muestra de la población 2 a pertenecer a la
categoríaA,ynorte.3dnorteA:=nÞde los de la muestra de la población 3 a pertenecer a la categoríaA.
Estos cálculos producen las frecuencias esperadas para la primera fila de la Tabla 12.5.1. Un
razonamiento y cálculos similares producen las frecuencias esperadas para las otras dos filas.
Vemos nuevamente que el procedimiento abreviado de multiplicar los totales marginales apropiados
y dividirlos por el total general produce las frecuencias esperadas para las celdas.
A partir de los datos de la tabla 12.5.1 calculamos el siguiente estadístico de prueba:
" #
XdO
k i- miiÞ2
X2¼
i¼1
mii

EJEMPLO 12.5.1
La narcolepsia es una enfermedad que implica alteraciones del ciclo sueño-vigilia. Los miembros de la
Sociedad Alemana de Migraña y Dolor de Cabeza (A-8) estudiaron la relación entre los dolores de cabeza por
migraña en 96 sujetos diagnosticados con narcolepsia y 96 controles sanos. Los resultados se muestran en la
Tabla 12.5.2. Deseamos saber si podemos concluir, sobre la base de estos datos,

TABLA 12.5.2 Frecuencia de migrañas por estado de narcolepsia

Dolores de cabeza por migraña informados

Sí No Total

Sujetos narcolépticos 21 75 96
Controles saludables 19 77 96

Total 40 152 192

Fuente: The DMG Study Group, "Migraña y narcolepsia idiopática: un estudio de casos y controles"
Cefalagia, 23 (2003), 786–789.
632 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

que la población con narcolepsia y las poblaciones sanas representadas por las muestras no son
homogéneas con respecto a la frecuencia de la migraña.

Solución:

1. Datos.Ver Tabla 12.5.2.


2. Supuestos.Suponemos que tenemos una muestra aleatoria simple de cada
una de las dos poblaciones de interés.
3. Hipótesis.
H0: Las dos poblaciones son homogéneas con respecto a la migraña
frecuencia.
HA: Las dos poblaciones no son homogéneas con respecto a la migraña
frecuencia.
Dejara¼ .05.

4. Estadística de prueba.La estadística de prueba es


Xh i
2
X2¼ dOi- mi iÞ =mii

5. Distribución de la estadística de prueba. SiH0es verdad,X2se distribuye aproximadamente


amablemente comoX2cond2 - 1Þð2 - 1Þ ¼ ð1Þð1¼1 grado de libertad.
6. Regla de decisión.RechazarH0si el valor calculado deX2es igual o
mayor que 3.841.
7. Cálculo de la estadística de prueba.La salida de MINITAB se muestra en la Figura
12.5.1.

Prueba de chi-cuadrado

Los conteos esperados se imprimen debajo de los conteos observados

Filas: Narcolepsia Columnas: Migraña

No Sí Todo

No 77 19 96
76.00 20.00 96.00

Sí 75 21 96
76.00 20.00 96.00

Todo 152 40 192


152.00 40.00 192.00

Chi-Cuadrado = 0,126, GL = 1, Valor P = 0,722

FIGURA 12.5.1Salida de MINITAB para el ejemplo 12.5.1.


12.5 PRUEBAS DE HOMOGENEIDAD 633

8. Decisión estadística.Dado que .126 es menor que el valor crítico de 3.841,


no podemos rechazar la hipótesis nula.
9. Conclusión.Concluimos que las dos poblaciones pueden ser homogéneas con
respecto a la frecuencia de la migraña.
10pagvalor.De la salida de MINITAB vemos quepag¼ .722. &

Pequeñas frecuencias esperadasLas reglas para frecuencias esperadas pequeñas dadas en la


sección anterior son aplicables cuando se realiza una prueba de homogeneidad.
En resumen, la prueba de homogeneidad chi-cuadrado tiene las siguientes características:

1.Se identifican dos o más poblaciones de antemano y se extrae una muestra independiente
de cada una.
2.Los sujetos u objetos de muestra se colocan en categorías apropiadas de la variable de
interés.
3.El cálculo de las frecuencias esperadas de las celdas se basa en el razonamiento de que si las
poblaciones son homogéneas como se establece en la hipótesis nula, la mejor estimación de la
probabilidad de que un sujeto u objeto caiga en una categoría particular de la variable de interés se
puede obtener mediante agrupando los datos de la muestra.

4.Las hipótesis y conclusiones se expresan en términos de homogeneidad (respecto a la


variable de interés) de las poblaciones.

Prueba de Homogeneidad yH0:pag1¼pag2 La prueba de homogeneidad de chi-cuadrado para el


caso de dos muestras proporciona un método alternativo para probar la hipótesis nula de que dos
proporciones de población son iguales. En la Sección 7.6, se recordará, aprendimos a probar H0:pag1¼
pag2contraHA:pag16¼pag2por medio de la estadistica

ðp̂ - p̂ ff2Þ - ðp̂ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi


ffiffiffiffiffiffiffiffiffiffiffi21Þ
- pag
z¼r1ffiffiffiffiffiffiffi ffi ff ffiffiffiffi0ff

- pagd1 - -pagÞ - pagd1 - -pagÞ


þ
norte1 norte2

dónde -pagse obtiene agrupando los datos de las dos muestras independientes disponibles para el
análisis.
Supongamos, por ejemplo, que en una prueba deH0:pag1¼pag2contraHA:pag16¼pag2, los datos de la muestra
fueron los siguientes:norte1¼100; pag1¼ .60;norte2¼120; pag2¼ .40. Cuando agrupamos los datos de la muestra
tenemos

. 60d100Þþ.40d120Þ 108
- pag¼ ¼ ¼ .4909
100þ120 220
y

. 60 - .40
z¼rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi¼2:95469

d.4909Þð.5091Þ d.4909Þð.5091Þ
þ
100 120
lo cual es significativo al nivel .05 ya que es mayor que el valor crítico de 1.96.
634 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Si deseamos probar la misma hipótesis usando el enfoque de chi-cuadrado, nuestra tabla de


contingencia será

Característica Presente
Muestra Sí No Total

1 60 40 100
2 48 72 120

Total 108 112 220

Por la Ecuación 12.4.1 calculamos

220½ð60Þð72Þ - ð40Þð48Þ2
X2¼ ¼8:7302
d108Þð112Þð100Þð120Þ

lo cual es significativo al nivel .05 porque es mayor que el valor crítico de 3.841. Vemos,
pues, que llegamos a la misma conclusión por ambos métodos. esto no es sorprendente
porque, como se explica en la Sección 12.2,X2 d1Þ¼z2. Tomamos nota de que 8:7302¼ ð2:95469Þ2y
eso 3:841¼ ð1:96Þ2.

EJERCICIOS

En los ejercicios que siguen, realice la prueba al nivel de significación indicado y determine lapag
valor.

12.5.1Consulte el estudio de Carter et al. [A-9], que investigó el efecto de la edad de aparición del trastorno bipolar en el curso
de la enfermedad. Una de las variables estudiadas fue la historia familiar de los sujetos. La Tabla 3.4.1 muestra la
frecuencia de antecedentes familiares de trastornos del estado de ánimo en los dos grupos de interés: edad de inicio
temprana (18 años o menos) y edad de inicio tardía (más de 18 años).

Antecedentes familiares de trastornos del

estado de ánimo 18 tempranosdmiÞ Más tarde > 18dLÞ Total

Negativo (A) 28 35 63
Trastorno bipolar (B) 19 38 57
Unipolar (C) 41 44 85
Unipolares y bipolares (D) 53 60 113

Total 141 177 318


Fuente: Tasha D. Carter, Emanuela Mundo, Sagar V. Parkh y James L. Kennedy, "Early Age
at Onset as a Risk Factor for Poor Outcome of Bipolar Disorder"Revista de Investigación
Psiquiátrica, 37 (2003), 297–303.

¿Podemos concluir sobre la base de estos datos que los sujetos de 18 años o menos difieren de los sujetos mayores de 18 con
respecto a los antecedentes familiares de trastornos del estado de ánimo? Dejara¼ .05.
EJERCICIOS 635

12.5.2Coughlin et al. (A-10) examinó las prácticas de detección de mama y cuello uterino de mujeres hispanas y no
hispanas en condados que se aproximan a la región fronteriza sur de EE. UU. El estudio utilizó datos de las
encuestas del Sistema de Vigilancia de Factores de Riesgo del Comportamiento de adultos de 18 años o más
realizadas en 1999 y 2000. La siguiente tabla muestra el número de observaciones de mujeres hispanas y no
hispanas que se habían realizado una mamografía en los últimos 2 años. clasificación cruzada por estado
civil.

Estado civil Hispano no hispano Total

Actualmente casado 319 738 1057


Divorciado o separado 130 329 459
Viudo 88 402 490
Nunca casado o viviendo como 41 95 136
una pareja no casada

Total 578 1564 2142


Fuente: Steven S. Coughlin, Robert J. Uhler, Thomas Richards y Katherine M.
Wilson, “Prácticas de detección de cáncer de mama y de cuello uterino entre
mujeres hispanas y no hispanas que residen cerca de la frontera entre Estados
Unidos y México, 1999–2000”Salud Familiar y Comunitaria, 26, (2003), 130–139.

Deseamos saber si podemos concluir sobre la base de estos datos que el estado civil y el origen étnico
(hispano y no hispano) en los condados fronterizos del sur de los Estados Unidos no son homogéneos. Dejara
¼ .05.

12.5.3Swor et al. (A-11) examinó la efectividad del entrenamiento en reanimación cardiopulmonar (RCP) en personas mayores
de 55 años. Compararon las tasas de retención de habilidades de los sujetos en este grupo de edad que completaron
un curso de instrucción de RCP tradicional con aquellos que recibieron reanimación cardiopulmonar solo con
compresiones torácicas (CC-CPR). Se evaluaron grupos independientes 3 meses después del entrenamiento.
Entre los 27 sujetos que recibieron RCP tradicional, 12 fueron calificados como competentes. En el grupo CC-CPR, 15 de 29
fueron calificados como competentes. ¿Proporcionan estos datos evidencia suficiente para que concluyamos que las dos
poblaciones no son homogéneas con respecto a la calificación de competencia 3 meses después de la capacitación? Dejara¼ .
05.

12.5.4En un estudio de contaminación del aire, se seleccionó una muestra aleatoria de 200 hogares de cada una de
dos comunidades. A un encuestado de cada hogar se le preguntó si a alguien en el hogar le molestaba o no
la contaminación del aire. Las respuestas fueron las siguientes:

¿Algún miembro del hogar molesto


por la contaminación del aire?

Comunidad Sí No Total

I 43 157 200
Yo 81 119 200

Total 124 276 400

¿Pueden los investigadores concluir que las dos comunidades difieren con respecto a la variable de interés?
Dejara¼ .05.
636 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

12.5.5En una muestra aleatoria simple de 250 trabajadores industriales con cáncer, los investigadores encontraron que 102 habían
trabajado en trabajos clasificados como de "alta exposición" con respecto a los agentes causantes de cáncer sospechosos. Del
resto, 84 habían trabajado en trabajos de “exposición moderada” y 64 no habían experimentado ninguna exposición conocida
debido a sus trabajos. En una muestra aleatoria simple independiente de 250 trabajadores industriales de la misma área que
no tenían antecedentes de cáncer, 31 trabajaban en trabajos de "alta exposición", 60 trabajaban en trabajos de "exposición
moderada" y 159 trabajaban en trabajos que no implicaban una exposición conocida a sustancias sospechosas. agentes
cancerígenos. ¿Parece a partir de estos datos que las personas que trabajan en trabajos que los exponen a posibles agentes
causantes de cáncer tienen un mayor riesgo de contraer cáncer? Dejara¼ .05.

12.6 LA PRUEBA EXACTA DE FISHER

A veces tenemos datos que se pueden resumir en una tabla de contingencia 2 - 2, pero estos datos se
derivan de muestras muy pequeñas. La prueba de chi-cuadrado no es un método de análisis
apropiado si no se cumplen los requisitos mínimos de frecuencia esperados. Si, por ejemplo,nortees
menos de 20 o sinorteestá entre 20 y 40 y una de las frecuencias esperadas es menor que 5, se debe
evitar la prueba de chi-cuadrado.
A mediados de la década de 1930, Fisher (7, 8), Irwin (9) y Yates (10) propusieron casi
simultáneamente una prueba que puede usarse cuando no se cumplen los requisitos de tamaño de la
prueba de chi-cuadrado. La prueba ha llegado a ser conocida como laPrueba exacta de Fisher.Se
llama exacto porque, si se desea, permite calcular la probabilidad exacta de obtener los resultados
observados o resultados más extremos.

Arreglo de datosCuando usamos la prueba exacta de Fisher, organizamos los datos en forma
de una tabla de contingencia 2 - 2 como la Tabla 12.6.1. Organizamos las frecuencias de tal
manera queA > By elija la característica de interés para quea=A > b=B.
Algunos teóricos creen que la prueba exacta de Fisher es apropiada solo cuando ambos totales
marginales de la tabla 12.6.1 están fijados por el experimento. Este modelo específico no parece surgir con
mucha frecuencia en la práctica. Muchos experimentadores, por lo tanto, usan la prueba cuando ambos
totales marginales no son fijos.

suposicionesLos siguientes son los supuestos para la prueba exacta de Fisher.


1.Los datos consisten enAobservaciones muestrales de la población 1 yBobservaciones
muestrales de la población 2.
2.Las muestras son aleatorias e independientes.
3.Cada observación se puede categorizar como uno de dos tipos mutuamente excluyentes.

TABLA 12.6.1 A 2 - 2 Tabla de contingencia para la prueba exacta de Fisher

Con Sin
Muestra Característica Característica Total

1 a un - un A
2 b b-b B

Total aþb Aþb-a-b AþB


12.6 LA PRUEBA EXACTA DE FISHER 637

HipótesisLas siguientes son las hipótesis nulas que se pueden probar y sus
alternativas.
1. (dos caras)
H0: La proporción con la característica de interés es la misma en ambas poblaciones;
eso es,pag1¼pag2.
HA: La proporción con la característica de interés no es la misma en ambos
poblaciones;pag16¼pag2.

2. (Unilateral)
H0: La proporción con la característica de interés en la población 1 es menor o
igual a la proporción en la población 2;pag1 pag2.

HA: La proporción con la característica de interés es mayor en la población 1 que


en la población 2;pag1>pag2.

Estadística de pruebaLa estadística de prueba esb,el número de la muestra 2 con la característica de


interés.

Regla de decisiónFinney (11) ha preparado valores críticos debparaA 15. Latcha


(12) ha extendido las tablas de Finney para acomodar valores deAhasta 20. Apéndice Tabla J da estos
valores críticos debparaAentre 3 y 20, ambos inclusive. Niveles de significancia de .05, . 025, .01 y .005
están incluidos. Las reglas de decisión específicas son las siguientes:

1. Prueba bilateral.Introduzca la tabla J conun, b,ya.Si el valor observado debes igual o menor
que el número entero en una columna dada, rechazarH0a un nivel de significancia igual al
doble del nivel de significación que se muestra en la parte superior de esa columna. Por
ejemplo, supongamos A¼8,B¼7,a¼7, y el valor observado debes 1. Podemos rechazar la
hipótesis nula en el 2d.05Þ ¼ .10, el 2d.025Þ ¼ .05, y el 2d.01Þ ¼ .02 niveles de
significación, pero no en el 2d.005Þ ¼ .01 nivel.
2. Prueba unilateral.Introduzca la tabla J conun, b,ya.Si el valor observado debes menor o igual que
el número entero en una columna dada, rechazarH0en el nivel de significación que se muestra
en la parte superior de esa columna. Por ejemplo, supongamos queA¼dieciséis,B¼8,a¼4, y el
valor observado debes 3. Podemos rechazar la hipótesis nula en los niveles de significancia de
.05 y .025, pero no en los niveles de .01 o .005.

Aproximación de muestra grandePara muestras suficientemente grandes, podemos probar


la hipótesis nula de la igualdad de dos proporciones poblacionales usando la aproximación
normal. Calcular

dun = unÞ - ðb=bÞ


z¼pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi (12.6.1)
p̂ð1 - p̂Þð1=Aþ1=BÞ

dónde

pag¼ ðaþbÞ=ðAþBÞ (12.6.2)

y compárelo en cuanto a importancia con los valores críticos apropiados de la distribución


normal estándar. El uso de la aproximación normal generalmente se considera satisfactorio sia,
638 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

b, A-a,yb - bson todas mayores o iguales a 5. Alternativamente, cuando los tamaños de muestra son lo
suficientemente grandes, podemos probar la hipótesis nula mediante la prueba de chi-cuadrado.

Otras lecturasLa prueba exacta de Fisher ha sido objeto de cierta controversia entre los estadísticos.
Algunos sienten que la suposición de totales marginales fijos no es realista en la mayoría de las
aplicaciones prácticas. La controversia entonces se centra en si la prueba es apropiada cuando ambos
totales marginales no son fijos. Para una discusión más detallada de este y otros puntos, consulte los
artículos de Barnard (13–15), Fisher (16) y Pearson (17).
Sweetland (18) comparó los resultados de usar la prueba de chi-cuadrado con los obtenidos
usando la prueba exacta de Fisher para muestras de tamañoAþB¼3 aAþB¼69. Encontró un acuerdo
cercano cuandoAyBeran de tamaño similar y la prueba era unilateral.
Carr (19) presenta una extensión de la prueba exacta de Fisher a más de dos muestras de igual
tamaño y da un ejemplo para demostrar los cálculos. Neave (20) presenta la prueba exacta de Fisher
en un nuevo formato; la prueba se trata como una prueba de independencia más que de
homogeneidad. Ha preparado cuadros extensos para usar con su enfoque.
Dupont (21) analiza la sensibilidad de la prueba exacta de Fisher a perturbaciones
menores en tablas de contingencia 2 - 2.

EJEMPLO 12.6.1
El propósito de un estudio de Justesen et al. (A-12) fue evaluar la eficacia a largo plazo de tomar
indinavir/ritonavir dos veces al día en combinación con dos inhibidores nucleósidos de la transcriptasa
inversa en sujetos con VIH que se dividieron en dos grupos. El grupo 1 estaba formado por pacientes
que no tenían antecedentes de tomar inhibidores de la proteasa (PI Na€he). El grupo 2 estaba
formado por pacientes que tenían un historial previo de tomar un inhibidor de la proteasa (PI
Experimentado). La Tabla 12.6.2 muestra si estos sujetos permanecieron en el régimen durante las
120 semanas de seguimiento. Queremos saber si podemos concluir que los pacientes clasificados en
el grupo 1 tienen menor probabilidad que los sujetos del grupo 2 de permanecer en el régimen
durante 120 semanas.

TABLA 12.6.2 Estado del régimen a las 120 semanas para PI Na€
Sujetos con experiencia en cinco y PI que toman indinavir/
ritonavir como se describe en el ejemplo 12.6.1

permaneció en
el Régimen
durante 120 semanas

Total Sí No

1 (PI Na€he) 9 2 7
2 (PA con experiencia) 12 8 4

Total 21 10 11

Fuente: US Justesen, AM Lervfing, A. Thomsen, JA Lindberg, C. Pedersen y P.


Tauris, “Indinavir en dosis bajas en combinación con ritonavir en dosis bajas:
farmacocinética en estado estacionario y seguimiento de resultados clínicos
a largo plazo ,”Medicina del VIH, 4 (2003), 250–254.
12.6 LA PRUEBA EXACTA DE FISHER 639

TABLA 12.6.3 Datos de la Tabla 12.6.2 reorganizados para ajustarse al diseño de la


Tabla 12.6.1

Permaneció en régimen durante 120 semanas

Sí No Total

2 (PI experimentado) 8¼a 4¼un - un 12¼A


1 (PI Na€he) 2¼b 7¼b - b 9¼B

Total 10¼aþb 11¼Aþb-a-b 21¼AþB

Solución:

1. Datos.Los datos informados se muestran en la Tabla 12.6.2. La Tabla 12.6.3


muestra los datos reorganizados para ajustarse al diseño de la Tabla 12.6.1.
Permanecer en el régimen es la característica de interés.
2. Supuestos.Suponemos que se cumplen los supuestos para la aplicación de la
prueba exacta de Fisher.
3. Hipótesis.
H0: La proporción de sujetos que permanecen 120 semanas en el régimen en un
población de pacientes clasificados como grupo 2 es igual o menor que la
proporción de sujetos que permanecen en el régimen de 120 semanas en
una población clasificada como grupo 1.
HA: Los pacientes del grupo 2 tienen una tasa más alta que los pacientes del grupo 1 de
permaneciendo en el régimen durante 120 semanas.

4. Estadística de prueba.El estadístico de prueba es el valor observado debcomo se muestra en la


Tabla 12.6.3.

5. Distribución de la estadística de prueba.Determinamos la importancia deb


consultando la Tabla J del Apéndice.
6. Regla de decisión.Supongamos que dejamosa¼ .05. La regla de decisión,
entonces, es rechazarH0si el valor observado debes igual o menor que 1, el
valor de ben la Tabla J paraA¼12,B¼9,a¼8, ya¼ .05.
7. Cálculo de la estadística de prueba.El valor observado deb,como se muestra en la
Tabla 12.6.3, es 2.
8. Decisión estadística.Como 2 > 1, no podemos rechazarH0.
9. Conclusión.Ya que fallamos en rechazarH0, concluimos que la hipótesis nula puede ser
cierta. Es decir, puede ser cierto que la tasa de permanencia en el régimen durante 120
semanas sea igual o menor para el grupo experimentado con PI en comparación con el
grupo con PI na.€ive grupo.

10pagvalor.Vemos en la Tabla J que cuandoA¼12,B¼9,a¼8, el valor de b¼2 tiene


una probabilidad exacta de ocurrir solo por casualidad, cuandoH0es cierto,
mayor que .05. &
640 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Pl * Tabulación cruzada restante

Contar

Se mantuvo

Sí No Total

por favor Experimentado 8 4 12


Ingenuo 2 7 9
Total 10 11 21

Pruebas de chi-cuadrado

asíncrono Sig. Sig exacto. Sig exacto.


Valor d.f. (2 caras) (2 caras) (1 cara)

Chi-cuadrado de Pearson 4.073b 1 . 044


Corrección de continuidada 2.486 1 . 115
Índice de probabilidad 4.253 1 . 039
Prueba exacta de Fisher . 080 . 056
Lineal por lineal 3.879 1 . 049
Asociación
N de casos válidos 21

a. Calculado solo para una tabla 2 2


b. 2 celdas (50,0 %) tienen un recuento esperado inferior a 5. El recuento mínimo esperado es 4,29.

FIGURA 12.6.1Salida de SPSS para el Ejemplo 12.6.1.

Varios programas de software estadístico realizan los cálculos para la prueba exacta de Fisher. La
figura 12.6.1 muestra los resultados del ejemplo 12.6.1 calculados por SPSS. el exactopag El valor se
proporciona tanto para una prueba unilateral como para una bilateral. Con base en estos resultados, no
podemos rechazarH0(pagvalor >.05), tal como lo hicimos usando las tablas estadísticas en el Apéndice. Tenga
en cuenta que, además de la prueba exacta de Fisher, se proporcionan varias pruebas alternativas. El lector
debe ser consciente de que estas pruebas alternativas no son apropiadas si se han violado los supuestos en
los que se basan.

EJERCICIOS

12.6.1El objetivo de un estudio realizado por Tahmassebi y Curzon (A-13) fue determinar si el babeo en niños con
parálisis cerebral se debe a hipersalivación. Uno de los procedimientos hacia ese fin fue examinar la
capacidad amortiguadora salival de niños y controles con parálisis cerebral. La siguiente tabla da
los resultados.
12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL 641

Capacidad de almacenamiento

Grupo Medio Alto

Parálisis cerebral 2 8
Control 3 7
Fuente: JF Tahmassebi y MEJ Curzon, "La causa del babeo en niños
con parálisis cerebral: ¿hipersalivación o defecto de deglución?"
Revista Internacional de Odontología Pediátrica, 13 (2003), 106–111.

Pruebe si hay una diferencia significativa entre los niños con parálisis cerebral y los controles con respecto a la capacidad
amortiguadora alta o baja. Dejara¼ .05 y encuentra elpagvalor.

12.6.2En un estudio realizado por Xiao y Shi (A-14), los investigadores estudiaron el efecto del jugo de arándano en el tratamiento
y prevención deHelicobacter pyloriinfección en ratones. La erradicación deHelicobacter pylori resulta en la
curación de las úlceras pépticas. Los investigadores compararon el tratamiento con jugo de arándano con
“terapia triple (amoxicilina, subcitrato de bismuto y metronidazol) en ratones infectados conHelicobacter
pylori.Después de 4 semanas, examinaron a los ratones para determinar la frecuencia de erradicación de la
bacteria en los dos grupos de tratamiento. La siguiente tabla muestra los resultados.

Nº de ratones conHelicobacter pylorierradicado


Sí No

Triple terapia 8 2
Jugo de arándano 2 8
Fuente: Shu Dong Xiao y Tong Shi, "¿Es efectivo el jugo de arándano en el tratamiento y la
prevención deHelicobacter pyloriinfección de ratones”,Revista china de enfermedades digestivas,
4 (2003), 136–139.

¿Podemos concluir, sobre la base de estos datos, que la triple terapia es más eficaz que el jugo de arándano
para erradicar la bacteria? Dejara¼ .05 y encuentra elpagvalor.

12.6.3En un estudio de Shaked et al. (A-15), los investigadores estudiaron a 26 niños con lesiones pancreáticas cerradas. Estas
lesiones se produjeron por golpe directo en el abdomen, manubrio de bicicleta, caída de altura o accidente
automovilístico. Diecinueve de los pacientes fueron clasificados con lesiones menores y siete con lesiones mayores.
Se sospechó la formación de seudoquistes cuando se desarrollaron signos de deterioro clínico, como aumento del
dolor abdominal, plenitud epigástrica, fiebre y aumento de los niveles de enzimas pancreáticas. En el grupo de
lesiones mayores, seis de los siete niños desarrollaron seudoquistes, mientras que en el grupo de lesiones menores,
tres de los 19 niños desarrollaron seudoquistes. ¿Es esta evidencia suficiente para permitirnos concluir que la
proporción de niños que desarrollan seudoquistes es mayor en el grupo de lesiones mayores que en el grupo de
lesiones menores? Dejara¼ .01.

12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES


Y LA ESTADÍSTICA DE MANTEL-HAENSZEL

En el capítulo 8 aprendimos a usar técnicas de análisis de varianza para analizar datos que surgen de
experimentos diseñados, investigaciones en las que al menos una variable se manipula de alguna
manera. Los experimentos diseñados, por supuesto, no son las únicas fuentes de datos que son
642 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

de interés para los médicos y otros profesionales de las ciencias de la salud. Otra clase importante de
investigación científica que se utiliza ampliamente es laestudio observacional.

DEFINICIÓN
Unestudio observacionales una investigación científica en la que no se manipulan
de forma alguna los temas objeto de estudio ni ninguna de las variables de
interés.

Un estudio observacional, en otras palabras, puede definirse simplemente como una


investigación que no es un experimento. La forma más simple de estudio observacional es aquella en
la que sólo hay dos variables de interés. Una de las variables se llamafactor de riesgo,o variable
independiente, y la otra variable se conoce como laresultado,o variable dependiente.

DEFINICIÓN
El términofactor de riesgose utiliza para designar una variable que se cree que está
relacionada con alguna variable de resultado. El factor de riesgo puede ser una causa
sospechosa de algún estado específico de la variable de resultado.

En una investigación particular, por ejemplo, la variable de resultado podría ser el estado de los
sujetos en relación con el cáncer y el factor de riesgo podría ser su estado con respecto al
tabaquismo. El modelo se simplifica aún más si las variables son categóricas con solo dos categorías
por variable. Para la variable de resultado, las categorías pueden ser cáncer presente y cáncer
ausente. Con respecto al factor de riesgo, los sujetos pueden clasificarse como fumadores y no
fumadores.
Cuando las variables en los estudios observacionales son categóricas, los datos
correspondientes a las mismas pueden presentarse en una tabla de contingencia, de ahí la inclusión
del tema en el presente capítulo. Limitaremos nuestra discusión a la situación en la que la variable de
resultado y el factor de riesgo son ambas variables dicotómicas.

Tipos de estudios observacionalesHay dos tipos básicos de estudios observacionales,


estudios prospectivosyestudios retrospectivos.

DEFINICIÓN
Aestudio prospectivoes un estudio observacional en el que se seleccionan dos
muestras aleatorias de sujetos. Una muestra se compone de sujetos que poseen el
factor de riesgo y la otra muestra se compone de sujetos que no poseen el factor
de riesgo. Los sujetos son seguidos hacia el futuro (es decir, son seguidos
prospectivamente), y se lleva un registro del número de sujetos en cada muestra
que, en algún momento, son clasificables en cada una de las categorías de la
variable de resultado.

Los datos resultantes de un estudio prospectivo que involucre dos variables dicotómicas
se pueden mostrar en una tabla de contingencia 2 - 2 que generalmente brinda información
sobre el número de sujetos con y sin el factor de riesgo y el número que sí y no.
12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL 643

TABLA 12.7.1 Clasificación de una muestra de sujetos con respecto al estado de la


enfermedad y el factor de riesgo

Estado de la enfermedad

Factor de riesgo Presente Ausente Total en riesgo

Presente a b aþb
Ausente C d Cþd

Total aþC bþd norte

sucumbir a la enfermedad de interés, así como las frecuencias para cada combinación de
categorías de las dos variables.

DEFINICIÓN
Aestudio retrospectivoes el reverso de un estudio prospectivo. Las muestras
se seleccionan de aquellas que caen en las categorías de la variable de
resultado. Luego, el investigador mira hacia atrás (es decir, hace una mirada
retrospectiva) a los sujetos y determina cuáles tienen (o tenían) y cuáles no
tienen (o no tenían) el factor de riesgo.

A partir de los datos de un estudio retrospectivo podemos construir una tabla de contingencia
con frecuencias similares a las que son posibles para los datos de un estudio prospectivo.
En general, el estudio prospectivo es más costoso de realizar que el estudio
retrospectivo. El estudio prospectivo, sin embargo, se parece más a un experimento.

Riesgo relativoLos datos resultantes de un estudio prospectivo en el que la variable


dependiente y el factor de riesgo son ambos dicotómicos pueden mostrarse en una tabla de
contingencia 2 - 2 como la Tabla 12.7.1. El riesgo de desarrollo de la enfermedad entre los
sujetos con el factor de riesgo esun =daþbÞ.El riesgo de desarrollo de la enfermedad entre los
sujetos sin el factor de riesgo esc=dCþdÞ.Definimos el riesgo relativo de la siguiente manera.

DEFINICIÓN
Riesgo relativoes la relación entre el riesgo de desarrollar una enfermedad entre sujetos
con el factor de riesgo y el riesgo de desarrollar la enfermedad entre sujetos sin el factor
de riesgo.

Representamos el riesgo relativo de un estudio prospectivo simbólicamente como

un =daþbÞ
RCR¼ (12.7.1)
c=dCþdÞ

dóndea B C,ydson como se definen en la Tabla 12.7.1, yRCRindica que el riesgo relativo se
calcula a partir de una muestra que se utilizará como una estimación del riesgo relativo,RR,para
la población de la que se extrajo la muestra.
644 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Podemos construir un intervalo de confianza paraRR

pagffiffiffiffi

100d1 -aÞ%CI¼RCR1dza=X2Þ (12.7.2)

dóndezaes de dos caraszvalor correspondiente al coeficiente de confianza elegido yX2


se calcula mediante la Ecuación 12.4.1.

Interpretación deRREl valor deRRpuede oscilar entre cero e infinito. Un valor de 1 indica que
no existe asociación entre el estado del factor de riesgo y el estado de la variable dependiente.
En la mayoría de los casos, los dos estados posibles de la variable dependiente son enfermedad
presente y enfermedad ausente. Interpretamos unRRde 1 para significar que el riesgo de
adquirir la enfermedad es el mismo para aquellos sujetos con el factor de riesgo y aquellos sin
el factor de riesgo. un valor deRRmayor que 1 indica que el riesgo de adquirir la enfermedad es
mayor entre los sujetos con el factor de riesgo que entre los sujetos sin el factor de riesgo. Un
RRun valor inferior a 1 indica menor riesgo de adquirir la enfermedad entre los sujetos con el
factor de riesgo que entre los sujetos sin el factor de riesgo. Por ejemplo, un factor de riesgo de
2 se entiende que aquellos sujetos con el factor de riesgo tienen el doble de probabilidades de
adquirir la enfermedad en comparación con los sujetos sin el factor de riesgo.

Ilustramos el cálculo del riesgo relativo mediante el siguiente ejemplo.

EJEMPLO 12.7.1
En un estudio prospectivo de mujeres embarazadas, Magann et al. (A-16) recopilaron amplia información
sobre el nivel de ejercicio de mujeres trabajadoras embarazadas de bajo riesgo. Un grupo de 217 mujeres no
hizo ejercicio voluntario u obligatorio durante el embarazo, mientras que un grupo de 238 mujeres hizo
mucho ejercicio. Una variable de resultado de interés fue experimentar trabajo de parto prematuro. Los
resultados se resumen en la Tabla 12.7.2.
Deseamos estimar el riesgo relativo de trabajo de parto prematuro cuando las mujeres embarazadas hacen mucho
ejercicio.

Solución:Por la Ecuación 12.7.1 calculamos

22=238 . 0924
RCR¼ ¼ ¼1:1
18=217 . 0829

TABLA 12.7.2 Sujetas con y sin el factor de riesgo que se convirtieron en casos de trabajo de parto
prematuro

Factor de riesgo Casos de trabajo de parto prematuro No casos de trabajo de parto prematuro Total

ejercicio extremo 22 216 238


no hacer ejercicio 18 199 217

Total 40 415 455

Fuente: Everett F. Magann, Sharon F. Evans, Beth Weitz y John Newnham, "Importancia del ejercicio anteparto,
intraparto y neonatal en mujeres trabajadoras embarazadas saludables de bajo riesgo"Obstetricia y Ginecología, 99 (
2002), 466–472.
12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL 645

Sección de Odds Ratio y Riesgo Relativo


Común Original iterado Probabilidades de registro Relativo

Parámetro Razón de probabilidades Razón de probabilidades Razón de probabilidades Relación Riesgo

CL 95% superior 2.1350 2.2683 0.7585 2.1192

Estimar 1.1260 1.1207 1.1207 0.1140 1.1144

CL inferior al 95 % 0.5883 0.5606 0.5305 0.5896

FIGURA 12.7.1Salida NCSS para los datos del Ejemplo 12.7.1.

Estos datos indican que el riesgo de tener un parto prematuro cuando una mujer hace
mucho ejercicio es 1,1 veces mayor que entre las mujeres que no hacen nada de
ejercicio.
Calculamos el intervalo de confianza del 95 por ciento paraRRcomo sigue. Por la
Ecuación 12.4.1, calculamos a partir de los datos de la Tabla 12.7.2:

455½ð22Þð199Þ - ð216Þð18Þ2
X2¼ ¼ .1274
d40Þð415Þð238Þð217Þ

Por la Ecuación 12.7.2, los límites de confianza inferior y superior son, respectivamente,
pagffiffiffiffiffiffiffiffiffi pagffiffiffiffiffiffiffiffiffi
1:11-1:96= :1274¼ :65 y 1:11þ1:96= :1274¼1:86. Como el intervalo incluye
1, concluimos, con un nivel de significancia de .05, que el riesgo de la población puede
ser 1. En otras palabras, concluimos que, en la población, puede no haber un mayor
riesgo de tener un trabajo de parto prematuro cuando una mujer embarazada hace
mucho ejercicio .
Los datos fueron procesados por NCSS. Los resultados se muestran en la Figura
12.7.1. El cálculo del riesgo relativo se muestra en la columna en el extremo derecho
de la salida, junto con los límites de confianza del 95 %. Debido a errores de redondeo,
estos valores difieren ligeramente de los que se dan en el ejemplo. &

Razón de probabilidadesCuando los datos a analizar provienen de un estudio retrospectivo, el riesgo


relativo no es una medida significativa para comparar dos grupos. Como hemos visto, un estudio
retrospectivo se basa en una muestra de sujetos con la enfermedad (casos) y una muestra separada
de sujetos sin la enfermedad (controles o no casos). Luego determinamos retrospectivamente la
distribución del factor de riesgo entre los casos y controles. Dados los resultados de un estudio
retrospectivo que involucra dos muestras de sujetos, casos y controles, podemos mostrar los datos en
una tabla 2 - 2 como la Tabla 12.7.3, en la que los sujetos se dicotomizan con respecto a la presencia y
ausencia del factor de riesgo. Tenga en cuenta que los encabezados de las columnas en la Tabla
12.7.3 difieren de los de la Tabla 12.7. 1 para enfatizar el hecho de que los datos son de un estudio
retrospectivo y que los sujetos fueron seleccionados porque eran casos o controles. Cuando los datos
de un estudio retrospectivo se muestran como en la Tabla 12.7.3, la razónun =daþbÞ,por ejemplo, no
es una estimación del riesgo de enfermedad para sujetos con el factor de riesgo. La medida apropiada
para comparar casos y controles en un estudio retrospectivo es larelación de probabilidades.Como se
señaló en el Capítulo 11, para comprender el concepto de
646 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

TABLA 12.7.3 Sujetos de un estudio retrospectivo clasificados según el


estado relativo a un factor de riesgo y si son casos o controles

Muestra

Factor de riesgo Casos Control S Total

Presente a b aþb
Ausente C d Cþd

Total aþC bþd norte

la razón de probabilidades, debemos entender el términoimpares,que es utilizado con frecuencia por aquellos que
hacen apuestas sobre los resultados de los eventos deportivos o participan en otros tipos de actividades de juego.

DEFINICIÓN
Las probabilidades de éxito son la relación entre la probabilidad de éxito y la
probabilidad de fracaso.

Usamos esta definición de probabilidades para definir dos probabilidades que podemos calcular a partir de los datos
que se muestran en la Tabla 12.7.3:

1.La probabilidad de ser un caso (tener la enfermedad) a ser un control (no tener la
enfermedad) entre sujetos con el factor de riesgo es½un =daþbÞ =½b=daþb¼a=b.
2.La probabilidad de ser un caso (tener la enfermedad) a ser un control (no tener la
enfermedad) entre sujetos sin el factor de riesgo es½c=dCþdÞ =½re=dCþd¼c=d.

Ahora definimos la razón de probabilidades que podemos calcular a partir de los datos de un estudio
retrospectivo. Usamos el símboloO CRpara indicar que la medida se calcula a partir de datos de muestra
y se utiliza como una estimación de la razón de probabilidades de la población,O.

DEFINICIÓN
La estimación de la razón de posibilidades de la población es

a=b anuncio
O
CR¼ ¼ (12.7.3)
c=d antes de Cristo

dóndea B C,ydson como se definen en la Tabla 12.7.3.

Podemos construir un intervalo de confianza paraOpor el siguiente método:


pagffiffiffiffi

100d1 -aÞ%CI¼O CR1dza=X2Þ (12.7.4)

dóndezaes de dos caraszvalor correspondiente al coeficiente de confianza elegido y X2se calcula


mediante la Ecuación 12.4.1.
12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL 647

Interpretación del Odds RatioEn el caso de una enfermedad rara, la razón de posibilidades de la población
proporciona una buena aproximación al riesgo relativo de la población. En consecuencia, la razón de probabilidades
de la muestra, al ser una estimación de la razón de probabilidades de la población, proporciona una estimación
indirecta del riesgo relativo de la población en el caso de una enfermedad rara.
La razón de posibilidades puede asumir valores entre cero y1.Un valor de 1 indica que no hay
asociación entre el factor de riesgo y el estado de la enfermedad. Un valor inferior a 1 indica probabilidades
reducidas de la enfermedad entre sujetos con el factor de riesgo. Un valor superior a 1 indica mayores
probabilidades de tener la enfermedad entre los sujetos en los que está presente el factor de riesgo.

EJEMPLO 12.7.2
Toschke et al. (A-17) recopilaron datos sobre el estado de obesidad de niños de 5 a 6 años y el estado
de tabaquismo de la madre durante el embarazo. La Tabla 12.7.4 muestra 3970 sujetos clasificados
como casos o no casos de obesidad y también clasificados según el estado tabáquico de la madre
durante el embarazo (el factor de riesgo). Deseamos comparar las probabilidades de obesidad a los
5-6 años entre aquellos cuya madre fumó durante el embarazo con las probabilidades de obesidad a
los 5-6 años entre aquellos cuya madre no fumó durante el embarazo.

Solución: La razón de posibilidades es la medida adecuada para responder a la pregunta planteada.


Por la Ecuación 12.7.3 calculamos

d64Þð3496Þ
O
CR¼ ¼9:62
d342Þð68Þ

Vemos que los niños obesos (casos) tienen 9,62 veces más probabilidades que los
niños no obesos (no casos) de haber tenido una madre que fumó durante todo el
embarazo.
Calculamos el intervalo de confianza del 95 por ciento paraOcomo sigue. Por la
Ecuación 12.4.1 calculamos a partir de los datos de la Tabla 12.7.4

3970½ð64Þð3496Þ - ð342Þð68Þ2
X2¼ ¼217:6831
d132Þð3838Þð406Þð3564Þ

TABLA 12.7.4 Sujetos clasificados según estado de obesidad y


tabaquismo de la madre durante el embarazo

Estado de obesidad

Estado de tabaquismo Casos no casos Total


Durante el embarazo

Ahumado en todo 64 342 406


nunca fumé 68 3496 3564

Total 132 3838 3970

Fuente: AM Toschke, SM Montgomery, U. Pfeiffer y R. von Kries, “Exposición intrauterina


temprana a productos inhalados por tabaco y obesidad”Diario Americano de
Epidemiología, 158 (2003), 1068–1074.
648 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Smoking_status * Obsesity_status Tabulación cruzada

Contar

Estado de obesidad

Casos No Casos Total

estado_de_fumar Ahumado en todo 64 342 406


nunca fumé 68 3496 3564
Total 132 3838 3970

Estimación de riesgo

95% de confianza
Intervalo

Valor Más bajo Superior

Razón de probabilidades para

estado_de_fumar
(Ahumado en todo 9.621 6.719 13.775
/Nunca fumé)
Para cohorte Obesidad_ 8.262 5.966 11.441
casos de estado
Para cohorte Obesidad_ . 859 . 823 . 896
estado No casos
N de casos válidos 3970

FIGURA 12.7.2Salida de SPSS para el Ejemplo 12.7.2.

Los límites de confianza inferior y superior para la población.O,respectivamente, son


pagffiffiffiffiffiffiffiffiffiffiffiffiffiffi pagffiffiffiffiffiffiffiffiffiffiffiffiffiffi

9:621-1:96= 217:6831¼7:12 y 9:621þ1:96= 217:6831¼13:00 Concluimos con un 95 por ciento


de confianza en que la poblaciónOestá en algún lugar entre las 7.12 y las 13.00.
Debido a que el intervalo no incluye 1, concluimos que, en la población, los niños
obesos (casos) tienen más probabilidades que los niños no obesos (no casos) de
haber tenido una madre que fumó durante todo el embarazo.
Los datos del ejemplo 12.7.2 se procesaron con SPSS. Los resultados se
muestran en la Figura 12.7.2. El cálculo de la razón de probabilidades, junto con los
límites de confianza del 95 %, se muestran en la línea superior del cuadro Estimación
del riesgo. Estos valores difieren ligeramente de los del ejemplo debido al error de
redondeo. &

La estadística de Mantel-HaenszelCon frecuencia cuando estamos estudiando la relación


entre el estado de alguna enfermedad y el estado de algún factor de riesgo, estamos
12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL 649

consciente de otra variable que puede estar asociada con la enfermedad, con el factor de
riesgo, o con ambos de tal manera que se enmascara la verdadera relación entre el estado de la
enfermedad y el factor de riesgo. Tal variable se llamavariable de confusión.Por ejemplo, la
experiencia podría indicar la posibilidad de que la relación entre alguna enfermedad y un factor
de riesgo sospechado difiera entre diferentes grupos étnicos. Entonces trataríamos la
pertenencia étnica como una variable de confusión. Cuando se pueden identificar, es deseable
controlar las variables de confusión para que se pueda calcular una medida inequívoca de la
relación entre el estado de la enfermedad y el factor de riesgo. Una técnica para lograr este
objetivo es el procedimiento de Mantel-Haenszel (22), llamado así en reconocimiento a los dos
hombres que lo desarrollaron. El procedimiento nos permite probar la hipótesis nula de que no
existe asociación entre el estado con respecto a la enfermedad y el estado de los factores de
riesgo. Utilizado inicialmente solo con datos de estudios retrospectivos, el procedimiento de
Mantel-Haenszel también es adecuado para su uso con datos de estudios prospectivos.

En la aplicación del procedimiento de Mantel-Haenszel, los sujetos de casos y controles se


asignan a estratos correspondientes a diferentes valores de la variable de confusión. Luego, los datos
se analizan dentro de los estratos individuales, así como en todos los estratos. La discusión que sigue
asume que los datos bajo análisis son de un estudio retrospectivo o prospectivo con sujetos caso y no
caso clasificados de acuerdo a si tienen o no el factor de riesgo sospechado. La variable de confusión
es categórica, con las diferentes categorías definiendo los estratos. Si la variable de confusión es
continua, debe categorizarse. Por ejemplo, si la variable de confusión sospechosa es la edad,
podríamos agrupar a los sujetos en categorías de edad mutuamente excluyentes. Los datos antes de
la estratificación se pueden mostrar como se muestra en la Tabla 12.7.3.

La aplicación del procedimiento Mantel-Haenszel consta de los siguientes pasos.

1.Formakestratos correspondientes akcategorías de la variable de confusión. Mesa


12.7.5 muestra la pantalla de datos para elith estrato.
2.Para cada estrato calcule la frecuencia esperadamiide la celda superior izquierda de la
Tabla 12.7.5 como sigue:

daiþbiÞðaiþCiÞ
mii¼ (12.7.5)
nortei

TABLA 12.7.5 Sujetos en eliº Estrato de una variable de confusión clasificada


según el estado relativo a un factor de riesgo y si son casos o controles

Muestra

Factor de riesgo Casos Control S Total

Presente ai bi aiþbi
Ausente Ci di Ciþdi

Total aiþCi biþdi nortei


650 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

3.Para cada estrato calcular

daiþbiÞðCiþdiÞðaiþCiÞðbiþdiÞ
v i¼ (12.7.6)
dnortei-1Þ
i 2
norte

4.Calcule el estadístico de prueba de Mantel-Haenszel,X2 mhcomo sigue:

2
PAG
k PAG
k
ai- mii
i¼1
Xmh
2 ¼i¼1 (12.7.7)
PAG
k
vi
i¼1

5.Rechazar la hipótesis nula de no asociación entre el estado de la enfermedad y el riesgo sospechado


estado del factor en la población si el valor calculado deX2 mhes igual o mayor que
el valor crítico del estadístico de prueba, que es el valor de chi-cuadrado tabulado para 1
grado de libertad y el nivel de significancia elegido.

Estimador de Mantel-Haenszel de la razón de probabilidades comunesCuando nosotros


tenerkestratos de datos, cada uno de los cuales puede mostrarse en una tabla como la Tabla 12.7.5,
CRmhcomo
podemos calcular el estimador de Mantel-Haenszel de la razón de probabilidades común,O sigue:

PAG
k
daidi=niÞ
CRmh¼i¼1
O (12.7.8)
PAG
k
dbiCi=niÞ
i¼1

Cuando usamos el estimador de Mantel-Haenszel dado por la Ecuación 12.7.4, asumimos que, en la
población, la razón de posibilidades es la misma para cada estrato.
Ilustramos el uso de las estadísticas de Mantel-Haenszel con los siguientes
ejemplos.

EJEMPLO 12.7.3
En un estudio de LaMont et al. (A-18), los investigadores recopilaron datos sobre la enfermedad arterial
coronaria obstructiva (OCAD), la hipertensión y la edad entre los sujetos identificados por una prueba de
esfuerzo en cinta rodante como en riesgo. En la Tabla 12.7.6, se presentan recuentos de sujetos en dos
estratos de edad con hipertensión como factor de riesgo y la presencia de OCAD como variable caso/no caso.

Solución:

1. Datos.Ver Tabla 12.7.6.


2. Supuestos.Suponemos que se cumplen los supuestos discutidos anteriormente
para el uso válido de la estadística de Mantel-Haenszel.
12.7 RIESGO RELATIVO, RAZÓN DE POSIBILIDADES Y LA ESTADÍSTICA DE MANTEL-HAENSZEL 651

TABLA 12.7.6 Pacientes estratificados por edad y clasificados por estado relativo a la
hipertensión (el factor de riesgo) y OCAD (variable caso/no caso)

Estrato 1 (55 y menos)

Factor de riesgo
(Hipertensión) Casos (OCAD) no casos Total

Presente 21 11 32
Ausente dieciséis 6 22

Total 37 17 54

Estrato 2 (mayores de 55 años)

Factor de riesgo
(Hipertensión) Casos (OCAD) no casos Total

Presente 50 14 64
Ausente 18 6 24

Total 68 20 88

Fuente: Datos proporcionados por cortesía de Matthew J. Budoff, MD.

3. Hipótesis.
H0: No existe asociación entre la presencia de hipertensión
y aparición de OCAD en sujetos de 55 años o menos y sujetos mayores de
55 años.
HA: Existe una relación entre las dos variables.
4. Estadística de prueba.

2
PAG
k PAG
k
ai- mii
i¼1
Xmh
2 ¼i¼1
PAG
k
vi
i¼1

como se indica en la Ecuación 12.7.7.

5. Distribución de la estadística de prueba.Chi-cuadrado con 1 grado de libertad.


6. Regla de decisión.Supongamos que dejamosa¼ .05. RechazarH0si el valor calculado
del estadístico de prueba es mayor o igual a 3,841.
7. Cálculo de la estadística de prueba.Por la Ecuación 12.7.5 calculamos las
siguientes frecuencias esperadas:

mi1¼ ð21þ11Þð21þdieciséisÞ=54¼ ð32Þð37Þ=54¼21:93


mi2¼ ð50þ14Þð50þ18Þ=88¼ ð64Þð68Þ=88¼49:45
652 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Por la Ecuación 12.7.6 calculamos

v1¼ ð32Þð22Þð37Þð17Þ=ð2916Þð54 - 1¼2:87 v2


¼ ð64Þð24Þð68Þð20Þ=ð7744Þð88 - 1¼3:10

Finalmente, por la Ecuación 12.7.7 calculamos

½ð21þ50Þ - ð21:93þ49:45Þ2
Xmh
2 ¼ ¼ .0242
2:87þ3:10

8. Decisión estadística.Como .0242 < 3:841, fallamos en rechazarH0.


9. Conclusión.Concluimos que puede no haber una asociación entre la
hipertensión y la aparición de OCAD.
10pagvalor.Como .0242 < 2:706, elpagvalor para esta prueba espag > .10

Ahora ilustramos el cálculo del estimador de Mantel-Haenszel de la razón de


probabilidades común. &

EJEMPLO 12.7.4
Consultemos los datos de la tabla 12.7.6 y calculemos la razón de probabilidades común.

Solución: A partir de los datos estratificados de la Tabla 12.7.6 calculamos el numerador de la razón de la siguiente
manera:

da1d1=n1Þ þ ða2d2=n2Þ ¼ ½ð21Þð6Þ=54þ ½ð50Þð6Þ=88


¼5:7424

El denominador de la razón es

db1C1=n1Þ þ ðb2C2=n2Þ ¼ ½ð11ÞðdieciséisÞ=54þ ½ð14Þð18Þ=88


¼6:1229

Ahora, por la Ecuación 12.7.7, calculamos la razón de probabilidades común:

5:7424
CRmh¼
O ¼ .94
6:1229

A partir de estos resultados, estimamos que, independientemente de la edad, los pacientes


que tienen hipertensión tienen menos probabilidades de tener OCAD que los pacientes que no
tienen hipertensión. &

El cálculo manual de las estadísticas de prueba de Mantel-Haenszel puede resultar una tarea
engorrosa. Afortunadamente, el investigador puede encontrar alivio en uno de los varios paquetes de
software estadístico disponibles. Para ilustrar, los resultados del uso de SPSS para procesar los datos
del ejemplo 12.7.3 se muestran en la figura 12.7.3. Estos resultados difieren de los dados en el
ejemplo debido al error de redondeo.
EJERCICIOS 653

Tabaquismo * Obsesity_status * Tabulación cruzada de estrato

Contar

Estado de obesidad

Estrato Casos no casos Total

55 y menos estado_de_fumar Ahumado en todo 21 11 32


nunca fumé dieciséis 6 22
Total 37 17 54
Más de 55 estado_de_fumar Ahumado en todo 50 14 64
nunca fumé 18 6 24
Total 68 20 88

Pruebas de Independencia Condicional

asíncrono Sig.
chi-cuadrado d.f. (2 caras)

de Cochran . 025 1 . 875


Mantel-Haenszel . 002 1 . 961

Estimación de la razón de probabilidades comunes de Mantel-Haenszel

Estimar . 938
En (estimación) . 064
Estándar Error de In(Estimate) . 412
Asymp. Sig. (2 caras) . 876
asíncrono 95% de confianza Probabilidades comunes Límite inferior . 418
Intervalo Relación Límite superior 2.102
En común) Límite inferior . 871
Razón de probabilidades) Límite superior . 743

FIGURA 12.7.3Salida de SPSS para el ejemplo 12.7.3.

EJERCICIOS

12.7.1Davy et al. (A-19) informó los resultados de un estudio sobre la supervivencia del cáncer de cuello uterino. El
los investigadores encontraron que entre los sujetos menores de 50 años, 16 de 371 sujetos no habían sobrevivido durante 1
año después del diagnóstico. En sujetos de 50 años o más, 219 de 376 no habían sobrevivido durante 1 año después del
diagnóstico. Calcule el riesgo relativo de muerte entre sujetos de 50 años o más. ¿Parece a partir de estos datos que las
personas mayores diagnosticadas con cáncer de cuello uterino son propensas a tasas de mortalidad más altas?
654 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

12.7.2El objetivo de un estudio prospectivo de Stenestrand et al. (A-20) fue comparar la tasa de mortalidad
después de un infarto agudo de miocardio (IAM) entre sujetos que recibieron revascularización temprana a la tasa de
mortalidad entre sujetos que recibieron tratamientos conservadores. Entre 2554 pacientes que recibieron revascularización
dentro de los 14 días posteriores al IAM, 84 fallecieron en el año siguiente al IAM. En el grupo de tratamiento conservador
(factor de riesgo presente), 1751 de 19 358 pacientes fallecieron dentro del año posterior al IAM. Calcule el riesgo relativo de
mortalidad en el grupo de tratamiento conservador en comparación con el grupo de revascularización en pacientes que
experimentan IAM.

12.7.3Consulte el Ejemplo 12.7.2. Toschke et al. (A-17), que recolectó datos sobre el estado de obesidad de niños de 5 a
6 años y el estado de tabaquismo de la madre durante el embarazo, también informó sobre otra variable de
resultado: si el niño nació prematuro (37 semanas o menos de gestación). ). La siguiente tabla resume los
resultados de este aspecto del estudio. Se considera el mismo factor de riesgo (fumar durante el embarazo),
pero ahora se define un caso como una madre que dio a luz prematuramente.

Estado de Nacimiento Prematuro

Estado de tabaquismo
Durante el embarazo Casos no casos Total

Ahumado en todo 36 370 406


nunca fumé 168 3396 3564

Total 204 3766 3970


Fuente: AM Toschke, SM Montgomery, U. Pfeiffer y R. von Kries, “Exposición intrauterina
temprana a productos inhalados por tabaco y obesidad”Diario Americano de Epidemiología, 158
(2003), 1068–1074.

Calcule la razón de posibilidades para determinar si fumar durante el embarazo está relacionado con el parto
prematuro. Use la prueba de independencia chi-cuadrado para determinar si se puede concluir que existe una
asociación entre fumar durante el embarazo y el parto prematuro. Dejara¼ .05.

12.7.4Sugiyama et al. (A-21) examinó los factores de riesgo de enfermedades alérgicas entre escolares de 13 y 14 años
en Japón. Un factor de riesgo de interés fue un historial familiar de comer una dieta desequilibrada.
La siguiente tabla muestra los casos y no casos de niños que presentaron síntomas de rinitis en
presencia y ausencia del factor de riesgo.

Rinitis

Historia familiar Casos no casos Total

dieta desequilibrada 656 1451 2107


Dieta equilibrada 677 1662 2339

Total 1333 3113 4446


Fuente: Takako Sugiyama, Kumiya Sugiyama, Masao Toda, Tastuo Yukawa, Sohei Makino y
Takeshi Fukuda, “Risk Factors for Asthma and Allergic Diseases Among 13–14-Year-Old
Schoolchildren in Japan,”Alergología Internacional, 51 (2002), 139–150.

¿Cuál es la razón de probabilidad estimada de tener rinitis entre los sujetos con antecedentes familiares de una dieta
desequilibrada en comparación con los que siguen una dieta equilibrada? Calcule el intervalo de confianza del 95 por ciento
para la razón de probabilidades.

12.7.5Según Holben et al. (A-22), “La inseguridad alimentaria implica un acceso o disponibilidad limitados de alimentos o una
capacidad limitada/incierta para adquirir alimentos en formas socialmente aceptables”. Estos investigadores
12.8 RESUMEN 655

recopiló datos sobre 297 familias con un niño en el programa de guardería Head Start en un área rural de Ohio cerca
de Appalachia. La principal variable de resultado del estudio fue el estado del hogar en relación con la seguridad
alimentaria. Los hogares que no tenían seguridad alimentaria se consideran casos. El factor de riesgo de interés fue
la ausencia de un jardín desde el cual un hogar pudiera complementar su suministro de alimentos. En el siguiente
cuadro, los datos están estratificados por la situación laboral del jefe de hogar fuera del hogar.

Estrato 1 (Empleados Fuera del Hogar)

Factor de riesgo Casos no casos Total

sin jardin 40 37 77
Jardín 13 38 51

Total 53 75 128
Estrato 2 (No Ocupado Fuera del Hogar)

Factor de riesgo Casos no casos Total

sin jardin 75 38 113


Jardín 15 33 48

Total 90 71 161
Fuente: Datos proporcionados por cortesía de David H. Holben, Ph.D. y John P. Holcomb, Jr., Ph.D.

Calcule la razón de posibilidades común de Mantel-Haenszel con estratificación por situación laboral. Utilice la
estadística de la prueba chi-cuadrado de Mantel-Haenszel para determinar si podemos concluir que existe una
asociación entre el factor de riesgo y la inseguridad alimentaria. Dejara¼ .05.

12.8 RESUMEN

En este capítulo se analizan algunos usos de la distribución versátil de chi-cuadrado. Se presentan las
pruebas de bondad de ajuste de chi-cuadrado aplicadas a las distribuciones normal, binomial y de
Poisson. Vemos que el procedimiento consiste en calcular un estadístico
" #
XdOi- mi iÞ
2
X2¼
mii

que mide la discrepancia entre lo observado (Oi) y esperado (mii) frecuencias de


ocurrencia de valores en ciertas categorías discretas. Cuando la hipótesis nula apropiada
es verdadera, esta cantidad se distribuye aproximadamente comoX2. CuandoX2es mayor o
igual que el valor tabulado deX2para algunosa,se rechaza la hipótesis nula en elanivel de
significancia.
En este capítulo también se analizan las pruebas de independencia y las pruebas de homogeneidad.
Las pruebas son matemáticamente equivalentes pero conceptualmente diferentes. Nuevamente, estas
pruebas prueban esencialmente la bondad de ajuste de los datos observados a las expectativas bajo
hipótesis, respectivamente, de independencia de dos criterios de clasificación de los datos y la
homogeneidad de las proporciones entre dos o más grupos.
656 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Además, discutimos e ilustramos en este capítulo otras cuatro técnicas para analizar datos de
frecuencia que se pueden presentar en forma de una tabla de contingencia 2 - 2: la prueba exacta de Fisher,
la razón de probabilidades, el riesgo relativo y el procedimiento de Mantel-Haenszel. . Finalmente, discutimos
los conceptos básicos del análisis de supervivencia e ilustramos los procedimientos computacionales por
medio de dos ejemplos.

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 12

Fórmula
Número Nombre Fórmula
yi-metro
12.2.1 Estándar normal aleatorio zi¼
variable s
2 2 2
12.2.2 Distribución chi-cuadrado con XdnorteÞ
2 ¼z 1þz2þ þznorte

nortegrados de libertad

12.2.3 Probabilidad de chi-cuadrado 1 1 tudk=2Þ-1mi-dtu=2Þ


Fdtu¼ 2k=2
función de densidad k
- 1 !
2
" #
12.2.4 2
Estadística de prueba de chi-cuadrado
PAGdOi- mi iÞ
X2 ¼
mii

12.4.1 Cálculo de chi-cuadrado nortedanuncio - acÞ2

fórmula para una tabla


X2¼
daþCÞðbþdÞðaþbÞðCþdÞ
de contingencia 2 - 2

12.4.2 Cálculo de chi-cuadrado norteDJanuncio - acj-.5norteÞ2

corregido de Yates para un 2 - 2 Xcorregido


2 ¼ daþCÞðbþdÞðaþbÞðCþdÞ
mesa de contingencia

12.6.1–12.6.2 Aproximación de muestra grande dun = unÞ - ðb=bÞ


z¼pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
al chi-cuadrado p̂ð1 - p̂Þð1=Aþ1=BÞ

dónde

pag¼ ðaþbÞ=ðAþBÞ

12.7.1 Estimación del riesgo relativo un =daþbÞ


RCR¼
c=dCþdÞ
pagffiffiffi

12.7.2 Intervalo de confianza para la


100d1 -aÞ%CI¼RCR1dza=X2Þ
estimación del riesgo relativo

12.7.3 Estimación de la razón de probabilidades a=b anuncio


O
CR¼ ¼
c=d antes de Cristo

pagffiffiffi

12.7.4 Intervalo de confianza para la estimación de


100d1 -aÞ%CI¼O CR1dza=X2Þ
la razón de probabilidades

(Continuación)
PREGUNTAS DE REPASO Y EJERCICIOS 657

12.7.5 Frecuencia esperada en el daiþbiÞðaþC


i iÞ
mi

estadístico de Mantel-Haenszel nortei

12.7.6 Frecuencia esperada del daiþbiÞðCþd


i iÞða iþCiÞðbiþdiÞ
vi¼
estrato en el Mantel-Haenszel dnortei-1Þ
i 2
norte

estadística

12.7.7 Estadístico de prueba de Mantel-Haenszel PAG


k PAG
k
ai- mii
i¼1
X2mh¼i¼1
PAG
k
vi
i¼1

12.7.8 Estimador de Mantel-Haenszel de la PAG


k
daidi=niÞ
razón de probabilidades común
CRmh¼
O i¼1
PAG
k
dbiCi=niÞ
i¼1

Clave de símbolo a; b; C; d¼frecuencias de celda en una tabla de contingencia 2 -


2 A; B¼totales de fila en la tabla de contingencia 2 - 2 b¼
coeficiente de regresion X2oX2¼chi-cuadrado

mii¼frecuencia esperada en el estadístico de Mantel-Haenszel


mii¼frecuencia esperada midyjXÞ¼valor esperado deyenX

k¼grados de libertad en la distribución chi-cuadrado metro


¼significar
Oi¼frecuencia observada
O
CR¼estimación de la razón de
probabilidades s¼Desviación Estándar
RCR¼estimación del riesgo relativo
vi¼frecuencia esperada del estrato en el estadístico de Mantel-Haenszel yi¼
valor de datos en el puntoes¼variable normal

PREGUNTAS DE REPASO Y EJERCICIOS

1.Explique cómo se puede derivar la distribución de chi-cuadrado.

2.¿Cuáles son la media y la varianza de la distribución chi-cuadrado?

3.Explique cómo se calculan los grados de libertad para las pruebas de bondad de ajuste de chi-cuadrado.

4.Enuncie la regla de Cochran para frecuencias esperadas pequeñas en pruebas de bondad de ajuste.

5.¿Cómo se ajusta uno para las pequeñas frecuencias esperadas?

6.¿Qué es una tabla de contingencia?

7.¿Cómo se calculan los grados de libertad cuando unX2valor se calcula a partir de una tabla de
contingencia?
658 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

8.Explique la lógica detrás del método de calcular las frecuencias esperadas en una prueba de
independencia.

9.Explique la diferencia entre una prueba de independencia y una prueba de homogeneidad.

10Explique la lógica detrás del método de calcular las frecuencias esperadas en una prueba de
homogeneidad.

11¿Cuándo usan los investigadores la prueba exacta de Fisher en lugar de la prueba de chi-cuadrado?

12Defina lo siguiente:

(a)Estudio observacional (b)Factor de riesgo


(C)Resultado (d)Estudio retrospectivo
(mi)Estudio prospectivo (F)Riesgo relativo
(gramo)Impares (h)Razón de probabilidades

(i)Variable de confusión

13¿Bajo qué condiciones es apropiada la prueba de Mantel-Haenszel?

14Explique cómo los investigadores interpretan las siguientes medidas:


(a)Riesgo relativo
(b)Razón de probabilidades

(C)Razón de probabilidades común de Mantel-Haenszel

15.En un estudio de victimización violenta de mujeres y hombres, Porcerelli et al. (A-23) recopiló
información de 679 mujeres y 345 hombres de 18 a 64 años de edad en varios centros de medicina
familiar en el área metropolitana de Detroit. Los pacientes completaron un cuestionario de historial
de salud que incluía una pregunta sobre victimización. La siguiente tabla muestra los sujetos de la
muestra clasificados en forma cruzada por género y el tipo de victimización violenta reportada. Las
categorías de victimización se definen como no victimización, victimización por pareja (y no por otros),
victimización por persona distinta a la pareja (amigo, familiar o extraño) y quienes reportaron
victimización múltiple.

Género Sin victimización Pareja no pareja Múltiple Total

Mujer 611 34 dieciséis 18 679


Hombres 308 10 17 10 345

Total 919 44 33 28 1024


Fuente: John H. Porcerelli, Rosemary Cogan, Patricia P. West, Edward A. Rose, Dawn
Lambrecht, Karen E. Wilson, Richard K. Severson y Dunia Karana, “Vitimización violenta de
mujeres y hombres: síntomas físicos y psiquiátricos, ”Revista de la Junta Estadounidense
de Medicina Familiar, 16 (2003), 32–39.

¿Podemos concluir sobre la base de estos datos que el estado de victimización y el género no son independientes?
Dejara¼ .05.

dieciséis.Consulte el Ejercicio 15. La siguiente tabla muestra los datos informados por Porcerelli et al. para 644 mujeres
afroamericanas y caucásicas. ¿Podemos concluir sobre la base de estos datos que para las mujeres, la raza y el estado
de victimización no son independientes? Dejara¼ .05.
PREGUNTAS DE REPASO Y EJERCICIOS 659

Sin victimización Pareja no pareja Múltiple Total

caucásico 356 20 3 9 388


Afroamericano 226 11 10 9 256

Total 582 31 13 18 644


Fuente: John H. Porcerelli, Rosemary Cogan, Patricia P. West, Edward A. Rose, Dawn Lambrecht,
Karen E. Wilson, Richard K. Severson y Dunia Karana, “Vitimización violenta de mujeres y hombres:
síntomas físicos y psiquiátricos, ”Revista de la Junta Estadounidense de Medicina Familiar, 16
(2003), 32–39.

17Una muestra de 150 portadores crónicos de cierto antígeno y una muestra de 500 no portadores reveló las siguientes
distribuciones de grupos sanguíneos:

Grupo sanguíneo Transportistas no portadores Total

0 72 230 302
A 54 192 246
B dieciséis 63 79
AB 8 15 23

Total 150 500 650

¿Se puede concluir a partir de estos datos que las dos poblaciones de las que se extrajeron las muestras difieren con
respecto a la distribución de grupos sanguíneos? Dejara¼ .05. ¿Cuál es elpagvalor para la prueba?

18La siguiente tabla muestra 200 hombres clasificados según la clase social y el estado del dolor de cabeza:

Clase social
Grupo de dolor de cabeza A B C Total

Sin dolor de cabeza (en el año anterior) 6 30 22 58


Dolor de cabeza simple 11 35 17 63
Cefalea unilateral (no migraña) 4 19 14 37
Migraña 5 25 12 42

Total 26 109 sesenta y cinco 200

¿Estos datos proporcionan evidencia suficiente para indicar que el estado de la cefalea y la clase social están relacionados?
Dejara¼ .05. ¿Cuál es elpagvalor para esta prueba?

19La siguiente es la distribución de frecuencia de las puntuaciones obtenidas en una prueba de aptitud por 175 solicitantes
de un centro de formación en fisioterapia.d-X¼39:71;s¼12:92Þ.

Puntaje Numero de aplicantes Puntaje Numero de aplicantes

10–14 3 40–44 28
15–19 8 45–49 20
20–24 13 50–54 18
25–29 17 55–59 12
(Continuación)
660 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

Puntaje Numero de aplicantes Puntaje Numero de aplicantes

30–34 19 60–64 8
35–39 25 65–69 4

Total 175

¿Estos datos proporcionan evidencia suficiente para indicar que la población de puntajes no se distribuye
normalmente? Dejara¼ .05. ¿Cuál es elpagvalor para esta prueba?

20Un departamento de salud local patrocinó un programa de información sobre enfermedades venéreas (VD) que estaba abierto a
estudiantes de tercer y cuarto año de secundaria con edades comprendidas entre los 16 y los 19 años. El director del programa
creía que cada nivel de edad estaba igualmente interesado en saber más sobre la VD. Dado que cada nivel de edad estaba
representado por igual en el área atendida, ella sintió que el mismo interés en VD se reflejaría en la asistencia al programa por
igual nivel de edad. El desglose por edades de los asistentes fue el siguiente:

Edad número de asistencia

dieciséis 26
17 50
18 44
19 40

¿Son estos datos incompatibles con la creencia del director del programa de que los estudiantes de los cuatro niveles de edad
están igualmente interesados en VD? Dejara¼ .05. ¿Cuál es elpagvalor para esta prueba?

21Una encuesta de niños menores de 15 años que residen en el área del centro de una ciudad grande se clasificaron según
el grupo étnico y el nivel de hemoglobina. Los resultados fueron los siguientes:

Nivel de hemoglobina (g/100 ml)

Grupo étnico 10.0 o mayor 9,0–9,9 <9:0 Total

A 80 100 20 200
B 99 190 96 385
C 70 30 10 110

Total 249 320 126 695

¿Proporcionan estos datos suficiente evidencia para indicar, al nivel de significancia de .05, que las dos variables están
relacionadas? Cuál es elpagvalor para esta prueba?

22Una muestra de casos notificados de paperas en niños en edad preescolar mostró la siguiente distribución por edad:

Años de edad) Numero de casos

menos de 1 6
1 20
2 35
3 41
4 48

Total 150
PREGUNTAS DE REPASO Y EJERCICIOS 661

Pruebe la hipótesis de que los casos ocurren con la misma frecuencia en las cinco categorías de edad. Dejara¼ .05.
¿Cuál es elpagvalor para esta prueba?

23A cada uno de una muestra de 250 hombres extraídos de una población de presuntas víctimas de enfermedades articulares se le
preguntó cuál de los tres síntomas le molestaba más. Se hizo la misma pregunta a una muestra de 300 mujeres presuntamente
víctimas de enfermedades articulares. Los resultados fueron los siguientes:

Síntoma más molesto Hombres Mujer

Rigidez matutina 111 102


dolor nocturno 59 73
Inflamación de articulaciones 80 125

Total 250 300

¿Estos datos proporcionan suficiente evidencia para indicar que las dos poblaciones no son homogéneas con
respecto a los principales síntomas? Dejara¼ .05. ¿Cuál es elpagvalor para esta prueba?

Para cada uno de los ejercicios 24 a 34, indique si es adecuada una hipótesis nula de homogeneidad o
una hipótesis nula de independencia.

24Un investigador desea comparar el estado de tres comunidades con respecto a la inmunidad contra la poliomielitis en
niños en edad preescolar. Se extrajo una muestra de niños en edad preescolar de cada una de las tres comunidades.

25En un estudio de la relación entre el tabaquismo y las enfermedades respiratorias, se clasificó una muestra
aleatoria de adultos según el consumo de tabaco y la extensión de los síntomas respiratorios.

26Un médico que deseaba saber más sobre la relación entre el tabaquismo y los defectos congénitos estudia los
registros de salud de una muestra de madres y sus hijos, incluidos los mortinatos y los fetos abortados
espontáneamente cuando es posible.

27Un equipo de investigación en salud cree que la incidencia de depresión es mayor entre las personas con
hipoglucemia que entre las personas que no padecen esta afección.

28En una muestra aleatoria simple de 200 pacientes en tratamiento en un centro de tratamiento de abuso de
drogas, el 60 por ciento pertenecía al grupo étnico I. El resto pertenecía al grupo étnico II. En el grupo étnico
I, 60 estaban siendo tratados por abuso de alcohol (A), 25 por abuso de marihuana (B) y 20 por abuso de
heroína, metadona ilegal o algún otro opioide (C). El resto había abusado de barbitúricos, cocaína,
anfetaminas, alucinógenos o algún otro no opioide además de la marihuana (D). En el grupo étnico II, la
categoría de drogas de abuso y los números involucrados fueron los siguientes:

Ad28Þ Bd32ÞCd13Þ Ddel restoÞ

¿Se puede concluir a partir de estos datos que existe una relación entre el grupo étnico y la elección de la droga de
abuso? Dejara¼ .05 y encuentra elpagvalor.

29Las queratosis solares son lesiones de la piel que se encuentran comúnmente en el cuero cabelludo, la cara, el dorso de
las manos, los antebrazos, las orejas, el cuero cabelludo y el cuello. Son causados por la exposición prolongada al
sol, pero no son cánceres de piel. Chen et al. (A-24) estudió a 39 sujetos asignados al azar (con una proporción de 3 a
1) a la crema de imiquimod y una crema de control. El criterio de efectividad fue tener el 75 por ciento o más del área
lesionada limpia después de 14 semanas de tratamiento. Hubo 21 éxitos entre los 29 sujetos tratados con imiquimod
y tres éxitos entre los 10 sujetos que usaron la crema de control. Los investigadores utilizaron la prueba exacta de
Fisher y obtuvieron unapagvalor de .027. ¿Cuáles son las variables involucradas? ¿Las variables son cuantitativas o
cualitativas? ¿Qué hipótesis nula y alternativa son apropiadas? ¿Cuáles son tus conclusiones?
662 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

30Janardhan et al. (A-25) examinó a 125 pacientes que se sometieron a tratamiento quirúrgico o endovascular por
aneurismas intracraneales. A los 30 días del procedimiento, 17 sujetos experimentaron déficits neurológicos
transitorios/persistentes. Los investigadores realizaron una regresión logística y encontraron que el intervalo de
confianza del 95 por ciento para el cociente de probabilidades del tamaño del aneurisma era de 0,09 a 0,96. El
tamaño del aneurisma se dividió en menos de 13 mm y mayor o igual a 13 mm. Los tumores más grandes indicaron
mayores probabilidades de déficit. Describa las variables en cuanto a si son continuas, discretas, cuantitativas o
cualitativas. ¿Qué conclusiones se pueden sacar de la información dada?

31En un estudio sobre el abandono del hábito de fumar realizado por Gold et al. (A-26), 189 sujetos se
autoseleccionaron en tres tratamientos: solo parche de nicotina (NTP), solo Bupropion SR (B) y parche de
nicotina con Bupropion SR dNTPþBÞ.Los sujetos se agruparon por edad en menores de 50 años, entre 50 y
64, y 65 y más. Hubo 15 sujetos menores de 50 años que eligieron NTP, 26 que eligieron B y 16 que eligieron
NTPþB. En la categoría de 50 a 64 años, seis eligieron NTP, 54 eligieron B y 40 eligieron NTPþB. En la
categoría de mayor edad, seis eligieron NTP, 21 eligieron B y cinco eligieron NTPþB. ¿Qué técnica estadística
estudiada en este capítulo sería apropiada para analizar estos datos? Describa las variables involucradas en
cuanto a si son continuas, discretas, cuantitativas o cualitativas. ¿Qué hipótesis nula y alternativa son
apropiadas? Si cree que tiene suficiente información, realice una prueba de hipótesis completa. ¿Cuáles son
tus conclusiones?

32.Kozinszky y B-artai (A-27) examinaron el uso de anticonceptivos por parte de adolescentes que solicitan un
aborto en Szeged, Hungría. Los sujetos se clasificaron como menores de 20 años o mayores de 20 años. De
las mujeres menores de 20 años, 146 solicitaron un aborto. Del grupo de mayor edad, 1054 solicitaron un
aborto. Un grupo de control estuvo compuesto por visitantes del centro de planificación familiar que no
solicitaron un aborto o acompañantes de mujeres que solicitaron un aborto. En el grupo de control, había
147 mujeres menores de 20 años y 1053 que tenían 20 años o más. Una de las variables de resultado de
interés fue el conocimiento de la anticoncepción de emergencia. Los investigadores informan que, “La
anticoncepción de emergencia fue significativamente [(Mantel–Haenszel)pag < .001] menos conocido entre
las adolescentes que aspiran a abortar en comparación con las mujeres mayores que solicitan un aborto
artificial dO¼ .07Þque el conocimiento relevante de los controles adolescentesdO¼ .10Þ.”Explique el
significado de las estadísticas reportadas. ¿Cuáles son sus conclusiones basadas en la información dada?

33.El objetivo de un estudio de Crosignani et al. (A-28) fue evaluar el efecto del escape del tráfico rodado sobre el
riesgo de leucemia infantil. Estudiaron a 120 niños en el norte de Italia identificados a través de un registro
de cáncer basado en la población (casos). Se tomaron muestras de cuatro controles por caso, emparejados
por edad y sexo, de los archivos de población. Los investigadores utilizaron un modelo de difusión de
benceno para estimar la exposición a los gases de escape del tráfico. En comparación con los niños cuyos
hogares no estaban expuestos a las emisiones del tráfico rodado, la tasa de leucemia infantil fue
significativamente mayor en los niños muy expuestos. Caracterice este estudio en cuanto a si es
observacional, prospectivo o retrospectivo. Describa las variables en cuanto a si son continuas, discretas,
cuantitativas, cualitativas, un factor de riesgo o una variable de confusión. Explique el significado de los
resultados informados.

34.Gallagher et al. (A-29) realizaron un estudio descriptivo para identificar los factores que influyen en la asistencia de las mujeres a los
programas de rehabilitación cardíaca después de un evento cardíaco. Una variable de resultado de interés fue la asistencia real
a dicho programa. Los investigadores reclutaron a mujeres dadas de alta de cuatro hospitales metropolitanos en Sydney,
Australia. De 183 mujeres, solo 57 asistieron a los programas. Los autores informaron razones de probabilidad e intervalos de
confianza en las siguientes variables que afectaron significativamente el resultado: edad al cuadrado (1,72; 1,10–2,70). Las
mujeres mayores de 70 años tenían las probabilidades más bajas, mientras que las mujeres de 55 a 70 años tenían las
probabilidades más altas), control percibido (0,92; 0,85–1,00), empleo (0,20; 0,07–0,58), diagnóstico (6,82, 1,84–25,21, el
cociente de probabilidades fue mayor para las mujeres que experimentaron un injerto de derivación de la arteria coronaria en
comparación con el infarto de miocardio), y evento estresante (.21, .06–.73). Caracterice este estudio en cuanto a si es
observacional, prospectivo o retrospectivo. Describe el
PREGUNTAS DE REPASO Y EJERCICIOS 663

variables en cuanto a si son continuas, discretas, cuantitativas, cualitativas, un factor de riesgo o una variable de
confusión. Explique el significado de las razones de probabilidades informadas.

Para cada uno de los ejercicios del 35 al 51, haga tantos de los siguientes como considere apropiados:

(a)Aplicar una o más de las técnicas discutidas en este capítulo.


(b)Aplicar una o más de las técnicas discutidas en capítulos anteriores.
(C)Construir gráficos.
(d)Construya intervalos de confianza para los parámetros de la población.

(mi)Formule hipótesis relevantes, realice las pruebas apropiadas y encuentrepagvalores.


(F)Indique las decisiones estadísticas y las conclusiones clínicas que justifican los resultados de sus pruebas de hipótesis.

(gramo)Describa la(s) población(es) a las que cree que se aplican sus inferencias.
(h)Indique las suposiciones necesarias para la validez de sus análisis.

35.En un estudio prospectivo, aleatorizado y doble ciego, Stanley et al. (A-30) examinó la eficacia relativa y los efectos
secundarios de la morfina y la petidina, fármacos comúnmente utilizados para la analgesia controlada por el paciente
(PCA). Los sujetos fueron 40 mujeres, entre las edades de 20 y 65 años, sometidas a histerectomía abdominal total.
Los pacientes fueron asignados al azar para recibir morfina o petidina por PCA. Al final del estudio, los sujetos
describieron su apreciación de náuseas y vómitos, dolor y satisfacción por medio de una escala verbal de tres puntos.
Los resultados fueron los siguientes:

Satisfacción

Infeliz/ Moderadamente Feliz/


Droga Miserable Feliz Contento Total

petidina 5 9 6 20
Morfina 9 9 2 20

Total 14 18 8 40

Dolor

Inaguantable/ Leve/
Droga Severo Moderado Ninguno Total

petidina 2 10 8 20
Morfina 2 8 10 20

Total 4 18 18 40

Náuseas

Inaguantable/ Leve/
Droga Severo Moderado Ninguno Total

petidina 5 9 6 20
Morfina 7 8 5 20

Total 12 17 11 40
Fuente: Datos proporcionados por cortesía del Dr. Balraj L. Appadu.
664 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

36.Los datos de detección de un programa estatal de prevención del envenenamiento por plomo entre abril de 1990 y
marzo de 1991 fueron examinados por Sargent et al. (A-31) en un esfuerzo por aprender más sobre los factores de
riesgo de la comunidad para la deficiencia de hierro en niños pequeños. Los sujetos del estudio tenían entre 6 y 59
meses de edad. Entre 1860 niños con apellidos hispanos, 338 tenían deficiencia de hierro. Cuatrocientos cincuenta y
siete de 1139 con apellidos del sudeste asiático y 1034 de 8814 niños con otros apellidos tenían deficiencia de hierro.

37.Para aumentar la comprensión del riesgo de infección por VIH entre pacientes con enfermedades mentales graves, Horwath et al.
(A-32) realizó un estudio para identificar predictores del uso de drogas inyectables entre pacientes que no tenían un trastorno
primario por uso de sustancias. De 192 pacientes reclutados de centros psiquiátricos públicos para pacientes hospitalizados y
ambulatorios, 123 eran hombres. Veintinueve de los hombres y nueve de las mujeres tenían antecedentes de inyección de
drogas ilícitas.

38.Skinner et al. (A-33) realizó un ensayo clínico para determinar si el tratamiento con melfalán, prednisona y
colchicina (MPC) es superior a la colchicina (C) sola. Los sujetos consistieron en 100 pacientes con amiloidosis
primaria. Cincuenta fueron tratados con C y 50 con MPC. Dieciocho meses después del ingreso de la última
persona y 6 años después de iniciado el ensayo, 44 de los que recibieron C y 36 de los que recibieron MPC
habían fallecido.

39.El propósito de un estudio de Miyajima et al. (A-34) fue evaluar los cambios de contaminación de células
tumorales en la médula ósea (MO) y sangre periférica (PB) durante el curso clínico de pacientes con
neuroblastoma avanzado. Su procedimiento involucró la detección de ARNm de tirosina hidroxilasa (TH) para
aclarar la fuente y el momento apropiados para recolectar células madre hematopoyéticas para el trasplante.
Los autores utilizaron la prueba exacta de Fisher en el análisis de sus datos. Si está disponible, lea su artículo y decida
si está de acuerdo en que el texto exacto de Fisher era la técnica adecuada para usar. Si está de acuerdo, duplique su
procedimiento y vea si obtiene los mismos resultados. Si no está de acuerdo, explique por qué.

40Cohen et al. (A-35) investigó la relación entre la seropositividad al VIH y la vaginosis bacteriana en una población
con alto riesgo de adquisición sexual del VIH. Los sujetos fueron 144 trabajadoras sexuales comerciales en
Tailandia, de las cuales 62 eran seropositivas y 109 tenían antecedentes de enfermedades de transmisión
sexual (ETS). En el grupo VIH negativo, 51 tenían antecedentes de ETS.

41.El propósito de un estudio de Lipschitz et al. (A-36) fue examinar, utilizando un cuestionario, las tasas y características del
abuso infantil y las agresiones de adultos en una gran población general de pacientes ambulatorios. Los sujetos
consistieron en 120 pacientes ambulatorios psiquiátricos (86 mujeres, 34 hombres) en tratamiento en una clínica
hospitalaria grande en un área del centro de la ciudad. Cuarenta y siete mujeres y seis hombres denunciaron
incidentes de abuso sexual infantil.

42.Sujetos de un estudio de O'Brien et al. (A-37) consistió en 100 pacientes de bajo riesgo con embarazos bien
fechados. Los investigadores deseaban evaluar la eficacia de un método más gradual para promover el
cambio cervical y el parto. La mitad de las pacientes fueron asignadas al azar para recibir un placebo y el
resto recibió 2 mg de prostaglandina E intravaginal.2(PGE2) durante 5 días consecutivos. Uno de los bebés
nacidos de madres en el grupo experimental y cuatro nacidos de madres en el grupo de control tenían
macrosomía.

43.Los propósitos de un estudio de Adra et al. (A-38) fueron para evaluar la influencia de la vía de parto en el
resultado neonatal en fetos con gastrosquisis y para correlacionar la apariencia ultrasonográfica del intestino
fetal con el resultado posnatal inmediato. Entre los 27 casos de gastrosquisis diagnosticados prenatalmente,
la apariencia ultrasonográfica del intestino fetal fue normal en 15. Se observaron complicaciones
postoperatorias en dos de los 15 y en siete de los casos en los que la apariencia ultrasonográfica no fue
normal.

44.Liu et al. (A-39) realizó encuestas de hogares en áreas de Alabama bajo advertencias de tornado. En una de las encuestas
(encuesta 2) la edad media de los 193 entrevistados fue de 54 años. De estos, el 56,0 por ciento eran
PREGUNTAS DE REPASO Y EJERCICIOS 665

mujeres, el 88,6 por ciento eran blancas y el 83,4 por ciento tenía educación secundaria o superior. Entre la
información recopilada se encontraban datos sobre la actividad de búsqueda de refugio y la comprensión del
término "advertencia de tornado". Ciento veintiocho encuestados indicaron que generalmente buscan refugio
cuando se enteran de una advertencia de tornado. De estos, 118 entendieron el significado de la advertencia de
tornado. Cuarenta y seis de los que dijeron que normalmente no buscaban refugio entendieron el significado del
término.

45.Los propósitos de un estudio de Patel et al. (A-40) fueron para investigar la incidencia del glaucoma agudo de
ángulo cerrado secundario a la dilatación pupilar e identificar métodos de detección para detectar ángulos
en riesgo de oclusión. De 5308 sujetos estudiados, 1287 tenían 70 años o más. Se identificó que diecisiete de
los sujetos mayores y 21 de los sujetos más jóvenes (40 a 69 años de edad) tenían ángulos potencialmente
ocluibles.

46.Voskuyl et al. (A-41) investigó aquellas características (incluido el género masculino) de pacientes con
artritis reumatoide (AR) que están asociadas con el desarrollo de vasculitis reumatoide (VR). Los
sujetos consistieron en 69 pacientes a los que se les había diagnosticado RV y 138 pacientes con AR
en los que no se sospechaba que tuvieran vasculitis. Había 32 hombres en el grupo RV y 38 entre los
pacientes con AR.

47.harris et al. (A-42) realizó un estudio para comparar la eficacia de la colporrafia anterior y la uretropexia
retropúbica realizadas para la incontinencia urinaria de esfuerzo genuina. Los sujetos fueron 76 mujeres que
se habían sometido a una u otra cirugía. Los sujetos de cada grupo eran comparables en edad, estatus
social, raza, paridad y peso. En 22 de los 41 casos notificados como curados la cirugía había sido realizada
por personal asistencial. En 10 de los fracasos, la cirugía había sido realizada por personal asistencial. Todas
las demás cirugías habían sido realizadas por cirujanos residentes.

48.Kohashi et al. (A-43) realizó un estudio en el que los sujetos eran pacientes con escoliosis. Como parte del estudio, 21
pacientes tratados con aparatos ortopédicos se dividieron en dos grupos, el grupo AdnorteA¼12Þy grupo BdnorteB¼9
Þ,sobre la base de ciertos factores de progresión de la escoliosis. Dos pacientes en el grupo A y ocho en el grupo B
exhibieron evidencia de deformidad progresiva, mientras que los demás no.

49.En un estudio de pacientes con neoplasia intraepitelial cervical, Burger et al. (A-44) compararon los que eran
positivos para el virus del papiloma humano (VPH) y los que eran negativos para el VPH con respecto a los
factores de riesgo de infección por VPH. Entre sus hallazgos se encontraban 60 de 91 no fumadores con
infección por VPH y 44 pacientes VPH positivos de 50 que fumaban 21 o más cigarrillos por día.

50Tomás et al. (A-45) realizó un estudio para determinar las correlaciones del cumplimiento de las citas de
seguimiento y el surtido de recetas después de una visita al departamento de emergencias. Entre los 235
encuestados, 158 mantuvieron sus citas. De estos, 98 eran mujeres. De los que faltaron a sus citas, 31 eran
hombres.

51.Los sujetos de un estudio realizado por O'Keefe y Lavan (A-46) fueron 60 pacientes con deterioro cognitivo que
requerían líquidos parenterales durante al menos 48 horas. Los pacientes fueron asignados al azar para
recibir líquidos intravenosos (IV) o subcutáneos (SC). La edad media de los 30 pacientes del
El grupo SC tenía 81 años con una desviación estándar de 6. El 57 % eran mujeres. La edad media del
grupo IV fue de 84 años con una desviación estándar de 7. Se observó agitación relacionada con la
cánula o el goteo en 11 de los pacientes SC y 24 de los pacientes IV.

Ejercicios para usar con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel
1.Consulte los datos sobre tabaquismo, consumo de alcohol, presión arterial y enfermedades respiratorias entre
1200 adultos (FUMAR). Las variables son las siguientes:
666 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

SexodAÞ :1¼masculino; 0¼femenino


TabaquismodBÞ :0¼no fumador; 1¼fumador Nivel
de bebidadCÞ :0¼no bebedor
1¼bebedor ligero a moderado 2¼
Tomador empedernido
Síntomas de enfermedad respiratoriadDÞ :1¼presente; 0¼ausente
Estado de presión arterial altadmiÞ :1¼presente; 0¼ausente

Seleccione una muestra aleatoria simple de tamaño 100 de esta población y realice un análisis para ver si
puede concluir que existe una relación entre el tabaquismo y los síntomas de enfermedad respiratoria. Dejar
a¼ .05 y determinar elpagvalor para su prueba. Compara tus resultados con los de tus compañeros.

2.Consulte el Ejercicio 1. Seleccione una muestra aleatoria simple de tamaño 100 de la población y realice una
prueba para ver si puede concluir que existe una relación entre el consumo de alcohol y el estado de presión
arterial alta en la población. Dejara¼ .05 y determinar elpagvalor. Compara tus resultados con los de tus
compañeros.

3.Consulte el Ejercicio 1. Seleccione una muestra aleatoria simple de tamaño 100 de la población y realice
una prueba para ver si puede concluir que existe una relación entre el género y el tabaquismo en la
población. Dejara¼ .05 y determinar elpagvalor. Compara tus resultados con los de tus compañeros.

4.Consulte el Ejercicio 1. Seleccione una muestra aleatoria simple de tamaño 100 de la población y realice una
prueba para ver si puede concluir que existe una relación entre el género y el nivel de consumo de alcohol en
la población. Dejara¼ .05 y encuentra elpagvalor. Compara tus resultados con los de tus compañeros.

REFERENCIAS

Referencias de metodología
1. kARLPAGEARSON, “Sobre el criterio de que un sistema dado de desviaciones de lo probable en el caso de un sistema de variables
correlacionadas es tal que puede suponerse razonablemente que ha surgido de un muestreo aleatorio”,The London,
Edinburgh and Dublin Philosophical Magazine and Journal of Science,quinta serie,50 (1900), 157–175. Reimpreso enPrimeros
artículos estadísticos de Karl Pearson,Prensa de la Universidad de Cambridge, 1948.
2. HO LANCASTER,La distribución chi-cuadrada,Wiley, Nueva York, 1969.
3. mIKHAILS. N.IKULINy PRISCILLAP.EJREENWOOD,Una guía para las pruebas de chi-cuadrado,Wiley, Nueva York, 1996.
4. WILLIAMGCOCRAN, "ElX2Prueba de bondad de ajuste”,Anales de estadística matemática, 23 (1952), 315–345.
5. WILLIAMGCOCRAN, “Algunos métodos para fortalecer el comúnX2Pruebas,”biometría, 10 (1954), 417–451.

6. Año fiscalATE, “Tablas de contingencia que involucran números pequeños y laX2Pruebas,”Revista de la Royal Statistical
Society, Suplemento, 1,1934 (Serie B), 217–235.
7. RA FES ELLA,Métodos estadísticos para investigadores,Quinta edición, Oliver and Boyd, Edimburgo, 1934.
8. RA FES ELLA, "La lógica de la inferencia inductiva",Revista de la Royal Statistical Society Serie A, 98 (1935), 39–54.

9. JO IRWIN, “Pruebas de significación para diferencias entre porcentajes basadas en números pequeños”,Metron, 12
(1935), 83–94.
10. Año fiscalATE, “Tablas de contingencia que involucran números pequeños y laX2Prueba,"Revista de la Royal Statistical
Society, Suplemento, 1, (1934), 217–235.
11. DJ F.INNEY, “La prueba de significancia de Fisher-Yates en 2 - 2 tablas de contingencia,”Biometrika, 35 (1948),
145-156.
REFERENCIAS 667

12. R.LATSCHA, "Pruebas de significación en una tabla de contingencia 2 - 2: extensión de la tabla de Finney",Biometrika, 40 (
1955), 74–86.
13. GA BARNARD, “Una nueva prueba para 2 - 2 tablas,”Naturaleza, 156 (1945), 117.
14. GA BARNARD, “Una nueva prueba para 2 - 2 tablas,”Naturaleza, 156 (1945), 783–784.
15. GA BARNARD, “Pruebas de significación para 2 - 2 tablas,”Biometrika, 34 (1947), 123–138.
16. RA FES ELLA, “Una nueva prueba para 2 - 2 tablas,”Naturaleza, 156 (1945), 388.
17. ES PEARSON, "La elección de pruebas estadísticas ilustradas sobre la interpretación de datos clasificados en una tabla 2 - 2",
Biometrika, 34 (1947), 139–167.
18. A. S.HUMEDAL, "Una comparación de la prueba Chi-Square para 1 df y la prueba exacta de Fisher", Rand Corporation,
Santa Mónica, CA, 1972.
19. WENDELLECARR, "Texto exacto de Fisher extendido a más de dos muestras del mismo tamaño",Tecnometría, 22 (1980),
269–270.
20. HENRIARR. N.ALERO, "Una nueva mirada a una vieja prueba",Boletín de Estadística Aplicada, 9 (1982), 165–178.
21. WILLIAMD DSOBRE, "Sensibilidad del texto exacto de Fisher a perturbaciones menores en 2 - 2 tablas de contingencia",
Estadística en Medicina, 5 (1986), 629–635.
22. N. M.ANTELy W. H.AENSZEL, “Aspectos estadísticos del análisis de datos de estudios retrospectivos de enfermedades”,
Revista del Instituto Nacional del Cáncer, 22 (1959), 719–748.
23. N. M.ANTEL, “Pruebas de chi-cuadrado con un grado de libertad: Extensiones del procedimiento de Mantel-Haenszel,” Revista de la
Asociación Estadounidense de Estadística, 58 (1963), 690–700.

Aplicaciones Referencias
A-1. CUN ROLWCRANORy DCERVEZA INGLESAANTES DE CRISTOHRISTENSEN, “El Proyecto Asheville: Resultados a corto plazo de un programa de
atención de la diabetes en una farmacia comunitaria”,Diario de la Asociación Farmacéutica Americana, 43 (2003), 149–159. AMI
A-2. LBSÍ, hCUEROALLORE, THOMASMGENFERMO, y PETERnpEDUZZI, "Aplicación de modelos binomiales negativos para resultados discretos: un
estudio de caso en la investigación sobre el envejecimiento"Revista de Epidemiología Clínica, 56 (2003), 559–564.

A-3. kATLETAEMTEPANUK, jORGEETOLOSA, DAWNEETELEWIS, VICTORIAMETROOJOS, CYNTIAROYDS, jUANCARLOS


SAOGALy RENLIBRIZZI, “Uso de suplementos de ácido fólico entre mujeres que acuden a un servicio de
información de teratología”,Diario americano de obstetricia y ginecología, 187 (2002), 964–967.
A-4. JK Splatay DD AIELLO, “Sobrevivientes de polio: caídas y lesiones posteriores”,Revista estadounidense de
medicina física y rehabilitación, 81 (2002), 567–570.
A-5. CYNTIAG. S.IGUALy jACQUELINEJ. A.NDERSON, “Preparación preoperatoria de la piel de pacientes cardíacos”,Revista
AORN, 76 (2002), 821–827.
A-6. RALFAROTHENBERGy jOHNPHolcomb, “Pautas para el control de los AINE: ¿Quién escuchó?”Diario de
Reumatología Clínica, 6 (2000), 258–265.
A-7. SharónMBOLESy PUN TRUCOBJOHNSON, “Género, preocupaciones sobre el peso y tabaquismo adolescente”,Revista de
enfermedades adictivas, 20 (2001), 5–14.
A-8. El Grupo de estudio DMG, “Migraña y narcolepsia idiopática: un estudio de casos y controles”,Cefalagia, 23 (2003),
786–789.
A-9. TASHADCARTER, miMANUELAMETRODESHACER, SAGARVPARCAy J.AMÉSLkENNEDY, “La edad temprana de inicio como factor de riesgo
de mala evolución del trastorno bipolar”,Revista de Investigación Psiquiátrica, 37 (2003), 297–303.
A-10. STEVENSCOUGHLIN, ROBERTOJ. U.HLER, THOMASRCHARDOSy kATERINAMWILSON, “Cáncer de mama y de cuello uterino
Prácticas de detección entre mujeres hispanas y no hispanas que residen cerca de la frontera entre Estados Unidos y
México, 1999-2000”,Salud Familiar y Comunitaria, 26 (2003), 130–139.
A-11. ROBERTOSWOR, SCOTTCOMPTON, FERNVENTRADA, LYNNOSOSKYFARR, SUEkOKKO, REBECCAPAGASCUALy RAYMONDMI.
jACKSON, "Un ensayo controlado aleatorizado de RCP solo con compresión torácica para adultos mayores: un estudio piloto"
Reanimación, 58 (2003), 177–185.
A-12. EE. UU. JUSTESEN, AM LERVFING, ENHOMSEN, JA LINDBERG, CPEDERSEN, y P. T.AURIS, “Indinavir en dosis bajas en combinación con
ritonavir en dosis bajas: farmacocinética en estado estacionario y seguimiento de resultados clínicos a largo plazo”
Medicina del VIH, 4 (2003), 250–254.
A-13. JF TAHMASSEBIy MEJCURZÓN, “La causa del babeo en niños con parálisis cerebral: ¿hipersalivación o defecto de
deglución?”Revista Internacional de Odontología Pediátrica, 13 (2003), 106–111.
A-14. SHUDONGXIAOy TONGSHOLA, “¿Es efectivo el jugo de arándano en el tratamiento y prevención deHelicobacter pylori
¿Infección de ratones?,”Revista china de enfermedades digestivas, 4 (2003), 136–139.
668 CAPÍTULO 12 LA DISTRIBUCIÓN CHI-CUADRADO Y EL ANÁLISIS DE FRECUENCIAS

A-15. GRAMOANUNCIOSMERLUCHA, ohPIERNAkLEINER, ROBERTOFDENTRO, jACOBMETROORDECHAI, norteITZAnorteEWMAN, y ZAHAVICOHEN,


“Manejo de lesiones pancreáticas contusas en niños”,Revista Europea de Trauma, 29 (2003), 151–155. miVERETTFMAGÁN,
A-16. SharónFEFURGONETAS, BETHWEITZy J.OHNnorteEWNHAM, "Importancia del ejercicio antes del parto, durante el parto y neonatal
en mujeres trabajadoras embarazadas sanas de bajo riesgo"Obstetricia y Ginecología, 99 (2002), 466–472.

A-17. Soy TOSCHKE, SM MONGOMERÍA, ARRIBAfeiffery R.von Kries, “Exposición intrauterina temprana a productos inhalados
por tabaco y obesidad”,Diario Americano de Epidemiología, 158 (2003), 1068–1074.
A-18. DanielHLAMETROONT, mATTEOJBUDOFF, DÁVIDOEMHAVELLE, ROBERTOSHAVELLE, BRUCEHBRENDIMIENTOy J.AMÉS
MHAGAR, "La exploración de calcio coronario agrega valor incremental a los pacientes con pruebas de esfuerzo positivas",
Diario americano del corazón, 143 (2002), 861–867.
A-19. METROARGARETLJDAVY, TOMJDEXTRAÑO, COLINGLReino Unido, y DÁVIDOSEÑORODER, "Cáncer de cuello uterino: efecto del tipo de célula
glandular en el pronóstico, el tratamiento y la supervivencia",Obstetricia y Ginecología, 101 (2003), 38–45.
A-20. A NOSOTROSTENESTRANDAy L. W.ALENTÍN, “Revascularización temprana y supervivencia de 1 año en sobrevivientes de 14 días de
infarto agudo de miocardio,”Lanceta, 359 (2002), 1805–1811.
A-21. TAKAKOSUGIYAMA, kUMIYASUGIYAMA, mASAOTAOD, TAstuoYUKAWA, SOHEIMETROAKINO, y TAKESHIFUKUDA, "Riesgo
Factores para el asma y las enfermedades alérgicas entre los escolares de 13 y 14 años en Japón”,Alergología
Internacional, 51 (2002), 139–150.
A-22. DHOLBÉN, MC MCCLINCY, JP H.olcomby KL DEAN, “Estado de seguridad alimentaria de los hogares en los Apalaches de Ohio
con niños en Head Start”,Diario de la Asociación Dietética Americana, 104 (2004), 238–241.
A-23. jOHNHPORCERELLI, ROSEMARIOCOGAN, PAGATRICIAP. W.est, miENANOA. R.OSE, DARISTALAMBRECHE, kARÉNE. W.ILSON,
RICHARDKSEVERSON, y DUNÍAkARANA, “Vitimización violenta de mujeres y hombres: síntomas físicos y
psiquiátricos”,Revista de la Junta Estadounidense de Medicina Familiar, 16 (2003), 32–39.
A-24. kESPCGALLINA, LEE.UU.METROIEYpunto de acceso, ROBINMETROARCAS, y StephenSHUMACK, “Terapia de corta duración con crema de imiquimod
al 5 % para la queratosis solar: un ensayo controlado aleatorizado”Revista de Dermatología de Australasia, 44 (2003), 250–255.

A-25. VALABHjANARDHAN, ROBERTOFRIEDLANDER, hPREMIORIINA, y PHILIPmiDWINSTIEG, “Identificación de pacientes en riesgo


para la morbilidad posprocedimiento después del tratamiento de aneurismas intracraneales incidentales: el papel del tamaño y la
ubicación del aneurisma”,Enfoque neuroquirúrgico, 13 (2002), 1–8.
A-26. PAGAULBGVIEJO, ROBERTOnrUBEYy RICHARDTHARVEY, “Estudio comparativo naturalista y autoasignado de bupropion SR, un
parche de nicotina o ambos para el tratamiento para dejar de fumar en la atención primaria”Revista estadounidense
sobre adicciones, 11 (2002), 315–331.
A-27. ZOLTA- nortekOZINSZKYy Gyo €RGYBA - RTAI, “Conducta anticonceptiva de adolescentes que solicitan aborto”,europeo
Revista de Obstetricia y Ginecología y Biología Reproductiva, 112 (2004), 80–83.
A-28. PAGAOLOCROSIGNANI, ANDREATITTARELLI, ALESSANDROBORGINI, TIZIANACODAZZI, ADRIANOROVELLI, miartes marciales mixtasPAG
ORO, PAGAOLOCONTIERO, norteADIABIANCHI, gIOVANNATAGLIABUE, RosariaFISSI, FRANCESCOROSSITTO, y FrancoBERRINO,
“Leucemia infantil y tráfico rodado: un estudio de control de casos basado en la población”,Revista Internacional de
Cáncer, 108 (2004), 596–599.
A-29. ROBYNGRAMOALLAGHER, SharónMETROCkINLEYy kATLETADRACUP, “Predictores de la Asistencia de las Mujeres a los Programas
de Rehabilitación Cardiaca,”Avances en Enfermería Cardiovascular, 18 (2003), 121–126.
A-30. G. S.TANLEY, B. A.PPADU, M. M.DAEy DJ R.OWBOTHAM, "Requisitos de dosis, eficacia y efectos secundarios de la morfina y la
petidina administradas mediante analgesia controlada por el paciente después de una cirugía ginecológica"Revista
británica de anestesia, 76 (1996), 484–486.
A-31. jAMÉSD. S.ARGÉN, THÉRESECOMOtukel, mADELINEADALTON, jEANLFREEMAN, y MARIOjEANBFILA, "Hierro
Deficiencia en las comunidades de Massachusetts: factores de riesgo socioeconómicos y demográficos entre los
niños”, Diario Americano de Salud Pública, 86 (1996), 544–550.
A-32. miWALDHORWATH, FRANCINECNUESTROS, kARÉNMETROCkPOSADA, jEANNINER. G.UIDOy RICHARDHERMAN, "Droga ilicita
Inyección entre pacientes psiquiátricos sin un trastorno primario por uso de sustancias”,Servicios Psiquiátricos, 47
(1996), 181–185.
A-33. METROARTHASKINNER, jENNIFERJ. A.NDERSON, ROBERTOSIMMS, RODNEYFALK, mEN GWESP, CARYNA. L.IBBEY, LEE.UU.ANNAjUNOS,
y unLANSCOHEN, “Tratamiento de 100 pacientes con amiloidosis primaria: un ensayo aleatorizado de melfalán,
prednisona y colchicina versus colchicina sola”Diario americano de medicina, 100 (1996), 290–298.
A-34. YUJIMETROIYAJIMA, kEIZOHORIBE, mINORUFUKUDA, kIMIKAZUMETROATSUMOTO, SH.N.I.-ICHIROnorteUMATA, hIROSHIMETROO YO, y
kOJIkATO, “Detección secuencial de células tumorales en la sangre periférica y la médula ósea de pacientes con neuroblastoma
en estadio IV mediante la reacción en cadena de la polimerasa con transcripción inversa para ARNm de tirosina hidroxilasa,”
Cáncer, 77 (1996), 1214–1219.
REFERENCIAS 669

A-35. CRAIGRCOHEN, ANNDUERR, norteIWATPAGRUITHITHADA, SUNGWALRUGPAO, SharónHILLIER, PAGATRICIAGRAMOARCIA, y


kENRADnorteELSON, “Vaginosis bacteriana y seroprevalencia del VIH entre trabajadoras sexuales comerciales en
Chiang Mai, Tailandia”SIDA, 9 (1995), 1093–1097.
A-36. DEBORÁS. L.IPSCHITZ, mARGARETLkUN PLAN, jODIOBSORKENN, gIANNILFAEDDA, PAGETERCCUERNO, y GREGORIO
MASNIS, “Prevalencia y características del abuso físico y sexual entre pacientes psiquiátricos ambulatorios”, Servicios
Psiquiátricos, 47 (1996), 189–191.
A-37. jOHNM.O'BRIEN, BRIANMMercer, norteANCYTCLEARY, y BAjáEMIBAI, “Eficacia de la inducción ambulatoria con dosis bajas de
prostaglandina intravaginalmi2: un ensayo aleatorizado, doble ciego, controlado con placebo”,Diario americano de
obstetricia y ginecología, 173 (1995), 1855–1859.
A-38. ABDALLAHMADRA, hELAINJ. L.ANDY, jAIMEnorteAHMÍAS, y ORLANDOGRAMOO - MEZ-METROAR-ıN, “El Feto con Gastro-

esquisis: impacto de la vía de parto y la ecografía prenatal”,Diario americano de obstetricia y


ginecología, 174 (1996), 540–546.
A-39. SESTOY DENTROLIU, LYNNE.Q.UENEMOEN, jOSEFINAMETROALILAY, miRICnorteOJI, THOMASSTINTASy J.AMÉSMETROENDLEÍN, "Evaluación
de un Sistema de Alerta de Clima Severo y Preparación para Desastres, Calhoun Country, Alabama, 1994,”Diario
Americano de Salud Pública, 86 (1996), 87–89.
A-40. kETANHPATEL, jONATÁNC. J.AVITT, jAMÉSMTIELSCH, DEBRACOMOÁRBOL, jOANNEkZTA, hARRYA QUIGLEY, y
ALFREDSOMMER, “Incidencia de glaucoma agudo de ángulo cerrado después de midriasis farmacológica,”Diario
Americano de Oftalmología, 120 (1995), 709–717.
A-41. ALEXANDREEVOSKUYL, AEILKOH ZWINDERMAN, mARIELOuiseWESTEDT, jUNPVANDENBROUCKE, FerdinandC.
BREEDVELDy J.OHANNAMW HAZÉS, "Factores asociados con el desarrollo de vasculitis en la artritis reumatoide: resultados
de un estudio de casos y controles"Anales de las enfermedades reumáticas, 55 (1996), 190–192.
A-42. ROBERTOLHARISTA, CHRISTOPHERA.Y.ANCEY, WINFREDOL. W.ISER, jOHNCMORRISONy G. R.ODNEYMETROEEKS,
“Comparación de colporrafia anterior y uretropexia retropúbica para pacientes con incontinencia urinaria de
esfuerzo genuina”Diario americano de obstetricia y ginecología, 173 (1995), 1671–1675.
A-43. YOSHIHIROkOHASHI, mASAYOSHIOGeorgia, y YOICHISUGIOKA, "Un nuevo método que utiliza vistas superiores de la columna para
predecir la progresión de las curvas en la escoliosis idiopática durante el crecimiento"Columna vertebral, 21 (1996),
A-44. 212–217. MPM BURGENCIA, S.SOLLEMA, WJLM PIETERS, FP SCDH€oDER, y WGV QUINT, “Evidencia epidemiológica de neoplasia
intraepitelial cervical sin presencia de virus del papiloma humano”,Revista británica de cáncer, 73 (1996), 831–836.

A-45. miRICJTHOMAS, hELENrbUrstin, ANNEC.O'NNIE, EJOHNORAV, y TROYENABRENNAN, "Paciente


Incumplimiento de los consejos médicos después de la visita al servicio de urgencias”,Anales de Medicina de Emergencia, 27 (
1996), 49–55.
A-46. ST OKEEFEy JN LUNA CAMIONETA, “Líquidos subcutáneos en pacientes hospitalizados de edad avanzada con deterioro cognitivo”,
Gerontología, 42 (1996), 36–39.
CAPÍTULO 13
NO PARAMÉTRICO Y
SIN DISTRIBUCIÓN
ESTADÍSTICAS

RESUMEN DEL CAPÍTULO

Este capítulo explora una amplia variedad de técnicas que son útiles cuando se violan
los supuestos subyacentes de las pruebas de hipótesis tradicionales o cuando se
desea realizar una prueba sin hacer suposiciones sobre la población muestreada.

TEMAS

13.1INTRODUCCIÓN
13.2ESCALAS DE MEDIDA
13.3LA PRUEBA DEL SIGNO

13.4LA PRUEBA DE RANGO CON SIGNOS DE WILCOXON PARA LA UBICACIÓN

13.5LA PRUEBA DE LA MEDIANA

13.6LA PRUEBA DE MANN-WHITNEY


13.7PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV-SMIRNOV
13.8EL ANÁLISIS UNIDIRECCIONAL DE LA VARIANZA POR RANGO DE KRUSKAL-WALLIS

13.9EL ANÁLISIS DE FRIEDMAN DE DOS VÍAS DE LA VARIANZA POR RANGO

13.10EL COEFICIENTE DE CORRELACIÓN DE RANGO DE SPEARMAN

13.11ANÁLISIS DE REGRESIÓN NO PARAMÉTRICO


13.12RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. Comprender la transformación de rango y cómo se pueden usar procedimientos no paramétricos
para escalas de medición débiles.

670
13.1 INTRODUCCIÓN 671

2. ser capaz de calcular e interpretar una amplia variedad de pruebas no paramétricas comúnmente
utilizadas en la práctica.
3. comprender qué pruebas no paramétricas se pueden usar en lugar de las pruebas estadísticas
paramétricas tradicionales cuando se violan varios supuestos de prueba.

13.1 INTRODUCCIÓN

La mayoría de los procedimientos de inferencia estadística que hemos discutido hasta este punto se
clasifican comoestadísticas paramétricas.Una excepción es nuestro uso de chi-cuadrado, como prueba de
bondad de ajuste y como prueba de independencia. Estos usos de chi-cuadrado se encuentran bajo el título
de estadísticas no paramétricas.
La pregunta obvia ahora es: "¿Cuál es la diferencia?" En respuesta, recordemos la naturaleza de
los procedimientos inferenciales que hemos categorizado comoparamétrico.En cada caso, nuestro
interés se centró en estimar o probar una hipótesis sobre uno o más parámetros poblacionales.
Además, el centro de estos procedimientos era el conocimiento de la forma funcional de la población
de la que se extrajeron las muestras que proporcionaban la base para la inferencia.
Un ejemplo de una prueba estadística paramétrica es la ampliamente utilizadatprueba. Los usos más
comunes de esta prueba son para probar una hipótesis sobre una sola media poblacional o la diferencia
entre dos medias poblacionales. Una de las suposiciones que subyacen al uso válido de esta prueba es que la
población o poblaciones muestreadas tienen una distribución al menos aproximadamente normal.

Como aprenderemos, los procedimientos que analizamos en este capítulo no tienen que ver
con los parámetros de la población o no dependen del conocimiento de la población muestreada.
Estrictamente hablando, solo aquellos procedimientos que prueban hipótesis que no son
afirmaciones sobre parámetros poblacionales se clasifican comono paramétrico,mientras que
aquellos que no hacen ninguna suposición acerca de la población muestreada se denominansin
distribuciónprocedimientos. A pesar de esta distinción, es habitual utilizar los términosno paramétrico
ydistribución gratuitaindistintamente y discutir los diversos procedimientos de ambos tipos bajo el
título estadísticas no paramétricas.Seguiremos esta convención.
La discusión anterior implica las siguientes cuatro ventajas de las estadísticas no
paramétricas.

1.Permiten la prueba de hipótesis que no son afirmaciones sobre los valores de los parámetros de
la población. Algunas de las pruebas de bondad de ajuste de chi-cuadrado y las pruebas de
independencia son ejemplos de pruebas que poseen esta ventaja.
2.Las pruebas no paramétricas se pueden utilizar cuando se desconoce la forma de la población
muestreada.

3.Los procedimientos no paramétricos tienden a ser computacionalmente más fáciles y, en consecuencia, se


aplican más rápidamente que los procedimientos paramétricos. Esta puede ser una característica deseable en
ciertos casos, pero cuando el tiempo no es escaso, merece una baja prioridad como criterio para elegir una
prueba no paramétrica. De hecho, la mayoría de los paquetes de software estadístico ahora incluyen una
amplia variedad de opciones de análisis no paramétrico, lo que hace que las consideraciones sobre la
velocidad de cálculo sean innecesarias.

4.Los procedimientos no paramétricos se pueden aplicar cuando los datos que se analizan consisten
simplemente en clasificaciones o clasificaciones. Es decir, los datos pueden no estar basados en un
672 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

escala de medición lo suficientemente fuerte como para permitir las operaciones aritméticas
necesarias para llevar a cabo procedimientos paramétricos. El tema de las escalas de medición se
analiza con más detalle en la siguiente sección.

Aunque las estadísticas no paramétricas disfrutan de una serie de ventajas, también deben
reconocerse sus desventajas.

1.El uso de procedimientos no paramétricos con datos que pueden manejarse con un procedimiento paramétrico
da como resultado un desperdicio de datos.

2.La aplicación de algunas de las pruebas no paramétricas puede ser laboriosa para muestras
grandes.

13.2 ESCALAS DE MEDIDA

Como se señaló en la sección anterior, una de las ventajas de los procedimientos estadísticos no
paramétricos es que se pueden utilizar con datos que se basan en una escala de medición débil. Para
comprender completamente el significado de esta declaración, es necesario conocer y comprender el
significado de la medición y las diversas escalas de medición que se utilizan con mayor frecuencia. En
este punto, el lector puede referirse a la discusión de las escalas de medición en el Capítulo 1.

Muchas autoridades opinan que diferentes pruebas estadísticas requieren


diferentes escalas de medición. Aunque esta idea parece seguirse en la práctica, existen
puntos de vista alternativos.
Los datos basados en rangos, como se discutirá en este capítulo, se encuentran comúnmente en las
estadísticas. Podemos, por ejemplo, simplemente observar el orden en que una muestra de sujetos completa
un evento en lugar del tiempo real que tarda en completarlo. Más a menudo, sin embargo, usamos un
transformación de rangosobre los datos reemplazando, antes del análisis, los datos originales por sus
rangos. Aunque normalmente perdemos algo de información al emplear este procedimiento (por ejemplo, la
capacidad de calcular la media y la varianza), la escala de medida transformada permite el cálculo de la
mayoría de los procedimientos estadísticos no paramétricos. De hecho, la mayoría de los procedimientos no
paramétricos de uso común, incluida la mayoría de los que se presentan en este capítulo, se pueden obtener
aplicando primero la transformación de rango y luego usando el procedimiento paramétrico estándar en los
datos transformados en lugar de en los datos originales. Por ejemplo, si deseamos determinar si dos
muestras independientes difieren, podemos emplear las muestras independientestprobar si los datos tienen
una distribución aproximadamente normal. Si no podemos hacer la suposición de distribuciones normales,
podemos, como veremos en las secciones siguientes, emplear una prueba no paramétrica apropiada. En
lugar de estos procedimientos, primero podríamos aplicar la transformación de rango en los datos y luego
usar las muestras independientestprueba en las filas. Esto proporcionará una prueba equivalente a la prueba
no paramétrica y es una herramienta útil para emplear si la prueba no paramétrica deseada no está
disponible en su paquete de software estadístico disponible.

Los lectores también deben tener en cuenta que otras transformaciones (p. ej., tomar el logaritmo de
los datos originales) pueden normalizar los datos lo suficiente como para que se puedan usar
procedimientos paramétricos estándar en los datos transformados en lugar de usar métodos no
paramétricos.
13.3 LA PRUEBA DEL SIGNO 673

13.3 LA PRUEBA DEL SIGNO

el familiartLa prueba no es estrictamente válida para probar (1) la hipótesis nula de que la media de una
población es igual a algún valor en particular, o (2) la hipótesis nula de que la media de una población de
diferencias entre pares de medidas es igual a cero a menos que el valor relevante las poblaciones están al
menos aproximadamente distribuidas normalmente. El caso 2 se reconocerá como una situación que fue
analizada por la prueba de comparaciones pareadas en el Capítulo 7. Cuando no se pueden hacer los
supuestos de normalidad o cuando los datos disponibles son rangos en lugar de medidas en una escala de
intervalo o razón, el investigador puede desear un procedimiento opcional. Aunque eltse sabe que la prueba
es bastante insensible a las violaciones de la suposición de normalidad, hay ocasiones en las que es deseable
una prueba alternativa.
Una prueba no paramétrica de uso frecuente que no depende de los supuestos delt la
prueba es laprueba de signosEsta prueba se centra en la mediana en lugar de la media como
medida de tendencia central o ubicación. La mediana y la media serán iguales en distribuciones
simétricas. La única suposición que subyace a la prueba es que la distribución de la variable de
interés es continua. Este supuesto descarta el uso de datos nominales.
La prueba de signos recibe su nombre del hecho de que los más y los menos, en lugar de los valores
numéricos, proporcionan los datos sin procesar que se utilizan en los cálculos. Ilustramos el uso de la prueba
de signos, primero en el caso de una sola muestra y luego con un ejemplo que involucra muestras pareadas.

EJEMPLO 13.3.1
Los investigadores querían saber si la instrucción en el cuidado y arreglo personal mejoraría la apariencia de
las niñas con retraso mental. En una escuela para retrasados mentales, 10 niñas seleccionadas al azar
recibieron instrucción especial en cuidado y arreglo personal. Dos semanas después de completar el curso de
instrucción, las niñas fueron entrevistadas por una enfermera y una trabajadora social, quienes asignaron a
cada niña una puntuación basada en su apariencia general. Los investigadores creían que las puntuaciones
alcanzaban el nivel de una escala ordinal. Sentían que aunque una puntuación de, digamos, 8 representaba
una mejor apariencia que una puntuación de 6, no estaban dispuestos a decir que la diferencia entre las
puntuaciones de 6 y 8 era igual a la diferencia entre, digamos, las puntuaciones de 8 y 10; o que la diferencia
entre las puntuaciones de 6 y 8 representó el doble de mejora que la diferencia entre las puntuaciones de 5 y
6. Las puntuaciones se muestran en la Tabla 13.3.1. Queremos saber si podemos concluir que la puntuación
media de la población de la que suponemos que se ha extraído esta muestra es diferente de 5.

TABLA 13.3.1 Puntuaciones de apariencia


general de 10 niñas con retraso mental

Chica Puntaje Chica Puntaje

1 4 6 6
2 5 7 10
3 8 8 7
4 8 9 6
5 9 10 6
674 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Solución:

1. Datos.Ver enunciado del problema.


2. Supuestos.Suponemos que las medidas se toman en una
variable continua.
3. Hipótesis.
H0: La mediana de la población es 5: HA: La
mediana de la población no es 5:

Dejara¼ :05.
4. Estadística de prueba.El estadístico de prueba para la prueba de signos es el
número observado de signos más o el número observado de signos menos. La
naturaleza de la hipótesis alternativa determina cuál de estos estadísticos de
prueba es apropiado. En una prueba dada, cualquiera de las siguientes hipótesis
alternativas es posible:

HA:PAGðþÞ > ð-Þ HA: alternativa unilateral


PAGðþÞ < ð-Þ HA: alternativa unilateral
PAGðþÞ 6¼1ð-Þ alternativa de dos caras

Si la hipótesis alternativa es

HA:PAGðþÞ >PAGð-Þ

un número suficientemente pequeño de signos menos provoca el rechazo deH0. La


estadística de prueba es el número de signos menos. De manera similar, si la hipótesis
alternativa es

HA:PAGðþÞ <PAGð-Þ

un número suficientemente pequeño de signos más provoca el rechazo deH0. La


estadística de prueba es el número de signos más. Si la hipótesis alternativa es

HA:PAGðþÞ 6¼PAGð-Þ

ya sea un número suficientemente pequeño de signos más o un número suficientemente


pequeño de signos menos provoca el rechazo de la hipótesis nula. Podemos tomar como
estadística de prueba el signo que ocurre con menor frecuencia.

5. Distribución de la estadística de prueba.Como primer paso para determinar la naturaleza del


estadístico de prueba, examinemos los datos de la tabla 13.3.1 para determinar qué puntajes
se encuentran por encima y cuáles por debajo de la mediana hipotética de 5. Si asignamos un
signo más a esos puntajes que se encuentran por encima de la mediana hipotética y un
menos a los que se encuentran por debajo, tenemos los resultados que se muestran en la
Tabla 13.3.2.

Si la hipótesis nula fuera cierta, es decir, si la mediana fuera, de hecho,


5, esperaríamos que el número de puntuaciones por encima y por debajo de 5 fuera
13.3 LA PRUEBA DEL SIGNO 675

TABLA 13.3.2 Puntuaciones superioresðþÞy por debajoð-Þla mediana hipotética basada en los datos
del ejemplo 13.3.1

Chica 1 2 3 4 5 6 7 8 9 10

Puntuación relativa a - 0 þ þ þ þ þ þ þ þ
hipotético
mediana

aproximadamente igual. Esta línea de razonamiento sugiere una forma alternativa


en la que podríamos haber establecido la hipótesis nula, a saber, que la
probabilidad de un más es igual a la probabilidad de un menos, y estas
probabilidades son iguales a 0,5. Expresado simbólicamente, la hipótesis sería

H0:PAGðþÞ ¼PAGð-Þ ¼ :5

En otras palabras, esperaríamos aproximadamente el mismo número de signos más que


de signos menos en la tabla 13.3.2 cuandoH0es verdad. Una mirada a la Tabla 13.3.2
revela una preponderancia de ventajas; específicamente, observamos ocho más, uno
menos y un cero, que se asignó al puntaje que cayó exactamente en la mediana. El
procedimiento usual para el manejo de ceros es eliminarlos del análisis y reducirnorte,el
tamaño de la muestra, en consecuencia. Si seguimos este procedimiento, nuestro
problema se reduce a uno que consta de nueve observaciones de las cuales ocho son
positivas y una negativa.
Dado que el número de más y menos no es el mismo, nos preguntamos si la
distribución de signos es lo suficientemente desproporcionada como para poner
en duda nuestra hipótesis. Expresado de otra manera, nos preguntamos si este
pequeño número de desventajas podría haber ocurrido solo por casualidad
cuando la hipótesis nula es verdadera, o si el número es tan pequeño que algo
diferente al azar (es decir, una hipótesis nula falsa) es responsable. por los
resultados
Con base en lo que aprendimos en el Capítulo 4, parece razonable concluir
que las observaciones en la Tabla 13.3.2 constituyen un conjunto denorte variables
aleatorias independientes de la población de Bernoulli con parámetropag.si
dejamosk¼la estadística de prueba, la distribución muestral dekes la distribución
de probabilidad binomial con parámetropag¼ :5 si la hipótesis nula es verdadera.

6. Regla de decisión.La regla de decisión depende de la hipótesis alternativa. ParaHA:


PAGðþÞ >PAGð-Þ,rechazarH0si cuandoH0es cierto, la probabilidad de
observandoko menos signos menos es menor o igual quea. ParaHA:
PAGðþÞ <PAGð-Þ,rechazarH0si la probabilidad de observar, cuando
H0es verdad,ko menos signos más es igual o menor quea. ParaHA:
PAGðþÞ 6¼PAGð-Þ,rechazarH0si (dado queH0es verdad) la
probabilidad de obtener un valor dektan extremo o más extremo de lo
que realmente se calculó es igual o menor queun =2.

Para este ejemplo, la regla de decisión es: RechazarH0Si elpagel valor de la


estadística de prueba calculada es menor o igual a .05.
676 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

7. Cálculo de la estadística de prueba.Podemos determinar la probabilidad de


observarXo menos signos menos cuando se da una muestra de tamaño
nortey parámetropagevaluando la siguiente expresión:
XX
nk
PAGdk-xjnorte; pag¼ norteCkpagkq- (13.3.1)
k¼0

Para nuestro ejemplo calcularíamos


0 9 1
9C0d:5Þ ð:5Þ9-0þ9C1d:5Þ1d:5Þ- ¼ :00195þ :01758¼ :0195

8. Decisión estadística.En el Apéndice Tabla B encontramos

PAGdk-1j9; :5Þ ¼ :0195

Con una prueba bilateral, un número suficientemente pequeño de negativos o un


número suficientemente pequeño de positivos provocaría el rechazo de la hipótesis
nula. Dado que, en nuestro ejemplo, hay menos desventajas, enfocamos nuestra
atención en las desventajas en lugar de las ventajas. Configurandoaigual a .05,
estamos diciendo que si el número de menos es tan pequeño que la probabilidad de
observar estos pocos o menos es menor que .025 (la mitad dea),rechazaremos la
hipótesis nula. La probabilidad que hemos calculado, .0195, es menor que . 025. Por lo
tanto, rechazamos la hipótesis nula.

9. Conclusión.Concluimos que la puntuación mediana no es 5.


10pagvalor.Elpagel valor para esta prueba es 2d:0195Þ ¼ :0390. &

Prueba de signos: datos emparejadosCuando los datos a analizar consisten en observaciones en pares
emparejados y los supuestos que subyacen a latno se cumplen las pruebas, o la escala de medición es débil,
se puede emplear la prueba de signos para probar la hipótesis nula de que la diferencia de la mediana es 0.
Una forma alternativa de enunciar la hipótesis nula es

PAGdXi> Yi¼PAGdXi< YiÞ ¼ :5

Una de las puntuaciones coincidentes, por ejemplo,Yi, se resta de la otra puntuación,Xi. SiYies
menos queXi, el signo de la diferencia esþ,y siYies mayor queXi, el signo de la diferencia es -. Si la
diferencia de la mediana es 0, esperaríamos que un par elegido al azar tuviera la misma probabilidad
de producir unþcomo a - cuando se realiza la resta. Podemos enunciar la hipótesis nula, entonces,
como

H0:PAGðþÞ ¼PAGð-Þ ¼ :5

En una muestra aleatoria de pares emparejados, esperaríamos que el número deþ's y -'s sean
aproximadamente iguales. si hay masþ's o más - de los que pueden explicarse solo por casualidad
cuando la hipótesis nula es verdadera, albergaremos algunas dudas sobre la veracidad de nuestra
hipótesis nula. Por medio de la prueba de los signos, podemos decidir cuántos de un signo
constituyen más de lo que puede explicarse solo por casualidad.
13.3 LA PRUEBA DEL SIGNO 677

EJEMPLO 13.3.2
Un equipo de investigación dental deseaba saber si sería beneficioso enseñar a las personas a
cepillarse los dientes. Doce pares de pacientes atendidos en una clínica dental se obtuvieron
emparejando cuidadosamente factores como la edad, el sexo, la inteligencia y las puntuaciones
iniciales de higiene oral. Un miembro de cada pareja recibió instrucciones sobre cómo cepillarse los
dientes y sobre otros asuntos de higiene bucal. Seis meses después, un higienista dental examinó a
los 24 sujetos y les asignó una puntuación de higiene bucal sin saber qué sujetos habían recibido la
instrucción. Una puntuación baja indica un alto nivel de higiene bucal. Los resultados se muestran en
la Tabla 13.3.3.

Solución:

1. Datos.Ver enunciado del problema.


2. Supuestos.Suponemos que la población de diferencias entre pares de
puntajes es una variable continua.
3. Hipótesis.Si la instrucción produce un efecto beneficioso, este hecho se
reflejaría en las puntuaciones asignadas a los miembros de cada pareja. Si
tomamos las diferenciasXi- sii, esperaríamos observar más - queþ's si la
instrucción hubiera sido beneficiosa, ya que una puntuación baja indica un
mayor nivel de higiene bucal. Si, de hecho, la instrucción es beneficiosa, la
mediana de la población hipotética de todas esas diferencias sería menor
que 0, es decir, negativa. Si, por el contrario, la instrucción no tuviera efecto,
la mediana de esta población sería cero. Las hipótesis nula y alterna,
entonces, son:

TABLA 13.3.3 Puntuaciones de higiene bucal de 12 sujetos


que recibieron instrucción en higiene bucal (Xi) y 12 sujetos
que no reciben instrucción (Yi)

Puntaje

Número de par instruido (Xi) no instruido (Yi)

1 1.5 2.0
2 2.0 2.0
3 3.5 4.0
4 3.0 2.5
5 3.5 4.0
6 2.5 3.0
7 2.0 3.5
8 1.5 3.0
9 1.5 2.5
10 2.0 2.5
11 3.0 2.5
12 2.0 2.5
678 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

TABLA 13.3.4 Signos de diferenciasdXi- siiÞen puntajes de higiene bucal de 12 sujetos


instruidosdXiÞy 12 sujetos emparejados no instruidosdYiÞ

Par 1 2 3 4 5 6 7 8 9 10 11 12

signo de puntuación - 0 - þ - - - - - - þ -
diferencias

H0: La mediana de las diferencias es cero½PAGðþÞ ¼PAGð-Þ. HA: La


mediana de las diferencias es negativa½PAGðþÞ <PAGð-Þ.
Dejaraser .05.
4. Estadística de prueba.La estadística de prueba es el número de signos más.

5. Distribución de la estadística de prueba.La distribución muestral dekes la


distribución binomial con parámetrosnortey .5 siH0es verdad.
6. Regla de decisión.RechazarH0siPAGdk-2j11; :5Þ - :05.
7. Cálculo de la estadística de prueba.Como se verá, el procedimiento aquí es idéntico
al procedimiento de muestra única una vez que se han obtenido las diferencias
de puntuación para cada par. Realizar las restas y observar los signos arroja los
resultados que se muestran en la Tabla 13.3.4.
La naturaleza de la hipótesis indica una prueba unilateral, de modo que
todas a¼ :05 está asociado con la región de rechazo, que consta de todos los
valores dek (dóndekes igual al número deþsignos) para los cuales la probabilidad
de obtener tantas o menos ventajas se debe únicamente al azar cuandoH0es
cierto es igual o menor que .05. Vemos en la tabla 13.3.4 que el experimento
arrojó un cero, dos más y nueve menos. Cuando eliminamos el cero, el tamaño
efectivo de la muestra esnorte¼11 con dos más y nueve menos. En otras
palabras, dado que un número "pequeño" de signos más provocará el rechazo
de la hipótesis nula, el valor de nuestro estadístico de prueba esk¼2.
8. Decisión estadística.Queremos saber la probabilidad de obtener no más de
dos positivos de 11 intentos cuando la hipótesis nula es verdadera. Como
hemos visto, la respuesta se obtiene evaluando la expresión binomial
adecuada. En este ejemplo encontramos

X2 k
PAGdk-2j11; :5¼ 11Ckd:5Þ ð:5Þ11-k
k¼0

Al consultar la Tabla B del Apéndice, encontramos que esta probabilidad es .0327.


Como .0327 es menor que .05, debemos rechazarH0.

9. Conclusión.Concluimos que la diferencia de medianas es negativa. Es


decir, concluimos que la instrucción fue beneficiosa.
10pagvalor.Para esta prueba,pag¼ :0327.
&

Prueba de signos con tablas "Mayor que"Como se ha demostrado, la


La prueba de signos se puede usar con una sola muestra o con dos muestras en las que cada miembro de
13.3 LA PRUEBA DEL SIGNO 679

una muestra se empareja con un miembro de la otra muestra para formar una muestra de pares
emparejados. También hemos visto que la hipótesis alternativa puede conducir a una prueba
unilateral o bilateral. En cualquier caso, nos concentramos en el signo que aparece con menos
frecuencia y calculamos la probabilidad de obtener ese número o menos de ese signo.
Usamos el signo que ocurre con menos frecuencia como nuestra estadística de prueba porque las
probabilidades binomiales en la Tabla B del Apéndice son probabilidades "menores o iguales a". Usando el
signo menos frecuente, podemos obtener la probabilidad que necesitamos directamente de la Tabla B sin
tener que hacer ninguna resta. Si las probabilidades en la Tabla B fueran probabilidades “mayores o iguales
a”, que a menudo se encuentran en las tablas de distribución binomial, usaríamos el signo que ocurre con
mayor frecuencia como nuestra estadística de prueba para aprovechar la conveniencia de obtener la
distribución binomial. probabilidad deseada directamente de la tabla sin tener que hacer ninguna resta. De
hecho, podríamos, en nuestros ejemplos presentes, usar el signo que ocurre con mayor frecuencia como
nuestra estadística de prueba, pero debido a que la Tabla B contiene probabilidades “menores que o iguales
a”, tendríamos que realizar una operación de resta para obtener la probabilidad deseada. Como ilustración,
considere el último ejemplo. Si usamos como nuestra estadística de prueba el signo que ocurre con mayor
frecuencia, es 9, el número de menos. La probabilidad deseada, entonces, es la probabilidad de nueve o más
menos, cuandonorte¼11 ypag¼ :5. Es decir, queremos

PAGdk¼9j11; :5Þ

Sin embargo, dado que la Tabla B contiene probabilidades “menores o iguales a”, debemos obtener
esta probabilidad por resta. Eso es,

PAGdk 9j11; :5¼1 -PAGdk-8j11; :5Þ


¼1 - :9673
¼ :0327

que es el resultado obtenido anteriormente.

Tamaño de la muestraVimos en el Capítulo 5 que cuando el tamaño de la muestra es grande y cuandopag


está cerca de .5, la distribución binomial puede aproximarse a la distribución normal. La regla empírica
utilizada fue que la aproximación normal es apropiada cuando ambosnotario públicoyn q son mayores que 5.
Cuandopag¼ :5, como se planteó como hipótesis en nuestros dos ejemplos, una muestra de tamaño 12
cumpliría la regla general. Siguiendo esta pauta, se podría usar la aproximación normal cuando se usa la
prueba de signos para probar la hipótesis nula de que la mediana o la diferencia de medianas es 0 ynortees
igual o mayor que 12. Dado que el procedimiento consiste en aproximar una distribución continua por una
distribución discreta, generalmente se usa la corrección de continuidad de .5. El estadístico de prueba
entonces es

dk:5Þ - :5norte
z¼ pffiffiffi (13.3.2)
:5norte

que se compara con el valor dezde la distribución normal estándar correspondiente


al nivel de significación elegido. En la Ecuación 13.3.2,kþ :5 se usa cuandok < n=2 y k
- :5 se usa cuandokn=2.
680 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Datos:

C1: 4 5 8 8 9 6 10 7 6 6

Caja de diálogo: Comando de sesión:

Estadística no paramétricos 1 muestra de letrero MTB > Prueba ST 5 C1; SUBC >
Alternativa 0.
TipoC1enVariables.ElegirMediana de pruebay tipo5en el cuadro de
texto. Hacer clicDE ACUERDO.

Producción:

Prueba de signos para la mediana: C1

Prueba de signos de la mediana 5.00 versus NE 5.000


N POR DEBAJO IGUAL POR ENCIMA DE P-VALOR
C1 MEDIANA 10118 0.0391 6.500

FIGURA 13.3.1Procedimiento y salida de MINITAB para el ejemplo 13.3.1.

Análisis informáticoMuchos paquetes de software de estadísticas realizarán la prueba de signos. Por


ejemplo, si usamos MINITAB para realizar la prueba del Ejemplo 13.3.1 en la que los datos se almacenan en la
Columna 1, el procedimiento y el resultado serían como se muestran en la Figura 13.3.1.

EJERCICIOS

13.3.1A una muestra aleatoria de 15 estudiantes de enfermería se le aplicó una prueba para medir su nivel de autoritarismo con
los siguientes resultados:

Alumno Autoritarismo Alumno Autoritarismo


Número Puntaje Número Puntaje

1 75 9 82
2 90 10 104
3 85 11 88
4 110 12 124
5 115 13 110
6 95 14 76
7 132 15 98
8 74

Pruebe al nivel de significancia de .05, la hipótesis nula de que la puntuación mediana para la población
muestreada es 100. Determine elpagvalor.
13.4 LA PRUEBA DE RANGO CON SIGNOS DE WILCOXON PARA LOCALIZACIÓN 681

13.3.2Determinar los efectos del jugo de toronja en la farmacocinética de la digoxina oral (un fármaco que a menudo se receta
para las enfermedades del corazón) fue el objetivo de un estudio realizado por Parker et al. (A-1). Siete voluntarios
sanos no fumadores participaron en el estudio. Los sujetos tomaron digoxina con agua durante 2 semanas,
sin digoxina durante 2 semanas y digoxina con jugo de toronja durante 2 semanas. La concentración máxima
promedio de digoxina en plasma (Cmax) cuando los sujetos tomaron digoxina con agua se proporciona en la primera
columna de la siguiente tabla. La segunda columna da la concentración de Cmax cuando los sujetos tomaron
digoxina con jugo de toronja. ¿Podemos concluir sobre la base de estos datos que la concentración de Cmax es
mayor cuando la digoxina se toma con jugo de toronja? Dejara¼ :5.

Cmáx
Sujeto H2O GFJ

1 2.34 3.03
2 2.46 3.46
3 1.87 1.97
4 3.09 3.81
5 5.59 3.07
6 4.05 2.62
Fuente: Datos proporcionados por cortesía
7 6.21 3.44 de Robert B. Parker, Pharm.D.

13.3.3Una muestra de 15 pacientes asmáticos participó en un experimento para estudiar el efecto de un nuevo
tratamiento sobre la función pulmonar. Entre las diversas medidas registradas se encuentran las de volumen
espiratorio forzado (litros) en 1 segundo (FEV1) antes y después de la aplicación del tratamiento. Los
resultados fueron los siguientes:

Sujeto Antes Después Sujeto Antes Después

1 1.69 1.69 9 2.58 2.44


2 2.77 2.22 10 1.84 4.17
3 1.00 3.07 11 1.89 2.42
4 1.66 3.35 12 1.91 2.94
5 3.00 3.00 13 1.75 3.04
6 . 85 2.74 14 2.46 4.62
7 1.42 3.61 15 2.35 4.42
8 2.82 5.14

Sobre la base de estos datos, ¿se puede concluir que el tratamiento es eficaz para aumentar el FEV1?1
¿nivel? Dejara¼ :05 y encuentra elpagvalor.

13.4 LA PRUEBA DE RANGO CON SIGNOS DE


WILCOXON PARA LOCALIZACIÓN

A veces deseamos probar una hipótesis nula sobre la media de una población, pero por alguna razón
tampocoznites un estadístico de prueba apropiado. Si tenemos una pequeña muestra.dn <30Þde una
población que se sabe que tiene una distribución no normal en términos generales, y el teorema del
límite central no es aplicable, lazSe descarta la estadística. Eltla estadística no es apropiada
682 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

porque la población muestreada no se aproxima lo suficiente a una distribución normal. Cuando nos
enfrentamos a tal situación, generalmente buscamos un procedimiento estadístico no paramétrico
apropiado. Como hemos visto, la prueba de signos puede usarse cuando nuestros datos consisten en
una sola muestra o cuando tenemos datos emparejados. Sin embargo, si los datos para el análisis se
miden al menos en una escala de intervalo, la prueba de signos puede no ser deseable porque no
haría un uso completo de la información contenida en los datos. Un procedimiento más apropiado
podría ser la prueba de rango con signo de Wilcoxon (1), que utiliza las magnitudes de las diferencias
entre las mediciones y un parámetro de ubicación hipotético en lugar de solo los signos de las
diferencias.

suposicionesLa prueba de ubicación de Wilcoxon se basa en las siguientes suposiciones sobre


los datos.

1.La muestra es aleatoria.


2.La variable es continua.
3.La población se distribuye simétricamente respecto a su media.metro.
4.La escala de medición es al menos de intervalo.

HipótesisLas siguientes son las hipótesis nulas (junto con sus alternativas) que pueden
probarse sobre alguna media poblacional desconocidametro0.

(a)H0:metro¼metro0 (b)H0:milímetro0 (C)H0:m-m0


HA:metro6¼metro0 HA:metro < metro0 HA:metro > metro0

Cuando usamos el procedimiento de Wilcoxon, realizamos los siguientes cálculos.

1.Restar la media hipotéticametro0de cada observaciónXi, para obtener

di¼Xi-metro0

Si algunaXies igual a la media, por lo quedi¼0, elimina esodide los cálculos y reducir
norterespectivamente.
2.Clasifica lo utilizabledidel más pequeño al más grande sin importar el signo dedi. Es decir,
considere sólo el valor absoluto de ladi, designadajdij,al momento de clasificarlos. Si dos o más
de losjdijson iguales, asigne a cada valor empatado la media de las posiciones de rango que
ocupan los valores empatados. Si, por ejemplo, los tres más pequeñosjdijson todos iguales,
colóquelos en las posiciones de rango 1, 2 y 3, pero asigne a cada uno un rango de d1þ2þ3Þ=3
¼2.
3.Asigne a cada rango el signo de ladique da ese rango.
4.EncontrarTþ, la suma de los rangos con signos positivos, yT-, la suma de los rangos con signos
negativos.

La estadística de pruebaEl estadístico de prueba de Wilcoxon esTþoT-, dependiendo de la


naturaleza de la hipótesis alternativa. Si la hipótesis nula es verdadera, es decir, si la media
poblacional verdadera es igual a la media hipotética, y si se cumplen los supuestos, la
probabilidad de observar una diferencia positivadi¼Xi-metro0de una magnitud dada es igual a
Traducido del inglés al español - www.onlinedoctranslator.com

13.4 LA PRUEBA DE RANGO CON SIGNOS DE WILCOXON PARA LOCALIZACIÓN 683

la probabilidad de observar una diferencia negativa de la misma magnitud. Entonces, en muestreo


repetido, cuando la hipótesis nula es verdadera y se cumplen los supuestos, el valor esperado deTþes
igual al valor esperado deT-. no esperamosTþyT-calculado a partir de una muestra dada para ser igual.
Sin embargo cuandoH0Es cierto, no esperamos una gran diferencia en sus valores. En consecuencia,
un valor suficientemente pequeño deTþo un valor suficientemente pequeño deT-provocará el rechazo
deH0.
Cuando la hipótesis alternativa es de dos colasdmetro6¼metro0Þ,ya sea un valor suficientemente
pequeño deTþo un valor suficientemente pequeño deT-hará que rechacemosH0:metro¼metro0. Entonces, el
estadístico de prueba esTþoT-, el que sea menor. Para simplificar la notación, llamamos al menor de los dost

CuandoH0:metro metro0es cierto, esperamos que nuestra muestra arroje un gran valor deTþ.
Por lo tanto, cuando la hipótesis alternativa unilateral establece que la verdadera media poblacional es
menor que la media hipotéticadmetro < metro0Þ,un valor suficientemente pequeño deTþprovocará el
rechazo deH0, yTþes el estadístico de prueba.
CuandoH0:m-m0es cierto, esperamos que nuestra muestra arroje un gran valor deT-. Por lo
tanto, para la alternativa unilateralHA:metro > metro0, un valor suficientemente pequeño deT-
provocará el rechazo deH0yT-es el estadístico de prueba.

Valores criticosLos valores críticos del estadístico de prueba de Wilcoxon se dan en la Tabla K del
Apéndice. Niveles de probabilidad exactos (PAG)se dan con cuatro decimales para todos los posibles
totales de rango (T)que producen un nivel de probabilidad diferente en el cuarto lugar decimal desde
.0001 hasta .5000. Los totales de rango (T)están tabulados para todos los tamaños de muestra de
norte¼5 a travésnorte¼30. Las siguientes son las reglas de decisión para las tres posibles hipótesis
alternativas:

(a)HA:metro6¼metro0. RechazarH0en elanivel de significancia si el calculadoTes menor o igual al


tabuladoTparanortey preseleccionadoun =2. Alternativamente, podemos ingresar la Tabla K
connortey nuestro valor calculado deTpara ver si el tabuladoPAGasociado con el calculadoTes
menor o igual a nuestro nivel de significación establecido. Si es así, podemos rechazarH0.

(b)HA:metro < metro0. RechazarH0en elanivel de significación siTþes menor o igual al tabuladoT
paranortey preseleccionadoa.
(C)HA:metro > metro0. RechazarH0en elanivel de significación siT-es menor o igual al tabuladoT
paranortey preseleccionadoa.

EJEMPLO 13.4.1
El gasto cardíaco (litros/minuto) se midió por termodilución en una muestra aleatoria simple de 15
pacientes quirúrgicos posquirúrgicos en posición lateral izquierda. Los resultados fueron los
siguientes:
4,91 4,10 6,74 7,27 7,42 7,50 6,56 4,64
5,98 3,14 3,23 5,80 6,17 5,39 5,77

Deseamos saber si podemos concluir sobre la base de estos datos que la media de la población es
diferente de 5.05.
684 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Solución:

1. Datos.Ver declaración de ejemplo.


2. Supuestos.Suponemos que se cumplen los requisitos para la aplicación de la
prueba de rangos con signo de Wilcoxon.
3. Hipótesis.
H0:metro¼5:05
HA:metro6¼5:05

Dejara¼0:05
4. Estadística de prueba.El estadístico de prueba seráTþoT-, el que sea menor.
Llamaremos al estadístico de pruebat
5. Distribución de la estadística de prueba.Los valores críticos de la estadística de
prueba se dan en la Tabla K del Apéndice.
6. Regla de decisión.vamos a rechazarH0si el valor calculado deTes menor o
igual a 25, el valor crítico paranorte¼15, yun =2¼ :0240, el valor más cercano
a .0250 en la Tabla K.
7. Cálculo de la estadística de prueba.El cálculo del estadístico de prueba se muestra
en la Tabla 13.4.1.
8. Decisión estadística.Como 34 es mayor que 25, no podemos
rechazarH0.
9. Conclusión.Concluimos que la media poblacional puede ser 5.05.
10pagvalor.De la Tabla K vemos quepag¼2d:0757Þ ¼ :1514.

TABLA 13.4.1 Cálculo del estadístico de prueba para el ejemplo 13.4.1

Cardíaco
Producción di¼Xi-5:05 rango dejdij Rango firmado dejdij

4.91 - :14 1 -1
4.10 - :95 7 -7
6.74 þ1:69 10 þ10
7.27 þ2:22 13 þ13
7.42 þ2:37 14 þ14
7.50 þ2:45 15 þ15
6.56 þ1:51 9 þ9
4.64 - :41 3 -3
5.98 þ:93 6 þ6
3.14 - 1:91 12 - 12
3.23 - 1:82 11 - 11
5.80 þ:75 5 þ5
6.17 þ1:12 8 þ8
5.39 þ:34 2 þ2
5.77 þ:72 4 þ4
Tþ¼86;T-¼34;T¼34
&
EJERCICIOS 685

Caja de diálogo: Comando de sesión:

Estadística no paramétricos Wilcoxon de 1 muestra MTB > WTEST 5.05 C1; SUBC >
Alternativa 0.
TipoC1enVariables.ElegirMediana de prueba.Escriba 5.05 en el cuadro de
texto. Hacer clicDE ACUERDO .

Producción:

Prueba de rango con signo de Wilcoxon: C1

PRUEBA DE MEDIANA 5.050 VERSUS MEDIANA NE 5.050

N PARA WILCOXON ESTIMADO


norte PRUEBA ESTADÍSTICA VALOR P MEDIANA
C1 15 15 86,0 0.148 5.747

FIGURA 13.4.1Procedimiento y salida de MINITAB para el ejemplo 13.4.1.

Prueba de rangos con signo de pares emparejados de WilcoxonLa prueba de Wilcoxon puede
usarse con datos pareados en circunstancias en las que no es apropiado usar las
comparaciones pareadastprueba descrita en el Capítulo 7. En tales casos obtener cada uno de
los Dakota del Norteivalores, la diferencia entre cada uno de losnortepares de medidas. si
dejamos metroD¼la media de una población de tales diferencias, podemos seguir el
procedimiento descrito anteriormente para probar cualquiera de las siguientes hipótesis nulas:
H0:metroD¼0,0,HyH 0:metro
0:metro D D-0.

Análisis informáticoMuchos paquetes de software estadístico realizarán la prueba de rango con


signo de Wilcoxon. Si, por ejemplo, los datos del Ejemplo 13.4.1 se almacenan en la Columna 1,
podríamos usar MINITAB para realizar la prueba como se muestra en la Figura 13.4.1.

EJERCICIOS

13.4.1Dieciséis animales de laboratorio fueron alimentados con una dieta especial desde el nacimiento hasta las 12 semanas de edad. su peso
las ganancias (en gramos) fueron las siguientes:

63 68 79 64
sesenta y cinco 63 64
sesenta y cinco 76 74 66 66 67 73 69 76

¿Podemos concluir a partir de estos datos que la dieta resulta en un aumento de peso promedio de menos de 70 gramos? Dejar
a¼ :05, y encuentre elpagvalor.

13.4.2Cantantes aficionados y profesionales fueron objeto de un estudio realizado por Grape et al. (A-2). Los investigadores
investigó los posibles efectos beneficiosos del canto sobre el bienestar durante una sola lección de canto. Una de las
variables de interés fue el cambio en el cortisol como resultado de la lección de señas. Utilice los datos de la siguiente
tabla para determinar si, en general, el cortisol (nmol/L) aumenta después de una lección de canto. Dejara¼ :05.
Encuentra elpagvalor.
686 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Sujeto 1 2 3 4 5 6 7 8

Antes 214 362 202 158 403 219 307 331


Después 232 276 224 412 562 203 340 313
Fuente: Datos proporcionados por cortesía de Christina Grape, MPH, enfermera licenciada.

13.4.3En un estudio realizado por Zuckerman y Heneghan (A-3), se midieron las tensiones hemodinámicas en sujetos sometidos
a colecistectomía laparoscópica. Una variable de resultado de interés fue el volumen diastólico final ventricular
(LVEDV) medido en mililitros. Una parte de los datos aparecen en la siguiente tabla. La línea de base se refiere a una
medición realizada 5 minutos después de la inducción de la anestesia, y el término "5 minutos" se refiere a una
medición realizada 5 minutos después de la línea de base.

VTSVI (ml)

Sujeto Base 5 minutos

1 51.7 49.3
2 79.0 72.0
3 78.7 87.3
4 80.3 88.3
5 72.0 103.3
6 85.0 94.0
7 69.7 94.7
8 71.3 46.3
9 55.7 71.7
Fuente: Datos proporcionados por
10 56.3 72.3 cortesía de RS Zuckerman, MD.

¿Podemos concluir, sobre la base de estos datos, que entre los sujetos sometidos a colecistectomía
laparoscópica, los niveles promedio de LVEDV cambian? Dejara¼ :01.

13.5 LA PRUEBA DE LA MEDIANA

Un procedimiento no paramétrico que se puede usar para probar la hipótesis nula de que se han
extraído dos muestras independientes de poblaciones con medianas iguales es la prueba de la
mediana. La prueba, atribuida principalmente a Mood (2) y Westenberg (3), también es discutida por
Brown y Mood (4).
Ilustramos el procedimiento mediante un ejemplo.

EJEMPLO 13.5.1
¿Los estudiantes de secundaria masculinos urbanos y rurales difieren con respecto a su nivel de salud
mental?

Solución:

1. Datos.Miembros de una muestra aleatoria de 12 estudiantes varones de una escuela


secundaria rural y una muestra aleatoria independiente de 16 estudiantes varones.
13.5 LA PRUEBA DE LA MEDIANA 687

TABLA 13.5.1 Nivel de puntajes de salud mental de niños de


secundaria

Escuela

Urbano Rural Urbano Rural

35 29 25 50
26 50 27 37
27 43 45 34
21 22 46 31
27 42 33
38 47 26
23 42 46
25 32 41

A los estudiantes de una escuela secundaria urbana se les aplicó una prueba para
medir su nivel de salud mental. Los resultados se muestran en la Tabla 13.5.1.
Para determinar si podemos concluir que existe una diferencia, realizamos una
prueba de hipótesis que hace uso de la prueba de la mediana. Supongamos que
elegimos un nivel de significancia de .05.

2. Supuestos.Los supuestos que subyacen a la prueba son (a) las muestras se


seleccionan de forma independiente y al azar de sus respectivas
poblaciones; (b) las poblaciones son de la misma forma, difiriendo sólo en la
ubicación; y (c) la variable de interés es continua. El nivel de medida debe
ser, al menos, ordinal. Las dos muestras no tienen que ser del mismo
tamaño.
3. Hipótesis.
H0:METROtu¼METROR

HA:METROtu6¼METROR

METROtues la puntuación media de la población muestreada de estudiantes urbanos, y


METRORes la puntuación media de la muestra de población de estudiantes rurales.
Dejara¼ :05.

4. Estadística de prueba.Como se mostrará en la discusión que sigue, el estadístico de


prueba esX2como se calcula, por ejemplo, mediante la Ecuación 12.4.1 para una tabla
de contingencia 2 2.

5. Distribución de la estadística de prueba.CuandoH0es cierto y se cumplen los


supuestos,X2se distribuye aproximadamente comoX2con 1 grado de libertad.
6. Regla de decisión.RechazarH0si el valor calculado deX2es 3:841 (ya que a
¼ :05).
7. Cálculo de la estadística de prueba.El primer paso para calcular la estadística
de prueba es calcular la mediana común de las dos muestras combinadas.
Esto se hace ordenando las observaciones en orden ascendente.
688 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

TABLA 13.5.2 Nivel de puntajes de salud mental de niños de


secundaria

Urbano Rural Total

Número de puntuaciones por encima de la mediana 6 8 14


Número de puntuaciones por debajo de la mediana 10 4 14

Total dieciséis 12 28

y, dado que el número total de observaciones es par, obtener la media


de los dos números del medio. Para nuestro ejemplo la mediana es d33
þ34Þ=2¼33:5.
Ahora determinamos para cada grupo el número de observaciones que
caen por encima y por debajo de la mediana común. Las frecuencias resultantes se
organizan en una tabla de 2 2. Para el presente ejemplo construimos la Tabla
13.5.2.
Si las dos muestras son, de hecho, de poblaciones con la misma mediana,
esperaríamos que aproximadamente la mitad de las puntuaciones en cada muestra
estén por encima de la mediana combinada y aproximadamente la mitad por debajo. Si
se cumplen las condiciones relativas al tamaño de la muestra y las frecuencias esperadas
para una tabla de contingencia 2 2 como se analiza en el Capítulo 12, se puede usar la
prueba de chi-cuadrado con 1 grado de libertad para probar la hipótesis nula de
medianas poblacionales iguales. Para nuestros ejemplos tenemos, por la fórmula 12.4.1,

28½ð6Þð4Þ - ð8Þð10Þ2
X2¼ ¼2:33
ddieciséisÞð12Þð14Þð14Þ

8. Decisión estadística.Como 2:33 < 3:841, el valor crítico deX2con a¼ :


05 y 1 grado de libertad, no podemos rechazar la hipótesis nula
sobre la base de estos datos.
9. Conclusión.Concluimos que las dos muestras pueden haber sido extraídas de
poblaciones con medianas iguales.
10pagvalor.Como 2:33 < 2:706, tenemospag > :10 &

Manejo de valores iguales a la medianaA veces uno o más observados


los valores serán exactamente iguales a la mediana común y, por lo tanto, no caerán ni por encima ni
por debajo de ella. Notemos que sinorte1þnorte2es impar, al menos un valor siempre será
exactamente igual a la mediana. Esto plantea la cuestión de qué hacer con observaciones de este tipo.
Una solución es eliminarlos del análisis sinorte1þnorte2es grande y solo hay unos pocos valores que
caen en la mediana combinada. O podemos dicotomizar las puntuaciones en las que superan la
mediana y las que no, en cuyo caso las observaciones que igualan la mediana se contarán en la
segunda categoría.

Extensión de prueba medianaLa prueba de la mediana se extiende lógicamente al caso en que se


desea probar la hipótesis nula de quek 3 muestras son de poblaciones con igual
medianas Para esta prueba un 2kLa tabla de contingencia se puede construir usando la
EJERCICIOS 689

Caja de diálogo: Comando de sesión:

Estadística no paramétricos Prueba de la mediana de Mood MTB > Estado de ánimo C1 C2.

TipoC1enRespuestayC2enFactor.Hacer clicDE ACUERDO.

Producción:

Prueba de la mediana del estado de ánimo: C1 frente a C2

Prueba de la mediana del estado de ánimo de C1

Chi cuadrado 2.33 df 1 pag 0.127

IC del 95,0 % individuales


C2 N< N > mediana Q3 Q1 -------- --------- --------- --------
1 10 6 27,0 15.0 (----------------------)
2 4 8 39.5 14.8 (-----------------------)
-------------------------------------
30.0 36,0 42.0
En general mediana 33.5

IC del 95,0 % para mediana (1) - mediana (2): ( 17,1,3,1)

FIGURA 13.5.1Procedimiento y salida de MINITAB para el ejemplo 13.5.1.

frecuencias que caen por encima y por debajo de la mediana calculada a partir de muestras combinadas. Si
se cumplen las condiciones en cuanto al tamaño de la muestra y las frecuencias esperadas,X2puede
calcularse y compararse con el valor críticoX2conk-1 grados de libertad.

Análisis informáticoLos cálculos de la prueba de la mediana se pueden realizar utilizando MINITAB.


Para ilustrar el uso de los datos del Ejemplo 13.5.1, primero almacenamos las mediciones en la
Columna 1 de MINITAB. En la Columna 2 de MINITAB almacenamos códigos que identifican las
observaciones en cuanto a si son para un sujeto urbano (1) o rural (2). El procedimiento y el resultado
de MINITAB se muestran en la figura 13.5.1.

EJERCICIOS

13.5.1Se revisaron quince registros de pacientes de cada uno de los dos hospitales y se les asignó una puntuación diseñada para medir el
nivel de atención. Las puntuaciones fueron las siguientes:

Hospital A: 99, 85, 73, 98, 83, 88, 99, 80, 74, 91, 80, 94, 94, 98, 80
Hospital B: 78, 74, 69, 79, 57, 78, 79, 68, 59, 91, 89, 55, 60, 55, 79
690 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

¿Concluiría, en el nivel de significancia de .05, que las dos medianas de población son diferentes?
Determina elpagvalor.

13.5.2Los siguientes valores de albúmina sérica se obtuvieron de 17 sujetos normales y 13 hospitalizados:

Albúmina sérica (g/100 ml) Albúmina sérica (g/100 ml)

Sujetos normales Sujetos hospitalizados Sujetos normales Sujetos hospitalizados

2.4 3.0 1.5 3.1 3.4 4.0 3,8 1,5


3.5 3.2 2.0 1.3 4.5 3.5 3.5
3.1 3.5 3.4 1.5 5.0 3.6
4,0 3,8 1.7 1.8 2.9
4.2 3.9 2.0 2.0

¿Concluiría con un nivel de significancia de .05 que las medianas de las dos poblaciones muestreadas son
diferentes? Determina elpagvalor.

13.6 LA PRUEBA DE MANN-WHITNEY

La prueba de la mediana discutida en la sección anterior no hace pleno uso de toda la información
presente en las dos muestras cuando la variable de interés se mide al menos en una escala ordinal.
Reducir el contenido de información de una observación a si cae o no por encima o por debajo de la
mediana común es un desperdicio de información. Si, para probar la hipótesis deseada, hay
disponible un procedimiento que hace uso de más información inherente a los datos, ese
procedimiento debe usarse si es posible. Un procedimiento no paramétrico de este tipo que a
menudo se puede usar en lugar de la prueba de la mediana es la prueba de Mann-Whitney (5), a veces
llamada prueba de Mann-Whitney-Wilcoxon. Dado que esta prueba se basa en los rangos de las
observaciones, utiliza más información que la prueba de la mediana.

suposicionesLos supuestos que subyacen a la prueba de Mann-Whitney son los siguientes:

1.Las dos muestras, de tamañonorteymetro,respectivamente, disponibles para el análisis se han


extraído de forma independiente y aleatoria de sus respectivas poblaciones.
2.La escala de medida es al menos ordinal.
3.La variable de interés es continua.
4.Si las poblaciones difieren en algo, difieren solo con respecto a sus medianas.

HipótesisCuando se cumplen estos supuestos, podemos probar la hipótesis nula de que las dos
poblaciones tienen medianas iguales frente a cualquiera de las tres alternativas posibles: (1) las
poblaciones no tienen medianas iguales (prueba bilateral), (2) la mediana de la población 1 es mayor
que la mediana de la población 2 (prueba unilateral), o (3) la mediana de la población 1 es menor que
la mediana de la población 2 (prueba unilateral). Si las dos poblaciones son simétricas, de modo que
dentro de cada población la media y la mediana sean iguales, las conclusiones a las que lleguemos
con respecto a las dos medianas de población también se aplicarán a las dos medias de población. El
siguiente ejemplo ilustra el uso de la prueba de Mann-Whitney.
13.6 LA PRUEBA DE MANN-WHITNEY 691

EJEMPLO 13.6.1
Un investigador diseñó un experimento para evaluar los efectos de la inhalación prolongada de óxido de
cadmio. Quince animales de laboratorio sirvieron como sujetos experimentales, mientras que 10 animales
similares sirvieron como controles. La variable de interés fue el nivel de hemoglobina después del
experimento. Los resultados se muestran en la Tabla 13.6.1. Deseamos saber si podemos concluir que la
inhalación prolongada de óxido de cadmio reduce el nivel de hemoglobina.

Solución:

1. Datos.Ver Tabla 13.6.1.


2. Supuestos.Suponemos que se cumplen los supuestos de la prueba de Mann-
Whitney.
3. Hipótesis.Las hipótesis nula y alternativa son las siguientes:

H0:METROX METROY

HA:METROX< MY

dóndeMETROXes la mediana de una población de animales expuestos a óxido de


cadmio yMETROYes la mediana de una población de animales no expuestos a la
sustancia. Supongamos que dejamosa¼ :05.

4. Estadística de prueba.Para calcular la estadística de prueba, combinamos las dos muestras y


clasificamos todas las observaciones de menor a mayor mientras hacemos un seguimiento de
la muestra a la que pertenece cada observación. A las observaciones empatadas se les asigna
un rango igual a la media de las posiciones de rango para las que están empatadas. Los
resultados de este paso se muestran en la Tabla 13.6.2.

TABLA 13.6.1 Determinaciones de hemoglobina


(gramos) para 25 animales de laboratorio

Animales expuestos (X) Animales no expuestos (Y)

14.4 17.4
14.2 16.2
13.8 17.1
16.5 17.5
14.1 15.0
16.6 16.0
15.9 16.9
15.6 15.0
14.1 16.3
15.3 16.8
15.7
16.7
13.7
15.3
14.0
692 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

TABLA 13.6.2 Datos originales y rangos, Ejemplo


13.6.1

X Rango Y Rango

13.7 1
13.8 2
14.0 3
14.1 4.5
14.1 4.5
14.2 6
14.4 7
15.0 8.5
15.0 8.5
15.3 10.5
15.3 10.5
15.6 12
15.7 13
15.9 14
16.0 15
16.2 dieciséis

16.3 17
16.5 18
16.6 19
16.7 20
16.8 21
16.9 22
17.1 23
17.4 24
17.5 25
_____
Total 145

La estadística de prueba es

nortednorteþ1Þ
T¼S - (13.6.1)
2
dóndenortees el numero de muestraXobservaciones ySes la suma de los
rangos asignados a las observaciones muestrales de la población deX
valores. La elección de qué valores de la muestra etiquetamosXes arbitrario
5. Distribución de la estadística de prueba.Los valores críticos de la distribución de la
estadística de prueba se dan en la Tabla L del Apéndice para varios niveles dea.

6. Regla de decisión.Si la mediana de laXla población es, de hecho, más pequeña que la
mediana de laYpoblación, como se especifica en la hipótesis alternativa, esperaríamos
(para tamaños de muestra iguales) la suma de los rangos asignados
13.6 LA PRUEBA DE MANN-WHITNEY 693

a las observaciones delXpoblación sea menor que la suma de los rangos


asignados a las observaciones de laYpoblación. El estadístico de prueba se
basa en este razonamiento de tal manera que un valor suficientemente
pequeño deTprovocará el rechazo deH0:METROX METROY.En general, para
pruebas unilaterales del tipo ilustrado aquí, la regla de decisión es:

Rechazar H0:METROX¼METROYsi la T calculada es menor que wa,dondeaes el


valor crítico de To obtenido ingresando la Tabla L del Apéndice con n, el
número de X observaciones; m, el número de Y observaciones; ya,el nivel de
significación elegido.

Si usamos el procedimiento de Mann-Whitney para probar

H0:METROX-MY

contra
HA:METROX> mY

valores suficientemente grandes deTcausará rechazo por lo que la regla de


decisión es:

Rechazar H0:METROX-MYsi T calculado es mayor que w1-a,donde


1-a¼nm- wa .

Para la situación de prueba bilateral con

H0:METROX¼METROY

HA:METROX6¼METROY

valores calculados deTque son lo suficientemente grandes o lo suficientemente


pequeños provocarán el rechazo deH0. Entonces, la regla de decisión para este caso es:

Rechazar H0:METROX¼METROYsi el valor calculado de T es menor que wun =2


o mayor que w1-dun =2Þdondeun =2es el valor crítico de T para n, m y un =2
dado en el Apéndice Tabla L, y w1-dun =2Þ¼nm - wun =2.

Para este ejemplo, la regla de decisión es:

Rechazar H0si el valor calculado de T es menor que 45, el valor crítico del estadístico de
prueba para n¼15;metro¼10,ya¼ :05que se encuentra en la tabla L.

Las regiones de rechazo para cada conjunto de hipótesis se muestran en la


Figura 13.6.1.
7. Cálculo de la estadística de prueba.Para nuestro ejemplo actual tenemos, como se
muestra en la Tabla 13.6.2,S¼145, por lo que

15d15þ1Þ
T¼145 - ¼25
2
694 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

FIGURA 13.6.1Regiones de rechazo de prueba de Mann-Whitney para tres conjuntos de hipótesis.

8. Decisión estadística.Cuando entramos en la Tabla L connorte¼15;metro¼10, y


a¼ :05, encontramos el valor crítico dewasea 45. Como 25 < 45, rechazamos
H0.
9. Conclusión.Concluimos queMETROXes más pequeña queMETROY. Esto lleva a la
conclusión de que la inhalación prolongada de óxido de cadmio reduce el nivel
de hemoglobina.
10pagvalor.Como 22 < 25 < 30, tenemos para esta prueba :005 >pag > :001.
&

Aproximación de muestra grandecuando ya seanorteometroes mayor que 20, no podemos usar


la tabla L del apéndice para obtener valores críticos para la prueba de Mann-Whitney. Cuando este es
el caso, podemos calcular

T - mn=2
z¼pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi (13.6.2)
Nuevo Méjicodnorteþmetroþ1jÞ=12

y compare el resultado, para determinar su importancia, con los valores críticos de la distribución normal
estándar.

Estadístico de Mann-Whitney y estadístico de WilcoxonComo se señaló


Al comienzo de esta sección, la prueba de Mann-Whitney a veces se denomina prueba
13.6 LA PRUEBA DE MANN-WHITNEY 695

Caja de diálogo: Comando de sesión:

Estadística no paramétricos Mann-Whitney BTT > Mann Whitney 95.0


C1 C2;
SUBC > Alternativa 1.
TipoC1enPrimera muestrayC2enSegunda Muestra. En
Alternativaelige menos que. Hacer clicDE ACUERDO.

Producción:

Prueba de Mann-Whitney e IC: C1, C2

C1 norte 15 15.300
Mediana
C2 norte 10 16.550
Mediana
Estimación puntual para ETA1 95,1 ETA2 es 1.300
Porcentaje de IC para ETA1 W 145,0 ETA2 es (2.300, 0.600)

Prueba de ETA1 ETA2 frente a ETA1 ETA2 es significativo en 0.0030


La prueba es significativa en 0.0030 (ajustada por empates)

FIGURA 13.6.2 Procedimiento y salida de MINITAB para el ejemplo 13.6.1.

rangos

y norte Rango medio Suma de rango

X 1.000000 15 9.67 146.00


2.000000 10 18.00 180.00
Total 25

Estadística de pruebab

X
U de Mann-Whitney 25.000
Wilcoxon W. 145.000
Z 2.775
asíncrono Sig. (2 colas) . 006
Sig exacto. [2*(Sig. de 1 cola)] . 004a

a. No corregido por empates


b. Variable de agrupación: y

FIGURA 13.6.3 Salida de SPSS para el ejemplo 13.6.1.


696 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Prueba de Mann-Whitney-Wilcoxon. De hecho, muchos paquetes de computadora dan el valor de prueba


tanto de la prueba de Mann-Whitney (U) como de la prueba de Wilcoxon (W). Estas dos pruebas son pruebas
algebraicamente equivalentes y están relacionadas por la siguiente igualdad cuando no hay empates en los
datos:

metrodmetroþ2norteþ1Þ
tuþW¼ (13.6.3)
2

Análisis informáticoMuchos paquetes de software estadístico realizarán la prueba de Mann-


Whitney. Con los datos de dos muestras almacenados en las Columnas 1 y 2, por ejemplo,
MINITAB realizará una prueba unilateral o bilateral. El procedimiento de MINITAB y el resultado
del ejemplo 13.6.1 se muestran en la figura 13.6.2.
El resultado de SPSS para el ejemplo 13.6.1 se muestra en la figura 13.6.3. Como vemos, esta salida
proporciona la prueba de Mann-Whitney, la prueba de Wilcoxon y la prueba de muestra grande.z
aproximación.

EJERCICIOS

13.6.1Cranor y Christensen (A-4) estudiaron a diabéticos asegurados por dos empleadores. Los sujetos del grupo 1 fueron
empleados por la ciudad de Asheville, Carolina del Norte, y los sujetos del grupo 2 fueron empleados por Mission–
Sistema de Salud de St. Joseph. Al comienzo del estudio, los investigadores realizaron la prueba de Mann-
Whitney para determinar si existía una diferencia significativa de peso entre los dos grupos de estudio. Los
datos se muestran en la siguiente tabla.

Libras de peso)

Grupo 1 Grupo 2

252 215 240 185 195 220


240 190 302 310 210 295
205 270 312 212 190 202
200 159 126 238 172 268
170 204 268 184 190 220
170 215 215 136 140 311
320 254 183 200 280 164
148 164 287 270 264 206
214 288 210 200 270 170
270 138 225 212 210 190
265 240 258 182 192
203 217 221 225 126
Fuente: Datos proporcionados por cortesía de Carole W. Carnor, Ph.D.

¿Podemos concluir, sobre la base de estos datos, que los pacientes de los dos grupos difieren significativamente con
respecto al peso? Dejara¼ :05.

13.6.2Uno de los propósitos de un estudio de Liu et al. (A-5) fue determinar los efectos de MRZ 2/579 (un antagonista del
receptor que se ha demostrado que proporciona actividad neuroprotectora in vivo e in vitro) en neurológicos
EJERCICIOS 697

déficit en ratas Sprague-Dawley. En el estudio, 10 ratas iban a recibir MRZ 2/579 y nueve ratas iban a recibir solución
salina regular. Antes del tratamiento, los investigadores estudiaron los niveles de gases en sangre en los dos grupos
de ratas. La siguiente tabla muestra la pO2niveles para los dos grupos.

Salino (mmHg) ZLM 2/579 (mmHg)

112.5 133.3
106.3 106.4
99.5 113.1
98.3 117.2
103.4 126.4
109.4 98.1
108.9 113.4
107.4 116.8
116.5

Fuente: Datos proporcionados por cortesía de Ludmila Belayev, MD

¿Podemos concluir, sobre la base de estos datos, que, en general, los sujetos que toman solución salina tienen, en promedio,
una pO más baja?2niveles al inicio? Dejara¼ :01.

13.6.3El propósito de un estudio realizado por investigadores de la Clínica Cleveland (Ohio) (A-6) fue determinar si el uso de
Flomax®redujo los efectos secundarios urinarios comúnmente experimentados por los pacientes después del
tratamiento con braquiterapia (implante permanente de semillas radiactivas) para el cáncer de próstata. La siguiente
tabla muestra las puntuaciones del índice de síntomas de la American Urological Association (AUA) para dos grupos
de sujetos después de 8 semanas de tratamiento. Cuanto mayor sea el índice AUA, más grave será la obstrucción e
irritación urinaria.

Índice AUA (Flomax®) Índice AUA (placebo)

1 5 11 1 6 12
1 5 11 1 6 12
2 6 11 2 6 13
2 6 11 2 6 14
2 7 12 2 6 17
2 7 12 3 7 18
3 7 13 3 8 19
3 7 14 3 8 20
3 8 dieciséis 3 9 23
4 8 dieciséis 4 9 23
4 8 18 4 10
4 8 21 4 10
4 9 31 5 11
4 9 5 11
4 10 5 12
Fuente: Datos proporcionados por cortesía de Chandana Reddy, MS

¿Podemos concluir, sobre la base de estos datos, que el índice AUA mediano en el Flomax®grupo difiere
significativamente de la mediana del índice AUA del grupo placebo? Dejara¼ :05.
698 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

13.7 PRUEBA DE BONDAD DE AJUSTE DE


KOLMOGOROV-SMIRNOV

Cuando se desea saber qué tan bien se ajusta la distribución de los datos muestrales a alguna distribución
teórica, una prueba conocida como prueba de bondad de ajuste de Kolmogorov-Smirnov proporciona una
alternativa a la prueba de bondad de ajuste de chi-cuadrado discutida en el Capítulo 12. La prueba recibe su
nombre de A. Kolmogorov y NV Smirnov, dos matemáticos rusos que introdujeron dos pruebas
estrechamente relacionadas en la década de 1930.
El trabajo de Kolmogorov (6) se ocupa del caso de una muestra como se discute aquí. El trabajo
de Smirnov (7) trata el caso de dos muestras cuyo interés se centra en contrastar la hipótesis de que
las distribuciones de las poblaciones biparentales son idénticas. La prueba para la primera situación
se conoce con frecuencia como la prueba de una muestra de Kolmogorov-Smirnov. La prueba para el
caso de dos muestras, comúnmente conocida como la prueba de dos muestras de Kolmogorov-
Smirnov, no se discutirá aquí.

La estadística de pruebaAl usar la prueba de bondad de ajuste de Kolmogorov-Smirnov, se


hace una comparación entre alguna función de distribución acumulada teórica,FT(X),y una
función de distribución acumulativa de muestra,FS(X).La muestra es una muestra aleatoria de
una población con función de distribución acumulada desconocidaF(x).Se recordará (Sección
4.2) que una función de distribución acumulativa da la probabilidad de queXes igual o menor
que un valor particular,X.Es decir, mediante la función de distribución acumulativa muestral, FS
(X),podemos estimarPAGdx-xÞ.Si existe un acuerdo estrecho entre las distribuciones
acumulativas teóricas y muestrales, la hipótesis de que la muestra se extrajo de la población
con la función de distribución acumulativa especificada,FT(X),esta apoyado. Sin embargo, si
existe una discrepancia demasiado grande entre las funciones de distribución acumulada
teórica y observada para atribuirla únicamente al azar, cuandoH0es verdadera, se rechaza la
hipótesis.
La diferencia entre la función de distribución acumulada teórica,FT(X),y la función de
distribución acumulada de la muestra,FS(X),se mide por la estadísticaD,¿Cuál es la mayor
distancia vertical entreFS(X)yFT(X).Cuando una prueba de dos caras es apropiada, es decir,
cuando las hipótesis son

H0:FdX¼FTdXÞ para todosXde -1aþ1

HA:FdXÞ 6¼FTdXÞ para al menos unoX

el estadístico de prueba es

D¼sorberjFSdXÞ -FTdXÞj (13.7.1)


X

que se lee, “Des igual al supremum (mayor), sobre todoX,del valor absoluto de la
diferenciaFSdXÞmenosFTdXÞ.”
Se rechaza la hipótesis nula en elanivel de significación si el valor calculado deDexcede el
valor que se muestra en el Apéndice Tabla M para 1 -a (bilateral) y el tamaño de la muestra
norte.
13.7 PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV-SMIRNOV 699

suposicionesLos supuestos que subyacen a la prueba de Kolmogorov-Smirnov incluyen los


siguientes:

1.La muestra es una muestra aleatoria.


2.La distribución hipotéticaFTdXÞes continuo
Cuando valores deDse basan en una distribución teórica discreta, la prueba es conservadora.
Cuando la prueba se utiliza con datos discretos, entonces, el investigador debe tener en cuenta que la
verdadera probabilidad de cometer un error tipo I es como máximo igual aa,el nivel de significación
indicado. La prueba también es conservadora si es necesario estimar uno o más parámetros a partir
de datos de muestra.

EJEMPLO 13.7.1
En la tabla 13.7.1 se muestran las determinaciones de glucosa en sangre en ayunas realizadas en 36 varones
adultos no obesos, aparentemente sanos. Deseamos saber si podemos concluir que estos datos no son de
una población distribuida normalmente con una media de 80 y una desviación estándar de 6.

Solución:

1. Datos.Ver Tabla 13.7.1.


2. Supuestos.La muestra disponible es una muestra aleatoria simple de una
distribución de población continua.
3. Hipótesis.Las hipótesis apropiadas son
H0:FdX¼FTdXÞ HA: para todosXde -1aþ1 para
FdXÞ 6¼FTdXÞ al menos unoX

Dejara¼ :05.
4. Estadística de prueba.Ver Ecuación 13.7.1.
5. Distribución de la estadística de prueba.Valores críticos del estadístico de prueba para
valores seleccionados dease dan en el Apéndice Tabla M.

6. Regla de decisión.RechazarH0si el valor calculado deDexcede .221, el


valor crítico deDparanorte¼36 ya¼ :05.
7. Cálculo de la estadística de prueba.Nuestro primer paso es calcular los valores deFSdXÞ como se
muestra en la Tabla 13.7.2.

TABLA 13.7.1 Valores de glucosa en sangre en ayunas


(mg/100 ml) para 36 varones adultos no obesos,
aparentemente sanos

75 92 80 80 84 72
84 77 81 77 75 81
80 92 72 77 78 76
77 86 77 92 80 78
68 78 92 68 80 81
87 76 80 87 77 86
700 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

TABLA 13.7.2 Valores deFSdXÞpara el


ejemplo 13.7.1

Acumulativo
X Frecuencia Frecuencia FSdXÞ

68 2 2 . 0556
72 2 4 . 1111
75 2 6 . 1667
76 2 8 . 2222
77 6 14 . 3889
78 3 17 . 4722
80 6 23 . 6389
81 3 26 . 7222
84 2 28 . 7778
86 2 30 . 8333
87 2 32 . 8889
92 4 36 1.0000
36

Cada valor deFSdXÞse obtiene dividiendo la frecuencia acumulada


correspondiente por el tamaño de la muestra. Por ejemplo, el primer valor
de FSdX¼2=36¼ :0556.
Obtenemos valores deFTdXÞconvirtiendo primero cada valor observado
deXa un valor de la variable normal estándar,z.A partir de la Tabla D del
Apéndice, encontramos el área entre -1yz.A partir de estas áreas podemos
calcular valores deFTdXÞ.El procedimiento, que es similar al utilizado para
obtener las frecuencias relativas esperadas en la prueba de bondad de
ajuste de chi-cuadrado, se resume en la tabla 13.7.3.

TABLA 13.7.3 Pasos en el Cálculo deFTdXÞ


para el ejemplo 13.7.1

X z¼ ðX -80Þ=6 FTdXÞ

68 - 2:00 . 0228
72 - 1:33 . 0918
75 - :83 . 2033
76 - :67 . 2514
77 - :50 . 3085
78 - :33 . 3707
80 . 00 . 5000
81 . 17 . 5675
84 . 67 . 7486
86 1.00 . 8413
87 1.17 . 8790
92 2.00 . 9772
13.7 PRUEBA DE BONDAD DE AJUSTE DE KOLMOGOROV-SMIRNOV 701

1.00
. 90

Frecuencia relativa acumulada


. 80
. 70
. 60
. 50
. 40
. 30
. 20
. 10

68 70 72 74 76 78 80 82 84 86 88 90 92 94

FIGURA 13.7.1FSdXÞyFTdXÞpara el ejemplo 13.7.1.

La estadística de pruebaDpuede calcularse algebraicamente, o puede


determinarse gráficamente midiendo la distancia vertical más grande entre
las curvas deFSdXÞyFTdXÞen un gráfico. Las gráficas de las dos
distribuciones se muestran en la Figura 13.7.1.
Examen de los gráficos deFSdXÞyFTdXÞrevela que :16¼ ð:72
D - :56Þ.Ahora calculemos el valor deDálgebra-
calladamente Los posibles valores dejFSdXÞ -FTdXÞjse muestran en la Tabla
13.7.4. Esta tabla muestra que el valor exacto deDes .1547.
8. Decisión estadística.La referencia a la Tabla M revela que un calculadoDde
. 1547 no es significativo en ningún nivel razonable. Por lo tanto, no estamos
dispuestos a rechazarH0.
9. Conclusión.La muestra puede haber venido de la distribución especificada.
10pagvalor.Como tenemos una prueba de dos caras, y como :1547 < :174,
tenemospag > :20

TABLA 13.7.4 Cálculo dejFsdXÞ -FTdXÞj para el ejemplo


13.7.1

X FsdXÞ FTdXÞ jFsdXÞ -FTdXÞj

68 . 0556 . 0228 . 0328


72 . 1111 . 0918 . 0193
75 . 1667 . 2033 . 0366
76 . 2222 . 2514 . 0292
77 . 3889 . 3085 . 0804
78 . 4722 . 3707 . 1015
80 . 6389 . 5000 . 1389
81 . 7222 . 5675 . 1547
84 . 7778 . 7486 . 0292
86 . 8333 . 8413 . 0080
87 . 8889 . 8790 . 0099
92 1.0000 . 9772 . 0228
&
702 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

FIGURA 13.7.2Salida de StatXact para el ejemplo 13.7.1

StatXact se utiliza a menudo para el análisis estadístico no paramétrico. Este programa de


software en particular tiene un módulo no paramétrico que contiene casi todas las pruebas no
paramétricas de uso común y también muchos procedimientos menos comunes, pero útiles. El
análisis por computadora usando StatXact para los datos del ejemplo 13.7.1 se muestra en la figura
13.7.2. Tenga en cuenta que proporciona la estadística de prueba deD¼0:156 y los dos lados exactos
pagvalor de .3447.

Una precauciónEl lector debe saber que al determinar el valor deD, no siempre es
suficiente calcular y elegir entre los posibles valores dejFSdXÞ -FTdXÞj. La mayor distancia
vertical entre FSdXÞy FTdXÞpuede no ocurrir en un valor observado, x, sino en algún otro
valor de X.Tal situación se ilustra en la figura 13.7.3. Vemos que si sólo los valores dejFSdX
Þ -FTdXÞjen los extremos izquierdos de las barras horizontales, calcularíamos
incorrectamenteDcomoj:2 - :4j ¼ :2. Sin embargo, uno puede ver al examinar el gráfico
que la distancia vertical más grande entreFSdXÞyFTdXÞocurre en el extremo derecho de la
barra horizontal que se origina en el punto correspondiente aX¼ :4, y el valor correcto de
Desj:5 - :2j ¼ :3.
Se puede determinar el valor correcto deDalgebraicamente por cálculo, además de
las diferenciasjFSdXÞ -FTdXÞj,las diferenciasjFSdXi-1Þ -FTdXiÞjpara todos los valores de i¼1;
2; . . . ;rþ1, donder¼el número de valores diferentes deXyFSdX0¼0. El valor correcto de la
estadística de prueba será entonces

D¼máximoFmáximo½jFSdXiÞ -FTdXiÞj; jFSdXi-1Þ -FTdXiÞjg (13.7.2)


1-Ir
EJERCICIOS 703

1.0

.9

.8

Frecuencia relativa acumulada


.7

.6

.5

.4

.3

.2

.1

.2 .4 .5 .8 1.0

FIGURA 13.7.3 Gráfico de datos ficticios que muestra el cálculo correcto deD.

Ventajas y desventajasLos siguientes son algunos puntos importantes de comparación


entre las pruebas de bondad de ajuste de Kolmogorov-Smirnov y chi-cuadrado.

1.La prueba de Kolmogorov-Smirnov no requiere que las observaciones se agrupen como en el


caso de la prueba de chi-cuadrado. La consecuencia de esta diferencia es que la prueba de
Kolmogorov-Smirnov utiliza toda la información presente en un conjunto de datos.
2.La prueba de Kolmogorov-Smirnov se puede utilizar con muestras de cualquier tamaño. Se recordará
que se requieren ciertos tamaños de muestra mínimos para el uso de la prueba de chi-cuadrado.

3.Como se ha señalado, la prueba de Kolmogorov-Smirnov no es aplicable cuando los parámetros


deben estimarse a partir de la muestra. La prueba de chi-cuadrado se puede utilizar en estas
situaciones reduciendo los grados de libertad en 1 para cada parámetro estimado.
4.Ya se ha mencionado el problema de la suposición de una distribución
teórica continua.

EJERCICIOS

13.7.1Los pesos en la autopsia de los cerebros de 25 adultos que padecían cierta enfermedad fueron los siguientes:

Peso del cerebro (gramos)

859 1073 1041 1166 1117


962 1051 1064 1141 1202
973 1001 1016 1168 1255
904 1012 1002 1146 1233
920 1039 1086 1140 1348
704 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

¿Se puede concluir a partir de estos datos que la población muestreada no se distribuye normalmente con una media
de 1050 y una desviación estándar de 50? Determina elpagvalor para esta prueba.

13.7.2Los coeficientes intelectuales de una muestra de 30 adolescentes detenidos por abuso de drogas en una determinada jurisdicción metropolitana fueron los

siguientes:

CI

95 100 91 106 109 110


98 104 97 100 107 119
92 106 103 106 105 112
101 91 105 102 101 110
101 95 102 104 107 118

¿Proporcionan estos datos evidencia suficiente de que la muestra de población de puntajes de CI no se distribuye
normalmente con una media de 105 y una desviación estándar de 10? Determina elpagvalor.

13.7.3Para una muestra de sujetos aparentemente normales que sirvieron como controles en un experimento, se
registraron las siguientes lecturas de presión arterial sistólica al comienzo del experimento:

162 177 151 167


130 154 179 146
147 157 141 157
153 157 134 143
141 137 151 161

¿Se puede concluir sobre la base de estos datos que la población de presiones arteriales de la
que se extrajo la muestra no se distribuye normalmente conmetro¼150 ys¼12? Determina el
pagvalor.

13.8 EL ANÁLISIS UNIDIRECCIONAL DE LA


VARIANZA POR RANGO DE KRUSKAL-WALLIS

En el Capítulo 8 analizamos cómo se puede usar el análisis de varianza de una vía para probar la
hipótesis nula de que varias medias poblacionales son iguales. Cuando no se cumplen los supuestos
que subyacen a esta técnica, es decir, cuando las poblaciones de las que se extraen las muestras no se
distribuyen normalmente con varianzas iguales, o cuando los datos para el análisis consisten
únicamente en rangos, una alternativa no paramétrica al análisis unidireccional de varianza se puede
utilizar para probar la hipótesis de parámetros de ubicación iguales. Como se señaló en la Sección
13.5, la prueba de la mediana puede extenderse para acomodar la situación que involucra más de dos
muestras. Sin embargo, una deficiencia de esta prueba es el hecho de que utiliza solo una pequeña
cantidad de la información disponible. La prueba utiliza solo información sobre si las observaciones
están o no por encima o por debajo de un solo número, la mediana de las muestras combinadas. La
prueba no utiliza directamente medidas de cantidad conocida. Hay disponibles varios análogos no
paramétricos del análisis de varianza que utilizan más información al tener en cuenta la magnitud de
13.8 EL ANÁLISIS UNIDIRECCIONAL DE LA VARIANZA POR RANGO DE KRUSKAL-WALLIS 705

cada observación relativa a la magnitud de cualquier otra observación. Quizás el más conocido
de estos procedimientos es el análisis de varianza por rangos de una vía de Kruskal-Wallis (8).

El procedimiento de Kruskal-WallisLa aplicación de la prueba implica los


siguientes pasos.
1.Elnorte1;norte2; . . . ;nortekobservaciones de laklas muestras se combinan en una sola serie
de tamañonortey ordenados en orden de magnitud de menor a mayor. Luego, las
observaciones se reemplazan por rangos desde 1, que se asigna a la observación más
pequeña, hastanorte,que se asigna a la observación más grande. Cuando dos o más
observaciones tienen el mismo valor, a cada observación se le asigna la media de los
rangos en los que está empatada.
2.Los rangos asignados a las observaciones en cada uno de losklos grupos se agregan por separado para dark
sumas de rango.

3.La estadística de prueba

12 Xk R2
H¼ j-3dnorteþ1Þ (13.8.1)
nortednorteþ1Þ nortej
j¼1

se calcula En la Ecuación 13.8.1,

k¼el número de muestras


nortej¼el número de observaciones en eljelmuestra f¼el
número de observaciones en todas las muestras combinadas Rj
¼la suma de los rangos en eljelmuestra

4.Cuando hay tres muestras y cinco o menos observaciones en cada muestra, la


importancia de la calculadaHse determina consultando la Tabla N del Apéndice.
Cuando hay más de cinco observaciones en una o más de las muestras,Hse
compara con los valores tabulados deX2conk-1 grados de libertad.

EJEMPLO 13.8.1
En un estudio de los efectos pulmonares en cobayos, Lacroix et al. (A-7) expuso cobayos
sensibilizados con ovoalbúmina (OA) al aire normal, benzaldehído o acetaldehído. Al final de la
exposición, los cobayos fueron anestesiados y las respuestas alérgicas fueron evaluadas en
lavado broncoalveolar (BAL). Una de las variables de resultado examinadas fue el recuento de
células eosinófilas, un tipo de glóbulo blanco que puede aumentar con las alergias. La tabla
13.8.1 proporciona el recuento de células de eosinófilos 106para los tres grupos de tratamiento.

¿Podemos concluir que las tres poblaciones representadas por las tres muestras difieren con respecto
al recuento de células de eosinófilos? Podemos concluir así si podemos rechazar la hipótesis nula de que las
tres poblaciones no difieren en el recuento de células de eosinófilos.
706 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

TABLA 13.8.1 Recuento de eosinófilos para


cobayos sensibilizados con ovoalbúmina

Recuento de células de eosinófilosd106Þ

Aire Benzaldehído acetaldehído

12.22 3.68 54.36


28.44 4.05 27.87
28.13 6.47 66.81
38.69 21.12 46.27
54.91 3.33 30.19

Fuente: Datos proporcionados por cortesía de G. Lacroix.

Solución:

1. Datos.Ver Tabla 13.8.1.


2. Supuestos.Las muestras son muestras aleatorias independientes de sus
respectivas poblaciones. La escala de medida empleada es al menos ordinal.
Las distribuciones de los valores en las poblaciones muestreadas son
idénticas excepto por la posibilidad de que una o más de las poblaciones
estén compuestas de valores que tiendan a ser mayores que los de las otras
poblaciones.
3. Hipótesis.
H0: Los núcleos de población son todos iguales.

HA: Al menos una de las poblaciones tiende a exhibir valores más grandes
que al menos una de las otras poblaciones.
Dejara¼ :01.
4. Estadística de prueba.Ver Ecuación 13.8.1.
5. Distribución de la estadística de prueba.Valores críticos deHpara varios tamaños de
muestra yalos niveles se dan en el Apéndice Tabla N.
6. Regla de decisión.La hipótesis nula será rechazada si el valor calculado deHes
tan grande que la probabilidad de obtener un valor tan grande o mayor
cuandoH0es cierto es igual o menor que el nivel de significación elegido,a.

7. Cálculo de la estadística de prueba.Cuando las tres muestras se combinan en una sola


serie y se clasifican, se puede construir la tabla de rangos que se muestra en la Tabla
13.8.2.
La hipótesis nula implica que las observaciones en las tres muestras
constituyen una sola muestra de tamaño 15 de una sola población. Si esto
es cierto, esperaríamos que los rangos estuvieran bien distribuidos entre
los tres grupos. En consecuencia, esperaríamos que la suma total de rangos
se dividiera entre los tres grupos en proporción al tamaño del grupo.
13.8 EL ANÁLISIS UNIDIRECCIONAL DE LA VARIANZA POR RANGO DE KRUSKAL-WALLIS 707

TABLA 13.8.2 Los Datos de la Tabla 13.8.1


Reemplazados por Rangos

Aire Benzaldehído acetaldehído

5 2 13
9 3 7
8 4 15
11 6 12
14 1 10

R1¼47 R2¼dieciséis R3¼57

Las desviaciones de estas condiciones se reflejan en la magnitud de las


estadísticas de prueba.h
De los datos de la Tabla 13.8.2 y la Ecuación 13.8.1, obtenemos

" #
12 d47Þ2 ddieciséisÞ2 d57Þ2
H¼ þ þ - 3d15þ1¼9:14
15ddieciséisÞ 5 5 5

8. Decisión estadística.La tabla N muestra que cuando elnortejson 5, 5 y 5, la


probabilidad de obtener un valor deH¼9:14 es menos que .009. La hipótesis
nula se puede rechazar en el nivel de significancia de .01.
9. Conclusión.Llegamos a la conclusión de que existe una diferencia en el recuento
medio de células de eosinófilos entre las tres poblaciones.
10pagvalor.Para esta prueba,pag < :009. &

CorbatasCuando ocurren empates entre las observaciones, podemos ajustar el valor deHal
dividirlo por

PAG
T
1- (13.8.2)
norte3-norte

dóndeT¼t3-t.La cartatse utiliza para designar el número de observaciones empatadas en un grupo de valores
empatados. En nuestro ejemplo no hay grupos de valores empatados pero, en general, puede haber varios
grupos de valores empatados dando como resultado varios valores det
El efecto del ajuste por empates suele ser insignificante. Tenga en cuenta también que el
efecto del ajuste es aumentarH,de modo que si no se ajustaHes significativo al nivel elegido, no
es necesario aplicar el ajuste.

Más de tres muestras/Muestras grandesAhora vamos a ilustrar el


procedimiento cuando hay más de tres muestras y al menos una de lasnortejes mayor
que 5.
708 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

TABLA 13.8.3 Valor Neto Contable de Equipo por Cama por Tipo de Hospital

Tipo Hospital

A B C D mi

$1735(11) $5260(35) $2790(20) $3475(26) $6090(40)


1520(2) 4455(28) 2400(12) 3115(22) 6000(38)
1476(1) 4480(29) 2655(16) 3050(21) 5894(37)
1688(7) 4325(27) 2500(13) 3125(23) 5705(36)
1702(10) 5075(32) 2755(19) 3275(24) 6050(39)
2667(17) 5225(34) 2592(14) 3300(25) 6150(41)
1575(4) 4613(30) 2601(15) 2730(18) 5110(33)
1602(5) 4887(31) 1648(6)
1530(3) 1700(9)
1698(8)

R1¼68 R2¼246 R3¼124 R4¼159 R5¼264

EJEMPLO 13.8.2
La tabla 13.8.3 muestra el valor contable neto del capital de equipo por cama para una muestra de
hospitales de cada uno de los cinco tipos de hospitales. Deseamos determinar, mediante la prueba de
Kruskal-Wallis, si podemos concluir que el valor contable neto promedio del capital de equipo por
cama difiere entre los cinco tipos de hospitales. Los rangos de los 41 valores, junto con la suma de
rangos para cada muestra, se muestran en la tabla.

Solución: De las sumas de los rangos calculamos

" #
12 d68Þ2 d246Þ2 d124Þ2 d159Þ2 d264Þ2
H¼ þ þ þ þ - 3d41þ1Þ
41d41þ1Þ 10 8 9 7 7
¼36:39

Referencia a la Tabla F del Apéndice conk-1¼4 grados de libertad indica que


la probabilidad de obtener un valor deHtan grande como o más grande que
36.39, debido solo al azar, cuando no hay diferencia entre las poblaciones,
es menor que .005. Concluimos, entonces, que existe diferencia entre las
cinco poblaciones con respecto al valor promedio de la variable de interés.
&

Análisis informáticoEl paquete de software MINITAB calcula el estadístico de prueba de Kruskal-


Wallis y proporciona información adicional. Después de ingresar los recuentos de eosinófilos en la
Tabla 13.8.1 en la Columna 1 y los códigos de grupo en la Columna 2, el procedimiento MINITAB y el
resultado son como se muestra en la Figura 13.8.1.
EJERCICIOS 709

Datos:
C1: 12,22 28,44 28,13 38,69 54,91 3,68 4,05 6,47 21,12 3,33 54,36 27,87 66,81 46,27 30,19 C2: 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3

Caja de diálogo: Comando de sesión:

Estadística no paramétricos Kruskal-Wallis BTT > Kruskal-Wallis C1 C2.


TipoC1enRespuestayC2enFactor.Hacer clicDE ACUERDO.

Producción:

Prueba de Kruskal-Wallis: C1 frente a C2

Prueba de Kruskal-Wallis en C1

C2 norte Mediana Clasificación promedio Z


1 5 28.440 9.4 0.86
2 5 4.050 3.2 - 2.94
3 5 46.270 11.4 2.08
En general 15 8.0

H = 9,14 DF = 2 P = 0,010

FIGURA 13.8.1Procedimiento MINITAB y salida, prueba de Kruskal-Wallis de datos de recuento de eosinófilos en la


Tabla 13.8.1.

EJERCICIOS

Para los siguientes ejercicios, realice la prueba al nivel de significación indicado y determine el pag
valor.

13.8.1En un estudio de sujetos sanos agrupados por edad (más jóvenes: 19 a 50 años, personas mayores: 65 a 75 años
y Longeval: 85 a 102 años), Herrmann et al. (A-8) midieron sus niveles de vitamina B-12 (ng/L). Todos los
sujetos de edad avanzada vivían en casa y podían realizar actividades normales del día a día. La siguiente
tabla muestra los niveles de vitamina B-12 para 50 sujetos del grupo joven, 92 adultos mayores y 90 sujetos
del grupo longevo.

Joven (19–50 años) Mayor (65–75 años) Longevidad (85–102 años)

230 241 319 371 566 170 148 149 631 198
477 442 190 460 290 542 1941 409 305 321
561 491 461 440 271 282 128 229 393 2772
347 279 163 520 308 194 145 183 282 428
566 334 377 256 440 445 174 193 273 259
260 247 190 335 238 921 495 161 157 111
(Continuado)
710 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Joven (19–50 años) Mayor (65–75 años) Longevidad (85–102 años)

300 314 375 137 525 1192 460 400 1270 262
230 254 229 452 298 748 548 348 252 161
215 419 193 437 153 187 198 175 262 1113
260 335 294 236 323 350 165 540 381 409
349 455 740 432 205 1365 226 293 162 378
315 297 194 411 248 232 557 196 340 203
257 456 780 268 371 509 166 632 370 221
536 668 245 703 668 357 218 438 483 917
582 240 258 282 197 201 186 368 222 244
293 320 419 290 260 177 346 262 277
569 562 372 286 198 872 239 190 226
325 360 413 143 336 240 241 203
275 357 685 310 421 136 195 369
172 609 136 352 712 359 220 162
2000 740 441 262 461 715 164 95
240 430 423 404 631 252 279 178
235 645 617 380 1247 414 297 530
284 395 985 322 1033 372 474 334
883 302 170 340 285 236 375 521
Fuente: Datos proporcionados por cortesía de W. Herrmann y H. Schorr.

¿Podemos concluir, sobre la base de estos datos, que las poblaciones representadas por estas muestras difieren con
respecto a los niveles de vitamina B-12? Dejara¼ :01.

13.8.2Los siguientes son cargos para pacientes ambulatoriosð-$100Þrealizado a pacientes para determinado procedimiento
quirúrgico por muestras de hospitales ubicados en tres diferentes zonas del país:

Área

I Yo tercero

$80.75 $58.63 $84.21


78.15 72.70 101.76
85.40 64.20 107.74
71.94 62.50 115.30
82.05 63.24 126.15

¿Podemos concluir con un nivel de significancia de .05 que las tres áreas difieren con respecto a los cargos?

13.8.3Un estudio de niños pequeños realizado por Flexer et al. (A-9) publicado en elDiario de audienciaexamina la
efectividad de un campo de sonido FM al enseñar fonética a los niños. En el estudio, los niños en un salón de
clases sin entrenamiento en conciencia fonológica o fonémica (control) se compararon con una clase con
conciencia fonológica y fonémica (PPA) y con una clase que utilizó entrenamiento en conciencia fonológica y
fonémica y el campo de sonido FM (PPA/ FM). Un total de 53 estudiantes de tres aulas preescolares
separadas participaron en este estudio. A los estudiantes se les dio una medida de conciencia fonémica en
preescolar y luego al final del primer semestre de jardín de infantes. Los puntajes de mejora se enumeran en
la siguiente tabla medidos por la prueba de segmentación fonémica de Yopp-Singer.
EJERCICIOS 711

Mejora (Control) PPA de mejora Mejora PPA/FM

0 1 2 1 19
-1 1 3 3 20
0 2 15 7 21
1 2 18 9 21
4 3 19 11 22
5 6 20 17 22
9 7 5 17 15
9 8 17 17
13 9 18 17
18 18 18 19
0 20 19 22
0 19
Fuente: Datos proporcionados por cortesía de John P. Holcomb, Jr., Ph.D.

Pruebe si hay una diferencia significativa entre los tres grupos. Dejara¼ :05.

13.8.4Consulte el ejemplo 13.8.1. Otra variable de interés para Lacroix et al. (A-7) fue el número de
células alveolares en tres grupos de sujetos expuestos al aire, benzaldehído o acetaldehído. La
siguiente tabla da la información para seis cobayos en cada uno de los tres grupos de tratamiento.

Número de células alveolaresd 106Þ

Aire Benzaldehído acetaldehído

0,55 0.81 0,65


0.48 0.56 13.69
7.8 1.11 17.11
8.72 0.74 7.43
0,65 0.77 5.48
1.51 0.83 0.99 Fuente: Datos proporcionados por
0,55 0.81 0,65 cortesía de G. Lacroix.

¿Podemos concluir, sobre la base de estos datos, que el número de células alveolares en cobayos sensibilizados con
ovoalbúmina difiere según el tipo de exposición? Dejara¼ :05.

13.8.5La siguiente tabla muestra los niveles de residuos de pesticidas (ppb) en muestras de sangre de cuatro poblaciones de
sujetos humanos. Use la prueba de Kruskal-Wallis para probar con un nivel de significancia de .05 la hipótesis nula de
que no hay diferencia entre las poblaciones con respecto al nivel promedio de residuos de pesticidas.

Población Población

A B C D A B C D

10 4 15 7 44 11 9 4
37 35 5 11 12 7 11 5
12 32 10 10 15 32 9 2
(Continuado)
712 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Población Población

A B C D A B C D

31 19 12 8 42 17 14 6
11 33 6 2 23 8 15 3
9 18 6 5

13.8.6Hepáticogramo-Se midió la actividad de glutamil transpeptidasa (GGTP) en 22 pacientes sometidos a biopsia


hepática percutánea. Los resultados fueron los siguientes:

Sujeto Diagnóstico Nivel hepático de GGTP

1 Hígado normal 27.7


2 Cirrosis biliar primaria 45,9
3 Enfermedad hepática 85.3
4 alcohólica Cirrosis biliar 39.0
5 primaria Hígado normal 25.8
6 hepatitis persistente 39.6
7 Hepatitis crónica activa 41.8
8 Enfermedad hepática alcohólica 64.1
9 Hepatitis persistente 41.1
10 hepatitis persistente 35.3
11 Enfermedad hepática 71.5
12 alcohólica Cirrosis biliar 40,9
13 primaria Hígado normal 38.1
14 Cirrosis biliar primaria Cirrosis 40.4
15 biliar primaria Enfermedad 34,0
dieciséis hepática alcohólica 74.4
17 Enfermedad hepática 78.2
18 alcohólica Hepatitis persistente 32.6
19 Hepatitis crónica activa 46.3
20 Hígado normal 39.6
21 Hepatitis crónica activa 52.7
22 Hepatitis crónica activa 57.2

¿Podemos concluir a partir de estos datos de muestra que el nivel promedio de GGTP de la población difiere entre los
cinco grupos de diagnóstico? Dejara¼ :05 y encuentra elpagvalor.

13.9 EL ANÁLISIS DE FRIEDMAN DE DOS VÍAS DE LA


VARIANZA POR RANGO

Así como en ocasiones podemos necesitar un análogo no paramétrico del análisis de varianza unidireccional
paramétrico, también podemos encontrar necesario analizar los datos en una clasificación bidireccional
mediante métodos no paramétricos análogos al análisis de varianza bidireccional. . Tal necesidad puede
surgir porque no se cumplen los supuestos necesarios para el análisis paramétrico de varianza, porque la
escala de medición empleada es débil o porque los resultados
13.9 EL ANÁLISIS DE FRIEDMAN DE DOS VÍAS DE LA VARIANZA POR RANGO 713

se necesitan con urgencia. Una prueba empleada con frecuencia en estas circunstancias es el análisis
bidireccional de varianza por rangos de Friedman (9,10). Esta prueba es adecuada siempre que los
datos se midan, al menos, en una escala ordinal y se puedan organizar significativamente en una
clasificación bidireccional, como se da para el experimento de bloques aleatorios analizado en el
Capítulo 8. El siguiente ejemplo ilustra este procedimiento.

EJEMPLO 13.9.1
Un fisioterapeuta realizó un estudio para comparar tres modelos de estimuladores eléctricos de bajo
voltaje. Se pidió a otros nueve fisioterapeutas que clasificaran los estimuladores en orden de
preferencia. Un rango de 1 indica primera preferencia. Los resultados se muestran en la Tabla 13.9.1.
Deseamos saber si podemos concluir que los modelos no se prefieren por igual.

Solución:

1. Datos.Ver Tabla 13.9.1.


2. Supuestos.Las observaciones que aparecen en un bloque dado son independientes
de las observaciones que aparecen en cada uno de los otros bloques, y dentro de
cada bloque se logra la medición en al menos una escala ordinal.
3. Hipótesis.En general, las hipótesis son:
H0: Todos los tratamientos tienen efectos idénticos.
HA: Al menos un tratamiento tiende a producir observaciones más grandes que
al menos uno de los otros tratamientos.
Para nuestro ejemplo presente establecemos las hipótesis de la siguiente manera:

H0: Los tres modelos son igualmente preferidos. HA: Los


tres modelos no son igualmente preferidos.
Dejara¼ :05.

TABLA 13.9.1 Clasificación de fisioterapeutas de tres modelos


de estimuladores eléctricos de bajo voltaje

Modelo

Terapeuta A B C

1 2 3 1
2 2 3 1
3 2 3 1
4 1 3 2
5 3 2 1
6 1 2 3
7 2 3 1
8 1 3 2
9 1 3 2

Rj 15 25 14
714 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

4. Estadística de prueba.Mediante el test de Friedman podremos determinar si


es razonable suponer que las columnas de rangos han sido extraídas de la
misma población. Si la hipótesis nula es verdadera, esperaríamos que la
distribución observada de rangos dentro de cualquier columna sea el
resultado de factores aleatorios y, por lo tanto, esperaríamos que los
números 1, 2 y 3 ocurran aproximadamente con la misma frecuencia en
cada columna. Si, por otro lado, la hipótesis nula es falsa (es decir, los
modelos no son igualmente preferidos), esperaríamos una preponderancia
de rangos relativamente altos (o bajos) en al menos una columna. Esta
condición se reflejaría en las sumas de los rangos. La prueba de Friedman
nos dirá si las sumas de rangos observadas son o no tan discrepantes que
no es probable que sean el resultado del azar cuandoH0es verdad.
Dado que los datos ya consisten en clasificaciones dentro de bloques (filas), nuestro
primer paso es sumar las clasificaciones dentro de cada columna (tratamiento). estas sumas
son losRjse muestra en la Tabla 13.9.1. Un estadístico de prueba, denotado por Friedman como
Xr2,se calcula de la siguiente manera:

12 Xk-
Xr2¼ R2j - 3nortedkþ1Þ (13.9.1)
nkdkþ1Þ j¼1

dóndenorte¼el número de filas (bloques) yk¼el número de columnas


(tratamientos).
5. Distribución de la estadística de prueba.Valores críticos para varios valores denorte
y kse dan en el Apéndice Tabla O.
6. Regla de decisión.RechazarH0si la probabilidad de obtener (cuandoH0es
cierto) un valor deX2 rtan grande como o más grande que lo que realmente se calculó es menor
que o igual aa.
7. Cálculo de la estadística de prueba. Utilizando los datos de la Tabla 13.9.1 y
Ecuaciones 13.9.1, calculamos

12 h i
Xr2¼ d15Þ2þ ð25Þ2þ ð14Þ2 - 3d9Þð3þ1¼8:222
9d3Þð3þ1Þ

8. Decisión estadística.Cuando consultamos la Tabla Oa del Apéndice, encontramos que


la probabilidad de obtener un valor deX2 rtan grande como 8.222 debido al azar
solo, cuando la hipótesis nula es verdadera, es .016. Podemos, por tanto,
rechazar la hipótesis nula.
9. Conclusión.Concluimos que los tres modelos de estimulador eléctrico de bajo
voltaje no son igualmente preferidos.
10pagvalor.Para esta prueba,pag¼ :016. &

CorbatasCuando los datos originales consisten en mediciones en un intervalo o una escala de razón en lugar
de rangos, se asignan rangos a las mediciones en función de sus magnitudes relativas dentro de los bloques.
Si se producen empates, a cada valor se le asigna la media de los rangos para los que está empatado.
13.9 EL ANÁLISIS DE FRIEDMAN DE DOS VÍAS DE LA VARIANZA POR RANGO 715

Muestras grandesCuando los valores deky/onorteexceden los dados en la Tabla O, el


valor crítico deX2rse obtiene consultando elX2tabla (Tabla F) con el elegidoay
k-1 grados de libertad.

EJEMPLO 13.9.2
La Tabla 13.9.2 muestra las respuestas, en porcentaje de disminución del flujo salival, de 16 animales de
experimentación después de diferentes niveles de dosis de atropina. Los rangos (entre paréntesis) y la suma
de los rangos también se dan en la tabla. Deseamos ver si podemos concluir que los diferentes niveles de
dosis producen respuestas diferentes. Es decir, deseamos probar la hipótesis nula de que no hay diferencia
en la respuesta entre los cuatro niveles de dosis.

Solución: A partir de los datos, calculamos

12
Xr2¼ d20Þ2þ ð36:5Þ2þ ð44Þ2þ ð59:5Þ2 - 3ddieciséisÞð4þ1¼30:32
dieciséisd4Þð4þ1Þ

La referencia a la Tabla F indica que conk-1¼3 grados de libertad


la probabilidad de obtener un valor deX2 rtan grande como 30.32 debido solo al azar
es cuandoH0es cierto, menos de .005. Rechazamos la hipótesis nula y concluimos que
los diferentes niveles de dosis producen respuestas diferentes.

TABLA 13.9.2 Porcentaje de disminución en el flujo salival de


animales de experimentación después de diferentes niveles de
dosis de atropina

Nivel de dosis

Número de animales A B C D

1 29(1) 48(2) 75(3) 100(4)


2 72(2) 30(1) 100(3.5) 100(3.5)
3 70(1) 100(4) 86(2) 96(3)
4 54(2) 35(1) 90(3) 99(4)
5 5(1) 43(3) 32(2) 81(4)
6 17(1) 40(2) 76(3) 81(4)
7 74(1) 100(3) 100(3) 100(3)
8 6(1) 34(2) 60(3) 81(4)
9 16(1) 39(2) 73(3) 79(4)
10 52(2) 34(1) 88(3) 96(4)
11 8(1) 42(3) 31(2) 79(4)
12 29(1) 47(2) 72(3) 99(4)
13 71(1) 100(3.5) 97(2) 100(3.5)
14 7(1) 33(2) 58(3) 79(4)
15 68(1) 99(4) 84(2) 93(3)
dieciséis 70(2) 30(1) 99(3.5) 99(3.5)

Rj 20 36.5 44 59.5
&
716 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Caja de diálogo: Comando de sesión:

Estadística no paramétricos Friedman BTT > FRIEDMAN C3 C1 C2

TipoC3enRespuesta,C1enTratamientoyC2en Bloques.
Hacer clicDE ACUERDO.

Producción:

Prueba de Friedman: C3 versus C1 bloqueado por C2

S 8.22 df 2p 0.017

Est. La suma de
C1 norte Mediana RANGOS
1 9 2.0000 15.0
2 9 2.6667 25,0
3 9 1.3333 14.0

gran mediana 2.0000

FIGURA 13.9.1Procedimiento y salida de MINITAB para el ejemplo 13.9.1.

Análisis informáticoMuchos paquetes de software estadístico, incluido MINITAB, realizarán la prueba


de Friedman. Para usar MINITAB formamos tres columnas de datos. Podemos, por ejemplo,
configurar las columnas de modo que la Columna 1 contenga números que indiquen el tratamiento al
que pertenecen las observaciones, la Columna 2 contenga números que indiquen los bloques a los
que pertenecen las observaciones y la Columna 3 contenga las observaciones. Si hacemos esto para el
ejemplo 13.9.1, el procedimiento y la salida de MINITAB son como se muestran en la figura 13.9.1.

EJERCICIOS

Para los siguientes ejercicios realice la prueba al nivel de significación indicado y determine el pag
valor.

13.9.1La siguiente tabla muestra los puntajes obtenidos por nueve estudiantes de enfermería seleccionados al azar en la evaluación final.
exámenes en tres áreas temáticas:

Área temática
Alumno
Número Fundamentos Fisiología Anatomía

1 98 95 77
2 95 71 79

(Continuado)
EJERCICIOS 717

Área temática
Alumno
Número Fundamentos Fisiología Anatomía

3 76 80 91
4 95 81 84
5 83 77 80
6 99 70 93
7 82 80 87
8 75 72 81
9 88 81 83

Pruebe la hipótesis nula de que los estudiantes de enfermería que constituyen la población de la que se extrajo la
muestra anterior se desempeñan igualmente bien en las tres áreas temáticas frente a la hipótesis alternativa de que
se desempeñan mejor en, al menos, un área. Dejara¼ :05.

13.9.2Quince estudiantes de fisioterapia seleccionados al azar recibieron las siguientes instrucciones: “Suponga
que se casará con una persona con una de las siguientes desventajas (las limitaciones se enumeraron y designaron
con las letras de la A a la J). Clasifique estas desventajas del 1 al 10 de acuerdo con su primera, segunda, tercera (y así
sucesivamente) elección de desventaja para su cónyuge”. Los resultados se muestran en la siguiente tabla.

Desventaja

Número de estudiante A B C D mi F GRAMO H I j

1 1 3 5 9 8 2 4 6 7 10
2 1 4 5 7 8 2 3 6 9 10
3 2 3 7 8 9 1 4 6 5 10
4 1 4 7 8 9 2 3 6 5 10
5 1 4 7 8 10 2 3 6 5 9
6 2 3 7 9 8 1 4 5 6 10
7 2 4 6 9 8 1 3 7 5 10
8 1 5 7 9 10 2 3 4 6 8
9 1 4 5 7 8 2 3 6 9 10
10 2 3 6 8 9 1 4 7 5 10
11 2 4 5 8 9 1 3 7 6 10
12 2 3 6 8 10 1 4 5 7 9
13 3 2 6 9 8 1 4 7 5 10
14 2 5 7 8 9 1 3 4 6 10
15 2 3 6 7 8 1 5 4 9 10

Pruebe la hipótesis nula de que no hay preferencia por las desventajas frente a la alternativa de que se prefieren algunas
desventajas sobre otras. Dejara¼ :05.

13.9.3Diez sujetos con asma inducida por el ejercicio participaron en un experimento para comparar el efecto protector de un
fármaco administrado en cuatro niveles de dosis. Se usó solución salina como control. La variable de interés fue el
cambio en el FEV1después de la administración de la droga o solución salina. Los resultados fueron los siguientes:
718 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Nivel de dosis de fármaco (mg/ml)

Sujeto Salina 2 10 20 40

1 - :68 - :32 - :14 - :21 - :32


2 - 1:55 - :56 - :31 - :21 - :dieciséis

3 - 1:41 - :28 - :11 - :08 - :83


4 - :76 - :56 - :24 - :41 - :08
5 - :48 - :25 - :17 - :04 - :18
6 - 3:12-1:99-1:22-:55-:75
7 - 1:16 - :88 - :87 - :54 - :84
8 - 1:15 - :31 - :18 - :07 - :09
9 - :78 - :24 - :39 - :11 - :51
10 - 2:12 - :35 - :28 þ:11 - :41

¿Se puede concluir sobre la base de estos datos que diferentes niveles de dosis tienen efectos diferentes?
Dejara¼ :05 y encuentra elpagvalor.

13.10 EL COEFICIENTE DE CORRELACIÓN


DE RANGO DE SPEARMAN

Varias medidas no paramétricas de correlación están disponibles para el investigador. De estos, un


procedimiento de uso frecuente que es atractivo debido a la simplicidad de los cálculos involucrados
se debe a Spearman (11). La medida de correlación calculada por este método se denomina
coeficiente de correlación de rango de Spearman y se designa porrs. Este procedimiento hace uso de
los dos conjuntos de rangos que pueden asignarse a los valores muestrales deXyY,las variables
independientes y continuas de una distribución bivariada.

HipótesisLas hipótesis generalmente probadas y sus alternativas son las siguientes:


(a)H0:XyYson mutuamente independientes. HA:XyY
no son mutuamente independientes.
(b)H0:XyYson mutuamente independientes.
HA: Hay una tendencia a valores grandes deXy grandes valores deYser emparejado
juntos.
(C)H0:XyYson mutuamente independientes.
HA: Hay una tendencia a valores grandes deXemparejarse con valores pequeños dey

Las hipótesis especificadas en (a) conducen a una prueba bilateral y se utilizan cuando se desea
detectar cualquier desviación de la independencia. Las pruebas unilaterales indicadas por (b) y (c) se utilizan,
respectivamente, cuando los investigadores desean saber si pueden concluir que las variables están directa o
inversamente correlacionadas.

El procedimientoEl procedimiento de prueba de hipótesis implica los siguientes pasos.


1.Clasifica los valores deXdel 1 aln (número de pares de valores deXyYen la muestra).
Clasifica los valores deYdel 1 alnorte.
13.10 EL COEFICIENTE DE CORRELACIÓN DE RANGO DE SPEARMAN 719

2.Calculardipara cada par de observaciones restando el rango deYidesde el


rango deXi.
PAG
3.Cuadrado cada unodiy calcular di2,la suma de los valores al cuadrado.
4.Calcular
PAG
6 di2
rs¼1 - (13.10.1)
nortednorte2- 1Þ

5.Sinorteestá entre 4 y 30, compare el valor calculado derscon los valores críticos,rs, de la
Tabla P del Apéndice. Para la prueba bilateral,H0es rechazado en elanivel de significación
sirses mayor querso menos que -rs,dóndersestá en la intersección de la columna
encabezadaun =2 y la fila correspondiente anorte.Para la prueba unilateral conHA
especificando la correlación directa,H0es rechazado en elanivel de significación sirses
mayor quersparaa ynorte.Se rechaza la hipótesis nula en elanivel de significación en la
otra prueba unilateral sirses menos que -rsparaaynorte.
6.Sinortees mayor que 30, se puede calcular

pffiffiffiffiffiffiffiffiffiffiffiffi z¼rsn-1 (13.10.2)

y use la Tabla D del Apéndice para obtener los valores críticos.

7.Las observaciones empatadas presentan un problema. El uso de la Tabla P es estrictamente válido solo cuando
los datos no contienen ningún empate (a menos que se emplee algún procedimiento aleatorio para
desempatar). En la práctica, sin embargo, la mesa se usa con frecuencia después de que se haya empleado
algún otro método para manejar las ataduras. Si el número de empates es grande, se puede emplear la
siguiente corrección por empates:

t3-t
T¼ (13.10.3)
12
dóndet¼el número de observaciones que están empatadas para algún rango en particular. Cuando se
utiliza este factor de corrección,rsse calcula a partir de
PPA
X2þ y2- d2 i
r s¼ pffiP
ffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffi (13.10.4)
2 X2 y2
en lugar de la Ecuación 13.10.1.
En la Ecuación 13.10.4,

PAG norte3-norte
X
X2 ¼ - TX
12
PAG norte3- norte
X
y2 ¼ - Ty
12
TX¼la suma de los valores deTpara los diversos rangos empatados enXTy¼
la suma de los valores deTpara los diversos rangos empatados enY

La mayoría de las autoridades están de acuerdo en que, a menos que el número de empates sea excesivo, la
corrección hace muy poca diferencia en el valor ders. Cuando el número de empates es pequeño, podemos seguir el
720 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

procedimiento habitual de asignar a las observaciones empatadas la media de los rangos para los que están
empatadas y proceder con los pasos 2 a 6.

EJEMPLO 13.10.1
En un estudio de la relación entre la edad y el EEG, se recogieron datos de 20 sujetos de entre
20 y 60 años. La Tabla 13.10.1 muestra la edad y un valor de salida de EEG particular para cada
uno de los 20 sujetos. El investigador desea saber si se puede concluir que esta salida de EEG en
particular está inversamente correlacionada con la edad.

Solución:

1. Datos.Ver Tabla 13.10.1.


2. Supuestos.Suponemos que la muestra disponible para el análisis es una
muestra aleatoria simple y que tantoXyYse miden al menos en la escala
ordinal.
3. Hipótesis.
H0: Esta salida de EEG y la edad son mutuamente independientes. HA: Hay una
tendencia a que esta salida de EEG disminuya con la edad.
Supongamos que dejamosa¼ :05.

TABLA 13.10.1 Edad y valor de salida de EEG


para 20 sujetos

Sujeto Salida EEG


Número Edad (X) Valor (Y)

1 20 98
2 21 75
3 22 95
4 24 100
5 27 99
6 30 sesenta y cinco

7 31 64
8 33 70
9 35 85
10 38 74
11 40 68
12 42 66
13 44 71
14 46 62
15 48 69
dieciséis 51 54
17 53 63
18 55 52
19 58 67
20 60 55
13.10 EL COEFICIENTE DE CORRELACIÓN DE RANGO DE SPEARMAN 721

4. Estadística de prueba.Ver Ecuación 13.10.1.


5. Distribución de la estadística de prueba.Los valores críticos de la estadística de prueba se
dan en la Tabla P del Apéndice.

6. Regla de decisión.Para la presente prueba rechazaremosH0si el valor


calculado derses menor que -:3789.
7. Cálculo de la estadística de prueba.Cuando elXyYvaloresPAG están clasificados, nosotros

tener los resultados que se muestran en la Tabla 13.10.2. Eldi,d2 i,y di2son exhibidos
en la misma mesa.
Sustitución de los datos de la Tabla 13.10.2 en la Ecuación 13.10.1
da
6d2340Þ
rs¼1 - ¼ -:76
20½ð20Þ2- 1
8. Decisión estadística.Dado que nuestro calculadors¼ -:76 es menor que el
críticors,rechazamos la hipótesis nula.
9. Conclusión.Concluimos que las dos variables están inversamente relacionadas.
10pagvalor.Como -:76 < -0:6586, tenemos para esta pruebapag < :001.

TABLA 13.10.2 Rangos para los datos del ejemplo 13.10.1

Sujeto
Número Rango (X) Rango (Y) di d2i

1 1 18 - 17 289
2 2 15 - 13 169
3 3 17 - 14 196
4 4 20 - dieciséis 256
5 5 19 - 14 196
6 6 7 -1 1
7 7 6 1 1
8 8 12 -4 dieciséis

9 9 dieciséis -7 49
10 10 14 -4 dieciséis

11 11 10 1 1
12 12 8 4 dieciséis

13 13 13 0 0
14 14 4 10 100
15 15 11 4 dieciséis

dieciséis dieciséis 2 14 196


17 17 5 12 144
18 18 1 17 289
19 19 9 10 100
20 20 3 17 289
PAG
d2i ¼2340
&
722 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Ilustremos ahora el procedimiento para una muestra connorte >30 y algunas observaciones
empatadas.

EJEMPLO 13.10.2
En la Tabla 13.10.3 se muestran las edades y concentraciones (ppm) de cierto mineral en el
tejido de 35 sujetos a quienes se les realizaron autopsias como parte de una gran investigación.
proyecto.
PAG
Las categorias,di,d2 i,y di2se muestran en la Tabla 13.10.4. Probemos, en el nivel .05 de
significación, la hipótesis nula de queXyYson mutuamente independientes frente a la
alternativa bilateral de que no son mutuamente independientes.

Solución:A partir de los datos de la tabla 13.10.4 calculamos

6d1788:5Þ
rs¼1 - ¼ :75
35d35Þ2- 1

Para probar la importancia derscalculamos

pffiffiffiffiffiffiffiffiffiffiffiffiffiffi

z¼ :75 35 - 1¼4:37

TABLA 13.10.3 Edad y concentración de minerales (ppm) en tejido de 35 sujetos

Mineral Mineral
Sujeto Edad Concentración Sujeto Edad Concentración
Número (X) (Y) Número (X) (Y)

1 82 169.62 19 50 4.48
2 85 48.94 20 71 46.93
3 83 41.16 21 54 30.91
4 64 63.95 22 62 34.27
5 82 21.09 23 47 41.44
6 53 5.40 24 66 109.88
7 26 6.33 25 34 2.78
8 47 4.26 26 46 4.17
9 37 3.62 27 27 6.57
10 49 4.82 28 54 61.73
11 sesenta y cinco 108.22 29 72 47.59
12 40 10.20 30 41 10.46
13 32 2.69 31 35 3.06
14 50 6.16 32 75 49.57
15 62 23.87 33 50 5.55
dieciséis 33 2.70 34 76 50.23
17 36 3.15 35 28 6.81
18 53 60.59
13.10 EL COEFICIENTE DE CORRELACIÓN DE RANGO DE SPEARMAN 723

TABLA 13.10.4 Rangos para los datos del ejemplo 13.10.2

Sujeto Rango Rango Sujeto Rango Rango


Número (X) (Y) di di2 Número (X) (Y) di d2i

1 32.5 35 - 2:5 6.25 19 17 9 8 64.00


2 35 27 8 64.00 20 28 25 3 9.00
3 34 23 11 121.00 21 21.5 21 .5 . 25
4 25 32 -7 49.00 22 23.5 22 1.5 2.25
5 32.5 19 13,5 182,25 23 13.5 24 - 10:5 110.25
6 19.5 11 8,5 72,25 24 27 34 -7 49.00
7 1 14 - 13 169.00 25 6 3 3 9.00
8 13.5 8 5,5 30,25 26 12 7 5 25.00
9 9 6 3 9.00 27 2 15 - 13 169.00
10 15 10 5 25.00 28 21.5 31 - 9:5 90.25
11 26 33 -7 49.00 29 29 26 3 9.00
12 10 17 -7 49.00 30 11 18 -7 49.00
13 4 1 3 9.00 31 7 4 3 9.00
14 17 13 4 16.00 32 30 28 2 4.00
15 23.5 20 3.5 12.25 33 17 12 5 25.00
dieciséis 5 2 3 9.00 34 31 29 2 4.00
17 8 5 3 9.00 35 3 dieciséis - 13 169.00
18 19.5 30 - 10:5 110.25
PAG
d2i ¼1788:5

Como 4.37 es mayor quez¼3:89;pag <2d:0001Þ ¼ :0002, y


rechazamosH0y concluir que las dos variables en estudio no son
independientes entre sí.
Para fines comparativos, corrijamos los empates usando la Ecuación 13.10.3 y
luego calculemosrspor la Ecuación 13.10.4.
en las clasificaciones deXteníamos seis grupos de empates que se rompieron
asignando los valores 13.5, 17, 19.5, 21.5, 23.5 y 32.5. En cinco de los grupos
empataron dos observaciones y en un grupo empataron tres observaciones. Por lo
tanto, calculamos cinco valores de

23- 2 6
TX¼ ¼ ¼ :5
12 12
y un valor de

33- 3 24
TX¼ ¼ ¼2
12 12
PAG
A partir de estos cálculos, tenemos TX¼5d:5Þ þ2¼4:5, de modo que

X 352 - 35
X2 ¼ - 4:5¼3565:5
12
724 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Caja de diálogo: Comando de sesión:

Estadística Estadísticas básicas Correlación BTT > CORRELACIÓN C3 C4

TipoC3–C4enVariables.Hacer clicDE ACUERDO.

Producción:

Correlaciones (Pearson)

Correlación de (X)Rank y (Y)Rank - 0.759

FIGURA 13.10.1Procedimiento MINITAB y salida para calcular el coeficiente de correlación de rangos de


Spearman, Ejemplo 13.10.1.

PAG
Dado que no se produjeron empates en elYclasificación, tenemos Ty¼0 y
X
353 - 35
y2¼
- 0¼3570:0
12
PAG
De la tabla 13.10.4 tenemos di2¼1788:5. A partir de estos datos ahora podemos
calcular por la Ecuación 13.10.4

3565:5þ3570:0 - 1788:5
rs¼ ¼ :75
uffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff

2 d3565:5Þð3570Þ

Vemos que en este caso la corrección por empates no hace ninguna diferencia en
el valor ders. &

Análisis informáticoPodemos usar MINITAB, así como muchos otros paquetes de software
estadístico, para calcular el coeficiente de correlación de Spearman. Para usar MINITAB, primero
debemos hacer que MINITAB clasifique las observaciones y almacene los rangos en columnas
separadas, una para elXrangos y uno para elYrangos Si clasificamos laXyYvalores del ejemplo 13.10.1
y almacenarlos en las columnas 3 y 4, podemos obtener el coeficiente de correlación de rangos de
Spearman con el procedimiento que se muestra en la figura 13.10.1. Otros paquetes de software
como SAS®y SPSS, por ejemplo, clasifica automáticamente las medidas antes de calcular el coeficiente,
eliminando así un paso adicional en el procedimiento.

EJERCICIOS

Para los siguientes ejercicios realice la prueba al nivel de significación indicado y determine el pag
valor.

13.10.1La siguiente tabla muestra 15 áreas geográficas seleccionadas al azar clasificadas por densidad de población y
tasa de mortalidad ajustada por edad. ¿Podemos concluir con un nivel de significancia de .05 que la densidad de población y la tasa de
mortalidad ajustada por edad no son mutuamente independientes?
EJERCICIOS 725

Clasificar por Clasificar por

Población Ajustado por edad Población Ajustado por edad


Área Densidad (X) Índice de mortalidad (Y) Área Densidad (X) Índice de mortalidad (Y)

1 8 10 9 6 8
2 2 14 10 14 5
3 12 4 11 7 6
4 4 15 12 1 2
5 9 11 13 13 9
6 3 1 14 15 3
7 10 12 15 11 13
8 5 7

13.10.2La siguiente tabla muestra 10 comunidades clasificadas por dientes cariados, faltantes u obturados (DMF) por cada 100
niños y concentración de fluoruro en ppm en el suministro público de agua:

Clasificar por Clasificar por

Dientes DMF Fluoruro Dientes DMF Fluoruro


por 100 Concentración por 100 Concentración
Comunidad Niños (X) (Y) Comunidad Niños (X) (Y)

1 8 1 6 4 7
2 9 3 7 1 10
3 7 4 8 5 6
4 3 9 9 6 5
5 2 8 10 10 2

¿Proporcionan estos datos evidencia suficiente para indicar que el número de dientes de DMF por cada 100 niños tiende a
disminuir a medida que aumenta la concentración de fluoruro? Dejara¼ :05.

13.10.3El propósito de un estudio de Nozawa et al. (A-10) fue evaluar el resultado de la reparación quirúrgica de pars
defecto interarticular por fijación segmentaria con alambre en adultos jóvenes con espondilólisis lumbar. Los autores
citan literatura que indica que la fijación segmentaria con alambre ha tenido éxito en el tratamiento de espondilólisis
de no deportistas y señalan que no existía información sobre los resultados de este tipo de cirugía en deportistas. En
un estudio retrospectivo de sujetos operados entre 1993 y 2000, los autores encontraron 20 sujetos que se habían
sometido a la cirugía. La siguiente tabla muestra la edad (años) en el momento de la cirugía y la duración (meses) de
la atención de seguimiento de estos sujetos.

Duración del seguimiento Edad Duración del seguimiento Edad


(Meses) (Años) (Meses) (Años)

103 37 38 27
68 27 36 31
62 12 34 24
60 18 30 23
60 18 19 14
(Continuado)
726 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Duración del seguimiento Edad Duración del seguimiento Edad


(Meses) (Años) (Meses) (Años)

54 28 19 23
49 25 19 18
44 20 19 29
42 18 17 24
41 30 dieciséis 27
Fuente: Satoshi Nozawa, Katsuji Shimizu, Kei Miyamoto y Mizuo Tanaka, "Reparación del defecto pars interarticularis mediante
fijación segmentaria con alambre en atletas jóvenes con espondilolisis".Revista americana de medicina deportiva, 31 (2003),
págs. 359–364.

¿Podemos concluir, sobre la base de estos datos, que en una población de sujetos similares existe una
asociación entre la edad y la duración del seguimiento? Dejara¼ :05.

13.10.4Consulte el Ejercicio 13.10.3. Nozawa et al. (A-10) también calculó la Asociación Ortopédica Japonesa
puntuación para medir el dolor de espalda (JOA). Los resultados de los 20 sujetos junto con la duración del
seguimiento se muestran en la siguiente tabla. Cuanto mayor sea el número, menor será el grado de dolor.

Duración del seguimiento Duración del seguimiento


(Meses) joa (Meses) joa

103 21 38 13
68 14 36 24
62 26 34 21
60 24 30 22
60 13 19 25
54 24 19 23
49 22 19 20
44 23 19 21
42 18 17 25
41 24 dieciséis 21
Fuente: Satoshi Nozawa, Katsuji Shimizu, Kei Miyamoto y Mizuo Tanaka, "Reparación
del defecto pars interarticularis mediante fijación segmentaria con alambre en atletas
jóvenes con espondilolisis".Revista americana de medicina deportiva, 31 (2003), págs.
359–364.

¿Podemos concluir a partir de estos datos que, en general, existe una relación entre la duración del seguimiento y la
puntuación JOA en el momento de la operación? Dejara¼ :05.

13.10.5Butz et al. (A-11) estudiaron el uso de ventilación no invasiva con presión positiva en pacientes con
la esclerosis lateral amiotrófica. Evaluaron el beneficio del procedimiento sobre los síntomas, la calidad de vida y la
supervivencia de los pacientes. Dos variables de interés son PaCO2, presión parcial de dióxido de carbono arterial y
PaO2, presión parcial de oxígeno arterial. La siguiente tabla muestra, para 30 sujetos, los valores de estas variables
(mm Hg) obtenidos a partir de los análisis de gases en sangre arterial de referencia.

PaCO2 PaO2 PaCO2 PaO2 PaCO2 PaO2

40 101 54.5 80 34.5 86.5


47 69 54 72 40.1 74.7
(Continuado)
13.11 ANÁLISIS DE REGRESIÓN NO PARAMÉTRICO 727

PaCO2 PaO2 PaCO2 PaO2 PaCO2 PaO2

34 132 43 105 33 94
42 sesenta y cinco 44.3 113 59,9 60.4
54 72 53,9 69.2 62.6 52.5
48 76 41.8 66.7 54.1 76,9
53.6 67.2 33 67 45.7 65.3
56,9 70,9 43.1 77.5 40.6 80.3
58 73 52.4 65.1 56,6 53.2
45 66 37,9 71 59 71,9
Fuente: M. Butz, KH Wollinsky, U. Widemuth-Catrinescu, A.
Sperfeld, S. Winter, HH Mehrkens, AC Ludolph y H. Schreiber,
“Efectos longitudinales de la ventilación no invasiva con presión
positiva en pacientes con esclerosis lateral amiotrófica, ”Diario
Americano de Rehabilitación Médica, 82 (2003) 597–604.

Sobre la base de estos datos podemos concluir que existe una asociación entre PaCO2y PaO2
¿valores? Dejara¼ :05.

13.10.6Diecisiete pacientes con antecedentes de insuficiencia cardíaca congestiva participaron en un estudio para evaluar la
efectos del ejercicio en diversas funciones corporales. Durante un período de ejercicio, se recopilaron los siguientes
datos sobre el cambio porcentual en la norepinefrina plasmática (Y)y el cambio porcentual en el consumo de oxígeno
(X):

Sujeto X Y Sujeto X Y

1 500 525 10 50 60
2 475 130 11 175 105
3 390 325 12 130 148
4 325 190 13 76 75
5 325 90 14 200 250
6 205 295 15 174 102
7 200 180 dieciséis 201 151
8 75 74 17 125 130
9 230 420

Sobre la base de estos datos, ¿se puede concluir que existe una asociación entre las dos variables? Dejar a¼ :
05.

13.11 NO PARAMÉTRICO
ANÁLISIS DE REGRESIÓN

Cuando no se cumplen los supuestos que subyacen al análisis de regresión lineal simple, como se analiza en
el capítulo 9, podemos emplear procedimientos no paramétricos. En esta sección presentamos estimadores
de la pendiente y el intercepto que son alternativas fáciles de calcular a los estimadores de mínimos
cuadrados descritos en el Capítulo 9.
728 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Estimador de pendiente de TheilTheil (12) propone un método para obtener una estimación
puntual del coeficiente de pendienteb.Suponemos que los datos se ajustan al modelo de
regresión clásico

yi¼b0þb1X1þmii;i¼1; . . . ;norte

donde elXison constantes conocidas,b0yb1son parámetros desconocidos, yYies un valor


observado de la variable aleatoria continuaYenXi. Para cada valor deXi, asumimos una
subpoblación deYvalores, y elmiison mutuamente independientes. ElXison todos distintos (sin
vínculos), y tomamosX1<X2< <Xnorte.
Los datos consisten ennortepares de observaciones muestrales,dX1;y1Þ; dX2;y2Þ; . . . ; dXnorte;y
norteÞ, donde eliEl par representa las medidas tomadas en eliª unidad de asociación.
- Para obtener- El estimador de Theil deb1primero formamos todas las pendientes muestrales posibles
Syo¼yj- yi= xj- Xi,dóndeyo < j.Habránorte¼norteC2valores deSyo. El estimador deb1
que designamos por b̂1es la mediana deSyovalores. Eso es,

b1¼medianaSyo (13.11.1)

El siguiente ejemplo ilustra el cálculo de b̂1.

EJEMPLO 13.11.1
En la Tabla 13.11.1 se encuentran los niveles de testosterona plasmática (ng/ml) (Y)y niveles de ácido cítrico
seminal (mg/ml) en una muestra de ocho machos adultos. Deseamos calcular la estimación del coeficiente de
pendiente de regresión de población por el método de Theil.

Solución:Elnorte¼8C2¼28 valores ordenados deSyose muestran en la Tabla 13.11.2.


si dejamosi¼1 yj¼2, los indicadores del primer y segundo valor de YyX
en la tabla 13.11.1, podemos calcularS12como sigue:

S12¼ ð175 - 230Þ=ð278 - 421Þ ¼ -:3846

Cuando todas las pendientes se calculan de manera similar y se ordenan como


en la tabla 13.11.2, -:3846 termina como el décimo valor en la matriz ordenada.

la mediana de laSyovalores es .4878. En consecuencia, nuestra estimación del


coeficiente de pendiente de la población b̂1¼ :4878.

TABLA 13.11.1 Niveles plasmáticos de testosterona y ácido cítrico seminal en


hombres adultos

Testosterona: 230 175 315 290 275 150 360 425


Ácido cítrico: 421 278 618 482 465 105 550 750
13.11 ANÁLISIS DE REGRESIÓN NO PARAMÉTRICO 729

TABLA 13.11.2 Valores ordenados deSyo


para el ejemplo 13.11.1

- :6618 . 5037
. 1445 . 5263
. 1838 . 5297
. 2532 . 5348
. 2614 . 5637
. 3216 . 5927
. 3250 . 6801
. 3472 . 8333
. 3714 . 8824
. 3846 . 9836
. 4118 1.0000
. 4264 1.0078
. 4315 1.0227
. 4719 1.0294
&

Un estimador del coeficiente de intersecciónDietz (13) recomienda dos


estimadores de intercepción. El primero, designado b̂0 1;METRO es la mediana de lanortetérminosyi- b1Xien
cual B1es el estimador de Theil. Se recomienda cuando el investigador no está dispuesto a asumir que los
términos de error son simétricos alrededor de 0. Si el investigador está dispuesto a asumir una
distribución simétrica de los términos de error, Dietz recomienda el estimador b̂0 cual es 2;METRO

la mediana de lanortednorteþ1Þ=2 promedios por pares de losyi- b1Xitérminos. Ilustramos el


cálculo de cada uno en el siguiente ejemplo.

EJEMPLO 13.11.2
Consulte el ejemplo 13.11.1. Calculemos â1;METROy â2;METROde los datos sobre los niveles de testosterona
y ácido cítrico.

Solución: el ordenadoyi- :4878Xilos términos son: 13.5396, 24.6362, 39.3916, 48.1730,


54.8804, 5-9.1500, 91.7100 y 98.7810. La mediana, 51.5267, es la
estimador b̂0 1;METRO
.
el 8d8þ1Þ=2¼36 promedios ordenados por pares de losyi- :4878Xison

13.5396 49.2708 75.43


19.0879 51.5267 76.8307
24.6362 52.6248 78.9655
26.4656 53.6615 91.71
30.8563 54.8804 95.2455
32.0139 56.1603 98.781
34.21 57.0152
36.3448 58.1731
(Continuado)
730 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

36.4046 59.15
39.3916 61.7086
39.7583 65.5508
41.8931 69.0863
43.7823 69.9415
47.136 73.2952
48.173 73.477

La mediana de estos promedios, 53.1432, es el estimador â2;METRO. La ecuación de


estimación, entonces, esyi¼53:1432þ :4878Xisi estamos dispuestos a asumir que
la distribución de los términos de error es simétrica alrededor de 0. Si no
estamos dispuestos a asumir la simetría, la ecuación de estimación es yi¼51:5267
þ :4878Xi. &

EJERCICIOS

13.11.1Los siguientes son los valores de frecuencia cardíaca (FC: latidos/minuto) y consumo de oxígeno (VO2:
cal/kg/24 h) para nueve lactantes con insuficiencia cardíaca congestiva crónica:

HORA(X): 163 164 156 151 152 167 165 153 155
VO2(Y): 53,9 57,4 41,0 40,0 42,0 64,4 59,1 49,9 43,2

- -
Calcule b̂1; b0 ;y ^
1;METRO b0 2;METRO

13.11.2Los siguientes son los pesos corporales (gramos) y el área de superficie total (cm2) de nueve laboratorio
animales:

Peso corporal (X): Área 660.2 706.0 924.0 936.0 992.1 888.9 999.4 890.3 841.2
de superficie (Y): 781.7 888.7 1038.1 1040.0 1120.0 1071.5 1134.5 965.3 925.0

Calcule el estimador de pendiente y dos estimadores de intersección.

13.12 RESUMEN

Este capítulo se ocupa de las pruebas estadísticas no paramétricas. Estas pruebas pueden usarse
cuando las suposiciones subyacentes a las pruebas paramétricas no se realizan o cuando los datos a
analizar se miden en una escala demasiado débil para los procedimientos aritméticos necesarios para
las pruebas paramétricas.
Se describen e ilustran nueve pruebas no paramétricas. Excepto por la prueba de bondad
de ajuste de Kolmogorov-Smirnov, cada prueba proporciona una alternativa no paramétrica a
una prueba paramétrica conocida. Hay una serie de otras pruebas no paramétricas disponibles.
Se remite al lector interesado a los numerosos libros dedicados a los métodos no paramétricos,
incluidos los de Gibbons (14) y Pett (15).
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 13 731

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 13

Fórmula
Número Nombre Fórmula

13.3.1 Estadística de prueba de signo - XX


-k
P k - xn; pag¼ norteCkpagkqnorte

k¼0

13.3.2 Muestra grande dkþ0:5Þ þ0:5norte norte


z¼ pffiffiffi ; si k <
aproximación de 0:5norte 2
la prueba de signos
dk-0:5Þ -0:5norte norte
z¼ pffiffiffi ; si k
0:5norte 2

13.6.1 Prueba de Mann-Whitney nortednorteþ1Þ


T¼S -
estadística 2

13.6.2 Muestra grande T - mn=2


Z¼pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
aproximación de la Nuevo Méjicodnorteþmetroþ1Þ=12

Prueba de Mann-Whitney

13.6.3 Equivalencia de Mann- metrodmetroþ2norteþ1Þ


tuþW¼
Whitney y Wilcoxon 2
estadísticas de dos muestras

13.7.1–13.7.2 Kolmogorov–Smirnov D¼sorberjFsdXÞ -FTdXÞj


X
Estadística de prueba

¼máximoFmáximo½jFsdXiÞ -FTdXiÞj; jFsdXi-1Þ


1-Ir

-FTdXi-1Þjg

13.8.1 Prueba de Kruskal-Wallis 12 Xk R2


estadística H¼ j-3dnorteþ1Þ
nortednorteþ1Þ nortej
j¼1

PAG
13.8.2 Prueba de Kruskal-Wallis T
1-
ajuste estadístico norte3-norte

para corbatas

13.9.2 Estadístico de prueba de Friedman


12 Xk- 2
Xr2¼ Rj - 3nortedkþ1Þ
nkdkþ1Þ j¼1

PAG
13.10.1 Estadística de prueba de correlación de 6 di2
rango de Spearman
rs¼1 -
nortednorte2- 1Þ
732 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

13.10.2 Muestra grande pffiffiffiffiffiffiffiffiffiffiffiffi z¼rsn-1

aproximación de la
Correlación de rango de Spearman

13.10.3–13.10.4 Corrección por empate t3-t



observaciones en el 12
Correlación de rango de Spearman
con
PAG PAG PAG
X2þ y2- di2
r s¼ pffiP ffiffiffiffiffiffiffiffiffiffi
ffiffiffiffiffiffiffiffiffiffiffi

2 X2 y2

13.11.1 de Theil b¼medianaFSigramo


estimador deb

Clave de símbolo b¼- Estimador de Theil de


bx2oX2¼chi-cuadrado
D¼Kolmogorov - Estadístico de prueba de
Smirnov FidX¼función de distribución deYo H¼
Prueba de Friedman ststictic
k¼estadístico de prueba de signos y el número de columnas en la prueba de Friedman
metro¼tamaño de la muestra de la más pequeña de dos muestras norte¼tamaño de la
muestra de la mayor de dos muestras pag¼probabilidad de éxito

q¼1 -pag¼probabilidad de falla R


¼rango
rs¼Coeficiente de correlación de rango de Spearman S¼
suma de rangos
Syo¼pendiente entre puntoiyj
sorber¼supremodmayorÞ
t¼número de observaciones empatadas T¼
corrección para observaciones empatadas Xyy¼
valor de datos para variablesXyYu¼Prueba
estadística de Mann-Whitney W¼Prueba de
Wilcoxon estadística z¼variable normal

PREGUNTAS DE REPASO Y EJERCICIOS

1.Definir estadísticas no paramétricas.

2.¿Qué se entiende por el término¿Pruebas estadísticas libres de distribución?

3.¿Cuáles son algunas de las ventajas de usar pruebas estadísticas no paramétricas?

4.¿Cuáles son algunas de las desventajas de las pruebas no paramétricas?


PREGUNTAS DE REPASO Y EJERCICIOS 733

5.Describa una situación en su área particular de interés en la que se podría utilizar cada una de las siguientes pruebas.
Use datos reales o realistas y pruebe una hipótesis apropiada usando cada prueba.
(a)la prueba del signo

(b)la prueba mediana


(C)La prueba de Wilcoxon
(d)La prueba de Mann-Whitney
(mi)La prueba de bondad de ajuste de Kolmogorov-Smirnov
(F)El análisis unidireccional de varianza por rangos de Kruskal-Wallis
(gramo)El análisis bidireccional de Friedman de la varianza por rangos

(h)El coeficiente de correlación de rango de Spearman


(i)Análisis de regresión no paramétrico

6.Los siguientes son los rangos de las edades (X)de 20 pacientes quirúrgicos y la dosis (Y)de un agente analgésico
requerido para bloquear un segmento espinal.

rango de Rango de dosis rango de Rango de dosis


Edad en Requisito Edad en Requisito
Años (X) (Y) Años (X) (Y)

1 1 11 13
2 7 12 5
3 2 13 11
4 4 14 dieciséis

5 6 15 20
6 8 dieciséis 18
7 3 17 19
8 15 18 17
9 9 19 10
10 12 20 14

Calcularrsy prueba (bilateral) de significación. Dejara¼ :05. Determinar elpagvalor para esta prueba.

7.Otani y Kishi (A-12) estudiaron siete sujetos con edema macular diabético. Midieron el grosor foveald
metrometroÞen siete ojos antes y después de la cirugía de vitrectomía unilateral. Los resultados se
muestran en la siguiente tabla:

Sujeto Espesor foveal preoperatoriodmetrometroÞ Espesor foveal posoperatoriodmetrometroÞ

1 690 200
2 840 280
3 470 230
4 690 200
5 730 560
6 500 210
7 440 200
Fuente: Datos proporcionados por cortesía de Tomohiro Otani, MD

Utilice la prueba de rango con signo de Wilcoxon para determinar si se debe concluir que la cirugía es
eficaz para reducir el grosor foveal. Dejara¼ :05. ¿Cuál es elpag¿valor?
734 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

8.Los sujetos de un estudio realizado por J. Jose y SR Ell (A-13) fueron 303 voluntarios sanos que autoevaluaron su propio
estado de flujo nasal al indicar si sus vías respiratorias nasales estaban (1) totalmente despejadas, (2) no muy
despejadas, (3 ) muy bloqueado, o (4) totalmente bloqueado. Después de la autoevaluación, se utilizó un medidor In-
Check para medir la tasa de flujo nasal inspiratorio máximo (PINFR, L/min). Los datos sobre 175 sujetos en tres de las
categorías de autoevaluación se muestran en la siguiente tabla. Los autores realizaron una prueba de Kruskal-Wallis
para determinar si estos datos brindan evidencia suficiente para indicar una diferencia en los centros de población de
PINFR entre estos tres grupos de respuesta. Dejara¼ :01. ¿Cuál es el valor estadístico de prueba para esta prueba?

Tasa de flujo nasal inspiratorio máximo (L/min)

Totalmente claro no muy claro parcialmente bloqueado

180 105 150 120 160 190 130 100


150 150 110 95 200 95 110 100
200 240 130 140 70 130 110 100
130 120 100 135 75 240 130 105
200 90 170 100 150 180 125 95
120 135 80 130 80 140 100 85
150 110 125 180 130 150 230 50
150 155 115 155 160 130 110 105
160 105 140 130 180 90 270 200
150 140 140 140 90 115 180
110 200 95 120 180 130 130
190 170 110 290 140 210 125
150 150 160 170 230 190 90
120 120 90 280 220 135 210
180 170 135 150 130 130 140
140 200 110 185 180 210 125
130 160 130 150 140 90 210
230 180 170 150 140 125 120
200 170 130 170 120 140 115
140 160 115 210 140 160 100
150 150 145 140 150 230 130
170 100 130 140 190 100 130
180 100 170 160 210 120 110
160 180 160 120 130 120 150
200 130 90 230 190 150 110
90 200 110 100 220 110 90
130 120 130 190 160 150 120
140 145 130 90 105 130 115
200 130 120 100 120 150 140
220 100 130 125 140 130 130
200 130 180 180 130 145 160
120 160 140 200 115 160 110
310 125 175 160 115 120 165
160 100 185 170 100 220 120
115 140 190 85 150 145 150
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 735

Tasa de flujo nasal inspiratorio máximo (L/min)

Totalmente claro no muy claro parcialmente bloqueado

170 185 130 150 130 150 170


130 180 160 280 130 120 110
220 115 160 140 170 155 120
250 260 130 100 130 100 85
160 160 135 140 145 140
130 170 130 90
130 115 120 190
150 150 190 130
160 130 170
Fuente: Datos proporcionados por cortesía de J. Jose, MS, FRCS.

9.Diez sujetos con asma bronquial participaron en un experimento para evaluar la eficacia relativa de tres
fármacos. La siguiente tabla muestra el cambio en FEV1(volumen espirado forzado en 1 segundo) valores
(expresados en litros) 2 horas después de la administración del fármaco:

Droga Droga

Sujeto A B C Sujeto A B C

1 . 00 . 13 . 26 6 . 03 . 18 . 25
2 . 04 . 17 . 23 7 . 05 . 21 . 32
3 . 02 . 20 . 21 8 . 02 . 23 . 38
4 . 02 . 27 . 19 9 . 00 . 24 . 30
5 . 04 . 11 . 36 10 . 12 . 08 . 30

¿Son estos datos suficientes para indicar una diferencia en la eficacia de los medicamentos? Dejara¼ :05. ¿Cuál es elpag valor
para esta prueba?

10Una faceta del plan de estudios de enfermería en la Universidad Estatal de Wright requiere que los estudiantes usen las
matemáticas para realizar los cálculos de dosis apropiados. En un estudio realizado por Wendy Gantt (A-14), a los
estudiantes universitarios de enfermería se les administró una prueba de matemáticas estandarizada para
determinar su aptitud matemática (escala: 0–100). Los estudiantes se dividieron en dos grupos: edad universitaria
tradicional (18–24 años, 26 observaciones) y no tradicional (25 años).þ,ocho observaciones). Los puntajes en la prueba
de matemáticas aparecen en la siguiente tabla:

Puntuaciones de estudiantes tradicionales Puntuaciones de estudiantes no tradicionales

70 6 88 77
57 79 68 72
85 14 88 54
55 82 92 87
87 45 85 85
(Continuado)
736 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Puntuaciones de estudiantes tradicionales Puntuaciones de estudiantes no tradicionales

84 57 56 62
56 91 31 77
68 76 80 86
94 60
Fuente: Datos proporcionados por cortesía de Wendy Gantt y el Centro de Consultoría Estadística de la
Universidad Estatal de Wright.

¿Estos datos proporcionan evidencia suficiente para indicar una diferencia en las medianas de la población? Dejara¼ :05. ¿Cuál
es elpagvalor para esta prueba? Utilice tanto la prueba de la mediana como la prueba de Mann-Whitney y compare los
resultados.

11Los siguientes son los PaCO2(mm Hg) valores en 16 pacientes con enfermedad broncopulmonar:

39, 40, 45, 48, 49, 56, 60, 75, 42, 48, 32, 37, 32, 33, 33, 36

Use la prueba de Kolmogorov-Smirnov para probar la hipótesis nula de que PaCO2valores en la población
muestreada se distribuyen normalmente conmetro¼44 ys¼12

12La siguiente tabla muestra el aporte calórico (cal/día/kg) y el consumo de oxígeno VO2(ml/min/kg) en 10
lactantes:

Caloría Caloría
ingesta (X) VO2(Y) ingesta (X) VO2(Y)

50 7.0 100 10.8


70 8.0 150 12.0
90 10.5 110 10.0
120 11.0 75 9.5
40 9.0 160 11.9

Pruebe la hipótesis nula de que las dos variables son mutuamente independientes contra la alternativa de que están
directamente relacionadas. Dejara¼0:5. Cuál es elpagvalor para esta prueba?

13Mary White (A-15) encuestó a médicos para medir sus opiniones sobre la importancia de la ética en la práctica
médica. La herramienta de medición utilizó una escala de 1 a 5 en la que un valor más alto indica una opinión
más alta sobre la importancia de la ética. Las edades y puntajes de los sujetos del estudio se muestran en la
siguiente tabla. ¿Se puede concluir sobre la base de estos resultados que la edad y el puntaje de ética están
directamente relacionados? Sea .05 la probabilidad de cometer un error tipo I. Cuál es elpag¿valor?

Edad Ética Edad Ética Edad Ética

25 4.00 26 4.50 26 4.50


34 4.00 29 4.75 27 5.00
30 4.25 30 4.25 22 3.75
31 3.50 26 4.50 22 4.25
25 4.75 30 4.25 24 4.50
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 737

Edad Ética Edad Ética Edad Ética

25 3.75 25 3.75 22 4.25


25 4.75 24 4.75 24 3.75
29 4.50 24 4.00 38 4.50
29 4.50 25 4.50 22 4.50
26 3.75 25 4.00 22 4.50
25 3.25 26 4.75 25 4.00
29 4.50 34 3.25 23 3.75
27 3.75 23 4.50 22 4.25
29 4.25 26 3.25 23 4.00
25 3.75 23 5.00 22 4.25
25 4.50 24 4.25 25 3.50
25 4.00 45 3.25 26 4.25
26 4.25 23 3.75 25 4.25
26 4.00 25 3.75 27 4.75
24 4.00 25 3.75 23 3.75
25 4.00 23 3.75 22 4.00
22 3.75 23 4.75 26 4.75
26 4.50 26 4.00 22 4.25 Fuente: Datos proporcionados por cortesía de Mary White,

23 4.00 Doctor. y el Centro de Consultoría Estadística de la


Universidad Estatal de Wright.

14Dominic Sprott (A-16) realizó un experimento con conejos en el que la variable de resultado fue la
infiltración grasa en la masa del hombro (PFI, medida como porcentaje). Al inicio, a 15 conejos se les
había desprendido un músculo del hombro elegido al azar. Luego se volvió a unir el hombro. Seis
semanas más tarde, se sacrificaron cinco conejos elegidos al azar y se registraron las diferencias en el
PFI entre el hombro vuelto a unir y el hombro no separado (grupo A). Seis meses más tarde, se
sacrificaron los 10 conejos restantes y se registraron de nuevo las diferencias en el PFI entre el
hombro vuelto a unir y el hombro no separado (grupo B).

Diferencia de porcentaje de infiltración de grasa


(No desconectado–Reconectado)

Grupo A Grupo B

2.55 1.04 1.38


0.9 3.29 0.75
0.2 0.99 0.36
- 0:29 1.79 0.74
1.11 - 0:85 0.3 Fuente: Datos proporcionados por cortesía de Dominic Sprott, MD y el Centro de
Consulta Estadística de la Universidad Estatal de Wright.

¿Podemos concluir, con un nivel de significación de 0,05, que los tratamientos tienen un efecto diferencial sobre el PFI
entre los dos músculos del hombro? Cuál es elpagvalor para la prueba?

En cada uno de los ejercicios del 15 al 29, haga uno o más de los siguientes que considere
apropiados:
(a)Aplicar una o más de las técnicas discutidas en este capítulo.
(b)Aplicar una o más de las técnicas discutidas en capítulos anteriores.
738 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

(C)Formule hipótesis relevantes, realice las pruebas apropiadas y encuentrepagvalores.


(d)Indique las decisiones estadísticas y las conclusiones clínicas que justifican los resultados de sus pruebas de
hipótesis.
(mi)Describa la(s) población(es) a las que cree que se aplican sus inferencias.
(F)Indique las suposiciones necesarias para la validez de sus análisis.

15.El propósito de un estudio de Damm et al. (A-17) fue investigar la sensibilidad a la insulina y la secreción de insulina en
mujeres con diabetes gestacional (DMG) previa. Los sujetos fueron 12 mujeres tolerantes a la glucosa de peso normal
(edad media, 36,6 años; desviación estándar, 4,16) con diabetes gestacional previa y 11 controles (edad media, 35
años; desviación estándar, 3,3). Entre los datos recopilados se encuentran los siguientes valores de insulina
plasmática en ayunas (mmol/L). Utilice la prueba de Mann-Whitney para determinar si puede concluir sobre la base
de estos datos que las dos poblaciones representadas difieren con respecto al nivel promedio de insulina en plasma
en ayunas.

Control S DMG anterior Control S DMG anterior

46.25 30.00 40.00 31.25


40.00 41.25 30.00 56.25
31.25 56.25 51.25 61.25
38.75 45.00 32.50 50.00
41.25 46.25 43.75 53.75
38.75 46.25 62.50

Fuente: Datos proporcionados por cortesía del Dr. Peter Damm.

dieciséis.Gutín et al. (A-18) compararon tres medidas de composición corporal, incluida la absorciometría de rayos
X de energía dual (DXA). Los sujetos eran niños aparentemente sanos (21 niños y 22 niñas) de entre 9 y 11
años. Entre los datos recopilados se encuentran las siguientes mediciones de los compartimentos de
composición corporal por DXA. Los investigadores estaban interesados en la correlación entre todos los
pares posibles de estas variables.

Hueso Libre de grasas

Libre de grasas Mineral Suave

Porcentaje de grasa Grasa corporal Masa Contenido Tejido

11.35 3.8314 29.9440 1.19745 28.7465


22.90 6.4398 21.6805 0.79250 20.8880
12.70 4.0072 27.6290 0.95620 26.6728
42.20 24.0329 32.9164 1.45740 31.4590
24.85 9.4303 28.5009 1.32505 27.1758
26.25 9.4292 26.4344 1.17412 25.2603
23.80 8.4171 26.9938 1.11230 25.8815
37.40 20.2313 33.8573 1.40790 32.4494
14.00 3.9892 24.4939 0.95505 23.5388
19.35 7.2981 30.3707 1.45545 28.9153
29.35 11.1863 26.8933 1.17775 25.7156
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 739

Hueso Libre de grasas

Libre de grasas Mineral Suave

Porcentaje de grasa Grasa corporal Masa Contenido Tejido

18.05 5.8449 26.5341 1.13820 25.3959


13.95 4.6777 28.9144 1.23730 27.6771
32.85 13.2474 27.0849 1.17515 25.9097
11.40 3.7912 29.5245 1.42780 28.0967
9.60 3.2831 30.8228 1.14840 29.6744
20.90 7.2277 27.3302 1.24890 26.0813
44.70 25.7246 31.8461 1.51800 30.3281
17.10 5.1219 24.8233 0.84985 23.9734
16.50 5.0749 25.7040 1.09240 24.6116
14.35 5.0341 30.0228 1.40080 28.6220
15.45 4.8695 26.6403 1.07285 25.5674
28.15 10.6715 27.2746 1.24320 26.0314
18.35 5.3847 23.9875 0.94965 23.0379
15.10 5.6724 31.9637 1.32300 30.6407
37.75 25.8342 42.6004 1.88340 40.7170
39.05 19.6950 30.7579 1.50540 29.2525
22.25 7.2755 25.4560 0.88025 24.5757
15.50 4.4964 24.4888 0.96500 23.5238
14.10 4.3088 26.2401 1.17000 25.0701
26.65 11.3263 31.2088 1.48685 29.7219
20.25 8.0265 31.5657 1.50715 30.0586
23.55 10.1197 32.8385 1.34090 31.4976
46.65 24.7954 28.3651 1.22575 27.1394
30.55 10.0462 22.8647 1.01055 21.8541
26.80 9.5499 26.0645 1.05615 25.0083
28.10 9.4096 24.1042 0.97540 23.1288
24.55 14.5113 44.6181 2.17690 42.4412
17.85 6.6987 30.8043 1.23525 29.5690
20.90 6.5967 24.9693 0.97875 23.9905
33.00 12.3689 25.1049 0.96725 24.1377
44.00 26.1997 33.3471 1.42985 31.9172
19.00 5.0785 21.6926 0.78090 20.9117

Fuente: Datos proporcionados por cortesía del Dr. Mark Litaker.

17La preocupación de un estudio de Crim et al. (A-19) fue el papel potencial del análisis de citometría de flujo del
líquido de lavado broncoalveolar (BALF) en el diagnóstico del rechazo pulmonar agudo. Los investigadores
señalan que estudios previos sugirieron una asociación de rechazo pulmonar agudo con aumentos en CD8þ
linfocitos y aumento de la expresión del antígeno linfocitario humano (HLA)-DR y del receptor de
interleucina-2 (IL-2R). Los sujetos consistieron en receptores de trasplante de pulmón (LT) que no tenían
evidencia histológica de rechazo o infección, voluntarios humanos normales (NORM), voluntarios sanos
receptores de trasplante de corazón (HT) y receptores de trasplante de pulmón que experimentaban rechazo
pulmonar agudo (AR). Entre los datos recopilados se encuentran los siguientes porcentajes de BALF CD8þ
linfocitos que también expresan IL-2R observados en los cuatro grupos de sujetos.
740 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Norma HT LT Arkansas

0 0 1 6 12
2 0 0 6 0
1 5 5 8 9
0 4 0 dieciséis 7
0 6 0 24 2
2 0 5 5 6
3 0 18 3 14
0 4 2 22 10
0 8 2 10 3
1 8 8 0 0
0 8 0
7 3 1
2 4 1
5 4 0
1 18 0
Fuente: Datos proporcionados por cortesía
0 4
de la Dra. Courtney Crim.

18Ichinose et al. (A-20) estudiaron la participación de las taquiquininas endógenas en el estrechamiento de las vías
respiratorias inducido por el ejercicio en pacientes con asma por medio de un antagonista selectivo del receptor de
neuroquinina 1, FK-888. Nueve sujetos (ocho hombres, una mujer) de 18 a 43 años con al menos un 40 por ciento de
caída en la conductancia específica de las vías respiratorias participaron en el estudio. Los siguientes son los datos de
consumo de oxígeno (ml/min) de los sujetos en reposo y durante el ejercicio mientras estaban en tratamiento con un
placebo y FK-888:

Placebo FK-888

Ejercicio en reposo Ejercicio en reposo

303 2578 255 2406


288 2452 348 2214
285 2768 383 3134
280 2356 328 2536
295 2112 321 1942
270 2716 234 2652
274 2614 387 2824
185 1524 198 1448
Fuente: Datos proporcionados por
364 2538 312 2454 cortesía del Dr. Kunio Shirato.

19factor de crecimiento transformantea (TGFa),según Tomiya y Fujiwara (A-21), se alega que desempeña un papel
en la progresión maligna así como en el crecimiento celular normal de manera autocrina, y se ha informado
que sus niveles séricos aumentan durante esta progresión. Los presentes investigadores han desarrollado
un ensayo inmunoabsorbente ligado a enzimas (ELISA) para medir el TGF sérico.aniveles en el diagnóstico de
carcinoma hepatocelular (CHC) como complicación de la cirrosis. En un estudio en el que evaluaron la
importancia del TGF séricoaniveles con fines de diagnóstico, recogieron los siguientes
PREGUNTAS DE REPASO Y EJERCICIOS 741

mediciones en las pruebas de función hepática, TGFa (pg/ml) y sueroa-fetoproteína (AFP) (ng/ml) de
pacientes con CHC:

TGFa AFP TGFa AFP TGFa AFP TGFa AFP

32,0 12866 44.0 23077 100.0 479 15.0 921


65,9 9 75,0 371 12.0 47 34,0 118
25,0 124.3 36,0 291 32,0 177 100.0 6.2
30.0 9 65,0 700 98.0 9 26,0 19
22.0 610 44.0 40 20.0 1063 53.0 594
40,0 238 56,0 9538 20.0 21 140.0 10
52.0 153 34,0 19 9.0 206 24.0 292
28,0 23 300.0 11 58.0 32 20.0 11
11.0 28 39.0 42246 39.0 628 35,0 37
45,0 240 82.0 12571 52.0 35
29,0 66 85.0 20 50.0 742
45,0 83 24.0 29 95.0 10
21.0 4 40,0 310 18.0 291
38.0 214 9.0 19
Fuente: Datos proporcionados por cortesía del Dr. Kenji Fujiwara.

20El objetivo de un estudio de Sakhaee et al. (A-22) fue determinar el contenido corporal de aluminio (A1) de forma
no invasiva utilizando el incremento en el suero y la orina después de la administración intravenosa de
deferoxamina (DFO) en pacientes con cálculos renales y mujeres con osteoporosis en tratamiento a largo
plazo con citrato de potasio (K3Cit) o dicitrato tricálcico (Ca3ciudad2), respectivamente. Los sujetos
consistieron en 10 pacientes con nefrolitiasis de calcio y cinco pacientes con osteoporosis que se
mantuvieron con citrato de potasio o citrato de calcio durante 2 a 8 años, respectivamente, más 16
voluntarios normales sin antecedentes de uso regular de antiácidos que contienen aluminio. Entre los datos
recopilados se encuentran las siguientes mediciones de excreción de aluminio en orina de 24 horasdmetro
g=díaÞantes (PRE) y después (POST) de una infusión de DFO de 2 horas.

Grupo PRE CORREO Grupo PRE CORREO

Control 41.04 135.00 Mando 9.39 12.32


Control 70,00 95,20 Mando 10.72 13.42
Control 42,60 74,00 Mando 16,48 17.40
Control 15,48 42,24 Mando 10,20 14.20
Control 26,90 104,30 Mando 11,40 20.32
Control 16,32 66,90 Mando 8,16 12.80
Control 12,80 10,68 Mando 14,80 62.00
Control 68.88 46.48 Paciente 15.20 27.15
Control 25.50 73.80 Paciente 8.70 38.72
Paciente 0.00 14.16 Paciente 5.52 7.84
Paciente 2.00 20.72 Paciente 13.28 31.70
Paciente 4.89 15.72 Paciente 3.26 17.04
Paciente 25.90 52.40 Paciente 29,92 151,36
Paciente 19.35 35.70 Paciente 15,00 61,38
(Continuado)
742 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

Grupo PRE CORREO Grupo PRE CORREO

Paciente 4.88 70.20 Paciente 36,80 142,45


Paciente 42.75 86.25

Fuente: Datos proporcionados por cortesía del Dr. Khashayar Sakhaee.

21El propósito de un estudio de Dubuis et al. (A-23) fue determinar si el déficit neuropsicológico de los niños con la forma
grave de hipotiroidismo congénito se puede evitar mediante el inicio más temprano de la terapia y dosis más altas de
levotiroxina. Los sujetos consistieron en 10 bebés (de 3 a 24 días de edad) con hipotiroidismo congénito severo y 35
bebés (de 2 a 10 días de edad) con hipotiroidismo congénito moderado. Entre los datos recopilados se encuentran las
siguientes mediciones en plasma T4(nmol/L) niveles en la selección:

Casos severos Casos moderados

T4 T4 T4
Sexo (nmol/L) Sexo (nmol/L) Sexo (nmol/L)

METRO dieciséis F 20 F 62
METRO 57 F 34 METRO 50
METRO 40 F 188 F 40
F 50 F 69 F 116
F 57 F 162 F 80
F 38 F 148 F 97
F 51 F 108 F 51
F 38 F 54 F 84
METRO F 96 F 51
F 60 METRO 76 F 94
METRO 122 METRO 158
METRO 43 F
F 40 METRO 47
F 29 METRO 143
F 83 METRO 128
F 62 METRO 112
METRO 111
¼Datos perdidos.
F 84
Fuente: Datos proporcionados por
METRO 55 cortesía del Dr. Guy Van Vliet.

22Kuna et al. (A-24) realizó un estudio relacionado con las quimiocinas en la rinitis alérgica estacional. Los sujetos
incluyeron 18 individuos atópicos con rinitis alérgica estacional causada por polen de ambrosía. Entre los
datos recopilados sobre estos sujetos se encontraban las siguientes mediciones de histamina y proteína
catiónica de eosinófilos (ECP):

PCE (ng/ml) Histamina (ng/ml) PCE (ng/ml) Histamina (ng/ml)

511.0 31.2 25.3 5.6


388.0 106.0 31.1 62.7
14.1 37.0 325.0 138.0
314.0 90,0 437.0 116.0
(Continuado)
PREGUNTAS DE REPASO Y EJERCICIOS 743

PCE (ng/ml) Histamina (ng/ml) PCE (ng/ml) Histamina (ng/ml)

74.1 29,0 277.0 70.6


8.8 87.0 602.0 184.0
144.0 45,0 33.0 8.6
56,0 151.8 661.0 264.0
205.0 86,0 162.0 92.0
Fuente: Datos proporcionados por cortesía del Dr. Allen P. Kaplan.

23El propósito de un estudio de Kim et al. (A-25) fue investigar los cambios en serie en los niveles de lipoproteína Lp(a) con
la pérdida de hormonas sexuales femeninas por la menopausia quirúrgica y con la terapia de reemplazo de
estrógenos en las mismas mujeres. Los sujetos fueron 44 mujeres premenopáusicas que se sometieron a una
histerectomía transabdominal (TAH). Treinta y una de las mujeres se sometieron a una TAH y salpingooforectomía
unilateral (USO), y 13 se sometieron a una TAH y salpingooforectomía bilateral (BSO). Las mujeres tenían entre 30 y
53 años de edad. Los sujetos del grupo BSO recibieron 0,625 mg de estrógeno equino conjugado diariamente 2
meses después de la operación. Los siguientes fueron los niveles de colesterol total de los sujetos antes (TC0), 2
meses después (TC2) y 4 meses después (TC4) del procedimiento quirúrgico y la terapia de reemplazo hormonal.

USO USO
Sujeto TC0 TC2 TC4 Sujeto TC0 TC2 TC4

1 202 203 196 25 134 131 135


2 204 183 203 26 163 190 185
3 206 199 192 27 196 183 192
4 166 180 176 28 181 194 208
5 150 171 154 29 160 162 181
6 137 134 129 30 188 200 181
7 164 168 171 31 172 188 189
8 207 249 223
9 126 121 140 BSO
10 131 141 167
Sujeto TC0 TC2 TC4
11 133 159 149
12 142 152 140 32 224 218 239
13 225 193 180 33 202 196 231
14 158 182 179 34 181 182 208
15 184 177 182 35 191 230 208
dieciséis 223 244 234 36 248 284 279
17 154 178 187 37 224 228 199
18 176 137 162 38 229 318 272
19 205 253 288 39 147 199 194
20 167 156 136 40 248 258 302
21 164 176 191 41 160 218 229
22 177 168 185 42 175 187 166
23 140 175 167 43 262 260 247
24 167 186 195 44 189 199 181
Fuente: Datos proporcionados por cortesía del Dr. Chee Jeong Kim.
744 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

24Velthuis et al. (A-26) realizaron un estudio para evaluar si la combinación de heparina inmovilizada pasivamente y
heparización estándar puede reducir la activación del complemento en pacientes sometidos a una intervención
quirúrgica cardíaca. Los investigadores señalan que los circuitos extracorpóreos recubiertos de heparina reducen la
activación del complemento durante las operaciones cardíacas, pero que se dispone de poca información in vivo
sobre la reducción de la activación de las vías alternativa y clásica. La activación del complemento inicia una respuesta
inflamatoria sistémica durante y después de las operaciones cardíacas y se asocia con eventos fisiopatológicos como
depresión cardíaca posoperatoria, fuga capilar pulmonar y hemólisis. Los sujetos fueron 20 pacientes que se
sometieron a un injerto de derivación cardiopulmonar (CPB) electivo asignados al azar para ser tratados con circuitos
extracorpóreos recubiertos de heparina (H) o circuitos no recubiertos (U). Entre los datos recopilados se encuentran
las siguientes concentraciones del complejo del complemento terminal en plasma (SC5b-9) al inicio, 10 minutos
después del inicio de la CEC, al finalizar la CEC y después de la administración de sulfato de protamina:

Paciente Tratamiento Base 10 min CEC Finalizar CEC protamina

1 tu 0.37 0.81 1.88 2.12


2 tu 0.48 0.73 3.28 3.31
3 tu 0.48 0.42 2.94 1.46
4 H 0.37 0.44 1.28 3.82
5 H 0.38 0.31 0.50 0,68
6 tu 0.38 0.43 1.39 5.04
7 H 0.46 0.57 1.03 1.29
8 H 0.32 0.35 0.75 1.10
9 tu 0.41 0,94 1.57 2.53
10 tu 0.37 0.38 2.07 1.69
11 H 0.48 0.33 1.12 1.04
12 H 0.39 0.39 1.69 1.62
13 tu 0.27 0.41 1.28 2.26
14 H 0.51 0.27 1.17 1.05
15 H 0.97 0.75 1.82 1.31
dieciséis tu 0.53 1.57 4.49 2.15
17 tu 0.41 0.47 1.60 1.87
18 tu 0.46 0,65 1.49 1.24
19 H 0.75 0.78 1.49 1.57
20 H 0,64 0.52 2.11 2.44
Fuente: Datos proporcionados por cortesía del Dr. Henk te Velthuis.

25Heijdra et al. (A-27) afirman que muchos pacientes con enfermedad pulmonar obstructiva crónica (EPOC) grave
tienen baja saturación arterial de oxígeno durante la noche. Estos investigadores realizaron un estudio para
determinar si existe una relación causal entre la disfunción de los músculos respiratorios y la saturación
nocturna. Los sujetos fueron 20 (cinco mujeres, 15 hombres) pacientes con EPOC asignados aleatoriamente
para recibir entrenamiento muscular inspiratorio con flujo objetivo (TF-IMT) al 60 por ciento de su presión
bucal inspiratoria máxima (PImáximo) o TF-IMT falso al 10 por ciento de PImáximo. Entre los datos recopilados se
encuentran los siguientes tiempos de resistencia (Tiempo, s) para cada sujeto al inicio del entrenamiento y 10
semanas después:
PREGUNTAS DE REPASO Y EJERCICIOS 745

Tiempo (s) TF-IMT Tiempo (s) TF-IMT


60% IPmáximo 10% IPmáximo

Semana 0 semana 10 Semana 0 semana 10

330 544 430 476


400 590 400 320
720 624 900 650
249 330 420 330
144 369 679 486
440 789 522 369
440 459 116 110
289 529 450 474
819 1099 570 700
540 930 199 259
Fuente: Datos proporcionados por cortesía de la Dra. Yvonne F. Heijdra.

26Los tres objetivos de un estudio de Wolkin et al. (A-28) fueron para determinar (a) los efectos del tratamiento crónico con
haloperidol sobre el metabolismo cerebral en pacientes esquizofrénicos, (b) la relación entre los síntomas negativos y
los cambios regionales inducidos por haloperidol en la utilización de glucosa cerebral, y (c)
la relación entre el cambio metabólico y el efecto antipsicótico clínico. Los sujetos fueron 18 pacientes masculinos
hospitalizados para veteranos (10 negros, cinco blancos y tres hispanos) con descompensación aguda o crónica de la
esquizofrenia. Los sujetos tenían edades comprendidas entre los 26 y los 44 años, y la duración de la enfermedad
oscilaba entre los 7 y los 27 años. Entre los datos recopilados se encuentran las siguientes puntuaciones previas al
tratamiento en la subprueba de sustitución de dígitos y símbolos del WAIS-R (DSY1RW) y el cambio inducido por
haloperidol en la corteza prefrontal dorsolateral izquierda absoluta (DLLA3V1) y la corteza prefrontal dorsolateral
derecha absoluta (DLRA3V1) medidas en unidades demetromol glucosa/100 g tejido/min:

DSY1RW DLLA3V1 DLRA3V1 DSY1RW DLLA3V1 DLRA3V1

47 - 7:97 - 17:17 18 - 4:91 - 9:58


dieciséis - 8:08 - 9:59 0 - 1:71 . 40
31 - 10:15 - 11:58 29 - 4:62 - 4:57
34 - 5:46 - 2:16 17 9.48 11.31
22 - 17:12 - 12:95 38 - 6:59 - 6:47
70 - 12:12 - 13:01 64 - 12:19 - 13:61
59 - 9:70 - 12:61 52 - 15:13 - 11:81
41 - 9:02 - 7:48 50 - 10:82 - 9:45
0 4.67 7.26 62 - 4:92 - 1:87
Fuente: Datos proporcionados por cortesía del Dr. Adam Wolkin.

27El propósito de un estudio de Maltais et al. (A-29) fue comparar y correlacionar el aumento de ácido láctico arterial (La)
durante el ejercicio y la capacidad oxidativa del músculo esquelético en pacientes con enfermedad pulmonar
obstructiva crónica (EPOC) y sujetos control (C). Había nueve sujetos en cada grupo. La edad media de los pacientes
fue de 62 años con una desviación estándar de 5. Los sujetos de control tenían una edad media de 54 años con una
desviación estándar de 3. Entre los datos recopilados se encontraban los
746 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

siguientes valores para la actividad de fosfofructoquinasa (PFK), hexoquinasa (HK) y lactato


deshidrogenasa (LDH) para los dos grupos:

PFK Hong Kong LDH


C EPOC C EPOC C EPOC

106.8 49,3 2,0 2.3 241.5 124.3


19,6 107,1 3,2 1.4 216.8 269.6
27,3 62,9 2,5 1.0 105.6 247.8
51,6 53,2 2,6 3.6 133.9 200.7
73,2 105,7 2,4 1.3 336.4 540.5
89,6 61,3 2,4 2.9 131.1 431.1
47,7 28,2 3,5 2.2 241.4 65.3
113,5 68,5 2,2 1.5 297.1 204.7
46,4 40,8 2,4 1.6 156.6 137.6

Fuente: Datos proporcionados por cortesía del Dr. FrancSois Maltais.

28Torre et al. (A-30) realizó un estudio para determinar los niveles séricos de nitrito en pacientes pediátricos con infección
por el virus de la inmunodeficiencia humana tipo 1 (VIH-1). Los sujetos incluyeron 10 niños de control sanos (seis
niños y cuatro niñas) con una edad media de 9,7 años y una desviación estándar de 3,3. El resto de los sujetos eran 21
niños nacidos de madres infectadas por el VIH-1. De estos, siete (tres niños y cuatro niñas) estaban afectados por el
SIDA. Tenían una edad media de 6 años con una desviación estándar de 2,8. Los 14 niños restantes (siete niños y siete
niñas) se volvieron seronegativos para el VIH-1 durante el primer año de vida. Su edad media fue de 3,3 años con una
desviación estándar de 2,3 años. Entre los datos recopilados se encuentran los siguientes niveles séricos de nitritod
metromol=LÞ:

Control S Niños seronegativizados Pacientes VIH-1-positivos


norte¼10 norte¼14 norte¼7

0.301 0.335 0.503


0.167 0.986 0.268
0.201 0.846 0.335
0.234 1.006 0.946
0.268 2.234 0.846
0.268 1.006 0.268
0.201 0.803 0.268
0.234 0.301
0.268 0.936
0.301 0.268
0.134
0.335
0.167
0.234

Fuente: Datos proporcionados por cortesía del Dr. Donato Torre.

29Seghaye et al. (A-31) analizaron la influencia de la aprotinina en dosis bajas sobre la activación del complemento,
la estimulación leucocitaria, la producción de citocinas y la respuesta de fase aguda en niños sometidos a
REFERENCIAS 747

operaciones cardíacas. El criterio de inclusión para el estudio fue un defecto cardíaco congénito no cianótico que
requería un procedimiento quirúrgico primario relativamente simple asociado con un riesgo postoperatorio bajo.
Entre los datos recopilados se encuentran las siguientes mediciones de interleucina-6 (IL-6) y proteína C reactiva
(PCR) obtenidas 4 y 24 horas después de la operación, respectivamente:

IL-6 PCR IL-6 PCR IL-6 PCR

122 32 467 53 215 50


203 39 421 29 415 41
458 63 421 44 66 12
78 7 227 24 58 14
239 62 265 31 213 9
165 22 97 12
Fuente: Datos proporcionados por cortesía de la Dra. Marie-Christine Seghaye.

Ejercicios para uso con grandes conjuntos de datos disponibles en el siguiente sitio web:
www.wiley.com/college/daniel

1.El proyecto de ley 2071 (AB 2071) de la Asamblea del Estado de California exigía que los pacientes de las clínicas de
metadona se sometieran a un mínimo de 50 minutos de asesoramiento al mes. Evan Kletter (A-32) recopiló datos
sobre 168 sujetos que estaban continuamente activos en tratamiento a través de los centros de Investigación y
Tratamiento de Adicciones del Área de la Bahía (BAART) durante 1 año antes y 2 años después de la
implementación de AB 2071. Antes de AB 2071, los consejeros del centro BAART pasaban dos sesiones de al
menos 15 minutos por sesión por mes con cada cliente. Los sujetos del estudio también fueron identificados
como consumidores de cocaína. Las observaciones en KLETTER son los porcentajes de falla en una prueba de
drogas de cocaína para cada uno de los sujetos antes y después de AB 2071. Por ejemplo, un valor previo de 60
implica que el paciente falló una prueba de cocaína el 60 por ciento de las veces antes de adopción de AB 2071.
El Dr. Kletter realizó una prueba de suma de rangos de Wilcoxon para determinar si el porcentaje de pruebas
fallidas disminuyó significativamente después de la aprobación de AB 2071. Use los datos para determinar a qué
conclusión pudo llegar. Informe la estadística de prueba ypagvalor.

REFERENCIAS

Referencias de metodología
1. F.RANGOWILCOXÓN, "Comparaciones individuales por métodos de clasificación,"biometría, 1 (1945), 80–83.
2. AM MDOO,Introducción a la Teoría de la Estadística,McGraw-Hill, Nueva York, 1950.
3. J. W.ESTENBERG, “Prueba de significancia para la mediana y el rango intercuartílico en muestras de poblaciones continuas de
cualquier forma,”Procedimientos Koninklijke Nederlandse Akademie Van Wetenschappen, 51 (1948), 252–261.
4. GW BFILAy soy mDOO, “Sobre la mediana de las pruebas de hipótesis lineales”,Actas del Segundo Simposio de Berkeley
sobre Estadística Matemática y Probabilidad,Prensa de la Universidad de California, Berkeley, 1951, 159–166.
5. HB MANAy DR WHITNEY, "En una prueba de si una de dos variables aleatorias es estocásticamente más grande
que la otra",Anales de estadística matemática, 18 (1947), 50–60.
6. AN KOLMOGOROV, “Sulla Determinazione Empirial di una Legge di Distribuizione,”Giornale dell'Institut
Italiano degli Altuari, 4 (1933), 83–91.
7. NV SMIRNOV, “Estimación de la desviación entre funciones de distribución empíricas en dos muestras
independientes” (en ruso),Boletín de la Universidad de Moscú, 2 (1939), 3–16.
748 CAPÍTULO 13 ESTADÍSTICAS NO PARAMÉTRICAS Y LIBRES DE DISTRIBUCIÓN

8. WH KRUSKALy WAWTODO ES, “Uso de rangos en análisis de varianza de un criterio,”Revista de la Asociación


Estadounidense de Estadística, 47 (1952), 583–621; fe de erratas,ibíd., 48 (1953), 907–911.
9. M. F.RIEDMAN, "El uso de rangos para evitar la suposición de normalidad implícita en el análisis de varianza", Revista de la
Asociación Estadounidense de Estadística, 32 (1937), 675–701.
10. M. F.RIEDMAN, “Una comparación de pruebas alternativas de significación para el problema demetroclasificaciones,”Anales de
estadística matemática, II (1940), 86–92.
11. C. S.PEARMAN, "La prueba y medida de la asociación entre dos cosas",Diario Americano de Psicología, 15 (
1904), 72–101.
12. H. T.HEIL, “Un método de rango invariante de análisis de regresión lineal y polinomial. III,”Koninklijke
Nederlandse Akademie Van Wetenschappen, Actas, Serie A, 53 (1950), 1397–1412.
13. E. J.ACQUELINDIETZ, “Enseñanza de la regresión en un curso de estadística no paramétrica”,Estadístico estadounidense, 43
(1989), 35–40.
14. J.EANDGIBONES,Métodos no paramétricos para análisis cuantitativo,Tercera edición, American Sciences Press,
Syracuse, NY, 1996.
15. mARJORIEAPTET,Estadísticas no paramétricas para la investigación del cuidado de la salud,Publicaciones Sage, Thousand Oaks, CA,
1997.

Aplicaciones Referencias
A-1. ROBERTOBPARKER, RyanYATE, jUDITHESOBERMAN, y CASEYLAIZURA, "Efectos del jugo de toronja en la glicoproteína P
intestinal: evaluación con digoxina en humanos"Farmacoterapia, 23 (2003), 979–987.
A-2. CCRISTINAGRAMOVIOLACIÓN, mARIASANDGREN, LARS-OLAFHANSSON, mATSmiRICSON, y T€oRESTHEORELL, “¿Cantar
¿Promover el bienestar?: un estudio empírico de cantantes profesionales y aficionados durante una lección de canto”, Ciencias
fisiológicas y del comportamiento integradoras, 38 (2003), 65–74.
A-3. RSZUCKERMANy S. H.ENEGHAN, "La duración de la depresión hemodinámica durante la colecistectomía
laparoscópica",Endoscopia quirúrgica, 16 (2002), 1233–1236.
A-4. CUN ROLWCRANORy DCERVEZA INGLESAANTES DE CRISTOHRISTENSEN, “El Proyecto Asheville: Resultados a corto plazo de un
programa de atención de la diabetes en una farmacia comunitaria”,Diario de la Asociación Farmacéutica Americana,
43 (2003), 149–159.
A-5. YITAOLIU, LUDMILABELAYEV, WEIZHAOZHAO, RAULBUSTO, y MYRONDGINSBURG, “MRZ 2(579, una novela
poco competitivoNORTE-Antagonista de metil-D-aspartato, reduce el volumen del infarto y la inflamación del cerebro y mejora el déficit
neurológico después de la isquemia cerebral focal en ratas”,Investigación del cerebro, 862 (2000), 111–119.
A-6. METROOHAMEDAELSHAIKH, jAMÉSC.U.LCHAKER, CHANDANAA. R.REMOLINO, kENNETHANGERMEIER, miRICAKLEINy J.SÍPAG.
CIEZKI, “Tamsulosina profiláctica (Flomax®) en pacientes sometidos a próstata125I Braquiterapia para el Carcinoma de
Próstata. Informe final de un estudio aleatorizado doble ciego controlado con placebo”,Revista internacional de
radiación en oncología, biología, física, (próximo).
A-7. GLACROIX, CALLEISSOT, FROGERIEUX, R. B.EAULIEU, LCORNU, CGILLETA, FROBIDEL, JP LEFE - VRE, y año fiscal BOIS,
“Disminución de la respuesta alérgica pulmonar inducida por ovoalbúmina por exposición al benzaldehído pero no
al acetaldehído en un modelo de conejillo de Indias”Diario de Toxicología y Salud Ambiental, Parte A, 65 (2002), 995–
1012.
A-8. WHERRMANN, H. S.CORO, JP KPNA, SOYtu €LLER, G. S.TEINy J. G.EISEL, “Papel de la homocisteína, cistationina
y medición de ácido metilmalónico para el diagnóstico de la deficiencia de vitaminas en sujetos de edad avanzada”,Revista
europea de investigación clínica, 30 (2000), 1083–1089.
A-9. CarolFLEXER, kCOMIÓkEMPBILEY, ALISAHINKLEY, CHERYLHARKEMAy J.OHN. Holcomb, “Uso de Sound-Field para
Enseñar conciencia fonémica a niños en edad preescolar”,Diario de Audiencia, 55 (3) (2002), 38–44.
A-10. SATOSHInorteOZAWA, kATSUJISHIMIZU, kIEMETROIYAMOTO, y MIZUOTANAKÁ, "Reparación del defecto pars interarticularis mediante fijación
segmentaria con alambre en atletas jóvenes con espondilólisis",Revista estadounidense de medicina deportiva, 31 (2003), 359–
364.
A-11. MBUTZ, KHWOLLINSKY, U. W.IDEMUTO-CATRINESCU, COMOPERFELADO, SUDOESTEENTERRAR, HH MEHRKENS, CA LUDOLFO,
y H. S.CHREIBER, “Efectos longitudinales de la ventilación con presión positiva no invasiva en pacientes con
esclerosis lateral amiotrófica,”Diario Americano de Rehabilitación Médica, 82 (2003), 597–604.
A-12. TOMOHIROOtaniy ShojikISHI, "Un estudio controlado de vitrectomía para el edema macular diabético",Diario
Americano de Oftalmología, 134 (2002), 214–219.
A-13. JJOSEy SR ELL, "La asociación de la permeabilidad nasal subjetiva con el flujo nasal inspiratorio máximo en una gran
población sana"Otorrinolaringología Clínica, 28 (2003), 352–354.
REFERENCIAS 749

A-14. WFINGRAMOANTTy el Centro de Consulta Estadística de la Universidad Estatal de Wright (2002).


A-15. METROARIOWHITEy el Centro de Consulta Estadística de la Universidad Estatal de Wright (2001). D
A-16. OMINICOSPROTy el Centro de Consulta Estadística de la Universidad Estatal de Wright (2003).
A-17. PAGETERDAMM, hENRIKVESTERGAARD, CLAÚSktu €NS, y OlufPAGEDERSEN, “Deterioro de la insulina no estimulada
Metabolismo oxidativo de la glucosa en mujeres tolerantes a la glucosa con diabetes gestacional anterior”,Diario
americano de obstetricia y ginecología, 174 (1996), 722–729.
A-18. BERNARDOGRAMOUTIN, mARCALITAKER, SYEDIGOLPE, TEN UNMETROANOS, CLAYTONSMITO, y FRANGOTREIBER, "Cuerpo-
Medición de la composición en niños de 9 a 11 años mediante absorciometría de rayos X de energía dual, mediciones del
grosor de los pliegues cutáneos y análisis de bioimpedancia.Diario Americano de Nutrición Clínica, 63 (1996), 287–292.
A-19. COURTNEYCBORDE, CESARAKELLER, CHERIEHDUNPHY, hORACIOMMALUFy J.ENFERMOA.O.har, “Citometría de flujo
Análisis de linfocitos pulmonares en receptores de trasplantes de pulmón”,American Journal of Respiratory and
Critical Care Medicine, 153 (1996), 1041–1046.
A-20. METROASAKAZÚICHINO, mOTOHIKOMETROIURA, hIDEYUKIYAMAUCHI, norteATSUKOkAGEYAMA, mASAFUMITOMAKI, TATSUYA
OYake, YUZURUOHUCHI, WATARUHAIF, hIROSHIMETROIKI, gESTAMURAy kUNÍOSHIRATO, “Un receptor de neuroquinina 1
El antagonista mejora el estrechamiento de las vías respiratorias inducido por el ejercicio en pacientes asmáticos”,American
Journal of Respiratory and Critical Care Medicine, 153 (1996), 936–941.
A-21. TOMOAKITOMIYAy kENJÍFUJIWARA, “Factor de crecimiento transformante del sueroanivel como marcador de carcinoma
hepatocelular que complica la cirrosis”,Cáncer, 77 (1996), 1056-1060.
A-22. kHASHAYARSAKHAEE, LES UNRUML, PAGAULETTEPAGADALINO, SharónHAYNES, y CHARLESYC PAlaska, "La falta de
Influencia del tratamiento a largo plazo con citrato de potasio y citrato de calcio en la carga corporal total de aluminio en
pacientes con riñones en funcionamiento.Diario del Colegio Americano de Nutrición, 15 (1996), 102–106.
A-23. jEAN-METROICHELDUBUIS, jACQUELINEGRAMOLORIEUX, FAISCARICHER, CHERILDEAL, jEANHDUSSAULT, y GUYFurgoneta VLIETA,
“Resultado del hipotiroidismo congénito severo: cerrar la brecha de desarrollo con el tratamiento temprano con
dosis altas de levotiroxina”,Revista de Endocrinología Clínica y Metabolismo, 81 (1996), 222–227.
A-24. PAGIOTRkUNA, mARCALAZAROVICH, y ALLENPAQUETEUN PLAN, "Quimiocinas en la rinitis alérgica estacional",Revista de
Alergia e Inmunología Clínica, 97 (1996), 104–112.
A-25. CjejejEONGkSOY, WESPSEONGRYU, jtuWENkWAK, CHONGTAIKPAGARCA, y túnorteHORYOO, “Cambios en Lp(a)
Niveles de lipoproteínas y lípidos después del cese de la producción de hormonas sexuales femeninas y la terapia de
reemplazo de estrógenos”,Archivos de Medicina Interna, 156 (1996), 500–504.
A-26. HENK TEVELTHUIS, PAGIETGMJANSEN, C. E.RIKHACK, LOE - nortemiIJSMAN, y CHARLESRH WILDEVUUR, "Específico
Inhibición del complemento con circuitos extracorpóreos recubiertos de heparina”,Anales de Cirugía Torácica, 61 (1996),
1153-1157.
A-27. YVONNEFHEIJDRA, PN RICHARDDEKHUIJZEN, CSEELAván HERWAARDEN, y HRespuestaTH. M. F.OLGERING,
“La saturación nocturna mejora con el entrenamiento de los músculos inspiratorios con flujo objetivo en pacientes con EPOC”
American Journal of Respiratory and Critical Care Medicine, 153 (1996), 260–265.
A-28. APRESAWOLKÍN, mICHAELSANFILIPO, miRicaDUNCAN, BURTONANGRIST, ALFREDP. W.OLF, THOMASANTES DE CRISTOOPER,
jONATÁNDBRODIE, miUGENELASKAy J.OHNPROSTROSEN, "Cambio atenuado en la utilización de glucosa cerebral después del
tratamiento con haloperidol en pacientes esquizofrénicos con síntomas negativos prominentes"Diario Americano de
Psiquiatría, 153 (1996), 346–354.
A-29. FRANCOSOISMETROALTAÍS, ANDRE - mi-ANNESIMARD, CLERMONTSIMARD, jEANjOBIN, PAGIERREDESGAGNE - S, y PIERRELmiBLANC,
“Capacidad Oxidativa del Músculo Esquelético y Cinética del Ácido Láctico Durante el Ejercicio en Sujetos Normales y
en Pacientes con EPOC,”American Journal of Respiratory and Critical Care Medicine, 153 (1996), 288–293.
A-30. DONATOTORRE, gIULIOFERRARIO, FILIPPOSPERANZA, ROBERTOMETROARTEGANI, y CLAUDIAZEROLI, “Niveles aumentados
de nitrito en el suero de niños infectados con el virus de la inmunodeficiencia humana tipo 1”,Enfermedades Infecciosas
Clínicas, 22 (1996), 650–653.
A-31. METROARIE-CCRISTINASEGHAYE, jEANDUCHATEAU, RALFAGGCONEJO, kARSTENjABLONKA, TOBÍASWENZL, Ccristina
METROARCO, BRUNOJ. M.ESMER, y GOETZVon BERNUTH, “Influencia de dosis bajas de aprotinina en la reacción inflamatoria
debida a circulación extracorpórea en niños”Anales de Cirugía Torácica, 61 (1996), 1205–1211. miCAMIONETAkCARTA,
A-32. "Consejería como una intervención para el paciente de mantenimiento con metadona que abusa de la cocaína",
Revista de Drogas Psicoactivas, 35 (2003), 271–277.
CAPÍTULO 14
ANÁLISIS DE SUPERVIVENCIA

RESUMEN DEL CAPÍTULO

Este capítulo proporciona una introducción al análisis de los datos que surgen de estudios
en los que el resultado de interés es el tiempo transcurrido hasta la ocurrencia de un
evento. Este tipo de estudios se han utilizado históricamente para monitorear el tiempo
de supervivencia de los pacientes que enfrentan la posibilidad de morir durante el
estudio, de ahí el uso de la descripción de estas técnicas como “análisis de supervivencia”.
Sin embargo, en este capítulo aprenderemos técnicas que se pueden usar en el contexto
de cualquier resultado donde el tiempo de ocurrencia de un evento es de interés.
Emplearemos técnicas similares a las que aprendimos en capítulos anteriores, incluidos
los métodos para analizar datos de frecuencia, los métodos para desarrollar modelos
lineales para hacer predicciones y temas de estadística no paramétrica.

TEMAS

14.1INTRODUCCIÓN
14.2CENSURACIÓN Y DATOS DE TIEMPO HASTA EL EVENTO

14.3EL PROCEDIMIENTO DE KAPLAN-MEIER

14.4COMPARACIÓN DE CURVAS DE SUPERVIVENCIA

14.5REGRESIÓN DE COX: EL MODELO DE RIESGOS PROPORCIONALES


14.6RESUMEN

LOS RESULTADOS DEL APRENDIZAJE

Después de estudiar este capítulo, el estudiante


1. comprender los datos de tiempo hasta el evento y cómo se pueden manejar estadísticamente las observaciones
censuradas.
2. ser capaz de desarrollar y utilizar curvas de supervivencia para sacar conclusiones.
3. ser capaz de comparar estadísticamente las curvas de supervivencia.

4. comprender cómo desarrollar modelos diseñados para manejar datos de tiempo hasta el evento.

14.1 INTRODUCCIÓN

En muchos estudios, el resultado de interés está relacionado con el momento en que ocurre un evento. En un
entorno clínico, uno puede estar interesado en medir cuánto tiempo un enfermo crónico

750
14.2 CENSURACIÓN Y DATOS DE TIEMPO HASTA EL EVENTO 751

el paciente sobrevive después de recibir un determinado tratamiento. En otro escenario, uno puede estar interesado
en determinar cuál de los tres medicamentos, en comparación con un placebo, proporciona un alivio de los síntomas
con mayor rapidez.
Imagine que una clínica de rehabilitación cardíaca está interesada en determinar si la
inscripción en un programa tradicional de educación para la salud o la inscripción en un programa
que brinda planificación dietética y nutricional junto con educación del paciente es más eficaz para
prevenir la ocurrencia de un segundo infarto de miocardio después de un primer ataque cardíaco. . El
estudio podría comenzar cuando el primer paciente, después de su primer ataque cardíaco, se asigna
aleatoriamente a un programa de tratamiento, con pacientes adicionales inscritos a lo largo del
tiempo. Por el contrario, el estudio podría comenzar con una cohorte de sujetos, cada uno de los
cuales ha tenido su primer ataque cardíaco, que se asignan aleatoriamente a un programa de
tratamiento. En cualquier caso, hay potencialmente tres resultados que podrían ocurrir con cada
paciente, con elevento de interessiendo un segundo infarto. Estos son (1)el paciente tiene un segundo
infarto; (2)el paciente abandona el estudio, convirtiéndose así en unpérdida durante el seguimiento—
que podría ocurrir por una serie de razones, incluida la muerte o la reubicación geográfica, por
ejemplo; o (3)el evento de interés no le ocurre al paciente durante el período de estudio. Estos tres
eventos mutuamente excluyentes son la base para los estudios de análisis de supervivencia.
Aunque la gran mayoría de las investigaciones publicadas que utilizan los métodos de análisis de
supervivencia son de naturaleza clínica, debe mencionarse que también hay muchos usos no clínicos para el análisis
de supervivencia. Con el advenimiento de los programas estadísticos basados en computadora para ayudar con
cálculos complejos, el uso de metodologías de análisis de supervivencia ha aumentado de manera demostrable entre
muchas disciplinas. Por ejemplo, los ingenieros pueden querer saber el tiempo que tarda una batería en perder su
carga, un científico de control de calidad en una planta de fabricación puede querer entender en qué punto las
máquinas necesitan ser recalibradas, o un ecólogo puede querer estimar cuánto cuánto tiempo permanece el
cadáver promedio en un área de estudio antes de ser depurado.

14.2 CENSURACIÓN Y DATOS DE TIEMPO HASTA EL EVENTO

Los datos de medición para los estudios de análisis de supervivencia utilizan el tiempo que tarda en ocurrir
un evento de interés bien definido. Para cada sujeto inscrito en un estudio, el investigador registra la
cantidad de tiempo (esto puede ser meses, días, años o cualquier medida de tiempo) transcurrido entre el
momento en que cada sujeto ingresó al estudio hasta que experimente uno de los tres eventos posibles que
se acaban de presentar: el evento ocurre, el evento no ocurre o el sujeto se pierde durante el seguimiento. La
cantidad total de tiempo entre la inscripción inicial en el estudio y la ocurrencia de uno de los tres resultados
se conoce como el tiempo del sujeto de investigación.tiempo de supervivencia,otiempo hasta el evento.Por lo
tanto, la información recopilada sobre cada tema a menudo se denominadatos de supervivenciaodatos de
tiempo hasta el evento.Además de los datos de supervivencia, también se pueden recopilar covariables,
como la edad, el sexo, el tipo de medicación y la dieta, por ejemplo, para el desarrollo de modelos complejos.

DEFINICIÓN
datos de supervivencia,odatos de tiempo hasta el evento,son medidas del tiempo
transcurrido entre la inscripción inicial en un estudio y la disposición final del sujeto del
estudio. Este tiempo transcurrido podría estar representado por el momento del
diagnóstico inicial o podría estar representado por el momento en que uno
752 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

Paciente
B

1 de enero 1 de julio 1 de enero 1 de enero 31 de diciembre

2002 2002 2003 2004 2004


FIGURA 14.2.1 Pacientes que ingresan a un estudio en diferentes momentos con conocidos ( - ) y censurado (-)
tiempos de supervivencia.

entra en el estudio.Supervivenciaen este contexto simplemente significa que no ha


ocurrido un evento, no, necesariamente, que el punto final de interés involucró un
examen de "vida" y "muerte".

Supongamos que consideramos pacientes que ingresaron en el estudio de infarto de miocardio


descrito en la Introducción. Con fines ilustrativos, supongamos que examinamos el destino de tres pacientes
que estaban en el estudio (Figura 14.2.1).
El paciente A ingresó al estudio el 1 de enero de 2002 y tuvo un infarto de miocardio el 31 de
diciembre de 2003. Por lo tanto, el tiempo de supervivencia del paciente A es de 24 meses. El paciente B
ingresó al estudio el 1 de julio de 2002 y se mudó fuera del estado 6 meses después, el 31 de diciembre de
2002. El tiempo de supervivencia del paciente B en el estudio es de 6 meses. Finalmente, el Paciente C
ingresó al estudio el 1 de agosto de 2002 y permaneció en el estudio hasta que finalizó el 31 de diciembre de
2004. El tiempo de supervivencia del Paciente C es de 29 meses. Por lo tanto, tenemos información de
supervivencia de estos tres pacientes que podría ser útil para el análisis; sin embargo, notamos que los
tiempos de supervivencia de los pacientes B y C no se conocen con exactitud. Es decir, el paciente B brinda un
ejemplo de un paciente perdido durante el seguimiento y el paciente C brinda un ejemplo de un paciente que
completó el estudio sin experimentar el evento de interés. tiempos de supervivencia censuradosy por lo
tanto estos tiempos de supervivencia se conocen comodatos censurados.

DEFINICIÓN
Datos censuradosestán representados por mediciones para las cuales tenemos alguna
información sobre el tiempo de supervivencia, pero no se conoce el tiempo de supervivencia
exacto.

Los datos censurados pueden ocurrir de varias maneras. Endatos censurados individualmente,un
número fijo de sujetos entran en un estudio al mismo tiempo. Una vez en el estudio, algunos de los sujetos
no experimentarán el evento. Se sabe que su tiempo de supervivencia es un período de tiempo mayor que la
duración del estudio. Esto se conoce comocensura tipo I.También puede ser que por razones de
investigación o éticas, el estudio finalice después de que una cierta proporción de los sujetos experimente la
condición de interés, y la proporción restante no experimentó el evento cuando finalizó el estudio. Se llama
censura tipo II.Cabe señalar que estos conceptos no están relacionados con los conceptos de error Tipo I y
error Tipo II presentados en el Capítulo 7. Otro tipo de censura
14.2 CENSURACIÓN Y DATOS DE TIEMPO HASTA EL EVENTO 753

que puede ocurrir se conoce comodatos progresivamente censuradosen el que el período de estudio es fijo, pero los
sujetos pueden ingresar al experimento en diferentes momentos. Entonces, los pacientes pueden experimentar o no
experimentar el evento de interés, y aquellos que no experimentan el evento tienen tiempos de supervivencia
desconocidos. Se llamacensura tipo III.Los datos para los cuales no se conocen los criterios de valoración exactos, ya
sea porque el sujeto abandonó el estudio, se retiró del estudio o sobrevivió más allá de la finalización del estudio se
denominandatos censurados por la derechaporque los tiempos de supervivencia se extienden más allá de la cola
derecha de la distribución de tiempos de supervivencia. Por el contrario, podríamos tener datos para los cuales no se
conocen los puntos iniciales exactos. Esto podría surgir, por ejemplo, si un sujeto con la condición ingresa al estudio,
pero no se sabe exactamente cuándo se desarrolló la condición en el paciente. Estos datos se conocen comodatos
censurados a la izquierdadebido a que sus tiempos de supervivencia se truncan en el lado izquierdo de la distribución
de la distribución del tiempo de supervivencia, lo que hace que se desconozca la diferencia de tiempo entre el
diagnóstico y la entrada en el estudio. Claramente, los detalles que rodean a los datos censurados son complejos y
requieren un análisis mucho más detallado que el que se cubre en este texto introductorio. Para aquellos interesados
en leer más, sugerimos los libros de Kleinbaum y Klein (1), Lee (2) y Hosmer y Lemeshow (3).

Generalmente, para fines de análisis, se utiliza una variable dicotómica o indicadora para distinguir los
tiempos de supervivencia de aquellos sujetos que experimentan el evento de interés y aquellos que no lo
hacen debido a uno de los mecanismos de censura descritos anteriormente. Por lo general, esta variable se
denominavariables de estado,con un cero que indica que no ocurrió un evento y, por lo tanto, el tiempo de
supervivencia está censurado, y un 1 que indica que sí ocurrió el evento de interés.
En los estudios donde se investigan diferentes tratamientos, estamos interesados en tres
elementos de información para cada sujeto: (1)¿Qué tratamiento se le dio al paciente? (2)¿Durante
cuánto tiempo se observó al paciente? (3)¿Experimentó el paciente el evento de interés durante el
estudio o se censuró el tiempo de supervivencia por algún motivo? En los estudios que no se ocupan
de comparar diferentes condiciones de tratamiento, solo los dos últimos elementos de datos son
relevantes. Además, podemos estar interesados en diferentes covariables asociadas con los
pacientes (p. ej., edad, género, nivel de ingresos) para desarrollar modelos más complejos y, por lo
tanto, podemos desarrollar preguntas basadas en estas covariables de interés.
Con estos tres elementos de información a la mano, junto con cualquier covariable de interés,
podemos, en estudios como el ejemplo del infarto de miocardio mencionado en la Sección 14.1,
estimar la mediana del tiempo de supervivencia del grupo de pacientes que recibió un tratamiento en
comparación con otro. La comparación de diferentes medianas de tratamiento nos permite responder
a la siguiente pregunta: Con base en la información de nuestro estudio, ¿qué tratamiento concluimos
que retrasa por un período de tiempo más largo, en promedio, la ocurrencia de un segundo infarto?
Los datos recopilados en estudios de seguimiento como los que hemos descrito también pueden
usarse para responder otra pregunta de gran interés para el médico: ¿Cuál es la probabilidad
estimada de que un paciente sobreviva durante un período de tiempo específico? O, ¿Hay alguna
diferencia en la supervivencia de hombres y mujeres que han sufrido ataques al corazón? Para el
estudio de infarto de miocardio, el médico puede preguntar: "¿Cuál es la probabilidad de que un
paciente que recibió tratamiento A sobreviva más de 2 años?" Los métodos empleados para
responder a este tipo de preguntas se conocen comoanálisis de supervivenciamétodos.

Funciones de distribución estadísticaAntes de presentar el análisis de supervivencia


métodos, es importante considerar las distribuciones de datos que se encuentran comúnmente en tales análisis. Los
datos de tiempo hasta el evento se distribuyen temporalmente, de modo que los eventos ocurren en algún punto o
dentro de algún intervalo de tiempo. Se considera que estos eventos representan una
754 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

variable aleatoria que tiene alguna probabilidad de ocurrencia en cada período de tiempo para cada sujeto
en el estudio.
Ya hemos encontrado dos representaciones útiles de distribuciones de probabilidad en el
Capítulo 4. Estas fueron la función de distribución acumulativa y la función de distribución de
probabilidad. Si dejamos que el tiempo del evento sea representado porT,entonces la función de
distribución acumulada deTestá representado porFdtÞ,tal que

Fdt¼PAGdT tÞ (14.2.1)

Es decir, la función de distribución acumulativa representa la probabilidad de que el tiempo de


un evento sea menor o igual que algún tiempo de medición especificado,t.Como recordará del
capítulo 4,FdtÞes una función creciente que va desde un valor de cero (teóricamente se supone que
no ha ocurrido ningún evento al inicio del estudio), hasta un valor de 1 (teóricamente se supone que
todos los eventos han ocurrido al final del estudio ). En el contexto del análisis de supervivencia, una
función estrechamente relacionada que se usa más comúnmente que FdtÞes una función que va
desde un valor de 1 (se supone que todos los sujetos al inicio del estudio han “sobrevivido” hasta ese
punto) hasta un valor de cero (se supone teóricamente que ninguno de los sujetos ha “sobrevivido”
cuando termina el estudio, aunque algunos temas pueden estar censurados). Convenientemente,
esto se conoce como la distribución de supervivencia,SdtÞ,y está matemáticamente relacionado con la
función de distribución acumulada por

Sdt¼1FdtÞ (14.2.2)

Ambas distribuciones se ilustran en la Figura 14.2.2. Es la curva de supervivencia lo que generalmente nos
interesa más, y las comparaciones de varias curvas de supervivencia proporcionan un medio estadístico para
comparar cosas como la supervivencia individual y las diferencias en la supervivencia entre diferentes
tratamientos.

1
0.9
0.8
0.7
0.6
Probabilidad

0.5
Pie)
0.4
Calle)
0.3
0.2
0.1
0
0 2 4 6 8 10 12 14 dieciséis 18 20
Tiempo

FIGURA 14.2.2 Ilustración de la función de distribución acumulativa, F(t), y la supervivencia


distribución, S(t).
14.2 CENSURACIÓN Y DATOS DE TIEMPO HASTA EL EVENTO 755

La función de distribución de probabilidad, tal como se define en el Capítulo 4, está


representada por el conjunto de probabilidades que especifican los valores posibles de una
variable aleatoria. En el contexto del análisis de supervivencia, esta función de densidad
representa la probabilidad de que ocurra un evento en un intervalo de tiempo definido.
Podríamos preguntar, por ejemplo, ¿cuál es la probabilidad de sobrevivir 2 meses? Aunque
apreciar completamente las complejidades de esta distribución de probabilidad requiere
conocimiento de cálculo, podemos ilustrar su significado conceptualmente recordando un
concepto de nuestra discusión sobre la distribución normal en el Capítulo 4. Cuando calculamos
las probabilidades para la distribución normal, estábamos interesados en calcular la
distribución normal. área bajo una curva que estaba limitada por dos valores. Similarmente,D
yo,y luego encontrar nuestra probabilidad a medida que el intervalo se vuelve muy pequeño,
eso es comoDt!0. Por lo tanto, la función de distribución de probabilidad,FdtÞ,es definido por

PAGdt T < tþDtÞ


Fdt¼ ; comoDt!0 (14.2.3)
Dt

Es decir, el conjunto de probabilidades de eventos que ocurren en un intervalo de tiempo infinitesimalmente


pequeño define la función de probabilidad. También es posible encontrar esta función examinando lo que
sucede durante un cambio enFdtÞ,decirDFdtÞ,o un cambio enCalle),decirDSdtÞ,en un intervalo de tiempo
dado. Eso es

DFdtÞ DSdtÞ
Fdt¼ ¼ (14.2.4)
Dt Dt
Finalmente, una función que se encuentra a menudo en el análisis de supervivencia es la función de
riesgo, hdtÞ.Esta función se utiliza para definir la probabilidad instantánea de que ocurra un evento dado que
el sujeto ha sobrevivido hasta un tiempo determinado,t.Esta función se define como

PAGdt T < tþDtjT tÞ


hdt¼ ;comoDt!0 (14.2.5)
Dt

Tenga en cuenta que esta función se basa en una probabilidad condicional, en la que estamos interesados
en calcular la probabilidad de que ocurra un evento dado que el sujeto ya ha sobrevivido a un tiempo
definido. La condición de haber sobrevivido hasta un momento dado significa que la probabilidad de
sobrevivir en el futuro está influenciada por haber sobrevivido a períodos de tiempo anteriores. Esta idea
puede ser muy importante en algunos casos, donde sobrevivir a las primeras etapas de una enfermedad
puede disminuir drásticamente el potencial de que ocurra un evento en el futuro cercano. Como ejemplo,
considere el cáncer donde la no recurrencia o la remisión durante un período de 5 años generalmente
aumenta la supervivencia. Esta función también se puede expresar en términos de dos funciones
previamente definidas. Esta expresión es

FdtÞ
hdt¼ (14.2.6)
SdtÞ

Debido a que la función de riesgo puede exceder 1, no es realmente una probabilidad, aunque se basa en la
probabilidad condicional de que ocurra un evento. La función de riesgo a menudo se define en el análisis de
supervivencia mediante una distribución conocida, como lognormal, exponencial o Weibull.
756 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

distribución. Allison (4) y Kleinbaum y Klein (1) proporcionan excelentes descripciones de los diversos
modelos utilizados para representar funciones de riesgo.

14.3 EL PROCEDIMIENTO DE KAPLAN-MEIER

Ahora mostremos cómo podemos usar los datos generalmente recopilados en estudios de seguimiento del
tipo que hemos estado discutiendo para estimar la probabilidad de sobrevivir durante un período de tiempo
específico. El método que utilizamos fue introducido por Kaplan y Meier (5) y por esa razón se llama el
Procedimiento de Kaplan-Meier.Dado que el procedimiento involucra la multiplicación sucesiva de
probabilidades individuales estimadas, a veces se lo denominamétodo de límite de productode estimar las
probabilidades de supervivencia.
Como veremos, los cálculos incluyen los cálculos de proporciones de sujetos en una muestra que
sobreviven durante varios períodos de tiempo. Usamos estas proporciones de muestra como estimaciones
de las probabilidades de supervivencia que esperaríamos observar en la población representada por nuestra
muestra. En términos matemáticos nos referimos al proceso como la estimación de una función de
supervivencia. Las distribuciones de frecuencia y las distribuciones de probabilidad pueden construirse a
partir de los tiempos de supervivencia observados, y estas distribuciones observadas pueden mostrar
evidencia de seguir alguna distribución teórica de forma funcional conocida. Cuando se desconoce la forma
de la distribución muestreada, se recomienda que la estimación de una función de supervivencia se realice
por medio de unatécnica no paramétrica,de los cuales el procedimiento de Kaplan-Meier es uno. Las técnicas
no paramétricas se definen y analizan en detalle en el Capítulo 13.

Cálculos para el procedimiento de Kaplan-MeierDejamos


norte¼el número de sujetos cuyos tiempos de supervivencia están disponibles

pag1¼la proporción de sujetos que sobreviven al menos el primer período de tiempo


(día, mes, año, etc.)
pag2¼la proporción de sujetos que sobreviven al segundo período de tiempo
después de haber sobrevivido al primer período de tiempo

pag3¼la proporción de sujetos que sobreviven al tercer período de tiempo


después de haber sobrevivido al segundo período de tiempo
..
.
pagk¼la proporción de sujetos que sobreviven alkperíodo de tiempo
después de haber sobrevivido a ladk1Þperíodo de tiempo

Usamos estas proporciones, que podemos volver a etiquetar como p̂1; pag2; pag3; . . . ; pagkcomo
estimaciones de la probabilidad de que un sujeto de la población representada por la muestra sobreviva a los
periodos de tiempo 1, 2, 3, . . . ,k,respectivamente.
Para cualquier período de tiempo,yo,donde t k,estimamos la probabilidad de sobrevivir a la
1 tperíodo de tiempo,pagt, como sigue:

número de sujetos que sobreviven al menosdt1Þperiodos de tiempo que también sobreviven altperíodo
pagt¼
número de sujetos vivos al final del período de tiempodt1Þ
(14.3.1)
14.3 EL PROCEDIMIENTO DE KAPLAN-MEIER 757

La probabilidad de sobrevivir al tiempo.t, sdtÞ,se estima por

Dakota del SurtÞ ¼ p̂1 pag2 pagt (14.3.2)

Ilustramos el uso del procedimiento de Kaplan-Meier con el siguiente ejemplo.

EJEMPLO 14.3.1
Para evaluar los resultados e identificar predictores de supervivencia, Martini et al. (A-1) revisó su
experiencia total con los tumores malignos primarios del esternón. Clasificaron a los pacientes en
tumores de bajo grado (25 pacientes) o de alto grado (14 pacientes). El evento (estado), el tiempo
hasta el evento (meses) y el grado del tumor para cada paciente se muestran en la Tabla 14.3.1.
Deseamos comparar la experiencia de supervivencia a 5 años de estos dos grupos mediante el
procedimiento de Kaplan-Meier.

Solución: La disposición de los datos y los cálculos necesarios se muestran en la Tabla 14.3.2. Las
entradas para la tabla se obtienen de la siguiente manera.

TABLA 14.3.1 Datos de supervivencia, sujetos con tumores malignos del esternón

Tiempo Vital Tumor Tiempo Vital Tumor


Sujeto (Meses) Estadoa Calificaciónb Sujeto (Meses) Estadoa Calificaciónb

1 29 dod L 21 155 ned L


2 129 ned L 22 102 dod L
3 79 dod L 23 34 ned L
4 138 ned L 24 109 ned L
5 21 dod L 25 15 dod L
6 95 ned L 26 122 ned H
7 137 ned L 27 27 dod H
8 6 ned L 28 6 dod H
9 212 dod L 29 7 dod H
10 11 dod L 30 2 dod H
11 15 dod L 31 9 dod H
12 337 ned L 32 17 dod H
13 82 ned L 33 dieciséis dod H
14 33 dod L 34 23 dod H
15 75 ned L 35 9 dod H
dieciséis 109 ned L 36 12 dod H
17 26 ned L 37 4 dod H
18 117 ned L 38 0 dpo H
19 8 ned L 39 3 dod H
20 127 ned L

adod¼muerto de enfermedad; ned¼sin evidencia de enfermedad; dpo¼muerto postoperatorio.


bL¼grado bajo; H¼Alto grado.
Fuente: Datos proporcionados por cortesía del Dr. Nael Martini.
758 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

TABLA 14.3.2 Disposición de datos y cálculos para el procedimiento de Kaplan-Meier, ejemplo 14.3.1

1 2 3 4 5 6

Estado vital Pacientes Acumulativo


Tiempo 0¼censurado Pacientes Restante Supervivencia Supervivencia

(Meses) 1¼Muerto en riesgo Vivo Proporción Proporción

Pacientes con tumores de bajo grado

6 0
8 0
11 1 23 22 22=23¼ :956522 . 956522

15 1
15 1 22 20 20=22¼ :909090 . 869564

21 1 20 19 19=20¼ :950000 . 826086

26 0
29 1 18 17 17=18¼ :944444 . 780192

33 1 17 dieciséis 16=17¼ :941176 . 734298

34 0
75 0
79 1 14 13 13=14¼ :928571 . 681847

82 0
95 0
102 1 11 10 10=11¼ :909090 . 619860

109 0
109 0
117 0
127 0
129 0
137 0
138 0
155 0
212 1 2 1 1=2¼ :500000 . 309930

337 0

(Continuado)
14.3 EL PROCEDIMIENTO DE KAPLAN-MEIER 759

TABLA 14.3.2 (Continuación)

1 2 3 4 5 6

Estado vital Pacientes Acumulativo


Tiempo 0¼censurado Pacientes Restante Supervivencia Supervivencia

(Meses) 1¼Muerto en riesgo Vivo Proporción Proporción

Pacientes con tumores de alto grado

0 1 14 13 13=14¼ :928571 . 928571

2 1 13 12 12=13¼ :923077 . 857142

3 1 12 11 11=12¼ :916667 . 785714

4 1 11 10 10=11¼ :909090 . 714285

6 1 10 9 9=10¼ :900000 . 642856

7 1 9 8 8=9¼ :888889 . 571428

9 1
9 1 8 6 6=8¼ :750000 . 428572

12 1 6 5 5=6¼ :833333 . 357143

dieciséis 1 5 4 4=5¼ :800000 . 285714

17 1 4 3 3=4¼ :750000 . 214286

23 1 3 2 2=3¼ :666667 . 142857

27 1 2 1 1=2¼ :500000 . 071428

122 0 1 0

1.Comenzamos enumerando los tiempos observados en orden de menor a mayor en la


Columna 1.

2.La columna 2 contiene una variable indicadora que muestra el estado vital d1¼
fallecido; 0¼vivo o censuradoÞ.
3.En la Columna 3 enumeramos el número de pacientes en riesgo por cada tiempo asociado con la
muerte de un paciente. Solo debemos preocuparnos por los momentos en que ocurren las
muertes porque la tasa de supervivencia no cambia en los momentos censurados.

4.La columna 4 contiene el número de pacientes que quedan vivos justo después de una o
más muertes.

5.La columna 5 contiene la probabilidad condicional estimada de sobrevivir, que se


obtiene dividiendo la columna 4 por la columna 3. Tenga en cuenta que aunque
hubo dos muertes a los 15 meses en el grupo de bajo grado y dos muertes a los 9
meses en el grupo de alto grado, calculamos sólo una proporción de supervivencia
en estos puntos. Los cálculos tienen en cuenta las dos muertes.
6.La columna 6 contiene la probabilidad acumulada estimada de supervivencia. Obtenemos
las entradas en esta columna por multiplicación sucesiva. Cada entrada después de la
primera en la Columna 5 se multiplica por el producto acumulativo de todas las entradas
anteriores.
760 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

Después de completar los cálculos, examinamos la Tabla 14.3.2 para determinar


qué información útil proporciona. De la tabla observamos los siguientes hechos, que
nos permiten comparar la experiencia de supervivencia de los dos grupos de sujetos:
aquellos con tumores de bajo grado y aquellos con tumores de alto grado:

1. Tiempo medio de supervivencia.Podemos determinar el tiempo medio de supervivencia localizando el


tiempo, en meses, en el que la proporción de supervivencia acumulada es igual a 0,5. Ninguna de
las proporciones de supervivencia acumulada es exactamente 0,5, pero vemos que en el grupo de
tumores de bajo grado, la probabilidad cambia de 0,619860 a 0,309930 a los 212 meses; por lo
tanto, la mediana de supervivencia para este grupo es de 212 meses. En el grupo de tumores de alto
grado, la proporción acumulada cambia de 0,571428 a 0,428572 a los 9 meses, que es la mediana de
supervivencia de este grupo.

2. Tasa de supervivencia a cinco años.Podemos determinar la tasa de supervivencia a 5 años o 60 meses


para cada grupo directamente a partir de la proporción de supervivencia acumulada a los 60 meses.
Para el grupo de tumores de bajo grado, la tasa de supervivencia a 5 años es . 734298 o 73 por
ciento; para el grupo de tumores de alto grado, la tasa de supervivencia a 5 años es 0,071428 o 7
por ciento.

3. Tiempo medio de supervivencia.Podemos calcular para cada grupo la media de los


tiempos de supervivencia, que llamaremosTLyTHpara los grupos de bajo y alto grado,
respectivamente. Para el grupo de tumores de bajo grado calculamos TL¼2201=25¼
88:04, y para el grupo de tumores de alto grado calculamos TH¼257=14¼18:35. Dado
que muchos de los tiempos en el grupo de grado bajo están censurados, el verdadero
tiempo de supervivencia promedio para ese grupo es, en realidad, más alto (quizás,
considerablemente) que 88.04. El verdadero tiempo medio de supervivencia para el
grupo de alto grado también es probablemente más alto que el 18,35 calculado, pero
con solo un tiempo censurado no esperamos una diferencia tan grande entre la media
calculada y la media real. Por lo tanto, vemos que tenemos aún otra indicación de que
la experiencia de supervivencia del grupo de tumores de bajo grado es más favorable
que la experiencia de supervivencia del grupo de tumores de alto grado.
4. Tasa de riesgo promedio.A partir de los datos sin procesar de cada grupo, también podemos
calcular otra estadística descriptiva que se puede usar para comparar las dos experiencias de
supervivencia. Esta estadística se llamatasa de riesgo promedio.Es una medida del potencial
de no supervivencia en lugar de la supervivencia. Un grupo con una tasa de riesgo promedio
más alta tendrá una menor probabilidad de sobrevivir que un grupo con una tasa de riesgo
promedio más baja. Calculamos la tasa de riesgo promedio, designadah dividiendo el
número de sujetos que no sobreviven por la suma de los tiempos de supervivencia
observados. Para el grupo de tumores de bajo grado, calculamos hL¼9=2201¼ :004089. Para
el grupo de tumores de alto grado calculamos hH¼13=257¼ :05084, Vemos que la tasa de
riesgo promedio para el grupo de alto grado es más alta que para el grupo de bajo grado, lo
que indica una menor probabilidad de supervivencia para el grupo de alto grado.

La columna de proporción de supervivencia acumulada de la Tabla 14.3.2 se puede


representar visualmente en un gráfico de curva de supervivencia en el que las proporciones
de supervivencia acumulada están representadas por el eje vertical y el tiempo en meses por
el eje horizontal. Notamos que el gráfico se asemeja a escalones con "pasos" que ocurren en
los momentos en que ocurrieron las muertes. La gráfica también nos permite
EJERCICIOS 761

1.0

73%
.8 Grado bajo (norte=25)

.6
.5
.4

.2 7%
Alto grado (norte=14)

0.0
0 12 24 36 48 60 72 84 96 108 120
Tiempo (Meses)

FIGURA 14.3.1Curva de supervivencia de Kaplan-Meier, ejemplo 14.3.1, que muestra la mediana de los tiempos de supervivencia y las tasas
de supervivencia a 5 años (60 meses).

para representar visualmente el tiempo medio de supervivencia y las tasas de supervivencia, como
la tasa de supervivencia a 5 años. El gráfico de los datos de supervivencia acumulados de la Tabla
14.3.2 se muestra en la Figura 14.3.1.
Estas observaciones sugieren fuertemente que la experiencia de supervivencia de los
pacientes con tumores de bajo grado es mucho más favorable que la de los pacientes con tumores
de alto grado. &

EJERCICIOS

14.3.1Cincuenta y tres pacientes con cáncer medular de tiroides (CMT) fueron objeto de un estudio de Dottorini
et al. (A-2), quienes evaluaron el impacto de diferentes factores clínicos, patológicos y el tipo de tratamiento en su
supervivencia. Treinta y dos de los pacientes eran mujeres y la edad media de todos los pacientes fue de 46,11 años
con una desviación estándar de 14,04 (rango 18-35 años). La siguiente tabla muestra el estado de cada paciente en
varios períodos de tiempo después de la cirugía. Calcule la función de supervivencia utilizando el procedimiento de
Kaplan-meier y trace la curva de supervivencia.

Sujeto Tiempoa(Años) Estadob Sujeto Tiempoa(Años) Estadob

1 0 doc 28 6 vivo
2 1 mtc 29 6 vivo
3 1 mtc 30 6 vivo
4 1 mtc 31 6 vivo
5 1 mtc 32 7 mtc
6 1 mtc 33 8 vivo
7 1 mtc 34 8 vivo
8 1 mtc 35 8 vivo
9 1 vivo 36 8 vivo
10 2 mtc 37 8 vivo
(Continuado)
762 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

Sujeto Tiempoa(Años) Estadob Sujeto Tiempoa(Años) Estadob

11 2 mtc 38 9 vivo
12 2 mtc 39 10 vivo
13 2 vivo 40 11 mtc
14 2 vivo 41 11 doc
15 3 mtc 42 12 mtc
dieciséis 3 mtc 43 12 doc
17 3 vivo 44 13 mtc
18 4 mtc 45 14 vivo
19 4 vivo 46 15 vivo
20 4 vivo 47 dieciséis mtc
21 4 vivo 48 dieciséis vivo
22 5 vivo 49 dieciséis vivo
23 5 vivo 50 dieciséis vivo
24 5 vivo 51 17 doc
25 5 vivo 52 18 mtc
26 6 vivo 53 19 vivo
27 6 vivo
aEl tiempo es el número de años después de la cirugía.
bdoc¼muerto por otras causas; mtc¼muertos de cáncer medular de tiroides.
fuente: Datos proporcionados por cortesía del Dr. Massimo E. Dottorini.

14.3.2Banerji et al. (A-3) siguió a pacientes con diabetes mellitus no insulinodependiente (NIDDM) desde el inicio
de su hiperglucemia original y el inicio de su remisión casi normoglucémica después del tratamiento. Los
sujetos eran hombres y mujeres negros con una edad media de 45,4 años y una desviación estándar de 10,4.
La siguiente tabla muestra la experiencia de recaída/remisión de 62 sujetos. Calcule la función de
supervivencia utilizando el procedimiento de Kaplan-Meier y trace la curva de supervivencia.

Total Total Total


Duración de Duración de Duración de
Remisión Remisión Remisión Remisión Remisión Remisión
(Meses) Estadoa (Meses) Estadoa (Meses) Estadoa

3 1 8 2 26 1
3 2 9 2 27 1
3 1 10 1 28 2
3 1 10 1 29 1
3 1 11 2 31 2
4 1 13 1 31 1
4 1 dieciséis 1 33 2
4 1 dieciséis 2 39 2
5 1 17 2 41 1
5 1 18 2 44 1
5 1 20 1 46 1
5 1 22 1 46 2
5 1 22 2 48 1
5 1 22 2 48 2

(Continuado)
14.4 COMPARACIÓN DE CURVAS DE SUPERVIVENCIA 763

Total Total Total


Duración de Duración de Duración de
Remisión Remisión Remisión Remisión Remisión Remisión
(Meses) Estadoa (Meses) Estadoa (Meses) Estadoa

5 1 23 1 48 1
6 1 24 2 49 1
6 1 25 2 50 1
6 1 25 2 53 1
7 1 26 1 70 2
8 2 26 1 94 1
8 1
8 2
a1¼sí (el paciente todavía está en remisión); 2¼no (el paciente ha recaído). Fuente: Datos
proporcionados por cortesía de la Dra. Mary Ann Banerji.

14.4 COMPARACIÓN DE CURVAS DE SUPERVIVENCIA

El examen de una curva de supervivencia para un solo grupo de individuos es valioso porque permite ver
características que no se ven tan fácilmente al examinar un conjunto de valores tabulados. Esto incluye
visualizar la trayectoria temporal para encontrar períodos de tiempo en los que hubo cambios dramáticos en
la supervivencia, encontrar períodos de tiempo en los que ocurrieron cambios relativamente pequeños o
encontrar la mediana aproximada de la distribución de datos. La construcción de curvas de supervivencia, sin
embargo, encuentra su mayor uso cuando las comparaciones entre las distribuciones de supervivencia son
de interés. Por ejemplo, uno puede desear examinar las diferencias en el tratamiento en el que los sujetos
fueron asignados al azar, o puede desear saber qué medicación retrasa la aparición del evento de interés
durante el período de tiempo más largo.
Los resultados de comparar las experiencias de supervivencia de diferentes grupos no siempre serán
tan dramáticos como los de nuestro ejemplo anterior. Para una comparación objetiva de las experiencias de
supervivencia de diferentes grupos, es deseable que tengamos una técnica objetiva para determinar si son
significativamente diferentes desde el punto de vista estadístico. Sabemos también que los resultados
observados se aplican estrictamente a las muestras en las que se basan los análisis. De mucho mayor interés
es un método para determinar si podemos concluir que existe una diferencia entre las experiencias de
supervivencia en las poblaciones de las que se extrajeron las muestras. En otras palabras, en este punto,
deseamos un método para probar la hipótesis nula de que no hay diferencia en la experiencia de
supervivencia entre poblaciones contra la alternativa de que sí hay diferencia. Tal prueba es proporcionada
por elprueba de rango logarítmico.La prueba de rango logarítmico es una aplicación del procedimiento de
Mantel-Haenszel analizado en la sección 12.7. Mantel (6) propuso la extensión del procedimiento a los datos
de supervivencia. Aunque es posible que deseemos comparar las curvas de supervivencia de muchas
poblaciones, limitaremos nuestra discusión a la comparación de dos grupos: Para realizar esta tarea,
calculamos la estadística de rango logarítmico y procedemos de la siguiente manera:

1.Ordene los tiempos de supervivencia hasta la muerte para ambos grupos combinados, omitiendo los tiempos
censurados. Cada vez constituye un estrato como se define en la Sección 12.7.

2.Para cada estrato o tiempo,ti, construimos una tabla 2 2 en la que la primera fila
contiene el número de muertes observadas, la segunda fila contiene el número de
764 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

TABLA 14.4.1 Tabla de Contingencia por Estrato (Tiempo)tipara calcular la prueba de rango
logarítmico

Grupo A Grupo B Total

Número de muertes observadas ai bi ai+ segundoi

Número de pacientes vivos Ci di Ci+ rei


Número de pacientes “en riesgo” ai+ci bi+ rei nortei¼ai+ segundoi+ci+ rei

pacientes vivos, la primera columna contiene datos para un grupo, por ejemplo, el grupo A, y la
segunda columna contiene datos para el otro grupo, por ejemplo, el grupo B. La tabla 14.4.1 muestra
la tabla para el tiempoti.

3.Para cada estrato, calcule la frecuencia esperada para la celda superior izquierda de su tabla
mediante la Ecuación 12.7.5.
4.Para cada estrato calcularvipor la Ecuación 12.7.6.
5.Finalmente, calcule el estadístico de Mantel-Haenszel (ahora llamado estadístico de rango logarítmico) mediante
la Ecuación 12.7.7.

Ilustramos el cálculo de la estadística de rango logarítmico con el siguiente ejemplo.

EJEMPLO 14.4.1
Volvamos a referirnos a los datos sobre tumores malignos primarios del esternón presentados
en el ejemplo 14.3.1. El examen de los datos revela que hay 20 períodos de tiempo (estratos).
Para cada uno de estos debe construirse una tabla 2 2 siguiendo el patrón de la Tabla 14.4.1. La
primera de estas tablas se muestra como Tabla 14.4.2. Por las Ecuaciones 12.7.5 y 12.7.6
calculamosmiiyvicomo sigue:

d0þ1Þð0þ25Þ
mii¼ ¼ :641
39
d0þ1Þð25þ13Þð0þ25Þð1þ13Þ
vi¼ ¼ :230
392d38Þ

Los datos de la Tabla 14.4.2 y datos similares para los otros 19 períodos de tiempo se muestran en
Tabla 14.4.3. Con los datos de la tabla 14.4.3, calculamos el estadístico de rango logarítmico mediante la ecuación 12.7.7 de la
siguiente manera:

d9 17:811Þ2
Xmh
2 ¼ ¼24:724
3:140

TABLA 14.4.2 Tabla de contingencia para el primer estrato (período de


tiempo) para el cálculo de la prueba de rango logarítmico, ejemplo 14.4.1

Grado bajo Alto grado Total

Fallecidos 0 1 1
pacientes vivos 25 13 38
Pacientes en riesgo 25 13 39
14.4 COMPARACIÓN DE CURVAS DE SUPERVIVENCIA 765

TABLA 14.4.3 Cálculos intermedios para la prueba de rango logarítmico, ejemplo 14.4.1

Tiempo,ti ai Ci aiþCi bi di biþdi nortei mii yi

0 0 25 25 1 13 14 39 0.641 0.230
2 0 25 25 1 12 13 38 0.658 0.225
3 0 25 25 1 11 12 37 0.676 0.219
4 0 25 25 1 10 11 36 0.694 0.212
6 0 25 25 1 9 10 35 0.714 0.204
7 0 24 24 1 8 9 33 0.727 0.198
9 0 23 23 2 6 8 31 1.484 0.370
11 1 22 23 0 6 6 29 0.793 0.164
12 0 22 22 1 5 6 28 0.786 0.168
15 2 20 22 0 5 5 27 1.630 0.290
dieciséis 0 20 20 1 4 5 25 0.800 0.160
17 0 20 20 1 3 4 24 0.833 0.139
21 1 19 20 0 3 3 23 0.870 0.113
23 0 19 19 1 2 3 22 0.864 0.118
27 0 18 18 1 1 2 20 0.900 0.090
29 1 17 18 0 1 1 19 0.947 0.050
33 1 dieciséis 17 0 1 1 18 0.944 0.052
79 1 13 14 0 1 1 15 0.933 0.062
102 1 10 11 0 1 1 12 0.917 0.076
212 1 1 2 0 0 0 2 1.000 0.000

Totales 9 17.811 3.140

La referencia a la Tabla F del Apéndice revela que desde 24:724 > 7:879, elpagel valor para esta
prueba es < :005. Por lo tanto, rechazamos la hipótesis nula de que la experiencia de supervivencia es
la misma para pacientes con tumores de bajo grado y tumores de alto grado y concluimos que son
diferentes.
Existen procedimientos alternativos para probar la hipótesis nula de que dos curvas de supervivencia
son idénticas. Incluyen la prueba de Breslow (también llamada prueba de Wilcoxon generalizada) y la prueba
de Tarone-Ware. Ambas pruebas, así como la prueba de rango logarítmico, se analizan en Parmar y Machin
(7) y Allison (4). Al igual que la prueba de rango logarítmico, la prueba de Breslow y la prueba de Tarone-Ware
se basan en las diferencias ponderadas entre el número real y esperado de muertes en los puntos de tiempo
observados. Mientras que la prueba de rango logarítmico clasifica todas las muertes por igual, las pruebas de
Breslow y Tarone-Ware dan más peso a las muertes prematuras. Para el ejemplo 12.8.1, SPSS calcula un valor
de 24:93dpag < :001Þpara el test de Breslow y un valor de 25:22dpag < :001Þpara la prueba de Tarone-Ware.
Kleinbaum (27) analiza otra prueba llamada prueba de Peto. Las fórmulas para esta prueba se encuentran en
Parmar y Machin (7). La prueba de Peto también da más peso a la primera parte de la curva de supervivencia,
donde encontramos el mayor número de sujetos en riesgo. Al elegir una prueba, entonces, los investigadores
que quieran dar más peso a la parte anterior de la curva de supervivencia seleccionarán la prueba de
Breslow, la de Tarone-Ware o la de Peto. De lo contrario, la prueba de rango logarítmico es adecuada.
766 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

Hemos cubierto solo los conceptos básicos del análisis de supervivencia en esta
sección. El lector que desee profundizar en el tema puede consultar uno o más de
varios libros dedicados al tema, como los de Kleinbaum (8), Lee (9), Marubini y
Valsecchi (10) y Parmar y Machin (7). ).

Análisis informático
Varios de los paquetes de software estadístico disponibles, como SPSS, son capaces de realizar
análisis de supervivencia y construir gráficos de apoyo como se describe en esta sección.
d en los ejemplos 14.3.1 y 14.4.1 es
&

Medios y medianas para el tiempo de supervivencia

Significara Mediana

Intervalo de confianza del 95 % Intervalo de confianza del 95 %

Tumor_ Estándar Más bajo Superior Estándar Más bajo Superior


calificación Estimar Error Atado Atado Estimar Error Atado Atado

H 18.357 8.251 2.186 34.528 9.000 1.852 5.371 12.629


L 88.040 15.258 58.134 117.946 82.000 16.653 49.359 114.641
En general 63.026 11.490 40.505 85.546 27.000 7.492 12.317 41.683

aLa estimación se limita al mayor tiempo de supervivencia si se censura.

Comparaciones generales

chi-cuadrado d.f. Sig.

Clasificación logarítmica (Mantel-Cox) 24.704 1 . 000


Breslow (Generalizado
Wilcoxon) 24.927 1 . 000
Tarone-Ware 25.217 1 . 000

Test de igualdad de distribuciones de supervivencia para los diferentes niveles de tumor_grade.

FIGURA 14.4.1Salida de SPSS para los ejemplos 14.3.1 y 14.4.1.


EJERCICIOS 767

EJERCICIOS

14.4.1Si está disponible en su biblioteca, lea el artículo, "Impacto de la obesidad en pacientes con trasplante alogénico de
células madre: un estudio de casos y controles emparejado", por Donald R. Fleming et al. [Diario Americano de
Medicina, 102 (1997), 265–268] y responda las siguientes preguntas:
(a)¿Cómo se determinó el tiempo de supervivencia?

(b)¿Por qué cree que los autores usaron la prueba de Wilcoxon (prueba de Breslow) para comparar las curvas de
supervivencia?

(C)Explique el significado de lapagvalores informados para las Figuras 1 a 4.


(d)¿Qué resultados estadísticos específicos permiten a los autores llegar a su conclusión declarada?

14.4.2Si está disponible en su biblioteca, lea el artículo, "Supervivencia mejorada en pacientes con cáncer de próstata
localmente avanzado tratados con radioterapia y goserelina", de Michel Bolla et al. [Revista de Medicina de
Nueva Inglaterra, 337 (1997), 295–300], y responda las siguientes preguntas:
(a)¿Cómo se determinó el tiempo de supervivencia?

(b)¿Por qué cree que los autores usaron la prueba de rango logarítmico para comparar las curvas de supervivencia?

(C)Explique el significado de lapagvalores reportados para las Figuras 1 y 2.


(d)¿Qué resultados estadísticos específicos permiten a los autores llegar a su conclusión declarada?

14.4.3Cincuenta sujetos que completaron un programa de reducción de peso en un gimnasio se dividieron en dos
grupos iguales. Los sujetos del grupo 1 fueron inmediatamente asignados a un grupo de apoyo que se
reunía semanalmente. Los sujetos del grupo 2 no participaron en las actividades del grupo de apoyo. Todos
los sujetos fueron seguidos durante un período de 60 semanas. Se reportaron semanalmente al gimnasio,
donde fueron pesados y se determinó si estaban dentro de la meta. Se consideró que los sujetos estaban
dentro del objetivo si su peso semanal estaba dentro de las 5 libras de su peso al momento de completar el
programa de reducción de peso. La supervivencia se midió desde la fecha de finalización del programa de
reducción de peso hasta la finalización del seguimiento o el punto en el que el sujeto superó el objetivo. Se
observaron los siguientes resultados:

Estado Estado
(GRAMO¼Dentro de la (GRAMO¼Dentro de la
Tiempo Meta Gþ ¼Objetivo superado Tiempo Meta Gþ ¼Objetivo superado
Sujeto (Semanas) L¼perdidos durante el seguimiento) Sujeto (Semanas) L¼perdidos durante el seguimiento)

Grupo 1 Grupo 2

1 60 GRAMO 1 20 GRAMOþ

2 32 L 2 26 GRAMOþ

3 60 GRAMO 3 10 GRAMOþ

4 22 L 4 2 GRAMOþ

5 6 GRAMOþ 5 36 GRAMOþ

6 60 GRAMO 6 10 GRAMOþ

7 60 GRAMO 7 20 GRAMOþ

8 20 GRAMOþ 8 18 L
9 32 GRAMOþ 9 15 GRAMOþ

10 60 GRAMO 10 22 GRAMOþ

11 60 GRAMO 11 4 GRAMOþ

12 8 GRAMOþ 12 12 GRAMOþ

(Continuado)
768 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

Estado Estado
(GRAMO¼Dentro de la (GRAMO¼Dentro de la
Tiempo Meta Gþ ¼Objetivo superado Tiempo Meta Gþ ¼Objetivo superado
Sujeto (Semanas) L¼perdidos durante el seguimiento) Sujeto (Semanas) L¼perdidos durante el seguimiento)

Grupo 1 Grupo 2

13 60 GRAMO 13 24 GRAMOþ

14 60 GRAMO 14 6 GRAMOþ

15 60 GRAMO 15 18 GRAMOþ

dieciséis 14 L dieciséis 3 GRAMOþ

17 dieciséis GRAMOþ 17 27 GRAMOþ

18 24 L 18 22 GRAMOþ

19 34 L 19 8 GRAMOþ

20 60 GRAMO 20 10 L
21 40 L 21 32 GRAMOþ

22 26 L 22 7 GRAMOþ

23 60 GRAMO 23 8 GRAMOþ

24 60 GRAMO 24 28 GRAMOþ

25 52 L 25 7 GRAMOþ

Analice estos datos usando los métodos discutidos en esta sección.

14.5 REGRESIÓN DE COX: EL MODELO DE RIESGOS


PROPORCIONALES

En capítulos anteriores, vimos que los modelos de regresión se pueden usar para medidas de resultado
continuas y para medidas de resultado binarias (regresión logística). Las técnicas de regresión adicionales
están disponibles cuando las medidas dependientes pueden consistir en una combinación de datos de
tiempo hasta el evento u observaciones de tiempo censurado. Volviendo a nuestro ejemplo de un ensayo
clínico de la efectividad de dos medicamentos diferentes para prevenir un segundo infarto de miocardio, es
posible que deseemos controlar las características adicionales de los sujetos inscritos en el estudio. Por
ejemplo, esperaríamos que los sujetos fueran diferentes en sus mediciones de presión arterial sistólica de
referencia, antecedentes familiares de enfermedades cardíacas, peso, masa corporal y otras características.
Dado que todos estos factores pueden influir en la duración del intervalo de tiempo hasta un segundo infarto
de miocardio, nos gustaría tener en cuenta estos factores para determinar la eficacia de los medicamentos. El
método de regresión conocido como regresión de Cox (después de DR Cox (11), quien fue el primero en
proponer el método) o regresión de riesgos proporcionales se puede utilizar para tener en cuenta los efectos
de las mediciones de covariables continuas y discretas (variable independiente) cuando la variable
dependiente posiblemente esté censurada. datos de tiempo hasta el evento.

Describimos esta técnica revisando primero elfunción de riesgode la Sección 14.2, que describe
la probabilidad condicional de que un evento ocurra en un tiempo apenas mayor queticondicionado a
haber sobrevivido sin eventos hasta el momentoti. Esta función a menudo se escribe comoh(ti). El
modelo de regresión requiere que asumamos que las covariables tienen el efecto de
14.5 REGRESIÓN DE COX: EL MODELO DE RIESGOS PROPORCIONALES 769

ya sea aumentando o disminuyendo el peligro para un individuo en particular en comparación con


algún valor de referencia para la función. En nuestro ejemplo de ensayo clínico, podríamos medirk
covariables en cada uno de los sujetos donde hayi¼1; . . . ;nortesujetos yh0dtiÞes la función de riesgo
de línea de base. Describimos el modelo de regresión como

hdti¼h0dtiÞExpdb1zi1þb2zi2þ þbkzyoÞ (14.5.1)

Los coeficientes de regresión representan el cambio en el peligro que resulta del factor
de riesgo,zyo, que hemos medido. Reorganizar la ecuación anterior muestra que el coeficiente
exponenciado representa la razón de riesgo o la razón de las probabilidades condicionales de
un evento. Esta es la base para nombrar este método. regresión de riesgos proporcionales.Tal
vez recuerde que esta es la misma forma en que obtuvimos la estimación de la razón de
probabilidades a partir del coeficiente estimado cuando analizamos la regresión logística en el
Capítulo 11.

hdtiÞ
¼Expdbz1 i1 þbz2 i2 þ þ bz
k ikÞ (14.5.2)
h0dtiÞ

Para estimar los efectos de las covariables, b̂ requiere el uso de un paquete de software estadístico porque no existe
una única ecuación sencilla que proporcione las estimaciones para este modelo de regresión. La salida de la
computadora generalmente incluye estimaciones de los coeficientes de regresión, estimaciones del error estándar,
estimaciones de la razón de riesgo e intervalos de confianza. Además, la salida de la computadora también puede
proporcionar gráficos de las funciones de riesgo y las funciones de supervivencia para sujetos con diferentes valores
de covariables que son útiles para comparar los efectos de las covariables en la supervivencia.

EJEMPLO 14.5.1
Para determinar si el tiempo de recaída entre los usuarios de drogas está relacionado con la edad del
paciente y/o la droga de elección, Cross (datos clínicos no publicados) revisó una muestra aleatoria de
archivos de casos de usuarios de drogas de alto riesgo en una clínica de tratamiento ambulatorio. Los datos
representan el tiempo autoinformado en que ocurrió la recaída (o el tiempo en que el paciente se perdió
durante el seguimiento), el estado del paciente, el fármaco de elección y la edad del paciente. Los datos se
resumen en la Tabla 14.5.1.

TABLA 14.5.1 Datos de supervivencia de pacientes en una clínica de tratamiento ambulatorio

Estado Droga Estado Droga


Tiempo 0¼censurado 1¼Opiáceo Tiempo 0¼censurado 1¼Opiáceo
Sujeto (Semanas) 1¼Recaída 2¼Otro Edad Sujeto (Semanas) 1¼Recaída 2¼Otro Edad

1 12 1 1 21 21 21 1 2 28
2 8 1 1 18 22 41 1 2 31
3 5 1 1 17 23 23 0 2 22
4 17 1 1 17 24 15 1 2 31
5 19 1 1 25 25 15 0 2 25
6 12 0 1 30 26 21 1 2 19
(Continuado)
770 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

TABLA 14.5.1 (Continuación)

Estado Droga Estado Droga


Tiempo 0¼censurado 1¼Opiáceo Tiempo 0¼censurado 1¼Opiáceo
Sujeto (Semanas) 1¼Recaída 2¼Otro Edad Sujeto (Semanas) 1¼Recaída 2¼Otro Edad

7 10 1 1 dieciséis 27 45 1 2 21
8 11 1 1 23 28 37 1 2 23
9 5 1 1 31 29 51 1 2 15
10 2 1 1 21 30 50 1 2 29
11 10 1 1 19 31 42 1 2 28
12 7 0 1 18 32 21 1 2 31
13 19 1 1 18 33 20 1 2 31
14 11 1 1 21 34 15 1 2 26
15 11 1 1 23 35 40 1 2 28
dieciséis 19 1 1 15 36 39 1 2 31
17 19 1 1 17 37 33 1 2 23
18 24 1 1 21 38 37 1 2 23
19 21 1 1 22 39 15 0 2 29
20 14 1 1 17 40 52 0 2 37

Fuente: Datos proporcionados por cortesía del Dr. Chad L. Cross.

Para este ejemplo, emplearemos los algoritmos del método de regresión de Cox proporcionados en el
software SPSS. Todas las referencias a tablas y figuras en las explicaciones a continuación se refieren a la
Figura 14.5.1, que muestra la salida seleccionada de SPSS para este ejemplo.

1. Prueba general.SPSS proporciona una prueba general de significancia muy similar a la reportada
para la regresión logística que se analiza en el Capítulo 11. En esta prueba, la probabilidad se
usa para comparar un modelo sin parámetros (el modelo nulo) y un modelo con las variables
de interés incluidas. Si hay una diferencia significativa en la función de verosimilitud entre el
modelo con parámetros y el modelo nulo, entonces el modelo de regresión de Cox es
significativo y al menos una de las variables de interés está significativamente relacionada con
la variable de resultado. Un examen de la salida muestra que la prueba ómnibus para los
coeficientes del modelo con la edad y la droga ingresada en el modelo es significativamente
diferente del modelo nulo, conp<.001.
2. Variables en el modelo.A continuación, SPSS proporciona una tabla para cada una de las variables
ingresadas en el modelo. Al igual que un modelo de regresión estándar, se proporcionan el
parámetro del modelo, su error estándar y una prueba de significancia para probar el valor nulo, Ho:b
¼0. Para estos datos, el tipo de fármaco predijo significativamente el tiempo hasta la recaída (p<.001),
pero la edad no (pag¼ .792).

3. Curvas de supervivencia.Dado que se encontró que el fármaco de elección estaba significativamente


relacionado con el momento de la recaída, es instructivo examinar las curvas de supervivencia para estos
datos. Al examinar estas curvas, queda claro que existe una diferencia en el tiempo hasta la recaída, ya que
aquellos que informan el uso de opiáceos como su principal droga de elección recaen a un ritmo mucho más
rápido que aquellos que informan el uso de drogas distintas de los opiáceos.

4. Coeficientes de riesgo.Los cocientes de riesgo se proporcionan para cada variable en el modelo. Al igual que en la
regresión logística donde calculamos las razones de probabilidad, las razones de riesgo se encuentran mediante
14.5 REGRESIÓN DE COX: EL MODELO DE RIESGOS PROPORCIONALES 771

Pruebas ómnibus de los coeficientes del modelo

Total (puntuación)

– 2 registro Chi-
Probabilidad cuadrado d.f. Sig.
167.407 25.558 2 . 000

Variables en la ecuación

95,0% Cl para Exp(B)

B SE Wald d.f. Sig. Exp(B) Más bajo Superior

Droga 2.139 . 531 16.239 1 . 000 8.492 3.000 24.036


edad – . 009 . 032 . 070 1 . 792 . 991 . 930 1.057

droga
1.0
Opiáceo
Otro
0.8
Supervivencia acumulada

0.6

0.4

0.2

0.0

. 00 10,00 20,00 30,00 40,00 50,00 60,00


Semanas

FIGURA 14.5.1 Resultado del análisis de supervivencia de la regresión de Cox del software SPSS para
el ejemplo 14.5.1.

calculando exp(b).Al examinar la variable droga, donde los opiáceos se usaron como variable
indicadora en SPSS, el riesgo de recaída es casi 8,5 veces más probable para los opiáceos en
comparación con otras drogas, controlando la covariable de la edad. Aunque podemos calcular
el cociente de riesgos instantáneos para la edad de la misma manera que para el fármaco,
suele ser útil para las covariables cuantitativas considerar el cálculo de la función 100(exp(b)1),
que proporciona una estimación del cambio porcentual en el riesgo cuando la covariable
aumenta en una unidad. En el presente ejemplo para la edad, esto conduce a
772 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

100(.991 1)¼ .9. Por lo tanto, por cada aumento de 1 año en la edad, el riesgo de recaída
disminuye en un promedio de alrededor del 0,9 por ciento.
5. Conclusión.Con base en los resultados de esta muestra limitada, hemos aprendido que la edad del
paciente, aunque no es estadísticamente significativa, sugiere que, en general, la edad puede ser algo
protectora en el sentido de que el riesgo de recaída disminuye con la edad. También hemos
aprendido que aquellos que experimentan adicción a los opiáceos son propensos a recaer mucho
antes en su tratamiento. Los resultados de este estudio preliminar pueden usarse para desarrollar
estudios adicionales para determinar si los programas de tratamiento diferentes, y quizás más
intensivos, son más exitosos para dirigirse a aquellos que experimentan adicción a los opiáceos en
comparación con otras drogas. &

Claramente, la regresión de Cox puede volverse muy compleja a medida que aumenta el
número de variables. Al igual que con los modelos de regresión estándar analizados en los primeros
capítulos, se puede optar por utilizar procedimientos de selección (hacia adelante, hacia atrás o por
pasos) o examinar las interacciones entre las variables de los modelos. Además, se pueden tener
covariables dependientes del tiempo en las que el valor de la covariable puede cambiar en cada
momento de medición. Ejemplos de esto pueden ser el matrimonio o el diagnóstico de una condición
de salud. Estas covariables contrastan con las covariables constantes en el tiempo, que no cambian (p.
ej., género). En resumen, la regresión de Cox es una técnica muy útil para modelar datos de
supervivencia. Para aquellos interesados en leer más, se recomiendan los textos de Kleinbaum y
Klein (1), Lee (2), Hosmer y Lemeshow (3) y Allison (4).

EJERCICIOS

14.5.1En un estudio que examinó el tiempo de aparición del cáncer después de la exposición a la luz ultravioleta en ratas, se utilizó la edad
(meses) como covariable en un modelo de regresión de Cox. En el modelo, la estimación del parámetro para el peso fue de .19
y tuvo unpag-valor de .021. Proporcione una interpretación de la estimación de este parámetro en términos de la razón de
riesgo.

14.5.2En el estudio descrito en el Ejercicio 14.5.1, los investigadores también estaban interesados en saber si había una diferencia entre el
género en el tiempo que tardaba en desarrollarse el cáncer. Para el género, la estimación del parámetro fue de .77 y tuvo un
pag-valor de 0.014. Proporcione una interpretación de la estimación de este parámetro en términos de la razón de riesgo.

14.5.3La intención de un estudio de Weaver et al. (A-4) fue evaluar si las metástasis ocultas en los ganglios linfáticos son
indicadores importantes de la recurrencia de la enfermedad o la supervivencia en pacientes con cáncer de mama. Los datos a continuación

proporcionan algunos de los resultados pertinentes de un modelo de regresión de Cox para estos datos.

(a)Calcule los coeficientes de los parámetros de regresión para cada variable.


(b)Proporcione una interpretación de estos resultados usando los conceptos aprendidos en esta sección.

Variable Relación de riesgo (HR) IC del 95 % para recursos humanos pag-valor

Edad (50þvs. <50) Tamaño del tumor 1.69 (1.24, 2.31) . 001
(>2 cm vs. Quimioterapia vs. 2cm)
no 1.32 (.98, 1.76) . 060
quimioterapia Radiación vs. no . 88 (.68, 1.13) . 31
radiación 0.54 (.40, .73) . 001
RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 14 773

14.6 RESUMEN

En este capítulo se proporcionó una introducción a los datos de tiempo hasta el evento. En particular, se
introdujo el concepto de censura de datos, en el que no se conocen los tiempos exactos de los sujetos. Se
discutieron las distribuciones útiles en el análisis de supervivencia, incluyendo la función de distribución
acumulada, la función de supervivencia y la función de riesgo. Se discutió el cálculo de las curvas básicas de
supervivencia mediante el procedimiento de Kaplan-Meier, así como los métodos para comparar las curvas
de supervivencia mediante métodos no paramétricos. Se proporcionaron conceptos de regresión utilizando
la regresión de Cox y se proporcionó un análisis detallado de ejemplos. La relación de varios métodos
cubiertos en este capítulo se vinculó a los conceptos aprendidos anteriormente en el texto, incluida la
regresión lineal, el análisis de datos de frecuencia y las estadísticas no paramétricas.

RESUMEN DE LAS FÓRMULAS DEL CAPÍTULO 14

Fórmula Nombre Fórmula


Número

14.2.1 Acumulativo Fdt¼PAGdT tÞ


función de distribución

14.2.2 función de supervivencia Sdt¼1FdtÞ


14.2.3 Probabilidad PAGdt T < tþDtÞ
Fdt¼ ; como
Dt!0
función de distribución Dt
14.2.4 Relación de
DFdtÞ DSdtÞ
probabilidad Fdt¼ ¼
Dt Dt
función de distribución
al acumulativo
función de distribución
y la supervivencia
función

14.2.5 Función de riesgo PAGdt T < tþDtjT tÞ


hdt¼ ;comoDt!0
Dt
14.2.7 Relación de la FdtÞ
hdt¼
función de riesgo para SdtÞ
la probabilidad
función de distribución
y la supervivencia
función

14.3.1 Probabilidad de supervivencia número de sujetos que sobreviven al menosdt1Þperiodo de tiempo


que también sobreviven a latperíodo
pagi¼
número de sujetos vivos al final del período de tiempodt1Þ

14.3.2 Supervivencia estimada Dakota del SurtÞ ¼ p̂1 pag2 pagt


función
774 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

14.5.1 Regresión de peligros hdti¼h0dtiÞExpdb1zi1þb2zi2þ þbkzyoÞ


modelo

14.5.2 peligro proporcional hdtiÞ


¼Expdb1z i1þb2zi2þ þbkzyoÞ
modelo hodtiÞ

Símbolo - b¼coeficiente de regresion


Llave - D¼cambiar
- Pie)¼función de distribución acumulativa
- pie)¼función de densidad de probabilidad
- h(t)¼función de riesgo
- pag¼probabilidad
- Calle)¼función de supervivencia
- T¼tiempo de interés
- t¼hora del evento
- z¼factor de riesgo en la regresión de Cox

PREGUNTAS DE REPASO Y EJERCICIOS

1.Describa con palabras el concepto de censura de datos.

2.Defina lo siguiente:
(a)Cociente de riesgo

(b)Función de riesgo
(C)Función de distribución de probabilidad
(d)función de supervivencia

(mi)Estimación de Kaplan-Meier

3.Explicar los conceptos subyacentes al modelo de regresión de Cox.

4.¿Cuál es la diferencia entre la censura por la derecha y la censura por la izquierda? Proporcione un ejemplo de cada uno.

5.Analice por qué a menudo es preferible utilizar una prueba no paramétrica para comparar las curvas de supervivencia.

6.¿Por qué la regresión de Cox se denomina modelo de "riesgos proporcionales"?

7.Si la función de distribución de probabilidad en el momento 5 es igual a 0,25 y la función de supervivencia en el momento 5 es igual
a 0,15, ¿cuál es la función de riesgo en el momento 5?

8.Si encontramos que una medición en el intervalo de tiempo entre el tiempo 2 y el 10 da como resultado una función de
distribución de probabilidad estimada de 0.03, ¿cuál es el cambio estimado en la función de distribución acumulativa?

9.Utilizando los datos de la pregunta 8, ¿cuál es el cambio estimado en la función de supervivencia?

10Explique por qué la función de distribución acumulativa y la función de supervivencia son imágenes especulares entre sí.

11El objetivo de un estudio de Lee et al. (A-5) fue mejorar la comprensión del comportamiento biológico de los tumores
estromales epitelioides gástricos. Estudiaron las características clínicas, los hallazgos histológicos y la ploidía del ADN
de una serie de tumores para identificar los factores que podrían distinguir entre las variantes benignas y malignas
de estos tumores y tener relevancia para el pronóstico. Cincuenta y cinco pacientes con tumores
PREGUNTAS DE REPASO Y EJERCICIOS 775

se clasificaron según si sus tumores eran malignos de alto grado (grado 2), malignos de bajo grado
(grado 1) o benignos (grado 0). Entre los datos recopilados se encuentran los siguientes:

Resultado Número de Resultado Número de


(1¼Muerte Días para durar (1¼Muerte Días para durar
Tumor de Seguimiento o Tumor de Seguimiento o
Paciente Calificación Enfermedad) Muerte Paciente Calificación Enfermedad) Muerte

1 0 0 87 8 0 0 1616
2 0 0 775 9 0 0 mil novecientos ochenta y dos

3 0 0 881 10 0 0 2035
4 0 0 914 11 0 0 2191
5 0 0 1155 12 0 0 2472
6 0 0 1162 13 0 0 2527
7 0 0 1271 14 0 0 2782
15 0 0 3108 36 0 0 7318
dieciséis 0 0 3158 37 0 0 7447
17 0 0 3609 38 0 0 9525
18 0 0 3772 39 0 0 9938
19 0 0 3799 40 0 0 10429
20 0 0 3819 41 1 1 450
21 0 0 4586 42 1 1 556
22 0 0 4680 43 1 1 2102
23 0 0 4989 44 1 0 2756
24 0 0 5675 45 1 0 3496
25 0 0 5936 46 1 1 3990
26 0 0 5985 47 1 0 5686
27 0 0 6175 48 1 0 6290
28 0 0 6177 49 1 0 8490
29 0 0 6214 50 2 1 106
30 0 0 6225 51 2 1 169
31 0 0 6449 52 2 1 306
32 0 0 6669 53 2 1 348
33 0 0 6685 54 2 1 549
34 0 0 6873 55 2 1 973
35 0 0 6951

Fuente: Datos proporcionados por cortesía del Dr. Michael B. Farnell.

12Girard et al. (A-6) realizó un estudio para identificar los factores pronósticos de una mejor supervivencia después de la
resección de metástasis pulmonares (PM) aisladas de cáncer colorrectal. Entre los datos recopilados se encuentran
los siguientes con respecto al número de PM resecados, la supervivencia y el resultado de 77 pacientes que se
sometieron a una resección completa en la primera operación torácica:

Número de Supervivencia Número de Supervivencia

Paciente PM resecado (Meses) Estado Paciente PM resecado (Meses) Estado

1 1 24 Vivo 8 1 15 Muerto

2 1 67 Vivo 9 1 10 Muerto

3 1 42 Vivo 10 1 41 Muerto

4 > 1 28 Muerto 11 > 1 41 Muerto

5 1 37 Muerto 12 1 27 Muerto

6 1 133 Vivo 13 1 93 Vivo


7 1 33 Muerto 14 > 1 0 Muerto

15 1 60 Muerto 47 1 54 Muerto

(Continuado)
776 CAPÍTULO 14 ANÁLISIS DE SUPERVIVENCIA

Número de Supervivencia Número de Supervivencia

Paciente PM resecado (Meses) Estado Paciente PM resecado (Meses) Estado

dieciséis 1 43 Muerto 48 > 1 57 Vivo


17 > 1 73 Vivo 49 > 1 dieciséis Muerto

18 1 55 Vivo 50 1 29 Muerto

19 1 46 Muerto 51 1 14 Muerto

20 1 66 Vivo 52 > 1 29 Muerto

21 1 10 Muerto 53 > 1 99 Muerto

22 > 1 3 Muerto 54 > 1 23 Muerto

23 > 1 7 Muerto 55 1 74 Vivo


24 > 1 129 Vivo 56 1 169 Vivo
25 1 19 Vivo 57 > 1 24 Muerto

26 > 1 15 Muerto 58 > 1 9 Muerto

27 1 39 Vivo 59 1 43 Muerto

28 1 15 Muerto 60 1 3 Vivo
29 > 1 30 Muerto 61 > 1 20 Muerto

30 1 35 Vivo 62 1 2 Muerto

31 > 1 18 Muerto 63 > 1 41 Muerto

32 1 27 Muerto 64 > 1 27 Muerto

33 1 121 Vivo sesenta y cinco 1 45 Vivo


34 > 1 8 Muerto 66 1 26 Muerto

35 1 24 Vivo 67 > 1 10 Muerto

36 1 127 Vivo 68 1 143 Vivo


37 1 26 Muerto 69 1 dieciséis Muerto

38 > 1 7 Muerto 70 1 29 Vivo


39 > 1 26 Muerto 71 1 17 Muerto

40 > 1 17 Muerto 72 > 1 20 Muerto

41 1 18 Muerto 73 1 92 Vivo
42 1 17 Muerto 74 > 1 15 Muerto

43 > 1 10 Muerto 75 1 5 Muerto

44 > 1 33 Muerto 76 > 1 73 Vivo


45 > 1 42 Vivo 77 1 19 Muerto

46 1 40 Vivo

Fuente: Datos proporcionados por cortesía del Dr. Philippe Girard.

13En un estudio de Alicikus et al. (A-7), se examinó el control a largo plazo del cáncer de próstata que recibieron
radioterapia en pacientes después de 10 años. Los autores utilizaron el análisis de regresión de Cox para analizar
estos datos, lo que dio como resultado los datos resumidos en la siguiente tabla. Para estos datos:
(a)Calcule las estimaciones de parámetros para el modelo de regresión de Cox.
(b)Proporcione una explicación de las razones de riesgo (HR) y su significado.
(C)Para la edad, proporcione una medida alternativa para el HR y proporcione su significado en términos del cambio
porcentual en años.

Variable Relación de riesgo (HR) IC del 95 % para recursos humanos pag-valor

Edad 1.02 (.96, 1.08) . 51


Terapia hormonal (sí vs. no) Pre-PSA, . 89 (.44, 1.81) . 75
>10 ng/mL vs. 10 ng/mL Clasificación 2.41 (1.19, 4.88) . 015
del tumor 1.42 (1.17, 1.71) <.001

Fuente:ZUMREA.ALICIKUS, YOSHIYAYAMADA, ZHIGANGZCOLGAR, XENPAGIE, mARGIEHUNG, mARISAkOLLMEIER, BRETT


CBUEY, y MICHAELJ.ZELEFSKY, “Resultados a diez años de radioterapia de intensidad modulada y dosis altas para el cáncer
de próstata localizado,”Cáncer, 117 (2010), 1429–1437.
REFERENCIAS 777

REFERENCIAS

Referencias de metodología
1. DÁVIDOG KLEINBAUMy MITCHELkLEIN,Análisis de supervivencia: un texto de autoaprendizaje,Segunda edición, Springer, Nueva York,
2005.
2. miLISATLEE.UU.,Métodos estadísticos para el análisis de datos de supervivencia,Tercera edición, Wiley, Nueva York, 2003.
3. DÁVIDOWHOSMER, JR. y STANLEYLEMESHOW,Análisis de supervivencia aplicado: modelado de regresión de datos de tiempo hasta el
evento,Wiley, Nueva York, 1999.
4. pagAULD.A.LLISON,Análisis de supervivencia usando SAS®: una guía práctica,Segunda edición, SAS Publishing, Cary, NC,
2010.
5. EL KUN PLANy P. M.EIER, “Estimación no paramétrica a partir de observaciones incompletas,”Revista de la Asociación
Estadounidense de Estadística, 53 (1958), 457–481.
6. norteATANMETROANTEL, "Evaluación de los datos de supervivencia y dos nuevas estadísticas de orden de rango que surgen en su
consideración", Informes de quimioterapia del cáncer, 50 (marzo de 1966), 163–170.
7. mAHEESHKB PArmary DÁVIDOMETROAQUIN,Análisis de supervivencia: un enfoque práctico,Wiley, Nueva York, 1995.
8. DÁVIDOG KLEINBAUM,Análisis de supervivencia: un texto de autoaprendizaje,Springer, Nueva York, 1996.
9. miLISATLEE.UU.,Métodos estadísticos para el análisis de datos de supervivencia,Publicaciones Lifetime Learning, Belmont, CA, 1980.
10. miTORREMETROARUBINIy MARIAGRAMORAZIAVALSECCHI,Análisis de datos de supervivencia de ensayos clínicos y estudios observacionales,
Wiley, Nueva York, 1995.
11. DÁVIDORCBUEY, “Modelos de regresión y tablas de vida” (con discusión),Diario de la Sociedad Real de Estadística, B34 (
1972), 187–220.

Referencias de aplicaciones
1. norteAELMETROARTINI, ANDREWGHUVOS, mICHAELEBURT, ROBERTOTHEELAN, mANJITSBAINS, PAGATRICIAMMCCORMACK,
VALERÍAWRUSCH, mICHAELWEBER, ROBERTOJDPROPIEDADy ROBERTOJGInsberg, "Predicciones de supervivencia en
tumores malignos del esternón",Revista de Cirugía Torácica y Cardiovascular, 111 (1996), 96–106.
2. mASSIMOEDOTTORINI, AGNESIOASSI, mARIASIRONÍ, gABRIELESANGALLI, gIANLUIGISPREÁFICO, y yoUIGÍACOLOMBO,
“Análisis multivariado de pacientes con carcinoma medular de tiroides,”Cáncer, 77 (1996), 1556–1565.
3. mARIOANNBANERJI, RochelleLCHAIKEN, y HAROLDE. L.EBOVITZ, "Remisión normoglucémica a largo plazo en sujetos negros
con NIDDM recién diagnosticados",Diabetes, 45 (1996), 337–341.
4. DONALDL. W.EVER, TAkamaruASHIKAGA, DÁVIDOn kTRAPO, jOANEMKELLY, STEWARTJ. A.NDERSON, SETHPHFLECHA,
THOMASBJULIAN, miIZQUIERDOSPMAMUENAS, y NORMALWOLMARK, "Efecto de las metástasis ocultas en la supervivencia en el cáncer de
mama con ganglios negativos",El Diario de Medicina de Nueva Inglaterra, 364 (2011), 412–421.
5. J.OYSYLEE.UU., ANTONIOG. N.ASCIMENTO, mICHAELBFARNELL, J. A.IDANCARNEY, WILLIAMS. H.ARMSEN, y DUANEMETRO.
ILSTRUP, “Tumores epitelioides del estroma gástrico (leiomioblastomas): un estudio de cincuenta y cinco casos”,Cirugía, 118
(1995), 653–661.
6. P.HILIPPEGRAMOirard, mICHELDUCREUX, PAGIERREBALDEYROU, PAGHILIPPELASER, BARROZGRAMOAYET, PAGIERRERUFFIE -, y DOMINICO
GRAMORUNENWALD, “Cirugía de metástasis pulmonares de cáncer colorrectal: análisis de factores pronósticos,”Diario de
Oncología Clínica, 14 (1996), 2047–2053.
7. ZUMREA.ALICIKUS, YOSHIYAYAMADA, ZHIGANGZCOLGAR, XENPAGIE, mARGIEHUNG, mARISAkOLLMEIER, BRETTCBUEY, y
METROICHAELJ.ZELEFSKY, “Resultados a diez años de radioterapia de intensidad modulada y dosis altas para el cáncer de
próstata localizado,”Cáncer, 117 (2010), 1429–1437.
APÉNDICE

TABLAS ESTADÍSTICAS

A-1
A-2 ANEXO TABLAS ESTADÍSTICAS
ANEXO TABLAS ESTADÍSTICAS A-3
A-4 ANEXO TABLAS ESTADÍSTICAS
3GBAPP 12/04/2012 16:43:11 Page 5

APPENDIX STATISTICAL TABLES A-5


3GBAPP 12/04/2012 16:43:16 Page 6

A-6 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:43:19 Page 7

APPENDIX STATISTICAL TABLES A-7


3GBAPP 12/04/2012 16:43:22 Page 8

A-8 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:43:26 Page 9

APPENDIX STATISTICAL TABLES A-9


3GBAPP 12/04/2012 16:43:30 Page 10

A-10 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:43:33 Page 11

APPENDIX STATISTICAL TABLES A-11


3GBAPP 12/04/2012 16:43:36 Page 12

A-12 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:43:38 Page 13

APPENDIX STATISTICAL TABLES A-13


3GBAPP 12/04/2012 16:43:41 Page 14

A-14 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:43:46 Page 15

APPENDIX STATISTICAL TABLES A-15


3GBAPP 12/04/2012 16:43:54 Page 16

A-16 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:43:55 Page 17

APPENDIX STATISTICAL TABLES A-17


3GBAPP 12/04/2012 16:43:56 Page 18

A-18 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:43:57 Page 19

APPENDIX STATISTICAL TABLES A-19


3GBAPP 12/04/2012 16:43:57 Page 20

A-20 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:43:58 Page 21

APPENDIX STATISTICAL TABLES A-21


3GBAPP 12/04/2012 16:43:58 Page 22

A-22 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:43:59 Page 23

APPENDIX STATISTICAL TABLES A-23


3GBAPP 12/04/2012 16:44:0 Page 24

A-24 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:1 Page 25

APPENDIX STATISTICAL TABLES A-25


3GBAPP 12/04/2012 16:44:5 Page 26

A-26 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:6 Page 27

APPENDIX STATISTICAL TABLES A-27


3GBAPP 12/04/2012 16:44:7 Page 28

A-28 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:8 Page 29

APPENDIX STATISTICAL TABLES A-29


3GBAPP 12/04/2012 16:44:8 Page 30

A-30 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:9 Page 31

APPENDIX STATISTICAL TABLES A-31


3GBAPP 12/04/2012 16:44:9 Page 32

A-32 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:10 Page 33

APPENDIX STATISTICAL TABLES A-33


3GBAPP 12/04/2012 16:44:10 Page 34

A-34 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:14 Page 35

APPENDIX STATISTICAL TABLES A-35


3GBAPP 12/04/2012 16:44:17 Page 36

A-36 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:18 Page 37

APPENDIX STATISTICAL TABLES A-37


3GBAPP 12/04/2012 16:44:21 Page 38

A-38 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:23 Page 39

APPENDIX STATISTICAL TABLES A-39


3GBAPP 12/04/2012 16:44:24 Page 40

A-40 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:25 Page 41

APPENDIX STATISTICAL TABLES A-41


3GBAPP 12/04/2012 16:44:26 Page 42

A-42 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:29 Page 43

APPENDIX STATISTICAL TABLES A-43


3GBAPP 12/04/2012 16:44:30 Page 44

A-44 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:33 Page 45

APPENDIX STATISTICAL TABLES A-45


3GBAPP 12/04/2012 16:44:34 Page 46

A-46 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:35 Page 47

APPENDIX STATISTICAL TABLES A-47


3GBAPP 12/04/2012 16:44:36 Page 48

A-48 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:39 Page 49

APPENDIX STATISTICAL TABLES A-49


3GBAPP 12/04/2012 16:44:40 Page 50

A-50 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:41 Page 51

APPENDIX STATISTICAL TABLES A-51


3GBAPP 12/04/2012 16:44:42 Page 52

A-52 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:43 Page 53

APPENDIX STATISTICAL TABLES A-53


3GBAPP 12/04/2012 16:44:45 Page 54

A-54 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:47 Page 55

APPENDIX STATISTICAL TABLES A-55


3GBAPP 12/04/2012 16:44:50 Page 56

A-56 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:51 Page 57

APPENDIX STATISTICAL TABLES A-57


3GBAPP 12/04/2012 16:44:54 Page 58

A-58 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:44:55 Page 59

APPENDIX STATISTICAL TABLES A-59


3GBAPP 12/04/2012 16:44:59 Page 60

A-60 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:45:1 Page 61

APPENDIX STATISTICAL TABLES A-61


3GBAPP 12/04/2012 16:45:7 Page 62

A-62 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:45:11 Page 63

APPENDIX STATISTICAL TABLES A-63


3GBAPP 12/04/2012 16:46:15 Page 64

A-64 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:46:19 Page 65

APPENDIX STATISTICAL TABLES A-65


3GBAPP 12/04/2012 16:46:20 Page 66

A-66 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:46:22 Page 67

APPENDIX STATISTICAL TABLES A-67


3GBAPP 12/04/2012 16:46:22 Page 68

A-68 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:46:23 Page 69

APPENDIX STATISTICAL TABLES A-69


3GBAPP 12/04/2012 16:46:24 Page 70

A-70 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:46:25 Page 71

APPENDIX STATISTICAL TABLES A-71


3GBAPP 12/04/2012 16:46:26 Page 72

A-72 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:46:27 Page 73

APPENDIX STATISTICAL TABLES A-73


3GBAPP 12/04/2012 16:46:29 Page 74

A-74 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:46:30 Page 75

APPENDIX STATISTICAL TABLES A-75


3GBAPP 12/04/2012 16:46:31 Page 76

A-76 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:46:35 Page 77

APPENDIX STATISTICAL TABLES A-77


3GBAPP 12/04/2012 16:47:15 Page 78

A-78 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:27 Page 79

APPENDIX STATISTICAL TABLES A-79


3GBAPP 12/04/2012 16:47:29 Page 80

A-80 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:30 Page 81

APPENDIX STATISTICAL TABLES A-81


3GBAPP 12/04/2012 16:47:31 Page 82

A-82 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:31 Page 83

APPENDIX STATISTICAL TABLES A-83


3GBAPP 12/04/2012 16:47:33 Page 84

A-84 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:34 Page 85

APPENDIX STATISTICAL TABLES A-85


3GBAPP 12/04/2012 16:47:36 Page 86

A-86 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:37 Page 87

APPENDIX STATISTICAL TABLES A-87


3GBAPP 12/04/2012 16:47:37 Page 88

A-88 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:39 Page 89

APPENDIX STATISTICAL TABLES A-89


3GBAPP 12/04/2012 16:47:40 Page 90

A-90 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:42 Page 91

APPENDIX STATISTICAL TABLES A-91


3GBAPP 12/04/2012 16:47:44 Page 92

A-92 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:45 Page 93

APPENDIX STATISTICAL TABLES A-93


3GBAPP 12/04/2012 16:47:46 Page 94

A-94 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:47 Page 95

APPENDIX STATISTICAL TABLES A-95


3GBAPP 12/04/2012 16:47:50 Page 96

A-96 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:51 Page 97

APPENDIX STATISTICAL TABLES A-97


3GBAPP 12/04/2012 16:47:52 Page 98

A-98 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:53 Page 99

APPENDIX STATISTICAL TABLES A-99


3GBAPP 12/04/2012 16:47:54 Page 100

A-100 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:55 Page 101

APPENDIX STATISTICAL TABLES A-101


3GBAPP 12/04/2012 16:47:56 Page 102

A-102 APPENDIX STATISTICAL TABLES


3GBAPP 12/04/2012 16:47:57 Page 103

APPENDIX STATISTICAL TABLES A-103


3GBAPP 12/04/2012 16:47:58 Page 104

A-104 APPENDIX STATISTICAL TABLES


Traducido del inglés al español - www.onlinedoctranslator.com

ANEXO TABLAS ESTADÍSTICAS A-105

REFERENCIAS PARA TABLAS ESTADÍSTICAS

A. La Corporación Rand,Un millón de dígitos aleatorios con 1000,000 desviaciones normales,La prensa
libre, Glencoe, IL, 1955.
E. Laboratorios Geigy,Documenta Geigy, Mesas Científicas,Séptima edición, CIBA-Geigy
Limited, Basilea, Suiza, 1970.
FA Hald y SA Sinkbaek, “Tabla de puntos porcentuales de laX2Distribución,"
Skandinavisk Astuartietidskrift,33 (1950), 168–175.
GHO Hartley y ES Pearson,Tablas de biometría para estadísticos,Volumen 1, tercera edición,
Bentley House, Londres, 1970.
HHO Hartley y ES Pearson,Tablas de biometría para estadísticos,Volumen 1, tercera edición,
Bentley House, Londres, 1970.
JES Pearson y HO Hartley,Tablas de biometría para estadísticos,Volumen 1, Tercera Edición,
The Syndics of the Cambridge University Press, 1966. Y R. Latscha, “Tests of
Importancia en una tabla de contingencia 2 - 2: extensión de la tabla de Finney”,biometrika,40
(1953), 74–86.
K. Frank Wilcoxon, SK Katti y Roberta A. Wilcox,Valores críticos y niveles de probabilidad para la prueba de
rango con signo de Wilcoxon,División de Laboratorios Lederle, American Cyanamid Company, Pearl
River, NY, en cooperación con el Departamento de Estadística, Universidad Estatal de Florida,
Tallahassee, Florida, 1963.
LLR Verdooren, "Tablas extendidas de valores críticos para la prueba estadística de Wilcoxon",
biometrika,50 (1963), 177–186. y WJ Conover,Estadística práctica no paramétrica, John
Wiley and Sons, Nueva York, 1971, 384–388.
MLH Miller, "Tabla de puntos porcentuales de las estadísticas de Kolmogorov",Revista de la Asociación
Estadounidense de Estadística,51 (1956), 111–121. y WJ Conover,Estadística práctica no paramétrica,
Tercera edición, John Wiley and Sons, Nueva York, 1999, 547.
NWH Kruskal y WA Wallis, "Uso de rangos en el análisis de varianza de un criterio" Revista de la Asociación
Estadounidense de Estadística,47 (1952), 583–621; fe de erratas,ibídem,48 (1953), 907–911.

OM Friedman, “El uso de rangos para evitar la suposición de normalidad implícita en el análisis de
varianza”,Revista de la Asociación Estadounidense de Estadística,32 (1937), 675–701.
P. Gerald J. Glasser y Robert F. Winter, "Valores críticos del coeficiente de correlación de rangos
para probar la hipótesis de la independencia"biometrika,48 (1961), 444–448.
RESPUESTAS A
EJERCICIOS IMPAR

Capítulo 1
Ejercicios de repaso

7.Situación A
(a)300 hogares (b)todos los hogares en el pequeño pueblo del sur
(C)número de niños en edad escolar niños (d)todo lo que reportó uno o más
presentes (mi)nominal (categorías: 0 niños, 1 niño, etc.)
Situación B
(a)250 pacientes (b)todos los pacientes ingresados en el hospital durante los últimos
año (C)la distancia a la que vive el paciente del hospital (d)250 distancias
(mi)relación

Capitulo 2
2.3.1. (a)
Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia

0–0,49 3 3 3.33 3.33


. 5–0,99 3 6 3.33 6.67
1,0–1,49 15 21 16.67 23.33
(Continuado)

Histograma de pindex Polígono de frecuencia de pindex


50 50

40 40

30 30
Frecuencia

Frecuencia

20 20

10 10

0 0
0,25 0,75 1,25 1,75 2,25 2,75 0.25 0.75 1.25 1,75 2,25 2.75 3.25
Pindex Pindex

A-107
A-108RESPUESTAS A LOS EJERCICIOS IMPAR

Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia

1.5–1.99 15 36 16.67 40.00


2,0–2,49 45 81 50.00 90.00
2,5–2,99 9 90 10.00 100.00

(b)40,0% (C) .7667 (d)16,67% (mi)9 (F)16,67%


(gramo)2.17, porque compone casi el 25 por ciento de los datos y es el valor que ocurre con
más frecuencia en el conjunto de datos. (h)Sesgada a la izquierda.
2.3.3. (a)
Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia

20–24,99 2 2 0.069 6,90


25–29,99 11 13 0.3793 44.83
30–34,99 6 19 0.2069 65.52
35–39,99 2 21 0.069 72.41
40–44,99 5 26 0.1724 89.66
45–49,99 2 28 0.069 96.55
50–54,99 1 29 0.0345 100.00

Histograma de IMC Polígono de frecuencias del IMC

12 12

10 10

8 8
Frecuencia
Frecuencia

6 6

4 4

2 2

0 0
22,5 27,5 32,5 37,5 42,5 47,5 52,5 17.5 27.5 37.5 47.5 57.5
IMC IMC

(b)44,83% (C)24,14% (d)34,48% (mi)los datos son correctos


sesgado (F)21
RESPUESTAS A LOS EJERCICIOS IMPAR A-109

2.3.5. (a)
Clase Relativo
Intervalo Frecuencia Frecuencia

0–2 5 0.1111
3–5 dieciséis 0.3556
6–8 13 0.2889
9–11 5 0.1111
12–14 4 0.0889
15-17 2 0.0444

45 1.000

Histograma de Horas
18
dieciséis

14
12
Frecuencia

10
8
6
4
2
0
1 4 7 10 13 dieciséis

Horas

Polígono de frecuencia de horas


18
dieciséis

14
12
Frecuencia

10
8
6
4
2
0
–2 1 4 7 10 13 dieciséis 19
Horas

(b)sesgado a la derecha
A-110RESPUESTAS A LOS EJERCICIOS IMPAR

2.3.7. (a)
Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia

110–139 8 8 0.0516 0.0516


140–169 dieciséis 24 0.1032 0.1548
170–199 46 70 0.2968 0.4516
200–229 49 119 0.3161 0.7677
230–259 26 145 0.1677 0.9354
260–289 9 154 0.0581 0.9935
290–319 1 155 0.0065 1.0000

Histograma de puntuaciones

50

40
Frecuencia

30

20

10

0
125 155 185 215 245 275 305
Puntuaciones

Polígono de frecuencia de puntuaciones

50

40
Frecuencia

30

20

10

0
95 125 155 185 215 245 275 305 335
Puntuaciones

(b)No muy sesgado


RESPUESTAS A LOS EJERCICIOS IMPAR A-111

2.3.9. (a)

Visualización de tallo y hojas: Visualización de tallo y hojas:


Hospital A Hospital B

Tallo y hoja de C1 N = 25 Hoja Tallo y hoja de C2 N = 25 Hoja


Unidad = 1.0 Unidad = 1.0

1 17 1 1 12 5
2 18 4 2 13 5
4 19 15 4 14 35
9 20 11259 9 15 02445
(6) 21 233447 (4) 16 5678
10 22 2259 12 17 38
6 23 389 10 18 466
3 24 589 7 19 0059
3 20 3
2 21 24

(b)Ambos asimétricos: A está sesgado a la izquierda y B está sesgado a la derecha.

2.3.11. (a)
Acumulativo
Clase Acumulativo Relativo Relativo
Intervalo Frecuencia Frecuencia Frecuencia Frecuencia

. 0–.0999 45 45 20.83 20.83


. 1–.1999 50 95 23.15 43.98
. 2–.2999 34 129 15.74 59.72
. 3–.3999 21 150 9.72 69.44
. 4–.4999 23 173 10.65 80.09
. 5–.5999 12 185 5.56 85.65
. 6–.6999 11 196 5.09 90.74
. 7–.7999 6 202 2.78 93.52
. 8–.8999 4 206 1.85 95.37
. 9–.9999 5 211 2.31 97.69
1.0–1.0999 4 215 1.85 99.54
1.1–1.1999 1 216 0.46 100.00
A-112RESPUESTAS A LOS EJERCICIOS IMPAR

Histograma de relación S/R

50

40

Frecuencia
30

20

10

0
0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 1,05
Relación S/R

Polígono de frecuencia de relación S/R

50

40
Frecuencia

30

20

10

0
1.15
1.05

1.25
0.15
0.05

0.25
0.35
0,45
0,55
0,65
0.75
0.85
0,95
– 0.05

Relación S/R

Tallo y hojas de C1 norte = 216


Unidad de hoja = 0.010

46 0 00000000001122233334444555555666666677777778888999
96 1 0011111223444444445568696998
(34) 2
86 3 0011112444445556668999
4
sesenta y cinco 00001122223333444568899
42 5 002334444599
30 6 02236788999
19 7 012289
13 8 0237
9 9 05588
4 10 236
1 11 6
RESPUESTAS A LOS EJERCICIOS IMPAR A-113

(b)sesgado a la derecha (C)10, 4,62% (d)196, 90,74%; 67, 31,02%, 143,


19,91%
2.5.1. (a)193.6 (b)205.0 (C)sin modo (d)255 (mi)5568.09
(F)74.62 (gramo)38.54 (h)100.5
2.5.3. (a)47.42 (b)46.35 (C)54,0, 33,0 (d)29.6 (mi)76.54
(F)8.75 (gramo)18.45 (h)13.72
2.5.5. (a)16.75(b)15(C)15(d)43(mi)124.02(F)11.14
(gramo)66.51 (h)8.25
2.5.7. (a)1.8172 (b)2 (C)2.17 (d)2.83 (e) .3164
(f) .5625 (gramo)30.95 (h) .6700
2.5.9. (a)33.87 (b)30.49 (C)ninguno (d)29.84 (mi)64.00
(F)8.00 (gramo)23.62 (h)13.4
2.5.11. (a)6.711 (b)7.00 (C)7.00 (d)dieciséis (mi)16.21
(F)4.026 (gramo)59.99 (h)5.5
2.5.13. (a)204.19 (b)204 (C)198, 204, 205, 212 (d)196
(mi)1257.99 (F)35.47 (gramo)17.37 (h)46

Ejercicios de repaso

13. (a)Unidad de hoja = 1.0 2


2 55
4 2 67
7 2 999
10 3 001
17 3 2223333
(12) 3 444555555555
21 3 666666666666666666677
(b)sesgado (C)la cirugía se realiza antes del nacimiento; el nacimiento es generalmente alrededor de 37
semanas (d) -X¼33:680, mediana¼35:00,s¼3:210,s2¼10:304
15. (a) -X¼43:39, mediana¼42,s¼17:09, CV:¼39:387,s2¼292:07
(b)Tallo y hoja de GFR N = 28 Unidad de hoja
= 1.0

1 1 8
6 2 11377
12 3 022267
(7) 4 1223388
9 5 158
6 6 02378
1 7
1 8 8
(C)Ver gráfico en la página siguiente (A-113)
(d)67,9%, 96,55%, 100%
A-114RESPUESTAS A LOS EJERCICIOS IMPAR

Diagrama de caja de la TFG

90
80
70
60

TFG
50
40
30
20
10

17Algunos ejemplos incluyen diferencia, diversidad, partida, discrepancia, desviación y


entropía.
19.-X¼3:95, mediana¼3,s¼3:605,s2¼12:998
21Las respuestas variarán: no es raro que los estudiantes obtengan calificaciones más altas en los exámenes a medida que
avanza el semestre; por lo tanto, es probable que los puntajes de los exámenes queden sesgados, lo que hace que la
mediana, que se ve menos afectada por el sesgo, sea la mejor opción.
23Las respuestas variarán: usando la regla de Sturges, dondew¼R k; k¼1þ3:322dregistro10300Þ
'9:23. Se puede encontrar una estimación de la desviación estándar de la muestra dividiendo el
rango de muestra por 4. Por lo tanto,s -R 4de modo queR-4s.Usando esta fórmula, entoncesR¼160
yw¼160 9:23¼17:33 sugiriendo que (d) o (e) pueden ser apropiados.
25Las respuestas variarán: imagine que está examinando la ingesta de proteínas entre los estudiantes
universitarios. En general, es probable que la mayoría de los estudiantes consuman la ingesta diaria
promedio de proteínas, pero entre esta población, es probable que haya un buen número de atletas que
consumen grandes cantidades de proteínas debido a las demandas de su deporte. En ese caso, es
probable que los datos tengan un sesgo positivo y la mediana representa mejor la tendencia central de
los datos.
27 Variable norte Media Mediana TrMedia Desvst SE medio
S/R 216 0,3197 0,2440 0,2959 0,2486 0.0169
Variable Mínimo Máximo Q1 Q3
S/R 0.0269 1.1600 0.1090 0.4367
IQR¼ :3277, gama¼1:1331, RIQ=R¼ :2892

Diagrama de caja de la relación S/R

1.2
*
1.0 *
*
*
*
0.8
Relación S/R

0.6

0.4

0.2

0.0
RESPUESTAS A LOS EJERCICIOS IMPAR A-115

29. (a)Variable N nutri Media Mediana TrMean StDev SE 75,40 Significar

107 73,80 74,77 13,64 1.32


Variable Mínimo Máximo Q1 Q3
nutri 45.60 130.00 67,50 80,60
Diferencia¼186:0496, Rango¼84:4, RIC¼13:1, RQI=R¼ :1552

Histograma de estado

40

30
Frecuencia

20

10

0
60 80 100 120
Estados nutricionales

Polígono de frecuencia de estado

40

30
Frecuencia

20

10

0
50 75 100 125 150
Estados nutricionales

Tallo y hoja de C1 norte = 107


Unidad de hoja = 1.0
1 4 5
5 5 0004
12 5 5556899
18 6 013444
31 6 5555666777888
(28) 7 00000111222222222333333344444
48 7 666666666677888999
A-116RESPUESTAS A LOS EJERCICIOS IMPAR

30 8 000002234444
18 8 56889
13 9 01223
8 9 679
5 10 00
3 10 9
2 11
2 11
2 12 3
1 12
1 13 0
Diagrama de caja de estado

130 *
120 *
110
*
100
90
Estado

80
70
60
50
40 *

(d)75:4 - 13:64; 61,76, 89,04; 79=107¼ :7383; 75:4 - 2d13:64Þ;48,12, 102,68;


103=107¼ :9626; 75:4 - 3d13:64Þ;34,48, 116,32; 105=107¼ :9813
(mi)102=107¼ :9533 (F)1=107¼ :0093

Capítulo 3
3.4.1. (a) .6631 (b)marginal (C) .0332 (d)articulación (e) .0493
(F)condicional (g) .3701 (h)regla de suma
3.4.3. (a)drogas masculinas y fraccionadas, .3418 (b)Drogas masculinas o divididas o ambas, .8747
(C)hombre que recibió drogas divididas, .6134 (d)masculino, .6592
3.4.5. .95
3.4.7. .301
3.5.1. (a)Un sujeto que tiene el síntoma (S) y no tiene la enfermedad.
(b)Un sujeto que no tiene S pero tiene la enfermedad. (C) .96
(d) .9848(e) .0595(f) .99996(g) .00628, .999996, .3895, .9996,
. 8753, .9955 (h)el valor predictivo aumenta a medida que la tasa de enfermedad hipotética
aumenta
3.5.3. .9999977

Ejercicios de repaso

3. (a) .2143 (b) .5519 (C) .1536 (d) .4575 (e) .5065
5. (a) .1349 (b) .6111 (C) .3333 (d) .5873 (e) .3571
(f) .6667 (gramo)0 (h) .3269
RESPUESTAS A LOS EJERCICIOS IMPAR A-117

7. (a) 1. .2200 2. .5000 3. .0555 4. .1100 5. .5900


(b) 1. .3000 2. .3900 3. .3900 4. .1667 5. .0700 6. .6000
9. (a) .0432 (b) .0256 (C) .0247 (d) .9639 (e) .5713
(f) .9639 (g) .9810
11. .0060
13. .0625
15.madres menores de 24 años
17conjunto nulo, ya que los eventos son mutuamente excluyentes

19. (a)lipoproteínas plasmáticas entre 10 y 15 o mayor o igual a 30.


(b)lipoproteína plasmática entre 10-15 y mayor o igual a 30.
(C)lipoproteína plasmática entre 10-15 y menor o igual a 20.
(d)lipoproteínas plasmáticas entre 10 y 15 o menos o igual a 20.
21. (a) .7456 (b) .3300
23. .0125

Capítulo 4
4.2.1. (a)
Número de Frecuencia Relativo Acumulativo
Sustancias utilizadas Frecuencia Frecuencia

0 144 . 19 . 19
1 342 . 44 . 63
2 142 . 18 . 81
3 72 . 09 . 90
4 39 . 05 . 95
5 20 . 03 . 98
6 6 . 01 . 99
7 9 . 01 1.00
8 2 . 003 1.003
9 1 . 001 1.004
Total 777 1.004

(b) 0.5

0.4
Frecuencia

0.3

0.2

0.1

0.0
0 1 2 3 4 5 6 7 8 9
Número de sustancias utilizadas
A-118RESPUESTAS A LOS EJERCICIOS IMPAR

1.0
0.9
0.8
0.7

Frecuencia
0.6
0.5
0.4
0.3
0.2
0.1
0 1 2 3 4 5 6 7 8 9
Número de sustancias utilizadas

4.2.3. -X¼1:58,s2¼2:15,s¼1:47
4.3.1. (a) .1484 (b) .8915 (C) .1085 (d) .8080
4.3.3. (a) .2536, (b) .3461 (C) .7330 (d) .9067 (e) .0008
4.3.5.significar¼4:8, variación¼3:264
4.3.7. (a) .5314(b) .3740(C) .0946(d) .9931 (e) .0946
(f) .0069
4.3.9.
Número de Probabilidad,f(x)
éxitos,X

0 3!
d:2Þ3d:8Þ0¼ :008
0!3!
1 3!
d:2Þ2d:8Þ1¼ :096
1!2!
2 3!
d:2Þ1d:8Þ2¼ :384
2!1!
3 3!
d:2Þ0d:8Þ3¼ :512
3!0!
Total 1

4.4.1. (a) .156 (b) .215 (C) .629 (d) .320


4.4.3. (a) .105 (b) .032 (C) .007 (d) .440
4.4.5. (a) .086 (b) .946 (C) .463 (d) .664 (e) .026
4.6.1. .4236
4.6.3. .2912
4.6.5. .0099
4.6.7. .95
4.6.9. .901
4.6.11. 2.54
4.6.13.1.77
4.6.15.1.32
RESPUESTAS A LOS EJERCICIOS IMPAR A-119

4.7.1. (a) .6321 (b) .4443 (C) .0401 (d) .3064


4.7.3. (a) .1357 (b) .2389 (C) .6401 (d) .0721 (e) .1575
4.7.5. (a) .3413 (b) .1056 (C) .0062 (d) .3830
4.7.7. (a) .0630 (b) .0166 (C) .7719
Ejercicios de repaso

15. (a) .0212 (b) .0949 (C) .0135 (d) .7124


17. (a) .034 (b) .467 (C) .923 (d) .010 (e) .105
19. (a) .4967 (b) .5033 (C) .1678 (d) .0104 (e) .8218
21. (a) .0668 (b) .6247 (C) .6826
23. (a) .0013 (b) .0668 (C) .8931
2557.1
27. (a)64.75 (b)118.45 (C)130.15 (d)131.8
2914.90
3110.6
33. (a)Bernoulli suponiendo que existe la misma probabilidad de ambos (b)No
géneros Bernoulli: más de dos resultados posibles (C)No Bernoulli: el peso no es un
variable binaria

Capítulo 5
5.3.1.204, 6.2225
5.3.3. (a) .1841 (b) .7980 (C) .0668
5.3.5. (a) .0020 (b) .1736 (C) .9777 (d) .4041
5.3.7. (a) .9876 (b) .0668 (C) .0668 (d) .6902
5.3.9.
Muestra -
X
6, 8, 10 8.00
6, 8, 12 8.67
6, 8, 14 9.33
6, 10, 12 9.33
6, 10, 14 10.00
6, 12, 14 10.67
8, 10, 12 10.00
8, 10, 14 10.67
8, 12, 14 11.33
10, 12, 14 12.00

metro-X¼10;s-X¼1:333

5.4.1. .3897
5.4.3. .0038
5.4.5. .0139
5.5.1. .1131
5.5.3. .0808
5.5.5. (a) .1539 (b) .3409 (C) .5230
5.6.1. .1056
5.6.3. .7938
A-120RESPUESTAS A LOS EJERCICIOS IMPAR

Ejercicios de repaso

11. .0003
13. .0262
15. .1335
17. .1093
19. .1292
21252
23. .53, .0476
25Al menos aproximadamente normalmente distribuida
27. .9942
29. (a)No (b)Sí (C)No (d)Sí (mi)Sí (F)Sí
Capítulo 6
6.2.1. (a)88, 92 (b)87, 93 (C)86, 94
6.2.3. (a)7.63, 8.87 (b)7,51, 8,99 (C)7.28, 9.22
6.2.5.1603.688, 1891.563; 1576.125, 1919.125; 1521.875, 1973.375
6.3.1. (a)2.1448(b)2.8073(C)1.8946(d)2.0452
6.3.3. (a)1.549, .387 (b)2,64, 4,36; .49, .91 (C)Tasas de difusión de óxido nítrico
se distribuyen normalmente en la población de la que se extrajo la
muestra. (d)más estrecho (mi)más amplio

6.3.5.66,2, 76,8; 65,1, 77,9; 62,7, 80,3


6.4.1. 549:82; 340:17; 571:28; 318:72; 615:52; 274:48
6.4.3. 5:90; 17:70; 8:15; 19:95; 12:60; 24:40
6.4.5.64,09, 479,91; 19,19, 524,81; 77:49, 621.49
6.4.7.2.1, 4.5; 1,8, 4,8; 1.3, 5.3
6.4.9. 32:58; 25:42; 33:33; 24:67; 34:87; 23:13
6.5.1. .1028, .1642
6.5.3. .4415, .6615
6.6.1. .0268, .1076
6.6.3. :0843, .2667
6.7.1.27, 16
6.7.3.19
6.8.1.683, 1068
6.8.3.385, 289
6.9.1.6.334, 44.63
6.9.3.793.92, 1370.41
6.9.5.1.17, 2.09
6.9.7.170:98503 s2 630:65006
6.10.1. .44, 17.37
6.10.3. .49, 2,95
6.10.5. .9, 3.52
6.10.7.5.13, 60.30

Ejercicios de repaso

13.-X¼79:87,s2¼28:1238,s¼5:3; 76,93, 82,81


15. p̂¼ :30; .19, .41
RESPUESTAS A LOS EJERCICIOS IMPAR A-121

17. p̂1¼ :20; pag2¼ :54, .26, .42


19. p̂¼ :90; .87, .93
21.-X¼19:23,s2¼20:2268; 16.01, 22.45
23 2:18, 2.82
25362.73, 507.27
27. .44, .74
29 :416, .188
31Disminuye el nivel de confianza. El intervalo no tendría ancho. El nivel de
confianza sería cero.
33.z,8.1, 8.1
35.Todos los conductores mayores de 55 años. Conductores de 55 años o más que participan en el estudio de la visión.
37. .2865, .3529 (Usarzdesdenorte >30)

Capítulo 7
7.2.1.RechazarH0porque 2:57 < 2:33,pag¼ :0051 < :01
7.2.3.Fallo para rechazarH0porque :76 < 1:333:pag > :10
7.2.5.si, rechazarH0,z¼5:73 < 1:645:pag < :0001
7.2.7.No, fallar al rechazarH0.t¼1:5 > 1:709: :05 <pag < :10
7.2.9.si, rechazarH0,z¼3:08:pag¼ :0010
7.2.11.z¼4, rechazarH0,pag < :0001
7.2.13.t¼ :1271, falla al rechazarH0.pag > :2
7.2.15.z¼4:18, rechazarH0.pag < :0001
7.2.17.z¼1:67, fallar al rechazarH0.pag¼2d:0475Þ ¼ :095
7.2.19.RechazarH0desdez¼ 4:00:pag < :0001
7.3.1.RechazarH0porque 10:9 < 2:388;pag < :005
7.3.3.RechazarH0porque 9:60 < 2:6591;pag <2d:005Þ
7.3.5.RechazarH0porquez¼3:39 > 1:96:pag¼2d:0003Þ
7.3.7.s2pag¼5421:25;t¼6:66. RechazarH0.pag <2d:005Þ ¼ :010
7.3.9.z¼3:39. RechazarH0.pag¼2d1 :9997Þ ¼ :0006
7.3.11.t¼3:3567. RechazarH0.pag < :01
7.4.1.RechazarH0porque 3:17 > 2:624;pag < :005
7.4.3.RechazarH03:1553 < 1:8125; :005 <pag < :01
7.4.5.RechazarH0desde 4:4580 < 2:4469;pag < :01
7.5.1.RechazarH0desde 1:62 > 1:645:pag¼ :0526
7.5.3.RechazarH0porque 1:77 < 1:645;pag¼ :0384
7.5.5.RechazarH0porquez¼ 2:21;pag¼ :0136
7.6.1.RechazarH0porque 2:86 < 2:58;pag¼ :0042
7.6.3.Fallo para rechazarH0porquez¼1:70 < 1:96;pag¼ :088
7.7.1.no rechazarH0desde 5:142 < 20:723 < 34:267;pag > :01 (prueba bilateral).
7.7.3.X2¼6:75. no rechazarH0.pag > :05 (prueba de dos caras)
7.7.5.X2¼28:8. no rechazarH0.pag > :10
7.7.7.X2¼22:036; :10 >pag > :05
7.8.1.No se puede rechazar porque V:R:¼1:226 < 1:74pag > :10
7.8.3.No, V:R:¼1:83;pag > :10
7.8.5.RechazarH0. V: R:¼4; :02 <pag < :05
7.8.7.V: R:¼2:1417;pag > :10
A-122RESPUESTAS A LOS EJERCICIOS IMPAR

7.9.1.
Alternativa valor del poder
Valor demetro b Función 1b

516 0.9500 0.0500


521 0.8461 0.1539
528 0.5596 0.4404
533 0.3156 0.6844
539 0.1093 0.8907
544 0.0314 0.9686
547 0.0129 0.9871

7.9.3. 1.0

0.8

0.6
Fuerza

0.4

0.2

0.0
515 520 525 530 535 540 545 550
Valores alternativos de mu

Alternativa valor del poder


Valor demetro b Función 1b

4.25 0.9900 0.0100


4.50 0.8599 0.1401
4.75 0.4325 0.5675
5.00 0.0778 0.9222
5.25 0.0038 0.9962

1.0

0.8

0.6
Fuerza

0.4

0.2

0.0
4.2 4.4 4.6 4.8 5.0 5.2
Valores alternativos de mu
RESPUESTAS A LOS EJERCICIOS IMPAR A-123

7.10.1.norte¼548;C¼518:25. Seleccione una muestra de tamaño 548 y calcule:X.Si - 518:25,


X rechazarH0. Si -X <518:25 no rechacesH0.
7.10.3.norte¼103;C¼4:66. Seleccione una muestra de tamaño 103 y calcule:XSi - 4:66, rechazar
x altura0. Si -X <4:66, no rechacesH0.

Ejercicios de repaso

19RechazarH0desde 29:49 > 2:33:pag < :0001


21No se puede rechazar el nulo porquez¼1:48 < 1:96:pag¼ :1388
23RechazarH0desde 12:79 > 2:58:pag < :0001
25Fallo para rechazarH0porque 1:10 < 1:645;pag¼ :1357
27t¼3:873;pag < :005
29d-¼11:49;s2 d¼256:679;sd¼16:02;t¼2:485; :025 >pag > :01
31RechazarH0desde 2:286 < 1:7530; :025 >pag > :01

Respuestas a ejercicios41–55obtenido por MINITAB


41.95,0% IC
(456.8, 875.9)
t pagvalor
7.09 0.0000
Prueba demetro¼0 contrametrono¼0
43.95,0% IC
(0.224, 0.796)
tpvalor
3,65 0,0010
Prueba demetro¼0 contrametrono¼0

45.Prensa de piernas: 95,0% IC Abductor del brazo: IC 95,0%


(32.22, 56.45) (3.717, 7.217)
tpvalor tpvalor
7.85 0.0000 6.70 0.0000
Prueba demetro¼0 contrametrono¼ Prueba demetro¼0 contrametrono¼0
0 Flexor de cadera: 95,0% IC abductor del brazo: IC del 95,0 %
(3.079, 6.388) (4.597, 7.670)
tpvalor tpvalor
6.14 0.0000 8.56 0.0000
Prueba demetro¼0 contrametrono¼ Prueba demetro¼0 contrametrono¼0

0 extensor de cadera: 95,0% IC


(6.031, 10.236)
tpvalor
8.30 0.0000
Prueba demetro¼0 contrametrono¼0

47.95,0% IC
d71:9; 26:5Þ
t pagvalor
4:34 0.0001
Prueba demetro¼0 contrametrono¼0
A-124RESPUESTAS A LOS EJERCICIOS IMPAR

49.IC del 95,0 % parametro1 metro2:d83:8; 20Þ


tpruebametro1 metro2dvs: no¼Þ :t¼3:30pag¼ :0021 d: f:¼42
tpruebametro1 metro2dcontra: <Þ :t¼3:30pag¼ :0011 d: f:¼42
51.IC del 95,0 % parametroGRUPO 1-metroGRUPO 2 (.5, 26.4)
tpruebametroGRUPO 1¼metroGRUPO 2dvs: no¼Þ :t¼2:88pag¼ :045 d: f:¼4
53.IC del 95,0 % parametro1 metro2:d3:00; 22Þ
tpruebametro1¼metro2dvs: no¼Þ :t¼ :29pag¼ :77 d: f:¼53 Ambos
usan Desv. estándar agrupada¼4:84
55.IC del 95,0 % parametroPT metroC:d7:6; 18:8Þ
tpruebametroPT¼metroCdvs: no¼Þ :t¼4:78pag¼0:0000 d: f:¼31

Capítulo 8

Respuestas para 8.2.1–8.2.7 obtenidas por SAS1

8.2.1.F = 6,24
pag= .0004
Alfa 0.05
Error Grados de libertad Error 325
Cuadrado medio 1.068347
Valor crítico del rango estudentizado 3.65207

Las comparaciones significativas al nivel de 0,05 se indican mediante ***.

Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
90 - 30 0.1911 - 0.1831 0.5652
90 - 120 0.6346 0.1320 1.1372 ***
90 - 60 0.6386 0.1360 1.1413 ***
30 - 90 - 0.1911 - 0.5652 0.1831
30 - 120 0.4436 - 0.1214 1.0085
30 – 60 0.4476 - 0.1173 1.0125
120 - 90 - 0.6346 - 1.1372 - 0,1320 ***
120 - 30 - 0.4436 - 1.0085 0.1214
120 - 60 0.0040 - 0.6531 0.6611
60 - 90 - 0.6386 - 1.1413 - 0,1320 ***
60 - 30 - 0.4476 - 1.0125 0.1173
60 - 120 - 0.0040 - 0.6611 0.6531
8.2.3.F = 9,36
p = < .0001
Alfa 0.05
Grados de libertad de error 109
RESPUESTAS A LOS EJERCICIOS IMPAR A-125

Cuadrado medio del error 211252.3


Valor crítico del rango estudentizado 3.68984

Las comparaciones significativas al nivel de 0,05 se indican mediante ***.

Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
A-B 455.72 45.73 865.71 ***
A-C 574.54 235.48 913.59 ***
A-D 596.63 287.88 905.39 ***
B-A - 455.72 - 865.71 - 45,73 ***
ANTES DE CRISTO 118.82 - 271.45 509.09
B-D 140.91 - 223.34 505.17
C-A - 574.54 - 913.59 - 235,48 ***
C-B - 118.82 - 509.0 271.45
CD 22.10 - 259.95 304.14
D-A - 596.63 - 905.39 - 287,88 ***
D-B - 140.91 - 505.17 223.34
D-C - 22.10 - 304.14 259.95
8.2.5.F = 9,26
pag= .0009
Alfa 0.05
Error Grados de libertad Error 26
Cuadrado medio 637.384
Valor crítico del rango estudentizado 3.51417

Las comparaciones significativas al nivel de 0,05 se indican mediante ***.

Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
Y - MA 18.16 - 10.67 46.98
S.M 48.13 20.07 76,19 ***
PUEDE - 18.16 - 46,98 10.67
MA - E 29.97 1.15 58,80 ***
E-Y - 48.13 - 76.19 - 20.07 ***
E-MA - 29,97 - 58,80 - 1,15 ***
8.2.7.F = 4,94
pag= .0026
Alfa 0.05
Error Grados de libertad Error 174
Cuadrado medio 0.17783
Valor crítico del rango estudentizado 3.66853
A-126RESPUESTAS A LOS EJERCICIOS IMPAR

Las comparaciones significativas al nivel de 0,05 se indican mediante ***.

Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
0-1 0.10165 - 0.13866 0.34196
0-2 0.17817 - 0.2188 0.37822
Diferencia Simultáneo
Grupo Entre 95% de confianza
Comparación Medio Límites
0-3 0.35447 0.10511 0,60383 ***
1-0 - 0.10165 - 0.34196 0.13866
1-2 0.07652 - 0.17257 0.32561
1-3 0.25281 - 0.03737 0.54300
2-0 - 0.17817 - 0.37822 0.02188
2-1 - 0.07652 - 0.32561 0.17257
2-3 0.17630 - 0.08154 0.43413
3-0 - 0.35447 - 0.60383 - 0,10511 ***
3-1 - 0.25281 - 0.54300 0.03737
3-2 - 0.17630 - 0.43413 0.08154
8.3.1.V: R:¼19:79;pag < :005
8.3.3.V: R:¼30:22;pag < :005
8.3.5.V: R:¼7:37; :025 >pag > :01
8.3.7.Totald:f:¼Bloque 41 (Perros)d:f:¼5 Tratamientos (Tiempos)d:f:¼6, errord:f:¼ 30

8.4.1.V: R:¼48:78;pag < :005


8.4.3.V: R:¼16:45;pag < :005
8.4.5.Totald:f:¼29, bloque (sujeto)d:f:¼9, Tratamiento (Tiempo)d:f:¼2, error d:f:
¼18
8.5.1.Ion V:R:¼6:18;pag¼ :023; dosis V:R:¼74:59;pag¼ :000; entre V:R:¼ :89pag¼
:427
8.5.3.Migraña V:R:¼19:98;pag < :0001; tratar V:R:¼2:13;pag¼ :1522; interacción
V:R:¼1:42;pag¼ :2404
Ejercicios de repaso

13V: R:¼7:04;pag¼ :000. La media de la muestra para los sujetos sanos es significativamente
diferente de las medias de las categorías B, C y D. Ninguna otra diferencia entre las medias
de la muestra es significativa.
15.V: R:¼1:35;pag¼ :274. No rechacesH0.
17Tabaquismo V:R:¼3:16;pag¼ :052, Agotamiento Vital Grupo
V:R:¼6:84;pag¼ :003, Interacción V:R:¼2:91;pag¼ :032
19V: R:¼4:23;pag < :001
21V: R:¼6:320;pag¼ :008
23V: R:¼3:1187;pag¼ :043. La media de la muestra D es significativamente diferente de la media de la
muestra B. Ninguna otra diferencia entre las medias muestrales es significativa.
RESPUESTAS A LOS EJERCICIOS IMPAR A-127

25V: R:dEdad¼29:38;pag < :001; Ocupación V:R:¼31:47;pag < :001; Interacción


V:R:¼7:12;pag < :001
27499,5, 9, 166,5, 61,1667, 2,8889, 57,6346, <:005
29. (a)Completamente al azar, (b)3, (C)30, (d)No porque
1:0438 < 3:35
31V: R:¼26:06;pag < :001: HSD¼2:4533. Todas las diferencias significativas exceptometroLuz
metroModerado
33.V: R:¼2:37;pag¼ :117, Tukey HSD no es necesario.
35. (a)ANOVA unidireccional
(b)Respuesta: puntaje post-pre-entrenamiento
(C)Factores: Grupos de años de experiencia (con 4 niveles)
(d)experiencia quirúrgica e interés en obstetricia
(mi)sin efectos de arrastre
(F)el trato son años de experiencia d:f:¼3, total d:f:¼29, error d:f:¼26
37. (a)medidas repetidas
(b)Respuesta: DMO
(C)Factores: periodos de tiempo (con seis niveles)
(d)Dieta, ejercicio y consumo de calcio.
(mi)sin efectos de arrastre
(F)factor de tiempo d:f:¼5, factor sujeto d:f:¼25, total, error d:f:¼125.
39.
Análisis de Varianza para bilirrubí Fuente
DF SS EM F PAG
sujeto 17 2480.83 145.93 45.57 0.000
tiempo 6 89.09 14.85 4.64 0.000
Error 102 326.65 3.20
Total 125 2896.57

41.CR = Relación de compresión


Análisis de Varianza para Fuente CR
DF SS EM F PAG
Grupo 4 9092 2273 8.12 0.001
Error 19 5319 280
Total 23 14411

IC del 95 % individual para la media basada


en la desviación estándar agrupada
Nivel norte Significar Desvst ---+----------+----------+----------+---
Control 6 79.96 5.46 (-----*-----)
I 4 78.69 21.44 (------*------)
Yo 4 47.84 23.74 (------*------)
tercero 5 43.51 10.43 (-----*------)
IV 5 33.32 20.40 (-----*------)
---+----------+----------+--------------
Desv. estándar agrupada = 16,73 25 50 75 100
Comparaciones por pares de Tukey
A-128RESPUESTAS A LOS EJERCICIOS IMPAR

Tasa de error familiar = 0,0500


Tasa de error individual = 0,00728
Valor crítico = 4,25
Intervalos para (media a nivel de columna) - (media a nivel de fila)
Control I Yo tercero

I - 31.19
33.72
Yo - 0,34 - 4,70
64.58 66.41
tercero 6.00 1,45 - 29,41
66.89 68,91 38,05
IV 16.19 11.64 - 19.21 - 21.61
77.08 79,10 48,24 41.99

43.ANOVA bidireccional: BC versus calor, cromo


Análisis de varianza para BC
Fuente DF SS EM F PAG
calor 1 0.1602 0.1602 3.95 0.061
cromo 1 0.6717 0.6717 16.55 0.001
Interacción 1 0.0000 0.0000 0.00 0.994
Error 20 0.8119 0.0406
Total 23 1.6438
Análisis de varianza para fuente
de CA DF SS EM F PAG
calor 1 0.0468 0.0468 1.99 0.174
cromo 1 0.4554 0.4554 19.34 0.000
Interacción 1 0.0039 0.0039 0.16 0.690
Error 20 0.4709 0.0235
Total 23 0.9769
Análisis de varianza para fuente AC/
BC DF SS EM F PAG
calor 1 0.04524 0.04524 15.62 0.001
cromo 1 0.00000 0.00000 0.00 1.000
Interacción 1 0.00385 0.00385 1.33 0.262
Error 20 0.05793 0.00290
Total 23 0.10702

45.CA = Ángulo de congruencia


Análisis de varianza para CA Fuente
DF SS EM F PAG
Grupo 3 7598 2533 14.83 0.000
Error 86 14690 171
Total 89 22288
RESPUESTAS A LOS EJERCICIOS IMPAR A-129

IC del 95 % individual para la media basada


en la desviación estándar agrupada
Nivel norte Significar Desvst -----+----------+----------+----------+-
Lateral 27 6,78 15,10 (----*----)
Medio 26 - 10.81 10.80 (----*----)
Multi 17 - 18.29 15.09 (------*-----)
Normal 20 - 7.00 10.76 (-----*-----)
-----+----------+----------+----------+-
Desv. estándar agrupada = 13.07 - 20 - 10 0 10
Comparaciones por pares de Tukey

Tasa de error familiar = 0,0500


Tasa de error individual = 0,0103

Valor crítico = 3,71


Intervalos para (media a nivel de columna) - (media a nivel de fila)
Lateral Medio Multi
Medio 8.16
27.01
Multi 14.46 - 3.21
35.69 18.18
Normal 3.66 - 14.01 - 22.60
23.89 6.39 0.02

47.
Análisis de Varianza para respuesta
Fuente DF SS EM F PAG
sujeto 5 25.78 5.16 4,72 0,018
temperatura 2 30.34 15,17 13,87 0,001
Error 10 10.93 1.09
Total 17 67.06

49.GC = concentración de glucosa


Análisis de varianza para la fuente
de GC DF SS EM F PAG
grupo 3 8.341 2.780 10.18 0.001
sujeto 5 8.774 1.755 6,43 0,002
Error 15 4.096 0.273
Total 23 21.210

51.
Análisis de Varianza para Fuente
T3 DF SS EM F PAG
sujeto 11 8967 815 2,55 0,030
día 2 12466 6233 19.50 0.000
Error 22 7033 320
Total 35 28467
A-130RESPUESTAS A LOS EJERCICIOS IMPAR

53.BBL = niveles de bilirrubina en sangre


Análisis de Varianza para Fuente
BBL DF SS EM F PAG
Grupo 2 4077 2039 3,31 0,090
Error 8 4931 616
Total 10 9008
IC del 95 % individual para la media basada
en la desviación estándar agrupada
Nivel norte Significar Desvst ---+----------+----------+----------+--
Control 4 63.50 28.25 - (--------*--- ------)
hipercoche 4 50.00 22.69 (---------*--------)
hiperosmo 3 98.00 22.27 (----------*----------)
- - - + - - - - - - - - - - + - - - - - - - - - - + - - - - - - - - - - + - - - 30
Desviación estándar agrupada = 24,83 60 90 120
Comparaciones por pares de Tukey

Tasa de error familiar = 0,0500


Tasa de error individual = 0,0213
Valor crítico = 4,04
Intervalos para (media a nivel de columna) - (media a nivel de fila)
Control hipercoche
hipercoche - 36,7
63.7
hiperosmo - 88,7 - 102.2
19.7 6.2

55.
Análisis de varianza para puntajes de respiración
Fuente DF SS EM F PAG
grupo 2 244.17 122.08 14.50 0.000
Error 38 319.88 8.42
Total 40 564.05
IC del 95 % individual para la media basada
en la desviación estándar agrupada
Nivel norte Significar Desvst ----+----------+----------+---------+--
1 13 13.231 1.739 (------*----- )
2 14 13.786 2.833 (-----*-----)
3 14 18.643 3.713 (------*-----)
----+----------+----------+----------+--
Desv. estándar agrupada = 2.901 12.5 15.0 17.5 20.0
Comparaciones por pares de Tukey

Tasa de error familiar = 0,0500


Tasa de error individual = 0,0195 Valor
crítico = 3,45
RESPUESTAS A LOS EJERCICIOS IMPAR A-131

Intervalos para (media a nivel de columna) - (media a nivel de fila)


1 2
2 - 3.281
2.171
3 - 8.138 - 7.532
- 2.686 - 2.182

57. PSWQ¼Puntuación PSWQ

Análisis de varianza para la fuente


PSWQ DF SS EM F PAG
Grupo 3 16654.9 5551.6 74.11 0.000
Error 115 8614.6 74,9
Total 118 25269.5
IC del 95 % individual para la media basada
en la desviación estándar agrupada

Nivel norte Significar Desvst -----+----------+----------+----------+-


1 15 62.933 8.556 (---*---)
2 30 38.333 7.494 (--*--)
3 19 64.158 10.259 (---*---)
4 55 66.536 8.678 (--*-)
-----+----------+----------+----------+
Desviación estándar agrupada = 8,655 - 40506070
Comparaciones por pares de Tukey
Tasa de error familiar = 0,0500
Tasa de error individual = 0,0103
Valor crítico = 3,69

Intervalos para (media a nivel de columna) - (media a nivel de fila)


1 2 3
2 17.459
31.741
3 - 9.025 - 32.446
6.575 - 19.203
4 - 10.181 - 33.329 - 8.388
2.975 - 23.077 3.631
A-132RESPUESTAS A LOS EJERCICIOS IMPAR

59.
Análisis de Varianza por Edad
Fuente DF SS EM F PAG
Grupo 2 16323.2 8161.6 139.79 0.000
Error 189 11034.7 58.4
Total 191 27357.9

IC del 95 % individual para la media basada


en la desviación estándar agrupada
Nivel norte Significar Desvst -+----------+----------+----------+----
hija 50 49.420 7.508 - (--*-)
Esposo 65 71.985 7.516 (-*-)
Esposa 77 68.649 7.828 (-*-)
-+----------+----------+----------+-----
Desv. estándar agrupada = 7,641 48.056.064.072.0

Comparaciones por pares de Tukey

Tasa de error familiar = 0,0500


Tasa de error individual = 0,0192

Valor crítico = 3,34

Intervalos para (media a nivel de columna) - (media a nivel de fila)

Hija Marido

Marido - 25.959
- 19.170

Esposa - 22.507 0.296


- 15.952 6.375

61.SAVIA¼nivel de fosfatasa alcalina sérica

Análisis de Varianza para Fuente


SAP DF SS EM F PAG
Calificación 2 36181 18091 5,55 0,009
Error 29 94560 3261
Total 31 130742
RESPUESTAS A LOS EJERCICIOS IMPAR A-133

IC del 95 % individual para la media basada


en la desviación estándar agrupada
Nivel norte Significar Desvst -+----------+----------+----------+-----
I 9 118.00 61.85 (---------*--------)
Yo 8 143.63 55,90 (---------*---------)
tercero 15 194.80 54.82 (-------*------)
-+----------+----------+----------+----
Desv. estándar agrupada = 57,10 - 80120160200

Comparaciones por pares de Tukey

Tasa de error familiar = 0,0500


Tasa de error individual = 0,0197

Valor crítico = 3,49

Intervalos para (media a nivel de columna) - (media a nivel de fila)

I Yo
Yo - 94,1
42.8
tercero - 136,2 - 112,9
- 17.4 10.5

63.
Análisis de varianza para fuente de
hematocrito DF SS EM F PAG
Grupo 2 817.5 408.8 20.26 0.000
Error 27 544.8 20.2
Total 29 1362.3
IC del 95 % individual para la media basada
en la desviación estándar agrupada
Nivel norte Significar Desvst --+----------+----------+----------+----
Impostor 10 38.200 2.573 (----*----) 15 40.200
tratado 5.348 (---*---)
Sin tratar 5 53.200 4.604 (------*------)
--+----------+----------+----------+----
Desv. estándar agrupada = 4.492 36.042.048.054.0
Comparaciones por pares de Tukey

Tasa de error familiar = 0,0500


Tasa de error individual = 0,0196
A-134 RESPUESTAS A LOS EJERCICIOS IMPAR

Valor crítico = 3,51


Intervalos para (media a nivel de columna) - (media a nivel de fila)
Impostor tratado
tratado - 6.551
2.551
sin tratar - 21.106 - 18.757
- 8.894 - 7.243

sesenta y cinco.Ambos¼rhIGF-IþrhGH

Análisis de varianza para fuente de


respuesta DF SS EM F PAG
Grupo 3 4.148 1.383 1.39 0.282
Error dieciséis 15.898 0.994
Total 19 20.046
IC del 95 % individual para la media basada
en la desviación estándar agrupada
Nivel norte Significar Desvst ----------+---------+----------+-------
Ambos 5 11.520 0.653 (--------*---------)
rhGH 5 11.250 0.570 (--------*---------)
rhIGF-I 6 10.800 1.418 (---------*--------)
Salina 4 10.250 0.971 (---------*----------)
----------+---------+----------+-------
Desviación estándar agrupada = 0,997 10.0 11.0 12.0

Comparaciones por pares de Tukey

Tasa de error familiar = 0,0500


Tasa de error individual = 0,0113

Valor crítico = 4,05

Intervalos para (media a nivel de columna) - (media a nivel de fila)

Ambos rhGH rhIGF-I

rhGH - 1.5354
2.0754

rhIGF-I - 1.0086 - 1.2786


2.4486 2.1786

Salina - 0.6450 - 0.9150 - 1.2927


3.1850 2.9150 2.3927
RESPUESTAS A LOS EJERCICIOS IMPAR A-135

Capítulo 9
9.3.1. (a)Directo, (b)Directo, (C)Inverso
9.3.3. ŷ¼560þ0:140X
9.3.5. ŷ¼68:6 19:5X
9.3.7. ŷ¼0:193þ0:00628X
9.4.1Vaticinador coef SE Coef T PAG
Constante 559.90 29.13 19.22 0.000
metanfetamina dos 0.13989 0.06033 2.32 0.035

S = 68,28 R-Sq = 26,4% R-Cuadrado(ajustado) = 21,5 %

Análisis de variación

Fuente DF SS EM F PAG
Regresión 1 25063 25063 5,38 0,035
error residual 15 69923 4662
Total dieciséis 94986

Intervalo de confianza para b̂1.011, .268

9.4.3.Vaticinador coef SE Coef T PAG


Constante 68.64 16.68 4.12 0.006
Cmáx con - 19.529 4.375 - 4.46 0.004

S = 18,87 R-Sq = 76,9% R-Cuadrado(ajustado) = 73,0%

Análisis de variación

Fuente DF SS EM F PAG
Regresión 1 7098.4 7098.4 19,93 0,004
error residual 6 2137.4 356.2
Total 7 9235.9

Intervalo de confianza para b̂1-30,23, -8,82

9.4.5.Vaticinador coef SE Coef T PAG


Constante 0.19290 0.04849 3.98 0.001
DTPA TFG 0.006279 0.001059 5.93 0.000

S = 0,09159 R-Sq = 58,5% R-Cuadrado(ajustado) = 56,8 %

Análisis de variación
Fuente DF SS EM F PAG
Regresión 1 0.29509 0.29509 35.18 0.000
error residual 25 0.20972 0.00839
Total 26 0.50481
Intervalo de confianza para b̂10.0041, 0.0085
A-136RESPUESTAS A LOS EJERCICIOS IMPAR

9.5.1. (a)580.6, 651.2 (b)466.1, 765.6


9.5.3. (a)30:42, 5:22 (b)62:11, 36.92
9.5.5. (a)0,3727, 0,4526 (b)0.2199, 0.6055
9.7.1.r¼ :466;t¼2:23;pag¼ :038; :030 <r<:775
9.7.3.r¼ :812;t¼ 3:11;pag¼ :027; 1 <r < :152
9.7.5.r¼ :531;t¼ 3:31;pag¼ :003; :770 <r < :211

Ejercicios de repaso

17JUNTA¼191þ4:68 promedio;r2¼ :772;t¼17:163;pag < :001


19y-sombrero = 12.6 + 1.80x

Vaticinador coef SE Coef T PAG


Constante 12.641 2.133 5.93 0.000
No. de p 1.8045 0.5585 3.23 0.005

S = 7.081 R-Sq = 38,0% R-Cuadrado(ajustado) = 34,4 %

Análisis de variación

Fuente DF SS EM F PAG
Regresión 1 523.41 523.41 10.44 0.005
error residual 17 852.38 50.14
Total 18 1375.79

21La ecuación de regresión es B =


1.28 + 0.851 A

Vaticinador coef SE Coef T PAG


Constante 1.2763 0.3935 3.24 0.006
A 0.8513 0.1601 5.32 0.000

S = 0,2409 R-Sq = 68,5% R-Cuadrado(ajustado) = 66,1 %

Análisis de variación

Fuente DF SS EM F PAG
Regresión 1 1.6418 1.6418 28.29 0.000
error residual 13 0.7545 0.0580
Total 14 2.3963

23. ŷ¼61:8819þ :509687X;V: R:¼4:285; :10 >pag > :05;t¼2:07; IC del 95% para pag : :
03, 0,79; 110.3022; 87.7773, 132.8271
RESPUESTAS A LOS EJERCICIOS IMPAR A-137

25. ŷ¼37:4564þ :0798X;V: R:¼77:13;pag < :005;t¼8:78; IC del 95% parar: .91, 1;
40.63, 42.27.
29La ecuación de regresión es A =
570 + 0.429 B

Vaticinador coef SE Coef T PAG


Constante 569.8 141.2 4.03 0.000
B 0.42927 0.04353 9.86 0.000

S = 941,6 R-Sq = 54,0% R-Cuadrado(ajustado) = 53,4 %

Correlación de Pearson de B y A = 0,735 Valor


P = 0,000

31La ecuación de regresión es y =


45.0 + 0.867 x

Vaticinador coef SE Coef T PAG


Constante 44.99 33.54 1.34 0.193
X 0.86738 0.07644 11.35 0.000

S = 102,9 R-Sq = 84,8% R-Cuadrado(ajustado) = 84,2 %

Correlación de Pearson de x e y = 0,921 Valor


P = 0,000

33.La ecuación de regresión es S =


-1.26 + 2.10 DBS

Vaticinador coef SE Coef T PAG


Constante - 1.263 3.019 - 0,42 0.680
DBS 2.0970 0.1435 14.62 0.000

S = 8.316 R-Sq = 90,3% R-Cuadrado(ajustado) = 89,9 %

Correlación de Pearson de S y DBS = 0,950 Valor


P = 0,000

35.La ecuación de regresión es log y


= 2,06 + 0,0559 PCu

Vaticinador coef SE Coef T PAG


Constante 2.0603 0.3007 6.85 0.000
UCP 0.05593 0.01631 3.43 0.001
A-138RESPUESTAS A LOS EJERCICIOS IMPAR

S = 0,3873 R-Sq = 16,4% R-Cuadrado(ajustado) = 15,0%

Correlación de Pearson de PCu y log y = 0,405 Valor P


= 0,001

37.La ecuación de regresión es C6 =


-0.141 - 1.33 C5

Vaticinador coef SE Coef T PAG


Constante - 0.1413 0.2267 - 0,62 0.540
C5 - 1.3286 0.1242 - 10.69 0.000

S = 1.086 R-Sq = 84,5% R-Cuadrado(ajustado) = 83,7 %

Correlación de Pearson de IGELogE y SkinLogE = -0,919 Valor P =


0,000

39.Normotenso C6¼C4 C5; C7¼ ðC4þC5Þ=2; C8¼C2 C3; C9¼ ðC2þC3Þ=


2

La ecuación de regresión es C6 =
4.2 + 0.106 C7

Vaticinador coef SE Coef T PAG


Constante 4.19 17.30 0.24 0.811
C7 0.1060 0.1590 0,67 0.512
S = 5.251 R-Sq = 2,0% R-Cuadrado(ajustado) = 0.0%

Correlación de Pearson de C6 y C7 = 0,141 Valor


P = 0,512
La ecuación de regresión es C8 =
0.2 + 0.268 C9
Vaticinador coef SE Coef T PAG
Constante 0.25 18.53 0.01 0.989
C9 0.2682 0.2932 0.91 0.370
S = 5.736 R-Sq = 3.7% R-Cuadrado(ajustado) = 0.0%

Correlación de Pearson de C8 y C9 = 0,191 Valor


P = 0,370

preeclampsia

La ecuación de regresión es C6 =
57.9 - 0.363 C7
RESPUESTAS A LOS EJERCICIOS IMPAR A-139

Vaticinador coef SE Coef T PAG


Constante 57.89 17.10 3.39 0.003
C7 - 0.3625 0.1273 - 2.85 0.009

S = 7.109 R-Sq = 26,9% R-Cuadrado(ajustado) = 23,6 %

Correlación de Pearson de C6 y C7 = -0,519 Valor


P = 0,009

La ecuación de regresión es C8 =
54.4 - 0.540 C9

Vaticinador coef SE Coef T PAG


Constante 54.377 9.771 5.56 0.000
C9 - 0.5403 0.1154 - 4.68 0.000

S = 5.787 R-Sq = 49,9% R-Cuadrado(ajustado) = 47,6 %

Correlación de Pearson de C8 y C9 = -0,707 Valor


P = 0,000

41.La ecuación de regresión es


LBMD = 0.131 + 0.511 ABMD

Vaticinador coef SE Coef T PAG


Constante 0.13097 0.05413 2.42 0.018
ABMD 0.51056 0.05935 8.60 0.000

S = 0,09188 R-Sq = 53,6% R-Cuadrado(ajustado) = 52,9 %

Correlación de Pearson de ABMD y LBMD = 0,732


Valor P = 0,000

43.WL, VO2
La ecuación de regresión es WL =
0,01 + 0,262 VO2

Vaticinador coef SE Coef T PAG


Constante 0.013 1.308 0.01 0.992
VO2 0.26237 0.07233 3.63 0.003

S = 1.835 R-Sq = 52,3% R-Cuadrado(ajustado) = 48,3 %

Correlación de Pearson de WL y VO2 = 0,723 Valor


P = 0,003
A-140RESPUESTAS A LOS EJERCICIOS IMPAR

WL, en

La ecuación de regresión es WL =
0.75 + 0.367 AT

Vaticinador coef SE Coef T PAG


Constante 0.752 1.761 0.43 0.677
EN 0.3668 0.1660 2.21 0.047

S = 2.241 R-Sq = 28,9% R-Cuadrado(ajustado) = 23,0%

Correlación de Pearson de WL y AT = 0,538 Valor


P = 0,047

WL, ET
La ecuación de regresión es WL =
0.74 + 0.00637 ET

Vaticinador coef SE Coef T PAG


Constante 0.739 1.173 0,63 0.541
hora del Este 0.006375 0.001840 3.46 0.005

S = 1.879 R-Sq = 50,0% R-Cuadrado(ajustado) = 45,8 %

Correlación de Pearson de WL y ET = 0,707 Valor


P = 0,005

45.La ecuación de regresión es CL/F


= 19,4 + 0,893 CLer

Vaticinador coef SE Coef T PAG


Constante 19.393 4.496 4.31 0.000
CLer 0.89250 0.05671 15.74 0.000

S = 28,20 R-Sq = 59,3% R-Cuadrado(ajustado) = 59,1 %

Correlación de Pearson de CL/F y CLer = 0,770 Valor P


= 0,000

Capítulo 10
10.3.1. ŷ¼31:4þ0:473X1þ1:07X2
10.3.3. ŷ¼13:45þ4:02X1þ281X2
10.3.5. ŷ¼422:00þ11:17X1 :63X2
RESPUESTAS A LOS EJERCICIOS IMPAR A-141

10.4.1.
Análisis de variación

Fuente DF La suma de Significar


Cuadrícula Cuadrado valor F PR > F
Modelo 2 1576.99011 788.49506 185.13 <.0001
Error 32 136.29516 4.25922
corregido Total 34 1713.28527

MSE raíz 2.06379 R Plaza 0.9204


Media dependiente 51.25086 Cuadrado R adj. 0.9155
Coef Var 4.02684

Estimaciones de parámetros

Parámetro Estándar
Variable DF Estimar Error Valor t Pr > |t| 95% de confianza Límites

Interceptar 1 - 31.42480 6.14747 - 5.11 <.0001 - 43.94678 - 18.90282


X1 1 0.47317 0.06117 7.74 <.0001 0.34858 0.59776
X2 1 1.07117 0.06280 17.06 <.0001 0.94326 1.19909

(a) .9204 (C)X1pag-valor < :0001;X2pag-valor < :0001 X1:d0:34858


(d)IC del
0:59776Þ,IC
95% para
pendiente para del 95 % para la pendiente deX2:
d0:94326 1:19909Þ

10.4.3.
Análisis de variación
Fuente DF La suma de Significar
Cuadrícula Cuadrado valor F PR > F
Modelo 2 452.56375 226.28188 7.05 0.0210
Error 7 224.70025 32.10004
Total corregido 9 677.26400
MSE raíz 5.66569 R Plaza 0.6682
Media dependiente 57.16000 Cuadrado R adj. 0.5734
Coef Var 9.91198
Estimaciones de parámetros

Parámetro Estándar
Variable DF Estimar Error Valor t Pr > |t| 95% de confianza Límites
Interceptar 1 13.44923 13.23156 1.02 0.3433 - 17.83843 44.73689
X1 1 4.01680 1.07136 3.75 0.0072 1.48344 6.55016
X2 1 2.81175 1.37859 2.04 0.0808 - 0.44809 6.07160

(a) .6682 (C)X1pag-valor¼ :0072;X2pag-valor¼ :0808 (d)IC del 95% para


pendiente paraX1:d1:48344 6:55016Þ
A-142 RESPUESTAS A LOS EJERCICIOS IMPAR

10.4.5.

Análisis de variación
Fuente DF La suma de Significar
Cuadrícula Cuadrado valor F PR > F
Modelo 2 17018 8508.89242 4.89 0.0175
Error 22 38282 1740.10069
Total corregido 24 55300
MSE raíz 41.71451 R Plaza 0.3077
Media dependiente 537.00000 Cuadrado R adj. 0.2448
Coef Var 7.76807
Estimaciones de parámetros

Parámetro Estándar
Variable DF Estimar Error Valor t Pr > |t| 95% de confianza Límites
Interceptar 1 - 421.99671 339.76199 - 1.24 0.2273 - 1126.61995 282.62653
X1 1 11.16613 3.65523 3.05 0.0058 3.58564 18.74663
X2 1 - 0.63032 0.93826 - 0,67 0.5087 - 2.57615 1.31552

(a) .3077 (C)X1pag-valor¼ :0058;X2pag-valor¼ :5807 (d)IC del 95% para


pendiente paraX1:d3:58564 18:74663Þ
10.5.1.CI: 50.289, 51.747. IP: 46.751, 55.284
10.5.3.IC: 44,22, 56,59; IP: 35,64, 65,17
10.5.5.IC: 514,31, 550,75; IP: 444.12, 620.94
10.6.1. (a)Correlaciones por pares:

ADN-Bloo Co-culto Rectificación de ADN

Co-culto 0.360
Rectificación de ADN 0.532 0.303
ARN-Rect 0.202 0.674 0.430

(b)R¼ :370;F¼7:06;pag¼ :001


(C)ry1:23¼ :3472;ry2:13¼ :5232;ry3:12¼ :2538
(d)r12:y3¼ :1660
(mi)r13:y2¼ :6615
(F)r23:y1¼ :3969
10.6.3. (a)R¼ :9517;F¼57:638;pag < :005
(antes de Cristo)

ry1:2¼ :9268;t¼8:549;pag < :01;ry2:1¼ :3785;t¼1:417; :20 >pag > :10; r


12:y¼ :1789;t¼ :630;pag > :20

Ejercicios de repaso

7.R¼ :3496F¼ :83dpag > :10Þ


9. (a) ŷ¼11:419þ1:2598X1þ3:1067X2 (b)R2¼ :92
RESPUESTAS A LOS EJERCICIOS IMPAR A-143

(C)
Fuente SS d.f. EM realidad virtual pag
Regresión 1827.004659 2 913.50 69.048 <.005
Residual 158.728641 12 13.23

1985.7333 14

(d) ŷ¼11:419þ1:2598d10Þ þ3:1067d5¼39:55

11. (a) ŷ¼126:505þ :176X1 1:563X2þ1:575X3þ1:6292X4


(b)
Fuente SS d.f. EM realidad virtual pag
Regresión 30873.47 4 7718.367 13.37 <.005
Residual 5774.93 10 577.493

36648.40 14

(C)t1¼4:40;t2¼ :78;t3¼3:53;t4¼2:59
(d)R2 y:1234¼ :842423;Ry:1234¼ :91784
13. (a)correlación
(b)registro de los niveles de adiponectina en plasma

(C)edad y tasa de filtración glomerular


(d)ambas correlaciones no fueron significativas
(mi)sujetos con enfermedad renal en etapa terminal

15. (a)correlación
(b)presión inspiratoria estática en la boca
(C)volumen espiratorio forzado, flujo espiratorio máximo y flujo inspiratorio máximo
(d)ambas correlaciones no fueron significativas
(mi)niños y niñas de 7 a 14 años
17

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13

X1 1
X2 . 737( ) 1
X3 . 109 . 244 1
X4 . 760( ) . 698( ) . 316 1
X5 . 556( ) . 608( ) . 273 . 760( ) 1
X6 . 040 . 213 . 136 . 101 . 647( ) 1
X7 . 291 . 289 . 093 . 293 . 412( ) . 231 1
X8 . 570( ) . 659( ) . 227 . 568( ) . 763( ) . 481( ) . 555( ) 1
X9 . 555( ) . 566( ) . 146 . 454( ) . 717( ) . 503( ) . 650( ) . 922( ) 1
X10 . 345 . 508( ) . 419( ) . 455( ) . 640( ) . 377 . 480( ) . 905( ) . 788( ) 1
X11 . 467( ) . 400( ) . 224 . 621( ) . 702( ) . 388( ) . 732( ) . 652( ) . 646( ) . 582( ) 1
X12 . 250 . 260 . 178 . 228 . 448( ) . 390( ) . 778( ) . 641( ) . 717( ) . 667( ) . 796( ) 1
X13 . 271 . 305 . 380 . 346 . 518( ) . 348 . 524( ) . 645( ) . 707( ) . 729( ) . 744( ) . 864( ) 1

la correlación es significativa al nivel 0,01 (bilateral). la


correlación es significativa al nivel de 0,05 (bilateral).
A-144RESPUESTAS A LOS EJERCICIOS IMPAR

19
v1 v2 v3 v4 v5 v6 v7 v8

v1 1
v2 . 123 1
v3 . 115 . 963( ) 1
v4 . 417( ) . 063 . 041 1
v5 . 005 . 102 . 103 . 059 1
v6 . 001 . 270( ) . 295( ) . 036 . 137 1
v7 . 113 . 074 . 076 . 052 . 134 . 061 1
v8 . 077 . 002 . 023 . 146 . 165 . 202 . 032 1

La correlación es significativa al nivel 0,01 (dos colas).

Capítulo 11
11.2.1.movilizador: 0 G-CSF, 1-etopósido

La ecuación de regresión es
conc = 12,9 - 0,0757 edad - 5,48 movilizador

Vaticinador coef SE Coef T PAG


Constante 12.933 2.787 4.64 0.000
edad - 0.07566 0.04388 - 1.72 0.092
movilizar - 5.480 1.429 - 3.83 0.000

S = 3.965 R-Sq = 27,1% R-Cuadrado(ajustado) = 23,6 %

Análisis de variación

Fuente DF SS EM F PAG
Regresión 2 240.02 120.01 7,63 0,002
error residual 41 644.60 15.72
Total 43 884.62

11.2.3.

La ecuación de regresión es QTc = 23,0


+ 39,4 sexo + 0,825 dosis

Vaticinador coef SE Coef T PAG


Constante 22.98 46.92 0.49 0.632
sexo 39.40 42.14 0,93 0.366
dosis 0.82456 0.07556 10.91 0.000
S = 84,10 R-Sq = 89,6% R-Cuadrado(ajustado) = 88,1 %
RESPUESTAS A LOS EJERCICIOS IMPAR A-145

Análisis de variación
Fuente DF SS EM F PAG
Regresión 2 850164 425082 60.10 0.000
error residual 14 99018 7073
Total dieciséis 949182

11.3.1.

Paso 1 2 3
Constante 51.93 116.07 115.54
MEM 0,66 0,60 0.57
Valor T 5.75 5.87 5.53
Valor P 0.000 0.000 0.000
SOCIALSU - 0.476 - 0.492
Valor T - 5.28 - 5.51
Valor P 0.000 0.000
CGDUR 0.122
Valor T 1.88
Valor P 0.064
S 17.4 15.4 15.2
cuadrados R 25.20 41.92 43.97
R-Cuadrado(adj) 24.44 40.72 42.22

11.3.3.

Alfa para ingresar: 0,15 Alfa para eliminar: 0,15 La


respuesta es REACTIVA en 6 predictores, con N = 68
Paso 1 2 3
Constante 3.374 5.476 5.418
ABUSO DE EDAD - 0,38 - 0,45 - 0,42
Valor T - 2.49 - 3.00 - 2.91
Valor P 0.015 0.004 0.005
VERBALIQ - 0.0219 - 0.0228
Valor T - 2,75 - 2,93
Valor P 0.008 0.005
STIM 0,61
Valor T 2.05
Valor P 0.044
A-146RESPUESTAS A LOS EJERCICIOS IMPAR

S 1.06 1.01 0.990


cuadrados R 8.57 18.10 23.15
R-Cuadrado(adj) 7.19 15.58 19.55
CP 10.4 4.6 2.5

11.4.1.
Estándar Wald
Parámetro DF Estimar Error chi-cuadrado Pr > ChiSq
Interceptar 1 2.1192 0.1740 148.3439 <.0001
sexo 1 0.0764 0.2159 0.1252 0.7234
Estimaciones de la razón de probabilidades

Efecto Punto Estimar 95% de madera Confianza Límites


sexo 1.079 0.707 1.648

Ejercicios de repaso

15. ŷ¼1:87þ6:3772X1þ1:9251X2

Coeficiente Error estándar t


1.867 . 3182 5.87
6.3772 . 3972 16.06
1.9251 . 3387 5.68

R2¼ :942

Fuente SS d.f. EM realidad virtual

Regresión 284.6529 2 142.3265 202.36954


Residual 17.5813 25 . 7033
302.2342 27

17. ŷ¼1:1361þ :07648X1þ :7433X2 :8239X3 :02772X1X2þ :03204X1X3

Coeficiente Desviación Estándar t paga


1:1361 . 4904 2:32 :05 >pag > :02
. 07648 . 01523 5.02 < :01
. 7433 . 6388 1.16 > :20
:8239 . 6298 1:31 :20 >pag > :10
:02772 . 02039 1:36 :20 >pag > :10
. 03204 . 01974 1.62 :20 >pag > :10

aAproximado. Obtenido usando 35 df


R2¼ :834.
RESPUESTAS A LOS EJERCICIOS IMPAR A-147

Fuente SS d.f. EM realidad virtual

Regresión 3.03754 5 . 60751 34.04325


Residual . 60646 34
3.64400 39 . 01784

- -
1 siA 1 siB
X2¼ X3 ¼
0 si no 0 si no

ParaR: ŷ¼ ð 1:1361þ :7433Þ þ ð:07648 :02772ÞX1¼ :3928þ :04875X1


ParaPor¼ ð 1:1361þ :8239Þ þ ð:07648þ :03204ÞX1¼ 1:96þ :10852X1
ParaC: ŷ¼1:1361þ :07648X1
23
Respuesta¼V, maniquí1¼1 si es bebé, 0 en caso contrario, Dummy2¼1 si es niño, 0 en caso
contrario

La ecuación de regresión es
V = 11,7 + 0,137 W - 11,4 DUMMY1 -11,7 DUMMY2 + 0,226 INTER1 + 0,223
INTER2

Vaticinador coef SE Coef T PAG


Constante 11.750 3.822 3.07 0.004
W 0.13738 0.05107 2.69 0.010
maniquí1 11.421 4.336 2.63 0.012
maniquí2 11.731 3.966 2.96 0.005
INTER1 0.2264 0.2208 1.03 0.311
INTER2 0.22332 0.06714 3.33 0.002

S = 1.73234 R=cuadrado = 94,9 % R=cuadrado(ajustado) = 94,3 %

Análisis de variación

Fuente DF SS EM F PAG
Regresión 5 2304.47 460.89 153.58 0.000
error residual 41 123.04 3.00
Total 46 2427.51

Fuente DF SS de secuencia

W 1 2265.07
maniquí1 1 5.59
maniquí2 1 0.00
INTER1 1 0,60
INTER2 1 33.20
A-148RESPUESTAS A LOS EJERCICIOS IMPAR

Observaciones inusuales

Obs. W V Adaptar Ajuste SE Residual San Resid


17 10.8 8.366 4.257 0.496 4.109 2.48R
36 47.0 15.400 16.971 1.145 1.571 1.21X
41 96,0 20.000 24.938 1.265 4.938 4.17RX
46 87.0 30.900 23.702 0.881 7.198 4.83R

R denota una observación con un residuo estandarizado grande. X denota


una observación cuyo valor X le da una gran influencia.

Capítulo 12
12.3.1.X2¼2:072;pag > :05
12.3.3.X2¼3:417;pag > :10
12.3.5.X2¼2:21;pag > :10
12.4.1.X2¼ :078;pag > :10
12.4.3.X2¼816:410;pag < :005
12.4.5.X2¼42:579;pag < :005
12.5.1.X2¼3:622;d:f:¼3;pag > :10
12.5.3.X2¼ :297;d:f:¼1;pag > :10
12.5.5.X2¼82:373;d:f:¼2;pag < :005
12.6.1.Desdeb¼7 > 3dparaA¼10;B¼10;a¼8Þ;pag >2d:035Þ ¼ :070. No rechaces H0.

12.6.3.Desdeb¼1dparaA¼9;B¼7;a¼dieciséisÞ;pag¼2d:002Þ ¼ :004. RechazarH0.


12.7.1.RCR¼13:51, IC 95% 9,7, 18,8
12.7.3.X2¼12:898;pag < :005;O CR¼1:967
12.7.5.OCRmh¼3:733;X2 mh¼25:095;pag < :005

Ejercicios de repaso

15.X2¼7:124;d:f:¼3;pag > :05, falla al rechazar.


17X2¼2:40516;pag > :10
19X2¼5:1675;pag > :10
21X2¼67:8015;pag < :005
23X2¼7:2577:05 >pag > :025
25Independencia
27Homogeneidad
35.Satisfacción General
X2¼3:143
d: f:¼2;pag¼0:208
2 celdas con recuentos esperados inferiores a 5,0
RESPUESTAS A LOS EJERCICIOS IMPAR A-149

Dolor

X2¼0:444
d: f:¼2;pag¼0:801
2 celdas con recuentos esperados inferiores a
5,0 Náuseas y vómitos
X2¼0:483
d: f:¼2;pag¼0:785

37.OCR¼2:06; IC 95%: .92, 4.61


41.X2¼13:530 d:f:¼1;
pag¼0:000
43.Estadística de prueba¼2;pag¼ :019 (prueba unilateral)
45.X2¼8:749
d: f:¼1;pag¼0:003
47.X2¼4:875
d: f:¼1;pag¼0:027
49.OCR¼3:79; IC 95%: 1,52, 9,48O
51.X2¼11:589 d:f:¼1;
pag¼0:001

Capítulo 13
13.3.1.PAG¼ :3036,pag¼ :6072
13.3.3.PAGdX 2j13; :5Þ ¼ :0112. Desde :0112 < :05, rechazarH0:pag¼ :0112
13.4.1.Tþ¼48:5. :1613 <pag < :174
13.4.3.T¼11:5, :1054 <pag < :1308
13.5.1.X2¼16:13,pag < :005.
13.6.1.T¼712:5,pag¼ :2380, Error al rechazarH0.
13.6.3.S¼1772: 5,pag¼ :7566, Error al rechazarH0.
13.7.1.D¼ :3241,pag < :01
13.7.3.D¼ :1319,pag > :20
13.8.1.H¼11:38,pag¼ :003¼3.
13.8.3.H¼18:13,pag < :0001,d:f:¼2.
13.8.5.H¼19:61 (ajustado por empates),pag < :005
13.9.1.X2r¼8:67,pag¼ :01
13.9.3.X2r¼29:38,pag < :005
13.10.1.rs¼0:07,pag > :20
13.10.3.rs¼ :018,norte¼20,pag > :05
13.10.5.rs¼ :43,norte¼30, :01 <pag < :02
13.11.1. b1¼1:429
-
b0 ¼ 176:685
- 1;M

b0 2;M ¼ 176:63
A-150RESPUESTAS A LOS EJERCICIOS IMPAR

Ejercicios de repaso

7.T¼0,norte¼7,pag¼ :0078
9.X2r¼16:2,pag < :005
11D¼ :1587,pag > :20
13rs¼ :09,pag¼ :4532
15.T¼29:5,pag¼0:0263, RechazarH0
17H¼9:02, d: f:¼3,pag¼0:029
H¼9:30, d: f:¼3,pag¼0:026 (ajustado por empates)
19rs¼ :036,pag¼ :802
21T¼62:5,pag¼ :0072, RechazarH0
23USO:X2 r¼3:94,pag¼ :140
OSB:X2r¼4:77,pag¼ :093
25T¼89,pag¼ :0046, RechazarH0
27PFK: T¼38,pag¼ :8598, Error al rechazarH0
Hong Kong: T¼61:5,pag¼ :0703, Error al rechazarH0
LDH: T¼37,pag¼ :7911, Error al rechazarH0
29rs¼ :733,pag¼ :001

capitulo 14
14.3.1
Número de casos: 53 Censurado :34 (64.1 5%) Eventos: 19

Tiempo de supervivencia Error estándar Intervalo de confianza del 95 %


Significar:12.57 1.10 ( 10.40, 14.73 )
(Limitado a 19.00 )
Mediana: 16.00 1.80 ( 12.47, 19.53 )

percentiles
25.00 50.00 75.00
Valor 18.00 16.00 4.00
Error estándar 1,80 3,76

14.4.3Grupo de apoyo:
Número de casos: 22 Censurado: 0 ( .00%) Eventos: 22
Tiempo de supervivencia Error estándar Intervalo de confianza del 95 %
Significar: 45.09 3.98 ( 37.29, 52.89 )
Mediana: 60.00 . 00 (.,.)

percentiles
25.00 50.00 75.00
Valor 60.00 60.00 26.00
Error estándar . . 6.96
RESPUESTAS A LOS EJERCICIOS IMPAR A-151

Grupo sin apoyo:


Número de casos: 28 Censurado: 0 ( .00%) Eventos: 28
Tiempo de supervivencia Error estándar Intervalo de confianza del 95 %
Significar: 16.04 1.86 ( 12.39, 19.68 )
Mediana: 15.00 5.29 ( 4.63, 25.37 )

percentiles
25.00 50.00 75.00
Valor 22.00 15.00 7.00
Error estándar 3,44 5,29 . 92

Estadística de rango logarítmico y (significación): 29,22 ( ,0000)


Estadística de Breslow y (significación): 23,42 ( ,0000) Estadística de
Tarone-Ware y (significación): 26,28 ( ,0000)

Test de Breslow = 21,843, p < 0,001

14.5.1La variable "peso" fue significativa en este modelo cuando se usó para predecir el tiempo de aparición del
cáncer después de la exposición a la luz ultravioleta. 100dmi:19 1¼20:9%; por lo tanto, por cada
unidad de aumento de peso, el riesgo de tiempo hasta la aparición del cáncer aumenta en un 20,9
%.
14.5.3 (a) Edad:b¼end1:69Þ ¼ :525; Tamaño del tumor:b¼end1:32Þ ¼ :278;
Quimioterapia: b¼end:88Þ ¼ :128; Radiación:b¼end:54Þ ¼ :616.
(b) El riesgo de metástasis aumenta a 1,69 veces para los 50þ,1,32 veces si el tamaño del
tumor es > 2 cm, 0,88 veces para quienes reciben quimioterapia y 0,54 veces para quienes
reciben radiación. Por lo tanto, la edad avanzada y el tamaño tumoral más grande predicen
un aumento de las metástasis, mientras que la quimioterapia y la radiación protegen contra
las metástasis.

Ejercicios de repaso

7.hdtÞ ¼ :25=:15¼1:67
DsdtÞ
9.03¼ ¼ :24
d10 2Þ
11Análisis de supervivencia para DÍAS

Factor GRADO = 1
Tiempo Estado Acumulativo Estándar Acumulativo Número
Supervivencia Error Eventos Restante
450 1 . 8889 . 1048 1 8
556 1 . 7778 . 1386 2 7
2102 1 . 6667 . 1571 3 6
2756 0 3 5
3496 0 3 4
3990 1 . 5000 . 1863 4 3
5686 0 4 2
6290 0 4 1
8490 0 4 0
A-152RESPUESTAS A LOS EJERCICIOS IMPAR

Número de casos: 9 Censurados: 5 (55,56%) Eventos: 4

Tiempo de supervivencia Error estándar Intervalo de confianza del 95 %


Significar: 5255 1197 ( 2910, 7601 )
(Limitado a 8490)
Mediana: 3990 . ( .,.)
Análisis de supervivencia para DÍAS

Factor GRADO = 2
Tiempo Estado Acumulativo Estándar Acumulativo Número
Supervivencia Error Eventos Restante
106 1 . 8333 . 1521 1 5
169 1 . 6667 . 1925 2 4
306 1 . 5000 . 2041 3 3
348 1 . 3333 . 1925 4 2
549 1 . 1667 . 1521 5 1
973 1 . 0000 . 0000 6 0

Número de casos: 6 Censurado: ( .00%) Eventos: 6

Tiempo de supervivencia Error estándar Intervalo de confianza del 95 %


Significar: 409 129 ( 155, 662 )
Mediana: 306 110 (91, 521)

Análisis de supervivencia para DÍAS

Total Número Número Por ciento


Eventos censurado censurado
CALIFICACIÓN 0 40 0 40 100.00
CALIFICACIÓN 1 9 4 5 55.56
CALIFICACIÓN 2 6 6 0 . 00
En general 55 10 45 81.82

Test de Breslow 73.630, p < 0.001

13. (a)Edad:b¼end1:02Þ ¼ :020; Terapia hormonal:b¼end:89Þ ¼ :117; Pre-PSA: b¼


end2:41Þ ¼ :880; Clasificación tumoral:b¼end1:42Þ ¼ :351.
(b)La edad y la terapia hormonal no fueron significativas en términos de control a largo plazo del
cáncer de próstata. Tener un PSA previo al tratamiento de > 10 ng=mL y una clasificación tumoral
alta fueron factores de riesgo significativos (el PSA previo aumentó el riesgo 2,41 veces y la
clasificación tumoral alta aumentó el riesgo).y1,42 veces).
(C)100dmi:02 1¼2%; por lo tanto, un aumento de 1 unidad de edad aumenta el riesgo de cáncer a
largo plazo en un 2 %.

Capítulo 15: SOLO EN LÍNEA


15.2.1 (a)5.8 (b)Blanco: 10.0, Negro: 3.7, (C)9.43 (d)5.5
(mi)9.43 (F)MN 22 .2, MCD 34.5
RESPUESTAS A LOS EJERCICIOS IMPAR A-153

15.2.3

Edad Poblacióna Fallecidosb A NOSOTROS Edad- Estándar Número de


(Años) PoblaciónC Específico Población Esperado
Muerte Residencia en Muertes en
Tarifas A NOSOTROS Estándar
(por Población Población
100,000) 2000
0–4 539,509 1,178 19,175,798 218.3 68139 149
5–14 1,113,920 224 41,077,577 20.1 145964 29
15–24 1,117,439 954 39.183.891 85.4 139235 119
25–34 1,213,415 1,384 39.891.724 114.1 141751 162
35–44 1,287,120 2,823 45,148,527 219.3 160430 352
45–54 1,085,150 5,271 37.677.952 485.7 133884 650
55–64 723,712 8,035 24.274.684 1110.2 86257 958
65 y
Encima 969.048 51.863 34.991.753 5352,0 124339 6655
Total 8.049.313 71.732 281.421.906 891,2 1000000 9073
Tasa de mortalidad ajustada por edad¼9:1

15.3.1 (a) (10–14): 1,3, (15–19): 59,9, (20–24): 126,7, (25–29): 112,6, (30–34): 83,6,
(35–39): 36,5, (40–más): 2,6; (b)2142.1 (C) (10–14): 6.3, (15–19):
305,9, (20–24): 939,2, (25–29): 1502,3, (30–34): 1920,2, (35–39): 2102,9, (40– más):
2142,1 (d)46.7
15.3.3 (a) (10–14): 1.2, (15–19): 58.5, (20–24): 120.2, (24–29): 113.7, (30–34): 84.2,
(35–39): 33,8, (40–44): 6,0, (45 y más): 0,5; (b)2089.6 (C) (10–14):
6.1, (15–19): 298,5, (20–24): 899,6, (25–29): 1468,1, (30–34): 1889,3, (35–39):
2058,2, (40–44): 2088,1, (45 y más): 2089.6 (d)45.6
15.4.1 (a)tasa de inmadurez: 1997—7.3, 2001—8.1 (b)razón de prevalencia: Nevada—
22,2, Estados Unidos—20,5 (C)tasa de incidencia: 14,5 por 100.000

Ejercicios de repaso

9.8.9
11Mortalidad infantil: Total—5,7; blanco—5,3; no blancos: 6,5; Causa de muerte: enfermedad
cardíaca total: 36,8; blanco 37,7; no blancos 32,3 Cáncer total: 23,7; blanco—23,8; no blancos:
23,1 SIDA total: 1,5; blanco .8; no blancos 4,9 Relación de inmadurez: total: 7,0; blanco—6,7;
no blanca: 7,5 Tasa de incidencia de cesárea: total: 22,6; blanco 25,0; no blanco: 18.3

1315,9, 51,6
ÍNDICE

Los números precedidos por A se refieren a las páginas del Apéndice.

A Distribución de chi-cuadrado, 195–197, 600–657


Precisión, 14 propiedades matemáticas, tabla
Regla de la suma, 72–73 601–604, A-41
Análisis de varianza, 306–308 uso en pruebas de bondad de ajuste, 604–619
suposiciones, 307 pequeñas frecuencias esperadas, 604 uso
diseño completamente aleatorizado, 308–334 en pruebas de homogeneidad, 630–634
unidireccional, 309–334 pequeñas frecuencias esperadas, 633 uso
procedimiento, 307–308 en pruebas de independencia, 619–630
diseño de bloques completos al azar, 334–346 frecuencias esperadas pequeñas,
diseño de medidas repetidas, 346–356 625 2 - 2 tabla, 625–627
bidireccional, 336–346 intervalo de clase, 22
Media aritmética, 38 Coeficiente de determinación, 427–428
Tasa de riesgo promedio, 760 Coeficiente de determinación múltiple,
501–503
B Coeficiente de variación, 45–46
Eliminación hacia atrás, 564 Combinación, 101
Teorema de Bayes, 68, 80–83 Diseño completamente aleatorizado, 308–334
Proceso de Bernoulli, 99–101 b1, tabla ANOVA, 317
intervalo de confianza, 438 suposiciones, 311
prueba de hipótesis, 432–434 Simetría compuesta, 348
Distribución binomial, 99–108 Ordenadores:
parámetros, 105–107 y análisis de varianza, 308, 321–323, 326–327,
mesa, A-3–A-31 341–343, 350–351, 355
Uso de la tabla, 104–105 y análisis bioestadístico, 15–16 y
Bioestadística, 3 chi-cuadrado, 615, 623
Tasa de natalidad, cruda, 15-10 y estadística descriptiva, 21, 22–30, 47 y
Distribución normal bivariada, 445 prueba de hipótesis, 232–233, 243–244,
Método de Bonferroni, 324, 327 258–259
Diagrama de caja y patillas, 50–52 y estimación de intervalos, 169–
170 y regresión logística, 573
C y análisis de correlación múltiple, 512–519 y
Razón de letalidad, 15-14 Razón análisis de regresión múltiple, 494–496 y
de causa de muerte, 15-8 Datos números aleatorios, 16
censurados, 752 y regresión lineal simple y correlación
Teorema del límite central, 139–140 análisis, 450–451
Tendencia central, medidas, 38–43 y regresión por pasos, 560–563

I-1
I-2 ÍNDICE

Coeficiente de confianza, 169 Tasas y proporciones de mortalidad, 15-3 a 15-10


Intervalo de confianza: Proporción de mortalidad, fetal, 15-7
parab1, 438 Regla de decisión, 218
regresión múltiple, 506 Grados de libertad, 45
para la diferencia entre dos medias poblacionales, Función de densidad, 115
177–185 Estadísticas descriptivas, 2, 19–64
poblaciones no normales, 179–180 para Dispersión, medidas, 43–49
la diferencia entre dos poblaciones Procedimientos sin distribución,
proporciones, 187–188 671 Variable ficticia, 544–559
por medio deY,dadoX,441–442 para
metroyj1- - -k, 508–509 mi
para la media de la población, 165–178 Epidemiología, 779
poblaciones no normales, 168–171 Estimación, 161–210
para proporción de población, 185–186 en análisis de regresión lineal simple, 434,
interpretación práctica, 167 441
para predichoY,441–442, 508–509 Estimador, 165
interpretación probabilística, 167 para robusto, 170
la razón de dos varianzas, 198–201 para Eventos:
r,454 complementario, 74
para la varianza, 194–198 independiente, 73–74
matriz de confusión, 219 mutuamente excluyentes, 68
Tabla de contingencia, 619 SOBRESALIR:

Corrección por continuidad, 152 y distribución binomial, 106


Coeficiente de correlación: Exclusivo o, 73
múltiple, 510–513 Experimentos, 10
sencillo, 446–450 diseño, 14–15
Modelo de correlación: Análisis exploratorio de datos, 52
múltiple, 510–519 Extrapolación, 442, 459–460
sencillo, 445–446
Modelo de regresión de Cox, 768–772 F
función de riesgo, 768–769 factoriales, 101
Región crítica, 224 Experimento factorial, 358–369
Valor crítico, 224 tabla ANOVA, 364
Frecuencias acumuladas, 25 suposiciones, 362
Frecuencias relativas acumuladas, 25 Falso negativo, 79
Falso positivo, 79
D Tasas de error por familia, 506
datos, 2 Fdistribución, 199
agrupados, 22–37 tabla de, A-42–A-51
crudo, 20 Fecundidad, 15-10
fuentes, 3 Fertilidad, 15-10
Índice de mortalidad: medidas, 15-10 a 15-12 Tasa de
crudo, 15-3 fertilidad:
fetal, 15-7 específico de edad, 15-11
específico, 15-3 acumulativo, 15-12
estandarizado, 15-3 generales, 15-10
ÍNDICE I-3

estandarizado, 15-12 dos varianzas de población, 267–272 de


total, 15-12 dos colas, 226
Corrección de población finita, 141
Prueba exacta de Fisher, 636–640 I
mesa para, A-55–A-85 Tasa de inmadurez, 15-14

Z de Fisher, 453–454 Tasa de incidencia, 15-13

mesa, A-54 inclusive o, 73


Modelo de efectos fijos, 311 Estadísticas inferenciales, 2,
Prueba F-max, 198 162 Interacción, 359–360, 550
Selección hacia adelante, 563 Interpolación, 442
Distribución de frecuencias, 22–37 Rango intercuartílico, 48

Polígono de frecuencias, 27 Estimación de intervalo, 165

Prueba de Friedman, 712–716 Escala de intervalos, 6

mesa para, A-102–A-103


j
Fprueba, 316–317
Distribución conjunta, 445

GRAMO
k
Pruebas de bondad de ajuste, 604–616 Procedimiento de Kaplan-Meier, 756–761
Datos agrupados, 22–37 Prueba de Kolmogorov-Smirnov, 698–703
ventajas y desventajas, 703 y análisis
H por computadora StatXact, 702 tabla
Histograma, 25–28 para, A-99
Hipótesis, 215 Prueba de Kruskal-Wallis, 704–709
alternativa, 216 mesa para, A-l00–A-101
formular, 14 Curtosis, 48–49
nulo, 216
investigación, 215 L
estadística, 216 Mínimos cuadrados, método, 420 Línea
Pruebas de hipótesis, 215–303 de mínimos cuadrados, 420–422 Prueba
mediante intervalo de confianza, 225–226 de Levene, 201, 270 Parámetros de
diferencia entre medias, 236–249 ubicación, 47 Prueba de rango
poblaciones no normales, 242–243 varianzas logarítmico, 763–765 Regresión logística,
de población conocidas, 236–238 varianzas de 569–581 Pérdida durante el seguimiento,
población desconocidas, 238–243 parabi, 751
regresión múltiple, 504–506 parab1, regresión
lineal simple, 427–432 unilateral, 226–228 METRO

Prueba de Mann-Whitney, 690–696


propósito, 215, 220 mesa para, A-95–A-98
media de población única, 222–236 Estadística de Mantel-Haenszel, 650–653
población no normal, 230–232 varianza de Margen de error, 168
población conocida, 222–228 varianza de Media, 38–40
población desconocida, 228–230 proporción propiedades, 40
de población única, 257–259 varianza de medida, 6
población única, 264–266 escalones, 216 Escalas de medida, 5–6
Mediana, 40
dos proporciones de población, 261–264 propiedades, 41
I-4 ÍNDICE

Prueba mediana, 686–689 norte

MINITAB: Escala nominal, 6


y distribución binomial, 107 y Estadísticas no paramétricas, 671–747
diagramas de caja y bigotes, 51–52 y Región de no rechazo, 218
chi-cuadrado, 615–616, 623, 632 Distribución normal, 118–127
e intervalos de confianza para una media, 169– aplicaciones, 122–127
170 y medidas descriptivas, 47 características, 118–119
y variables ficticias, 546–547, 550, 555 y estándar, 118–122
experimento factorial, 367–368 y mesa, A-38–A-39
distribuciones de frecuencia, 27
y prueba de Friedman, O
716 e histogramas, 26–27 Observación, 14
y prueba de hipótesis, 253, 258–259 y Estudio observacional, 642–643 Razón de
prueba de Kruskal-Wallis, 709 probabilidades, 645–648
y prueba de Mann-Whitney, 694–696 y Ojiva, 96
prueba de la mediana, 689 Curva característica operativa, 277
y correlación múltiple, 512, 515, 517 y Matriz ordenada, 20–21
regresión múltiple, 495, 508 y Escala ordinal, 6
distribución normal, 126–127 y ANOVA valores atípicos, 52

de una vía, 321–322 y matriz ordenada,


20–21 PAG
y distribución de Poisson, 111–112 y Comparaciones pareadas, 249–254
medidas repetidas ANOVA, 349–350 y Parámetro, 38
prueba de signos, 680 Correlación parcial, 513–519
y regresión lineal simple, 421, 444 y Coeficientes de regresión parcial,
correlación de rango de Spearman, 724 492 Percentil, 47
y presentaciones de tallo y hojas, 29–30 Estimación puntual, 163
y regresión por pasos, 560–563 y ANOVA Distribución de veneno, 108–113
de dos vías, 341–342 y prueba de tabla de, A-32–A-37
Wilcoxon, 685 proceso de envenenamiento, 109

modo, 41 Población, 5
Morbilidad, 15-13 finito, 5
medidas, 15-13 a 15-14 Tasa de infinito, 5
mortalidad: muestreado, 164
bebé, 15-7 objetivo, 164
maternal, 15-6 Poder, 272–279
neonatal, 15-7 Precisión, 14, 168
perinatal, 15-7 Valor predictivo negativo, 80
Multicolinealidad, 542 Valor predictivo positivo, 80
Comparación múltiple, 322–326 Estudio prospectivo, 642
Coeficiente de correlación múltiple, Intervalo de predicción
510–513 regresión múltiple, 508–509
Modelo de correlación múltiple, 510–513 regresión lineal simple, 441–442
Regla de multiplicación, 71–72 Tasa de prevalencia, 15-14
Distribución multivariada, 510 Probabilidad, 65–85
Distribución normal multivariada, 510 posteriores, 68
ÍNDICE I-5

anterior, 68 no paramétrico, 727–730


clásico, 66–67 línea resistente, 442–444
condicional, 70 lineal simple, 413–446
articulación, 71 suposiciones, 415–416
marginal, 70, 75 ecuación, 417–423
objetivo, 66–67 modelo, 414–416
personalista, 67 paso a paso, 560–564
propiedades, 68–69 Región de rechazo, 218
frecuencia relativa, 67 Frecuencias relativas, 24–25
subjetivo, 67–68 Riesgo relativo, 643–645
Distribuciones de probabilidad, 92–132 Confiabilidad, 14
de variables continuas, 113–128 de Coeficiente de fiabilidad, 167 Diseño de
variables discretas, 93–113 medidas repetidas, 346–356
acumulativo, 96–98 suposiciones, 347–348
propiedades, 95 definición, 347
método de límite de producto,buscarProcedimiento aplan-Meier Estudio de investigación, 10

Modelo de riesgos proporcionales,ver cregresión de buey residual, 429


modelo Línea resistente, 442–444
Razón de mortalidad proporcional, 15-8 pag Estudio retrospectivo, 643
valores, 225 Factor de riesgo, 642

q S
Variables cualitativas, 4, 543–556 muestra, 5
Cuartil, 47–48 conveniencia, 165
no aleatorio, 164–165
R al azar, 164–165
R aleatorio simple, 7–10
y diagramas de caja y bigotes, 51 tamaño para controlar los errores de tipo II,
e intervalo de confianza entre dos medias, 277–279
183 tamaño para estimar medias, 189–191 tamaño
Dígitos aleatorios, tabla, A-2 para estimar proporciones, 191–193 estratificado
uso, 9–10 proporcional al tamaño, 13 estratificado
Diseño de bloques completos al azar, 334–346 aleatorio, 12
tabla ANOVA, 338 estratificado sistemático, 12
suposiciones, 337 sistemático, 11
Rango, 43–44 Distribución muestral, 135–160
Transformación de rango, 672 características, 136
Tasa, 15-2 construcción de, 135
Proporción, 15-2 definición, 135
Escala de razón, 6 de diferencia entre medias muestrales, 145–150
Regresión: poblaciones no normales, 148
logística, 569–581 de diferencia entre las proporciones de la muestra,
múltiple, 489–510 154–156
suposiciones, 491 de la media muestral, 136–145
ecuación, 491–492 poblaciones no normales, 139–141 de
modelo, 490–492 proporción muestral, 150–153
I-6 ÍNDICE

S.A.S.: Estadística, 38
y análisis chi-cuadrado, 623–625 y Inferencia estadística, 7, 162
medidas descriptivas, 47 y Estadística, 2
experimento factorial, 367, 368 y Visualización de tallo y hojas, 28–30
prueba de hipótesis, 233, 244–245 y Regresión paso a paso, 560–569
regresión logística, 572–576 y Rango estudentizado, 324
regresión múltiple, 493, 496 y ANOVA tabla de, A-52–A-54
unidireccional, 322 Distribución de estudiantes, 172–177
y medidas repetidas ANOVA, 350–351 y mesa de, A-40
regresión lineal simple y correlación, regla de Sturges, 22
442–443, 450–451 Análisis de supervivencia, 750–776
y prueba HSD de Tukey, 326 y ANOVA tiempos de supervivencia censurados, 752

bidireccional, 341–342 Diagrama de tipos, 752–753


dispersión, 419–420 Métodos científicos, Regresión de Cox, función de riesgo, 768–772
13–15 Tasa de ataque secundario, 15-14 función de distribución acumulativa, 754
Sensibilidad, 80 Procedimiento de Kaplan–Meier, 756–761
técnica no paramétrica, 756 probabilidad
Nivel de significación, 218–219 de sobrevivir, 756–757 función de
Prueba de signos, 673–680 distribución de probabilidad, 755 funciones
Muestreo aleatorio simple, 7–10 de distribución estadística, 753 curvas de
sin reemplazo, 7–8 con supervivencia, comparación, 763–766 datos
reemplazo, 7–8 de tiempo hasta el evento, 751–756
Sesgo, 41–42
Pendiente, 415 T
Coeficiente de correlación de rango de Spearman, 718–724 tdistribución, 171–177
mesa para, A-104 y diferencia entre medias, 179–183
especificidad, 80 varianzas de población iguales, 179–180
esfericidad, 348 varianzas de población no iguales, 180–183
SPSS: propiedades, 172
y prueba exacta de Fisher, 640 y mesa de, A-40
distribución de frecuencias, 25–26 y Datos de tiempo hasta el evento,verAnálisis de supervivencia

curtosis, 49 Estadística de prueba, 217–218

y regresión logística, 577 y prueba de Media recortada, 170


Mann-Whitney, 695–696 y prueba de Prueba HSD de Tukey, 323–324
Mantel-Haenzcel, 652–653 y regresión Línea de Tukey, 443–444
múltiple, 493 Error tipo I, 219
y razón de probabilidades, 648 Error tipo II, 219, 272–279
y correlación parcial, 516, 518–519 y
medidas repetidas ANOVA, 350–351 y tu
asimetría, 43 Imparcialidad, 163.
y análisis de supervivencia, 665– Distribución uniforme, 614–616
666 y prueba HSD de Tukey, 327 Unidad de asociación, 459
Desviación estándar, 45
Error estándar de la media, 139 Distribución V
normal estándar, 118–122 variables, 3
tabla de, A-38–A-39 aleatorio continuo, 4
ÍNDICE I-7

dependiente, 415 Varianza, 44–45


aleatorio discreto, 4 estimación de intervalo, 194–197
maniquí, 544–556 Relación de varianza, 316
explicativo, 490 Prueba de razón de varianza, 198, 268–272
extraño, 307 Estadísticas vitales, 778–796
independiente, 415
predictor, 417, 490 W
cualitativo, 4, 543–556 Distribución de Weibull, 755–756
cuantitativo, 4 Prueba de Wilcoxon, 681–686
al azar, 4 mesa para, A-86–A-95
respuesta, 307, 417
tratamiento, 307 Y
Selección de variables corrección de Yates, 627
procedimientos, 560–564 y-interceptar, 415

También podría gustarte