Está en la página 1de 409

Bioestadística

Segunda edición
Carlos Amilcar Sánchez Colindres
Licenciado en Matemáticas
Máster en Gestión de la Calidad
Catedrático área de Matemática
Universidad Católica de Honduras
Gerente de portafolio de Universidades: Gabriela López
Desarrollador de Contenido Senior: Marcela I. Rocha Martínez
Desarrollador de Contenido: Cristina Tapia Montes de Oca

Bioestadística
Segunda edición

Todos los derechos reservados. Esta publicación no puede ser reproducida, ni parcial, ni totalmente, ni registrada en/o
transmitida por un sistema de recuperación de información, en ninguna forma ni formato, por ningún medio, sea mecánico,
fotocopiado, electrónico, magnético, electroóptico, o cualquier otro, sin el permiso previo y por escrito de la editorial.

DERECHOS RESERVADOS © 2019, respecto a la segunda edición en español por:


McGRAW-HILL/INTERAMERICANA EDITORES, S.A. DE C.V.
Prolongación Paseo de la Reforma Núm. 1015, Torre A
Piso 16, Colonia Desarrollo Santa Fe,
Delegación Álvaro Obregón
C.P. 01376, Ciudad de México
Miembro de la Cámara Nacional de la Industria Editorial Mexicana, Reg. Núm. 736

ISBN: 978-1-4562-6753-7
ISBN de la edición anterior: 978-607-15-1250-5

1 2 3 4 5 6 7 9 0 24 23 22 21 20 19
Impreso en México Printed in Mexico
Agradecimiento

En primer lugar, dedico la presente obra al Dios Todo Poderoso, creador de los cielos y la
tierra, y el dueño de todo conocimiento que se genera en todo el universo, y quien me ha
regalado la vida para cumplir con su propósito en ésta tierra, asentando mis conocimien-
tos profesionales al servicio de la sociedad.
A mi padre Félix Sánchez (QDDG) y a mi madre Lilian Colindres (QDDG), que se
esforzaron por darme los primeros conocimientos académicos y la inculcación de los
principios éticos y morales de los cuales debe revestirse todo ser humano, el temor a Dios,
el servir al prójimo y el respeto a los demás.
A mis abuelos Ildefonso Fúnez Medina y Julia Colindres Pavón, quienes apoyaron a
mis padres para que sus descendientes se forjaran en los primeros conocimientos escolares.
A mis hermanos Rigoberto (QDDG), Juan Bautista, Mirna Isidra, Dora Elizabeth, y
Héctor Hernán (QDDG), con quienes compartí mi niñez y aprendimos a cuidarnos, ser-
virnos y respetarnos mutuamente.
A mi esposa Glenda Xiomara Pérez, a mis hijos Vilma Lynneth, Lynda Suzzeth, Car-
los Amílcar, Johanna Grissel, María José y Gretel Gabriela, quienes han estado a mi lado
por siempre, brindándome todo el apoyo moral que un padre y jefe de familia requiere para
salir adelante.

iii
Dedicatoria

A Dios por todo, ya que sin su voluntad nada es posible.


A toda mi familia, compañeros de trabajo y amigos.
A la Universidad Católica de Honduras, Nuestra Señora Reina de la Paz, y a sus autorida-
des que me han brindado la oportunidad de impartir mis conocimientos profesionales en
la docencia, dando el pan del saber por más de 20 años en el área de la matemática, la
física y la gestión de la calidad, como parte de los componentes necesarios entre otros, en
función de la formación integral de profesionales humanistas, con valores claros, defenso-
res de la vida y en constante diálogo con el mundo, la ciencia y la fe, y que sean líderes que
contribuyan a la construcción de una nueva sociedad.

iv
Acerca del autor del texto,
y sus colaboradores

Carlos Amilcar Sánchez Colindres


Nació en Moramulca, Municipio de San Isidro, Departamento de Choluteca, el 9 de di-
ciembre de 1960. Cursó sus estudios universitarios en la Universidad Nacional Autónoma
de Honduras, UNAH, obteniendo el Título de Licenciado en Matemáticas.
Catedrático en el área de Matemáticas en diversas Universidades (UNAH, Escuela
Zamorano, Universidad de Defensa de Honduras UDH, y en la UNICAH, en 1995, 2003
y 2007 hasta la fecha)

El autor y usuarios agradecen al


doctor Jaime Gustavo Núñez Cruz, su valiosa colaboración y aportes en la segunda
Edición del presente texto de Bioestadística.
Fecha de nacimiento: 11 de febrero de 1958
Títulos obtenidos: Licenciatura, Master of Arts, Master of Sciencie, PhD
Catedrático en la UNICAH, desde el año 1999.

v
Contenido

Capítulo 1.  Introducción y resumen del texto  1


1.1 Resumen del texto 2
1.2 Reseña histórica de la estadística 2
1.3 Importancia de la estadística en las ciencias médicas y áreas de la salud 4
1.4 Errores Estadísticos Comunes 4
1.5 Notas sobre el valor de la estadística en las ciencias médicas
y áreas de la salud 5
1.6 Objetivos y aplicaciones de la estadística en las ciencias médicas
y área de la salud 5
1.7 Conclusiones 6

Capítulo 2.  Introducción a la estadística  7


2.1 Definición de estadística y bioestadística 8
2.2 Objetivos generales, clasificación y definición de términos
más utilizados en estadística 8
2.2.1 Objetivos   8
2.2.2 Clasificación  8
2.2.3 Definición de términos  9
2.3 Tipo de datos y escalas de medición 11
2.4 Tablas o cuadros estadísticos 12
2.5 Medidas de punto: Proporciones, porcentajes y razones 14
2.6 Tasas de cambio, tasa de crecimiento y proyecciones de población 16
2.7 Tasas demográficas y poblacionales 19

Capítulo 3. Ordenamiento y presentación


de datos  25
3.1 Representación gráfica de datos 26
3.1.1 Gráfico o diagrama de barras simples  26
3.1.2 Gráfico de barras agrupadas o comparativas  26
3.1.3 Gráfico de barras compuestas o segmentadas  27
3.1.4 Gráfico de líneas  28
vii
viii Contenido

3.1.5 Gráfico circular o diagrama de sectores  29


3.1.6 Pirámides de población  29
3.1.7 Pictogramas 30
3.1.8 Mapas 31
3.2 Distribuciones de frecuencias o presentación tabular 33
3.2.1 Rango 33
3.2.2 Intervalos de clase y límites de clase  34
3.2.3 Ancho de clase  34
3.2.4 Marca de clase o punto medio  35
3.2.5 Límites reales de clase  35
3.2.6 Frecuencia simple o absoluta, frecuencia acumulada,
frecuencia relativa y frecuencia relativa acumulada  35
3.3 Representación gráfica de las distribuciones de frecuencias 41
3.3.1 Histograma 41
3.3.2 Polígono de frecuencias  41
3.3.3 Ojivas de Galton  42

Capítulo 4.  Medidas detendencia central  47


4.1 Conceptualización 48
4.2 La sumatoria o notación sigma 48
4.3 La media aritmética y su cálculo 50
4.3.1 Cálculo de la media aritmética para datos no agrupados  50
4.3.2 Cálculo de la media aritmética para datos agrupados
en frecuencia simple  50
4.3.3 Cálculo de la media aritmética para datos agrupados en distribución
de frecuencias   51
4.4 La mediana y su cálculo 54
4.4.1 Cálculo de la mediana para datos no agrupados  55
4.4.2 Cálculo de la mediana para datos agrupados en frecuencia simple  55
4.4.3 Cálculo de la mediana para datos agrupados en distribución
de frecuencias  56
4.5 La moda y su cálculo 59
4.5.1 Cálculo de la moda para datos no agrupados  60
4.5.2 Cálculo de la moda para datos agrupados en frecuencia simple  60
4.5.3 Cálculo de la moda para datos agrupados en distribución
de frecuencia   61
4.6 La media aritmética ponderada 64
4.7 Ventajas y desventajas de la media, mediana y moda 66
4.8 La Media Geométrica 67

Capítulo 5.  Medidas de posición  69


5.1 Cálculo de la posición y valor de los cuartiles, deciles y percentiles
para datos no agrupados 70
5.2 Cálculo de los cuartiles, deciles y percentiles para datos agrupados 74
5.3 El Rango Percentil: Cálculo y su significado 77

Capítulo 6.  Medidas de dispersión  81


6.1 Conceptualización e interpretación de la desviación estándar 82
6.2 Cálculo de la desviación estándar y varianza para datos no agrupados 83
Contenido ix

6.3 Cálculo de la desviación estándar y varianza para datos


agrupados en frecuencia simple 86
6.4 Cálculo de la desviación estándar y varianza para datos
agrupados en distribución de frecuencias 89
6.5 Desviaciones relativas 92
6.5.1 El coeficiente de variación  92
6.5.2 La variable normalizada  92
6.6 Medidas de la curtosis 94
6.7 Asimetría estadística 97
6.7.1 Cálculo del Coeficiente de Asimetría de Fisher  98
6.7.2 Cálculo del Coeficiente de Asimetría de Pearson  101

Capítulo 7.  Tasas y estandarización  103


7.1 Tasas 104
7.2 Tasas de estandarización 107
7.3 Método directo de estandarización de datos 108
7.4 Método indirecto de estandarización de datos 109
7.5 Uso de las tasas de estandarización 110
7.6 Aplicaciones adicionales 112

Capítulo 8.  Tablas de vida  117


8.1 Cálculo de las tablas de vida 119
8.2 Aplicaciones de la tabla de vida 121

Capítulo 9.  Introducción a la probabilidad  125


9.1 Historia e importancia de la teoría de la probabilidad 126
9.2 Elementos más utilizados en la teoría de la probabilidad 127
9.3 Axiomas de probabilidad 127
9.4 Introducción a la probabilidad clásica 128
9.5 Probabilidad condicional 129
9.5.1 Regla de la suma  132
9.5.2 Regla del producto para eventos con independencia estadística  136
9.5.3 Regla del producto para eventos con dependencia estadística  138
9.5.4 Regla de Bayes  141

Capítulo 10. Distribuciones teóricas de


probabilidad 145
10.1 La distribución binomial 146
10.2 La distribución de Poisson 150
10.3 La distribución normal 153

Capítulo 11.  Técnicas de muestreo  161


11.1 El muestreo no aleatorio 162
11.1.1 Muestreo por accidente  162
11.1.2 Muestreo por cuota  162
11.1.3 Muestreo intencional o de juicio  163
x Contenido

11.2 Muestreo aleatorio 163


11.2.1 Muestreo aleatorio simple  163
11.2.2 El muestreo sistemático  163
11.2.3 El muestreo estratificado  164
11.2.4 El muestreo por conglomerado  165

Capítulo 12.  Distribuciones muestrales  167


12.1 Estimadores y parámetros 168
12.2 Criterios de un buen estimador 169
12.3 Cálculo de la gran media 169
12.4 Teorema del límite central 170
12.5 El teorema de Chebyshev 172
12.6 Distribución muestral de medias 173
12.6.1 Error estándar de la media  173
12.6.2 Error estándar para proporciones  175
12.6.3 Uso de la distribución muestral  175

Capítulo 13. Metodología científica y temas


relacionados 179
13.1 Método Estadístico 180
13.2 Método Científico 181
13.3 El Ensayo Clínico 184
13.4 Diseño y ejecución en procesos estadísticos 190
13.5 Sensibilidad, Especificidad, Prevalencia y Valores predictivos 192
13.5.1 Sensibilidad  193
13.5.2 Especificidad  193
13.5.3 Relación entre Sensibilidad y Especificidad  194
13.5.4 Prevalencia  194
13.5.5 La influencia de la prevalencia  195
13.5.6 Combinación de factores  195
13.5.7 La seguridad de una prueba diagnóstica  197
13.5.8 Razones de probabilidad o coeficientes de verosimilitud  199
13.5.9 Razones de Probabilidad (ODDS RATIO)  201
13.5.10 Tasa de Riesgo Relativo  204

Capítulo 14.  Estimaciones  211


14.1 Estimaciones puntuales 212
14.2 Estimaciones por intervalo e intervalo de confianza 214
14.3 Estimación para la media, (muestras grandes) 216
14.4 Estimación para la media, (muestras pequeñas
y el uso de la distribución t) 218
14.5 Estimaciones para proporciones (muestras grandes y pequeñas) 220
14.6 Determinación del tamaño de una muestra 222
14.6.1 Fórmulas más utilizadas para el cálculo del tamaño de una
muestra: 223
14.6.2 Toma de decisiones  224
Contenido xi

Capítulo 15. Pruebas de hipótesis para


una sola muestra  227
15.1 Introducción y conceptos básicos 228
15.2 Prueba de hipótesis 228
15.3 Prueba de hipótesis de medias cuando se conoce la desviación estándar de
la población 233
15.4 Prueba de hipótesis de medias cuando no se conoce la desviación estándar
de la población 235
15.5 Prueba de hipótesis para proporciones, (muestras grandes) 238

Capítulo 16. Pruebas de hipótesis para dos


muestras 243
16.1 Prueba de hipótesis para la diferencia de medias (muestras grandes) 244
16.2 Prueba de hipótesis para la diferencia de medias (muestras pequeñas) 247
16.3 Prueba de hipótesis para la diferencia entre proporciones
(muestras grandes) 250
16.4 Prueba de hipótesis para la diferencia entre proporciones
(muestras pequeñas) 253
16.5 Prueba de la diferencia entre medias con muestras dependientes 255

Capítulo 17. La distribución Ji-Cuadrada y el análisis


de varianza  259
17.1 Introducción 260
17.2 Ji-cuadrada como prueba de independencia 260
17.3 Ji-cuadrada como prueba de bondad de ajuste 265
17.4 Análisis de varianza 271
17.5 Inferencia sobre una varianza de población 277
17.6 Inferencia sobre la varianza de dos poblaciones 280

Capítulo 18. Regresión simple y correlación  285


18.1 Estimación mediante la línea de regresión 286
18.2 Análisis de correlación 292
18.3 Pendiente de la línea de regresión de la población y error estándar
del coeficiente de regresión 295

Capítulo 19. Regresión múltiple y análisis de


correlación 299
19.1 Introducción 300
19.2 Deducción de la ecuación de regresión múltiple 300
19.3 Técnicas de modelado 303

Capítulo 20. Estadística no paramétrica  307


20.1 Prueba de signos para datos pareados 308
20.2 Prueba U de Mann-Whitney 311
20.3 Prueba de Kruskal-Wallis 314
xii Contenido

20.4 Prueba de corridas de una sola muestra 317


20.5 Prueba correlación de rango de Spearman 319
20.6 Prueba de Kolmogorov-Smirnov 321

Capítulo 21. Series temporales  325


21.1 Introducción 326
21.2 Variaciones en las series de tiempo 326
21.3 Análisis de tendencia 328
21.4 Variación cíclica 332
21.5 Variación estacional 334
21.6 Variación irregular 339

ANEXOS 341
ANEXO A1 Tablas de distribuciones de probabilidad 342
ANEXO A2 Respuestas a ejercicios de número par 377
ANEXO A3 Bibliografía 395
CAPÍTULO

Introducción y resumen
del texto 1
Contenido

1.1 Resumen del texto


1.2 Reseña histórica de la estadística
1.3 Importancia de la estadística en las ciencias
médicas y áreas de la salud
1.4 Errores estadísticos comunes
1.5 Notas sobre el valor de la estadística en las
ciencias médicas y áreas de la salud
1.6 Objetivos y aplicaciones de la estadística en
las ciencias médicas y áreas de la salud
1.7 Conclusiones
2 CAPÍTULO 1

Introducción y resumen del texto


1.1  Resumen del texto
La presente obra tiene como propósito desarrollar ampliamente los contenidos sistemáticos
del curso de Bioestadística programado por las universidades públicas y privadas, en los
planes de estudio para las carreras del doctorado en medicina y cirugía, doctorado en ciru-
gía dental; licenciatura en enfermería; o cualquier otra carrera de similar condición.
El texto está constituido por veintiún capítulos, vinculados a los temas nominados en
el acápite de páginas anteriores (índice), información primaria que debe ser leída o revi-
sada por el lector, con el propósito de tener una mejor orientación de los aspectos progra-
máticos de desarrollo y características específicas que facilitan la enseñanza y el aprendi-
zaje de la estadística aplicada a las ciencias médicas y áreas de la salud.
Cabe señalar que el presente texto, está diseñado para ayudar a captar el sentido de
la estadística, es decir, cómo y cuándo aplicar las técnicas a situaciones de la vida real, y
cómo interpretar los resultados que se obtengan; por tal razón, descartamos las demostra-
ciones matemáticas de rigor a favor de las pruebas intuitivas; no obstante, para una mejor
comprensión de los contenidos del presente texto, es obligatorio para todo estudiante o
lector, haber llevado un curso de álgebra elemental.

1.2  Reseña histórica de la estadística


Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones
lograron recopilar hacia el año 3050 antes de Cristo, datos prolijos relativos a la población
y la riqueza del país. De acuerdo al historiador griego Herodoto, dicho registro de riqueza y
población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo
Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo testamento, la Biblia da referencias en el libro de Números sobre los
datos estadísticos obtenidos en dos recuentos de la población hebrea. Por otra parte, el
Rey David ordenó a Joab, general del ejército, hacer un censo en Israel, con la finalidad
de conocer el número de habitantes de este país en ese entonces.
Los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron
censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cál-
culo de recursos y hombres disponibles). La investigación histórica revela que se realiza-
ron sesenta y nueve (69) censos para calcular los impuestos, determinar los derechos de
voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor supie-
ron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la po-
blación, y sus funcionarios públicos tenían la obligación de anotar nacimientos, defuncio-
nes y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas
obtenidas en las tierras conquistadas. Según la historia, para el año del nacimiento de
Jesucristo y en algunos años de su niñez, se realizaron varios empadronamientos de la
población bajo la autoridad del imperio, con diversas finalidades, aplicando procesos es-
tadísticos empíricos pero funcionales para la época.
Durante los mil años siguientes a la caída del Imperio Romano se realizaron muy
pocas operaciones estadísticas, con la notable excepción de las relaciones de tierras per-
tenecientes a la iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el
762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos.
En Inglaterra, para el año 1086 Guillermo el Conquistador recopiló el Domesday Book o
libro del Gran Catastro, un documento de la propiedad, extensión y valor de las tierras de
Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra.
Aunque Carlomagno en Francia; y Guillermo el Conquistador en Inglaterra, trataron
de revivir la técnica romana, los métodos estadísticos permanecieron casi olvidados du-
rante la edad media.
Introducción y resumen del texto 3

Durante los siglos xv, xvi, y xvii, hombres como Leonardo Da Vinci, Nicolás Copér-
nico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron gran-
des aportaciones al método científico de tal forma que cuando se crearon los estados na-
cionales y surgió como fuerza el comercio internacional, existía ya, un método capaz de
aplicarse a los datos económicos y financieros. Asimismo, para el año 1532 empezaron a
registrarse en Inglaterra las defunciones debido al temor que Enrique vii tenía por la peste
que menguaba la población de ese entonces. Más o menos por la misma época en Francia,
la ley exigió a los clérigos registrar los bautismos, nacimientos, fallecimientos y matrimo-
nios, como parte de los actos y hechos vitales de las personas naturales.
Durante un brote de peste que apareció a fines de la década de 1500, el gobierno in-
glés comenzó a publicar estadísticas semanales de los decesos. Esa costumbre continuó
muchos años después, y en 1632, estos Bills of Mortality (Cuentas de Mortalidad) conte-
nían los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó do-
cumentos que abarcaban treinta años y efectuó predicciones sobre el número de personas
que morirían de varias enfermedades, así como las proporciones de nacimientos de varo-
nes y mujeres que cabría esperar. El trabajo de Graunt, condensado en su obra Natural
and Political Observations...Made Upon the Bills of Mortality (Observaciones Políticas y
Naturales... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en
el análisis estadístico.
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de
los recursos nacionales, contentiva de datos sobre la organización política, instrucciones
sociales, comercio y poderío militar. Durante el siglo xvii aportó indicaciones más concre-
tas de métodos de observación y análisis cuantitativo, y amplió los campos de la inferen-
cia y la teoría estadística.
Los eruditos del siglo xvii demostraron especial interés por la estadística demográfica
como resultado de la especulación sobre si la población aumentaba, decrecía o permane-
cía estática.
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos
países. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar
en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau.
Este investigador se propuso destruir la antigua creencia popular de que en los años ter-
minados en siete moría más gente que en los restantes, y para lograrlo removió paciente-
mente en los archivos parroquiales de la ciudad. Después de revisar miles de certificados
de defunción pudo demostrar que en tales años no fallecían más personas que en los de-
más. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley,
descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida huma-
na. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las
compañías de seguros.
Durante el siglo xvii y principios del xviii, matemáticos como Bernoulli, Francis Ma-
seres, LaGrange y Laplace, desarrollaron la teoría de probabilidades. No obstante, durante
cierto tiempo, la aplicación de la teoría de las probabilidades se limitó a los juegos de azar,
y es hasta el siglo xviii cuando comenzó a aplicarse a los grandes problemas científicos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la pala-
bra estadística, que extrajo del término italiano estatista (estadista). Creía, y con sobrada
razón, que los datos de la nueva ciencia serían el aliado más eficaz del gobernante cons-
ciente. La raíz remota de la palabra se halla, por otra parte, en el término latino status,
que significa estado o situación; esta etimología aumenta el valor intrínseco de la palabra,
por cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones.
Jacques Quételect es quien aplica las estadísticas a las ciencias sociales. Este inter-
pretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver la aplica-
ción del principio de promedios y de la variabilidad a los fenómenos sociales. Quételect
4 CAPÍTULO 1

fue el primero en realizar la aplicación práctica de todo el método estadístico a las diver-
sas ramas de la ciencia en ese entonces conocido.
Entre tanto, en el periodo de 1800 a 1820 se desarrollaron dos conceptos matemáti-
cos fundamentales para la teoría estadística: la teoría de los errores de observación, apor-
tada por Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por Laplace,
Gauss y Legendre. A finales del siglo xix, Sir Francis Gaston ideó el método conocido por
correlación, que tenía por objeto medir la influencia relativa de los factores sobre las va-
riables. De aquí partió el desarrollo del coeficiente de correlación creado por Karl Pear-
son y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H. Hooker y
G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.
Los progresos más recientes en el campo de la estadística se refieren al ulterior desa-
rrollo del cálculo de probabilidades, particularmente en la rama denominada indetermi-
nismo o relatividad, se ha demostrado que el determinismo fue reconocido en la física
como resultado de las investigaciones atómicas y que este principio se juzga aplicable
tanto a las ciencias sociales como a la física. La historia del desarrollo de la teoría estadís-
tica y su práctica es larga. Con la presente reseña solo nos hemos limitado a nominar al-
gunos personajes y hechos relacionados al desarrollo histórico de la estadística, por tanto,
de acuerdo se vaya escudriñando el texto, más adelante nos encontraremos con nombres
de personas que han hecho grandes contribuciones a la estadística, y que por ende mu-
chas leyes, teoremas y métodos, llevan el nombre de estos ilustres personajes.

1.3 Importancia de la estadística en las ciencias


médicas y áreas de la salud
Todas las ciencias estudiadas y aplicadas en cualquier sociedad, están estrechamente liga-
das a las matemáticas, por tal razón, la estadística como una técnica matemática no debe
ser excluida para el entendimiento de los diversos procesos biológicos, administrativos,
económicos, financieros o de ingeniería, en la recolección de información, análisis, inter-
pretación y representación de datos vinculados con las áreas antes precitadas, inferencias
sobre los procesos en las áreas de la salud y las ciencias médicas, administrativas y otras
o avances científicos para el mejor bienestar de las poblaciones presentes y venideras.
Asimismo, es importante para cualquier profesional del área de las ciencias médicas y la
salud, poder utilizar las técnicas, métodos, fórmulas, cálculos y análisis de la estadística
descriptiva e inferencial, medidas de tendencia central, de dispersión, de posición, repre-
sentaciones gráficas de conjuntos de datos muéstrales o poblacionales, análisis de diver-
sos parámetros estadísticos como la regresión y la correlación, pruebas de hipótesis en
general, series temporales, tasas, razones y proporciones, tablas de vida, estandarización
de datos y otros temas, utilizados frecuentemente en dichos campos.
Cuando los seres humanos nos vemos obligados a conocer en cualquier área de las
acciones del hombre e inferir que ha sucedido en el pasado, que sucede en el presente o
que sucederá a futuro, es la estadística la herramienta fundamental a la cual debemos
recurrir obligatoriamente, para proporcionar las adecuadas respuestas a dichas interro-
gantes.
Con la utilización de las técnicas y conocimientos estadísticos, los profesionales vin-
culados a las ciencias médicas y áreas de la salud, pueden sentirse apoyados y más seguros
al manejar información concurrente y precisa en proyectos y programas que vinculan la
solución duradera o temporal sobre situaciones atinentes a sus áreas; la investigación
científica, y toda actividad que conlleve el uso de estadísticas en dichos campos.

1.4  Errores estadísticos comunes


Al momento de recopilar los datos que serán procesados, se es susceptible de cometer
errores, así como durante los cómputos de los mismos. No obstante, hay otros errores
Introducción y resumen del texto 5

que no tienen nada que ver con la digitación y que no son tan fácilmente identificables.
Algunos de estos errores son:
Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes
de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o
estado mental pueda influir en la recopilación y en el análisis de la información. En estos
casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan
su opinión que a aquellos que la contradicen. Un caso extremo de sesgo sería la situación
donde primero se toma una decisión y después se utiliza el análisis estadístico para justi-
ficar la decisión ya tomada.
Datos no comparables: El establecer comparaciones, es una de las partes más impor-
tantes del análisis estadístico, pero es extremadamente importante que tales comparacio-
nes se hagan entre datos que sean comparables.
Proyección descuidada de tendencias: La proyección simplista de tendencias pasadas
hacia el futuro, es uno de los errores que más ha desacreditado el uso del análisis estadístico.
Muestreo Incorrecto: En la mayoría de los estudios sucede que el volumen de infor-
mación disponible es tan inmenso que se hace necesario estudiar muestras, para derivar
conclusiones acerca de la población a que pertenece la muestra. Si la muestra se seleccio-
na correctamente, tendrá básicamente las mismas propiedades que la población de la cual
fue extraída; pero si el muestreo se realiza incorrectamente, entonces puede suceder que
los resultados no signifiquen nada.

1.5 Notas sobre el valor de la estadística en las ciencias


médicas y áreas de la salud
La necesidad de un enfoque estadístico está actualmente bien reconocida en la investiga-
ción y en la práctica de las disciplinas que constituyen las áreas de la salud y el campo de
la medicina, aplicando claramente las leyes de los grandes números y de las fluctuaciones
aleatorias en los diversos campos de la medicina. Asimismo, recuerde que la estadística
permite analizar situaciones en las que los componentes aleatorios contribuyen de forma
importante en la variabilidad de los datos obtenidos.
La extensión de los conocimientos y aptitudes de carácter estadístico que necesitan
adquirir los profesionales de las áreas de la salud son importantes, porque el conocimien-
to de los principios y métodos estadísticos y la competencia en su aplicación se necesitan
para el ejercicio eficaz, y adicionalmente para la comprensión e interpretación de los da-
tos en general, a fin de discriminar entre opiniones arbitrarias o discrecionales, con res-
pecto a las verdaderamente evaluadas en un contexto científico.

1.6 Objetivos y aplicaciones de la estadística en las ciencias


médicas y área de la salud
Entre los objetivos más importantes relacionados con la estadística y que contribuyen en
el campo de las ciencias médicas y área de la salud, así como de los diversos sectores re-
lacionados, tenemos los siguientes:
1. Comprender los fundamentos racionales en que se basan las decisiones en materia de
diagnóstico y pronósticos médicos, epidemias, efectividad de los medicamentos y
drogas, administración y procesos aplicados en la salud pública, y otra diversidad de
acciones relacionadas con dichas áreas;
2. Interpretar las pruebas, observaciones y mediciones técnicas-administrativas, sus va-
riaciones y la interrelación entre el observador y los componentes estadísticos, ya sea
como una ciencia o una técnica matemática;
3. Proporcionar los conocimientos necesarios y comprensión de la información acerca
de la etiología y el pronóstico de los diversos procesos en el área de la salud y las
ciencias médicas;
6 CAPÍTULO 1

4. Otorgar un discernimiento de los problemas macros en la administración de las ade-


cuadas políticas aplicables a las ciencias médicas, área de la salud y otras de tipo co-
nexo, sustentados en los recursos necesarios y disponibles en la solución de dichos
problemas.
Adicionalmente a los objetivos antes citados, resaltan la utilidad de la estadística en
el desarrollo del pensamiento crítico, con el fin de: a) Recapacitar críticamente acerca de
los problemas presentados en el mundo real; b) Evaluar correctamente los datos disponi-
bles para la toma de decisiones; c) Identificar las decisiones y conclusiones que carecen
de base científica y lógica.

1.7 Conclusiones
La estadística es la ciencia que más aporta en la toma de decisiones en todos los ámbitos
gerenciales. Desde el poder ejecutivo hasta los draft’s deportivos, la estadística juega su
papel a la hora de hacer cualquier movimiento.
La estadística, por otro lado, si no se sabe manejar con cautela puede generar resultados
falaces que podrían a su vez, llevarnos a la toma de decisiones erradas. Por consiguiente,
se recomienda un estudio pleno y científico de la materia, a fin de que quien utilice sus
servicios pueda hacerlo de manera objetiva y con resultados satisfactorios.
Recuerde que la estadística es mucho más que sólo números apilados y gráficas boni-
tas. Es una ciencia con tanta antigüedad como la escritura, y es por sí misma auxiliar de
todas las demás ciencias. Los mercados, las empresas, la medicina, la ingeniería, los go-
biernos, etc.…, se nombran entre los más destacados clientes de ésta.
CAPÍTULO

Introducción a la
estadística 2
Contenido

2.1 Definición de estadística y bioestadística


2.2 Objetivos, clasificación y términos utilizados
en estadística
2.2.1 Objetivos
2.2.2 Clasificación
2.2.3 Definición de términos
2.3 Tipo de datos y escalas de medición
2.4 Tablas o cuadros estadísticos
2.5 Medidas de punto: Proporciones, porcentajes
y razones
2.6 Tasas de cambio, tasa de crecimiento y
proyecciones de población
2.7 Tasas demográficas y poblacionales
8 CAPÍTULO 2

Introducción a la estadística
2.1  Definición de estadística y bioestadística
La estadística, por una parte, es una rama de la matemática que se encarga de la recopila-
ción, el ordenamiento, el análisis, la interpretación, y la representación de datos. Por otra
parte, y de forma general, pero exhaustiva, se puede decir que la estadística trata del dise-
ño de experimentos o encuestas mediante muestras para obtener una cantidad determina-
da de información a un costo mínimo, y del uso óptimo de esa información para hacer
inferencias con respecto a una población.
Asimismo, podemos agregar que la estadística es una ciencia formal y una herramien-
ta que estudia el uso y los análisis provenientes de una muestra representativa de datos,
busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocu-
rrencia en forma aleatoria o condicional. No obstante, podemos decir, que la estadística
es más que eso, es decir, es la herramienta o bastión fundamental, que otorga el beneplá-
cito para el desarrollo formal de los procesos relacionados con la investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad, como también la utili-
dad para la toma de decisiones en las áreas de los negocios en general, de la administra-
ción, las ingenierías, o de las instituciones gubernamentales de acuerdo a su naturaleza.
Bioestadística: Se define como la aplicación amplia de las técnicas estadísticas a las
ciencias biológicas y las disciplinas relacionadas con el área de la medicina y la salud.

2.2 Objetivos generales, clasificación y definición


de términos más utilizados en estadística
2.2.1 Objetivos
Entre los objetivos generales de la estadística tenemos:
a) Hacer inferencias sobre una población a partir de la información de una muestra;
b) Proporcionar una medida correspondiente para la bondad de las inferencias sobre
parámetros poblacionales;
c) Describir mediante técnicas y métodos matemáticos un fenómeno físico, biológico,
administrativo o de cualquier otra naturaleza;
d) Promediar y medir los sucesos pasados, su variabilidad y probabilidad de ocurrencia
en el futuro;
e) Facilitar a los seres humanos el manejo, la representación, la clasificación, la interpre-
tación y el mejor entendimiento de la información transformada en datos estadísticos
en general

2.2.2 Clasificación
La estadística se subdivide en dos grandes ramas:
a) Estadística descriptiva; y
b) Estadística inferencial;
La estadística descriptiva: Trata de los métodos para organizar datos numéricos de
modo que se haga más fácil su interpretación. Asimismo, todo lo referente a gráficos,
cuadros, tablas, diagramas, medidas de tendencia central, de posición, de dispersión, así
como otros métodos de representación, son elementos característicos de la estadística
descriptiva.
La estadística inferencial: A esta subdivisión le corresponde todo lo atinente a la teo-
ría, métodos, reglas y axiomas de probabilidad; y la mayoría de análisis complejos sobre
parámetros de una población, conjugando para tal fin, las teorías probabilísticas y técni-
cas especiales basadas en información referente a un pequeño grupo de la misma.
Introducción a la estadística 9

2.2.3 Definición de términos
Población: Conocida también como conjunto universo, se refiere a la colección de todos
los elementos en estudio que tienen una o más características comunes, y cuyas propieda-
des se han de analizar.
Muestra: Es una parte o un subconjunto de la población, que comparte las mismas
características de la población en estudio.
Ejemplo1 de población: Todos los estudiantes de la UNICAH.
Muestra1: Estudiantes del Campus Sagrado Corazón de Jesús.
Muestra2: Estudiantes de la Carrera de Medicina y Cirugía.
Muestra3: Estudiantes de la UNICAH, sexo femenino.
Ejemplo 2 de población: Sea A = {2, 3, 5, 7, 11, 13, 17, 19, 23}
Muestra 1: B = {3, 5, 7} y Muestra 2: H = {2, 23}
Variable: Es la característica de interés acerca de cada elemento de una población o
muestra. Asimismo, a la variable se le conoce como un símbolo que puede tomar cual-
quier valor dentro de un universo dado.
Una variable en estadística puede ser de dos tipos:
1. Cuantitativa;
2. Cualitativa.
Variables cuantitativas:
Son aquellas que se expresan mediante valores numéricos: como ser el número de perso-
nas en una reunión o que conforman un grupo social, número de animales o cosas, medi-
das como el peso, la temperatura, la edad, la estatura, etc.
Las variables cuantitativas se clasifican en discretas y continuas.
Una variable cuantitativa es discreta cuando sus resultados solo pueden ser valores
enteros.
Ejemplo
1. Número de médicos en un auditórium;
2. Número de alumnos de la Carrera de Cirugía Dental presentes en una clase;
3. Número de niños nacidos vivos en un período X en el Hospital Materno Infantil;
4. Número de centros de salud construidos en la Región Sur de Honduras; etc.
Una variable cuantitativa es continua cuando sus resultados pueden ser por su natura-
leza, valores enteros o decimales.
Ejemplo
1. Estatura de un paciente;
2. Velocidad de un móvil;
3. Altura del edificio del Hospital Mario Catarino Rivas;
4. Peso de un automóvil ambulancia o cualquier otro objeto;
5. Volumen de una figura geométrica, etc.
Variables cualitativas:
Estas son expresadas mediante palabras, ya que describen la cualidad de una variable;
también se les conoce como atributos, y a las partes en que se dividen estos atributos, se
les llama, “modalidad”.
Ejemplo 1
Variable cualitativa Modalidad
Sexo de un médico Femenino
Masculino
10 CAPÍTULO 2

Ejemplo 2
Variable cualitativa Modalidad
Estado civil de los empleados de salud Casado
Unión libre
Soltero
Divorciado
Viudo
Unión de hecho
Dato: Es el valor de la variable asociado a un elemento de una población o una muestra.
Ejemplo
Alessandra Girón: Es estudiante de la carrera de Medicina y Cirugía en la UNICAH,
Campus Sagrado Corazón de Jesús, tiene 20 años, pesa 150 libras, mide 1.66 metros, ha-
bla tres idiomas, es de piel blanca, ojos cafés, pelo castaño, reside en Tegucigalpa, etc.
Experimento: Es una actividad realizada según un plan definido, cuyos resultados
producen un conjunto de datos.
La información o registro de datos en un experimento puede obtenerse mediante:
Observación, medición o consulta
Nota: El instrumento o proceso más común para la recolección de información es la en-
cuesta

EJERCICIOS 2.2
1. Relacionado al campo de la medicina y la salud, establezca dos ejemplos para cada
uno de los siguientes términos:
a) Población;
b) Muestra;
c) Dato;
d) Experimento; y
e) Variable.
2. ¿Cuál es la diferencia entre una población y una muestra?
3. ¿Cómo se clasifican las variables cuantitativas?
4. Establezca dos ejemplos de variable cualitativa en el área de la salud;
5. Diga si las siguientes variables son discretas o continuas;
a) Número de empleados en el Hospital Mario Catarino Rivas;
b) La temperatura corporal de un paciente;
c) La altura de los médicos de un hospital privado en la Ciudad de La Ceiba;
d) La distancia recorrida por una ambulancia;
e) La remuneración salarial de los trabajadores del área de la salud en Honduras;
f) Número de niños con tratamiento especial para enfermedades crónicas;
g) El número de ampollas producidas en una droguería;
h) El peso promedio de las enfermeras del Hospital San Felipe;
i) Número de bacterias presentes por centímetro cuadrado en una masa corporal;
j) Volumen del torrente sanguíneo de un paciente;
k) Los descansos tomados por un médico durante un día cualesquiera.
6. Mencione los tres medios más comunes para obtener información o recolectar datos.
7. ¿Cuál es el instrumento más común y utilizado en la recolección de información?
Introducción a la estadística 11

2.3  Tipo de datos y escalas de medición


Los datos numéricos cuantitativos discretos o continuos, pueden ser tratados a través de
las siguientes escalas de medición:
1. Escala Nominal
2. Escala ordinal
3. Escala de razón
4. Escala de intervalo
Las Escalas Nominales: Son utilizadas para representar datos en categorías separadas.
Ejemplo
Consultas más comunes por especialidad que brinda el Hospital Escuela Universitario
HEU, en Tegucigalpa
• Medicina general
• Ginecología
• Maternidad
• Medicina interna
• Oncología
• Urología
• Cardiología
• Ortopedia
• Otorrinolaringología
• Otras
Las Escalas Ordinales: Son las que clasifican las observaciones en categorías con un
orden significativo.
Ejemplo 1
Niveles de atención en las áreas de emergencia en el IHSS
Malo    Bueno   Muy Bueno   Excelente
Ejemplo 2
Lugares de premiación para el personal del Hospital La Policlínica, por su buen desempe-
ño durante el año 2014:
Primer lugar    Segundo lugar   Tercer lugar
Las Escalas de Razón: Son medidas numéricas en las cuales se aplican los razona-
mientos lógicos y matemáticos de acuerdo a las propiedades de los números. En este caso
el cero es fijo de acuerdo a su interpretación numérica y asimismo los demás resultados.
Ejemplo
La siguiente tabla representa el número de proveedores por empresa atendidos por la Se-
cretaría de Salud durante la semana:

Empresas Cantidad
1. Droguería Farinter 7
2. Grupo Pharma City 3
3. Droguería Bayer 6
4. Accesorios Ortopédicos S.A. 2
5. Droguería Astro Rey 2
6. Droguería Universal 1
Total 21
12 CAPÍTULO 2

Las Escalas por Intervalo: Son medidas numéricas en las cuales el valor del cero es
arbitrario, pero la diferencia entre otros valores es importante.
Ejemplo 1
Debemos tener en cuenta que 0º (cero grados), no significa la ausencia de temperatura, y
entre 30º y 50º, existen 20º de diferencia, igual que entre 20º y 40º.
Ejemplo 2
0º Centígrados es relativo a los 32º Fahrenheit, y ambos valores representan la misma
temperatura.
Ejemplo 3
Peso de los empleados del Centro de Salud Las Crucitas, Ciudad de Comayagüela:

Peso en kgs Cantidad


50.0-55.5 2
55.6-61.1 5
61.2-66.7 4
66.8-72.3 3
72.4-77.9 1
Total 15

EJERCICIOS 2.3
1. Para cada una de las cuatro escalas de medición, establezca un ejemplo relacionado
a las ciencias médicas o área de la salud.
2. La estructura en una institución de servicios médicos, sección, departamento, geren-
cia, subdirección y dirección, ¿Con cuál escala de medición pueden describirse?
3. Construya una escala nominal para el tipo asistencias en pacientes procedentes de
diez colonias de la Ciudad Capital.
4. Construya una escala ordinal para la estructura y jerarquía de mandos en la UNI-
CAH, referente a sus autoridades académicas.
5. Construya una escala de razón para proveedores de la UNICAH y número de visitas
a la Gerencia Administrativa durante una semana cualesquiera. Proveedor A, 3 visi-
tas, Proveedor B, 1 visita, proveedor C, 2 visitas y Proveedor D, ninguna visita.
6. Construya una escala de intervalo para los estudiantes de la UNICAH de la Carrera
de Cirugía Dental, referente a sus edades, debiendo cada intervalo contar con una
dimensión de un año. (Realice una encuesta de 20 estudiantes)
7. Construya una escala ordinal para las posiciones logradas por los cinco hospitales
públicos de Honduras, más destacados de acuerdo a los resultados obtenidos durante
el año 2014. Haga referencia a los hospitales siguientes: Leonardo Martínez de San
Pedro Sula, Hospital Escuela de Tegucigalpa, Hospital Santa Teresa de Comayagua,
Hospital Atlántida en La Ceiba y Hospital de occidente en Santa Rosa de Copán.

2.4  Tablas o cuadros estadísticos


Las tablas o cuadros estadísticos: sirven para representar datos arreglados sistemáticamen-
te en filas y columnas.
Las tablas o cuadros estadísticos se clasifican en:
1. Tablas de propósitos generales;
2. Tablas de propósitos especiales
Introducción a la estadística 13

La tabla de propósitos generales: contiene información de uso general e incluye infor-


mación detallada y amplia.
La tabla de propósitos especiales: proporciona información particularizada, ésta es
breve y simple, lo cual facilita al lector interpretar la información sin mucho esfuerzo.
Partes de una tabla o cuadro estadístico
1. Título; 5. Nota preliminar;
2. Encabezado; 6. Nota de pie;
3. Concepto o columna matriz; 7. Fuente de datos.
4. Cuerpo;
El título: Es la descripción del contenido del cuadro, el cual usualmente indica:
• Qué son los datos;
• Cómo están clasificados los datos;
• Cuándo ocurrieron los datos; y,
• Dónde ocurrieron los datos.
El encabezado: Es el título en la parte superior en cada una de las columnas.
Concepto o columna matriz: Representan las clasificaciones de las cifras incluidas
dentro del cuadro.
Cuerpo: Es el contenido numérico de los datos estadísticos.
Nota Preliminar: Son notas escritas justamente arriba de los encabezados y debajo
del título, las que ayudan e explicar con más detalle ciertos contenidos.
Nota de Pie: Son usadas para clarificar algunas de las partes incluidas en el cuadro o
tabla, que no son explicadas en otras partes del mismo.
Fuente de datos: Estas se escriben debajo de las notas de pie, indican la institución o
empresa a la que pertenece la base de datos.
Ejemplo
Título: Asistencia de pacientes por especialidad en el Centro Médico Hondureño La
Granja durante el último trimestre de 2014
Nota preliminar: No incluye información del área de las emergencias

Encabezado Especialidad No. de pacientes


Medicina General 102
Medicina Interna 132
Urología 141
Otorrinolaringología 104
Neumología 117 Cuerpo
Concepto o Ortopedia 38
columna matriz Ginecología 123
Dermatología 73
Cardiología 234
Gastroenterología 222
Oftalmología 67
Hematología 166
Otras 245
Total 1764

Nota de pie: Sobre algunas especialidades no se contaba con datos para el período en
mención.
Fuente: Sección de Estadística CMH-La Granja
14 CAPÍTULO 2

EJERCICIOS 2.4
1. Los siguientes datos fueron extraídos del Departamento de Estadística del Hospital
San Felipe de Tegucigalpa, los cuales pertenecen a la asistencia del primer trimestre
del año 2012, en donde 502 personas fueron atendidas por medicina interna, 202
hospitalizaciones, 2314 consultas externas, 916 cirugías y 415 en otras especialidades.
Con la información anterior, construya una tabla estadística e identifique sus partes.
2. En el Hospital La Policlínica se tienen los siguientes registros de consulta general
comprendidos para el segundo trimestre del año 20152.N2

Tipo de paciente Cantidad


Niñas 234
Niños 322
Varones adultos 721
Mujeres adultas 935
Total 2212

Construya una tabla o cuadro estadístico e identifique sus partes.


3. Para la siguiente información, por cada inciso elabore un cuadro estadístico:
a) Estudiantes matriculados por carrera, Universidad Católica de Honduras, del pe-
riodo más reciente;
b) Estudiantes de la Carrera de Medicina y Cirugía de la UNICAH, por sexo y edad
(un período);
c) Estudiantes de la Universidad Católica de Honduras, por carrera y sexo que han
asistido a consulta a la enfermería de la UNICAH, Campus Sagrado Corazón de
Jesús, durante el segundo período del año 2015;
d) En el año 2015 los graduados de la UNAH fueron 1005 de los cuales 472 eran
hombres y 533 mujeres. En el área físico-matemático se graduaron 103 hombres y
56 mujeres, en el área económica-administrativa 227 fueron hombres y 124 muje-
res, en el área de las ciencias biológicas y de la salud 101 hombres y 98 mujeres, y
el área de las ciencias sociales 162 fueron hombres y 134 mujeres.

2.5  Medidas de punto: Proporciones, porcentajes y razones


Proporciones: Una proporción ayuda a comparar el número de casos de una categoría f
con el número total de casos de la población, a través de la fórmula siguiente:
f = Frecuencia de una categoría
f
P= ; Donde: N = Total de los casos
N P = Proporción
El valor de la proporción debe estar en el intervalo, o sea 0 ≤ P ≤ 1
Ejemplo:
En un evento sobre medicina tropical participan 121 profesionales de la salud, de los
cuales 70 son hombres.
a) Encuentre la proporción de mujeres en el evento;
b) Encuentre la proporción de hombres en este mismo evento.
Solución:
f 121 − 70 51 f 70
a) P = = = ≅0.42 b)  P = = ≅ 0.58
N 121 121 N 121
Introducción a la estadística 15

Porcentaje: Es la frecuencia de ocurrencia de una categoría por cada 100 casos, lo


que indica que una proporción está expresada en un tanto por ciento del total y se calcula
a través de la fórmula siguiente:
f
P (%) = x100
N
Ejemplo
En un salón de clases, la asignatura de Bioestadística tiene 42 alumnos, de los cuales 20
son mujeres:
a) ¿Qué porcentaje representan las alumnas mujeres?
b) ¿Qué porcentaje representan los alumnos varones?
Solución
f 20 f 22
a) P (%) = x100 = x100 ≅ 47.62% b)  P (%) = x100 = x100 ≅ 52.38%
N 42   N 42

Razón: Una razón compara el número de casos de una categoría f1 con la de otra ca-
tegoría f2 , generalmente expresadas por cada 100, y se calcula a través de la siguiente
fórmula:
f1 f2
R= x100 R= x100
f2 f1
 o 
Ejemplo
En un congreso de enfermería realizado en la zona norte de Honduras, asistieron 20 en-
fermeros y 15 enfermeras.
a) ¿Cuál es la razón de hombres a mujeres?
b) ¿Cuál es la razón de mujeres a hombres?
Solución
Sea f1 el número de enfermeros y sea f2 el número de enfermeras, entonces la razón de
hombres a mujeres está dada por:
f 20
a) R = 1 x100 = x100 ≅133%
f2 15
Significado: Por cada 133 varones hay 100 mujeres.
La razón de mujeres a hombres estará dada por:
f2 15
b) R= x100 = x100 ≅ 75%
f1 20
Significado: Por cada 75 mujeres hay 100 varones.

EJERCICIOS 2.5
1. En un curso de capacitación auspiciado por un organismo internacional, participaron
70 profesionales del área de la salud, de los cuales 42 eran varones.
a) ¿Cuál es el porcentaje de mujeres en éste curso?
b) ¿Cuál es el porcentaje de varones?
c) ¿Cuál es la razón de mujeres a varones?
d) ¿Cuál es la razón de varones a mujeres?
16 CAPÍTULO 2

2. Según un estudio de la Secretaría de Salud, la siguiente distribución representa el


consumo de bebidas alcohólicas y de drogas, por estudiantes universitarios en el año
1993.

Consumo de mariguana Consumo de alcohol Total


Alto Medio Bajo
Alto 32 21 17 70
Medio 18 31 43 92
Bajo 26 18 35 79
Total 76 70 95 241

Calcular:
a) El % de consumidores de marihuana;
b) El % de altos consumidores de alcohol;
a) El % alto de alcohol y marihuana; y
d) El % bajo de consumidores de marihuana y alcohol;
3. En el curso de Anatomía I en la Universidad Católica de Honduras UNICAH, Cam-
pos San Pedro y San Pablo, hay 45 alumnos, de los cuales 20 son varones y 25 mujeres.
a) ¿Cuál es la proporción de varones?
b) ¿Cuál es la proporción de mujeres?
4. Si en un curso de Bioestadística hay 55 alumnos y se sabe que el número de mujeres
es 15 más, que el número de varones.
a) ¿Qué porcentaje representan los varones en éste curso?
b) ¿Qué porcentaje representan las mujeres en éste curso?
5. Si en una conferencia sobre cardiología, el porcentaje de los varones es tres veces el
de las mujeres, ¿Cuál es el número de mujeres y varones en esta conferencia si hay un
total de 40 personas?
6. ¿Cuál es el costo final de un medicamento que está en lista a L Lempiras después de
dar 20% de descuento y aplicarle el 15% de impuesto sobre ventas?
7. El salario de una enfermera del Hospital del Sur es de Lps. 13,000. Después de recibir
un aumento de 12.5% ¿Cuál es el nuevo salario de la enfermera?
8. Si en una de las reuniones mensuales del personal de salud en la zona oriental de
Honduras, se determinó una razón de 110 hombres a 100 mujeres de una población
total de 114 empleados. Determinar el número de empleados varones y mujeres en la
reunión en mención.

2.6 Tasas de cambio, tasa de crecimiento


y proyecciones de población
Tasas de cambio:
Una tasa de cambio: Significa el aumento o disminución de una cantidad ya estableci-
da. En el caso de personas significa el aumento de nuevos pobladores por cada 1000 ha-
bitantes en un período de tiempo, normalmente medido en años.
Número de casos reales
Una tasa se define como Tasa =
Número de casos potenciales
La tasa de cambio puede ser absoluta o relativa, y se calcula por:
TCA = Tasa de cambio absoluta
1. TCA = Pf – Pi Donde: P = Población final
f
Pi = Población inicial
Introducción a la estadística 17

P f − Pi TCR = Tasa de cambio relativa


2. TCR =  Donde: Pf = Población final
Pi
Pi = Población inicial

Ejemplo
En 1997 la población de cierta ciudad fue de 4.5 millones de habitantes y en el año 2007
fue de 4.75 millones de habitantes; calcular para dicho periodo:
a) La Tasa de Cambio Absoluta   b) La Tasa de Cambio Relativa
Solución
a) TCA = Pf – Pi = 4.75 – 4.5 = 0.25 millones de habitantes o sea hubo un crecimiento
de 250,000 nuevos habitantes.
P − Pi 4.75 − 4.5 0.25
b) TCR = f = = ≅ 0.0555 ; significa un crecimiento de 5.55% en los
Pi 4.5 4.5
10 años.

Tasa de cambio promedio anual


Es el promedio de cambio que se da por cada año, calculado a través de:
pf
t =n −1;  Donde: t = tasa de crecimiento promedio anual
pi P f = Población final
Pi = Población inicial
n = diferencia de años en los que ocurrió la Pf y la Pi

Ejemplo
En una pequeña comunidad en 1990 la población era de 65,000 habitantes y en 1996 la
población fue de 71,000 habitantes.
Encontrar la tasa de crecimiento promedio anual en dicho período
Solución
Sea Pf = 71,000; Pi = 65,000; n = 1996 –1990 = 6
Pf 71000
t =n −1 = 6 −1 = 6 1.0923 −1 =1.0148 −1 ≅ 0.0148
Pi 65000
Conclusión: la tasa de crecimiento promedio fue de 1.48%
Proyecciones de población
Cuando en el crecimiento de una población no intervienen factores externos como las
epidemias, desastres naturales, incremento de la migración acelerada, etc., el crecimiento,
estimación o proyección de una población a futuro, puede calcularse por la fórmula:
P(proyectada) = UPC(1 + t)n; Donde:
t = tasa de crecimiento promedio anual
n = Número de años entre el año a proyectar y la última población conocida
UPC =Última población conocida y P(proyectada) = Población proyectada
Ejemplo
En el año de 1999 una pequeña ciudad tenía una población de 150,000 habitantes y en
2009 la población era de 176,000 habitantes; determinar:
a) La tasa de crecimiento anual; b) Proyectar la población de ésta ciudad al año 2020
18 CAPÍTULO 2

Solución: a) Sea Pf = 176000 ; Pi = 150000; n = 2009 – 1999 = 10

Pf 176000
t =n −1 =10 −1 =10 1.1734 −1 =1.016119 −1 ≅ 0.016119
Pi 150000

b) Sea UPC = 176000; t = 0.016119 y n = 2020 – 2009 = 11


P(proyectada)2020 = UPC(1 + t)n = 176000(1 + 0.016119)11 ≅ 209847
La pequeña ciudad en mención, en el año 2020 tendrá una población de alrededor de
209,847 habitantes.
Bajo esta misma intuición matemática, la fórmula de proyección antes mencionada
puede utilizarse para estimar los crecimientos de algunos tipos de bacterias que tienen
patrones especiales para su multiplicación en los organismos y que estos pueden ser des-
critos o estimados mediante fórmulas similares como:
N(t) = N0 ekt o N(t) = N0akt ; donde k es la constante de proporcionalidad, t tiempo
comúnmente medido en minutos, horas, días o semanas, No población inicial de bacterias
y N(t) la población final al cabo de cierto tiempo.
Ejemplo
El número de bacterias presentes en un cultivo después de t horas se da por el modelo
N(t) = N0e0.140t, donde el tiempo t se mide en horas. Si la colonia comenzó con 50 bacte-
rias ¿Cuántas bacterias habrá después de cinco horas?
Solución
N0 = 50 y t = 5 horas; entonces sí N(t) = N0e0.1401t, se tiene que N(5) = (50)e(0.140 1)(5) ≅
100.74
Implica que al cabo de 5 horas se pueden estimar que en el cultivo se tienen unas 100
o 101 bacterias aproximadamente.

EJERCICIOS 2.6
1. La siguiente distribución representa la población afectada por enfermedades tropica-
les en seis países del Continente Americano, en los años de 1980 a 2000.

Pais Años
1980 2000
Brasil 539,025 689,724
Venezuela 132,332 330,009
Guatemala 66,728 92,068
Honduras 43,245 61,536
Mexico 469,300 565,334
Haiti 23,813 39,277
Total 1274443 1777948

Calcular para cada país:


a) La tasa de cambio absoluta; b) La tasa de cambio relativa;
b) La tasa de cambio promedio anual,
c) De continuar este mismo patrón, que cantidad de habitantes padecería la afección
mencionada para el año 2025.
Introducción a la estadística 19

2. En una comunidad de Honduras, la población tiene una tasa promedio de crecimien-


to de 2.1%. Si en 1995 la población era de 3,234 personas, de no cambiar la tasa
promedio, ¿Cuántas personas vivirán en esta comunidad para el año 2025?
3. La población de una colonia de bacterias se incrementa con el modelo matemático
t
de crecimiento N (t ) = N 0 3 20 , (donde t se mide en minutos). ¿Cuánto tiempo tarda la
colonia en crecer de 1000 a 4000 bacterias?
4. El número de bacterias presentes en un cultivo después de t horas se da por el mode-
lo N (t ) = N 0 e 0.368t , donde el tiempo t se mide en horas. Si la colonia comenzó con
200 bacterias, ¿cuántas bacterias habrá después de ocho horas?
5. El número de bacterias existentes en un cultivo después de t horas está dado por
N (t ) = N 0 e kt
a) Encuentre el valor de k, si se sabe que después de dos horas la colonia se ha exten-
dido 1.5 veces su población inicial;
b) Encuentre el tiempo que tarda la colonia de bacterias para duplicar su tamaño.
6. Según el Instituto Nacional de Estadística (INE), en el 2005 la población de Hondu-
ras era de 7197303 de habitantes y en el año 2015 fue de 8894975 habitantes.
a) Calcule la tasa de cambio anual de la población hondureña en el periodo 2005-
2014.
b) Determine la tasa de cambio absoluto y la tasa de cambio relativa.
c) Estime el número de pobladores hondureños a 2040.
7. En un hospital privado del occidente de Honduras, anualmente su masa laboral crece
en 1.5%. Si el hospital en 2012 tenía 70 empleados y de no cambiar el patrón de cre-
cimiento del talento humano. ¿Cuántos empleados tendrán en el hospital en men-
ción, en el año 2027?
8. Si se sabe que en el año 2010 el número total de enfermeras profesionales en la Secre-
taría de Salud, fue de 3724 y que en el año 2003 la tasa de crecimiento absoluto fue
de 160 enfermeras. ¿Cuál era la población inicial?
9. Si en el año 2022 la población afectada por el dengue en Honduras se estima en unas
2300 personas, y se sabe que dicha epidemia desde el año 2013 ha crecido con una
tasa promedio anual de 12%. ¿Qué cantidad de personas padecieron la enfermedad en
mención, en el año 2013?

2.7  Tasas demográficas y poblacionales


Las tasas demográficas y poblacionales en las ciencias biológicas, están relacionadas con
los hechos vitales de personas naturales, y todos aquellos hechos o actos derivados de
éstos.
Se consideran como hechos vitales de una persona natural el nacimiento y la muerte,
y como actos vitales el matrimonio, el divorcio, la adopción, etc.
En el estudio de las ciencias biológicas, podemos apreciar que de los hechos vitales
se derivan diversas tasas e índices demográficos, sobre poblaciones tratadas especialmen-
te de acuerdo al área de su pertenencia.
Las fórmulas siguientes están relacionadas con el cálculo de tasas de natalidad, mor-
talidad, morbilidad, mortalidad infantil, tasas de egresos hospitalarios y de incidencia,
tasas brutas y específicas sobre fecundidad, mortalidad, natalidad; así como diversos índi-
ces y razones, sobre género, crecimiento natural o vegetativo, esperanza de vida, densidad
demográfica y otros.
1. TASA BRUTA DE NATALIDAD
Número total de niños nacidos vivos durante un año
TBN = ×1000
Población total
20 CAPÍTULO 2

2. TASA BRUTA DE MORTALIDAD


Númerode muertes durante un año
TBM = × 1000
Población total
3. TASA ESPECIFICA DE MORTALIDAD
Númerode muertos en un subgrupoespecífico durante un año
TEM = ×1000
Población total en el subgrupo específico
4. TASA DE MORTALIDAD MATERNA
Muertedebidoa las causas puerperales durante un año
TMM = ×1000
Total de nacimiento de niños vivos durate el año
5. TASA DE MORTALIDAD INFANTIL
Número de muertes de niños menores de un año de edad durante un año
TMI = ×1000
Número total de nacimientos de niños vivos durante el año
6. TASA DE MORTALIDAD NEONATAL
Número de muertes de niños menores de 28 días de edad durante un año
TMN = ×1000
Número total de nacimientos de niños vivos durante el año
7. TASA DE MORTALIDAD FETAL
Número total de muertes fetales durate un año
TMF = ×1000
Número total de nacimientodurate el año
8. RAZON DE MORTALIDAD FETAL
Número total de muertes fetales durate un año
RMF = ×1000
Números total de nacimiento de niños vivos al año
9. TASA GENERAL DE FERTILIDAD
Númerode nacimientos de niños nacidos vivos durate un año
TGF = ×1000
Númerode mujeres(15 a 49 años)
10. TASA DE FERTILIDAD ESPECIFICA POR EDADES
Númerode nacimiento para mujeres de cierta edad durate un año
TFEE = ×1000
Número total de mujeres de la edad especificada
11. TASA DE NATALIDAD
Númerode nacimientos en un año
TN = ×1000
Población total
12. TASA DE INCIDENCIA HOSPITALARIA
Númerode nuevos enfermos
TEH = ×100,000
Población en riesgo
13. TASA DE EGRESOS HOSPITALARIOS
Númerode ingresos hospitalarios
TEH = ×100,000
Población en riesgo
14. INDICE DE MASCULINIDAD
Númerode hombres
IM = × 100
Númerode mujeres
Introducción a la estadística 21

15. INDICE DE DEPENDENCIA


Población (menores de 15+65 y más)
ID = ×100
Población (12a 64años)
16. CRECIMIENTO NATURAL O VEGETATIVO
CNV = Nacimiento – Defunciones
17. DENSIDAD DEMOGRÁFICA
Población
DD =
Superficie territorial
18. ESPERANZA DE VIDA AL NACER
Números de años vividos por la población(media aritmética en un año)
EVN =
Número de nacidos vivos durate ese año
En la aplicación de ésta última fórmula (18), se recomienda como más apropiado el
uso de tablas de vida, desarrolladas en el capítulo 8 del presente texto.

EJERCICIOS 2.7
1. La siguiente distribución de frecuencias representa el número de pobladores en una
comunidad de la Región Centroamericana, verificada por rango de edades y muertes
ocurridas durante el año 2012:

Edad (años) Población Muertes


0-5 2500 13
6 - 11 3550 15
12 - 17 4930 14
18 - 23 6080 10
24 - 29 5180 22
30 – 35 4860 19
36 - 41 4670 25
42 - 47 4260 18
48 - 53 3980 17
54 - 59 3600 20
60 - 65 2200 27
66 y más 1050 34
Total 46860 234

Determinar:
a) La tasa bruta de mortalidad;
b) La tasa específica de mortalidad;
c) Tasa especifica de mortalidad para cada uno de los grupos;
2. En el año 2013, las autoridades de la Secretaría de Salud y el Registro Nacional de las
Personas, reportaron los siguientes datos en comunidades de la Región Sur de Hon-
duras, con poca atención sobre medicina preventiva y curativa:
• Población estimada al 1 de julio 601, 200
• Población estimada al 31 de diciembre 627,500
• Total de nacimientos de niños vivos 13,542
• Nacimientos prematuros 1,253
22 CAPÍTULO 2

MUERTES FETALES
• De 20 semanas de gestación 365
• De 20 a 27 semanas de gestación 123
• De más de 28 semanas de gestación 132
• Duración desconocida 12
Total 632
MUERTES
• Total de todas las edades 6,315
• Menos de un año 283
• De menos de 28 días 230
• Muerte por inmadurez 18
• Muertes de madres 3
Con la información anterior, calcular e interpretar los resultados de:
a) Tasa de mortalidad materna;
b) Tasa de mortalidad infantil;
c) Tasa de mortalidad fetal;
d) Tasa bruta de mortalidad anual, y;
e) Tasa bruta de natalidad.
3. En un trabajo demográfico realizado en el año 2002 por la Secretaría de Salud en una
comunidad del norte del país, se obtuvieron los resultados siguientes:
• Población total en la comunidad 45,627 personas;
• Total de niños nacidos vivos durante el año 2002: 13,115;
• Total de mujeres en edad de dar a luz 15,628;
• Niños nacidos vivos en el año 2002 de madres edad de 18 a 35 años, 10,434;
• Total, de mujeres en edad de 18 a 35 años, 12,368.
Determinar:
a) La tasa bruta de natalidad;
b) Tasa general de fertilidad;
c) Tasa de fertilidad especifica por edades.
4. Si en una Ciudad de Honduras, el número de niños nacidos vivos durante el año 2005
fue de 17,524 y la tasa bruta de natalidad en dicha comunidad está estimada en un
0.132% o de 132 por cada 1000, ¿cuál es la población total en ésta pequeña ciudad?
5. La siguiente tabla representa información demográfica de varios años en un país de
África Central:

Niños Mujeres Hombres Muerte Muerte Muerte


Años nacidos vivos adultas Adultos menores mujeres hombres
2008 1501 13245 13100 17 48 54
2009 1603 13425 13201 16 44 65
2010 1870 13658 13405 21 52 59
2011 1968 13900 13888 25 64 62
2012 2017 14115 14117 31 37 47
2013 2175 14444 14222 30 40 51
Total 11134 82787 81933 140 285 338

Determinar:
a) El índice de masculinidad;
b) Tasa de natalidad;
c) El crecimiento vegetativo o natural;
a) Tasa de mortalidad;
Introducción a la estadística 23

b) Tasa de mortalidad infantil;


c) Tasa de mortalidad especifica;
6. En el año 2015 el Hospital Escuela Universitario HEU, registró el ingreso y asistencia
de 27,400 nuevos pacientes. Asimismo, dio de alta (egresaron) 24895 pacientes. La
Secretaría de Salud tiene estimado que por cierto tipo de enfermedades, unos 35,000
pacientes (población en riesgo), podrían visitar por asistencia médica el Hospital
Escuela Universitario HEU.
a) Determinar la tasa de incidencia hospitalaria;
b) La tasa de egresos hospitalarios.
24 CAPÍTULO 2
CAPÍTULO

Ordenamiento y
presentación de datos 3
Contenido

3.1 Representación gráfica de datos


3.1.1 Gráfico o diagrama de barras simples
3.1.2 Gráfico o diagrama de barras
comparativas o agrupadas
3.1.3 Gráfico de barras compuestas o
segmentadas
3.1.4 Gráfico de líneas
3.1.5 Gráfico circular o diagrama de sectores
3.1.6 Pirámides de población
3.1.7 Pictogramas
3.1.8 Mapas
3.2 Distribuciones de frecuencias
3.2.1 Rango
3.2.2 Intervalos de clase y límites de clase
3.2.3 Ancho de clase
3.2.4 Marcas de clase o punto medio
3.2.5 Límites reales de clase
3.2.6 Frecuencia simple, frecuencia
acumulada, frecuencia relativa y
frecuencia relativa acumulada
3.3 Representación gráfica de las distribuciones
de frecuencias
3.3.1 Histograma
3.3.2 Polígono de frecuencias
3.3.3 Ojivas de Galton
26 CAPÍTULO 3

Ordenamiento y presentación de datos


3.1  Representación gráfica de datos
3.1.1 Gráfico o diagrama de barras simples
Son barras paralelas colocadas en forma horizontal o vertical, y que nos permiten efec-
tuar comparaciones entre aspectos más o menos similares.
En la construcción de los gráficos de barras simples debe tenerse en cuenta lo siguiente:
a) Todas las barras o rectángulos deben partir de una línea horizontal llamada Línea
Base.
b) Las barras o rectángulos deben tener el mismo ancho, siendo éste arbitrario. El an-
cho de cada barra dependerá del número de datos a representar.
c) El espacio entre las barras o rectángulos, no debe ser menor que la mitad del ancho
de una barra, ni mayor que el ancho de la misma;

Ejemplo
La siguiente tabla representa el número de pacientes atendidos por día en una clínica
médica en Tegucigalpa.
Construir un gráfico de barras simples

Día Cantidad
Lunes 10
Martes 8
Miércoles 9
Jueves 12
Viernes 10
Sábado 6
Total 55

Solución

Número de pacientes atendidos por día

12
10
8
6
4
2
0
Lunes Martes Miércoles Jueves Viernes Sábado

3.1.2 Gráfico de barras agrupadas o comparativas


La construcción de éste gráfico es similar al de barras simples, la diferencia está en que se
dibujan varias barras para comparar un mismo período de tiempo. La escala en ambas
líneas es la misma para todas las barras. Cada barra en su periodo debe tener su propio
indicador con el objetivo de tener claramente los eventos comparados en un mismo o va-
rios periodos.
Ordenamiento y presentación de datos 27

Ejemplo
El siguiente cuadro representa el número de pacientes internos por año que se atendieron
en hospitales privados en tres ciudades del país.

Año Tegucigalpa S.P.S. La Ceiba Total

2005 300 220  86  606

2006 334 230  92  656

2007 351 255 104  710

Total 985 705 282 1972

Construir un gráfico de barras comparativas

Pacientes internos por año

400
350
300
Tegucigalpa
250
S.P.S
200 La Ceiba
150
100
50
0
2005 2006 2007

Solución

3.1.3 Gráfico de barras compuestas o segmentadas


Este gráfico es muy similar al gráfico de barras comparativas o agrupadas, su diferencia
está en que una misma barra representa un mismo periodo de tiempo para comparar va-
rias categorías.
Ejemplo
La siguiente tabla representa el registro de 195 niños de tres áreas diferentes de una comu-
nidad en el oriente de Honduras, los cuales visitan una clínica odontológica por caries a
temprana edad.

Área
A B C Total
Edad
3-5 14 12 15 41
6-8 28 20 25 73
9 - 11 35 24 22 81
Total 77 56 62 195
28 CAPÍTULO 3

Solución

Niños asistidos en la clinica odontológica Indicadores


90
80 =A
70 22 =B
60 25 =C

50 24
40 20
15
30
20 12 35
10 14 28
0
3a5 6a8 9 a 11
Rango de edad en años

3.1.4 Gráfico de líneas
Este gráfico se emplea en un sistema de ejes cartesianos y puntos en el plano para repre-
sentar un fenómeno estadístico.
Ejemplo
El siguiente cuadro representa dos tipos de enfermedades registradas en las consultas de
un hospital público durante los años 2000, 2001, 2002 y 2003.

Enfermedades Enfermedades
Años respiratorias gastrointestinales
2000 1501 1225
2001 1707 2327
2002 1204 1105
2003 1418 1645
Total 6302

Construir un gráfico de líneas.


Solución

Pacientes atendidos en un hospital por enfermedades


respiratorias y gastrointestinales
2500

2000

Enfermedades
1500
respiratorias

1000 Enfermedades
gastrointestinales
500

0
Ordenamiento y presentación de datos 29

3.1.5 Gráfico circular o diagrama de sectores


Este diagrama ilustra la participación de un conjunto, resaltando la cantidad o porcentaje
que integran cada parte del total de observaciones.
Ejemplo
El siguiente cuadro representa el número de extranjeros que ingresaron al territorio nacio-
nal durante el año 2013, por vía aérea, terrestre y marítima, cumpliendo con los requisitos
sanitarios correspondientes exigidos por el Estado de Honduras. (Construir un gráfico
circular)

Puerto de ingreso Cantidad


Aéreo 362816
Terrestre 1141983
Marítimo   10914
Total 1515713

Fuente: Instituto Nacional de Migración


Solución

Puerto de ingreso Cantidad Porcentaje Grados=(%)(3.6)


Aéreo 362816 23.93%  86
Terrestre 1141983 75.34% 271
Marítima   10914 00.73%   3
Total 1515713 100.00 360

Ingreso de extranjeros a Honduras año 2013


por puerto de entrada y que cumplieron con los requisitos
sanitarios-migratorios de ley

0.73
23.93
23.93
Aéreo

Terrestre
75.34
75.34
Marítima

3.1.6 Pirámides de población
Las poblaciones de los países pueden diferir considerablemente, sin embargo, todas tien-
den a caer dentro de tres perfiles generales de la composición de la población por edad y
sexo.
a) Población expansiva: Es aquella en donde el número de personas en edades menores,
es mayor.
b) Población constrictiva: Es aquella en donde el número de personas en edades meno-
res, es menor.
c) Población estacionaria: Igual número de personas aproximadamente en todos los gru-
pos de edades, con una reducción paulatina en las edades más avanzadas.
30 CAPÍTULO 3

Población expansiva

Población constrictiva

Población estacionaria

3.1.7 Pictogramas
Es un diagrama de figuras que representa dibujos ilustrativos para expresar la magnitud y
el comportamiento de un fenómeno en estudio.
Ordenamiento y presentación de datos 31

Ejemplo:
Crecimiento
Ejemplo: poblacional
Crecimiento en una
poblacional comunidad
en una comunidadde
deHonduras de 2000
Honduras del 2000ala 2005
2005

2000 78,577 habitantes

2001 81,716 habitantes

2002 87,434 habitantes

2003 92,321 habitantes

2004 98,138 habitantes

2005 105,210 habitantes

3.1.8 Mapas
Los mapas estadísticos muestran la variación geográfica de un fenómeno estadístico, refe-
rente al crecimiento o disminución de la población, como también la representación de
actos y hechos vitales vinculados al ser humano, enfermedades en expansión o extinción,
estructuras, avances de proyectos en diversas áreas, y otros. Estas representaciones son
identificadas por áreas sombreadas, punteadas o de líneas finas.

EJERCICIOS 3.1
1. La siguiente tabla representa la población asistida en centros de salud de la Ciudad
de Comayagüela entre los años 2010 a 2013.

Año Número de trabajadores


2010 235
2011 259
2012 216
2013 312
Total 1022
Construya un gráfico de barras simples:
32 CAPÍTULO 3

2. La presente tabla representa la población asegurada por el IHSS, en miles de benefi-


ciarios en Tegucigalpa, San Pedro Sula y otras ciudades, del año 1975 al año 1978.

Año Tegucigalpa S.P.S Otras ciudades Total


1975 149 60 26 235
1976 159 73 27 259
1977 125 75 16 216
1978 219 66 27 312
Total 652 274 96 1022

Construya un gráfico de barras comparativas:


3. La siguiente tabla representa la cantidad de casos de dengue clásico registrados del 1
de enero al 30 de junio de 2012, en Tegucigalpa, San Pedro Sula, Choluteca y Coma-
yagua. Con ésta información construya un diagrama circular.

Ciudad Número de casos dengue clásico


Tegucigalpa 1803
San Pedro Sula 2125
Choluteca 934
Comayagua 655
Total 5517

4. La siguiente tabla representa las afecciones gastrointestinales, respiratorias y enfer-


medades psicosomáticas, producidas en pobladores de Tegucigalpa, San Pedro Sula y
en el interior del país, en el mes de enero del 2008:

Enfermedad
Instestinal Respiratoria Psicosomatica
Ciudad (# Afectados) (# Afectados) (# Afectados) Total
Tegucigalpa 134 98 85 317
San Pedro Sula 210 120 70 400
Otras ciudades 112 60 27 199
Total 456 278 182 916

Construya un gráfico de barras compuestas.


5. La siguiente tabla muestra el número de pacientes por sexo y año, a quienes se les
realizó al menos una cirugía en el Hospital Escuela.

Sexo años Hombres Mujeres Total


2010 108 160 268
2011 119 146 265
2012 134 184 318
2013 145 176 321
2014 166 188 354
Total 672 854 1526

Construya un gráfico de líneas.


Ordenamiento y presentación de datos 33

6. La siguiente distribución de frecuencias representa el número de alumnos de la UNI-


CAH por carrera que participaron en un evento científico.

Carrera Número de participantes


Medicina 80
Odontología 32
Teología 15
Ingenierías (todas) 150
Total 277

Construir un gráfico circular


7. Los siguientes datos corresponden a los alumnos que visitan por enfermedades comu-
nes la clínica de la UNICAH en el Campus Sagrado Corazón de Jesús, durante el mes
de marzo del año 2015.

Alumnos por sexo Cantidad


Varones 116
Mujeres 168
Total 284

Construir un gráfico circular y un gráfico de barras simples.

3.2  Distribuciones de frecuencias o presentación tabular


Definición: Una distribución de frecuencias o presentación tabular, es una tabla o cuadro
estadístico en el cual se representan datos cualitativos o cuantitativos ordenados de mane-
ra sistemática en filas y columnas. Asimismo, los datos representados en la primera co-
lumna se les llama clases y a la segunda columna frecuencias. La frecuencia es el número
de datos que caen dentro de cada clase y las clases son intervalos numéricos dentro los
cuales se encuentran los valores correspondientes del conjunto de datos.
Ejemplo de una distribución de frecuencias agrupada en intervalos

Clases Frecuencia
10 - 21  4
22 - 33  7
34 - 45 10
46 - 57  8
58 - 69  5
Total 34

A las distribuciones de frecuencia se les puede asociar otros factores como los siguientes:

3.2.1 Rango
En una serie de datos, el rango es la diferencia entre el valor máximo y el valor mínimo
del conjunto de datos en estudio.
Rango = Vmax – Vmin
Ejemplo
Sean 2.1, 3.2, 3.2, 3.5, 3.7, 3.9, 4.1, 4.1, 4.3 un conjunto de datos; determinar el rango.
34 CAPÍTULO 3

Solución
Rango = Vmax – Vmin = 4.3 – 2.1 = 2.2, entonces: Rango = 2.2

3.2.2 Intervalos de clase y límites de clase


Mediante la siguiente tabla de datos ordenados, podemos identificar los elementos si-
guientes:

Clase X Datos ordenados Frecuencia


10 - 14 10 11 11 12 13 5
15 - 19 16 16 17 18 19 19 19 7
20 - 24 20 21 21 23 23 24 6
25 - 29 25 25 25 28 29 29 6
30 - 34 31313133343434 7
Total 31

Intervalo de clase: Son los intervalos numéricos de la primera columna.


Límites de clase: Son los valores extremos en cada uno de los intervalos de clase, por
ejemplo, para el intervalo de clase 10 – 14, el número 10 es el límite inferior y el número
14 es el límite superior de dicha clase.

3.2.3 Ancho de clase
Es el tamaño que tiene cada una de las clases, aunque por cuestiones de estandarización
de cálculo, normalmente las clases en una distribución, deben tener el mismo ancho.
El ancho de un intervalo de clase es la diferencia entre dos límites sucesivos, ya sean
éstos inferiores o superiores.
Ejemplo
De la tabla anterior:
Con límites inferiores Con límites superiores
Ancho de clase = 15 – 10 = 5 Ancho de clase = 19 – 14 = 5
Notas:
1. Si los datos no están ordenados y hay que construir la distribución de frecuencias, el
ancho de clase se calcula por:
Rango
Ancho de clase =
No. de clases determinadas
2. Para construir la distribución de frecuencias los datos normalmente se ordenan de
menor a mayor.
3. Generalmente el número de clases deseadas no deben ser menor que 5 ni mayor de
15.
4. Por otra parte, bajo criterios matemáticos el número de clases que tendrá una distri-
bución de frecuencias, puede estimarse con la fórmula o desigualdad:2k ≥ N: donde
N es el número total de observaciones y k un entero para el número de clases a utili-
zar. También puede utilizarse la fórmula opcional conocida como la fórmula de Stur-
ges Número de clases = 1 + (3.3)LogN, donde N es el tamaño del conjunto de datos.
El resultado de Sturges se aproxima al entero inmediato inferior y en la desigualdad
primera (2k ≥ N), al entero inmediato superior.

Ejemplo
Si se cuenta con un conjunto de datos donde el número total de observaciones es 50, en-
tonces, 2k ≥ 50 y resolviendo para k tenemos que el número entero adecuado es k = 6, ya
Ordenamiento y presentación de datos 35

que 2k = 26 = 64 ≥ 50; Si hubiésemos evaluado con k = 5, tendríamos que 25 = 32, pero


32 < 50 y no cumple con las condiciones de la inecuación 2k ≥ N.
Por otra parte, si en la fórmula 2k ≥ N , k es el número de clases a utilizar en la distri-
bución de frecuencias por construir, ésta se puede despejar en la forma siguiente: 2k ≥ n
L n(N ) L n (50 )
2k ≥ n → Ln2k ≥ ln(N) →  K ≥  →  K ≥
Ln2 Ln2
3.912023005
→ K≥ → K ≥ 5.64 ≅ 6 Clases
    0.69314718    
En el caso de la segunda fórmula se tendría Número de clases = 1 + (3.3) Log (50) =
1 + (3.3) Log (50) = 1 + (3.3)(1.69897) = 1 + 5.61 = 6.61 ≅ 6 Clases.

3.2.4 Marca de clase o punto medio


LI + LS
Serepresenta por el símbolo Xm, y se calcula por X m =
2

3.2.5 Límites reales de clase


Son valores numéricos extremos de un intervalo de clase, los que normalmente no son
asumidos por ningún valor de la variable.
Notas:
1. Si los límites inferiores y superiores de clase son valores enteros, para obtener los lí-
mites reales de cada clase, sume 0.5 al límite superior y reste 0.5 al límite inferior;
2. Cuando los límites de clase son decimales, el procedimiento para el cálculo de los lí-
mites reales es el siguiente:
a) Si la posición decimal en el límite inferior, límite superior o ambos límites de la
clase, es un dígito, reste al límite inferior 0.05 y al límite superior súmele 0.05.
b) Si la posición decimal en el límite inferior, límite superior o ambos límites de la
clase, son dos dígitos, reste al límite inferior 0.005 y al límite superior súmele
0.005.
c) Si la posición decimal en el límite inferior, límite superior o ambos límites de la
clase, son tres dígitos, reste al límite inferior 0.0005 y al límite superior súmele
0.0005, y así sucesivamente.
3. Los límites reales deben escribirse en columna diferente;
4. Todo límite real superior de la clase anterior, es igual al límite real inferior de la clase
posterior.

3.2.6 Frecuencia simple o absoluta, frecuencia acumulada, frecuencia


relativa y frecuencia relativa acumulada
a) La frecuencia simple o absoluta representada por f, identifica el número de datos que
caen dentro de cada intervalo de clase.
b) La frecuencia acumulada representada por fa, identificala sumatoria de las observa-
ciones anteriores más las observaciones de la clase seleccionada, y que se acumulan
hasta dicha clase;
f
c) La frecuencia relativa representada y calculada por fr = , representa los valores
relativos en dicha frecuencia; N
fa
d) La frecuencia relativa acumulada, representada y calculada por fra = x100 , nor-
N
malmente representa los porcentajes acumulados de 0 al 100% de los datos.
36 CAPÍTULO 3

Ejemplo 1
El siguiente conjunto de datos representa las edades de 25 ciudadanos que fueron atendi-
dos en servicios de emergencia por accidentes varios, por parte de la Cruz Roja Hondure-
ña en la Ciudad de San Pedro Sula, durante el mes de diciembre de 2015:
13, 14, 10, 15, 15, 16, 17, 17, 10, 21, 21, 11, 12, 13, 12, 22, 18, 18, 18, 23, 19, 19, 23, 20, 14.
1. Ordenar los datos de menor a mayor;
2. Construir una distribución de frecuencias de cinco clases;
3. Calcular f, fa, fr y las fra;
4. Calcular las marcas de clase y límites reales.

Solución
1. 10, 10, 11, 12, 12, 13, 13, 14, 14, 15, 15, 16, 17, 17, 18, 18, 18, 19, 19, 20, 21,21, 22, 23,
23.
2. Primero calcularemos el rango: Rango = Vmax – Vmin = 7.5 – 2.2 = 5.3
3. Luego con 2k ≥ N; si k = 5 y N = 25; entonces: 25 ≥ 25, 32 ≥ 25, implica usar 5 clases
Ln(25) 3.218875825
O K≥ = = 4.62 ≅ 5 clases
Ln2 0.39614718
Por la fórmula de Sturges se tiene K = 1 + 3.3 Log(N) = 1 + (3.3)(Log25) = 1 + (3.3)
(1.39794) = 1 + 4.6 = 5.6 ≅ 6 Clases
Rango 13
4. Ancho de clase = = = 2.6 ≅3
No. de clases 5
Ancho de clase = 3 (el ancho se aproxima de 2.6 a 3 por conveniencia)

Edad de los pacientes f


10 - 12 5
13 - 15 6
16 - 18 6
19 - 21 5
22 - 24 3
Total 25

3 y 4.
a) Frecuencia acumulada fa, sume las observaciones de la clase anterior a la clase si-
guiente (inicia en la clase 0).

Edad de los pacientes f fa


10 - 12 5 5
13 - 15 6 11
16 - 18 6 17
19 - 21 5 22
22 - 24 3 25
Total 25

b) Frecuencia relativa f, calculada por fr = f


N
Ordenamiento y presentación de datos 37

f
Edad de los pacientes f fr =
N
10 - 12 5 0.20
13 - 15 6 0.24
16 - 18 6 0.24
19 - 21 5 0.20
22 - 24 3 0.12
Total N = 25

fa
c) Frecuencia relativa acumulada o porcentaje fra, calculada por fra = x100
N

fa
Edad de los pacientes f fra = x100
N
10 - 12 5 20%
13 - 15 6 44%
16 - 18 6 68%
19 - 21 5 88%
22 - 24 3 100%
Total N = 25

LI + LS
d) Marca de clase o punto medio Xm , calculada por X m =
2

LI + LS
Edad de los pacientes f Xm =
2
10 -12 5 11
13 -15 6 14
16 -18 6 17
19 -21 5 20
22 -24 3 23
Total N = 25

e) Límites reales: Lri y Lrs, recuerde que los límites de clase son valores enteros, por
tanto sume 0.5 a cada límite superior y reste 0.5 a cada límite inferior de clase.

Edad de los pacientes f Límitereal inferior Límite real superior


10 - 12 5 10 – 0.5 = 9.5 12 + 0.5 = 12.5
13 - 15 6 13 – 0.5 = 12.5 15 + 0.5 = 15.5
16 - 18 6 16 – 0.5 = 15.5 18 + 0.5 = 18.5
19 - 21 5 19 – 0.5 = 18.5 21 + 0.5 = 21.5
22 - 24 3 22 – 0.5 = 21.5 24 + 0.5 = 24.5
Total N = 25
38 CAPÍTULO 3

Distribución completa que representa los cálculos anteriores.

Edad de los pacientes f fa fr fra(%) Xm Lri – Lrs


10 - 12 5 5 0.20 20 11 09.5 - 12.5
13 - 15 6 11 0.24 44 14 12.5 - 15.5
16 - 18 6 17 0.24 68 17 15.5 - 18.5
19 - 21 5 22 0.20 88 20 18.5 - 21.5
22 - 24 3 25 0.12 100 23 21.5 - 24.5
Total 25 1.00

Ejemplo 2
Dado el siguiente conjunto de datos:
3.1 3.4 3.4 3.1 2.2 2.5 2.3 7.5 7.3 7.4 7.4 7.2 7.3 7.0
2.3 2.3 4.3 4.2 4.0 3.0 3.2 6.7 6.6 6.8 6.3 6.0 6.0 5.2
5.8 6.4 6.5 3.2 3.7 3.9 6.6
1. Ordenar los datos de menor a mayor;
2. Construir una distribución de frecuencias de cinco clases;
3. Calcularf , fa , fr y las fra;
4. Calcular las marcas de clase y límites reales.
Solución
1. 2.2, 2.3, 2.3, 2.3, 2.5, 3.0, 3.1, 3.1, 3.2, 3.2, 3.4, 3.4, 3.7, 3.9, 4.0, 4.2, 4.3, 5.2, 5.8, 6.0,
6.0, 6.3, 6.4, 6.5, 6.6, 6.6, 6.7, 6.8, 7.0, 7.2, 7.3, 7.3, 7.4, 7.4, 7.5
2. Primero calcularemos el rango: Rango = Vmax – Vmin = 7.5 – 2.2 = 5.3
2k ≥ N; si k = 6 y N = 35; entonces: 26 ≥ 35, 64 ≥ 35, implica usar 6 clases
Rango 5.3
Ancho de clase = = = 0.88 ≅0.9
No. de clases 6
Ancho de clase = 0.9

Clases f
2.2 - 3.0 6
3.1 - 3.9 8
4.0 - 4.8 3
4.9 - 5.7 1
5.8 - 6.6 8
6.7 - 7.5 9
Total 35

3 y 4.
a) Frecuencia acumulada fa, sume las observaciones de la clase anterior a la clase si-
guiente (inicia en la clase 0).

Clases f fa
2.2 - 3.0 6 6
3.1 - 3.9 8 14
4.0 - 4.8 3 17
4.9 - 5.7 1 18
5.8 - 6.6 8 26
6.7 - 7.5 9 35
Total 35
Ordenamiento y presentación de datos 39

f
b) Frecuencia relativa fr, calculada por fr =
N

f
Clases f fr =
N
2.2 - 3.0 6 0.17
3.1 - 3.9 8 0.23
4.0 - 4.8 3 0.08
4.9 - 5.7 1 0.03
5.8 - 6.6 8 0.23
6.7 - 7.5 9 0.26
Total 35

fa
c) Frecuencia relativa acumulada o porcentaje fra, calculada por fra = x100
N

fa
Clases f fra = x100
N
2.2 - 3.0 6 17.14%
3.1 - 3.9 8 40.00%
4.0 - 4.8 3 48.57%
4.9 - 5.7 1 51.43%
5.8 - 6.6 8 74.28%
6.7 - 7.5 9 100.00%
Total 35

LI + LS
d) Marca de clase o punto medio Xm, calculada por X m =
2

LI + LS
Clases f Xm =
2
2.2 - 3.0 6 2.6
3.1 - 3.9 8 3.5
4.0 - 4.8 3 4.4
4.9 - 5.7 1 5.3
5.8 - 6.6 8 6.2
6.7 - 7.5 9 7.1
Total 35

e) Límites reales: Lri y Lrs, recuerde que los límites de clase son valores decimales a una
posición, por tanto, los límites reales se calculan restando a los límites inferiores la
cantidad 0.05 y sumando la misma a los límites superiores.
40 CAPÍTULO 3

Clases f Límitereal inferior Límite real superior


2.2 - 3.0 6 2.2 – 0.05 = 2.15 3.0 + 0.05 = 3.05
3.1 - 3.9 8 3.1 – 0.05 = 3.05 3.9 + 0.05 = 3.95
4.0 - 4.8 3 4.0 – 0.05 = 3.95 4.8 + 0.05 = 4.85
4.9 - 5.7 1 4.9 – 0.05 = 4.85 5.7 + 0.05 = 5.75
5.8 - 6.6 8 5.8 – 0.05 = 5.75 6.6 + 0.05 = 6.65
6.7 - 7.5 9 6.7 – 0.05 = 6.65 7.5 + 0.05 = 7.55
Total N = 35

Resumen cálculos anteriores:

Clases f fa fr fra(%) Xm Lri – Lrs


2.2 - 3.0 6 6 0.17 17.14 2.6 2.15 - 3.05
3.1 - 3.9 8 14 0.23 40.00 3.5 3.05 - 3.95
4.0 - 4.8 3 17 0.08 48.57 4.4 3.95 - 4.85
4.9 - 5.7 1 18 0.03 51.43 5.3 4.85 - 5.75
5.8 - 6.6 8 26 0.23 74.28 6.2 5.75 - 6.65
6.7 - 7.5 9 35 0.26 100.00 7.1 6.65 - 7.55
Total 35 1.00

EJERCICIOS 3.2
1. En cierto hospital de rehabilitación, una investigación sobre destreza manual, abarcó
el tiempo requerido para finalizar cierta tarea entre los pacientes. Los tiempos corres-
pondientes en horas fueron los siguientes:
7.1 7.2 7.2 7.6 7.6 7.6 7.9 8.1 8.1 8.1 8.3
8.3 8.4 8.4 8.9 9.0 9.0 9.1 9.1 9.1 9.1 9.1
9.7 9.8 9.8 9.1 9.2 9.2 9.3 9.3 9.5 8.7 7.7
Construya una distribución de frecuencias con el número de clases adecuadas, y
determine los valores para la frecuencia acumulada, la frecuencia relativa acumulada,
las marcas de clase y límites reales.
2. Los datos de la siguiente distribución de frecuencias, representan los pesos en libras
de los niños recién nacidos en un hospital de la zona sur de Honduras, durante un
período de dos meses.

Peso frecuencia
4.5 - 5.4 5
5.5 - 6.4 10
6.5 - 7.4 28
7.5 - 8.4 32
8.5 - 9.4 16
9.5 - 10.4 4
Total 95
Calcular
a) La frecuencia acumulada,
b) La frecuencia relativa acumulada
c) Las marcas de clase;
d) Los límites reales.
Ordenamiento y presentación de datos 41

3. Si los límites reales en una distribución de frecuencias están dados por:

Límites reales
13.75 - 14.25
14.25 - 14.75
14.75 - 15.25
15.25 - 15.75
15.75 - 16.25
Obtenga los límites de cada clase.
4. Con los siguientes datos adjuntos, construya una distribución de frecuencias utilizan-
do 2k ≥ N o K = 1 + (3.3)log(N) para determinar el número de clases deseadas, luego
calcule la frecuencia simple, la frecuencia acumulada, la frecuencia relativa, la fre-
cuencia relativa acumulada, las marcas de clase y los límites reales.
1.05 1.09 1.07 1.14 1.03 1.07 1.07 1.25 1.33 1.42
1.39 1.37 1.17 1.18 1.22 1.26 1.31 1.35 1.36 1.39
1.30 1.30 1.28 1.19 1.16 1.11 1.11 1.12 1.32 1.13
1.13 1.18 1.20 1.21 1.24 1.26 1.01 1.02 1.06 1.03
1.03 1.41 1.27 1.27 1.14 1.08 1.05 1.08 1.10 1.33
5. Para los siguientes datos, construya una distribución de frecuencias utilizando 2k ≥
para determinar el número de clases deseadas, luego calcule la frecuencia simple, la
frecuencia acumulada, la frecuencia relativa, la frecuencia relativa acumulada, las
marcas de clase y los límites reales.
105 109 107 114 103 107 107 125 133 142
139 137 117 118 122 126 131 135 136 139
130 130 128 119 116 111 111 112 132 113

3.3 Representación gráfica de las distribuciones de frecuencias


3.3.1 Histograma
Es la representación gráfica de los datos de una distribución de frecuencias a través de
rectángulos comúnmente paralelos al eje Y. No obstante, tratándose de un diagrama o
gráfico direccional, las barras pueden estar en dirección vertical u horizontal.

3.3.2 Polígono de frecuencias
El polígono de frecuencias es un gráfico de línea continua que inicia en la marca de clase
cero, pasando por todos los centros superiores de los rectángulos del histograma y termi-
nando en la marca de clase n + 1.
Los gráficos antes mencionados, representan en el eje vertical Y, las frecuencias sim-
ples, y en el eje horizontal X, los límites reales y las marcas de clase.
Ejemplo
Para la siguiente distribución de frecuencias, construya el histograma y polígono de fre-
cuencias.

Clases Frecuencia
1–5 5
6 – 10 12
11 – 15 14
16 – 20 8
21 – 25 4
Total 43
42 CAPÍTULO 3

Solución
Calculando las marcas de clase o punto medio, y los límites reales como se muestra en el
cuadro siguiente:

Marcas de clase Limites reales


3 0.5 – 5.5
8 5.5 – 10.5
13 10.5 – 15.5
18 15.5 – 20.5
23 20.5 – 25.5

Luego resulta la representación gráfica del histograma y polígono de frecuencias, en un


mismo eje coordenado. No obstante, ambos gráficos pueden representarse por separado.

Y
18 Histograma
16
14

12 Polígono
10
8
6
4
2
0 X
0.5 5.5 10.5 15.5 20.5 25.5
límites reales
–2 3 8 13 18 23 28 marcas de clase

3.3.3 Ojivas de Galton
Una ojiva es una representación gráfica de líneas de una distribución de frecuencias acu-
mulada o frecuencias relativas acumuladas, conocidas también como Ojivas de Galton, en
honor al antropólogo, psicólogo, meteorólogo y estadístico británico Sir Francis Galton
(1822-1911).
Componentes de la ojiva
a) Título;
b) Un sistema de ejes coordenados donde el eje Y representa las fa o la fra, según sea el
caso, y el eje X representa los límites reales;
c) Toda ojiva comienza con una frecuencia acumulada (fa) igual a cero, asociada al lími-
te real inferior de la primera clase, y termina con una frecuencia acumulada (fa) de
valor N, asociada al límite superior de la última clase;
d) En el caso de utilizar las fra, la ojiva comienza con una frecuencia relativa acumulada
(fra) igual a cero por ciento, asociada al límite real inferior de la primera clase, y ter-
mina con una frecuencia relativa acumulada (fra) de 100%, asociada al límite superior
de la última clase;

Tipos de ojiva
1. La “Ojiva Menor Que” representa las frecuencias acumuladas (fa) o frecuencias rela-
tivas aculadas (fra), menores que cualquier límite real superior de clase;
Ordenamiento y presentación de datos 43

2. La “Ojiva Mayor Que” representa las frecuencias acumuladas (fa) o frecuencias rela-
tivas aculadas (fra), mayores que cualquier límite real inferior de clase.

Ejemplo
La siguiente distribución de frecuencias representa la estatura en metros de un grupo de 70
estudiantes del doctorado en medicina y cirugía de la Universidad Católica de Honduras.

Estatura Número de estudiantes


1.45 - 1.49 3
1.50 - 1.54 6
1.55 - 1.59 13
1.60 - 1.64 15
1.65 - 1.69 14
1.70 - 1.74 12
1.75 - 1.79 5
1.80 - 1.84 2
Total 70

a) Construir la Ojiva Menor Que;


b) Qué porcentaje de los estudiantes tiene una estatura menor o igual que 1.74 metros;
c) Construir la Ojiva Mayor Que;
d) Qué porcentaje de los estudiantes tiene una estatura mayor o igual a 1.54 metros.
Solución
a) Ojiva Menor Que

Estatura f Lri - Lrs LR fa fra(%)


1.45 - 1.49 3 1.445 - 1.495 < 1.445 0 0.00
1.50 - 1.54 6 1.495 – 1.545 < 1.495 3 4.28
1.55 - 1.59 13 1.545 – 1.595 < 1.545 9 12.86
1.60 - 1.64 15 1.595 – 1.645 < 1.595 22 31.43
1.65 - 1.69 14 1.645 – 1.695 < 1.645 37 52.86
1.70 - 1.74 12 1.695 – 1.745 < 1.695 51 72.86
1.75 - 1.79 5 1.745 – 1.795 < 1.745 63 90.00
1.80 - 1.84 2 1.795 – 1.845 < 1.795 68 97.14
< 1.845 70 100.00

OJIVA MENOR QUE Utilizando las fa


80
70

60

50

40

30

20

10

0
1.445 1.495 1.545 1.595 1.645 1.695 1.745 1.795 1.845
44 CAPÍTULO 3

OJIVA MENOR QUE Utilizando las fra


120

100

80

PORCENTAJE
60

40

20

0
1.445 1.495 1.545 1.595 1.645 1.695 1.745 1.795 1.845

b) El 90% de los estudiantes tienen una estatura inferior o igual a 1.745 metros
c) Ojiva Mayor Que

Estatura f Lri - Lrs LR fa fra(%)


1.45 - 1.49 3 1.445 - 1.495 > 1.445 70 100.00
1.50 - 1.54 6 1.495 – 1.545 > 1.495 67 95.71
1.55 - 1.59 13 1.545 – 1.595 > 1.545 61 87.14
1.60 - 1.64 15 1.595 – 1.645 > 1.595 48 68.57
1.65 - 1.69 14 1.645 – 1.695 > 1.645 33 47.14
1.70 - 1.74 12 1.695 – 1.745 > 1.695 19 27.14
1.75 - 1.79 5 1.745 – 1.795 > 1.745 7 10.00
1.80 - 1.84 2 1.795 – 1.845 > 1.795 2 2.86
> 1.845 0 0.00

OJIVA MAYOR QUE Utilizando las fa


80
70

60

50

40

30

20

10

0
1.445 1.495 1.545 1.595 1.645 1.695 1.745 1.795 1.845
Ordenamiento y presentación de datos 45

OJIVA MAYOR QUE Utilizando las fra


120

100

80
Porcentaje

60

40

20

0
1.445 1.495 1.545 1.595 1.645 1.695 1.745 1.795 1.845

e) El 87.14% de los estudiantes tienen una estatura superior o igual a 1.545 metros.

EJERCICIOS 3.3
1. La siguiente distribución representa el número de pacientes por edad atendidos en el
Hospital Escuela y Materno Infantil, durante el mes de diciembre del año 2008.

Rango de edades Frecuencia


00 - 09 86
10 - 19 115
20 - 29 185
30 - 39 201
40 - 49 207
50 - 59 175
60 - 69 121
70 - 79 92
80 - 89 71
Total 1253
Construir el histograma y polígono de frecuencias;
a) Construir una Ojiva Mayor Que;
b) Construir una Ojiva Mayor Que;
c) Qué porcentaje de los datos están por debajo de 39.5;
e) Qué porcentaje de los datos están por arriba de 19.5.
2. La siguiente distribución representa el número de alumnos de la UNICAH que asis-
tieron a la clínica del Campus Sagrado Corazón de Jesús, durante el primer periodo
del año 2012.

Rango de edades Frecuencia


16 - 18 52
19 - 21 75
22 - 24 95
25 - 27 42
28 - 30 24
Total 288
46 CAPÍTULO 3

a) Construir el histograma y polígono de frecuencias;


b) Construir una Ojiva Mayor Que;
c) Construir una Ojiva Mayor Que;
d) Que porcentaje de los datos están por debajo de 27.5;
e) Que porcentaje de los datos están por arriba de 18.5.
3. Los siguientes datos representan el nivel de temperatura tomada a 30 estudiantes
durante una semana en la Clínica del Campus San Pedro y San Pablo, Universidad
Católica de Honduras.

38.1 39.4 40.1 37.1 37.8 37.6 37.1 37.5 37.0 36.9
37.7 37.7 37.3 37.0 37.0 37.8 37.8 37.9 38.4 38.6
38.0 38.2 38.7 38.9 39.1 39.2 39.3 39.8 38.7 37.7

a) Construir el histograma y polígono de frecuencias;


b) Construir la Ojiva Menor Que; c) Construir la Ojiva Mayor Que;
CAPÍTULO

Medidas de
tendencia central 4
Contenido

4.1 Conceptualización
4.2 La sumatoria o notación sigma
4.3 La media aritmética y su cálculo
4.3.1  Cálculo de la media para datos no
agrupados
4.3.2 Cálculo de la media para agrupados en
frecuencia simple
4.3.3 Cálculo de la media para datos
agrupados en distribución de
frecuencias
4.4 La mediana y su cálculo
4.4.1 Cálculo de la mediana para datos no
agrupados
4.4.2 Cálculo de la mediana para datos
agrupados en frecuencia simple
4.4.3 Cálculo de la mediana para datos
agrupados en distribución de
frecuencias
4.5 La moda y su cálculo
4.5.1 Cálculo de la moda para datos no
agrupados
4.5.2 Cálculo de la moda para datos
agrupados en frecuencia simple
4.5.3 Cálculo de la moda para datos
agrupados en distribución de
frecuencias
4.6 La media aritmética ponderada
4.7 Ventajas y desventajas de las medidas de
tendencia central
4.8 La media geométrica
48 CAPÍTULO 4

Medidas de tendencia central


4.1 Conceptualización
Igual que los promedios, las medidas de tendencia central nos indican el punto medio o
típico de datos que cabe esperar. También reciben el nombre de medidas de localización.
Las siguientes gráficas representan la comparación de la localización central de las
tres curvas.

B C

Los gráficos representados anteriormente, dependiendo de su altura en la gráfica son


contentivas de diferentes nombres y características llamadas curtosis, tema que se desa-
rrollará al final del Capítulo 6 del presente texto, cuando ya el lector pueda calcular medi-
das de dispersión.
Volviendo al tema de las medidas de tendencia central, entre las principales medidas
de tendencia central tenemos:
a) La media aritmética;
b) La mediana;
c) La moda;
d) La media aritmética ponderada;
e) La media geométrica;
f) La media cuadrática;
g) La media armónica.
Dependiendo de la aplicación y el tipo de conjunto de datos en estudio, cada una de
las medidas de tendencia central mencionadas anteriormente, tienen sus aplicaciones,
ventajas y desventajas, y en el presente texto solo desarrollaremos las primeras cinco me-
didas en mención que son las que tienen mayor aplicación en el tema de las ciencias bio-
lógicas, el área de la medicina y el campo de la salud.

4.2  La sumatoria o notación sigma


Con el objeto de apoyar al estudiante o lector del presente texto, es necesario que este se
familiarice con las propiedades y aplicaciones matemáticas de la sumatoria o notación
sigma, ya que ésta se utiliza con frecuencia en estadística.
La notación sigma o notación sumatoria, se representa generalmente por la letra
griega mayúscula ∑ y que es utilizada para representar una suma indicada. Cuando se
recopila gran cantidad de datos en general, a la sumatoria debe agregársele los índices
correspondientes para saber dónde inicia y donde termina la suma indicada.
Propiedades de la sumatoria o notación sigma
n n
1.  ∑X i = X1 + X 2 + X 3 +... + X n 2.  ∑C = Cn ; donde C es una constante.
i =1 i =1
Medidas de tendencia central 49

n n
3. ∑ CX i = C∑X i = C ( X1 + X 2 + X 3 + ... + Xn) donde C es una constante
i=1 i =1

n n n
4. ∑ ( X i ± Yi ) = ( X1 ± Y1 ) + ( X 2 ± Y2 ) + ( X 3 ± Y3 ) + ... + ( X n ± Yn) =∑ xi ±∑yi =
i =1 i=1 i =1

( ) (
x1 + x2 + x3 + ... + xn ± y1 + y2 + y3 + ... + yn )
Ejemplos
Evaluar las siguientes sumatorias:
3
a) ∑7
i =1

Solución a)
3 3
a) ∑7 = (3)(7) = 21 o ∑7 = 7 + 7 + 7 = 21
i =1 i =1
5
b) ∑X i
i =1

Solución b)
5
a) ∑X i = X1 +X 2 + X 3 + X 4 + X 5
i =1
4
b) ∑(1 − i)3−i
i =1

Solución c)
4
c) ∑(1 − i)3−i = (1 −1)3−1 + (1 − 2)3 −2 + (1 −3)3−3 + (1 − 4)3 −4
i =1
= 02 + (−1)1 + (−2)0 + (−3)−1
1 1
= 0 −1 +1 − = − ≅ − 0.33333… .
3 3

EJERCICIOS 4.2
1. Pruebe que:
n
a) ∑C = Cn ; donde C es una constante;
i =1

n
b) ∑X i = X1 + X 2 + X 3 + ... + X n
i =1

n n
c) ∑CX i = C ∑Xi = C ( X1 + X 2 + X 3 + ... + Xn) ; C constante
i=1 i =1
50 CAPÍTULO 4

2. Encuentre el resultado de las siguientes sumatorias:


4
5 10 7 i 2 −1 7
3i + 4 3i 4 − 2
∑( i ) ∑X i
3
∑ ∑
4
a)  −i2 b)  c)  d) 
i =1 i =0 i =1 5 i =1 2i + 1
4 i −i 5 2 i +5
4 3i
10
2 3i 4 + 7 3i 4 − 10 3+ i 5i

3
e) 
∑5  2i +11  f) 
i +13 7i + 4
i =1 i =2

4.3  La media aritmética y su cálculo


La media aritmética como medida de tendencia central señala el centro de un conjunto
de datos en torno a la cual se agrupan todos los elementos de la muestra o población.
Asimismo, hablar de un valor promedio, literal y matemáticamente, es cuando se suman
dos datos y el resultado se divide entre dos; se suman tres datos y el resultado se divide
entre tres, y así sucesivamente hasta sumar n datos, y el resultado se divide entre n.
Normalmente la media aritmética se calcula para tres conjuntos de datos:
a) No agrupados
b) Agrupados en frecuencia simple;
c) Agrupados en distribución de frecuencias
Dependiendo del conjunto de datos, las fórmulas para su determinación varían.

4.3.1 Cálculo de la media aritmética para datos no agrupados


Si los datos provienen de una muestra la media aritmética suele representarse por el sím-
n
x
bolo X , y se calcula por: X = ∑ i
i =1 n
Si los datos son todos los de la población en estudio la media aritmética suele repre-
N
x
sentarse por el símbolo μ y se calcula por µ = ∑ i
i =1 N

Nota:
Generalmente en estadística N sirve para representar el tamaño de una población, y n
para representar el tamaño de la muestra.
Ejemplo
El siguiente conjunto de datos representa las calificaciones en un laboratorio realizado
por estudiantes de la Carrera de Cirugía Dental de la UNICAH:
4, 5, 3, 5, 7, 7, 9, 5, 5, 3, 3, 3, 4, 6, 6, 6, 4, 4, 4, 5
Calcular la nota promedio obtenida por los alumnos en éste laboratorio.
Solución
20
4 + 5 + 3 + 5 + 7 + 7 + 9 + 5 + 5 + 3 + 3 + 3 + 4 ++6+ 6+ 6 + 4 + 4 + 4 + 5
µ = ∑X i =
i =1 20
98
µ= ≅ 4.9
20

4.3.2 Cálculo de la media aritmética para datos agrupados


en frecuencia simple
∑f X ∑ fx
En éste caso se calcula por la fórmula: µ = o X=
N n
Medidas de tendencia central 51

f = frecuencia

Dónde: X = valor del dato o variable
N = número total de observaciones o tamaño de la población
n = número total de observaciones o tamaño de la muestra
Ejemplo
La siguiente distribución de frecuencias simples representa a 129 jóvenes como pacientes
que reciben atención médica especial. Calcular el valor promedio de sus edades.

Años Cantidad (f)


14 12
15 17
16 25
17 30
18 19
19 16
20 10
Total 129

Solución
X f f X
14 12 168
15 17 255
16 25 400
17 30 510
18 19 342
19 16 304
20 10 200

Total 129 ∑ fX = 2179

∑ fX 2179
µ= = =16.89 ≅ 17 años
N 129

4.3.3 Cálculo de la media aritmética para datos agrupados


en distribución de frecuencias
Para datos agrupados en distribuciones de frecuencias, la media aritmética se calcula por:

∑ fX m  o  ∑ f Xm
µ= X=
N n
f = frecuencia
Donde: Xm = Marca de clase o punto medio
N = Tamaño de la población
n = Tamaño de muestra
Ejemplo
La siguiente distribución de frecuencias representa los pesos en kilogramos de 114 paque-
tes que serán enviados por la Secretaría de Salud, de Tegucigalpa a la Ciudad San Pedro
Sula. Calcular el peso promedio de dichos paquetes.
52 CAPÍTULO 4

X f
10.0 – 10.9 2
11.0 – 11.9 8
12.0 – 12.9 12
13.0 – 13.9 16
14.0 – 14.9 24
15.0 – 15.9 22
16.0 – 16.9 16
17.0 – 17.9 14
Total 114

Solución

X f Xm f Xm
10.0 – 10.9 2 10.45 20.9
11.0 – 11.9 8 11.45 91.6
12.0 – 12.9 12 12.45 149.4
13.0 – 13.9 16 13.45 215.2
14.0 – 14.9 24 14.45 346.8
15.0 – 15.9 22 15.45 339.9
16.0 – 16.9 16 16.45 263.2
17.0 – 17.9 14 17.45 244.3
Total 114 1671.3

∑ f Xm 1671.3
µ= = ≅14.66 Kilogramos
N 114

EJERCICIOS 4.3
1. Para los siguientes conjuntos de datos no agrupados, calcule la media.
a) 1.1 1.2 1.7 2.3 2.7 2.6 1.2 2.5 1.4 2.4 2.6 2.8 2.3 1.8 1.5 1.1 1.8
2.2 2.8 2.3 2.2 2.4 2.0 1.3
b) 10 15 18 16 13 14 13 15 11 17 18 16 10 10
1 3 5 7 5 3 3 1 3 5 5 1 7 5
c) , , , , , , , , , , , , ,
2 2 2 2 2 2 2 2 2 2 2 2 2 2

2. Se seleccionó un curso de Álgebra Elemental (MT-101) de la Universidad Católica de


Honduras, y se registraron sus edades de la manera siguiente:

2 0 7 18 17 18 18 18 18 19 21 19 19 17 17 18 22 20 1
7 17 17 18 19 16 23 19 18 17 18 18 17
Calcular la edad promedio de los alumnos en esta clase.
Medidas de tendencia central 53

3. Dadas las siguientes tablas de frecuencias simples, calcular la media.


a) X f b) X f
1.004 7 13.15 8
1.005 6 15.15 10
1.006 10 17.15 15
1.007 9 19.15 17
1.008 8 21.15 14
1.009 5 25.15 12
27.15 9
Total 45 Total 85
4. La siguiente tabla representa el peso de 30 niños nacidos en la Aldea de Moramulca,
Municipio de San Isidro Choluteca, durante el primer semestre del año 2014.
Peso en libras f
6.5 3
7.5 7
8.5 10
9.5 5
10.5 4
11.0 1
Total 30
Calcule el peso medio de estos recién nacidos.
5. La siguiente tabla representa las edades de 77 estudiantes de la Carrera de Cirugía
Dental de la UNICAH.
Edad Frecuencia (f)
16 2
17 12
18 14
19 13
20 10
21 7
22 6
23 5
24 5
25 3
Total 77
Calcule la edad promedio de estos estudiantes;
6. Para las siguientes distribuciones de frecuencias, determinar la media.
a) X f b) X f
10.01 – 11.00 10 10.1 – 11.3 2
11.01 – 12.00 12 11.4 – 12.6 8
12.01 – 13.00 13 12.7 – 13.9 7
13.01 – 14.00 13 14.0 – 15.2 6
14.01 – 15.00 11 15.3 – 16.5 5
15.01 – 16.00 9 16.6 – 17.8 5
17.9 – 19.1 4
19.2 – 20.4 3
Total 68 Total 40
54 CAPÍTULO 4

7. La siguiente tabla representa las edades y números de reclamos por mala atención en
los servicios médicos a los beneficiarios del IHSS, durante el mes de enero del año 2014;

Edades frecuencia
18 - 25 12
26 - 33 15
34 - 41 22
42 - 49 29
50 - 57 35
58 - 65 40
66 - 73 26
74 - 81 9
Total 188
Calcular la media.
8. Los siguientes datos muestran el nivel de contaminación en una empresa manufactu-
rera en la zona norte de Honduras.

Nivel de contaminación frecuencia


20.5 - 30.0 5
30.1 - 39.6 8
39.7 - 49.2 13
49.3 - 58.8 7
58.9 - 68.4 6
Total 39
Calcular el nivel promedio de contaminación.
9. Los siguientes datos representan el número de trabajadores por edad, atendidos por
accidentes laborales en un hospital público, durante un año.

Edad Frecuencia (f )
18 - 22 5
23 - 27 12
28 - 32 15
33 - 37 18
38 - 42 24
43 - 47 24
48 - 52 22
53 - 57 20
58 - 62 27
63 - 67 28
68 - 72 34
73 - 77 13
78 - 82 6
Total 248
Calcular la edad promedio de estos pacientes.

4.4  La mediana y su cálculo


La mediana, es una medida de tendencia central que, en un conjunto de datos, ordenados
normalmente de menor a mayor, representa el dato centro, o sea, separa al conjunto de
datos ordenados 50% por debajo de ella y 50% por arriba de la misma.
Medidas de tendencia central 55

La mediana generalmente es representada por el símbolo Me, y dependiendo del tipo


de datos a utilizar se requiere de procesos o fórmulas diferentes, como a continuación se
procede.

4.4.1 Cálculo de la mediana para datos no agrupados


1. Ordene el conjunto de datos de menor a mayor;
2. Si el número de datos de la población o muestra es impar, entonces la mediana será
el dato centro;
3. Si el número de datos de la población o muestra es par, entonces la mediana será la
media aritmética de los dos datos centros.
Ejemplo 1
Dado el siguiente conjunto de datos:
10, 16, 11, 10, 16, 21, 18, 12, 13; calcular la mediana.
Solución
Ordenando los datos de menor a mayor tenemos:
10, 10, 11, 12, 13, 16, 16, 18, 21
Como el número de datos es impar, entonces por definición: Me = 13
Ejemplo 2
Dado el siguiente conjunto de datos:
5.2, 4.5, 6.5, 6.7, 5.9, 5.7, 7.1, 7.1, 6.3, 6.6; calcular la mediana
Solución
Ordenando el conjunto de datos tenemos:
4.5, 5.2, 5.7, 5.9, 6.3, 6.5, 6.6, 6.7, 7.1, 7.1
Como el número de datos es par, por definición la mediana será el valor de la media
aritmética de los dos datos o valores centros, y que en éste caso son: 6.3 y 6.5, entonces:
6.3 + 6.5 12.8
Me = = = 6.4
2 2
4.4.2 Cálculo de la mediana para datos agrupados en frecuencia simple
En éste caso, la mediana se calcula bajo los siguientes criterios:
n +1
• Primero se calcula la posición a través de la fórmula P =
2
Dónde: P = posición y n = número total de observaciones
• Conocida la posición a través de la columna de las frecuencias acumuladas (fa), se
selecciona el valor de la variable (X).
Ejemplo
La siguiente distribución de frecuencias simple, representa el número de personas de una
pequeña comunidad de Honduras, y el número de veces que fueron afectados por la gripe
durante un año. Determine la mediana para éste conjunto de datos.
Cantidad Frecuencia
Personas (x) (Gripe en un año)
10 9
13 8
15 7
16 5
18 4
20 3
Total 36
56 CAPÍTULO 4

Solución

X f fa n +1 35 +1 36
P= = = = 18
10 9 9 2 2 2
13 8 17
15 6 23 Renglón mediano
16 5 28
18 4 32
20 3 35
Total 35

Como el valor de la posición indica que la observación número 18 se encuentra en el
tercer renglón, entonces Me = 15

4.4.3 Cálculo de la mediana para datos agrupados


en distribución de frecuencias
En distribuciones de frecuencias, la mediana se calcula por la fórmula siguiente:

N
− (∑f )1
M e = LriMe + 2 xC ;
f Me

LriMe = Límite real inferior mediano


( )
∑ f 1 = Frecuencia acumulada hasta el intervalo anterior al intervalo mediano
Donde: fMe = Frecuencia absoluta del intervalo mediano
C = Ancho del intervalo mediano
N = Número total de observaciones

Ejemplo
La siguiente distribución de frecuencias, representa los reclamos por seguros de acciden-
tes, hechos a una compañía aseguradora durante el mes de enero de 2013. Calcular la
mediana para éste conjunto de datos.

X Frecuencia
10 - 15 12
16 - 21 8
22 - 27 14
28 - 33 25
34 - 39 11
40 - 45 30
46 - 51 12
52 - 57 8
58 - 63 4
Total 124
Medidas de tendencia central 57

Solución

X f fa Lri – Lrs
10 - 15 12 12
16 - 21 8 20
22 - 27 14 34
28 - 33 25 59
Intervalo Mediano 34 - 39 11 70 33.5
40 - 45 30 100
46 - 51 12 112
52 - 57 8 120
58 - 63 4 124
Total 124
n +1 124 +1
Calculando p = tenemos que p = = 62.5 , se puede ver que el valor que
2 2
constituirá la mediana se encuentra entre los datos que ocupan la posición 62 y 63, y que
se encuentran en la quinta clase o el intervalo de clase formado por 34 - 39, a éste renglón
o fila es el que llamaremos, nuestro intervalo mediano.
N
− (∑f )1 62 − 59
Como: M e = LriMe + 2 xC = 33.5 + x6 = 35
f Me 11

EJERCICIOS 4.4
1. Para los siguientes conjuntos de datos no agrupados, calcular la mediana.
a) 1.1 1.2 1.7 2.3 2.7 2.6 1.2 2.5 1.4 2.4 2.6 2.8 2.3 1.8 1.5 1.1 1.8
2.2 2.8 2.3 2.2 2.4 2.0 1.3
b) 10 15 18 16 13 14 13 15 11 17 18 16 10 10
1 3 5 7 5 3 3 1 3 5 5 1 7 5
c) , , , , , , , , , , , , ,
2 2 2 2 2 2 2 2 2 2 2 2 2 2
2. Se seleccionó un curso de Anatomía de la Universidad Católica de Honduras, y se
registraron sus edades, de la manera siguiente:
2 0 17 18 17 18 18 18 18 19 21 19 19 17 17 18 22 20 17 17 17
18 19 16 23 19 18 17 18 18 17
Calcular la mediana para estos datos.
3. Dadas las siguientes tablas de frecuencias simples, calcular la mediana.

a) X f b) X f
1.004 7 13.15 8
1.005 6 15.15 10
1.006 10 17.15 15
1.007 9 19.15 17
1.008 8 21.15 14
1.009 5 25.15 12
27.15 9
Total 45 Total 85
58 CAPÍTULO 4

4. La siguiente tabla representa el peso de 30 niños nacidos en una aldea de Honduras,


durante el mes de febrero del año 2007.

Peso en libras f
6.5 3
7.5 7
8.5 10
9.5 5
10.5 4
11.0 1
Total 30

Calcule la mediana.
5. La siguiente tabla representa las edades de 77 estudiantes de la carrera de Relaciones
Internacionales de la UNICAH.

Edad Frecuencia (f)


16 2
17 12
18 14
19 13
20 10
21 7
22 6
23 5
24 5
25 3
Total 77

Calcule la mediana.
6. Para las siguientes distribuciones de frecuencias, determinar la mediana.

a) X f b) X f
10.01 – 11.00 10 10.1 – 11.3 2
11.01 – 12.00 12 11.4 – 12.6 8
12.01 – 13.00 13 12.7 – 13.9 7
13.01 – 14.00 13 14.0 – 15.2 6
14.01 – 15.00 11 15.3 – 16.5 5
15.01 – 16.00 9 16.6 - 17.8 5
17.9 – 19.1 4
19.2 – 20.4 3
Total 68 Total 40

7. La siguiente tabla representa las edades y números de reclamos por mala atención en
los servicios médicos, a los beneficiarios del IHSS durante el mes de enero del año
2014.
Medidas de tendencia central 59

Edades Frecuencia
18 - 25 12
26 - 33 15
34 - 41 22
42 - 49 29
50 - 57 35
58 - 65 40
66 - 73 26
74 - 81 9
Total 188
Calcular la mediana
8. Los siguientes datos muestran el nivel de contaminación en una empresa maquiladora.

Nivel de contaminación Frecuencia


20.5 - 30.0 5
30.1 - 39.6 8
39.7 - 49.2 13
49.3 - 58.8 7
58.9 - 68.4 6
Total 39
Calcular la mediana.
9. Los datos siguientes representan el número de trabajadores por edad atendidos du-
rante un año en un hospital público, por accidentes laborales.
Edad Frecuencia (f )
18 - 22 5
23 - 27 12
28 - 32 15
33 - 37 18
38 - 42 24
43 - 47 24
48 - 52 22
53 - 57 20
58 - 62 27
63 - 67 28
68 - 72 34
73 - 77 13
78 - 82 6
Total 248
Calcular la mediana.

4.5  La moda y su cálculo


En un conjunto de datos, la moda es el dato o valor que ocurre con mayor número de ve-
ces o frecuencias.
La moda generalmente es representada por Mo
Notas importantes:
1. En un conjunto de datos la moda no es única;
2. Si el conjunto de datos solo tiene una moda se le llama unimodal, dos modas bimo-
dal, tres modas trimodal, etc.
60 CAPÍTULO 4

3. Los datos deben ser ordenados de menor a mayor, para leerlos mejor;
4. Muchas veces hay conjuntos de datos que no tienen moda;
5. En el caso de conjunto de datos multimodales, las modas deben repetirse el mismo
número de veces.

4.5.1 Cálculo de la moda para datos no agrupados


Ejemplo
Para los siguientes conjuntos de datos, determine la moda:
a) 2, 3, 5, 7, 7, 7, 2, 6, 6, 3,
Solución
Ordenando los datos tenemos:
2, 2, 3, 3, 5, 6, 6, 7, 7, 7, :: Mo = 7
b) 9, 7, 6, 5, 3, 2, 1
Solución
Ordenando el conjunto de datos, tenemos:
1, 2, 3, 5, 6, 7, 9,
El conjunto de datos carece de moda.
c) 7, 6, 6, 6, 10, 10, 10, 8, 8, 9
Solución
Ordenando el conjunto de datos, tenemos:
6, 6, 6, 7, 8, 8, 9, 10, 10, 10,
El conjunto de datos es bimodal, entonces:
Mo = 6 y Mo = 10

4.5.2 Cálculo de la moda para datos agrupados en frecuencia simple


Para este tipo de datos ordenados en frecuencia simple, la moda se determina seleccio-
nando el valor de la variable que tiene mayor frecuencia.

Ejemplo
Dada la siguiente distribución de frecuencias simples, calcular la moda.

X f
13 2
15 6
17 11
19 12
21 8
25 9
27 4
Total 52

Solución
En la distribución se puede observar que el valor o dato 19, es el que más se ha repetido,
entonces: Mo = 19
Medidas de tendencia central 61

4.5.3 Cálculo de la moda para datos agrupados


en distribución de frecuencia
En distribuciones de frecuencias, la moda se calcula por la fórmula siguiente:
d1
M o = LriM + xC ;
o d1 + d2

LriM = Límite real inferior modal


o
d1 = Frecuencia del intervalo modal menos la frecuencia del intervalo anterior
Donde:
d2 = Frecuencia del intervalo modal menos la fecuencia del intervalo posterior
C = Ancho del intervalo modal
Nota:
Antes de aplicar la fórmula, la manera correcta de seleccionar el intervalo modal es iden-
tificando la frecuencia con mayor número de observaciones en la distribución.
Ejemplo
Las edades de los médicos del Hospital San Felipe, están descritas mediante la siguiente
distribución de frecuencias. Determine la moda de las edades de los médicos del Hospital
San Felipe.

Edades Cantidad
23 - 27 14
28 - 32 17
33 - 37 24
38 - 42 26
43 - 47 21
48 - 52 28
53 - 57 17
58 - 62 9
63 - 67 5
68 - 72 3
Total 164
Solución
Edades f Lri - Lrs
23 - 27 14
28 - 32 17
33 - 37 24
38 - 42 26
43 - 47 21
48 - 52 28 47.5
53 - 57 17
58 - 62 9
63 - 67 5
68 - 72 3
Total 164

Se puede ver que la sexta clase es la que tiene mayor frecuencia, por tanto, este ren-
glón o fila, será nuestro intervalo modal, luego se tiene que:
d1 7
M o = LriMo + xC = 47.5 + x5 = 49.44 Años
d1 + d2 7 +11
62 CAPÍTULO 4

EJERCICIOS 4.5
1. Para los siguientes conjuntos de datos no agrupados, calcule la moda.

a) 1.1 1.2 1.7 2.3 2.7 2.6 1.2 2.5 1.4 2.4 2.6 2.8 2.3 1.8 1.5 1.1 1.8
2.2 2.8 2.3 2.2 2.4 2.0 1.3
b) 10 15 18 16 13 14 13 15 11 17 18 16 10 10

1 3 5 7 3 3 1 3 5 5 1 7 5
c) , , , , , , , , , , , ,
2 2 2 2 2 2 2 2 2 2 2 2 2

2. Se seleccionó un curso de Bioestadística en la Universidad Católica de Honduras, y


se registraron sus edades de la manera siguiente:
2 0 17 18 17 18 18 18 18 19 21 19 19 17 17 18 22 20 17 17 17
18 19 16 23 19 18 17 18 18 17
Calcular la moda en estos datos.
3. Dadas las siguientes tablas de frecuencias simples, calcular la moda.

a) X f b) X f
1.004 7 13.15 8
1.005 6 15.15 10
1.006 10 17.15 15
1.007 9 19.15 17
1.008 8 21.15 14
1.009 5 25.15 12
27.15 9
Total 45 Total 85

4. La siguiente tabla representa el peso de 30 niños nacidos en una aldea de Honduras


durante el mes de febrero del año 2007. Calcular la moda.

Peso en libras f
6.5 3
7.5 7
8.5 10
9.5 5
10.5 4
11.0 1
Total 30

5. La siguiente tabla representa la edad de 77 estudiantes de la carrera de Medicina y


Cirugía, en la UNICAH.
Medidas de tendencia central 63

Edad Frecuencia (f)


16 2
17 12
18 14
19 13
20 10
21 7
22 6
23 5
24 5
25 3
Total 77
Calcule la moda.
6. Para las siguientes distribuciones de frecuencias, determinar la moda.

a) X f b) X f
10.01 – 11.00 10 10.1 – 11.3 2
11.01 – 12.00 12 11.4 – 12.6 8
12.01 – 13.00 13 12.7 – 13.9 7
13.01 – 14.00 13 14.0 – 15.2 6
14.01 – 15.00 11 15.3 – 16.5 5
15.01 – 16.00 9 16.6 - 17.8 5
17.9 – 19.1 4
19.2 – 20.4 3
Total 68 Total 40
7. La siguiente tabla representa las edades y números de reclamos por mala atención en
los servicios médicos a los beneficiarios del IHSS, durante el mes de enero del año 2014;
Edades frecuencia
18 - 25 12
26 - 33 15
34 - 41 22
42 - 49 29
50 - 57 35
58 - 65 40
66 - 73 26
74 - 81 9
Total 188
Calcular la moda.
8. Los siguientes datos muestran el nivel de contaminación en una empresa maquiladora.

Nivel de contaminación frecuencia


20.5 - 30.0 5
30.1 - 39.6 8
39.7 - 49.2 13
49.3 - 58.8 7
58.9 - 68.4 6
Total 39
Calcular la moda.
64 CAPÍTULO 4

9. Los siguientes datos representan el número de trabajadores por edad, atendidos en un


hospital público, por accidentes laborales durante un año.

Edad Frecuencia (f )
18 - 22 5
23 - 27 12
28 - 32 15
33 - 37 18
38 - 42 24
43 - 47 24
48 - 52 22
53 - 57 20
58 - 62 27
63 - 67 28
68 - 72 34
73 - 77 13
78 - 82 6
Total 248
Calcular la moda.

4.6  La media aritmética ponderada


Cuando los valores de las variables X1; X 2 ; X 3 ; X 4 ;...; X n de una población o muestra
están asociados a factores denominados pesos w1 ; w2 ; w3 ; w4 ;...; wn , la media aritmética
n
∑X iWi
i =1
ponderada se calcula por XW = n
∑Wi
i =1

Ejemplo
Jaime Rivera, estudiante de la carrera de Medicina y Cirugía de la Universidad Católica
de Honduras, en el segundo periodo del 2010, cursó las asignaturas de Bioestadística,
Anatomía I, Física Médica y Química Orgánica, habiendo aprobado las clases antes men-
cionadas con los promedios de 84, 96, 93 y 87, respectivamente. Dichas asignaturas por
su orden tienen 4, 4, 4 y 3 unidades valorativas o créditos. Calcular el rendimiento prome-
dio del estudiante Jaime Rivera.

Solución
n
∑X iWi (84)(4) + (96)(4) + (93)(4) + (87)(3) 336 + 384 +372 +261 1353 ≅
i =1
XW = n = = = 90.2%
4 + 4 + 4 +3 15 15
∑Wi
n i =1

∑X iWi (84)(4) + (96)(4) + (93)(4) + (87)(3) 336 + 384 +372 +261 1353 ≅
i =1
XW = n = = = 90.2%
4 + 4 + 4 +3 15 15
∑Wi
i =1 El rendimiento promedio ponderado del estudiante Jaime Rivera en el segundo perio-
do de 2010, fue de 90.2%
Medidas de tendencia central 65

EJERCICIOS 4.6
1. Un hospital de especialidades ha decidido vacunar contra una epidemia, a todos los
pobladores de una localidad afectada por dicha enfermedad. Los médicos deciden
que de 0 a 10 años se apliquen 3 dosis con 80% del componente A, de 11 a 20 años,
4 dosis con 85% del componente A, de 21 a 30 años 5 dosis con el 88% del compo-
nente A, de 31 a 50 años 6 dosis con 90% del componente A, y 51 años y más 7 dosis
con 95% del componente A. Calcule el promedio ponderado del medicamento tipo A
que fue aplicado a los pobladores de ésta comunidad.
2. Un estudiante de la UNICAH, construye una tabla de su rendimiento académico en
el segundo periodo del 2013 de la manera siguiente:

Asignatura Créditos Nota final


Estadística II 4 82%
Administración I 3 73%
Contabilidad II 3 76%
Administración de Recursos Humanos 3 91%
Control de la Calidad 3 87%
Calcular el nivel promedio ponderado de rendimiento para este estudiante.
3. Los paquetes que llegan al almacén de un hospital público, tienen una relación en
peso y volumen, de la manera siguiente:

Tipo de paquete Volumen Peso en Kilos


A 200 cm3 5
B 250 cm3 10
C 300 cm3 15
D 350 cm3 20

a) Determine el volumen promedio ponderado de los paquetes;


b) Determine el peso promedio ponderado de los paquetes.
4. Una empresa televisora tiene 6 spots publicitarios de los más solicitados en el área de
salud preventiva, y se informa que estos anuncios fueron vistos por el público en un
determinado mes de la manera siguiente:

No. de veces que la población


vio el anuncio en el mes Frecuencia
0 897
1 1082
2 1325
3 814
4 307
5 253
6 198
Total 4876
¿Cuál es el número promedio ponderado de veces que un espectador vio uno de los
anuncios en la empresa televisora?
66 CAPÍTULO 4

4.7  Ventajas y desventajas de la media, mediana y moda


a) Ventajas y desventajas de la media aritmética
Ventajas:
1. El concepto de media o promedio casi es conocido por todos;
2. Todo conjunto de datos posee una sola media;
3. Puede ser comparada para varios conjuntos de datos;
4. Para calcularla no se necesita ordenar los datos;
5. El uso de la media es restringido exclusivamente a datos por intervalo;
6. Es una medida de mayor facilidad en su aplicación a fenómenos estadísticos;
7. Es una medida confiable.

Desventajas:
1. La media es afectada por valores extremos, ya sean éstos datos muy grandes o muy
pequeños;
2. Su cálculo es tedioso, debido a que se deben utilizar todos los datos;
3. La media no se puede calcular para datos que están contenidos en clases abiertas en
los extremos de una distribución.

b) Ventajas y desventajas de la mediana


Ventajas:
1. Los valores extremos no le afectan tanto como a la media;
2. Puede ser calculada inclusive para distribuciones que contienen clases abiertas en sus
extremos;
3. Puede ser utilizada como una localización central en datos cuantitativos y cualitati-
vos.

Desventajas:
1. No se puede calcular para datos nominales;
2. Sus utilizaciones en procesos estadísticos son más complejos que el uso de la media;
3. Para calcularla es obligatorio ordenar el conjunto de datos.

c) Ventajas y desventajas de la moda


Ventajas:
1. La moda puede utilizarse a semejanza de la mediana, como una localización central
en datos cualitativos y cuantitativos;
2. No le afectan los valores extremos;
3. Puede utilizarse sin importar la dispersión o magnitud de los valores de la distribu-
ción;
4. Se puede emplear cuando hay clases abiertas.

Desventajas:
1. Se usa menos que la media y la mediana, como una medida de localización central;
2. Es una medida infructuosa cuando no existe en un conjunto de datos o que todos los
valores sean la moda;
3. Cuando el conjunto de datos es multimodal, la moda no es de mucha utilidad para
comparación o interpretación de los mismos.
Medidas de tendencia central 67

4.8  La Media Geométrica


Esta medida es utilizada para mostrar la medida precisa de un cambio porcentual prome-
dio en una serie de números positivos. La media geométrica tiene una amplia aplicación
en varias disciplinas, sin embargo, en este texto nos interesaremos por la aplicación de
problemas relacionados con las ciencias biológicas.
La media geométrica es la raíz enésima del producto de n cantidades o números que
asume la variable, y se calcula mediante la siguiente fórmula:
MG = n X1 X 2 X 3 ... X n

Ejemplo
El director de un programa sobre salud pública en Honduras, desea determinar la tasa de
crecimiento porcentual promedio del número de pacientes en la zona norte del país. El
profesional de la medicina cuenta con los registros de los años 1992 a 1996, de acuerdo a
la siguiente tabla.

Año Nuevos pacientes


1992 50104
1993 55203
1994 66734
1995 60477
1996 78624
Total 311142
Determinar:
a) La media geométrica;    b) Tasa de crecimiento porcentual promedio
Solución inciso a)
Año Nuevos pacientes Razón año anterior
1992 50104 —
1993 55203 55203/50104 = 1.10
1994 66734 66734/55203 = 1.21
1995 60477 60477/66734 = 0.91
1996 78624 78624/60477 = 1.30
Total 311142

MG = 4 (1.10)(1.21)(0.91)(1.30) = 4 1.574573 ≅ 1.120187443

Solución inciso b)
La tasa de crecimiento porcentual promedio está dada por:
TCPP = (MG – 1) × 100 = (1.120187443 – 1)(100) ≅ 12.02%: TCPP = 12.02%
Nota: Si hubiésemos calculado la tasa de crecimiento porcentual promedio mediante la
media aritmética tendríamos:

1.10 + 1.21+ 0.91+ 1.30 4.52


X= = = 1.13
4 4

Ahora la TCPP = (la media – 1) (100) = (1.13 – 1) (100) = 13%, este resultado es
mayor que 12.02% calculado anteriormente, por lo que en éstos casos es más recomenda-
ble utilizar la media geométrica, dado que ésta medida representa con mayor exactitud el
cambio promedio con el tiempo.
68 CAPÍTULO 4

EJERCICIOS 4.8
1. Un administrador de una cadena de clínicas privadas, ha registrado los siguientes in-
crementos porcentuales en la demanda de nuevos productos fabricados, durante los
últimos 5 años.
2010 2011 2012 2013 2014

5% 10.5% 9.0% 6.0% 7.5%


¿Cuál es el incremento porcentual promedio durante este periodo?
2. Juan Navarro, médico pediatra de una clínica de maternidad en la capital de la repú-
blica, está calculando el factor de crecimiento promedio del nacimiento de niños en
los últimos 6 años. Por medio de la media geométrica encuentra una respuesta de
1.24. Los factores individuales de crecimiento en el nacimiento de niños registrados
en la cínica en mención, fueron de 1.19, 1.35, 1.19 y 1.30, pero el Doctor Navarro
perdió los registros del sexto año luego de haber calculado la media. ¿Cuál fue el
factor de ese año?
3. El Hospital Santa Mónica, en un periodo de tres semanas compró $120 de material
para revestimiento de los enyesados de fractura en tres compras iguales de $40 cada
una. En la primera, el costo de revestimiento es de $1.00 por centímetro cuadrado, la
segunda $1.10 y el tercer $1.15. ¿Cuál fue el precio promedio pagado por centímetro
cuadrado?
4. El Departamento de Proveeduría de un hospital público de Honduras, tiene registros
del costo de procesamientos de una orden de compra para la reparación de aires
acondicionados. En los últimos 5 años, el costo ha mostrado la siguiente tendencia:
$55.00, $58.00, $61.00, $65.00 y $66.00.
a) ¿Cuál ha sido, durante este período, el porcentaje promedio de incremento de
compra de este producto?
b) Si la tasa promedio permanece inalterable más de 3 años, ¿Cuánto le costará a la
institución estatal procesar una orden de compra en ese tiempo?
5. Una enfermedad tradicional en Honduras, ha crecido paulatinamente como se mues-
tra a continuación:

Año 2007 2008 2009 2010 2011 2012 2013 2014


Población 30.59 30.5 31 32.1 32.3 33.6 37.6 48.5
en miles

a) Calcule el crecimiento promedio de esta enfermedad (use la media geométrica),


en el período en cuestión;
b) Basado en el crecimiento calculado en el inciso a) de continuar esta tendencia,
calcule la población afectada por dicha enfermedad para el año 2025;
c) Aplicando la media aritmética, calcule el crecimiento promedio de esta enferme-
dad, en el periodo en cuestión;
d) Basado en el crecimiento calculado en el inciso c) de continuar esta tendencia,
calcule la población afectada por dicha enfermedad para el año 2025;
e) Comparar los resultados de los incisos b) y d), establezca su conclusión.
CAPÍTULO

Medidas de posición
5
Contenido

5.1 Cálculo de la posición y valor de los cuartiles,


deciles y percentiles para datos no
agrupados
5.2 Cálculo de los cuartiles, deciles y percentiles
para datos agrupados
5.3 El rango percentil: Cálculo y su significado
70 CAPÍTULO 5

Medidas de posición
Las medidas de posición sirven para describir la localización de un dato específico, con
relación al resto de la muestra o población. Entre éstas medidas las más utilizadas son:
1. Los cuartiles;
2. Los deciles,
3. Los percentiles.
• Los cuartiles se representan generalmente con la letra Q, y son datos que dividen al
conjunto ordenado de menor a mayor en cuatro partes iguales.
Existen tres cuartiles identificados como: Q1, Q2 y Q3 y se ubican en el conjunto orde-
nado de la forma siguiente:

25% 25% 25% 25%

Q1 Q2 Q3

• Los deciles se representan generalmente con la letra D, y son datos que dividen al
conjunto ordenado de menor a mayor en diez partes iguales.
Existen nueve deciles identificados como: D1, D2, ..., D9 y se ubican en el conjunto
ordenado de la forma siguiente:

10% 10% ... 10% 10%

D1 ...... D9
• Los percentiles se representan generalmente con la letra P, y son datos que dividen al
conjunto ordenado de menor a mayor en cien partes iguales.
Existen noventa y nueve percentiles identificados por: P1, P2,..., P99 , se ubican en el
conjunto ordenado de la forma siguiente:

1% 1% ... 1% 1%

P1 P99

5.1 Cálculo de la posición y valor de los cuartiles,


deciles y percentiles para datos no agrupados
Cálculo de los cuartiles para datos no agrupados
1. Ordene los datos en forma ascendente;
2. Si el número de datos o tamaño del conjunto es impar, entonces el dato centro es el
cuartil dos, (Q2).

Ejemplo
Sean 13.5, 3.5, 4.2, 7 y 11; un conjunto de datos no agrupados, calcular el cuartil dos (Q2)
Solución
Ordenando los datos: 3.5, 4.2, 7, 11, 13.5
Entonces Q2 = 7
3. Si el número de datos o tamaño del conjunto es impar, entonces el cuartil dos, (Q2),
será la media aritmética de los dos datos centros.
Medidas de posición 71

Ejemplo
Sean 7, 2.2, 11.6, 2.1, 6.6, 9.4; un conjunto de datos no agrupados, calcular el cuartil dos
(Q2)
Solución
Ordenando los datos: 2.1, 2.2, 6.6, 7, 9.4, 11.6

6.6 + 7
Entonces Q2 = = 6.8
2
4. Para el cálculo del cuartil uno (Q1)y cuartil tres (Q3); para la posición haremos uso
de las fórmulas siguientes:
a) Si el número de datos o tamaño del conjunto es par, para el cálculo de la posición
n
+1
use la fórmula: P = 2 , luego con el valor de la posición y los datos ordenados
2
de menor a mayor, busque la posición del dato para el cuartil uno, de izquierda a
derecha y para el cuartil tres busque la posición del cuartil tres, de derecha a iz-
quierda.
b) Si el número de datos o tamaño del conjunto es impar, para el cálculo de la posi-
n −1
+1
ción use la fórmula: P = 2 , luego con el valor de la posición y los datos
2
ordenados de menor a mayor busque la posición del dato para el cuartil uno,
de izquierda a derecha y para el cuartil tres busque la posición del cuartil tres, de
derecha a izquierda.

Ejemplo 1
Sean 15, 27, 33, 13, 18, 5, 25, 21, 17
Calcular los cuartiles uno (Q1) y tres (Q3)

Solución
Ordenando los datos: 5, 13, 15, 17, 18, 21, 25, 27, 33
Como el número de datos o tamaño del conjunto es impar, para el cálculo de la posi-
ción para la búsqueda de los cuartiles uno (Q1) y tres (Q3) , usaremos la fórmula.
n −1 9 −1
+1 +1 5
p= 2 = 2 = = 2.5
2 2 2
El resultado 2.5 significa que los cuartiles buscados se encuentran en la posición 2 o
3, ya con los datos ordenados, entonces el cuartil uno se busca de la siguiente manera:

5, 13, 15, 17, 18, 21, 25, 27, 33

Posición: 1  2  3  4  5  6  7  8  9

13 +15 28
Entonces Q1 = = = 14
2 2

Para la búsqueda del cuartil tres, se hace lo siguiente:


        
5, 13, 15, 17, 18, 21, 25, 27, 33
72 CAPÍTULO 5

Posición: 9  8  7  6  5  4  3  2  1

25 + 27 52
Entonces Q3 = = = 26
2 2

Ejemplo 2
Sean 15, 27, 33, 13, 18, 5,
Calcular los cuartiles uno (Q1) y tres (Q3)
Solución
Ordenando los datos: 5, 13, 15, 18, 27, 33,
Como el número de datos o tamaño del conjunto es par (n = 6), para el cálculo de la
posición para la búsqueda de los cuartiles uno (Q1) y tres (Q3), usaremos la fórmula:
n 6
+1 +1 4
P= 2 =2 = =2
2 2 2
El resultado 2 significa que los cuartiles buscados se encuentran en la posición 2, ya
con los datos ordenados, entonces el cuartil uno se busca de la siguiente manera:

5, 13, 15, 18, 27, 33,


Posición: 1  2  3  4  5  6  
Entonces Q2 = 13
Para la búsqueda del cuartil tres, se hace lo siguiente:
        
5, 13, 15, 18, 27, 33
Posición: 6  5  4  3  2  1
Entonces Q3 = 27

Notas especiales
Como todo Cuartil y todo Decil están relacionados con algún Percentil, matemáticamen-
te podemos hacer uso de fórmulas percentílicas para el cálculo de cualquiera de las medi-
das de posición (Cuartiles, Deciles y Percentiles), teniendo en cuenta las condiciones si-
guientes:
1. Relación entre Cuartiles, Deciles y Percentiles:
a) Q1 = P25 b) Q2 = P50 c) Q3 = P75 d ) D1 = P10 e) D2 = P20 f ) D3 =P30
g) D4 = P40 h) D5 = P50 i) D6 = P60 j) D7 = P70 k) D8 = P80 l ) D9 = P90
2. Para datos no agrupados, ordénelos en forma ascendente;
3. Determine la posición para datos no agrupados y agrupados en distribución de fre-
nk
cuencias, mediante la fórmula P = ; donde:
100
n = Número total de observaciones o datos
k = Número del percentil deseado (k = 1, 2, 3, ..., 99)
4. Si el valor de la posición resulta un entero, súmele 0.5 a ese valor;
5. Si el valor de la posición resulta un número decimal, aproxime ese valor al entero in-
mediato superior. (No use regla de redondeo).
Medidas de posición 73

Ejemplo
a) Si P = 5, entonces el verdadero valor de la posición es P = 5.5
b) Si P = 6.01, entonces el verdadero valor de la posición es P = 7
c) Si P = 6.85, entonces el verdadero valor de la posición es P = 7
Para calcular la posición y el valor de los cuartiles, deciles y percentiles en datos no
agrupados, haga lo siguiente:
nk
6. La fórmula pk = , servirá para el cálculo de cualquier Decil, Cuartil o Percentil
100
para datos no agrupados, dado que éstas medidas (los percentiles) tienen relación
con algún Decil o Cuartil, como lo dijimos anteriormente.
7. En este proceso y para datos no agrupados, localizaremos el valor del percentil desea-
do en el conjunto de datos ordenados de menor a mayor, de acuerdo a la posición
encontrada de izquierda a derecha para cualquiera de las medidas.
8. Cuando el valor final de la posición sea el decimal aproximado (esto es por la suma
de 0.5), el valor del percentil buscado, será la media aritmética de los dos valores de
los datos ordenados que dejen en el intermedio el valor de dicha posición, y si el valor
final de la posición es un valor entero, entonces la medida de posición buscada es el
dato ubicado en dicha posición.

Ejemplo para datos no agrupados


Dado el siguiente conjunto de datos:
6, 7, 5, 5, 8, 8, 8, 3, 3, 2, 4, 4, 7, 13, 13, 12, 10, 9, 9, 7
Calcular: a) P73  b) D4  c) Q2
Solución inciso a)
Ordenando los datos de menor a mayor, tenemos:
2, 3, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 8, 9, 9, 10, 12, 13, 13
En éste caso k = 73 y n = 20, entonces la posición está dada por:
nk (20)(73) 1460
P= = = =14.60 ≅15
100 100 100
Buscando de izquierda a derecha el dato en la posición 15, es el número 9
2, 3, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 8, 9, 9, 10, 12, 13, 13

Entonces: P73 = 9

Solución inciso b)
Ordenando los datos de menor a mayor, tenemos:
2, 3, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 8, 9, 9, 10, 12, 13, 13
En éste caso D4 = P40, entonces k = 40 y n = 20, calculando la posición tenemos que:

nk (20)(40) 800
P= = = = 8 + 0.5 = 8.5
100 100 100

Como el valor de la posición es 8.5, al buscar de izquierda a derecha, el percentil de-


seado debe ser el valor de la media aritmética de los dos datos que están en la posición 8
6 +7
y 9, en éste caso son los valores 6 y 7, por tanto, P40 = = 6.5
2
74 CAPÍTULO 5

2, 3, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 8, 9, 9, 10, 12, 13, 13



6 +7
D4 = = 6.5 : Entonces D4 = 6.5
2

Solución inciso c)
Ordenando los datos de menor a mayor, tenemos:
2, 3, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 8, 9, 9, 10, 12, 13, 13
En éste caso Q2 = P50 , entonces k = 50 y n = 20, calculando la posición tenemos
que:

nk (20)(50) 1000
P= = = = 10 + 0.5 = 10.5
100 100 100

Como el valor de la posición es 10.5, al buscar de izquierda a derecha, el percentil


deseado debe ser el valor de la media aritmética de los dos datos que están en la posición
7 +7
10 y 11, en éste caso son los valores 7 y 7, por tanto, P50 = =7
2
2, 3, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 8, 9, 9, 10, 12, 13, 13

7 +7
Luego: Q2 = = 7 Entonces: Q2 = 7
2

EJERCICIOS 5.1
1. Para los siguientes conjuntos de datos no agrupados:
a) 7, 7, 5, 6, 4, 8, 9, 12, 11, 11, 10, 5, 5, 10, 10, 10
b) 2.4, 3.5, 4.8, 2.3, 2.9, 4.1, 2.7, 2.5, 3.6, 3.9, 3.8, 3.3
c) 1.07, 1.09, 1.01, 1.01, 1.02, 1.03, 1.03, 1.05, 1.04, 1.06
Calcular:
a) El Cuartil 3, Decil 6 y Percentil 37
b) El Percentil 66, Decil 2, Cuartil 1 y Percentil 7

5.2 Cálculo de los cuartiles, deciles y percentiles


para datos agrupados en distribuciones de frecuencias
Como vimos en la sección 5.1, que todo Decil o Cuartil está relacionado con algún Per-
centil, en el caso de datos agrupados, para calcular el valor de cualquier percentil, lo ha-
remos a través de los siguientes pasos:
1. Las aproximaciones definidas en la sección anterior para el cálculo de la posición de
un percentil, en ésta sección, tendrán la misma validez;
2. En la distribución de frecuencias, ubicaremos dicha posición mediante la columna de
las frecuencias acumuladas (fa), esto nos permitirá identificar nuestro intervalo per-
centílico;
Medidas de posición 75

3. Para calcular un percentil cualquiera, utilice la fórmula siguiente:


nk
100
− ∑f ( 1
)
PK = LriPk + xC ;
f Pk

Pk = Percentil buscado
LRIpk = Límite real inferior de la clase percentílica
(∑f)1 = Total, de observaciones acumuladas antes del intervalo percentílico
n = Número total de observaciones
Donde:
k = Percentil k-ésimo deseado
nk
= Posición de la clase percentílica
100
fpk = Frecuencia simple o absoluta en la clase percentílica
C = Ancho de la clase percentílica
Ejemplo:
Dada la siguiente distribución de frecuencias, Calcular a) D9  b) P38

X f
40 - 49 10
50 - 59 12
60 - 69 14
70 - 79 16
80 - 89 13
90 - 99 11
Total 76
Solución inciso a)
Como el Decil nueve es igual al percentil noventa (D9 = P90), entonces en éste caso k = 90
y n = 76, luego:

nk (76)(90) 6840
P= = = = 68.4 ≅ 69;
100 100 100

La posición es 69, la buscaremos en la distribución siguiente:

X f fa Limites reales
40 - 49 10 10
50 - 59 12 22
60 - 69 14 36
70 - 79 16 52
80 - 89 13 65
90 - 99 11 76 89.5
Total 76
Podemos ver que nuestro intervalo centílico o percentílico, está en la posición 69 o
sea ubicada en la última clase; entonces:
nk
(
− ∑f ) 69 − 65
PK = LriPk + 100
1
xC = P90 = 89.5 + x10 ≅ 93.14
f Pk 11

Concluyendo: D9 = 93.14
76 CAPÍTULO 5

Solución inciso b)
En éste caso k = 38 y n = 76, luego:

nk (76)(38) 2888
P= = = = 28.88 = 29 ; La posición es 29, la cual buscaremos en la
100 100 100

Distribución siguiente:

X f fa Limites reales
40 - 49 10 10
50 - 59 12 22
60 - 69 14 36 59.5
70 - 79 16 52
80 - 89 13 65
90 - 99 11 76
Total 76
Podemos ver que nuestro intervalo centílico o percentílico, es la clase tres; entonces:

nk
− ∑f ( )1 29 − 22
PK = LriPk + 100 xC = P38 = 59.5 + x10 ≅ 64.5; entonces:
f Pk 14

P38 = 64.5

EJERCICIOS 5.2
1. La siguiente distribución de frecuencias representa datos durante el mes de noviem-
bre del año 2013, referente a la edad de las madres solteras que laboran en una empre-
sa maquiladora en el norte del país.

Rango de edades Frecuencia


18 - 20 9
21 - 23 18
24 - 26 23
27 - 29 16
30 - 32 7
33 - 35 3
36 - 38 2
39 - 41 1
42 - 44 1
Total 80

Calcular: D9; Q2; D5; P13 y P66


2. La siguiente distribución de frecuencias representa el número de personas por rango
de edades, afectadas por el dengue clásico en la zona sur de Honduras, durante el año
2007.
Medidas de posición 77

Edades Frecuencia
01 - 10 20
11 - 20 44
21 - 30 36
31 - 40 48
41 - 50 57
51 - 60 33
61 - 70 22
71 - 80 10
81 - 90  4
Total 274

Calcular: D7; Q3; D2; P34 y P97


3. La siguiente distribución de frecuencias representa el diámetro en milímetros de los
micros procesadores electrónicos fabricados para problemas cardiacos.

X Frecuencia
0.01 - 0.05 25
0.06 - 0.10 18
0.11 - 0.15 23
0.16 - 0.20 16
0.21 - 0.25 17
0.26 - 0.30 13
Total 112

Calcular: D5; Q3; P47 y P77

5.3  El Rango Percentil: Cálculo y su significado


El Rango Percentil identificado por RP (x) sirve para determinar qué porcentaje está por
debajo de un valor x cualesquiera del conjunto de datos.
El rango percentil lo calcularemos mediante la fórmula:

x −B
RP ( x ) = A + D;
C

RP(x) = Rango percentil de un puntaje x dado


A = % de casos por debajo antes del intervalo percentílico
Donde: B = Límite real inferior del intervalo percentílico
C = Ancho de la clase que contiene el intervalo percentílico
D = % de los casos dentro del intervalo percentílico

f
El valor de D debe calcularse por: D = x100
N

Ejemplo
La siguiente distribución de frecuencias representa las edades y cantidad de personas que
se sometieron a un programa de exámenes psicométricos y que obtuvieron resultados por
arriba de la media normal del coeficiente intelectual.
78 CAPÍTULO 5

Edades Cantidad de pacientes


20 - 30 15
31 - 40 25
41 - 50 36
51 - 60 44
61 - 70 39
71 - 80 24
81 - 90 12
Total 195

Calcular: a) RP(35) y su significado   b) RP(70) y su significado

Solución inciso a)

Límites
Edades (X) f fa fra(%) reales
20 - 30 15 15  7.69
31 - 40 25 40  20.51 30.5
41 - 50 36 76  38.97
51 - 60 44 120  61.54
61 - 70 39 159  81.54
71 - 80 24 183  93.85
81 - 90 12 195 100.00
Total 195

Como X = 35, éste valor se encuentra en la segunda clase, entonces:


X −B
RP ( X ) = A + xD =
C

35 −30.5 25
RP (35) = 7.69 + x x100 = 7.69 + (0.45)(12.82) =13.46%
10 195

Significado: El 13.46% de los datos, están por debajo del valor 35, y 86.54% de los
datos, están por arriba del valor 35.

Solución inciso b)

Edades (X) f fa fra(%) Límites reales


20 - 30 15 15   7.69
31 - 40 25 40  20.51
41 - 50 36 76  38.97
51 - 60 44 120  61.54
61 - 70 39 159  81.54 60.5
71 - 80 24 183  93.85
81 - 90 12 195 100.00
Total 195
Medidas de posición 79

Como X = 70, éste valor se encuentra en la quinta clase, entonces:

X −B
RP ( X ) = A + xD =
C
70 − 60.5 39
RP (70) = 61.54 + x x100 = 61.54 + (0.95)(20) = 80.54%
10 195

Significado: El 80.54% de los datos, están por debajo del valor 70, y 19.46% de los
datos, están por arriba del valor 70.

EJERCICIOS 5.3
1. La siguiente distribución representa la incidencia de enfermedades respiratorias en
niños durante los meses de invierno en la zona norte de Honduras.

Edades en años Cantidad


01 - 03 214
04 - 06 227
07 - 09 302
10 - 12 276
13 - 15 196
Total 1215

a) Calcular RP(02) y RP(11)


b) Explique el significado de RP(02) y RP(11), calculados en el inciso anterior.
2. La siguiente distribución de frecuencias representa el número de infantes vacunados
contra enfermedades prevenibles que afectan a los menores de 10 años, mediante un
programa especial de la Secretaría de Salud para las Ciudades de Tegucigalpa y Co-
mayagüela, en el año 2006.

Edades en años Cantidad


0.50 -  2.00 5,148
2.10 -  3.60 7,827
3.61 -  5.20 9,702
5.21 -  6.80 8,876
6.81 -  8.40 6,993
8.41 - 10.00 4,444
Total 42,990

a) Calcular RP(1.52) y RP(7.77)


b) Explique el significado de RP(1.52) y RP(7.77), calculados en el inciso anterior.
80 CAPÍTULO 5

3. Los siguientes datos representan el número de pacientes que visitan por día el consul-
torio médico de Las crucitas en la Ciudad de Comayagüela.

48 34 26 39 51 60 55 45 47 54 38 36
44 49 58 59 50 40 46 43 57 48 44 47

a) Construya la distribución de frecuencias adecuada;


b) Calcule RP(44) y RP(56)
c) Explique el significado de los rangos percentiles determinados en el inciso ante-
rior.
CAPÍTULO

Medidas de dispersión
6
Contenido

6.1 Conceptualización e interpretación de la


desviación estándar
6.2 Cálculo de la desviación estándar y varianza
para datos no agrupados
6.3 Cálculo de la desviación estándar y varianza
para datos agrupados en frecuencia simple
6.4 Cálculo de la desviación estándar y varianza
para datos agrupados en distribución de
frecuencias
6.5 Desviaciones relativas
6.5.1 El coeficiente de variación
6.5.2 La variable normalizada
6.6 Medidas de la curtosis
6.7 Asimetría estadística
6.7.1 Cálculo del coeficiente de asimetría de
Fisher
6.7.2 Cálculo del coeficiente de asimetría de
Pearson
82 CAPÍTULO 6

Medidas de dispersión
6.1 Conceptualización e interpretación
de la desviación estándar
Cualquier promedio central no logra por sí mismo describir completamente una distribu-
ción de frecuencias. Se necesita de otras medidas para que sus características queden de-
finidas y pueda efectuarse una efectiva comparación con otras distribuciones. A éstas
medidas se les conoce con el nombre de Medidas de Dispersión o de Variabilidad.
La variación o dispersión, es el grado en que las observaciones o datos de una muestra
o población, tienden a concentrarse o a dispersarse en torno a un valor promedio central.
La Desviación Estándar como medida de fluctuación (variabilidad) en los datos, nos
permite determinar con mayor grado de precisión, donde se sitúan los valores de una
distribución de frecuencia, en relación con la media, o qué porcentaje de ellos deben estar
entre ciertos límites.
Dos o más conjuntos de datos pueden tener la misma localización central, y, no obs-
tante, ser muy distintos, si uno de ellos se halla más disperso que el otro.
Ejemplo

Tres curvas
con la
misma
medida,
pero con
diferentes
variables

Tres curvas con la misma media, pero con diferente variabilidad


La dispersión de los datos es importante entenderla y medirla, dado que:
1. Suministra información complementaria que permite juzgar la confiabilidad de la me-
dida de tendencia central utilizada;
2. Es necesario reconocer si los datos están muy dispersos o no;
3. Al comparar la dispersión de varias muestras, se nos permite poder utilizar aquella
menos dispersa, de tal forma que el riesgo en la investigación sea el menor posible.
Las medidas de dispersión o variabilidad más conocidas son:
a) La desviación típica o estándar;
b) La varianza;
c) El coeficiente de variación
d) La variable normalizada; y
e) El rango.

La desviación estándar
La desviación estándar representa la variabilidad promedio de los datos con respecto a la
media, o sea que nos permite saber que tan disperso o que tan concentrado está el conjun-
to de datos con respecto a su media o dato promedio.
Medidas de dispersión 83

La medida clásica de variación más utilizada en la práctica, es la desviación estándar,


y se representa generalmente por la letra griega: σ para datos poblacionales, y por la letra
S, para datos que representan una muestra.

6.2 Cálculo de la desviación estándar y varianza


para datos no agrupados
La desviación estándar para datos no agrupados la calcularemos por las siguientes fórmu-
las:
a) Si los datos provienen de una muestra:

∑( X i − X ) ∑ X 2 ∑ X ∑X
2

S= o  S = −
n −1 n −1 n(n −1)

Dónde: n = tamaño de la muestra; X = media muestral
Xi = valor de la observación
b) Si los datos corresponden a toda la población:

∑( X i − µ )2
σ =
N
Dónde: N = tamaño de la población; 𝜇 = media poblacional
Xi = valor de la observación o dato
Ejemplo
Sean 2, 3, 5, 7, 11, 13, 17, el conjunto de los primeros siete números primos.
a) Calcular la desviación estándar tratando los datos como una muestra; y,
b) La desviación estándar tratando los datos como una población.
Solución inciso a)

X X2
 2   4
 3   9
 5  25
 7  49
11 121
13 169
17 289

∑X = 58 ∑X 2 = 666

∑X 58
≅ 8.28
X = =
n 7

Luego tenemos que:

∑( X i − X )
2

S=
n −1
84 CAPÍTULO 6

(2 − 8.28)2 + (3 − 8.28)2 + (5 − 8.28)2 + (7 − 8.28)2 + (11− 8.28)2 + (13 − 8.28)2 + (17 − 8.28)2
7 −1

39.4384 + 27.8784 +10.7584 +1.6384 + 7.3984 + 22.2784 +76.0384 185.4288


= = 30.9048 ≅ 5.56
6 6
7.3984 + 22.2784 +76.0384 185.4288
= = 30.9048 ≅ 5.56
6
La desviación estándar es: S = 5.56
Ahora utilizando la segunda fórmula:

∑X 2 ∑X∑ X
S= − =
n −1 n(n −1)

666 (58)(58) 666 3364


− = − = 111 − 80.095 = 30.9047 ≅ 5.56
7 −1 7(7 −1) 6 42

La desviación estándar es: S = 5.56

Solución inciso b)

∑X 58
Calculando la media tenemos que: µ = = ≅ 8.28
N 7

∑( X i − µ )
2

Luego: σ = =
N

∑(2 − 8.28)2 + (3 − 8.28)2 + (5 − 8.28)2 + (7 − 8.28)2 + (11− 8.28)2 + (13 − 8.28)2 + (17 − 8.28)2
7
39.4384 + 27.8784 +10.7584 +1.6384 +7.3984 + 22.2784 +76.0384 185.4288
= = 26.4898 ≅ 5.15
7 7

7.3984 + 22.2784 +76.0384 185.4288


= = 26.4898 ≅ 5.15
7

La desviación estándar es σ ≅ 5.15

La Varianza
La varianza de una población o muestra, es similar a una desviación absoluta promedio,
y para cualquier conjunto de datos, se calcula con las mismas fórmulas de la desviación
estándar sin la raíz cuadrada, en otras palabras la varianza es el cuadrado de la desviación
estándar y se representa por los símbolos para datos muéstrales y para datos poblaciona-
les, por tanto las fórmulas a utilizar serán:
a) Si los datos provienen de una muestra:

∑(X i − X )2 ∑ X 2 ∑X∑X
S2 = o S2 = −
n −1 n −1 n(n −1)
Medidas de dispersión 85

n = tamaño de la muestra

Dónde: X = media muestral
Xi = valor de la observación o dato
b) Si los datos corresponden a toda la población:

∑( X i − µ )2
σ =
2
N

N = tamaño de la población
Dónde: 𝜇 = media poblacional
Xi = valor de la observación
Ejemplo
En el ejemplo anterior se obtuvo que la desviación estándar muestral fue: S = 5.56 y para
la desviación estándar poblacional 𝜎 = 5.15.
Entonces S2 = 30.9136 y 𝜎2 = 26.5225

EJERCICIOS 6.2
1. Los siguientes datos representan el coeficiente intelectual de 20 estudiantes de la
Carrera de Cirugía Dental de la UNICAH, Campus Sagrado Corazón de Jesús.

110 115 128 105 126 121 116 118 132 124
114 119 120 127 121 108 112 113 119 20

a) Tratando los datos como una muestra, calcular la media, desviación estándar y
varianza.
b) Tratando los datos como una población, calcular la media, desviación estándar y
varianza.
2. Los siguientes datos en una escala de 0 a 10, corresponden al nivel de desnutrición
que presentaron 80 niños de una comunidad del Distrito Central, Departamento de
Francisco Morazán.
2.3, 3.4, 3.4, 5.8, 6.0, 6.0, 6.1, 6.0, 6.1, 6.1, 3.5, 3.8, 3.7, 4.8, 4.7, 1.7, 1.6,
1.9, 1.4, 2.2, 2.3, 2.4, 2.7, 2.9, 2.9, 2.1, 2.5, 2.6, 3.1, 1.7, 1.2, 1.5, 1.9, 1.7,
1.6, 3.3, 3.4, 3.5, 3.6, 3.6, 3.6, 3.8, 3.9, 3.8, 4.1, 4.5, 4.7, 4.3, 4.2, 4.9, 4.9,
5.2, 5.1, 5.1, 5.7, 5.9, 5.7, 5.4, 5.4, 5.5, 5.8, 5.9, 5.9, 5.9, 5.7, 6.1, 6.2, 6.0,
6.0, 6.1, 5.2, 5.3, 5.5, 5.5, 4.7, 3.7, 3.7, 3.7, 4.4, 4.4.

Usando las funciones estadísticas de su calculadora, determinar:


a) La media de desnutrición en los niños de dicha comunidad;
b) La desviación estándar y varianza poblacional; y
c) La desviación estándar y varianza muestral.
3. Los datos adjuntos representan una muestra de las calificaciones finales de 30 estu-
diantes de uno de los cursos de Bioestadística en la UNICAH, Campus Sagrado Co-
razón de Jesús.
85 87 70 75 78 92 74 95 90 77 77 80 81 76 73
88 89 84 84 84 79 86 85 71 70 70 73 80 82 83
86 CAPÍTULO 6

Calcular:
a) La nota promedio en éste curso;
b) La desviación estándar y varianza de las notas obtenidas;
c) Si la nota mínima de aprobación es de 70%, interprete los resultados de la media,
desviación estándar y varianza.
4. La siguiente muestra representa la longitud en milímetros de una bacteria en especí-
fico: 0.001, 0.001, 0.002, 0.0025, 0.0013, 0.0016, 0.0017, 0.0018, 0.0011, 0.0012,
0.0022, 0.0019, 0.0021, 0.0021, 0.0023, 0.0024, 0.0013.
Calcular la media, desviación estándar y varianza.

6.3 Cálculo de la desviación estándar y varianza para datos


agrupados en frecuencia simple
En éste caso la desviación estándar y la varianza la calcularemos a través de las fórmulas
siguientes:

a) Para datos muestrales:

∑ FX 2 ∑FX ∑FX  y  S 2 = ∑ FX 2 − ∑FX∑ FX


S= −
n −1 n(n −1) n −1 n(n −1)

n = Tamaño de la muestra
F = frecuencia simple o absoluta
Donde: X = Valor de la observación o dato
S = Desviación estándar muestral
S2 = Varianza-muestral

b) Para datos poblacionales:

∑FX 2 ∑FX 2
−µ2 y σ = − µ2 ;
2
σ= N
N

𝜎 = Desviación estándar poblacional


𝜎2 = Varianza poblacional
N = Tamaño de la población
Donde: 2
𝜇 = Media poblacional al cuadrado
X = Valor de la variable
F = Frecuencia

Ejemplo
La siguiente tabla de frecuencias simples, representa las edades de los alumnos de un
curso de anatomía en la Universidad Católica de Honduras, Campus San Isidro, de la
Ciudad de La Ceiba:
Medidas de dispersión 87

Edades (en años) Cantidad


17  2
18  9
19 13
20 14
21  5
22  4
23  3
24  1
Total 51
a) Tratando los datos como una muestra, calcular la desviación estándar y varianza;
b) Tratando los datos como una población, calcular la desviación estándar y varianza;
Solución inciso a)

X F X2 FX FX2
17  2 289  34  578
18  9 324 162 2916
19 13 361 247 4693
20 14 400 280 5600
21  5 441 105 2205
22  4 484  88 1936
23  3 529  69 1587
24  1 576  24  576

Total 51 ∑FX = 1009 ∑FX 2 = 20091

∑ FX 2 ∑ FX ∑ FX
S= − =
n −1 n(n −1)

20091 (1009)(1009) 20091 1018018


− = − = 401.82 −399.23 = 2.59725 ≅ 1.61
51 −1 51(51 −1) 50 2550

Entonces la desviación estándar muestral es: S = 1.16 y como la varianza es el cuadra-


do de la desviación estándar tenemos que S2 = 2.59
Solución inciso b)

X F X2 FX FX2
17 2 289  34  578
18 9 324 162 2916
19 13 361 247 4693
20 14 400 280 5600
21  5 441 105 2205
22  4 484  88 1936
23  3 529  69 1587
24  1 576  24  576
Total 51 ∑FX =1009 ∑FX 2 = 20091
88 CAPÍTULO 6

∑FX 1009
µ 2 = (19.78)2 ≅ 391.42
µ= = = 19.78
N 51

∑FX 2 20091
− (19.78)2 = 393.94 − 391.42 = 2.52 ≅ 1.5874
σ= −µ 2 =
N 51
Entonces la desviación estándar es: 𝜎 =1.5874 y la varianza 𝜎2 = 2.52

EJERCICIOS 6.3
1. Para las siguientes distribuciones simples, calcular:
a) La media, desviación estándar y varianza muestral;
b) La media, desviación estándar y varianza poblacional.

a) x f x f
 4 10  9.5 30
 5 13 10.5 33
 6 15 11.7 35
 7 18 12.4 38
 8 13 13.7 33
 9 12 14.5 32
10 11 15.7 33
Total 92 Total 234

b) x f x f
07.54 15  90.155  7
08.55 17 100.255  9
09.56 18 110.355 12
10.57 14 120.455 13
11.58 14 130.555 12
12.59 13 140.655 10
13.60 12 150.755  8
Total 103 Total 71
2. Los siguientes datos medidos en una escala de 0 a 10, representan la eficiencia laboral
del personal del Centro Médico La Granja.

8.45 9.75 9.73 9.87 9.03 8.87 7.74 7.93 8.16 8.27 8.88
9.04 7.77 7.14 7.55 7.86 8.07 8.34 8.20 7.98 9.15 9.89
a) Ordene los datos en forma ascendente;
b) Agrúpelos en una tabla de frecuencias simples;
c) Tratando los datos como una muestra, calcule la media, desviación estándar y va-
rianza.
3. Para los datos del numeral anterior, tratándolos como una población, calcular:
a) La media;
b) La desviación estándar;
c) La varianza.
Medidas de dispersión 89

6.4 Cálculo de la desviación estándar y varianza


para datos agrupados en distribución de frecuencias
En este caso la desviación estándar y varianza la calcularemos mediante las fórmulas si-
guientes:
a) Para datos muéstrales

∑ FX m2 ∑FX m∑FX m  y S 2 ∑ FX m2 ∑FXm ∑ FXm


S= − = −
n −1 n(n −1) n −1 n(n −1)

b) Para datos poblacionales

∑FX m2 ∑FX m2
σ = −µ 2  y  σ 2 = −µ 2
N N

Ejemplo:
Dada la siguiente distribución de frecuencias:

X f
10 - 15 12
16 - 21 13
22 - 27 18
28 - 33 14
34 - 39 11
Total 68

Para los incisos a) y b) bajo las condiciones que se establecen, calcular la desviación
estándar y varianza:
a) Tratando los datos como una muestra;
b) Tratando los datos como una población.

Solución inciso a)

X F XM FXM X2M FX2M


10 - 15 12 12.5 150 156.25 1875
16 - 21 13 18.5 240.5 342.25 4449.25
22 - 27 18 24.5 441 600.25 10804.5
28 - 33 14 30.5 427 930.25 13023.5
34 - 39 11 36.5 401.5 1332.25 14654.75

Total 68 ∑FX m = 1660 ∑FX m2 = 44807

∑ FX m2 ∑FX m ∑FXm
S= − =
n −1 n(n −1)

44807 (1660)(1660) 44807 2755600


− = − = 668.76 − 604.83 = 63.93 ≅ 7.99
68 −1 68(68 −1) 67 4556
90 CAPÍTULO 6

El valor de la desviación estándar es: S = 7.99 y la varianza S2 = 63.84


Solución inciso b)
X F XM FXM X 2M FX2M
10 - 15 12 12.5 150 156.25 1875
16 - 21 13 18.5 240.5 342.25 4449.25
22 - 27 18 24.5 441 600.25 10804.5
28 - 33 14 30.5 427 930.25 13023.5
34 - 39 11 36.5 401.5 1332.25 14654.75
Total 68 ∑FX m =1660 ∑FX m2 = 44807
∑FX m 1660
µ= = = 24.41  y  µ 2 = 595.85
N 68
∑ FX m2 44807
σ = −µ 2 − 595.85 = 658.93 − 595.85 = 63.0765 ≅ 7.94
N 68
El valor de la desviación estándar es: σ = 7.94 y la varianza σ2 = 63.0765

EJERCICIOS 6.4
1. Los datos de la siguiente distribución de frecuencia corresponden al registro mensual
de personas que visitan durante la época de verano, un centro de salud en la costa
atlántica de Honduras.
X f
501 - 510 32
511 - 520 59
521 - 530 82
531 - 540 21
541 - 550 35
551 - 560 27
Total 256
a) Calcular el valor promedio de pacientes;
b) Calcule la desviación estándar y varianza.
2. La siguiente tabla muestra las mediciones de un contaminante encontrado en ciertas
regiones del país: (mm3/pu2)
X f
0.01 - 0.09 14
0.10 - 0.18 17
0.19 - 0.27 22
0.28 - 0.36 25
0.37 - 0.45 27
0.46 - 0.54 26
0.55 - 0.63 19
0.64 - 0.72 15
0.73 - 0.81 13
0.82 - 0.90 12
Total 190
Medidas de dispersión 91

a) Tratando los datos como una población, calcular el valor de:


La media, desviación estándar y la varianza.
b) Tratando los datos como una muestra, calcular el valor de:
La media, desviación estándar y la varianza.
3. Para las siguientes distribuciones de frecuencia, calcular:

a) X , S y S2
b) 𝜇, 𝜎 y 𝜎2
1. 2.
X f X f
65 - 69 13 1.65 - 1.69 13
70 - 74 20 1.70 - 1.74 10
75 - 79 10 1.75 - 1.79 10
80 - 84 32 1.80 - 1.84 12
85 - 89 30 1.85 - 1.89 15
90 - 94 10 1.90 - 1.94 10
95 - 99 15 1.95 - 1.99 13
Total 130 Total 83

3.
X f
36.55 - 37.59 7
37.60 - 38.64 12
38.65 - 39.69 13
39.70 - 40.74 15
40.75 - 41.79 12
41.80 - 42.84 10
42.85 - 43.89 8
Total 77

4. Los siguientes datos son las edades de los 36 ancianitos de uno de los asilos de Tegu-
cigalpa, registradas en febrero del año 2015, por un grupo de estudiantes de la Univer-
sidad Católica de Honduras en su labor de extensión universitaria.

77 84 91 87 88 90 79 85 86 96 91 84 83 83 86 90 90 77
79 80 80 80 80 85 89 89 88 83 82 90 90 87 87 75 78 81
Tratando los datos como no agrupados y como una población:
a) Calcular la edad promedio de estos ancianitos;
b) Determinar la desviación estándar y varianza para las edades de los ancianitos en
mención.
5. Dados los siguientes datos, construya una distribución de frecuencias (use 2k ≥ n
para el número de clases deseadas), con dicha distribución y tratando los datos como
una muestra, calcule la media, la desviación estándar y la varianza.
20.1, 30.3, 50.4, 60.7, 51.9, 52.7, 45.6, 60.3, 50.4, 40.4, 60.6, 60.6, 60.6, 50.8,
50.7, 50.7, 50.7, 41.3, 44.4, 48.5, 45.8, 47.8, 23.2, 27.4, 25.4, 28.6, 26.9, 20.8,
35.5, 39.8, 32.8, 34.3, 33.2, 36.4, 38.1, 68.1, 69.0, 60.9, 66.1, 50.7, 40.6
92 CAPÍTULO 6

6.5  Desviaciones relativas


La desviación estándar es una medida absoluta de dispersión y expresa la variación en las
mismas unidades que los datos originales. La desviación estándar no puede ser la única
medida base para comparar dos o más distribuciones.
Para estos casos el coeficiente de variación es una de las medidas relativas que nos
proporciona una idea general de la magnitud de la desviación estándar en relación con la
magnitud de la media.

6.5.1 El coeficiente de variación


σ
El coeficiente de variación representado por CV y calculado por la fórmula CV = x100 ,
µ
el cual relaciona una y otra medida expresando el cociente de la desviación estándar σ y
la media µ, como un porcentaje, relacionado a la variabilidad de los datos.
Ejemplo
En el laboratorio de un hospital, el técnico A durante el día realiza en promedio 55 análi-
sis, con una desviación estándar de 7, mientras que el técnico B, realiza un promedio de
70 análisis, con una desviación estándar de 13.
¿Cuál de los dos técnicos muestra menor variabilidad?
Solución
Para tener una respuesta correcta debe calcularse el coeficiente de variación para cada
técnico y luego comparar los resultados.

σ 7
Técnico A: CV = x100 = x100 ≅12.23%
µ 55

σ 8
Técnico B: CV = x100 = x100 ≅11.43%
µ 70

Se puede apreciar que el técnico B muestra una menor variabilidad.

6.5.2 La variable normalizada


La desviación estándar nos ayuda a medir el valor promedio en que los valores de la varia-
ble se apartan de la media de la distribución; sin embargo, es necesario tener una medida
que nos permita determinar el número de desviaciones estándar a que está un determina-
do valor por arriba o por abajo del valor de la media de la distribución. A éste proceso se
le conoce como normalización, estandarización o puntuación Z, y se calcula mediante la
fórmula siguiente:

x −µ
Z= ;
σ

x = Valor de la variable
𝜇 = Media de la población
Dónde:
𝜎 = Desviación estándar poblacional
Z = Puntaje estandarizado
Ejemplo
En la asignatura de bioestadística las calificaciones del curso tuvieron un promedio de
78% con una desviación estándar de 12%. En química, las calificaciones finales tuvieron
un promedio de 72% con una desviación estándar de 9%. Si un alumno obtiene 90% en
bioestadística y 82% en química.
Medidas de dispersión 93

a) ¿A cuántas desviaciones estándar está cada una de las calificaciones por arriba del
promedio de la asignatura respectiva?
b) ¿Qué podemos decir acerca del desempeño de dicho alumno en ambas asignaturas?

Solución inciso a)
Calculando las dos puntuaciones:

x − µ 90 − 78 x − µ 82 − 72
Bioestadística: Z = = = 1.0 y Química: Z = = = 1.12
σ 12 σ 9

Solución inciso b)
Su desempeño relativo, fue mejor en la clase de bioestadística, que en la clase de química.

EJERCICIOS 6.5
1. Dos alumnos (A y B) de la carrera de medicina y cirugía de la UNICAH, en una
clase de especialidades, recibieron el mismo entrenamiento mediante dos métodos
diferentes. El alumno A se sometió al Método I, y requirió un promedio de 20 horas
con una desviación estándar de 3.2 horas; El alumno B que se sometió al entrena-
miento con el Método II, requirió un promedio de 24 horas y una desviación estándar
2.45 horas. ¿Cuál método mostró la mayor variabilidad relativa?
2. El peso de los maestros de la facultad de medicina en la UNICAH, tienen una media
de 224 libras con una desviación estándar de 18 libras, mientras que los maestros del
área de ciencias médicas tienen una media de 195 libras con una desviación estándar
de 12 libras. ¿Cuál de los dos grupos muestra una mayor dispersión relativa en el
peso?
3. Con las siguientes observaciones se describen las calificaciones de los estudiantes
que asisten a una capacitación especial en el Campus Sagrado Corazón de Jesús de
la UNICAH, en dos jornadas especiales:
NOTAS JORNADA DIURNA: 92 94 70 80 80 84 77 74 96 98 93 73
NOTAS JORNADA NOCTURNA: 72 85 89 92 78 79 81 74 77 83 88 75 76
Si la homogeneidad del grupo es un factor positivo en el aprendizaje, aplicar una medi-
da de variabilidad relativa que indique a cuál de los dos grupos es más fácil enseñarles.
4. Los datos siguientes corresponden al porcentaje de la meta lograda por tres emplea-
dos en el área de asistencia para niños con retraso mental en un complejo de la tele-
ton.
PATRICIA :88 68 89 92 73
JUAN JOSÉ :76 88 90 86 79
FRANCISCO :88 95 78 88 63
¿Cuál de los empleados es más constante?
5. El supervisor de servicio al ciudadano de un gran complejo hospitalario, revisa el
tiempo promedio en minutos para atender un paciente por emergencia en un día
cualesquiera. El supervisor considera tres médicos que atienden el área de emergen-
cia de manera permanente, y que además de un promedio mínimo, es de suma impor-
tancia la consistencia basada en la dispersión relativa. ¿Cuál de los tres médicos es el
mejor en la prestación de servicios?
94 CAPÍTULO 6

Médico Tiempo en minutos


Ruben 4.2 4.6 3.9 4.3 5.7 4.9 4.4 5.1 5.7 5.9 3.9 4.8
Karla 4.8 5.6 4.9 6.1 4.5 3.9 5.2 6.1 4.7 4.9 4.6 5.8
María 5.2 4.8 5.4 4.9 4.5 4.1 5.8 4.6 5.1 5.3 6.6 3.8

6. La media y desviación estándar de una población son 120 y 20 respectivamente. En-


contrar el valor de x que corresponde a:
a)  Z = 0.0   b) 
Z = 1.2   c) Z = –1.4   d) Z = 2.05   e) Z = –2.75
7. ¿Cuál valor de x tiene menor posición relativa con respecto al conjunto del cual pro-
cede?
A: x = 28.1 donde 𝜇 = 25.7 𝜎 =1.8
B: x = 39.2 donde 𝜇 = 34.1 𝜎 = 4.3
8. ¿Cuál valor de x tiene la mayor magnitud relativa al conjunto de datos del cual proce-
de?
A: x = 85 donde μ = 72.0 σ = 8.0  B: x = 93 donde μ = 87.0 σ = 5.0
9. El número de aciertos en un examen de aptitud, aplicado a nivel nacional para aspi-
rantes a ocupar cargos de directores en hospitales públicos, tiene una media y una
desviación estándar de 500 y 100 respectivamente, calcular el número de aciertos
para cada valor de Z:
a) Z = 1.8   b) Z = –2.03   c) Z = –1.2   d) Z = 1.22   e) Z = 3.02
10. El jefe de cocina del Hospital San Jorge, dice que el precio promedio de lechuga es L.
5.71 la libra con una desviación estándar de 1.05; el tomate L. 6.40 la libra con des-
viación estándar de 1.03; y el pepino L. 4.19 la libra en promedio con una desviación
estándar de 1.02. Si en los demás mercados se tienen los precios de L. 5.78 la libra de
lechuga, L. 6.45 la de tomata y L. 4.21 la de pepino, ¿Cuál de éstas verduras tiene
relativamente un precio excesivo?

6.6  Medidas de la curtosis


Relacionados a las gráficas que representan conjuntos de datos, existen muchos grados
diferentes de curtosis (altura del gráfico), no obstante, normalmente los estadísticos utili-
zan tres tipos. La curtosis determina el grado del pico en la curva, y entre los tipos de
curtosis más utilizados tenemos:
1. La loptocúrtica;
2. La mesocúrtica;
3. La platicúrtica.

Gráfico de una curva loptocúrtica


Medidas de dispersión 95

Gráfico de una curva mesocúrtica

Gráfico de una curva platicúrtica

Cálculo del grado de la curtosis en una curva


Los tres grados de curtosis se pueden determinar para datos agrupados en frecuencias
simples, y agrupados en distribución de frecuencias. La fórmula de Fisher nos permite
conocer el nivel de curtosis a través de:

a) GC =
∑( X − X )4
− 3 ; datos agrupados en frecuencia simple
Ns x4

∑( xm − x )4
b) GC = − 3 ; datos agrupados en distribución de frecuencias
Nsx4

GC = Grado de Curtosis
X = Valor de la variable
xm = Marca de clase
Dónde: —
X = Media muestral
N = Tamaño de muestra o número total de observaciones
sx = Desviación estandar muestra;

Notas:
1. Si el grado de la Curtosis es mayor que cero, entonces la curva es de índice loptocúr-
tica;
2. Si el grado de la Curtosis es cero, entonces la curva es de índice mesocúrtico;
3. Si el grado de la Curtosis es menor que cero, entonces la curva es de índice platicúr-
tica;
Ejemplo
La siguiente distribución de frecuencias representa las calificaciones de 50 estudiantes de
un curso de Cirugía I, en la Universidad Católica de Honduras, UNICAH. Determinar el
índice de la curtosis y establecer el tipo de curtosis.

Clases f
01 - 20  2
21 - 40  3
41 - 60  7
61 - 80 25
 81 - 100 13
Total 50
96 CAPÍTULO 6

Solución

Clases f Xm f Xm X m2 f X m2 (Xm − X )4
01 - 20  2 10.5 21 110.25 220.5 11007531.42
21 - 40  3 30.5 91.5 930.25 2790.75 1998717.338
41 - 60  7 50.5 353.5 2550.25 17851.75 95951.2576
61 - 80 25 70.5 1762.5 4970.25 124256.25 33.1776
 81 - 100 13 90.5 1176.5 8190.25 106473.25 251763.0976
Total 35 3405 16751.25 251592.5 13353996.29

∑ f Xm 3405
X= = = 68.1
N 50

∑ FX m2 ∑ FX m ∑ FX m 251592.5 (3405)(3405)
S= − = − = 20.0571
n −1 n(n −1) 49 50 ( 49)
y Sx4 = 161835.0399

∑(xm − X )4 13353996.29 13353996.29


Ahora como: GC = −= −3 = −3
Ns x4 (50)(161835.0399) 8091751.995

= 1.65 – 3 = –1.35, entonces: GC = –1.35 < 0


Conclusión: Como el índice es menor que cero (–1.35 < 0) se trata de una curtosis
platicúrtica.

EJERCICIOS 6.6
1. Para las siguientes distribuciones de frecuencia, calcule la curtosis de cada una de las
gráficas, y dibuje el gráfico apoyado en su correspondiente histograma de frecuencias.
a) Clases f b) Clases f
10 - 15 12  0.25 -  3.75 10
16 - 21 13  3.76 -  7.26 15
22 - 27 17  7.27 - 10.77 20
28 - 33 14 10.78 - 14.28 14
34 - 39 14 14.29 - 17.79  9
Total 70 Total 68
2. Para los siguientes resultados, establezca el tipo de curtosis:
a) GC = 0.75   b) GC = 1.27   c) GC = –2.34   d) GC = 2.15
3. Los siguientes datos corresponden a las edades en años de los médicos que laboran
en el Hospital San Felipe de Tegucigalpa:
45, 24, 27, 36, 61, 54, 37, 29, 30, 30, 53, 55, 58, 57, 44, 63, 66, 67, 26, 28, 31, 40,
40, 49, 73, 74, 78, 26, 25, 38, 39, 43, 42, 32, 33, 57, 52, 51, 29, 27, 33, 41, 54, 60,
63, 56, 55, 25, 28, 35, 35, 43, 43, 49, 53, 53, 50, 47, 48, 39, 34, 57, 61, 64, 65, 72,
66, 67, 60, 26, 34, 38, 45, 45, 50, 53, 49, 39, 39, 35 y 42.
a) Construya la distribución de frecuencias adecuada;
b) Determine la curtosis para estos datos;
c) Dibuje el gráfico que corresponde, apoyado en el histograma de frecuencias.
Medidas de dispersión 97

6.7  Asimetría estadística


La asimetría resulta útil en muchos campos. Muchos modelos simplistas asumen una
distribución normal, esto es, simétrico en torno a la media. La distribución normal tiene
una asimetría cero. Pero en realidad, los valores no son nunca perfectamente simétricos y
la asimetría de la distribución proporciona una idea sobre si las desviaciones de la media
son positivas o negativas. Una asimetría positiva implica que hay más valores distintos a
la derecha de la media.
Las medidas de asimetría, sobre todo el coeficiente de asimetría de Fisher, junto con
las medidas de apuntamiento o curtosis, se utilizan para contrastar si se puede aceptar
que una distribución estadística sigue la distribución normal o no. Esto es necesario para
realizar numerosos contrastes estadísticos en la teoría de inferencia estadística, en cual-
quiera de las ciencias de la vida.
Las medidas de asimetría son indicadores que permiten establecer el grado de sime-
tría o asimetría que presenta una distribución de probabilidad de una variable aleatoria,
sin tener que hacer su representación gráfica.
Como eje de simetría consideramos una recta paralela al eje de las ordenadas que
pasa por la media de la distribución.
Si una distribución es simétrica, existe el mismo número de valores a la derecha que
a la izquierda de la media, por tanto, se tiene el mismo número de desviaciones con signo
positivo que con signo negativo.
Decimos que hay asimetría positiva (o a la derecha) si la “cola” a la derecha de la
media es más larga que la de la izquierda, es decir, si hay valores más separados o disper-
sos a la derecha de la media.
Diremos que hay asimetría negativa (o a la izquierda) si la “cola” a la izquierda de la
media es más larga que la de la derecha, es decir, si hay valores más separados o dispersos
a la izquierda de la media.
Las gráficas siguientes pueden clarificar la teoría antes manifestada.

Grafica No. 1

Curva de asimetría Curva de asimetría


Curva simétrica
Negativa Positiva

Eje de simetría Eje de simetría Eje de simetría

En ésta gráfica no debe confundirse el punto centro sesgado a la derecha o a la izquierda,


ya que la asimetría negativa o positiva está definida de acuerdo al largo de la cola, referen-
te al pico más alto en donde se ubica el valor de la moda. Recuerde que si la gráfica es
simétrica (gráfica del centro), la moda, la mediana y la media, tienen el mismo valor, y se
encuentran en el pico más alto de la curva.
98 CAPÍTULO 6

Gráfica No. 2

– –
X Me Mo Mo Me X
Asimetría negativa Asimetría positiva

En ésta gráfica se puede apreciar la ubicación de los valores de las medidas de tendencia
central, (media, mediana y moda), y el sesgo hacia a la izquierda (Asimetría negativa), y
el sesgo a la derecha (Asimetría positiva).

Gráfica No. 3

GRAFICA DE LA ASIMETRIA

Grafica que muestra las tres (3)


curvas de asimetria según los
valores de la media, la mediana y
la moda

Media Moda Media Moda Media


Mediana Mediana Mediana
Asimétrica hacia Moda Asimétrica hacia
la izquierda Simétrica la derecha

El tercer gráfico es más evidente con respecto a la ubicación en la curva para los valores
de la media, mediana y moda.

6.7.1 Cálculo del coeficiente de asimetría de Fisher


En la teoría de la probabilidad, la medida de asimetría más utilizada parte del uso del
tercer momento estándar. La razón de esto es que nos interesa mantener el signo de las
desviaciones con respecto a la media, para determinar si éstos son mayores que las que
ocurren a la derecha de la media que las de la izquierda. No obstante, no es buena idea
tomar el momento estándar con respecto a la media de orden 1. Debido a que una simple
suma de todas las desviaciones siempre es cero.
Para el cálculo del coeficiente de simetría de Fisher, haremos uso de la fórmula si-
guiente:
3

1. ASF =
∑(x i − x) ; Datos no agrupados
ns3
3

2. ASF =
∑ f i xm − x
; Datos agrupados en distribución de frecuencias
ns3
Medidas de dispersión 99

ASF = Coeficiente de asimetría de Fisher


xi = Valor de la variable
n = Número total de observaciones
Dónde: s3 = La desviación estándar elevada al cubo o de tercer momento
fi = Frecuencia i-ésima
xm = Marca de clase o punto medio
x— = Media muestral
Notas:
1. Si ASF = 0; la distribución es simétrica
2. Si ASF > 0; la distribución es asimétrica positiva
3. Si ASF < 0; la distribución es asimétrica negativa

Ejemplo 1 (Datos no agrupados)


La siguiente distribución representa el nivel de temperatura corporal en grados centígra-
dos registrada en la tarde del día lunes en la segunda semana de clases II periodo 2016,
que les fueron tomados a 10 alumnos de la UNICAH, Campus Sagrado Corazón de Jesús,
durante su asistencia a la clínica médica del Campus en mención.
38.9, 37.2, 39.1, 39.7, 39.5, 37.1, 37.8, 37.6, 38.7, 38.4
a) Calcular el Coeficiente de asimetría de Fisher; y,
b) Concluir sobre el tipo de asimetría.
Solución inciso a)

xi (xi – x–)2 (xi – x–)3


38.9 (38.9 – 38.4)2 = 0.25 (38.9 – 38.4)3 = 0.125
37.2 (37.2 – 38.4)2 = 1.44 (37.2 – 38.4)3 = –1.728
39.1 (39.1 – 38.4)2 = 0.49 (39.1 – 38.4)3 = 0.343
39.7 (39.7 – 38.4)2 = 1.69 (39.7 – 38.4)3 = 2.197
39.5 (39.5 – 38.4)2 = 1.21 (39.5 – 38.4)3 = 1.331
37.1 (37.1 – 38.4)2 = 1.69 (37.1 – 38.4)3 = –2.197
37.8 (37.8 – 38.4)2 = 0.36 (37.8 – 38.4)3 = –0.216
37.6 (37.6 – 38.4)2 = 0.64 (37.6 – 38.4)3 = –0.512
38.7 (38.7 – 38.4)2 = 0.09 (38.7 – 38.4)3 = 0.027
38.4 (38.4 – 38.4)2 = 0.00 (38.4 – 38.4)3 = 0.000
Σxi = 384 Σ(xi – x–)2 = 7.86 Σ(x – x–)3 = –0.63
i

A continuación, se tiene que:

x=
∑x i
=
384
= 38.4
n 10

∑(xi - x) 2 7.86
s= = = 0.9345;
n-1 9
Entonces: s3 = (0.9345)3 = 0.8161
Luego el Coeficiente de asimetría está dado por:

∑( x −x ) =
3
−0.63
ASF = i
= −0.00674
ns 3
(10)(0.9345)
100 CAPÍTULO 6

Solución inciso b)
Como ASF = –0.0674 < 0; La asimetría es negativa.
Ejemplo No. 2
La siguiente distribución de frecuencias representa los pacientes y número de cirugías
realizadas por rango de edad en el Hospital Mario Catarino Rivas de la Ciudad de San
Pedro Sula, durante el primer semestre de 2015.

Rango de edad (en años) No. de cirugías realizadas (f )


10 - 15 12
16 - 21 17
22 - 27 18
28 - 33 15
34 - 39 22
40 - 45 25
46 - 51 19
52 - 57 16
58 - 63 10
Total 154

a) Calcular el Coeficiente de asimetría de Fisher


b) Concluir sobre el tipo de asimetría

Solución inciso a)
Como la media y desviación estándar se calculan por:

∑fxm ∑ fxm2 ∑ fxm∑ fxm


x= y s= −
n n −1 n ( n −1)

Entonces de la tabla siguiente, obtenemos:

Años f xm xm2 f xm f xm2 (fi)(xm− –x)3


10 - 15 12 12.5 156.25 150 1875 (12)(12.5 − 36.54)3 = −166718.82
16 - 21 17 18.5 342.25 314.5 5818.25 (17)(18.5 − 36.54)3 = −99806.422
22 - 27 18 24.5 600.25 441 10804.5 (18)(24.5 − 36.54)3 = −31416.066
28 - 33 15 30.5 930.25 457.5 13953.75 (15)(30.5 − 36.54)3 = −3305.232
34 - 39 22 36.5 1332.25 803 29309.5 (22)(36.5 − 36.54)3 = −0.001408
40 - 45 25 42.5 1806.25 1062.5 45156.25 (25)(42.5 − 36.54)3 = 5292.7175
46 - 51 19 48.5 2352.25 921.5 44692.75 (19)(48.5 − 36.54)3 = 32504.763
52 - 57 16 54.5 2970.25 872 47524 (16)(54.5 − 36.54)3 = 92691.296
58 - 63 10 60.5 3660.25 605 36602.5 (10)(60.5 − 36.54)3 = 137549.95
Σfxm2 Σfxm2 Σ = (x )(x − x–)3 = −33207.8149
i m
Total 154 =5627 =235736.5
Medidas de dispersión 101

∑ xm5627
x= = = 36.54
n 154
∑ fxm2 ∑ fxm ∑ fxm 235736.5 ( 5627 )( 5627 )
s= − = − = 14.03352
n −1 n(n −1) 153 23562

s3 = (14.03352)3 = 2763.756988

∑( fi )( xm − x )
3
−33207.8149
Ahora, como ASF = = = − 0.078
ns 3 (154 )( 2763.756988 )

Solución b)
Como ASF = –0.078 < 0; entonces la asimetría es negativa

6.7.2 Cálculo del coeficiente de asimetría de Pearson


El coeficiente de asimetría de Pearson, sólo se puede utilizar en distribuciones uniformes,
unimodal y moderadamente asimétricas. Se basa en que en distribuciones simétricas la
media de la distribución es igual a la moda.
3( x − M e )
Este coeficiente lo calcularemos por la fórmula ASP =
s
Donde:
x = la media
Me = la mediana
Notas:
1. El resultado de ASP varía entre –3 y 3
2. Si ASP < 0; La distribución será asimétrica negativa
3. Si ASP > 0; La distribución será asimétrica positiva

Ejemplo
Los siguientes datos representan el número de años trabajados para el Hospital San Felipe
de Tegucigalpa, por 12 enfermeras, seleccionadas al azar y entrevistadas sobre las condi-
ciones en que desarrollan sus actividades profesionales.
20, 15, 11, 16, 25, 17, 14, 13, 23, 28, 35, 13
a) Calcular el coeficiente de asimetría de Pearson
b) Qué tipo de asimetría presenta la distribución.

Solución inciso a)
Datos: 11, 13, 13, 14, 15, 16, 17, 20, 23, 25, 28, 35
3 (x − M e ) ; debemos calcular la media, la mediana y la desviación es-
Como ASP =
s
tándar muestral:

Y se tiene que: x– = 19.166666… Me = 16.5 y S = 7.26

3( x − M e ) 3(19.16666 −16.5 ) 7.99999


Entonces: ASP = = = = 1.1
S 7.26 7.26
102 CAPÍTULO 6

Solución inciso b)
Como ASP = 1.1 > 0; La asimetría es positiva.

EJERCICIOS 6.7
1. La siguiente distribución representa el número de pruebas diagnósticas sobre VIH
por rango de edad aplicada a 32 pacientes adultos, en un hospital privado de la Ciu-
dad de Tegucigalpa.

Rango de edad del Número de pacientes a los


paciente que se les aplicó la prueba
18 - 24 7
25 - 31 5
32 - 38 6
39 - 45 10
46 - 52 2
53 - 59 2
Total 32

a) Calcular el coeficiente de asimetría de Fisher;


b) Calcular el coeficiente de asimetría de Pearson;
c) Comparar los resultados de ambos coeficientes, realizando las conclusiones co-
rrespondientes entre ambas medidas.
2. Los siguientes datos representan un grupo de niñas y niños menores de 12 años a
quienes en una escala de 1 a 10, se les aplicó una prueba diagnóstica para determinar
el riesgo de padecer de diabetes infantil.
2.2, 7.5, 5.1, 4.6, 6.5, 3.7, 4.4, 2.3, 2.8, 3.5
a) Calcular el coeficiente de asimetría de Fisher
b) Calcular el coeficiente de asimetría de Pearson
CAPÍTULO

Tasas y estandarización
7
Contenido

7.1 Tasas
7.2 Tasas de estandarización
7.3 Método directo de estandarización de datos
7.4 Método indirecto de estandarización de datos
7.5 Uso de las tasas de estandarización
7.6 Aplicaciones adicionales
104 CAPÍTULO 7

Tasas y estandarización
Los datos demográficos y las estadísticas demográficas son cantidades con que se carac-
teriza o describe una población. Los datos demográficos incluyen información como el
tamaño de una población y su composición en lo que se refiere a género, raza y edad. Las
estadísticas demográficas describen la vida de la población: se refieren a nacimientos,
muertes, matrimonios, divorcios y casos de enfermedad. Los investigadores y profesiona-
les de la salud pública emplean ambas clases de datos para describir el estado de salud de
una población con el fin de pronosticar tendencias, elaborar proyectos y planificar servi-
cios básicos como vivienda y atención médica.
Las estadísticas demográficas también se emplean para comparar grupos. Por ejem-
plo, con el fin de evaluar tendencias de salud podríamos comparar el número de muertes
en un país en el año 1991 contra el número de muertes en el año 1992. Si por razones
naturales en el año 1991 se produjeron 2, 169, 518 decesos de personas y en el año 1992,
2, 175, 613; resultaría difícil interpretar el incremento observado, es posible que hubiere
menos muertes en 1991 por el simple hecho de que la base de población era menor ese
año, ya que mientras menor sea la población, esperaríamos ver un menor número de
muertes.

7.1 Tasas
En lugar de emplear datos brutos, se pueden utilizar las tasas con el objeto de hacer com-
paraciones más significativas entre grupos. Se define tasa como el número de casos de un
resultado particular de interés que ocurre en un período, dividido entre el tamaño de la
población en dicho período. Por ejemplo, podríamos interesarnos en la cantidad de infec-
ciones de oído diagnosticadas en un grupo determinado de estudiantes de la Universidad
Católica de Honduras durante un período de dos meses. Aunque a menudo se les emplea
indistintamente, el término tasa y proporción, no son sinónimos. Una proporción es co-
ciente en el cual los individuos representados en el numerador deben incluirse también en
el denominador, como la fracción de mujeres de alrededor de 60 años de edad que han
sufrido un ataque al corazón, carece de unidades. Una tasa incorpora unidades de medi-
ción e intrínsecamente depende de una medida de tiempo.
En lugar de comparar la cantidad total de muertes en 1991 y 1992, podríamos com-
parar las tasas de mortalidad de esos años. La tasa de mortalidad es el número de muertes
ocurridas en cierto período, como lo vimos en la sección 2.7 del presente texto. Si calculá-
ramos las tasas de mortalidad en Estados Unidos, encontraríamos que dicha tasa en 1991
es de 860.3 por cada 100,000 habitantes y que la tasa de mortalidad en 1992 es 852.9 por
cada 100,000 habitantes. Aunque en 1992 murió una cantidad mayor de gente, la tasa de
mortalidad en realidad disminuyó.
Una de las tasas de mortalidad más común registrada para una población es la tasa
de mortalidad infantil. Esta cantidad se define como el número de muertes durante un
año civil de niños menores de un año de edad, dividida entre el número de niños nacidos
vivos durante ese año. La tasa de mortalidad infantil constituye una de las mediciones
más importantes del estado de salud de una nación. Aunque las cantidades de nacimien-
tos y muertes varían considerablemente de un país a otro, resulta ilustrativo comparar las
tasas de mortalidad. La tabla 7.1 muestra las tasas de mortalidad infantil de los países
seleccionados.
Tasas y estandarización 105

Tabla 7.1 Tasas de mortalidad infantil 1992


Tasa de mortalidad por cada
País 1000 nacidos vivos
Argentina  22
Australia   7
Brasil  54
Canadá   7
China  35
Egipto  43
Etiopía 123
Finlandia   6
Francia   7
Grecia  8
India  83
Israel   9
Italia   8
Japón   4
México  28
Filipinas  46
Polonia  14
Rusia  28
Arabia Saudita  35
España   8
Suecia   6
Reino Unido   7
Estados Unidos   9
Venezuela  20

Las tasas de mortalidad que hasta ahora hemos analizado han sido tasas brutas. Una
tasa bruta es un solo número calculado como medida de resumen para una población
entera, e ignora diferencias de edad, género, raza y otras características. Factores como la
edad, sexo y raza a menudo tienen un efecto significativo en las tasas que describen las
estadísticas de esperanza de vida. Por ejemplo, si consideramos las tasas de mortalidad en
las siguientes tablas, en las cuales la tabla 7.2 muestra las muertes totales y la tabla 7.3
muestra la tasa de mortalidad para el año 1992 en Estados Unidos, y que aparte de las
tasas brutas calculado para ese mismo año, ahora estaremos presentando tasas calculadas
para varios subgrupos de individuos.

Tabla 7.2
Total de muertes por edad, raza y sexo EE. UU. 1992
Todas las razas Caucásicos
Edad Ambos Sexos Varón Mujer Ambos Sexos Varón Mujer
Todas las edades 2175613 1122336 1053277 1873781 956957 916824
Menor de un año 34628 19545 15083 22164 12625 9539
1-4 años 6764 3809 2955 4685 2690 1995
5-9 años 3739 2231 1508 2690 1605 1085
Continúa
106 CAPÍTULO 7

Tabla 7.2 (Continuación)


Total de muertes por edad, raza y sexo EE. UU. 1992
Todas las razas Caucásicos
Edad Ambos Sexos Varón Mujer Ambos Sexos Varón Mujer
10-14 años 4454 2849 1605 3299 2093 1206
15-19 años 14411 10747 3664 10328 7440 2888
20-24 años 20137 15460 4677 14033 10696 3337
25-29 años 24314 18032 6282 17051 12825 4226
30-34 años 34167 24863 9304 24450 18210 6240
35-39 años 42089 29641 12448 30127 21690 8437
40-44 años 49201 33354 15847 35886 24726 11160
45-49 años 56533 36622 19911 43451 28343 15108
50-54 años 68497 42649 25848 53689 33681 20008
55-59 años 94582 58083 36499 75750 47042 28708
60-64 años 146409 88797 57612 122213 74994 47219
65-69 años 211071 124228 86843 180788 107427 73361
70-74 años 266845 149937 116908 234117 132273 101844
75-79 años 301736 158257 143479 270238 142422 127816
80-84 años 308116 141640 166476 279507 128484 151023
85 años y más 487446 161236 326210 448984 147419 301565
No establecido 474 356 118 351 272 79

Tabla 7.3
Total de muertes por edad, raza y sexo EE. UU. 1992
Todas las razas Caucásicos
Edad Ambos Sexos Varón Mujer Ambos Sexos Varón Mujer
Todas las edades 852.9 901.6 806.5 880.0 917.1 844.3
Menor de un año 865.7 956.6 770.8 701.8 780.9 618.7
1-4 años 43.6 48.0 39.0 38.1 42.6 33.3
5-9 años 20.4 23.7 16.8 18.3 21.3 15.2
10-14 años 24.6 30.7 18.2 22.8 28.2 17.2
15-19 años 84.3 122.4 44.0 75.6 106.0 43.3
20-24 años 105.7 159.4 50.1 91.0 135.4 44.3
25-29 años 120.5 178.0 62.5 103.2 153.3 51.9
30-34 años 153.5 224.0 83.3 132.4 195.8 68.1
35-39 años 199.5 282.8 117.2 171.2 245.5 96.3
40-44 años 261.6 359.1 166.5 226.3 312.2 140.6
45-49 años 368.0 485.7 254.6 328.6 432.5 226.5
50-54 años 568.2 728.1 417.1 518.6 663.4 379.3
55-59 años 902.1 1156.5 668.2 835.1 1071.5 613.4
60-64 años 1402.2 1815.2 1038.2 1334.9 1729.7 979.7
65-69 años 2114.8 2775.4 1577.7 2042.6 2688.5 1511.0
Tasas y estandarización 107

Tabla 7.3 (Continuación)


70-74 años 3146.8 4109.3 2419.9 3073.0 4012.4 2356.4
75-79 años 4705.9 6202.4 3716.8 4662.2 6148.8 3672.7
80-84 años 7429.1 9726.0 6186.1 7391.0 9700.5 6146.1
85 años y más 14972.9 17740.4 13901.0 15104.2 17956.2 14015.9

Examinando las tablas 7.2 y 7.3, vemos que las mujeres tienden a tasas de mortalidad
menores que los varones. Las tasas que se calculan dentro de los subgrupos relativamente
pequeños y bien definidos se denominan “tasas específicas”.

7.2  Tasas de estandarización


Un problema que surge a menudo al comparar datos brutos en distintos grupos, es el he-
cho de que la población puede diferir sustancialmente en lo que respecta a características
importantes, como edad y sexo. Por ejemplo, si tenemos dos poblaciones de distintas re-
giones geográficas, una compuesta enteramente por hombres y la otra por mujeres, jamás
podremos estar seguros de sí una diferencia en sus tasas de mortalidad se debe a la loca-
lidad o a alguna influencia del género. En este caso, al género se le da el nombre de “factor
de confusión”. Como se relacionan con la región geográfica y, con la tasa de mortalidad,
oscurece la verdadera relación entre estos factores.
Para determinar si es justo afirmar que los individuos que no se encuentran en la
fuerza laboral tienen un riesgo más alto de daño a los órganos de su cuerpo expuestos a
las actividades peculiares de la misma, que los que se encuentran empleados o desarrollan
una actividad permanente relacionada con los riesgos profesionales y técnicos. Por tanto,
sería prudente verificar si las dos subpoblaciones poseen las mismas estructuras funda-
mentales. La tabla 7.4 representa información relacionada con este tipo de análisis.

Tabla 7.4
Edad Empleado Fuera de la fuerza laboral
Población Porcentaje Población Porcentaje
17 - 44 67987 68,5 20760 36,6
45 - 64 27592 27,9 15108 26,6
65+ 3338 3,4 20910 36,8
TOTAL 98917 100 56778 100

Relación de fuerza laboral empleada y desempleada


Como podemos observar a partir de las frecuencias relativas, ambos grupos difieren en el
contenido de edades: los individuos fuera de la fuerza laboral son considerablemente
mayores que los que cuentan con un empleo.
Si analizamos en seguida las tasas de daños por edad específica en la población estu-
diada en conjunto, tenemos:

Tabla 7.5
Edad Poblacion Daños Tasa por cada 1000
17 - 44  94930 441 4,65
45 - 64  43857 308 7,02
65+  24370 198 8,12
163157 947 5,8
108 CAPÍTULO 7

Observe que la tabla bruta de daños por lesiones a algún miembro del organismo ex-
puesto a riesgo en la totalidad de la población estudiada es en realidad un promedio
ponderado de las tasas específicas por edad: en particular,

5.80 =
(94930)( 4.65) +( 43857 )(7.02 ) + ( 24370)(8.12 )
163157
Las tasas específicas por edad se ponderan por el número de individuos de cada gru-
po. Observe asimismo que la tasa de daños se incrementa con la edad. La edad es un
factor de confusión en relación entre daños a un órgano del cuerpo y el estado laboral, y
se relaciona de forma independiente con cada una de estas cantidades. Como consecuen-
cia, no podemos estar seguros de sí una tasa más alta de daños entre individuos que no
pertenecen a la fuerza laboral es resultado de alguna característica inherente de los miem-
bros de éste grupo, o si se trata sencillamente de la influencia de la edad.
Con el objeto de hacer una comparación más precisa entre las dos subpoblaciones,
deberíamos considerar las tasas de daño específicas por edad en lugar de las tasas brutas
en conjunto.
En la siguiente tabla presentamos la información de acopio en el párrafo anterior.

Tabla 7.6
Empleado Fuera de la fuerza laboral
Edad Tasa por Tasa por
Poblacion Daños Cada 1000 Poblacion Daños Cada 1000
17 - 44 67987 346 5,09 20760  80 3,85
45 - 64 27592 179 6,49 15108 117 7,74
65+  3338  27 8,09 20910 171 8
Total 98917 552 5,58 56778 368 18
Resulta difícil derivar una conclusión sucinta sobre la base de estos dos conjuntos de
tasas. En los individuos sobre los 45 años de edad la tasa de daños es superior en quienes
no pertenecen a la fuerza laboral respecto de los que se encuentran empleados; los que se
encuentran entre los 17 y 44 años, la tasa es mucho más baja en personas que no pertene-
cen a la fuerza laboral. Comparándolas, las tasas brutas de daños de las dos subpoblacio-
nes nos brindan un cuadro incompleto de la verdadera situación.
Aunque las tasas específicas por subgrupo proporcionan una comparación más exac-
ta entre poblaciones que las tasas brutas si tuviéramos muchos subgrupos, podríamos
terminar con una cantidad abrumadora de tasas por comparar. Sería conveniente reunir
el caso completo con un solo número de cada subpoblación, un número que corrija las
diferencias en la estructura de estas composiciones. En la práctica, hay dos formas de
calcular dicho resumen.
La primera se conoce como el método directo de estandarización; la segunda se de-
nomina método indirecto de estandarización. Ambas estrategias se enfocan en los dos
componentes que figuran en el cálculo de una tasa bruta. La composición de la población
y sus tasas específicas por subgrupo e intentan resolver el problema de la confusión man-
teniendo constante en las poblaciones uno de estos componentes.

7.3  Método directo de estandarización de datos


El método directo de ajuste de diferencias entre poblaciones se centra en el cálculo total de
tasas que resultarían si, en lugar de tener diferentes distribuciones todas las poblaciones que
se comparan tuvieran la misma composición estándar. El primer paso para aplicar esta
Tasas y estandarización 109

técnica consiste en elegir la distribución estándar. En el caso de los daños a un órgano


anatómico de personas empleadas y desempleadas que hemos venido tratando en el presen-
te capítulo, suponiendo que cada uno de los subgrupos tuviera esta distribución estándar de
población mientras retienen sus propias tasas específicas de daños por edad individuales.
La tabla 7.7 representa las cantidades esperadas para cada subgrupo tratado anterior-
mente.

Tabla 7.7
Total Empleados Desempleados
(2) Tasa por (3) Daños (4) Tasa por (5) Daños
Edad (1) Población cada 1000 esperados cada 1000 esperados
17 - 44 94930 5,09 483,2 3,85 365,5
45 - 64 43857 6,49 284,6 7,74 339,5
65+ 24370 8,09 197,2 8,18 199,3
Total 163157 965 904,3

El cálculo de los daños esperados para los individuos que tienen un empleo se obtu-
vieron al multiplicar la columna (1) por la columna (2) y dividiendo entre 1000, y las
cantidades de daños esperados para los desempleados o fuera de la fuerza laboral se ob-
tienen al multiplicar la columna (1) por la columna (4) y dividiendo entre 1000.
Después, la tasa de daños ajustada por edad de cada grupo se calcula dividiendo su
número total esperado de daños entre la población total estándar.
965.0
Empleados: = 5.91 por cada 1000
163157
904.3
Desempleados: = 5.54 por cada 1000
163157
Estas tasas ajustadas por edad constituyen las tasas de daños que se aplicarían si ambos
grupos de individuos, los que trabajan y los que no, tuvieran la misma distribución de
edades que la de la población estudiada. Después de controlar los efectos de la edad, la
tasa de daños ajustada de individuos que laboran es mayor que la tasa de individuos des-
empleados. Esto es contrario a lo que observamos cuando vimos las tasas brutas, lo cual
implica que estas tasas brutas de hecho recibían la influencia de la estructura de edad de
los grupos subyacentes.
Observe que la elección de una distribución estándar por edad diferente (columna
(1)) de la tabla 7.7, nos habría conducido a diferentes tasas ajustadas de daño. No obstan-
te, esto no tiene importancia, pues una tasa ajustada carece de significado en sí misma. Se
trata solo de una elaboración calculada sobre la base de una distribución estándar hipoté-
tica; a diferencia de una tasa bruta o específica, no refleja la verdadera tasa de daños de
una población. Las tasas ajustadas poseen significado solo cuando comparamos dos o
más grupos, y se ha probado que la elección de un modelo por lo general no afecta las
tendencias entre grupos. En general, su composición no debería desviarse radicalmente
de las de los grupos comparados. Si eligiéramos una distribución estándar por edades ra-
zonable pero diferente para los datos de daños en el presente problema, no debería cam-
biar drásticamente, aunque las tasas mismas si lo hicieran los que trabajan deberían aun
tener una tasa ajustada de daños ligeramente más alta.

7.4  Método indirecto de estandarización de datos


El método indirecto de ajuste de diferencias en la composición implica el uso de un con-
junto de tasas específicas por edades de daños junto a la composición de edades de cada
110 CAPÍTULO 7

subpoblación comparada. De nuevo utilizaremos toda la población estudiada como están-


dar. No obstante, esta vez calcularemos la cantidad de daños que habrían ocurrido en los
dos subgrupos poblacionales si cada uno hubiera tomado las tasas específicas de daños
por edades como un todo mientras conservan su propia distribución de edades.

Tabla 7.8
Total Empleados Desempleados
Edad (1) Tasa por (2) (3) Daños (4) (5) Daños
cada 1000 Población esperados Población esperados
17 - 44 4.65 67987 316.1 20760 96.5
45 - 64 7.02 27592 193.7 15108 106.1
65+ 8.12  3338  27.1 20910 169.8
Total 5.8 98917 536.9 56778 372.4
Las cantidades esperadas de daños entre los que laboran se calculan al multiplicar la
columna (1) por la columna (2) y dividiendo entre 1000; los daños esperados para los que no
trabajan se obtienen multiplicando la columna (1) por la columna (4) dividiendo entre 1000.
En seguida dividimos el número de daños observados en cada grupo de empleados
entre el número total de daños esperados. La cantidad que resulta se denomina “razón de
morbilidad estandarizada”. Si los datos se refieren a las muertes en lugar de los daños, al
dividir el número de muertes entre el número esperado obtendríamos la razón de morta-
lidad estandarizada.
552
Empleados: = 1.03 = 103%
536.9
368
Desempleados: = 0.99 = 99%
372.4
Estas razones de morbilidad estandarizadas indican que el grupo de individuos actual-
mente empleados tiene una tasa de daños del 3% más que la población estudiada en con-
junto, mientras que el grupo desempleado tiene una tasa de daños 1% más baja que la de
la población entera. Recuerde que la población total estudiada también incluye el grupo
de individuos que en la actualidad están desempleados.
La aplicación del método indirecto a menudo concluye con una composición de las
razones estandarizadas. No obstante, podríamos continuar y calcular las tasas de daños
ajustadas reales de cada grupo. Estas tasas se obtienen al multiplicar la tasa de daños
bruta para el total de la población estudiada por las razones estandarizadas adecuadas.
5.80
Individuos empleados: x1.03 = 5.97 por cada 1000.
100
5.80
Individuos desempleados: x 0.99 = 5.74 por cada 1000.
100
Al eliminar el efecto de la edad, el grupo de individuos empleados parece tener de nuevo
una tasa ajustada de daños un poco más alta que los que no pertenecen a la fuerza laboral.
Aunque las tasas mismas son diferentes, se trata de la misma conclusión a la que se llegó
al aplicarse el método directo de estandarización.

7.5  Uso de las tasas de estandarización


La tasa de estandarización, y las tasas ajustadas por edad en particular, con frecuencia
aparecen en el estudio de la estadística demográfica. Un ejemplo interesante abarca datos
de tres diferentes estudios sobre la relación entre la tasa de mortalidad y los fumadores.
Tasas y estandarización 111

Cada estudio compara tres grupos de hombres: no fumadores, fumadores de cigarrillos y


fumadores de puro. A continuación, se muestran las tasas de mortalidad por cada 1000
personas. Estas tasas se calcularon dividiendo el total de muertes en cada grupo entre los
correspondientes años por persona y multiplicando por 1000. Un año-persona es una
unidad de tiempo definida como una persona a la que se le hace seguimiento durante un
año; de hacer esto a diez diferentes individuos durante un año a cada uno, tendríamos un
total de diez años-persona, y de hacer el seguimiento a cinco personas durante dos años a
cada una, también tendríamos diez años-persona.

Tabla 7.9
Grupo de Tasa de mortalidad por cada 1000 años persona
fumadores Canada Gran Bretaña Estados Unidos
No fumadores 20,2 11,3 13,5
Cigarrillos 20,5 14,1 13,5
Puros 35,5 20,7 17,4
Los estudios llevados a cabo en Canadá, Gran Bretaña y Estados Unidos parecen
comunicar el mismo mensaje; los individuos que fuman puros debería de abandonar el
hábito, o, cuando menos, cambiar a cigarrillos. No obstante, no olvide que todos estos
fueron estudios de observación.
En un estudio de observación, el investigador no tiene control sobre la observación de
un tratamiento u orientación, más bien los individuos en estudio determinan su propia
orientación y el investigador sencillamente observa lo que sucede con ellos. Es posible que
los grupos difieran sustancialmente en características distintas de la clase de fumadores.
Por ejemplo, si consideramos las edades medias de los diferentes grupos de fumado-
res, encontraríamos que difieren considerablemente. Para ilustrarlo, las edades medias de
los tres grupos en cada uno de los estudios se muestran a continuación.

Tabla 7.10
Grupo de Edad media (en años)
fumadores Canada Gran Bretaña Estados Unidos
No fumadores 54,9 49,1 57
Cigarrillos 50,5 49,8 53,2
Puros 65,9 55,7 59,7
En general, los fumadores de puros tienden a ser mayores que los no fumadores de
cigarrillos.
Como consecuencia de las diferencias de edad, las tasas de mortalidad se estandarizaron
al separar tres diferentes subclases; las categorías por edad se eligieron de manera que cayera
aproximadamente la misma cantidad de individuos dentro de cada clase. Si el grupo de no
fumadores se elige de manera que proporcione la distribución de edad estándar, se obtienen
las tasas de mortalidad ajustadas mediante el método directo que figura en la siguiente tabla.

Tabla 7.11
Grupo de Tasa de mortalidad por cada 1000 años-persona
fumadores Canada Gran Bretaña Estados Unidos
No fumadores 20,2 11,3 13,5
Cigarrillos 28,3 12,8 17,7
Puros 21,2 12 14,2
112 CAPÍTULO 7

Observe que estas tasas no pueden calcularse a partir de la información proporciona-


da, y en la continuación del análisis se tiene que las tasas ajustadas de los no fumadores
son idénticas a las tasas brutas, como se esperaba, a causa de que este grupo se utilizó
como la distribución estándar. Note que fumar cigarrillos parece mucho más peligroso de
lo que habíamos observado antes. Además, las tasas de mortalidad ajustadas para los fu-
madores de puros son considerablemente más bajas que las tasas brutas. Por tanto, des-
pués de ajustar las diferencias de edad, obtenemos una interpretación muy diferente de los
datos.
En la práctica, el método directo de estandarización es mucho más frecuente que el
método indirecto. Cuando se aplica el método directo de estandarización, las tasas espe-
cíficas por subgrupo deben tener las mismas tendencias generales en todos los grupos
comparados, así como en la población estándar. Mas explícitamente, si graficamos las
tasas especificas por subgrupo para los diferentes grupos, las tendencias serían idealmen-
te paralelas cuando lo observemos gráficamente.

7.6  Aplicaciones adicionales


Supongamos que nos interesa comparar las tasas de mortalidad de dos Estados, Colorado
y Luisiana. ¿Cómo hacerlo? Para comenzar, consideremos los siguientes datos, que espe-
cifican las cantidades de nacidos vivos y el número de muertes de niños menores de un
año de edad, ocurridas en cada estado en el año de 1987.

Tabla 7.12
Nacidos Muertes Tasa por
Estado vivos infantiles cada 1000
Colorado 53808 527  9.8
Luisiana 73967 872 11.8

Los datos brutos muestran que la tasa de mortalidad infantil de Colorado es 9.8 por
cada 100 nacidos vivos, mientras que la Luisiana tiene mayor probabilidad de morir antes
de alcanzar un año de edad que los nacidos en Colorado.
Antes de informar este resultado, podríamos estudiar nuestra sospecha de que la tasa
de un factor de confusión en relación entre el Estado y la tasa de mortalidad infantil. Por
tanto, primero exploremos las distribuciones raciales subyacentes en las dos poblaciones.

Tabla 7.13
Colorado Louisiana
Raza
Nacidos vivos Porcentaje Nacidos vivos Porcentaje
Afroamericana 3166 5.9 29670 40.1
Caucásica 48805 90.7 42749 57.8
Otra 1837 3.4 1548 2.1
Total 53808 100 73967 100

Las frecuencias relativas indican que los estados difieren en su estructura racial. En
Colorado, la mayoría de los nacidos vivos son niños de raza caucásica; en Luisiana, un
porcentaje mayor de niños son afroamericanos.
En seguida analizamos la tasa de mortalidad específica por raza en la población ente-
ra de Estados Unidos en 1987.
Tasas y estandarización 113

Tabla 7.14
Nacidos Muertes Tasas por
Raza vivos infantiles cada 1000
Afroamericana 641567 11461 17,9
Caucásica 2992488 25810 8,6
Otra 175339 1137 6,5
Total 3809394 38408 10,1

La tasa bruta de mortalidad infantil para Estados Unidos es un promedio ponderado


de las tasas específicas por raza; observe que:

10.1 =
(641567 )(17.9 ) + ( 2992488)(8.6 ) + (175339)(6.5)
3809394

De la tabla anterior observamos que la tasa de mortalidad infantil es considerable-


mente es más alta entre niños afroamericanos que entre caucásicos. Debido a que la raza
se asocia con el estado y la tasa de mortalidad infantil, es un factor de confusión en la
relación entre estas dos cantidades. Tal vez la tasa bruta de mortalidad infantil más alta
en Luisiana sea una consecuencia de la mayor proporción de niños afroamericanos que
nacen allí.
Se puede hacer una comparación más precisa entre los dos estados al observar las
tasas específicas de mortalidad infantil por raza en lugar de las tasas brutas.

Tabla 7.15
Colorado Luisiana
Raza Nacidos Muertes Tasa por Nacidos Muertes Tasa por
vivos infantiles cada 1000 vivos infantiles cada 1000
Afroamericana 3166 52 16,4 29670 525 17,7
Caucásica 48805 469 9,6 42749 344 8
Otra 1837 6 3,3 1548 3 1,9
Total 53808 527 9,8 73967 11,8

Entre los niños afroamericanos, la tasa de mortalidad infantil es más alta en Luisiana
que en Colorado; no obstante, entre los niños caucásicos y los de otros grupos raciales, la
tasa de mortalidad infantil es más alta en Colorado. Aunque las tasas específicas por raza
proporcionan la información más detallada acerca de estas dos poblaciones, sería conve-
niente resumir toda la situación con un par de números una para cada estado que ajuste
las diferencias en la composición racial.
Con el fin de aplicar el método directo de estandarización elegimos primero una
distribución estándar por raza; en este ejemplo, utilizamos todos los nacidos vivos en Es-
tados Unidos en 1987. En seguida calculamos el número de muertes infantiles que ha-
brían ocurrido en cada uno de los estados si ambos poseyeran esta composición racial
estándar mientras conservaran sus propias tasas específicas de mortalidad por raza.
114 CAPÍTULO 7

Tabla 7.16
EUA Colorado Luisiana
Nacidos Tasa por Muertes Tasa por Muertes
Raza vivos cada 1000 esperadas cada 1000 esperadas
Afroamericanos 641567 16,4 10521,7 17,7 11355,7
Caucásicos 2992488 9,6 28727,9 8 23939,9
Otras 175339 3,3 578,6 1,9 333,1
Total 3809394 39828,2 35628,7

Las cantidades de muertes esperadas se calculan multiplicando el número total de


nacidos vivos en Estados Unidos de un grupo racial particular por las tasas específicas de
cada raza en cada estado, y dividiendo entre 1000.
La tasa de mortalidad infantil ajustada por raza de cada estado se calcula dividiendo
su número total esperado de muertes de niños entre el número de nacidos vivos en la
población estándar.
39828.2
Colorado: = 10.5 por cada 1000
3809394
35628.7
Luisiana: = 9.4 por cada 1000
3809394

Estas tasas ajustadas por raza son las tasas de mortalidad infantil que se aplicarían a los
nacidos vivos tanto en Colorado como en Luisiana tuvieran la misma distribución que
Estados Unidos como un todo. Aunque la tasa de mortalidad infantil bruta para Luisiana
es más alta que la tasa bruta para Colorado, la tasa de mortalidad infantil ajustada en
Colorado es mayor después de controlar el efecto de la raza.
Se puede concluir que el uso del método de estandarización directa nos llevó a verifi-
car que ambos estados los niños afroamericanos tienen la tasa de mortalidad infantil más
alta, seguidos por los niños caucásicos y en seguida por la de otros grupos raciales.

Aplicando el método de estandarización indirecto


Si se aplicara el método de estandarización indirecto, debemos elegir un conjunto modelo
de tasas específicas de mortalidad infantil por raza y aplicarlas a las cantidades reales de
nacidos vivos en cada estado. De nuevo elegimos como modelo los nacidos vivos en Esta-
dos Unidos en 1987. Luego calculando las muertes infantiles que habrían ocurrido en
cada estado si asumiéramos los valores de las tasas específicas de mortalidad infantil por
raza en Estados Unidos en conjunto mientras retuvieran sus propias distribuciones
por raza.

Tabla 7.17
Tasa por Nacidos Muertes Nacidos Muertes
Raza cada 1000 vivos esperadas vivos esperadas
Afroamericanos 17,9 3166 56,7 29670 531,1
Caucásicos 8,6 48805 419,7 42749 367,6
Otras 6,5  1837 11,9  1548 10,1
Total 10,1 53808 488,3 73967 908,8

Las cantidades esperadas de muerte se calculan al multiplicar las tasas especificas por
raza en Estados Unidos por las cantidades de nacidos vivos en cada estado y dividiéndo-
Tasas y estandarización 115

las entre 1000. La razón de mortalidad estandarizada para cada estado se obtiene al divi-
dir la cantidad de muertes de niños observadas entre el total de muertes esperadas.
527
Colorado: = 1.08 = 108%
488.3
827
Luisiana: = 0.96 = 96%
908.8
Estas razones de mortalidad estandarizadas indican que Colorado tienen una tasa de
mortalidad infantil 8% más alta que Estados Unidos en conjunto, mientras Luisiana tie-
nen una tasa de mortalidad infantil de 4% más baja.
Recuerde que para todos los estados la línea de tendencia es de 100%, y por eso Co-
lorado refleja un 8% arriba de la línea de tendencia, mientras que Luisiana un 4% por de-
bajo de la línea de tendencia.
Por último, calculamos la tasa de mortalidad infantil ajustada por raza para cada es-
tado multiplicando su razón de mortalidad estandarizada por la tasa bruta de mortalidad
infantil en la población modelo, 10.1 por cada 1000 nacidos vivos.
10.1
Colorado: x1.08 = 10.9 por cada 1000
1000
10.1
Luisiana: x0.96 = 9.7 por cada 1000
1000
Tras controlar los efectos de la raza, Colorado tiene de nuevo una tasa de mortalidad infan-
til ajustada más alta que Luisiana. Aunque las tasas mismas difieren, se trata de la misma
conclusión a la que llegamos cuando aplicamos el método de estandarización directo.

EJERCICIOS 7.0
1. ¿Qué son los datos demográficos y las estadísticas demográficas?
2. Los datos demográficos y las estadísticas demográficas, ¿Cómo se les puede emplear
para describir el estado de salud de una población?
3. ¿Cuál es la diferencia entre tasa y proporción?
4. ¿Qué es un factor de confusión?
5. ¿Cómo difiere el método de estandarización directo del indirecto?
6. ¿Cómo influye la elección de una distribución de una población modelo, en los resul-
tados del proceso de estandarización?
7. ¿En qué circunstancias se deberían utilizar las tasas brutas, las específicas y las ajus-
tadas?
8. En 1992 se registraron los datos siguientes en el Estado de Massachusetts.

Cantidad
Población 6060943
Nacidos vivos 87202
Muertes
Total 53804
Menores de un año 569

Calcule las siguientes tasas:


a) Tasa bruta de nacimiento;
b) Tasa bruta de mortalidad;
c) Tasa de mortalidad infantil
116 CAPÍTULO 7

9. En la tabla siguiente, las cantidades de nacidos vivos y muertes infantiles en Estados


Unidos en 1983, se clasifican por peso al nacer.

Peso al nacer (gramos) Nacidos vivos Muertes infantiles


2500 y + 3385912 15349
1500 - 2499 204534 6136
750 - 1499 31246 7283
500 - 749 7594 5815
< 500 4444 3937
Desconocido 5383 1163
Total 3639113 39683

a) Calcule la tasa de mortalidad infantil para cada categoría de peso al nacer;


b) ¿Qué puede usted concluir sobre la relación entre la mortalidad infantil y el peso
al nacer?
c) ¿Piensa usted que una población mayor de niños cuyo peso al nacer se desconoce
pesará probablemente menos de 1500 gramos?
10. Considere los siguientes datos que comparan la mortalidad por cáncer en Estados
Unidos en 1940 y 1986.

1940 1986
Edad
Población (miles) Muertes Población (miles) Muertes
0-4 10541 494 18152 666
5 - 14 22431 667 33860 1165
15 - 24 23922 1287 39021 2115
25 - 34 21339 3696 42779 5604
35 - 44 18333 11198 33070 14991
45 - 54 15512 26180 22815 37800
55 - 64 10572 39071 22232 98805
65 - 74 6377 44328 17332 146803
75+ 2643 31279 11836 161381
Total 131670 158200 241097 469330

a) Calcule las tasas brutas de mortalidad por cáncer de 1940 y 1986, y comparándolas;
b) Calcule la proporción total de la población de 1940 y 1986, en cada grupo de eda-
des. Describa de qué manera difieren dos poblaciones con respecto a su composi-
ción por edades;
c) Calcule las tasas específicas por edades de mortalidad por cáncer de cada pobla-
ción. ¿Existe alguna relación entre las tasas de mortalidad y edad?
d) Para necesario controlar el efecto de la edad cuando se comparan las tasas de
mortalidad por cáncer en ambas poblaciones. ¿Por qué?
e) Con la población de Estados Unidos como distribución modelo, aplique el méto-
do de estandarización directo. ¿Cuáles son las tasas de mortalidad por cáncer
ajustadas por edades de 1940 y 1986?
f) Con las tasas especificas por edades de mortalidad por cáncer de 1940 como mo-
delo, aplique el método de estandarización indirecto para calcular las razones de
mortalidad estándar de 1940 y 1986.
CAPÍTULO

Tablas de vida
8
Contenido

8.1 Cálculo de las tablas de vida


8.2 Aplicaciones de las tablas de vida
118 CAPÍTULO 8

Tablas de vida
Resulta prácticamente imposible predecir el tiempo que vivirá cierta persona, y mucho
más predecir lo que le resta de vida a cada individuo en una población de millones de
habitantes. A pesar de este hecho, corresponde a los planificadores de políticas evaluar y
describir la salud y longevidad de una nación entera. Durante muchos años las tablas de
vida se han utilizado como medio de resumir el estado de salud de un grupo de individuos.
Tal como en el caso de las técnicas que hemos estudiado en los capítulos anteriores, las
tablas demográficas son de naturaleza descriptiva, incluyen gran variedad de aplicacio-
nes; y un tipo de ellas son las tablas de vida, las cuales identifican las tasas de mortalidad
que experimenta una población particular, para establecer comparaciones internaciona-
les, para calcular primas de seguros y anualidades, y predecir la supervivencia. También
se les ha empleado, inútilmente, en el debate respecto a la existencia de un límite biológi-
co de la vida humana.
Al observar un conjunto ficticio de individuos o cohorte, normalmente un grupo de
100,000 personas, desde el nacimiento hasta que el último individuo del conjunto haya
muerto, una tabla de vida describe la experiencia de mortalidad del grupo en un periodo
específico de tiempo.
La siguiente tabla muestra un modelo de la tabla de vida abreviada de la población
total de Estados Unidos en 1992.

Tabla 8.1

Proporción de Tiempo de
Intervalo individuos que vida promedio
de edad mueren De cada 100,000 nacidos vivos Población estacionaria restante
Proporción
de personas Número
vivas al inicio Número de promedio de
Periodo de del intervalo Número de individuos En este y todos años de vida
vida entre dos de edad individuos vivos que mueren los intervalos restantes al
edades exactas que mueren al comienzo durante el de edad comienzo del
establecidas en durante el del intervalo de intervalo de En el intervalo subsecuentes intervalo de
años (1) intervalo (2) edad (3) edad (4) de edad (5) (6) edad (7)
xax+n nqx Lx ndx nLx Tx ex
00 - 01 0.00851 100000 851 99275 7577757 75.8
01 - 05 0.00172 99149 171 396195 7478482 75.4
05 - 10 0.00102 98978 101 494615 7082287 71.6
10 - 15 0.00121 98877 120 494192 6587672 66.6
15 - 20 0.00418 98757 413 492848 6093520 61.7
20 - 25 0.00528 98344 519 490448 5600672 56.9
25 - 30 0.00601 97825 588 487654 5110224 52.2
30 - 35 0.00765 97237 744 484369 4622570 47.5
35 - 40 0.01001 96493 966 480187 4138201 42.9
40 - 45 0.01305 95527 1247 474740 3658014 38.3
45 - 50 0.01822 94280 1718 467420 3183274 33.8
50 - 55 0.02799 92562 2591 456739 2715854 29.3
55 - 60 0.04421 89971 3978 440481 2259115 25.1
Tablas de vida 119

Tabla 8.1 (Continuación)


60 - 65 0.06800 85993 5848 416137 1818634 21.2
65 - 65 0.10084 80145 8082 381393 1402497 17.5
65 - 70 0.14673 72063 10574 334799 1021104 14.2
75 - 80 0.21189 61489 13029 275667 686305 11.2

8.1  Cálculo de las tablas de vida


Referente a la tabla 8.1 el intervalo de edad representa el periodo de vida entre la edad x
y la edad x + n, donde n es la amplitud del intervalo. Por tanto, 0 -1 designa el periodo
de un año de vida desde el nacimiento hasta el primer aniversario del individuo. El inter-
valo 1 – 5 representa el tiempo desde el primer cumpleaños hasta el quinto, un intervalo
de 4 años. Los demás intervalos representan 5 años con excepción del último periodo
que se trata de un intervalo abierto y representa el periodo de vida más allá de los 85
años.

Columna 2
La segunda columna de la tabla 8.1 representada por nqx enlista la proporción de indivi-
duos vivos al comienzo del intervalo de edad xax + n que mueren en algún momento du-
rante el intervalo. A esta cantidad también se le denomina función de riesgo; es posible
calcularla a partir de las tasas específicas de mortalidad para edades de la población de
Estados Unidos en 1992. Por ejemplo:
1q0 = Proporción de individuos vivos al nacer que mueren antes de su primer año de
edad.
Si recordamos de la tabla 7.3 la tasa de mortalidad global para todas las razas en Es-
tados Unidos en 1992 menores de un año era de 865.7 por cada 100,000 habitantes, por
tanto tenemos que: 1q0 = 865.7/100000 = 0.008657 ≈ 0.00851; para el manejo de cinco
posiciones, después del punto decimal.
:: ∞ q85 = proporción de individuos vivos en su aniversario número 85, quienes mueren
durante el periodo posterior a su aniversario número 85 = 1.00000; pues la
muerte es inevitable.
El resto de datos en la columna 2, no necesariamente fácil de calcular, pero de alguna
manera apoyado en algunos métodos gráficos o determinando en forma de cocientes la
tasa global de mortalidad por cada 100,000 personas, también puede ser determinado.

Columnas 3 y 4
La tercera columna de la tabla de vida Lx muestra el número de individuos de entre la
cantidad original de 100,000 que permanecer vivos en su aniversario x. Observe que los
encabezados de la columna con un solo subíndice se refieren a las condiciones al comien-
zo del intervalo de edad, y los que tienen dos subíndices especifican condiciones dentro
del intervalo. De aquí que la cuarta columna ndx muestra una lista del número tomado de
los Lx individuos vivos al principio del intervalo x a x + n que mueren en algún momento
durante ese intervalo. Los cálculos de la tercera y cuarta columna son independientes;
también dependen de la columna 2. Para ilustrar este punto L0 es la cantidad de indivi-
duos nacidos dentro del conjunto el cual es 100,000. La cantidad de individuos que mue-
120 CAPÍTULO 8

re antes de su primer cumpleaños es el total de los individuos nacidos vivos multiplicados


por la proporción de individuos que mueren durante el intervalo de edad 0 – 1, o sea:
1d0 = 100,000 × 1q0 = 100,000 × 0.00851 = 851
Por tanto, el número de individuos de la cantidad original de 100,000 habitantes que
llegan vivos a su primer aniversario es:
L1 = 100,000 × 0.00851 = 851
Asimismo, 4d1 = (99149)(4q1) = (99149)(0.00172) = 171
Ls = 99149 – 171 = 98978, y así sucesivamente hasta completar las columnas corres-
pondientes.
En general la cantidad de individuos vivos al principio de un intervalo particular es
igual al número de individuos que estaban vivos al comienzo de los intervalos anteriores
menos el número de individuos que murieron durante el intervalo, es decir:
Lx + n = Lx – ndx
Para el cálculo de los datos de la columna 4, o sea ndx lo efectuaremos a través de:
ndx = (Lx)(ndx )

Columna 5
La columna 5 de la tabla de vida representada por nLx se denomina población estaciona-
ria dentro de un intervalo. Los demógrafos utilizan este concepto que puede interpretarse
de la siguiente manera. Supongamos que nace cada año un conjunto de 100,000 indivi-
duos. Además, supongamos también que la proporción de individuos que muere dentro
del intervalo de edad x a x + n está dado por nqx en la columna 2. Como resultado las
tasas específicas de mortalidad de edades de 1992 aplican a cada grupo. Si no ocurren
casos de migración y permitimos que una cantidad suficiente de años, alcanzaríamos una
población estacionaria o sea el número de personas vivas en cualquier grupo por edades,
jamás cambiaría. Tan pronto como un individuo abandona un intervalo ya sea porque
muere o porque aumenta su edad y por consiguiente entra en el intervalo subsecuente al-
guien del grupo de edades precedente ocuparía su lugar. La población estacionaría nLx
tiene asimismo otra interpretación. Se puede considerar como el tiempo total de años vi-
vidos durante el intervalo de edades x a x + n, por los Lx individuos al principio del inter-
valo. Considere, por ejemplo, el intervalo de edades 1 – 5. Existen L1 = 99149 individuos
vivos al comienzo de este intervalo. De estos 99149 individuos, L5 = 98978 permanecen
vivos en su quinto aniversario. Puesto que cada uno de estos 98978 individuos sobrevive
el periodo entero de 4 años, contribuye 98978 × 4 = 395912 años-persona el total del
tiempo vivido durante el intervalo. También existen 4d1 = 171 personas que mueren en
algún momento durante el intervalo. Cada uno de estos individuos contribuye con alguna
cantidad de tiempo-persona antes de morir, una cantidad mayor que cero, pero menor de
cuatro años. Si sumamos los años-persona contribuye por cada uno de los individuos que
mueren durante el intervalo, información que no figura en la tabla de vida condensada y
se suma a los 395912 años-persona que han vivido los individuos que sobreviven los cua-
tro años completos, alcanzando un total de 4d1 = 396115 años vividos durante el interva-
lo de edades 1 – 5.

Columna 6
La sexta columna de la tabla de vida Tx muestra la población total estacionaria en el inter-
valo de edades x a x + n, y todos los intervalos subsiguientes. En otras palabras, se trata
del número total de años-persona vividos más allá del aniversario de vida número x por
los Lx individuos vivos en la celebración de dichos cumpleaños. Esta columna se obtiene
sumando la columna 5 de abajo hacia arriba; por ejemplo:
Tablas de vida 121

T65 = 5L65 + 5L70 + 5L75 + 5L80 + ∞L85


= 381393 + 334799 + 275667 + 204369 + 206269 = 1,402,497

Columna 7
Por último, la columna siete de la tabla de vida ex es el número promedio de años de vida
restantes para un individuo que se encuentra vivo a la edad x años. Esta columna se calcu-
la dividiendo el número total de años-persona vividos más allá del cumpleaños número x,
Tx, entre la cantidad de individuos que sobreviven a la edad de x o más allá; si se divide
entreTx se elimina la dependencia del tamaño del grupo original.
e0 = número promedio de años de vida que restan a partir del nacimiento
T0 7577757
= = 75.8
L0 100000

e1 = número promedio de años de vida que restan después del primer aniversario de vida
T1 7478482
= = 75.4
L1 99148

Si e1 es mayor que e0 que es el caso de Estados Unidos como ocurrió en 1976 que
existía una tasa de mortalidad infantil alta. Esto implica que, si un niño es suficientemen-
te fuerte como para sobrevivir el primer año de vida, el promedio de vida restante en su
primer cumpleaños es mayor que el del momento en que nació.

8.2  Aplicaciones de la tabla de vida


Las tablas de vida poseen diversas aplicaciones, por ejemplo, se pueden emplear para
predecir la oportunidad de que una persona viva hasta cierta edad x en particular. Supon-
gamos que deseamos conocer la probabilidad de que un individuo sobreviva a partir de su
nacimiento hasta la edad de 65 años, o, de igual forma, la proporción de personas que lo
hacen. De los 100, 000 individuos que nacieron en el grupo de 1992, 80145 aún viven en
su aniversario número 65. Por tanto, la proporción de personas que sobrevivirán hasta la
edad de 65 años es de:
L65 80145
= = 0.80145; es decir, cerca de 80.1%.
L0 100000

La probabilidad de que una persona de 50 años de edad alcance vivir hasta su aniver-
sario número 65 es la cantidad de individuos vivos para ese aniversario dividida entre el
número de individuos vivos para su aniversario de vida número 50, es decir:
L65 80145
= =0.86585
L50 92562
O sea, aproximadamente 86.6%. Observe que la probabilidad de supervivencia hasta
la edad de 65 años se incrementa si la persona ya sobrevivió los primeros 50 años. Este
incremento de probabilidad de 80.1% al 86.6% resulta importante para quienes calculan
primas de seguros.
El promedio de esperanza de vida restante en particular e0 que a menudo se utiliza
para describir el estado de salud de una población ilustra otra aplicación de las tablas de
vida.
A base de información, les presentamos los promedios de esperanza de vida al nacer
para algunos de los países que fueron seleccionados y estudiados sus aspectos demográfi-
cos para el año 1992, y estos se presentan en la siguiente tabla.
122 CAPÍTULO 8

Tabla 8.2

Promedio de esperanza de vida al nacer, año 1992


País Mujeres como % de los hombres
Argentina 71 110
Australia 77 109
Brasil 66 109
Canadá 77 105
China 71 109
Egipto 61 104
Etiopía 47 107
Finlandia 76 111
Francia 77 111
Grecia 77 107
India 60 101
Israel 76 105
Italia 77 109
Japón 79 108
México 70 110
Filipinas 65 106
Polonia 72 101
Federación Rusa 69 113
Arabia Saudita 69 104
España 77 108
Suecia 78 108
Reino Unido 76 107
Estados Unidos 76 109
Venezuela 70 109

Referente a la tercera columna, se puede apreciar que en esta tabla las mujeres tienen
una mayor esperanza de vida, y por situaciones bien especiales, solo hay unos pocos paí-
ses en el mundo en los cuales sucede lo contrario.
Este tipo de tablas además de su empleo como medida de resumen poblacional, el
promedio de esperanza de vida restante se utiliza como fundamento para el cálculo de
primas de seguros de vida.
Por último, para terminar la presentación de éste capítulo presentaremos la siguiente
tabla sobre la esperanza de vida al nacer por raza y sexo, para los Estados Unidos en los
años de 1960, 1950, 1960, y 1970 a 1992.

Tabla 8.3
Esperanza de vida al nacer por raza y sexo, Estados Unidos
Año Todas las razas Caucásica Total Afroamericana
Ambos Ambos Ambos Ambos
sexos Varón Mujer sexos Varón Mujer sexos Varón Mujer sexos Varón Mujer
1992 75.80 72.30 79.10 76.50 73.20 79.80 71.80 67.70 75.70 69.60 65.00 73.90
1991 75.50 72.00 78.90 76.30 72.90 79.60 71.50 67.30 75.50 69.30 64.60 73.80
1990 75.40 71.80 78.80 76.10 72.70 79.40 71.20 67.00 75.20 69.10 64.50 73.60
1989 75.10 71.70 78.50 75.90 72.50 79.20 70.90 66.70 74.90 68.80 64.30 73.30
1988 74.90 71.40 78.30 75.60 72.20 78.90 70.80 66.70 74.80 68.90 64.40 73.20
Tablas de vida 123

Tabla 8.3 (Continuación)

1987 74.90 71.40 78.30 75.60 72.10 78.90 71.00 66.90 75.00 69.10 64.70 73.40
1986 74.70 71.20 78.20 75.40 71.90 78.80 70.90 66.80 74.90 69.10 64.80 73.40
1985 74.70 71.10 78.20 75.30 71.80 78.70 71.00 67.00 74.80 69.30 65.00 73.40
1984 74.70 71.10 78.20 75.30 71.80 78.70 71.10 67.20 74.90 69.50 65.30 73.60
1983 74.60 71.00 78.10 75.20 71.60 78.70 70.90 67.00 74.70 69.40 65.20 73.50
1982 74.50 70.80 78.10 75.10 71.50 78.70 70.90 66.80 74.90 69.40 65.10 73.60
1981 74.10 70.40 77.80 74.80 71.10 78.40 70.30 66.20 74.40 68.90 64.50 73.20
1980 73.70 70.00 77.40 74.40 70.70 78.10 69.50 65.30 73.60 68.10 63.80 72.50
1979 73.90 70.00 77.80 74.60 70.80 78.40 69.80 65.40 74.10 68.50 64.00 72.90
1978 73.50 69.60 77.30 74.10 70.40 78.00 69.30 65.00 73.50 68.10 63.70 72.40
1977 73.30 69.50 77.20 74.00 70.20 77.90 68.90 64.70 73.20 67.70 63.40 72.00
1976 72.20 69.10 76.80 73.60 69.90 77.50 68.40 64.20 72.70 67.20 62.90 71.60
1975 72.60 68.80 76.60 73.40 69.50 77.30 68.00 63.70 72.40 66.80 62.40 71.30
1974 72.00 68.20 75.90 72.80 69.00 76.70 67.10 62.90 71.30 66.00 61.70 70.30
1973 71.40 67.60 75.30 72.20 68.50 76.10 66.10 62.00 70.30 65.00 60.90 69.30
1972 71.20 67.40 75.10 72.00 68.30 75.90 65.70 61.50 70.10 64.70 60.40 69.10
1971 71.10 67.40 75.00 72.00 68.30 75.80 65.60 61.60 69.80 64.60 60.50 68.90
1970 70.80 67.10 74.70 71.70 68.00 75.60 65.30 61.30 69.40 64.10 60.00 68.30
1960 69.70 66.60 73.10 70.60 67.40 74.10 63.60 61.10 66.30
1950 68.20 65.60 71.10 69.10 66.50 72.20 60.80 59.10 62.90
1940 62.90 60.80 65.20 64.20 62.10 66.60 53.10 51.50 54.90

Muchas son las razones que nos obligan al uso de tablas de vida ya que sus utilidades
no pueden ser imprescindibles, inclusive pueden utilizarse para cuantificar la mortalidad
prematura, los progresos de supervivencia y con mucha certeza las demás situaciones
vinculantes a los hechos vitales de los seres humanos.

EJERCICIOS 8.0
1. Describa dos aplicaciones prácticas de la tabla de vida.
2. ¿Qué es una función de riesgo?
3. Abajo aparece una lista de valores seleccionados de Lx , el número de individuos vivos
a los x años de edad, tomados de las tablas de vida de mujeres de raza caucásica en la
población de Estados Unidos de 1909 a 1911, y de 1969 a 1971.

Número de supervivientes por cada


Edad 100,000 nacidos vivos
1909 - 1911 1969 - 1971
0 100000 100000
15 83093 97902
45 69341 94649
75 26569 63290
124 CAPÍTULO 8

a) Calcule las probabilidades de supervivencia desde el nacimiento a la edad de 15


años, desde la edad de 15 años hasta la edad de 45 años, y de los 45 años a los 75
en cada grupo de individuos.
b) Si la probabilidad de supervivencia a partir de la edad x a x + n es P1 de 1909 –
1911, y P2 de 1969 – 1971, el progreso porcentual relativo en la supervivencia so-
P −P
bre el periodo de 60 años de edad es: 2 1
P1
¿Qué grupo por edades tiene el mayor progreso porcentual relativo de supervivencia?
4. Explique el concepto de población estacionaria en un intervalo de una tabla de vida.
5. Consulte la tabla 8.1 del presente capítulo y haga lo siguiente:
a) ¿Cuál es la probabilidad de supervivencia a partir del nacimiento hasta la edad de
80 años?
b) Si un individuo llega a los 50 años, ¿cuál es la probabilidad de que sobreviva hasta
los 80 años de edad?
c) ¿Cuál es la probabilidad de supervivencia desde el nacimiento hasta la edad de 10
años? ¿Hasta la edad de 30? ¿Hasta la edad de 50?
d) Si un niño llega a su primer año de edad, ¿Cuál es la probabilidad de que ese indi-
viduo sobreviva a la edad de 10 años? ¿A la edad de 30 años? ¿A la edad de 50
años?
e) ¿Cuál es la probabilidad de que un individuo de 25 años de edad sobreviva 10 años
más? ¿Y uno de 45 años de edad? ¿Y uno de 65 años de edad?
f) ¿Cuál es la probabilidad de que un niño de 10 años de edad sobreviva 20 años
más? ¿Y 40 años más? ¿Y 60 años más?
CAPÍTULO

Introducción a la
probabilidad 9
Contenido

9.1 Historia e importancia de la teoría de la


probabilidad
9.2 Elementos más utilizados en la teoría de la
probabilidad
9.3 Axiomas de probabilidad
9.4 Introducción a la probabilidad clásica
9.5 Probabilidad condicional
9.5.1 Regla de la suma
9.5.2 Regla del producto para eventos con
independencia estadística
9.5.3 Regla del producto para eventos con
dependencia estadística
9.5.4 Regla de Bayes
126 CAPÍTULO 9

Introducción a la probabilidad
Para la mayoría de la gente, “probabilidad” es un término vago utilizado en el lenguaje
para indicar la posibilidad de la ocurrencia de un suceso futuro. Esta interpretación prác-
tica del término puede considerarse aceptable, no obstante, se pretende lograr una com-
prensión más precisa del contexto de su aplicación, de cómo se mide y de qué manera se
utiliza la probabilidad para hacer inferencias.
El concepto de probabilidad es necesario cuando se opera con procesos físicos, bio-
lógicos y sociales que generan observaciones que no es factible predecir con exactitud.
Por ejemplo, no se puede predecir con certeza la presión arterial de una persona en un
momento dado, y nunca se conoce la carga exacta que soporta un puente antes de de-
rrumbarse y caer. Tales sucesos o eventos aleatorios no se pueden predecir con exactitud,
pero la frecuencia relativa en una gran serie de observaciones es a menudo estable. Los
eventos que poseen esta propiedad se denominan “eventos aleatorios o estadísticos”. Esta
frecuencia relativa estable nos da una medida significativa de la posibilidad de ocurrencia
de un evento aleatorio en una observación futura. Es imposible, por ejemplo, predecir con
exactitud la ocurrencia de caras en un solo lanzamiento de una moneda perfecta, pero se
podría afirmar con relativa confianza que la proporción de caras en una gran cantidad de
lanzamientos estaría muy cerca de 0.5. El uso de ésta frecuencia relativa como medida
para la posibilidad de este resultado en un solo lanzamiento es evidente cuando se consi-
dera el objetivo de un apostador.
De ésta manera podemos considerar más ejemplos análogos y prácticos, haciendo
resaltar que, en muchos aspectos de la vida, todo ser humano es un apostador. El médico
que realiza una investigación arriesga tiempo y dinero en el proyecto de investigación y le
interesa “ganar” en un “solo lanzamiento” de una moneda simbólica. De la misma mane-
ra, la inversión de capital en una nueva instalación industrial es un riesgo que representa
el lanzamiento de una moneda, en el cual el empresario deposita sus esperanzas de tener
éxito.

9.1  Historia e importancia de la teoría de la probabilidad


Históricamente, Jacob Bernoulli (1654-1715), Abraham de Moivre (1667-1754), el reve-
rendo Thomas Bayes (1702-1761) y Joseph LaGrange (1736-1813), entre otros, desarrolla-
ron fórmulas y técnicas para el cálculo de la probabilidad. Años más tarde, Pierre Simón
de Laplace (1749-1827), unificó todas las primeras ideas y compiló la primera teoría gene-
ral de probabilidad.
La teoría de la probabilidad ha sido aplicada con éxito en los juegos de azar, pero
para nosotros serán más importantes las aplicaciones realizadas a problemas sociales,
biológicos y físicos, ya que en la actualidad la teoría matemática de la probabilidad es la
base en las investigaciones científicas y en la toma de las grandes decisiones.
La utilización de la probabilidad forma parte de nuestras vidas cotidianas por la toma
de decisiones permanentes en situaciones de incertidumbre, ya sean éstas de tipo perso-
nal o profesional en las diversas ramas de la vida.
Vivimos en un mundo que es incapaz de predecir el futuro con total exactitud. No
obstante, cuando el ser humano recurre a los procesos matemáticos para tal fin, estos son
bastante precisos, como lo hacen los astrónomos con los diferentes acontecimientos so-
bre eclipses de luna o de sol, impacto de meteoritos, periodo o frecuencia con la que se
avista un cometa a simple vista desde la tierra, etc…
Nuestra necesidad de tratar con tal incertidumbre nos lleva a estudiar y utilizar la
teoría de la probabilidad. En muchos casos, nosotros, como ciudadanos preocupados,
tendremos algún conocimiento sobre los posibles resultados de una decisión. Al organizar
ésta información y considerarla de forma sistemática, seremos capaces de reconocer nues-
tras suposiciones, comunicar nuestro razonamiento a otras personas y tomar una decisión
Introducción a la probabilidad 127

más sólida que la que tomaríamos si solo diéramos palos de ciego. En resumen, la proba-
bilidad se define como un evento o suceso esperado con cierta confianza, y se considera
la posibilidad numérica representada en el intervalo cerrado de que ocurra o no dicho
evento.

9.2  Elementos más utilizados en la teoría de la probabilidad


La teoría de la probabilidad en particular y la estadística en general, utilizan diversos tér-
minos prácticos con el objetivo de manejar con mayor claridad los procesos prácticos y
elementales en aplicación de ésta teoría, entre estos elementos tenemos los siguientes:
Experimento: Es todo proceso que produce una observación, medición o resultado.

Ejemplo
a) Lanzar un dado; b) Lanzar una moneda; c) Sacar una carta de una baraja, etc.…

Sucesos o eventos: Son los resultados producidos por todo experimento.

Ejemplo
a) Al lanzar un dado, podemos observar un número 1, 2, 3, 4, 5 o 6.
b) Al lanzar una moneda, podemos observar un escudo o una letra.
Espacio muestral:
Es el conjunto al que pertenecen todos los resultados posibles de un experimento. Al es-
pacio muestral también se le conoce como conjunto universo y lo identificaremos con la
letra S.
Ejemplo 1:
Al lanzar un dado, el espacio muestral es: S = {1, 2, 3, 4, 5, 6}
Ejemplo 2:
Al lanzar una moneda, el espacio muestral es: S = {E, L}

Frases especiales utilizadas en probabilidad:


a) A lo más: Significa como máximo la cantidad mencionada y todo valor discreto que
esté por debajo de ella;
b) Al menos: Significa como mínimo la cantidad mencionada y todo valor discreto que
esté por arriba de ella;
c) Ninguno o nada: Significa la probabilidad de la no ocurrencia del evento mencionado;
d) Exactamente: Significa exactamente la cantidad mencionada;
e) Como máximo: Es un sinónimo de la frase “A lo más”;
f) Como mínimo: Es un sinónimo de la frase “Al menos”;
g) A lo sumo: Es un sinónimo de la frase “A lo más”.

9.3  Axiomas de probabilidad


1. Las probabilidades son números reales que están en el intervalo [0, 1];
2. Si A es un evento probabilístico, entonces la probabilidad de A estará denotada por
P(A) y 0 ≤ P(A) ≤ 1;
3. Si se tiene la certeza de que un evento ocurrirá, su probabilidad es igual 1, entonces
P(A) = P(S) =1;
4. Si se tiene la certeza de que un evento no ocurrirá, su probabilidad es igual a cero,
entonces P(A) = P(φ) = 0;
5. Dos eventos A y B que no pueden ocurrir al mismo tiempo, se llaman eventos mutua-
mente excluyentes, en donde A ∩ B = φ y P(A ∩ B) = 0;
128 CAPÍTULO 9

6. Si dos eventos A y B son mutuamente excluyentes, entonces P(A ∪ B) = P(A) + P(B);


7. Si dos eventos A y B no son mutuamente excluyentes, entonces: P(A ∪ B) = P(A) +
P(B) – P(A ∩ B);
8. El complemento de un evento A se identifica por Ac y se cumple que P(A) + P(Ac) = 1;
9. Si A y B son dos eventos probabilísticos, entonces, P(A ∪ B) + P(A ∪ B)c = 1;
n
10. Si A es un evento probabilístico, entonces, ∑P ( Ai ) =1;
i=1
+∞
11. Si A es un evento probabilístico, entonces, ∑P ( Ai ) = 1 ;
i=1
12. Leyes de Morgan
a) P(A ∪ B)c = P(Ac ∩ Bc)
b) P(Ac ∪ Bc) = P(A ∩ B)c

9.4  Introducción a la probabilidad clásica


La probabilidad clásica es aquella que está relacionada con aquellos eventos como ser el
lanzamiento de monedas, dados, urnas, ruletas, barajas y otros.
Si A es un evento probabilístico, generalmente la probabilidad clásica es calculada por
s
la fórmula P ( A)= ;
n
P(A) = Probabilidad de A
Donde: s = Número de éxitos o fracasos
n = Número total de elementos
Al lanzar una moneda al aire en forma consecutiva, el espacio muestral está definido
por la expresión 2n, donde n es el número de lanzamientos y el resultado 2n será el núme-
ro de combinaciones resultantes entre letra y escudo, denominados eventos o sucesos.
Ejemplo
Se lanza una moneda perfecta tres veces consecutivas:
1. Construya el espacio muestral;
2. Asigne la probabilidad a los eventos;
3. Cuál es la probabilidad de observar:
a) Exactamente dos escudos;
b) A lo sumo dos escudos;
c) A lo más tres letras;
d) Al menos un escudo; y,
e) Como máximo una letra.
Solución numeral 1
Para tres lanzamientos consecutivos de una moneda tenemos:
2n = 23 = 8 Combinaciones entre escudos y letras, entonces:
E1 = E E E
E2 = E E L
E3 = E L E
E4 = E L L
E5 = L E E
E6 = L E L
E7 = L L E
E8 = L L L
S = {EEE, EEL, ELE, ELL, LEE, LEL, LLE, LLL}
Introducción a la probabilidad 129

Solución numeral 2
Como el espacio muestral está constituido de 8 eventos, entonces cada evento tendrá la
1 1
probabilidad de, — o sea que: P ( E1 ) = , para i = 1, 2, 3, … , 8
8 8
Solución numeral 3a)
Sea A el evento de observar exactamente dos escudos, entonces:

1 1 1 3
P ( A) = P ( E2 ) + P ( E3 ) + P ( E5 ) = + + = = 0.375
8 8 8 8

Solución numeral 3b)


Sea B el evento de observar a lo sumo dos escudos, entonces:
P (B ) = P (E 2 ) +P (E 3 ) + P (E 4 ) +P (E 5 ) + P (E 6 ) +P (E 7 ) + P (E 8 ) =
1 1 1 1 1 1 1 7
+ + + + + + = = 0.875
8 8 8 8 8 8 8 8
Conclusión: la probabilidad de observar a lo sumo dos escudos es de 0.875.

Solución numeral 3c)


Sea C, el evento de observar a lo más tres letras, entonces:
P (C ) = P ( E1) +P ( E2 ) + P ( E3 ) +P ( E4 ) + P ( E5 ) +P ( E6 ) + P ( E7 ) + P ( E8 ) =
1 1 1 1 1 1 1 1 8
+ + + + + + + = =1.0
8 8 8 8 8 8 8 8 8
Conclusión: la probabilidad de observar a lo más tres letras es de 1.0.

Solución numeral 3d)


Sea D, el evento de observar al menos un escudo, entonces:
P ( D) = P ( E1) + P ( E2 ) + P ( E3 ) + P ( E4 ) + P ( E5 ) + P ( E6 ) + P ( E7 ) =
1 1 1 1 1 1 1 7
+ + + + + + = = 0.875
8 8 8 8 8 8 8 8
Conclusión: la probabilidad de observar al menos un escudo es de 0.875.
Solución numeral 3e)
Sea E, el evento de observar como máximo una letra, entonces:
1 1 1 1 4
P (E ) = P (E 1 ) +P (E 2 ) + P (E 3 ) + P (E 5 ) = + + + = = 0.5
8 8 8 8 8
Conclusión: la probabilidad de observar como máximo una letra es de 0.50

9.5  Probabilidad condicional


En este caso, este tipo de probabilidades está vinculado a la dependencia estadística, por
lo que, la probabilidad condicional está dada por aquellos eventos en donde la probabili-
dad buscada se ve afectada por la ocurrencia de un evento anterior.
P ( A ∩ B)
La fórmula a utilizar está dada por: P ( A B ) = ;
P (B)
P(A∣B) = Probabilidad de que ocurra el evento A, dado que ya ocurrió el evento B
Donde: P(A ∩ B) = Probabilidad de que los eventos A y B, ocurran al mismo tiempo
P(A) = Probabilidad marginal de A
P(B) = Probabilidadw marginal de B
130 CAPÍTULO 9

Ejemplo 1
En un comedor de beneficencia, una trabajadora social recolecta los datos siguientes. De
las personas que concurren al comedor 59% son hombres, 32% son alcohólicos y 21% son
hombres alcohólicos.
¿Cuál es la probabilidad de que un hombre que acuda al comedor sea alcohólico?
Solución
Sea H el evento de ser un hombre, entonces P(H) = 0.59; sea A el evento de ser alcohóli-
co, entonces P(A) = 0.32 y sea H ∩ A, el evento de ser hombre alcohólico, entonces:
P(A ∩ H) = 0.21
P ( A ∩ H ) 0.21
Por tanto, P ( A H ) = = ≅ 0.36
P (H ) 0.59
Ejemplo 2
Una caja contiene bolitas blancas y negras, además cada una tiene grabada una letra A o
Z, como sigue:

Bolitas Blancas Negras Total


A 6 4 10
Z 8 7 15
Total 14 11 25

a) ¿Cuál es la probabilidad de sacar una bolita de color blanco, ya que ésta tiene la letra
Z?
b) ¿Cuál es la probabilidad de sacar una bolita que tenga la letra A, ya que se sacó una
bolita de color negro?

Solución inciso a)
Sea B el evento de sacar una bolita color blanco y sea Z el evento de que la bolita tiene
grabada la letra Z, entonces:
8
P ( B ∩ Z ) 25 8
P (B Z ) = = = ≅ 0.53
P (Z ) 15 15
25
Solución inciso b)
Sea A, el evento de sacar una bolita que tenga grabada la letra A, y sea N el evento de que
la bolita es de color negro:
4
P ( A ∩ N ) 25 4 ≅
P( A N )= = = 0.36
P (N ) 11 11
25
Ejemplo 3
Se lanza un dado no cargado. Dado que el resultado es un número impar, ¿cuál es la pro-
babilidad de que el número sea mayor que 3?
Solución
Sea I el evento de que el número observado es un número impar y sea M el evento de que
el número es mayor que 3.
Sabemos que al lanzar un dado el espacio muestral contiene los elementos 1, 2, 3, 4,
5 y 6, por tanto, los números impares son 3 de 6 y los números impares mayores que 3 es
1 de 6, o sea únicamente el número 5, luego tendríamos que:
Introducción a la probabilidad 131

1
P(M ∩ I) 6 1
P(M I) = = = ≅ 0.333...
P(I) 3 3
6
Ejemplo 4
En Concepción de Chile, la probabilidad de que llueva el primero de junio es de 0.5 y la
probabilidad de que llueva los primeros dos días de junio es de 0.40. Dado que llovió el
día primero; ¿cuál es la probabilidad de que llueva el siguiente día?

Solución
Sea A el evento de que llueva el primero de junio y sea B el evento de que llueva el día
siguiente, entonces la probabilidad está dada por:

P ( B ∩ A) (0.4 ∩ 0.5) 0.4


P ( B A) = = = = 0.8
P ( A) 0.5 0.5

EJERCICIOS 9.5
1. De los estudiantes de una universidad, el 40% son varones y el 4% son varones que
estudian arte. Si se elige un estudiante al azar y este resulta ser un varón, ¿cuál es la
probabilidad de que estudie arte?
2. Si F es el evento de que un estudiante de medicina obtendrá ayuda financiera, E es el
evento que encontrará un empleo de medio tiempo y G es el evento de que se gradua-
rá, expresar en forma simbólica las probabilidades siguientes:
a) Obtenga ayuda financiera y se gradúe;
b) No obtenga ayuda financiera y encuentre trabajo;
c) No reciba ayuda financiera y no encontrará trabajo;
d) Reciba ayuda financiera y encuentre trabajo y no se gradúe.
3. Si E es el evento de tener experiencia previa en el área de medicina, C el de tener un
automóvil y G el de que es profesional graduado de la UNICAH. Explicar en palabras
que probabilidades condicionales expresan cada una de las siguientes proposiciones:
a) P(C|G) b) P(E|C c) c) P(C c|E)
d) P(G c|C c) e) P(C|E ∪ G) f) P(E ∩ C c|G)
4. Si W es el evento de ser enfermera capacitada; Q que cumple con la asignación de sus
tareas, expresar en forma simbólica las probabilidades de que:
a) Una enfermera capacitada cumpla con la asignación de sus tareas;
b) Una que cumpla con la asignación de sus tareas y no esté capacitada;
c) Una enfermera no capacitada no cumpla con la asignación de sus tareas.
5. Con referencia al ejemplo anterior, explique en palabras las probabilidades que expre-
san las siguientes proposiciones:
a) P(W|Q) b) P(C c|W) c) P(wc|Qc)
6. Si H es el evento de ser estudiante honesto; E el de ser indolente y W el de ser justo.
Expresar de manera simbólica las probabilidades de que:
a) Ser indolente y justo
b) Deshonesto dado que sea indolente
c) Honesto e indolente dado que sea justo
132 CAPÍTULO 9

7. Con referencia al ejercicio anterior, exprese con palabras las probabilidades que ex-
presan las siguientes proposiciones:
a) P(H|Wc)
b) P(wc|Ec)
c) P(W∩ E|H)
8. Si en un gran hospital hay 400 pacientes internos por enfermedades naturales o acci-
dentales. Sea H el evento de ser hombres y M el evento de ser mujeres, el cuadro si-
guiente resume la calidad del internamiento u hospitalización.
Calcular las probabilidades a partir de las entradas y los totales de las filas y columnas:

Género/condición del paciente Hombre Mujer Total


Enfermedad natural 120  40 160
Enfermedad accidental  80 160 240
Total 200 200 400
P(Hc|M)
a)  P(H) b) P(M) c) P(M ∩ H) d) P(Hc ∩ M) e) P(M|H) f) 
9. Sean: P(A) = 0.80; P(B) = 0.35 y P(A ∩ B) = 0.28, encontrar resultados de:
a)  P(A|B) b)  P(Bc|A) c) P(A|Bc) d) P((A ∪ B)|(A ∩ B)) e) 
P(B|(A ∪ B))
f)  P((A ∩ B )|(A ∪ B))
c c

10. Una cadena de laboratorios clínicos ha recibido 25 solicitudes de empleo para una
plaza de laboratorista técnico. De los aspirantes, 10 tienen más de 30 años y 15 me-
nos de este valor. Solo 17 de los aspirantes tienen grado universitario a nivel de licen-
ciatura en microbiología y 8 de maestría en áreas de similar condición. De los que son
menores de 30 años, 6 tienen el grado de maestría. Si se hace una selección al azar,
¿cuál es la probabilidad de que:
a) Sea seleccionado un aspirante de más de 30 años o que tenga maestría
b) Sea seleccionado un aspirante menor de 30 años que tenga una licenciatura
c) Sea seleccionado un menor de 30 años con licenciatura
11. Una clínica de especialidades cuenta con dos médicos expertos en una misma rama;
uno de ellos tiene 35 años de experiencia y el otro está recién graduado. Según algu-
nos registros, las posibilidades de que un paciente sea atendido por el médico de
mayor experiencia es de dos contra uno. Un paciente visitó dicha clínica en dos oca-
siones en el término de dos meses sin darse cuenta de las diferencias en experiencia
entre dichos galenos. ¿Cuál es la probabilidad de que al menos una vez este paciente
haya sido atendido por el médico de mayor experiencia?

9.5.1 Regla de la suma
Esta regla expresa la ocurrencia de la probabilidad de la unión de dos eventos A o B, la
cual calcularemos por:
P ( A ∪ B) = P ( A) + P ( B) − P ( A ∩ B) ; donde:
P ( A ∪ B) = probabilidad de que ocurra A o B
P ( A) = probabilidad marginal de A
P ( B) = probabilidad marginal de B
P ( A ∩ B) = probabilidad de A y B o curran al mismo tiempo
Nota: En este caso debe tenerse cuidado referente a que los eventos pueden ser mutuamen-
te excluyentes o no, y de ello dependerá de que la probabilidad de la intercepción de A y
B sea cero o no.
Introducción a la probabilidad 133

Ejemplo 1
En una baraja de 52 cartas, ganaremos $100 si elegimos una carta de color negro o un rey.
¿Cuál es la probabilidad de ganar los $100?
Solución
En este ejemplo podemos apreciar que los eventos no son mutuamente excluyentes ya que
existen 26 cartas de color negro y que de los cuatro reyes dos son de color negro y dos
de color rojo, por tanto, si N es el evento de sacar una carta de color negro y R el evento de
sacar un rey, entonces:
26 4 2 28 ≅
P ( N ∪ R) = P ( N ) + P ( R) − P ( N ∩ R) = + − = 0.54
52 52 52 52
Ejemplo 2
Si se lanza un dado no cargado; ¿cuál es la probabilidad de observar un par o un número
divisible por 3?
Solución
Sea A el evento de que el número es par y sea B el evento de que el número sea divisible
por 3. En notación de conjuntos podemos expresar que: A = {2, 4, 6}; B = {3, 6} y A ∩ B =
{6}, luego tenemos que:
3 2 1 4 2
P ( A ∪ B) = P ( A) + P ( B) − P ( A ∩ B) = + − = = ≅ 0.67
6 6 6 6 3

Ejemplo 3
Dados dos eventos A y B, mutuamente excluyentes donde P(A) = 0.37 y P(B) = 0.55,
Calcular el valor de las siguientes probabilidades:
a) P(Ac)   b) P(Bc)   c) P(A ∪ B)   d) P(A ∩ B)   e) P(Ac ∩ Bc)
Solución inciso a)
P(A) + P(Ac) = 1, entonces: P(Ac) = 1 – P(A) = 1 – 0.37 = 0.63
Solución inciso b)
P(B) + P(Bc) = 1, entonces: P(Bc) = 1 – P(B) = 1 – 0.55 = 0.45
Solución inciso c)
P(A ∪ B) = P(A) + P(B) = 0.37 + 0.55 = 0.92
Solución inciso d)
Como los eventos son mutuamente excluyentes, entonces:
P(A ∩ B) = 0
Solución inciso e)
P(A ∩ B) = P(A ∪ B)c; Pero P(A ∪ B) + (A ∪ B)c = 1; entonces:
P(A ∪ B) = 1 – P(A ∪ B) = 1 – 0.92 = 0.08
Se concluye que: P(Ac ∩ Bc) = 0.08
Ejemplo 4
Sea E el evento de que el Decano de Medicina de la UNICAH esté en España y sea H el
evento de que esté en Honduras. Si P(E) = 0.27 y P(H) = 0.39; ¿cuál es la probabilidad de
que el Decano de Medicina de la UNICAH?
a) Esté en Honduras y España;
b) Que no esté en España;
134 CAPÍTULO 9

c) Que no esté en Honduras;


d) Que esté en España o en Honduras;
e) No esté ni en Honduras ni en España;
f) Que esté en Madrid y en España.
Solución inciso a)
Como no puede estar en los dos países al mismo tiempo, entonces los eventos son mutua-
mente excluyentes, por tanto: P(E ∩ H) = P(φ) = 0
Solución inciso b)
P(E) + P(Ec) = 1; P(Ec) = 1 – P(E)=1 – 0.27 = 0.73
Solución inciso c)
P(H) + P(Hc) = 1; P(Hc) = 1 – P(H) = 1 – 0.39 = 0.61
Solución inciso d)
P(E ∪ H) = P(E) + P(H) = 0.27 + 0.39 = 0.66
Solución inciso e)
En este caso el resultado es la intercepción de los complementos, o sea,
P(Ec ∩ Hc) = P(E ∪ H)c, Pero P(E ∪ H) + P(E ∪ H)c = 1, entonces:
P(E ∪ H)c = 1 – P(E ∪ H) = 1 – 0.66 = 0.34
Solución inciso f)
Como Madrid es la Capital de España, si el Decano de Medicina de la UNICAH está en
Madrid entonces está en España, lo que implica que P(M ⊆ E) = P(E) = 0.27

EJERCICIOS 9.5.1
1. Una urna contiene 75 bolitas: 35 son azules, y 25 de esas azules son oscuras. El resto
de las bolitas son rojas, y 30 de ellas son oscuras. Las bolitas que no son oscuras tie-
nen color claro. Cuál es la probabilidad de sacar:
a) Una bolita de color azul
b) Una bolita clara
c) Una bolita azul oscuro
d) Una bolita roja y clara
e) Una bolita oscura
f) Una bolita roja oscura o azul oscura
2. El jefe de rayos X de un hospital privado de la ciudad de San Pedro Sula se da cuenta
que en las radiografías tomadas a los pacientes de cada 1000; 10 tienen fallas al inte-
rior de las transparencias, 8 presentan fallas de corrugado y 5 tienen ambos tipos de
defectos. Si en un mes cualesquiera de 1000 radiografías tomadas, se selecciona una
al azar, cuál es la probabilidad de que:
a) La radiografía presente ambas fallas;
b) Ninguna falla;
c) Tenga fallas al interior o fallas de corrugado?
3. De una baraja de 52 cartas, cuál es la probabilidad de:
a) Sacar un rey o una carta color rojo?
b) Sacar una carta de color negro o una reina;
c) Un as o una carta de corazones.
Introducción a la probabilidad 135

4. Se lanza un dado no cargado, cuál es la probabilidad de:


a) Observar un número par o primo
b) Un número impar y menor que cinco
c) Un número compuesto o mayor e igual que cuatro
5. Si en un grupo de cinco médicos se tiene:
1. Varón de 35 años
2. Varón de 32 años
3. Mujer de 45 años
4. Mujer de 25 años
5. Varón de 40 años
Si se elige al azar a un representante de éste grupo, ¿cuál es la probabilidad de que sea
mujer o tenga más de 35 años?
6. Un proveedor para los hospitales públicos del Estado tiene cinco terminales de com-
putadora aparentemente idénticas para ser entregadas. El proveedor no sabe que dos
de las cinco son defectuosas. Recibe un pedido especial de dos terminales y lo surte
seleccionando al azar dos de las cinco disponibles.
a) Obtenga el espacio muestral para este experimento;
b) Encuentre la probabilidad de que el pedido se surte con dos terminales no defec-
tuosas;
c) Encuentre la probabilidad de que el evento se surte con al menos una terminal
defectuosa;
d) Encuentre la probabilidad de que el pedido se surte con las dos terminales defec-
tuosas; y
e) Encuentre la probabilidad de que el pedido se surte con exactamente una terminal
defectuosa.
7. El jefe de recursos humanos de un hospital privado requiere a siete aspirantes para
ocupar tres cargos en el nivel de dirección. Las capacidades o preparación de los as-
pirantes están numeradas de la siguiente manera: 1 es el mejor, 2 el segundo mejor, y
así sucesivamente hasta que el 7, es el menos capacitado. El jefe de recursos humanos
naturalmente no sabe de ésta calificación.
a) Determine el espacio muestral para este experimento;
b) Calcule la probabilidad de que el jefe de recursos humanos seleccionó los tres
menos capacitados;
c) Los tres mejores capacitados;
d) El mejor capacitado; y
e) Los dos menos capacitados y el mejor capacitado.
8. Una clínica de especialidades cuenta con dos médicos expertos en una misma rama;
uno de ellos tiene 35 años de experiencia y el otro está recién graduado. Según los
registros, las posibilidades de que un paciente sea atendido por el médico de mayor
experiencia son de dos contra uno. Un paciente visitó dicha clínica en dos ocasiones
en el término de dos meses sin darse cuenta de las diferencias de experiencia entre
uno y otro. Diga cuál es la probabilidad de que al menos una vez este paciente fuera
atendido por el médico de mayor experiencia.
9. Un jurado médico, debe calificar según su efecto tres tipos de medicamentos: X, Y, Z
para el tratamiento de la hipertensión. Determinar:
a) ¿Cuál es la probabilidad de que se prefiera el medicamento tipo X al tipo Y?
b) ¿Cuál es la probabilidad de que el medicamento tipo X sea calificado como el mejor?
c) ¿Qué el medicamento tipo X se califique en el segundo lugar?
d) ¿El medicamento tipo X se califique en último lugar?
136 CAPÍTULO 9

9.5.2 Regla del producto para eventos con independencia estadística


Si los eventos probabilísticos tienen independencia estadística, y se da que estos puedan
ocurrir al mismo tiempo o en sucesión, el resultado de la probabilidad es el producto de
sus probabilidades marginales, o sea que si A, B, C, D son dos eventos de probabilidad,
entonces:
P(ABCD...) = P(A ∩ B ∩ C ∩ D...) = P(A)P(B)P(C)P(D)...
Nota: Cuando los eventos son un éxito o un fracaso en su totalidad, en vez de utilizar los
productos directos, es más adecuado utilizar la fórmula:
éxito + fracaso = 1
Ejemplo 1
Tres médicos cirujanos A, B y C del Hospital Centro Médico La Granja realizan cirugías
de manera paralela en tres quirófanos diferentes. Si se sabe que la probabilidad de que el
médico A tenga éxito es 0.75, que B tenga éxito es 0.85 y que C tenga éxito es 0.70.
a) ¿Cuál es la probabilidad de que los tres médicos tengan éxito en la próxima cirugía?
b) ¿Cuál es la probabilidad de que el médico A tenga éxito y que los médicos B y C fra-
casen en sus cirugías?

Solución inciso a)
En el ejercicio se observa una total independencia entre los eventos, y por otro lado se
pide la probabilidad del éxito total de los médicos; por tanto, haremos uso de la fórmula:
éxito + fracaso = 1; en donde, fracaso = P(Ac)P(Bc)P(Cc) = (0.25)(0.15)(0.30) = 0.01125
fracaso + éxito = 1, entonces: éxito = 1 – fracaso = 1 – 0.01125 = 0.98875.
La probabilidad de que los tres médicos tengan éxito es de 0.98875

Solución inciso b)
En este inciso el resultado de la probabilidad pedida será el producto del éxito del médico
A, con el fracaso de los médicos B y C. Entonces:

P ( AB C C C ) = P ( A ∩ B C ∩ C C ) = P ( A) P ( B C ) P (C C ) = (0.75)(0.15)(0.30) ≅ 0.03375

Ejemplo 2
En una máquina de rayos X, un dispositivo consta de tres componentes A, B y C, indepen-
dientes entre sí. El dispositivo se considera defectuoso, si uno o más de los componentes
lo son. La probabilidad de que A sea defectuoso es 0.01, de que B sea defectuoso es 0.02
y que C sea defectuoso es 0.10.
a) ¿Cuál es la probabilidad de que el dispositivo sea defectuoso?
b) ¿Cuál es la probabilidad de que el dispositivo sea defectuoso debido solo a una falla
del componente C?

Solución inciso a)
Sean A, B y C los eventos de que los componentes del dispositivo sean defectuosos y sean
Ac, Bc y Cc de que no son defectuosos, entonces:
P(Dispositivo no sea defectuoso) P(Ac) P(Bc) P(Cc) = (0.99)(0.98)(0.90) ≅ 0.87318
Recuerde que P(éxito) + P(fracaso) = 1, por tanto:
P(dispositivo sea defectuoso) = 1 – P(dispositivo no sea defectuoso) =1 – 0.87318 ≅ 0.1268
Introducción a la probabilidad 137

Solución inciso b)
Aquí la probabilidad solicitada estará dada por el producto de los complementos de los
componentes A y B, y la probabilidad del componente C, una probabilidad mixta entre
fracasos y éxitos; entonces:
P(Ac Bc C) = P(Ac ∩ Bc ∩ C) = P(Ac)P(Bc)P(C) = (0.99)(0.98)(0.10) ≅ 0.096

Ejemplo 3
Se sabe que un paciente responderá al tratamiento de una afección en particular con una
probabilidad igual a 0.9. Si se trata a tres pacientes en una forma independiente, encuen-
tre la probabilidad de al menos uno responda al tratamiento.
Solución
Sea A el evento de que al menos uno de los pacientes responda al tratamiento.
Sea B1 el evento de que el primer paciente no responderá, B2 el evento de que el se-
gundo paciente no responda al tratamiento y B3 el evento de que el tercer paciente no
responda al tratamiento.
Por otra parte, se puede ver que Ac = B1 ∩ B2 ∩ B3 y que S = A ∪ Ac, por tanto:
P(S) = P(A) + P(Ac)
1 = P(A) + P(B1 ∩ B2 ∩ B3), o bien P(A) = 1 – P(B1 ∩ B2 ∩ B3)
Luego al aplicar la ley multiplicativa, se tiene
P(B1 ∩ B2 ∩ B3) = P(B1) P(B2 | B1) P(B3 | B1 ∩ B2)
Con P(B2 | B1) = P(B2) y P(B3 | B1 ∩ B2) = P(B3); dado que los eventos son indepen-
dientes.
Al sustituir P(Bi) = 0.1; i = 1, 2, 3, tenemos:
P(A) = 1 – (0.1)(0.1)(0.1) ≅ 0.999

EJERCICIOS 9.5.2
1. El Departamento de salubridad pública realiza sistemáticamente dos inspecciones
independientes en cada restaurante de la ciudad; este pasa la prueba si y solo si am-
bos inspectores dan un dictamen positivo. El inspector A tiene mucha experiencia y,
por lo mismo aprueba solo el 2% de los restaurantes que han violado el código sani-
tario. El inspector B tiene menos experiencia y aprueba 7% de los restaurantes que
han cometido alguna infracción. ¿Cuál es la probabilidad de que:
a) El inspector A apruebe un restaurante con una violación, si el inspector B ha des-
cubierto alguna infracción
b) El inspector B apruebe un restaurante que haya incurrido en una violación, si el
inspector A lo aprueba
c) Un restaurante con una violación sea aprobado por el departamento de salubridad
pública
2. Las cuatro puertas eléctricas de la sala de cuidados intensivos de un complejo hospi-
talario, se descomponen y se reparan independientemente entre sí. Por experiencia se
sabe que cada una está fuera de servicio 2% de las veces.
a) Si la puerta 1 está fuera de servicio, ¿Cual es la probabilidad de que también lo
estén las puertas 2 y 3?
b) Durante un recorrido por la sala, le dicen a usted de que las probabilidades de que
las cuatro puertas estén fuera de servicio son menores que 1 en 5, 000,000. ¿Es
verdadera esa afirmación?
138 CAPÍTULO 9

3. El nuevo ministro de salud lanza una campaña publicitaria sobre las nuevas políticas
de servicios que el Estado estará prestando a su población en los hospitales públicos.
El ministro acaba de instalar cuatro letreros en una carretera que pasa por las afueras
de la ciudad y por experiencia él sabe que el primer letrero sea visto por un conductor
es de 0.75. Las probabilidades de que el segundo sea visto es de 0.82, de que el terce-
ro sea visto es de 0.87 y la probabilidad de que el cuarto sea visto es de 0.90. Supo-
niendo que el evento consiste en que un conductor vea uno de los letreros sea
independiente del hecho de que vea o no los otros. Cuál es la probabilidad de que:
a) Los 4 letreros sean vistos por un conductor elegido aleatoriamente;
b) El primero y el cuarto, pero no el segundo ni el tercero, sean vistos
c) Exactamente uno de los letreros sea visto
d) El tercero y el cuarto no sean vistos
4. Tres médicos A, B y C son los responsables de las cirugías en un hospital privado en
la ciudad de Tegucigalpa. El médico A tiene éxito en el 95% de los casos, el médico B
un 85% de éxito y el médico C fracasa en el 25% de sus cirugías. Se supone que las
actuaciones de los tres médicos son independientes entre sí. Si se someten a opera-
ción tres pacientes al mismo tiempo en un día cualesquiera, cuál es la probabilidad de
que:
a) El médico C tenga éxito y los médicos A y B fracasen
b) Los tres médicos fracasen, y
c) El médico A y B tengan éxito y el médico C fracase

9.5.3  Regla del producto para eventos con dependencia estadística


Si varios eventos que pueden ocurrir al mismo tiempo o en sucesión, y entre ellos presen-
tan dependencia estadística, entonces la probabilidad estará dada por:
P(A1 A2 A3 … An) = P(A1 ∩ A2 ∩ A3 ∩ … ∩ An)
= P(A2)P(A1|A2)P(A1 ∩ A2)P(A3|A1 ∩ A2) … …
Nota: Esta regla es aplicada a eventos clásicos sin restitución y expandible para n eventos.
Ejemplo 1
De una baraja de 52 cartas, se sacan dos cartas sin restitución. ¿Cuál es la probabilidad
de que ambas sean ases?
Solución
Sea A el evento de que la primera carta sea un As y sea B el evento de que la segunda
carta sea también un As; entonces:

4 3 12 ≅
P ( A ∩ B) = P ( B) P ( A B) = x = 0.0045
52 51 2652

Ejemplo 2
De una baraja de 52 cartas, se extraen cinco cartas en forma sucesiva y sin restitución.
a) ¿Cuál es la probabilidad de que no haya ningún As entre las cinco cartas?
b) ¿Cuál es la probabilidad de que las primeras tres cartas sean ases y las dos últimas
sean reyes?
c) ¿Cuál es la probabilidad de que solo las tres primeras cartas sean ases?

Solución inciso a)
Sea A, el evento de obtener un As y sea Ac el evento de no obtenerlo o que la carta no sea
As, entonces:
Introducción a la probabilidad 139

48 47 46 45 44 205476480 ≅
P ( A1C ∩ A2C ∩ A3C ∩ A4C ∩ A5C ) = = 0.6588
52 51 50 49 48 311875200
Solución inciso b)
Sea A el evento de que las primeras tres cartas sean Ases y sea R el evento de que las dos
últimas cartas sean reyes, entonces:

4 3 2 4 3 288
P ( A1 ∩ A2 ∩ A3 ∩ R1 ∩ R2 ) = = ≅ 0.00000092
52 51 50 49 48 311875200
Solución inciso c)
Sea A el evento de obtener un As y sea Ac el evento de no obtenerlo o que la carta no sea
As, entonces:

4 3 2 48 47 54144 ≅
P ( A1 ∩ A2 ∩ A3 ∩ A1C ∩ A2C ) = = 0.0001736
52 51 50 49 48 311875200
Ejemplo 3
En cierta ciudad 40% de los pobladores son hombres y 60% son mujeres, 70% de los hom-
bres y 80% de las mujeres, normalmente son afectados por una enfermedad tropical. Al
seleccionar una persona de esta ciudad; ¿cuál es la probabilidad de que esté afectada por
la enfermedad?
Solución
Apoyándonos en un diagrama de Venn, tenemos que:
U
H M

A∩H A∩M

Sea A el evento de que la persona está afectada por la enfermedad


Sea H el evento de que la persona es un hombre
Sea M el evento de que la persona es una mujer
Como P(H) = 0.4; P(M) = 0.60; P(A | H) = 0.70 y P(A | M) = 0.80
La probabilidad de que la persona esté afectada por la enfermedad está dada por:
P(A) = P(A ∩ H) + P(A ∩ M) = P(H)P(A | H) + P(M)P(A | M) = (0.40)(0.70) +
(0.60)(0.80) = 0.28 + 0.48 = 0.76
Ejemplo 4
Una urna contiene seis bolitas de color blanco y cuatro bolitas de color negro. Si se ex-
traen dos bolitas de la urna sucesivamente y sin restitución:
a) ¿Cuál es la probabilidad de que ambas bolitas sean de color blanco?
b) ¿Cuál es la probabilidad de que la primera sea de color blanco y la segunda sea de
color negro?
Solución inciso a)
Sea B1 el evento de que la primera bolita sea de color blanco y sea B2 el evento de que la
segunda bolita también sea de color blanco. Entonces:
6 5 1
P ( B1 ∩ B2 ) = P ( B1 ) P ( B2 B1) = = ≅ 0.333...
10 9 3
140 CAPÍTULO 9

Solución inciso b)
Sea B1 el evento de que la primera bolita sea de color blanco y sea N2 el evento de que la
segunda bolita sea de color negro. Entonces:
6 4 4
P ( B1 ∩ N 2 ) = P ( B1 ) P ( N 2 B1) = = ≅ 0.27
10 9 15

EJERCICIOS 9.5.3
1. Se sacan dos cartas sin restitución de una baraja de 52 cartas, cuál es la probabilidad
de que:
a) La primera carta sea una reina y la segunda sea un rey;
b) Se obtenga una reina y un rey;
c) Ninguna de las dos cartas sea reina;
d) Ninguna de las dos cartas sea reina ni rey.
2. Se sacan cinco cartas sin restitución de una baraja, cuál es la probabilidad de que:
a) Las primeras tres cartas sean reinas y las dos últimas sean reyes;
b) Solo las tres primeras cartas sean reinas;
c) Las tres primeras cartas sean reinas.
3. Se sacan tres cartas sin restitución de una baraja, ¿Cuál es la probabilidad de que haya
por lo menos un rey entre las tres cartas?
4. Una urna contiene 4 bolitas blancas y 3 rojas. Si se sacan dos bolitas sin restitución,
cuál es la probabilidad de que:
a) Las dos sean blancas b) La primera sea roja y la segunda blanca
c) Las dos sean rojas d) La primera sea blanca y la segunda negra
5. Un médico tiene cinco medicamentos numerados del 1 al 5, y todos surten el mismo
efecto para las enfermedades cutáneas. Cada vez que el médico proporciona a un
paciente una muestra médica de los medicamentos en mención, los extrae de un reci-
piente de manera aleatoria. Si el médico extrae a la vez tres de los medicamentos sin
restitución, cuál es la probabilidad de que:
a) El primer medicamento sea el número 4, el segundo el número 5 y el tercero el nú-
mero 1.
b) Los primeros dos medicamentos extraídos no sean el número 4 ni el número 5
6. En una pequeña ciudad se sabe que las afecciones bucales (encías y dientes) son
causadas por dos tipos de bacteria (bacteria tipo A y bacteria tipo B). La bacteria tipo
A se encuentra presente en 55% de la población y el tipo B en 45%. El 85% de la bac-
teria tipo A y 75% de la bacteria tipo B es destruida por un nuevo medicamento odon-
tológico. Si se selecciona una persona de esta pequeña ciudad, ¿cuál es la probabilidad
de que el medicamento haga el efecto esperado?
7. Un psicólogo aficionado a las estadísticas frecuentemente le gusta efectuar cálculos
de probabilidad sobre el desarrollo de la personalidad que se genera en todo niño
hasta la edad de siete años. Él sabe que de cada 20 pacientes adultos que atiende
diariamente el 20% son provenientes de hogares desintegrados, el 40% han sido afec-
tados por la pobreza, el 5% fueron rebeldes por naturaleza y el 35% recibieron la
protección necesaria de sus padres. Si un día cualquiera, de los 20 pacientes adoles-
centes que esperan turno en su clínica para ser atendidos, el psicólogo selecciona
cuatro pacientes al azar; ¿cuál es la probabilidad de que:
a) Solo los dos primeros fueron afectados por la pobreza;
b) Que el primero provenga de hogares desintegrados, el tercero y cuarto hayan sido
rebeldes por naturaleza.
Introducción a la probabilidad 141

9.5.4 Regla de Bayes
El procedimiento de la descomposición de los eventos para resolver problemas de probabi-
lidad, para su facilitación es aconsejable considerar el espacio muestral S como una unión
de subconjuntos que son mutuamente excluyentes, lo que permite que para una probabili-
dad condicional de la forma P(Bi ∣ A) se puede calcular mediante la siguiente fórmula:

P ( A ∩ Bi ) P ( B ) P ( A Bi )
P ( Bi A) = = K i
P ( A)
∑P (Bi )P ( A Bi )
i =1

A la fórmula anterior se le conoce como la regla de bayes.


Ejemplo 1
Una compañía de suministros de implementos para hospitales, bajo una reciente investi-
gación, muestra que la probabilidad de que en los hospitales públicos compren sus sumi-
nistros ha sido del 20%. Por otra parte, los clientes de hospitales privados en los últimos
meses han comprado en esta compañía el 50% de sus implementos médicos. El gerente
de la compañía piensa que concentrarse en los clientes de hospitales privados incremen-
tará la probabilidad de que una llamada telefónica al departamento de ventas termine en
una compra por parte de un hospital público. ¿Cuál sería la conclusión referente a la po-
sición o pensamiento del gerente?
Solución
Sea A el evento de que la llamada telefónica provenga de un cliente que pertenece a un
hospital público, entonces P(A) = 0.20. Sea B el evento de que la llamada telefónica pro-
venga de un cliente que pertenece a un hospital privado dado que ya ocurrió una llamada
de un hospital público, entonces: P(B ∣ A) = 0.50 y sea Ac el evento que la llamada sea de
un hospital privado dado que no hay ninguna llamada de un hospital público, entonces:
P(B ∣ Ac) = 0.60 y P(Ac) = 0.80.

P ( A ∩ B) P ( A) P ( B A)
P ( A B) = =
P ( B) P ( A) P ( B A) + P ( AC ) P ( B AC )
Luego se tiene que:
(0.20)(0.50)
= ≅ 0.172
(0.20)(0.50) +(0.80)(0.60)

Como 0.172 < 0.20, la idea del gerente no es buena.

Ejemplo 2
Tres médicos de un hospital de especialidades efectúan cirugías de corazón abierto todos
los días, el médico de la sala 1 efectúa el 35% de las operaciones, el médico de la sala 2 el
45% y el médico de la sala 3 el 20%. En las operaciones de corazón abierto, el médico de
la sala 1 fracasa en un 20% de sus operaciones, el de la sala 2 fracasa en el 15% y el médi-
co de la 3 fracasa en un 5%.
a) Si el paciente fallece ¿cuál es la probabilidad de que haya sido operado por el médico
de la sala número 3?;
b) Si la operación del paciente fue exitosa, ¿cuál es la probabilidad de que haya sido
operado por el médico de la sala número 1?

Solución inciso a)
Sea A la probabilidad de que el paciente haya sido operado por el médico de la clínica
número 3;
142 CAPÍTULO 9

Sea B el evento de que el paciente muera durante la operación;


(0.20)(0.05) 0.01
P ( A B) = = ≅ 0.0678
(0.20)(0.05) + (0.35)(0.20) + (0.45)(0.15) 0.1475

Solución inciso b)
Sea A la probabilidad de que el paciente haya sido operado por el médico de la clínica
número 1;
Sea B el evento de que la operación del paciente fue exitosa;
(0.35)(0.80) 0.28
P ( A B) = = ≅ 0.3284
(0.35)(0.80)+ (0.45)(0.85) +(0.20)(0.95) 0.8525

EJERCICIOS 9.5.4
1. El doctor Sócrates Sánchez, gerente de crédito de un hospital privado en la zona sur
de Honduras, sabe que dicho hospital emplea tres métodos para alentar el cobro de
cuentas atrasadas de algunos pacientes. Al consultar los archivos de la cobranza,
descubre que 70% de las cuentas se cobran en forma personal, 20% se cobran por te-
léfono y al 10% se les envía una carta. La probabilidad de cobrar una deuda vencida
con los tres métodos es de 0.75, 0.60 y 0.65 respectivamente. El doctor Sánchez
acaba de recibir el pago de una cuenta vencida de un paciente. Cuál es la probabilidad
de que ese paciente:
a) Haya sido visitado en forma personal
b) Haya recibido una llamada telefónica o,
c) Haya recibido una carta.
2. Tres médicos de un hospital de especialidades efectúan cirugías de corazón abierto
todos los días, el médico de la sala 1 efectúa el 35% de las operaciones, el médico de
la sala 2 el 45% y el médico de la sala 3 el 20%. En las operaciones de corazón abier-
to, el médico de la sala 1 fracasa en un 20% de sus operaciones, el de la sala 2 fracasa
en el 15% y el médico de la 3 fracasa en un 5%.
a) Si la operación tuvo éxito ¿cuál es la probabilidad de que haya sido operado por el
médico de la sala número 1?;
b Si la operación fracasó ¿cuál es la probabilidad de que haya sido operado por el
médico de la sala número 2?
3. Cinco líneas de producción fabrican los fusibles electrónicos para todos los aparatos
eléctricos utilizados en pacientes con problemas cardiovasculares. Los fusibles son
caros, son bastante confiables, y se suplen en lotes de 100 unidades. La mayoría de
los compradores prueba solamente un pequeño número de los fusibles antes de deci-
dir si aceptan o rechazan los lotes de fusibles que llegan, ya que la prueba es destruc-
tiva. Las cinco líneas producen fusibles a la misma velocidad y normalmente producen
solo 2% de fusibles defectuosos, que se distribuyen aleatoriamente en el proceso de
producción. Desafortunadamente, la línea 1 sufrió una falla mecánica y produjo 5%
de defectuosos en el mes de noviembre recién pasado. El productor se enteró de esta
situación después de haber enviado los fusibles. El administrador de uno de los hos-
pitales, adquirió un lote producido en el mes de noviembre y probó tres fusibles; uno
era defectuoso.
a) ¿Cuál es la probabilidad de que el lote haya salido de la línea 1?
b) ¿Cuál es la probabilidad de que el lote haya salido de una de las otras cuatro líneas?
Introducción a la probabilidad 143

4. En una etapa de la producción de cierto artículo de uso médico, se aplica soldadura


especial; y para eso, se usan tres diferentes robots. La probabilidad de que la soldadu-
ra especial sea defectuosa varía para cada uno de los tres robots, así como la propor-
ción de artículos que cada uno procesa.

Robots Defecto Artículo procesado


A 0.002 18%
B 0.005 42%
C 0.001 40%

a) ¿Cuál es la probabilidad global de defectos producidos por los tres robots?


b) Si se toma un artículo al azar y resulta con defectos de soldadura, ¿Cuál es la pro-
babilidad que no haya sido soldado por el robot C?
5. Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se
realizan correcciones faciales, un 35% implantes mamarios y el restante en otras ciru-
gías correctivas. Se sabe, además, que son de género masculino el 25% de los que se
realizan correcciones faciales, 15% implantes mamarios y 40% otras cirugías correcti-
vas. Si se selecciona un paciente al azar, determine:
a) La probabilidad de que sea de género masculino;
b) Si resulta que es de género masculino, ¿cuál es la probabilidad de que sea realiza-
do, una cirugía de implantes mamarios?
6. En la sala pediátrica de un hospital, el 60% de los pacientes son niñas. De los niños
35% son menores de 24 meses. El 20% de las niñas tienen menos de 24 meses. Un
pediatra que ingresa a la sala selecciona un infante al azar.
a) ¿Cuál es la probabilidad de que el infante sea menor de 24 meses?
b) Si el infante resultó ser menor de 24 años. ¿Cuál es la probabilidad de que sea una
niña?
7. Un doctor dispone de tres equipos electrónicos para realizar ecosonogramas. El uso
que le da a cada equipo es de 25% al primero, 35% el segundo y 40% el tercero. Se
sabe que los aparatos tienen probabilidades de error de 1%, 2% y 3% respectivamente.
Un paciente busca el resultado de una ecografía y observa que tiene un error. Deter-
mine la probabilidad de que se ha usado el primer aparato.
144 CAPÍTULO 9
CAPÍTULO

Distribuciones teóricas
de probabilidad 10
Contenido

10.1 La distribución binomial


10.2 La distribución de Poisson
10.3 La distribución normal
146 CAPÍTULO 10

Distribuciones teóricas de probabilidad


Las distribuciones de probabilidad son distribuciones de frecuencias teóricas que permi-
ten que la variable aleatoria asuma ciertos valores dentro de un intervalo determinado.
Por otra parte, una variable aleatoria transforma los eventos de un espacio muestral en
eventos numéricos.
Las distribuciones de probabilidad pueden ser discretas y continuas.
En el presente texto estudiaremos distribuciones de variable discreta como la bino-
mial, la Poisson, la geométrica, y la hipergeométrica, en donde su variable aleatoria solo
asume valores enteros entre cero y el tamaño del espacio muestral.
En las distribuciones de variable continua a estudiar en el presente texto tenemos la
normal, la uniforme, la gamma y la beta.
En el mundo real, es posible enfrentarse a diversidad de panoramas y a la existencia
de variedad de problemas en estadística inferencial, los cuales deben ser resueltos median-
te la distribución teórica de probabilidad más adecuada al tipo de problema. Los profesio-
nales de las ciencias médicas y áreas de la salud constantemente estarán luchando con
esta complejidad de problemas en su área, y por eso la necesidad trascendental de que
estos profesionales deben compenetrarse de manera profunda en el manejo de las diversas
distribuciones contentivas de las presentaciones y soluciones de la mayoría de problemas
en el mundo real.

10.1  La distribución binomial


Es una distribución de variable discreta que describe una variedad de procesos de interés
en la teoría de la probabilidad, la cual resultó de un experimento llamado “proceso
de Bernoulli”, en honor al matemático suizo del siglo xix, Jacob Bernoulli. El proceso de
Bernoulli estuvo relacionado al lanzamiento de monedas no alteradas un número fijo
de veces, y los resultados de estos lanzamientos pueden representarse mediante la distri-
bución de probabilidad binomial.
Los resultados o frecuencias de la distribución binomial estarán vinculados al éxito o
fracaso de los sucesos o eventos ocurridos, siendo éstos intentos estadísticamente inde-
pendientes, es decir, el resultado de un suceso no afecta el de cualquier otro suceso.
En el caso de la distribución binomial, calcularemos probabilidades mediante la fór-
mula siguiente:

n x n−x n!
P ( X = x) = pq = p x q n −x ;
x ( )
n − x ! x!

x = 0, 1, 2, 3, 4, . . . , n
n! = n factoria l donde n! = n(n – 1)(n – 2)(n – 3). . .(1)
Donde:
P = Probabilidad de éxito
q = (1 – P) = Probabilidad de fracaso
Notas especiales:
1. Simbólicamente, podemos representar la media de una distribución binomial por 𝜇 = np;
En la que:
n = número de ensayos
p = probabilidad de tener éxito
2. La desviación estándar de una distribución binomial se calcula por la fórmula si-
guiente: σ = npq ; donde:
Distribuciones teóricas de probabilidad 147

n = número de ensayos
p = probabilidad de éxito
q = probabilidad de fracaso
Cabe señalar que el maestro debe obligatoriamente enseñar a sus alumnos a plantear
y calcular probabilidades mediante la fórmula antes mencionada y con las tablas que apa-
recen en los anexos de cualquier texto de estadística. Las dos opciones son de legítima
obligatoriedad que el alumno las conozca, ya que ambos caminos tienen ventajas y des-
ventajas, por ejemplo, en un trabajo de campo el profesional no cuenta con una tabla de
probabilidades, o si cuenta con la tabla esta no tiene resultados para algunos valores de n,
más conocido como el tamaño del espacio muestral o el número de ensayos en un evento
de condiciones de Bernoulli. Asimismo, las disposiciones del presente párrafo deben ser
aplicadas para cualquier distribución de probabilidad discreta o continua.

Ejemplo 1
Con n = 7 y p = 0.4, determine las probabilidades binomiales siguientes:
a) P(x = 3)
b) P(x > 5)
c) P(x ≤ 2)
d) P(2 < x ≤ 4)

Solución inciso a)
n! 7!
P (x = 3) = P xq n−x = (0.4)3 (0.6)4 = 35(0.4)3 (0.6)4 ≅ 0.2903
(n − x )! x! (7 − 3)!3!

Solución inciso b)
7! 7!
P (x > 5) = P (x = 6) + P (x = 7) = (0.4)6 (0.6) + (0.4)7 (0.6)0 =
(7 − 6)!6! (7 − 7)!7 !
0.0172 + 0.0016 ≅ 0.0188

Solución inciso c)

P (x ≤ 2) = P (x = 0) + P (x = 1) + P (x = 2) =
7! 7! 7!
(0.4)0 (0.6)7 + (0.4)1 (0.6)6 + (0.4)2 (0.6)5 =
(7 − 0)!0! (7 −1)!1! (7 − 2)!2!
0.0280 + 0.1306 + 0.2613 ≅ 0.4199

Solución inciso d)

P (2 < x ≤ 4) = P (x = 3) + P (x = 4) =
7! 7!
(0.4)3 (0.6)4 + (0.4)4 (0.6)3 = 0.2903 + 0.1935 ≅ 0.4838
(7 − 3)!3! (7 − 4)!4!

Ejemplo 2
Una compañía distribuye un producto especial para hospitales y clínicas médicas de la
región sur del país, y sabe que la probabilidad de que le compren el producto cuando un
profesional de la medicina vea el anuncio por televisión es de 0.3. Suponga que 10 profe-
sionales de la medicina de la región sur ven el anuncio.
a) ¿Cuál es la probabilidad de que al menos unos de los hospitales o clínicas compren el
producto?
148 CAPÍTULO 10

b) ¿Cuál es la probabilidad de que a lo sumo tres hospitales o clínicas compren el pro-


ducto?
c) ¿Cuál es la probabilidad de que no más de cuatro hospitales o clínicas compren el
producto?
d) ¿Cuál es la probabilidad de que ninguno de los hospitales o clínicas compre el pro-
ducto?

Solución inciso a)
10!
P (x ≥ 1) = 1 − P (x = 0) = 1− (0.3)0 (0.7)10 = 1− 0.0282 ≅ 0.9718
(10 − 0)!0!

Solución inciso b)

P (x ≤ 3) = P (x = 0) +P (x = 1) +P (x = 2) +P (x = 3) =
10! 10! 10!
(0.3)0 (0.7)10 + (0.3)1 (0.7)9 + (0.3)2 (0.7)8 +
(10 − 0)!0! (10 −1)!1! (10 − 2)!2!
10!
(0.3)3 (0.7)7 = 0.0282 + 0.1211 + 0.2335 + 0.2668 ≅ 0.6496
(10 − 3)!3!

Solución inciso c)

P (x ≤ 4) = P (x = 0) + P (x = 1) + P (x = 2) + P (x = 3) + P (x = 4) =
10! 10! 10!
(0.3)0 (0.7)10 + (0.3)1 (0.7)9 + (0.3)2 (0.7)8 +
(10 − 0)!0! (10 −1)!1! (10 − 2)!2!
10! 10!
(0.3)3 (0.7)7 + (0.3)4 (0.7)6 = 0.0282 + 0.1211+ 0.2335 + 0.2668 +
(10 − 3)!3! (10 − 4)!4!
0.2001 ≅ 0.8498

Solución inciso d)
10!
P (x = 0) = (0.3)0 (0.7)10 ≅ 0.0282
(10 − 0)! 0!

EJERCICIOS 10.1
1. El 35% de los análisis clínicos en un laboratorio de Tegucigalpa no son confiables. Si
en éste laboratorio hay 20 reportes sobre análisis clínicos para ser entregados:
a) ¿Cuál es la probabilidad de que exactamente 2 no sean confiables?
b) ¿Cuál es la probabilidad de que al menos 3 sean confiables?
c) ¿Qué ninguno sea confiable?
d) ¿Qué menos de 3 sean confiables?
2. El 85% de los empleados de un complejo hospitalario, porta su identificación perso-
nal. Si en un día cualesquiera llegan 10 empleados a la entrada principal del complejo
hospitalario, cuál es la probabilidad de que el guardia de seguridad encuentre:
a) ¿Ocho empleados con identificación?
b) ¿Cuatro empleados sin identificación?
c) ¿Por lo menos 4 empleados sin identificación?
d) ¿A lo sumo 5 empleados con identificación?
e) ¿Entre 4 y 7 empleados inclusive con identificación?
Distribuciones teóricas de probabilidad 149

3. En un concurso para ocupar una plaza de médico general, un aspirante debe obtener
por lo menos el 60% en un examen de verdadero y falso con 18 preguntas por respon-
der. Si el aspirante lanza una moneda para determinar la respuesta a cada pregunta,
¿cuál es la probabilidad de que el aspirante apruebe el examen?
4. Para una distribución binomial con n = 7 y p = 0.20, encuentre:
a)  P(x = 5)      b) P(x > 2)      c) P(x < 8)      d) P(x ≥ 4)
e)  P((x ≤ 4) /(x ≥ 2))  f) P((x ≤ 1) o (x > 5) /(x ≤ 6))  g) 
P((1 ≤ x < 4) /(x ≥ 3))
5. En una encuesta realizada al personal de enfermería en un hospital público indica
que, de las enfermeras escogidas al azar, la probabilidad de que sean graduadas y con
experiencia es de 0.30, la probabilidad de que no sean graduadas y con experiencia es
de 0.55 y la probabilidad de que no sean ni graduadas ni con experiencia es 0.15.
Suponiendo que estas probabilidades son exactas, responda las preguntas siguientes
con respecto a un grupo de 10 enfermeras seleccionadas al azar.
a) ¿Cuál es la probabilidad de que cuatro sean graduadas y con experiencia?
b) ¿Cuál es la probabilidad de que ninguna sea graduada y con experiencia?
c) ¿Cuál es la probabilidad de que dos no sean ni graduadas ni con experiencia?
d) ¿Cuál es la probabilidad de que al menos ocho sean graduadas y con experiencia?
6. El jefe de proveeduría de una cadena de clínicas para salud mental se ha dado cuenta
de que la probabilidad de que un administrador de una de estas clínicas que ha reali-
zado cotizaciones durante la semana vía teléfono, compre algún implemento o apara-
to médico, es de 0.45. Supóngase que 15 clínicas de la cadena en mención cotizaron
durante una semana cualesquiera.
a) ¿Cuál es la probabilidad de que al menos unas de las clínicas compren algún im-
plemento o aparato médico esa semana?
b) ¿Cuál es la probabilidad de que al menos cuatro clínicas compren algún aparato o
implemento médico?
c) ¿Cuál es la probabilidad de que ninguna de las clínicas que cotizaron vía teléfono
durante la semana compren algún implemento o aparato médico?
d) ¿Cuál es la probabilidad de que no más de cuatro clínicas que cotizaron durante la
semana compren un aparato o implemento médico?
7. Una Comisión Especial de 15 médicos en un hospital público de San Pedro Sula es la
responsable de la toma de decisiones para la aprobación de cirugías y operaciones
complejas. Un paciente tiene cita para someterse a una operación complicada, y se
sabe que en estos casos la decisión es tomada por mayoría de votos en la Comisión
Especial de Médicos. Por experiencia se sabe que la Comisión Especial de Médicos
toma dichas decisiones en 95% de las veces. ¿Cuál es la probabilidad de que el pacien-
te sea intervenido quirúrgicamente?
8. Los estudiantes de la Carrera del Doctorado en Cirugía Dental de la Universidad
Católica de Honduras, en la clase de Cirugía I, se someten a un examen de opción
múltiple compuesto de 15 preguntas, con cinco respuestas posibles cada una, de las
cuales solamente una es correcta. Supóngase que uno de los estudiantes que realizan
el examen contesta las preguntas al azar. ¿Cuál es la probabilidad de que conteste
correctamente al menos 10 preguntas?
9. La probabilidad de que un ratón inoculado con un suero contraiga cierta enfermedad
es de 0.20. Encuentre la probabilidad que a lo más tres de 30 ratones inoculados
contraigan la enfermedad.
10. Los trabajadores de una empresa que fabrica aisladores son examinados para detectar
la presencia de asbesto en sus pulmones. La empresa debe enviar tres trabajadores
con pruebas positivas de asbesto a un centro médico para realizarles más exámenes.
Si el 40% de los trabajadores tienen pruebas positivas de asbesto en sus pulmones,
150 CAPÍTULO 10

encuentre la probabilidad de que se tenga que examinar 10 trabajadores hasta encon-


trar tres con asbesto en los pulmones.
11. Arturo Hernández, tiene a cargo la Sección de Aparatos para Cirugía Dental. Él se
ha percatado de que la probabilidad de que un médico odontólogo compre equipos
de cirugía dental, ya que vio el anuncio de descuentos en los periódicos, es de 0.70.
Suponga que 15 odontólogos vieron el anuncio:
a) ¿Cuál es la probabilidad de que por lo menos un odontólogo compre, dado que vio
el anuncio en el periódico?
b) ¿Cuál es la probabilidad de que no más de 4 odontólogos compren?
12. Para una distribución de probabilidad binomial donde el 60% de 10 observaciones
son votos a favor del Doctor Gómez para la presidencia del Colegio Médico de Hon-
duras. ¿Cuál es el valor esperado o esperanza matemática, si a lo más tres votantes
están a favor del Doctor Gómez?
13. Un fabricante de accesorios preventivos para cirugía dental, desarrolla dos productos
nuevos A y B, los cuales desea someter a evaluación de un grupo de médicos odontó-
logos, para determinar cuál es el mejor. Por información del fabricante se sabe que el
producto A no tiene preferencia ante el producto B. Se hace la demostración ante un
grupo de 12 profesionales de la cirugía dental.
¿Cuál es la probabilidad de que más de siete profesionales de cirugía dental pre-
fieran el producto A o B?

10.2  La distribución de Poisson


La distribución de Poisson, debe su nombre a Simeón Denis Poisson (1781-1840), un
francés que desarrolló ésta distribución a partir de los estudios que realizó durante la últi-
ma parte de su vida.
La distribución de Poisson es una distribución de probabilidad discreta, ya que los
valores que asume la variable son números enteros (x = 0, 1, 2, 3, 4,..), y se utiliza para
describir ciertos procesos, entre éstos los estudios de cola como: las llamadas telefónicas
que llegan a un conmutador, la demanda de ciudadanos que requieren de los servicios de
una institución hospitalaria, la llegada de móviles a cierto lugar (ambulancias y otros), el
número de accidentes registradas en cierta intersección de calles, etc.
Las probabilidades en la distribución de Poisson, se calculan mediante la fórmula:
λ x e −λ
P ( X = x) = ;
x!
λ = Valor promedio o media
e = 2.718281 . . .
Donde:
x = 0, 1, 2, 3, 4, . . .
x! = (x – 1)(x – 2)(x – 3), . . . , (1)

Notas especiales:
1. La distribución de Poisson puede ser aproximada a la Distribución Binomial, median-
( np ) e ( )
x −mp

te la fórmula: P ( X = x ) =
x!
2. La Distribución de Poisson es una aproximación a la Distribución Binomial cuando
n es mayor o igual a 20, y p es menor o igual a 0.05.
3. Dependiendo de los eventos, la media global es la suma de las medias parciales des-
critas en el problema.
Distribuciones teóricas de probabilidad 151

Ejemplo 1
Dada λ = 4.2 para la distribución de Poisson, determinar:
a) P(x = 2)
b) P(x < 3)
c) P(x ≥ 5)

Solución inciso a)
(4.2)2 e −4.2 (17.64)(0.014995576)
P (x = 2) = = ≅ 0.1323
2! 2

Solución inciso b)
(4.2)0 e −4.2 (4.2)1 e −4.2 (4.2)2 e −4.2
P (x < 3) = P (x = 0) + P (x = 1) + P (x = 2) = + + ≅
0! 1! 2!
0.0149 + 0.0629 + 0.1323 = 0.2101
Solución inciso c)
P (x ≥ 5) =1 − P (x < 5) = 1− P (x = 0) + P (x = 1) + P (x = 2) + P (x = 3) + P (x = 4) =
1 − 0.0150 +0.0630 + 0.1323 + 0.1852 + 0.1944 = 1 − 0.5899 ≅ 0.4101

Ejemplo 2
Al estacionamiento de un hospital privado en la Ciudad de San Pedro Sula, cada 15 mi-
nutos por la entrada I, se cuantifica el ingreso de un promedio de 4 vehículos, y por la
entrada II un promedio de 3 vehículos. Durante un lapso de 15 minutos en una hora
cualesquiera, cual es la probabilidad que a éste estacionamiento ingresen:
a) Exactamente 5 vehículos;  b) Más de 10 vehículos;  c) No más de 3 vehículos.
Solución inciso a)
Como el promedio de vehículos que ingresan por la entrada I durante 15 minutos es de 4
y por la entrada II es de 3 vehículos, entonces λ = 4 + 3 = 7, por tanto:
λ x e−λ (7)5 e −7
P (x = 5) = = ≅ 0.1277
x! 5!
Solución inciso b)
P (x > 10) =1 − P (x =0) + P (x =1) +... +P (x = 10) = 1 −0.9014 ≅ 0.0986

Solución inciso c)
P (x ≤ 3) = P (x = 0) +P (x = 1) +P (x = 2) +P (x = 3) =0.0009 + 0.0064 +0.0223 +
0.0521 ≅ 0.0817

EJERCICIOS 10.2
1. En un complejo hospitalario de la Ciudad de La Ceiba, se han contratado a ocho re-
cepcionistas telefónicas para que tomen las citas de los pacientes solicitantes de aten-
ción médica. Una recepcionista está ocupada el 30% del tiempo tomando los datos de
un paciente. Como director del complejo hospitalario usted no desea que la probabi-
lidad de que la llamada de un paciente se reciba con una señal de ocupado y que esta
situación exceda el 50%. ¿Debería usted contratar más recepcionistas si 3 pacientes
llamaran al mismo tiempo?
152 CAPÍTULO 10

2. A un conmutador de la oficina principal del “Future Health Hospital” llegan llama-


das a un promedio de dos por minuto y se sabe que tienen distribución Poisson. Si el
operador esta distraído por un minuto, cuál es la probabilidad de que el número de
llamadas no respondidas sea:
a)  Cero  b) Por lo menos una  c) Entre 3 y 5, inclusive
3. ¿Cuáles serían las probabilidades en el ejercicio anterior, si el operador se distrae por
4 minutos?
4. Un proceso de fabricación utilizado para hacer aparatos ortopédicos presenta una
tasa de defectos de 5 por cada 100 unidades. Las unidades se envían a los hospitales
de varios países en lotes de 200. Si la probabilidad de que más de 3 salgan defectuosos
supere el 30%, usted como director de un hospital dejará de comprarle aparatos orto-
pédicos a ésta empresa. ¿Le seguirá comprando?
5. Usted como jefe de abastecimiento de una compleja droguería compra productos a
una fábrica del extranjero. Se sabe que este proveedor no cumple con los estrictos re-
quisitos de fabricación de sus productos en un 3% por paquete o envasado. Usted está
urgido en adquirir 150 paquetes o envases fabricados por la empresa extranjera en
mención, pero no aceptará una probabilidad de más del 50% de que dos o más paque-
tes tengan fallas de fabricación. ¿Usted le seguirá comprando a dicho proveedor?
6. Si los precios de los medicamentos aumentan en cuatro veces promedio cada diez
años, encuentre la probabilidad de que:
a) Ningún aumento se dé en un período de diez años;
b) Haya dos aumentos de precio;
c) Haya cuatro aumentos de precio;
d) Haya cinco o más aumentos.
7. Dado que λ = 4.2, para una distribución de Poisson, encuentre:
a)  P(x ≤ 2)  b) 
P(x ≥ 5)  c) 
P(x = 8)  d) 
P((x < 2) o (x ≥ 5) /(x ≤ 0))  
8. El jefe de Recursos Humanos de un complejo hospitalario está preocupado por la
habilidad de un empleado de mantenimiento ya mayor para mantener el menor ritmo
de trabajo. Además de los descansos diarios obligatorios, este empleado deja de tra-
bajar durante períodos cortos un promedio de 4.1 veces por hora. El periodo de des-
canso que se toma es de tres minutos cada vez. El jefe de Recursos Humanos ha
decidido que, si la probabilidad del descanso adicional del empleado es 12 minutos o
más por hora, del empleado (es decir, además del obligatorio), es mayor que 0.5, en-
tonces lo cambiará a realizar una tarea diferente. ¿Deberá el jefe de Recursos Huma-
nos cambiarlo a una actividad diferente?
9. El departamento legal de una gran compañía farmacéutica, maneja varios tipos de
litigios laborales en sus empleados, pero casi todos ellos son de tipo psicológico debi-
do a la alta incidencia de violencia doméstica en los hogares de esa comunidad. De
hecho, 90% de los casos que atienden los oficiales jurídicos de la unidad legal son de
ésta naturaleza.
a) ¿Cuál es la probabilidad, de que de 30 litigios atendidos por el departamento legal
exactamente siete, no sean de violencia doméstica?
b) ¿Cuál es la probabilidad de que ninguno sea de carácter psicológico por violencia
doméstica?
10. Los coches de los empleados del Hospital Medical Center ingresan al estacionamien-
to a través de dos entradas. La primera entrada tiene una media de tres automóviles
por cada media hora y la segunda entrada registra una media de cinco automóviles por
cada media hora. En un día cualesquiera y en un término de 30 minutos, ¿cuál es la
probabilidad de que:
Distribuciones teóricas de probabilidad 153

a) Ingresen al estacionamiento exactamente dos automóviles


b) Ningún automóvil
c) Más de tres automóviles
d) Más de un automóvil y menos de cinco

10.3  La distribución normal


Es una distribución de probabilidad continua, ya que su variable aleatoria puede asumir
cualquier valor numérico dentro de un intervalo dado. Esta distribución es muy utilizada
por la diversidad de profesionales de las áreas biológicas, administrativas y de la ingenie-
ría. Asimismo, ocupa un lugar prominente en las estadísticas ya que sus propiedades la
hacen aplicable a un gran número de situaciones en los muestreos y cálculo de probabili-
dades. A la distribución normal también se le conoce como la distribución gaussiana en
honor al matemático, astrónomo y físico alemán del siglo xix, Johann Carl Friedrich
Gauss.
La distribución normal cuenta con características especiales como ser:
a) Su gráfica tiene un solo pico, por tanto, es unimodal;
b) Su media está distribuida normalmente y cae en el centro de la curva;
c) La curva normal es simétrica;
d) La media, la mediana y la moda tienen el mismo valor y todas caen en el centro de la
curva;
d) Los dos extremos de la distribución normal se extienden indefinidamente y nunca
tocan el eje horizontal.
La representación gráfica de la distribución normal es una curva en forma de campa-
na, como la siguiente figura.

𝜇 – 3𝜎 𝜇 – 2𝜎 𝜇–𝜎 𝜇 𝜇+𝜎 𝜇 + 2𝜎 𝜇 + 3𝜎

La curva normal dependiendo del intervalo y las condiciones del evento probabilísti-
co puede ser acotada y representada por áreas como las siguientes:
1. El cálculo de probabilidades para la distribución normal en general está dada por;
2
1 x −µ

2 σ
b e
P (a ≤ x ≤ b ) = ∫ f (x ) dx f (x ) =
a σ 2π

No obstante, para la facilitación de los cálculos de probabilidades se utilizará la tabla


normal (Anexos final del texto).
2. La probabilidad en el intervalo a ≤ x ≤ b se representa por:
154 CAPÍTULO 10

a 𝜇 b

𝜇 a b

a b 𝜇

3. La probabilidad en el intervalo x ≤ a se presenta por:

a 𝜇

𝜇 a

4. La probabilidad en el intervalo x ≥ a se presenta por:

a 𝜇
Distribuciones teóricas de probabilidad 155

𝜇 a

Matemáticamente, el área bajo la curva normal es 1 o 100% de todos los casos de la dis-
tribución dada.

Ejemplo 1
Utilizando la tabla normal, calcular las siguientes probabilidades:
a) P(z > 2.1);  b) P(–1.2 < z < 1.5);  c) P(z < – 2.8);  d) P(z = 2.4)
e) P(z < – 1.5 o z > 1.5)

Solución inciso a)
Si dibujamos la curva normal se puede apreciar que el área buscada es:

𝜇=0 z = 2.1

Entonces P(z > 2.1) = 0.5 – P(z = 2.1) = 0.5 – 0.4821 = 0.0179

Solución inciso b)

–1.2 0 1.5

P(–1.2 < z < 1.5) = P(z = 1.5) + P(z = 1.2) = 0.4332 + 0.3849 = 0.8181

Solución inciso c)

–2.8 𝜇=0

P(z < –2.8) = P(z > 2.8) = 0.5 – P(z = 2.8) = 0.5 – 0.4974 = 0.0026
156 CAPÍTULO 10

Solución inciso d)

𝜇=0 2.4

P(z = 2.4) = 0.4918


Solución inciso e)

–1.5 𝜇=0 1.5

 ((z < –1.5) o (z > 1.5)) = 2P(z > 1.5) = 1 –2P(z = 1.5) = 1 – 2(0.4332) = 1 –0.8664
P
= 0.1336
Ejemplo 2
Los salarios anuales de los ejecutivos de mandos intermedios de una Unidad de la Secre-
taría de Salud están distribuidos normalmente con una desviación estándar de 1200 lem-
piras. Se tiene programado un recorte de personal de aquellos que ganen menos de 18,000
lempiras. Si tal medida representa el 10% de empleados de mandos medios.
a) ¿Cuál es actualmente el salario medio de estos funcionarios?
b) ¿Cuál es el sueldo mínimo que perciben estos funcionarios de tal forma que no se
exceda del 12%?
Solución inciso a)
x −µ x −µ
x = 18000; σ = 1200; P z < = 0.10 ; Entonces: z =
σ σ
De la tabla normal

40% 50%
10%

z 𝜇

de la tabla normal z = −1.28


x −µ 18000 − µ
Luego de z = −1.28 = ; despejando
σ 1200
µ = 18000 + (1200)(1.28) ≅ 19536
Solución inciso b)
x −µ x −µ
µ = 19536; σ = 1200; P z < = 0.12 ; Entonces: z =
σ σ
Distribuciones teóricas de probabilidad 157

Entonces Z = –1.178
x −µ x −19536
Luego de z = − 1.178 = ; despejando
σ 1200
x = 19536 – (1200)(1.178) ≅ 18,122.40

38% 50%
12%

x 𝜇 = 19536

38% 50%
12%

z 𝜇=0

Ejemplo 3
Una compañía fabrica marcos especiales de puertas para una obra en construcción. La
compañía quiere fabricar marcos de puertas lo más pequeños posible para ahorrar en los
costos de material, pero al mismo tiempo desea preservar su buena reputación entre la
población de la ciudad. Por otra parte, la compañía está obligada a fabricar puertas que
sean suficientemente grandes para que por ellas pase el 99% de las personas que se movi-
lizan al interior de los inmuebles. A fin de determinar la altura de las puertas, la empresa
está dispuesta a suponer que la talla de la población en esta ciudad tiene una distribución
normal, con una media de 71 pulgadas y una desviación estándar de 7 pulgadas.
¿Qué altura deben de tener las puertas en esta obra de construcción?
Solución
x −µ x −µ
µ = 71; σ = 7; P z < = 0.99 ; entonces: z =
σ σ

50% 49%
1%

𝜇 = 71 x

50% 49%
1%

𝜇=0 z
158 CAPÍTULO 10

x −µ x − 71
De z = 2.33 = ; despejando:
σ 7
x = (7)(2.33) + 71 ≅ 87.31 Pulgadas.

Ejemplo 4
En una editorial, el editor de revistas sobre cuidados e higiene bucal calcula que transcu-
rren en promedio 11 semanas antes de terminar el proceso de publicación, desde la elabo-
ración del manuscrito hasta terminar la revista, con una desviación estándar de 2.4 sema-
nas. Piensa que la distribución normal describe bien los tiempos de publicación. De 19
revistas que tendrá a su cargo este año. ¿Aproximadamente cuantas estarán terminadas en
menos de 12 semanas?
Solución
x −µ 12 −11
P( x ≤ 12) = P (z ≤ ) = P (z ≤ ) = P (z ≤ 0.42) = 0.5 + P (z = 0.42) = 0.5 + 0.1628
σ 2.4
= 0.6628
Luego el número n de revistas terminadas está dado por n = (0.6628) (19) = 12.59;
entre 12 y 13 revistas estarán terminadas.

EJERCICIOS 10.3
1. Calcular el área bajo la curva normal, para los incisos siguientes:
a) P(z = 1.52)   b) P(z > 1.52)  c) P(z < 1.52)
d) P(–2.1 < z < 0)
e) P(z < – 1.35)  f) P(–1.5 < z < 2.1)
g) P(0.7 < z < 2.5)
2. En una preclínica del IHSS, se sabe que el peso promedio de los pacientes adultos se
ajusta a una distribución normal con una media de 170 libras y una desviación están-
dar de 25 libras. Calcular las probabilidades siguientes:
a)  P(x ≥ 165)   b)  P(140 ≤ x ≤ 190)   c) P(x < 155)  
d)  P(x <185)   e)  P(x ≥ 145)   f) P(150 ≤ x ≤ 195)  
3. Dado una variable aleatoria X que tiene una distribución binomial con n = 50 ensayos
y p = 0.25, utilice la aproximación de la distribución binomial a la normal para encon-
trar (usar distribución normal):
a)  P(x > 10)  b)  P(x < 18)    c)  P(x > 21)  d) 
P(9 < x < 14)
4. En una distribución normal con una desviación estándar de 5.0, la probabilidad de
que una observación elegida al azar exceda 21 es de 0.1401:
a) Encuentre la media de la distribución;
b) Encuentre el valor por debajo del cual se halla el 4% de los valores de la distribu-
ción.
5. El médico responsable del área de emergencia en un hospital público de una gran
ciudad desea cuantificar la variación en la demanda semanal de pintas de sangre. Ha
decidido suponer que esta demanda está distribuida normalmente. El médico sabe
que en promedio se requieren 100 pintas de sangre semanalmente y que 90% de las
veces la demanda semanal está por debajo de 115 pintas.
Distribuciones teóricas de probabilidad 159

a) ¿Cuál es la desviación estándar de esta distribución?;


b) El médico desea tener en existencia el número suficiente de pintas de sangre cada
semana, de modo que la probabilidad de quedarse sin sangre no sea mayor de 0.05.
¿Cuál es el más bajo nivel de existencias que debe tener?
6. La compañía Sánchez y Asociados ha recibido un gran pedido para producir motores
eléctricos para marcapasos en personas con problemas cardiacos. Con el fin de que
ajuste en su soporte, el mini rotor del motor debe tener un diámetro de 5.1 ± 0.05
(milímetros). El encargado de las compras de la compañía se da cuenta de que hay en
existencia una gran cantidad de pequeños pines de aluminio con un diámetro medio
de 5.07 milímetros, y con una desviación estándar de 0.07 milímetros. ¿Cuál es la
probabilidad de que un pin de aluminio del inventario existente se ajusta en el sopor-
te del motor de la marcapasos?
7. El jefe de mantenimiento del área de lubricación de piezas para todos los aparatos y
motores hidráulicos que funcionan en un hospital está tratando de revisar su política
de pedidos de cartuchos de pistolas de grasa. Actualmente, ordena 110 cartuchos por
mes, pero se queda sin ellos uno de cada cuatro meses. Sabe que, en promedio, los
edificios del hospital para sus gradas eléctricas y motores hidráulicos utilizan 95 car-
tuchos por mes. También está dispuesto a suponer que la demanda de cartuchos está
distribuida normalmente.
a) ¿Cuál es la desviación estándar de esta distribución?
b) Si el jefe de mantenimiento desea pedir el número suficiente de cartuchos para que
la probabilidad de que se quede sin ellos en un mes cualquiera no sea mayor a 0.02,
¿cuántos cartuchos deberá pedir al mes?
8. La compañía Jarrid Medical, Inc. está desarrollando una máquina compacta para
realizar diálisis de riñón, pero el ingeniero en jefe de la compañía Mike Crowe tiene
problemas al controlar la variabilidad de la rapidez con la cual se mueve el fluido por
el aparato. Los patrones médicos requieren que el flujo por hora sea de cuatro litros,
mas, menos 0.1 litro, 80% del tiempo. El señor Crowe, al hacer las pruebas al prototi-
po, se encuentra con que 68% del tiempo el flujo por hora está dentro del margen de
0.08 litros con respecto a 4.02 litros. ¿Satisface el prototipo los patrones mediados?
9. El proveedor responsable de abastecer y mantener el inventario de gorros para el
personal médico que laboran permanentemente para los quirófanos de un gran hos-
pital, basándose en la experiencia, ha decidido que el tamaño de la cabeza del perso-
nal médico varía de tal modo que se le puede aproximar por una distribución normal
con un diámetro medio de 7 pulgadas para gorros. Recientemente ha revisado su es-
timación de la desviación estándar y la cambió de 0.75 a 0.875 pulgadas. La política
actual sobre existencias es tener a mano gorros de cada talla (en incrementos de 1/8
de pulgada) desde 6 — 1 de pulgada hasta 7 —
3 de pulgada. Suponiendo que un empleado
4 4
podrá obtener un gorro de su talla si se encuentra dentro de este intervalo de tallas,
encuentre la probabilidad de que dicho empleado obtenga un gorro de su talla, utili-
zando:
a) La anterior estimación de la desviación estándar;
b) La nueva estimación de la desviación estándar.
10. Un aparato utilizado en el quirófano se puede ajustar de tal manera que llene algunos
recipientes utilizados en operaciones con un promedio de µ centímetros cúbicos de
sangre. Si el número de centímetros cúbicos por recipiente tiene una distribución nor-
mal con una desviación estándar igual 0.3 centímetros cúbicos, encuentre el valor de
µ, de tal manera que los recipientes de cinco centímetros cúbicos solo pierdan el 1%.
11. Una empresa metalmecánica produce instrumentos para cirugía dental con espesor
corto punzante que tienen una distribución normal con media de 3.0005 milímetros
160 CAPÍTULO 10

y una desviación estándar de 0.0010 milímetros. Las especificaciones requieren que


los diámetros estén en el intervalo 3.000 ± 0.0020 milímetros. Se rechazan los instru-
mentos que quedan fuera del intervalo y deben volverse a maquinar, con la maquina-
ria actual. ¿Qué fracción de la producción total será rechazada?
12. El editor de revistas sobre cuidados suprarrenales de un gran complejo hospitalario
supone que transcurren en promedio siete meses antes de terminar el proceso de
publicación, desde la elaboración del manuscrito hasta terminar la revista, con una
desviación estándar de 1.4 meses. Piensa que la distribución normal describe bien los
tiempos de publicación para la revista en mención. Si se sabe que en ediciones de
años anteriores se han producido o terminado alrededor de cincuenta revistas en
menos de nueve meses, ¿aproximadamente, que cantidad de revistas debería tener a
su cargo este año?
CAPÍTULO

Técnicas de muestreo
11
Contenido

11.1 Muestreo no aleatorio


11.1.1 Por accidente
11.1.2 Por cuota
11.1.3 Intencional o de juicio
11.2 Muestreo aleatorio
11.2.1 Aleatorio simple
11.2.2 Sistemático
11.2.3 Estratificado
11.2.4 Por conglomerado
162 CAPÍTULO 11

Técnicas de muestreo
Una de las aplicaciones más importantes de la estadística es hacer inferencias acerca de
grupos o poblaciones muy grandes, basándose en pequeños cúmulos llamados muestras.
En otras palabras, se trata de conocer características de interés de una población entera a
partir de datos de una o más muestras, tomadas de dicha población.
La medida en que estas inferencias sean funcionales y exactas, dependerá de lo ade-
cuado de las muestras.

Tipos de muestreo
Los muestreos se clasifican en:
1. No aleatorio;
2. Aleatorio

11.1  El muestreo no aleatorio


Es aquel en que las muestras se seleccionan a partir de su consideración propia, basada
en experiencias totalmente típicas y en aplicación de algunos fundamentos matemáticos
lógicos y de sentido común.
Existen tres tipos de muestreos no aleatorios:
1. El muestreo por accidente;
2. El muestreo por cuota;
3. El muestreo intencional o de juicio.

11.1.1 Muestreo por accidente


Consiste en estudiar los datos que a criterio del investigador conviene analizar.
Ejemplo
En la Universidad Católica de Honduras, Campus “Sagrado Corazón de Jesús” se realiza
una investigación sobre algunos inconvenientes en el transporte colectivo universitario,
para ello el investigador elabora y aplica una encuesta a un grupo de estudiantes universi-
tarios usuarios del transporte colectivo universitario, seleccionados por el investigador
con el propósito de establecer una conclusión del problema en estudio.

11.1.2 Muestreo por cuota


Consiste en formar las muestras considerando las diversas características de la población
de acuerdo al porcentaje que ocupan dentro de ella. Estas características pueden ser la
edad, sexo, religión, preferencia de algún deporte, preferencias en los partidos políticos,
preferencias de médicos, tipos de clínicas o hospitales, tratamientos, sistema de aplica-
ción de medicamentos, costumbres, etc…, y la selección se hace siguiendo un criterio no
aleatorio.
Ejemplo
En la Universidad Católica de Honduras se realiza una investigación estadística sobre los
niveles de conocimiento y manejo óptimo sobre matemática básica para alumnos que
cursan la clase de Bioestadística. Se sabe que 53% de los estudiantes de medicina son
hombres y que 47% son mujeres, y que la muestra seleccionada por el investigador es de
500 estudiantes.
Para determinar el número de estudiantes hombres y mujeres, se hace lo siguiente:
Hombres: 53%: 500 × 0.53 = 265
Mujeres: 47%: 500 × 0.47 = 235
Técnicas de muestreo 163

11.1.3 Muestreo intencional o de juicio


Consiste en tomar los datos para formar la muestra de acuerdo a la experiencia, al sentido
común o al sano juicio del investigador, es decir solo tomará aquellos datos que él consi-
dere representativos en la población.
Ejemplo
Un investigador residente en la capital de la República de Honduras (Tegucigalpa) supone
que los jóvenes aspirantes a estudiar medicina prefieren la Universidad Católica de Hon-
duras UNICAH o la Universidad Nacional Autónoma de Honduras UNAH, ambas uni-
versidades cuentan con ventajas y desventajas para los padres de familia. Es posible que,
para las familias católicas, la Universidad Católica de Honduras sea mejor, y que otros
sectores digan lo contrario.

11.2  Muestreo aleatorio


Son aquellos donde los elementos por seleccionar se toman de acuerdo con las leyes pro-
babilísticas, o sea que cada elemento de una población tiene la misma probabilidad de ser
seleccionado como parte de la muestra.
Existen cuatro tipos de muestreos aleatorios:
1. Aleatorio simple;
2. Sistemático;
3. Estratificado;
4. Por conglomerado.

11.2.1 Muestreo aleatorio simple


Consiste en enumerar cada dato de una población para después escoger aleatoriamente
cada uno de los datos que formarán la muestra. El procedimiento a seguir cuando la po-
blación es pequeña es depositar en una urna cada uno de los números que representan los
datos y luego ir sacando al azar de uno en uno los datos de la muestra.
Si la población es demasiada grande, es inconveniente el uso de urnas, por tanto, se
han creado o pueden crearse tablas de dígitos aleatorios, las cuales se usan de acuerdo a
reglas específicas que un experto en el tema puede explicar.
Ejemplo
De una población de 100 estudiantes de cirugía dental de la Universidad Católica de
Honduras, se desea tomar una muestra de 15 estudiantes que representarán a la UNICAH
en un programa televisivo de higiene bucal, se supone que todos los estudiantes poseen el
mismo nivel de capacidades en el tema a tratar. El procedimiento a seguir es enumerar los
100 nombres de los estudiantes de 1 a 100 y depositar los números anotados en papel o
esferitas en una urna, y luego sacar uno a uno los 15 números correspondientes a los
nombres de los estudiantes que formarán la muestra. El proceso utilizando debe estar
apegado a las reglas del azar sin que se permitan sesgos.

11.2.2 El muestreo sistemático


Consiste en dividir la población entre el tamaño de la muestra a obtener, para así formar
tantos grupos como datos tendrá la muestra. Por tanto, para obtener el primer elemento
que formará parte de la muestra, se toma al azar un elemento del primer grupo: luego para
escoger el segundo elemento se le suma al primer elemento el tamaño de cada grupo y así
sucesivamente hasta completar la muestra.
Ejemplo
Se desea formar una muestra de tamaño 20 de una población constituida de 500 profesio-
nales de la medicina en Centroamérica.
164 CAPÍTULO 11

Primero se divide 500 entre 20, dando como resultado el cociente 25, donde 25 co-
rresponde al tamaño de cada grupo. Como segundo paso se selecciona al azar un número
entre 1 y 25, y, por ejemplo, si saliera seleccionado el número 17, entonces el 17 será el
primer elemento que formará parte de la muestra. Para seleccionar el segundo elemento
de la muestra solo se le suma 25 a 17, resultando el número 42, después a 42 se le suma
25 resultando el número 67 como el tercer elemento de la muestra, y así sucesivamente
hasta completar los 20 datos que en este caso en particular tendrá la muestra, y que serán
los siguientes: (recuerde que los participantes están en una nómina numerados del 1 al
500).
17, 42, 67, 92, 117, 142, 167, 192, 217, 242, 267, 292, 317, 342, 367, 392, 417, 442, 467 y 492.

11.2.3 El muestreo estratificado


Es similar al muestreo no aleatorio por cuotas, excepto en que después de haber determi-
nado los porcentajes de cada grupo o estrato, los elementos de la muestra se extraen de
cada estrato, mediante un muestreo aleatorio, por tal razón el muestreo estratificado es
una combinación del muestreo no aleatorio por cuotas y el muestreo aleatorio simple.
En éste muestreo la población se divide en estratos por cuota y a cada estrato se le
aplica el muestreo aleatorio simple. Éste muestreo garantiza que todos los elementos de
la población tienen la misma probabilidad de ser seleccionados.
Ejemplo
Se hace una encuesta sobre el porqué de la preferencia de los estudiantes hacia cinco ca-
rreras en particular de la Universidad Católica de Honduras, UNICAH. Para realizar un
trabajo representativo, es necesario estudiar cada carrera por separado y formar los cinco
estratos:

Estrato 1. Medicina y cirugía


Estrato 2. Odontología
Estrato 3. Ingenierías
Estrato 4. Derecho
Estrato 5. Administración de empresas
Estrato 6. Otras carreras

Además, se sabe que 20% son estudiantes de medicina, 11% son estudiantes de Odon-
tología, 32% estudiantes de ingeniería, 8% estudiantes de Derecho y 18% estudiantes
de administración de empresas, y 11% restante estudiantes de otras carreras. Aplicando el
muestreo por estratificación, se desea obtener una muestra de tamaño 1000.
Aplicando los cálculos necesarios la muestra estará formada de la manera siguiente:

Medicina y cirugía : 20%: 1000 × 0.2 = 200


Odontología : 11%: 1000 × 0.11 = 110
Ingenierías : 32%: 1000 × 0.32 = 320
Derecho :  8%: 1000 × 0.08 = 80
Administración de empresas : 18%: 1000 × 0.18 = 180
Otras carreras : 11%: 1000 × 0.11 = 110
Una vez que se ha establecido la cantidad de los elementos de cada estrato, se toma
la lista de estudiantes de medicina, y mediante el muestreo aleatorio simple se obtienen
los 200 estudiantes que integran la muestra. Se hace lo mismo con los estratos restantes
del presente ejemplo, hasta obtener los 1000 elementos que constituirán la muestra a
analizar.
Técnicas de muestreo 165

11.2.4 El muestreo por conglomerado


Este muestreo es el más utilizado y adecuado para la realización de censos, el que consis-
te en dividir geográficamente una población para después escoger al azar los grupos que
formarán la muestra. A estos grupos se les conoce como cúmulos o conglomerados.
Se sabe que las principales limitantes en la realización de un censo son los recursos
financieros, el tiempo, el personal, la logística y otros, por tanto, el muestreo aleatorio por
conglomerado es utilizado en la sustitución de un censo completo, y que se procede en la
forma siguiente:
1. Se establece la población en estudio de manera geográfica;
2. Las divisiones geográficas pueden constituirse en los componentes y sub componen-
tes denominados en las divisiones políticas de los continentes, países, regiones, de-
partamentos, distritos, provincias, municipios, aldeas caseríos, etc.;
3. Una vez identificados los cúmulos, a cada una de ellos para ser seleccionados se le
aplica el método aleatorio más conveniente.

Ejemplo
Se va establecer un censo en la capital de la República de Honduras con el objetivo de
medir varias características en común de los pobladores de Tegucigalpa y Comayagüela.
La disponibilidad de recursos para llevar a cabo el censo es demasiada limitada, por tanto,
nos apoyaremos en el muestreo aleatorio por conglomerado, procediendo de la manera
siguiente:
Supongamos que la oficina responsable sobre dicho estudio solo cuenta con recursos
para contratar 40 encuestadores (dos por cúmulo), entonces, se obtiene un mapa de am-
bas ciudades y utilizando líneas rectas meridionales, en éste caso en particular se puede
dividir toda la periferia en unos 80 cúmulos, de los cuales solo 20 serán seleccionados
para ser encuestados.

Todos los cúmulos en éste caso del ejemplo en particular, se enumeran de 1 a 80 y


con la técnica del muestreo aleatorio simple, se selecciona la muestra contentiva de los 20
cúmulos a encuestar.
Este resultado en un informe final producirá casi el mismo efecto que se obtendría
trabajando con toda la región que conforma la capital de la República de Honduras.

EJERCICIOS 11.0
1. Una relacionadora pública del sector de salud del gobierno desea entrevistar a 15 de
6285 personas. Estas personas se numeran 0001, 0002,…, 6284, 6285. ¿A quiénes
seleccionará para la entrevista, si selecciona la muestra con la tabla de dígitos aleato-
rios de los anexos del presente texto, empleando las primeras 4 columnas de la tabla,
recorriendo la tabla hacia abajo y comenzando en el renglón 10?
166 CAPÍTULO 11

2. Un investigador desea incluir en una muestra, 10 de 83 personas. Si las numera con


00, 01, 02,…, 82, 83. ¿Qué personas incluirá en la muestra si mediante la tabla de dí-
gitos aleatorios (capítulo 11), selecciona el uso de las dos primeras cifras de la iz-
quierda comenzando con 22 en el sexto renglón de la segunda columna y hacia abajo?
3. Se tiene una población de 10,000 y se desea muestrear 20 aleatoriamente. Usar la
tabla de dígitos aleatorios para seleccionarlos. Enumerar los elementos que se han
seleccionado. Describa su propia metodología y explíquela.
4. Con un calendario, muestrear sistemáticamente cada día décimo octavo de un año,
comenzando con el 6 de enero.
5. Una población está constituida por grupos que tienen una gran variación entre sí,
pero poca variación entre el uno el otro. El tipo adecuado de muestreo en ésta pobla-
ción es:
a) Estratificado;
b) Sistemático;
c) Por conglomerado;
d) Intencional o de juicio
6. Un bacteriólogo desea evaluar una muestra de 8 de 754 probetas de sangre. Si enume-
ra las probetas del 000, 001, 002,…, 752, 753. ¿Cuáles seleccionará si le dice a usted
que le resuelva este problema usando la tabla de dígitos aleatorios (capítulo 11)
7. Utilizando su intuición personal y la asociación de conocimientos adquiridos en el
tema, establezca un ejemplo concreto en el área de la salud, para cada uno de los tres
muestreos no aleatorios.
CAPÍTULO

Distribuciones
muestrales 12
Contenido

12.1 Estimadores y parámetros


12.2 Criterios de un buen estimador
12.3 Cálculo de la gran media
12.4 Teorema del límite central
12.5 El teorema de Chebyshev
12.6 Distribución muestral de medias
12.6.1 Error estándar de la media
12.6.2 Error estándar para proporciones
12.6.3 Uso de la distribución muestral
168 CAPÍTULO 12

Distribuciones muestrales
Generalmente las poblaciones son demasiado grandes como para ser estudiadas en su
totalidad, por tanto, es necesario seleccionar una muestra representativa de un tamaño
que sea más manejable. Esta muestra se utiliza para sacar las conclusiones de la población
en estudio. La muestra seleccionada y constituida en la base de datos a trabajar permitirá
calcular elementos muestrales como la media, la varianza, la desviación estándar, propor-
ciones etc.
Por otra parte, a lo interno de las distribuciones muestrales trataremos sobre temas
de importancia, como ser los estimadores, criterios que debe tener un buen estimador, el
valor, análisis y cálculo de la media de medias, los principios del límite central y sus apli-
caciones, como también el uso de las distribuciones muestrales en el cálculo de probabi-
lidades y otros elementos de distribuciones normales.

12.1  Estimadores y parámetros


A los elementos muestrales como la media, la desviación estándar, la varianza y las pro-
porciones, se les conocen como estimadores, y son los más utilizados para hacer inferen-
cias sobre los verdaderos valores de los parámetros de la población. La siguiente tabla
representa los estadísticos con sus respectivos símbolos utilizados en las teorías estadísti-
cas para la labor de estimaciones y pruebas de hipótesis.

Nombre del estadistico Estimador Parametro


Media — 𝜇

Desviación estándar S 𝜎
Varianza S2 𝜎2
Proporción p– P

EJERCICIOS 12.1
1. Suponga que está muestreando una población con una media de 2.15. ¿Qué tamaño
de la muestra garantizará que?:
a) La media muestral sea de 2.15;
b) El error estándar de la media sea cero.
2. Se sabe que una máquina que llena envases de suero oral tiene un llenado promedio
de 125 gramos y una desviación estándar de 20 gramos. Un empleado de control de
calidad tomó una muestra aleatoria de envases llenos y descubrió que la media mues-
tral era de 130 gramos. El gerente de la empresa supuso que la muestra tomada por el
empleado no es representativa. ¿Es correcta su conclusión?
3. El presidente del Colegio de Odontólogos de Honduras quiere determinar el número
medio de veces que cada uno de sus afiliados participa en eventos de la organización.
Para lograrlo pide a 100 empleados del colegio en mención y que aleatoriamente se
encuesten a 50 de sus afiliados en forma aleatoria y entregar al colegio de odontólo-
gos la información sobre el número medio de veces que los afiliados participan en los
eventos sociales de todo el año. Esos números se calculan y se envían al presidente
del colegio. ¿Ha recibido el presidente del colegio una muestra extraída de la pobla-
ción de afiliados o de alguna otra distribución?
4. Si usted fuese un investigador profesional, ¿Creería que todos los estimadores son
confiables?
Distribuciones muestrales 169

5. Piensa usted que, si un estimador es exactamente igual al parámetro de esa población,


entonces ¿el tamaño de la muestra es igual a dicha población?

12.2  Criterios de un buen estimador


A los estimadores también se les conoce como estadísticos, y estos para que tengan una
aplicación con los mínimos errores referente al verdadero valor de los parámetros, deben
cumplir con los criterios o propiedades siguientes:
Imparcialidad:
Una media muestral es un estimador insesgado de la media de la población, pues la media
de distribución de muestreo de las medias muestrales tomadas de una misma población
es igual a la media de ésta última. De igual manera debe producirse el mismo efecto para
los parámetros restantes de la población.
Eficiencia:
La eficiencia debe designar el tamaño del error estándar del estadístico. En otras palabras,
un estimador es más eficiente porque su error estándar es más pequeño.
Congruencia:
Un estadístico es un estimador congruente del parámetro de una población, si al aumen-
tar el tamaño de la muestra con seguridad absoluta el valor del estadístico debe acercarse
mucho más al parámetro de la población.
Suficiencia:
Un estimador es suficiente si utiliza toda la información contenida en la muestra, de tal
forma que ningún otro estimador podría extraer de ésta última más información referente
al parámetro de la población que va a ser estimado.
Nota: En estadística, y en el caso del uso de estimadores, un estadístico muestral no siem-
pre es el mejor estimador de su análogo parámetro de población, ya que en muchas oca-
siones debemos recurrir a otros análisis más cuidadosos para asegurarnos que estamos
trabajando o utilizando, un estimador que cumpla con los criterios o propiedades elemen-
tales requeridas.

12.3  Cálculo de la gran media


Vale la pena notar que la distribución muestral de las medias muestrales, es simplemente
una lista de todas las medias muestrales posibles. Estas medias muestrales, al igual que
cualquier lista de números, tienen una media denominada como “la gran media” o “la
media de las medias muestrales”. La gran media se representa por X y se calcula de la
misma manera que una media aritmética, como sigue:
n
∑X i
i =1
X=
n

Ejemplo
De una población de tamaño N, se extrajeron cinco muestras las cuales tienen medias
muestrales de 12.5, 14.2, 13.3, 13.8 y 12.9 respectivamente. Calcular la gran media:
Solución
n
∑X i
i =1 12.5 +14.2+13.3 +13.8 +12.9 66.7
X= = = ≅ 13.34
n 5 5
170 CAPÍTULO 12

EJERCICIOS 12.3
1. Si la Secretaría de Salud dispone de los valores promedios en sus cuatros hospitales
regionales sobre eficiencia de servicios, y estos son 95%, 88%, 92% y 85% respectiva-
mente, ¿cuál es el valor promedio nacional de servicios de eficiencia en el área de la
salud?
2. Se toman cinco muestras de igual tamaño de las edades del personal del Hospital Pú-
blico de Comayagua en cinco unidades diferentes, las que a continuación se detallan:
1. 23 24 18 17 26 34 45 48 54 53 37 35 35 38 44 46
2. 51 42 36 17 19 21 21 24 29 27 33 37 45 57 40 31
3. 41 34 32 26 26 26 37 19 22 25 25 49 50 55 43 18
4. 26 34 19 18 34 39 39 48 51 44 40 45 42 37 20 20
5. 32 23 45 54 36 24 48 25 52 23 32 19 22 20 21 27
a) Calcule la media de cada muestra;
b) Calcule la gran media;
c) ¿Cuál de las medias muestrales es más próxima a la gran media y porque?
3. Si los siguientes datos representan el error promedio en la aplicación de leyes y regla-
mentos por instituciones del Estado, en el área de salud a través de quince oficinas
públicas en las ciudades de San Pedro Sula y Tegucigalpa, ¿cuál es el error promedio
global cometido por dichas instituciones en las ciudades en mención?
Errores promedio: 0.05, 0.03, 0.12, 0.19, 0.18, 0.09, 0.09, 0.07, 0.13, 0.17, 0.17, 0.16,
0.10, 0.12, 0.13.

12.4  Teorema del límite central


El teorema del límite central establece que para una población cualquiera a medida que el
tamaño de la muestra (n) aumenta, la distribución de las medias muestrales se aproxima
a una distribución normal con una media X = µ y un error estándar de:
σ
σX=
n
Si la población no está distribuida normalmente, la distribución de muestreo de las
medias será normal si n es lo suficientemente grande. La regla general es que, si n es por
lo menos 30, el teorema del límite central asegurará una distribución normal en las me-
dias muestrales, inclusive si la población no es normal.
Por otra parte, la importancia del teorema del límite central es que nos permite usar
el estadístico muestral para hacer inferencias sobre los parámetros de la población, sin
conocer nada sobre la forma de la distribución de frecuencia de esa población, salvo la
información que logremos recabar de la muestra.
Teorema del límite central:
Sean X1 , X2 , X3, . . . , Xn, variables aleatorias independientes y distribuciones idénticamen-
te con E(Xi) = µ y V(Xi) = σ2 < ∞; definimos:
x −µ 1
Un = n ; en donde; X = ∑ni =1xi entonces la función de distribución Un
σ n
converge a una función de distribución normal estándar cuando n → ∞.
La conclusión del teorema del límite central expresado de otra manera nos dice que:
u2
1 −
P ( a ≤ Un ≤ b) =∫
b
e 2 du ; cuando n → ∞
a 2π
Distribuciones muestrales 171

Es decir, los enunciados de las probabilidades con respecto a Un se pueden aproximar


por las probabilidades correspondientes para la variable aleatoria normal estándar si n es
grande. (Un valor de n mayor que 30 garantizará generalmente que la distribución Un se
pueda aproximar muy bien por una distribución normal).
Por conveniencia, la conclusión del teorema del límite central se reemplaza muchas

veces por el enunciado más sencillo de que X­ es asintomáticamente normal con media µ
σ 2
y varianza . Es importante notar que el teorema del límite central se puede aplicar
2
para una muestra aleatoria X1 , X2 , X3 , . . . , Xn de cualquier distribución, en tanto que E(Xi)
= µ y V(Xi) = σ2 sean finitos y el tamaño de la muestra sea grande.
Daremos algunos ejemplos del uso del teorema del límite central y sin la necesidad
de llevar a cabo la demostración de dicho teorema, podemos entender sus aplicaciones en
general.
Ejemplo 1
Los resultados de las pruebas finales en la clase de administración II de todos los alumnos
de la carrera de administración en la UNAH, tienen una media de 60 y una varianza de
64. En años anteriores de un registro de 100 alumnos, éstos tuvieron una media de 58.
¿Puede afirmarse que el rendimiento de éstos alumnos sea inferior? (Calcule la probabili-
dad de que la media muestral sea a lo más 58 cuando n = 100).
Solución
Sea x— la media de una muestra aleatoria cuando n = 100 calificaciones de una población
con µ = 60 σ2 = 64. Se desea aproximar P(x— ≤ 58)
x −µ
Sabemos que n es aproximadamente una variable aleatoria normal están-
σ
dar, que denotamos por Z. Por tanto:
 58 − 60 
P (X ≤ 58 ) ≅ P  Z ≤  = P (Z ≤− 2.5) ≅ 0.00062 ; calculado mediante la tabla
 64 
 100 
normal.
Ya que la probabilidad es tan pequeña, es poco probable que se pueda considerar al
curso de Administración II como una muestra aleatoria de una población con 𝜇 = 60 y
𝜎2 = 64. Se puede afirmar que la calificación promedio para el curso de administración II
en años anteriores es menor que el promedio global de 𝜇 = 60.
Ejemplo 2
Los tiempos de espera para los pacientes del IHSS son variables aleatorias independientes
con una media de 1.5 minutos y una varianza de 1 minuto. Aproxime la probabilidad de
que se pueda atender a 100 pacientes en menos de 2 horas.
Solución
Si Xi denota el tiempo de espera para el i-ésimo paciente, entonces se desea calcular:
100
120
∑ i ≤ 120 = P X ≤ = P (X ≤1.20 )
P i =1X 100

Ya que el tamaño de la muestra es grande el teorema del límite central establece que
X es aproximadamente una distribución normal con media 𝜇 = 1.5 y varianza
σ2 1
σ x2 = = , por tanto:
n 100
X −1.50 1.20 −1.50
P ( X ≤ 1.20 ) = P ≤ = P (z ≤−3) ≅ 0.0013
1 ⁄ 100 1 ⁄ 100
172 CAPÍTULO 12

Así, la probabilidad de que se pueda atender a 100 pacientes en menos de 2 horas es


aproximadamente 0.0013. Este pequeño valor probabilístico indica que es prácticamente
imposible atender en el IHSS a 100 pacientes en menos de 2 horas.

EJERCICIOS 12.4
1. Un sociólogo dedicado a la investigación científica quiere estimar la estatura prome-
dio de los hombres de cierta raza. Si se supone que la desviación estándar de la po-
blación es de 2.5 pulgadas y se selecciona al azar a 100 hombres, encuentre la
probabilidad de que la diferencia entre la media de la muestra y la media verdadera
de la población, no exceda 0.5 pulgadas.
2. Suponga que el sociólogo del ejercicio 1 quiere que la diferencia entre la media de la
muestra y la media de la población sea menor de 0.4 pulgadas, con una probabilidad
de 0.95. ¿Cuántos hombres tendrían que seleccionar para alcanzar su objetivo?
3. Siete clínicas médicas privadas de la región noroccidental de Honduras, ofrecen a su
personal un salario promedio de 4.00 dólares por hora con una desviación estándar
de 0.50 dólares. Las clínicas en mención emplean 64 trabajadores de cierto grupo
étnico. Estos trabajadores tienen un salario promedio de 3.90 dólares por hora. ¿Es
razonable suponer que el grupo étnico es una muestra aleatoria de los trabajadores en
el área de las clínicas? Calcule la probabilidad de obtener una media muestral menor
que o igual a 3.90 dólares por hora.
4. Se diseña un experimento para probar cuál de los laboratoristas A o B obtienen el
trabajo para manejar un nuevo y complejo equipo médico en un hospital. Se toma el
tiempo de 50 pruebas que involucran la realización de cierto trabajo en el nuevo equi-
po para cada trabajador. Si las medias de las muestras para las 50 pruebas difieren en
más de un segundo, el operador con la media más pequeña obtiene el empleo. De otra
manera, se considera que el experimento termina en empate. Si se supone que las
desviaciones estándar de los tiempos para ambos operadores son de 2 segundos,
¿cuál es la probabilidad de que el operador a obtenga el trabajo aun cuando los dos
son igualmente hábiles?

12.5  El teorema de Chebyshev


El teorema de Chebyshev puede utilizarse para obtener un límite inferior de la probabili-
dad de que la variable aleatoria de interés X caiga en un intervalo de la forma 𝜇 ± k𝜎.
Si X es una variable aleatoria con una media finita 𝜇 y varianza 𝜎2, entonces para
cualquier constante positiva K se tiene que:
1 1
P ( X − µ < kσ ) ≥1 − 2
o P ( X − µ ≥ kσ ) ≤ 2
k k
Ejemplo
Se ha observado durante un largo período el número X de pacientes por día que acuden a
emergencia en el hospital público de la localidad, y se encontró que su media es de 20
pacientes con una desviación estándar de 2 pacientes. No se conoce la distribución de
probabilidad de X. ¿Qué puede decirse de la probabilidad de que X esté entre 16 y 24 pa-
cientes para el día de mañana?
Solución
Se desea encontrar P(16 ≤ X ≤ 24). Por el teorema de Chebyshev sabemos que para cada
1 1
k ≥ 0, P ( X − µ ≤ kσ ) ≥1 − 2 o sea, P [ (µ − kσ ) ≤ X ≤ (µ + k σ) ] ≥ 1 − 2
k k
Distribuciones muestrales 173

Como 𝜇 = 20 y 𝜎 = 2, se tiene que 𝜇 – k𝜎 = 16 y 𝜇 + k𝜎 = 24


1 3
Sí k = 2, entonces P (16 ≤ X ≤ 24) ≥1 − 2 = = 0.75
2 4
En conclusión, para el día de mañana el número de pacientes estará entre 16 y 24,
con una probabilidad de al menos 0.75

EJERCICIOS 12.5
1. Sea X una variable aleatoria con media 11 y varianza 9. Utilice el teorema de Chebys-
hev para encontrar:
a) Un límite inferior para P(6 < X < 16)
b) El valor de C talque P(∣X – 11∣ ≥ C) ≤ 0.09
2. Una fábrica de aparatos acústicos promete a sus clientes hacer sondas especiales para
mejorar el audio con un diámetro de 0.5 centímetros y una desviación estándar de
0.01 de centímetro. Utilizando el teorema de Chebyshev, encuentre un límite inferior
para el número de sondas de un lote de 400 con un diámetro de 0.48 y 0.52 centíme-
tros,
3. El número de bacterias por centímetro cúbico en ciertos cuerpos humanos tiene una
media de 100. Encuentre un intervalo que incluya al menos 5/9 de los valores mues-
trales del número de bacterias obtenido de un gran número de muestras de un centí-
metro cúbico, suponiendo que las bacterias tienen una distribución de Poisson.
4. El número de centros de salud afectados por la inestabilidad de un terreno no sólido
en un área urbana de un kilómetro cuadrado, tiene una distribución de Poisson con
una media λ = 10. En ésta parte de la ciudad las autoridades municipales hacen man-
tenimientos del terreno a un costo de 3 dólares por centros de salud, y con un costo
fijo de 50 dólares por alquiler de un equipo especial. Sea C el costo total de manteni-
miento para un kilómetro cuadrado seleccionado al azar. Encuentre el valor esperado
y la desviación estándar de C. Encuentre el intervalo que contiene a C con una proba-
bilidad de al menos 0.75.

12.6  Distribución muestral de medias


La distribución de probabilidad de todas las medias posibles de las muestras es una distri-
bución de medias muestrales. A ésta teoría en estadística se le conoce como distribución
muestral de la media.
Por otra parte, toda distribución de probabilidad o cualquier distribución muestral,
puede describirse en parte mediante su media y su desviación estándar.

12.6.1 Error estándar de la media


Al concepto de una distribución muestral de medias, se le asocia el error estándar de la
media, el cual describe un valor específico debido al proceso del azar y a la variabilidad
de las diferentes medias muestrales observadas de una misma población. Asimismo, sabe-
mos que la desviación estándar de la distribución de un estadístico muestral recibe el
nombre de error estándar del estadístico. El error estándar indica no solo el tamaño del
error accidental que se ha cometido, sino además la exactitud que seguramente alcanzare-
mos si usamos un estadístico muestral para estimar un parámetro de la población.
Si la población se considera infinita o bien donde muestreamos una población finita
con sustitución, en otras palabras, después que cada elemento se muestrea, se devuelve a
la población antes de elegir el siguiente elemento y así un mismo elemento puede ser se-
174 CAPÍTULO 12

leccionado más de una vez. Bajo estas condiciones el error estándar de la media puede cal-
σ
cularse mediante la fórmula: σ X = ; donde 𝜎 es la desviación estándar de la población
n
y n el tamaño de la muestra.

Ejemplo
Una muestra de tamaño 80, tiene una desviación estándar poblacional de 1.34. Calcular
el error estándar de la media:

Solución
σ 1.34 1.34 ≅
σX = = = 0.1498 Error estándar de la media
n 80 8.9443
Si la población es finita, es decir, tiene un tamaño limitado o establecido, entonces el
error estándar de la media es calculado mediante la fórmula siguiente:

σ N −n
σX = ;
n N −1

N = Tamaño de la población;
n = Tamaño de la muestra;
Donde: 𝜎 = Desviación estándar de la población;
N −n
= Multiplicador de población finita o factor de corrección de población
N − 1 finita.

Nota: el multiplicador de población finita deberá ser utilizado obligatoriamente, si la frac-


n
ción ≥ 0.05, de lo contrario no se utiliza dado que el efecto que éste produce es insig-
N
nificante.

Ejemplo 1
Supóngase que el Ministro de Salud desarrolla su política de rotación del personal de los
hospitales públicos, centros de salud y otros de similar condición, en los sectores más
vulnerables. Un estudio indica que la desviación estándar de la rotación anual es de 75
empleados en todo el complejo de salud. Si se muestrean cinco hospitales, calcular el error
estándar de la media.

Solución
n 5
Como = = 0.25 > 0.05; entonces:
N 20

σ N − n 75 20 − 5 75 15 75
σX = = = = ( 0.888 ) ≅29.8
n N −1 5 20 −1 2.236 19 2.236

Ejemplo 2
De una población de 150 estudiantes de cirugía dental de la UNICAH, se toma una mues-
tra de 6, sabiendo que la desviación estándar de la distribución es de 1.5. Calcular el error
estándar de la media.

Solución

n 6
Como = = 0.04 < 0.05, no hay necesidad de utilizar el factor de corrección
N 150
Distribuciones muestrales 175

Finita, y la fórmula a utilizar es:


σ 1.5 1.5 ≅
σX = = = 0.61
n 6 2.449

12.6.2 Error estándar para proporciones


La proporción de éxitos en una muestra se representa por medio de –p y se lee p con barra
o p barra. Por otra parte, la media de distribución de muestreo de la proporción de éxitos
está dada por:
μ P– = P, la cual basada en las teorías de Bernoulli referente a una distribución Bino-
pq
mial, el error estándar de la proporción está dada por: σ P = ;
n
p = Éxito de la proporción
Donde: q = Fracaso de la proporción
n = Tamaño de la muestra
Nota: Cuando se desconoce la proporción de la población, ésta debe ser estimada y la
fórmula se identifica de la manera siguiente:

∧ pq
σP= ; De igual manera si la desviación estándar de la población es desconocida la
n
fórmula del error estándar es representada por:

∧ σ s
σX = =
n n

12.6.3 Uso de la distribución muestral


Una aplicación muy común y de gran utilidad en una distribución muestral es la de deter-
minar la probabilidad de que una media muestral se encuentre en un intervalo o rango.
Dado que una distribución muestral está distribuida normalmente, por tanto, la fórmula
de estandarización o normalización puede escribirse de la manera siguiente:
X−µ
Z=
σX

Ejemplo
Una encuesta realizada a la facultad de medicina de la UNICAH, reveló que los estudian-
tes de esta carrera que cursan el primer año, ven televisión un promedio de 37.2 horas por
semana. Se asume una desviación estándar de 5.4 horas. En una muestra de 100 estudian-
tes de medicina de primer año, ¿qué tan probable es que la media muestral sea?:
a) Más de 38 horas  b) Menos de 36.6 horas  c) Entre 36.4 y 37.9 horas

Solución inciso a)
X −µ 38 − 37.2
P (X ≥ 38) = P (X ≥ ) = P (Z ≥ ) = P (Z ≥1.48) = 0.5 − P (Z = 1.48) =
σX 5.4 / 100
0.0694

Solución inciso b)
X −µ 36.6 − 37.2
P (X < 36.6) = P (X < ) = P (Z < ) = P (Z < −1.10) = 0.5 − P (Z = 1.10) =
σX 5.4 / 100
0.1357
176 CAPÍTULO 12

Solución inciso c)
36.4 − 37.2 37.9 − 37.2
P (36.4 ≤ X < 37.9) = P ( ≤Z ≤ ) = P (−1.48 ≤ Z ≤ 1.30) =
5.4 / 100 5.4 / 100
P (Z = 1.48) + P (Z =1.30) = 0.4306 + 0.4032 = 0.8338

EJERCICIOS 12.6
1. De una muestra de 50 observaciones con media 10 y desviación estándar 1.004. Cal-
cule el error estándar para la media.
2. De una población de 500 se extrae una muestra de 30. Se sabe que la media es 14 con
una varianza de 4. Calcule el error estándar de la media.
3. La población de estudiantes de finanzas en la UNICAH a finales del año 2007 era de
655, con una media de edad de 19.4 años y una desviación estándar de 1.7 años. Se
toma una muestra de 60 estudiantes. Calcule el error estándar de la media.
4. Cuando se muestrea a partir de una población infinita. ¿Qué sucede con el error es-
tándar de la media, si el tamaño de la muestra:
a) Se incrementa de 25 a 225?
b) Se disminuye de 480 a 30?
c) Se aumenta de 20 a 45;
d) Se disminuye de 250 a 40?
5. Cuál es el valor del factor de corrección de la población finita cuando sucede:
a) n = 5 y N = 150?
b) n = 10 y N = 150?
c) n = 50 y N = 150?
6. En una población de tamaño N = 80, con una media de 8.2 y una desviación estándar
de 2.1. Calcule el error estándar de la media para los siguientes tamaños de muestra:
a n = 16
b) n = 25
c) n = 49
d) n = 64
e) n = 81
7. Un psicólogo entrevistó a 150 médicos y encontró que 42% eran incapaces de sumar
fracciones. Estime el error estándar de la proporción muestral.
8. El 8% de los estudiantes de ingeniería en la UNAH son zurdos. Se seleccionan 150
alumnos de esa población. Calcule el error estándar de la proporción.
9. En una muestra de 16 observaciones de una distribución normal con una media de
150 y una desviación estándar de 16, encuentre:
– – –
a) P(X < 160)  b) P(X < 142)  b) P(140 < X < 160)
10. El costo promedio a nivel nacional de un local para oficinas de la Secretaría de Salud
es de L. 50,000, con una desviación estándar de L. 3,000.
a) ¿Cuál es la probabilidad de que, en cierta localidad del país, el costo de un local
sea de al menos 55,000 lempiras?
b) ¿Cuál es la probabilidad de que el costo sea de a lo más 45,000 lempiras?
c) Entre 48,000 y 53,000 lempiras.
Distribuciones muestrales 177

11. La doctora María Barrios es auditora de un complejo hospitalario privado, y sabe que
en promedio el saldo mensual de determinado paciente atendido al crédito es de
5000 lempiras con una desviación estándar de 600 lempiras. Si la Doctora Barrios
revisa 50 cuentas al azar, ¿cuál es la probabilidad de que el saldo mensual promedio
esté:
a) Por debajo de 3500 lempiras?
b) Entre 4000 y 6000 lempiras;
c) Más de 5500 lempiras.
12. Se escogieron 64 elementos de una población de 125 elementos, con una media de
105 y una desviación estándar de 17.
a) ¿Cuál es el error estándar de la media?
b) ¿Cuál es la probabilidad de que la media se encuentre entre 107.5 y 109.
13. Un psicólogo ha determinado que una pequeña comunidad de Honduras el 8% de los
pobladores son daltónicos. Si se selecciona al azar 150 habitantes de esa población.
¿Cuál es la probabilidad de que la proporción de que son daltónicos sea:
a) Tan grande como 0.15?  b) Esté entre 0.10 y 0.13?
c) Menores que 0.12? d) Mayores que 0.14?
14. Según una clínica de especialidades, el 15% de las personas están sometidas a algún
tipo de dieta. ¿Cuál es la probabilidad de que una muestra al azar de tamaño 100 de
una proporción de aquellos que se encuentran a dieta:
a) Sea mayor o igual al 20%?
b) Esté entre el 10 y 20 por ciento?
c) No mayor de 0.12?
15. En una muestra al azar de 75 personas adultas, 35 dijeron que el cáncer mamario era
curable. Si la proporción real de quienes piensan que dicho cáncer puede ser curado
es de 0.55. ¿Cuál es la probabilidad de una obtener una proporción tan pequeña o
menor que la obtenida en esa muestra?
178 CAPÍTULO 12
CAPÍTULO

Metodología científica y
temas relacionados 13
Contenido

13.1 El método estadístico


13.2 El método científico
13.3 El ensayo clínico
13.4 Diseño y ejecución de un proceso
estadístico
13.5 Sensibilidad y especificidad
13.5.1 Sensibilidad
13.5.2 Especificidad
13.5.3 Relación entre sensibilidad y
especificidad
13.5.4 Prevalencia
13.5.5 La influencia de la prevalencia
13.5.6 Combinación de factores
13.5.7 La seguridad de una prueba
diagnóstica
13.5.8 Razón de probabilidad o coeficiente
de verosimilitud
13.5.9 Razón de probabilidad (ODDS RATIO)
13.5.10 Tasa de riesgo relativo
13.5.11 Análisis de supervivencia
180 CAPÍTULO 13

13.1  Método estadístico


El conjunto de los métodos que se utilizan para medir las características de la informa-
ción, para resumir los valores individuales, y para analizar los datos a fin de extraerles el
máximo esencial de información, es lo que se conoce con el nombre de métodos estadís-
ticos. Los métodos de análisis para la información cuantitativa se pueden dividir en los
seis pasos siguientes:
1. Definición del problema;
2. Recopilación de la información existente;
3. Obtención de información original;
4. Clasificación;
5. Presentación;
6. Análisis y conclusiones.
Los estudios experimentales y observacionales tienen como objetivo común en los
proyectos de investigación estadística determinar la causalidad, y en particular extraer una
conclusión en el efecto que algunos cambios en los valores de predicción de variables in-
dependientes o dependientes tienen sobre una respuesta. Hay dos grandes tipos de estu-
dios estadísticos para estudiar determinar las causalidades de una situación que pueda
generarse en las ciencias biológicas y materias afines, por medio de estudios experimenta-
les y observacionales. En ambos tipos de estudios, el efecto de las diferencias de una va-
riable independiente (o variables) en el comportamiento de una variable dependiente es
observado. La diferencia entre los dos tipos es la forma en que el estudio es conducido,
sin el menoscabo de que cada uno de ellos puede ser muy efectivo.
Es necesario recordar que existen cuatro tipos de mediciones o escalas de medición,
vistas en el Capítulo 2, del presente Texto, conocidos también como niveles de medición
(nominal, ordinal, intervalo y razón). Estos niveles de medición tienen diferentes grados
de uso en la investigación estadística. Las medidas de razón, en donde un valor cero y
distancias entre diferentes mediciones son definidas dan la mayor flexibilidad en métodos
estadísticos que pueden ser usados para analizar los datos. Las medidas de intervalo tie-
nen distancias interpretables entre mediciones, pero un valor cero sin significado (como
las mediciones de coeficiente intelectual o temperatura en grados Celsius). Las medidas
ordinales tienen imprecisas diferencias entre valores consecutivos, pero un orden interpre-
table para sus valores. Las medidas nominales no tienen ningún rango interpretable entre
sus valores.
La escala de medida nominal puede considerarse la escala de nivel más bajo. Se trata
de agrupar objetos en clases. La escala ordinal, por su parte, recurre a la propiedad de
«orden» de los números reales. La escala de intervalos igualmente está caracterizada por
una unidad de medida común y constante. Es importante destacar que el punto cero en
las escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de
la magnitud que estamos midiendo. Esta escala, además de poseer las características de la
escala ordinal, permite determinar la magnitud de los intervalos (distancia) entre todos
los elementos de la escala. La escala de coeficientes o razones es el nivel de medida más
elevado y se diferencia de las escalas de intervalos iguales únicamente por poseer un pun-
to cero propio como origen; es decir que el valor cero de esta escala no significan ausencia
de la magnitud que estamos midiendo.
Si se observa una carencia total de propiedad, se dispone de una unidad de medida
para el efecto. A iguales diferencias entre los números asignados corresponden iguales
diferencias en el grado de atributo presente en el objeto de estudio.
Las técnicas de análisis estadístico en procedimientos de investigación son muy cono-
cidas, y entre las más utilizadas tenemos:
• Prueba t de Student
• Prueba Chi cuadrada
Metodología científica y temas relacionados 181

• El análisis de varianza (ANOVA)


• La prueba U de Mann-Whitney
• El análisis de regresión
• Correlación
• Iconografía de las correlaciones
• Frecuencia estadística
• Análisis de frecuencia acumulada
• Prueba de la diferencia menos significante de Fisher
• Coeficiente de correlación de Pearson
• Coeficiente de correlación de Spearman
• Análisis factorial exploratorio
• Análisis factorial confirmatorio
• Gráfica estadística

13.2  Método científico


Desde principios del siglo xx la metodología científica se basa en los postulados del posi-
tivista crítico Karl Popper, pionero de la filosofía de la ciencia. En su libro Búsqueda sin
término afirma: que la actitud científica corresponde a una actitud crítica que no busca
justificaciones satisfactorias, sino contrastaciones cruciales que puedan refutar la teoría
contrastada”. Con ello, estableció el concepto de falsabilidad como una de las premisas
básicas que sostienen el rigor científico. La ciencia avanza de acuerdo con la formulación
clásica “por ensayo y eliminación progresiva de errores” y las teorías sólo deberían refu-
tarse negativamente, siendo imposible alcanzar verdades definitivas. “Lo que hace al hom-
bre de ciencia no es su posesión del conocimiento de la verdad irrefutable, sino su indaga-
ción de la verdad persistente y temerariamente crítica”.
Todo enunciado científico es siempre provisional y cualquier pretensión de alcanzar
una verdad definitiva es dogmática. La actitud crítica, tanto en el ámbito de las ciencias
experimentales como fuera de ellas, debe estar regida por el siguiente axioma: la certeza
es imposible. Mientras no se consigue una respuesta definitiva a una pregunta científica
deben irse escalonando respuestas progresivamente aceptables según un criterio de co-
rrección continua.
El rigor metodológico para conseguir progresos en medicina está basado en la teoría
de la probabilidad. Se trata de la forma más objetiva, aunque no la última, de interpretar
los datos y a ella se acoge la investigación biomédica actual. “Un solo cisne negro nos
destroza la hipótesis de que todos los cisnes son blancos; millones de cisnes blancos no
nos permiten dar por seguro —sí por probable— que todos los cisnes son blancos”.
El entorno de incertidumbre en el que discurre la práctica de la medicina la convierte
en una de las principales facetas del conocimiento humano donde es necesario un mayor
compromiso con el rigor científico.

La estadística y la teoría de la probabilidad


En el campo de la Metodología Científica en Ciencias de la Salud existen dos enfoques
filosóficos diferentes sobres cómo contrastar hipótesis, que podrían denominarse estadís-
tica de frecuencias y estadística probabilística. El método clásico de análisis y que se si-
gue utilizando en la mayoría de estudios es el basado en las frecuencias. Este método, in-
troducido por Fisher, consiste en contrastar una hipótesis nula (que suele ser la aceptada
hasta el momento) con una hipótesis alternativa (que es la que el investigador pretende
demostrar). El contraste se realiza mediante la realización de un test estadístico que pro-
porciona unos resultados de la frecuencia o la proporción de la variable estudiada en cada
uno de los grupos de estudio. Imaginemos un estudio para valorar la eficacia de un fárma-
co A en el tratamiento de los síntomas de la hiperplasia benigna de próstata (HBP). Un
Ensayo Clínico realizado a tal efecto nos informará, por ejemplo, de la proporción de
182 CAPÍTULO 13

pacientes que mejoran su sintomatología en el grupo placebo y en el grupo del fármaco


A. La estadística clásica basada en frecuencias proporcionará la significación estadística
(valor p) calculada mediante la realización de un test estadístico determinado.
Sin embargo, este valor p por sí solo no informa de si el fármaco A es mejor que el
placebo, sino de la probabilidad de que la diferente proporción de la mejoría de sintoma-
tología hallada en cada grupo haya sido debida al azar en vez de a la diferente eficacia del
fármaco A respecto al placebo. Es bien conocido que el límite de significación estadística
aceptado en Ciencias de la Salud es de un 5% (p = 0.05). Por ello, cuando la p es inferior
a 0.05, se afirma que la probabilidad de que los resultados hallados se hayan debido al
azar es muy baja, por lo que la diferencia es estadísticamente significativa y se puede acep-
tar la hipótesis alternativa.
No obstante, esta forma tan poco flexible de entender la estadística tiene también sus
críticas. Siguiendo con el ejemplo anterior, supongamos que entre ambos grupos existe
una diferencia muy relevante de proporción de mejora de la sintomatología pero que la p
es igual a 0.051. ¿Por este 1 por mil es necesario resignarse a concluir que la diferencia
observada se puede deber al azar y no a la mayor eficacia del fármaco A? Es por esto que
algunos autores empiezan a ver con buenos ojos otro enfoque diferente de la estadística,
particularmente el basado en las leyes de probabilidad. La estadística probabilística tiene
su punto de partida en el teorema de Bayes:
La fórmula de Bayes puede ser de gran utilidad a la hora de realizar algoritmos diag-
nósticos o guías clínicas. Clásicamente, en la Facultad de Medicina se enseña sobre el
porcentaje de pacientes afectos de HBP o de tumor vesical que cursan con hematuria. Sin
embargo, lo que interesa al clínico en el proceso diagnóstico es el porcentaje inverso, es
decir, ante un paciente con hematuria ¿cuál es la probabilidad de que tenga una HBP o un
tumor vesical? En este caso conociendo la prevalencia de la hematuria P(H), la prevalen-
cia del tumor vesical P(TV) y el porcentaje de pacientes afectos de tumor vesical que
cursan con hematuria P(H/TV), mediante el teorema de Bayes, se puede calcular la pro-
babilidad de que un paciente que consulte por hematuria tenga un tumor vesical P(TV/H).

P (TV ) P ( H / TV )
P (TV / H ) =
P (H )

En esta fórmula se puede descomponer la prevalencia de la hematuria P(H):

P (TV ) P ( H / TV )
P (TV / H ) =
P ( H ) P ( H / TV ) + P ( NH ) P ( H / NTV )

Donde P(NH) es la probabilidad de no tener hematuria y P(H/NTV) la probabilidad


de tener hematuria en los pacientes que no tienen tumor vesical.
A continuación, se va a comprobar la utilidad de la estadística probabilística en el
algoritmo diagnóstico de las enfermedades. Supongamos que la prevalencia de tumor ve-
sical es de 1 por mil (P(TV) = 0.001) y que además cursan con hematuria el 85% de los
pacientes afectados de tumor vesical (P(H/TV) = 0.85) y el 0.5% de los que no tienen tu-
mor vesical (P(H/NTV) = 0.005). ¿Cuál es la probabilidad de que un paciente con hema-
turia tenga tumor vesical?

P (TV ) P ( H / TV ) (0.001)(0.85)
P (TV / H ) = =
P ( H ) P ( H / TV ) + P ( PH / NTV ) (0.001)(0.85) +(0.999)(0.005)
0.00085 0.00085
= = = 0.1454 o 14.54%
0.00085 +0.004995 0.005845
Metodología científica y temas relacionados 183

Sobre una lógica no determinista


Cuando la dispersión y falta de cuantificación de datos no permite realizar un tratamiento
estadístico de los mismos, parece razonable abordar cada uno de los supuestos desde
otras perspectivas. Para el desarrollo de diagramas de decisión de estas características
resulta muy útil aplicar una modalidad de razonamiento lógico no sujeto al determinismo.
Se trata de la llamada lógica borrosa que es capaz de resolver problemas relacionados con
la incertidumbre de la información o del conocimiento, proporcionando un método for-
mal de expresión asequible a la forma de razonamiento de la mente humana. La principal
motivación de la teoría de conjuntos borrosos es la construcción de un marco formal que
permita el tratamiento de la incertidumbre presente en numerosos ámbitos del conoci-
miento humano, como el de la medicina. Contrasta con la teoría clásica de conjuntos, que
sitúa los distintos elementos de un universo dentro o fuera de un conjunto. Así, por ejem-
plo, si se considera el universo de los números naturales positivos:

U = {1, 2, 3, 4, 5,}

Se puede decir que el 3 pertenece al conjunto de los números impares, mientras que
el 8 no. Igualmente, el 9 pertenece al conjunto de los números mayores que el 5, mientras
que el 3 no. La pertenencia a un conjunto de diferentes elementos suele representarse
gráficamente mediante la denominada función de pertenencia (ver cuadro 5). En la fun-
ción de pertenencia toman valor 1 aquellos elementos que pertenecen al conjunto, mien-
tras que toman valor 0 aquellos que no pertenecen. La teoría de conjuntos borrosos pro-
pone la extensión del concepto de pertenencia para que admita graduación entre la no
pertenencia y la pertenencia total al conjunto.
Así, si se trata del conjunto de las personas mayores, se puede decir que una persona
de 30 años pertenece a dicho conjunto con grado 0 (es decir, no pertenece), una de 50
pertenece con algún grado (es decir 0.4) y una persona de 78 años pertenece con grado 1
(es decir, pertenece completamente).
Los conjuntos borrosos proporcionan una manera de definir conjuntos para los que
la pertenencia sea una cuestión de grado, o no esté completamente definida. Establecen
una frontera gradual entre la no pertenencia y la pertenencia, y por tanto conforman una
herramienta para el modelado de la imprecisión o la incertidumbre.
Esta sistemática ha permitido tratar numerosos problemas cuya resolución según es-
quemas y técnicas clásicas no es completamente satisfactoria.
Un dominio como la medicina donde, en muchos casos, la imprecisión o la vaguedad
son parte intrínseca del conocimiento se beneficia de abordaje más relativista en cuanto a
cuál puede ser la mejor decisión ante un supuesto determinado influido por muchos fac-
tores de cuantificación imprecisa.
La utilización de la lógica borrosa es pues aconsejable para procesos muy complejos,
es decir, cuando se carece de un modelo matemático simple o para procesos altamente no
lineales, o si el procesamiento (lingüísticamente formulado) del conocimiento experto
puede ser desempeñado. Es un lenguaje que permite trasladar sentencias sofisticadas del
lenguaje natural a un formalismo matemático.
Por su parte la lógica clásica impone a sus enunciados únicamente los valores falso o
verdadero, modelando una gran parte del razonamiento natural. Pero el razonamiento
humano utiliza valores de verdad que no tienen por qué ser necesariamente tan determi-
nistas. Por medio de la lógica borrosa pueden formularse matemáticamente nociones
como “ligera mejoría”, “menos agresivo” u “orina más clara”. La lógica borrosa permite
trabajar con estos parámetros llegando a cuantificar expresiones humanas vagas o poco
precisas, pero que tienen un elevado valor expresivo en términos reales y que resultan
convincentes a la hora de justificar o no la toma de una decisión. Esta lógica cuantifica las
descripciones imprecisas que se usan en el lenguaje y otorgarles un grado, a partir del que
es posible establecer una concatenación de sucesos cuestionables y, en función de éstos,
184 CAPÍTULO 13

asignar una determinada vía de salida hacia una solución del problema. La habilidad de
la lógica borrosa para procesar de forma eficiente valores parciales ha sido de gran ayuda
para la ingeniería y la medicina, pues elabora aproximaciones matemáticas en la resolu-
ción de ciertos tipos de problemas, produciendo resultados exactos a partir de datos im-
precisos, lo cual resulta útil en la elaboración de guías clínicas o algoritmos de actuación.
La lógica borrosa puede llegar a redefinir los grados de veracidad de los enunciados
de salida conforme se refinan los de entrada, por lo que algunos de sus sistemas precisan
de aprendizaje, y son excelentes mecanismos de control de procesos. Se pueden evaluar
mayor cantidad de variables, como las lingüísticas y las no numéricas, que son habitual-
mente manejadas en el conocimiento humano. Con ello se hacen inteligibles complejos
algoritmos decisorios que parten de apreciaciones subjetivas. Es posible relacionar entra-
das y salidas, sin tener que entender todas las variables, permitiendo que el sistema pueda
ser más fiable y estable que un sistema de control lógico convencional. El sistema difuso
no precisa conocer todas las variables antes de empezar a trabajar, lo que permite simpli-
ficar la asignación de soluciones a problemas sin resolver previamente, y obtener prototi-
pos rápidamente.

13.3  El Ensayo clínico


Un ensayo clínico es una evaluación experimental de un producto, sustancia, medicamen-
to, técnica diagnóstica o terapéutica que, en su aplicación a seres humano, pretende valo-
rar su eficacia y seguridad.
Los estudios de prometedores tratamientos nuevos o experimentales en pacientes se
conocen como ensayos clínicos. Un ensayo clínico se realiza sólo cuando hay razones
para creer que el tratamiento que se está estudiando puede ser beneficioso para el pacien-
te. Los tratamientos usados en los ensayos clínicos con frecuencia demuestran tener be-
neficios reales. Los investigadores realizan estudios sobre nuevos tratamientos para cono-
cer la utilidad del nuevo tratamiento y su mecanismo de acción, si la efectividad es mayor
que otros tratamientos ya disponibles, los efectos secundarios del nuevo tratamiento y si
son mayores o menores que el tratamiento convencional, si supera los beneficios a los
efectos secundarios y en qué pacientes el nuevo tratamiento es más útil.

Introducción
Puede encontrarse tantas definiciones de ensayo clínico como enfoques posibles tiene el
tema, aunque predomina el enfoque epidemiológico y el finalista (su uso para investigar
fármacos). Desde la más simple, que lo define como “una prueba científica de un fárma-
co, aceptada por el enfermo y amparada por la ley” a las más complejas; de las más am-
plias a las más restrictivas, hay una amplia variedad.1 Podemos decir que el ensayo clínico
consiste en un estudio experimental y prospectivo en el cual el investigador provoca y
controla las variables y los sujetos (pacientes, la mayoría de los casos) son asignados de
forma aleatoria a las distintas intervenciones que se comparan. Debido a que es el tipo de
estudio epidemiológico que presenta menores errores sistemáticos o sesgos, constituye la
mejor prueba científica para apoyar la eficacia de las intervenciones terapéuticas. El ele-
mento esencial del ensayo es la existencia de un grupo de comparación o grupo de con-
trol, que permite probar si la nueva intervención (por ejemplo un nuevo fármaco) es me-
jor o no que las ya existentes o que no intervenir (placebo).
Un ensayo clínico se inicia cuando surge una hipótesis a partir de estudios no contro-
lados observacionales, descriptivos o retrospectivos, o de estudios preclínicos. Frecuente-
mente se descubren en investigaciones preclínicas posibilidades terapéuticas que no tie-
nen ningún beneficio en un ensayo clínico. Muchas veces se realizan actividades médicas
cuya utilidad no ha sido demostrada mediante un ensayo clínico, sin embargo, llevarlo a
la práctica es difícil, sobre todo por el costo económico y de tiempo. Después de ser dise-
ñado debe ser aprobado por un comité de bioética, los pacientes que forman parte deben
Metodología científica y temas relacionados 185

conocer los objetivos del estudio, sus riesgos y beneficios y firmar el consentimiento infor-
mado y podrán abandonar el estudio cuando quieran. El ensayo clínico finaliza cuando
acaban los plazos de tiempo definidos en el protocolo, o cuando de forma prematura son
manifiestamente perjudiciales o beneficiosos los efectos en el brazo experimental.
El ensayo clínico es el estudio clínico que posee el nivel de evidencia más alto para
demostrar que el procedimiento médico que se realiza es el más adecuado con los cono-
cimientos científicos que existen en ese momento, debido al diseño del estudio, donde las
variables estadísticas están controladas para evitar los sesgos. Así pues, junto con los es-
tudios de meta análisis son la base de lo que se conoce como medicina basada en la evi-
dencia, que no es más que el respaldo de las prácticas clínicas con pruebas consistentes
desde el punto de vista científico.
Clasificación
Existen diferentes tipos de clasificaciones en virtud del factor que tengamos en cuenta
para realizarla. Las clases obtenidas no son, en la mayoría de los casos, incompatibles
entre sí, sino que se solapan, perfeccionándose en la combinación de unas con otras. Así,
en la adecuada combinación de las clases podremos llegar al ensayo clínico ideal (aunque
éste será variable en función de las circunstancias de la investigación). En la siguiente ta-
bla se muestran algunas de ellas.

Clasificación de los ensayos clínicos


Factor de clasificación Tipos de ensayos clínicos
Desarrollo clínico • Fase I
• Fase II
• Fase III
• Fase IV
Aspecto de la • Explicativos
intervención • Pragmáticos
Objetivo • Equivalencia terapéutica
• Búsqueda de dosis
• Dosis-respuesta
• Concentración-respuesta
• Bioequivalencia
• Biodisponibilidad
• Estudio piloto
Enmascaramiento • No enmascarado/abierto
• Enmascarado/ciego/cerrado
• Simple ciego
• Doble ciego
• Triple ciego
Exposición • Paralelo
• Cruzado
Control • Controlado
• No controlado
Aleatorización • Aleatorizado
• No aleatorizado
186 CAPÍTULO 13

Ensayo clínico ideal


La adecuada combinación de las características de los distintos tipos de ensayos clínicos
nos permitirá ir construyendo un ensayo clínico ideal, formado por las clases más poten-
tes, fiables, rigurosas o reproducibles. Aunque el ensayo clínico ideal será aquel que, como
se verá, mejor se adapte a las condiciones de cada intervención, en una hipotética situa-
ción ideal habrá de cumplir las siguientes características:
Estudio controlado
El ensayo clínico es un estudio experimental en el que en el diseño de investigación deben
estar bien definidas las variables y los mecanismos de control de dichas variables, cuya
función es evitar los sesgos y las variables de confusión. Existe un grupo con el que se
compara la intervención experimental. Este grupo sufre también una intervención con un
procedimiento placebo o con un procedimiento estándar de referencia, ya validado para
la situación objeto de estudio. Para que ambos grupos sean comparables todos los factores
pronósticos, tanto los conocidos (mediante los criterios de selección) como los descono-
cidos (mediante la asignación aleatoria), deben estar repartidos por igual entre los grupos
antes de iniciar el tratamiento. Pueden existir más de un grupo de intervención experi-
mental cuando queremos probar más de una hipótesis, así como más de un grupo de
control cuando existe más de una intervención validada que se sabe eficaz. Esto se suele
hacer cuando se quiere estratificar la eficacia de las intervenciones. A cada grupo, tanto
de intervención como de control, se les llama brazos del estudio.
Un ejemplo: queremos probar la eficacia de dos fármacos A y B en la enfermedad E,
para la cual ya se han mostrado efectivos los fármacos C y D. Pues bien, podemos hacer
los siguientes grupos: grupo del fármaco A, grupo del fármaco B, grupo del fármaco C,
grupo del fármaco D y grupo con placebo. Tras el análisis estadístico de los resultados, la
comparación de los brazos A y B con el brazo placebo nos dirá si los fármacos son o no
eficaces en esa enfermedad. La comparación con los brazos C y D nos dirá el grado de
eficacia respecto a lo ya conocido. Así, podemos conseguir resultados del tipo: el fármaco
A no es eficaz, mientras que el B sí lo es, siendo más eficaz que el C, pero menos que el D.
Estudio prospectivo
Según la temporalidad, es decir, el momento en el que se define el estudio respecto al
tiempo, los estudios pueden ser:
• Estudio retrospectivo: es un estudio longitudinal en el tiempo que se analiza en el
presente, pero con datos del pasado.
• Estudio transversal: es un estudio que se realiza con los datos obtenidos en un mo-
mento puntual. Es útil para sacar una “instantánea” de la situación existente en un
momento dado, como en los estudios de prevalencia.
• Estudio prospectivo: es un estudio longitudinal en el tiempo que se diseña y comienza
a realizarse en el presente, pero los datos se analizan transcurrido un determinado
tiempo, en el futuro.
Las fechas de inicio y terminación deben definirse previamente en el protocolo de
investigación.
Estudio aleatorizado
Lo podemos encontrar frecuentemente bajo el término randomizado, neologismo inglés
que en ocasiones hasta se declina como si fuera un verbo castellano: randomizar.
La aleatorización significa que los casos son distribuidos al azar en cada brazo del
estudio.
El objetivo es conseguir que los diferentes grupos sean comparables u homogéneos,
evitar el sesgo del investigador en la asignación de casos a los grupos y garantizar que los
test estadísticos tendrán valores de significación estadística válidos. Existen varias alterna-
tivas metodológicas de aleatorización, que deben ser consideradas en la fase de planifica-
Metodología científica y temas relacionados 187

ción del estudio, y cuya idoneidad depende de las características del ensayo a efectuar. En
medicina y otras ciencias biológicas, las técnicas de aleatorización más usadas son:

Predeterminación muestral adecuada


A la hora de realizar un estudio debemos definir claramente a qué población va dirigido
(población de estudio). Así, sería inútil realizar un estudio sobre los anticonceptivos ora-
les entre mujeres mayores de 70 años. Esta población pertenece a una población diana
con unas características determinadas a la que pretendemos generalizar los resultados del
estudio. Por ejemplo, no son comparables en muchos aspectos las poblaciones de Nigeria
y Noruega. La población estudio representa fielmente las características de esa población
general, pero habitualmente no podemos incluir a toda esa población diana en el estudio,
por lo que hemos de seleccionar una muestra más pequeña de ella. Esta muestra ha de
mantener las características generales de la población estudio por lo que hemos de obte-
nerla de una forma dirigida y siguiendo una serie de criterios científicos. Si no selecciona-
mos correctamente la muestra caemos en una desviación sobre lo habitual o sesgo de se-
lección, uno de los errores a evitar a la hora de diseñar un ensayo clínico.4 Los criterios
que seguiremos para obtener una muestra reciben el nombre de criterios de selección. Los
criterios de selección son pautas que definen determinados aspectos de una población y
que en su conjunto delimitan a la población estudio. De todos los sujetos que cumplan los
criterios de selección se elegirán una parte para realizar el estudio. Los criterios de selec-
ción pueden ser:
• Criterios de inclusión: Describen el tipo se sujetos que se pretenden incluir en el ensa-
yo. La descripción ha de ser lo más clara y detallada posible, para que en cualquier
momento otro investigador pueda repetir el ensayo en las mismas circunstancias.
• Criterios de exclusión: Describen el tipo de sujetos que se excluirán del ensayo por
razones éticas, metodológicas, prácticas o de seguridad para el sujeto.
Además, habremos de tener en cuenta que de los sujetos que cumplen los requisitos
y que han sido seleccionados no todos terminarán el estudio. Unos porque no lo empeza-
rán (pérdidas pre aleatorización) y otros porque no podrán terminarlo (pérdidas post
aleatorización). Estas pérdidas habrán de ser sumadas al total de sujetos para realizar el
cálculo del tamaño muestral.3
El tamaño de la muestra debe ser el óptimo para detectar las diferencias estadística y
clínicamente significativas entre dos intervenciones cuando realmente existen tales dife-
rencias, y no son meramente debidas al azar. Una muestra demasiado grande encarece el
estudio, tanto desde el punto de vista económico como de los recursos humanos y físicos.
Por otra parte, una muestra demasiado pequeña puede hacer que el estudio sea incapaz
de detectar las posibles diferencias entre grupos, llegando a conclusiones erróneas.
Para la correcta elección de la muestra habremos de utilizar técnicas de muestreo o
de diseño muestral. En ocasiones, éstas habrán de basarse en técnicas de minería de da-
tos, equivalente para algunos autores a la KDD (acrónimo en inglés de knowledge disco-
very in data bases, extracción de conocimientos en bases de datos).
En conclusión podemos decir que el estudio clínico ideal es un estudio experimental,
analítico, prospectivo, controlado con placebo (si es posible ciego, doble ciego o triple
ciego) y aleatorizado y con muestras adecuadas y de tamaño suficiente como para permitir
la extrapolación de los resultados a la población diana. Los ensayos clínicos pueden tener
una duración desde días a años, sobre una muestra seleccionada de una población a la que
se pueden extrapolar los resultados de la intervención y realizado bajo el prisma de la ética.

Aspectos éticos de los ensayos clínicos


Los criterios éticos son indispensables dentro de todo ensayo clínico. Los participantes
deben estar informados y dar su consentimiento informado cuando son incluidos dentro
de un ensayo. Los pacientes deben estar advertidos de los eventuales riesgos de una forma
188 CAPÍTULO 13

exhaustiva. Los ensayos clínicos deben pasar por un comité de ética. Este comité verifica-
rá el interés científico y médico del estudio, la relación riesgo/beneficio, la conformidad
con las buenas prácticas metodológicas sobre todo a las que conciernen al promotor y al
investigador principal del estudio y la presencia de un seguro que permita indemnizar a
los participantes en el estudio en caso de daño. Las relaciones financieras entre los inves-
tigadores y los promotores del estudio, cuando existan deben ser anunciadas. Los conflic-
tos de intereses deben ser evitados.
Ezequiel Emanuel refiere siete requisitos que deben guiar la evaluación del marco
ético de las propuestas de investigaciones clínicas. Estos requisitos especiales se hacen
necesarios porque los sujetos de investigación pasan a ser el medio por el cual se obtiene
el conocimiento y en esta condición, el hombre puede ser explotado al exponerlo al riesgo
de ser perjudicado en pos del bien de otros. En este contexto, estos requisitos reducen al
mínimo el riesgo de explotación y les asegura ser tratados con respeto.
Estos siete requisitos proporcionan un marco sistemático y racional para determinan
si una investigación clínica es ética. A su vez, éstos han sido elaborados para guiar el de-
sarrollo y la ejecución de los protocolos y su revisión. Los requisitos han sido elaborados
para ser universales, sin limitaciones a una situación en particular, un país o un grupo de
investigación.
Valor
La investigación clínica debe tener valor (importancia social, científica o clínica), es decir,
que sus resultados deben tener la probabilidad de promover mejoras en la salud, el bien-
estar o el conocimiento de la población. La razón por la cual una investigación clínica
debe tener valor está en dos puntos: el uso responsable de recursos limitados (dinero, es-
pacio y tiempo), esto de la mano del concepto de equidad, y evitar la explotación (la ex-
posición de personas a riesgos y daños potenciales sin obtener resultados valiosos). El
requisito de que la investigación clínica sea valiosa asegura a los sujetos de investigación
que no serán expuestos a riesgos sin la probabilidad de algún beneficio personal o social.
Validez científica
En este caso, la mala ciencia no es ética. Un estudio con sujetos humanos que ha sido mal
diseñado (y por lo tanto no puede producir observaciones reproducibles, o sea, hechos
científicos) no es ético. Su metodología debe ser válida y prácticamente realizable, tenien-
do un objetivo científico claro, estar diseñada usando principios, métodos y prácticas de
efecto seguro aceptados, tener poder suficiente para probar definitivamente el objetivo, un
plan de análisis de datos verosímil y poder llevarse a cabo.
La búsqueda de validez científica se basa también en los dos principios: utilización de
recursos limitados y evitar la explotación. Sin validez sería desperdiciar recursos y no se
podría generar ningún conocimiento, producir algún beneficio o justificar la exposición de
las personas a riesgos o daños.
Selección equitativa del sujeto
Este requisito tiene cuatro facetas: el requisito de la selección equitativa del sujeto se
sustenta en el principio de la equidad distributiva (los beneficios y las cargas de la vida
social deben ser distribuidos equitativamente). Así todos deben poder recibir los benefi-
cios obtenidos en la investigación, especialmente, aquellos que corrieron el riesgo, y los
riesgos a su vez no deben caer solo en grupos vulnerables.
Proporción favorable de riesgo-beneficio
Tomando en cuenta que el grado de riesgo-beneficio es incierto, siendo mayor la incerti-
dumbre en las primeras etapas, a una investigación clínica se le pide que:
1. Los riesgos potenciales a los sujetos individuales se minimizan.
2. Los beneficios potenciales a los sujetos individuales o a la sociedad se maximizan.
3. Los beneficios potenciales son proporcionales o exceden a los riesgos asumidos.
Metodología científica y temas relacionados 189

A su vez, todos los riesgos potenciales son sostenidos por los sujetos individuales,
pudiendo recibir beneficios potenciales, mientras que los beneficios principales son reci-
bidos por toda la sociedad. Por tal razón es válido tomar en cuenta los riesgos y beneficios
potenciales para los sujetos, y los riesgos para los sujetos comparados con los beneficios
de la sociedad.
A pesar de carecer de fórmulas que permitan determinar la proporcionalidad del
riesgo-beneficio, las evaluaciones de los riesgos y beneficios de la investigación son juicios
que pueden implicar normas explícitas basadas en un delineado sistemático, sobre la base
de datos existentes, de los tipos potenciales de riesgo y beneficio, su probabilidad de ocu-
rrir y sus consecuencias a largo plazo.
Se debe poner especial cuidado respecto a la cercanía a la explotación cuando los
riesgos potenciales de los sujetos individuales superan el potencial de beneficio a la socie-
dad, sobre todo en la primera fase de la experimentación donde no se espera ningún be-
neficio para el individuo. Los individuos no sopesan esta situación por lo general, pero los
responsables de las políticas habitualmente si lo hacen. Al respecto no existe un marco
determinado sobre cómo se debe balancear esta situación.
Los principios insertos en este requisito son los de beneficencia y no-maleficencia.
Esta última sostiene que no se debe causar daño a una persona, por lo que se deben mini-
mizar los riesgos de la investigación. El principio de beneficencia se refiere a la obligación
moral de actuar en beneficio de otros, en este caso maximizando los beneficios de la in-
vestigación para los sujetos involucrados y la sociedad. Asegurando que los beneficios
excedan los riesgos se evita la explotación.

Evaluación independiente
Dado que los investigadores tienen potencial de conflicto de múltiples intereses, pueden in-
voluntariamente distorsionar sus juicios sobre el diseño y la realización de la investigación,
el análisis de los datos y su adherencia a los requisitos éticos. Todo esto se puede minimizar
por medio de una evaluación independiente realizada por peritos independientes al estudio,
y con autoridad para aprobar, enmendar o cancelar la investigación. Otra razón para hacer
una evaluación independiente es la responsabilidad social. Así se vela por el cumplimiento
de los requisitos éticos de un estudio o investigación, garantizando a la sociedad que las
personas inscritas para los ensayos serán tratadas éticamente y no solo como medios.

Consentimiento informado
Su objetivo es que los sujetos que participan en investigaciones clínicas lo hagan cuando
esta sea compatible con sus valores, intereses y preferencias. El consentimiento informa-
do tiene los siguientes requisitos: la provisión de información sobre la finalidad, los ries-
gos, los beneficios y las alternativas a la investigación y de su propia situación clínica, y la
toma de una decisión libre no forzada sobre si participar o no. Con todo esto los sujetos
pueden tomar decisiones racionales y libres.
El consentimiento informado atiende a la necesidad del respeto por las personas y a
sus decisiones autónomas. Las personas tienen un valor intrínseco debido a su capacidad
de elegir, modificar y proseguir su propio plan de vida. El consentimiento informado res-
peta entonces a la persona y a su autonomía.

Respeto a los sujetos inscritos


Los individuos deben ser respetados durante todo el desarrollo de la investigación, no
solo hasta firmar el consentimiento. Este respeto implica cinco actividades:
1. Permitir al sujeto cambiar de opinión y retirarse sin sanción.
2. Se debe respetar la privacidad del sujeto, administrando la información acerca de él
recopilada de forma confidencial.
3. Si durante la investigación se obtiene nuevos datos sobre riesgos o beneficios de las
intervenciones realizadas, se debe comunicar a los sujetos inscritos.
190 CAPÍTULO 13

4. Debe informarse a los sujetos sobre los conocimientos científicos obtenidos como
resultado de la investigación.
5. Se debe ir evaluando a medida que avanza el estudio el bienestar de los sujetos, para
pesquisar la aparición de reacciones adversas, para poder prestarles un tratamiento
adecuado y oportuno, y retirarlo de la investigación si fuese necesario.

13.4  Diseño y ejecución en procesos estadísticos


La ejecución y análisis de un proceso estadístico está constituido de los componentes si-
guientes:

1. Planteamiento del problema o una necesidad


En la definición del problema de estudio es fundamental identificar claramente la pregun-
ta que se quiere responder o el problema concreto a cuya solución o entendimiento se
contribuirá con la ejecución del proyecto de investigación. Para el planteamiento se deben
seguir los siguientes pasos.
a) Hacer el diagnóstico de la situación: ¿Qué pasa en el entorno de estudio? Identificar
síntomas, necesidades y otros aspectos.
b) Con las listas de causas o necesidades, identifique los hechos o situaciones que lo
producen, o sea las causas del problema.
c) Si los síntomas persisten en la investigación, ¿que podría llegar a pasar?, ¿cuales se-
rían los resultados de tal permanencia? Ese sería el pronóstico.
d) Se deben proponer alternativas que se anticipen al pronóstico, piense en qué forma o
qué es necesario hacer para que el pronóstico no se presente en la investigación. Este
será el mecanismo de control.
e) Luego tome todos los interrogantes que surgieron en los puntos anteriores y redácte-
los en una forma coherente y lógica; el resultado será el planteamiento del problema.

2. Objetivos de la investigación
Antes de iniciar cualquier investigación se debe tener bien definido qué, y por qué se va a
investigar, cómo se llevará a cabo dicha investigación, es decir, en qué condiciones y con
cuáles recursos. Cuándo y dónde se va realizar. La contestación adecuada al qué, cómo,
cuándo y dónde; su desglose en metas, tareas y actividades menores; la obtención de los
recursos físicos, financieros, bibliográficos y humanos son fundamentales para el desarro-
llo del cronograma de la investigación.
Una vez definidas las posibles respuestas a los anteriores interrogantes, complete se-
ñalando las acciones que usted va a realizar como investigador y que le van a permitir
cumplir lo que ha propuesto. Utilice el infinitivo al señalar la formulación de las acciones
que quiere ejecutar (los objetivos siempre deben empezar con un verbo infinitivo).
Debe haber un objetivo principal o general y como mínimo tres objetivos específicos
los cuáles serán las acciones o herramientas que servirán para alcanzar el objetivo general.

3. Determinacion de la unidad de investigación


Es el elemento de la población que origina la información y puede estar constituida por
uno o varios individuos u objetos (un paciente, una clínica, un hospital, un medicamento,
etc.) y denominarse simple o compleja. La unidad de investigación debe estar perfecta-
mente identificada, y ser fácilmente mensurable. Como habíamos definido anteriormente
la población es el conjunto de todas las observaciones de interés para el investigador,
también podemos definir la población como el conjunto de todos los elementos que tie-
nen características comunes. Es fundamental definir claramente la población a investigar
clarificando si es finita o es infinita, y dada la dificultad que implica trabajar con poblacio-
nes grandes, es necesario trabajar con subconjuntos o muestras de dicha población. Exis-
ten muchos métodos para seleccionar y calcular el tamaño de la muestra.
Metodología científica y temas relacionados 191

4. Formulacion de la hipotesis
La hipótesis es una proposición que nos permite establecer relaciones entre hechos. Su
valor reside en la capacidad para establecer unas relaciones entre los hechos y explicar del
por qué se producen. La hipótesis es una proposición para responder tentativamente un
problema; indica por lo tanto qué estamos buscando, va siempre hacia adelante; es una
proposición que puede ser puesta a prueba para determinar su validez. Al final esta afir-
mación puede ser rechazada o replanteada.

5. Selección del metodo de investigacion


En esta etapa se determina si la investigación va a ser muestral o poblacional. Si es mues-
tral se debe indicar cuál es el procedimiento seleccionado para calcular el tamaño de la
muestra y determinar el método para extraer los elementos de la muestra. Se debe definir
si la investigación se inicia como exploratoria, descriptiva, correlacional o explicativa y
hasta qué nivel llegará.

6. Recoleccion de la información
Una de las etapas más importantes de la investigación estadística es la recolección de
datos. La información se puede recolectar por diferentes medios, entre los cuales los más
comunes son: por observación directa, por encuestas, por publicaciones o fuentes exter-
nas confiables que se hayan realizado.
En esta etapa se deben de diseñar las preguntas que se realizarán en la encuesta, si se
va a tener criterios demográficos vinculados a factores que se relacionen con el área de la
salud y las ciencias médicas, como es el caso especial del presente texto.

7. Procesamiento de la información
Consiste en ordenar la información, filtrarla, eliminando los posibles errores, (donde es
fundamental el conocimiento de la población por parte de quien depura y filtra para po-
der detectar las falsedades en las respuestas), tabularla mediante la utilización de cuadros
o tablas estadísticas donde se resume la información de acuerdo al interés específico del
investigador, y analizar la información mediante los métodos y normas estadísticas.
Cabe anotar que para la presentación final hay que tener en cuenta a quien va dirigida
la información por lo tanto es indispensable combinar gráficos, tablas y cuadros con el fin
de que la información llegue con claridad y permita hacer los análisis fácilmente.
El avance tecnológico y la masificación de las computadoras hacen que estas tareas
manualmente engorrosas sean realizadas fácilmente y en muy corto tiempo. Se debe men-
cionar que tipos de análisis se van a realizar con la información, y cómo se van a tabular
las diferentes variables.

8. Publicacion
Es la etapa final de entrega de la información después de revisada, donde quedan consig-
nados todo el resultado de la investigación. Estos resultados deben presentarse adecuada-
mente de tal manera que puedan servir para estudios posteriores.

9. El diseño experimental


El diseño experimental es una técnica estadística que permite identificar y cuantificar las
causas de un efecto dentro de un estudio experimental. En un diseño experimental se
manipulan deliberadamente una o más variables, vinculadas a las causas, para medir el
efecto que tienen en otra variable de interés. El diseño experimental prescribe una serie
de pautas relativas qué variables hay que manipular, de qué manera, cuántas veces hay que
repetir el experimento y en qué orden para poder establecer con un grado de confianza y
la necesidad de predecir una presunta relación de causa-efecto.
192 CAPÍTULO 13

El diseño experimental encuentra aplicaciones en la industria, la agricultura, la mer-


cadotecnia, la medicina, la ecología, las ciencias de la conducta, etc. constituyendo una
fase esencial en el desarrollo de un estudio experimental.
El señor Ronald Fisher es considerado como el padre del diseño experimental en sus
estudios de agronomía en el primer tercio del siglo xx. A la lista de los pioneros de su uso
hay que añadir los trabajos de los señores Frank Yates, W.G. Cochran y G.E.P. Box. Mu-
chas de las aplicaciones originarias del diseño experimental estuvieron relacionadas con
la agricultura y la biología, disciplinas de las que procede parte de la terminología propia
de dicha técnica.

10. La replica estadística


La réplica estadística normalmente se sujeta a medidas de variación y la incertidumbre de
dichas medidas, significa que si se repiten con experimentos enteros y se replican para
ayudar a identificar las fuentes de la variación, con el objeto de poder estimar los efectos
verdaderos de tratamientos, fortalecer su confiabilidad y validez, y por agregar al conoci-
miento del tópico que corresponde en la realidad. No obstante, se necesita del cumpli-
miento de ciertas condiciones antes que la réplica se comience.

Ejercicios para secciones combinadas 13.1; 13.2; 13.3 y 13.4


a) Elaborar un experimento estadístico con diversos grupos de alumnos en la clase de
Bioestadística;
b) Elaborar un experimento científico con diversos grupos de alumnos en la clase de
Bioestadística, orientado a las ciencias médicas y área de la salud;
c) Llevar a cabo el diseño y ejecución de proyectos en el marco de las ciencias biológi-
cas, aplicando los principios y pruebas de Fisher.

13.5 Sensibilidad, especificidad, prevalencia


y valores predictivos
El caso más sencillo que se nos puede plantear es el de una prueba dicotómica, que clasi-
fica a cada paciente como sano o enfermo en función de que el resultado de la prueba sea
positivo o negativo. En casos como éste, generalmente un resultado positivo se asocia con
la presencia de enfermedad y un resultado negativo con la ausencia de la misma.
Cuando se estudia una muestra de pacientes, los datos obtenidos permiten clasificar a
los sujetos en cuatro grupos según una tabla 2 × 2, como la que se muestra en el siguiente
cuadro.

Estado del paciente Total


Test
P(+) P(–)
Test(+) VP FP
Test(–) FN VN
Total

Test = test aplicado


Estado del paciente = enfermo P(+) o sano P(–)
VP = verdadero positivo
VN = verdadero negativo
FN = falso negatvo
FP = falso positivo
En este tipo de tablas se plasman los resultados de la prueba diagnóstica (en filas)
con el estado real de los pacientes (en columnas) o, en su defecto, el resultado de la prue-
ba de referencia que vayamos a utilizar. El resultado de la prueba puede ser correcto
Metodología científica y temas relacionados 193

(verdadero positivo y verdadero negativo) o incorrecto (falso positivo y falso negativo). El


análisis de su validez puede obtenerse calculando los valores de sensibilidad y especifici-
dad.

13.5.1 Sensibilidad
Es la probabilidad de clasificar correctamente a un individuo enfermo, es decir, la proba-
bilidad de que para un sujeto enfermo se obtenga en la prueba un resultado positivo. La
sensibilidad es, por lo tanto, la capacidad del test para detectar la enfermedad.
Cuando los datos obtenidos a partir de una muestra de pacientes se clasifican en una
tabla como la anterior, fácil estimar a partir de la información en ella la sensibilidad como
la proporción de pacientes enfermos que obtuvieron un resultado positivo en la prueba
diagnóstica. Es decir:
VP
Sensibilidad =
VP + FN

Donde VP es la prueba que resultó verdadera positiva y FN la prueba que resultó falsa
negativa. De ahí que también la sensibilidad sea conocida como “fracción de verdaderos
positivos (FVP)”.

13.5.2 Especificidad
Representa la probabilidad de una prueba en la que un paciente sano tenga un resultado
negativo en la prueba, y se puede calcular mediante la fórmula siguiente:

VN
Especificidad =
VN + FP
Donde VN serían los verdaderos negativos; y FP, los falsos positivos.
En conclusión, la sensibilidad es la fracción de verdaderos positivos (FVP) y la espe-
cificidad, la fracción de verdaderos negativos (FVN).
No obstante, cada prueba tendrá mayor o menos porcentaje tanto en especificidad
(SP) como en sensibilidad (SE) dependiendo de los resultados y el acompañamiento de
información adicional generada a través de los valores de predicción, probabilidades pre-
test y postest, y el coeficiente de verosimilitud, para establecer con mayor seguridad si el
paciente que tuvo una prueba negativa, está realmente enfermo, o el paciente que tuvo una
prueba positiva está sano.
La información o situaciones referidas en el párrafo precedente es de mucha utilidad
en el diagnóstico clínico, ya que por ejemplo se puede llegar a conclusiones aduciendo
que, si el valor de la especificidad supera 80% se considera que la prueba es buena.
Por regla general, se elige una prueba muy específica cuando prefieres obtener falsos
negativos en lugar de falsos positivos, y así asegurar de que un paciente tiene realmente
una enfermedad. Por ejemplo, una prueba para detectar una enfermedad que implique
una operación, es imprescindible asegurarse de que el paciente está enfermo y necesita la
operación, para no operar a un paciente sano.
Otros casos en los que se usa una prueba muy específica son: al tratarse de una enfer-
medad grave y prácticamente incurable, cuando es importante desde el punto de vista
sanitario y psicológico saber que no se padece la enfermedad, cuando un resultado positi-
vo falso supone un trauma económico y psicológico para el sujeto. En estas situaciones se
utiliza una prueba con un valor predictivo positivo alto, que aumenta de valor, conforme
la prevalencia de la enfermedad de esta es mayor.
En cambio, se elige una prueba muy sensible cuando se prefiere obtener falsos positi-
vos en lugar de falsos negativos, es decir, quieres que el número de enfermos sin detectar
sea mínimo. Por ejemplo, en una epidemia es importante usar una prueba muy sensible,
194 CAPÍTULO 13

puesto que es necesario aislar a los enfermos y para ello todos deben ser detectados. Se
usa en casos en que la enfermedad es grave pero curable, existiendo tratamiento para ella.
En estos casos se usan pruebas con valor predictivo negativo alto, cuyo valor aumenta
conforme disminuye la prevalencia de la enfermedad.

13.5.3 Relación entre sensibilidad y especificidad


Idealmente una prueba debería ser 100% sensible y 100% específica, que implicaría que es
capaz de reconocer correctamente a todos los enfermos y a todos los que no tienen la al-
teración en estudio.
En términos generales, cuando se estudia una variable de tipo cuantitativo continuo,
puede observarse que existe una relación inversa entre el valor de la sensibilidad y el de la
especificidad, de tal manera que, a medida que uno se incrementa, el otro disminuye.
La siguiente tabla representa los resultados de concentración de glucosa en la sangre
que puede variar en diferentes pacientes, 2 horas después de comer.

Concentración de glucosa % %
sanguinea (mg/100 ml) Sensibilidad Especificidad
 70 98.1   8.8
 80 97.1  25.5
 90 94.3  47.6
100 88.6  69.8
110 85.7  84.1
120 71.4  92.5
130 64.3  96.9
140 57.1  98.4
150 50.0  99.6
160 47.1  99.8
170 42.9 100
180 38.6 100
190 34.3 100
200 27.1 100

13.5.4 Prevalencia
Es la proporción porcentual del resultado de casos identificados con una x enfermedad,
del total de pobladores en riesgo, para lo cual podemos aplicar la fórmula siguiente:

PREV =
∑P (+) × 100
Población en riesgo

Ejemplo
Si la comunidad de Santa Mónica en una provincia de Centroamérica tiene una población
de 450,000 habitantes de los cuales 25,835 de estos habitantes han sido diagnosticados
con un tipo de cáncer de piel. Determinar la prevalencia de esta enfermedad en dicha
comunidad.
Metodología científica y temas relacionados 195

Solución
Como la prevalencia está dada por:

∑P (+)
PREV = ×100 = (25835/450000)(100) = 5.74%
Población en riesgo

De este resultado se puede concluir que, de cada 100 pobladores en Santa Mónica, 6
pueden tener una prevalencia de la enfermedad.

13.5.5 La influencia de la prevalencia


Hemos visto cómo los valores de sensibilidad y especificidad, a pesar de definir completa-
mente la validez de la prueba diagnóstica, presentan la desventaja de que no proporcionan
información relevante a la hora de tomar una decisión clínica ante un determinado resul-
tado de la prueba. Sin embargo, tienen la ventaja adicional de que son propiedades intrín-
secas a la prueba diagnóstica, y definen su validez independientemente de cuál sea la
prevalencia de la enfermedad en la población a la cual se aplica.
Por el contrario, el concepto de valores predictivos, a pesar de ser de enorme utilidad
a la hora de tomar decisiones clínicas y transmitir a los pacientes información sobre su
diagnóstico, presenta la limitación de que dependen en gran medida de lo frecuente que
sea la enfermedad a diagnosticar en la población objeto de estudio. Cuando la prevalencia
de la enfermedad es baja, un resultado negativo permitirá descartar la enfermedad con
mayor seguridad, siendo así el valor predictivo negativo mayor. Por el contrario, un resul-
tado positivo no permitirá confirmar el diagnóstico, resultando en un bajo valor predicti-
vo positivo.
Ilustraremos lo anterior con un sencillo ejemplo. Para el diagnóstico del VIH se em-
plean test que han confirmado tener una alta validez, con valores aproximados de sensibi-
lidad y especificidad de un 99.5%. Supongamos que se aplica esta prueba a la totalidad de
una población de una ciudad con alto riesgo de VIH, que se cifra en 2,800,000 habitantes.
Si asumimos que en esa ciudad existen 6.000 pacientes VIH positivos (lo cual implicaría
una prevalencia de 6000/2,800,000 = 0.21%), el test resultaría positivo en un total de
19.940 sujetos, obteniéndose un valor predictivo positivo del 29.9%.
Así pues, sólo un 29.9% de los sujetos con un resultado positivo en el test resultarían
estar realmente afectados, mientras que un 70.1% de los mismos no presentarían la enfer-
medad. Resulta obvio que en una comunidad como la de esta ciudad la utilización de esta
prueba no resultaría útil, debido a la alta proporción de falsos positivos que conllevaría.
Veamos ahora qué ocurriría si se aplicase la misma prueba a una población en la que
el número de enfermos VIH+ fuese de 800,000 (resultando en una prevalencia mucho
mayor de un 800,000/2,800,000 = 28.6%). En este caso, la prevalencia de una prueba
positiva aumenta de un 29.9% a un 98.7%, disminuyendo la proporción de falsos positivos
a tan sólo un 1.3%. Por lo tanto, si la prevalencia es alta, un resultado positivo tiende a
confirmar la presencia de la enfermedad, mientras que, si la prevalencia es baja, un resul-
tado positivo no permitirá afirmar su existencia.

13.5.6 Combinación de factores
Como en la teoría de los diagnósticos clínicos es de vital importancia el manejo de diver-
sos factores como la sensibilidad, la especificidad, la prevalencia y valores predictivos en
pruebas diagnósticas, a continuación conjugamos los resultados antes mencionados:
Ejemplo 1
Un estudio en el que se incluyó a 2641 pacientes con sospecha de cáncer prostático que
acudieron a una consulta de urología durante un periodo determinado.
196 CAPÍTULO 13

Durante su exploración, se recogió el resultado del tacto rectal realizado a cada uno
de estos pacientes, según fuese éste normal o anormal, y se contrastó con el posterior
diagnóstico obtenido de la biopsia prostática.
Los datos del estudio y los resultados obtenidos se muestran en la siguiente tabla:

Estado del paciente Total


Test
P(+) P(–)
Test(+) VP = 634 FP = 269 903
Test(–) FN = 487 VN = 1251 1738
Total 1121 1520 2641
Según la tabla se encontró en total 1121 casos de cáncer, lo cual representa 42.45%
del total de sujetos estudiados.
La sensibilidad del tacto rectal para detectar cáncer fue de 56.56% (634/1121) y la
especificidad de 82.3% (1251/1520).
Así, el tacto fue anormal en un 56,56% de los casos de cáncer prostático y normal en
82.3% de los casos que presentaron finalmente otras patologías.
Esto significa que un 100-56.56 = 43.44% de los pacientes que efectivamente tenían
cáncer presentaban tactos normales. Claramente ello indica la necesidad de utilizar otros
marcadores más sensibles, como el PSA o sus derivados, para poder establecer el diagnós-
tico de forma más precisa.
Resulta obvio que lo ideal sería trabajar con pruebas diagnósticas de alta sensibilidad
y especificidad, pero esto no siempre es posible. En general, las pruebas deben ser de alta
sensibilidad para poder captar a todos los enfermos. Una prueba muy sensible será espe-
cialmente adecuada en aquellos casos en los que el no diagnosticar la enfermedad puede
resultar fatal para los enfermos, como ocurre con enfermedades peligrosas pero tratables,
como los linfomas o la tuberculosis, o en enfermedades en las que un falso positivo no
produzca serios trastornos psicológicos o económicos para el paciente (por ejemplo, la
realización de mamografía en el cáncer de mama).
Por otra parte, la especificidad se refiere, como se señaló previamente, a la probabili-
dad de que un sujeto sano sea clasificado adecuadamente. En general, las pruebas confir-
matorias del diagnóstico deben ser de alta especificidad, para evitar falsos positivos.
Los test de alta especificidad son necesarios en enfermedades graves, pero sin trata-
miento disponible que las haga curables, cuando exista gran interés por conocer la ausen-
cia de enfermedad o cuando diagnosticar a un paciente de un mal que realmente no pade-
ce pueda acarrear graves consecuencias, ya sean físicas, psicológicas o económicas (por
ejemplo, en el caso del SIDA).
Ejemplo 2
En una prueba de esfuerzo en banda sin fin en el diagnóstico de la estenosis coronaria, se
tiene la siguiente información:

Estenosis Sin estenosis


Prueba de esfuerzo coronaria coronaria Total
Positiva  55  7  62
Negativa  49 84 133
Total 104 91 195

Solución
Resultados tabla:
55
Sensibilidad = = 0.528×100 =52.88%
104
Metodología científica y temas relacionados 197

falsos negativos = 1 − sensibilidad = 1 − 0.5288 = 0.4712x100 = 47.12%

84
especificidad = = 0.9231×100 =92.31%
91
falsos positivos = 1 − especificidad = 1 − 0.9231 = 0.0769x100 = 7.69%

Ejemplo 3
La siguiente tabla representa los datos del ultrasonido en el diagnóstico del carcinoma
primario de hígado, establecidos a través de una biopsia por aspiración.

Carcinoma de Sin carcinoma de


Ultrasonido hígado hígado Total
Positiva 16  8 24
Negativa  5 31 36
Total 21 39 60

Solución
Resultados tabla:
16
sensibilidad = ×100 =76.2%
21
falsos negativos = 1 − sensibilidad = 1 − 0.762 = 0.238x100 = 23.8%

31
especificidad = ×100=79.4%
39
falsos positivos = 1 − especificidad = 1 − 0.794 = 0.206x100 = 20.6%

13.5.7 La seguridad de una prueba diagnóstica


Los conceptos de sensibilidad y especificidad permiten, por lo tanto, valorar la validez de
una prueba diagnóstica. Sin embargo, carecen de utilidad en la práctica clínica.
Tanto la sensibilidad como la especificidad proporcionan información acerca de la
probabilidad de obtener un resultado concreto (positivo o negativo) en función de la ver-
dadera condición del enfermo con respecto a la enfermedad. No obstante, cuando a un
paciente se le realiza alguna prueba, el médico carece de información a priori acerca de
su verdadero diagnóstico, y más bien la pregunta se plantea en sentido contrario: ante un
resultado positivo o negativo en la prueba, ¿cuál es la probabilidad de que el paciente esté
realmente enfermo o sano? Así pues, resulta obvio que hasta el momento sólo hemos
abordado el problema en una dirección, razón por la cual es necesario determinar los
valores predictivos y así poseer un mejor sustento matemático para dar respuesta sobre las
probabilidades antes mencionadas.

Valor predictivo positivo


Es la probabilidad de padecer la enfermedad si se obtiene un resultado positivo en el test.
El valor predictivo positivo puede estimarse, por tanto, a partir de la proporción de pa-
cientes con un resultado positivo en la prueba que finalmente resultaron estar enfermos,
para este caso utilizaremos la fórmula siguiente:
VP
VPP = ×100
VP + FP
198 CAPÍTULO 13

VPP = valor predictivo positivo


Donde: VP = verdadero positivo
FP = falso positivo
TEST (+) ∩ P (+)
Asimismo, se puede utilizar la fórmula alternativa VPP =
∑TEST(+)
Valor predictivo negativo
Es la probabilidad de que un sujeto con un resultado negativo en la prueba esté realmente
sano. Se estima dividiendo el número de verdaderos negativos entre el total de pacientes
con un resultado negativo en la prueba, y se calcula mediante la fórmula siguiente:
VN
VPN =
VN + FN

VPN = valor predictivo negativo


Donde: VN = verdadero negativo
FN = falso negativo
También puede utilizarse la fórmula alternativa:
TEST (−) ∩ P (−)
VPN = ×100
∑TEST (−)
Ejemplo
En una población de 4,000 pacientes se tiene una prevalencia del 7%, es decir se supone
que, de cada 100 personas, siete de ellas estarían realmente enfermas. Si se sabe que la
sensibilidad es del 80% y la especificidad es de un 95%. Determinar el valor predictivo
positivo (VPP) y el valor predictivo negativo (VPN).
Solución
La siguiente tabla representa los resultados para VP, FN, FP, VN, ΣP(+), y ΣP(–); los
cuales se determinaron de la manera siguiente:
Como la prevalencia es del 7%, la sensibilidad 80% y la especificidad del 95%, enton-
ces:
El total de pacientes positivos se calcula a través de:
ΣP(+) = (prevalencia)(número total de pacientes) = 0.07 × 4000 = 280
VP = (sensibildad) (ΣP(+)) = (0.80)(280) = 224
FN = ΣP(+) – VP = 280 – 224 = 56
ΣP(–) = (número total de pacientes) – ΣP(+) = 4000 – 280 = 3720
VN = (especificidad) (ΣP(–)) = (0.95)(3720) = 3534
FP = ΣP(–) – VN = 3720 – 3534 = 186

Estado del paciente Total


TEST
P(+) P(–)
TEST(+) VP = 224 FP = 186  410
TEST(–) FN = 56 VN = 3534 3590
Total 280 3720 4000

Ahora, el problema nos pide el cálculo del valor predictivo positivo (VPP) y valor
predictivo negativo (VPN).
Metodología científica y temas relacionados 199

TEST (+) ∩ P (+) VP 224


VPP = ×100 = ×100 = ×100 = 54.63%
∑TEST (+) ∑TEST (+) 410

TEST (−) ∩ P (−) VP 3534


VPN = ×100 = ×100 = ×100 = 98.44%
∑TEST (−) ∑TEST (−) 3590

13.5.8 Razones de probabilidad o coeficientes de verosimilitud


Queda claro pues cómo la prevalencia es un factor determinante en los valores predictivos
de un test. Por lo tanto, éstos no pueden ser utilizados como índices a la hora de comparar
dos métodos diagnósticos diferentes ni tampoco a la hora de extrapolar los resultados de
otros estudios a datos propios. Por ello, resulta necesario determinar otros índices de va-
loración que sean a la vez clínicamente útiles y que no dependan de la prevalencia de la
enfermedad en la población a estudiar. Así, además de los conceptos de sensibilidad, es-
pecificidad y valores predictivos, se suele hablar del concepto de razón de verosimilitudes,
razón de probabilidad o cociente de probabilidades. Estos miden cuánto más probable es
un resultado concreto (positivo o negativo) según la presencia o ausencia de enfermedad:
En cierto sentido, la verosimilitud es una versión inversa de la probabilidad condicio-
nal, en tal sentido, conocido un parámetro B, la probabilidad condicional de A es P(A|B),
pero si se conoce A, pueden realizarse inferencias sobre el valor de B, gracias al teorema
de Bayes, el que describe estos resultados mediante la fórmula siguiente:
P ( A B)P ( B)
VP ( B A) =
P ( A)
La función de verosimilitud, L(b|A), definida como: L(b|A) = P(A|B = b); desempe-
ña el mismo papel bajo un enfoque no bayesiano. De hecho, lo relevante no es el valor en
sí de L(b|A) sino la razón de verosimilitudes:
Que permite comparar cuanto más verosímil es el parámetro b1 que el b2 a la hora de
explicar el evento A. De ahí que en ocasiones se entienda que la función de verosimilitud,
más que una función en sí, sea la clase de funciones:
L(b|A) = 𝛼P(A|B = b); donde α es una constante de proporcionalidad.
La función de verosimilitud, abundando en los razonamientos anteriores, abre la vía
para dos técnicas muy habituales en inferencia estadística: las de la máxima verosimilitud
y la del test de la razón de verosimilitud.
Coeficiente o razón de verosimilitudes positiva
Éste se calcula dividiendo la probabilidad de un resultado positivo en los pacientes enfer-
mos entre la probabilidad de un resultado positivo entre los sanos. Es, en definitiva, el
cociente entre la fracción de verdaderos positivos (sensibilidad) y la fracción de falsos
positivos (1-especificidad), dados en la fórmula siguiente:
sensibilidad
CVERO(+) =
1 −especificidad
Coeficiente o razón de verosimilitudes negativa
Éste se calcula dividiendo la probabilidad de un resultado negativo en presencia de enfer-
medad entre la probabilidad de un resultado negativo en ausencia de la misma. Se calcula,
por lo tanto, como el cociente entre la fracción de falsos negativos (1-sensibilidad) y la
fracción de verdaderos negativos (especificidad), según la fórmula siguiente:
1 −sensibilidad
CVERO(−) =
especificidad
200 CAPÍTULO 13

En esta situación nos encontramos con el dilema del diagnóstico (probabilidad a


priori o probabilidad pretest), y el hallazgo (probabilidad postest), como el siguiente es-
quema:

Probabilidad pretest = probabilidad a priori

{
Námesis
Circunstancias intermedias = Laboratorio
Exploración
Imagen

Probabilidad postest
Asimismo, la probabilidad postest se puede estimar o se puede medir, en ambos casos la
medición es mucho más exacta, ya que estimamos un x% vía la presencia de síntomas,
radiografías y otros; mientras que cuando ésta se mide podemos contar con el apoyo de
exámenes y sus resultados, identificación de otros focos de infección, cultivos y otros.
Notas:
1. Si el coeficiente de verosimilitud es igual a 1, entonces la probabilidad pretest y la
probabilidad postest, no cambia o sea sigue siendo la misma;
2. Si el coeficiente de verosimilitud es mayor que 1, entonces la probabilidad postest, es
más alta que la probabilidad pretest; y,
3. Si el coeficiente de verosimilitud es menor que 1, entonces la probabilidad postest, es
más baja que la probabilidad pretest.
Ejemplo
La siguiente tabla representa los resultados de 10,000 pacientes, en donde se puede veri-
ficar un 70% de sensibilidad, y un 95% de especificidad, con una Prevalencia de un 7%.

Estado del paciente Total


TEST
P(+) P(–)
TEST(+) VP = 490 FP = 465   955
TEST(–) FN = 210 VN = 8835 9,045
Total 700 9300 10,000
Calcular:
a) El coeficiente de verosimilitud positivo
b) El coeficiente de verosimilitud negativo
Solución a)
Como el coeficiente de verosimilitud positivo se calcula por:
sensibilidad 0.7 0.7
CVERO(+) = = = =14
1− especificidad 1 −0.95 0.05
Solución b)
1− sensibilidad 1 −0.7 0.30
Ahora CVERO(−) = = = = 0.315
especificidad 0.95 0.95
Nota:
Recuerde que, si no conoce el resultado de la sensibilidad, este puede calcularlo por las
fórmulas siguientes:
VP
a) Sensibilidad =
VP + FN
Metodología científica y temas relacionados 201

VN
b) Especificidad =
VN + FP

Comprobando con los datos de la tabla en el presente ejemplo tenemos que:


VP 490 490
Sensibilidad = = = = 0.70
VP + FN 490 + 210 700
VN 8835 8835
Especificidad = = = = 0.95
VN + FP 8835 + 465 9300

13.5.9 Razones de probabilidad (ODDS RATIO)


En el cálculo de probabilidades postest y viceversa, se ve involucrada una medida especial
denominada ODDS RATIO (OR), para la que no hay un término en castellano que sea
bien aceptado. El ODDS con un posible sinónimo de ventaja en las pruebas clínicas, es
otra forma de representar un riesgo mediante el cociente entre el número de veces que
ocurre el suceso frente a cuántas veces no ocurre. Así un ODDS de 3 indica que tres (3)
personas sufrirán el suceso frente a uno (1) que no lo hará.
Si en la siguiente tabla contamos con información sobre un posible infarto o no, de-
pendiente de un mal control o buen control del paciente, se tiene:

Riesgo de infarto Mal control Buen control Total


Infarto  10   7  17
No infarto 240 454 694
Total 250 461 711

En esta tabla el ODDS de infarto en el grupo de mal control es 10 / 250 = 1 / 25 = 0.04,


es decir que ocurre 1 vez por 25 veces que no ocurre.
En el grupo de buen control el ODDS es 7/461 = 0.015.
El cociente de los ODDS de los dos grupos es lo que se denomina ODDS RATIO y
constituye otra forma de cuantificar la asociación entre dos variables dicotómicas. En la
tabla anterior el valor del ODDS RATIO es aproximadamente 2.6, que coincide con el
riesgo relativo y, como después veremos, no por casualidad.
El cálculo del ODDS RATIO a partir de los datos de frecuencia de una tabla 2 × 2 es
muy sencillo determinarlo, y entre las fórmulas más comunes tenemos:

probabilidad PRETEST
a) ODDS PRETEST =
1 −probabilidad PRETEST

b) ODDS POSTEST = (ODDS PRETEST)(CVERO)


ODDS POSTEST
c) Probabilidad POSTEST =
1+ ODDS POSTEST

Si el test es positivo el factor CVERO en la fórmula, será el valor del CVERO (+) y si el
test es negativo el factor CVERO, será el valor numérico del CVERO (–).

Ejemplo 1
Tomando el cuadro del ejemplo anterior, en donde los resultados de 10,000 pacientes
verificaban un 70% de sensibilidad, un 95% de especificidad, y una prevalencia del 7%.
202 CAPÍTULO 13

Estado del paciente Total


TEST
P(+) P(–)
TEST(+) VP = 490 FP = 465   955
TEST(–) FN = 210 VN = 8835  9,045
Total 700 9300 10,000

Calcular:
a) Calcular el ODDS PRETEST;
b) Calcular el ODDS POSTEST, positivo y negativo;
c) Calcular la probabilidad POSTEST, cuando el test es positivo;
d) Calcular la probabilidad POSTEST, cuando el test es negativo;

Solución inciso a)
Datos:
Sensibilidad = 70%
Especificidad = 95%
Prevalencia = 7%
sensibilidad 0.7 0.7
CVERO(+) = = = =14
1 −especificidad 1 −0.95 0.05

1 −sensibilidad 1 −0.7 0.30


CVERO(−) = = = = 0.315
especificidad 0.95 0.95
probabilidad PRETEST 0.07 0.07
Como ODDS PRETEST = = = = 0.075
1 −probabilidad PRETEST 1 −0.07 0.93
Entonces: ODDS PRETEST = 0.075
Solución inciso b)
Datos:
Sensibilidad = 70%
Especificidad = 95%
Prevalencia = 7%
sensibilidad 0.7 0.7
CVERO(+) = = = =14
1 −especificidad 1 −0.95 0.05

1 −sensibilidad 1 −0.7 0.30


CVERO(−) = = = = 0.315
especificidad 0.95 0.95

Entonces el cálculo para un ODDS POSTEST, cuando el test sea positivo, tendre-
mos:
ODDS PRETEST = (ODDS PRETEST)(CVERO(+)) = (0.075)(14) = 1.054
Y en el caso del test negativo:
ODDS PRETEST = (ODDS PRETEST)(CVERO(–)) = (0.075)(0.315) = 0.236

Solución inciso c)
Datos:
ODDS PRETEST = 1.054 (test positivo)
Metodología científica y temas relacionados 203

ODDS POSTEST
Como la Probabilidad POSTEST =
1+ ODDS POSTEST
En el caso del test positivo tendremos:
ODDS POSTEST 1.054 1.054
Probabilidad POSTEST = = = = 0.513 o 51.3%
1 + ODDS POSTEST 1 +1.054 2.054

Solución inciso d)
Datos:
ODDS PRETEST = 0.236 (test negativo)
ODDS POSTEST
Como la probabilidad POSTEST =
1+ ODDS POSTEST

En el caso del test negativo tendremos:


ODDS POSTEST 0.0236 0.0236
Probabilidad POSTEST = = = = 0.023 o 2.3%
1 + ODDS POSTEST 1 + 0.0236 1.0236

Ejemplo 2
Para la tabla del ejemplo 1, utilice una prevalencia de 15%, y calcule las probabilidades
POSTEST, tanto para el test positivo como para el test negativo.
(Recuerde que debe mantener la sensibilidad de 70% y especificidad de 95%)
Tabla anterior:

Estado del paciente Total


TEST
P(+) P(–)
TEST(+) VP = 490 FP = 465 955
TEST(–) FN = 210 VN = 8835 9045
Total 700 9300 10,000

Nueva tabla con prevalencia del 15%, sensibilidad de 70% y especificidad de 95%.

Estado del paciente Total


TEST
P(+) P(–)
TEST(+) VP = 1050 FP = 425 1475
TEST(–) FN = 450 VN = 8075 8525
Total 1500 8500 10,000
VP
Recuerde que = 07; entonces VP = 1500(0.7) = 1050
1500
VN
Y que = 0.95; entonces VN = 8500(0.95) = 8075
8500
Los demás resultados se determinan por diferencias.
Ahora como la probabilidad POSTEST está dada por:
ODDS POSTEST
Probabilidad POSTEST = ; pero
1 + ODDS POSTEST
probabilidad PRETEST
ODDS PRETEST =
1 − probabilidad PRETEST
204 CAPÍTULO 13

Y ODDS PRETEST = (ODDS PRETEST)(CVERO); por tanto debemos calcular los


ODDS PRETEST y POSTEST, así como Coeficiente de Verosimilitud (CVERO).
Como la probabilidad PRETEST es de 15%, entonces:
probabilidad PRETEST 0.15 0.15
ODDS PRETEST = = = = 0.1765 o17.65%
1 − probabilidad PRETEST 1 −0.15 0.85
ODDS POSTEST = (ODDS PRETEST)(CVERO); entonces:
sensibilidad 0.7 0.7
CVERO(+) = = = = 14
1 −especificidad 1 −0.95 0.05

1 −sensibilidad 1 −0.7 0.30


CVERO(−) = = = = 0.315
especificidad 0.95 0.95

Recuerde que, si la sensibilidad y la especificidad siguen siendo los mismos resulta-


dos, los valores del coeficiente de verosimilitud son los mismos resultados del ejercicio
anterior, luego tenemos que:
ODDS POSTEST = (ODDS PRETEST)(CVERO(+)) = (0.1765)(14) = 2.47
Y el ODDS POSTEST = (ODDS PRETEST)(CVERO(–)) = (0.1765)(0.315) = 0.05559
La probabilidad POSTEST, calculada para el test positivo:
ODDS POSTEST 2.47 2.47
Probabilidad POSTEST = = = = 0.7118 o 71.18%
1 + ODDS POSTEST 1 +2.47 3.47
La probabilidad POSTEST, calculada para el test negativo:
ODDS POSTEST 0.05559 0.05559
Probabilidad POSTEST = = = = 0.0526 o 5.26%
1 + ODDS POSTEST 1 +0.05559 1.05559
Conclusión:
La probabilidad POSTEST, calculada para el test positivo es 71.18%.
La probabilidad POSTEST, calculada para el test negativo es 5.26%.

13.5.10 Tasa de riesgo relativo


En estadística y epidemiología, la tasa de riesgo relativo o simplemente riesgo relativo es
el cociente entre el riesgo en el grupo con el factor de exposición o factor de riesgo y el
riesgo en el grupo de referencia (que no tiene el factor de exposición) como índice de
asociación.
El mejor estudio para calcular el riesgo relativo son los estudios prospectivos como el
estudio de cohortes y el ensayo clínico, donde de la población se extraen dos muestras sin
enfermedad o en las que no haya sucedido el evento: una expuesta al factor de riesgo y
otra sin tal exposición. De cada muestra se calcula la incidencia acumulada de expuestos
y su cociente.
En una tabla de incidencias de riesgo relativo (RR) con elementos en relación sobre
la cantidad de población expuesta o no a un riesgo de estar enfermos o estar sanos, pode-
mos apreciar dicha información de la manera siguiente:

Incidencia Enfermos Sanos Total


Expuestos EE ES EE + ES
No expuestos NEE NES NEE + NES
Total EE + NEE ES + NES N
Metodología científica y temas relacionados 205

Luego el riesgo relativo dependiendo de la razón pedida a calcular tendrá una fórmu-
la variante de acuerdo al caso. Por ejemplo, si se pide calcular el riesgo relativo de enfer-
mos expuestos, esta se plantea en la forma siguiente:
EE
EE + ES
RR =
NEE
NEE + NES

En conclusión, el riesgo relativo tendrá las características siguientes:


1. El riesgo relativo es una medida relativa del efecto porque indica cuánto más veces
tiende a desarrollar el evento en el grupo de sujetos expuestos al factor de exposición
o factor de riesgo en relación con el grupo no expuesto. Por ejemplo, es relativo que
Andrés sufra de problemas de salud y que Javier no sufra de ellos.
2. El riesgo relativo (RR) no tiene dimensiones, y simplemente es una razón matemática.
3. El rango de su valor oscila entre [0, + ∞[
4. El RR identifica la magnitud o fuerza de la asociación, lo que permite comparar la
frecuencia con que ocurre el evento entre los que tienen el factor de riesgo y los que
no lo tienen.
5. El RR = 1 indica que no hay asociación entre la presencia del factor de riesgo y el
evento.
6. El RR > 1 indica que existe asociación positiva, es decir, que la presencia del factor
de riesgo se asocia a una mayor frecuencia de suceder el evento. Entre mayor es el
riesgo relativo (RR) más fuerte es la prueba de una relación causal. Sin embargo, la
sola medida de un riesgo relativo alto no prueba causalidad. Para probar causalidad
se requieren otros criterios como los de Bradford Hill, los postulados de Koch, los
criterios de Rothman o los de Evans, entre otros.
7. El RR < 1 indica que existe una asociación negativa, es decir, que no existe factor de
riesgo, que lo que existe es un factor protector.
8. El riesgo relativo no puede utilizarse en los estudios de casos y controles o retrospec-
tivos ya que no es posible calcular las tasas de incidencia. En estos casos se utilizará
la ODDS RATIO.
9. El concepto de riesgo relativo es más difícil de interpretar que el de riesgo absoluto,
y hay que tener en cuenta que cuando se habla de enfermedades, un riesgo relativo
alto en una enfermedad rara no implica que el riesgo absoluto sea alto.
10. Interpretar el riesgo relativo es importante, por ejemplo, un riesgo relativo de 40,
quiere decir que los expuestos tienen cuarenta veces más que los no expuestos la po-
sibilidad de desarrollar la enfermedad o ser un caso.

Ejemplo
De una población de 5000 pacientes, en donde según estudios se ha determinado la can-
tidad de pobladores afectados y no afectados por una epidemia de gripe no común, como
se presentan en el cuadro siguiente:

Gripe no comun Enfermos Sanos Total


Expuestos 1500  500 2000
No expuestos  500 2500 3000
Total 2000 3000 5000

a) Calcular el riesgo relativo de expuestos enfermos


b) Calcular el riesgo relativo de no expuestos enfermos
206 CAPÍTULO 13

c) Calcular el riesgo relativo de expuestos sanos


d) Calcular el riesgo relativo de no expuestos sanos

Solución inciso a)
Entonces la fórmula que aplicaríamos en éste caso para expuestos enfermos, tenemos:
EE 1500
EE + ES 0.75
RR = = 2000 = = 0.45
NEE 500 1.66666
NEE + NES 3000

Solución inciso b)
Entonces la fórmula que aplicaríamos en éste caso para no expuestos enfermos, tenemos:
NEE 500
NEE + NES 3000 1.66666
RR = = = = 2.23
EE 1500 0.75
EE + ES 2000

Solución inciso c)
Entonces la fórmula que aplicaríamos en éste caso para expuestos sanos, tenemos:
ES 500
ES + EE 2000 0.25
RR = = = = 0.30
NES 2500 0.83
NES + NEE 3000

Solución inciso d)
Entonces la fórmula que aplicaríamos en éste caso para no expuestos sanos, tenemos:
NES 2500
NES + NEE 3000 0.83
RR = = = = 3.34
ES 500 0.25
ES + EE 2000

13.5.11 Análisis de supervivencia
Esta medida no queda limitada a los términos de vida o muerte, sino a situaciones en la
que se mide el tiempo que transcurre hasta que sucede un evento de interés, como puede
ser tiempo de recurrencia, tiempo que dura la eficacia de una intervención, tiempo de un
aprendizaje determinado, etc. Por tanto, la supervivencia es una medida de tiempo a una
respuesta, fallo, muerte, recaída o desarrollo de una determinada enfermedad o evento. El
término supervivencia se debe a que en las primeras aplicaciones de este método de aná-
lisis se utilizaba como evento la muerte de un paciente. En las enfermedades crónicas,
tales como el cáncer, la supervivencia se mide como una probabilidad de permanecer vivo
durante una determinada cantidad de tiempo.
La supervivencia al año o a los 5 años, son a menudo expresadas como indicadores
de la severidad de una enfermedad y su pronóstico. Típicamente, el pronóstico del cáncer
se valora determinando el porcentaje de pacientes que sobrevive al menos cinco años
después del diagnóstico. Son muchos los textos que se pueden consultar acerca de la me-
todología estadística a emplear en estudios de supervivencia.
La teoría de la supervivencia en las ciencias médicas tiene como objetivo familiarizar-
se con los conceptos y terminología básica del análisis de supervivencia, conocer cómo
estimar la proporción acumulada de supervivencia, así como los tests estadísticos a em-
plear para comparar dos curvas de supervivencia.
Metodología científica y temas relacionados 207

Conceptos básicos:
La observación de cada paciente se inicia con el diagnóstico (tiempo = 0) y continua
hasta la muerte o hasta que el tiempo de seguimiento se interrumpe. Cuando el tiempo de
seguimiento termina antes de producirse la muerte o antes de completar el período de
observación se habla de paciente “censurado”. El periodo de seguimiento puede terminar
por las siguientes razones:
a) El paciente decide no participar más en el estudio y lo abandona;
b) El paciente se pierde y no tenemos información; y,
c) El estudio termina antes de aparecer el evento.
Cuando los tiempos de supervivencia no se conocen con exactitud, los datos se con-
sideran censurados. No se conoce el tiempo hasta el suceso de interés (muerte, recaída)
porque los individuos en estudio pueden haberse perdido o retirado, o el suceso puede no
haber ocurrido durante el período de estudio. El seguimiento viene definido por una fecha
de inicio y una fecha de cierre que determinan el tiempo de seguimiento.
Las fechas de inicio y cierre son diferentes para cada individuo, pues los pacientes o
personas incluidas en el estudio se incorporan en momentos diferentes. En las observacio-
nes incompletas (censuradas) el evento de interés no se ha producido, ya sea porque el
estudio se finalizó, antes de la aparición del evento, el paciente decide abandonar y no
participar en el estudio, perdemos al paciente por cambio en el lugar de residencia, muer-
te no relacionada con la investigación, etc.
Ejemplo
En el presente cuadro se detallan todas las posibles pérdidas para cada individuo, en un
tiempo determinado después del inicio de la observación.

F
E
D
C
B
A
0 2 4 6 8 10 12

El esquema lo relacionaremos como un estudio temporal para observar los tiempos


de espera para la supervivencia en pacientes que se sometieron a una intervención quirúr-
gica, en donde los círculos representan las pérdidas por diversas causas y los cuadrados
las muertes de éstos pacientes. El eje horizontal representa el tiempo en meses y el eje
vertical la identificación de seis pacientes identificados con las letras A, B, C, D, E, F; para
los cuales hacemos las observaciones siguientes:
El paciente A desaparece del estudio tres meses después de su intervención quirúrgi-
ca, el paciente B fallece a los 2.5 meses, el C sigue vivo al finalizar el estudio en un período
de un año o 12 meses. Al paciente D que se le interviene en el mes 1, fallece en el noveno
mes de estudio. El paciente E al que se le interviene en el mes 2, se pierde en el mes 7, y
208 CAPÍTULO 13

el paciente F que se le interviene en el mes 6, sigue sobreviviendo al acabar el período de


estudio de un año o 12 meses.

EJERCICIOS 13.5
1. Investigadores médicos en Honduras, tomaron una muestra de 4500 personas pro-
pensas a padecer diabetes. Según información de los hospitales públicos en la zona
norte del país, y que según los médicos que atienden los casos de glicemia en dicha
zona, estiman que la prevalencia debido a pruebas de test realizadas con anterioridad
en la muestra tomada por estos investigadores, es de un 27%.
a) Construya la tabla adecuada de pruebas de test;
b) Calcular los valores: Verdaderos Positivos (VP), Verdaderos Negativos (VN),
Falsos Positivos (FP) y Falsos Negativos (FN);
c) Calcule la sensibilidad y especificidad de la prueba.
2. El siguiente cuadro representa la validez de procedimientos simplificados para deter-
minar que niños tienen sospecha de diabetes.

Prueba Prueba Patrón (+) Prueba Patrón (–)


Prueba en Estudio (+) 50 22
Prueba en Estudio (–) 16 212

a) Calcular la sensibilidad
b) Calcular la especificidad
3. Si al completar la tabla del ejercicio anterior tenemos que:

Prueba Prueba Patrón (+) Prueba Patrón (–) Total


Prueba en Estudio (+) 50  22  72
Prueba en Estudio (–) 16 212 228
Total 66 234 300

Si la prevalencia es del 22%, la Sensibilidad del 75.75% y la Especificidad del 90.59%:


a) Calcular el valor predictivo positivo;
b) Calcular el valor predictivo negativo.
4. Con los valores predictivos del ejercicio anterior:

Prueba Prueba Patrón (+) Prueba Patrón (–) Total


Prueba en Estudio (+) 50  22  72
Prueba en Estudio (–) 16 212 228
Total 66 234 300

Calcular:
a) El coeficiente de verosimilitud (CVERO);
b) Los ODDS RATIO;
c) La probabilidad POSTEST para un test positivo; y,
d) La probabilidad POSTEST para un test negativo.
Metodología científica y temas relacionados 209

5. La siguiente tabla presenta los resultados de la exploración y biopsia prostática de


una muestra de pacientes con sospecha de cáncer de próstata.

Resultados de la exploración y biopsia prostática de una muestra


de pacientes con sospecha de cáncer de próstata
Resultado de la biopsia prostática
Resultado del
tacto rectal Patología
Cáncer Total
benigna
Anormal 634 269 903
Normal 487 1251 1738
Total 1121 1520 2641

Determinar:
a) La prevalencia
b) La sensibilidad
c) La especificidad;
d) Los valores de predicción positiva y negativa
e) El coeficiente de verosimilitud
f) Los ODDS RATIO
g) La probabilidad POSTEST, para test positivos
h) La probabilidad de POSTEST, para test negativos
i) El riesgo relativo (RR) del tacto rectal anormal benigno.
210 CAPÍTULO 13
CAPÍTULO

Estimaciones
14
Contenido

14.1 Estimaciones puntuales


14.2 Estimaciones por intervalo e intervalo de
confianza
14.3 Estimación para la media, (muestras grandes)
14.4 Estimación para la media, (muestras
pequeñas y el uso de la distribución t)
14.5 Estimaciones para proporciones (muestras
grandes y pequeñas)
14.6 Determinación del tamaño de una muestra
14.6.1 Fórmulas más utilizadas
14.6.2 Toma de decisiones
212 CAPÍTULO 14

Estimaciones
Permanentemente todo mundo hace estimaciones. Cuando nos preparamos a cruzar una
calle, estimamos la velocidad del automóvil que se acerca, la distancia entre él y nosotros,
y también ambas velocidades. Una vez efectuadas estas estimaciones, decidimos cruzar la
calle o no, y en caso que decidamos hacerlo, pensamos si debemos cruzar en forma rápida
o caminando sin mucha prisa.
En asuntos relacionados a problemas administrativos y de la ingeniería, la mayoría de
profesionales responsables de la conducción y éxito de las instituciones o empresas que
rectoran, recurren a las estimaciones para la toma de decisiones, inclusive bajo las peores
condiciones de incertidumbre.
Este capítulo tiene como objetivo establecer los métodos que nos permitan estimar
con una exactitud razonable parámetros poblacionales de utilidad en la toma decisiones,
así como formular una afirmación sobre el error que posiblemente acompañe a dicha es-
timación, lo que nos permitirá aplicar algunos controles para evitar en lo posible el error.
Mediante esta teoría, en estadística se pueden realizar tres tipos de estimaciones res-
pecto a una población, entre ellas: la estimación puntual, la estimación por intervalo y la
estimación por intervalo de confianza.

14.1  Estimaciones puntuales



La media X de la muestra es el mejor estimador de la media µ de la población. En este

caso, la media X como estimador tiene las características de ser insesgada, congruente,
eficiente y, mientras la muestra sea lo bastantemente amplia, su distribución de muestreo
puede ser aproximada por la distribución normal.

Por otra parte, si conocemos la distribución muestral de X , podemos hacer afirmacio-
nes acerca de cualquier estimación que realicemos con la información obtenida del mues-
treo.
Ejemplo 1
Una compañía de artículos médicos que produce jeringas hipodérmicas desechables, se
envasa en un paquete estéril, y luego se meten en una caja corrugada, conteniendo dicha
caja distintos números de jeringas. Puesto que las jeringas se venden por unidades, la
compañía necesita una estimación del número de las que se incluyen en cada caja para
poder hacer la facturación. Se toma una muestra de 35 cajas al azar y se registra el núme-
ro de jeringas en cada una, según la tabla siguiente:
Resultados de una muestra de 35 cajas de jeringas hipodérmicas (jeringas por caja)

101 103 112 12 98 97 93


105 100 97 107 93 94 97
97 100 110 106 110 103 99
93 98 106 100 112 105 100
114 97 11 102 98 112 99

Con los datos de la presente tabla, calcular la media muestral.


Solución
∑X 3570
X= = = 102 Jeringas.
n 35

Así pues, al emplear como estimador la media X de la muestra, la estimación puntual
de la media µ de la población es de 102 jeringas por caja. Por otra parte, como el precio
de fabricación de una jeringa hipodérmica desechable no es tan costoso, tanto el vende-
Estimaciones 213

dor como el comprador aceptan utilizar ésta estimación puntual como base de la factura-
ción y el fabricante se ahorrará el tiempo y dinero que supone contar cada jeringa que se
mete en la caja.
Ejemplo 2
Con los datos de la tabla del ejemplo 1 o ejemplo anterior, calcule la estimación puntual
de la varianza y la desviación estándar de la población.
Solución
Como el estimador de la varianza de la población está dado por:

∑x2 n (X )
2
365368 35(102)2 1228 ≅
s2 = − = − = 36.12
n −1 n −1 34 34 34
Luego el estimador para la desviación estándar lo calculamos por

s = s 2 = 36.12 ≅ 6.01

En conclusión, la estimación puntual S2 para la varianza σ2 de la población es de 36


jeringas, con una desviación estándar poblacional estimada de 6 jeringas.
Nota: Recuerde que para disminuir el error a cometer o que nuestros estimadores
gocen del criterio de insesgado, tanto para σ2 como para σ, se usaron las fórmulas:
∑ x2 n (X )
2
∑x 2 n (X )2
s2 = − y s= − en vez de:
n −1 n −1 n −1 n −1

∑ ( x − x )2 ∑( x − x)2
s2 = y s=
n n
Estimación puntual de la proporción de la población
La proporción de unidades que poseen una característica particular en determinada po-
blación se representa con P. Si conocemos la proporción de unidades de una muestra que

tienen esa misma característica (denotada por P ), podemos utilizar esta última como es-

timador de P. Por otra parte, puede demostrarse que P tiene todas las propiedades desea-
bles mencionadas anteriormente como criterios de un buen estimador: insesgado, con-
gruente, eficiente y suficiente.
Ejemplo
Supóngase que el jefe del almacén central de la Secretaría de Salud desea estimar el nú-
mero de cajas que contienen medicamentos que llegaron dañadas por el deficiente mane-
jo en el embarque. Si en una muestra de 50 cajas se determina que en todo el viaje el daño

fue de 5 cajas, podremos afirmar que la proporción de la muestra dañada es de P = 0.10.

Para concluir, como P es un buen estimador adecuado de la proporción de la pobla-
ción P, podemos estimar que la proporción de cajas dañadas en la población es de 0.10.

EJERCICIOS 14.1
1. Las siguientes mediciones corresponden a 16 observaciones realizadas a micro orga-
nismos poco comunes en América Central.
0.06 0.24 0.90 0.00 0.31 1.12 0.09 0.45
0.02 0.43 0.83 0.17 0.32 0.00 0.50 0.21
Determine la media muestral de la precipitación o aparecimiento de éstos micro or-
ganismos en América Central.
214 CAPÍTULO 14

2. Un auditórium para médicos y personal de enfermería está considerando la posibili-


dad de ampliar su capacidad de asientos y necesita conocer el número promedio de
personas que asisten a los eventos científicos y su variabilidad de ese número.
Se transcribe la asistencia del número de participantes a los últimos 9 eventos, como
sigue:

88 140 213 79 125 206 163 141 130


Calcule las estimaciones puntuales de la media y la varianza de la población de donde
se extrajo la muestra.
3. La Secretaría de Salud preocupada por la inasistencia del personal técnico en los la-
boratorios en tiempos de emergencia, realizó un muestreo del número de días por
semana en los cuales no se presentan a sus turnos al menos dos técnicos.
Número de días por semana

2 3 2 4 5 3 3 4 5 2 1 1 1 1 2 3 2 3
Determine las estimaciones puntuales de:
a) La media;
b) La desviación estándar;
c) La varianza;

14.2  Estimaciones por intervalo e intervalo de confianza


La estimación por intervalo describe una gama de valores dentro de los cuales probable-
mente se encuentre un parámetro de la población.
En el caso de la estimación por intervalo, en el cual puede encontrarse la media des-
conocida de la población, éste gira en torno al estimador y al error estándar del mismo.
Calculado en la forma siguiente I = X ± σ x ; donde σ x es el error de la media y lo calcu-
laremos por:
σ
a) σ x = para poblaciones infinitas
n
σ N −n
b) σ x = para poblaciones finitas
n N −1

Ejemplo
Se toma una muestra de 50 personas en espera para comprar un producto de escasa fabri-
cación y que esta tiene una media de 13 y una desviación estándar de 5.1
a) Encuentre el error estándar de la media;
b) Establezca una estimación por intervalo alrededor de la media, usando el error están-
dar calculado en el inciso anterior.

Solución inciso a)
Como la población es desconocida e infinita, entonces:
σ 5.1 5.1
σx= = = = 0.7212
n 50 7.0711

Solución inciso b)

X ± σ X = 13 ± 0.7212
= (13 −0.7212, 13 + 0.7212) = (12.2788, 13.7212) = (LI , LS)
Estimaciones 215

Hemos visto que la estimación puntual y la estimación por intervalo, no involucran el


nivel de confianza referente a que el verdadero parámetro poblacional, caerá dentro de
dicho intervalo. Por tanto, en el caso del intervalo de confianza la diferencia será que
aparte del error del estimador también conoceremos el nivel de confianza de predicción.
En estadística, la probabilidad que asociamos a una estimación por intervalo se llama
nivel de confianza.
En una estimación, los niveles de confianza más utilizados son 90, 95 y 99%, pero
podemos aplicar cualquier otro; y también pensar que, a mayor probabilidad, se debe te-
ner más confianza sobre el objetivo y efecto que dicho intervalo tendrá referente al verda-
dero parámetro poblacional.
Para el cálculo de los intervalos y límites de confianza, lo haremos en aplicación a
problemas de la vida real con los datos numéricos a que corresponda, sin embargo, con
frecuencia se suele utilizar expresando la información en errores estándar. Si nuestro pa-
rámetro de interés fuese la media, el intervalo de confianza lo calcularemos de la forma
siguiente:
X ± Zσ x , en donde:
X ± Zσ x Es el límite superior del intervalo de confianza
X ± Zσ x Es el límite inferior del intervalo de confianza

Nota: No debemos confundir que el hecho de usar un alto nivel de confianza, como ser
un 99% en todas las estimaciones, después de todo, un alto nivel de confianza parece sig-
nificar un importante grado de exactitud en la estimación; no obstante, en la práctica esos
niveles de confianza producirán grandes intervalos de confianza y éstos no son precisos,
más bien suelen darse estimaciones muy confusas.
Ejemplo entre nivel e intervalo de confianza:

Pregunta del Repsuesta del Nivel implícito de Intervalo implícito


paciente médico confianza de confianza
¿Podría ser operado Absolutamente
en un año? seguro. Mayor que 99% 1 año
¿Me efectuarán la Estoy seguro que
operación en un mes? se la haremos. Por lo menos 95% 1 mes
¿Se me podría operar Estoy seguro que
en una semana? se la haremos en
ésta semana. Cerca de 80% 1 semana
¿Sería posible ser No estoy seguro
operado mañana? de eso. Cerca de 40% 1 día
¿Podría darse que me Hay pocas
operaran hoy? probabilidades Cerca de 1% 2 horas

Según la tabla anterior, las preguntas y las respuestas establecen una relación directa
entre el nivel y el intervalo de confianza en cualquier estimación. A medida que el pacien-
te establece niveles de confianza cada vez más estrechos, el médico acepta un nivel de
confianza más y más inferior. Nótese asimismo que, cuando el intervalo de confianza re-
sulta demasiado amplio, como el caso de una operación, la estimación puede tener escaso
valor real, aun cuando el médico atribuya un nivel de confianza de 99% a esa estimación.
De manera análoga, si el intervalo de confianza es demasiado estrecho la estimación se
asocia a un nivel de confianza tan bajo (1%) que ponemos en tela de juicio su utilidad.
216 CAPÍTULO 14

EJERCICIOS 14.2
1. Defina el nivel de confianza de una estimación por intervalo.
2. Defina el intervalo de confianza.
3. Si se tienen los siguientes niveles de confianza, exprese los límites inferior y superior

del intervalo de confianza de estos niveles en función de X y σ x .
a) 60%  b) 80%  c) 90%  d) 96%  e) 97%  f) 98%  g) 99%
4. ¿En qué forma puede una estimación ser menos significativa debido a:
a) Un alto nivel de confianza?
b) Un estrecho intervalo de confianza?
5. Si de una población de 1000 personas se toma una muestra de 125, y se sabe que esta
tiene una media de 24.5 con una varianza de 9. Determine el error estándar de la
media.

14.3  Estimación para la media, (muestras grandes)


En matemáticas, como aplicación axiomática a la estadística se consideran muestras gran-
des más de 30 observaciones para un conjunto de datos que puede corresponder a una
muestra o población. No obstante, debe tenerse en cuenta que, en el mundo real al refe-
rirnos a muestras grandes, estas pueden ser de viarios cienes o miles, así también de ma-
nera relativa podemos referirnos a muestras pequeñas que estén por arriba de 30 o sea
cantidades mucho más grandes.

Ejemplo 1
El tratamiento de una afección cutánea con un nuevo medicamento promete períodos
más cortos de tiempo para curar totalmente dicha afección. Un grupo de médicos reúnen
una muestra de 200 pacientes de una población que frecuentemente padecen esta enfer-
medad y descubren que el nuevo medicamento tarda en promedio 10 días, con una desvia-
ción estándar de 1.5 días, hasta que el paciente sane totalmente.
a) Encuentre un intervalo de confianza de 90% para la media;
b) Encuentre un intervalo de confianza de 98% para la media.

Solución inciso a)

Haremos uso de la fórmula X ± Zσ x en donde X = 10 días; σ = 15 días, entonces

σ 1.5 1.5
σX = = = = 0.1061
n 200 14.1421

De la tabla normal se tiene que para un área de 90%, Z = 1.645

Luego X ± Zσ x = 10 ± (1.645)(0.1061) = 10 ± 0.1745

Solución inciso b)
De igual manera se hace uso de la fórmula X ± Zσ x y los mismos datos utilizados en el
inciso anterior, con la diferencia que el único valor que cambia es de Z, ya que el nivel de
confianza ahora es de 98% en vez de 90%, por tanto, de la tabla normal se tiene que para
un área de 98%, Z = 2.33
Luego X ± Zσ x = 10 ± (2.33)(0.1061) = 10 ± 0.2472
Estimaciones 217

EJERCICIOS 14.3
1. En una maquila del sur de Honduras, se toma una muestra de 38 trabajadores de una
población que tiene una desviación estándar de 5.1.
a) Encuentre el error estándar de la media;
b) Establezca una estimación por intervalo alrededor de la media, usando el error
estándar calculado en el inciso anterior.
2. Un maestro del área de matemáticas de la Universidad Católica de Honduras, está
realizando un estudio sobre el peso promedio de los estudiantes de la carrera de ciru-
gía dental. El profesor tomó una muestra de 130 estudiantes, la que generó una media
de 163.4 libras con una desviación estándar de 14.5 libras.
a) Encuentre el error estándar de la media;
b) ¿Cuál es el intervalo alrededor de la media muestral que incluirá la media de la
población 95.5% de las veces?
3. En una población con una varianza de 207, una muestra de 36 personas produce 143
como estimación de la media.
a) Encuentre el error estándar de la media;
b) Establezca una estimación por intervalo que incluya la media de la población
68.3% de las veces.
4. En el Departamento de Olancho, el jefe de mantenimiento de un hospital privado,
está interesado en determinar el número promedio de horas que dura un foco fabrica-
do por la compañía local proveedora. El jefe de mantenimiento toma una muestra de
35 focos y registró que el promedio de duración es de 842 horas y una desviación
estándar de 25 horas.
a) Calcule el error estándar de la media;
b) Construya un intervalo de confianza de 90% para la verdadera media de la pobla-
ción.
5. Al reunir una muestra de 200 en una población, cuya desviación estándar es de 5.23,
se descubre que la media es de 76.3.
a) Encuentre un intervalo de confianza de 90% para la media;
b) Encuentre un intervalo de confianza de 98% para la media.
6. Una muestra de 35 enfermeras se escoge de una población de 360. En la muestra, se
descubre que la media es de 20.9 y que la desviación estándar es de 6.1.
a) Calcule el error estándar estimado de la media;
b) Construya un intervalo de confianza de 96% para la media.
7. Ramiro Sánchez, es el encargado del mantenimiento del ornato de una compleja clíni-
ca de especialidades. A Don Ramiro le preocupa que en los últimos tres años sus 2500
plantas florales hayan sido dañadas por la excesiva lluvia. Al fin de averiguar el daño
causado a sus plantas toma una muestra de 42 y ha observado que la producción pro-
medio es de 24 flores por semana con una desviación estándar de 3 flores por planta.
a) Estime la desviación estándar de la población a partir de la desviación estándar
de la muestra;
b) Estime el error estándar de la media en esta población finita;
c) Construya un intervalo de confianza de 98% para la producción media de los 2500
plantíos de flores;
d) Si el rendimiento promedio de flores por plantío fue de 32 hace 5 años, ¿qué puede
decir Don Ramiro sobre la posible existencia de un daño en el ornato en éste mo-
mento?
218 CAPÍTULO 14

14.4 Estimación para la media,


(muestras pequeñas y el uso de la distribución t)
Matemáticamente al tratarse de muestras pequeñas en estadística, asumiremos éste con-
cepto para cuando el número de observaciones sean menores o iguales que 30. Sin embar-
go, en el mundo real, no debe confundirse que una muestra menor de 30 observaciones es
pequeña o muy pequeña, o que si se tiene una muestra de 35 observaciones esta es lo su-
ficientemente grande, ello genera confusión, pues el tamaño de la muestra no es más que
una de las condiciones que nos llevan a la aplicación de las teorías de la distribución
normal o la distribución t.
La aplicación de la distribución t debe efectuarse bajo las características siguientes:
a) El tamaño de la muestra es 30 o menos;
b) Se desconoce la desviación estándar de la población;
c) Debe suponerse que la población es normal o aproximadamente normal.
La distribución t se debe en honor a W.S. Gosset y se empezaron a efectuar las prime-
ras aplicaciones alrededor del año 1900. Gosset trabajaba para la compañía Guinness
Brewery en Dublín, Irlanda, empresa que no permitía a los empleados publicar los resul-
tados de las investigaciones con sus propios nombres, razón por la cual Gosset decidió
bautizar esta distribución con el nombre de “Distribución t de Student”.

Distribución normal
Distribución t
n = 15

Distribución t
n=5

Gramaticalmente: diríamos que existe una distribución t para cada tamaño de la


muestra. En un lenguaje matemático diríamos: Existe una distribución t para cada uno de
los posibles grados de libertad
Los grados de libertad se definen como el número de valores elegidos libremente.
Supóngase que se está trabajando con dos valores de las muestras a y b, y que sabemos
que tienen una media de 18. Dicha situación puede expresarse por medio de símbolos de
la forma siguiente:
a+b
= 18 , la respuesta es, a y b pueden ser valores cualesquiera cuya suma sea 36.
2
Ahora suponga que nos enteramos que a tiene el valor de 10, entonces b ya no puede
asumir un valor cualquiera, ya que si a = 10,
a+b
= 18     10 + b = 18;   b = 26
2 2
El ejemplo anterior nos indica que cuando existen dos elementos en una muestra y
conocemos la media muestral de ambos, podemos especificar uno de los elementos, pues-
to que el otro está determinado por el hecho de que los dos elementos suman el doble de
la media muestral. En este caso los estadísticos dirían tenemos un grado de libertad. Si
fuésemos incremento el número de elementos terminaríamos concluyendo que el número
Estimaciones 219

de grados de libertad de forma general estarían dados por n – 1, donde n es el tamaño de


la muestra.
En el uso de la distribución t (tabla 2 del apéndice) difiere en su construcción de la
tabla de z, en al menos las tres diferencias siguientes:
1. La tabla de la distribución t es más compacta y muestra las áreas y valores de t para
unos cuantos porcentajes exclusivamente, (10, 5, 2 y 1 por ciento);
2. La tabla de la distribución t no se centra en los valores de probabilidad de que el pa-
rámetro de la población que estamos estimando caiga dentro del intervalo de confian-
za. Por el contrario, mide la probabilidad de que ese parámetro no caiga dentro del
intervalo de confianza, (es decir, de que se encuentre fuera de él);
3. El empleo de la tabla de la distribución t consiste en que hemos de especificar los
grados de libertad con que estamos trabajando.

Ejemplo
La siguiente muestra representa el peso en libras de 8 productos empacados en una em-
presa de envíos en Honduras.
10.3 12.4 11.6 11.8 12.6 10.9 11.2 10.3
a) Encuentre la media para ésta muestra;
b) Estime la desviación estándar de la población;
c) Construya un intervalo de confianza de 98% para la media.

Solución inciso a)
∑X 10.3 +12.4 + 11.6 +11.8 + 12.6 + 10.9 + 11.2 +10.3 91.1
X= = = ≅ 11.3875
n 8 8

Solución inciso b)

∧ ∑ X 2 ∑X∑ X 1042.75 (91.1)(91.1)


σ =S= − = − ≅ 0.874132
n −1 n(n −1) 7 (8)(7)

Solución inciso c) ∧
Utilizaremos la fórmula X ± t σ X y se tiene que X = 11.3875 ; σ = 0.874132 y el error es

∧ σ 0.874132 0.874132
σX = = = ≅ 0.30905
n 8 2.828
Por tanto el intervalo lo construiremos con 7 grados de libertad, y de la tabla t de
Student, se tiene que para una confianza de 98%, t = 2.998
Ahora X ±t σ X =11.3875 ± (2.998)(0.30905) =11.3875 ± 0.9265

EJERCICIOS 14.4
1. Para los siguientes tamaños de muestras y niveles de confianza, calcule los valores
apropiados de t con los cuales se construyen los intervalos de confianza.
a) n = 6; 95%    b) n = 29; 99%   c) n = 16; 95%
d) n = 16; 99%   e) n = 12; 99%
2. Si tenemos los siguientes tamaños de muestra y valores de t usados para construir
intervalos de confianza, encuentre los niveles correspondientes de confianza:
220 CAPÍTULO 14

a) n = 21; t = ± 2.086
b) n = 13; t = ± 1.782
c) n = 8 ; t = ± 2.998
3. Una muestra de 12 observaciones, tiene una media de 6.2 y una desviación estándar
de 10. Construya un intervalo de confianza de 95% para la media de la población.
4. La siguiente muestra de 8 observaciones está tomada de una población infinita con
distribución normal:

10.3 12.4 11.6 11.8 12.6 10.9 11.2 10.3


a) Encuentre la media;
b) Estime la desviación estándar de la población;
c) Construya un intervalo de confianza de 98% para la media.
5. Siete estudiantes fueron muestreados aleatoriamente, y se averiguó que recorrían un
promedio de 39.2 kilómetros por semana a sus centros de estudio, con una desviación
estándar de 3.2 kilómetros por semana. Construya un intervalo de confianza de 95%
para la media de la población.

14.5 Estimaciones para proporciones


(muestras grandes y pequeñas)
Los estadísticos a menudo emplean una muestra para estimar una proporción de ocurren-
cias en una población. Por ejemplo, un director dinámico del Hospital Escuela, puede
estimar mediante un procedimiento de muestreo, la tasa de enfermedades prevenibles o la
proporción de personas que se enferman, por no acatar las prácticas de buena higiene y
medidas de prevención, difundidas a la población nacional por la Secretaría de Salud.
Apoyados en la distribución binomial y las teorías enmarcadas en torna a dicha dis-
tribución, podemos describir dos fórmulas para obtener la media y desviación estándar de
la distribución binomial.

µ = np  y   σ = npq ;
n = Número de ensayos
Donde: p = Probabilidad de un éxito
q = Probabilidad de fracaso que se obtiene tomando 1 – p
En teoría, la distribución binomial es la distribución correcta que ha de utilizarse al
construir los intervalos de confianza, para estimar una proporción de la población.
Por otra parte, podemos representar la media de distribución de muestreo de la pro-
porción de éxitos como:
µ P = P y de manera similar, el error estándar de la proporción podrá representarse
pq
y calcularse mediante σ P =
n
Nota: En el caso de que se desconozca la proporción de la población y los valores son es-
timados a partir de una muestra, el error estándar de la proporción debe representarse
por:
∧ pq
σP =
n
Conociendo el error estándar de la proporción y la media de éxitos en dicha propor-
ción, los intervalos de confianza pueden calcularse mediante las fórmulas siguientes:

a) p ± z σ p (muestras grandes y población infinita)
Estimaciones 221

∧ N −n
b) p ± z σ p (muestras grandes y población finita)
N −1


c) p ± t σ p (muestras menores o iguales a 30, desviación estándar desconocida y la
población es infinita)
∧ N −n
d) p ± t σ p (muestras menores o iguales a 30, desviación estándar descono-
N −1
cida y la población es finita)

Recuérdese que en cualquier problema de estimación en el que el tamaño de la mues-


tra sea 30 o menos y se desconoce la desviación estándar de la población, utilizaremos la
distribución t.
Ejemplo 1
Se toma una muestra de 75 empleados del área de servicio al ciudadano en una institución
pública en el área de salud y se les propone que la atención de servicios al ciudadano se
incrementará en 10 horas más a la semana por turno, y se descubre que solo el 60% están
de acuerdo y un 40% en desacuerdo por la nueva medida.
El director de la institución solicita utilizar la muestra anterior para encontrar un in-
tervalo en el cual se pueda tener una confianza de 99% de que contiene la verdadera pro-
porción de la población de empleados que laboran en la institución pública en mención.
Solución
n = 75; p– = 0.4; q– = 0.4; confianza = 99%;
∧ pq (0.6)(0.4) 0.24
Entonces σ P = = = = 0.0032 = 0.057
n 75 75
Como la muestra es mayor que 30, de la tabla normal para una confianza de 99% el
valor de Z es de 2.58, luego el intervalo de confianza estará dado por:

p ± z σ p = 0.6 ± (2.58)(0.057) = 0.6 ± 0.147 = (LI, LS) = (0.6 – 0.147, 0.6 + 0.147) =
(0.253, 0.547).

Ejemplo 2
En un hospital odontológico de asistencia especial para niños, se toma una muestra de 20
niños, con el objetivo de determinar la proporción de la población infantil que carece de
buenos hábitos en la limpieza diaria y el correcto cepillado de sus dientes, durante sus
primeros diez años de vida. Por otra parte, los médicos estiman que en éste rango de eda-
des y por el domicilio de los pacientes infantes, la media proporcional de buena higiene
bucal es de apenas el 35%. Los médicos de éste hospital están interesados en conocer el
intervalo que contenga la verdadera proporción de la población de niños menores de diez
años con buena práctica de higiene bucal y que éste tenga una confianza de 98%.

Solución
Este problema requiere el empleo de la distribución t, puesto que el tamaño de la muestra
es menor que 30 y se ignora la desviación estándar de la población.
∧ pq (0.35)(0.65) 0.2275
Entonces: σ P = = = = 0.011375 = 0.1066
n 20 20

p ± t σ p = 0.35 ± (2.539)(0.1066) = 0.35 ± 0.2706 = (LI, LS) =
(0.35 – 0.2706, 0.35 + 0.2706) ≅ (0.0794, 0.6206)
222 CAPÍTULO 14

EJERCICIOS 14.5
1. Cuando una muestra de 70 ejecutivos fue entrevistada en lo referente a su desempeño
insatisfactorio en las instituciones públicas, 65% manifestó que esto obedecía a la
falta de equipo y materiales en dichos lugares.
a) Estime el error estándar de la proporción de ejecutivos que atribuyó el bajo desem-
peño a la falta de equipo y materiales;
b) Encuentre los límites superior e inferior de ésta proporción, si se tiene un nivel de
confianza de 0.95.
2. La doctora Gabriela Midence, una psicóloga social, encuesta 150 enfermeras y en-
cuentra que 60% no tienen conocimientos de la aplicación de la regla de tres simple
para el cálculo proporcional de medicamentos según el volumen de masa corporal y
edad del paciente.
a) Estime el error estándar de la proporción;
b) Construya un intervalo de confianza de 99% para la verdadera proporción de en-
fermeras que no saben aplicar la regla de tres simple.
3. Una asociación estudiantil de una universidad pública muestreó 45 libros de textos en
la librería de dicha universidad y descubrió que 60% de ellos tenían un sobreprecio de
más de 50% sobre el costo al mayoreo. Construya un intervalo de la proporción de
libros con ese sobreprecio que ofrezcan una seguridad de 96% de contener la verda-
dera proporción de sobreprecio.
4. Un equipo de psicólogos cree que de los médicos hondureños, no todos alcanzan una
especialidad. Toman una muestra de 200 médicos y se dan cuenta que solo 55%
poseen al menos una especialidad.
a) Calcule el error estándar de la proporción;
b) Construya un intervalo de confianza de 95.5% que contenga la verdadera propor-
ción de los médicos con especialidad.

14.6  Determinación del tamaño de una muestra


En todas las explicaciones que hemos dado hasta ahora, hemos usado el símbolo n para
designar el tamaño de la muestra en vez de un número específico.
Todo profesional en cualquier área siempre que decide realizar una investigación, las
primeras preguntas que se hace son las siguientes: ¿Qué tamaño de la muestra es el ade-
cuado? ¿Cómo puedo determinar una muestra del tamaño mínimo que me sirva a mi in-
vestigación?
Las técnicas de muestreo, el uso de los intervalos de confianza, los criterios de preci-
sión deseados y el control del margen de error a cometer, nos permiten hacer uso de algu-
nas fórmulas para el cálculo del tamaño de una muestra adecuada.
Debe tenerse muy en cuenta, que al trabajar con muestras adecuadas y no con mues-
tras más grandes de lo necesario, o con toda la población, estaremos ahorrando esfuerzos,
reduciendo costos, tiempo y otros factores como ser trabajos tediosos que conllevan a
gastos de toda índole y tareas más onerosas.
Si conocemos el intervalo de confianza podemos hacer uso de él para determinar el
tamaño mínimo de una muestra, la cual servirá para estimar parámetros fundamentales
como la media de la población, entre otros.
Notas:
1. A priori se pueden utilizar fórmulas para poblaciones infinitas como las siguientes:
a) ZσX— = d; donde d es error o número de unidades hacia uno u otro lado del estimador.

b) ZσP— = P (intervalo de confianza para proporciones)
Estimaciones 223

2. Si los datos no son proporcionales y se desconoce la desviación estándar de la pobla-


ción, esta puede estimarse mediante:
6σ = A la diferencia entre el límite superior e inferior (si éste se conoce).
3. Cuando se usan proporciones y no se conoce la verdadera proporción de éxito, use
p = 0.5 y q = 0.5, ya que con éstos valores se obtiene el mayor tamaño de muestra.
4. Si conoce el ancho-error en el cual variará la media o proporción, use ZσX— = mitad
del ancho-error
5. Exprese su respuesta final como n ≥ k, donde k es el valor mínimo o necesario que la
muestra debe tener.
Ejemplo 1
Determine el tamaño necesario de la muestra que permita estimar la verdadera propor-
ción de pacientes satisfechos con las nuevas atenciones en las instituciones de salud del
Estado, dentro de ± 0.05 y un nivel de confianza de 90%. Supóngase que no se tiene una
idea muy clara de la proporción poblacional.
Solución
Como no se conoce la proporción de éxito entonces p = 0.5 y q = 0.5
— —
De la información del problema P = 0.05 y ZσP— = P ZσP— = 0.05
pq
Luego Z = 0.05 , pero por otra parte para una confianza de 90% de la tabla
n
normal el valor de Z es de 1.645, por tanto:
(0.5)(0.5) (1.645) (0.5)(0.5)
(1.645) = 0.05 = 0.05, despejando para n, tene-
n n
mos:
n ≥ 271, en conclusión, el tamaño mínimo de muestra debe ser de 271 pacientes, como
mínimo.
Ejemplo 2
En una investigación sobre temas relacionados al surgimiento de nuevas modalidades
para el consumo de drogas en la década de los 80’s, la desviación estándar de una pobla-
ción en especial es de 15. Encuentre el tamaño necesario de la muestra para estimar la
verdadera media dentro de 10 puntos y un nivel de confianza de 95%
Solución
En este caso el ancho del intervalo es de 10 unidades, por tanto, d = 5 y ZσX— = mitad del
σ
ancho-error ZσX— = 5 Z =5
n
Como σ = 15 y para una confianza de 95% de la tabla normal se tiene que el valor de
Z es de 1.96, entonces:
15 (1.96)(15)
(1.96) = 5; resolviendo para n tenemos n =
n 5
(1.96)2 (15)2 (3.8416)(225)
n≥ = ≅ 34.5744 n ≥ 35
52 25
En conclusión, el tamaño mínimo de la muestra debe ser de 35 observaciones.

14.6.1 Fórmulas más utilizadas para el cálculo del tamaño


de una muestra:
Dependiendo del tipo de poblaciones ya sean éstas finitas o infinitas, a partir de los inter-
valos de confianza podemos establecer fórmulas que nos pueden ayudar a determinar el
224 CAPÍTULO 14

tamaño mínimo de una muestra adecuada a utilizar, entre éstas fórmulas tenemos las si-
guientes:
z 2 pq
a) n = (población infinita con proporción)
d2
z 2σ 2
b) n = (población infinita con datos absolutos)
d2
Nz 2 pq
c) n = 2 (población finita con proporciones)
d (N − 1) + z 2 pq
Nz 2σ 2
d) n = (población finita con datos absolutos)
− 1) + z 2 p 2
d 2 (N
— —
Nota: recuerde que d ≅ X ≅ P (mitad del ancho de clase)

14.6.2 Toma de decisiones
En el caso de la toma de decisiones sobre el tamaño adecuado de una muestra para la
realización de una investigación, a parte de los temas expuestos en los numerales anterio-
res de éste capítulo, deben tenerse en cuenta otros factores como los siguientes:
a) La experiencia del investigador;
b) Consultar especialistas o expertos en estadística;
c) El nivel de tolerancia del error a cometer dependerá de que tan crítico o complejo es
el fenómeno a investigar;
d) Tome una muestra piloto de tamaño razonable con el objeto de obtener los valores de

los estimadores X y S;
e) Utilice histogramas y polígonos de frecuencia para asegurarse de que la población
está distribuida normalmente;
f) Recuerde que, si usted quiere mejorar un intervalo de confianza o trabajar con un
mejor tamaño de muestra, incremente el número de las observaciones;
g) No olvide que incrementar el tamaño de la muestra, éste le genera más costos y tra-
bajo;
h) La decisión sobre el error a tolerar, consúltelo con un experto en el tema.

EJERCICIOS 14.6
1. Si la desviación estándar de la población es 150, encuentre el tamaño necesario de la
muestra para estimar la verdadera media dentro de 90 puntos para un nivel de con-
fianza de 95%.
2. Si tenemos una población con una desviación estándar de 2.1, ¿qué tamaño de la
muestra se necesita para estimar la media de la población dentro de ± 0.36, con una
confianza de 99%?
3. Tenemos fuertes motivos para pensar que la proporción es de 0.8 más o menos. En-
cuentre el tamaño de la muestra necesario para estimar la proporción dentro ± 0.06
con un nivel de confianza de 95%.
4. La gerencia de una empresa textil ha recibido últimamente muchos ataques por los
efectos supuestamente nocivos que su proceso de manufactura ejerce sobre la salud.
Un sociólogo propuso la teoría de que los empleados que mueren de causa natural
muestran una notable uniformidad a lo largo de su vida. Los límites superior e infe-
rior de la duración de su vida difieren en no más de 550 semanas. Para un nivel de
confianza de 98%, ¿de qué tamaño ha de ser una muestra examinada si se quiere cal-
cular la vida promedio de esos empleados dentro de ± 30 semanas.
Estimaciones 225

5. Una tienda que vende bolsas para basura en una pequeña ciudad, ha recibido muchas
quejas respecto a la resistencia de ellas. Parece ser que la bolsa de ésta tienda es más
débil que las que vende un segundo proveedor; por tanto, se rompen más pronto y el
personal de aseo corre riesgos en su salud. El gerente de la tienda en mención quiere
determinar el peso máximo promedio que puede meterse en las bolsas sin que estas
se rompan. Si la desviación estándar que se rompan las bolsas es de 1.2 libras, deter-
mine el número de bolsas que el gerente de la tienda debe probar y que éste tenga una
seguridad de 95% de que el peso de rotura promedio de la muestra se haya dentro de
0.5 libras del promedio verdadero.
6. Un curso de lectura veloz garantiza cierto incremento en la rapidez de lectura en un
plazo de dos días. El maestro sabe que habrá pocos que no logren ese aumento, por
lo cual antes de señalar el incremento garantizado quiere tener una confianza de 95%
de que el porcentaje haya sido estimado dentro de ± 3% del valor verdadero. ¿Cuál es
el tamaño más conservador de la muestra necesario en este problema?
7. Una clínica de rehabilitación quiere obtener una estimación por intervalo para el
número promedio de pacientes que visitan diariamente la clínica en mención. El
doctor Rogelio Maradiaga, médico en jefe de dicha clínica, tiene una seguridad razo-
nable de que la desviación estándar del número diario de pacientes es 15. Ayúdelo a
resolver el problema determinando el tamaño de la muestra que el doctor Maradiaga
debe usar si quiere lograr un intervalo de confianza de 96% para la verdadera media
que tendrá un ancho de 8 pacientes solamente.
226 CAPÍTULO 14
CAPÍTULO

Pruebas de hipótesis para


una sola muestra 15
Contenido

15.1 Introducción y conceptos básicos


15.2 Prueba de hipótesis
15.3 Prueba de hipótesis de medias cuando se
conoce la desviación estándar de la
población
15.4 Prueba de hipótesis de medias cuando no
se conoce la desviación estándar de la
población
15.5 Prueba de hipótesis para proporciones,
(muestras grandes)
228 CAPÍTULO 15

Pruebas de hipótesis una sola muestra


15.1  Introducción y conceptos básicos
Una prueba de hipótesis consiste en una afirmación o conjetura acerca de un parámetro
o parámetros de la población.
Probar una hipótesis es tener la capacidad de poder decidir si se acepta o se rechaza
una afirmación acerca de un valor específico del parámetro de una población.
Existen dos tipos de hipótesis:
a) La hipótesis nula;
b) La hipótesis alternativa.
La hipótesis nula es la que deseamos probar antes de empezar el muestreo. La infor-
mación manifiesta sobre un supuesto que alguien tiene, es el considerado como la informa-
ción a objetar o aceptar referente a los verdaderos parámetros de una población en estudio.
De manera general la hipótesis nula se identifica por H0
La hipótesis alternativa es la que resulta después de tomados los datos de la muestra
y normalmente especifica si el valor del parámetro es diferente, menor o mayor, en com-
paración con el dato o datos hipotéticos.
La hipótesis alternativa se representa por Ha o Hi
1. La hipótesis nula siempre se escribe bajo el supuesto de ser igual al verdadero pará-
metro de la población, como sigue:
H0: µ = µ0
2. La hipótesis alternativa dependiendo de las condiciones establecidas en el problema,
es planteada de la forma siguiente:
Ha: µ ≠ µ0
Ha: µ > µ0
Ha: µ < µ0
3. A µ0 se le conoce como la media hipotética;
4. Cuando se rechaza una hipótesis nula siendo ésta cierta, se comete error tipo I, y su
nivel de significancia se representa por α.
5. El aceptar una hipótesis nula cuando ésta es falsa, se comete error tipo II, y su nivel
de significancia se representa por β.

15.2  Prueba de hipótesis


Para la realización de las pruebas de hipótesis deben seguirse algunos procedimientos de
la forma siguiente:
1. Dibuje la curva de la distribución con la que se está trabajando, e identifique la cola
o colas de acuerdo a las especificaciones del problema.
Prueba para dos colas

Zona aceptación

Zona rechazo Zona rechazo

𝜇H
0
Pruebas de hipótesis para una sola muestra 229

Prueba cola izquierda

Zona rechazo Zona aceptación

𝜇H
0

Prueba cola derecha

Zona aceptación
Zona rechazo

𝜇H
0

2. Reflejados en el numeral anterior, si el estadístico de prueba cae en la región blanca


o no sombreada, acepte H0.
3. Si el estadístico de prueba cae en la región sombreada, rechace H0.
4. Llamaremos valor de significancia al valor numérico de α.
5. Los valores críticos o de frontera, pueden utilizarse con los valores reales enunciados
en el problema original o comúnmente se procede con los datos en forma estandari-
zada (Z), de la manera siguiente:

LI = µ H − Zσ X
a) Datos estandarizados para la media 0

LS = µ H + Zσ X
0

LI = PH − Z σ p
b) Datos estandarizados para proporciones 0

LS = PH + Z σ p
0

Dónde: LI = Límite inferior y LS = Límite superior


6. Si se plantea que Ha: µ ≠ µ0; entonces:
230 CAPÍTULO 15

Datos estandarizados

Zona aceptación

Zona rechazo Zona rechazo

–Z 𝜇H = 0 Z
0

Datos reales
Zona aceptación

Zona rechazo Zona rechazo

𝜇H – z𝜎x– 𝜇H = 𝜇 𝜇H + z𝜎x–
0 0 0

7. Si se plantea que Ha: µ > µ0; entonces:


Datos estandarizados

Zona aceptación
Zona rechazo

𝜇H = 0 z
0

Datos reales

Zona aceptación
Zona rechazo

𝜇H = 𝜇 𝜇H + z𝜎x–
0 0

8. Si se plantea que Ha: µ < µ0; entonces:


Datos estandarizados
Pruebas de hipótesis para una sola muestra 231

Zona rechazo Zona aceptación

–z 𝜇H = 0
0

Datos reales

Zona rechazo Zona aceptación

𝜇H – z𝜎x– 𝜇H = 𝜇
0 0

9. Si los intervalos corresponden a datos estandarizados (Z), el estadístico de prueba


para poblaciones infinitas está dado por:
X − µ H0 P − PH0
a) Z* = y Z* = (muestras grandes)
σX σP
X − µ H0 P − PH0
b) t * = y t* = (muestras pequeñas)
σX σP

Ejemplo
Si el objetivo es aceptar la hipótesis nula de que la media es µ =185, con un 99% de certe-
za cuando esta sea cierta, sabiendo que el tamaño de la muestra es 450.
Haga un diagrama de las regiones de aceptación, rechazo y valores críticos o de fron-
tera, para las siguientes hipótesis alternativas:
a) Ha: µ ≠ 185
b) Ha: µ > 185
c) Ha: µ < 185
Solución inciso a)
Ha: µ ≠ 185
Para una confianza de 99% de la tabla normal y para dos colas, el valor crítico para Z
es de 2.578
Datos estandarizados
Zona de aceptación

Zona de rechazo Zona de rechazo

–2.578 𝜇H = 0 2.578
0
232 CAPÍTULO 15

Solución inciso b)
Ha: µ > 185
Para una confianza de 99% de la tabla normal y para una cola (derecha), el valor
crítico para Z es de 2.33
Datos estandarizados

Zona de aceptación Zona de rechazo

𝜇H = 0 2.33
0

Solución inciso c)
Ha: µ < 185
Para una confianza de 99% de la tabla normal y para una cola (izquierda), el valor
crítico para Z es de –2.33.
Datos estandarizados

Zona de rechazo Zona de aceptación

–2.33 𝜇H = 0
0

EJERCICIOS 15.2
1. Formule una hipótesis nula y una alternativa, para probar que el número de ciudada-
nos que llegan a solicitar un servicio en los establecimientos públicos, es mayor al
70% de la población que conforman dichas comunidades.
2. Describa lo que una hipótesis nula y una hipótesis alternativa suelen representar en
el proceso de una prueba.
3. Defina la expresión nivel de significancia.
4. Defina los errores de tipo I y tipo II.
5. En un juicio, la hipótesis nula señala que un acusado es inocente de cierto crimen.
¿Preferiría el sistema legal cometer un error de tipo I o un error de tipo II?
6. ¿Cuál es la relación existente entre el nivel de significancia de una prueba y el error
de Tipo I?
7. ¿En qué condiciones conviene aplicar la prueba de un extremo? ¿Y una de dos extre-
mos?
8. Si tuviera que decidir que la prueba de un extremo es la adecuada, ¿Cómo determina-
ría si debería ser de extremo inferior o de extremo superior?
Pruebas de hipótesis para una sola muestra 233

15.3  Prueba de hipótesis de medias cuando se conoce


la desviación estándar de la población
En las secciones anteriores, se discutió el uso de la distribución normal o la distribución
t de Student, decisión que se tomaba con base en que el tamaño de la muestra fuese menor
o igual que 30 se consideraba una muestra pequeña, y mayor de 30 observaciones una
muestra grande.
Sin embargo, debemos tener en cuenta que, si se conoce la desviación estándar de la
población, aunque el tamaño de la muestra sea menor o igual a 30, puede utilizarse la
distribución normal. Asimismo, si la desviación estándar de la población fuese descono-
cida, pero el tamaño de la muestra es mayor que 30, también se usará la distribución
normal para la prueba.
Ejemplo 1
Una compañía farmacéutica ha iniciado una promoción especial sobre un nuevo medica-
mento para niños, y piensa que la promoción deberá culminar en un cambio de precio.
Sabe que, antes de comenzar la promoción, el precio promedio para frascos de 250 ml,
era de $ 41.95 con una desviación estándar de $ 5.36. La compañía farmacéutica muestrea
16 farmacias de la ciudad una vez iniciada la promoción y descubre que el precio medio
es ahora de $ 38.95.
En un nivel de significancia de 2%, ¿Existen motivos para pensar que el precio prome-
dio de éste producto ha disminuido?
Solución:
Ha: µ = 41.95
Ha: µ < 41.95
α = 0.02

Datos: σ = 5.36; n = 16; X = 38.95; µH = 41.95
0
Nota: Observe que aunque el tamaño de la muestra es menor que 30, utilizaremos la dis-
tribución normal y no la distribución t de Student, ya que se conoce la desviación están-
dar de la población (σ = 5.36).
σ 5.36 5.36
El error estándar lo calculamos por: σ X = = = ≅ 1.34
n 16 4
Luego el estadístico de prueba lo calculamos por:
X − µ Ho 38.95 − 41.95 −3
Z* = = = ≅ −2.24
σX 1.34 1.34
Para una confianza de 98% o una significancia de 2%, de la tabla normal para una cola
se tiene que el valor crítico de frontera es de –2.05.

Zona de rechazo Zona de aceptación

–2.05 𝜇H = 0
0
Z* = –2.24

Conclusión: Se rechaza H0; y podemos decir que el precio promedio para éste medi-
camento infantil, si ha disminuido.
234 CAPÍTULO 15

Ejemplo 2
Una empleada de servicio al ciudadano en las oficinas de la Cruz Roja afirma que en un
mes cualesquiera se atienden un promedio de 7000 ciudadanos. Un empleado de la Cruz
Roja interesado en la veracidad de dicha información, toma una muestra de 35 ciudada-
nos y determina que el promedio de atenciones es de 7030 con una desviación estándar
muestral de 100 ciudadanos.
En un nivel de confianza de 95%, ¿Puede el empleado concluir que su compañera de
trabajo está equivocada?
Solución
Observe que, aunque no se conoce la verdadera desviación estándar poblacional, pero
como el tamaño de muestra es mayor que 30, para la prueba usaremos la distribución
normal.

Datos: σ =100; n = 35 ; X = 7030; µH0 = 7000
Planteamiento de las hipótesis
H0: µ = 7000
Ha: µ ≠ 7000
α = 0.05 ∧
∧ σ s 100 100 ≅
El error estándar lo calculamos por: σ X = = = = 16.903
n n 35 5.9161
Luego el estadístico de prueba lo calculamos por:
X − µ Ho 7030 − 7000 30 ≅
Z* = = = 1.77
σX 16.903 16.903

Para una confianza de 95%, de la tabla normal para dos colas se tiene que los valores
críticos de frontera son ± 1.96.

Zona de aceptación

Zona de rechazo Zona de rechazo

–1.96 𝜇H = 0 1.96
0
Z* = 1.77

Conclusión: Se acepta H0; a éste nivel de significancia, el empleado no puede decir


que su compañera de trabajo esté equivocada.

EJERCICIOS 15.3
1. Un laboratorio supone que la vida de su equipo más utilizado es de 14,500 horas, con
una desviación estándar de 2,100 horas. El laboratorio muestrea 25 equipos similares
fabricados por la misma compañía y obtiene una media muestral de 13,000 horas. En
un nivel de significancia de 0.01, ¿debe el dueño del laboratorio concluir que la vida
media de los equipos fabricados por ésta compañía, es menor que las 14,500 horas
supuestas?
Pruebas de hipótesis para una sola muestra 235

2. La comisión promedio que cobra una empresa extranjera por dar mantenimiento al
equipo de diálisis renal del Hospital Escuela, es de 144 dólares por componente, con
una desviación estándar de 52 dólares. El administrador del hospital ha extraído una
muestra aleatoria de 121 mantenimientos de la empresa en mención y determinó que
el gobierno pagó una comisión promedio de 151 dólares. En un nivel de significancia
de 0.10, ¿podemos afirmar que las comisiones de la empresa de mantenimiento son
superiores al promedio convenido?
3. El Gobierno de la República a través de oficinas contraloras, todos los meses descu-
bre un promedio de 8 millones de lempiras en pérdidas por la compra de medicamen-
tos con fechas cortas de vencimiento, con una desviación estándar de 5.5 millones de
lempiras. Se toma una muestra de los últimos 64 meses, y la institución gubernamen-
tal responsable de la compra de los medicamentos para los hospitales públicos, refle-
jó una media muestral de 10.5 millones de lempiras en pérdidas por compra de
medicamentos casi vencidos. En un nivel de significancia del 5%, ¿indica esta muestra
que a las autoridades del gobierno central debe preocuparles que el incremento de
pérdidas para el Estado por medicamentos que se compran casi vencidos, haya reba-
sado su nivel histórico?
4. Antes del embargo petrolero de 1973 y de los incrementos posteriores en los precios
del petróleo crudo, el consumo de gasolina en Estados Unidos de Norteamérica ha-
bía crecido a una tasa mensual de 0.57% ajustada a la estación del año, con una des-
viación estándar de 0.10% al mes. En 15 meses escogidos aleatoriamente en 1975 y
1985, el consumo de gasolina aumentó a un porcentaje promedio de apenas 0.33%
por mes. En un nivel de significancia de 0.01. ¿Puede afirmar usted que el crecimien-
to en el consumo de gasolina disminuyó a raíz del embargo y sus consecuencias?
5. Un empleado de recursos humanos de una cadena de farmacias a nivel nacional,
asegura que de las aproximadamente 80 solicitudes que se atendieron para nuevos
empleos en los últimos seis meses del año 2012, en un promedio mensual de 13 y más,
no tenían preparación académica. El director toma una muestra aleatoria de 37 per-
sonas atendidas en los meses de noviembre y diciembre de 2012 en dicho complejo
farmacéutico, y determinó una media de 15 con una desviación estándar de siete (7).
¿Es prudente creer que la aseveración del empleado es correcta?. (Realice su prueba
al nivel de 5%).

15.4 Prueba de hipótesis de medias cuando no se conoce


la desviación estándar de la población
En el caso de que el tamaño de muestra sea menor o igual a 30 y si se desconoce la des-
viación estándar de la población, para la prueba de hipótesis, es más adecuado el utilizar
la distribución t de Student.
Ejemplo 1
En la mayoría de casos, los locales para oficinas de gobierno a nivel nacional, son renta-
dos. La Secretaría de Finanzas en una pequeña ciudad del norte de Honduras, tomó una
muestra de siete locales que reúnen los requisitos para el funcionamiento de una oficina
pública, y encontró que el valor promedio estimado era L. 5,600.00, con una desviación
estándar muestral de L. 400.00.
Pruebe la hipótesis de que, para todos los locales del área, el valor medio es de L.
6,000.00, contra la alternativa de que sea menor de L. 6,000.00. (Use un α = 0.05).
Solución
µH = 6000; —
x = 5600; s = 400; n = 7; α = 0.05
0
236 CAPÍTULO 15

Nota: Observe que el tamaño de la muestra es menor que 30 y en éste caso el verdadero


valor de la desviación estándar poblacional no se conoce, por tanto, para la prueba hare-
mos uso de la distribución t, en vez de la distribución normal. Por otra parte, la prueba se
hará para una cola, en este caso para hacer de la tabla de la distribución t, el valor de α
debe duplicarse, o sea α = 0.10 y el número de grados de libertad son n – 1 = 7 – 1 = 6
grados de libertad.
Las hipótesis deben plantearse como sigue:
H0 : µ = 6000
Ha : µ < 6000
α = 0.10
El error estándar de la media estará dado por:

∧ σ s 400 400
σX = = = = = 151.1887
n n 7 2.6457

Luego el estadístico de prueba lo calculamos por:


X − µ Ho 5600 − 6000 − 400
t* = = = = −2.645
σX 151.1887 151.1887
Para una significancia de 5% y 6 grados de libertad, de la tabla t para una cola se tiene
que el valor crítico de frontera es de –1.943.

Zona de rechazo Zona de aceptación

–1.943 𝜇H = 0
0

t * = –2.645

Conclusión: Se rechaza H0; y podemos decir que el precio promedio de renta es me-
nor a L. 6,000.00

Ejemplo 2
Las autoridades de salud dicen que, en un reportaje de una revista de mucha credibilidad,
se afirma que la glotonería para los pobladores de una ciudad con muchas industrias, les
produce un sobrepeso de 10 kilos aproximadamente. Para probar tal afirmación, un equi-
po de médicos examinó a 18 personas seleccionadas aleatoriamente y descubrió que su
exceso promedio de peso era de 12.4 kilos con una desviación estándar de 2.7 kilos.
En un nivel de significancia de 0.01, ¿Existen razones para dudar de la validez del
valor de 10 kilos?

Solución
Dado que el tamaño de muestra es menor que 30 y la desviación estándar de la población
desconocida, para la prueba haremos uso de la distribución t.
Datos:

µH = 10; X = 12.4; s = 2.7; n = 18; α = 0.01 ; Número de grados de libertad 17
0
Pruebas de hipótesis para una sola muestra 237

Planteamiento de las hipótesis:


H0 : µ = 10
Ha : µ ≠ 10
α = 0.01
El error estándar de la media estará dado por:

∧ σ s 2.7 2.7 ≅
σX = = = = 0.6364
n n 18 4.2426

Luego el estadístico de prueba lo calculamos por:

X − µ Ho 12.4 −10 2.4 ≅


t* = = = 3.771
σX 0.6364 0.6364

Para una significancia de 1% y 17 grados de libertad, de la tabla t para dos colas se


tiene que los valores críticos de frontera son de ± 2.898.

Zona de aceptación

Zona de rechazo Zona de rechazo

–2.898 𝜇H = 0 2.898
0

t * = 3.771

Conclusión: Se rechaza H0; y podemos decir que si existen razones para dudar del
peso de 10 kilos, según lo publicado en la revista.

EJERCICIOS 15.4
1. Si tenemos una media muestral de 15.7, una desviación estándar de la muestra de 6 y
un tamaño de la muestra de 16, pruebe la hipótesis de que el valor de la media de la
población es 17 contra la alternativa de que ésta sea menor. Use un nivel de signifi-
cancia de 0.025
2. Si una muestra de 20 observaciones revela una media muestral de 16 y una varianza
muestral de 2.25, pruebe la hipótesis de que la media de la población es 15, contra la
alternativa de que sea algún otro valor. Use el nivel de significancia de 0.01.
3. El Departamento Administrativo de la Secretaría de Salud tomó una muestra de 7
casas con el objetivo de tomarlos en alquiler para la extensión de servicios de dicha
Secretaría de Estado. El administrador encontró que el valor promedio es de 20000
lempiras con una desviación estándar de 2000 lempiras. Pruebe la hipótesis de que,
todas las casas del área tienen un valor promedio de alquiler mensual de 23000 lem-
piras contra la alternativa de que sea menor que 23000 lempiras. Use un nivel de
significancia de 0.05.
238 CAPÍTULO 15

4. En una muestra de 60 mujeres, tomadas de una población de más de 5000 que se


habían inscrito en un programa de reducción de peso por una cadena de clínicas de
salud en todo el país, la presión sistólica de la muestra es de 101 y su desviación es-
tándar de 42. En un nivel de significancia de 0.02, ¿puede afirmar usted que, en pro-
medio, las mujeres inscritas en el programa tienen una presión sistólica que rebasa el
valor de 75 recomendado por varias asociaciones médicas?
5. Un documental de televisión dedicado a la glotonería afirmó que, en promedio, los
norteamericanos tienen un exceso de peso de 10 libras aproximadamente. Para pro-
bar tal aseveración, se examinó a 18 personas seleccionados aleatoriamente, y se
descubrió que su exceso promedio era de 12.4 libras con una desviación estándar de
la muestra de 2.7 libras. En un nivel de significancia de 0.01, ¿hay razones para dudar
de la validez de ese valor de 10 libras?

15.5 Prueba de hipótesis para proporciones,


(muestras grandes)
Usando las proporciones, también podemos hacer pruebas de hipótesis referente a la
verdadera proporción de una población, sobre la cual queremos inferir acerca de situacio-
nes particulares y atinentes al área de las ciencias administrativas y de la ingeniería.
1. Cuando se conoce el tamaño de la población para el cálculo del estadístico de prueba
pueden utilizarse las fórmulas siguientes:
n − N (pH )
a) Z* = 0
(muestras grandes)
N ( p H ) (q H )
0 0

n − N (pH )
b) t* = 0
(muestras pequeñas y desviación estándar desconocida)
N ( p H ) (q H )
0 0

n = Tamaño de la muestra
N = Tamaño de la población
Donde: pH = p0 = p Proporción de éxito de la población
0
qH = q0 = q Proporción de fracaso de la población
0
2. Para poblaciones infinitas, usaremos las fórmulas siguientes:
p − pH
a) Z* = 0
(muestras grandes)
σP

p − pH
b) t * = 0
(muestras pequeñas y desviación estándar desconocida)
σP
PH = p0 = p Proporción de éxito de la población
0
x
Donde: p = Proporción de éxito de la muestra
n
σ P Error estándar de la población
3. Los valores críticos o de frontera estarán dados por PH ± Z σ P
0

4. Recuerde que el error proporcional de la población (σ P ), lo calcularemos por: σ P =


( pH ) (qH ) ∧ pq
σP = 0 0
oσ P =
n n
Pruebas de hipótesis para una sola muestra 239

Ejemplo 1
Las autoridades de la Dirección Nacional de Tránsito, en una muestra tomada al azar de
una población de 400 accidentes, descubrieron que 128 de ellos se debieron a la fatiga del
conductor.
Utilizar un nivel de significancia de 1% para determinar que las autoridades de trán-
sito, tienen razón de que 35% de los accidentes se debe a la fatiga de los conductores.

Solución
Datos: N = 400; n = 128; α = 0.01; PH = 0.35 y qH = 0.65
0 0
Planteamiento de las hipótesis
H0: P = 0.35
Ha: P ≠ 0.35
Como la muestra es grande (mayor de 30) y la población conocida, para calcular el
estadístico de prueba usaremos la fórmula:
n − N (pH ) 128 − (400)(0.35) 128 − 140 −12
Z* = 0
= = = ≅ −1.26
N ( p H ) (q H ) (400)(0.35)(0.65) 91 9.5394
0 0

Para una significancia del 1% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 2.58

Zona de aceptación

Zona de rechazo Zona de rechazo

–2.58 𝜇H = 0 2.58
0

Z * = –1.26

Conclusión: Se acepta H0; a éste nivel de significancia, las autoridades de tránsito


tienen razón al decir que el 35% de los accidentes se debe a la fatiga de los conductores.
Ejemplo 2
Una oficina de investigaciones varias, aplicó una encuesta a nivel nacional en 6000 fami-
lias y determinó que 335 de ellas asisten a consultas en hospitales o clínicas privadas. Un
estudio más exhaustivo hecho dos años antes por otra organización, revelaba que solo el
5% de las familias asistían a consultas en los hospitales o clínicas privadas. En un nivel de
significancia del 2%, ¿deberá la oficina de investigaciones concluir que actualmente la
demanda de consultas en los hospitales y clínicas privadas, es mayor?
Solución
Datos: N = 6000; n = 335; pH = 0.05; qH = 0.95; α = 0.02
0 0
Planteamiento de las hipótesis
H0: P = 0.05
Ha: P > 0.05
240 CAPÍTULO 15

Muestra es grande (mayor de 30) y población conocida, entonces:


n − N (pH ) 335 − (6000)(0.05) 335 − 300 35
Z* = 0
= = = ≅2.07
N ( p H )(q H ) (6000)(0.05)(0.95) 285 16.882
0 0

Para una significancia de 2% de la tabla normal se tiene que el valor crítico para una
cola está dado por Z = 2.05

Zona de aceptación

Zona de rechazo

𝜇H = 0 2.05
0

Z * = 2.07

Conclusión: Se rechaza H0; a éste nivel de significancia, la oficina de investigaciones


varias puede concluir que la demanda de consultas en hospitales y clínicas privadas, ac-
tualmente no es mayor.
No obstante, en éste caso, debemos ser un tanto prudentes al hacer esta aseveración,
ya que el estadístico de prueba y el valor crítico para el nivel de significancia de 2%, casi
son iguales o se puede decir que la diferencia entre ambos datos es casi insignificante.

Ejemplo 3
Una nutricionista afirma que en Honduras no más de 75% de los niños de preescolar,
tienen dieta deficiente en proteínas. Una muestra de 206 niños reveló que esto es cierto
en 73%. Pruebe su hipótesis en un nivel de significancia de 5%.

Solución
Datos: n = 206; α = 0.05; PH = 0.75; —
p = 0.73 y q— = 0.27
0
Planteamiento de las hipótesis
H0: P = 0.75
Ha: P < 0.75
El error lo calcularemos por:
pq (0.73)(0.27) 0.1971
σP = = = = 0.000956796 ≅ 0.03
n 206 206
Como la muestra es grande (mayor de 30) y la población conocida, para calcular el
estadístico de prueba usaremos la fórmula:

p − pH 0.73 − 0.75 − 0.02


Z* = 0
= = ≅ − 0.67
σP 0.03 0.03

Para una significancia de 5% de la tabla normal se tiene que el valor de frontera o


valor crítico, está dado por Z = —1.645
Pruebas de hipótesis para una sola muestra 241

Zona de rechazo Zona de aceptación

–1.645 𝜇H = 0
0

Z * = –0.67

Conclusión: Se acepta H0; a éste nivel de significancia, la nutricionista tiene razón.

EJERCICIOS 15.5
1. Un ministro de salud pública, sabe que cierta enfermedad prevenible afecta la pobla-
ción de la zona norte en un 19%. Hace poco muestreó 85 familias de la zona sur y
descubrió que esta misma enfermedad en esta región, solo ha afectado a un 14.12% de
sus pobladores. En un nivel de significancia de 0.04, ¿debe el ministro de salud públi-
ca creer que la población de la región norte referente a esta enfermedad, está siendo
menos atendida?
2. De un total de 9700 préstamos otorgados por el INJUPEM a los empleados del sector
gobierno en los últimos 5 años, 350 fueron muestreados para determinar qué propor-
ción fue concedida a las mujeres. La muestra reveló que el 41% de los préstamos se
concedieron a empleadas. Un estudio similar, efectuado hace 5 años, mostró que 35%
de los prestatarios eran mujeres. En un nivel de significancia de 0.02. ¿Puede usted
afirmar que la proporción de préstamos otorgados a las mujeres ha cambiado signifi-
cativamente durante los últimos 5 años?
3. Un fabricante de analgésicos está a punto de decidir si producir un nuevo medicamen-
to de mayor efectividad, al mismo costo y con el mismo volumen de dosificación. El
departamento de investigación de la empresa farmacéutica aplicó una encuesta tele-
fónica a nivel nacional en 6000 familias y averiguó que el nuevo medicamento sería
comprado por 335 de ellas. Un estudio más exhaustivo hecho 2 años antes reveló que
5% de las familias estarían interesadas en adquirir un medicamento similar de mayor
eficacia contra dolores. En un nivel de significancia de 2%, ¿deberá la compañía con-
cluir que en la población hay un mayor interés por el nuevo medicamento?
4. Un fabricante de aparatos electrónicos de la marca RPX que provee a las empresas en
Centroamérica, quiere comparar la confiabilidad de dichos aparatos con los de otra
marca que se expende a nivel Centroamericano. Él sabe que apenas sus clientes le
han reclamado en 15% por defectos de fabricación. Una muestra de 120 clientes reve-
ló que, exactamente 22 de ellos hicieron reclamos por inconformidad con esta clase
de productos. En el nivel de significancia del 0.02, ¿hay evidencia de que los aparatos
electrónicos difieren en la confiabilidad con los de la otra marca que se expenden a
nivel de Centro América?
242 CAPÍTULO 15
CAPÍTULO

Pruebas de hipótesis
para dos muestras 16
Contenido

16.1 Prueba de hipótesis para la diferencia de


medias (muestras grandes)
16.2 Prueba de hipótesis para la diferencia de
medias (muestras pequeñas)
16.3 Prueba para la diferencia entre
proporciones, (muestras grandes)
16.4 Prueba para diferencia entre proporciones
(muestras pequeñas)
16.5 Prueba de las diferencias entre medias con
muestras dependientes.
244 CAPÍTULO 16

Prueba de hipótesis para dos muestras


En algunas situaciones para la toma de decisiones, la gente necesita determinar si los pa-
rámetros se parecen o son diferentes. Por ejemplo, es posible que un fabricante de auto-
móviles quizá necesite saber si un nuevo modelo satisface las expectativas de los clientes
de esa marca, no así en otra fábrica que pueden pensar de manera diferente.
En tal situación, a un investigador, le interesa menos el verdadero valor de los pará-
metros que la relación existente entre los valores de los parámetros, o sea en que difieren
éstos últimos, y puede preguntarse, ¿Reaccionó un grupo de clientes en forma distinta a
como lo hizo otro grupo de los que prefieren esta marca de automóviles?
En la presente sección, introduciremos los métodos que nos permiten contestar inte-
rrogantes como la anterior, mediante procedimientos de una prueba de hipótesis.

16.1 Prueba de hipótesis para la diferencia de medias


(muestras grandes)
Puesto que deseamos estudiar dos poblaciones y no una solamente, la distribución de mues-
treo que nos interesa ahora es la distribución de muestreo de la diferencia entre medias
muéstrales.
La media de la distribución de muestreo de la diferencia entre las medias muéstrales
se representa con µ X − X y es igual a µ X −µ X , o de manera más simple se puede escribir
1 2 1 2
µ1 – µ2. Por otra parte, si µ1 = µ2, entonces µ X −µ X = 0 .
1 2

1. La desviación estándar de la distribución de la diferencia entre las medias muéstrales


recibe el nombre de error estándar de la diferencia entre las medias y:
σ 12 σ 22
Se calcula por: σ X −
X2
= +
1 n1 n2

σ 21 = Varianza de la población 1


σ 2 = Varianza de la población 2
Donde: 2
n1 = Tamaño de la muestra de la población 1
n2 = Tamaño de la muestra de la población 2
2. Si las dos desviaciones estándar de la población no se conocen, haciendo uso de la

información de las muestras, estas pueden ser estimadas, o sea asumir que, σ = s
∧ ∧
∧ σ 12 σ 22
y luego tenemos que el error estimado estará dado por: σ X1 −
X2 = +
n1 n2
3. El estadístico de prueba lo calcularemos por:
( X1 − X2 )− (µ 1 − µ 2 )H
Z* = 0

σX −
X2
1

X1 = media muestral de la población 1


Donde: X 2 = media muestral de la población 2
µ1 = media de la población 1
µ2 = media de la población 2
σ 12 σ 22
σX −
X2
= + = error estándar de la diferencia entre medias
1 n1 n2
4. Las hipótesis deben plantearse de la manera siguiente:
H0: µ1 = µ2
Ha: µ1 ≠ µ2 (Dos colas)
Pruebas de hipótesis para dos muestras 245

Ha: µ1 > µ2 (Una cola (derecha))


Ha : µ1 < µ2 (Una cola (izquierda))
Ejemplo 1
En una investigación se reunieron dos muestras independientes de observaciones. En la
primera muestra de 40 elementos la media fue de 198 con una desviación estándar de 15. La
segunda muestra de 55 elementos tenía una media de 204 y una desviación estándar de 11.
a) Calcule el error estándar de la diferencia entre las medias;
b) Usando un α = 0.01, pruebe si puede considerarse razonable que las dos muestras
provienen de poblaciones que tengan la misma media.

Solución inciso a)
Como los datos son puramente muestrales, el error estándar lo calcularemos mediante la
fórmula:
∧ ∧
∧ σ 12 σ 22 s2 s2 (15)2 (11)2 225 121
σ X1 −X 2 = + = 1 + 2 = + = + = 5.625 + 2.2 =
n1 n2 n1 n2 40 55 40 55
7.825 ≅ 2.797
Solución inciso b)
— — ∧
Datos: X 1 = 198; X 2 = 204; (µ1 – µ2)H = 0; σ X1 −X 2 = 2.797
0

En cuanto a los datos recuerde que estamos asumiendo que las muestras provienen
de poblaciones con la misma media, por eso la diferencia de las medias poblacionales la
consideramos cero.
Planteamiento de hipótesis:
H0: µ1 = µ2
Ha: µ1 ≠ µ2
α = 0.01
El estadístico de prueba:
( X1 − X 2 ) −(µ 1 − µ 2 )H (198 − 204) −0 −6
Z* = 0
= = ≅ −2.14
σ X −X 2.797 2.797
1 2

Para una significancia de 1% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 2.58

Zona de aceptación

Zona de rechazo Zona de rechazo

–2.58 (𝜇1 – 𝜇2)H 2.58


0

Z * = –2.14

Conclusión: Se acepta H0; Los investigadores pueden concluir que las muestras pro-
vienen de poblaciones con la misma media.
246 CAPÍTULO 16

Ejemplo 2
Una Secretaría de Estado está interesada en saber la variación en cuanto a los servicios de
calidad prestados a la ciudadanía. Se toma una muestra de 200 ciudadanos en la Ciudad
de Tegucigalpa, con una media de 8.95 y una varianza de 0.16. En la Ciudad de San Pedro
Sula, una muestra de 175 ciudadanos, genera una media de 9.10 y una varianza de 0.36.
Supóngase que la Secretaría de Estado en mención, desea probar la hipótesis a un
nivel de significancia de 5% de que no hay diferencia en los servicios de calidad prestados
por su personal en ambas ciudades.

Solución
— —
Datos: X 1 = 8.92; X 2 = 9.10; (µ1 – µ2) = 0; n1 = 200; n2 = 175
s12 = 0.16 y s22 = 0.36

Planteamiento de las hipótesis:


H0: µ1 = µ2
Ha: µ1 ≠ µ2
α = 0.05
Como los datos son muéstrales, el error estándar lo calcularemos mediante la fórmula:

∧ ∧
∧ σ2 σ2 s2 s2 0.16 0.36
σ X1 −X 2 = 1 + 2 = 1 + 2 = + = 0.0008 + 0.0021 =
n1 n2 n1 n2 200 175
0.0029 ≅ 0.0538

El estadístico de prueba:

( X1 − X 2 )− (µ 1 − µ 2 )H (8.95 − 9.10) − 0 − 0.15


Z* = 0
= = ≅ − 2.78
σ X −X 0.0538 0.0538
1 2

Para una significancia de 5% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 1.96

Zona de aceptación

Zona de rechazo Zona de rechazo

–1.96 (𝜇1 – 𝜇2)H 1.96


0

Z * = –2.78

Conclusión: Se rechaza H0 ; Las autoridades de la Secretaría de Estado pueden con-


cluir que los servicios de calidad prestados por sus empleados en San Pedro Sula y los
prestados en la ciudad de Tegucigalpa, no son iguales, o sea que exista una mejor o peor
atención en los servicios prestados en Tegucigalpa y San Pedro Sula.
Pruebas de hipótesis para dos muestras 247

EJERCICIOS 16.1
1. Se reunieron dos muestras independientes de observaciones. En la primera muestra
de 40 elementos, la media fue de 198 y la desviación estándar de 15. La segunda
muestra de 55 elementos tenía una media de 204 y una desviación estándar de 11.
a) Calcule el error estándar de la diferencia entre las dos medias;
b) Usando un 𝛼 = 0.01, pruebe si puede considerarse razonable que las dos muestras
provienen de poblaciones que tengan la misma media.
2. Dos laboratorios de investigación han producido independientemente medicamentos
que dan alivio a los que sufren de artritis. El primer fármaco fue probado en un grupo
de 90 pacientes con artritis, dando un promedio de 8.5 horas de alivio con una des-
viación estándar de 1.8 horas. El segundo fármaco fue probado en 80 pacientes con
artritis y produjo un promedio de 7.9 horas de alivio, con una desviación estándar de
2.1 horas. En un nivel de significancia del 5%. ¿Ofrece el segundo medicamento un
período significativamente más corto de alivio?
3. En septiembre de 1985, una compañía distribuidora de combustibles entrevistó 60
estaciones de servicio seleccionadas aleatoriamente, determinando que el precio pro-
medio de la gasolina regular sin plomo en las bombas de autoservicio era de $1.195,
con una desviación estándar de 6.8 centavos de dólar. Tres meses más tarde, otra
encuesta de 90 estaciones de servicio, encontró un precio promedio de $1.158, con
una desviación de 8.5 centavos de dólar. Cuando 𝛼 = 0.02. ¿Cree usted que durante
estos tres meses, hubo un cambio significativo al precio de la gasolina sin plomo en
las estaciones de auto servicio?
4. A la unidad responsable de monitorear la eficiencia de los servicios públicos y priva-
dos en Honduras, le han manifestado que estos servicios de similar condición son
mejores en los centros privados que en los públicos. Bajo una escala especial para la
medición de la eficiencia en la prestación de servicios a la ciudadanía, el director de
la unidad tomó una muestra de 108 ciudadanos que asisten a los centros de servicios
públicos y determinó una media de 24 con una desviación estándar de 5. De la pobla-
ción que asiste a los centros privados tomó una muestra de 120 ciudadanos, la cual
reveló una media de 23 con una desviación estándar de 12. A un nivel de significancia
de 5%, ¿debe concluir el director de la unidad técnica que si hay diferencia en la pres-
tación de servicios en el sector público versus el privado?

16.2 Prueba de hipótesis para la diferencia de medias


(muestras pequeñas)
Si las muestras son pequeñas (menores o iguales a 30), el método utilizado anteriormente
para estimar las desviaciones estándar o las varianzas, no es el adecuado. Basados en
métodos matemáticos como ser el uso de los grados de libertad y en la búsqueda de un
estimador insesgado, el promedio ponderado mediante el cual estaremos buscando el va-
lor de 𝜎2, se le llama estimación combinada o conjunta de 𝜎2, y la calcularemos por la
fórmula siguiente:
(n1 − 1)s12 + (n2 − 1)s 22
s P2 =
n1 + n2 − 2
Por otra parte, si se incorporan estos datos a la fórmula del error estándar de las me-
dias se tiene que:
∧ 1 1
σ X1− X 2 = s P +
n1 n2
248 CAPÍTULO 16

Luego para determinar los valores críticos o de frontera, utilizaremos la distribución


t, con un número de grados de libertad de n1 + n2 – 2, como también el estadístico de
prueba lo representaremos y calcularemos por:

( X1 − X 2 ) −(µ 1 −µ 2 )H
t* = 0

σ X −X
1 2

En el caso del planteamiento de las pruebas de hipótesis, es similar al utilizado en la


sección anterior.
H0: 𝜇1 = 𝜇2
Ha: 𝜇1 ≠ 𝜇2 (Dos colas)
Ha: 𝜇1 > 𝜇2 (Una cola (derecha))
Ha: 𝜇1 < 𝜇2 (Una cola (izquierda))

Ejemplo
En una escala especial para medir el desempeño del personal de una cadena de drogue-
rías, una muestra de 30 empleados tomada en el año 2014, su tasa de rendimiento fue de
7.23% con una desviación estándar de muestra de 0.51%. Un año antes una muestra de 28
empleados tuvo una tasa de rendimiento de 8.36% con una desviación estándar de 0.84%.
A un nivel de significancia de 5% ¿Es razonable concluir que los rendimientos en cuanto
al desempeño del personal, disminuyó durante el año 2014?

Solución
— —
Datos: X 1 = 7.23%; X 2 = 8.36%; n1 = 30; n2 = 28; s1 = 0.51% y s = 0.36
Planteamiento de hipótesis:
H0: 𝜇1 = 𝜇2
Ha: 𝜇1 < 𝜇2
α = 0.05
Estimando de manera conjunta el valor de 𝜎2, tenemos que:
(n1 − 1)s12 + (n2 −1)s 22 (30 − 1)(0.51)2 + (28 −1)(0.84)2 (29)(0.2601) + (27)(0.7056)
s P2 = = =
n1 + n2 −2 30 + 28 −2 56
7.5429 +19.0512 26.5941
= = ≅ 0.475
56 56
Ahora el error lo calculamos por:
∧ 1 1 1 1
σ X1 −X 2 = s P + = (0.6892) + = (0.6892)(0.26277) ≅ 0.811
n1 n2 30 28

El estadístico de prueba:

( X1 − X 2 ) − (µ 1 − µ 2) H (7.23 − 8.36) −0 −1.13


t* = 0
= = ≅ − 6.24
σ X −X 0.1811 0.1811
1 2

Para una significancia de 5% de la tabla t y como la hipótesis alternativa fue planteada


para una cola, entonces el valor de 𝛼 se duplica, luego sí 𝛼 = 0.10 y con un número de
grados de libertad de n1 + n2 – 2 = 30 + 28 – 2 = 56, el valor de frontera o valor crítico,
está dados por t = –1.671
Pruebas de hipótesis para dos muestras 249

Zona de rechazo Zona de aceptación

–1.671 (𝜇1 – 𝜇2)H


0

t * = –6.24

Conclusión: Se rechaza H0; y se puede concluir que los rendimientos en cuanto al


desempeño por parte de los empleados de la empresa en mención, no fue inferior o no
disminuyó en el año 2014.

EJERCICIOS 16.2
1. Para celebrar el primer aniversario, El doctor Raúl Pérez decidió comprarle a su es-
posa unos aretes de diamantes. Le mostraron 9 pares con gemas de marquesa que
pesaban aproximadamente dos quilates cada par. Debido a la diferencia en el color y
calidad de las piedras, los precios variaban de un juego a otro. El precio promedio era
de $ 2900 con una desviación estándar de $ 370. El doctor Raúl Pérez también exa-
minó 6 pares de piedras con forma de pera que tenían aproximadamente el mismo
peso de dos quilates. Estos aretes costaban un precio promedio de $3065, con una
desviación estándar de $805. Basándose en ésta evidencia, ¿puede el doctor Raúl
Pérez concluir a un nivel de significancia de 5%, que los diamantes en forma de pera
cuestan más en promedio que los diamantes de marquesa?
2. Los datos anexos son una muestra aleatoria de 9 empresas privadas y que operan en
el área de salud, y que en el año de 1986 se les investigó sus ganancias promedias por
acción en millones de dólares.
Empresa      1  2  3  4  5  6  7  8  9
Ganancias 1984 1.38 1.26 3.64 3.50 2.47 3.21 1.05 1.98 2.72
Ganancias 1985 2.48 1.50 4.59 3.06 2.11 2.80 1.59 0.92 0.47
a) Calcule el cambio medio de ganancias por acción entre 1984 y 1985;
b) Encuentre la desviación estándar del cambio y el error estándar de la media;
c) ¿Fueron en promedio diferentes las ganancias por acción en 1984 y 1985?, pruebe
su hipótesis a un nivel del 2%.
3. La Contraloría General de la República para compra de equipos informáticos, intere-
sada en un ahorro en la compra de equipos y suministros para oficinas estatales, en-
cuesta nueve distribuidores de computadoras en las grandes áreas metropolitanas y se
les preguntaron los precios de dos impresoras semejantes. El resultado de ésta en-
cuesta se dan a continuación.
Distribuidor    1   2  3   4  5  6  7  8  9
Precio Epson  $350 419 385 360 405 395 389 409 375
Precio Okaydata  $370 425 369 375 389 385 395 425 400
Cuando 𝛼 = 0.05, ¿es razonable afirmar que, en promedio, la impresora Epson cuesta
menos que la impresora Okaydata?
250 CAPÍTULO 16

4. Un club de salud ha estado anunciando un riguroso programa de acondicionamiento


físico. El club sostiene que, al cabo de un mes en el programa, el participante promedio
será capaz de hacer en dos minutos, 8 flexiones más que las que podía hacer al inicio
del programa. Se tomó la siguiente muestra de 10 participantes de manera aleatoria.
Participantes  1 2 3 4 5 6 7 8 9 10
Antes  38 11 34 25 17 38 12 27 32 29
Después  45 24  41 39 30 44 30 39 40 41
¿Apoya usted la afirmación del club? Use un nivel de significancia de 0.025.
5. Una organización que presta servicios de ambulancia en Honduras, interesada en
adquirir vehículos con mayor rendimiento en el consumo de combustible, selecciona
varios modelos de automóviles y evalúa su ahorro de combustible. En el estudio de
ese año sobre dos modelos todo terreno, el millaje promedio de 12 automóviles de la
marca A, fue de 27.2 millas por galón, con una desviación estándar de 3.8 mpg. Las 9
unidades de la marca B que fueron probados arrojaron un promedio de 32.1 mpg, con
una desviación estándar de 4.3 mpg. A un nivel de significancia de 0.01, ¿debe llegarse
a la conclusión que los automóviles de la marca B tienen un ahorro de combustible
mayor que los de la marca A?

16.3 Prueba de hipótesis para la diferencia entre proporciones


(muestras grandes)
De igual manera que las medias, la diferencia entre proporciones es muy utilizada para
determinar la diferencia proporcional entre dos conjuntos distintos.
En esta sección, el error estándar de la diferencia entre dos proporciones lo calcula-
remos por:
p1q 1 p 2q 2
σ P −P = +
1 2 n1 n2

En el caso que no se conozcan los parámetros p1, p2, q1 y q2, en consecuencia necesi-
tamos estimarlos a partir de los estadísticos muéstrales p—1; p—2; q—1 y q—2. Asimismo, podría-
mos suponer que la fórmula más adecuada a utilizar es:
∧ p 1q 1 p 2 q 2
σ P1−P2 = +
n1 n2
Por otra parte, debemos tener en cuenta que, si no existe diferencia entre las dos
proporciones de la población, nuestra mejor estimación de la proporción global de la
población de éxitos, probablemente sea la proporción combinada de éxitos en ambas
muestras, entonces:
∧ (n1)( p 1) + (n2 )( p 2 )
p= ; Luego se tiene que:
n1 + n2
∧∧ ∧∧
∧ pq pq
σ P1 −P2 = +
n1 n2
Por último, el estadístico de prueba lo calcularemos por:
( p 1 − p 2) − ( p1 − p 2 )H
Z* = 0

σp
1 −p 2
Pruebas de hipótesis para dos muestras 251

Ejemplo 1
Como parte de la preparación sobre los incrementos salariales y beneficios que periódica-
mente solicitan los empleados de los hospitales públicos, el sindicato hizo una investiga-
ción entre sus afiliados para determinar si existe una preferencia por un aumento grande
en el beneficio del retiro o un menor incremento al salario.
En un grupo de 1000 trabajadores de sexo masculino que fueron consultados, 750 es-
taban a favor de un aumento en los beneficios del retiro. De 500 trabajadores del sexo fe-
menino entrevistados, 405 estuvieron a favor en el aumento para los beneficios del retiro.
a) Estimar P;
b) Calcule el error estándar de la diferencia entre estas proporciones;
c) Pruebe la hipótesis de igual proporción de hombres y mujeres que están a favor de un
aumento en los beneficios del retiro. (Use 𝛼 = 0.05)

Solución inciso a)
750 405
Datos: n1 = 1000; n2 = 500; p 1 = = 0.75; p 2 = ≅ 0.81 ;
1000 500
∧ (n )( p ) + (n2)( p 2) (1000)(0.75) + (500)(0.81)
p= 1 1 = ≅ 0.77
n1 + n2 1000 + 500

Solución inciso b)

Del inciso anterior tenemos que p = 0.77;
∧ ∧
Entonces q = 1 −p = 1 − 0.77 = 0.23, luego el error estándar estará dado por:
∧∧ ∧∧
∧ pq pq (0.77)(0.23) (0.77)(0.23)
σ P1 −P2 = + = + ≅ 0.023
n1 n2 1000 500

Solución inciso c)
Planteamiento de las hipótesis
H0: p1 = p2
Ha: p1 ≠ p2
α = 0.05
Cálculo del estadístico de prueba
( p 1 − p 2 ) −( p1 − p 2 )H (0.75 − 0.81) − 0
Z* = 0
= = −2.61
σp −p 2 0.023
1

Para una significancia de 5% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 1.96

Zona de aceptación

Zona de rechazo Zona de rechazo

–1.96 (p1 – p2)H 1.96


0

Z * = –2.61
252 CAPÍTULO 16

Conclusión: Se rechaza H0; las proporciones de los trabajadores de los hospitales


públicos, entre mujeres y hombres a favor del aumento de los beneficios del retiro, no son
iguales.

Ejemplo 2
Un laboratorio de investigación científica prueba dos nuevas sustancias con que se preten-
de reducir la presión sanguínea. Las sustancias se administran a dos distintos conjuntos
de animales de laboratorio. En el grupo 1, 71 de 100 animales sometidos a prueba respon-
den al fármaco 1 reduciendo la presión sanguínea. En el grupo 2, 58 de 90 animales res-
ponden al fármaco 2 disminuyendo la presión sanguínea. El laboratorio quiere probar en
un nivel de significancia de 0.05, si hay diferencia entre la eficacia de ambos fármacos.

Solución
71 58
p1 = = 0.71; q1 = 0.29; p2 = = 0.644; q 2 = 0.356
100 90
n1 = 100; n2 = 90

Planteamiento de las hipótesis


H0: p1 = p2 (No hay diferencia entre los dos fármacos)
Ha: p1 ≠ p2 (Existe diferencia entre los dos fármacos)
α = 0.05
Calculando el error estándar de las proporciones:

∧ p 1q 1 p 2 q 2 (0.71)(0.29) (0.644)(0.356)
σ P1 −P2 = + = +
n1 n2 100 90
= 0.002059 + 0.0025474 = 0.0046064 ≅ 0.06787

Cálculo del estadístico de prueba

( p 1 − p 2) − ( p1 − p2 )H (0.71− 0.644) − 0
Z* = 0
= = 0.97
σp −p 2 0.06787
1

Para una significancia de 5% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 1.96

Zona de aceptación

Zona de rechazo Zona de rechazo

–1.96 (p1 – p2)H 1.96


0

Z * = 0.97

Conclusión: Se acepta H0; no hay diferencia entre los dos fármacos.


Pruebas de hipótesis para dos muestras 253

EJERCICIOS 16.3
1. Dos áreas de una gran ciudad están siendo consideradas como sedes de centro de
atención diurna. De 200 familias entrevistadas en una sección, la proporción en que
la madre trabajaba a tiempo completo fue de 0.52. En la otra sección, 40% de las 150
familias entrevistadas tenían madres que trabajaban en empleos de tiempo completo.
En un nivel de significancia del 0.04, ¿existe una diferencia significativa en la propor-
ción de madres que trabajan en las dos áreas de la ciudad?
2. Los ingenieros ambientalistas y técnicos de una planta eléctrica alimentada por car-
bón, están estudiando la posibilidad de instalar dos sistemas diferentes de anticonta-
minación. El primero ha reducido la emisión de contaminantes a niveles aceptables
68% de las veces, determinados en 200 muestras de aire. El segundo sistema, más
costoso, ha disminuido las emisiones a niveles aceptables en 76% de las veces, deter-
minadas con 250 muestras de aire. Si el sistema caro es significativamente más eficaz
en la reducción de contaminantes a niveles aceptables, la gerencia de la planta eléc-
trica instalará el primer sistema. ¿Qué sistema será instalado si la gerencia se vale de
un nivel de significancia de 2% al tomar su decisión?
3. Los pobladores de una gran ciudad dicen que los análisis médicos de los hospitales
públicos son mejores que los análisis realizados por centros médicos privados. El
Colegio Médico interesado en verificar dicha aseveración, tomó una muestra de 200
personas que requieren de los servicios de los hospitales públicos y el 92% manifestó
estar satisfecho por este servicio. De 206 personas muestreadas que asisten a los
centros médicos privados para la realización de análisis, solo el 89% manifestó estar
conforme con la calidad del servicio. A un nivel de significancia del 0.01, ¿puede el
Colegio Médico respaldar la aseveración de los pobladores?
4. Un grupo de médicos clínicos está efectuando pruebas con algunos pacientes para de-
terminar la eficiencia de un nuevo antihipertensivo. Un grupo de enfermos con hiperten-
sión fueron elegidos al azar y luego fueron asignados aleatoriamente al grupo de control
(que recibía un antihipertensivo bien probado) o al grupo experimental (que recibía el
nuevo fármaco). Los médicos anotaron el porcentaje de pacientes cuya presión sanguí-
nea se redujo a un nivel normal en el lapso de un año. En un nivel de significancia de
0.01, pruebe las hipótesis apropiadas para comprobar si el nuevo medicamento es signi-
ficativamente más eficaz que el anterior para reducir la hipertensión.

Proporcion Número
Grupo que mejoró de pacientes
Experimental 0.45 120
De control 0.36 150

16.4 Prueba de hipótesis para la diferencia


entre proporciones (muestras pequeñas)
Cuando el tamaño de las muestras sea menor o igual a 30 y si se desconoce la desviación
estándar poblacional, haremos uso de una distribución más adecuada como lo es la distri-
bución t, para lo cual el estadístico de prueba se calculará por:
( p 1 − p 2) − ( p1 − p2 )H
t* = 0

σp −p 2
1

El cálculo del error estándar para la diferencia de proporciones se hará de manera


similar que en la sección anterior. De igual manera, deben manejarse las mismas condi-
254 CAPÍTULO 16

ciones para el planteamiento de las hipótesis, las estimaciones de los parámetros pobla-
cionales y el manejo de los grados de libertad necesarios recomendados para el manejo
del tema.

Ejemplo
En la Universidad Nacional Autónoma de Honduras, UNAH, una muestra de 25 catedrá-
ticos varones, reflejó que el 75% tienen al menos una especialidad (maestría o doctorado).
Una segunda muestra de 28 catedráticos mujeres mostró que solo el 68% tienen al menos
una especialidad. El rector de la UNAH desea efectuar la prueba de hipótesis a un nivel
de 5% de que los catedráticos varones superan a las mujeres catedráticas en sacar una es-
pecialidad después de graduados en el pre grado.

Solución
Datos:
p1 = 0.75 q1 = 0.25 n1 = 25
p2 = 0.68 q2 = 0.32 n2 = 28
Número de grados de libertad = n1 + n2 – 2 = 25 + 28 – 2 = 51
Planteamiento de las hipótesis
H0: p1 = p2 ( No hay diferencia entre la proporción de catedráticos varones y catedrá-
ticos mujeres en obtener una especialidad)
Ha: p1 > p2 (En cuestiones de especialidades la proporción de catedráticos varones
es mayor que la proporción de catedráticos mujeres)
α = 0.05
Calculando el error estándar de las proporciones:
p1q 1 p 2q 2 (0.75)(0.25) (0.68)(0.32)
σ P −P = + = + = 0.0075 + 0.00777 =
1 2 n1 n2 25 28
0.01527 ≅ 0.1236
Cálculo del estadístico de prueba
( p1 − p 2) − ( p1 − p 2)H (0.75 − 0.68) − 0
t* = 0
= ≅ 0.566
σp −p 2 0.1236
1

Para una significancia de 5% y para una cola, se duplica el valor de 𝛼, de 0.05 a 0.10
(𝛼 = 0.10). De la tabla t, con 51 grados de libertad se tiene el valor de frontera o valor
crítico, y que es t = 1.671

Zona de aceptación

Zona de rechazo

(p1 – p2)H 1.671


0

t * = 0.566

Conclusión: Se acepta H0; La proporción de catedráticos varones no es mayor que la


proporción de mujeres catedráticas en la obtención de especialidades después de graduar-
se en pregrado.
Pruebas de hipótesis para dos muestras 255

EJERCICIOS 16.4
1. Una aspirina de lenta absorción perdió hace poco su preferencia en el mercado ante
un nuevo fármaco. Este nuevo fármaco anuncia en su publicidad que su marca pene-
tra en la corriente sanguínea más rápidamente que la aspirina de lenta absorción. El
laboratorio productor de aspirinas preocupado por dicha aseveración, le interesa pro-
bar que no existe diferencia en la absorción de ambos medicamentos en la sangre de
los pacientes. Toma una muestra de 9 personas y se les suministra la aspirina de lenta
absorción, 3 minutos después el 85% manifiesta que el dolor de cabeza ha desapare-
cido. En una segunda muestra de 10 personas se suministra el nuevo fármaco y 3
minutos más tarde, solo el 83% manifiesta el desaparecimiento de la cefalea. Realice
su prueba a un nivel de 2%. ¿Cuál es su conclusión?
2. Los pacientes creen que los medicamentos vía intravenoso son de alivio más rápido
que los que se usan vía oral. Un médico interesado en comprobar esta percepción,
entrevista un grupo de 15 pacientes tratados por enésima vez para una enfermedad en
particular, con medicamentos vía oral, el 80% manifestó que el alivio fue más lento,
contra un 94% que manifestaron haber percibido un alivio más rápido cuando fueron
tratados de manera intravenosa para la misma dolencia n1 = n2. Lleve a cabo su prue-
ba a un nivel de 5% de significancia. Establezca su conclusión.
3. Un psicólogo preocupado porque en la actualidad los jóvenes que estudian medicina
lo hacen por decisión caprichosa de sus padres ya que estos desean que su hijo o hija
se gradúe de médico, y no porque estos jóvenes tengan la actitud condicionante para
el desempeño de esta profesión. El psicólogo toma una muestra de 25 médicos gra-
duados hace 30 años, y descubre que el 96% cumplen con las pruebas actitudinales
que la profesión requiere. De 28 estudiantes en la actualidad evaluados con las mis-
mas pruebas, solo 65% tienen vocación para estudiar la carrera de medicina. Al nivel
de significancia de 4%, ¿puede el psicólogo respaldar su percepción?

16.5 Prueba de la diferencia entre medias


con muestras dependientes
En los ejemplos de las secciones anteriores, las muestras fueron escogidas de manera in-
dependiente entre ellas. A menudo el muestreo de muestras dependientes o pareadas, nos
permitirá efectuar un análisis más preciso, pues entonces podremos controlar los factores
extraños. Con muestras dependientes seguiremos todavía el mismo procedimiento básico
que aplicamos en la prueba de hipótesis. Las únicas diferencias estriban en que no usare-
mos una fórmula diferente con el error estándar estimado de la diferencia de la muestra y
que ambas muestras deberán ser del mismo tamaño.

Ejemplo
Un gimnasio anuncia un programa de reducción de peso, afirmando que el participante
promedio del programa pierde como mínimo 17 libras. Una persona con sobre peso inte-
resada en el programa, pero un tanto escéptico ante tales afirmaciones, pide pruebas al
gimnasio en mención. Los responsables del gimnasio le permiten seleccionar aleatoria-
mente los expedientes de 10 participantes y registrar su peso antes y después del progra-
ma. Los datos aparecen en la tabla siguiente:
Pesos en libras antes y después del programa de reducción de peso.

Antes 189 202 220 207 194 177 193 202 208 233
Después 170 179 203 192 172 161 174 187 186 204
256 CAPÍTULO 16

La persona interesada quiere probar en un nivel de significancia de 5%, la supuesta


pérdida promedio de peso de 17 libras como mínimo.
Solución
Planteamiento de hipótesis:
H0: 𝜇1 – 𝜇2 = 17
Ha: 𝜇1 – 𝜇2 > 17
α = 0.05
Desde el punto de vista conceptual, lo que tenemos no son dos muestras de los pesos
antes y después de la intervención en el programa, sino más bien una muestra de las pér-
didas de peso. Si la población de dichas pérdidas tiene una media 𝜇e, podemos reformular
nuestras hipótesis de la manera siguiente:
H0: 𝜇e = 17
Ha: 𝜇e > 17
Ahora calcularemos las pérdidas individuales, su media y desviación estándar, y pro-
cedemos exactamente como lo hicimos cuando probamos las hipótesis relativas a una
sola media. Los cálculos se efectúan a continuación:

Pérdida Cuadrado de la perdida


Antes Despues x x2
189 170 19 361
202 179 23 529
220 203 17 289
207 192 15 225
194 172 22 484
177 161 16 256
193 174 19 361
202 187 15 225
208 186 22 484
233 204 29 841

∑x =197 ∑x2 = 4, 055


∑x ∑x2 n ( x)
2

x= s= −
n n −1 n −1
197 4055 (10)(19.7)2
= =19.7 = −
10 9 9
= 19.34 ≅ 4.3977

Ahora ya podemos estimar el error estándar de la media:



∧ σ 4.3977
σx= = = 1.39
n 10

El estadístico de prueba, (recuerde que haremos uso de 9 grados de libertad para la


tabla t, en una sola cola (cola superior).
Pruebas de hipótesis para dos muestras 257


t* = µ H + tσ x = 17 + 1.833(1.39) = 19.55 Libras; límite superior.
0

Zona de aceptación

Zona de rechazo

𝜇H = 17 19.55
0

x– = 19.70

Conclusión: Se rechaza H0; la persona interesada puede concluir que la supuesta


pérdida de peso atribuible al programa no es cierta.
Nota: Recuerde que cuando se usan datos no estandarizados el estadístico de prueba para
medias, es la media muestral.

EJERCICIOS 16.5
1. Los siete empleados de una agencia de investigaciones científicas que utilizaron nue-
vas técnicas en sus trabajos, calificaron sus resultados en una escala de 0 a 20, donde
0 significa que las nuevas técnicas de investigación no produjeron ningún efecto sig-
nificativo y 20 la manifestación de ser efectivas en 100%.
Empleado      1   2   3   4   5   6   7
Antes      15  18  20  20  16  14  18
Después     14  18  19  19  17  15  16
A un nivel de significancia de 5%, ¿cree usted que las nuevas técnicas de investigación
produjeron resultados más efectivos?
2. Un psiquiatra está tratando desde hace 2 semanas a 10 de sus pacientes con un nuevo
medicamento para el cual, el fabricante asegura bajar los niveles de desorden mental
con mayor rapidez que los utilizados tradicionalmente.
Antes   89  85  90  78  94  77  93  85  83  84
Después     70  79  86  77  72  61   74   71  77  71
A un nivel de significancia de 2%, ¿Está el fabricante del nuevo fármaco diciendo la
verdad?
3. En una escala de 0 a 10, la gerencia de recursos humanos del Instituto Nacional del
Tórax, mide el nivel de rendimiento de su personal que asiste a pacientes internos
afectados por enfermedades cardio-pulmonares, con el objetivo de verificar, si des-
pués del incremento salarial como un incentivo, este mejoró el nivel de desempeño en
los empleados de dicho hospital. Se seleccionan 15 empleados y durante una semana
se mide su desempeño, respecto al mostrado antes del incremento salarial.
258 CAPÍTULO 16

Antes    8  5  9  7  9  7  9  5  8  8  7  6  6  5  7
Después  7  9  8  7  7  6  7  7  9  9  7  7  8  7  9
A un nivel de significancia de 5%, ¿pueden las autoridades del Instituto Nacional del
Tórax confirmar que el desempeño del personal asignado a las salas de pacientes internos
después del incremento salarial, ha mejorado?
CAPÍTULO

17
La distribución
Ji-Cuadrada y el
análisis de varianza

Contenido

17.1 Introducción
17.2 Ji-cuadrada como prueba de independencia
17.3 Ji-cuadrada como prueba de bondad de
ajuste
17.4 Análisis de varianza
17.5 Inferencia sobre una varianza de población
17.6 Inferencia sobre la varianza de dos
poblaciones
260 CAPÍTULO 17

La distribución Ji-Cuadrada y el análisis de varianza


17.1 Introducción
En el capítulo anterior, examinamos la diferencia existente entre dos medias o dos propor-
ciones. No obstante, imaginémonos que quisiéramos hacer comparaciones entre tres o
más proporciones poblacionales, con el objetivo de inferir si éstas son iguales o presentan
alguna diferencia significativa. En éste caso, los métodos aplicados en el capítulo 14 no
funcionarían para comparar tres o más proporciones de poblaciones, razón por la cual, es
recomendable hacer uso de distribuciones más adecuadas como lo es la distribución Ji
Cuadrada, la cual no simplemente sirve para probar la igualdad de varias proporciones, ya
que con dicha distribución podemos hacer muchas cosas más, relacionadas al tema.
Por ejemplo, si clasificáramos una población en diversas categorías respecto a dos
atributos (como ser: edad y rendimiento en el trabajo), podemos aplicar una prueba de
este tipo para determinar si ambos atributos son independientes entre sí.
Los profesionales de todas las áreas enfrentan situaciones en donde conviene verifi-
car la igualdad de más de dos medias de población. Por otra parte, es evidente que, en las
ciencias biológicas, la medicina o la salud, no siempre nos interesarán las medias y las
proporciones. Hay muchos problemas en las áreas en mención en que queremos conocer
la variabilidad o varianza de una población, lo que llevaremos a cabo más adelante en el
presente capítulo. En el caso de comparar las varianzas de dos poblaciones lo haremos a
través de la distribución F, siempre en éste capítulo.

17.2  Ji-cuadrada como prueba de independencia


Muchas veces los profesionales de las ciencias médicas o en el área de la salud, o cual-
quier persona relacionada con investigaciones en dichas áreas, necesitan saber si las dife-
rencias que observan entre varias proporciones muestrales son significativas o si solo se
deben a una mera casualidad, o sí las muestras presentan dependencia entre sí, o si son
totalmente independientes.

Tablas de contingencia
Supóngase que, en cuatro regiones de Honduras, una Secretaría de Estado muestrea las
actitudes que sus empleados tienen ante las evaluaciones del desempeño del trabajo. A los
empleados se les da la opción de elegir entre el método actual (dos evaluaciones por año)
y un nuevo método propuesto de llevar a cabo evaluaciones trimestrales.
La siguiente tabla, que recibe el nombre de “tabla de contingencia” contiene la res-
puesta dada a ésta pregunta, según la muestra estudiada.

Preferencia Zona Zona Zona Zona


de metodo Norte Occidental Centro Sur Oriental Total
Método actual 68 75 57 79 279
Nuevo método 32 45 33 31 141
Total 100 120 90 110 420

Frecuencias observadas y esperadas


A partir de una tabla de contingencia se puede construir otra tabla estadística conocida
como “tabla de frecuencias observadas y frecuencias esperadas”
Por ejemplo, la Secretaría de Salud puede comparar los casos de dengue clásico y
dengue hemorrágico, registrados en la zona rural y zona urbana, de la manera siguiente:
La distribución Ji-Cuadrada y el análisis de varianza 261

Registros efectuados durante el primer trimestre del año 2012:


Zona Urbana:
Dengue clásico 645 casos
Dengue hemorrágico 54 casos
Zona Rural:
Dengue clásico 218 casos
Dengue hemorrágico 23 casos

La información anterior corresponde a las frecuencias observadas, debemos calcular


las frecuencias esperadas de la manera siguiente:

RT × CT
fe = ;
n

RT = Total de observaciones para el renglón que contiene la celda nominada;


Donde: CT = Total de observaciones para la columna que contiene la celda nominada;
n = Número total de observaciones

Zonas
Enfermedad Frecuencia Urbana Rural Total

Dengue fo 645 218 863


clásico fe 641.74 221.26

Dengue fo 54  23  77


hemorrágico fe 57.26  19.74
Total   699 241 940

Observe que para el dengue clásico las frecuencias esperadas fueron calculadas por:

RT × CT (863)(699) ≅
fe = = 641.74
n 940
RT × CT (863)(241) ≅
fe = = 221.26
n 940
En cuanto a las frecuencias esperadas del dengue hemorrágico tenemos:

RT × CT (77)(699) ≅
fe = = 57.26
n 940
RT × CT (77)(241) ≅
fe = = 19.74
n 940
Uso de la prueba Ji-cuadrada con tablas de contingencia
1. El estadístico de prueba se calcula por:

χ2 =∑
( f o − fe ) 2
fe
262 CAPÍTULO 17

2. La gráfica Ji-cuadrada con 10 grados de libertad tiene las características siguientes:

Zona de aceptación

Zona de rechazo Zona de rechazo

𝜒 2L 𝜒 2U

3. En la mayoría de casos las pruebas con Ji-cuadrada se hacen con cola derecha.
4. Al usar tabla de contingencias el número de grados de libertad está dado por ngl =
(r − 1)(c − 1); donde r es el número total de renglones y c el número total de colum-
nas.
5. las hipótesis se plantean de la manera siguiente:
a) Para medias

H o : µ 1= µ 2 = µ 3 =,..., = µ n
H a : µ 1≠ µ 2 ≠ µ 3 ≠, ..., ≠ µ n

b) Para proporciones

Ho : P1 = P2 = P3 =, ..., = Pn
Ha : P1 ≠ P2 ≠ P 3 ≠, ..., ≠ Pn

6. En vez de subíndices numéricos se pueden utilizar letras que asocien iníciales de pa-
labras en la información del problema, o también está la forma alternativa conocida
como explícitas ya que se expresan con palabras, haciéndolo en la forma siguiente:
Ho: No existe diferencia en las medias poblacionales
Ha: Existe diferencia en las medias poblacionales

Ejemplo
El Colegio Médico de Honduras está interesado en saber si existe diferencia entre las
personas que de acuerdo al nivel educativo tienen la cultura de automedicarse. Se levanta
una encuesta en los departamentos de Francisco Morazán y Cortés, habiendo entrevista-
do a 400 personas, información que se registra en la tabla siguiente:

Departamentos
Nivel de
Francisco Total
escolaridad Cortes
morazan
Primario  59  60 119
Secundario  57  55 112
Superior  30  40  70
Ningun nivel  48  51  99
Total 194 206 400
La distribución Ji-Cuadrada y el análisis de varianza 263

a) Construya una tabla de frecuencias observadas y frecuencias esperadas;


b) Calcule el estadístico χ2;
c) Formule las hipótesis;
d) A un nivel de significancia del 5%, ¿Cuál es la conclusión del colegio médico?

Solución inciso a)

Nivel de Departamentos
Frecuencias Total
escolaridad Fm Cortes
fo 59 60 119
Primario
fe 57.71 61.29  
fo 57 55 112
Secundario
fe 54.32 57.68  
fo 30 40  70
Superior
fe 33.95 36.05  
fo 48 51  99
Ningun nivel
fe 48.02 50.98  
Total   194 206 400

Recuerde que el cálculo de las frecuencias esperadas se efectuó mediante la fórmula:


RT x CT
fe = ;
n
RT = Total de observaciones para el renglón que contiene la celda nominada;
Donde: CT = Total de observaciones para la columna que contiene la celda nominada;
n = Número total de observaciones
Solución inciso b)
De la tabla de frecuencias del inciso anterior se construye la tabla siguiente:

( fo – fe)2
f0 fe fo – fe (fo – fe)2 fe
59 57.71 1.29  1.6641 0.0288
60 61.29 –1.29  1.6641 0.0272
57 54.32 2.68  7.1824 0.1322
55 57.68 –2.68  7.1824 0.1245
30 33.95 –3.95 15.6025 0.4596
40 36.05 3.95 15.6025 0.4328
48 48.02 –0.02  0.0004 0.000008329
51 50.98 0.02  0.0004 0.000007846
∑ = 1.2051

Solución inciso c)
Ho: No hay diferencia en los niveles de escolaridad para las personas que se automedican.
Ha: Si hay diferencia en los niveles de escolaridad para las personas que se automedican.

Solución inciso d)
( fo − fe )
2

Como el estadístico de prueba está dado por χ 2 =


∑ f , entonces: χ2 =1.2051
e
264 CAPÍTULO 17

Ahora de la tabla Ji-cuadrada con tres grados de libertad y α = 0.05, se tiene que el
valor de frontera o valor crítico es 7.815

Zona de aceptación

Zona de rechazo

7.851
𝜒 = 1.2051
2

Conclusión: Se acepta H0; No existe diferencia en el nivel de educación para las per-
sonas que tienen la costumbre de automedicarse.

EJERCICIOS 17.2
1. Para averiguar si las ventas de pastillas de silicio son independientes del punto donde
se halla el ciclo económico de Estados Unidos, se han recabado datos sobre las ven-
tas semanales de una empresa y sobre el hecho de que la economía esté llegando a un
nivel máximo del ciclo, esté cayendo en una depresión cíclica o se encuentre ya en
una depresión. He aquí los resultados:
Ventas semanales de pastillas
Economía Altas Medianas Bajas Total
Nivel máximo  20  7  3  30
En depresión  30 40 30 100
En aumento  20  8  2  30
En disminución  30  5  5  40
Total 100 60 40 200

a) Elabore una tabla de contingencia con las frecuencias observadas y esperadas


b) Formule la hipótesis nula y la alternativa
c) Calcule el valor muestral Ji-cuadrada
d) A un nivel de significancia de 0.10, ¿Cuál es su conclusión?
2. Un asesor financiero de la Secretaría de Finanzas, quiere conocer las diferencias en la
estructura de capital de las gerencias administrativas del sector público. Hace una en-
cuesta en todos sus niveles y que tienen distintas cantidades de activos y las divide en
tres grupos. Clasifica cada una según su deuda, que mayor que el capital contable presu-
puestado o que su deuda total sea menor. A continuación, los resultados de la encuesta.
Tamaño de activos (en miles de dolares)
Condicion e intervalo <$500 $500-2000 $2000+ Total
Deuda < que el capital social  7 10  8 25
Deuda > que el capital social 10 18  9 37
Total 17 28 17 62
La distribución Ji-Cuadrada y el análisis de varianza 265

Usando un nivel de significancia de 0.10, ¿Cree usted que la estructura de capital en


los tres niveles de las gerencias administrativas del sector público, son iguales?
3. El director de un programa de prevención en salud bucal, desea identificar con preci-
sión las características de las personas de una comunidad, y se pregunta si el número
de personas y una buena higiene bucal, guarda relación con el nivel de educación de
ellos. En un cuestionario preguntó, su nivel de educación y la frecuencia con que se
cepillan sus dientes. Los resultados se incluyen en la siguiente tabla.
Nivel educacional y aprovechamiento
Graduados Educación Educación
Frecuencia Posgrado Universitarios Media Primaria Total
Una vez 16 14 13  7  50
Dos veces 13 17  7  7  44
Tres veces 39 41 10  5  95
Más de 3 veces 22 23  8 12  65
Total 90 95 38 31 254

En el nivel de significancia del 10%, ¿La frecuencia de limpieza bucal de los poblado-
res en esta comunidad, difiere según el nivel de educación?
4. Un investigador sobre procesos de enseñanza-aprendizaje, opina que las calificacio-
nes que obtienen los estudiantes en la Carrera de Medicina, depende del tiempo que
dediquen a escuchar música. Con el objeto de probar su teoría, ha aplicado aleatoria-
mente un cuestionario a 400 alumnos. El cuestionario contiene dos preguntas: ¿cuán-
tas horas por semana escucha usted música? y ¿cuál es su calificación promedio en
todas las asignaturas? Los datos de la encuesta se incluyen en la tabla anexa. Usando
un nivel de significancia de 5%, pruebe si los factores en mención son dependientes
o independientes.

Horas dedicadas Calificacion promedio


Total
a escuchar musica
A B C D F
< 5 horas 13 10  11 16  5  55
5-10 horas 20 27  27 19  2  95
11-20 horas  9 27  71 16 32 155
> 20 horas  8 11  41 24 11  95
Total 50 75 150 75 50 400

17.3  Ji-cuadrada como prueba de bondad de ajuste


Esta prueba puede utilizarse para decidir si una distribución de probabilidad en particular
como la binomial, la Poisson o la normal, son distribuciones apropiadas para las observa-
ciones o información recabada.
Procedimientos:
1. El problema planteado le hará mención sobre la distribución en particular;
Σ 
2. Las fe se calculan por fei = f0; donde: P(xi) = Probabilidad de cada clase
Σ  f0 = suma de todas las frecuencias observadas
3. El cálculo de los grados de libertad se hace por k-1; donde k es el número de clases.
266 CAPÍTULO 17

4. Si se estima: µ y σ a través de x— y s respectivamente, el número de grados de libertad


debe ser k-3, donde k es el número de clases.
5. En el caso de la distribución binomial, n siempre debe ser una unidad menos que el
número de clases.
6. Si la última o dos últimas frecuencias esperadas son menores que cinco (fe > 5),
i
fusione los últimos renglones de tal manera que el valor de la última frecuencia espe-
rada sea mayor que cinco o sea (fe > 5)
7. Recuerde que, si ocurre lo mencionado en el numeral anterior, el valor de k cambia,
ya que el número de clases fueron reducidas.

Ejemplo 1
El Doctor Rodríguez, supervisor de las operaciones de la Secretaría de Salud para el com-
bate del sancudo transmisor del dengue en la ciudad capital, tiene que visitar cinco ba-
rrios o colonias por día, con el objetivo de verificar el número de personas que padecieron
de dengue en los últimos dos meses. Se sugiere que la variable de personas que padecieron
la enfermedad puede ser descrita mediante una distribución binomial con una probabili-
dad de P = 0.40 de que una persona en esas comunidades haya padecido la enfermedad.

No. de personas afectadas 0 1 2 3 4 5


Frecuencia personas afectadas 10 41 60 20 6 3
A un nivel de significancia de 5%, ¿puede decirse que los datos pueden ser descritos
por la distribución binomial con P = 0.40?

Solución
a) Las f0: 10 41 60 20 6 3

Calculando las fe :
i

fe = P(x = 0)
1 Σ f0 = (0.0778)(140) ≅ 10.892
fe = P(x = 1) Σ f0 = (0.2592)(140) ≅ 36.288
2
fe = P(x = 2) Σ f0 = (0.3456)(140) ≅ 48.384
3
fe = P(x = 3) Σ f0 = (0.0768)(140) ≅ 10.752
4
fe = P(x = 4) Σ f0 = (0.2304)(140) ≅ 32.256
5
fe = P(x = 5) Σ f0 = (0.0102)(140) ≅ 1.428
6

Trasladando esta información a la tabla siguiente tenemos:

( fo – fe)2
f0 fe
fe
10 10.892
41 36.288
60 48.384
20 32.256
 6 10.752
 3 1.428
140
Como la última frecuencia esperada es menor que cinco, esta debe sumarse con la
penúltima fe y se tiene como resultado de dichas sumas 10.752 + 1.428 = 12.18 como éste
dato es mayor que 5, entonces la nueva tabla es:
La distribución Ji-Cuadrada y el análisis de varianza 267

( fo – fe)2
f0 fe
fe
10 10.892 0.0731
41 36.288 0.6118
60 48.384 2.7887
20 32.256 4.6567
9 12.18 0.8302
140 8.9605

b) Calculando el estadístico de prueba:

( fo − fe )2 , entonces: χ2 = 8.9605
Como χ2= ∑ fe
c) Planteando las hipótesis:
H0: Los datos pueden ser descritos por la distribución binomial con P = 0.40
H1: Los datos no pueden ser descritos por la distribución binomial con P = 0.40
α = 0.05
d) Calculando el ji-cuadrado crítico o de frontera
Al principio teníamos 6 clases, por tanto, ahora n = 5, ya que se trata de la distribu-
ción binomial, luego de fusionarse las dos últimas filas, entonces el número de clases
se redujo a 5, y el número de grados de libertad es 4.
De la tabla ji-cuadrada con α = 0.05 y 4 grados de libertad se tiene que χ2Crit = 9.488
e) Decisión:

Zona de aceptación

Zona de rechazo

9.488
𝜒 = 8.9605
2

Se acepta H0
Conclusión: Los datos pueden ser descritos mediante una distribución Binomial con
P = 0.40.
Ejemplo 2
El Doctor Daniel Barrios, administrador de un complejo hospitalario en la zona norte de
Honduras, ha examinado los expedientes pasados de 210 turnos de 8 horas cada uno,
elegidos al azar, a fin de determinar la frecuencia con que se generan conflictos sobre los
procedimientos. El número de días en que 0, 1, 2, 3, 4, 5 o más personas reclamaron sobre
los procedimientos, se atendieron 25, 55, 65, 35, 20 y 10, respectivamente. En un nivel de
significancia de 0.05, ¿Podemos suponer razonablemente que la incidencia de los recla-
mos sobre procedimientos del personal siguen una distribución de Poisson con una media
de λ = 2?
268 CAPÍTULO 17

Solución
a) Calculando las frecuencias esperadas y el estadístico de prueba tenemos:

Probabilidad ( fo – fe)2


x f0 fe
Poisson fe
0 0.1353 25 28.413 0.4099
1 0.2707 55 56.847 0.0600
2 0.2707 65 56.847 1.1693
3 0.1804 35 37.884 0.2195
4 0.0902 20 18.942 0.0591
5+ 0.0527 10 11.067 0.1028
210 2.0206

b) Estadístico de prueba:
( fo − fe )2 , entonces: χ2 = 2.0206
Como χ2= ∑ fe
c) Planteando las hipótesis:
H0: La incidencia de los reclamos siguen una distribución de Poisson con λ = 2
Ha: La incidencia de los reclamos no siguen una distribución de Poisson con λ = 2
α = 0.05
d) Calculando el ji-cuadrado crítico o de frontera
Como K = 6 clases, entonces el número de grados de libertad es 5.
De la tabla ji-cuadrada con α = 0.05 y 5 grados de libertad se tiene que χ2Crit = 11.070
e) Decisión:

Zona de aceptación

Zona de rechazo

11.070

𝜒 = 2.0206
2

Se acepta H0
Conclusión: La incidencia de reclamos siguen una distribución de Poisson con λ = 2.
Ejemplo 3
El administrador de una cooperativa con el objetivo de conservar cierta cantidad de efec-
tivo en caja como reserva de operaciones durante un horario especial extendido, quiere
saber si el pago de los clientes tiene una distribución normal. Para dicha prueba el admi-
nistrador recolecta la siguiente información:
Pagos $0 – 999 $ 1000 – 1999 $ 2000 y +
f0 20 65 25
a) Calcular las frecuencias esperadas si los datos tienen distribución normal con una
media de $ 1500 y una desviación estándar de $ 600.
La distribución Ji-Cuadrada y el análisis de varianza 269

b) Calcule el estadístico de prueba Ji-cuadrada;


c) Formule las hipótesis en forma explícita;
d) Pruebe sus hipótesis a un nivel de significancia del 10%.

Solución:
a) Calculando las fe

( fo – fe)2
x Probabilidad f0 fe
fe
<1000 0.2033 20 22.363 0.2496
1000 - 1500 0.5934 65 65.274 0.0012
≥ 2000 0.2033 25 22.363 0.3109
110 0.5617

( fo − fe )2 , entonces: χ2 = 0.5617
b) χ2= ∑ fe

c) Planteando las hipótesis:


H0: Los pagos de los clientes siguen una distribución normal con una media de
$1500 y una desviación estándar de $600
Ha: Los pagos de los clientes no siguen una distribución normal con una media de
$ 1500 y una desviación estándar de $600.
α = 0.10
d) Calculando el ji-cuadrado crítico o de frontera
Como K = 3, entonces el número de grados de libertad es 2.
De la tabla ji-cuadrada con α = 0.10 y 2 grados de libertad se tiene que χ2Crit = 4.605
e) Decisión:

Zona de aceptación

Zona de rechazo

4.605

𝜒 = 0.5617
2

Se acepta H0
Conclusión: Los pagos de los clientes siguen una distribución normal con una media de
$1500 y una desviación estándar de $600.

EJERCICIOS 17.3
1. El Doctor Luis Lemus, visitador médico de una compañía farmacéutica tiene 5 clien-
tes (médicos) que visitar al día. Se sugiere que la variable, o sea las ventas logradas
por el Doctor Lemus sean descritas mediante la distribución binomial, siendo 0.80 la
270 CAPÍTULO 17

probabilidad de lograr una venta con cada cliente. Si se tiene la siguiente distribución
de frecuencias del número de ventas hechas diariamente por el Doctor Lemus, usan-
do un nivel de significancia de 0.05, ¿Podemos concluir que la distribución sigue en
efecto la que ha sido sugerida?

Número de ventas por día 0 1 2 3 4 5


Frecuencia del número de ventas 15 35 50 18 10 8
2. A continuación se le da una distribución de frecuencia observada. Usando una distri-
bución normal con 𝜇 = 3 y 𝜎 = 0.5
a) Encuentre la probabilidad de caer en cada clase;
b) Basándose en a), calcule la frecuencia esperada de cada categoría;
c) Calcule el estadístico Ji Cuadrada;
d) En el nivel de significancia de 0.10, ¿Parece ser que ésta distribución está bien
descrita por la distribución normal sugerida?

Valor observado de la variable < 2.2 2.2-2.59 2.6-2.99 3-3.39 ≥ 3.4

Frecuencia observada 3 17 33 22 5

3. Una oficina postal quiere resolver el problema de las “cartas maltratadas”. Se ha di-
cho que cualquier carta enviada a cierta área tiene una probabilidad de 0.15 de ser
maltratada. Dado que la oficina postal es tan grande, puede suponerse que esas pro-
babilidades son independientes para cada carta. Se seleccionó una muestra de 310
personas y se les enviaron dos cartas de prueba. El número de personas que recibie-
ron 0, 1 o 2 cartas maltratadas fue de 260, 40 y 10, respectivamente. En el nivel de
significancia de 0.10, ¿es razonable concluir que el número de cartas maltratadas re-
cibidas por persona sigue una distribución binomial donde P = 0.15?
4. Un diligente estudiante del Doctorado en Cirugía Dental en la UNICAH, quiere veri-
ficar si es razonable suponer que algunos datos de ventas sobre equipos quirúrgicos
han sido muestreados de una población normal, antes de realizar una prueba de hipó-

tesis con las ventas promedio. Reunió algunos datos de ventas y calculó X = 78 y s = 9,
tabulando los datos como sigue:

Ventas ≤ 65 66-70 71-75 76-80 81-85 ≥ 86

Observaciones por grupo 10 20 40 50 40 40

a) ¿Es importante que el estudiante verifique si los datos tienen una distribución
normal?
b) Formule una hipótesis nula y una hipótesis alternativa explícita para verificar si los
datos tienen una distribución normal;
c) ¿Cuál es la probabilidad (aplicando una distribución normal con 𝜇 = 78 y 𝜎 = 9)
de que las ventas sean menores o iguales a 65, que fluctúen entre 66 y 70; entre 71
y 75; entre 76 y 80; entre 81 y 85; mayores o iguales que 86?;
d) En el nivel de 0.05 de significancia, ¿Sigue la distribución observada una distribu-
ción normal?
5. Luego de años de trabajar en una estación donde se pesan los camiones que transpor-
tan equipo médico y productos para los hospitales a nivel nacional, Jaime Rodas,
empleado de la Secretaría de Infraestructura piensa que el peso por camión (en miles
de libras) sigue una distribución normal con 𝜇 = 71 y 𝜎 = 15. Con el objeto de probar
su suposición, un lunes reunió los siguientes datos, registrando el peso de cada ca-
mión que entra a la estación de abastecimiento.
La distribución Ji-Cuadrada y el análisis de varianza 271

70 72 69 52 90 55 86 94 58 57
73 71 87 91 84 95 55 52 66 95
86 56 58 57 55 90 65 87 50 56
57 84 64 80 58 55 98 58 82 55
85 62 78 61 81 92 62 59 88 65
Si el señor Rodas aplicó una prueba Ji Cuadrada de bondad de ajuste en estos datos,
¿A qué conclusión llegará sobre la distribución de los pesos de los camiones? Use un nivel
de significancia de 0.10. (Sugerencia: Utilice 5 intervalos igualmente probables).

17.4  Análisis de varianza


El análisis de varianza nos permite probar la significancia de la diferencia entre más de
dos medias muestrales. Para dichas pruebas es necesario conocer el valor de la media de
medias o conocida también como la gran media. Por otra parte, deben calcularse la va-
rianza entre columnas y la varianza dentro de muestras o columnas.
Para ésta prueba utilizaremos una nueva distribución llamada “Distribución F”.
Procedimientos en el cálculo de las varianzas:
1. Cálculo de la gran media
Lo haremos mediante la fórmula siguiente:
n1 x1 + n2 x 2 + n3 x 3 + ⋯ +nk x k
X=
n1 + n 2 + n3 + ⋯ +nk

X = La gran media
x—1 = Media de la muestra 1
x—2 = Media de la muestra 2
Donde: x—k = Media de la muestra k
n1 = Tamaño de la muestra 1
n2 = Tamaño de la muestra 2
nk = Tamaño de la muestra k
2. Planteamiento de las hipótesis
H0: 𝜇1 = 𝜇2 = 𝜇3; ⋯ ; = 𝜇k
Ha: 𝜇1 ≠ 𝜇2 ≠ 𝜇3; ⋯ ; ≠ 𝜇k
Las hipótesis también pueden plantearse de manera explícita, así como los subín-
dices de los parámetros pueden utilizar letras iníciales de tal forma que relacionen la
información de los elementos actores en el problema.
Por ejemplo, si en tres muestras se refieren a tres grupos A, B y C, entonces los
parámetros se pueden representar por:
𝜇A, 𝜇B y 𝜇C; haciendo referencia a los grupos.
3. La varianza entre columnas
Esta la calcularemos a través de:

∧2 ∑nj (xj −X )2
σ EC =
k −1
nj = Tamaño de la muestra j-ésima
k = Número de muestras
Donde: x—j = Media muestral j-ésima
X = La gran media
272 CAPÍTULO 17

4. La varianza dentro de columnas o dentro de las muestras


Calculada por:

∧ n −1
σDC
2
= ∑ NTj − k s 2j

nj = Tamaño de la muestra j-ésima


NT = Σnj Tamaño total de observaciones
Donde:
k = Número de muestras
s2j = Varianza muestral j-ésima
Ejemplo
Los siguientes datos corresponden a pacientes atendidas por tres empleadas asistentes de
consultas en un hospital de especialidades de ojos, en un mes cualesquiera:
Empleada 1: 45 55 43 60 39
Empleada 2: 54 65 38 48 52 53
Empleada 3: 65 57 37 44
Calcular:
a) La gran media
b) La varianza entre columnas
c) La varianza dentro de columnas o muestras

Solución inciso a)
Datos:
n1 = 5
n1 = 5; n2 = 6 y n3 = 4
n1 = 4
45 + 55 + 43 + 60 + 39
x1 = ≅ 48.4
5
54 +65 +38+ 48 + 52 +53
x2 = ≅ 51.67
6
65 +57 +37 + 44
x3 = ≅ 50.75
4
Ahora la gran media:
n1 x1 + n2 x 2 + n3 x3
X=
n1 +n2 +n3

5 (48.4) +6 (51.67) +4 (50.75) 755.52


x= = ≅ 50.368
5+ 6 + 4 15
≅ 50.368
Se concluye que: X =
Solución inciso b)
La varianza entre columnas:

∑nj(x j − x ) = 5 (48.4 −50.368)2 + 6 (51.67− 50.368)2 + 4 (50.75 −50.368)2


2
∧2
σ EC =
k −1 3 −1
19.36512 +10.171224 +0.583696
= ≅ 15.06002
2
La distribución Ji-Cuadrada y el análisis de varianza 273


Entonces: σDC
2
= 15.06002

Solución inciso c)
Primero calculamos las varianzas muestrales:

∑( xi − x1 )2
s12 = =
n1 − 1
2 2 2 2 2
(45− 48.4) + (55− 48.4) + (43− 48.4) + (60 −48) + (39− 48.4)
=
5 −1
11.56+ 43.56 + 29.16 +134.56+ 88.36 307.2
= ≅ 76.8
4 4
Entonces: s12 ≅ 76.8

∑( xi − x1 )2
s22 = =
n2 −1
(54 −51.67)2 + (65 − 51.67)2 + (38 −51.67)2 + ( 48 −51.67)2 + (52 −51.67)2 + (53 − 51.67)2
=
6−1
5.4289 +177.6889 +186.8689 +13.4689 + 0.1089 +1.7689 385.3334
= ≅ 77.067
5 5
Entonces: s22 ≅ 77.067

∑( xi − x 2 )2
s32 = =
n3 − 1
2 2 2 2
(65 −50.75) + (57 −50.75) + (37− 50.75) + (44 −50.75)
=
4 −1
203.0625 +39.0625 +189.0625+ 45.5625 476.75
= ≅ 158.92
3 3

Entonces: s32 ≅ 158.92


Luego la varianza dentro de columnas o muestras:
n −1 2
=∑ j
∧2
σDC s =
NT − k j
5 −1 6 −1 4 −1
(76.8) + (77.067) + (158.92) ≅ 97.44
15 −3 15 −3 15 −3
∧2
Entonces: σDC ≅ 97.44

La distribucion F
La distribución F es utilizada para pruebas de hipótesis relacionadas al análisis de varian-
zas, en el que suponemos que los eventos son idénticos o iguales, sin importar la diferen-
cia entre el tamaño de las diversas muestras tomadas para la prueba.
Notas:
1. Para determinar los valores críticos o de frontera utilizaremos la Tabla F que se en-
cuentra en los apéndices del presente texto, para valores de significancia del cinco y
uno por ciento.
274 CAPÍTULO 17

2. El número de grados de libertad en el numerador (columnas) lo calcularemos por


k-1, donde k es el número de muestras en estudio.
3. El número de grados de libertad en el denominador (filas) lo calcularemos por NT-k,
donde NT es el número total de observaciones de todas las muestras y k el número de
muestras. ∧
σ2
4. El estadístico de prueba será: F = ∧EC 2
σDC
5. En el caso de no existir una fila o columna referente al número de grados de libertad,
debe utilizarse la columna o fila más cercana.
6. En la mayoría de casos, la distribución F utilizada en este tipo de pruebas y como
también el que se hará más delante para la varianza de dos poblaciones, se trabaja en
la cola derecha.

Ejemplo
Los siguientes datos muestran el número de reclamaciones hechas por ciudadanos incon-
formes, las cuales fueron procesadas diariamente en un grupo de cuatro empleados que
atienden las áreas de servicio al ciudadano en una oficina gubernamental con orientación
en la salud. El supervisor de ésta área observó durante varios días a los cuatro empleados
más cuestionados. Pruebe la hipótesis de que las reclamaciones medias por día para los
cuatro empleados son iguales. (Use un 𝛼 = 0.01)
Empleado 1: 15 17 14 12
Empleado 2: 12 10 13 17
Empleado 3: 11 14 13 15 12
Empleado 4: 13 12 12 14 10 9

Solución
a) Datos
n1 = 4; n2 = 4; n3 = 5 y n4 = 6
n1 = 4
n1 = 5
n1 = 6
K = 4; NT = 19
Grados de libertad en el numerador = k – 1 = 4 – 1 = 3 g.l.n.
Grados de libertad en el denominador = NT – k = 19 – 4 = 15 g.l.d.
b) Calculando las medias muestrales, la gran media y las varianzas muestrales

15 +17 +14 +12 58


x= = ≅ 14.50
4 4
12 +10 +13 +17 52
x2 = = ≅ 13.00
4 4
11 +14 +13 +15 +12 65
x3 = = ≅ 13.00
5 5
13 +12 +12 +14 +10 +9 70
x4 = = ≅ 11.67
6 6
Ahora la gran media
n1 x1 + n2 x2 + n3 x3 +n4 x4
X=
n1 + n2 + n3 + n4
4(14.50) + 4(13) +5(13) +6(11.67) 58 +52 +65 +70.02 245.02
X= = = ≅ 12.89
4 + 4 +5 +6 19 19
La distribución Ji-Cuadrada y el análisis de varianza 275

Calculando las varianzas muestrales:

s12 =
∑(xi − x1)2 = (15 −14.5)2 + (17 −14.5)2 +(14 −14.5)2 + (12 −14.5)2 =
n1 −1 4 −1
0.25 +6.25 + 0.25 + 6.25 13
= ≅ 4.34
3 3
Entonces: s12 ≅ 4.34

∑(xi − x2 )2 (12 − 13)2 + (10 − 13)2 + (13 −13)2 + (17 − 13)2 1 +9 + 0 +16
s22 = = = =
n2 − 1 4 −1 3
26
≅ 8.67
3

Entonces: s22 ≅ 8.67

∑(xi − x3 )2 (11− 13)2 + (14 − 13)2 + (13 − 13)2 + (15 − 13)2 + (12 −13)2
s32 = = =
n3 − 1 5 −1
4 +1 + 0 + 4 +1 10
= ≅ 2.5
4 4
Entonces: s32 ≅ 2.5

∑(xi − x4 )2
s42 = =
n4 − 1
(13 − 11.67)2 + (12 − 11.67)2 + (12 −11.67)2 + (14 −11.67)2 + (10 −11.67)2 + (9 −11.67)2
=
6 −1
1.7689 + 0.1098 + 0.1098 + 5.4289 + 2.7889 +7.1289 17.3334
= ≅ 3.467
5 5
Entonces: s42 ≅ 3.467

c) Planteando las hipótesis


H0: Las reclamaciones para los empleados son iguales
H1: Las reclamaciones para los empleados no son iguales
𝛼 = 0.01
d) Calculando las varianzas entre columnas y dentro de las muestras

∑n j ( x j − x )
2
∧2
σ EC = =
k −1
2 2 2 2
4 (14.5 −12.89) + 4 (13 −12.89) + 5 (13 −12.89) + 6 (11.67−12.89)
=
4 −1
10.3684 + 0.0484 + 0.0605 + 8.9304 19.4077
= ≅ 6.469
3 3
∧2
Entonces: σ EC ≅ 6.469
276 CAPÍTULO 17

n j −1
σ DC
2 =
∑ NT − k
s 2j =

4 −1 4 −1 5 −1 6 −1
(4.34) + (8.67) + (2.5) + (3.467) =
19 − 4 19 − 4 19 − 4 19 − 4
(0.2)(4.34) +(0.2)(8.67) + (0.267)(3.5) +(0.34)(3.467) = 0.868 + 1.734 + 0.6675 +
1.17878 = 4.45

Entonces: σ DC
2 ≅ 4.45

e) Calculando el estadístico de prueba


2
σ EC 6.469
F= 2
= ≅ 1.45
σ DC 4.45
f) Con 3 grados de libertad en el numerador (columnas), 15 grados de libertad en el
denominador (filas) y 𝛼 = 0.01, se tiene el F crítico o de frontera que es 5.42 (ver tabla
F), entonces:

Zona de aceptación
Zona de rechazo

5.42
F = 1.47

Se acepta H0
Conclusión: Los reclamos de los ciudadanos para los cuatro empleados, son iguales.

EJERCICIOS 17.4
1. En un estudio que duró 30 días, se compararon los efectos que tuvieron cuatro pro-
mociones de incentivo para los pacientes y clientes permanentes de un hospital pri-
vado de la ciudad capital.
Servicios médicos gratuitos 78 87 81 89 85
Rebaja en servicios de laboratorio 94 91 87 90 88
Descuento por pagos en efectivo 73 78 69 83 76
Reembolso por atención de menores 79 83 78 69 81
a) Calcule la media de cada promoción y luego determine la gran media;
b) Estime la varianza de la población usando la varianza entre columnas;
c) Encuentre la varianza de la población usando la varianza dentro de columnas,
calculada a partir de la varianza dentro de las muestras;
d) Calcule la razón F. En un nivel de significancia de 0.01, ¿producen las promocio-
nes diferentes efectos en la atención médica?
2. Con el objetivo de medir la productividad para los empleados del Sector Minero en
Honduras y los riesgos de salud que estos enfrentan, se compararon tres métodos de
capacitación aplicados durante el año anterior. A continuación, se dan las medidas
de productividad de los empleados sin riesgos para su salud de una compañía minera
La distribución Ji-Cuadrada y el análisis de varianza 277

en el Departamento de Santa Bárbara, y que fueron instruidos con cada método por
las autoridades sanitarias.
Método 1 36 26 31 20 34 25
Método 2 40 29 38 32 39 34
Método 3 32 18 23 21 33 27
En el nivel de significancia de 0.05 ¿los tres métodos de capacitación conducen a di-
ferentes niveles de productividad sin riesgos en su salud?
3. Un Médico dedicado a la investigación científica, tiene las mediciones de las cuatro
muestras anexas. ¿Podemos concluir que estas proceden de poblaciones que tienen el
mismo valor medio? Use un nivel de significancia de 0.01.
Muestra 1 16 21 24 28 29
Muestra 2 29 18 20 19 30 21
Muestra 3 14 15 21 19 28 17
Muestra 4 21 28 20 22 18
4. El supervisor de los servicios de emergencia en un hospital público en Honduras, le
gustaría saber si el hospital atiende más pacientes en la temporada navideña que en
los meses que preceden o siguen a otros días festivos. Reunió datos sobre el número
de pacientes atendidos en las áreas de emergencia durante los meses de noviembre,
diciembre y enero en los últimos dos años.
Número de pacientes atendidos
Noviembre 43  37  59  55  38  48
Diciembre 54  41  48  35  50  49
Enero 36  28  34  41  30  32
En un nivel de significancia de 0.05, ¿es el número medio de pacientes el mismo,
durante estos tres meses?
5. Algunas empresas de Tegucigalpa y San Pedro Sula, han diseñado tres diferentes sis-
temas para limpiar los derrames de fluidos contaminantes en las oficinas y casas
particulares. La siguiente tabla contiene los resultados, medidos por la cantidad de
área de superficie que se limpia en una hora. Los datos se obtuvieron al probar cada
método en cinco ensayos. ¿Tienen igual eficacia los tres sistemas? Use el nivel de
significancia de 0.05.
Sistema A 55 60 58 61 54
Sistema B 52 58 59 54 57
Sistema C 61 57 56 62 61

17.5  Inferencia sobre una varianza de población


Esta prueba tiene como objetivo conocer la variabilidad de los datos, y para ello cuando
se trabaja con una población, en la prueba de hipótesis se usa la distribución Ji-cuadrada.
Notas:
1. Las hipótesis se plantean como sigue:
H 0 : σ 2 = σ 02
σ 2 ≠ σ 02
H a : σ 2 > σ 02
σ 2 < σ 02
Donde 𝜎20 es la varianza hipotética
278 CAPÍTULO 17

2. Si se plantea que Ha: 𝜎2 ≠ 𝜎20, use dos colas con n – 1 grados de libertad, 𝛼– a la dere-
cha y 1 – 𝛼– a la izquierda, para los límites de aceptación y rechazo.
2
2
3. Si se plantea que Ha: 𝜎2 > 𝜎20, use la cola derecha con 𝛼 y n – 1 grados de libertad para
el límite de aceptación y rechazo.
4. Si se plantea que Ha: 𝜎2 < 𝜎20, use la cola izquierda con 1 – 𝛼 y n – 1 grados de libertad
para el límite de aceptación y rechazo.
( n −1) s 2
5. El estadístico de prueba se calcula por: χ 2 =
σ 02
n = tamaño de la muestra;
Donde: s2 = Varianza muestral;
𝜎20 = Varianza hipotética.
6. Cuando se construyen intervalos de confianza para varianzas los límites inferior y
superior, o límites críticos para la prueba pueden calcularse por:
( n −1) s 2
Límite inferior = σ L2 =
σ U2

Límite inferior = σ U2 =
( n −1) s 2
σ L2
7. Los valores de χU2 y χL2; se calculan en la tabla Ji-cuadrada en la columna 𝛼– para χU2 y
1 – 𝛼– para χL2, ambos con n – 1 grados de libertad.
2
2
8. Las curvas Ji-cuadrada pueden dibujarse como sigue:
Zona de aceptación

Zona de rechazo Zona de rechazo

𝜒 2L 𝜒 2U

Zona de aceptación

Zona de rechazo

𝜒 2U

Zona de aceptación

Zona de rechazo

𝜒 2L
La distribución Ji-Cuadrada y el análisis de varianza 279

Ejemplo 1
En una fábrica de alimentos pasteurizados se toma una muestra de 30 productos fabrica-
dos en las últimas semanas, los cuales mostraron un promedio de 7 productos con fallas
en el empaque y una desviación estándar de ±3 productos. Construya un intervalo de
confianza del 95% para la verdadera varianza de ésta población.

Solución
a) Datos
n = 30; x– = 7 y s2 = 9
Número de grados de libertad = 29 y 𝛼 = 0.05

b) Calculando los límites inferior y superior

α 0.05
Con 29 grados de libertad y = = 0.025 , entonces: χU2 = 45.722
2 2

α 0.05
y con 1= =1− =1− 0.025 = 0.975; χL2 = 16.047
2 2

Luego:

( n −1) s 2 (30 −1)(9) ( n −1) s 2 (30 −1)(9)


σ L2 = = = 5.71 y σ U2 = = = 16.26
χ U2 45.722 χ L2 16.047

Por tanto: IC = (𝜎L2; 𝜎U2 ) = (5.71, 16.26)

Ejemplo 2
La Secretaría de Recursos Naturales y Ambiente con el objetivo de disminuir los niveles
de contaminación del medio ambiente en el país, inspecciona 30 de los vehículos asigna-
dos a dicha institución para ver si se ajustan a las normas de emisiones de contaminantes
establecidas por el gobierno, las cuales tienen una media de 10 y una varianza de 36. El
número promedio de partículas contaminantes emitidas no superó los niveles fijados,
pero la varianza de la muestra fue de 50. En un nivel de significancia del 5%, ¿Deberá la
Secretaría de Recursos Naturales y Ambiente poner fuera de circulación algunos de sus
vehículos?

Solución
a) Planteando las hipótesis
H 0: σ 2 = 36
H a: σ 2 > 36
α = 0.05

( n −1) s 2 (30 −1)(50)


b) El estadístico de prueba χ 2 = = = 40.27
σ 02 36

Con 29 grados de libertad y 𝛼 = 0.05, el Ji-cuadrado frontera o crítico buscado en la


tabla es 42.557.
280 CAPÍTULO 17

Zona de aceptación

Zona de rechazo

𝜒 2 = 40.27 𝜒 2U = 42.557

Como χ2 < χ2Crit (40.27 < 42.557); La Secretaría de Recursos Naturales y Ambiente,
no debería sacar de circulación sus vehículos.

EJERCICIOS 17.5
1. Una muestra de 15 observaciones tomada de una distribución normal tiene una me-
dia de 30 y una varianza de 15.5. Construya un intervalo de confianza de 95% para la
verdadera variancia de la población.
2. Se supone que la desviación estándar de una distribución es de 300. Si una muestra
observada de 20 produce una desviación estándar de la muestra de 250. ¿Deberíamos
rechazar la hipótesis nula según la cual la verdadera desviación estándar es de 300?
Utilice el nivel de significancia de 0.10.
3. Un fabricante de máquinas de rayos X quiere que estas tengan desviaciones estándar
en resolución que estén significativamente debajo de 2 unidades. Cuando una nueva
máquina de rayos X se usa en la tomografía de 30 pacientes, la desviación estándar
de la muestra resulta ser 1.46. ¿Debe venderse esta máquina de rayos X?
a) Formule la hipótesis nula y la alternativa
b) Pruebe sus hipótesis en el nivel de 𝛼 = 0.01
c) Formule una conclusión explícita.
4. Un psicólogo conoce estudios que muestran que la variabilidad de la atención de los
niños de cinco años puede resumirse mediante 𝜎2 = 64 min2. Quiere saber si la aten-
ción de los niños de seis años es diferente. Una muestra de niños de seis años da s2 =
64 min2.
a) Formule una hipótesis explicita y una hipótesis alternativa.
b) Pruebe sus hipótesis en el nivel de 𝛼 = 0.05
c) Formule una conclusión explícita.

17.6  Inferencia sobre la varianza de dos poblaciones


Si se tienen dos muestras n1 y n2; tendremos varianzas muestrales s21 y s22, las cuales pue-
den relacionarse entre sí y hacer pruebas de hipótesis utilizando la distribución F. En el
caso de inferir sobre la varianza de dos poblaciones la distribución F es la más adecuada
y si se hace sobre la varianza de una población debe aplicarse la distribución Ji-cuadrada.
Notas:
s12 s22
1. El estadístico de prueba estará dado por F = o F =
s22 s12
La distribución Ji-Cuadrada y el análisis de varianza 281

2. En el caso de llevar a cabo la prueba con una cola izquierda o derecha, la varianza
que va en el numerador del cociente F, es obligatorio que ésta sea mayor que la varian-
za del denominador.
3. Las hipótesis se plantean de la manera siguiente:

H 0 : σ 12 = σ 22
σ12 ≠ σ 22

H a : σ12 > σ 22
σ12 < σ 22

4. En la mayoría de casos se utiliza la cola derecha de F.


5. El número de grados de libertad en el numerador es n1 – 1 y el número de grados de
libertad en el denominador es n2 – 1.
6. En el caso de trabajar con dos colas los límites críticos o valores de frontera se calcu-
lan a través de:
LS = F(n, d, 𝛼);
n = número de grados de libertad en el numerador
Donde: d = número de grados de libertad en el denominador
𝛼 = valor de significancia
1
LI = ;
F ( d , n,α )
d = número de grados de libertad en el numerador
Donde: n = número de grados de libertad en el denominador
𝛼 = valor de significancia

Ejemplo 1
Bajo un método especial para medir la eficiencia de nuevos medicamentos, se obtuvo la
siguiente información sobre dos poblaciones que supuestamente pueden considerarse que
tienen la misma varianza en la rapidez y efectividad. Una muestra de 12 fue extraída de la
población 1, mostrando ésta una varianza de 1.96, en tanto que una muestra de tamaño
10 seleccionada de la población 2, produjo una varianza de 3.64.
a) Calcule la razón F para la prueba de igualdad de varianzas.
b) Obtenga el valor crítico de F del extremo superior empleando el nivel de significancia
de 0.05;
c) Obtenga el valor crítico de F correspondiente del extremo inferior;
d) Formule la conclusión de su prueba.

Solución inciso a)
Datos:
s12 1.96
n1 =12; s12 =1.96; n2 = 10 y s22 = 3.64 y F = = ≅ 0.54
s22 3.64
1
Solución inciso b) LS = FCRIT = = F (11, 9, 0.05) = 3.10
F ( n, d , α )

1 1 1
Solución inciso c) LI = FCRIT = = = = 0.39
F ( d , n, α ) F (9, 11, 0.05) 2.90
282 CAPÍTULO 17

Solución inciso d)
H 0 : σ 12 = σ 22
H a : σ 12 ≠ σ 22
α = 0.05

Zona de aceptación

Zona de rechazo Zona de rechazo

0.39 3.10

F = 0.54

Como se acepta H0, concluimos que al nivel de significancia del 5%, se puede decir
que la eficiencia de los nuevos medicamentos, son iguales.

Ejemplo 2
A una empresa le preocupa mucho la variabilidad en el número de productos con defectos
producidos en el proceso de fabricación. Si estos tienen una variabilidad significativamen-
te diferente en el número de artículos con defectos, terminado el proceso de fabricación,
los experimentos se confunden y aparecen algunas cosas extrañas y por ende se recabaron
los siguientes datos:

Número de defectos en el proceso de fabricación (en miles)


Producción A 91 89 83 101 93 98 144 118 108 125 138
Producción B 62 76 90 75 88 99 110 140 145 130 110

a) Calcule s A2 y s B2


b) Formule la hipótesis nula y la hipótesis alternativa; y luego pruébelas en un nivel de
significancia del 0.02

Solución

Inciso a) s2A = 423.4 y s2B = 755.818

Inciso b) H0: s2A = s2B

H0: s2A ≠ s2B


s 2A 423.4
F= = ≅ 0.56
sB2 755.818

Ahora F0.01 (10,10) ≅ 4.85 y F0.99 (10,10) = 1 ≅ 0.206


4.85
La distribución Ji-Cuadrada y el análisis de varianza 283

Zona de aceptación

Zona de rechazo Zona de rechazo

0.206 4.85

F = 0.56

Se acepta H0
Conclusión: Las varianzas son iguales

EJERCICIOS 17.6
1. En una muestra de 21 observaciones, la estimación de la desviación estándar de la
población resultó ser de 8.0. En otra muestra de 16 observaciones, se descubrió que
la estimación es de 3.2. ¿Podemos aceptar la hipótesis de que las dos muestras provie-
nen de poblaciones que tienen igual varianza, o debemos de afirmar que la varianza
de la segunda muestra es menor? Use un nivel de significancia de 0.01.
2. Una cooperativa de empleados públicos en el área de la salud, tiene algún dinero para
invertir, y ha reducido su selección a un fondo mutuo A o B. La tasa de rendimiento
del fondo A es menor, pero al parecer es más estable que el fondo B. Si su variabilidad
de la tasa de interés, en efecto, es significativamente menor que la del fondo B, la
cooperativa invertirá su dinero en él. En caso contrario, preferirá el fondo B. Para
tomar una decisión, la cooperativa ha tomado una muestra de las tasas de rendimien-
to de 21 meses. En el caso del fondo A la desviación estándar es de 2 y la del fondo B
fue de 3. ¿En qué fondo debe invertir la cooperativa en mención? Realice su prueba
a un nivel de significancia del 5%.
3. Un equipo de investigadores obtuvieron la siguiente información sobre dos poblacio-
nes que se consideraba que tenían la misma variancia. Una muestra de 12 extraída de
la población 1 mostró una varianza muestral de 1.96, en tanto que una muestra de 10
seleccionada de la población 2 dio una varianza de 3.64.
a) Calcule la razón F para la prueba de igualdad de varianzas.
b) Obtenga el valor crítico F del extremo superior, empleando el nivel de significancia
de 0.05.
c) Obtenga el valor F correspondiente del extremo inferior.
d) Formule la conclusión de su prueba.
4. Una compañía fabricante de equipo médico utilizado en los quirófanos, está a punto
de dar a conocer un nuevo aparato más confiable y de altas resoluciones (CAS2), para
sustituir su viejo modelo CAS1. Dos muestras de 25 pruebas en operaciones delicadas
consecutivas realizadas en un hospital público, generaron la siguiente información:
Rendimiento de confiabilidad
CAS2 CAS1
Media 50 75
Desviación estándar 20 10
284 CAPÍTULO 17

En el nivel de significancia de 0.05, ¿es significativamente más variable la confiabili-


dad de CAS2 que la de CAS1?
5. Dos médicos no coincidían en la cuestión de si las amas de casa urbanas mostraban
mayor variabilidad en sus patrones de enfermarse que las amas de casa rurales. Con
el objetivo de probar sus ideas opuestas, tomaron muestras aleatorias de 70 amas de
casa procedentes de zonas urbanas y de 60 amas de casa provenientes de zonas rura-
les. Descubrieron que la variancia en los cuadrados de los días entre las visitas a
centros de salud y hospitales del primer grupo era 14 y, en cambio, la variancia mues-
tral del segundo grupo era 3.5. ¿Es significativamente en el nivel de 0.01 la diferencia
entre la variancia de los días entre las visitas a las instituciones de salud?
CAPÍTULO

Regresión simple y
correlación 18
Contenido

18.1 Estimación mediante la línea de regresión


18.2 Análisis de correlación
18.3 Pendiente de la línea de regresión de la
población y error estándar del coeficiente
de regresión
286 CAPÍTULO 18

Regresión simple y correlación


El análisis de regresión es el establecimiento de un patrón mediante el cual las tendencias
regresan al valor medio de los datos. Por otra parte, la regresión o análisis de regresión
está asociado a una ecuación especial, llamada Ecuación de Estimación o Predicción la
cual dependiendo de las características del problema en la vida real, esta puede ser lineal,
cuadrática, exponencial o logo lineal.
Los seres humanos todos los días tomamos decisiones personales o profesionales que
se basan en las predicciones de hechos futuros. Para llevar a cabo tales pronósticos debe
confiarse en la relación intuitiva y calculada entre lo que ya se conoce y lo que va a esti-
marse. Si puede determinarse como se relaciona lo conocido con el evento futuro, contri-
buirá de manera importante al proceso de decisiones. Y este es precisamente el tema del
presente capítulo: La manera de cómo determinar la relación existente entre dos o más
variables. (naturaleza y fuerza de relación entre ellas).
Por otra parte, todos los días el director de un hospital toma decisiones personales y
profesionales que se basan en las predicciones de hechos futuros. Para hacer tales pronós-
ticos debe confiar en la relación intuitiva y calculada entre lo que ya se conoce y lo que va
a estimarse. Si se puede determinar cómo se relaciona lo conocido con el evento futuro,
contribuirá de manera importante al proceso de toma de decisiones.

18.1  Estimación mediante la línea de regresión


En el análisis de regresión desarrollaremos una ecuación de estimación, es decir, una
fórmula matemática que relaciona las variables conocidas con las desconocidas. Después
de haber aprendido el patrón de dicha relación (la regresión), seremos capaces de aplicar
análisis de correlación, el cual con mayor precisión nos indica el grado específico en que
están relacionadas las variables y la precisión con que la ecuación de estimación describe
dicha relación.
La relación existente entre dos o más variables puede ser directa o inversa.
a) Relación directa

Pendiente positiva

b) Relación inversa

Pendiente negativa

X
Regresión simple y correlación 287

Diagramas de dispersión
El primer paso al determinar si existe una relación entre dos variables consiste en exami-
nar la gráfica de los datos observados; a ésta gráfica se le conoce como diagrama de
dispersión
Ejemplo de posibles relaciones entre X y Y en los diagramas de dispersión:

a) Lineal directa b) Lineal inversa


Y Y

X X

c) Curvilínea directa d) Curvilínea inversa


Y Y

X X

e) Lineal inversa con más dispersión f) Sin relación


Y Y

X X

Entre las ecuaciones que conoceremos y utilizaremos posteriormente, la variable co-


nocida recibe el nombre de variable independiente (x) y la variable por predecir se conoce
como variable dependiente (y).
La ecuación lineal de regresión la calcularemos por:

∑ xy − nx y
Ŷ = a + bX; Donde b =  y a = –y – bx—
∑x − n ( x )
2
2

Ejemplo 1
Para el siguiente conjunto de datos:
X: 7 5 6 8 7 9 9 6 8
Y: 2 1.5 1.75 2.3 3.2 3.1 2.9 1.85 2.1
288 CAPÍTULO 18

a) Grafique el diagrama de dispersión


b) Desarrolle la ecuación de estimación que mejor describa los datos
c) Determine el valor de Y, cuando X = 3
Solución inciso a)

10

X
2 4 6 8 10

Solución inciso b)
X Y XY X2
7 2 14 49
5 1.5 7.5 25
6 1.75 10.5 36
8 2.3 18.4 64
7 3.2 22.4 49
9 3.1 27.9 81
9 2.9 26.1 81
6 1.85 11.1 36
8 2.1 16.8 64
65 20.7 154.7 485

∑ xy − nx y 154.7 − 9 ( 7.23)( 2.3) 5.039


b= = = ≅ 0.3465
∑x − n( x ) 485− 9 ( 7.23)
2 2
2 14.5439

a = —y —bx— = 2.3 — 0.3465(7.23) ≅ — 0.2052

Como Ŷ = a + bX; entonces Ŷ = – 0.2052 + 0.3465X

c) Ŷ(3) = – 0.2052 + 0.3465(3) = 0.83

Uso del error total para determinar el ajuste


Una manera en que podemos medir el error de nuestra línea de estimación es mediante la
suma de todas las diferencias individuales, o errores, entre los puntos estimados y los
puntos observados, o en otras palabras son los valores de diferencia existente entre Y y Ŷ.
En el caso de que las sumas de estas diferencias sean cero se puede concluir que la ecua-
ción o ecuaciones de estimación describen muy bien los datos y con igual exactitud. No
obstante, cuando se tienen varias ecuaciones de estimación para los mismos puntos de
dispersión, debe tenerse en cuenta que, el criterio correcto para juzgar la bondad de ajus-
Regresión simple y correlación 289

te sería sumar los valores absolutos y la ecuación que presente el mínimo valor absoluto
de error, será la línea de mejor ajuste en la gráfica.
Ejemplo
Supóngase que dos ecuaciones de estimación presentan los resultados siguientes:
Ecuación 1 Ecuación 2
Y Ŷ |Y – Ŷ| Y Ŷ |Y – Ŷ|
4 4 0 4 5 1
7 3 4 7 4 3
2 2 0 2 3 1
4 5
Se puede apreciar que el error absoluto total de la ecuación 1 es menor que el error
absoluto total de la ecuación 2, por tanto, concluimos que la ecuación 1 es la que mejor
ajusta los datos.
Por otra parte, el estándar de la estimación nos proporciona la medición de confiabi-
lidad de la ecuación de estimación, proceso matemático que nos permite medir la variabi-
lidad o dispersión de los valores observador alrededor de la línea de regresión.
El error estándar de la estimación se puede calcular a través de:

∑(Y −Ŷ )
2

∑Y 2
− a∑Y − b ∑xy
Se = o Se =
N −2 n −2
A la segunda ecuación se le conoce como el método abreviado o más rápido para
determinar el error estándar de estimación, ya que nos evitamos los tediosos cálculos de
determinar el valor de Ŷ, pero ambas tienen el mismo propósito y exactamente se llega al
mismo resultado.
X = Valores de la variable independiente
Y = Valores de la variable dependiente
a = Intersección en Y o término independiente en Ŷ = a + bX
b = Pendiente en la ecuación Ŷ = a + bX
n = Número de parejas de datos.
Ejemplo
Consideremos la ecuación del ejemplo número 1 de la presente sección, donde:
X: 7 5 6 8 7 9 9 6 8
Y: 2 1.5 1.75 2.3 3.2 3.1 2.9 1.85 2.1
X Y XY X2 Y2
7 2 14 49 4
5 1.5 7.5 25 2.25
6 1.75 10.5 36 3.0625
8 2.3 18.4 64 5.29
7 3.2 22.4 49 10.24
9 3.1 27.9 81 9.61
9 2.9 26.1 81 8.41
6 1.85 11.1 36 3.4225
8 2.1 16.8 64 4.41
65 20.7 154.7 485 50.695
b = 0.3465
a = − 0.2052
290 CAPÍTULO 18

Calcule el error estándar de la ecuación de estimación Ŷ = – 0.2052 + 0.3465X

Solución
Utilizando la segunda fórmula Se =
∑Y 2
− a∑Y − b∑ xy
n −2
Entonces:

∑Y 2
− a∑Y − b∑xy 50.695 − (− 03.63)( 20.7 ) − ( 0.3465)(154.7 )
Se = = ≅ 0.41
n −2 8

Por tanto, Se = 0.41


Intervalos aproximados de predicción
Una manera de concebir el error estándar de la estimación consiste en considerarlo como
la herramienta estadística que podemos utilizar para hacer una formulación de probabili-
dad acerca del intervalo alrededor de un valor estimado de Ŷ, dentro del cual se halla el
valor real de Y.
La fórmula a utilizar está dada por Ŷ ± tSe
Recuerde que como en la mayoría de casos n siempre es normalmente pequeña y no
se conoce la desviación estándar poblacional, entonces se usa la tabla t de Student, de lo
contrario podemos utilizar la distribución normal.

Ejemplo
Supóngase que un complejo industrial invierte en reparaciones de equipo de acuerdo al
tiempo de uso que estos tengan (medido en años). Para trabajar con mayor exactitud en
el manejo del presupuesto el gerente ha determinado una ecuación de estimación dada
por Ŷ = 375 + 75X, con un error de 0.866 y donde X es el tiempo de uso en años y Ŷ el
costo en dólares por mantenimiento de cada equipo clasificación A.
Uno de los equipos de refrigeración tiene 4 años de uso y debe recibir mantenimiento
el próximo mes. Construya un intervalo de confianza de 95% en donde fluctuará el verda-
dero valor de Y.

Solución
El límite superior = Ŷ + tSe y el límite inferior = Ŷ – tSe
Como Ŷ = 375 + 75X, entonces: Ŷ (4) = 375 + 75(4) = 675
Entonces con n − 1 = 4 − 1 = 3 grados de libertad y una significancia de 5% se tiene
que t = 3.182, (ver tabla t de Student), luego.
LI = Ŷ − tSe = 675 − (3.182)(86.6) = 399.94 dólares
LS = Ŷ + tSe = 675 + (3.182)(86.6) = 950.56 dólares
Intervalo de fluctuación para Y, (399.94 ≤ Y ≤ 950.56)

EJERCICIOS 18.1
1. ¿Qué es el análisis de regresión?
2. En el análisis de regresión, ¿qué es una ecuación de estimación?
3. ¿Cuál es la finalidad del análisis de correlación?
Regresión simple y correlación 291

4. Defina las relaciones directas e indirectas


5. Un instituto de investigación científica ha estado estudiando las relaciones estadísti-
cas entre muchas variables diferentes y la fluctuación del precio del petróleo en el
mercado internacional. Una de las variables son los conflictos políticos (X) y el nú-
mero de meses que duran los conflictos políticos (Y) en 7 países diferentes durante
un período de 12 meses. ¿Qué relación, si hay, parece existir entre las dos variables?
¿Indica esto un efecto causal?
X 2000 1500 500 750 600 900 1000
Y 60 40 10 15 5 25 30
6. Para el siguiente conjunto de datos:
a) Grafique el diagrama de dispersión
b) Desarrolle la ecuación de estimación que mejor describa los datos
c) Determine Y para X = 10, 15 y 20.
x 13 14 11 17 9 13 17 18 12
y 1.0 2.0 0.8 2.2 0.5 1.1 2.8 3.0 1.2
7. Si tenemos el siguiente conjunto de datos:
x: 56 48 42 58 40 39 50
y: 9,5 7.5 7.0 9.5 6.2 6.6 8.7
a) Encuentre la línea del mejor ajuste
b) Calcule el error estándar de estimación
c) Calcule el intervalo de predicción con un nivel de 95% de confianza para la varia-
ble dependiente cuando X es igual a 44.
8. Un estudio, efectuado en el año 2010 por la Dirección General de Transporte sobre
el efecto que el costo del pasaje tuvo en el número de pasajeros para los autobuses
utilizados por las mujeres trabajadoras de menores recursos económicos que reque-
rían trasladarse desde sus hogares a los centros de trabajo, produjo los siguientes re-
sultados:
Precio pasaje (en lempiras) 15 20 25 30 35 40 45 50
Pasajeros por 100 kilómetros 440 430 430 370 360 340 350 350
a) Grafique estos datos
b) Desarrolle la ecuación de estimación que mejor describa estos datos
c) Determine el número de mujeres trabajadoras, si el precio del boleto fue de 35
lempiras. Use un intervalo aproximado de predicción de 95%.
9. La unidad de emergencia de COPECO ha reunido datos sobre el número de acciden-
tes menores de tránsito y el número de personas accidentadas durante los últimos
siete fines de semana.
X (número de personas accidentadas) 20 30 10 12 15 25 34
Y (accidentes menores) 6 9 4 5 7 8 9
a) Grafique los datos anteriores
b) Desarrolle la ecuación de estimación que mejor describa estos datos
c) Determine el número de accidentes menores de tráfico que ocurrirán en un fin de
semana durante el cual se atendieron en la sala de emergencia a 33 personas con
lesiones.
d) Calcule el error estándar de la estimación.
10. En la contabilidad de costos, con frecuencia se trata de estimar los gastos indirectos
basándose en el número de pacientes atendidos. La gerencia de un hospital público
en la zona sur del país, ha reunido información sobre esos gastos y el número de pa-
cientes atendidos en las diferentes áreas de asistencia médica.
292 CAPÍTULO 18

Gastos indirectos 191 170 272 155 280 173 234 116 153 178
Pacientes atendidos 40 42 53 35 56 39 48 30 37 40
a) Desarrolle la ecuación de regresión para los que trabajan en la contabilidad de cos-
tos de dicho hospital;
b) Prediga el gasto general cuando se atiendan a 50 pacientes;
c) Calcule el error estándar de la estimación.

18.2  Análisis de correlación


El análisis de correlación es la herramienta estadística para describir los tipos de relación
y el grado en el que están relacionadas las variables. A menudo este análisis se usa con el
análisis de regresión para medir la eficacia con que la línea de regresión explica la varia-
ción de la variable dependiente.
Los estadísticos han inventado dos medidas especiales para describir la correlación
entre dos variables:
a) El coeficiente de correlación;
b) El coeficiente de determinación.

El coeficiente de correlación y de determinación


El coeficiente de correlación sirve para determinar si la correlación es directa o inversa-
mente proporcional, o la no existencia de correlación o relación entre las variables.
Notas importantes:
1. El coeficiente de correlación lo identificaremos por “r” y éste solo puede tomar valo-
res en el intervalo −1 ≤ r ≤ 1.
2. Sí r = 1 o r = −1, todos los puntos del diagrama de dispersión caen sobra una línea
recta, entonces decimos que las dos variables están en relación lineal perfecta.
3. Si toma un valor positivo (0 < r < 1), la relación es directamente proporcional.
4. Si toma un valor negativo (−1 < r < 0), la relación es inversamente proporcional.
5. Si r = 0, se dice que no existe relación lineal entre las variables.
El coeficiente de correlación puede calcularse mediante cualquiera de las siguientes
fórmulas:
S ( xy )
a) r =
S ( xx ) S ( yy )
∑x∑ y
S ( xy ) = ∑xy −
Donde: n
(∑x)
2

S ( xx ) = ∑x 2

n

S ( yy ) =∑ y2 −
(∑y) 2
n

b)  r =
∑(Y − Ŷ )2 o,
∑(Y − Y )2
a∑Y − b∑xy −n (Y )
2

c) r =
∑Y 2 − n (Y )2
Regresión simple y correlación 293

El coeficiente de determinación es el cuadrado del coeficiente de correlación y lo re-


presentaremos por r2. Por otra parte, es la medida utilizada para saber en que grado por-
centual están relacionadas las variables.

Ejemplo
Un investigador recolecta la siguiente información sobre la influencia de los programas de
televisión y los grados de violencia en dichos programas, para lo cual estableció una esca-
la del 1 al 10, y recopiló el porcentaje de televidentes que ven dichos programas del modo
siguiente:
Programa Grado de violencia (x) % De televidentes (y)
1 10 15
2 20 16
3 30 20
4 40 24
5 40 25
6 50 30
7 55 30
8 65 35
9 70 35
10 70 35

a) Encuentre el coeficiente de correlación;


b) Encuentre el coeficiente de determinación;
c) Haga una conclusión con respecto al valor de r;
d) En qué % están relacionadas las variables.

Solución inciso a)

X Y X2 Y2 XY
10 15 100 225 150
20 16 400 256 320
30 20 900 400 600
40 24 1600 576 960
40 25 1600 625 1000
50 30 2500 900 1500
55 30 3025 900 1650
65 35 4225 1225 2275
70 35 4900 1225 2450
70 35 4900 1225 2450
450 265 24150 7557 13355

∑ x∑ y ( 450 )( 265 )
S ( xy ) = ∑ xy − = 13355 −
n 10

S ( xx ) = ∑ x2 −
( ∑x ) 2

= 24150 −
( 450 )2
= 3900
n 10

S ( yy ) = ∑ y2 −
( ∑y )2 = 7557 − ( 265 )2 = 534.5
n 10

S ( xy )
Ahora como r = , entonces:
s ( xx ) S ( yy )
294 CAPÍTULO 18

S ( xy ) 1430
r= = ≅ 0.9904
S ( xx ) S ( yy ) ( 3900 )( 534.5 )
Entonces el coeficiente de correlación es r = 0.9904
Solución inciso b)
Como el coeficiente de determinación es el cuadrado del coeficiente de correlación, en-
tonces: r2 = (0.9904)2 ≅ 0.9808
Entonces: r2 = 0.9808
Solución inciso c)
Como r = 0.9904, la relación es directamente proporcional, y 0.9904 es un valor muy
cercano a 1, o sea que las variables están muy bien relacionadas.
Solución inciso d)
El porcentaje de relación entre las variables está dado por:
% = r2x100 = 0.9808x100 = 98.08%
Las variables están relacionadas en 98.08%, o sea que, a mayor violencia en los pro-
gramas de televisión, mayor es el porcentaje de televidentes.
Nota: A la fórmula utilizada en este ejemplo, se le conoce como el coeficiente de correla-
ción de Pearson, en honor al matemático británico Karl Pearson quien vivió en los años
1837 a 1936, y que, según algunos historiadores, se le considera como el fundador de la
estadística. Karl Pearson trabajó en muchos campos de la matemática y por ende en el
tema que nos atañe, y fórmulas como las siguientes llevan su nombre.
S ( xy )
r=
S ( xx ) S ( yy )
∑ x∑ y
S = ( xy ) =∑ xy −
n

S = ( xx ) =∑ x2 −
(
∑x
2
)
n

S = ( yy ) =∑ y2 −
( ∑y )2
n

EJERCICIOS 18.2
1. Una editorial en la región centroamericana, edita revistas sobre salud física y men-
tal. Los empleados han estado tratando de persuadir al dueño de la casa editora para
que mejore las condiciones de trabajo en el taller de prensa. Están convencidos, de
que el nivel de ruido cuando las prensas están funcionando, produce niveles nocivos
de tensión y ansiedad. Hace poco se administró un test psicológico durante el cual los
trabajadores del taller fueron puestos en cuartos con diversos niveles de ruido. La si-
guiente tabla muestra el índice de su grado de excitación o nerviosismo y el nivel del
ruido al que fueron expuestos. (1.0 es un nivel bajo y 10.0 es un nivel alto)
Nivel del ruido 4 3 1 2 6 7 2 3
Grado de exaltación 39 38 16 18 41 45 25 38
Regresión simple y correlación 295

a) Grafique estos datos.


b) Desarrolle una ecuación de estimación que describe los datos anteriores.
c) Determine el grado de excitación que cabe esperar cuando el nivel de ruido es 5.
e) Calcule r y r2, utilice los valores de r y r2 para hacer una conclusión sobre la corre-
lación de las variables y el porcentaje de asociación entre ellas.
2. Calcule el coeficiente muestral de determinación y el de correlación de los datos en
el ejercicio 5, de la sección 18.1
3. Calcule el coeficiente muestral de determinación y el de correlación de los datos en
el ejercicio 6, de la sección 18.1
4. Calcule el coeficiente muestral de determinación y el de correlación de los datos en
el ejercicio 7, de la sección 18.1
5. a) Calcule el coeficiente muestral de determinación y el de correlación de los datos
en los ejercicios 8, 9 y 10, de la sección 18.1
b) Establezca una conclusión respecto a r.
c) ¿En qué porcentaje están relacionadas las variables?

18.3 Pendiente de la línea de regresión de la población


y error estándar del coeficiente de regresión
La línea de regresión deriva de una muestra y no de la población entera. Por ello, no po-
demos esperar que la verdadera ecuación de regresión, Y = A + BX (la de la población
entera) sea exactamente a la de la ecuación de las observaciones de la muestra o sea
Ŷ = a + bX. Pese a ello, podemos utilizar el valor de b, la pendiente que calculamos de una
muestra, para probar las hipótesis referentes al valor de B, o sea la pendiente de la línea
de regresión de la población entera.
El procedimiento para probar una hipótesis acerca de B, es similar a los que se des-
criben en los capítulos en donde se desarrollaron pruebas de hipótesis en general. Para
entender este procedimiento podemos establecer la ecuación de regresión Ŷ = a + bX,
para la cual Ŷ = 20 + 2X.
El primer paso consiste en encontrar algunos valores de en la ecuación de la pobla-
ción entera Y = A + BX y compararlos con b = 2. Supóngase que, a través de un largo
período, la pendiente de la relación entre X y Y fue de 2.1. Para probar si sigue siendo así,
podríamos definir las hipótesis como:
H0∶ B = 2.1 Hipótesis nula
H1∶ B ≠ 2.1 Hipótesis alternativa.
En efecto, estamos probando si los datos actuales indican que B ha cambiado su valor
histórico de 2.1.
Error estándar del coeficiente de regresión
Para encontrar el estadístico de la prueba para B, es necesario calcular antes el error es-
tándar del coeficiente de regresión. En este caso, el coeficiente con que estamos trabajan-
do es b, de manera que su error estándar se denota por Sb, y se calcula a través de:
Se
Sb =
∑X 2 −n ( X )
2

Sb = Error estándar del coeficiente de regresión


Se = Error estándar de la estimación
Donde: X = Valores de la variable independiente

X = Media de los valores de la variable independiente
n = Número de puntos de datos
296 CAPÍTULO 18

Nota: recuerde que Se o error estándar de la estimación puede calcularse mediante cua-


lesquiera de las dos fórmulas siguientes:

∑(Y −Y )
2
∑ Y 2 − a∑Y −b∑xy
Se = o Se =
n −2 n −2

Una vez calculado Sb, podremos emplear la distribución t de Student con n – 2 grados
de libertad y también la siguiente ecuación para calcular los límites inferior y superior de
la región de aceptación:
Límite superior = b + t(Sb)
Límite inferior = b – t(Sb)
t = Valor aproximado de t (con n – 2 grados de libertad) para el nivel de signifi-
cancia de la prueba.
Donde: b = Pendiente real que se supone para la población
Sb = Error estándar del coeficiente de regresión
Ejemplo
Si:
X: 7 5 6 8 7 9 9 6 8
Y: 2 1.5 1.75 2.3 3.2 3.1 2.9 1.85 2.1

a) Calcular el error estándar de la estimación;


b) Calcular el error estándar del coeficiente de regresión;
c) Usando una significancia de 10%, establezca los límites inferior y superior;
d) Establezca la interpretación del intervalo de confianza.

Solución inciso a)

X Y XY X2 Y2
7 2 14 49 4
5 1.5 7.5 25 2.25
6 1.75 10.5 36 3.0625
8 2.3 18.4 64 5.29
7 3.2 22.4 49 10.24
9 3.1 27.9 81 9.61
9 2.9 26.1 81 8.41
6 1.85 11.1 36 3.4225
8 2.1 16.8 64 4.41
65 20.7 154.7 485 50.695

∑xy − nxy 154.7 − 9 ( 7.23)( 2.3) 5.039


b= = ≅ 0.3465
∑x2 − n ( x )2 458 − 9 ( 7.23)2 14.5439

a = –y − bx– = 2.3 − 0.3465(7.23) ≅ − 0.2052


Como Ŷ = a + bX; entonces Ŷ = − 0.2052 + 0.3465X
Calculando el error estándar de la ecuación de estimación Ŷ = − 0.2052 + 0.3465X

∑Y 2 − a∑Y − b∑xy
Utilizando la segunda fórmula Se =
n −2
Regresión simple y correlación 297

Entonces:

∑Y 2 − a∑Y −b∑xy 50.697− (−0.2052 )( 20.7 ) −( 0.3465 )(154.7 )


Se = = ≅ 0.41
n −2 8

Por tanto, Se = 0.41


Solución inciso b)
Se 0.14 0.14
Sb = = = ≅ 0.1075
∑X 2 −n ( X ) 2
485 −( 9 )( 7.23)
2 14.5439

Sb = 0.1075
Solución inciso c)
Como:
Límite superior = b + t(Sb)
Límite inferior = b − t(Sb)
Pero como Ŷ = − 0.2052 + 0.3465X; entonces podemos asumir que b = 0.3465;
Sb = 0.1075 y como n = 9, entonces con n – 2 grados de libertad, tenemos 7 grados de
libertad y α = 0.10, de la tabla de t de Student, se tiene que t = 1.895.
Límite superior = b + t (Sb) = 0.3465 + (1.895)(0.1075) ≅ 0.55
Límite inferior = b − t (Sb) = 0.3465 − (1.895)(0.1075) ≅ 0.14
Solución inciso d)
Así pues, en esta situación, tenemos una seguridad de 90% de que el verdadero valor de B
se halla entre 0.14 y 0.55.

EJERCICIOS 18.3
1. En un problema de regresión con una muestra de tamaño 20, se observó que la pen-
diente era de 1.52 y el error estándar de estimación era de 50.375. La cantidad

(ΣX 2 – n(X )2) = 1200.37
a) Calcule el error estándar del coeficiente de la pendiente de regresión;
b) Construya un intervalo de confianza de 95% para la pendiente de la población;
c) Interprete el anterior intervalo de confianza.
2. Los supervisores de las empresas de limpieza a menudo quieren saber cuál es el costo
por metro cuadrado para desinfectar las áreas con mayor contaminación en los hos-
pitales y clínicas. A continuación, se incluyen algunos datos sobre la superficie en
metros cuadrados y el costo en lempiras en 11 hospitales y clínicas en sus áreas de
emergencia y de pacientes internos.

Área: 1.1 1.5 1.6 1.6 1.4 1.3 1.1 1.7 1.9 1.5 1.3
Valor (Lps.) 40 49 54 51 48 46 41 56 62 50 45

a) Calcular el error estándar de la estimación;


b) Calcular el error estándar del coeficiente de regresión;
c) Usando una significancia de 10%, establezca los límites inferior y superior;
d) Establezca la interpretación del intervalo de confianza.
298 CAPÍTULO 18

3. Un supervisor de una maquila en San Pedro Sula, clasificó la muestra de 8 empleados


según el número de horas extras trabajadas y la antigüedad, como se muestra a conti-
nuación.

Horas extras 5.0 8.0 2.0 4.0 3.0 7.0 1.0 6.0
Antigüedad 1.0 6.0 4.5 2.0 7.0 8.0 4.5 3.0
a) Calcular la ecuación de estimación
b) Calcular el error estándar de la estimación;
c) Calcular el error estándar del coeficiente de regresión;
d) Usando una significancia de 5%, establezca los límites inferior y superior;
e) Establezca la interpretación del intervalo de confianza.
4. Usando los siguientes datos:

X 15 6 10 5 12 14
Y 6 16 15 18 9 10
a) Desarrolle la ecuación de estimación que mejor describa los datos.
b) Calcular Se y Sb
c) Determine los límites inferior y superior (use un α = 0.02);
CAPÍTULO

Regresión múltiple y
análisis de correlación 19
Contenido

19.1 Introducción
19.2 Deducción de la ecuación de regresión
múltiple
19.3 Técnicas de modelado
300 CAPÍTULO 19

Regresión múltiple y análisis de correlación


19.1 Introducción
La regresión múltiple y el análisis de correlación, tiene la misma finalidad que la regresión
simple, con la única diferencia que en la regresión múltiple la variable dependiente Y estará
sujeta a más de una variable independiente, identificadas por x1, x2, x3 , ⋯ , xn .
Dentro de la correlación múltiple nos interesarán temas como los siguientes:
a) Definir y calcular la ecuación de regresión múltiple;
b) Examinar el error estándar para la correlación múltiple;
c) Aplicar el análisis de correlación múltiple para averiguar con que eficacia describe la
ecuación de regresión para los datos observados.
19.2  Deducción de la ecuación de regresión múltiple
En el caso de que la variable dependiente Y esté sujeta a n variables, la ecuación de regre-
sión múltiple se desarrolla de la manera siguiente:
Ŷ = a + b1 X1 + b2 X2 + ⋯ + bn Xn
No obstante, para entender estos procesos nos limitaremos a que la variable depen-
diente Y estará sujeta a dos variables independientes, entonces la ecuación de regresión
múltiple estará dada por:
Ŷ = a + b1 X1+ b2 X2
Ŷ = Valor estimado correspondiente a la variable dependiente
Donde: a = Intersección en Y
X1 y X2 = Valores de dos variables independientes
b1 y b2 = Pendientes asociadas con x1 y x2, respectivamente.
Para determinar las incógnitas a, b1, b2 en la ecuación:
Ŷ = a + b1 X1 + b2 X2, y que debe resolverse mediante el siguiente sistema.
∑Y = na + b1 ∑ X1 + b2 ∑ X2
∑ X1Y = a ∑ X1 + b1 ∑ X 12 + b2 ∑ X1X2
∑ X 2Y = a ∑ X2 + b1 ∑ X 1 X 2 + b 2 ∑ X 22

Ejemplo
La siguiente tabla representa los datos recabados por una unidad de investigación de la
Policía Nacional de Honduras, en donde se representa el número de personas por semana
que llegan lesionadas a la sala de emergencia de un hospital público por accidentes de
tránsito o riñas, y si esta situación está relacionada por la ingesta de bebidas alcohólicas
y el bajo nivel educativo de los ciudadanos, en donde 50 representa un alto nivel de alco-
hol en la sangre y de 12 a 17 una escala especial de medición para nivel educativo.

No. de lesionados (Y) Nivel de alcohol (X1) Nivel educativo (X2)


29 45 16
24 42 14
27 44 15
25 45 13
26 43 13
28 46 14
30 44 16
28 45 16
28 44 15
27 43 15
Regresión múltiple y análisis de correlación 301

a) Determine la ecuación de regresión múltiple;


b) Estime el número de pacientes que se atenderían en una semana, si éstos al momento
de ingresar a la sala de emergencia tienen un 35 de nivel de alcohol en la sangre y un
nivel educativo de 12.

Solución inciso a)

Y X1 X2 X1Y X2Y X1X2 X12 X22 Y2

29 45 16 1305 464 720 2025 256 841


24 42 14 1008 336 588 1764 196 576
27 44 15 1188 405 660 1936 225 720
25 45 13 1125 325 585 2025 169 625
26 43 13 1118 338 559 1849 169 676
28 46 14 1288 392 644 2116 196 784
30 44 16 1320 480 704 1936 256 900
28 45 16 1260 448 720 2025 256 784
28 44 15 1232 420 660 1936 225 784
27 43 15 1161 405 645 1849 225 729
272 441 147 12005 4013 6485 19461 2173 7428

Ahora escribiendo del sistema,

∑ Y = na + b1 ∑ X1 + b 2 ∑ X
2
∑ X1Y = a ∑ X1 + b1∑ X12 + b2 ∑ X 1 X 2
∑ X 2Y = a ∑ X 2 + b1 ∑ X 1 X 2 + b 2 ∑ X 22

Tenemos:
272 = 10a + 141b1 + 147b2
12005 = 441a + 19461b1 + 6485b2
4013 = 147a + 6485b1 + 2173b2
Resolviendo el sistema, tenemos que:
a = – 13.828
b1 = 0.564
b2 = 1.099
Luego como Ŷ = a + b1X1 + b2X2, entonces:
Ŷ = – 13.828 + 0.564X1 + 1.099X2

Solución inciso b)
Con X1 = 35 y X2 = 12, tenemos:
Ŷ = –13.828 + 0.564X1 + 1.099X2
Ŷ = –13.828 + 0.564(35) + 1.099(12)
Ŷ = 19
En la sala de emergencia durante una semana cualesquiera y con los valores antes
mencionados, solo se esperaría atender unos 19 pacientes lesionados por efectos del alco-
hol y la vinculación del nivel educativo.
302 CAPÍTULO 19

EJERCICIOS 19.2
1. Si tenemos el siguiente conjunto de datos:

Y X1 X2
32 1.3 5.0
27 3.6 5.5
42 1.4 9.5
10 8.5 2.5
33 4.2 5.0
25 5.0 3.1

a) Calcule la ecuación de regresión múltiple


b) Prediga Y, cuando X1 = 4.8 y X2 = 4.0
2. La información anexa se ha obtenido de una muestra aleatoria de ciudadanos de los
alrededores de Tegucigalpa que visitan el Instituto Nacional de Migración para obte-
ner su pasaporte. Estamos interesados en predecir el costo en lempiras que cada
ciudadano paga por la cantidad de visitas que estos hacen a la institución estatal en
mención por problemas de información sobre requisitos, y la distancia que recorren
desde sus lugares de origen. A continuación, se presenta dicha información:

Cantidad de LPS No. de visitas Distancia recorrida


pagados (Y) (X1) en kilometros (X2)
180 2 12
160 6 5
200 3 6
205 4 7
210 3 4

a) Calcule la ecuación de regresión múltiple


b) Prediga Y cuando X1 = 4.8 y X2 = 4.0
c) ¿Qué comentarios puede hacer usted respecto a la relación de éstas variables?
3. Si tenemos los siguientes datos:

Y X1 X2 X3
74.6 5.3 3.5 5.8
90.8 6.1 4.7 6.2
64.2 5.0 3.6 5.4
93.4 7.0 4.9 8.8
77.7 5.5 4.1 6.0
60.2 3.8 2.9 5.0
96.6 7.2 5.2 7.6
34.3 2.1 2.2 3.1

Use cualquier paquete de computadora disponible,


a) Determine la ecuación de regresión;
b) Prediga los valores para X1 = 1.8, X2 = 4.2 y X3 = 5.1
4. Si tenemos los siguientes datos:
Regresión múltiple y análisis de correlación 303

X1 X2 X3 X4 Y
112.4 92.6 91.12 –0.2 8.22
115.7 70.4 92.4 0.5 27.39
114.8 81.8 89.6 0.2 19.46
111.8 101.4 90.9 –0.4 2.91
117.6 62.2 92.1 0.8 38.55
119.9 51.6 90.3 1.0 70.32
a) Determine la ecuación de regresión múltiple;
b) Prediga los valores para X1 = 120.8, X2 = 86.0, X3 = 95.2 y X4 = – 0.3
a) ¿Cuál es el error estándar de la estimación?
5. Ciertas personas afirman que las mujeres van más al médico, que los varones. Un in-
vestigador interesado en conocer como la variable género tiene alguna peculiaridad
en la asistencia de pacientes para el tratamiento de enfermedades comunes. Tomó los
siguientes datos de registros generados durante el año 2014 en un centro asistencial,
de la manera siguiente:

Meses No. mujeres (X1) No. hombres (X2) Total(Y)


Enero 110 50 160
Febrero 134 47 181
Marzo 115 61 176
Abril 142 59 201
Mayo 134 76 210
Junio 121 93 214
Julio 108 84 192
Agosto 114 74 188
Septiembre 102 40 142
Octubre 107 50 157
Noviembre 106 60 166
Diciembre 112 66 178
Total 1405 760 2165
a) Determine la ecuación de regresión múltiple;
b) Prediga el número de pacientes que podrían asistir a dicho centro en el mes de
marzo del año 2020, si X1 = 230, X2 = 66

19.3  Técnicas de modelado


Si tenemos una variable que queremos explicar y un conjunto de variables potenciales, tal
vez haya varias ecuaciones de regresión que podemos examinar, según las variables expli-
cativas que incluyamos y como lo hagamos.
A cada una de ésta ecuaciones se las llama modelo, y a las diversas formas o procesos
de adecuación de dichas ecuaciones, se le conoce como técnicas de modelado.
En todos los ejemplos de regresión que hemos examinado hasta ahora, los datos han
sido numéricos o cuantitativos. Pero en ocasiones trabajaremos con una variable que es
categórica o cualitativa.
Por ejemplo, la siguiente tabla representa el problema de discriminación sexual en el
desarrollo de algunas actividades realizadas por ambos sexos en los mismos períodos de
tiempo.
304 CAPÍTULO 19

Enfermeros Enfermeras
Meses de Salario base Meses de Salaro base
empleo (miles) empleo (miles)
6 7.5 5 6.2
10 8.6 13 8.7
13 9.1 15 9.4
18 10.3 21 9.8
30 13

Por el momento, ignoremos la antigüedad del empleo y apliquemos las técnicas ex-
puestas sobre pruebas de hipótesis para la diferencia entre las medias de dos poblaciones,
a fin de averiguar si los hombres con profesión de enfermeros ganaban más que las muje-
res con profesión de enfermeras. Probemos esto con α = 0.01, suponiendo que los enfer-
meros son la población 1 y las enfermeras son la población 2, estaremos probando:
H0∶ μ1 = μ2 No hay discriminación por sexo en los salarios base
Ha∶ μ1 > μ2 Si hay discriminadas referente al salario base
α = 0.01

Ahora se tiene que:


n1 = 5 n2 = 4
– –
X 1 = 9.7 X 2 = 8.525
S12 = 4.415 S22 = 2.609

SP2 =
( n1 − 1) S12 + ( n2 − 1)2s
n1 + n2 − 2
( 4 )( 4.415 ) +( 3)( 2.609 )
SP2 =
5 + 4 −2
Sp2 ≅ 3.641 y SP = SP2 = 3.642 ≅ 1.90814

1 1
Luego si: σ X1 −X2 = SP + = (1.90841)( 0.671) ≅ 1.28
n1 n2

Entonces: σ X1 −X2 = 12.28

Con 7 grados de libertad, el límite superior de la región de aceptación es 0 + (1.28)


– –
(2.998) = 3.837. Por otra parte el valor observado de X 1 – X 2 = 1.175.
Como 1.175 < 3.837, no podemos rechazar H0
Nuestro análisis concluye que no parece haber ninguna discriminación sexual en los
salarios base de trabajadores con profesión de enfermería. Pero recuérdese que hasta aho-
ra hemos ignorado en el análisis los datos referentes a la antigüedad.
Antes de proseguir con la exposición, examinemos un diagrama de dispersión de los
datos. En la siguiente figura los cuadritos corresponden a los enfermeros y los círculos a
las enfermeras, y la relación de los salarios base con la antigüedad.
Regresión múltiple y análisis de correlación 305

Salario
en miles

12

4
Meses
de empleo

4 8 12 16 20 24 28 30

El diagrama de dispersión nos muestra claramente que los salarios base aumentan
con la antigüedad; pero si se intenta ajustar a simple vista la línea de regresión, notará el
lector que los cuadritos tienden a estar sobre y los círculos tienden a estar debajo.
En estos casos de técnicas de modelado para adecuar la mejor línea de regresión,
debemos también de recurrir a otros procesos matemáticos importantes como lo es el
análisis de la salida de regresión referente al examen de los residuos. Si la regresión inclu-
ye todos los factores de explicación relevante, estos residuales deberían ser aleatorios. En
otras palabras, si los residuales muestran patrones no aleatorios, ello indica que hay algún
detalle sistemático que no hemos tomado en cuenta. Como conclusión sobre este acápite
buscamos patrones en los residuales o en términos coloquiales decimos: hay que exprimir
los residuales hasta que hablen.

EJERCICIOS 19.3

1. Describa tres situaciones de la vida diaria en las que las variables ficticias podrían
usarse en los modelos de regresión;
2. El director de transporte piensa que el incremento de la atención de ciudadanos de
escasos recursos económicos con respecto al uso del transporte público subsidiado
por el Estado, puede ser predicha a partir de mantener bajas tarifas en buses y taxis.
a) Mencione un modelo cuadrático que describa el número de pasajeros de escasos
recursos económicos que usan el transporte público. Establezca la forma de la
ecuación de regresión;
b) Se ha dicho que la ciudad en donde se movilizan estos ciudadanos las tarifas son
cómodas y accesibles debido al subsidio gubernamental. Extienda el modelo soli-
citado utilizando una variable ficticia para incorporar la sugerencia. También ex-
prese la forma del modelo de regresión.
3. La doctora Linda Sánchez dirige una clínica médica en Honduras. La doctora reunió
datos sobre la edad, reacción a la penicilina y presión sanguínea sistólica en 17 pa-
cientes. Estableció la presión como la variable dependiente, la edad como X1 y la re-
acción a la penicilina como X2. Suponiendo que 0 representa una reacción positiva a
la penicilina y que 1 representa una reacción negativa, realizó una regresión múltiple
con el programa SAS. La ecuación de predicción fue: Ŷ = 12.6 + 3.0X1 + 0.572X2
306 CAPÍTULO 19

a) Después que la regresión ya había sido corrida, la doctora Sánchez descubrió que
había tenido la intención de codificar como 1 una reacción positiva y como 0 la
reacción negativa. ¿Tiene que volver a correr la regresión?, si su respuesta es afir-
mativa explique por qué. Y si su respuesta es negativa dele la ecuación que habría
obtenido si la variable hubiera sido codificada como ella pretendía originalmente.
b) Si Sb2 tiene un valor de 0.12, ¿hay evidencia en un nivel de significancia de 0.05 de que
la reacción a la penicilina es una variable explicativa significativa de la presión sanguí-
nea sistólica?
CAPÍTULO

Estadística no
paramétrica 20
Contenido

20.1 Prueba de signos para datos pareados


20.2 Prueba U de Mann-Whitney
20.3 Prueba de Kruskal-Wallis
20.4 Prueba corridas de una sola muestra
20.5 Prueba correlación de rango de Spearman
20.6 Prueba de Kolmogorov-Smirnov
308 CAPÍTULO 20

Estadística no paramétrica
En fechas recientes los estadísticos han desarrollado técnicas útiles que no hacen suposi-
ciones restrictivas sobre la forma de las distribuciones de población. A estos métodos o
técnicas se les conoce con el nombre de no paramétricas. Las hipótesis de una prueba
no paramétrica se ocupan de otra cosa que no es el valor de un parámetro de la población.
Se dispone de varias de éstas pruebas, pero en el presente capítulo examinaremos solo
unas cuantas de las mejor conocidas y de mayor uso.
Ventajas de los métodos no paramétricos
1. No exigen hacer la suposición de que una población está distribuida en la forma de
una curva normal o tiene otra forma específica;
2. En general, son más fáciles de llevar a cabo y de entender.

Desventajas de los métodos no paramétricos


1. Ignoran cierta cantidad de información;
2. A menudo no son tan eficientes o exactos.

20.1  Prueba de signos para datos pareados


Esta prueba sirve a menudo para comparar cambios operados en dos conjuntos de datos,
o sea estas diferencias pueden ocurrir o no.
Notas importantes:
1. El valor de la probabilidad de éxito hipotizado o sea PH y el de fracaso hipotizado
0
qH , siempre asumen el valor de 0.50.
0
PH 0 q H0
2. El cálculo del error estándar se hace a través de σ P = , donde n es el nuevo
n
tamaño de la muestra o número de parejas que no se anularon.
3. Al restar los valores pareados de ambas muestras, estas generan signos más (+), me-
nos (–) o ceros.
4. Si las muestras no se ven afectadas por el transcurso del tiempo, se pueden restar los
elementos de la muestra I de las de los de la muestra II o viceversa, situación que no
altera el resultado.
5. Si las muestras están relacionadas con el tiempo (datos ocurridos antes y después);
debe restarse obligatoriamente los datos del después menos los del antes.

Ejemplo
Antes 5 9 4 3 1 7 6
Después 6 10 3 3 2 5 8
+ + – 0 + – +
6. En esta prueba puede utilizarse la distribución normal sí y solo si np > 5
7. Si utiliza la prueba normal construya el intervalo de confianza para los límites de
fronteras mediante PH ± Zσ P–.
o
∑+
8. El estadístico de prueba a utilizar se calcula mediante P = , y se utiliza sí y solo
n
si ∑+ > ∑–. De ocurrir lo contrario el estadístico de prueba a utilizar debe ser
∑−
P= . Sin embargo, al trabajar con una cola izquierda debe trabajarse con la
n
sumatoria de signos menor y en el caso de la cola derecha debe hacerse con la suma-
toria de signos mayor.
Estadística no paramétrica 309

9. Con mucha frecuencia se utiliza la prueba de hipótesis apoyada en la distribución


binomial bajo los siguientes criterios:
a) El valor de frontera será el valor de significancia dado en el problema y que se
cumpla que np ≤ 5.
b) La probabilidad de P(x)se determina por P(x ≥ ∑+)si y solo si ∑+ > ∑–; o P(x
≥ ∑–) si y solo si ∑– > ∑+.
c) Para rechazar o aceptar a H0 compare los resultados de P(x ≥ ∑+) o P(x ≥ ∑–)
según sea el caso, con el valor de α.
d) Si P(x) > α acepte a H0 de lo contrario rechace.
e) Las pruebas pueden hacerse para dos extremos o un extremo, dependiendo de la
especificación del problema.

Ejemplo
Los siguientes datos muestran las tasas de trabajo defectuoso de los empleados de una
droguería antes y después de un cambio en el plan de incentivos. Compare los dos conjun-
tos de datos anexos para comprobar si con el cambio disminuyen el número de trabajos
defectuosos producidos en medicamentos tradicionales. Utilice un nivel de significancia
de 0.10.

Antes 8 7 6 9 7 10 8 6 5 8 10 8
Después 6 5 8 6 9 8 10 7 5 6 9 5

Solución
a) H0∶ PH = 0.50 (Disminuyeron los trabajos defectuosos)
0
Ha∶ PH < 0.50 (No disminuyeron los trabajos defectuosos)
0
α = 0.10
b)
Antes 8 7 6 9 7 10 8 6 5 8 10 8
Después 6 5 8 6 9 8 10 7 5 6 9 5
– – + – + – + + 0 – – –

∑– = 7; ∑+ = 4 y n = 11
Como ∑– > ∑+, trabajaremos con la ∑–; por otra parte como np = (11)(0.5) =
5.5 > 5.0, es más conveniente utilizar la distribución normal.
7 ∑−
Entonces el estadístico de prueba estaría dado por: P = =
≅ 0.64 , pero se-
n 11
gún el numeral 8 y el planteamiento de la hipótesis alternativa debemos trabajar con la
∑+ 4 ≅
sumatoria menor, por tanto, calcularemos el estadístico de prueba por P = = 0.36
n 11
a) Cálculo de error y las fronteras:
PH 0 q H0 (0.5)(0.5) ≅
σP = = 0.1507
n 11
LI = PH – Zσ P– = 0.5 – (1.28)(0.1507) = 0.31
0
310 CAPÍTULO 20

Zona de aceptación
Zona de rechazo

0.31 pH = 0.5
0


P = 0.36

Conclusión
Se acepta H0; el incentivo no hizo producir cambios en los trabajos defectuosos produci-
dos por los empleados de la droguería.
Un comentario final sobre la prueba de signos
Una prueba de signos como la anterior, es muy sencilla de llevar a cabo y se aplica por
igual a las pruebas de un extremo y a las de dos extremos. Por lo regular se basa en la
distribución binomial. Pero no se olvide que pudimos emplear la distribución normal a la
distribución binomial como nuestra distribución de muestreo, porque tanto np como nq
eran mayores que 5. Si no se cumplen tales condiciones, es preciso aplicar entonces la
distribución binomial.

EJERCICIOS 20.1
1. Mediante una escala especial de medición del desempeño, el personal de un hospital
psiquiátrico, revisan los métodos de atención de sus pacientes antes y después de la
implementación de un nuevo método de mejoras para su asistencia. Use la prueba de
signo para verificar si existe una diferencia entre los métodos de asistencia en servi-
cios utilizados antes y después de establecer una nueva política. Use el nivel de signi-
ficancia de 0.5.

Antes 15 17 16 19 17 20 18 16 15 18 20 18
Después 13 15 18 16 19 18 20 17 15 16 19 15

2. Los siguientes datos muestran el desempeño del antes y el después de los empleados
de una cadena de farmacias en Tegucigalpa, después de recibir un incremento sala-
rial. Compare los dos conjuntos de datos anexos para comprobar si con el incremen-
to salarial mejoró el desempeño de los empleados de la cadena de farmacias en
mención. Utilice un nivel de significancia de 0.10.

Antes 7 6 5 8 6 6 6 7 8 9 4 5 5 5 6 5 7
Después 7 7 7 8 7 5 8 8 8 7 6 7 8 9 6 6 7

3. Los administradores y supervisores de los procesos de cobro de cuentas atrasadas en


hospitales privados de San Pedro Sula, están interesados en verificar si existe diferen-
cia entre el número de días requeridos para cobrar una cuenta antes y después de es-
tablecer una nueva política de cobro para sus clientes. Use un nivel de significancia
del 0.05.
Estadística no paramétrica 311

Antes 32 35 33 36 44 41 36 32 39 31 47 30 34 29 41
Después 36 37 34 40 40 42 36 40 42 33 46 29 38 35 39

4. Un grupo de ingenieros especializados en biometría, quieren saber si su nuevo equipo


óptico láser para operaciones de ojos, tiene mejor rendimiento y satisfacción en los
pacientes con la nueva tecnología láser en sustitución de los aparatos anteriores. Me-
diante una encuesta y una escala especial, se registra la siguiente información:

Antes 2 3 5 3 4 4 4 3 3 4 6 7 5 4 6 3 3 4
Después 3 3 6 5 5 6 6 4 5 6 7 7 7 6 6 4 4 4

¿Existe diferencia entre el antes y el después a raíz del cambio a la tecnología láser?
Use la prueba de signos pareados y un nivel de significancia del 5%.
5. Una organización internacional asegura que la conducta sexual de los jóvenes ha
cambiado a raíz de las campañas para la prevención de enfermedades de transmisión
sexual. Un investigador interesado por corroborar esta información, verifica los regis-
tros en varios centros hospitalarios del país, obteniendo la siguiente información:

Antes 132 145 169 174 118 125 134


Después 130 144 150 155 126 128 139

Use la prueba de signos y exprese si se puede respaldar la información del organismo


internacional. Use un nivel de significancia de 2%.

20.2 Prueba U de Mann-Whitney
Cuando se tienen exactamente dos poblaciones en estudio, la prueba U de Mann-Whitney
es la indicada para determinar si las muestras independientes fueron extraídas de la mis-
ma población o de distintas poblaciones con la misma distribución.
En ésta prueba haremos uso de las siguientes fórmulas:
n1n2
a) µ U = (media de U)
2

n1n2 ( n1+ n2 +1)


b) σ U = (error estándar de U)
12
n1 ( n1+ n2 +1) n2 ( n2+ 1)
c) U = n1n2 + − R1 o U = n1n2 + − R2
2 2

R1 = Suma de los rangos de las observaciones de la variable 1


R2 = Suma de los rangos de las observaciones de la variable 2
Donde: U = Estadístico de prueba U-Mann-Whitney
n1 = Tamaño de la muestra 1
n2 = Tamaño de la muestra 2
Notas especiales
1. No necesariamente n1 = n2
2. Si hay repetición en los datos, para el valor o valores de los rangos use el dato genera-
do por la media aritmética de dichos rangos.
312 CAPÍTULO 20

3. Para la prueba puede usar cualquiera de los estadísticos U.


4. Los límites o fronteras estarán determinados por: μU ± ZσU
5. La distribución del estadístico U puede ser aproximada por la distribución normal,
cuando tanto el tamaño de la muestra 1 como el tamaño de la muestra 2, sean mayo-
res que 10.
Ejemplo
Los siguientes datos muestran las horas anuales que, por enfermedad, 24 empleados y
empleadas faltaron a sus labores en una empresa. En el nivel de significancia de 0.10, ¿hay
alguna diferencia atribuible al sexo?
Hombres: 42 31 32 45 51 56 71 45 26 81 34 50
Mujeres: 44 39 32 34 58 61 62 40 23 25 31 32
Solución
a) H0∶ μ1 = μ2
Ha∶ μ1 ≠ μ2
α = 0.10
b) Cálculo de los rangos
Rangos Dato Clase (H o M) Rango H (R1) Rango M (R2)
1 23 M 1
2 25 M 2
3 26 H 3
4 31 H 4.5
5 31 M 4.5
6 32 H 7
7 32 M 7
8 32 M 7
9 34 M 9.5
10 34 H 9.5
11 39 M 11
12 40 M 12
13 42 H 13
14 44 M 14
15 45 H 15.5
16 45 H 15.5
17 50 H 17
18 51 H 18
19 56 H 19
20 58 M 20
21 61 M 21
22 62 M 22
23 71 H 23
24 81 H 24
∑R1 =169 ∑R2 =131
Estadística no paramétrica 313

n1 ( n1 + 1) 12 (12 +1)
c) U = n1n2 + − R1 = (12)(12)+ −169 = 53 , entonces U = 53
2 2

n1n2 ((12)12)
µU = = =72; entonces: µ U = 72 ;
2 2
n1n2 (n1 + n2 +1) (12)(12)(12 + 12 +1)
σU = = ≅ 17.32; entonces: σU = 17.32
12 12

d) μU ± ZσU = 72 ± (1.645)(17.32) = (43.51, 100.49)

Zona de aceptación

Zona de rechazo Zona de rechazo

43.51 100.49
μU = 72

U = 53

Se acepta H0; en cuanto a enfermarse no hay diferencia atribuible al sexo.

EJERCICIOS 20.2

1. Las autoridades encargadas de la prevención de enfermedades infectocontagiosas en


Honduras, aseguran que la conducta sexual de los hondureños y hondureñas sobre
enfermedades de transmisión sexual, tienen una aptitud de no prevenirse y que esta
conducta es más alta en los varones que en las mujeres. Se lleva a cabo una investiga-
ción en personas que en el transcurso de un año, al menos fueron tratados de una
enfermedad de transmisión sexual, obteniéndose la siguiente información:

Mujeres 1320 1450 1692 1741 1184 1254 1343


Hombres 1302 1445 1507 1559 1264 1286 1398

En un nivel de significancia de 10%, use la prueba de U Mann-Witney para verificar si


existe diferencia de género según lo expresado por las autoridades de salud.
2. Los supervisores del transporte aéreo internacional manifiestan que ya no existe dife-
rencia en los días hábiles y no hábiles para que las personas viajen fuera del país. Un
estudiante de psicología de la UNICAH, reúne información sobre las estadísticas re-
gistradas en vuelos de una pequeña línea aérea internacional, de la siguiente manera.

Número de pasajeros en días hábiles 20 17 14 17 13 15 11  9 16 14


Número de pasajeros en días no hábiles 21 18 15 17 14 18 16 12 17 22

 n un nivel de significancia de 5%, ¿puede dársele la credibilidad a la afirmación de


E
los supervisores del transporte aéreo internacional de Honduras?
314 CAPÍTULO 20

3. Los empresarios dedicados a la venta de medicinas dicen que las promociones y anun-
cios no dejan ninguna ganancia significativa para sus empresas (droguerías y farmacias).
Un administrador reúne información para verificar dichas afirmaciones y encuentra los
datos siguientes de clientes atendidos por semana con y sin promociones en los tres
complejos comerciales más grandes de la Ciudad de Tegucigalpa.

Con promoción 320 450 692 741 484 254 343


Sin promoción 302 445 507 559 264 286 398
¿ Tiene alguna credibilidad las aseveraciones de estos empresarios? Use un nivel de
significancia de 5%.
4. Un consorcio multifuncional contrata a casi todos sus nuevos ejecutivos de los egre-
sados de dos grandes universidades del país (una pública y una privada). En el último
año empezaron a administrar una prueba a profesionales recién titulados que ingresa-
ban al consorcio multifuncional, pues querían determinar cuál universidad formaba
mejor a sus alumnos en las diferentes carreras. Basándose en las siguientes puntuacio-
nes (entre 100 puntos posibles), ayude al personal de investigación a determinar si las
universidades difieren en la calidad de enseñanza. Aplique una prueba U Mann-Whit-
ney con un nivel de significancia de 6%.

Universidad Pública 97 69 73 84 76 92 90 88 84 87 93
Universidad Privada 88 99 65 69 97 84 85 89 91 90 87 91 72

20.3  Prueba de Kruskal-Wallis


Esta prueba es aplicada a tres o más poblaciones y la misma es una extensión de la prueba
U de Mann-Whitney.
El estadístico de prueba lo denotaremos por KW y lo calcularemos a través de:
12 R2j
KW = ∑
n ( n+1) n j
− 3 ( n +1)

nj = Número de elementos en la muestra j


R = Suma de los rangos de todos los elementos de la muestra j
Donde: j
K = Número de muestras en la prueba
n = n1 + n2 + n3 + ⋯ + nk
Notas
1. En esta prueba, si al menos todas las muestras tienen 5 observaciones, ésta puede
aproximarse por la distribución Ji-cuadrada.
2. El número de grados de libertad para el uso de la tabla Ji-cuadrada es: K-1, donde K
es el número de muestras.
3. Los tamaños de las muestras pueden ser iguales o diferentes entre sí.

Ejemplo
En una droguería de la Ciudad de Tegucigalpa, todos los pagos son realizados en lempiras,
separados de acuerdo a la forma de pago. Pruebe la hipótesis de que no existe diferencia
en la cantidad de lempiras (en miles) recibidos por pagos en efectivo, cheque o tarjeta de
crédito.

Pagos con tarjeta de crédito 78 64 75 45 82 69 60


Pagos con cheque 110 70 53 51 61 68
Pagos en efectivo 90 68 70 54 74 65 59
Estadística no paramétrica 315

Use la prueba Kruskal-Wallis con un nivel de significancia de 5%.

Solución
a) H0∶ μ1 = μ2 = μ3 (No hay diferencia)
Ha∶ μ1 ≠ μ2 ≠ μ3 (Si hay diferencia)
α = 0.05
b) Cálculo de los rangos

Rangos Datos Forma de pago TC(R1) CH(R2) E(R3)


1 45 TC 1
2 51 CH 2
3 53 CH 3
4 54 E 4
5 59 E 5
6 60 TC 6
7 61 CH 7
8 64 TC 8
9 65 E 9
10 68 E 10.5
11 68 CH 10.5
12 69 TC 12
13 70 CH 13.5
14 70 E 13.5
15 74 E 15
16 75 TC 16
17 78 TC 17
18 82 TC 18
19 90 E 19
20 110 CH 20

∑R1 =78 ∑R2 =56 ∑R3 =76


c) Con n = 20; R1 = 78; R2 = 56; R3 = 76
R2j 2 2 2
12 12 (78) (56) (76)
KW = ∑
n ( n +1) n j
− 3( n +1) =
20 (20+1) 7
+
6
+
7
− 3 (20 +1)

KW ≅ 0.34
d) Luego K-1 grados de libertad 3 – 1 = 2gl y α = 0.05 de la tabla Ji-cuadrada se tiene
que χU2 = 5.991
316 CAPÍTULO 20

Zona de aceptación

Zona de rechazo

KW = 0.34 𝜒 2U = 5.991

Se acepta H0; Las cantidades pagadas con los tres métodos, no son significativamente
diferentes.

EJERCICIOS 20.3
1. Un aparato electromecánico para uso en hospitales de la Ciudad de San Pedro Sula,
es utilizado en operaciones hidráulicas. El aparato se compra en el mercado bajo tres
marcas diferentes. Use la prueba Kruskal-Wallis para determinar si hay diferencia
entre los precios de las tres marcas en todo el país. Utilice un nivel de significancia
del 0.01.

Marca A $ 89 90 92 81 76 88 85 95 97 86 100
Marca B $ 78 93 81 87 89 71 90 96 82 85
Marca C $ 80 88 86 85 79 80 84 85 90 92
2. En un complejo hospitalario funcionan tres clínicas dedicadas a consultas médicas
en medicina general, las cuales supuestamente no difieren en calidad, comodidad y
prestigio para sus pacientes en ésta área. Usando una prueba Kruskal-Wallis, ¿En un
nivel de significancia de 0.05, ¿puede usted afirmar que las clínicas en mención atien-
den el mismo número de pacientes?

Clínica A 78 47 90 110 80 45 68 99 100 112


Clínica B 50 92 93 56 86 56 42 31 113 90
Clínica C 66 56 85 88 90 58 54 55 94 100
3. La Secretaría de Salud con el objetivo de estandarizar y mejorar los servicios en salud
pública que se prestan en las cuatro regiones del país, recolecta datos para verificar la
conformidad o no conformidad de sus pacientes, obteniendo mediante un mecanis-
mo moderno sobre medición del desempeño, la información siguiente:

Región Norte 8 9 9 9 8 7 7 8
Región Occidental 8 9 8 8 9 7 9 8 8
Región Oriental 9 8 8 8 7 8 8 8 9 7
Región Centro-sur 7 8 9 7 8 7 8 9 7 8 7
A un nivel de significancia de 10%, ¿pueden creer las autoridades de la Secretaría de
Salud que, en sus oficinas regionales, existe diferencia en la prestación de dichos
servicios?
Estadística no paramétrica 317

20.4  Prueba de corridas de una sola muestra


Esta prueba sirve para determinar la aleatoriedad o no aleatoriedad en la toma de los
datos. Una corrida es una secuencia de símbolos, letras o números, a menudo conocidos
como tipos. En la prueba corridas de una sola muestra al estadístico de prueba lo repre-
sentaremos por r, el cual será estimado como “r = número de corridas”
Fórmulas a utilizar:
2n1n2
a) µ r = + 1 (media del estadístico r)
n1 + n2

b) σ r =
(2n1n2 ) (2n1n2 − (n1+ n2 )) (error estándar del estadístico r)
(n1 + n1 ) (n1 + n2 − 1)
2

c) n1, n2, n3, ⋯, nk (número de tipos)


d) μr ± Zσr (límites críticos o fronteras)

Ejemplo
Un gerente de talento humano dedicado a la investigación sobre controles de riesgos para
los empleados en las áreas de salud, clasificó una muestra de la manera siguiente:
A,B,A,A,A,B,B,A,B,B,A,A,B,A,B,A,A,B,B,B,B,A,B,B,A,A,A,B,A,B,A,A,B,B,A,B,B,A,A,A,B,B,
A,A,B,A,A,A.
A un nivel de significancia de 5% pruebe la aleatoriedad o no aleatoriedad en la toma
de los datos.
Solución
a) H0∶ Existe aleatoriedad
Ha∶ No existe aleatoriedad
α = 0.05
b) Sean n1 = ∑A = Tipo I y n2 = ∑B = Tipo II; entonces: n1 = 26 y n2 = 22
c) Para determinar el valor de r, deben contarse el número de corridas o secuencias en
la forma siguiente:
A, B, A, A, A, B, B, A, B, B, A, A, B, A, B, A, A, B, B, B, B, A, B, B, A, A, A, B, A, B, A, A, B,
B, A, B, B, A, A, A, B, B, A, A, B, A, A, A.
Luego r = 27 (Número de secuencias o corridas subrayadas)
d) Cálculo de la media y el error
2n1n2 2 (26)(22)
µr = +1 = +1 ≅ 24.84
n1 + n2 26 +22

Entonces μr = 24.84

σr =
(2n1n2 ) (2n1n2 − (n1 + n2 )) = (2)(26)(22) ((2)(26)(22) −(26 +22)) ≅ 3.4027
(n1 + n1 ) (n1 + n2 −1)
2 2
(26+ 22) (26 +22 −1)
σr = 3.4027
Como los límites se determinan por: μr ± Zσr entonces:

μr ± Zσr = 24.85 ± (1.96)(3.4027)


LI = 18.17 y LS = 31.51
318 CAPÍTULO 20

Zona de aceptación

Zona de rechazo Zona de rechazo

18.17 𝜇r = 24.84 31.51

r = 27

Se acepta H0; si existe aleatoriedad en la toma de los datos.

EJERCICIOS 20.4
1. A nivel nacional, se inspeccionó una secuencia de actividades en los centros de aco-
pio para la prevención de desastres naturales que solo cuentan con un empleado para
atender las demandas de los pobladores en cada una de sus zonas. En seguida se
presenta la secuencia de atención conforme o no conforme manifiesta por sus pobla-
dores:
D,A,A,A,D,D,D,D,D,A,A,D,D,A,A,A,A,D,A,A,D,D,D,D,D
 ruebe la aleatoriedad o no aleatoriedad de los centros de acopio seleccionados.
P
Aplique el nivel de significancia de 0.05.
2. Una trabajadora social de un hospital público en el Departamento de La Paz, con el
objetivo de mejorar los servicios en la atención de los pacientes de más escasos recur-
sos económicos que asisten a resolver problemas pre operatorios, lleva un registro por
sexo de las personas que asisten a dicha oficina para quejarse por problemas de mala
atención de parte de los empleados del hospital, antes de someterse a una cirugía. He
aquí los datos en un día cualesquiera de atenciones en el hospital.
M,F,F,F,M,M,F,M,F,F,F,F,M,M,M,F,M,F,M,F,F,F,F,M,M,M,M,M
 tilizando un nivel de significancia de 5%, pruebe la aleatoriedad de la secuencia
U
anterior.
3. La oficina de trabajo social del Hospital San Felipe, lleva el siguiente registro del nú-
mero diario de los pacientes que solicitan orientación y apoyo en el tratamiento a su
enfermedad. Los siguientes datos representan el orden en que visitaron la oficina en
mención durante los últimos 30 días.
3,4,6,8,4,6,7,2,5,7,4,8,4,7,9,5,9,10,5,7,4,9,8,9,11,6,7,5,9,12
 ruebe la aleatoriedad de la secuencia anterior, comprobando si los valores situados
P
por encima y por debajo de la media ocurren en un orden aleatorio. Utilice el nivel de
significancia de 10%, pruebe la aleatoriedad de la secuencia anterior.
4. La facultad de teología de la Universidad Católica de Honduras, sostiene la teoría de
que el éxito favorece al éxito. En otras palabras, en su opinión, el hecho de graduar
profesionales de calidad y con los mejores principios morales, religiosos y profesiona-
les, aumenta la motivación de manera plena para seguir sirviendo a la sociedad de
Estadística no paramétrica 319

acuerdo a sus expectativas. En seguida se transcriben los resultados de un conteo


unitario sobre la excelencia (E) o el no cumplimiento a las expectativas (N).
E,E,E,E,E,E,N,E,E,E,E,E,N,E,E,E,E,N,N,E,E,E,E,E,E
 n un nivel de significancia de 10%, ¿es aleatoria la ocurrencia de éxitos y el no cum-
E
plimiento de expectativas?

20.5  Prueba correlación de rango de Spearman


Esta es una prueba de correlación significativa o no entre dos conjuntos de datos. Deno-
taremos el coeficiente de correlación de rango de Spearman por rs y lo calcularemos por:

6∑d 2
rs = 1−
n ( n2 −1)

n = Número de pareados
Donde:
d = Diferencia entre los rangos de cada pareja de observaciones
Notas
1. Si rechazamos H0, diremos que la correlación es significativa;
2. Para n ≤ 30 la correlación no es normal y debe utilizarse la tabla de Rango de Spear-
man propuesta en los anexos del presente texto;
3. Si n > 30 utilice la tabla de la distribución normal con:
1 1
σ= yσr =
n −1 S
n −1
4. El valor de n es igual al número de parejas dado en el problema.
5. Las hipótesis se plantean explícitamente o utilizando nomenclaturas como las si-
guientes.
H0∶ ρs = 0
Ha∶ ρs ≠ 0

Ejemplo
La alcaldía municipal del Distrito Central tiene un estudio con relación al personal que
presta sus servicios profesionales en el área de atención al ciudadano, referente a los gas-
tos de capacitación sobre gestión de la calidad y el número de ciudadanos que se quejan
por la mala atención de los empleados municipales.
La siguiente tabla, muestra la cantidad de dólares invertidos por empleado y la rela-
ción número de empleados denunciados por un mal servicio en atención al ciudadano.

Número $ invertidos 60 37 30 20 24 42 39 54 48 58 26
# de inconformes 2 7 6 9 7 4 8 2 4 3 8
Al nivel de significancia del 5%, ¿existe una correlación significativa entre los gastos
y el número de ciudadanos inconformes?

Solución
a) Planteamiento de hipótesis
H0∶ ρS = 0 (Existe correlación significativa)
Ha∶ ρS ≠ 0 (No existe correlación significativa)
α = 0.05
320 CAPÍTULO 20

b) Cálculo de los rangos

No. de
Cantidad de $ contaminados Diferencia
Pareja y rango y rango de rangos d d ²
60 2 20 1 2 1 11-1.5 9.5 90.25
37 7 24 2 2 2 5-7.5 –2.5 6.25
30 6 26 3 3 3 4-6.0 –2 4
20 9 30 4 4 4 1-11.0 –10 100
24 7 37 5 4 5 2-7.5 –5.5 30.25
42 4 39 6 6 6 7-4.5 2.5 6.25
39 8 42 7 7 7 6-9.5 –3.5 12
54 2 48 8 7 8 9-1.5 7.5 25
48 4 54 9 8 9 8-4.5 3.5 56.25
58 3 58 10 8 10 10-3.0 7 12.25
26 8 60 11 9 11 3-9.5 –6.5 49
409

∑d 2 = 409 y n = 11

c) Como:
6∑d 2 6 (409)
rs = 1− = 1− ≅ −0.86, Entonces: rs = −0.86
n( n2 −1) ( 2
11 (11) −1 )
d) Con n = 11 y α = 0.05, de la tabla de Spearman se obtiene que: rL = ± 0.6091

Zona de aceptación

Zona de rechazo
Zona de rechazo

–0.6091 𝜇rs 0.6091

rs = –0.86

Se rechaza H0; la correlación de rangos es significativa, lo que significa que a mayor


inversión en capacitación habrá menos quejas de los ciudadanos atendidos.

EJERCICIOS 20.5
1. A continuación se dan las evaluaciones (X), y el rendimiento en el desempeño (Y)
obtenido por 8 jefes de departamento de la Secretaría de Salud. ¿Existe una correla-
ción significativa por rangos entre las dos medidas? Use un nivel de significancia de
0.10.

X 30 17 35 28 42 25 19 29
Y 35 31 43 46 50 32 33 42
Estadística no paramétrica 321

2. Un ingeniero supervisor de la infraestructura en el sistema de salud de Honduras,


clasificó la muestra de 10 obreros según el número de horas extras trabajadas y la
antigüedad. ¿Es significancia la correlación por rangos entre las dos medidas? Utilice
un nivel de significancia de 0.01.

Horas extras 5.0 8.0 2.0 4.0 3.0 7.0 1.0 6.0 5.5 6.4
Antigüedad 1.0 6.0 4.5 2.0 7.0 8.0 4.5 3.0 4.7 6.0
3. La generalidad de la gente y los profesionales en salud mental, piensa que la experien-
cia produce mejores relaciones interpersonales entre un jefe y sus subordinados. En
una institución estatal se cuenta con los siguientes datos, referente a los jefes de uni-
dades, su edad y quejas expuestas por sus subalternos. En un nivel de significancia de
0.05, ¿sugiere la correlación por rangos entre los dos resultados que las relaciones
mejoran con la experiencia?

Edad del jefe 32 43 42 29 56 62 45 39 40 35


No. de quejas 5 2 4 4 3 2 4 5 4 6
4. El licenciado Amílcar Sánchez, catedrático de la Universidad Católica de Honduras,
piensa que cuando los empleados de la universidad (UNICAH) trabajan en equipo,
mayor es su productividad diaria en cada una de sus áreas. El licenciado Sánchez
reunió los siguientes datos de un grupo de empleados de la UNICAH que trabajan en
una misma área y en equipo durante varios días.
Producción diaria 4.0 7.0 5.0 6.0 8.0 2.0 3.0 0.5 9.0 6.0
Días trabajados juntos 1 2 3 4 5 6 7 8 9 10
¿Puede el licenciado Sánchez concluir en un nivel de significancia de 5%, que no
existe correlación entre el número de días que trabajaron juntos y la producción
diaria?

20.6  Prueba de Kolmogorov-Smirnov


Esta técnica no paramétrica se usa para probar si existe una diferencia significativa entre
una distribución de frecuencias observadas y una distribución de frecuencias teóricas
como la normal, binomial o Poisson.
El estadístico de prueba lo identificaremos por KS y lo calcularemos como:
KS = Max|Foar – Fera|
Donde:
Foar = frecuencia observada acumulada relativa
Fera = frecuencia esperada relativa acumulada

Notas
1. Los valores críticos o de frontera se calcularán de la tabla Kolmogorov-Smirnov (Ca-
pítulo 21);
2. n = ∑ f0 (f0 frecuencias observadas)

3. Si n > 35, los valores críticos se determinan por las fórmulas siguientes:

1.07
a) , si α = 0.20
n
1.14
b) , si α = 0.15
n
322 CAPÍTULO 20

1.22
c) , si α = 0.10
n
1.36
d) , si α = 0.05
n

e) 1.63 , si α = 0.01
n
4. Sí n ≤ 35, los valores críticos se buscan directamente de la tabla Kolmogorov-Smir-
nov, en los anexos del presente texto.

Ejemplo
La siguiente tabla muestra los datos del número de llegadas tarde de los empleados del
Hospital Viera, dado que sufrieron un retraso por congestión de tráfico.

Número de llegadas por día 0 1 2 3 4 5 6


Número de días 6 18 30 24 11 2 9

Al nivel de significancia de 0.05; ¿podemos concluir que los datos en mención provie-
nen de una distribución de Poisson con λ = 3?

Solución
a) H0∶ Los datos provienen de una distribución de Poisson con λ = 3
Ha∶ Los datos no provienen de una distribución de Poisson con λ = 3
α = 0.05 y n = ∑ f0 = 100
b) Cálculo de KS

Clases f0 foa foar fer fera |Foar – Fera|


0 6 6 0.06 0.0498 0.0498 0.0102
1 18 24 0.24 0.1494 0.1992 0.0408
2 30 54 0.54 0.2240 0.4232 0.1168
3 24 78 0.78 0.2240 0.6472 0.1328
4 11 89 0.89 0.1680 0.8152 0.0748
5 2 91 0.91 0.1008 0.9160 0.0060
6 9 100 1.00 0.0504 0.9664 0.0336

Luego KS = Max|Foar-Fera|, implica que KS = 0.1328

Como n > 35, ya que n = 100 y α = 0.05 , se tiene que el KS crítico o de la tabla, lo
1.36 1.36
determinamos por: = =0.1360
n 100
Como KS calculado es menor que el KS de la tabla, o sea que 0.1328 < 0.1360, se
concluye que debe aceptarse H0, y concluir que los datos provienen de una distribución
de Poisson con λ = 3.
Estadística no paramétrica 323

EJERCICIOS 20.6
1. El doctor Núñez, visitador médico de una compañía farmacéutica, tienen 7 clientes
que visitar por semana. Se considera que sus ventas pueden ser descritas con una
distribución binomial siendo de 0.45 la probabilidad de venderle a cada cliente. Exa-
mine la distribución de frecuencias observadas del número de ventas que el doctor
Núñez realiza por semana y determine si la distribución efectivamente corresponde a
la distribución sugerida. Utilice el nivel de significancia de 0.05.

Número de ventas por semana 0 1 2 3 4 5 6 7


Frecuencia del número de ventas 25 32 61 47 39 21 18 12

2. Se adjunta una tabla de frecuencias observadas, junto con las frecuencias que cabe
esperar en una distribución normal.
a) Calcule el estadístico de Kolmogorov-Smirnov.
b) ¿Puede usted afirmar que esta distribución efectivamente sigue una distribución nor-
mal? Use el nivel de significancia de 0.10.

Puntuacion de la prueba
51-60 61-71 71-80 81-90 91-100
Frecuencia observada 30 100 440 500 130
Frecuencia esperada 40 170 500 390 100

3. El gerente de una distribuidora de productos comestibles en la capital de la república,


ha reunido las siguientes estadísticas de los ingresos de su fuerza de ventas. Tiene
frecuencias observadas y esperadas en la siguiente distribución normal. En un nivel
de significancia de 0.10, ¿puede el gerente afirmar que la fuerza de los ingresos de sus
ventas, se adecúa a una distribución normal?

Ganancias en miles
25-30 31-36 37-42 43-48 49-54 55-60 61-66
F.O 9 22 25 30 21 12 6
F.E 6 17 32 35 18 13 4

4. Un ingeniero químico que trabaja en los servicios de alimentos de una cadena famosa
de restaurantes en Tegucigalpa, examinó los registros de 200 platos de comida selec-
cionados aleatoriamente y que fueron servidos a los clientes-trabajadores de tres gran-
des empresas. El ingeniero se dio cuenta que estos alimentos se servían con poco sodio.
El número de personas que ha ingerido 1, 2, 3, 4 o más comidas con poco sodio, fueron
25, 45, 67, 43 y 20, respectivamente. En el nivel de significancia de 0.05, ¿puede el
ingeniero concluir con suficiente seguridad que el consumo de estas comidas con
poco sodio, siguen una distribución de Poisson con λ = 1?
324 CAPÍTULO 20
CAPÍTULO

Series temporales
21
Contenido

21.1 Introducción
21.2 Variaciones en las series de tiempo
21.3 Análisis de tendencia
21.4 Variación cíclica
21.5 Variación estacional
21.6 Variación irregular
326 CAPÍTULO 21

Series temporales

21.1 Introducción
El pronóstico o predicciones, es una herramienta imprescindible en cualquier proceso de
toma de decisiones. Entre sus aplicaciones se cuentan desde la determinación de las ne-
cesidades de un inventario hasta los más grandes acontecimientos que puedan suscitarse.
Por ejemplo, en el área laboral y comercial, los centros de trabajo incrementan su perso-
nal en las áreas de mayor demanda para fechas festivas como semana santa, fiestas de
navidad y fin año.
Por otra parte, las instituciones de prevención, mitigación y asistencias por acciones
inclementes de la naturaleza como en la llegada de huracanes, inundaciones o desastres
naturales que lesionan en gran escala a centenares de pobladores, y así sucesivamente
podríamos continuar dando más ejemplos sobre el tema.
La calidad de los pronósticos que los profesionales y técnicos puedan realizar, guar-
dan estrecha relación con la información que extraen de datos pasados secuenciales o no
secuenciales.
En general, el análisis de las series de tiempo se utiliza para descubrir los patrones de
cambio en la información estadística durante intervalos regulares de tiempo. Estos patro-
nes los proyectamos para llegar a una estimación en el futuro. Así pues, el análisis de se-
ries de tiempo nos ayuda a sortear la incertidumbre ante el porvenir.

21.2  Variaciones en las series de tiempo


La designación de la frase “serie de tiempo” la utilizaremos para referirnos a un grupo
cualquiera de información estadística acumulada en intervalos regulares.
Existen cuatro tipos de cambio o variación, que intervienen en el análisis de las series
de tiempo, a saber:
1. Tendencia secular;
2. Fluctuación cíclica;
3. Variación estacional; y
4. Variación irregular.
En el primer tipo de cambio, la tendencia secular referente al valor de la variable, esta
tiende a incrementarse o disminuir a través de un período largo o mediano de tiempo. Los
incrementos constantes en el nacimiento de niños en una comunidad demandan al Esta-
do o a sus autoridades edilicias, mayor atención a sus problemas en general, ya sean estos
de tipo salud, educativo, infraestructura y otros, constituyendo un ejemplo de tendencia
secular.

Y Tendencia secular

Serie de tiempo real

X
Tiempo en años

El segundo tipo de variación de una serie de tiempo, es la fluctuación cíclica. En el


área de las ingenierías o de la administración, tienen que ver con muchos procesos que se
Series temporales 327

incrementan o disminuyen en el tiempo como en las obras civiles, los incrementos de las
lluvias, los largos períodos de sequía, las demandas de adquisiciones personales en tempo-
radas específicas como lo es las fiestas navideñas y semana santa, etc…

Y Línea de tendencia

Fluctuación cíclica

X
Tiempo en años

El tercer tipo de cambio en los datos de una serie temporal es la variación estacional.
Como cabe suponer por el nombre, esta modalidad incluye patrones de cambio dentro de
un año, que tienden a repetirse año tras año. Por ejemplo, un administrador esperará un
aumento considerable de trabajo y acciones recurrentes en los períodos con altas exigen-
cias por clientes y empleados. Puesto que se trata de patrones periódicos, y que son útiles
en el pronóstico a futuro.

Y Variación estacional

X
Tiempo en años

La cuarta variación conocida como irregular, también es discutida en el análisis de


las series temporales. En muchas situaciones el valor de una variable puede ser totalmen-
te impredecible, pues cambia de modo aleatorio y son las variaciones irregulares las que
describen estos movimientos. En el caso del alza o baja en los precios del petróleo, depen-
derá de diversas variables indeterminadas, como ser los conflictos bélicos o los cambios
de políticas internacionales repentinas en el mundo, un desastre no predecible etc…, con-
diciones que son poco comunes y casi descartadas, pero que tarde o temprano puedan
aparecer afectando la humanidad, sus expectativas y desarrollo.

Y Variación irregular

X
Tiempo en años
328 CAPÍTULO 21

Para concluir la presente sección, hasta ahora hemos dicho que una serie de tiempo
ofrece uno u otro de los tipos de variación. No obstante, en la generalidad de los casos una
serie contendrá varios de ellos. Por tanto, podemos percibir la variación global de una
serie en función de cuatro distintas clases de variación, razón por la cual, en las secciones
siguientes, examinaremos esos cuatro componentes y las formas en que se miden.

21.3  Análisis de tendencia


De los cuatro componentes de una serie de tiempo, la tendencia secular representa la di-
rección a largo plazo de la serie. Una manera de describir el componente de las tenden-
cias consiste en ajustar una línea visualmente a un conjunto de puntos sobre una gráfica.
Sin embargo, cualquier gráfica está sujeta a interpretaciones ligeramente por parte de las
personas. Podemos asimismo ajustar una línea de tendencia mediante el método de los
mínimos cuadrados.
En el estudio y análisis de las tendencias, existen tres razones que explican la utilidad
de las tendencias seculares.
1. Nos permite describir un patrón histórico;
2. Nos permite proyectar los patrones o tendencias históricas a futuro; y
3. En muchas situaciones, el estudiar una tendencia secular de una serie de tiempo per-
mite eliminar de la serie, el componente de la tendencia.
Las tendencias pueden ser lineales o curvilíneas y estas obedecen a las características
de los diferentes componentes o factores dados en la naturaleza y afectando los distintos
espacios y escenarios en los que el ser humano se moviliza.

Ajuste de la tendencia lineal mediante el método de los mínimos cuadrados.


Recuerde que una ecuación lineal determinada por éste método es:

Ŷ = a + bX ; b =
∑xy − nx y y a = y − bx
∑x2 − n ( x )2
y = valores de la variable dependiente;
x = Valores de la variable independiente;
x– = media de los valores de la variable dependiente
Donde: –y = media de los valores de la variable independiente
n = número de puntos o parejas en la serie temporal
a = intercepto en y
b = pendiente de la ecuación

Codificación de tiempos
Cuando se usan códigos para los tiempos se obvian cálculos tediosos de la manera si-
guiente:
Para tiempos impares

X (años) X−X Tiempo codificado (x)
1995 1995-1997 –2
1996 1996-1997 –1
1997 1997-1997 0
1998 1998-1997 1
1999 1999-1997 2
Series temporales 329

Para tiempos pares



X (años) X−X Tiempo codificado (x)
1995 1995-1997.5 (–2.5)(2) = –5
1996 1996-1997.5 (–1.5)(2) = –3
1997 1997-1997.5 (–0.5)(2) = –1
1998 1998-1997.5 (0.5)(2) = 1
1999 1999-1997.5 (1.5)(2) = 3
2000 2000-1997.5 (2.5)(2)= 5
Nota:
En el caso de los tiempos pares, para encontrar el valor de x codificado, la diferencia de
cada tiempo y la media, debe multiplicarse por la constante 2.
Antes de desarrollar el ejemplo ilustrativo y la nueva modalidad de tiempos codifica-
dos, la ecuación de estimación y el cálculo de sus componentes deben ajustarse al proceso
siguiente:

Ŷ = a + bx; b =
∑xy y a = y , dado que la sumatoria de las variables codificadas siem-
∑x 2
pre será cero, entonces la media también será cero.

Ejemplo
Una compañía que fabrica aparatos utilizados en las unidades de cuidados intensivos de
los hospitales, registra el número de unidades entregadas por año de la siguiente manera:

Año 1990 1991 1992 1993 1994 1995 1996 1997


Unidades 50 61 75 90 93 98 101 99
a) Encuentre la ecuación lineal que describa la tendencia del número de artículos médi-
cos entregados por la compañía a diversos complejos hospitalarios.
b) Estime las ventas de equipo médico de dicha compañía para el año 2015.
Solución incisa a)

X Y X−X x xY x2
1990 50 (1990-1993.5)(2) –7 –350 49
1991 61 (1991-1993.5)(2) –5 –305 25
1992 75 (1992-1993.5)(2) –3 –225 9
1993 90 (1993-1993.5)(2) –1 –90 1
1994 93 (1994-1993.5)(2) 1 93 1
1995 98 (1995-1993.5)(2) 3 294 9
1996 101 (1996-1993.5)(2) 5 505 25
1997 99 (1997-1993.5)(2) 7 693 49
667 0 615 168

Como Ŷ = a + bX ; b =
∑xY y a = y , entonces:
∑x 2
∑xY 615 y 667
b= = = 3.661; a = y = = = 83.375
∑x 168
2 n 8

Entonces Ŷ = 83.375 + 3.661x


330 CAPÍTULO 21

Solución inciso b)
Para dar respuesta al inciso b, debe tenerse en cuenta lo siguiente:
1. El valor de x se calcula por la diferencia del año a estimar y el año medio;
2. Si el número de años es par, duplique el valor de x encontrado de acuerdo al proceso
del numeral anterior y evalúelo en la ecuación Ŷ = a + bx;
3. Si el número de años es un dato impar, para la estimación use exactamente el valor
de x determinado de acuerdo a lo que establece el numeral 1.
4. Debido a los tiempos codificados, cuando el número de años son pares, los intervalos
de tiempo se consideran cada 6 meses o medios años.
Continuando con la solución del inciso b de nuestro ejemplo y como Ŷ = 83.375 +
3.661x y la estimación es al año 2015, se tiene que:
x = 2015 – 1993.5 = 21.5 y por tratarse en el presente ejemplo que la cantidad de años
es un número par, entonces el valor de x a evaluar es x = 2(21.5) = 43, por tanto:

Ŷ = 83.375 + 3.661(43) = 241

En conclusión, la compañía deberá tener un inventario no menor a 241 aparatos con


los cuales suple los pedidos de los complejos hospitalarios.
Uso de la ecuación de segundo grado con tiempos codificados
La forma general de una ecuación de segundo grado en una serie temporal está dada por:

Ŷ = a + bx + cx2

En donde a, b y c, son constantes numéricas a determinar y Ŷ es la estimación de la


variable dependiente y x los valores codificados de la variable temporal.
Por otra parte, para determinar las constantes a, b y c, debe resolverse el siguiente
sistema:

∑Y = na + c ∑x2 Ecuación 1

∑x2 = a ∑x2 + c∑x4 Ecuación 2


∑xY
b= Ecuación 3
∑x2

Ejemplo
Los siguientes registros representan el número de trasplantes de riñón efectuadas por un
hospital de especialidades.

Años 2000 2001 2002 2003 2004 2005 2006


Trasplantes 14 18 16 21 17 24 23

a) Desarrolle la ecuación de segundo grado


b) Utilice la ecuación de segundo grado y estime cuantos trasplantes de riñón llevaría a
cabo el hospital en el año 2013.
Series temporales 331

Solución inciso a)
X Y x x2 x4 xY x 2Y
2000 14 –3 9 81 –42 126
2001 18 –2 4 16 –36 72
2002 16 –1 1 1 –16 16
2003 21 0 0 0 0 0
2004 17 1 1 1 17 17
2005 24 2 4 16 48 96
2006 23 3 9 81 69 207
Total 133 0 28 196 40 534

b=
∑xY = 40 =1.43, entonces b =1.43
∑x2 28
Como:
∑Y = na + c ∑x2
∑x2 Y = a ∑x2 + c∑x4
Entonces:
133 = 7a + 28c
534 = 28a + 196c
Resolviendo el sistema se tiene que: a = 18.9 y c = 0.024
Luego Ŷ = a + bx + cx2 estará dada por Ŷ = 18.9 + 1.43x + 0.024x2
Solución inciso b)
x = 2013 − 2003 = 10 y como el número de años es impar, la ecuación de estimación
Ŷ = 18.9 + 1.43x + 0.024x2, debe ser evaluada exactamente en x = 10, por tanto:
Ŷ = 18.9 + 1.43x + 0.024(10)2 = 35.6

EJERCICIOS 21.3
Aproximadamente las autoridades del hospital de especialidades en mención, deben espe-
rar unos 36 trasplantes para el año 2013.
1. Una pequeña compañía que fabrica camillas móviles para el traslado de pacientes en
emergencia, desde que la fundaron han abastecido los pedidos de la Cruz Roja Hon-
dureña, y el número de camillas que se venden por año está representado por la si-
guiente serie de tiempo:
Año 2009 2010 2011 2012 2013 2014
Camillas vendidas 42 50 61 75 92 111
a) Encuentre la ecuación lineal que describe la tendencia del número de camillas
vendidas por la compañía;
b) Estime las ventas de camillas al año 2025.
2. Un ingeniero supervisor para la construcción de pequeños edificios para centros de
salud en la zona rural que funcionarán con energía solar, está examinando el número
de inmuebles a construir en todo el país durante los últimos 7 meses:
Mes Junio Julio Agosto Sept. Oct. Nov. Dic.
Número de edificios 6 17 25 28 32 43 50
332 CAPÍTULO 21

a) Grafique estos datos


b) Desarrolle la ecuación lineal de estimación que mejor describa estos datos;
c) Desarrolle la ecuación de segundo grado que mejor describa los datos;
3. El número de catedráticos de la Universidad Católica de Honduras que poseen una
computadora personal para el desarrollo y presentación de sus clases, según los últi-
mos datos se han incrementado en los últimos 5 años.
Año 2010 2011 2012 2013 2014
Número de Catedráticos que poseen una CP 25 40 51 64 97
a) Encuentre la ecuación lineal de estimación que mejor describe los datos;
b) Desarrolle la ecuación de segundo grado que mejor describa los datos;
c) Estime el número de computadoras personales que se utilizarán en la UNICAH
durante el año 2022 (use ambas ecuaciones);
d) Si en la UNICAH hay 230 catedráticos, ¿cuál es la mejor ecuación de predicción?
4. Una compañía que se especializa en aparatos de filtración anticontaminante ha lleva-
do el siguiente registro de ventas durante los últimos 9 años:
Año 1988 1989 1999 2000 2001 2002 2003 2004 2005
Ventas (X $100,000) 13 15 19 21 27 35 47 49 57
a) Grafique éstos datos;
b) Encuentre la ecuación lineal de estimación que mejor describe los datos;
c) Desarrolle la ecuación de segundo grado que mejor describa los datos;
d) Estime el número de ventas para el año 2015.
5. La Dirección Nacional de Tránsito está estudiando el número de muertes en acciden-
tes de tránsito ocurridas en los últimos 9 años las cuales se deben al conducir en es-
tado de ebriedad.
Año 1988 1989 1999 2000 2001 2002 2003 2004 2005
Muertes 36 38 44 52 57 59 64 66 68
a) Encuentre la ecuación lineal que describa la tendencia del número de muertes en
accidentes de tráfico en el país, atribuidas al hecho de conducir en estado de ebrie-
dad;
b) Estime el número de muertes de tránsito por conducir en estado de ebriedad que
el país espera en el año 2023.

21.4  Variación cíclica


La variación cíclica es el componente de una serie de tiempo que tiende a oscilar por en-
cima y por debajo de la línea de tendencia secular durante períodos mayores que un año.
El procedimiento con que se identifica la variación cíclica es el método de los residuales.
Método de los residuos
Si se utiliza una serie temporal compuesta por datos anuales, podemos encontrar la frac-
ción de la tendencia como:
Y
a) Porcentaje de tendencia calculado por: PT = x100
Ŷ
Y −Ŷ
b) Residuo cíclico relativo calculado por: RCR = x100
Ŷ
Ejemplo
El departamento de caja de una distribuidora de medicamentos al por mayor, ha recopila-
do el siguiente registro de ingresos correspondientes al período 2000-2006.
Series temporales 333

Año 2000 2001 2002 2003 2004 2005 2006


Ingreso en millones de lempiras 1.1 1.5 1.9 2.1 2.4 2.9 3.5
La ecuación de segundo grado que mejor describe la tendencia de los datos anterio-
res está dada por:
Ŷ = 2.086 + 0.375x + 0.025x2
a) Calcule el porcentaje de tendencia de estos datos;
b) Calcule el residuo cíclico relativo;
c) Grafique el porcentaje de tendencia;
d) En qué año ocurrió la máxima fluctuación.
Solución
a)
Año 2000 2001 2002 2003 2004 2005 2006
Y 1.1 1.5 1.9 2.1 2.4 2.9 3.5
Ŷ 1.186 1.436 1.736 2.086 2.486 2.936 3.436
Porcentaje de tendencia (PT)
Y
x100 92.75 104.46 109.45 100.67 96.54 98.77 101.86
Ŷ
b) Residuo cíclico relativo (RCR)

Y −Ŷ
x100 –7.26 4.46 9.45 0.67 –3.46 –1.23 1.86
Ŷ

c) Gráfica porcentaje de tendencia

% de tendencia
110

Línea de tendencia

105

100

95

90
2000 2001 2002 2003 2004 2005 2006 Años

d) El año de mayor fluctuación fue el 2002

EJERCICIOS 21.4
1. Una compañía de gas propano que abastece a pequeños clíper en los lugares más re-
motos del país, ha suministrado 18, 20, 21, 25 y 26 mil pies cúbicos de gas, respecti-
vamente del 2002 al 2006.
334 CAPÍTULO 21

a) Determine la ecuación de estimación que mejor describa los datos anteriores;


b) Calcule el porcentaje de la tendencia de los datos;
c) Calcule el residual cíclico relativo de estos datos;
d) En qué años ocurre la mayor fluctuación de la tendencia.
2. El jefe de la oficina de proveeduría de una Secretaría de Estado, reunió los siguientes
datos referente a las demandas de aparatos para limpieza y drenajes utilizados por las
oficinas regionales de dicha Secretaría de Estado, durante los últimos 5 años.

Año 1982 1983 1984 1985 1986


Número de aparatos 32 46 50 66 68
La ecuación que describe la tendencia secular del suministro de aparatos a las ofici-
nas regionales de la Secretaría de Estado en mención, viene dada por:
Ŷ = 52.4 + 9.2x, donde: 1984 = 0 y x unidades = 1 año
a) Calcule el porcentaje de la tendencia de los datos;
b) Calcule el residual cíclico relativo de estos datos;
c) Grafique el porcentaje de la tendencia en la parte a)
d) En qué año ocurre la mayor fluctuación de la tendencia.
3. Suponga que usted es el responsable de elaborar el presupuesto de una clínica de
implante facial, cuyas necesidades estimadas de financiamiento son las siguientes:

Año 1980 1981 1982 1983 1984 1985 1986


Millones de lempiras requeridos 2.2 2.1 2.4 2.6 2.7 2.9 2.8
La ecuación que mejor describe los datos anteriores es:
Ŷ = 2.53 + 0.13x, donde: 1983 = 0 y x unidades = 1 año
a) Calcule el porcentaje de la tendencia de los datos anteriores;
b) Calcule el residual cíclico relativo de estos datos;
c) En qué año ocurre la mayor fluctuación de la tendencia.
4. El jefe de proveeduría de alimentos para los trabajadores de un complejo hospitalario
tiene datos sobre el número de cajas de cereal entregadas al jefe de cocina en los últi-
mos 7 años.

Año 1980 1981 1982 1983 1984 1985 1986


Número de cajas (X 1000) 21.0 19.4 22.6 28.2 30.4 24.0 25.0
a) Encuentre la ecuación lineal de estimación que mejor describa los datos anteriores;
b) Calcule el porcentaje de la tendencia de estos datos;
c) Calcule el residual cíclico relativo de estos datos;
d) En qué año ocurre la mayor fluctuación de la tendencia.

21.5  Variación estacional


Es el movimiento repetitivo y predecible alrededor de una línea de tendencia durante un
año o menos. En esta variación normalmente hay que medir los intervalos de tiempo en
unidades pequeñas como, días, semanas, meses o trimestres.
Las tres ventajas fundamentales en la variación estacional, son las siguientes:
a) Se puede descubrir el cambio de los patrones anteriores;
b) Es útil proyectar los patrones históricos en el futuro;
c) Una vez identificados los patrones estacionales, es posible eliminar sus efectos en la
serie de tiempo.
Series temporales 335

Método de la razón al promedio móvil


Esta técnica nos ofrece un índice que describe el grado de variación estacional, durante
un período corto de tiempo y se calcula por:
w
GVE = (Promedio)
100
Donde w es el índice porcentual en el período corto y GVE es el grado de variación
estacional.
Ejemplo
Los siguientes datos muestran el número de personas que en julio de 1995 se presentaron
a la Cruz Roja Hondureña para verificar su tipo de sangre.

Mes Semana Total


I II III IV
Julio 100 1050 896 1070 4016

Calcular el GVE para la tercera semana.

Solución

Como el promedio es
∑xi =1000 +1050+ 896 +1070 = 1004
n 4

W será el índice porcentual correspondiente a la tercera semana, por tanto


nIII 896
w= (100) = x100 = 22.31 ; Ahora como:
∑xi 4016

w 22.31
GVE = (Promedio) = (1004) ≅ 224
100 100
GVE = 224 Personas por día

El método de relación con el promedio móvil nos ayuda a tomar mejores decisiones
en el manejo del recurso necesario (humano y material) para atender de mejor manera las
afluencias de personas, por ejemplo, en el área administrativa puede relacionarse a clien-
tes que buscan un servicio en instituciones públicas o privadas.
Para llevarse a cabo un trabajo matemático de éste tipo y referente a las series tempo-
rales estacionales en relación con el promedio móvil o índice estacional, éste debe efec-
tuarse en cuatro pasos.
1. Calcular el total móvil de los n períodos en la serie de tiempo;
2. Determinar el promedio móvil de los n períodos dividido entre los n totales de la serie
de tiempo;
3. Encontrar el promedio móvil de los n períodos; y
4. Calcular el porcentaje del valor real respecto al valor promedio móvil en cada período
de la serie de tiempo.
Ejemplo
En una guardería del Estado utilizada para familiares de escasos recursos económicos
que provienen del interior del país, y que acompañan a su familiar enfermo durante la
hospitalización. El director de dicho complejo desea mejorar los servicios prestados a
estas personas y está examinando planes para asignar personal durante los períodos de
mayor afluencia.
336 CAPÍTULO 21

La guardería en base a su ocupación, cuenta con información de series de tiempo


como la tabla siguiente:

Numero de huespedes por trimestre


Trimestre
Año
I II III IV
1982 1861 2203 2415 1908
1983 1921 2343 2514 1986
1984 1834 2154 2098 1799
1985 1837 2025 2304 1965
1986 2073 2414 2339 1967

La siguiente tabla mostrará las modificaciones de los datos en los cuatro pasos.

Paso 4
Porcentaje
Paso 3
de los
Promedio
valores del
Paso 1 Paso 2 móvil
promedio
Total, Promedio centrado
real respecto
móvil de 4 móvil de 4 de 4
al móvil
Año Trimestre Ocupacion trimestres trimestres trimestres
(1) (2) (3) (4) (5) = (4) ÷ (4) (6) ( 7 ) = 63 x100
I 1861
II 2203 8387 2096.75 2104.250 114.8
1982
III 2415 8447 2111.75 2129.250 89.6
IV 1908
I 1921 8557 2146.75 2159.125 89.0
II 2343 8686 2171.50 2181.250 107.4
1983
III 2514 8764 2191.00 2180.125 115.3
IV 1986 8677 2169.25 2145.625 92.6
I 1834 8488 2122.00 2070.000 88.6
II 2154 8072 2018.00 1994.625 108.0
1984
III 2098 7885 1971.25 1971.625 106.4
IV 1799 7888 1972.00 1955.875 92.0
I 1837 7759 1939.75 1965.500 93.5
II 2025 7965 1991.25 2012.000 100.6
1985
III 2304 8131 2032.75 2062.250 111.7
IV 1965 8367 2091.75 2140.375 91.8
I 2073 8756 2189.00 2193.375 94.5
II 2414 8791 2197.75 2198.000 109.8
1986
III 2339 8793 2198.25
IV 1967

Explicación de la tabla:
En el paso 1 para el año de 1982 sumamos los valores de la columna (3) lo que resulta
8,387, el cual se ubicó entre los renglones de los trimestres 1982-II y 1982-III.
Para el dato 8447 ubicado en la cuarta columna debajo de 8387, se eliminó el dato
1861 del renglón 1982-I y se sumaron los datos restantes del año 1982 y el renglón 1983-
I o sea 2203 + 2415 + 1908 + 1921 = 8447. Al suprimir el primer valor y sumar el quinto
Series temporales 337

conservamos cuatro trimestres en total. Continuamos el proceso de “desplazar” el total de


cuatro trimestres sobre la serie de tiempo hasta incluir el último valor de ella.
En nuestro ejemplo, ese valor es 1967 cuartos en el cuarto trimestre del año 1986, o
sea el último dato de la columna (3) de la tabla.
En el paso 2 únicamente se dividen entre 4 los totales de la columna número (4).
En el tercer paso centramos el promedio móvil de los cuatro trimestres, o sea referen-
te a la columna (5) al centrar el promedio móvil de 1982-III, el dato será (2096.75 +
2111.75)/2 nos genera la media de 2104.250, primer dato de la columna (6). Las cifras
siguientes de la columna (6) se calculan del mismo modo.
En el paso 4 para obtener los resultados de la columna (7) se dividen los datos de la
columna (3) entre los datos correspondientes de la columna (6) y multiplicando por 100
cada resultado.
Este tipo de procesos nos lleva a suavizar los componentes estacionales originales y a
veces irregulares, lo que al final nos permite llevar a cabo aplicaciones de los índices esta-
cionales de manera más segura y con una posible disminución de los errores a cometer.
Para reunir todo el porcentaje de los valores del promedio real sobre el promedio
móvil en la columna (7) de la tabla anterior, tiene relación al cálculo de la media modifi-
cada de cada trimestre. Dicha media se obtiene eliminando los valores máximos y míni-
mos de cada trimestre y promediando el resto de ellos, como aparece en la tabla siguiente:

Demostración del cálculo de un índice estacional

Año Trimestre I Trimestre II Trimestre III Trimestre IV


1982 – – 114.8 89.6
1983 89.0 107.4 115.3 92.6
1984 88.6 108.0 106.4 92.0
1985 93.5 100.6 111.7 91.8
1986 94.5 109.8 – –
182.5 215.4 226.5 183.8

Ahora la media modificada está dada por:

182.5
Trimestre I: = 91.25
2

215.4
Trimestre II: = 107.70
2

226.5
Trimestre III: = 113.25
2

183.8
Trimestre IV: = 91.90
2

Luego 91.25 + 107.70 + 113.25 + 91.90 = 404.1 total de índices

Nótese que los cuatro índices de la tabla anterior dan un total de 404.1. No obstante,
la base de un índice es 100. En consecuencia, los cuatro índices trimestrales deberán su-
mar 400, y su media debería ser 100. Para corregir éste error, multiplicamos cada uno de
los índices trimestrales por una constante de ajuste. Este número se obtiene dividiendo la
suma deseada de los índices (400) entre la suma real (404.1).
338 CAPÍTULO 21

En este caso el resultado es 0.9899 y los cálculos restantes los presentamos mediante
la siguiente tabla.

Indices sin ajustar × Indice


Trimestre constante de ajuste estacional
I  91.25  ×  0.9899 =  90.3
II 107.70  ×  0.9899 = 106.6
III 113.25  ×  0.9899 = 112.1
IV  91.90  ×  0.9899 =  91.0
Total, índices estacionales 400.0
Media de los índices estacionales:
400/4 = 100

EJERCICIOS 21.5
1. El dueño de una cadena de tiendas de zapatos ortopédicos en el país, ha recopilado
las siguientes cifras trimestrales relativas a la inversión en cuentas por cobrar durante
los últimos cinco años:

Estación
Año
Primavera Verano Otoño Invierno
1982 102 120 90 78
1983 110 126 95 83
1984 111 128 97 86
1985 115 135 103 91
1986 122 144 110 98
a) Calcule un promedio móvil centrado de 4 trimestres;
b) Obtenga el porcentaje del promedio real respecto al promedio móvil para cada
período;
c) Determine los índices estacionales modificados y los índices estacionales.
2. El jefe de personal de una fábrica de cosméticos y cremas para cuidados de la piel,
registró los siguientes índices de ausentismo de los empleados en sus puestos de tra-
bajo trimestralmente durante un período de cuatro años.
a) Construya un promedio móvil centrado de 4 trimestres y trácelo sobre una gráfica
junto con los datos originales;
b) ¿Qué puede concluir sobre el ausentismo en la parte a)?
3. El director de la sección de adquisiciones de un complejo hospitalario en la zona
norte del país, ha recopilado las siguientes cifras trimestrales referente a la inscrip-
ción de proveedores durante los años anteriores (X 100).

Estación
Año
Otoño Invierno Primavera Verano
1982 220 203 193 84
1983 235 208 206 76
1984 236 206 209 73
1985 241 215 206 92
1986 239 221 213 115
Series temporales 339

a) Calcule el promedio móvil centrado de 4 trimestres;


b) Obtenga el porcentaje del promedio real respecto al promedio móvil de cada pe-
ríodo;
c) Determine los índices estacionales modificados y los índices estacionales.

21.6  Variación irregular


El último componente de una serie de tiempo es la variación irregular. Luego de haber
eliminado las variaciones de tendencia, las cíclicas y estacionales en una serie, todavía nos
queda un factor impredecible. Por lo regular se presenta una variación irregular durante
intervalos breves y se ajusta a un patrón aleatorio.
Debido a lo impredecible de las variaciones irregulares, no intentaremos explicarla en
forma matemática. No obstante, a menudo podemos aislar sus causas, aunque estas no
pueden ser identificadas con facilidad. Este componente está relacionado en el caso del
área de la ingeniería y la administración con todas las acciones que en torno a estas se
manifiestan permanentemente y que pensamos que estás ya están resueltas de raíz, pero
que por factores desconocidos vuelven a aparecer afectando las relaciones socio-económi-
cas.

EJERCICIOS 21.6
1. ¿Por qué no proyectamos en el futuro las variaciones irregulares?
2. ¿Cuáles de los siguientes factores ejemplifica una variación irregular?
a) Una larga sequía que aumenta los precios de los alimentos.
b) El efecto de un volcán sobre las vías respiratorias de los niños.
c) El colapso del petróleo durante 1986.
d) El incremento abrupto del barril del petróleo en el 2008.
3. ¿Qué elementos permite al director de una institución de servicios públicos sortear la
variación irregular en una serie de tiempo?
340 CAPÍTULO 21
ANEXOS

Contenido

ANEXO A1 
Tablas de distribuciones de probabilidad
Tabla 1. Distribución normal
Tabla 2. Distribución t de Student
Tabla 3. Distribución binomial
Tabla 4. Distribución de Poisson
Tabla 5. Distribución Ji-cuadrada
Tabla 6. Distribución F
Tabla 7. Correlación rangos de Spearman
Tabla 8. Kolmogorov-Smirnov
Tabla 9. Tabla de dígitos aleatorios
ANEXO A2 
Respuestas a ejercicios de número par
ANEXO A3 
Bibliografía
342 ANEXOS

ANEXO A1  Tablas de distribuciones de probabilidad

Tabla 1. Distribución de probabilidad normal estándar


Área bajo la curva entre la media y valores positivos de Z

Si Z es 2.25, se busca en la
columna de Z 2.2 y en
la columna 0.05, generan
el valor de área de 0.4878

𝜇=0 Z = 2.25

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2442 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3816 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
ANEXO A1  Tablas de distribuciones de probabilidad 343

Tabla 2. Distribución t de Student


Área de los dos extremos combinados para la distribución t de Student
Para 19 grados de libertad
se busca en la columna 0.10,
ahí encontraremos a t con
el valor de 1.729

1.729 1.729

Grados de
0.10 0.05 0.02 0.01
libertad
1 6.314 12.706 31.821 63.657
2 2.920 4.303 6.965 9.925
3 2.353 3.182 4.541 5.841
4 2.132 2.776 3.747 4.604
5 2.015 2.571 3.365 4.032
6 1.943 2.447 3.143 3.707
7 1.895 2.365 2.998 3.499
8 1.860 2.306 2.896 3.355
9 1.833 2.262 2.821 3.250
10 1.812 2.228 2.764 3.169
11 1.796 2.201 2.787 3.106
12 1.782 2.179 2.681 3.055
13 1.771 2.160 2.650 3.012
14 1.761 2.145 2.624 2.977
15 1.753 2.131 2.602 2.947
16 1.746 2.120 2.583 2.921
17 1.740 2.110 2.567 2.898
18 1.734 2.101 2.552 2.878
19 1.729 2.093 2.539 2.861
20 1.725 2.086 2.528 2.845
21 1.721 2.080 2.518 2.831
22 1.717 2.074 2.508 2.819
23 1.714 2.069 2.500 2.807
24 1.711 2.064 2.492 2.797
25 1.708 2.060 2.485 2.787
26 1.706 2.056 2.479 2.779
27 1.703 2.052 2.473 2.771
28 1.701 2.048 2.467 2.763
29 1.699 2.045 2.462 2.756
30 1.697 2.042 2.457 2.750
40 1.684 2.021 2.423 2.704
60 1.671 2.000 2.390 2.660
120 1.658 1.980 2.358 2.617
Distribución
1.645 1.960 2.326 2.576
Normal
344
Tabla 3. Probabilidades binomiales (A1)
P
n x x n
0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18
2 0 0.9801 0.9604 0.9409 0.9216 0.9025 0.8836 0.8649 0.8464 0.8281 0.8100 0.7921 0.7744 0.7569 0.7396 0.7225 0.7056 0.6889 0.6724 2  
  1 0.0198 0.0392 0.0582 0.0768 0.0950 0.1128 0.1302 0.1472 0.1638 0.1800 0.1958 0.2112 0.2262 0.2408 0.2550 0.2688 0.2822 0.2952 1  
  2 0.0001 0.0004 0.0009 0.0016 0.0025 0.0036 0.0049 0.0064 0.0081 0.100 0.0121 0.0144 0.0169 0.0196 0.0225 0.0256 0.0289 0.0324 0 2
       
3 0 0.9703 0.9412 0.9127 0.8847 0.8574 0.8306 0.8044 0.7787 0.7536 0.7290 0.7050 0.6815 0.6585 0.6361 0.6141 0.5927 0.5718 0.5514 3  
  1 0.0294 0.0576 0.0847 0.1106 0.1354 01590 0.1816 0.2031 0.2236 0.2430 0.2614 0.2788 0.2952 0.3106 0.3251 0.3387 0.3513 0.3631 2  
ANEXOS

  2 0.0003 0.0012 0.0026 0.0046 0.0071 0.0102 0.0137 0.0177 0.0221 0.0270 0.0323 0.0380 0.0441 0.0506 0.0574 0.0645 0.0720 0.0797 1  
  3 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0005 0.0007 0.0010 0.0013 0.0017 0.0022 0.0027 0.0034 0.0041 0.0049 0.0058 0 3
       
4 0 0.9606 0.9224 0.8853 0.8493 0.8145 0.7807 0.7481 0.7164 0.6857 0.6561 0.6274 0.5997 0.5729 0.5470 0.5220 0.4979 0.4746 0.4521 4  
  1 0.0388 0.0753 0.1095 0.1416 0.1715 0.1993 0.2252 0.2492 0.2713 0.2916 0.3102 0.3271 0.3424 0.3562 0.3685 0.3793 0.3888 0.3970 3  
  2 0.0006 0.0023 0.0051 0.0088 0.0135 0.0191 0.0254 0.0325 0.0402 0.0486 0.0575 0.0669 0.0767 0.0870 0.0975 0.1084 0.1195 0.1307 2  
  3 0.0000 0.0000 0.0001 0.0002 0.0005 0.0008 0.0013 0.0019 0.0027 0.0036 0.0047 0.0061 0.0076 0.0094 0.0115 0.0138 0.0163 0.0191 1  
  4 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0004 0.0005 0.0007 0.0008 0.0010 0 4
       
5 0 0.9510 0.9039 0.8587 0.8154 0.7738 0.7339 0.6957 0.6591 06240 0.5905 0.5584 0.5277 0.4984 0.4704 0.4437 0.4182 0.3939 0.3707 5  
  1 0.0480 0.0922 0.1328 0.1699 0.2036 0.2342 0.2618 0.2866 0.3086 03280 0.3451 0.3598 0.3724 0.3829 0.3915 0.3983 0.4034 0.4069 4  
  2 0.0010 0.0038 0.0082 0.0142 0.0214 0.0299 0.0394 0.0498 0.0610 0.0729 0.0853 0.0981 0.1113 0.1247 0.1382 0.1517 0.1652 0.1786 3  
  3 0.0000 0.0001 0.0003 0.0006 0.0011 0.0019 0.0030 0.0043 0.0060 0.0081 0.0105 0.0134 0.0166 0.0203 0.0244 0.0289 0.0338 0.0392 2  
  4 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0004 0.0007 0.0009 0.0012 0.0017 0.0022 0.0028 0.0035 0.0043 1  
  5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0 5
       
6 0 0.9415 0.8858 0.8330 0.7828 0.7351 0.6899 0.6470 0.6064 0.5679 0.5314 04970 0.4664 0.4336 0.4046 0.3771 0.3513 0.3269 0.3040 6  
  1 0.0571 0.1085 0.1546 0.1957 0.2321 0.2642 0.2922 0.3164 0.3370 0.3543 0.3685 0.3800 0.3888 0.3952 0.3993 0.4015 0.4018 0.4004 5  
  2 0.0014 0.0055 0.012 0.0204 0.0305 0.0422 0.0550 0.0688 0.0833 0.0984 0.1139 0.1295 0.1452 0.1608 0.1762 0.1912 0.2057 0.2197 4  
  3 0.0000 0.0002 0.0005 0.0011 0.0021 0.0036 0.0055 0.0080 0.0110 0.0146 0.0188 0.0236 0.0289 0.0349 0.0415 0.0486 0.0562 0.0643 3  
  4 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005 0.0008 0.0012 0.0017 0.0024 0.0032 0.0043 0.0055 0.0069 0.0086 0.0106 2  
  5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0004 0.0005 0.0007 0.0009 1  
  6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 6
       
7 0 0.9321 0.8681 0.8080 0.7514 0.6983 0.6485 0.6017 0.5578 0.5168 0.4783 0.4423 0.4087 0.3773 0.3479 0.3206 0.2951 0.2714 0.2493 7  
  1 0.0659 0.1240 0.1749 0.2192 0.2573 0.2897 0.3170 0.3396 0.3578 0.3720 0.3827 0.3901 0.3946 0.3965 0.3960 0.3935 0.3891 0.3830 6  
  2 0.0020 0.0076 0.0162 0.0274 0.0406 0.0555 0.0716 0.0886 0.1061 0.1240 0.1419 0.1596 0.1769 0.1936 0.2097 0.2248 0.2391 0.2523 5  
  3 0.0000 0.0003 0.0008 0.0019 0.0036 0.0059 0.0090 0.0128 0.0175 0.0230 0.0292 0.0363 0.0441 0.0525 0.0617 0.0714 0.0816 0.0923 4  
  4 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0011 0.0017 0.0026 0.0036 0.0049 0.0066 0.0086 0.0109 0.0136 0.0167 0.0203 3  
  5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0004 0.0006 0.0008 0.0012 0.0016 0.0021 0.0027 2  
  6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 1  
  7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 7
x 0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82
n x n
P
Tabla 3. Probabilidades binomiales (A2)
P
n x x n
0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.9 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18
8 0 0.9227 0.8508 0.7837 0.7214 0.6634 0.6096 0.5596 0.5132 0.4703 0.4305 0.3937 0.3596 0.3282 0.2992 0.2725 0.2479 0.2252 0.2044 8  
  1 0.0746 0.1389 0.1939 0.2405 0.2793 0.3113 0.3370 0.3570 0.3721 0.3826 0.3892 0.3923 0.3923 0.3897 0.3847 0.3777 0.3691 0.3590 7  
  2 0.0026 0.0099 0.0210 0.0351 0.0515 0.0695 0.0888 0.1087 0.1288 0.1488 0.1684 0.1872 0.2052 0.2220 0.2376 0.2518 0.2646 0.2758 6  
  3 0.0001 0.0004 0.0013 0.0029 0.0054 0.0089 0.0134 0.0189 0.0255 0.0331 0.0416 0.0511 0.0613 0.0723 0.0839 0.0959 0.1084 0.1211 5  
  4 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0013 0.0021 0.0031 0.0046 0.0064 0.0087 0.0115 0.0147 0.0185 0.0228 0.0277 0.0332 4  
  5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0006 0.0009 0.0014 0.0019 0.0026 0.0035 0.0045 0.0058 3  
  6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0002 0.0003 0.0005 0.0006 2  
  7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1  
  8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 8
9 0 0.9135 0.8337 0.7602 0.6925 0.6302 0.5730 0.5204 0.4722 0.4279 0.3874 0.3504 0.3165 0.2855 0.2573 0.2316 0.2082 0.1869 0.1676 9  
  1 0.0830 0.1531 0.2116 0.2597 0.2985 0.3292 0.3525 0.3695 0.3809 0.3874 0.3897 0.3884 0.3840 0.3770 0.3679 0.3569 0.3446 0.3312 8  
  2 0.0034 0.0125 0.0262 0.0433 0.0629 0.0840 0.1061 0.1285 0.1507 0.1722 0.1927 0.2119 0.2295 0.2455 0.2597 0.2720 0.2823 0.2908 7  
  3 0.0001 0.0006 0.0019 0.0042 0.0077 0.0125 0.0186 0.0261 0.0348 0.0446 0.0556 0.0674 0.0800 0.0933 0.1069 0.1209 0.1349 0.1489 6  
  4 0.0000 0.0000 0.0001 0.0003 0.0006 0.0012 0.0021 0.0034 0.0052 0.0074 0.0103 0.0138 0.0179 0.0228 0.0283 0.0345 0.0415 0.0490 5  
  5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005 0.0008 0.0013 0.0019 0.0027 0.0037 0.0050 0.0066 0.0085 0.0108 4  
  6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0004 0.0006 0.0008 0.0012 0.0016 3  
  7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 2  
  8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1  
  9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 9
10 0 0.9044 0.8171 0.7374 0.6648 0.5987 0.5386 0.4840 0.4344 0.3894 0.3487 0.3118 0.2785 0.2484 0.2213 0.1969 0.1749 0.1552 0.1374 10  
  1 0.0914 0.1667 0.2281 0.2770 0.3151 0.3438 0.3643 0.3777 0.3851 0.3874 0.3854 0.3798 0.3712 0.3603 0.3474 0.3331 3178 0.3077 9  
  2 0.0042 0.0153 0.0317 0.0519 0.0746 0.0988 0.1234 0.1478 0.1714 0.1937 0.2143 02330 0.2496 0.2639 0.2759 0.2856 0.2959 0.2980 8  
  3 0.0001 0.0008 0.0026 0.0058 0.0105 0.0168 0.0248 0.0343 0.0252 0.0574 0.0706 0.0847 0.0995 0.1146 0.1298 0.1450 0.1600 0.1745 7  
  4 0.0000 0.0000 0.0001 0.0004 0.0010 0.0019 0.0033 0.0052 0.0078 0.0102 0.0153 0.0202 0.0260 0.0326 0.0401 0.0483 0.0573 0.0670 6  
  5 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0003 0.0005 0.0009 0.0015 0.0023 0.0033 0.0047 0.0064 0.0085 0.0111 0.0141 0.0177 5  
  6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0006 0.0009 0.0012 0.0018 0.0024 0.0032 4  
  7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0004 3  
ANEXO A1  Tablas de distribuciones de probabilidad

  8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2  
  9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1  
  10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 10
x 0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82
n x n
P
345
346

Tabla 3. Probabilidades binomiales  (A3)


P
n x x n
0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18

12 0  0.8864 0.7847  0.6938  0.6127  0.5404   0.4759  0.4186  0.3677  0.3225 0.2824  0.2470  0.2157 0.1880  0.1637   0.1422 0.1234  0.1069  0.0924  12  

  1 0.1074 0.1922 0.2575 0.3064 0.3413 0.3645 0.3781 0.3837 0.3827 0.3766 0.3663 0.3529 0.3372 0.3197 0.3012 0.2821 0.2627 0.2434 11  
  2 0.0060 0.0216 0.0438 0.0702 0.0988 0.1280 0.1565 0.1835 0.2082 0.2301 0.2490 0.2647 0.2771 0.2863 0.2924 0.2955 0.2960 0.2939 10  
  3 0.0002 0.0015 0.0045 0.0098 0.0173 0.0272 0.0393 0.0532 0.0686 0.0852 0.1026 0.1203 0.1380 0.1553 0.1720 0.1876 0.2021 0.2151 9  
ANEXOS

  4 0.0000 0.0001 0.0003 0.0009 0.0021 0.0039 0.0067 0.0104 0.0153 0.0213 0.0285 0.0369 0.0464 0.0569 0.0683 0.0804 0.0931 0.1062 8  
  5 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0008 0.0014 0.0024 0.0038 0.0056 0.0081 0.0111 0.0148 0.0193 0.0245 0.0305 0.0373 7  
  6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0003 0.0005 0.0008 0.0013 0.0019 0.0028 0.0040 0.0054 0.0073 0.0096 6  
  7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0006 0.0009 0.0013 0.0018 5  
  8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0002 4  
  9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 3  
  10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2  
  11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1  
  12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 12
       
15 0 0.8601 0.7386 0.6333 0.5421 0.4633 0.3953 0.3367 0.2863 0.2430 0.2059 0.1741 0.1470 0.1238 0.1041 0.0874 0.0731 0.0611 0.0510 15  
  1 0.1303 0.2261 0.2938 0.3388 0.3658 0.3785 0.3801 0.3734 0.3605 0.3432 0.3228 0.3006 0.2775 0.2542 0.2312 0.2090 0.1878 0.1678 14  
  2 0.0092 0.0323 0.0636 0.0988 0.1348 0.1691 0.2003 0.2273 0.2496 0.2669 0.2793 0.2870 0.2903 0.2897 0.2856 0.2787 0.2692 0.2578 13  
  3 0.0004 0.0029 0.0085 0.0178 0.0307 0.0468 0.0653 0.0857 0.1070 0.1285 0.1496 0.1696 0.1880 0.2044 0.2184 0.2300 0.2389 0.2452 12  
  4 0.0000 0.0002 0.0008 0.0022 0.0049 0.0090 0.0148 0.0223 0.0317 0.0428 0.0555 0.0694 0.0843 0.0998 0.1156 0.1314 0.1468 0.1615 11  
  5 0.0000 0.0000 0.0001 0.0002 0.0006 0.0013 0.0024 0.0043 0.0069 0.0105 0.0151 0.0208 0.0277 0.0357 0.0449 0.0551 0.0662 0.0780 10  
  6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0006 0.0011 0.0019 0.0031 0.0047 0.0069 0.0097 0.0132 0.0175 0.0226 0.0285 9  
  7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0003 0.0005 0.0008 0.0013 0.0020 0.0030 0.0043 0.0059 0.0081 8  
  8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0005 0.0008 0.0012 0.0018 7  
  9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 6  
  10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 5  
  11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 4  
  12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 3  
  13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2  
  14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1  
  15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 15
0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82
n x x n
P
Tabla 3. Probabilidades binomiales (A4)
P
n x x n
0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18

20 0 0.8179 0.6676 0.5438 0.4420 0.3585 0.2901 0.2342 0.1887 0.1516 0.1216 0.0972 0.0776 0.0617 0.0490 0.0388 0.0306 0.0241 0.0189 20  

  1 0.1652 0.2725 0.3364 0.3683 0.3774 0.3703 0.3526 0.3282 0.3000 0.2702 0.2403 0.2115 0.1844 0.1595 0.1368 0.1165 0.0986 0.0829 19  

  2 0.0159 0.0528 0.0988 0.1458 0.1887 0.2246 0.2521 0.2711 0.2818 0.2852 0.2822 0.2740 0.2618 0.2466 0.2293 0.2109 0.1919 0.1730 18  

  3 0.0010 0.0065 0.0183 0.0364 0.0596 0.0860 0.1139 0.1414 0.1672 0.1901 0.2093 0.2242 0.2347 0.2409 0.2428 0.2410 0.2358 0.2278 17  

  4 0.0000 0.0006 0.0024 0.0065 0.0133 0.0233 0.0364 0.0523 0.0703 0.0898 0.1099 0.1299 0.1491 0.1666 0.1821 0.1951 0.2053 0.2125 16  

  5 0.0000 0.0000 0.0002 0.0009 0.0022 0.0048 0.0088 0.0145 0.0222 0.0319 0.0435 0.0567 0.0713 0.0868 0.1028 0.1189 0.1345 0.1493 15  

  6 0.0000 0.0000 0.0000 0.0001 0.0003 0.0008 0.0017 0.0032 0.0055 0.0089 0.0134 0.0193 0.0266 0.0353 0.0454 0.0566 0.0689 0.0819 14  

  7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0005 0.0011 0.0020 0.0033 0.0053 0.0080 0.0115 0.0160 0.0216 0.0282 0.0360 13  

  8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0012 0.0019 0.0030 0.0046 0.0067 0.0094 0.0128 12  

  9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0007 0.0011 0.0017 0.0026 0.0038 11  

  10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0006 0.0009 10  

  11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 9  

  12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 8  

  13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 7  

  14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 6  

  15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 5  

  16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 4  

  17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 3  

  18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2  
ANEXO A1  Tablas de distribuciones de probabilidad

  19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1  

  20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 20

0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82
n x x n
P
347
348
Tabla 3. Probabilidades binomiales (A5)
P
n x x n
0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.30 0.31 0.32 0.33 0.34 0.35 0.36
 
2 0 0.6561 0.6400 0.6241 0.6084  0.5929 0.5776   0.5625  0.5476  0.5329  0.5184  0.5041  0.4900  0.4761  0.4624  0.4489  0.4356  0.4225 2  
0.4096
  1 0.3078 0.3200 0.3318 0.3432 0.3542 0.3648 0.3750 0.3848 0.3942 0.4032 0.4118 0.4200 0.4278 0.4352 0.4422 0.4488 0.4550 0.4608 1  
  2 0.0361 0.0400 0.0441 0.0484 0.0529 0.0576 0.0625 0.0676 0.0729 0.0784 0.0841 0.0900 0.0961 0.1024 0.1089 0.1156 0.1225 0.1296 0 2
3 0 0.5314 0.5120 0.4930 0.4746 0.4565 0.4390 0.4219 0.4052 0.3890 0.3732 0.3579 0.3430 0.3285 0.3144 0.3008 0.2875 0.2746 0.2621 3  
  1 0.3740 0.3840 0.3932 0.4015 0.4091 0.4159 0.4219 0.4271 0.4316 0.4355 0.4386 0.4410 0.4428 0.4439 0.4444 0.4443 0.4436 0.4424 2  
ANEXOS

  2 0.0877 0.0960 0.1045 0.1133 0.1222 0.1313 0.1406 0.1501 0.1597 0.1693 0.1791 0.1890 0.1989 0.2089 0.2189 0.2289 0.2389 0.2488 1  
  3 0.0069 0.0080 0.0093 0.0106 0.0122 0.0138 0.0156 0.0176 0.0197 0.0220 0.0244 0.0270 0.0298 0.0328 0.0359 0.0393 0.0429 0.0467 0 3
4 0 0.4305 0.4096 0.3895 0.3702 0.3515 0.3336 0.3164 0.2999 0.2840 0.2687 0.2541 0.2401 0.2267 0.2138 0.2015 0.1897 0.1785 0.1678 4  
  1 0.4039 0.4096 0.4142 0.4176 0.4200 0.4214 0.4219 0.4214 0.4201 0.4180 0.4152 0.4116 0.4074 0.4025 0.3970 0.3910 0.3845 0.3775 3  
  2 0.1421 0.1536 0.1651 0.1767 0.1882 0.1996 0.2109 0.2221 0.2331 0.2439 0.2544 0.2646 0.2745 0.2841 0.2933 0.3021 0.3105 0.3185 2  
  3 0.0222 0.0256 0.0293 0.0332 0.0375 0.0420 0.0469 0.0520 0.0575 0.0632 0.0693 0.0756 0.0822 0.0891 0.0963 0.1038 0.1115 0.1194 1  
  4 0.0013 0.0016 0.0019 0.0023 0.0028 0.0033 0.0039 0.0046 0.0053 0.0061 0.0071 0.0081 0.0092 0.0105 0.0119 0.0134 0.0150 0.0168 0 4
5 0 0.3487 0.3277 0.3077 0.2887 0.2707 0.2536 0.2373 0.2219 0.2073 0.1935 0.1804 0.1681 0.1564 0.1454 0.1350 0.1252 0.1160 0.1074 5  
  1 0.4089 0.4096 0.4090 0.4072 0.4043 0.4003 0.3955 0.3898 0.3834 0.3762 0.3685 0.3601 0.3513 0.3421 0.3325 0.3226 0.3124 0.3020 4  
  2 0.1919 0.2048 0.2174 0.2297 0.2415 0.2529 0.2637 0.2739 0.2836 0.2926 0.3010 0.3087 0.3157 0.3220 0.3275 0.3323 0.3364 0.3397 3  
  3 0.0450 0.0512 0.0578 0.0648 0.0721 0.0798 0.0879 0.0962 0.1049 0.1138 0.1229 0.1323 0.1418 0.1515 0.1613 0.1712 0.1811 0.1911 2  
  4 0.0053 0.0064 0.0077 0.0091 0.0108 0.0126 0.0146 0.0169 0.0194 0.0221 0.0251 0.0283 0.0319 0.0357 0.0397 0.0441 0.0488 0.0537 1  
  5 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008 0.0010 0.0012 0.0014 0.0017 0.0021 0.0024 0.0029 0.0034 0.0039 0.0045 0.0053 0.0060 0 5
6 0 0.2824 0.2621 0.2431 0.2252 0.2084 0.1927 0.1780 0.1642 0.1513 0.1393 0.1281 0.1176 0.1079 0.0989 0.0905 0.0827 0.0754 0.0687 6  
  1 0.3975 0.3932 0.3877 0.3811 0.3735 0.3651 0.3560 0.3462 0.3358 0.3251 0.3139 0.3025 0.2909 0.2792 0.2673 0.2555 0.2437 0.2319 5  
  2 0.2331 0.2458 0.2577 0.2687 0.2789 0.2882 0.2966 0.3041 0.3105 0.3160 0.3206 0.3241 0.3267 0.3284 0.3292 0.3290 0.3280 0.3261 4  
  3 0.0729 0.0819 0.0913 0.1011 0.1111 0.1214 0.1318 0.1424 0.1531 0.1639 0.1746 0.1852 0.1957 0.2061 0.2162 0.2260 0.2355 0.2446 3  
  4 0.0128 0.0154 0.0182 0.0214 0.0249 0.0287 0.0330 0.0375 0.0425 0.0478 0.0535 0.0595 0.0660 0.0727 0.0799 0.0873 0.0951 0.1032 2  
  5 0.0012 0.0015 0.0019 0.0024 0.0030 0.0036 0.0044 0.0053 0.0063 0.0074 0.0087 0.0102 0.0119 0.0137 0.0157 0.0180 0.0205 0.0232 1  
  6 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0007 0.0009 0.0011 0.0013 0.0015 0.0018 0.0022 0 6
7 0 0.2288 0.2097 0.1920 0.1757 0.1605 0.1465 0.1335 0.1215 0.1105 0.1003 0.0910 0.0824 0.0745 0.0672 0.0606 0.0546 0.0490 0.0440 7  
  1 0.3756 0.3670 0.3573 0.3468 0.3356 0.3237 0.3115 0.2989 0.2860 0.2731 0.2600 0.2471 0.2342 0.2215 0.2090 0.1967 0.1848 0.1732 6  
  2 0.2643 0.2753 0.2850 0.2935 0.3007 0.3067 0.3115 0.3150 0.3174 0.3186 0.3186 0.3177 0.3156 0.3127 0.3088 0.3040 0.2985 0.2922 5  
  3 0.1033 0.1147 0.1263 0.1379 0.1497 0.1614 0.1730 0.1845 0.1956 0.2065 0.2169 0.2269 0.2363 0.2452 0.2535 0.2610 0.2679 0.2740 4  
  4 0.0242 0.0287 0.0336 0.0389 0.0447 0.0510 0.0577 0.0648 0.0724 0.0803 0.0886 0.0972 0.1062 0.1154 0.1248 0.1345 0.1442 0.1541 3  
  5 0.0034 0.0043 0.0054 0.0066 0.0080 0.0097 0.0115 0.0137 0.0161 0.0187 0.0217 0.0250 0.0286 0.0326 0.0369 0.0416 0.0466 0.0520 2  
  6 0.0003 0.0004 0.0005 0.0006 0.0008 0.0010 0.0013 0.0016 0.0020 0.0024 0.0030 0.0036 0.0043 0.0051 0.0061 0.0071 0.0084 0.0098 1  
  7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0008 0 7
0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0.73 0.72 0.71 0.70 0.69 0.68 0.67 0.66 0.65 0.64
n x x n
P
Tabla 3. Probabilidades binomiales (A6)
P
n x x n
0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.30 0.31 0.32 0.33 0.34 0.35 0.36
8 0 0.1853 0.1678 0.1517 0.1370 0.1236  0.1113  0.1001   0.0899  0.0806  0.0722  0.0646  0.0576 0.0514  0.0457   0.0406 0.0360   0.0319 0.0281  8  
  1 0.3477 0.3355 0.3226 0.3092 0.2953 0.2812 0.2670 0.2527 0.2386 0.2247 0.2110 0.1977 0.1847 0.1721 0.1600 0.1484 0.1373 0.1267 7  
  2 0.2855 0.2936 0.3002 0.3052 0.3087 0.3108 0.3115 0.3108 0.3089 0.3058 0.3017 0.2965 0.2904 0.2835 0.2758 0.2675 0.2587 0.2494 6  
  3 0.1339 0.1468 0.1596 0.1722 0.1844 0.1963 0.2076 0.2184 0.2285 0.2379 0.2464 0.2541 0.2609 0.2668 0.2717 0.2756 0.2786 0.2805 5  
  4 0.0393 0.0459 0.0530 0.0607 0.0689 0.0775 0.0865 0.0959 0.1056 0.1156 0.1258 0.1361 0.1465 0.1569 0.1673 0.1775 0.1875 0.1973 4  
  5 0.0074 0.0092 0.0113 0.0137 0.0165 0.0196 0.0231 0.0270 0.0313 0.0360 0.0411 0.0467 0.0527 0.0591 0.0659 0.0732 0.0808 0.0888 3  
  6 0.0009 0.0011 0.0015 0.0019 0.0025 0.0031 0.0038 0.0047 0.0058 0.0070 0.0084 0.0100 0.0118 0.0139 0.0162 0.0188 0.0217 0.0250 2  
  7 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008 0.0010 0.0012 0.0015 0.0019 0.0023 0.0028 0.0033 0.0040 1  
  8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0 8
9 0 0.1501 0.1342 0.1199 0.1069 0.0952 0.0846 0.0751 0.0665 0.0589 0.0520 0.0458 0.0404 0.0355 0.0311 0.0272 0.0238 0.0207 0.0180 9  
  1 0.3169 0.3020 0.2867 0.2713 0.2558 0.2404 0.2253 0.2104 0.1960 0.1820 0.1685 0.1556 0.1433 0.1317 0.1206 0.1102 0.1004 0.0912 8  
  2 0.2973 0.3020 0.3049 0.3061 0.3056 0.3037 0.3003 0.2957 0.2899 0.2831 0.2754 0.2668 0.2576 0.2478 0.2376 0.2270 0.2162 0.2052 7  
  3 0.1627 0.1762 0.1891 0.2014 0.2130 0.2238 0.2336 0.2424 0.2502 0.2569 0.2624 0.2668 0.2701 0.2721 0.2731 0.2729 0.2716 0.2693 6  
  4 0.0573 0.0661 0.0754 0.0852 0.0954 0.1060 0.1168 0.1278 0.1388 0.1499 0.1608 0.1715 0.1820 0.1921 0.2017 0.2109 0.2194 0.2272 5  
  5 0.0134 0.0165 0.0200 0.0240 0.0285 0.0335 0.0389 0.0449 0.0513 0.0583 0.0657 0.0735 0.0818 0.0904 0.0994 0.1086 0.1181 0.1278 4  
  6 0.0021 0.0028 0.0036 0.0045 0.0057 0.0070 0.0087 0.0105 0.0127 0.0151 0.0179 0.0210 0.0245 0.0284 0.0326 0.0373 0.0424 0.0479 3  
  7 0.0002 0.0003 0.0004 0.0005 0.0007 0.0010 0.0012 0.0016 0.0020 0.0025 0.0031 0.0039 0.0047 0.0057 0.0069 0.0082 0.0098 0.0116 2  
  8 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0007 0.0008 0.0011 0.0013 0.0016 1  
  9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0 9
10 0 0.1216 0.1074 0.0947 0.0834 0.0733 0.0643 0.0563 0.0492 0.0430 0.0374 0.0326 0.0282 0.0245 0.0211 0.0182 0.0157 0.0135 0.0115 10  
  1 0.2852 0.2684 0.2517 0.2351 0.2188 0.2030 0.1877 0.1730 01590 0.1456 0.1330 0.1211 0.1099 0.0995 0.0898 0.0808 0.0725 0.0649 9  
  2 0.3010 0.3020 0.3011 0.2984 0.2942 0.2885 0.2816 0.2735 0.2646 0.2548 0.2444 0.2335 0.2222 0.2107 0.1990 0.1873 0.1757 0.1642 8  
  3 0.1883 0.2013 0.2134 0.2244 0.2343 0.2429 0.2503 0.2563 0.2609 0.2642 0.2662 0.2668 0.2662 0.2644 0.2614 0.2573 0.2522 0.2462 7  
  4 0.0773 0.0881 0.0993 0.1108 0.1225 0.1343 0.1460 0.1576 0.1689 0.1798 0.1903 0.2001 0.2093 0.2177 0.2253 0.2320 0.2377 0.2424 6  
  5 0.0218 0.0264 0.0317 0.0375 0.0439 0.0509 0.0584 0.0664 0.0750 0.0839 0.0933 0.1029 0.1128 0.1229 0.1332 0.1434 0.1536 0.1636 5  
  6 0.0043 0.0055 0.0070 0.0088 0.0109 0.0134 0.0162 0.0195 0.0231 0.0272 0.0317 0.0368 0.0422 0.0482 0.0547 0.0616 0.0689 0.0767 4  
  7 0.0006 0.0008 0.0011 0.0014 0.0019 0.0024 0.0031 0.0039 0.0049 0.0060 0.0074 0.0090 0.0108 0.0130 0.0154 0.0181 0.0212 0.0247 3  
ANEXO A1  Tablas de distribuciones de probabilidad

  8 0.0001 0.00001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0014 0.0018 0.0023 0.0028 0.0035 0.0043 0.0052 2  
  9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 1  
  10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 10
0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0.73 0.72 0.71 0.70 0.69 0.68 0.67 0.66 0.65 0.64
n x x n
P
349
350
ANEXOS

Tabla 3. Probabilidades binomiales (A7)


P
n x x n
0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.30 0.31 0.32 0.33 0.34 0.35 0.36

12 0 0.0798 0.0687 0.0591 0.0507 0.0434 0.0371 0.0317 0.0270 0.0229 0.0194 00164 0.0138 0.0116 0.0098 0.0082 0.0068 0.0057 0.0047 12  

  1 0.2245 0.2062 0.1885 0.1717 0.1557 0.1407 0.1267 0.1137 0.1016 0.0906 0.0804 0.0712 0.0628 0.0552 0.0484 0.0422 0.0368 0.0319 11  

  2 0.2897 0.2835 0.2756 0.2663 0.2558 0.2444 0.2323 0.2197 0.2068 0.1937 0.1807 0.1678 0.1552 0.1429 0.1310 0.1197 0.1088 0.0986 10  

  3 0.2265 0.2362 0.2442 0.2503 0.2547 0.2573 0.2581 0.2573 0.2549 0.2511 0.2460 0.2397 0.2324 0.2241 0.2151 0.2055 0.1954 0.1849 9  

  4 0.1195 0.1329 0.1460 0.1589 0.1712 0.1828 0.1936 0.2034 0.2122 0.2197 0.2261 0.2311 0.2349 0.2373 0.2384 0.2382 0.2367 0.2340 8  

  5 0.0449 0.0532 0.0621 0.0717 0.0818 0.0924 0.1032 0.1143 0.1255 0.1367 0.1477 0.1585 0.1688 0.1787 0.1879 0.1963 0.2039 0.2106 7  

  6 0.0123 0.0155 0.0193 0.0236 0.0285 0.0340 0.0401 0.0469 0.0542 0.0620 0.0704 0.0792 0.0885 0.0981 0.1079 0.1180 0.1281 0.1382 6  

  7 0.0025 0.0033 0.0044 0.0057 0.0073 0.0092 0.0115 0.0141 0.0172 0.0207 0.0246 0.0291 0.0341 0.0396 0.0456 0.0521 0.0591 0.0666 5  

  8 0.0004 0.0005 0.0007 0.0010 0.0014 0.0018 0.0024 0.0031 0.0040 0.0050 0.0063 0.0078 0.0096 0.0116 0.0140 0.0168 0.0199 0.0234 4  

  9 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0015 0.0019 0.0024 0.0031 0.0038 0.0048 0.0059 3  

  10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0003 0.0003 0.0005 0.0006 0.0008 0.0010 2  

  11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 1  

  12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.00000 0.0000 0.0000 0.0000 0.0000 0 12

0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0.73 0.72 0.71 0.70 0.69 0.68 0.67 0.66 0.65 0.64
n x x n
P
Tabla 3. Probabilidades binomiales (A8)
P x n
n x
0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.30 0.31 0.32 0.33 0.34 0.35 0.36
15 0 0.0424  0.0352  0.0291  0.0241  0.0198  0.0163 0.0134  0.0109  0.0089  0.0072  0.0059  0.0047  0.0038  0.0031  0.0025 0.0020  0.0016  0.0012  15  
  1 0.1492 0.1319 0.1162 0.1018 0.0889 0.0772 0.0668 0.0576 0.0494 0.0423 0.0360 0.0305 0.0258 0.0217 0.0182 0.0152 0.0126 0.0104 14  
  2 0.2449 0.2309 0.2162 0.2010 0.1858 0.1707 0.1559 0.1416 0.1280 0.1150 0.1029 0.0916 0.0811 0.0715 0.0627 0.0547 0.0476 0.0411 13  
  3 0.2489 0.2501 0.2490 0.2457 0.2405 0.2336 0.2252 0.2156 0.2051 0.1939 0.1821 0.1700 0.1579 0.1457 0.1338 0.1222 0.1110 0.1002 12  
  4 0.1752 0.1876 0.1986 0.2079 0.2155 0.2213 0.2252 0.2273 0.2276 0.2262 0.2231 0.2186 0.2128 0.2057 0.1977 0.1888 0.1792 0.1692 11  
  5 0.0904 0.1032 0.1161 0.1290 0.1416 0.1537 0.1651 0.1757 0.1852 0.1935 0.2005 0.2061 0.2103 0.2130 0.2142 0.2140 0.2123 0.2093 10  
  6 0.0353 0.0430 0.0514 0.0606 0.0705 0.0809 0.0917 0.1029 0.1142 0.1254 0.1365 0.1472 0.1575 0.1671 0.1759 0.1837 0.1906 0.1963 9  
  7 0.0107 0.0138 0.0176 0.0220 0.0271 0.0329 0.0393 0.0465 0.0543 0.0627 0.0717 0.0811 0.0910 0.1011 0.1114 0.1217 0.1319 0.1419 8  
  8 0.0025 0.0035 0.0047 0.0062 0.0081 0.0104 0.0131 0.0163 0.0201 0.0244 0.0293 0.0348 0.0409 0.0476 0.0549 0.0627 0.0710 0.0798 7  
  9 0.0005 0.0007 0.0010 0.0014 0.0019 0.0025 0.0034 0.0045 0.0058 0.0074 0.0093 0.0116 0.0143 0.0174 0.0210 0.0251 0.0298 0.0349 6  
  10 0.0001 0.0001 0.0002 0.0002 0.0003 0.0005 0.0007 0.00009 0.00133 0.0017 0.0023 0.0030 0.0038 0.0049 0.0062 0.0078 0.0096 0.0118 5  
  11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0006 0.0008 0.0011 0.0014 0.0018 0.0024 0.0030 4  
  12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0006 3  
  13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 2  
  14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1  
  15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 15
20 0 0.0148 0.0115 0.0090 0.0069 0.0054 0.0041 0.0032 0.0024 0.0018 0.0014 0.0014 0.0011 0.0006 0.0004 0.0003 0.0002 0.0002 0.0001 20  
  1 0.0693 0.0576 0.0477 0.0392 0.0321 0.0261 0.0211 0.0170 0.0137 0.0109 0.0087 0.0068 0.0054 0.0042 0.0033 0.0025 0.0020 0.0015 19  
  2 0.1545 0.1369 0.1204 0.1050 0.0910 0.0783 0.0669 0.0569 0.0480 0.0403 0.0336 0.0278 0.0229 0.0188 0.0153 0.0124 0.0110 0.0080 18  
  3 0.2175 0.2054 0.1920 0.1777 0.1631 0.1484 0.1339 0.1199 0.1065 0.0940 0.0823 0.0716 0.0619 0.0531 0.0453 0.0383 0.0323 0.0270 17  
  4 0.2168 0.2182 0.2169 0.2131 0.2070 0.1991 0.1897 0.1790 0.1675 0.1553 0.1429 0.1304 0.1181 0.1062 0.0947 0.0839 0.0738 0.0645 16  
  5 0.1627 0.1746 0.1845 0.1923 0.1979 0.2012 0.2023 0.2013 0.1982 0.1933 0.1868 0.1789 0.1698 0.1599 0.1493 0.1384 0.1272 0.1161 15  
  6 0.0954 0.1091 0.1226 0.1356 0.1478 0.1589 0.1686 0.1768 0.1833 0.1879 0.1907 0.1916 0.1907 0.1881 0.1839 0.1782 0.1712 0.1632 14  
  7 0.0448 0.0545 0.0652 0.0765 0.0883 0.1003 0.1124 0.1242 0.1356 0.1462 0.1558 0.1643 0.1714 0.1770 0.1811 0.1836 0.1844 0.1836 13  
  8 0.0171 0.0222 0.0282 0.0351 0.0429 0.0515 0.0609 0.0709 0.0815 0.0924 0.1034 0.1144 0.1251 0.1354 0.1450 0.1537 0.1614 0.1678 12  
  9 0.0053 0.0074 0.0100 0.0132 0.0171 0.0217 0.0271 0.0332 0.0402 0.0479 0.0563 0.0654 0.0750 0.0849 0.0952 0.1056 0.1158 0.1259 11  
  10 0.0014 0.0020 0.0029 0.0041 0.0056 0.0075 0.0099 0.0128 0.0163 0.0205 0.0253 0.0308 0.0370 0.0440 0.0516 0.0598 0.0686 0.0779 10  
  11 0.0003 0.0005 0.0007 0.0010 0.0015 0.0022 0.0030 0.0041 0.0055 0.0072 0.0094 0.0120 0.0151 0.0188 0.0231 0.0280 0.0336 0.0398 9  
  12 0.0001 0.0001 0.0001 0.0002 0.0003 0.0005 0.0008 0.0011 0.0015 0.0021 0.0029 0.0039 0.0051 0.0066 0.0085 0.0108 0.0136 0.0168 8  
  13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0002 0.0003 0.0005 0.0007 0.0010 0.0014 0.0019 0.0026 0.0034 0.0045 0.0058 7  
  14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0005 0.0006 0.0009 0.0012 0.0016 6  
  15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0004 5  
ANEXO A1  Tablas de distribuciones de probabilidad

  16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 4  
  17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 3  
  18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2  
  19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1  
  20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 20
x 0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0.73 0.72 0.71 0.70 0.69 0.68 0.67 0.66 0.65 0.64 x n
n
P
351
352

Tabla 3. Probabilidades binomiales (A9)


P
n x x n
0.37 0.38 0.39 0.40 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 0.49 0.50
8 0 0.0248  0.0218  0.0192  0.0168  0.0147  0.0128  0.0111  0.0097  0.0084  0.0072  0.0062  0.0053  0.0046  0.0039  8  
  1 0.1166 0.1071 0.0981 0.0896 0.0816 0.0742 0.0672 0.0608 0.0548 0.0493 0.0442 0.0395 0.0352 0.0312 7  
  2 0.2397 0.2297 0.2194 0.2090 0.1985 0.1880 0.1776 0.1672 0.1569 0.1469 0.1371 0.1275 0.1183 0.1094 6  
  3 0.2815 0.2815 0.2806 0.2787 0.2759 0.2723 0.2679 0.2627 0.2568 0.2503 0.2431 0.2355 0.2273 0.2187 5  
ANEXOS

  4 0.2067 0.2157 0.2242 0.2322 0.2397 0.2465 0.2526 0.2580 0.2627 0.2665 0.2695 0.2717 0.2730 0.2734 4  
  5 0.0971 0.1058 0.1147 0.1239 0.1332 0.1428 0.1525 0.1622 0.1719 0.1816 0.1912 0.2006 0.2098 0.2187 3  
  6 0.0285 0.0324 0.0367 0.0413 0.0463 0.0517 0.0575 0.0637 0.0703 0.0774 0.0848 0.0926 0.1008 0.1094 2  
  7 0.0048 0.0057 0.0067 0.0079 0.0092 0.0107 0.0124 0.0143 0.0164 0.0188 0.0215 0.0244 0.0277 0.0312 1  
  8 0.0004 0.0004 0.0005 0.0007 0.00008 0.0010 0.0012 0.0014 0.0017 0.0020 0.0024 0.0028 0.0033 0.0039 0 8
9 0 0.0156 0.0135 0.0117 0.0101 0.0087 0.0074 0.0064 0.0054 0.0046 0.0039 0.0033 0.0028 0.0023 0.0020 9  
  1 0.0826 0.0747 0.0673 0.0605 0.0542 0.0484 0.0431 0.0383 0.0339 0.0299 0.0263 0.0231 0.0202 0.0176 8  
  2 0.1941 0.1831 0.1721 0.1612 0.1506 0.1402 0.1301 0.1204 0.1110 0.1020 0.0934 0.0853 0.0776 0.0703 7  
  3 0.2660 0.2618 0.2567 0.2508 0.2442 0.2369 0.2291 0.2207 0.2119 0.2027 0.1933 0.1837 0.1739 0.1641 6  
  4 0.2344 0.2407 0.2462 0.2508 0.2545 0.2573 0.2592 0.2601 0.2600 0.2590 0.2571 0.2543 0.2506 0.2461 5  
  5 0.1376 0.1475 0.1574 0.1672 0.1769 0.1863 0.1955 0.2044 0.2128 0.2207 0.2280 0.2347 0.2408 0.2461 4  
  6 0.0539 0.0603 0.0671 0.0743 0.0819 0.0900 0.0983 0.1070 0.1160 0.1253 0.1348 0.1445 0.1542 0.1641 3  
  7 0.0136 0.0158 0.0184 0.0212 0.0244 0.0279 0.0318 0.0360 0.0407 0.0458 0.0512 0.0571 0.0635 0.0703 2  
  8 0.0020 0.0024 0.0029 0.0035 0.0042 0.0051 0.0060 0.0071 0.0083 0.0097 0.0114 0.0132 0.0153 0.0176 1  
  9 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0008 0.0009 0.0011 0.0014 0.0016 0.0020 0 9
10 0 0.0098 0.0084 0.0071 0.0060 0.0051 0.0043 0.0036 0.0030 0.0025 0.0021 0.0017 0.0014 0.0012 0.0010 10  
  1 0.0578 0.0514 0.0456 0.0403 0.0355 0.0312 0.0273 0.00238 0.0207 0.0180 0.0155 0.0133 0.0114 0.0098 9  
  2 0.1529 0.1419 0.1312 0.1209 0.1111 0.1017 0.0927 0.0843 0.0763 0.0688 0.0619 0.0554 0.0494 0.0439 8  
  3 0.2394 0.2319 0.2237 0.2150 0.2058 0.1963 0.1865 0.1765 0.1665 0.1564 0.1464 0.1364 0.1267 0.1172 7  
  4 0.2461 0.2487 0.2503 0.2508 0.2503 0.2488 0.2462 0.2427 0.2384 0.2331 0.2271 0.2204 0.2130 0.2051 6  
  5 0.1734 0.1829 0.1920 0.2007 0.2087 0.2162 0.2229 0.2289 0.2340 0.2383 0.2417 0.2441 0.2456 0.2461 5  
  6 0.0849 0.0934 0.1023 0.1115 0.1209 0.1304 0.1401 0.1499 0.1596 0.1692 0.1786 0.1878 0.1966 0.2051 4  
  7 0.0285 0.0327 0.0374 0.0425 0.0480 0.0540 0.0604 0.0673 0.0746 0.0824 0.0905 0.0991 0.1080 0.1172 3  
  8 0.0063 0.0075 0.0090 0.0106 0.0125 0.0147 0.0171 0.0198 0.0229 0.0263 0.0301 0.0343 0.0389 0.0439 2  
  9 0.0008 0.0010 0.0013 0.0016 0.0019 0.0024 0.0029 0.0035 0.0042 0.0050 0.0059 0.0070 0.0083 0.0098 1  
  10 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0054 0.0005 0.0006 0.0008 0.0010 0 10
0.63 0.62 0.61 0.60 0.59 0.58 0.57 0.56 0.55 0.54 0.53 0.52 0.51 0.50
n x x n
P
Tabla 3. Probabilidades binomiales (A10)
P
n x x n
0.37 0.38 0.39 0.40 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 0.49 0.50

12 0 0.0039  0.0032  0.0027  0.0022  0.0018  0.0014  0.0012  0.0010  0.0008  0.0006  0.0005  0.0004  0.0003  0.0002  12  

  1 0.0276 0.0237 0.0204 0.0174 0.0148 0.0126 0.0106 0.0090 0.0075 0.0063 0.0052 0.0043 0.0036 0.0029 11  

  2 0.0890 0.0800 0.0716 0.0639 0.0567 0.0502 0.0442 0.0388 0.0339 0.0294 0.0255 0.0220 0.0189 0.0161 10  

  3 0.1742 0.1634 0.1526 0.1419 0.1314 0.1211 0.1111 0.1015 0.0923 0.0836 0.0754 0.0676 0.0604 0.0537 9  

  4 0.2302 0.2254 0.2195 0.2128 0.2054 0.1973 0.1886 0.1794 0.1700 0.1602 0.1504 0.1405 0.1306 0.1208 8  

  5 0.2163 0.2210 0.2246 0.2270 0.2284 0.2285 0.2276 0.2256 0.2225 0.2184 0.2134 0.2075 0.2008 0.1934 7  

  6 0.1482 0.1580 0.1675 0.1766 0.1851 0.1931 0.2003 0.2068 0.2124 0.2171 0.2208 0.2234 0.2250 0.2256 6  

  7 0.0746 0.0830 0.0918 0.1009 0.1103 0.1198 0.1295 0.1393 0.1489 0.1585 0.1678 0.1768 0.1853 0.1934 5  

  8 0.0274 0.0318 0.0367 0.0420 0.0479 0.0542 0.0611 0.0684 0.0762 0.0844 0.0930 0.1020 0.1113 0.1208 4  

  9 0.0071 0.0087 0.0104 0.0125 0.0148 0.0175 0.0205 0.0239 0.0277 0.0319 0.0367 0.0418 0.0475 0.0537 3  

  10 0.0013 0.0016 0.0020 0.0025 0.0031 0.0038 0.0046 0.0056 0.0068 0.0082 0.0098 0.0116 0.0137 0.0161 2  

  11 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008 0.0010 0.0013 0.0016 0.0019 0.0024 0.0029 1  

  12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.00001 0.0001 0.0001 0.0002 0.0002 0 12

15 0 0.0010 0.0008 0.0006 0.0005 0.0004 0.00003 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001 0.0000 0.0000 15  

  1 0.0086 0.0071 0.0058 0.0047 0.0038 0.0031 0.0025 0.0020 0.0016 0.0012 0.0010 0.0008 0.0006 0.0005 14  

  2 0.0354 0.0303 0.0259 0.0219 0.0185 0.0156 0.130 0.0108 0.0090 0.0074 0.0060 0.0049 0.0040 0.0032 13  

  3 0.0901 0.0805 0.0716 0.0634 0.0558 0.0489 0.0426 0.0369 0.0318 0.0272 0.0232 0.0197 0.0166 0.0139 12  

  4 0.1587 0.1481 0.1374 0.1268 0.1163 0.1061 0.0963 0.0869 0.0780 0.0696 0.0617 0.0545 0.0478 0.0417 11  

  5 0.2051 0.1997 0.1933 0.1859 0.1778 0.1691 0.1598 0.1502 0.1404 0.1304 0.1204 0.1106 0.1010 0.0916 10  

  6 0.2008 0.2040 0.2059 0.2066 0.2060 0.2041 0.2010 0.1967 0.1914 0.1851 0.1780 0.1702 0.1617 0.1527 9  

  7 0.1516 0.1608 0.1693 0.1771 0.1840 0.1900 0.1949 0.1987 0.2013 0.2028 0.2030 0.2020 0.1997 0.1964 8  

  8 0.0890 0.0985 0.1082 0.1181 0.1279 0.1376 0.1470 0.1561 0.1647 0.1727 0.1800 0.1864 0.1919 0.1964 7  

  9 0.0407 0.0470 0.0538 0.0612 0.0691 0.0775 0.0863 0.0954 0.1048 0.1144 0.1241 0.1338 0.1434 0.1527 6  

  10 0.0143 0.0173 0.0206 0.0245 0.0288 0.0337 0.0390 0.0450 0.0515 0.0585 0.0661 0.0741 0.0827 0.0916 5  

  11 0.0038 0.0048 0.0060 0.0074 0.0091 0.0111 0.0134 0.0161 0.0191 0.0226 0.0266 0.0311 0.0361 0.0417 4  

  12 0.0007 0.0010 0.0013 0.0016 0.0021 0.0027 0.0034 0.0042 0.0052 0.0064 0.0079 0.0096 0.0116 0.0139 3  
ANEXO A1  Tablas de distribuciones de probabilidad

  13 0.0001 0.0001 0.0002 0.0003 0.0003 0.0004 0.0006 0.0008 0.0010 0.0013 0.0016 0.0020 0.0026 0.0032 2  

  14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 1  

  15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 15
0.63 0.62 0.61 0.60 0.59 0.58 0.57 0.56 0.55 0.54 0.53 0.52 0.51 0.50
n x x n
P
353
354

Tabla 3. Probabilidades binomiales (A11)


P
n x x n
0.37 0.38 0.39 0.40 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 0.49 0.50

20 0 0.0001  0.0001  0.0001  0.0000  0.0000  0.0000  0.0000  0.0000  0.0000  0.0000  0.0000  0.0000  0.0000  0.0000  20  
ANEXOS

  1 0.0011 0.0009 0.0007 0.0005 0.0004 0.0003 0.0002 0.0001 0.0001 0.0001 0.0001 0.0000 0.0000 0.0000 19  

  2 0.0064 0.0050 0.0040 0.0031 0.0024 0.0018 0.0014 0.0011 0.0008 0.0006 0.0005 0.0003 0.0002 0.0002 18  

  3 0.0224 0.0185 0.0152 0.0123 0.0100 0.0080 0.0064 0.0051 0.0040 0.0031 0.0024 0.0019 0.0014 0.0011 17  

  4 0.0559 0.0482 0.0412 0.0350 0.0295 0.0247 0.0206 0.0170 0.0139 0.0113 0.0092 0.0074 0.0059 0.0046 16  

  5 0.1051 0.0945 0.0843 0.0746 0.0656 0.0573 0.0496 0.0427 0.0365 0.0309 0.0260 0.0217 0.0180 0.0148 15  

  6 0.1543 0.1447 0.1347 0.1244 0.1140 0.1037 0.0936 0.0839 0.0746 0.0658 0.0577 0.0501 0.0432 0.0370 14  

  7 0.1812 0.1774 0.1722 0.1659 0.1585 0.1502 0.1413 0.1318 0.1221 0.1122 0.1023 0.0925 0.0830 0.0739 13  

  8 0.1730 0.1767 0.1790 0.1797 0.1790 0.1768 0.1732 0.1683 0.1623 0.1553 0.1474 0.1388 0.1296 0.1201 12  

  9 0.1354 0.1444 0.1526 0.1597 0.1658 0.1707 0.1742 0.1763 0.1771 0.1763 0.1742 0.1708 0.1661 0.1602 11  

  10 0.0875 0.0974 0.1073 0.1171 0.1268 0.1359 0.1446 0.1524 0.1593 0.1652 0.1700 0.1734 0.1755 0.1762 10  

  11 0.0467 0.0542 0.0624 0.0710 0.0801 0.0895 0.0991 0.1089 0.1185 0.1280 0.1370 0.1455 0.1533 0.1602 9  

  12 0.0206 0.0249 0.0299 0.0355 0.0417 0.0486 0.0561 0.0642 0.0727 0.0818 0.0911 0.1007 0.1105 0.1201 8  

  13 0.0074 0.0094 0.0118 0.0146 0.0178 0.0217 0.0260 0.0310 0.0366 0.0429 0.0497 0.0572 0.0653 0.0739 7  

  14 0.0022 0.0029 0.0038 0.0049 0.0062 0.0078 0.0098 0.0122 0.0150 0.0183 0.0221 0.0264 0.0314 0.0370 6  

  15 0.0005 0.0007 0.0010 0.0013 0.0017 0.0023 0.0030 0.0038 0.0049 0.0062 0.0078 0.0098 0.0121 0.0148 5  

  16 0.0001 0.0001 0.0002 0.0003 0.0004 0.0005 0.0007 0.0009 0.0013 0.0017 0.0022 0.0028 0.0036 0.0046 4  

  17 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0005 0.0006 0.0008 0.0011 3  

  18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 2  

  19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1  

  20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 20

0.63 0.62 0.61 0.60 0.59 0.58 0.57 0.56 0.55 0.54 0.53 0.52 0.51 0.50
n x x n
P
ANEXO A1  Tablas de distribuciones de probabilidad 355

Tabla 4. Probabilidades de Poisson (A1)


λ
x
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
0 0.9048 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066 0.3679
1 0.0905 0.1637 0.2222 0.2681 0.3033 0.3293 0.3476 0.3595 0.3659 0.3679
2 0.0045 0.0164 0.0333 0.0536 0.0758 0.0988 0.1217 0.1438 0.1647 0.1839
3 0.0002 0.0011 0.0033 0.0072 0.0126 0.0198 0.0284 0.0383 0.0494 0.0613
4 0.0000 0.0001 0.0003 0.0007 0.0002 0.0030 0.0050 0.0077 0.0111 0.0153
5 0.0000 0.0000 0.0000 0.0001 0.0000 0.0004 0.0007 0.0012 0.0020 0.0031
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
λ
x
1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
0 0.3329 0.3012 0.2725 0.2466 0.2231 0.2019 0.1827 0.1653 0.1496 0.1353
1 0.3662 0.3614 0.3543 0.3452 0.3347 0.3230 0.3106 0.2975 0.2842 0.2707
2 0.2014 0.2169 0.2303 0.2417 0.2510 0.2584 0.2640 0.2678 0.2700 0.2707
3 0.0738 0.0867 0.0998 0.1128 0.1255 0.1378 0.1496 0.1607 0.1710 0.1804
4 0.0203 0.0260 0.0324 0.0395 0.0471 0.0551 0.0636 0.0723 0.0812 0.0902
5 0.0045 0.0062 0.0084 0.0111 0.0141 0.0176 0.0216 0.2060 0.0309 0.0361
6 0.0008 0.0012 0.0018 0.0026 0.0035 0.0047 0.0061 0.0078 0.0098 0.0120
7 0.0001 0.0002 0.0003 0.0005 0.0008 0.0011 0.0015 0.0020 0.0027 0.0034
8 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0005 0.0006 0.0009
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002
λ
x
2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0
0 0.1225 0.1108 0.1003 0.0907 0.0821 0.0743 0.0672 0.0608 0.0550 0.0498
1 0.2572 0.2438 0.2306 0.2177 0.2052 0.1931 0.1815 0.1703 0.1596 0.1494
2 0.2700 0.2681 0.2652 0.2613 0.2565 0.2510 0.2450 0.2384 0.2314 0.2240
3 0.1890 0.1966 0.2033 0.2090 0.2138 0.2176 0.2205 0.2225 0.22370 0.2240
4 0.0992 0.1082 0.1169 0.1254 0.1336 0.1414 0.1488 0.1557 0.1622 0.1680
5 0.0417 0.0476 0.0538 0.0602 0.0668 0.0735 0.0804 0.0872 0.0940 0.1008
6 0.0146 0.0174 0.0206 0.0241 0.0278 0.0319 0.0362 0.0407 0.0455 0.0504
7 0.0044 0.0055 0.0068 0.0083 0.0099 0.0118 0.0139 0.0163 0.0188 0.0216
8 0.0011 0.0015 0.0019 0.0025 0.0031 0.0038 0.0047 0.0057 0.0068 0.0081
9 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0014 0.0018 0.0022 0.0027
10 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
356 ANEXOS

Tabla 4. Probabilidades de Poisson (A2)


λ
x
3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0
0 0.0450 0.0408 0.0369 0.0334 0.0302 0.0273 0.0247 0.0224 0.0202 0.0183
1 0.1397 0.1304 0.1217 0.1135 0.1057 0.0984 0.0915 0.0850 0.0789 0.0733
2 0.2165 0.2087 0.2008 0.1929 0.1850 0.1771 0.1692 0.1615 0.1539 0.1465
3 0.2237 0.2226 0.2209 0.2186 0.2158 0.2125 0.2087 0.2046 0.2001 0.1954
4 0.1734 0.1781 0.1823 0.1858 0.1888 0.1912 0.1931 0.1944 0.1951 0.1954
5 0.1075 0.1140 0.1203 0.1264 0.1322 0.1377 0.1429 0.1477 0.1522 0.1563
6 0.0555 0.0608 0.0662 0.0716 0.0771 0.0826 0.0881 0.0936 0.0989 0.1042
7 0.0246 0.0278 0.312 0.0348 0.0385 0.0425 0.0466 0.0508 0.0551 0.0595
8 0.0095 0.0111 0.0129 0.0148 0.0169 0.0191 0.0215 0.0241 0.0269 0.0298
9 0.0033 0.0040 0.0047 0.0056 0.0066 0.0076 0.0089 0.0102 0.0116 0.0132
10 0.0010 0.0013 0.0016 0.0019 0.0023 0.0028 0.0033 0.0039 0.0045 0.0053
11 0.0003 0.0004 0.0005 0.0006 0.0007 0.0009 0.0011 0.0013 0.0016 0.0019
12 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006
13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001
λ
x
4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0
0 0.0166 0.0150 0.0136 0.0123 0.0111 0.0101 0.0091 0.0082 0.0074 0.0067
1 0.0679 0.0630 0.0583 0.0540 0.0500 0.0462 0.0427 0.0395 0.0365 0.0337
2 0.1393 0.1323 0.1254 0.1188 0.1125 0.1063 0.1005 0.0948 0.0894 0.0842
3 0.1904 0.1852 0.1798 0.1743 0.1687 0.1631 0.1574 0.1517 0.1460 0.1404
4 0.1951 0.1944 0.1933 0.1917 0.1898 0.1875 0.1849 0.1820 0.1789 0.1755
5 0.1600 0.1633 0.1662 0.1687 0.1708 0.1725 0.1738 0.1747 0.1753 0.1755
6 0.1093 0.1143 0.1191 0.1237 0.1281 0.1323 0.1362 0.1398 0.1432 0.1462
7 0.0640 0.0686 0.0732 0.0778 0.0824 0.0869 0.0914 0.0959 0.1022 0.1044
8 0.0328 0.0360 0.0393 0.0428 0.0463 0.0500 0.0537 0.0575 0.0614 0.0653
9 0.0150 0.0168 0.0188 0.0209 0.0232 0.0255 0.0280 0.0307 0.0073 0.0363
10 0.0061 0.0071 0.0081 0.0092 0.0104 0.0118 0.0132 0.0147 0.0164 0.0181
11 0.0023 0.0027 0.0032 0.0037 0.0043 0.0049 0.0056 0.0064 0.0073 0.0082
12 0.0008 0.0009 0.0011 0.0014 0.0016 0.0019 0.0022 0.0026 0.0030 0.0034
13 0.0002 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013
14 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005
15 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002
ANEXO A1  Tablas de distribuciones de probabilidad 357

Tabla 4. Probabilidades de Poisson (A3)


λ
x
5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 6.0
0 0.0061 0.0055 0.0050 0.0045 0.0041 0.0037 0.0033 0.0030 0.0027 0.0025
1 0.0311 0.0287 0.0265 0.0244 0.0225 0.0207 0.0191 0.0176 0.0162 0.0149
2 0.0793 0.0746 0.0701 0.0659 0.0618 0.0580 0.0544 0.0509 0.0477 0.0446
3 0.1348 0.1293 0.1239 0.1185 0.1133 0.1082 0.1033 0.0985 0.0938 0.0892
4 0.1719 0.1681 0.1641 0.1600 0.1558 0.1515 0.1472 0.1428 0.1383 0.1339
5 0.1753 0.1748 0.1740 0.1728 0.1714 0.1697 0.1678 0.1656 0.1632 0.1606
6 0.1490 0.1515 0.1537 0.1555 0.1571 0.1584 0.1594 0.1601 0.1605 0.1606
7 0.1086 0.1125 0.1163 0.1200 0.1234 0.1267 0.1298 0.1326 0.1353 0.1377
8 0.0692 0.0731 0.0771 0.0810 0.0849 0.0887 0.0925 0.0962 0.0998 0.1033
9 0.0392 0.0423 0.0454 0.0486 0.0519 0.0552 0.0586 0.0620 0.0654 0.0688
10 0.0200 0.0220 0.0241 0.0262 0.0285 0.0309 0.0334 0.0359 0.0386 0.0413
11 0.0093 0.0104 0.0116 0.0129 0.0143 0.0157 0.0173 0.0190 0.0654 0.0225
12 0.0039 0.0045 0.0051 0.0058 0.0065 0.0073 0.0082 0.0092 0.0102 0.0113
13 0.0015 0.0018 0.0021 0.0024 0.0028 0.0032 0.0036 0.0041 0.0046 0.0052
14 0.0006 0.0007 0.0008 0.0009 0.0011 0.0013 0.0015 0.0017 0.0019 0.0022
15 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0007 0.0008 0.0009
16 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003
17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001
λ
x
6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 7.0
0 0.0022 0.0020 0.0018 0.0017 0.0015 0.0014 0.0012 0.0011 0.0010 0.0009
1 0.0137 0.0126 0.0116 0.0106 0.0098 0.0090 0.0082 0.0076 0.0070 0.0064
2 0.0417 0.0390 0.0364 0.0340 0.0318 0.0296 0.0276 0.0258 0.0240 0.0223
3 0.0848 0.0806 0.0765 0.0726 0.0688 0.0652 0.0617 0.0584 0.0552 0.0521
4 0.1294 0.1249 0.1205 0.1162 0.1118 0.1076 0.1034 0.0992 0.0952 0.0912
5 0.1579 0.1549 0.1519 0.1487 0.1454 0.1420 0.1385 0.1349 0.1314 0.1277
6 0.1605 0.1601 0.1595 0.1586 0.1575 0.1562 0.1546 0.1529 0.1511 0.1490
7 0.1399 0.1418 0.1435 0.1450 0.1462 0.1472 0.1480 0.1486 0.1489 0.1490
8 0.1066 0.1099 0.1130 0.1160 0.1188 0.1215 0.1240 0.1263 0.1284 0.1304
9 0.0723 0.0757 0.0791 0.0825 0.0858 0.0891 0.0923 0.0954 0.0985 0.1014
10 0.0441 0.0469 0.0498 0.0528 0.0558 0.0588 0.0618 0.0649 0.0679 0.0710
11 0.0245 0.0265 0.0285 0.0307 0.0330 0.0353 0.0377 0.0401 0.0426 0.0452
12 0.0124 0.0137 0.0150 0.0164 0.0179 0.0194 0.0210 0.0227 0.0245 0.0264
13 0.0058 0.0065 0.0073 0.0081 0.0089 0.0098 0.0108 0.0119 0.0130 0.0142
14 0.0025 0.0029 0.0033 0.0037 0.0041 0.0046 0.0052 0.0058 0.0064 0.0071
15 0.0010 0.0012 0.0014 0.0016 0.0018 0.0020 0.0023 0.0026 0.0029 0.0033
16 0.0004 0.0005 0.0005 0.0006 0.0007 0.0008 0.0010 0.0011 0.0013 0.0014
17 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006
18 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002
19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001
358 ANEXOS

Tabla 4. Probabilidades de Poisson (A4)


λ
x
7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 8.0
0 0.0008 0.0007 0.0007 0.0006 0.0006 0.0005 0.0005 0.0004 0.0004 0.0003
1 0.0059 0.0054 0.0049 0.0045 0.0041 0.0038 0.0035 0.0032 0.0029 0.0027
2 0.0208 0.0194 0.0180 0.0167 0.0156 0.0145 0.0134 0.0125 0.0116 0.0107
3 0.0492 0.0464 0.0438 0.0413 0.0389 0.0366 0.0345 0.0324 0.0305 0.0286
4 0.0874 0.0836 0.0799 0.0764 0.0729 0.0696 0.0663 0.0632 0.0602 0.0573
5 0.1241 0.1204 0.1167 0.1130 0.1094 0.1057 0.1021 0.0986 0.0951 0.0916
6 0.1468 0.1445 0.1420 0.1394 0.1367 0.1339 0.1311 0.1282 0.1252 0.1221
7 0.1489 0.1486 0.1481 0.1474 0.1465 0.1454 0.1442 0.1428 0.1413 0.1396
8 0.1321 0.1337 0.1351 0.1363 0.1373 0.1382 0.1388 0.1392 0.1395 0.1396
9 0.1042 0.1070 0.1096 0.1121 0.1144 0.1167 0.1187 0.1207 0.1224 0.1241
10 0.0740 0.0770 0.0800 0.0829 0.0858 0.0877 0.0914 0.0941 0.0867 0.0993
11 0.0478 0.0504 0.0531 0.0558 0.0585 0.0613 0.0640 0.0667 0.695 0.0722
12 0.0283 0.0303 0.0323 0.0344 0.0366 0.0388 0.0411 0.0434 0.0457 0.0481
13 0.0154 0.0168 0.0181 0.0196 0.0211 0.0227 0.0243 0.0260 0.0278 0.0296
14 0.0078 0.0086 0.0095 0.0104 0.0113 0.0123 0.0134 0.0145 0.0157 0.0169
15 0.0037 0.0041 0.0046 0.0051 0.0057 0.0062 0.0069 0.0075 0.0083 0.0090
16 0.0016 0.0019 0.0021 0.0024 0.0026 0.0030 0.0033 0.0037 0.0041 0.0045
17 0.0007 0.0008 0.0009 0.0010 0.0012 0.0013 0.0015 0.0017 0.0019 0.0021
18 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 0.0006 0.0007 0.0008 0.0009
19 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0003 0.0003 0.0004
20 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002
21 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001

Tabla 4. Probabilidades de Poisson (A5)


λ
x
8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 9.0
0 0.0003 0.0003 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0001 0.0001
1 0.0025 0.0023 0.0021 0.0019 0.0017 0.0016 0.0014 0.0013 0.0012 0.0011
2 0.0100 0.0092 0.0086 0.0079 0.0074 0.0068 0.0063 0.0058 0.0054 0.0050
3 0.0269 0.0252 0.0237 0.0222 0.0208 0.0195 0.0183 0.0171 0.0160 0.0150
4 0.0544 0.0517 0.0491 0.0466 0.0443 0.0420 0.0398 0.0377 0.0357 0.0337
5 0.0882 0.0849 0.0816 0.0784 0.0752 0.0722 0.0692 0.0663 0.0635 0.0607
6 0.1191 0.1160 0.1128 0.1097 0.1066 0.1034 0.1003 0.0972 0.0941 0.0911
7 0.1378 0.1358 0.1338 0.1317 0.1294 0.1271 0.1247 0.1222 0.1197 0.1171
8 0.1395 0.1392 0.1388 0.1382 0.1375 0.1366 0.1356 0.1344 0.1332 0.1318
9 0.1256 0.1269 0.1280 0.1290 0.1299 0.1306 0.1311 0.1315 0.1317 0.1318
10 0.1017 0.1040 0.1063 0.1084 0.1104 0.1123 0.1140 0.1157 0.1172 0.1186
11 0.0749 0.0776 0.0802 0.0828 0.0853 0.0878 0.0902 0.0925 0.0948 0.0970
12 0.0505 0.0530 0.0555 0.0579 0.0604 0.0629 0.0654 0.0679 0.0703 0.0728
13 0.0315 0.0334 0.0354 0.0374 0.0395 0.0416 0.0438 0.0459 0.0481 0.0504
14 0.0182 0.0196 0.0210 0.0225 0.0240 0.0256 0.0272 0.0289 0.0306 0.0324
15 0.0098 0.0107 0.0116 0.0126 0.0136 0.0147 0.0158 0.0169 0.0182 0.0194
16 0.0050 0.0055 0.0060 0.0066 0.0072 0.0079 0.0086 0.0093 0.0101 0.0109
17 0.0024 0.0026 0.0029 0.0033 0.0036 0.0040 0.0044 0.0048 0.0053 0.0058
18 0.0011 0.0012 0.0014 0.0015 0.0017 0.0019 0.0021 0.0024 0.0026 0.0029
19 0.0005 0.0005 0.0006 0.0007 0.0008 0.0009 0.0010 0.0011 0.0012 0.0014
20 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004 0.0005 0.0005 0.0006
21 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0003
22 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001
ANEXO A1  Tablas de distribuciones de probabilidad 359

Tabla 4. Probabilidades de Poisson (A6)


λ
x
9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 9.9 10.0
0 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0000
1 0.0010 0.0009 0.0009 0.0008 0.0007 0.0007 0.0006 0.0005 0.0005 0.0005
2 0.0046 0.0043 0.0040 0.0037 0.0034 0.0031 0.0029 0.0027 0.0025 0.0023
3 0.0140 0.0131 0.0123 0.0115 0.0107 0.0100 0.0093 0.0087 0.0081 0.0076
4 0.0319 0.0302 0.0285 0.0269 0.0254 0.0240 0.0226 0.0213 0.0201 0.0189
5 0.0581 0.0555 0.0530 0.0506 0.0483 0.0460 0.0439 0.0418 0.0398 0.0378
6 0.0881 0.0851 0.0822 0.0793 0.0764 0.0736 0.0709 0.0682 0.0656 0.0631
7 0.1145 0.1118 0.1091 0.1064 0.1037 0.1010 0.0982 0.0955 0.0928 0.0901
8 0.1302 0.1286 0.1269 0.1251 0.1232 0.1212 0.1191 0.1170 0.1148 0.1126
9 0.1317 0.1315 0.1311 0.1306 0.1300 0.1293 0.1284 0.1274 0.1263 0.1251
10 0.1198 0.1210 0.1219 0.1228 0.1235 0.1241 0.1245 0.1249 0.1250 0.1251
11 0.0991 0.1012 0.1031 0.1049 0.1067 0.1083 0.1098 0.1112 0.1125 0.1137
12 0.0752 0.0776 0.0799 0.0822 0.0844 0.0866 0.0888 0.0908 0.0928 0.0948
13 0.0526 0.0549 0.0572 0.0594 0.0617 0.0640 0.0662 0.0685 0.0707 0.0729
14 0.0342 0.0361 0.0380 0.0399 0.0419 0.0439 0.0459 0.0479 0.0500 0.0521
15 0.0208 0.0221 0.0235 0.0250 0.0265 0.0281 0.0297 0.0313 0.0330 0.0347
16 0.0118 0.0127 0.0137 0.0147 0.0157 0.0168 0.0180 0.0192 0.0204 0.0217
17 0.0063 0.0069 0.0075 0.0081 0.0088 0.0095 0.0103 0.0111 0.0119 0.0128
18 0.0032 0.0035 0.0039 0.0042 0.0046 0.0051 0.0055 0.0060 0.0065 0.0071
19 0.0015 0.0017 0.0019 0.0021 0.0023 0.0026 0.0028 0.0031 0.0034 0.0037
20 0.0007 0.0008 0.0009 0.0010 0.0011 0.0012 0.0014 0.0015 0.0017 0.0019
21 0.0003 0.0003 0.0004 0.0004 0.0005 0.0006 0.0006 0.0007 0.0008 0.0009
22 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0003 0.0003 0.0004 0.0004
23 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002
24 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001
360 ANEXOS

Tabla 4. Probabilidades de Poisson (A7)


λ
x
11 12 13 14 15 16 17 18 19 20
0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.0010 0.0004 0.0002 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.0037 0.0018 0.0008 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000
4 0.0102 0.0053 0.0007 0.0013 0.0006 0.0003 0.0001 0.0001 0.0000 0.0000
5 0.0224 0.0127 0.0070 0.0037 0.0019 0.0010 0.0005 0.0002 0.0001 0.0001
6 0.0411 0.0255 0.0152 0.0087 0.0048 0.0026 0.0014 0.0007 0.0004 0.0002
7 0.0646 0.0437 0.0281 0.0174 0.0104 0.0060 0.0034 0.0018 0.0010 0.0005
8 0.0888 0.0655 0.0457 0.0304 0.0194 0.0120 0.0072 0.0042 0.0024 0.0013
9 0.1085 0.0874 0.0661 0.0473 0.0324 0.0213 0.0135 0.0083 0.0050 0.0029
10 0.1194 0.1048 0.0859 0.0663 0.0486 0.0341 0.0230 0.0150 0.0095 0.0058
11 0.1194 0.1144 0.1015 0.0844 0.0663 0.0496 0.0355 0.0245 0.0164 0.0106
12 0.1094 0.1144 0.1099 0.0984 0.0829 0.0661 0.0504 0.0368 0.0259 0.0176
13 0.0926 0.1056 0.1099 0.1060 0.0956 0.0814 0.0658 0.0509 0.0378 0.0271
14 0.0728 0.0905 0.1021 0.1060 0.1024 0.0930 0.0800 0.0655 0.0514 0.0387
15 0.0534 0.0724 0.0885 0.0989 0.1024 0.0992 0.0906 0.0786 0.0650 0.0516
16 0.0367 0.0543 0.0719 0.0866 0.0960 0.0992 0.0963 0.0884 0.0772 0.0646
17 0.0237 0.0343 0.0550 0.0713 0.0847 0.0934 0.0963 0.0936 0.0863 0.0760
18 0.0145 0.0383 0.0397 0.0554 0.0706 0.0830 0.0909 0.0936 0.0911 0.0844
19 0.0084 0.0256 0.0272 0.0409 0.0557 0.0699 0.0814 0.0887 0.0911 0.0888
20 0.0046 0.0097 0.0177 0.0286 0.0418 0.0559 0.0692 0.0798 0.0866 0.0888
21 0.0024 0.0055 0.0109 0.0191 0.0299 0.0426 0.0560 0.0684 0.0783 0.0846
22 0.0012 0.0030 0.0065 0.0121 0.0204 0.0310 0.0433 0.0560 0.0676 0.0769
23 0.0006 0.0016 0.0037 0.0074 0.0133 0.0216 0.0320 0.0438 0.0559 0.0669
24 0.0003 0.0008 0.0020 0.0043 0.0083 0.0144 0.0226 0.0328 0.0442 0.0557
25 0.0001 0.0004 0.0010 0.0024 0.0050 0.0092 0.0154 0.0237 0.0336 0.0446
26 0.0000 0.0002 0.0005 0.0013 0.0029 0.0057 0.0101 0.0164 0.0246 0.0343
27 0.0000 0.0001 0.0002 0.0007 0.0016 0.0034 0.0063 0.0109 0.0173 0.0254
28 0.0000 0.0000 0.0001 0.0003 0.0009 0.0019 0.0038 0.0070 0.0117 0.0181
29 0.0000 0.0000 0.0001 0.0002 0.0004 0.0011 0.0023 0.0044 0.0077 0.0125
30 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0013 0.0026 0.0049 0.0083
31 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0007 0.0015 0.0030 0.0054
ANEXO A1  Tablas de distribuciones de probabilidad 361

Tabla 5.1 Distribución Ji-Cuadrada (A1)


Área correspondiente al extremo derecho de Ji-cuadrada
0.20 del área y 11 grados
de libertad, busque en la
columna 0.20 y 11 g.l., y
Área 0.20 encontrará a 14.631 en
la tabla 5.2

Valores (χ2)
14.631

Grados de
0.99 0.975 0.95 0.90 0.80
libertad
1 0.00016 0.00098 0.00398 0.0158 0.0642
2 0.0201 0.0506 0.103 0.211 0.446
3 0.115 0.216 0.352 0.584 1.005
4 0.297 0.484 0.711 1.064 1.649
5 0.554 0.831 1.145 1.610 2.343
6 0.872 1.237 1.635 2.204 3.070
7 1.239 1.690 2.167 2.833 3.822
8 1.646 2.180 2.733 3.490 4.594
9 2.088 2.700 3.325 4.168 5.380
10 2.558 3.247 3.940 4.865 6.179
11 3.053 3.816 4.575 5.578 6.989
12 3.571 4.404 5.226 6.304 7.807
13 4.107 5.009 5.892 7.042 8.634
14 4.660 5.629 6.571 7.790 9.467
15 5.229 6.262 7.261 8.547 10.307
16 5.818 6.908 7.962 9.312 11.152
17 6.408 7.564 8.672 10.085 12.002
18 7.015 8.231 9.390 10.865 12.857
19 7.633 8.907 10.117 11.651 13.716
20 8.260 9.591 10.851 12.443 14.578
21 8.897 10.283 11.591 13.240 15.445
22 9.542 10.982 12.338 14.041 16.314
23 10.196 11.689 13.091 14.848 17.187
24 10.856 12.401 13.848 15.658 18.062
25 11.524 13.120 14.611 16.473 18.940
26 12.198 13.844 15.379 17.292 19.820
27 12.879 14.573 16.151 18.114 20.703
28 13.565 15.308 16.928 18.939 21.588
29 14.256 16.047 17.708 19.768 22.475
30 14.953 16.791 18.493 20.599 23.364
362 ANEXOS

Tabla 5.2 Distribución Ji-Cuadrada (A2)


Complemento área correspondiente al extremo derecho de Ji-cuadrada
Grados de
0.01 0.025 0.05 0.10 0.20
libertad
1 6.635 5.024 3.841 2.706 1.642
2 9.210 7.378 5.991 4.605 3.219
3 11.345 9.348 7.815 6.251 4.642
4 13.277 11.143 9.488 7.779 5.989
5 15.086 12.833 11.070 9.236 7.289
6 16.812 14.449 12.592 10.645 8.558
7 18.475 16.013 14.067 12.017 9.803
8 20.090 17.535 15.507 13.362 11.030
9 21.666 19.023 16.919 14.684 12.242
10 23.209 20.483 18.307 15.987 13.442
11 24.725 21.920 19.675 17.275 14.631
12 26.217 23.337 21.026 18.549 15.812
13 27.688 24.736 22.362 19.812 16.985
14 29.141 26.119 23.685 21.064 18.151
15 30.578 27.488 24.996 22.307 19.311
16 32.000 28.845 26.296 23.542 20.465
17 33.409 30.191 27.587 24.769 21.615
18 34.805 31.526 28.869 25.989 22.760
19 36.191 32.852 30.144 27.204 23.900
20 37.566 34.170 31.410 28.412 25.038
21 38.932 35.479 32.671 29.615 26.171
22 40.289 36.781 33.924 30.813 27.301
23 41.638 38.076 35.172 32.007 28.429
24 42.980 39.364 36.415 33.196 29.553
25 44.314 40.647 37.652 34.382 30.675
26 45.642 41.923 38.885 35.563 31.795
27 46.963 43.194 40.113 36.741 32.912
28 48.278 44.461 41.337 37.916 34.027
29 49.588 45.722 42.557 39.087 35.139
30 50.892 46.979 43.773 40.256 36.250
ANEXO A1  Tablas de distribuciones de probabilidad 363

Tabla 6. Distribución F
Con 4 grados de libertad
en el numerador y 5 grados
de libertad en el denomainador
se encuentra F = 3.52, con una
0.10
significancia de 0.10

3.52

α = 0.10
Grados de libertad Grados de libertad en el numerador
en el denominador 1 2 3 4 5 6 7 8 9
1 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86
2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38
3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24
4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94
5 4.06 3.78 3.62 3.52 3.45 3.4 3.37 3.34 3.32
6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96
7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72
8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56
9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44
10 3.29 2.92 2.13 2.61 2.52 2.46 2.41 2.38 2.35
11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.3 2.27
12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21
13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16
14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12
15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09
16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06
17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03
18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00
19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98
20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96
21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95
22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93
23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92
24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91
25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89
26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88
27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87
28 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87
29 2.89 2.5 2.28 2.15 2.06 1.99 1.93 1.89 1.86
30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85
40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79
60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74
120 2.75 2.35 2.13 1.99 1.9 1.82 1.77 1.72 1.68
∞ 2.71 2.3 2.08 1.95 1.85 1.77 1.72 1.67 1.63
364 ANEXOS

Tabla 6. Distribución F (continuación)


α = 0.10

Grados de libertad Grados de libertad en el numerador


en el denominador 10 12 15 20 24 30 40 60 120 ∞
1 60.19 60.71 61.22 61.74 62.00 62.26 62.53 62.79 63.06 63.33
2 9.39 9.41 9.42 9.44 9.45 9.46 9.47 9.47 9.48 9.49
3 5.23 5.22 5.2 5.18 5.18 5.17 5.16 5.15 5.14 5.13
4 3.92 3.90 3.87 3.84 3.83 3.82 3.8 3.79 3.78 3.76
5 3.30 3.27 3.24 3.21 3.19 3.17 3.16 3.14 3.12 3.11
6 2.94 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.72
7 2.70 2.67 2.63 2.59 2.58 2.56 2.54 2.51 2.49 2.47
8 2.54 2.50 2.46 2.42 2.40 2.38 2.36 2.34 2.32 2.29
9 2.42 2.38 2.34 2.30 2.28 2.25 2.23 2.21 2.18 2.16
10 2.32 2.28 2.24 2.20 2.18 2.16 2.13 2.11 2.08 2.06
11 2.25 2.21 2.17 2.12 2.10 2.08 2.05 2.03 2.00 1.97
12 2.19 2.15 2.10 2.06 2.04 2.01 1.99 1.96 1.93 1.90
13 2.14 2.10 2.05 2.01 1.98 1.96 1.93 1.90 1.88 1.85
14 2.10 2.05 2.01 1.96 1.94 1.91 1.89 1.86 1.83 1.80
15 2.06 2.02 1.97 1.92 1.90 1.87 1.85 1.82 1.79 1.76
16 2.03 1.99 1.94 1.89 1.87 1.84 1.81 1.78 1.75 1.72
17 2.00 1.96 1.91 1.86 1.84 1.81 1.78 1.75 1.72 1.69
18 1.98 1.93 1.89 1.84 1.81 1.78 1.75 1.72 1.69 1.66
19 1.96 1.91 1.86 1.81 1.79 1.76 1.73 1.70 1.67 1.63
20 1.94 1.89 1.84 1.79 1.77 1.74 1.71 1.68 1.64 1.61
21 1.92 1.87 1.83 1.78 1.75 1.72 1.69 1.66 1.62 1.59
22 1.90 1.86 1.81 1.76 1.73 1.70 1.67 1.64 1.60 1.57
23 1.89 1.84 1.80 1.74 1.72 1.69 1.66 1.62 1.59 1.55
24 1.88 1.83 1.78 1.73 1.70 1.67 1.64 1.61 1.57 1.53
25 1.87 1.82 1.77 1.72 1.69 1.66 1.63 1.59 1.56 1.52
26 1.86 1.81 1.76 1.71 1.68 1.65 1.61 1.58 1.54 1.50
27 1.85 1.80 1.75 1,70 1.67 1.64 1.60 1.57 1.53 1.49
28 1.84 1.79 1.74 1.69 1.66 1.63 1.59 1.56 1.52 1.48
29 1.83 1.78 1.73 1.68 1.65 1.62 1.58 1.55 1.51 1.47
30 1.82 1.77 1.72 1.67 1.64 1.61 1.57 1.54 1.5 1.46
40 1.76 1.71 1.66 1.61 1.57 1.54 1.51 1.47 1.42 1.38
60 1.71 1.66 1.60 1.54 1.51 1.48 1.44 1.40 1.35 1.29
120 1.65 1.60 1.55 1.48 1.45 1.41 1.37 1.32 1.26 1.19
∞ 1.60 1.55 1.49 1.42 1.38 1.34 1.30 1.24 1.17 1.00
ANEXO A1  Tablas de distribuciones de probabilidad 365

Tabla 6. Distribución F (continuación)


α = 0.05

Grados de libertad Grados de libertad en el numerador


en el denominador 1 2 3 4 5 6 7 8 9
1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54
2 18.51 19.00 19.16 19.25 19.3 19.33 19.35 19.37 19.38
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49
18 4.41 2.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32
24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04
120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96
∞ 3.84 3.00 2.61 2.37 2.21 2.10 2.01 1.94 1.88
366 ANEXOS

Tabla 6. Distribución F (continuación)


α = 0.05
Grados de libertad Grados de libertad en el numerador
en el denominador 10 12 15 20 24 30 40 60 120 ∞
1 241.88 243.91 245.95 248.01 249.05 250.10 251.14 252.20 253.25 254.31
2 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.5
3 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53
4 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
5 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.37
6 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
7 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23
8 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
9 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
10 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
11 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
12 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
13 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.3 2.25 2.21
14 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
15 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
16 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
17 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
18 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
19 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
20 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
21 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
22 2.3 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
23 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
25 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
26 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
27 2.20 2.13 2.06 1.97 1.93 1.88 1.84 1.79 1.73 1.67
28 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
29 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
30 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
40 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
60 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
120 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
∞ 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00
ANEXO A1  Tablas de distribuciones de probabilidad 367

Tabla 6. Distribución F (continuación)


α = 0.025
Grados de libertad Grados de libertad en el numerador
en el denominador 1 2 3 4 5 6 7 8 9
1 647.8 799.5 864.2 899.6 921.8 937.1 948.2 956.7 963.3
2 38.51 39.00 39.17 39.25 39.3 39.33 39.36 39.37 39.39
3 17.44 16.04 15.44 15.1 14.88 14.73 14.62 14.54 14.47
4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90
5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68
6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52
7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82
8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36
9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03
10 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78
11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59
12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44
13 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31
14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21
15 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12
16 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05
17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98
18 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93
19 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88
20 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84
21 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80
22 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76
23 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81 2.73
24 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70
25 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68
26 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65
27 5.63 4.24 3.65 3.31 3.08 2.92 2.80 2.71 2.63
28 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61
29 5.59 4.20 3.61 3.27 3.04 2.88 2.76 2.67 2.59
30 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57
40 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45
60 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33
120 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22
∞ 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11
368 ANEXOS

Tabla 6. Distribución F (continuación)


α = 0.025
Grados de libertad Grados de libertad en el numerador
en el denominador 10 12 15 20 24 30 40 60 120 ∞
1 968.6 976.7 984.9 993.1 997.2 1001.4 1005.6 1009.8 1014.0 1018.2
2 39.40 39.41 39.43 39.45 39.46 39.46 39.47 39.48 39.49 39.50
3 14.42 14.34 14.25 14.17 14.12 14.08 14.04 13.99 13.95 13.90
4 5.84 8.75 8.66 8.56 8.51 8.46 8.41 8.36 8.31 8.26
5 6.62 6.52 6.43 6.33 6.28 6.23 6.18 6.12 6.07 6.02
6 5.46 5.37 5.27 5.17 5.12 5.07 5.01 4.96 4.90 4.85
7 4.76 4.67 4.57 4.47 4.41 4.36 4.31 4.25 4.20 4.14
8 4.30 4.20 4.10 4.00 3.95 3.89 3.84 3.78 3.73 3.67
9 3.96 3.87 3.77 3.67 3.61 3.56 3.51 3.45 3.39 3.33
10 3.72 3.62 3.52 3.42 3.37 3.31 3.26 3.20 3.14 3.08
11 3.53 3.43 3.33 3.23 3.17 3.12 3.06 3.00 2.94 2.88
12 3.37 3.28 3.18 3.07 3.02 2.96 2.91 2.85 2.79 2.73
13 3.25 3.15 3.05 2.95 2.89 2.84 2.78 2.72 2.66 2.60
14 3.15 3.05 2.95 2.84 2.79 2.73 2.67 2.61 2.55 2.49
15 3.06 2.96 2.86 2.76 2.70 2.64 2.59 2.52 2.46 2.40
16 2.99 2.89 2.79 2.68 2.63 2.57 2.51 2.45 2.38 2.32
17 2.92 2.82 2.72 2.62 2.56 2.50 2.44 2.38 2.32 2.25
18 2.87 2.77 2.67 2.56 2.50 2.44 2.38 2.32 2.26 2.19
19 2.82 2.72 2.62 2.51 2.45 2.39 2.33 2.27 2.20 2.13
20 2.77 2.68 2.57 2.46 2.41 2.35 2.29 2.22 2.16 2.09
21 2.73 2.64 2.53 2.42 2.37 2.31 2.25 2.18 2.11 2.04
22 2.70 2.60 2.50 2.39 2.33 2.27 2.21 2.14 2.08 2.00
23 2.67 2.57 2.47 2.36 2.30 2.24 2.18 2.11 2.04 1.97
24 2.64 2.54 2.44 2.33 2.27 2.21 2.15 2.08 2.01 1.94
25 2.61 2.51 2.41 2.30 2.24 2.18 2.12 2.05 1.98 1.91
26 2.59 2.49 2.39 2.28 2.22 2.16 2.09 2.03 1.95 1.88
27 2.57 2.47 2.36 2.25 2.19 2.13 2.07 2.00 1.93 1.85
28 2.55 2.45 2.34 2.23 2.17 2.11 2.05 1.98 1.91 1.83
29 2.53 2.43 2.32 2.21 2.15 2.09 2.03 1.96 1.89 1.81
30 2.51 2.41 2.31 2.20 2.14 2.07 2.01 1.94 1.87 1.79
40 2.39 2.29 2.18 2.07 2.01 1.94 1.88 1.80 1.72 1.64
60 2.27 2.17 2.06 1.94 1.88 1.82 1.74 1.67 1.58 1.48
120 2.16 2.05 1.94 1.82 1.76 1.69 1.61 1.53 1.43 1.31
∞ 2.05 1.95 1.83 1.71 1.64 1.57 1.48 1.39 1.27 1.00
ANEXO A1  Tablas de distribuciones de probabilidad 369

Tabla 6. Distribución F (continuación)


α = 0.01

Grados de libertad Grados de libertad en el numerador


en el denominador 1 2 3 4 5 6 7 8 9
1 4052.2 4999.5 5403.4 5624.6 5763.6 5859.0 5928.4 5981.1 6022.5
2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.8 14.66
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16
6 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98
7 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72
8 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22
26 7.72 0.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15
28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.2 3.09
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07
40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56
∞ 6.64 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41
370 ANEXOS

Tabla 6. Distribución F (continuación)


α = 0.01
Grados de libertad Grados de libertad en el numerador
en el denominador 10 12 15 20 24 30 40 60 120 ∞
1 6055.8 6106.3 6157.3 6208.7 6234.6 6260.6 6286.8 6313.0 6339.4 6365.8
2 99.40 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.5
3 27.23 27.05 26.87 26.69 26.60 26.5 26.41 26.32 26.22 26.13
4 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46
5 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02
6 7.87 8.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88
7 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65
8 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86
9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
10 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
11 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
13 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
14 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
15 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
16 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
17 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
18 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
19 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
20 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
21 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
22 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
23 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
24 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
27 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
28 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.81
60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
∞ 2.32 2.19 2.04 1.88 1.79 1.70 1.59 1.47 1.33 1.00
ANEXO A1  Tablas de distribuciones de probabilidad 371

Tabla 6. Distribución F (continuación)


α = 0.005

Grados de libertad Grados de libertad en el numerador


en el denominador 1 2 3 4 5 6 7 8 9
1 16211 20000 21615 22500 23056 23437 23715 23925 24091
2 198.50 199.00 199.17 199.25 199.30 199.33 199.36 199.37 199.39
3 55.55 49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88
4 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14
5 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77
6 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39
7 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51
8 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34
9 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54
10 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97
11 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54
12 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20
13 11.37 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94
14 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72
15 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54
16 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38
17 10.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25
18 10.22 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14
19 10.07 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04
20 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96
21 9.83 6.89 5.73 5.09 4.68 4.39 4.18 4.01 3.88
22 9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81
23 9.63 6.73 5.58 4.95 4.54 4.26 4.05 3.88 3.75
24 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69
25 9.48 6.60 5.46 4.84 4.43 4.15 3.94 3.78 3.64
26 9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60
27 9.34 6.49 5.36 4.74 4.34 4.06 3.85 3.69 3.56
28 9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52
29 9.23 6.40 5.28 4.66 4.26 3.98 3.77 3.61 3.48
30 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45
40 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22
60 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01
120 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81
∞ 7.88 5.3 4.28 3.72 3.35 3.09 2.90 2.75 2.62
372 ANEXOS

Tabla 6. Distribución F (continuación)


α = 0.005
Grados de libertad Grados de libertad en el numerador
en el denominador 10 12 15 20 24 30 40 60 120 ∞
1 24224 24426 24630 24836 24940 25044 25148 25253 25359 25464
2 199.40 199.42 199.43 199.45 199.46 199.47 199.47 199.48 199.49 199.50
3 43.69 43.39 43.08 42.78 42.62 42.47 42.31 42.15 41.99 41.83
4 20.97 20.70 20.44 20.17 20.03 19.89 19.75 19.61 19.47 19.33
5 13.62 13.38 13.15 12.90 12.78 12.66 12.53 12.40 12.27 12.14
6 10.25 10.03 9.81 9.59 9.47 9.36 9.24 9.12 9.00 8.88
7 8.38 8.18 7.97 7.75 7.64 7.53 7.42 7.31 7.19 7.08
8 7.21 7.01 6.81 6.61 6.50 6.40 6.29 6.18 6.06 5.95
9 6.42 6.23 6.03 5.83 5.73 5.62 5.52 5.41 5.30 5.19
10 5.85 5.66 5.47 5.27 5.17 5.07 4.97 4.86 4.75 4.64
11 5.42 5.24 5.05 4.86 4.76 4.65 4.55 4.45 4.34 4.23
12 5.09 4.91 4.72 4.53 4.43 4.33 4.23 4.12 4.01 3.90
13 4.82 4.64 4.46 4.27 4.17 4.07 3.97 3.87 3.76 3.65
14 4.60 4.43 4.25 4.06 3.96 3.86 3.76 3.66 3.55 3.44
15 4.42 4.25 4.07 3.88 3.79 3.69 3.58 3.48 3.37 3.26
16 4.27 4.10 3.92 3.73 3.64 3.54 3.44 3.33 3.22 3.11
17 4.14 3.97 3.79 3.61 3.51 3.41 3.31 3.21 3.10 2.98
18 4.03 3.86 3.68 3.50 3.40 3.30 3.20 3.10 2.99 2.87
19 3.93 3.76 3.59 3.40 3.31 3.21 3.11 3.00 2.89 2.78
20 3.85 3.68 3.50 3.32 3.22 3.12 3.02 2.92 2.81 2.69
21 3.77 3.60 3.43 3.24 3.15 3.05 2.95 2.84 2.73 2.61
22 3.70 3.54 3.36 3.18 3.08 2.98 2.88 2.77 2.66 2.55
23 3.64 3.47 3.30 3.12 3.02 2.92 2.82 2.71 2.60 2.48
24 3.59 3.42 3.25 3.06 2.97 2.87 2.77 2.66 2.55 2.43
25 3.54 3.37 3.20 3.01 2.92 2.82 2.72 2.61 2.50 2.38
26 3.49 3.33 3.15 2.97 2.87 2.77 2.67 2.56 2.45 2.33
27 3.45 3.28 3.11 2.93 2.83 2.73 2.63 2.52 2.41 2.29
28 3.41 3.25 3.07 2.89 2.79 2.69 2.59 2.48 2.37 2.25
29 3.38 3.21 3.04 2.86 2.76 2.66 2.56 2.45 2.33 2.21
30 3.34 3.18 3.01 2.82 2.73 2.63 2.52 2.42 2.30 2.18
40 3.12 2.95 2.78 2.60 2.50 2.40 2.30 2.18 2.06 1.93
60 2.90 2.74 2.57 2.39 2.29 2.19 2.08 1.96 1.83 1.69
120 2.71 2.54 2.37 2.19 2.09 1.98 1.87 1.75 1.61 1.43
∞ 2.52 2.36 2.19 2.00 1.90 1.79 1.67 1.53 1.36 1.00
ANEXO A1  Tablas de distribuciones de probabilidad 373

Tabla 7. Correlación de spearman, áreas combinadas en ambas colas

-0.4424 0.4424

Para una prueba de dos colas de nivel de significado 0.20, con n = 10, el valor apropiado de r↓s
puede hallasrse buscando bajo la columna 0.20 y bajando hasta n igual a 10; alli encontraba el valor
apropiado de r↓s que es 0.4424
n 0.20 0.10 0.05 0.02 0.01 0.002
4 0.8000 0.8000 0.0000 0.0000 0.0000 0.0000
5 0.7000 0.8000 0.9000 0.9000 0.0000 0.0000
6 0.6000 0.7714 0.8286 0.8857 0.9429 0.0000
7 0.5357 0.6786 0.7450 0.8571 0.8929 0.9643
8 0.5000 06190 0.7143 0.8095 0.8571 0.9286
9 0.4667 0.5833 0.6833 0.7667 0.8167 0.9000
10 0.4424 0.5515 0.6364 0.7333 0.7818 0.8667
11 0.4182 0.5273 0.6091 0.7000 0.7455 0.8364
12 0.3986 0.4965 0.5804 0.6713 0.7273 0.8182
13 0.3791 0.4780 0.5549 0.6429 0.6978 0.7912
14 0.3626 0.4593 0.5341 0.6220 0.6747 0.7670
15 0.3500 0.4429 0.5179 0.6000 0.6536 0.7464
16 0.3382 0.4265 0.5000 0.5824 0.6324 0.7265
17 0.326 0.4118 0.4853 0.5637 0.6152 0.7083
18 0.3148 0.3994 0.4716 0.548 0.5975 0.6904
19 0.3070 0.3895 0.4579 0.5333 0.5825 0.6737
20 0.2977 0.3789 0.4451 0.5203 0.5684 0.6586
21 0.2909 0.3688 0.4351 0.5078 0.5545 0.6455
22 0.2829 0.3597 0.4241 0.4963 0.5426 0.6318
23 0.2767 0.3518 0.4150 0.4852 0.5306 0.6186
24 0.2704 0.3435 0.4061 0.4748 0.5200 0.6070
25 0.2646 0.3362 0.3977 0.4654 0.5100 0.5962
26 0.2588 0.3299 0.3894 0.4564 0.5002 0.5856
27 0.2540 0.3236 0.3822 0.4481 0.4915 0.5757
28 0.2490 0.3175 0.3749 0.4401 0.4828 0.5660
29 0.2443 0.3113 0.3685 0.4320 0.4744 0.5567
30 0.2400 0.3059 0.3620 0.4251 0.4665 0.5479
374 ANEXOS

Tabla 8. Valores críticos de D para la prueba de bondad de ajuste


de Kolmogorov-Smirnov
Tamaño de Nivel de significancia para  D = l Fe – Fo l
muestra n 0.20 0.15 0.10 0.05 0.01
1 0.900 0.925 0.950 0.975 0.995
2 0.684 0.726 0.776 0.842 0.929
3 0.565 0.597 0.642 0.708 0.828
4 0.494 0.525 0.564 0.624 0.733
5 0.446 0.474 0.510 0.565 0.669
     
6 0.410 0.436 0.470 0.521 0.618
7 0.381 0.405 0.438 0.486 0.577
8 0.358 0.381 0.411 0.457 0.543
9 0.339 0.360 0.388 0.432 0.514
10 0.322 0.342 0.368 0.410 0.490
     
11 0.307 0.326 0.352 0.391 0.468
12 0.295 0.313 0.338 0.375 0.450
13 0.284 0.302 0.325 0.361 0.433
14 0.274 0.292 0.314 0.349 0.418
15 0.266 0.283 0.304 0.338 0.404
     
16 0.258 0.274 0.295 0.328 0.392
17 0.250 0.266 0.286 0.318 0.381
18 0.244 0.259 0.278 0.309 0.371
19 0.237 0.252 0.272 0.301 0.363
20 0.231 0.246 0.264 0.294 0.356
     
25 0.21 0.22 0.24 0.27 0.32
30 0.19 0.20 0.22 0.24 0.29
35 0.18 0.19 0.21 0.23 0.27

1.07 1.14 1.22 1.36 1.63


más de 35
n n n n n
ANEXO A1  Tablas de distribuciones de probabilidad 375

Tabla 9. Dígitos aleatorios


7421356805 0245869545 5421874521 2135486545 9512347102
4521023358 2541002369 2465844652 8542103366 1687412301
1452300287 5214447852 0125499147 7455102359 2589746120
9510234887 1983254711 4897263388 1458752122 3687924512
0365210488 0023568974 7851339962 1234569875 5477788924
5211477023 2271002569 1489647652 3214568970 4105236987
6661235414 2038795246 8542133690 4125789631 4789512320
3355981024 8456213002 4123698751 4568217941 8512013654
3214568011 8932165455 9521400231 0895421023 8942135671
2587941019 6871325465 3669985412 2134589720 7894562130
1789521036 1597563102 3000145875 5421369872 7412589632
6321045899 2541320078 2145687943 5879213410 5412369871
2514875222 9210315478 2013654789 6428798521 4236594120
5884100236 9855441023 7125894232 6320147899 0758462158
8120456878 6214587231 1478999524 8954150133 2458679555
1452357898 5844462322 0258463570 4789542666 8529637416
9875246859 7531598523 6842368423 5552687002 4785412568
4732596855 9021311447 7758602419 8042758635 6852146975
9745621588 6523145874 7548471114 0123586492 2568485884
2452013687 2546852214 1201352485 1578544479 5874558891
2987751256 8415962031 5587462519 4587546210 2226854788
6251148710 1594873465 2985471235 9874521025 2203336854
7451202589 0748510236 4562187554 9652482100 7824456632
0584012587 4108529637 1185746589 5482134599 6655874102
9652412037 8514012369 2547820013 8210354289 5214012323
8817465903 1256799417 5745669974 4123589450 6412003596
1389246312 3689214873 3965210038 2358462193 5544612879
0246589321 0756245355 2721639851 6654132851 7123369845
9123004803 1756203459 4562348032 4460782531 5423258947
2568771026 3462785040 0404569821 1123584673 0999645219
4712486322 7512854688 7324202876 3157486912 6287461000
1548520367 0651732581 1925789450 9426874266 8056821349
0815362179 7821235364 4451632983 8712948256 9988772135
7451238957 6128792165 4951287936 0354869125 0584862453
1034568951 7024568211 2713467985 9234582134 0085413258
6520340586 4321050903 3346521379 6852164973 0613196085
1452466197 4025689750 9024563782 0111285463 6015675421
Procedimiento: En una urna se depositan 10 esferitas numeradas del 0 al 9, luego se establece el
experimento, sacando una a una con reemplazo y se registran como aparecen en la presente tabla.
376 ANEXOS

ANEXO A2  Respuestas a ejercicios de número par


Ejercicios capítulo 2
Ejercicios 2.3
2. Nominal
4.
6.

Ejercicios 2.4
2.
Asistencia de pacientes en el Hospital la Policlínica durante año 2015

Tipo de paciente Cantidad


Niñas 234
Concepto  Niños 322  Cuerpo
Varones Adultos 721
Mujeres Adultas 935
Total 2212

Fuente: Unidad de estadística


Hospital La Policlínica

Ejercicios 2.5
2. a) 100%    b) 31.54%  c) 13.27%  d) 14.52%
4. a) 36.36%  b) 63.63%

Ejercicios 2.6
2. 4,417 personas
4. 3,798 bacterias
6. a) t = 0.0214 o 2.14%  b) TCA = 1697672 y TCR = 0.2358  
c) P2040 = 15102230
8. Población inicial = 3564 enfermeras

Ejercicios 2.7
2. a) 0.022% b) 0.21%  c) 4.27%  d) 1.006%  e) 2.36%

Ejercicios 2.8
2. 132,758 habitantes
ANEXO A2  Respuestas a ejercicios de número par 377

Ejercicios capítulo 3
Ejercicios 3.1
2.

Población asegurada años 1975-1978


250
219

200

159
149
150
TEG.
125
S.P.S.
100
O.C.
73 75 66
60
50
26 27 27
16
0
Años 1975 1976 1977 1978

4.

500
450 112
400 Series 3
350
300 Series 2
210 60
250 Series 1
200 120 27
150 70
100 134
98 85
50
0
Gastrointestinales Respiratorias Psicomáticas

Ejercicios 3.2
2.
Peso f fa fra Xm Límites Reales
4.5 – 5.4  5  5   5.26 4.95 4.45 - 5.45
5.5 – 6.4 10 15  15.78 5.95 5.45 - 6.45
6.5 – 7.4 28 43  45.26 6.95 6.45 - 7.45
7.5 – 8.4 32 75  78.95 7.95 7.45 - 8.45
8.5 – 9.4 16 91  95.78 8.95 8.45 - 9.45
 9.5 – 10.4  4 95 100.00 9.95  9.45 - 10.45
Total 95
378 ANEXOS

4.
X f fa fr fra Xm Límites Reales
1.01 – 1.07 11 11 0.22  22 1.04 1.005 - 1.075
1.08 – 1.14 11 22 0.22  44 1.11 1.075 - 1.145
1.15 – 1.22  8 30 0.16  60 1.18 1.145 - 1.215
1.23 – 1.28  7 37 0.14  74 1.25 1.215 - 1.285
1.29 – 1.35  7 44 0.14  88 1.32 1.285 - 1.355
1.36 – 1.42  6 50 0.12 100 1.39 1.355 - 1.425
Total 50 1.00

Ejercicios 3.3
2.

a)

100

80

60

40

20

15.5 18.5 21.5 24.5 27.5 30.5

14 17 20 23 26 29 32

LR f fa Fra(%)
>15.5 52 288 100
>18.5 75 236  81.94
>21.5 95 161  55.90
>24.5 42 66  22.92
>27.5 24 24   8.33
>30.5  0  0   0.00

b)
Fra(%)

100

50

15.5 18.5 21.5 24.5 27.5 30.5


ANEXO A2  Respuestas a ejercicios de número par 379

LR f fa Fra(%)
<15.5  0   0   0.00
<18.5 52  52  18.05
<21.5 75 127  44.09
<24.5 95 222  77.08
<27.5 42 264  91.67
<30.5 24 288 100.00

c) Fra(%)

100

50

15.5 18.5 21.5 24.5 27.5 30.5

a) Usando la Ojiva Menor Que, el % debajo de 27.5 es el 91.67.


b) Usando la Ojiva Mayor Que, el % por arriba de 18.5 es el 81.84.

Ejercicios capítulo 4
Ejercicios 4.2
2. a) 182048  b) X1 + X2 + X3 + ⋯ + X10  c) 3.552713679 × 1033
d) 7207.31  e) 0.3077  f) 2.079

Ejercicios 4.3
2. μ = 18.333…

4. X = 7.58
6. a) μ = 12.94  b) μ = 14.925
8. μ = 44.69

Ejercicios 4.4
2. Me = 18
4. Me = 8.5
6. a) Me = 12.966  b) Me = 14.71
8. Me = 44.82

Ejercicios 4.5
2. M0 = 18
4. M0 = 8.5
6. a) M0 = 12.005 y M0 = 12.005  b) M0 = 12.46
8. M0 = 44.01

Ejercicios 4.6

2. X W = 81.19%

4. X W = 2.02
380 ANEXOS

Ejercicios 4.8
2. Factor = 1.1796
4. a) 4.66%  b) $ 75.66

Ejercicios capítulo 5
Ejercicios 5.2

2. D7 = 48.22; Q3 = 50.08; D2 = 18.45; P34 = 28.8; P97 = 76.5

Ejercicios 5.3
2. a) RP(1.52) = 8% y RP(7.77) = 83.21%
b) El 8% de los datos están por debajo de 1.52 y 92% por arriba de 1.52.
El 83.21% de los datos están por debajo de 7.77 y 16.79% están por arriba de 7.77

Ejercicios capítulo 6
Ejercicios 6.2

2. a) X = 4.155  b) σ = 1.504485 y σ2 = 2.263475
c) s = 1.513977 y s2 = 2.292126

4. X = 0.00173529; S = 0.000506138; S2 = 0.000000256176

Ejercicios 6.3
2. a) 7.14, 7.55, 7.74, 7.77, 7.86, 7.93, 7.98, 8.07, 8.16, 8.20, 8.27, 8.34, 8.45, 8.87, 8.88,
9.03, 9.04, 9.15, 9.73, 9.75, 9.87, 9.89

b) c) X = 8.53 ; s = 0.8012; s2 = 0.64187
X f
7.14 1
7.55 1
7.74 1
7.77 1
7.86 1
7.93 1
7.98 1
8.07 1
8.16 1
8.20 1
8.27 1
8.34 1
8.45 1
8.87 1
8.88 1
9.03 1
9.04 1
9.15 1
9.73 1
9.75 1
9.87 1
9.89 1
Total 22
ANEXO A2  Respuestas a ejercicios de número par 381

Ejercicios 6.4
2. a) μ = 0.431315789; σ = 0228464; σ2 = 0.05219564

b) X = 0.431315789; s = 0.229067247; s2 = 0.052471804
4. a)  μ = 84.7  b) σ = 4.91 y σ2 = 24.0895
Ejercicios 6.5
2. Los maestros de la facultad de medicina muestran mayor dispersión ya que 8.03% >
6.15%
4. Juan José es el empleado más constante.
6. a) x = 120  b) x = 144  c) x = 92  d) x = 161  e) x = 65
8. A: z = 1.625; B: z = 1.2
10. El tomate
Ejercicios 6.6
2. a) GC = 0.75 Loptocúrtica
b) GC = 1.27 Loptocúrtica
c) GC = - 2.34 Platicúrtica
d) GC = 2.15 Loptocúrtica
Ejercicios 6.7
2. a) ASF = 0.48
b) ASP = 0.36

Ejercicios capítulo 7
Ejercicios 7.0
2. Utilizando las tablas de estandarización directa e indirecta, y los análisis correspon-
dientes al tema; en vez de utilizar datos brutos.
4. Factor de confusión: Es aquel factor que muchas veces se desestima en una investiga-
ción y se utiliza otro que tienen menor impacto sobre la misma. Por otra parte, se
puede considerar como un tercer factor que oscurece la relación del primer y segundo
factor en análisis.
6. Si las poblaciones tienen componentes homogéneos o características muy idénticas,
estos elementos favorecen el desarrollo y análisis de las tablas de estandarización.
8. a) 14.38 por cada 1000 (unos 14 niños)
b) Unos 6 niños por cada 1000.
10. a) 1940: 1.2 y 1986: 1.95 (índice de muertes en 1986 es mayor que el índice de 1940)
b)
Edad Proporción 1940 Proporción 1986
0-4 0.00004686 0.00003669
5-14 0.00002973 0.000034406
15-24 0.000053799 0.000054201
25-34 0.0001732 0.00013099
35-44 0.0006108 0.000453311
45-54 0.0016877 0.0016568
55-64 0.003695705 0.004444
65-74 0.00695123 0.008470
75 + 0.011834657 0.013625
Total
382 ANEXOS

c)
Tasa especifica mortalidad Tasa especifica mortalidad
Edad por cáncer 1940 por cáncer 1986
0-4 46.86 36.69
5-14 29.73 34.41
15-24 53.799 54.201
25-34 173.2 130.99
35-44 610.8 453.3111
45-54 1687.725 1656.8
55-64 3695.7 4444.2695
65-74 6951.23 8470.055
75 + 11834.657 13634.7584
Total 1201.488 1946.64

Si existe relación entre la mortalidad por cáncer y edad, ya que a mayor edad la tasa
es mayor.
d) Si es necesaria, ya que las tasas para poblaciones con minoría de edad son bastante
bajas.
e)

Población Población
1940 Muertes 1986 Muertes
Edad (en miles) Tasa esperadas (en miles) Tasa esperadas
0-4 10541 46.86 493.95 18152 36.69 665.99
5-14 22431 29.73 666.87 33860 34.41 1165.12
15-24 23922 53.799 1286.97 39021 54.201 2114.977
25-34 21339 173.2 3695.91 42779 130.99 5603.62
35-44 18333 610.8 11197.79 33070 453.3111 14990.99
45-54 15512 1687.7 26179.6 22815 1656.8 37868.34
55-64 10572 3695.7 39070.94 22232 4444.2695 98804.99
65-74  6377 6951.23 44327.99 17332 8470.055 146802.99
75 +  2643 11834.657 31278.99 11836 13634.76 161381
Total 131670 1201.488 158199.01 241097 1946.644 469398

Tasa estandarizada de la población de 1940 en Estados Unidos

158199
= 1.2 por cada 1000
131670

Tasa estandarizada de la población de 1986 en Estados Unidos

469398
= 1.95 por cada 1000
241097
ANEXO A2  Respuestas a ejercicios de número par 383

f )

Tasa global Población Muertes Población Muertes


Edad por cada 1000 1940 esperadas 1986 esperadas
0-4 40.43 10541 426.2 18152 733.88
5-14 32.54 22431 729.9 33860 1101.8
15-24 54.05 23922 1292.98 39021 2109.08
25-34 145.045 21339 3095.11 42779 6204.88
35-44 509.48 18333 9340.29 33070 16848.5
45-54 1669.32 15512 25894.49 22815 38085.5
55-64 4203.024 10572 44434.36 22232 93441.63
65-74 8061.54  6377 51408.44 17332 139722.6
75 + 13306.167  2643 35168.19 11836 157491.79
Total 171789.96 455739.66

Tasa porcentual estandarizada de la población de 1940 en Estados Unidos

158200
= 0.92 o sea el 92%
171789.96
Tasa porcentual estandarizada de la población de 1986 en Estados Unidos
469330
=1.03 o sea el 103%
455739.66

Ejercicios capítulo 8
2. Función de riesgo es la proporción de individuos vivos al comienzo del intervalo de
edad x a x + n que mueren en algún momento durante el intervalo.
4. El lector en función de una tabla de vida debe saber diferenciar una población esta-
cionaria, de una población expansiva o constrictiva.

Ejercicios capítulo 9
Ejercicios 9.5

2. a) P(F ∩ G)  b) P(F ' ∩ E)  c) P(F ' ∩ E ')  d) P(F ∩ E ∩ G') 


4. a) P(W/Q)  b) P(Q/W ')  c) P(W '/Q' )
6. a) P(E ∩ W)  b) P(H '/E)  c) P((H ∩ G)/W)
8. a) 0.60  b) 0.50  c) 0.40  d) 0.10  e) 0.67  f) 0.20
10. a) 0.64  b) 0.88  c) 0.60

Ejercicios 9.5.1

2. a) 0.005  b) 0.987  c)  0.013
4. a) 0.8333….  b) 0.3333….  c) 0.666….
6. a) S = {B1 B2, B1 B3, B2 B3, B1 D1, B1 D2, B2 D1, B2 D2, B3 D1, B3 D2, D1 D2}
b) 0.30  c) 0.70  d) 0.10  e) 0.60
8. 0.888…
384 ANEXOS

Ejercicios 9.5.2

2. a) 0.0004  b) 0.00000016 < 0.00000020; la afirmación es verdadera


4. a) 0.005625  b) 0.001875  c) 0.201875

Ejercicios 9.5.3
288
2. a)  = 0.000000923
311875200
b) 0.0001736
56448
c)  311875200 = 0.00018995

4. a) 0.2857  b) 0.2857  c) 0.1428  d) 0
6. 0.805

Ejercicios 9.5.4
2. a) 0.3284  b) 0.4576
4. a) 0.00286  b) 0.4007
6. a) 0.26  b) 0.46

Ejercicios capítulo 10
Ejercicios 10.1
2. a) 0.2758  b) 0.04009  c) 0.05  d) 0.0013  e) 0.1796
4. a) 0.0043  b) 0.1480  c) 1  d) 0.0333  e) 0.9891  
f ) 0.5771 g) 0.2627
6. a) 0.9999  b) 0.9575  c) 0.0001  d) 0.1205
8. 0.0001
10. 0.06
12. E(x) = 0.1503

Ejercicios 10.2
2. a) 0.1363  b) 0.8647  c) 0.3067
4. P(x > 3) = 0.9896 > 0.30; Dejará de comprarle
6. a) 0.0183  b) 0.1465  c) 0.1954  d) 0.3711
8. 0.5858 > 0.50 Lo cambiará a otra tarea.
10. a) 0.0107  b) 0.0003  c) 0.9577  d) 0.0966

Ejercicios 10.3
2. a) 0.5793  b) 0.6730  c) 0.2743  d) 0.7257  e) 0.8413  f) 0.6294
4. a) µ = 15.6  b) x = 6.85
6. 0.4832
8. 0.7745 < 0.80; El prototipo no satisface los requerimientos.
10. µ = 4.3
12. Alrededor de 21 revistas.
ANEXO A2  Respuestas a ejercicios de número par 385

Ejercicios capítulo 11
Ejercicios 11.0
2.
22 20 84 89 68 15 25 92 98 62
4. (año 2009)
6 y 24 de enero, 11 de febrero, 1 y 19 de marzo, 6 y 24 de abril, 12 y 30 de mayo, 17
de junio, 5 y 23 de julio, 10 y 28 de agosto, 15 de septiembre, 3 y 21 de octubre, 8 y
26 de noviembre, 14 de diciembre.
6. Se pueden tomar diferentes probetas mediante el muestreo sistemático y la tabla de
dígitos aleatorios.

Ejercicios capítulo 12
Ejercicios 12.1

2. No. El promedio de la prueba no es exactamente igual al promedio de la población,


ya que hay un error de prueba.
4. No necesariamente

Ejercicios 12.3

2. a) x—1 = 36.0625, —
x 2 = 33.125, —
x 3 = 33.0, —
x 4 = 34.75, —
x 5 = 31.4375

b) x = 33.675
c) La media muestral que más se aproxima a la gran media es: — x 2 = 33.125

Ejercicios 12.4
2. n = 157
4. 0.0062

Ejercicios 12.5
2. 300
4. (61.03, 98.97)

Ejercicios 12.6
2. 0.3544
4. a) El error disminuye  b) El error aumenta
c) El error aumenta no significativamente  d) El error aumenta
6. a) 0.4725  b) 0.3504  c) 0.1879  d) 0.1181
8. 0.02215
10. a) 0.0475  b) 0.0475  c) 0.7011
12. a) 1.49  b) 0.0428
14. a) 0.0808  b) 0.8384  c) 0.2005

Ejercicios capítulo 13
Ejercicios Secciones 13.1 a 3.4
1. Realizar proyecto relacionado
2. Realizar proyecto relacionado
3. Realizar proyecto relacionado
386 ANEXOS

Ejercicios 13.5
2. a) Sensibilidad = 0.76  b) Especificidad = 0.91
4. a) CVERO (+) = 8.4 y CVERO (–) = 0.26
b) ODDS RATIO (+) = 2.352 y ODDS RATIO (–) = 0.0728
c) Probabilidad POSTEST (+) = 0.7016 y Probabilidad POSTEST (–) = 0.0678

Ejercicios capítulo 14
Ejercicios 14.1
2. μ = 142.77 y σ2 = 1877.28

Ejercicios 14.2
2. Un intervalo de confianza es la acotación por un límite inferior y límite superior, te-
niendo en cuenta el valor de la probabilidad de confianza que permite asegurar que
dentro de dicho intervalo caerá el verdadero parámetro de la población.
4. a) Los niveles altos de confianza producen intervalos amplios, de modo que sacrifi-
camos la precisión con tal de lograr mayor seguridad.
b) Los intervalos pequeños provienen de bajos niveles de confianza, de modo que
sacrificamos la confianza con tal de lograr precisión.

Ejercicios 14.3
2. a) σ–x = 1.2717  b) IC = 163.4 ± 2.556
4. a) 4.226  b) 842 ± 6.931
6. a) 0.981  b) 20.9 ± 2.011

Ejercicios 14.4
2. a) 95%  b) 90%  c) 98%
4. a) 11.3875  b) 0.8741  c) 11.3875 ± 2.6206

Ejercicios 14.5
2. a) 0.04   b) 0.6 ± 0.10312
4. a) 0.0352  b) 0.55 ± 0.0707

Ejercicios 14.6
2. n ≥ 2 25
4. n ≥ 51
6. n ≥ 1068

Ejercicios capítulo 15
Ejercicios 15.2
2. Una hipótesis nula representa la hipótesis que usted está tratando de rechazar; la hi-
pótesis alternativa representa todas las otras posibilidades.
4. El error tipo I: Rechazar una hipótesis cuando es cierta.
El error tipo II: Aceptar una hipótesis cuando esta es falsa.
6. El nivel de significancia de una prueba es la probabilidad de un error de tipo I.
8. Podríamos usar una cola izquierda si las hipótesis se plantean de la manera siguiente:
H0: μ = valor especificado
H1: μ < valor esperado
ANEXO A2  Respuestas a ejercicios de número par 387

Podríamos usar una cola derecha si las hipótesis se plantean de la manera siguiente:
H0: μ = valor especificado
H1: μ > valor esperado

Ejercicios 15.3
– –
2. X = $151 y X U = $150; se rechaza H0; sus comisiones son significativamente más
altas.
– –
4. X = 0.33% y X L = 0.51%; se rechaza H0; la tasa de crecimiento ha disminuido de
modo significativo.

Ejercicios 15.4
2. (14.04, 15.96) ; como x– =16 > 15.96; se rechaza H0
– – –
4. X U = 86.11; como X = 101 y X > 86.11; se rechaza H0

Ejercicios 15.5
— —
2. IC = (0.3245, 0.3755); P = 0.41 entonces P > 0.3755
Se rechaza H0; la proporción de préstamos otorgados a mujeres ha cambiado signifi-
cativamente.
— —
4. PU = 0.05577; P = 0.05583 y P > 0.05577
Podríamos rechazar H0 , pero debe tenerse cuidado ya que la diferencia no es signifi-
cativa.

Ejercicios capítulo 16
Ejercicios 16.1
2. 0 + σ x1 −x2 = 0.4951; x − x = 8.5 − 7.9 = 0.6 > 0.4951
Se rechaza H0, el segundo fármaco ofrece un periodo más corto de alivio.
4. Z* = 0.8358; ZL = –2.01 y ZU = 2.01
Se acepta H0, No existe diferencia en los dos tipos de servicio.

Ejercicios 16.2
– – –
2. a) X = X 1985 – X 1984 = –0.19$
b) s = 1.05$ y σ x = 0.35$
c) IC = (–1.01, 1.01)
De modo que aceptamos a H0; No fueron significativamente diferentes.
– – – – –
4. X = X despues - X antes = 11 y X U = 10.76; Como X > 10.76
Se rechaza H0, la información se corrobora.

Ejercicios 16.3
2. ZL = – 0.08 y Z* = –0.087; Se acepta H0; se instalará el sistema menos caro.
4. ZU = 0.1398; Z* = 0.09 < 0.1398
Se acepta H0; el nuevo medicamento no es significativamente más eficaz.

Ejercicios 16.4
2. t*= –1.1656; tL = –2.048 y tU = 2.048
Se acepta H0; No hay diferencia en la aplicación de los medicamentos vía oral o intra-
venosa.
388 ANEXOS

Ejercicios 16.5

2. IC = (5.512, 18.487) y X = 12; Se acepta H0, el fabricante no dice la verdad.

Ejercicios capítulo 17
Ejercicios 17.2
2. χ2 = 0.393 y χU2 = 4.605; Como χ2 < χU2, se acepta H0
La estructura de capital en los tres niveles de las gerencias administrativas, son igua-
les.
2
4. χOBS = 63.829 y χCRIT
2 = 21.026
2
χOBS > χCRIT
2 ; Se rechaza H0, Los factores son independientes.

Ejercicios 17.3
2.

0.2881 0.2881
0.0548 0.1571 0.2119
F0 2.2 2.6 3 3.4
Z –1.6 –0.8 0 0.8

b) Fe: 4.384  12.568  23.048  23.048  16.952
2
c) χOBS = 14.7715
d) χCRIT = 7.779; Como χOBS
2 2 > χCRIT
2 ; se acepta H0. La distribución no es bien descrita
por la distribución normal con μ = 3 y σ = 0.5
4. a) No: Con n = 200 el teorema del límite central nos permite basar una prueba de μ
en la distribución normal aun cuando la población no sea normal.
b) H0: Los datos están normalmente distribuidos (con parte de μ y σ sin especificar);
H1: los datos no están distribuidos normalmente.
c) χ2 = 4.455 y χU2 = 7.815, por lo cual aceptamos H0 y podemos decir que los datos
están descritos por una distribución normal.

Ejercicios 17.4
2. F = 4.76 y FCRIT = 3.68; Como F > FCRIT; se rechaza H0; los tres métodos si conducen
a diferentes niveles de productividad.
4. F = 6.67 y FU = 3.68; F > FU; Se rechaza H0. El número promedio de pacientes difie-
re significativamente durante estos meses.

Ejercicios 17.5
2. χ2 = 13.194 y χU2 = 30.144; Como χ2 < χU2, se acepta H0.
4. a) H0∶ σ2 = 64; H1∶ σ2 ≠ 64
b) χ2 = 8.31; χL2 = 8.907 y χU2 = 35.852; Se acepta H0
c) La extensión de la atención de los niños de seis años de edad, tiene variación sig-
nificativamente diferente de los niños de cinco años.
ANEXO A2  Respuestas a ejercicios de número par 389

Ejercicios 17.6
2. F = 2.25 y FU = 2.12; por consiguiente, rechazamos H0, el primer fondo tiene una
variación significativamente menor, de manera que deberá invertirse en él.
4. F = 4; FU = 1.98; por lo cual rechazamos H0. La velocidad de procesamiento de
CAS2, es significativamente más variable.

Ejercicios capítulo 18
Ejercicios 18.1
2. Es la fórmula que describe las relaciones existentes entre una variable dependiente y
una o más variables independientes.
4. En una relación directa, la variable dependiente aumenta al crecer la variable inde-
pendiente; en una relación inversa, la variable dependiente disminuye al aumentar la
variable independiente.

6.
3.5

3.0

2.5

2.0

1.5

1.0

0.5

8 10 12 14 16 18 20

b) Ŷ = −2.2766 + 0.2769x


c) x = 10 entonces: Ŷ = 0.4924
x = 15 entonces: Ŷ = 1.8769
x = 20 entonces: Ŷ = 3.2614

8. Pasajeros

450

400

350

300

Precio
10 20 30 40 50
390 ANEXOS

b) Ŷ = 493.4530 − 3.4524x


c) 372.618 ± 412.256 pasajeros
10. a) Ŷ = −80.4430 + 6.4915x
b) 244.1320
c) 10.2320

Ejercicios 18.2
2. r = 0.9798 y r2 = 0.9602
4. r = 0.9728 y r2 = 0.9464

Ejercicios 18.3
2. a) Se = 1.0589
b) 1.3572
c) El intervalo (27.5123, 32.4877) tiene una confianza de 90%.
4. a) Ŷ = 23.5447 − 1.08363x
b) Se = 1.58578 y Sb = 0.1725
c) (–1.73, –0.44); éste intervalo garantiza 98% de confianza de que el verdadero valor
de B, estará entre (–1.73, –0.44)

Ejercicios capítulo 19
Ejercicios 19.2
2. a) Ŷ = 763.68 − 64.18x1 − 50.24x2
b) Si x1 = 10 y x2 = 9, entonces Ŷ = − 330.6
c) Este tipo de variables no tienen una buena correlación.
4. a) Ŷ = –1635.268 + 14.979x1 – 2.737x2 + 1.481x3 – 113.853x4
b) Se = 0.195
c) R2 20.9999
d) (–0.98; 3.98)

Ejercicios 19.3
2. a) Ŷ(Atención) = a + b1Flujo + b2Flujo2
b) Atención = a + b1Flujo + b2Flujo2 + b3(lugar procedencia)

Ejercicios capítulo 20
Ejercicios 20.1
– –
2. (0.26; 0.74); Como P = 0.84, entonces P > 0.74, por tanto se rechaza H0
Con el incremento, el desempeño del personal ha mejorado.
– –
4. (0.24; 0.76) y P = 1.0, como P > 0.74 entonces se rechaza H0. Si existe diferencia a
raíz del cambio en la tecnología.

Ejercicios 20.2
2. (24.06; 75.93) y U = 72. Se acepta H0. No hay diferencia en en el número de pasajeros
viajando en días hábiles y no hábiles.
4. (37.7; 105.3) y U = 74.5
Se acepta H0. No existe una diferencia significativa en la enseñanza de las universida-
des públicas y privadas.
ANEXO A2  Respuestas a ejercicios de número par 391

Ejercicios 20.3
2. K = 1.065 y X22,0.5 = 5.991; se acepta H0. Las empresas en mención atienden la misma
cantidad de clientes.

Ejercicios 20.4
2. n1 = 14 ; n2 = 14; r = 13 y IC = (9.9 ;20.1). Se acepta H0. La secuencia parrece ser
aleatoria.
4. n1 = 21; n2 = 4; r = 7 y a = 0.10; µr = 7.72 y σr = 1.27
IC = (5.64; 9.80). Se acepta H0. La secuencia es aleatoria.

Ejercicios 20.5
2. rs = 0.185; rL = −0.8571 y rU = 0.8571, entonces: rL < rS < rU
Se acepta H0. La correlación por rangos no es significativa.
4. rs = − 0.0030 ; IC = (−0.6364 ;0.6364); Se acepta H0. La correlación no es significa-
tiva.

Ejercicios 20.6
2. a) KS = 0.1121  b) 0.1121 < 0.5515; Se acepta H0. Los datos siguen una distribu-
ción normal.
4 Dn = 0.3858. El valor crítico del extremo superior es de 0.0962 y por lo mismo recha-
zamos H0. Los datos no están bien descritos por una distribución de Poisson con λ = 1

Ejercicios capítulo 21
Ejercicios 21.3
2. a) 

55

50

45

40

35

30

25

20

15

10
Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
392 ANEXOS

b) Ŷ = 30.1428 + 5.75x


c) Ŷ = 27.9048 + 5.75x + 0.5595x2
4. a) 

60

50

40

30

20

10

0
1978 1979 1980 1981 1982 1983 1984 1985 1986

b) Ŷ = 31.4444 + 5.8x


c) Ŷ = 28.6451 + 5.8x + 0.4199x2
d) Ŷ = 112.64 en la ecuación lineal cunado x = 14
Ŷ = 112.64 en la ecuación de segundo grado cuando x = 14

Ejercicios 21.4
2. a) 94.12  106.48  95.42  107.14  96.05
b) –5.88  6.48  –4.58  7.14  –3.95
c) La fluctuación mayor se dio en 1985.

Ejercicios 21.5
2. a) 
Tasa Promedio Promedio
Año Estacion ausentismo movimiento centrado
1983 Primavera 5.6
Verano 6.8 5.98
Otoño 6.3 6 5.988
Invierno 5.2 5.98 5.988
1984 Primavera 5.7 6 5.988
Verano 6.7 6.05 6.025
Otoño 6.4 5.95 6
Invierno 5.4 5.93 5.938
1985 Primavera 5.3 5.85 5.888
Verano 6.6 5.78 5.813
Otoño 6.1 5.8 5.788
Invierno 5.1 5.88 5.838
1986 Primavera 5.4 5.9 5.888
Verano 6.9 5.95 5.925
Otoño 6.2
Invierno 5.3
ANEXO A2  Respuestas a ejercicios de número par 393

6.9
6.8
6.7
6.6
6.5
6.4
6.3
6.2
6.1
6.0
5.9
5.8
5.7
5.6
5.5
5.4
5.3
5.2
5.1
I II III IV I II III IV I II III IV I II III IV

b) El patrón estacionario es bajo en primavera e invierno, y alto en las demás estacio-
nes. El promedio centrado muestra un patrón cíclico en un período de tres años.

Ejercicios 21.6
2. Todos los incisos.
394 ANEXOS

ANEXO A3 Bibliografía
Estadística matemática con aplicaciones
William Mendenhall, Richard L. Scheaffer, Dennis D. Wackerly, tercera edición
Editorial Iberoamérica 1986

Estadística para administradores


Richard I. Levin, segunda edición; Editorial Prentice Hall Hispanoamericana S.A. 1988

Estadística para administradores


Richard I. Levin y David S. Rubin, sexta edición; Editorial Prentice Hall 1995

Estadística aplicada a los negocios y la economía


Allen L. Webster, tercera edición, Editorial Mc Graw Hill 2000

Estadística aplicada
Horacio Reyes Núñez, tercera edición, Talleres de Impresión UPNFM 1996

Estadística general aplicada


Zuwaylif, primera edición (reproducción de copia autorizada) 2000

Fundamentos de bioestadística
Marcelo Pagano y Kimberley Gauvreau, segunda edición, Editorial Thompson Learning
2001

Bioestadística
Wayne W. Daniel, segunda edición, Editorial Limusa-México 1977

Estadística
Murray – Spiegel, segunda edición, Editorial Mc Graw Hill 2011

Métodos estadísticos aplicados a las ciencias sociales


Genne V. Glass, primera edición, Editorial Prentice Hall 2014

Estadística para biología y ciencias de la salud


Milton Tsokos, primera edición, Editorial Mc Graw Hill 1989

También podría gustarte