Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Segunda edición
Carlos Amilcar Sánchez Colindres
Licenciado en Matemáticas
Máster en Gestión de la Calidad
Catedrático área de Matemática
Universidad Católica de Honduras
Gerente de portafolio de Universidades: Gabriela López
Desarrollador de Contenido Senior: Marcela I. Rocha Martínez
Desarrollador de Contenido: Cristina Tapia Montes de Oca
Bioestadística
Segunda edición
Todos los derechos reservados. Esta publicación no puede ser reproducida, ni parcial, ni totalmente, ni registrada en/o
transmitida por un sistema de recuperación de información, en ninguna forma ni formato, por ningún medio, sea mecánico,
fotocopiado, electrónico, magnético, electroóptico, o cualquier otro, sin el permiso previo y por escrito de la editorial.
ISBN: 978-1-4562-6753-7
ISBN de la edición anterior: 978-607-15-1250-5
1 2 3 4 5 6 7 9 0 24 23 22 21 20 19
Impreso en México Printed in Mexico
Agradecimiento
En primer lugar, dedico la presente obra al Dios Todo Poderoso, creador de los cielos y la
tierra, y el dueño de todo conocimiento que se genera en todo el universo, y quien me ha
regalado la vida para cumplir con su propósito en ésta tierra, asentando mis conocimien-
tos profesionales al servicio de la sociedad.
A mi padre Félix Sánchez (QDDG) y a mi madre Lilian Colindres (QDDG), que se
esforzaron por darme los primeros conocimientos académicos y la inculcación de los
principios éticos y morales de los cuales debe revestirse todo ser humano, el temor a Dios,
el servir al prójimo y el respeto a los demás.
A mis abuelos Ildefonso Fúnez Medina y Julia Colindres Pavón, quienes apoyaron a
mis padres para que sus descendientes se forjaran en los primeros conocimientos escolares.
A mis hermanos Rigoberto (QDDG), Juan Bautista, Mirna Isidra, Dora Elizabeth, y
Héctor Hernán (QDDG), con quienes compartí mi niñez y aprendimos a cuidarnos, ser-
virnos y respetarnos mutuamente.
A mi esposa Glenda Xiomara Pérez, a mis hijos Vilma Lynneth, Lynda Suzzeth, Car-
los Amílcar, Johanna Grissel, María José y Gretel Gabriela, quienes han estado a mi lado
por siempre, brindándome todo el apoyo moral que un padre y jefe de familia requiere para
salir adelante.
iii
Dedicatoria
iv
Acerca del autor del texto,
y sus colaboradores
v
Contenido
ANEXOS 341
ANEXO A1 Tablas de distribuciones de probabilidad 342
ANEXO A2 Respuestas a ejercicios de número par 377
ANEXO A3 Bibliografía 395
CAPÍTULO
Introducción y resumen
del texto 1
Contenido
Durante los siglos xv, xvi, y xvii, hombres como Leonardo Da Vinci, Nicolás Copér-
nico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron gran-
des aportaciones al método científico de tal forma que cuando se crearon los estados na-
cionales y surgió como fuerza el comercio internacional, existía ya, un método capaz de
aplicarse a los datos económicos y financieros. Asimismo, para el año 1532 empezaron a
registrarse en Inglaterra las defunciones debido al temor que Enrique vii tenía por la peste
que menguaba la población de ese entonces. Más o menos por la misma época en Francia,
la ley exigió a los clérigos registrar los bautismos, nacimientos, fallecimientos y matrimo-
nios, como parte de los actos y hechos vitales de las personas naturales.
Durante un brote de peste que apareció a fines de la década de 1500, el gobierno in-
glés comenzó a publicar estadísticas semanales de los decesos. Esa costumbre continuó
muchos años después, y en 1632, estos Bills of Mortality (Cuentas de Mortalidad) conte-
nían los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó do-
cumentos que abarcaban treinta años y efectuó predicciones sobre el número de personas
que morirían de varias enfermedades, así como las proporciones de nacimientos de varo-
nes y mujeres que cabría esperar. El trabajo de Graunt, condensado en su obra Natural
and Political Observations...Made Upon the Bills of Mortality (Observaciones Políticas y
Naturales... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en
el análisis estadístico.
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de
los recursos nacionales, contentiva de datos sobre la organización política, instrucciones
sociales, comercio y poderío militar. Durante el siglo xvii aportó indicaciones más concre-
tas de métodos de observación y análisis cuantitativo, y amplió los campos de la inferen-
cia y la teoría estadística.
Los eruditos del siglo xvii demostraron especial interés por la estadística demográfica
como resultado de la especulación sobre si la población aumentaba, decrecía o permane-
cía estática.
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos
países. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar
en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau.
Este investigador se propuso destruir la antigua creencia popular de que en los años ter-
minados en siete moría más gente que en los restantes, y para lograrlo removió paciente-
mente en los archivos parroquiales de la ciudad. Después de revisar miles de certificados
de defunción pudo demostrar que en tales años no fallecían más personas que en los de-
más. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley,
descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida huma-
na. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las
compañías de seguros.
Durante el siglo xvii y principios del xviii, matemáticos como Bernoulli, Francis Ma-
seres, LaGrange y Laplace, desarrollaron la teoría de probabilidades. No obstante, durante
cierto tiempo, la aplicación de la teoría de las probabilidades se limitó a los juegos de azar,
y es hasta el siglo xviii cuando comenzó a aplicarse a los grandes problemas científicos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la pala-
bra estadística, que extrajo del término italiano estatista (estadista). Creía, y con sobrada
razón, que los datos de la nueva ciencia serían el aliado más eficaz del gobernante cons-
ciente. La raíz remota de la palabra se halla, por otra parte, en el término latino status,
que significa estado o situación; esta etimología aumenta el valor intrínseco de la palabra,
por cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones.
Jacques Quételect es quien aplica las estadísticas a las ciencias sociales. Este inter-
pretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver la aplica-
ción del principio de promedios y de la variabilidad a los fenómenos sociales. Quételect
4 CAPÍTULO 1
fue el primero en realizar la aplicación práctica de todo el método estadístico a las diver-
sas ramas de la ciencia en ese entonces conocido.
Entre tanto, en el periodo de 1800 a 1820 se desarrollaron dos conceptos matemáti-
cos fundamentales para la teoría estadística: la teoría de los errores de observación, apor-
tada por Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por Laplace,
Gauss y Legendre. A finales del siglo xix, Sir Francis Gaston ideó el método conocido por
correlación, que tenía por objeto medir la influencia relativa de los factores sobre las va-
riables. De aquí partió el desarrollo del coeficiente de correlación creado por Karl Pear-
son y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H. Hooker y
G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.
Los progresos más recientes en el campo de la estadística se refieren al ulterior desa-
rrollo del cálculo de probabilidades, particularmente en la rama denominada indetermi-
nismo o relatividad, se ha demostrado que el determinismo fue reconocido en la física
como resultado de las investigaciones atómicas y que este principio se juzga aplicable
tanto a las ciencias sociales como a la física. La historia del desarrollo de la teoría estadís-
tica y su práctica es larga. Con la presente reseña solo nos hemos limitado a nominar al-
gunos personajes y hechos relacionados al desarrollo histórico de la estadística, por tanto,
de acuerdo se vaya escudriñando el texto, más adelante nos encontraremos con nombres
de personas que han hecho grandes contribuciones a la estadística, y que por ende mu-
chas leyes, teoremas y métodos, llevan el nombre de estos ilustres personajes.
que no tienen nada que ver con la digitación y que no son tan fácilmente identificables.
Algunos de estos errores son:
Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes
de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o
estado mental pueda influir en la recopilación y en el análisis de la información. En estos
casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan
su opinión que a aquellos que la contradicen. Un caso extremo de sesgo sería la situación
donde primero se toma una decisión y después se utiliza el análisis estadístico para justi-
ficar la decisión ya tomada.
Datos no comparables: El establecer comparaciones, es una de las partes más impor-
tantes del análisis estadístico, pero es extremadamente importante que tales comparacio-
nes se hagan entre datos que sean comparables.
Proyección descuidada de tendencias: La proyección simplista de tendencias pasadas
hacia el futuro, es uno de los errores que más ha desacreditado el uso del análisis estadístico.
Muestreo Incorrecto: En la mayoría de los estudios sucede que el volumen de infor-
mación disponible es tan inmenso que se hace necesario estudiar muestras, para derivar
conclusiones acerca de la población a que pertenece la muestra. Si la muestra se seleccio-
na correctamente, tendrá básicamente las mismas propiedades que la población de la cual
fue extraída; pero si el muestreo se realiza incorrectamente, entonces puede suceder que
los resultados no signifiquen nada.
1.7 Conclusiones
La estadística es la ciencia que más aporta en la toma de decisiones en todos los ámbitos
gerenciales. Desde el poder ejecutivo hasta los draft’s deportivos, la estadística juega su
papel a la hora de hacer cualquier movimiento.
La estadística, por otro lado, si no se sabe manejar con cautela puede generar resultados
falaces que podrían a su vez, llevarnos a la toma de decisiones erradas. Por consiguiente,
se recomienda un estudio pleno y científico de la materia, a fin de que quien utilice sus
servicios pueda hacerlo de manera objetiva y con resultados satisfactorios.
Recuerde que la estadística es mucho más que sólo números apilados y gráficas boni-
tas. Es una ciencia con tanta antigüedad como la escritura, y es por sí misma auxiliar de
todas las demás ciencias. Los mercados, las empresas, la medicina, la ingeniería, los go-
biernos, etc.…, se nombran entre los más destacados clientes de ésta.
CAPÍTULO
Introducción a la
estadística 2
Contenido
Introducción a la estadística
2.1 Definición de estadística y bioestadística
La estadística, por una parte, es una rama de la matemática que se encarga de la recopila-
ción, el ordenamiento, el análisis, la interpretación, y la representación de datos. Por otra
parte, y de forma general, pero exhaustiva, se puede decir que la estadística trata del dise-
ño de experimentos o encuestas mediante muestras para obtener una cantidad determina-
da de información a un costo mínimo, y del uso óptimo de esa información para hacer
inferencias con respecto a una población.
Asimismo, podemos agregar que la estadística es una ciencia formal y una herramien-
ta que estudia el uso y los análisis provenientes de una muestra representativa de datos,
busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocu-
rrencia en forma aleatoria o condicional. No obstante, podemos decir, que la estadística
es más que eso, es decir, es la herramienta o bastión fundamental, que otorga el beneplá-
cito para el desarrollo formal de los procesos relacionados con la investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad, como también la utili-
dad para la toma de decisiones en las áreas de los negocios en general, de la administra-
ción, las ingenierías, o de las instituciones gubernamentales de acuerdo a su naturaleza.
Bioestadística: Se define como la aplicación amplia de las técnicas estadísticas a las
ciencias biológicas y las disciplinas relacionadas con el área de la medicina y la salud.
2.2.2 Clasificación
La estadística se subdivide en dos grandes ramas:
a) Estadística descriptiva; y
b) Estadística inferencial;
La estadística descriptiva: Trata de los métodos para organizar datos numéricos de
modo que se haga más fácil su interpretación. Asimismo, todo lo referente a gráficos,
cuadros, tablas, diagramas, medidas de tendencia central, de posición, de dispersión, así
como otros métodos de representación, son elementos característicos de la estadística
descriptiva.
La estadística inferencial: A esta subdivisión le corresponde todo lo atinente a la teo-
ría, métodos, reglas y axiomas de probabilidad; y la mayoría de análisis complejos sobre
parámetros de una población, conjugando para tal fin, las teorías probabilísticas y técni-
cas especiales basadas en información referente a un pequeño grupo de la misma.
Introducción a la estadística 9
2.2.3 Definición de términos
Población: Conocida también como conjunto universo, se refiere a la colección de todos
los elementos en estudio que tienen una o más características comunes, y cuyas propieda-
des se han de analizar.
Muestra: Es una parte o un subconjunto de la población, que comparte las mismas
características de la población en estudio.
Ejemplo1 de población: Todos los estudiantes de la UNICAH.
Muestra1: Estudiantes del Campus Sagrado Corazón de Jesús.
Muestra2: Estudiantes de la Carrera de Medicina y Cirugía.
Muestra3: Estudiantes de la UNICAH, sexo femenino.
Ejemplo 2 de población: Sea A = {2, 3, 5, 7, 11, 13, 17, 19, 23}
Muestra 1: B = {3, 5, 7} y Muestra 2: H = {2, 23}
Variable: Es la característica de interés acerca de cada elemento de una población o
muestra. Asimismo, a la variable se le conoce como un símbolo que puede tomar cual-
quier valor dentro de un universo dado.
Una variable en estadística puede ser de dos tipos:
1. Cuantitativa;
2. Cualitativa.
Variables cuantitativas:
Son aquellas que se expresan mediante valores numéricos: como ser el número de perso-
nas en una reunión o que conforman un grupo social, número de animales o cosas, medi-
das como el peso, la temperatura, la edad, la estatura, etc.
Las variables cuantitativas se clasifican en discretas y continuas.
Una variable cuantitativa es discreta cuando sus resultados solo pueden ser valores
enteros.
Ejemplo
1. Número de médicos en un auditórium;
2. Número de alumnos de la Carrera de Cirugía Dental presentes en una clase;
3. Número de niños nacidos vivos en un período X en el Hospital Materno Infantil;
4. Número de centros de salud construidos en la Región Sur de Honduras; etc.
Una variable cuantitativa es continua cuando sus resultados pueden ser por su natura-
leza, valores enteros o decimales.
Ejemplo
1. Estatura de un paciente;
2. Velocidad de un móvil;
3. Altura del edificio del Hospital Mario Catarino Rivas;
4. Peso de un automóvil ambulancia o cualquier otro objeto;
5. Volumen de una figura geométrica, etc.
Variables cualitativas:
Estas son expresadas mediante palabras, ya que describen la cualidad de una variable;
también se les conoce como atributos, y a las partes en que se dividen estos atributos, se
les llama, “modalidad”.
Ejemplo 1
Variable cualitativa Modalidad
Sexo de un médico Femenino
Masculino
10 CAPÍTULO 2
Ejemplo 2
Variable cualitativa Modalidad
Estado civil de los empleados de salud Casado
Unión libre
Soltero
Divorciado
Viudo
Unión de hecho
Dato: Es el valor de la variable asociado a un elemento de una población o una muestra.
Ejemplo
Alessandra Girón: Es estudiante de la carrera de Medicina y Cirugía en la UNICAH,
Campus Sagrado Corazón de Jesús, tiene 20 años, pesa 150 libras, mide 1.66 metros, ha-
bla tres idiomas, es de piel blanca, ojos cafés, pelo castaño, reside en Tegucigalpa, etc.
Experimento: Es una actividad realizada según un plan definido, cuyos resultados
producen un conjunto de datos.
La información o registro de datos en un experimento puede obtenerse mediante:
Observación, medición o consulta
Nota: El instrumento o proceso más común para la recolección de información es la en-
cuesta
EJERCICIOS 2.2
1. Relacionado al campo de la medicina y la salud, establezca dos ejemplos para cada
uno de los siguientes términos:
a) Población;
b) Muestra;
c) Dato;
d) Experimento; y
e) Variable.
2. ¿Cuál es la diferencia entre una población y una muestra?
3. ¿Cómo se clasifican las variables cuantitativas?
4. Establezca dos ejemplos de variable cualitativa en el área de la salud;
5. Diga si las siguientes variables son discretas o continuas;
a) Número de empleados en el Hospital Mario Catarino Rivas;
b) La temperatura corporal de un paciente;
c) La altura de los médicos de un hospital privado en la Ciudad de La Ceiba;
d) La distancia recorrida por una ambulancia;
e) La remuneración salarial de los trabajadores del área de la salud en Honduras;
f) Número de niños con tratamiento especial para enfermedades crónicas;
g) El número de ampollas producidas en una droguería;
h) El peso promedio de las enfermeras del Hospital San Felipe;
i) Número de bacterias presentes por centímetro cuadrado en una masa corporal;
j) Volumen del torrente sanguíneo de un paciente;
k) Los descansos tomados por un médico durante un día cualesquiera.
6. Mencione los tres medios más comunes para obtener información o recolectar datos.
7. ¿Cuál es el instrumento más común y utilizado en la recolección de información?
Introducción a la estadística 11
Empresas Cantidad
1. Droguería Farinter 7
2. Grupo Pharma City 3
3. Droguería Bayer 6
4. Accesorios Ortopédicos S.A. 2
5. Droguería Astro Rey 2
6. Droguería Universal 1
Total 21
12 CAPÍTULO 2
Las Escalas por Intervalo: Son medidas numéricas en las cuales el valor del cero es
arbitrario, pero la diferencia entre otros valores es importante.
Ejemplo 1
Debemos tener en cuenta que 0º (cero grados), no significa la ausencia de temperatura, y
entre 30º y 50º, existen 20º de diferencia, igual que entre 20º y 40º.
Ejemplo 2
0º Centígrados es relativo a los 32º Fahrenheit, y ambos valores representan la misma
temperatura.
Ejemplo 3
Peso de los empleados del Centro de Salud Las Crucitas, Ciudad de Comayagüela:
EJERCICIOS 2.3
1. Para cada una de las cuatro escalas de medición, establezca un ejemplo relacionado
a las ciencias médicas o área de la salud.
2. La estructura en una institución de servicios médicos, sección, departamento, geren-
cia, subdirección y dirección, ¿Con cuál escala de medición pueden describirse?
3. Construya una escala nominal para el tipo asistencias en pacientes procedentes de
diez colonias de la Ciudad Capital.
4. Construya una escala ordinal para la estructura y jerarquía de mandos en la UNI-
CAH, referente a sus autoridades académicas.
5. Construya una escala de razón para proveedores de la UNICAH y número de visitas
a la Gerencia Administrativa durante una semana cualesquiera. Proveedor A, 3 visi-
tas, Proveedor B, 1 visita, proveedor C, 2 visitas y Proveedor D, ninguna visita.
6. Construya una escala de intervalo para los estudiantes de la UNICAH de la Carrera
de Cirugía Dental, referente a sus edades, debiendo cada intervalo contar con una
dimensión de un año. (Realice una encuesta de 20 estudiantes)
7. Construya una escala ordinal para las posiciones logradas por los cinco hospitales
públicos de Honduras, más destacados de acuerdo a los resultados obtenidos durante
el año 2014. Haga referencia a los hospitales siguientes: Leonardo Martínez de San
Pedro Sula, Hospital Escuela de Tegucigalpa, Hospital Santa Teresa de Comayagua,
Hospital Atlántida en La Ceiba y Hospital de occidente en Santa Rosa de Copán.
Nota de pie: Sobre algunas especialidades no se contaba con datos para el período en
mención.
Fuente: Sección de Estadística CMH-La Granja
14 CAPÍTULO 2
EJERCICIOS 2.4
1. Los siguientes datos fueron extraídos del Departamento de Estadística del Hospital
San Felipe de Tegucigalpa, los cuales pertenecen a la asistencia del primer trimestre
del año 2012, en donde 502 personas fueron atendidas por medicina interna, 202
hospitalizaciones, 2314 consultas externas, 916 cirugías y 415 en otras especialidades.
Con la información anterior, construya una tabla estadística e identifique sus partes.
2. En el Hospital La Policlínica se tienen los siguientes registros de consulta general
comprendidos para el segundo trimestre del año 20152.N2
Razón: Una razón compara el número de casos de una categoría f1 con la de otra ca-
tegoría f2 , generalmente expresadas por cada 100, y se calcula a través de la siguiente
fórmula:
f1 f2
R= x100 R= x100
f2 f1
o
Ejemplo
En un congreso de enfermería realizado en la zona norte de Honduras, asistieron 20 en-
fermeros y 15 enfermeras.
a) ¿Cuál es la razón de hombres a mujeres?
b) ¿Cuál es la razón de mujeres a hombres?
Solución
Sea f1 el número de enfermeros y sea f2 el número de enfermeras, entonces la razón de
hombres a mujeres está dada por:
f 20
a) R = 1 x100 = x100 ≅133%
f2 15
Significado: Por cada 133 varones hay 100 mujeres.
La razón de mujeres a hombres estará dada por:
f2 15
b) R= x100 = x100 ≅ 75%
f1 20
Significado: Por cada 75 mujeres hay 100 varones.
EJERCICIOS 2.5
1. En un curso de capacitación auspiciado por un organismo internacional, participaron
70 profesionales del área de la salud, de los cuales 42 eran varones.
a) ¿Cuál es el porcentaje de mujeres en éste curso?
b) ¿Cuál es el porcentaje de varones?
c) ¿Cuál es la razón de mujeres a varones?
d) ¿Cuál es la razón de varones a mujeres?
16 CAPÍTULO 2
Calcular:
a) El % de consumidores de marihuana;
b) El % de altos consumidores de alcohol;
a) El % alto de alcohol y marihuana; y
d) El % bajo de consumidores de marihuana y alcohol;
3. En el curso de Anatomía I en la Universidad Católica de Honduras UNICAH, Cam-
pos San Pedro y San Pablo, hay 45 alumnos, de los cuales 20 son varones y 25 mujeres.
a) ¿Cuál es la proporción de varones?
b) ¿Cuál es la proporción de mujeres?
4. Si en un curso de Bioestadística hay 55 alumnos y se sabe que el número de mujeres
es 15 más, que el número de varones.
a) ¿Qué porcentaje representan los varones en éste curso?
b) ¿Qué porcentaje representan las mujeres en éste curso?
5. Si en una conferencia sobre cardiología, el porcentaje de los varones es tres veces el
de las mujeres, ¿Cuál es el número de mujeres y varones en esta conferencia si hay un
total de 40 personas?
6. ¿Cuál es el costo final de un medicamento que está en lista a L Lempiras después de
dar 20% de descuento y aplicarle el 15% de impuesto sobre ventas?
7. El salario de una enfermera del Hospital del Sur es de Lps. 13,000. Después de recibir
un aumento de 12.5% ¿Cuál es el nuevo salario de la enfermera?
8. Si en una de las reuniones mensuales del personal de salud en la zona oriental de
Honduras, se determinó una razón de 110 hombres a 100 mujeres de una población
total de 114 empleados. Determinar el número de empleados varones y mujeres en la
reunión en mención.
Ejemplo
En 1997 la población de cierta ciudad fue de 4.5 millones de habitantes y en el año 2007
fue de 4.75 millones de habitantes; calcular para dicho periodo:
a) La Tasa de Cambio Absoluta b) La Tasa de Cambio Relativa
Solución
a) TCA = Pf – Pi = 4.75 – 4.5 = 0.25 millones de habitantes o sea hubo un crecimiento
de 250,000 nuevos habitantes.
P − Pi 4.75 − 4.5 0.25
b) TCR = f = = ≅ 0.0555 ; significa un crecimiento de 5.55% en los
Pi 4.5 4.5
10 años.
Ejemplo
En una pequeña comunidad en 1990 la población era de 65,000 habitantes y en 1996 la
población fue de 71,000 habitantes.
Encontrar la tasa de crecimiento promedio anual en dicho período
Solución
Sea Pf = 71,000; Pi = 65,000; n = 1996 –1990 = 6
Pf 71000
t =n −1 = 6 −1 = 6 1.0923 −1 =1.0148 −1 ≅ 0.0148
Pi 65000
Conclusión: la tasa de crecimiento promedio fue de 1.48%
Proyecciones de población
Cuando en el crecimiento de una población no intervienen factores externos como las
epidemias, desastres naturales, incremento de la migración acelerada, etc., el crecimiento,
estimación o proyección de una población a futuro, puede calcularse por la fórmula:
P(proyectada) = UPC(1 + t)n; Donde:
t = tasa de crecimiento promedio anual
n = Número de años entre el año a proyectar y la última población conocida
UPC =Última población conocida y P(proyectada) = Población proyectada
Ejemplo
En el año de 1999 una pequeña ciudad tenía una población de 150,000 habitantes y en
2009 la población era de 176,000 habitantes; determinar:
a) La tasa de crecimiento anual; b) Proyectar la población de ésta ciudad al año 2020
18 CAPÍTULO 2
Pf 176000
t =n −1 =10 −1 =10 1.1734 −1 =1.016119 −1 ≅ 0.016119
Pi 150000
EJERCICIOS 2.6
1. La siguiente distribución representa la población afectada por enfermedades tropica-
les en seis países del Continente Americano, en los años de 1980 a 2000.
Pais Años
1980 2000
Brasil 539,025 689,724
Venezuela 132,332 330,009
Guatemala 66,728 92,068
Honduras 43,245 61,536
Mexico 469,300 565,334
Haiti 23,813 39,277
Total 1274443 1777948
EJERCICIOS 2.7
1. La siguiente distribución de frecuencias representa el número de pobladores en una
comunidad de la Región Centroamericana, verificada por rango de edades y muertes
ocurridas durante el año 2012:
Determinar:
a) La tasa bruta de mortalidad;
b) La tasa específica de mortalidad;
c) Tasa especifica de mortalidad para cada uno de los grupos;
2. En el año 2013, las autoridades de la Secretaría de Salud y el Registro Nacional de las
Personas, reportaron los siguientes datos en comunidades de la Región Sur de Hon-
duras, con poca atención sobre medicina preventiva y curativa:
• Población estimada al 1 de julio 601, 200
• Población estimada al 31 de diciembre 627,500
• Total de nacimientos de niños vivos 13,542
• Nacimientos prematuros 1,253
22 CAPÍTULO 2
MUERTES FETALES
• De 20 semanas de gestación 365
• De 20 a 27 semanas de gestación 123
• De más de 28 semanas de gestación 132
• Duración desconocida 12
Total 632
MUERTES
• Total de todas las edades 6,315
• Menos de un año 283
• De menos de 28 días 230
• Muerte por inmadurez 18
• Muertes de madres 3
Con la información anterior, calcular e interpretar los resultados de:
a) Tasa de mortalidad materna;
b) Tasa de mortalidad infantil;
c) Tasa de mortalidad fetal;
d) Tasa bruta de mortalidad anual, y;
e) Tasa bruta de natalidad.
3. En un trabajo demográfico realizado en el año 2002 por la Secretaría de Salud en una
comunidad del norte del país, se obtuvieron los resultados siguientes:
• Población total en la comunidad 45,627 personas;
• Total de niños nacidos vivos durante el año 2002: 13,115;
• Total de mujeres en edad de dar a luz 15,628;
• Niños nacidos vivos en el año 2002 de madres edad de 18 a 35 años, 10,434;
• Total, de mujeres en edad de 18 a 35 años, 12,368.
Determinar:
a) La tasa bruta de natalidad;
b) Tasa general de fertilidad;
c) Tasa de fertilidad especifica por edades.
4. Si en una Ciudad de Honduras, el número de niños nacidos vivos durante el año 2005
fue de 17,524 y la tasa bruta de natalidad en dicha comunidad está estimada en un
0.132% o de 132 por cada 1000, ¿cuál es la población total en ésta pequeña ciudad?
5. La siguiente tabla representa información demográfica de varios años en un país de
África Central:
Determinar:
a) El índice de masculinidad;
b) Tasa de natalidad;
c) El crecimiento vegetativo o natural;
a) Tasa de mortalidad;
Introducción a la estadística 23
Ordenamiento y
presentación de datos 3
Contenido
Ejemplo
La siguiente tabla representa el número de pacientes atendidos por día en una clínica
médica en Tegucigalpa.
Construir un gráfico de barras simples
Día Cantidad
Lunes 10
Martes 8
Miércoles 9
Jueves 12
Viernes 10
Sábado 6
Total 55
Solución
12
10
8
6
4
2
0
Lunes Martes Miércoles Jueves Viernes Sábado
Ejemplo
El siguiente cuadro representa el número de pacientes internos por año que se atendieron
en hospitales privados en tres ciudades del país.
400
350
300
Tegucigalpa
250
S.P.S
200 La Ceiba
150
100
50
0
2005 2006 2007
Solución
Área
A B C Total
Edad
3-5 14 12 15 41
6-8 28 20 25 73
9 - 11 35 24 22 81
Total 77 56 62 195
28 CAPÍTULO 3
Solución
50 24
40 20
15
30
20 12 35
10 14 28
0
3a5 6a8 9 a 11
Rango de edad en años
3.1.4 Gráfico de líneas
Este gráfico se emplea en un sistema de ejes cartesianos y puntos en el plano para repre-
sentar un fenómeno estadístico.
Ejemplo
El siguiente cuadro representa dos tipos de enfermedades registradas en las consultas de
un hospital público durante los años 2000, 2001, 2002 y 2003.
Enfermedades Enfermedades
Años respiratorias gastrointestinales
2000 1501 1225
2001 1707 2327
2002 1204 1105
2003 1418 1645
Total 6302
2000
Enfermedades
1500
respiratorias
1000 Enfermedades
gastrointestinales
500
0
Ordenamiento y presentación de datos 29
0.73
23.93
23.93
Aéreo
Terrestre
75.34
75.34
Marítima
3.1.6 Pirámides de población
Las poblaciones de los países pueden diferir considerablemente, sin embargo, todas tien-
den a caer dentro de tres perfiles generales de la composición de la población por edad y
sexo.
a) Población expansiva: Es aquella en donde el número de personas en edades menores,
es mayor.
b) Población constrictiva: Es aquella en donde el número de personas en edades meno-
res, es menor.
c) Población estacionaria: Igual número de personas aproximadamente en todos los gru-
pos de edades, con una reducción paulatina en las edades más avanzadas.
30 CAPÍTULO 3
Población expansiva
Población constrictiva
Población estacionaria
3.1.7 Pictogramas
Es un diagrama de figuras que representa dibujos ilustrativos para expresar la magnitud y
el comportamiento de un fenómeno en estudio.
Ordenamiento y presentación de datos 31
Ejemplo:
Crecimiento
Ejemplo: poblacional
Crecimiento en una
poblacional comunidad
en una comunidadde
deHonduras de 2000
Honduras del 2000ala 2005
2005
3.1.8 Mapas
Los mapas estadísticos muestran la variación geográfica de un fenómeno estadístico, refe-
rente al crecimiento o disminución de la población, como también la representación de
actos y hechos vitales vinculados al ser humano, enfermedades en expansión o extinción,
estructuras, avances de proyectos en diversas áreas, y otros. Estas representaciones son
identificadas por áreas sombreadas, punteadas o de líneas finas.
EJERCICIOS 3.1
1. La siguiente tabla representa la población asistida en centros de salud de la Ciudad
de Comayagüela entre los años 2010 a 2013.
Enfermedad
Instestinal Respiratoria Psicosomatica
Ciudad (# Afectados) (# Afectados) (# Afectados) Total
Tegucigalpa 134 98 85 317
San Pedro Sula 210 120 70 400
Otras ciudades 112 60 27 199
Total 456 278 182 916
Clases Frecuencia
10 - 21 4
22 - 33 7
34 - 45 10
46 - 57 8
58 - 69 5
Total 34
A las distribuciones de frecuencia se les puede asociar otros factores como los siguientes:
3.2.1 Rango
En una serie de datos, el rango es la diferencia entre el valor máximo y el valor mínimo
del conjunto de datos en estudio.
Rango = Vmax – Vmin
Ejemplo
Sean 2.1, 3.2, 3.2, 3.5, 3.7, 3.9, 4.1, 4.1, 4.3 un conjunto de datos; determinar el rango.
34 CAPÍTULO 3
Solución
Rango = Vmax – Vmin = 4.3 – 2.1 = 2.2, entonces: Rango = 2.2
3.2.3 Ancho de clase
Es el tamaño que tiene cada una de las clases, aunque por cuestiones de estandarización
de cálculo, normalmente las clases en una distribución, deben tener el mismo ancho.
El ancho de un intervalo de clase es la diferencia entre dos límites sucesivos, ya sean
éstos inferiores o superiores.
Ejemplo
De la tabla anterior:
Con límites inferiores Con límites superiores
Ancho de clase = 15 – 10 = 5 Ancho de clase = 19 – 14 = 5
Notas:
1. Si los datos no están ordenados y hay que construir la distribución de frecuencias, el
ancho de clase se calcula por:
Rango
Ancho de clase =
No. de clases determinadas
2. Para construir la distribución de frecuencias los datos normalmente se ordenan de
menor a mayor.
3. Generalmente el número de clases deseadas no deben ser menor que 5 ni mayor de
15.
4. Por otra parte, bajo criterios matemáticos el número de clases que tendrá una distri-
bución de frecuencias, puede estimarse con la fórmula o desigualdad:2k ≥ N: donde
N es el número total de observaciones y k un entero para el número de clases a utili-
zar. También puede utilizarse la fórmula opcional conocida como la fórmula de Stur-
ges Número de clases = 1 + (3.3)LogN, donde N es el tamaño del conjunto de datos.
El resultado de Sturges se aproxima al entero inmediato inferior y en la desigualdad
primera (2k ≥ N), al entero inmediato superior.
Ejemplo
Si se cuenta con un conjunto de datos donde el número total de observaciones es 50, en-
tonces, 2k ≥ 50 y resolviendo para k tenemos que el número entero adecuado es k = 6, ya
Ordenamiento y presentación de datos 35
Ejemplo 1
El siguiente conjunto de datos representa las edades de 25 ciudadanos que fueron atendi-
dos en servicios de emergencia por accidentes varios, por parte de la Cruz Roja Hondure-
ña en la Ciudad de San Pedro Sula, durante el mes de diciembre de 2015:
13, 14, 10, 15, 15, 16, 17, 17, 10, 21, 21, 11, 12, 13, 12, 22, 18, 18, 18, 23, 19, 19, 23, 20, 14.
1. Ordenar los datos de menor a mayor;
2. Construir una distribución de frecuencias de cinco clases;
3. Calcular f, fa, fr y las fra;
4. Calcular las marcas de clase y límites reales.
Solución
1. 10, 10, 11, 12, 12, 13, 13, 14, 14, 15, 15, 16, 17, 17, 18, 18, 18, 19, 19, 20, 21,21, 22, 23,
23.
2. Primero calcularemos el rango: Rango = Vmax – Vmin = 7.5 – 2.2 = 5.3
3. Luego con 2k ≥ N; si k = 5 y N = 25; entonces: 25 ≥ 25, 32 ≥ 25, implica usar 5 clases
Ln(25) 3.218875825
O K≥ = = 4.62 ≅ 5 clases
Ln2 0.39614718
Por la fórmula de Sturges se tiene K = 1 + 3.3 Log(N) = 1 + (3.3)(Log25) = 1 + (3.3)
(1.39794) = 1 + 4.6 = 5.6 ≅ 6 Clases
Rango 13
4. Ancho de clase = = = 2.6 ≅3
No. de clases 5
Ancho de clase = 3 (el ancho se aproxima de 2.6 a 3 por conveniencia)
3 y 4.
a) Frecuencia acumulada fa, sume las observaciones de la clase anterior a la clase si-
guiente (inicia en la clase 0).
f
Edad de los pacientes f fr =
N
10 - 12 5 0.20
13 - 15 6 0.24
16 - 18 6 0.24
19 - 21 5 0.20
22 - 24 3 0.12
Total N = 25
fa
c) Frecuencia relativa acumulada o porcentaje fra, calculada por fra = x100
N
fa
Edad de los pacientes f fra = x100
N
10 - 12 5 20%
13 - 15 6 44%
16 - 18 6 68%
19 - 21 5 88%
22 - 24 3 100%
Total N = 25
LI + LS
d) Marca de clase o punto medio Xm , calculada por X m =
2
LI + LS
Edad de los pacientes f Xm =
2
10 -12 5 11
13 -15 6 14
16 -18 6 17
19 -21 5 20
22 -24 3 23
Total N = 25
e) Límites reales: Lri y Lrs, recuerde que los límites de clase son valores enteros, por
tanto sume 0.5 a cada límite superior y reste 0.5 a cada límite inferior de clase.
Ejemplo 2
Dado el siguiente conjunto de datos:
3.1 3.4 3.4 3.1 2.2 2.5 2.3 7.5 7.3 7.4 7.4 7.2 7.3 7.0
2.3 2.3 4.3 4.2 4.0 3.0 3.2 6.7 6.6 6.8 6.3 6.0 6.0 5.2
5.8 6.4 6.5 3.2 3.7 3.9 6.6
1. Ordenar los datos de menor a mayor;
2. Construir una distribución de frecuencias de cinco clases;
3. Calcularf , fa , fr y las fra;
4. Calcular las marcas de clase y límites reales.
Solución
1. 2.2, 2.3, 2.3, 2.3, 2.5, 3.0, 3.1, 3.1, 3.2, 3.2, 3.4, 3.4, 3.7, 3.9, 4.0, 4.2, 4.3, 5.2, 5.8, 6.0,
6.0, 6.3, 6.4, 6.5, 6.6, 6.6, 6.7, 6.8, 7.0, 7.2, 7.3, 7.3, 7.4, 7.4, 7.5
2. Primero calcularemos el rango: Rango = Vmax – Vmin = 7.5 – 2.2 = 5.3
2k ≥ N; si k = 6 y N = 35; entonces: 26 ≥ 35, 64 ≥ 35, implica usar 6 clases
Rango 5.3
Ancho de clase = = = 0.88 ≅0.9
No. de clases 6
Ancho de clase = 0.9
Clases f
2.2 - 3.0 6
3.1 - 3.9 8
4.0 - 4.8 3
4.9 - 5.7 1
5.8 - 6.6 8
6.7 - 7.5 9
Total 35
3 y 4.
a) Frecuencia acumulada fa, sume las observaciones de la clase anterior a la clase si-
guiente (inicia en la clase 0).
Clases f fa
2.2 - 3.0 6 6
3.1 - 3.9 8 14
4.0 - 4.8 3 17
4.9 - 5.7 1 18
5.8 - 6.6 8 26
6.7 - 7.5 9 35
Total 35
Ordenamiento y presentación de datos 39
f
b) Frecuencia relativa fr, calculada por fr =
N
f
Clases f fr =
N
2.2 - 3.0 6 0.17
3.1 - 3.9 8 0.23
4.0 - 4.8 3 0.08
4.9 - 5.7 1 0.03
5.8 - 6.6 8 0.23
6.7 - 7.5 9 0.26
Total 35
fa
c) Frecuencia relativa acumulada o porcentaje fra, calculada por fra = x100
N
fa
Clases f fra = x100
N
2.2 - 3.0 6 17.14%
3.1 - 3.9 8 40.00%
4.0 - 4.8 3 48.57%
4.9 - 5.7 1 51.43%
5.8 - 6.6 8 74.28%
6.7 - 7.5 9 100.00%
Total 35
LI + LS
d) Marca de clase o punto medio Xm, calculada por X m =
2
LI + LS
Clases f Xm =
2
2.2 - 3.0 6 2.6
3.1 - 3.9 8 3.5
4.0 - 4.8 3 4.4
4.9 - 5.7 1 5.3
5.8 - 6.6 8 6.2
6.7 - 7.5 9 7.1
Total 35
e) Límites reales: Lri y Lrs, recuerde que los límites de clase son valores decimales a una
posición, por tanto, los límites reales se calculan restando a los límites inferiores la
cantidad 0.05 y sumando la misma a los límites superiores.
40 CAPÍTULO 3
EJERCICIOS 3.2
1. En cierto hospital de rehabilitación, una investigación sobre destreza manual, abarcó
el tiempo requerido para finalizar cierta tarea entre los pacientes. Los tiempos corres-
pondientes en horas fueron los siguientes:
7.1 7.2 7.2 7.6 7.6 7.6 7.9 8.1 8.1 8.1 8.3
8.3 8.4 8.4 8.9 9.0 9.0 9.1 9.1 9.1 9.1 9.1
9.7 9.8 9.8 9.1 9.2 9.2 9.3 9.3 9.5 8.7 7.7
Construya una distribución de frecuencias con el número de clases adecuadas, y
determine los valores para la frecuencia acumulada, la frecuencia relativa acumulada,
las marcas de clase y límites reales.
2. Los datos de la siguiente distribución de frecuencias, representan los pesos en libras
de los niños recién nacidos en un hospital de la zona sur de Honduras, durante un
período de dos meses.
Peso frecuencia
4.5 - 5.4 5
5.5 - 6.4 10
6.5 - 7.4 28
7.5 - 8.4 32
8.5 - 9.4 16
9.5 - 10.4 4
Total 95
Calcular
a) La frecuencia acumulada,
b) La frecuencia relativa acumulada
c) Las marcas de clase;
d) Los límites reales.
Ordenamiento y presentación de datos 41
Límites reales
13.75 - 14.25
14.25 - 14.75
14.75 - 15.25
15.25 - 15.75
15.75 - 16.25
Obtenga los límites de cada clase.
4. Con los siguientes datos adjuntos, construya una distribución de frecuencias utilizan-
do 2k ≥ N o K = 1 + (3.3)log(N) para determinar el número de clases deseadas, luego
calcule la frecuencia simple, la frecuencia acumulada, la frecuencia relativa, la fre-
cuencia relativa acumulada, las marcas de clase y los límites reales.
1.05 1.09 1.07 1.14 1.03 1.07 1.07 1.25 1.33 1.42
1.39 1.37 1.17 1.18 1.22 1.26 1.31 1.35 1.36 1.39
1.30 1.30 1.28 1.19 1.16 1.11 1.11 1.12 1.32 1.13
1.13 1.18 1.20 1.21 1.24 1.26 1.01 1.02 1.06 1.03
1.03 1.41 1.27 1.27 1.14 1.08 1.05 1.08 1.10 1.33
5. Para los siguientes datos, construya una distribución de frecuencias utilizando 2k ≥
para determinar el número de clases deseadas, luego calcule la frecuencia simple, la
frecuencia acumulada, la frecuencia relativa, la frecuencia relativa acumulada, las
marcas de clase y los límites reales.
105 109 107 114 103 107 107 125 133 142
139 137 117 118 122 126 131 135 136 139
130 130 128 119 116 111 111 112 132 113
3.3.2 Polígono de frecuencias
El polígono de frecuencias es un gráfico de línea continua que inicia en la marca de clase
cero, pasando por todos los centros superiores de los rectángulos del histograma y termi-
nando en la marca de clase n + 1.
Los gráficos antes mencionados, representan en el eje vertical Y, las frecuencias sim-
ples, y en el eje horizontal X, los límites reales y las marcas de clase.
Ejemplo
Para la siguiente distribución de frecuencias, construya el histograma y polígono de fre-
cuencias.
Clases Frecuencia
1–5 5
6 – 10 12
11 – 15 14
16 – 20 8
21 – 25 4
Total 43
42 CAPÍTULO 3
Solución
Calculando las marcas de clase o punto medio, y los límites reales como se muestra en el
cuadro siguiente:
Y
18 Histograma
16
14
12 Polígono
10
8
6
4
2
0 X
0.5 5.5 10.5 15.5 20.5 25.5
límites reales
–2 3 8 13 18 23 28 marcas de clase
3.3.3 Ojivas de Galton
Una ojiva es una representación gráfica de líneas de una distribución de frecuencias acu-
mulada o frecuencias relativas acumuladas, conocidas también como Ojivas de Galton, en
honor al antropólogo, psicólogo, meteorólogo y estadístico británico Sir Francis Galton
(1822-1911).
Componentes de la ojiva
a) Título;
b) Un sistema de ejes coordenados donde el eje Y representa las fa o la fra, según sea el
caso, y el eje X representa los límites reales;
c) Toda ojiva comienza con una frecuencia acumulada (fa) igual a cero, asociada al lími-
te real inferior de la primera clase, y termina con una frecuencia acumulada (fa) de
valor N, asociada al límite superior de la última clase;
d) En el caso de utilizar las fra, la ojiva comienza con una frecuencia relativa acumulada
(fra) igual a cero por ciento, asociada al límite real inferior de la primera clase, y ter-
mina con una frecuencia relativa acumulada (fra) de 100%, asociada al límite superior
de la última clase;
Tipos de ojiva
1. La “Ojiva Menor Que” representa las frecuencias acumuladas (fa) o frecuencias rela-
tivas aculadas (fra), menores que cualquier límite real superior de clase;
Ordenamiento y presentación de datos 43
2. La “Ojiva Mayor Que” representa las frecuencias acumuladas (fa) o frecuencias rela-
tivas aculadas (fra), mayores que cualquier límite real inferior de clase.
Ejemplo
La siguiente distribución de frecuencias representa la estatura en metros de un grupo de 70
estudiantes del doctorado en medicina y cirugía de la Universidad Católica de Honduras.
60
50
40
30
20
10
0
1.445 1.495 1.545 1.595 1.645 1.695 1.745 1.795 1.845
44 CAPÍTULO 3
100
80
PORCENTAJE
60
40
20
0
1.445 1.495 1.545 1.595 1.645 1.695 1.745 1.795 1.845
b) El 90% de los estudiantes tienen una estatura inferior o igual a 1.745 metros
c) Ojiva Mayor Que
60
50
40
30
20
10
0
1.445 1.495 1.545 1.595 1.645 1.695 1.745 1.795 1.845
Ordenamiento y presentación de datos 45
100
80
Porcentaje
60
40
20
0
1.445 1.495 1.545 1.595 1.645 1.695 1.745 1.795 1.845
e) El 87.14% de los estudiantes tienen una estatura superior o igual a 1.545 metros.
EJERCICIOS 3.3
1. La siguiente distribución representa el número de pacientes por edad atendidos en el
Hospital Escuela y Materno Infantil, durante el mes de diciembre del año 2008.
38.1 39.4 40.1 37.1 37.8 37.6 37.1 37.5 37.0 36.9
37.7 37.7 37.3 37.0 37.0 37.8 37.8 37.9 38.4 38.6
38.0 38.2 38.7 38.9 39.1 39.2 39.3 39.8 38.7 37.7
Medidas de
tendencia central 4
Contenido
4.1 Conceptualización
4.2 La sumatoria o notación sigma
4.3 La media aritmética y su cálculo
4.3.1 Cálculo de la media para datos no
agrupados
4.3.2 Cálculo de la media para agrupados en
frecuencia simple
4.3.3 Cálculo de la media para datos
agrupados en distribución de
frecuencias
4.4 La mediana y su cálculo
4.4.1 Cálculo de la mediana para datos no
agrupados
4.4.2 Cálculo de la mediana para datos
agrupados en frecuencia simple
4.4.3 Cálculo de la mediana para datos
agrupados en distribución de
frecuencias
4.5 La moda y su cálculo
4.5.1 Cálculo de la moda para datos no
agrupados
4.5.2 Cálculo de la moda para datos
agrupados en frecuencia simple
4.5.3 Cálculo de la moda para datos
agrupados en distribución de
frecuencias
4.6 La media aritmética ponderada
4.7 Ventajas y desventajas de las medidas de
tendencia central
4.8 La media geométrica
48 CAPÍTULO 4
B C
n n
3. ∑ CX i = C∑X i = C ( X1 + X 2 + X 3 + ... + Xn) donde C es una constante
i=1 i =1
n n n
4. ∑ ( X i ± Yi ) = ( X1 ± Y1 ) + ( X 2 ± Y2 ) + ( X 3 ± Y3 ) + ... + ( X n ± Yn) =∑ xi ±∑yi =
i =1 i=1 i =1
( ) (
x1 + x2 + x3 + ... + xn ± y1 + y2 + y3 + ... + yn )
Ejemplos
Evaluar las siguientes sumatorias:
3
a) ∑7
i =1
Solución a)
3 3
a) ∑7 = (3)(7) = 21 o ∑7 = 7 + 7 + 7 = 21
i =1 i =1
5
b) ∑X i
i =1
Solución b)
5
a) ∑X i = X1 +X 2 + X 3 + X 4 + X 5
i =1
4
b) ∑(1 − i)3−i
i =1
Solución c)
4
c) ∑(1 − i)3−i = (1 −1)3−1 + (1 − 2)3 −2 + (1 −3)3−3 + (1 − 4)3 −4
i =1
= 02 + (−1)1 + (−2)0 + (−3)−1
1 1
= 0 −1 +1 − = − ≅ − 0.33333… .
3 3
EJERCICIOS 4.2
1. Pruebe que:
n
a) ∑C = Cn ; donde C es una constante;
i =1
n
b) ∑X i = X1 + X 2 + X 3 + ... + X n
i =1
n n
c) ∑CX i = C ∑Xi = C ( X1 + X 2 + X 3 + ... + Xn) ; C constante
i=1 i =1
50 CAPÍTULO 4
Nota:
Generalmente en estadística N sirve para representar el tamaño de una población, y n
para representar el tamaño de la muestra.
Ejemplo
El siguiente conjunto de datos representa las calificaciones en un laboratorio realizado
por estudiantes de la Carrera de Cirugía Dental de la UNICAH:
4, 5, 3, 5, 7, 7, 9, 5, 5, 3, 3, 3, 4, 6, 6, 6, 4, 4, 4, 5
Calcular la nota promedio obtenida por los alumnos en éste laboratorio.
Solución
20
4 + 5 + 3 + 5 + 7 + 7 + 9 + 5 + 5 + 3 + 3 + 3 + 4 ++6+ 6+ 6 + 4 + 4 + 4 + 5
µ = ∑X i =
i =1 20
98
µ= ≅ 4.9
20
f = frecuencia
Dónde: X = valor del dato o variable
N = número total de observaciones o tamaño de la población
n = número total de observaciones o tamaño de la muestra
Ejemplo
La siguiente distribución de frecuencias simples representa a 129 jóvenes como pacientes
que reciben atención médica especial. Calcular el valor promedio de sus edades.
Solución
X f f X
14 12 168
15 17 255
16 25 400
17 30 510
18 19 342
19 16 304
20 10 200
∑ fX 2179
µ= = =16.89 ≅ 17 años
N 129
∑ fX m o ∑ f Xm
µ= X=
N n
f = frecuencia
Donde: Xm = Marca de clase o punto medio
N = Tamaño de la población
n = Tamaño de muestra
Ejemplo
La siguiente distribución de frecuencias representa los pesos en kilogramos de 114 paque-
tes que serán enviados por la Secretaría de Salud, de Tegucigalpa a la Ciudad San Pedro
Sula. Calcular el peso promedio de dichos paquetes.
52 CAPÍTULO 4
X f
10.0 – 10.9 2
11.0 – 11.9 8
12.0 – 12.9 12
13.0 – 13.9 16
14.0 – 14.9 24
15.0 – 15.9 22
16.0 – 16.9 16
17.0 – 17.9 14
Total 114
Solución
X f Xm f Xm
10.0 – 10.9 2 10.45 20.9
11.0 – 11.9 8 11.45 91.6
12.0 – 12.9 12 12.45 149.4
13.0 – 13.9 16 13.45 215.2
14.0 – 14.9 24 14.45 346.8
15.0 – 15.9 22 15.45 339.9
16.0 – 16.9 16 16.45 263.2
17.0 – 17.9 14 17.45 244.3
Total 114 1671.3
∑ f Xm 1671.3
µ= = ≅14.66 Kilogramos
N 114
EJERCICIOS 4.3
1. Para los siguientes conjuntos de datos no agrupados, calcule la media.
a) 1.1 1.2 1.7 2.3 2.7 2.6 1.2 2.5 1.4 2.4 2.6 2.8 2.3 1.8 1.5 1.1 1.8
2.2 2.8 2.3 2.2 2.4 2.0 1.3
b) 10 15 18 16 13 14 13 15 11 17 18 16 10 10
1 3 5 7 5 3 3 1 3 5 5 1 7 5
c) , , , , , , , , , , , , ,
2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 0 7 18 17 18 18 18 18 19 21 19 19 17 17 18 22 20 1
7 17 17 18 19 16 23 19 18 17 18 18 17
Calcular la edad promedio de los alumnos en esta clase.
Medidas de tendencia central 53
7. La siguiente tabla representa las edades y números de reclamos por mala atención en
los servicios médicos a los beneficiarios del IHSS, durante el mes de enero del año 2014;
Edades frecuencia
18 - 25 12
26 - 33 15
34 - 41 22
42 - 49 29
50 - 57 35
58 - 65 40
66 - 73 26
74 - 81 9
Total 188
Calcular la media.
8. Los siguientes datos muestran el nivel de contaminación en una empresa manufactu-
rera en la zona norte de Honduras.
Edad Frecuencia (f )
18 - 22 5
23 - 27 12
28 - 32 15
33 - 37 18
38 - 42 24
43 - 47 24
48 - 52 22
53 - 57 20
58 - 62 27
63 - 67 28
68 - 72 34
73 - 77 13
78 - 82 6
Total 248
Calcular la edad promedio de estos pacientes.
Solución
X f fa n +1 35 +1 36
P= = = = 18
10 9 9 2 2 2
13 8 17
15 6 23 Renglón mediano
16 5 28
18 4 32
20 3 35
Total 35
Como el valor de la posición indica que la observación número 18 se encuentra en el
tercer renglón, entonces Me = 15
N
− (∑f )1
M e = LriMe + 2 xC ;
f Me
Ejemplo
La siguiente distribución de frecuencias, representa los reclamos por seguros de acciden-
tes, hechos a una compañía aseguradora durante el mes de enero de 2013. Calcular la
mediana para éste conjunto de datos.
X Frecuencia
10 - 15 12
16 - 21 8
22 - 27 14
28 - 33 25
34 - 39 11
40 - 45 30
46 - 51 12
52 - 57 8
58 - 63 4
Total 124
Medidas de tendencia central 57
Solución
X f fa Lri – Lrs
10 - 15 12 12
16 - 21 8 20
22 - 27 14 34
28 - 33 25 59
Intervalo Mediano 34 - 39 11 70 33.5
40 - 45 30 100
46 - 51 12 112
52 - 57 8 120
58 - 63 4 124
Total 124
n +1 124 +1
Calculando p = tenemos que p = = 62.5 , se puede ver que el valor que
2 2
constituirá la mediana se encuentra entre los datos que ocupan la posición 62 y 63, y que
se encuentran en la quinta clase o el intervalo de clase formado por 34 - 39, a éste renglón
o fila es el que llamaremos, nuestro intervalo mediano.
N
− (∑f )1 62 − 59
Como: M e = LriMe + 2 xC = 33.5 + x6 = 35
f Me 11
EJERCICIOS 4.4
1. Para los siguientes conjuntos de datos no agrupados, calcular la mediana.
a) 1.1 1.2 1.7 2.3 2.7 2.6 1.2 2.5 1.4 2.4 2.6 2.8 2.3 1.8 1.5 1.1 1.8
2.2 2.8 2.3 2.2 2.4 2.0 1.3
b) 10 15 18 16 13 14 13 15 11 17 18 16 10 10
1 3 5 7 5 3 3 1 3 5 5 1 7 5
c) , , , , , , , , , , , , ,
2 2 2 2 2 2 2 2 2 2 2 2 2 2
2. Se seleccionó un curso de Anatomía de la Universidad Católica de Honduras, y se
registraron sus edades, de la manera siguiente:
2 0 17 18 17 18 18 18 18 19 21 19 19 17 17 18 22 20 17 17 17
18 19 16 23 19 18 17 18 18 17
Calcular la mediana para estos datos.
3. Dadas las siguientes tablas de frecuencias simples, calcular la mediana.
a) X f b) X f
1.004 7 13.15 8
1.005 6 15.15 10
1.006 10 17.15 15
1.007 9 19.15 17
1.008 8 21.15 14
1.009 5 25.15 12
27.15 9
Total 45 Total 85
58 CAPÍTULO 4
Peso en libras f
6.5 3
7.5 7
8.5 10
9.5 5
10.5 4
11.0 1
Total 30
Calcule la mediana.
5. La siguiente tabla representa las edades de 77 estudiantes de la carrera de Relaciones
Internacionales de la UNICAH.
Calcule la mediana.
6. Para las siguientes distribuciones de frecuencias, determinar la mediana.
a) X f b) X f
10.01 – 11.00 10 10.1 – 11.3 2
11.01 – 12.00 12 11.4 – 12.6 8
12.01 – 13.00 13 12.7 – 13.9 7
13.01 – 14.00 13 14.0 – 15.2 6
14.01 – 15.00 11 15.3 – 16.5 5
15.01 – 16.00 9 16.6 - 17.8 5
17.9 – 19.1 4
19.2 – 20.4 3
Total 68 Total 40
7. La siguiente tabla representa las edades y números de reclamos por mala atención en
los servicios médicos, a los beneficiarios del IHSS durante el mes de enero del año
2014.
Medidas de tendencia central 59
Edades Frecuencia
18 - 25 12
26 - 33 15
34 - 41 22
42 - 49 29
50 - 57 35
58 - 65 40
66 - 73 26
74 - 81 9
Total 188
Calcular la mediana
8. Los siguientes datos muestran el nivel de contaminación en una empresa maquiladora.
3. Los datos deben ser ordenados de menor a mayor, para leerlos mejor;
4. Muchas veces hay conjuntos de datos que no tienen moda;
5. En el caso de conjunto de datos multimodales, las modas deben repetirse el mismo
número de veces.
Ejemplo
Dada la siguiente distribución de frecuencias simples, calcular la moda.
X f
13 2
15 6
17 11
19 12
21 8
25 9
27 4
Total 52
Solución
En la distribución se puede observar que el valor o dato 19, es el que más se ha repetido,
entonces: Mo = 19
Medidas de tendencia central 61
Edades Cantidad
23 - 27 14
28 - 32 17
33 - 37 24
38 - 42 26
43 - 47 21
48 - 52 28
53 - 57 17
58 - 62 9
63 - 67 5
68 - 72 3
Total 164
Solución
Edades f Lri - Lrs
23 - 27 14
28 - 32 17
33 - 37 24
38 - 42 26
43 - 47 21
48 - 52 28 47.5
53 - 57 17
58 - 62 9
63 - 67 5
68 - 72 3
Total 164
Se puede ver que la sexta clase es la que tiene mayor frecuencia, por tanto, este ren-
glón o fila, será nuestro intervalo modal, luego se tiene que:
d1 7
M o = LriMo + xC = 47.5 + x5 = 49.44 Años
d1 + d2 7 +11
62 CAPÍTULO 4
EJERCICIOS 4.5
1. Para los siguientes conjuntos de datos no agrupados, calcule la moda.
a) 1.1 1.2 1.7 2.3 2.7 2.6 1.2 2.5 1.4 2.4 2.6 2.8 2.3 1.8 1.5 1.1 1.8
2.2 2.8 2.3 2.2 2.4 2.0 1.3
b) 10 15 18 16 13 14 13 15 11 17 18 16 10 10
1 3 5 7 3 3 1 3 5 5 1 7 5
c) , , , , , , , , , , , ,
2 2 2 2 2 2 2 2 2 2 2 2 2
a) X f b) X f
1.004 7 13.15 8
1.005 6 15.15 10
1.006 10 17.15 15
1.007 9 19.15 17
1.008 8 21.15 14
1.009 5 25.15 12
27.15 9
Total 45 Total 85
Peso en libras f
6.5 3
7.5 7
8.5 10
9.5 5
10.5 4
11.0 1
Total 30
a) X f b) X f
10.01 – 11.00 10 10.1 – 11.3 2
11.01 – 12.00 12 11.4 – 12.6 8
12.01 – 13.00 13 12.7 – 13.9 7
13.01 – 14.00 13 14.0 – 15.2 6
14.01 – 15.00 11 15.3 – 16.5 5
15.01 – 16.00 9 16.6 - 17.8 5
17.9 – 19.1 4
19.2 – 20.4 3
Total 68 Total 40
7. La siguiente tabla representa las edades y números de reclamos por mala atención en
los servicios médicos a los beneficiarios del IHSS, durante el mes de enero del año 2014;
Edades frecuencia
18 - 25 12
26 - 33 15
34 - 41 22
42 - 49 29
50 - 57 35
58 - 65 40
66 - 73 26
74 - 81 9
Total 188
Calcular la moda.
8. Los siguientes datos muestran el nivel de contaminación en una empresa maquiladora.
Edad Frecuencia (f )
18 - 22 5
23 - 27 12
28 - 32 15
33 - 37 18
38 - 42 24
43 - 47 24
48 - 52 22
53 - 57 20
58 - 62 27
63 - 67 28
68 - 72 34
73 - 77 13
78 - 82 6
Total 248
Calcular la moda.
Ejemplo
Jaime Rivera, estudiante de la carrera de Medicina y Cirugía de la Universidad Católica
de Honduras, en el segundo periodo del 2010, cursó las asignaturas de Bioestadística,
Anatomía I, Física Médica y Química Orgánica, habiendo aprobado las clases antes men-
cionadas con los promedios de 84, 96, 93 y 87, respectivamente. Dichas asignaturas por
su orden tienen 4, 4, 4 y 3 unidades valorativas o créditos. Calcular el rendimiento prome-
dio del estudiante Jaime Rivera.
Solución
n
∑X iWi (84)(4) + (96)(4) + (93)(4) + (87)(3) 336 + 384 +372 +261 1353 ≅
i =1
XW = n = = = 90.2%
4 + 4 + 4 +3 15 15
∑Wi
n i =1
∑X iWi (84)(4) + (96)(4) + (93)(4) + (87)(3) 336 + 384 +372 +261 1353 ≅
i =1
XW = n = = = 90.2%
4 + 4 + 4 +3 15 15
∑Wi
i =1 El rendimiento promedio ponderado del estudiante Jaime Rivera en el segundo perio-
do de 2010, fue de 90.2%
Medidas de tendencia central 65
EJERCICIOS 4.6
1. Un hospital de especialidades ha decidido vacunar contra una epidemia, a todos los
pobladores de una localidad afectada por dicha enfermedad. Los médicos deciden
que de 0 a 10 años se apliquen 3 dosis con 80% del componente A, de 11 a 20 años,
4 dosis con 85% del componente A, de 21 a 30 años 5 dosis con el 88% del compo-
nente A, de 31 a 50 años 6 dosis con 90% del componente A, y 51 años y más 7 dosis
con 95% del componente A. Calcule el promedio ponderado del medicamento tipo A
que fue aplicado a los pobladores de ésta comunidad.
2. Un estudiante de la UNICAH, construye una tabla de su rendimiento académico en
el segundo periodo del 2013 de la manera siguiente:
Desventajas:
1. La media es afectada por valores extremos, ya sean éstos datos muy grandes o muy
pequeños;
2. Su cálculo es tedioso, debido a que se deben utilizar todos los datos;
3. La media no se puede calcular para datos que están contenidos en clases abiertas en
los extremos de una distribución.
Desventajas:
1. No se puede calcular para datos nominales;
2. Sus utilizaciones en procesos estadísticos son más complejos que el uso de la media;
3. Para calcularla es obligatorio ordenar el conjunto de datos.
Desventajas:
1. Se usa menos que la media y la mediana, como una medida de localización central;
2. Es una medida infructuosa cuando no existe en un conjunto de datos o que todos los
valores sean la moda;
3. Cuando el conjunto de datos es multimodal, la moda no es de mucha utilidad para
comparación o interpretación de los mismos.
Medidas de tendencia central 67
Ejemplo
El director de un programa sobre salud pública en Honduras, desea determinar la tasa de
crecimiento porcentual promedio del número de pacientes en la zona norte del país. El
profesional de la medicina cuenta con los registros de los años 1992 a 1996, de acuerdo a
la siguiente tabla.
Solución inciso b)
La tasa de crecimiento porcentual promedio está dada por:
TCPP = (MG – 1) × 100 = (1.120187443 – 1)(100) ≅ 12.02%: TCPP = 12.02%
Nota: Si hubiésemos calculado la tasa de crecimiento porcentual promedio mediante la
media aritmética tendríamos:
Ahora la TCPP = (la media – 1) (100) = (1.13 – 1) (100) = 13%, este resultado es
mayor que 12.02% calculado anteriormente, por lo que en éstos casos es más recomenda-
ble utilizar la media geométrica, dado que ésta medida representa con mayor exactitud el
cambio promedio con el tiempo.
68 CAPÍTULO 4
EJERCICIOS 4.8
1. Un administrador de una cadena de clínicas privadas, ha registrado los siguientes in-
crementos porcentuales en la demanda de nuevos productos fabricados, durante los
últimos 5 años.
2010 2011 2012 2013 2014
Medidas de posición
5
Contenido
Medidas de posición
Las medidas de posición sirven para describir la localización de un dato específico, con
relación al resto de la muestra o población. Entre éstas medidas las más utilizadas son:
1. Los cuartiles;
2. Los deciles,
3. Los percentiles.
• Los cuartiles se representan generalmente con la letra Q, y son datos que dividen al
conjunto ordenado de menor a mayor en cuatro partes iguales.
Existen tres cuartiles identificados como: Q1, Q2 y Q3 y se ubican en el conjunto orde-
nado de la forma siguiente:
Q1 Q2 Q3
• Los deciles se representan generalmente con la letra D, y son datos que dividen al
conjunto ordenado de menor a mayor en diez partes iguales.
Existen nueve deciles identificados como: D1, D2, ..., D9 y se ubican en el conjunto
ordenado de la forma siguiente:
D1 ...... D9
• Los percentiles se representan generalmente con la letra P, y son datos que dividen al
conjunto ordenado de menor a mayor en cien partes iguales.
Existen noventa y nueve percentiles identificados por: P1, P2,..., P99 , se ubican en el
conjunto ordenado de la forma siguiente:
1% 1% ... 1% 1%
P1 P99
Ejemplo
Sean 13.5, 3.5, 4.2, 7 y 11; un conjunto de datos no agrupados, calcular el cuartil dos (Q2)
Solución
Ordenando los datos: 3.5, 4.2, 7, 11, 13.5
Entonces Q2 = 7
3. Si el número de datos o tamaño del conjunto es impar, entonces el cuartil dos, (Q2),
será la media aritmética de los dos datos centros.
Medidas de posición 71
Ejemplo
Sean 7, 2.2, 11.6, 2.1, 6.6, 9.4; un conjunto de datos no agrupados, calcular el cuartil dos
(Q2)
Solución
Ordenando los datos: 2.1, 2.2, 6.6, 7, 9.4, 11.6
6.6 + 7
Entonces Q2 = = 6.8
2
4. Para el cálculo del cuartil uno (Q1)y cuartil tres (Q3); para la posición haremos uso
de las fórmulas siguientes:
a) Si el número de datos o tamaño del conjunto es par, para el cálculo de la posición
n
+1
use la fórmula: P = 2 , luego con el valor de la posición y los datos ordenados
2
de menor a mayor, busque la posición del dato para el cuartil uno, de izquierda a
derecha y para el cuartil tres busque la posición del cuartil tres, de derecha a iz-
quierda.
b) Si el número de datos o tamaño del conjunto es impar, para el cálculo de la posi-
n −1
+1
ción use la fórmula: P = 2 , luego con el valor de la posición y los datos
2
ordenados de menor a mayor busque la posición del dato para el cuartil uno,
de izquierda a derecha y para el cuartil tres busque la posición del cuartil tres, de
derecha a izquierda.
Ejemplo 1
Sean 15, 27, 33, 13, 18, 5, 25, 21, 17
Calcular los cuartiles uno (Q1) y tres (Q3)
Solución
Ordenando los datos: 5, 13, 15, 17, 18, 21, 25, 27, 33
Como el número de datos o tamaño del conjunto es impar, para el cálculo de la posi-
ción para la búsqueda de los cuartiles uno (Q1) y tres (Q3) , usaremos la fórmula.
n −1 9 −1
+1 +1 5
p= 2 = 2 = = 2.5
2 2 2
El resultado 2.5 significa que los cuartiles buscados se encuentran en la posición 2 o
3, ya con los datos ordenados, entonces el cuartil uno se busca de la siguiente manera:
Posición: 1 2 3 4 5 6 7 8 9
13 +15 28
Entonces Q1 = = = 14
2 2
Posición: 9 8 7 6 5 4 3 2 1
25 + 27 52
Entonces Q3 = = = 26
2 2
Ejemplo 2
Sean 15, 27, 33, 13, 18, 5,
Calcular los cuartiles uno (Q1) y tres (Q3)
Solución
Ordenando los datos: 5, 13, 15, 18, 27, 33,
Como el número de datos o tamaño del conjunto es par (n = 6), para el cálculo de la
posición para la búsqueda de los cuartiles uno (Q1) y tres (Q3), usaremos la fórmula:
n 6
+1 +1 4
P= 2 =2 = =2
2 2 2
El resultado 2 significa que los cuartiles buscados se encuentran en la posición 2, ya
con los datos ordenados, entonces el cuartil uno se busca de la siguiente manera:
Notas especiales
Como todo Cuartil y todo Decil están relacionados con algún Percentil, matemáticamen-
te podemos hacer uso de fórmulas percentílicas para el cálculo de cualquiera de las medi-
das de posición (Cuartiles, Deciles y Percentiles), teniendo en cuenta las condiciones si-
guientes:
1. Relación entre Cuartiles, Deciles y Percentiles:
a) Q1 = P25 b) Q2 = P50 c) Q3 = P75 d ) D1 = P10 e) D2 = P20 f ) D3 =P30
g) D4 = P40 h) D5 = P50 i) D6 = P60 j) D7 = P70 k) D8 = P80 l ) D9 = P90
2. Para datos no agrupados, ordénelos en forma ascendente;
3. Determine la posición para datos no agrupados y agrupados en distribución de fre-
nk
cuencias, mediante la fórmula P = ; donde:
100
n = Número total de observaciones o datos
k = Número del percentil deseado (k = 1, 2, 3, ..., 99)
4. Si el valor de la posición resulta un entero, súmele 0.5 a ese valor;
5. Si el valor de la posición resulta un número decimal, aproxime ese valor al entero in-
mediato superior. (No use regla de redondeo).
Medidas de posición 73
Ejemplo
a) Si P = 5, entonces el verdadero valor de la posición es P = 5.5
b) Si P = 6.01, entonces el verdadero valor de la posición es P = 7
c) Si P = 6.85, entonces el verdadero valor de la posición es P = 7
Para calcular la posición y el valor de los cuartiles, deciles y percentiles en datos no
agrupados, haga lo siguiente:
nk
6. La fórmula pk = , servirá para el cálculo de cualquier Decil, Cuartil o Percentil
100
para datos no agrupados, dado que éstas medidas (los percentiles) tienen relación
con algún Decil o Cuartil, como lo dijimos anteriormente.
7. En este proceso y para datos no agrupados, localizaremos el valor del percentil desea-
do en el conjunto de datos ordenados de menor a mayor, de acuerdo a la posición
encontrada de izquierda a derecha para cualquiera de las medidas.
8. Cuando el valor final de la posición sea el decimal aproximado (esto es por la suma
de 0.5), el valor del percentil buscado, será la media aritmética de los dos valores de
los datos ordenados que dejen en el intermedio el valor de dicha posición, y si el valor
final de la posición es un valor entero, entonces la medida de posición buscada es el
dato ubicado en dicha posición.
Entonces: P73 = 9
Solución inciso b)
Ordenando los datos de menor a mayor, tenemos:
2, 3, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 8, 9, 9, 10, 12, 13, 13
En éste caso D4 = P40, entonces k = 40 y n = 20, calculando la posición tenemos que:
nk (20)(40) 800
P= = = = 8 + 0.5 = 8.5
100 100 100
Solución inciso c)
Ordenando los datos de menor a mayor, tenemos:
2, 3, 3, 4, 4, 5, 5, 6, 7, 7, 7, 8, 8, 8, 9, 9, 10, 12, 13, 13
En éste caso Q2 = P50 , entonces k = 50 y n = 20, calculando la posición tenemos
que:
nk (20)(50) 1000
P= = = = 10 + 0.5 = 10.5
100 100 100
EJERCICIOS 5.1
1. Para los siguientes conjuntos de datos no agrupados:
a) 7, 7, 5, 6, 4, 8, 9, 12, 11, 11, 10, 5, 5, 10, 10, 10
b) 2.4, 3.5, 4.8, 2.3, 2.9, 4.1, 2.7, 2.5, 3.6, 3.9, 3.8, 3.3
c) 1.07, 1.09, 1.01, 1.01, 1.02, 1.03, 1.03, 1.05, 1.04, 1.06
Calcular:
a) El Cuartil 3, Decil 6 y Percentil 37
b) El Percentil 66, Decil 2, Cuartil 1 y Percentil 7
Pk = Percentil buscado
LRIpk = Límite real inferior de la clase percentílica
(∑f)1 = Total, de observaciones acumuladas antes del intervalo percentílico
n = Número total de observaciones
Donde:
k = Percentil k-ésimo deseado
nk
= Posición de la clase percentílica
100
fpk = Frecuencia simple o absoluta en la clase percentílica
C = Ancho de la clase percentílica
Ejemplo:
Dada la siguiente distribución de frecuencias, Calcular a) D9 b) P38
X f
40 - 49 10
50 - 59 12
60 - 69 14
70 - 79 16
80 - 89 13
90 - 99 11
Total 76
Solución inciso a)
Como el Decil nueve es igual al percentil noventa (D9 = P90), entonces en éste caso k = 90
y n = 76, luego:
nk (76)(90) 6840
P= = = = 68.4 ≅ 69;
100 100 100
X f fa Limites reales
40 - 49 10 10
50 - 59 12 22
60 - 69 14 36
70 - 79 16 52
80 - 89 13 65
90 - 99 11 76 89.5
Total 76
Podemos ver que nuestro intervalo centílico o percentílico, está en la posición 69 o
sea ubicada en la última clase; entonces:
nk
(
− ∑f ) 69 − 65
PK = LriPk + 100
1
xC = P90 = 89.5 + x10 ≅ 93.14
f Pk 11
Concluyendo: D9 = 93.14
76 CAPÍTULO 5
Solución inciso b)
En éste caso k = 38 y n = 76, luego:
nk (76)(38) 2888
P= = = = 28.88 = 29 ; La posición es 29, la cual buscaremos en la
100 100 100
Distribución siguiente:
X f fa Limites reales
40 - 49 10 10
50 - 59 12 22
60 - 69 14 36 59.5
70 - 79 16 52
80 - 89 13 65
90 - 99 11 76
Total 76
Podemos ver que nuestro intervalo centílico o percentílico, es la clase tres; entonces:
nk
− ∑f ( )1 29 − 22
PK = LriPk + 100 xC = P38 = 59.5 + x10 ≅ 64.5; entonces:
f Pk 14
P38 = 64.5
EJERCICIOS 5.2
1. La siguiente distribución de frecuencias representa datos durante el mes de noviem-
bre del año 2013, referente a la edad de las madres solteras que laboran en una empre-
sa maquiladora en el norte del país.
Edades Frecuencia
01 - 10 20
11 - 20 44
21 - 30 36
31 - 40 48
41 - 50 57
51 - 60 33
61 - 70 22
71 - 80 10
81 - 90 4
Total 274
X Frecuencia
0.01 - 0.05 25
0.06 - 0.10 18
0.11 - 0.15 23
0.16 - 0.20 16
0.21 - 0.25 17
0.26 - 0.30 13
Total 112
x −B
RP ( x ) = A + D;
C
f
El valor de D debe calcularse por: D = x100
N
Ejemplo
La siguiente distribución de frecuencias representa las edades y cantidad de personas que
se sometieron a un programa de exámenes psicométricos y que obtuvieron resultados por
arriba de la media normal del coeficiente intelectual.
78 CAPÍTULO 5
Solución inciso a)
Límites
Edades (X) f fa fra(%) reales
20 - 30 15 15 7.69
31 - 40 25 40 20.51 30.5
41 - 50 36 76 38.97
51 - 60 44 120 61.54
61 - 70 39 159 81.54
71 - 80 24 183 93.85
81 - 90 12 195 100.00
Total 195
35 −30.5 25
RP (35) = 7.69 + x x100 = 7.69 + (0.45)(12.82) =13.46%
10 195
Significado: El 13.46% de los datos, están por debajo del valor 35, y 86.54% de los
datos, están por arriba del valor 35.
Solución inciso b)
X −B
RP ( X ) = A + xD =
C
70 − 60.5 39
RP (70) = 61.54 + x x100 = 61.54 + (0.95)(20) = 80.54%
10 195
Significado: El 80.54% de los datos, están por debajo del valor 70, y 19.46% de los
datos, están por arriba del valor 70.
EJERCICIOS 5.3
1. La siguiente distribución representa la incidencia de enfermedades respiratorias en
niños durante los meses de invierno en la zona norte de Honduras.
3. Los siguientes datos representan el número de pacientes que visitan por día el consul-
torio médico de Las crucitas en la Ciudad de Comayagüela.
48 34 26 39 51 60 55 45 47 54 38 36
44 49 58 59 50 40 46 43 57 48 44 47
Medidas de dispersión
6
Contenido
Medidas de dispersión
6.1 Conceptualización e interpretación
de la desviación estándar
Cualquier promedio central no logra por sí mismo describir completamente una distribu-
ción de frecuencias. Se necesita de otras medidas para que sus características queden de-
finidas y pueda efectuarse una efectiva comparación con otras distribuciones. A éstas
medidas se les conoce con el nombre de Medidas de Dispersión o de Variabilidad.
La variación o dispersión, es el grado en que las observaciones o datos de una muestra
o población, tienden a concentrarse o a dispersarse en torno a un valor promedio central.
La Desviación Estándar como medida de fluctuación (variabilidad) en los datos, nos
permite determinar con mayor grado de precisión, donde se sitúan los valores de una
distribución de frecuencia, en relación con la media, o qué porcentaje de ellos deben estar
entre ciertos límites.
Dos o más conjuntos de datos pueden tener la misma localización central, y, no obs-
tante, ser muy distintos, si uno de ellos se halla más disperso que el otro.
Ejemplo
Tres curvas
con la
misma
medida,
pero con
diferentes
variables
La desviación estándar
La desviación estándar representa la variabilidad promedio de los datos con respecto a la
media, o sea que nos permite saber que tan disperso o que tan concentrado está el conjun-
to de datos con respecto a su media o dato promedio.
Medidas de dispersión 83
∑( X i − X ) ∑ X 2 ∑ X ∑X
2
S= o S = −
n −1 n −1 n(n −1)
—
Dónde: n = tamaño de la muestra; X = media muestral
Xi = valor de la observación
b) Si los datos corresponden a toda la población:
∑( X i − µ )2
σ =
N
Dónde: N = tamaño de la población; 𝜇 = media poblacional
Xi = valor de la observación o dato
Ejemplo
Sean 2, 3, 5, 7, 11, 13, 17, el conjunto de los primeros siete números primos.
a) Calcular la desviación estándar tratando los datos como una muestra; y,
b) La desviación estándar tratando los datos como una población.
Solución inciso a)
X X2
2 4
3 9
5 25
7 49
11 121
13 169
17 289
∑X = 58 ∑X 2 = 666
∑X 58
≅ 8.28
X = =
n 7
∑( X i − X )
2
S=
n −1
84 CAPÍTULO 6
(2 − 8.28)2 + (3 − 8.28)2 + (5 − 8.28)2 + (7 − 8.28)2 + (11− 8.28)2 + (13 − 8.28)2 + (17 − 8.28)2
7 −1
∑X 2 ∑X∑ X
S= − =
n −1 n(n −1)
Solución inciso b)
∑X 58
Calculando la media tenemos que: µ = = ≅ 8.28
N 7
∑( X i − µ )
2
Luego: σ = =
N
∑(2 − 8.28)2 + (3 − 8.28)2 + (5 − 8.28)2 + (7 − 8.28)2 + (11− 8.28)2 + (13 − 8.28)2 + (17 − 8.28)2
7
39.4384 + 27.8784 +10.7584 +1.6384 +7.3984 + 22.2784 +76.0384 185.4288
= = 26.4898 ≅ 5.15
7 7
La Varianza
La varianza de una población o muestra, es similar a una desviación absoluta promedio,
y para cualquier conjunto de datos, se calcula con las mismas fórmulas de la desviación
estándar sin la raíz cuadrada, en otras palabras la varianza es el cuadrado de la desviación
estándar y se representa por los símbolos para datos muéstrales y para datos poblaciona-
les, por tanto las fórmulas a utilizar serán:
a) Si los datos provienen de una muestra:
∑(X i − X )2 ∑ X 2 ∑X∑X
S2 = o S2 = −
n −1 n −1 n(n −1)
Medidas de dispersión 85
n = tamaño de la muestra
—
Dónde: X = media muestral
Xi = valor de la observación o dato
b) Si los datos corresponden a toda la población:
∑( X i − µ )2
σ =
2
N
N = tamaño de la población
Dónde: 𝜇 = media poblacional
Xi = valor de la observación
Ejemplo
En el ejemplo anterior se obtuvo que la desviación estándar muestral fue: S = 5.56 y para
la desviación estándar poblacional 𝜎 = 5.15.
Entonces S2 = 30.9136 y 𝜎2 = 26.5225
EJERCICIOS 6.2
1. Los siguientes datos representan el coeficiente intelectual de 20 estudiantes de la
Carrera de Cirugía Dental de la UNICAH, Campus Sagrado Corazón de Jesús.
110 115 128 105 126 121 116 118 132 124
114 119 120 127 121 108 112 113 119 20
a) Tratando los datos como una muestra, calcular la media, desviación estándar y
varianza.
b) Tratando los datos como una población, calcular la media, desviación estándar y
varianza.
2. Los siguientes datos en una escala de 0 a 10, corresponden al nivel de desnutrición
que presentaron 80 niños de una comunidad del Distrito Central, Departamento de
Francisco Morazán.
2.3, 3.4, 3.4, 5.8, 6.0, 6.0, 6.1, 6.0, 6.1, 6.1, 3.5, 3.8, 3.7, 4.8, 4.7, 1.7, 1.6,
1.9, 1.4, 2.2, 2.3, 2.4, 2.7, 2.9, 2.9, 2.1, 2.5, 2.6, 3.1, 1.7, 1.2, 1.5, 1.9, 1.7,
1.6, 3.3, 3.4, 3.5, 3.6, 3.6, 3.6, 3.8, 3.9, 3.8, 4.1, 4.5, 4.7, 4.3, 4.2, 4.9, 4.9,
5.2, 5.1, 5.1, 5.7, 5.9, 5.7, 5.4, 5.4, 5.5, 5.8, 5.9, 5.9, 5.9, 5.7, 6.1, 6.2, 6.0,
6.0, 6.1, 5.2, 5.3, 5.5, 5.5, 4.7, 3.7, 3.7, 3.7, 4.4, 4.4.
Calcular:
a) La nota promedio en éste curso;
b) La desviación estándar y varianza de las notas obtenidas;
c) Si la nota mínima de aprobación es de 70%, interprete los resultados de la media,
desviación estándar y varianza.
4. La siguiente muestra representa la longitud en milímetros de una bacteria en especí-
fico: 0.001, 0.001, 0.002, 0.0025, 0.0013, 0.0016, 0.0017, 0.0018, 0.0011, 0.0012,
0.0022, 0.0019, 0.0021, 0.0021, 0.0023, 0.0024, 0.0013.
Calcular la media, desviación estándar y varianza.
n = Tamaño de la muestra
F = frecuencia simple o absoluta
Donde: X = Valor de la observación o dato
S = Desviación estándar muestral
S2 = Varianza-muestral
∑FX 2 ∑FX 2
−µ2 y σ = − µ2 ;
2
σ= N
N
Ejemplo
La siguiente tabla de frecuencias simples, representa las edades de los alumnos de un
curso de anatomía en la Universidad Católica de Honduras, Campus San Isidro, de la
Ciudad de La Ceiba:
Medidas de dispersión 87
X F X2 FX FX2
17 2 289 34 578
18 9 324 162 2916
19 13 361 247 4693
20 14 400 280 5600
21 5 441 105 2205
22 4 484 88 1936
23 3 529 69 1587
24 1 576 24 576
∑ FX 2 ∑ FX ∑ FX
S= − =
n −1 n(n −1)
X F X2 FX FX2
17 2 289 34 578
18 9 324 162 2916
19 13 361 247 4693
20 14 400 280 5600
21 5 441 105 2205
22 4 484 88 1936
23 3 529 69 1587
24 1 576 24 576
Total 51 ∑FX =1009 ∑FX 2 = 20091
88 CAPÍTULO 6
∑FX 1009
µ 2 = (19.78)2 ≅ 391.42
µ= = = 19.78
N 51
∑FX 2 20091
− (19.78)2 = 393.94 − 391.42 = 2.52 ≅ 1.5874
σ= −µ 2 =
N 51
Entonces la desviación estándar es: 𝜎 =1.5874 y la varianza 𝜎2 = 2.52
EJERCICIOS 6.3
1. Para las siguientes distribuciones simples, calcular:
a) La media, desviación estándar y varianza muestral;
b) La media, desviación estándar y varianza poblacional.
a) x f x f
4 10 9.5 30
5 13 10.5 33
6 15 11.7 35
7 18 12.4 38
8 13 13.7 33
9 12 14.5 32
10 11 15.7 33
Total 92 Total 234
b) x f x f
07.54 15 90.155 7
08.55 17 100.255 9
09.56 18 110.355 12
10.57 14 120.455 13
11.58 14 130.555 12
12.59 13 140.655 10
13.60 12 150.755 8
Total 103 Total 71
2. Los siguientes datos medidos en una escala de 0 a 10, representan la eficiencia laboral
del personal del Centro Médico La Granja.
8.45 9.75 9.73 9.87 9.03 8.87 7.74 7.93 8.16 8.27 8.88
9.04 7.77 7.14 7.55 7.86 8.07 8.34 8.20 7.98 9.15 9.89
a) Ordene los datos en forma ascendente;
b) Agrúpelos en una tabla de frecuencias simples;
c) Tratando los datos como una muestra, calcule la media, desviación estándar y va-
rianza.
3. Para los datos del numeral anterior, tratándolos como una población, calcular:
a) La media;
b) La desviación estándar;
c) La varianza.
Medidas de dispersión 89
∑FX m2 ∑FX m2
σ = −µ 2 y σ 2 = −µ 2
N N
Ejemplo:
Dada la siguiente distribución de frecuencias:
X f
10 - 15 12
16 - 21 13
22 - 27 18
28 - 33 14
34 - 39 11
Total 68
Para los incisos a) y b) bajo las condiciones que se establecen, calcular la desviación
estándar y varianza:
a) Tratando los datos como una muestra;
b) Tratando los datos como una población.
Solución inciso a)
∑ FX m2 ∑FX m ∑FXm
S= − =
n −1 n(n −1)
EJERCICIOS 6.4
1. Los datos de la siguiente distribución de frecuencia corresponden al registro mensual
de personas que visitan durante la época de verano, un centro de salud en la costa
atlántica de Honduras.
X f
501 - 510 32
511 - 520 59
521 - 530 82
531 - 540 21
541 - 550 35
551 - 560 27
Total 256
a) Calcular el valor promedio de pacientes;
b) Calcule la desviación estándar y varianza.
2. La siguiente tabla muestra las mediciones de un contaminante encontrado en ciertas
regiones del país: (mm3/pu2)
X f
0.01 - 0.09 14
0.10 - 0.18 17
0.19 - 0.27 22
0.28 - 0.36 25
0.37 - 0.45 27
0.46 - 0.54 26
0.55 - 0.63 19
0.64 - 0.72 15
0.73 - 0.81 13
0.82 - 0.90 12
Total 190
Medidas de dispersión 91
3.
X f
36.55 - 37.59 7
37.60 - 38.64 12
38.65 - 39.69 13
39.70 - 40.74 15
40.75 - 41.79 12
41.80 - 42.84 10
42.85 - 43.89 8
Total 77
4. Los siguientes datos son las edades de los 36 ancianitos de uno de los asilos de Tegu-
cigalpa, registradas en febrero del año 2015, por un grupo de estudiantes de la Univer-
sidad Católica de Honduras en su labor de extensión universitaria.
77 84 91 87 88 90 79 85 86 96 91 84 83 83 86 90 90 77
79 80 80 80 80 85 89 89 88 83 82 90 90 87 87 75 78 81
Tratando los datos como no agrupados y como una población:
a) Calcular la edad promedio de estos ancianitos;
b) Determinar la desviación estándar y varianza para las edades de los ancianitos en
mención.
5. Dados los siguientes datos, construya una distribución de frecuencias (use 2k ≥ n
para el número de clases deseadas), con dicha distribución y tratando los datos como
una muestra, calcule la media, la desviación estándar y la varianza.
20.1, 30.3, 50.4, 60.7, 51.9, 52.7, 45.6, 60.3, 50.4, 40.4, 60.6, 60.6, 60.6, 50.8,
50.7, 50.7, 50.7, 41.3, 44.4, 48.5, 45.8, 47.8, 23.2, 27.4, 25.4, 28.6, 26.9, 20.8,
35.5, 39.8, 32.8, 34.3, 33.2, 36.4, 38.1, 68.1, 69.0, 60.9, 66.1, 50.7, 40.6
92 CAPÍTULO 6
σ 7
Técnico A: CV = x100 = x100 ≅12.23%
µ 55
σ 8
Técnico B: CV = x100 = x100 ≅11.43%
µ 70
x −µ
Z= ;
σ
x = Valor de la variable
𝜇 = Media de la población
Dónde:
𝜎 = Desviación estándar poblacional
Z = Puntaje estandarizado
Ejemplo
En la asignatura de bioestadística las calificaciones del curso tuvieron un promedio de
78% con una desviación estándar de 12%. En química, las calificaciones finales tuvieron
un promedio de 72% con una desviación estándar de 9%. Si un alumno obtiene 90% en
bioestadística y 82% en química.
Medidas de dispersión 93
a) ¿A cuántas desviaciones estándar está cada una de las calificaciones por arriba del
promedio de la asignatura respectiva?
b) ¿Qué podemos decir acerca del desempeño de dicho alumno en ambas asignaturas?
Solución inciso a)
Calculando las dos puntuaciones:
x − µ 90 − 78 x − µ 82 − 72
Bioestadística: Z = = = 1.0 y Química: Z = = = 1.12
σ 12 σ 9
Solución inciso b)
Su desempeño relativo, fue mejor en la clase de bioestadística, que en la clase de química.
EJERCICIOS 6.5
1. Dos alumnos (A y B) de la carrera de medicina y cirugía de la UNICAH, en una
clase de especialidades, recibieron el mismo entrenamiento mediante dos métodos
diferentes. El alumno A se sometió al Método I, y requirió un promedio de 20 horas
con una desviación estándar de 3.2 horas; El alumno B que se sometió al entrena-
miento con el Método II, requirió un promedio de 24 horas y una desviación estándar
2.45 horas. ¿Cuál método mostró la mayor variabilidad relativa?
2. El peso de los maestros de la facultad de medicina en la UNICAH, tienen una media
de 224 libras con una desviación estándar de 18 libras, mientras que los maestros del
área de ciencias médicas tienen una media de 195 libras con una desviación estándar
de 12 libras. ¿Cuál de los dos grupos muestra una mayor dispersión relativa en el
peso?
3. Con las siguientes observaciones se describen las calificaciones de los estudiantes
que asisten a una capacitación especial en el Campus Sagrado Corazón de Jesús de
la UNICAH, en dos jornadas especiales:
NOTAS JORNADA DIURNA: 92 94 70 80 80 84 77 74 96 98 93 73
NOTAS JORNADA NOCTURNA: 72 85 89 92 78 79 81 74 77 83 88 75 76
Si la homogeneidad del grupo es un factor positivo en el aprendizaje, aplicar una medi-
da de variabilidad relativa que indique a cuál de los dos grupos es más fácil enseñarles.
4. Los datos siguientes corresponden al porcentaje de la meta lograda por tres emplea-
dos en el área de asistencia para niños con retraso mental en un complejo de la tele-
ton.
PATRICIA :88 68 89 92 73
JUAN JOSÉ :76 88 90 86 79
FRANCISCO :88 95 78 88 63
¿Cuál de los empleados es más constante?
5. El supervisor de servicio al ciudadano de un gran complejo hospitalario, revisa el
tiempo promedio en minutos para atender un paciente por emergencia en un día
cualesquiera. El supervisor considera tres médicos que atienden el área de emergen-
cia de manera permanente, y que además de un promedio mínimo, es de suma impor-
tancia la consistencia basada en la dispersión relativa. ¿Cuál de los tres médicos es el
mejor en la prestación de servicios?
94 CAPÍTULO 6
a) GC =
∑( X − X )4
− 3 ; datos agrupados en frecuencia simple
Ns x4
∑( xm − x )4
b) GC = − 3 ; datos agrupados en distribución de frecuencias
Nsx4
GC = Grado de Curtosis
X = Valor de la variable
xm = Marca de clase
Dónde: —
X = Media muestral
N = Tamaño de muestra o número total de observaciones
sx = Desviación estandar muestra;
Notas:
1. Si el grado de la Curtosis es mayor que cero, entonces la curva es de índice loptocúr-
tica;
2. Si el grado de la Curtosis es cero, entonces la curva es de índice mesocúrtico;
3. Si el grado de la Curtosis es menor que cero, entonces la curva es de índice platicúr-
tica;
Ejemplo
La siguiente distribución de frecuencias representa las calificaciones de 50 estudiantes de
un curso de Cirugía I, en la Universidad Católica de Honduras, UNICAH. Determinar el
índice de la curtosis y establecer el tipo de curtosis.
Clases f
01 - 20 2
21 - 40 3
41 - 60 7
61 - 80 25
81 - 100 13
Total 50
96 CAPÍTULO 6
Solución
—
Clases f Xm f Xm X m2 f X m2 (Xm − X )4
01 - 20 2 10.5 21 110.25 220.5 11007531.42
21 - 40 3 30.5 91.5 930.25 2790.75 1998717.338
41 - 60 7 50.5 353.5 2550.25 17851.75 95951.2576
61 - 80 25 70.5 1762.5 4970.25 124256.25 33.1776
81 - 100 13 90.5 1176.5 8190.25 106473.25 251763.0976
Total 35 3405 16751.25 251592.5 13353996.29
∑ f Xm 3405
X= = = 68.1
N 50
∑ FX m2 ∑ FX m ∑ FX m 251592.5 (3405)(3405)
S= − = − = 20.0571
n −1 n(n −1) 49 50 ( 49)
y Sx4 = 161835.0399
EJERCICIOS 6.6
1. Para las siguientes distribuciones de frecuencia, calcule la curtosis de cada una de las
gráficas, y dibuje el gráfico apoyado en su correspondiente histograma de frecuencias.
a) Clases f b) Clases f
10 - 15 12 0.25 - 3.75 10
16 - 21 13 3.76 - 7.26 15
22 - 27 17 7.27 - 10.77 20
28 - 33 14 10.78 - 14.28 14
34 - 39 14 14.29 - 17.79 9
Total 70 Total 68
2. Para los siguientes resultados, establezca el tipo de curtosis:
a) GC = 0.75 b) GC = 1.27 c) GC = –2.34 d) GC = 2.15
3. Los siguientes datos corresponden a las edades en años de los médicos que laboran
en el Hospital San Felipe de Tegucigalpa:
45, 24, 27, 36, 61, 54, 37, 29, 30, 30, 53, 55, 58, 57, 44, 63, 66, 67, 26, 28, 31, 40,
40, 49, 73, 74, 78, 26, 25, 38, 39, 43, 42, 32, 33, 57, 52, 51, 29, 27, 33, 41, 54, 60,
63, 56, 55, 25, 28, 35, 35, 43, 43, 49, 53, 53, 50, 47, 48, 39, 34, 57, 61, 64, 65, 72,
66, 67, 60, 26, 34, 38, 45, 45, 50, 53, 49, 39, 39, 35 y 42.
a) Construya la distribución de frecuencias adecuada;
b) Determine la curtosis para estos datos;
c) Dibuje el gráfico que corresponde, apoyado en el histograma de frecuencias.
Medidas de dispersión 97
Grafica No. 1
Gráfica No. 2
– –
X Me Mo Mo Me X
Asimetría negativa Asimetría positiva
En ésta gráfica se puede apreciar la ubicación de los valores de las medidas de tendencia
central, (media, mediana y moda), y el sesgo hacia a la izquierda (Asimetría negativa), y
el sesgo a la derecha (Asimetría positiva).
Gráfica No. 3
GRAFICA DE LA ASIMETRIA
El tercer gráfico es más evidente con respecto a la ubicación en la curva para los valores
de la media, mediana y moda.
1. ASF =
∑(x i − x) ; Datos no agrupados
ns3
3
2. ASF =
∑ f i xm − x
; Datos agrupados en distribución de frecuencias
ns3
Medidas de dispersión 99
x=
∑x i
=
384
= 38.4
n 10
∑(xi - x) 2 7.86
s= = = 0.9345;
n-1 9
Entonces: s3 = (0.9345)3 = 0.8161
Luego el Coeficiente de asimetría está dado por:
∑( x −x ) =
3
−0.63
ASF = i
= −0.00674
ns 3
(10)(0.9345)
100 CAPÍTULO 6
Solución inciso b)
Como ASF = –0.0674 < 0; La asimetría es negativa.
Ejemplo No. 2
La siguiente distribución de frecuencias representa los pacientes y número de cirugías
realizadas por rango de edad en el Hospital Mario Catarino Rivas de la Ciudad de San
Pedro Sula, durante el primer semestre de 2015.
Solución inciso a)
Como la media y desviación estándar se calculan por:
∑ xm5627
x= = = 36.54
n 154
∑ fxm2 ∑ fxm ∑ fxm 235736.5 ( 5627 )( 5627 )
s= − = − = 14.03352
n −1 n(n −1) 153 23562
s3 = (14.03352)3 = 2763.756988
∑( fi )( xm − x )
3
−33207.8149
Ahora, como ASF = = = − 0.078
ns 3 (154 )( 2763.756988 )
Solución b)
Como ASF = –0.078 < 0; entonces la asimetría es negativa
Ejemplo
Los siguientes datos representan el número de años trabajados para el Hospital San Felipe
de Tegucigalpa, por 12 enfermeras, seleccionadas al azar y entrevistadas sobre las condi-
ciones en que desarrollan sus actividades profesionales.
20, 15, 11, 16, 25, 17, 14, 13, 23, 28, 35, 13
a) Calcular el coeficiente de asimetría de Pearson
b) Qué tipo de asimetría presenta la distribución.
Solución inciso a)
Datos: 11, 13, 13, 14, 15, 16, 17, 20, 23, 25, 28, 35
3 (x − M e ) ; debemos calcular la media, la mediana y la desviación es-
Como ASP =
s
tándar muestral:
Solución inciso b)
Como ASP = 1.1 > 0; La asimetría es positiva.
EJERCICIOS 6.7
1. La siguiente distribución representa el número de pruebas diagnósticas sobre VIH
por rango de edad aplicada a 32 pacientes adultos, en un hospital privado de la Ciu-
dad de Tegucigalpa.
Tasas y estandarización
7
Contenido
7.1 Tasas
7.2 Tasas de estandarización
7.3 Método directo de estandarización de datos
7.4 Método indirecto de estandarización de datos
7.5 Uso de las tasas de estandarización
7.6 Aplicaciones adicionales
104 CAPÍTULO 7
Tasas y estandarización
Los datos demográficos y las estadísticas demográficas son cantidades con que se carac-
teriza o describe una población. Los datos demográficos incluyen información como el
tamaño de una población y su composición en lo que se refiere a género, raza y edad. Las
estadísticas demográficas describen la vida de la población: se refieren a nacimientos,
muertes, matrimonios, divorcios y casos de enfermedad. Los investigadores y profesiona-
les de la salud pública emplean ambas clases de datos para describir el estado de salud de
una población con el fin de pronosticar tendencias, elaborar proyectos y planificar servi-
cios básicos como vivienda y atención médica.
Las estadísticas demográficas también se emplean para comparar grupos. Por ejem-
plo, con el fin de evaluar tendencias de salud podríamos comparar el número de muertes
en un país en el año 1991 contra el número de muertes en el año 1992. Si por razones
naturales en el año 1991 se produjeron 2, 169, 518 decesos de personas y en el año 1992,
2, 175, 613; resultaría difícil interpretar el incremento observado, es posible que hubiere
menos muertes en 1991 por el simple hecho de que la base de población era menor ese
año, ya que mientras menor sea la población, esperaríamos ver un menor número de
muertes.
7.1 Tasas
En lugar de emplear datos brutos, se pueden utilizar las tasas con el objeto de hacer com-
paraciones más significativas entre grupos. Se define tasa como el número de casos de un
resultado particular de interés que ocurre en un período, dividido entre el tamaño de la
población en dicho período. Por ejemplo, podríamos interesarnos en la cantidad de infec-
ciones de oído diagnosticadas en un grupo determinado de estudiantes de la Universidad
Católica de Honduras durante un período de dos meses. Aunque a menudo se les emplea
indistintamente, el término tasa y proporción, no son sinónimos. Una proporción es co-
ciente en el cual los individuos representados en el numerador deben incluirse también en
el denominador, como la fracción de mujeres de alrededor de 60 años de edad que han
sufrido un ataque al corazón, carece de unidades. Una tasa incorpora unidades de medi-
ción e intrínsecamente depende de una medida de tiempo.
En lugar de comparar la cantidad total de muertes en 1991 y 1992, podríamos com-
parar las tasas de mortalidad de esos años. La tasa de mortalidad es el número de muertes
ocurridas en cierto período, como lo vimos en la sección 2.7 del presente texto. Si calculá-
ramos las tasas de mortalidad en Estados Unidos, encontraríamos que dicha tasa en 1991
es de 860.3 por cada 100,000 habitantes y que la tasa de mortalidad en 1992 es 852.9 por
cada 100,000 habitantes. Aunque en 1992 murió una cantidad mayor de gente, la tasa de
mortalidad en realidad disminuyó.
Una de las tasas de mortalidad más común registrada para una población es la tasa
de mortalidad infantil. Esta cantidad se define como el número de muertes durante un
año civil de niños menores de un año de edad, dividida entre el número de niños nacidos
vivos durante ese año. La tasa de mortalidad infantil constituye una de las mediciones
más importantes del estado de salud de una nación. Aunque las cantidades de nacimien-
tos y muertes varían considerablemente de un país a otro, resulta ilustrativo comparar las
tasas de mortalidad. La tabla 7.1 muestra las tasas de mortalidad infantil de los países
seleccionados.
Tasas y estandarización 105
Las tasas de mortalidad que hasta ahora hemos analizado han sido tasas brutas. Una
tasa bruta es un solo número calculado como medida de resumen para una población
entera, e ignora diferencias de edad, género, raza y otras características. Factores como la
edad, sexo y raza a menudo tienen un efecto significativo en las tasas que describen las
estadísticas de esperanza de vida. Por ejemplo, si consideramos las tasas de mortalidad en
las siguientes tablas, en las cuales la tabla 7.2 muestra las muertes totales y la tabla 7.3
muestra la tasa de mortalidad para el año 1992 en Estados Unidos, y que aparte de las
tasas brutas calculado para ese mismo año, ahora estaremos presentando tasas calculadas
para varios subgrupos de individuos.
Tabla 7.2
Total de muertes por edad, raza y sexo EE. UU. 1992
Todas las razas Caucásicos
Edad Ambos Sexos Varón Mujer Ambos Sexos Varón Mujer
Todas las edades 2175613 1122336 1053277 1873781 956957 916824
Menor de un año 34628 19545 15083 22164 12625 9539
1-4 años 6764 3809 2955 4685 2690 1995
5-9 años 3739 2231 1508 2690 1605 1085
Continúa
106 CAPÍTULO 7
Tabla 7.3
Total de muertes por edad, raza y sexo EE. UU. 1992
Todas las razas Caucásicos
Edad Ambos Sexos Varón Mujer Ambos Sexos Varón Mujer
Todas las edades 852.9 901.6 806.5 880.0 917.1 844.3
Menor de un año 865.7 956.6 770.8 701.8 780.9 618.7
1-4 años 43.6 48.0 39.0 38.1 42.6 33.3
5-9 años 20.4 23.7 16.8 18.3 21.3 15.2
10-14 años 24.6 30.7 18.2 22.8 28.2 17.2
15-19 años 84.3 122.4 44.0 75.6 106.0 43.3
20-24 años 105.7 159.4 50.1 91.0 135.4 44.3
25-29 años 120.5 178.0 62.5 103.2 153.3 51.9
30-34 años 153.5 224.0 83.3 132.4 195.8 68.1
35-39 años 199.5 282.8 117.2 171.2 245.5 96.3
40-44 años 261.6 359.1 166.5 226.3 312.2 140.6
45-49 años 368.0 485.7 254.6 328.6 432.5 226.5
50-54 años 568.2 728.1 417.1 518.6 663.4 379.3
55-59 años 902.1 1156.5 668.2 835.1 1071.5 613.4
60-64 años 1402.2 1815.2 1038.2 1334.9 1729.7 979.7
65-69 años 2114.8 2775.4 1577.7 2042.6 2688.5 1511.0
Tasas y estandarización 107
Examinando las tablas 7.2 y 7.3, vemos que las mujeres tienden a tasas de mortalidad
menores que los varones. Las tasas que se calculan dentro de los subgrupos relativamente
pequeños y bien definidos se denominan “tasas específicas”.
Tabla 7.4
Edad Empleado Fuera de la fuerza laboral
Población Porcentaje Población Porcentaje
17 - 44 67987 68,5 20760 36,6
45 - 64 27592 27,9 15108 26,6
65+ 3338 3,4 20910 36,8
TOTAL 98917 100 56778 100
Tabla 7.5
Edad Poblacion Daños Tasa por cada 1000
17 - 44 94930 441 4,65
45 - 64 43857 308 7,02
65+ 24370 198 8,12
163157 947 5,8
108 CAPÍTULO 7
Observe que la tabla bruta de daños por lesiones a algún miembro del organismo ex-
puesto a riesgo en la totalidad de la población estudiada es en realidad un promedio
ponderado de las tasas específicas por edad: en particular,
5.80 =
(94930)( 4.65) +( 43857 )(7.02 ) + ( 24370)(8.12 )
163157
Las tasas específicas por edad se ponderan por el número de individuos de cada gru-
po. Observe asimismo que la tasa de daños se incrementa con la edad. La edad es un
factor de confusión en relación entre daños a un órgano del cuerpo y el estado laboral, y
se relaciona de forma independiente con cada una de estas cantidades. Como consecuen-
cia, no podemos estar seguros de sí una tasa más alta de daños entre individuos que no
pertenecen a la fuerza laboral es resultado de alguna característica inherente de los miem-
bros de éste grupo, o si se trata sencillamente de la influencia de la edad.
Con el objeto de hacer una comparación más precisa entre las dos subpoblaciones,
deberíamos considerar las tasas de daño específicas por edad en lugar de las tasas brutas
en conjunto.
En la siguiente tabla presentamos la información de acopio en el párrafo anterior.
Tabla 7.6
Empleado Fuera de la fuerza laboral
Edad Tasa por Tasa por
Poblacion Daños Cada 1000 Poblacion Daños Cada 1000
17 - 44 67987 346 5,09 20760 80 3,85
45 - 64 27592 179 6,49 15108 117 7,74
65+ 3338 27 8,09 20910 171 8
Total 98917 552 5,58 56778 368 18
Resulta difícil derivar una conclusión sucinta sobre la base de estos dos conjuntos de
tasas. En los individuos sobre los 45 años de edad la tasa de daños es superior en quienes
no pertenecen a la fuerza laboral respecto de los que se encuentran empleados; los que se
encuentran entre los 17 y 44 años, la tasa es mucho más baja en personas que no pertene-
cen a la fuerza laboral. Comparándolas, las tasas brutas de daños de las dos subpoblacio-
nes nos brindan un cuadro incompleto de la verdadera situación.
Aunque las tasas específicas por subgrupo proporcionan una comparación más exac-
ta entre poblaciones que las tasas brutas si tuviéramos muchos subgrupos, podríamos
terminar con una cantidad abrumadora de tasas por comparar. Sería conveniente reunir
el caso completo con un solo número de cada subpoblación, un número que corrija las
diferencias en la estructura de estas composiciones. En la práctica, hay dos formas de
calcular dicho resumen.
La primera se conoce como el método directo de estandarización; la segunda se de-
nomina método indirecto de estandarización. Ambas estrategias se enfocan en los dos
componentes que figuran en el cálculo de una tasa bruta. La composición de la población
y sus tasas específicas por subgrupo e intentan resolver el problema de la confusión man-
teniendo constante en las poblaciones uno de estos componentes.
Tabla 7.7
Total Empleados Desempleados
(2) Tasa por (3) Daños (4) Tasa por (5) Daños
Edad (1) Población cada 1000 esperados cada 1000 esperados
17 - 44 94930 5,09 483,2 3,85 365,5
45 - 64 43857 6,49 284,6 7,74 339,5
65+ 24370 8,09 197,2 8,18 199,3
Total 163157 965 904,3
El cálculo de los daños esperados para los individuos que tienen un empleo se obtu-
vieron al multiplicar la columna (1) por la columna (2) y dividiendo entre 1000, y las
cantidades de daños esperados para los desempleados o fuera de la fuerza laboral se ob-
tienen al multiplicar la columna (1) por la columna (4) y dividiendo entre 1000.
Después, la tasa de daños ajustada por edad de cada grupo se calcula dividiendo su
número total esperado de daños entre la población total estándar.
965.0
Empleados: = 5.91 por cada 1000
163157
904.3
Desempleados: = 5.54 por cada 1000
163157
Estas tasas ajustadas por edad constituyen las tasas de daños que se aplicarían si ambos
grupos de individuos, los que trabajan y los que no, tuvieran la misma distribución de
edades que la de la población estudiada. Después de controlar los efectos de la edad, la
tasa de daños ajustada de individuos que laboran es mayor que la tasa de individuos des-
empleados. Esto es contrario a lo que observamos cuando vimos las tasas brutas, lo cual
implica que estas tasas brutas de hecho recibían la influencia de la estructura de edad de
los grupos subyacentes.
Observe que la elección de una distribución estándar por edad diferente (columna
(1)) de la tabla 7.7, nos habría conducido a diferentes tasas ajustadas de daño. No obstan-
te, esto no tiene importancia, pues una tasa ajustada carece de significado en sí misma. Se
trata solo de una elaboración calculada sobre la base de una distribución estándar hipoté-
tica; a diferencia de una tasa bruta o específica, no refleja la verdadera tasa de daños de
una población. Las tasas ajustadas poseen significado solo cuando comparamos dos o
más grupos, y se ha probado que la elección de un modelo por lo general no afecta las
tendencias entre grupos. En general, su composición no debería desviarse radicalmente
de las de los grupos comparados. Si eligiéramos una distribución estándar por edades ra-
zonable pero diferente para los datos de daños en el presente problema, no debería cam-
biar drásticamente, aunque las tasas mismas si lo hicieran los que trabajan deberían aun
tener una tasa ajustada de daños ligeramente más alta.
Tabla 7.8
Total Empleados Desempleados
Edad (1) Tasa por (2) (3) Daños (4) (5) Daños
cada 1000 Población esperados Población esperados
17 - 44 4.65 67987 316.1 20760 96.5
45 - 64 7.02 27592 193.7 15108 106.1
65+ 8.12 3338 27.1 20910 169.8
Total 5.8 98917 536.9 56778 372.4
Las cantidades esperadas de daños entre los que laboran se calculan al multiplicar la
columna (1) por la columna (2) y dividiendo entre 1000; los daños esperados para los que no
trabajan se obtienen multiplicando la columna (1) por la columna (4) dividiendo entre 1000.
En seguida dividimos el número de daños observados en cada grupo de empleados
entre el número total de daños esperados. La cantidad que resulta se denomina “razón de
morbilidad estandarizada”. Si los datos se refieren a las muertes en lugar de los daños, al
dividir el número de muertes entre el número esperado obtendríamos la razón de morta-
lidad estandarizada.
552
Empleados: = 1.03 = 103%
536.9
368
Desempleados: = 0.99 = 99%
372.4
Estas razones de morbilidad estandarizadas indican que el grupo de individuos actual-
mente empleados tiene una tasa de daños del 3% más que la población estudiada en con-
junto, mientras que el grupo desempleado tiene una tasa de daños 1% más baja que la de
la población entera. Recuerde que la población total estudiada también incluye el grupo
de individuos que en la actualidad están desempleados.
La aplicación del método indirecto a menudo concluye con una composición de las
razones estandarizadas. No obstante, podríamos continuar y calcular las tasas de daños
ajustadas reales de cada grupo. Estas tasas se obtienen al multiplicar la tasa de daños
bruta para el total de la población estudiada por las razones estandarizadas adecuadas.
5.80
Individuos empleados: x1.03 = 5.97 por cada 1000.
100
5.80
Individuos desempleados: x 0.99 = 5.74 por cada 1000.
100
Al eliminar el efecto de la edad, el grupo de individuos empleados parece tener de nuevo
una tasa ajustada de daños un poco más alta que los que no pertenecen a la fuerza laboral.
Aunque las tasas mismas son diferentes, se trata de la misma conclusión a la que se llegó
al aplicarse el método directo de estandarización.
Tabla 7.9
Grupo de Tasa de mortalidad por cada 1000 años persona
fumadores Canada Gran Bretaña Estados Unidos
No fumadores 20,2 11,3 13,5
Cigarrillos 20,5 14,1 13,5
Puros 35,5 20,7 17,4
Los estudios llevados a cabo en Canadá, Gran Bretaña y Estados Unidos parecen
comunicar el mismo mensaje; los individuos que fuman puros debería de abandonar el
hábito, o, cuando menos, cambiar a cigarrillos. No obstante, no olvide que todos estos
fueron estudios de observación.
En un estudio de observación, el investigador no tiene control sobre la observación de
un tratamiento u orientación, más bien los individuos en estudio determinan su propia
orientación y el investigador sencillamente observa lo que sucede con ellos. Es posible que
los grupos difieran sustancialmente en características distintas de la clase de fumadores.
Por ejemplo, si consideramos las edades medias de los diferentes grupos de fumado-
res, encontraríamos que difieren considerablemente. Para ilustrarlo, las edades medias de
los tres grupos en cada uno de los estudios se muestran a continuación.
Tabla 7.10
Grupo de Edad media (en años)
fumadores Canada Gran Bretaña Estados Unidos
No fumadores 54,9 49,1 57
Cigarrillos 50,5 49,8 53,2
Puros 65,9 55,7 59,7
En general, los fumadores de puros tienden a ser mayores que los no fumadores de
cigarrillos.
Como consecuencia de las diferencias de edad, las tasas de mortalidad se estandarizaron
al separar tres diferentes subclases; las categorías por edad se eligieron de manera que cayera
aproximadamente la misma cantidad de individuos dentro de cada clase. Si el grupo de no
fumadores se elige de manera que proporcione la distribución de edad estándar, se obtienen
las tasas de mortalidad ajustadas mediante el método directo que figura en la siguiente tabla.
Tabla 7.11
Grupo de Tasa de mortalidad por cada 1000 años-persona
fumadores Canada Gran Bretaña Estados Unidos
No fumadores 20,2 11,3 13,5
Cigarrillos 28,3 12,8 17,7
Puros 21,2 12 14,2
112 CAPÍTULO 7
Tabla 7.12
Nacidos Muertes Tasa por
Estado vivos infantiles cada 1000
Colorado 53808 527 9.8
Luisiana 73967 872 11.8
Los datos brutos muestran que la tasa de mortalidad infantil de Colorado es 9.8 por
cada 100 nacidos vivos, mientras que la Luisiana tiene mayor probabilidad de morir antes
de alcanzar un año de edad que los nacidos en Colorado.
Antes de informar este resultado, podríamos estudiar nuestra sospecha de que la tasa
de un factor de confusión en relación entre el Estado y la tasa de mortalidad infantil. Por
tanto, primero exploremos las distribuciones raciales subyacentes en las dos poblaciones.
Tabla 7.13
Colorado Louisiana
Raza
Nacidos vivos Porcentaje Nacidos vivos Porcentaje
Afroamericana 3166 5.9 29670 40.1
Caucásica 48805 90.7 42749 57.8
Otra 1837 3.4 1548 2.1
Total 53808 100 73967 100
Las frecuencias relativas indican que los estados difieren en su estructura racial. En
Colorado, la mayoría de los nacidos vivos son niños de raza caucásica; en Luisiana, un
porcentaje mayor de niños son afroamericanos.
En seguida analizamos la tasa de mortalidad específica por raza en la población ente-
ra de Estados Unidos en 1987.
Tasas y estandarización 113
Tabla 7.14
Nacidos Muertes Tasas por
Raza vivos infantiles cada 1000
Afroamericana 641567 11461 17,9
Caucásica 2992488 25810 8,6
Otra 175339 1137 6,5
Total 3809394 38408 10,1
10.1 =
(641567 )(17.9 ) + ( 2992488)(8.6 ) + (175339)(6.5)
3809394
Tabla 7.15
Colorado Luisiana
Raza Nacidos Muertes Tasa por Nacidos Muertes Tasa por
vivos infantiles cada 1000 vivos infantiles cada 1000
Afroamericana 3166 52 16,4 29670 525 17,7
Caucásica 48805 469 9,6 42749 344 8
Otra 1837 6 3,3 1548 3 1,9
Total 53808 527 9,8 73967 11,8
Entre los niños afroamericanos, la tasa de mortalidad infantil es más alta en Luisiana
que en Colorado; no obstante, entre los niños caucásicos y los de otros grupos raciales, la
tasa de mortalidad infantil es más alta en Colorado. Aunque las tasas específicas por raza
proporcionan la información más detallada acerca de estas dos poblaciones, sería conve-
niente resumir toda la situación con un par de números una para cada estado que ajuste
las diferencias en la composición racial.
Con el fin de aplicar el método directo de estandarización elegimos primero una
distribución estándar por raza; en este ejemplo, utilizamos todos los nacidos vivos en Es-
tados Unidos en 1987. En seguida calculamos el número de muertes infantiles que ha-
brían ocurrido en cada uno de los estados si ambos poseyeran esta composición racial
estándar mientras conservaran sus propias tasas específicas de mortalidad por raza.
114 CAPÍTULO 7
Tabla 7.16
EUA Colorado Luisiana
Nacidos Tasa por Muertes Tasa por Muertes
Raza vivos cada 1000 esperadas cada 1000 esperadas
Afroamericanos 641567 16,4 10521,7 17,7 11355,7
Caucásicos 2992488 9,6 28727,9 8 23939,9
Otras 175339 3,3 578,6 1,9 333,1
Total 3809394 39828,2 35628,7
Estas tasas ajustadas por raza son las tasas de mortalidad infantil que se aplicarían a los
nacidos vivos tanto en Colorado como en Luisiana tuvieran la misma distribución que
Estados Unidos como un todo. Aunque la tasa de mortalidad infantil bruta para Luisiana
es más alta que la tasa bruta para Colorado, la tasa de mortalidad infantil ajustada en
Colorado es mayor después de controlar el efecto de la raza.
Se puede concluir que el uso del método de estandarización directa nos llevó a verifi-
car que ambos estados los niños afroamericanos tienen la tasa de mortalidad infantil más
alta, seguidos por los niños caucásicos y en seguida por la de otros grupos raciales.
Tabla 7.17
Tasa por Nacidos Muertes Nacidos Muertes
Raza cada 1000 vivos esperadas vivos esperadas
Afroamericanos 17,9 3166 56,7 29670 531,1
Caucásicos 8,6 48805 419,7 42749 367,6
Otras 6,5 1837 11,9 1548 10,1
Total 10,1 53808 488,3 73967 908,8
Las cantidades esperadas de muerte se calculan al multiplicar las tasas especificas por
raza en Estados Unidos por las cantidades de nacidos vivos en cada estado y dividiéndo-
Tasas y estandarización 115
las entre 1000. La razón de mortalidad estandarizada para cada estado se obtiene al divi-
dir la cantidad de muertes de niños observadas entre el total de muertes esperadas.
527
Colorado: = 1.08 = 108%
488.3
827
Luisiana: = 0.96 = 96%
908.8
Estas razones de mortalidad estandarizadas indican que Colorado tienen una tasa de
mortalidad infantil 8% más alta que Estados Unidos en conjunto, mientras Luisiana tie-
nen una tasa de mortalidad infantil de 4% más baja.
Recuerde que para todos los estados la línea de tendencia es de 100%, y por eso Co-
lorado refleja un 8% arriba de la línea de tendencia, mientras que Luisiana un 4% por de-
bajo de la línea de tendencia.
Por último, calculamos la tasa de mortalidad infantil ajustada por raza para cada es-
tado multiplicando su razón de mortalidad estandarizada por la tasa bruta de mortalidad
infantil en la población modelo, 10.1 por cada 1000 nacidos vivos.
10.1
Colorado: x1.08 = 10.9 por cada 1000
1000
10.1
Luisiana: x0.96 = 9.7 por cada 1000
1000
Tras controlar los efectos de la raza, Colorado tiene de nuevo una tasa de mortalidad infan-
til ajustada más alta que Luisiana. Aunque las tasas mismas difieren, se trata de la misma
conclusión a la que llegamos cuando aplicamos el método de estandarización directo.
EJERCICIOS 7.0
1. ¿Qué son los datos demográficos y las estadísticas demográficas?
2. Los datos demográficos y las estadísticas demográficas, ¿Cómo se les puede emplear
para describir el estado de salud de una población?
3. ¿Cuál es la diferencia entre tasa y proporción?
4. ¿Qué es un factor de confusión?
5. ¿Cómo difiere el método de estandarización directo del indirecto?
6. ¿Cómo influye la elección de una distribución de una población modelo, en los resul-
tados del proceso de estandarización?
7. ¿En qué circunstancias se deberían utilizar las tasas brutas, las específicas y las ajus-
tadas?
8. En 1992 se registraron los datos siguientes en el Estado de Massachusetts.
Cantidad
Población 6060943
Nacidos vivos 87202
Muertes
Total 53804
Menores de un año 569
1940 1986
Edad
Población (miles) Muertes Población (miles) Muertes
0-4 10541 494 18152 666
5 - 14 22431 667 33860 1165
15 - 24 23922 1287 39021 2115
25 - 34 21339 3696 42779 5604
35 - 44 18333 11198 33070 14991
45 - 54 15512 26180 22815 37800
55 - 64 10572 39071 22232 98805
65 - 74 6377 44328 17332 146803
75+ 2643 31279 11836 161381
Total 131670 158200 241097 469330
a) Calcule las tasas brutas de mortalidad por cáncer de 1940 y 1986, y comparándolas;
b) Calcule la proporción total de la población de 1940 y 1986, en cada grupo de eda-
des. Describa de qué manera difieren dos poblaciones con respecto a su composi-
ción por edades;
c) Calcule las tasas específicas por edades de mortalidad por cáncer de cada pobla-
ción. ¿Existe alguna relación entre las tasas de mortalidad y edad?
d) Para necesario controlar el efecto de la edad cuando se comparan las tasas de
mortalidad por cáncer en ambas poblaciones. ¿Por qué?
e) Con la población de Estados Unidos como distribución modelo, aplique el méto-
do de estandarización directo. ¿Cuáles son las tasas de mortalidad por cáncer
ajustadas por edades de 1940 y 1986?
f) Con las tasas especificas por edades de mortalidad por cáncer de 1940 como mo-
delo, aplique el método de estandarización indirecto para calcular las razones de
mortalidad estándar de 1940 y 1986.
CAPÍTULO
Tablas de vida
8
Contenido
Tablas de vida
Resulta prácticamente imposible predecir el tiempo que vivirá cierta persona, y mucho
más predecir lo que le resta de vida a cada individuo en una población de millones de
habitantes. A pesar de este hecho, corresponde a los planificadores de políticas evaluar y
describir la salud y longevidad de una nación entera. Durante muchos años las tablas de
vida se han utilizado como medio de resumir el estado de salud de un grupo de individuos.
Tal como en el caso de las técnicas que hemos estudiado en los capítulos anteriores, las
tablas demográficas son de naturaleza descriptiva, incluyen gran variedad de aplicacio-
nes; y un tipo de ellas son las tablas de vida, las cuales identifican las tasas de mortalidad
que experimenta una población particular, para establecer comparaciones internaciona-
les, para calcular primas de seguros y anualidades, y predecir la supervivencia. También
se les ha empleado, inútilmente, en el debate respecto a la existencia de un límite biológi-
co de la vida humana.
Al observar un conjunto ficticio de individuos o cohorte, normalmente un grupo de
100,000 personas, desde el nacimiento hasta que el último individuo del conjunto haya
muerto, una tabla de vida describe la experiencia de mortalidad del grupo en un periodo
específico de tiempo.
La siguiente tabla muestra un modelo de la tabla de vida abreviada de la población
total de Estados Unidos en 1992.
Tabla 8.1
Proporción de Tiempo de
Intervalo individuos que vida promedio
de edad mueren De cada 100,000 nacidos vivos Población estacionaria restante
Proporción
de personas Número
vivas al inicio Número de promedio de
Periodo de del intervalo Número de individuos En este y todos años de vida
vida entre dos de edad individuos vivos que mueren los intervalos restantes al
edades exactas que mueren al comienzo durante el de edad comienzo del
establecidas en durante el del intervalo de intervalo de En el intervalo subsecuentes intervalo de
años (1) intervalo (2) edad (3) edad (4) de edad (5) (6) edad (7)
xax+n nqx Lx ndx nLx Tx ex
00 - 01 0.00851 100000 851 99275 7577757 75.8
01 - 05 0.00172 99149 171 396195 7478482 75.4
05 - 10 0.00102 98978 101 494615 7082287 71.6
10 - 15 0.00121 98877 120 494192 6587672 66.6
15 - 20 0.00418 98757 413 492848 6093520 61.7
20 - 25 0.00528 98344 519 490448 5600672 56.9
25 - 30 0.00601 97825 588 487654 5110224 52.2
30 - 35 0.00765 97237 744 484369 4622570 47.5
35 - 40 0.01001 96493 966 480187 4138201 42.9
40 - 45 0.01305 95527 1247 474740 3658014 38.3
45 - 50 0.01822 94280 1718 467420 3183274 33.8
50 - 55 0.02799 92562 2591 456739 2715854 29.3
55 - 60 0.04421 89971 3978 440481 2259115 25.1
Tablas de vida 119
Columna 2
La segunda columna de la tabla 8.1 representada por nqx enlista la proporción de indivi-
duos vivos al comienzo del intervalo de edad xax + n que mueren en algún momento du-
rante el intervalo. A esta cantidad también se le denomina función de riesgo; es posible
calcularla a partir de las tasas específicas de mortalidad para edades de la población de
Estados Unidos en 1992. Por ejemplo:
1q0 = Proporción de individuos vivos al nacer que mueren antes de su primer año de
edad.
Si recordamos de la tabla 7.3 la tasa de mortalidad global para todas las razas en Es-
tados Unidos en 1992 menores de un año era de 865.7 por cada 100,000 habitantes, por
tanto tenemos que: 1q0 = 865.7/100000 = 0.008657 ≈ 0.00851; para el manejo de cinco
posiciones, después del punto decimal.
:: ∞ q85 = proporción de individuos vivos en su aniversario número 85, quienes mueren
durante el periodo posterior a su aniversario número 85 = 1.00000; pues la
muerte es inevitable.
El resto de datos en la columna 2, no necesariamente fácil de calcular, pero de alguna
manera apoyado en algunos métodos gráficos o determinando en forma de cocientes la
tasa global de mortalidad por cada 100,000 personas, también puede ser determinado.
Columnas 3 y 4
La tercera columna de la tabla de vida Lx muestra el número de individuos de entre la
cantidad original de 100,000 que permanecer vivos en su aniversario x. Observe que los
encabezados de la columna con un solo subíndice se refieren a las condiciones al comien-
zo del intervalo de edad, y los que tienen dos subíndices especifican condiciones dentro
del intervalo. De aquí que la cuarta columna ndx muestra una lista del número tomado de
los Lx individuos vivos al principio del intervalo x a x + n que mueren en algún momento
durante ese intervalo. Los cálculos de la tercera y cuarta columna son independientes;
también dependen de la columna 2. Para ilustrar este punto L0 es la cantidad de indivi-
duos nacidos dentro del conjunto el cual es 100,000. La cantidad de individuos que mue-
120 CAPÍTULO 8
Columna 5
La columna 5 de la tabla de vida representada por nLx se denomina población estaciona-
ria dentro de un intervalo. Los demógrafos utilizan este concepto que puede interpretarse
de la siguiente manera. Supongamos que nace cada año un conjunto de 100,000 indivi-
duos. Además, supongamos también que la proporción de individuos que muere dentro
del intervalo de edad x a x + n está dado por nqx en la columna 2. Como resultado las
tasas específicas de mortalidad de edades de 1992 aplican a cada grupo. Si no ocurren
casos de migración y permitimos que una cantidad suficiente de años, alcanzaríamos una
población estacionaria o sea el número de personas vivas en cualquier grupo por edades,
jamás cambiaría. Tan pronto como un individuo abandona un intervalo ya sea porque
muere o porque aumenta su edad y por consiguiente entra en el intervalo subsecuente al-
guien del grupo de edades precedente ocuparía su lugar. La población estacionaría nLx
tiene asimismo otra interpretación. Se puede considerar como el tiempo total de años vi-
vidos durante el intervalo de edades x a x + n, por los Lx individuos al principio del inter-
valo. Considere, por ejemplo, el intervalo de edades 1 – 5. Existen L1 = 99149 individuos
vivos al comienzo de este intervalo. De estos 99149 individuos, L5 = 98978 permanecen
vivos en su quinto aniversario. Puesto que cada uno de estos 98978 individuos sobrevive
el periodo entero de 4 años, contribuye 98978 × 4 = 395912 años-persona el total del
tiempo vivido durante el intervalo. También existen 4d1 = 171 personas que mueren en
algún momento durante el intervalo. Cada uno de estos individuos contribuye con alguna
cantidad de tiempo-persona antes de morir, una cantidad mayor que cero, pero menor de
cuatro años. Si sumamos los años-persona contribuye por cada uno de los individuos que
mueren durante el intervalo, información que no figura en la tabla de vida condensada y
se suma a los 395912 años-persona que han vivido los individuos que sobreviven los cua-
tro años completos, alcanzando un total de 4d1 = 396115 años vividos durante el interva-
lo de edades 1 – 5.
Columna 6
La sexta columna de la tabla de vida Tx muestra la población total estacionaria en el inter-
valo de edades x a x + n, y todos los intervalos subsiguientes. En otras palabras, se trata
del número total de años-persona vividos más allá del aniversario de vida número x por
los Lx individuos vivos en la celebración de dichos cumpleaños. Esta columna se obtiene
sumando la columna 5 de abajo hacia arriba; por ejemplo:
Tablas de vida 121
Columna 7
Por último, la columna siete de la tabla de vida ex es el número promedio de años de vida
restantes para un individuo que se encuentra vivo a la edad x años. Esta columna se calcu-
la dividiendo el número total de años-persona vividos más allá del cumpleaños número x,
Tx, entre la cantidad de individuos que sobreviven a la edad de x o más allá; si se divide
entreTx se elimina la dependencia del tamaño del grupo original.
e0 = número promedio de años de vida que restan a partir del nacimiento
T0 7577757
= = 75.8
L0 100000
e1 = número promedio de años de vida que restan después del primer aniversario de vida
T1 7478482
= = 75.4
L1 99148
Si e1 es mayor que e0 que es el caso de Estados Unidos como ocurrió en 1976 que
existía una tasa de mortalidad infantil alta. Esto implica que, si un niño es suficientemen-
te fuerte como para sobrevivir el primer año de vida, el promedio de vida restante en su
primer cumpleaños es mayor que el del momento en que nació.
La probabilidad de que una persona de 50 años de edad alcance vivir hasta su aniver-
sario número 65 es la cantidad de individuos vivos para ese aniversario dividida entre el
número de individuos vivos para su aniversario de vida número 50, es decir:
L65 80145
= =0.86585
L50 92562
O sea, aproximadamente 86.6%. Observe que la probabilidad de supervivencia hasta
la edad de 65 años se incrementa si la persona ya sobrevivió los primeros 50 años. Este
incremento de probabilidad de 80.1% al 86.6% resulta importante para quienes calculan
primas de seguros.
El promedio de esperanza de vida restante en particular e0 que a menudo se utiliza
para describir el estado de salud de una población ilustra otra aplicación de las tablas de
vida.
A base de información, les presentamos los promedios de esperanza de vida al nacer
para algunos de los países que fueron seleccionados y estudiados sus aspectos demográfi-
cos para el año 1992, y estos se presentan en la siguiente tabla.
122 CAPÍTULO 8
Tabla 8.2
Referente a la tercera columna, se puede apreciar que en esta tabla las mujeres tienen
una mayor esperanza de vida, y por situaciones bien especiales, solo hay unos pocos paí-
ses en el mundo en los cuales sucede lo contrario.
Este tipo de tablas además de su empleo como medida de resumen poblacional, el
promedio de esperanza de vida restante se utiliza como fundamento para el cálculo de
primas de seguros de vida.
Por último, para terminar la presentación de éste capítulo presentaremos la siguiente
tabla sobre la esperanza de vida al nacer por raza y sexo, para los Estados Unidos en los
años de 1960, 1950, 1960, y 1970 a 1992.
Tabla 8.3
Esperanza de vida al nacer por raza y sexo, Estados Unidos
Año Todas las razas Caucásica Total Afroamericana
Ambos Ambos Ambos Ambos
sexos Varón Mujer sexos Varón Mujer sexos Varón Mujer sexos Varón Mujer
1992 75.80 72.30 79.10 76.50 73.20 79.80 71.80 67.70 75.70 69.60 65.00 73.90
1991 75.50 72.00 78.90 76.30 72.90 79.60 71.50 67.30 75.50 69.30 64.60 73.80
1990 75.40 71.80 78.80 76.10 72.70 79.40 71.20 67.00 75.20 69.10 64.50 73.60
1989 75.10 71.70 78.50 75.90 72.50 79.20 70.90 66.70 74.90 68.80 64.30 73.30
1988 74.90 71.40 78.30 75.60 72.20 78.90 70.80 66.70 74.80 68.90 64.40 73.20
Tablas de vida 123
1987 74.90 71.40 78.30 75.60 72.10 78.90 71.00 66.90 75.00 69.10 64.70 73.40
1986 74.70 71.20 78.20 75.40 71.90 78.80 70.90 66.80 74.90 69.10 64.80 73.40
1985 74.70 71.10 78.20 75.30 71.80 78.70 71.00 67.00 74.80 69.30 65.00 73.40
1984 74.70 71.10 78.20 75.30 71.80 78.70 71.10 67.20 74.90 69.50 65.30 73.60
1983 74.60 71.00 78.10 75.20 71.60 78.70 70.90 67.00 74.70 69.40 65.20 73.50
1982 74.50 70.80 78.10 75.10 71.50 78.70 70.90 66.80 74.90 69.40 65.10 73.60
1981 74.10 70.40 77.80 74.80 71.10 78.40 70.30 66.20 74.40 68.90 64.50 73.20
1980 73.70 70.00 77.40 74.40 70.70 78.10 69.50 65.30 73.60 68.10 63.80 72.50
1979 73.90 70.00 77.80 74.60 70.80 78.40 69.80 65.40 74.10 68.50 64.00 72.90
1978 73.50 69.60 77.30 74.10 70.40 78.00 69.30 65.00 73.50 68.10 63.70 72.40
1977 73.30 69.50 77.20 74.00 70.20 77.90 68.90 64.70 73.20 67.70 63.40 72.00
1976 72.20 69.10 76.80 73.60 69.90 77.50 68.40 64.20 72.70 67.20 62.90 71.60
1975 72.60 68.80 76.60 73.40 69.50 77.30 68.00 63.70 72.40 66.80 62.40 71.30
1974 72.00 68.20 75.90 72.80 69.00 76.70 67.10 62.90 71.30 66.00 61.70 70.30
1973 71.40 67.60 75.30 72.20 68.50 76.10 66.10 62.00 70.30 65.00 60.90 69.30
1972 71.20 67.40 75.10 72.00 68.30 75.90 65.70 61.50 70.10 64.70 60.40 69.10
1971 71.10 67.40 75.00 72.00 68.30 75.80 65.60 61.60 69.80 64.60 60.50 68.90
1970 70.80 67.10 74.70 71.70 68.00 75.60 65.30 61.30 69.40 64.10 60.00 68.30
1960 69.70 66.60 73.10 70.60 67.40 74.10 63.60 61.10 66.30
1950 68.20 65.60 71.10 69.10 66.50 72.20 60.80 59.10 62.90
1940 62.90 60.80 65.20 64.20 62.10 66.60 53.10 51.50 54.90
Muchas son las razones que nos obligan al uso de tablas de vida ya que sus utilidades
no pueden ser imprescindibles, inclusive pueden utilizarse para cuantificar la mortalidad
prematura, los progresos de supervivencia y con mucha certeza las demás situaciones
vinculantes a los hechos vitales de los seres humanos.
EJERCICIOS 8.0
1. Describa dos aplicaciones prácticas de la tabla de vida.
2. ¿Qué es una función de riesgo?
3. Abajo aparece una lista de valores seleccionados de Lx , el número de individuos vivos
a los x años de edad, tomados de las tablas de vida de mujeres de raza caucásica en la
población de Estados Unidos de 1909 a 1911, y de 1969 a 1971.
Introducción a la
probabilidad 9
Contenido
Introducción a la probabilidad
Para la mayoría de la gente, “probabilidad” es un término vago utilizado en el lenguaje
para indicar la posibilidad de la ocurrencia de un suceso futuro. Esta interpretación prác-
tica del término puede considerarse aceptable, no obstante, se pretende lograr una com-
prensión más precisa del contexto de su aplicación, de cómo se mide y de qué manera se
utiliza la probabilidad para hacer inferencias.
El concepto de probabilidad es necesario cuando se opera con procesos físicos, bio-
lógicos y sociales que generan observaciones que no es factible predecir con exactitud.
Por ejemplo, no se puede predecir con certeza la presión arterial de una persona en un
momento dado, y nunca se conoce la carga exacta que soporta un puente antes de de-
rrumbarse y caer. Tales sucesos o eventos aleatorios no se pueden predecir con exactitud,
pero la frecuencia relativa en una gran serie de observaciones es a menudo estable. Los
eventos que poseen esta propiedad se denominan “eventos aleatorios o estadísticos”. Esta
frecuencia relativa estable nos da una medida significativa de la posibilidad de ocurrencia
de un evento aleatorio en una observación futura. Es imposible, por ejemplo, predecir con
exactitud la ocurrencia de caras en un solo lanzamiento de una moneda perfecta, pero se
podría afirmar con relativa confianza que la proporción de caras en una gran cantidad de
lanzamientos estaría muy cerca de 0.5. El uso de ésta frecuencia relativa como medida
para la posibilidad de este resultado en un solo lanzamiento es evidente cuando se consi-
dera el objetivo de un apostador.
De ésta manera podemos considerar más ejemplos análogos y prácticos, haciendo
resaltar que, en muchos aspectos de la vida, todo ser humano es un apostador. El médico
que realiza una investigación arriesga tiempo y dinero en el proyecto de investigación y le
interesa “ganar” en un “solo lanzamiento” de una moneda simbólica. De la misma mane-
ra, la inversión de capital en una nueva instalación industrial es un riesgo que representa
el lanzamiento de una moneda, en el cual el empresario deposita sus esperanzas de tener
éxito.
más sólida que la que tomaríamos si solo diéramos palos de ciego. En resumen, la proba-
bilidad se define como un evento o suceso esperado con cierta confianza, y se considera
la posibilidad numérica representada en el intervalo cerrado de que ocurra o no dicho
evento.
Ejemplo
a) Lanzar un dado; b) Lanzar una moneda; c) Sacar una carta de una baraja, etc.…
Ejemplo
a) Al lanzar un dado, podemos observar un número 1, 2, 3, 4, 5 o 6.
b) Al lanzar una moneda, podemos observar un escudo o una letra.
Espacio muestral:
Es el conjunto al que pertenecen todos los resultados posibles de un experimento. Al es-
pacio muestral también se le conoce como conjunto universo y lo identificaremos con la
letra S.
Ejemplo 1:
Al lanzar un dado, el espacio muestral es: S = {1, 2, 3, 4, 5, 6}
Ejemplo 2:
Al lanzar una moneda, el espacio muestral es: S = {E, L}
Solución numeral 2
Como el espacio muestral está constituido de 8 eventos, entonces cada evento tendrá la
1 1
probabilidad de, — o sea que: P ( E1 ) = , para i = 1, 2, 3, … , 8
8 8
Solución numeral 3a)
Sea A el evento de observar exactamente dos escudos, entonces:
1 1 1 3
P ( A) = P ( E2 ) + P ( E3 ) + P ( E5 ) = + + = = 0.375
8 8 8 8
Ejemplo 1
En un comedor de beneficencia, una trabajadora social recolecta los datos siguientes. De
las personas que concurren al comedor 59% son hombres, 32% son alcohólicos y 21% son
hombres alcohólicos.
¿Cuál es la probabilidad de que un hombre que acuda al comedor sea alcohólico?
Solución
Sea H el evento de ser un hombre, entonces P(H) = 0.59; sea A el evento de ser alcohóli-
co, entonces P(A) = 0.32 y sea H ∩ A, el evento de ser hombre alcohólico, entonces:
P(A ∩ H) = 0.21
P ( A ∩ H ) 0.21
Por tanto, P ( A H ) = = ≅ 0.36
P (H ) 0.59
Ejemplo 2
Una caja contiene bolitas blancas y negras, además cada una tiene grabada una letra A o
Z, como sigue:
a) ¿Cuál es la probabilidad de sacar una bolita de color blanco, ya que ésta tiene la letra
Z?
b) ¿Cuál es la probabilidad de sacar una bolita que tenga la letra A, ya que se sacó una
bolita de color negro?
Solución inciso a)
Sea B el evento de sacar una bolita color blanco y sea Z el evento de que la bolita tiene
grabada la letra Z, entonces:
8
P ( B ∩ Z ) 25 8
P (B Z ) = = = ≅ 0.53
P (Z ) 15 15
25
Solución inciso b)
Sea A, el evento de sacar una bolita que tenga grabada la letra A, y sea N el evento de que
la bolita es de color negro:
4
P ( A ∩ N ) 25 4 ≅
P( A N )= = = 0.36
P (N ) 11 11
25
Ejemplo 3
Se lanza un dado no cargado. Dado que el resultado es un número impar, ¿cuál es la pro-
babilidad de que el número sea mayor que 3?
Solución
Sea I el evento de que el número observado es un número impar y sea M el evento de que
el número es mayor que 3.
Sabemos que al lanzar un dado el espacio muestral contiene los elementos 1, 2, 3, 4,
5 y 6, por tanto, los números impares son 3 de 6 y los números impares mayores que 3 es
1 de 6, o sea únicamente el número 5, luego tendríamos que:
Introducción a la probabilidad 131
1
P(M ∩ I) 6 1
P(M I) = = = ≅ 0.333...
P(I) 3 3
6
Ejemplo 4
En Concepción de Chile, la probabilidad de que llueva el primero de junio es de 0.5 y la
probabilidad de que llueva los primeros dos días de junio es de 0.40. Dado que llovió el
día primero; ¿cuál es la probabilidad de que llueva el siguiente día?
Solución
Sea A el evento de que llueva el primero de junio y sea B el evento de que llueva el día
siguiente, entonces la probabilidad está dada por:
EJERCICIOS 9.5
1. De los estudiantes de una universidad, el 40% son varones y el 4% son varones que
estudian arte. Si se elige un estudiante al azar y este resulta ser un varón, ¿cuál es la
probabilidad de que estudie arte?
2. Si F es el evento de que un estudiante de medicina obtendrá ayuda financiera, E es el
evento que encontrará un empleo de medio tiempo y G es el evento de que se gradua-
rá, expresar en forma simbólica las probabilidades siguientes:
a) Obtenga ayuda financiera y se gradúe;
b) No obtenga ayuda financiera y encuentre trabajo;
c) No reciba ayuda financiera y no encontrará trabajo;
d) Reciba ayuda financiera y encuentre trabajo y no se gradúe.
3. Si E es el evento de tener experiencia previa en el área de medicina, C el de tener un
automóvil y G el de que es profesional graduado de la UNICAH. Explicar en palabras
que probabilidades condicionales expresan cada una de las siguientes proposiciones:
a) P(C|G) b) P(E|C c) c) P(C c|E)
d) P(G c|C c) e) P(C|E ∪ G) f) P(E ∩ C c|G)
4. Si W es el evento de ser enfermera capacitada; Q que cumple con la asignación de sus
tareas, expresar en forma simbólica las probabilidades de que:
a) Una enfermera capacitada cumpla con la asignación de sus tareas;
b) Una que cumpla con la asignación de sus tareas y no esté capacitada;
c) Una enfermera no capacitada no cumpla con la asignación de sus tareas.
5. Con referencia al ejemplo anterior, explique en palabras las probabilidades que expre-
san las siguientes proposiciones:
a) P(W|Q) b) P(C c|W) c) P(wc|Qc)
6. Si H es el evento de ser estudiante honesto; E el de ser indolente y W el de ser justo.
Expresar de manera simbólica las probabilidades de que:
a) Ser indolente y justo
b) Deshonesto dado que sea indolente
c) Honesto e indolente dado que sea justo
132 CAPÍTULO 9
7. Con referencia al ejercicio anterior, exprese con palabras las probabilidades que ex-
presan las siguientes proposiciones:
a) P(H|Wc)
b) P(wc|Ec)
c) P(W∩ E|H)
8. Si en un gran hospital hay 400 pacientes internos por enfermedades naturales o acci-
dentales. Sea H el evento de ser hombres y M el evento de ser mujeres, el cuadro si-
guiente resume la calidad del internamiento u hospitalización.
Calcular las probabilidades a partir de las entradas y los totales de las filas y columnas:
10. Una cadena de laboratorios clínicos ha recibido 25 solicitudes de empleo para una
plaza de laboratorista técnico. De los aspirantes, 10 tienen más de 30 años y 15 me-
nos de este valor. Solo 17 de los aspirantes tienen grado universitario a nivel de licen-
ciatura en microbiología y 8 de maestría en áreas de similar condición. De los que son
menores de 30 años, 6 tienen el grado de maestría. Si se hace una selección al azar,
¿cuál es la probabilidad de que:
a) Sea seleccionado un aspirante de más de 30 años o que tenga maestría
b) Sea seleccionado un aspirante menor de 30 años que tenga una licenciatura
c) Sea seleccionado un menor de 30 años con licenciatura
11. Una clínica de especialidades cuenta con dos médicos expertos en una misma rama;
uno de ellos tiene 35 años de experiencia y el otro está recién graduado. Según algu-
nos registros, las posibilidades de que un paciente sea atendido por el médico de
mayor experiencia es de dos contra uno. Un paciente visitó dicha clínica en dos oca-
siones en el término de dos meses sin darse cuenta de las diferencias en experiencia
entre dichos galenos. ¿Cuál es la probabilidad de que al menos una vez este paciente
haya sido atendido por el médico de mayor experiencia?
9.5.1 Regla de la suma
Esta regla expresa la ocurrencia de la probabilidad de la unión de dos eventos A o B, la
cual calcularemos por:
P ( A ∪ B) = P ( A) + P ( B) − P ( A ∩ B) ; donde:
P ( A ∪ B) = probabilidad de que ocurra A o B
P ( A) = probabilidad marginal de A
P ( B) = probabilidad marginal de B
P ( A ∩ B) = probabilidad de A y B o curran al mismo tiempo
Nota: En este caso debe tenerse cuidado referente a que los eventos pueden ser mutuamen-
te excluyentes o no, y de ello dependerá de que la probabilidad de la intercepción de A y
B sea cero o no.
Introducción a la probabilidad 133
Ejemplo 1
En una baraja de 52 cartas, ganaremos $100 si elegimos una carta de color negro o un rey.
¿Cuál es la probabilidad de ganar los $100?
Solución
En este ejemplo podemos apreciar que los eventos no son mutuamente excluyentes ya que
existen 26 cartas de color negro y que de los cuatro reyes dos son de color negro y dos
de color rojo, por tanto, si N es el evento de sacar una carta de color negro y R el evento de
sacar un rey, entonces:
26 4 2 28 ≅
P ( N ∪ R) = P ( N ) + P ( R) − P ( N ∩ R) = + − = 0.54
52 52 52 52
Ejemplo 2
Si se lanza un dado no cargado; ¿cuál es la probabilidad de observar un par o un número
divisible por 3?
Solución
Sea A el evento de que el número es par y sea B el evento de que el número sea divisible
por 3. En notación de conjuntos podemos expresar que: A = {2, 4, 6}; B = {3, 6} y A ∩ B =
{6}, luego tenemos que:
3 2 1 4 2
P ( A ∪ B) = P ( A) + P ( B) − P ( A ∩ B) = + − = = ≅ 0.67
6 6 6 6 3
Ejemplo 3
Dados dos eventos A y B, mutuamente excluyentes donde P(A) = 0.37 y P(B) = 0.55,
Calcular el valor de las siguientes probabilidades:
a) P(Ac) b) P(Bc) c) P(A ∪ B) d) P(A ∩ B) e) P(Ac ∩ Bc)
Solución inciso a)
P(A) + P(Ac) = 1, entonces: P(Ac) = 1 – P(A) = 1 – 0.37 = 0.63
Solución inciso b)
P(B) + P(Bc) = 1, entonces: P(Bc) = 1 – P(B) = 1 – 0.55 = 0.45
Solución inciso c)
P(A ∪ B) = P(A) + P(B) = 0.37 + 0.55 = 0.92
Solución inciso d)
Como los eventos son mutuamente excluyentes, entonces:
P(A ∩ B) = 0
Solución inciso e)
P(A ∩ B) = P(A ∪ B)c; Pero P(A ∪ B) + (A ∪ B)c = 1; entonces:
P(A ∪ B) = 1 – P(A ∪ B) = 1 – 0.92 = 0.08
Se concluye que: P(Ac ∩ Bc) = 0.08
Ejemplo 4
Sea E el evento de que el Decano de Medicina de la UNICAH esté en España y sea H el
evento de que esté en Honduras. Si P(E) = 0.27 y P(H) = 0.39; ¿cuál es la probabilidad de
que el Decano de Medicina de la UNICAH?
a) Esté en Honduras y España;
b) Que no esté en España;
134 CAPÍTULO 9
EJERCICIOS 9.5.1
1. Una urna contiene 75 bolitas: 35 son azules, y 25 de esas azules son oscuras. El resto
de las bolitas son rojas, y 30 de ellas son oscuras. Las bolitas que no son oscuras tie-
nen color claro. Cuál es la probabilidad de sacar:
a) Una bolita de color azul
b) Una bolita clara
c) Una bolita azul oscuro
d) Una bolita roja y clara
e) Una bolita oscura
f) Una bolita roja oscura o azul oscura
2. El jefe de rayos X de un hospital privado de la ciudad de San Pedro Sula se da cuenta
que en las radiografías tomadas a los pacientes de cada 1000; 10 tienen fallas al inte-
rior de las transparencias, 8 presentan fallas de corrugado y 5 tienen ambos tipos de
defectos. Si en un mes cualesquiera de 1000 radiografías tomadas, se selecciona una
al azar, cuál es la probabilidad de que:
a) La radiografía presente ambas fallas;
b) Ninguna falla;
c) Tenga fallas al interior o fallas de corrugado?
3. De una baraja de 52 cartas, cuál es la probabilidad de:
a) Sacar un rey o una carta color rojo?
b) Sacar una carta de color negro o una reina;
c) Un as o una carta de corazones.
Introducción a la probabilidad 135
Solución inciso a)
En el ejercicio se observa una total independencia entre los eventos, y por otro lado se
pide la probabilidad del éxito total de los médicos; por tanto, haremos uso de la fórmula:
éxito + fracaso = 1; en donde, fracaso = P(Ac)P(Bc)P(Cc) = (0.25)(0.15)(0.30) = 0.01125
fracaso + éxito = 1, entonces: éxito = 1 – fracaso = 1 – 0.01125 = 0.98875.
La probabilidad de que los tres médicos tengan éxito es de 0.98875
Solución inciso b)
En este inciso el resultado de la probabilidad pedida será el producto del éxito del médico
A, con el fracaso de los médicos B y C. Entonces:
P ( AB C C C ) = P ( A ∩ B C ∩ C C ) = P ( A) P ( B C ) P (C C ) = (0.75)(0.15)(0.30) ≅ 0.03375
Ejemplo 2
En una máquina de rayos X, un dispositivo consta de tres componentes A, B y C, indepen-
dientes entre sí. El dispositivo se considera defectuoso, si uno o más de los componentes
lo son. La probabilidad de que A sea defectuoso es 0.01, de que B sea defectuoso es 0.02
y que C sea defectuoso es 0.10.
a) ¿Cuál es la probabilidad de que el dispositivo sea defectuoso?
b) ¿Cuál es la probabilidad de que el dispositivo sea defectuoso debido solo a una falla
del componente C?
Solución inciso a)
Sean A, B y C los eventos de que los componentes del dispositivo sean defectuosos y sean
Ac, Bc y Cc de que no son defectuosos, entonces:
P(Dispositivo no sea defectuoso) P(Ac) P(Bc) P(Cc) = (0.99)(0.98)(0.90) ≅ 0.87318
Recuerde que P(éxito) + P(fracaso) = 1, por tanto:
P(dispositivo sea defectuoso) = 1 – P(dispositivo no sea defectuoso) =1 – 0.87318 ≅ 0.1268
Introducción a la probabilidad 137
Solución inciso b)
Aquí la probabilidad solicitada estará dada por el producto de los complementos de los
componentes A y B, y la probabilidad del componente C, una probabilidad mixta entre
fracasos y éxitos; entonces:
P(Ac Bc C) = P(Ac ∩ Bc ∩ C) = P(Ac)P(Bc)P(C) = (0.99)(0.98)(0.10) ≅ 0.096
Ejemplo 3
Se sabe que un paciente responderá al tratamiento de una afección en particular con una
probabilidad igual a 0.9. Si se trata a tres pacientes en una forma independiente, encuen-
tre la probabilidad de al menos uno responda al tratamiento.
Solución
Sea A el evento de que al menos uno de los pacientes responda al tratamiento.
Sea B1 el evento de que el primer paciente no responderá, B2 el evento de que el se-
gundo paciente no responda al tratamiento y B3 el evento de que el tercer paciente no
responda al tratamiento.
Por otra parte, se puede ver que Ac = B1 ∩ B2 ∩ B3 y que S = A ∪ Ac, por tanto:
P(S) = P(A) + P(Ac)
1 = P(A) + P(B1 ∩ B2 ∩ B3), o bien P(A) = 1 – P(B1 ∩ B2 ∩ B3)
Luego al aplicar la ley multiplicativa, se tiene
P(B1 ∩ B2 ∩ B3) = P(B1) P(B2 | B1) P(B3 | B1 ∩ B2)
Con P(B2 | B1) = P(B2) y P(B3 | B1 ∩ B2) = P(B3); dado que los eventos son indepen-
dientes.
Al sustituir P(Bi) = 0.1; i = 1, 2, 3, tenemos:
P(A) = 1 – (0.1)(0.1)(0.1) ≅ 0.999
EJERCICIOS 9.5.2
1. El Departamento de salubridad pública realiza sistemáticamente dos inspecciones
independientes en cada restaurante de la ciudad; este pasa la prueba si y solo si am-
bos inspectores dan un dictamen positivo. El inspector A tiene mucha experiencia y,
por lo mismo aprueba solo el 2% de los restaurantes que han violado el código sani-
tario. El inspector B tiene menos experiencia y aprueba 7% de los restaurantes que
han cometido alguna infracción. ¿Cuál es la probabilidad de que:
a) El inspector A apruebe un restaurante con una violación, si el inspector B ha des-
cubierto alguna infracción
b) El inspector B apruebe un restaurante que haya incurrido en una violación, si el
inspector A lo aprueba
c) Un restaurante con una violación sea aprobado por el departamento de salubridad
pública
2. Las cuatro puertas eléctricas de la sala de cuidados intensivos de un complejo hospi-
talario, se descomponen y se reparan independientemente entre sí. Por experiencia se
sabe que cada una está fuera de servicio 2% de las veces.
a) Si la puerta 1 está fuera de servicio, ¿Cual es la probabilidad de que también lo
estén las puertas 2 y 3?
b) Durante un recorrido por la sala, le dicen a usted de que las probabilidades de que
las cuatro puertas estén fuera de servicio son menores que 1 en 5, 000,000. ¿Es
verdadera esa afirmación?
138 CAPÍTULO 9
3. El nuevo ministro de salud lanza una campaña publicitaria sobre las nuevas políticas
de servicios que el Estado estará prestando a su población en los hospitales públicos.
El ministro acaba de instalar cuatro letreros en una carretera que pasa por las afueras
de la ciudad y por experiencia él sabe que el primer letrero sea visto por un conductor
es de 0.75. Las probabilidades de que el segundo sea visto es de 0.82, de que el terce-
ro sea visto es de 0.87 y la probabilidad de que el cuarto sea visto es de 0.90. Supo-
niendo que el evento consiste en que un conductor vea uno de los letreros sea
independiente del hecho de que vea o no los otros. Cuál es la probabilidad de que:
a) Los 4 letreros sean vistos por un conductor elegido aleatoriamente;
b) El primero y el cuarto, pero no el segundo ni el tercero, sean vistos
c) Exactamente uno de los letreros sea visto
d) El tercero y el cuarto no sean vistos
4. Tres médicos A, B y C son los responsables de las cirugías en un hospital privado en
la ciudad de Tegucigalpa. El médico A tiene éxito en el 95% de los casos, el médico B
un 85% de éxito y el médico C fracasa en el 25% de sus cirugías. Se supone que las
actuaciones de los tres médicos son independientes entre sí. Si se someten a opera-
ción tres pacientes al mismo tiempo en un día cualesquiera, cuál es la probabilidad de
que:
a) El médico C tenga éxito y los médicos A y B fracasen
b) Los tres médicos fracasen, y
c) El médico A y B tengan éxito y el médico C fracase
4 3 12 ≅
P ( A ∩ B) = P ( B) P ( A B) = x = 0.0045
52 51 2652
Ejemplo 2
De una baraja de 52 cartas, se extraen cinco cartas en forma sucesiva y sin restitución.
a) ¿Cuál es la probabilidad de que no haya ningún As entre las cinco cartas?
b) ¿Cuál es la probabilidad de que las primeras tres cartas sean ases y las dos últimas
sean reyes?
c) ¿Cuál es la probabilidad de que solo las tres primeras cartas sean ases?
Solución inciso a)
Sea A, el evento de obtener un As y sea Ac el evento de no obtenerlo o que la carta no sea
As, entonces:
Introducción a la probabilidad 139
48 47 46 45 44 205476480 ≅
P ( A1C ∩ A2C ∩ A3C ∩ A4C ∩ A5C ) = = 0.6588
52 51 50 49 48 311875200
Solución inciso b)
Sea A el evento de que las primeras tres cartas sean Ases y sea R el evento de que las dos
últimas cartas sean reyes, entonces:
4 3 2 4 3 288
P ( A1 ∩ A2 ∩ A3 ∩ R1 ∩ R2 ) = = ≅ 0.00000092
52 51 50 49 48 311875200
Solución inciso c)
Sea A el evento de obtener un As y sea Ac el evento de no obtenerlo o que la carta no sea
As, entonces:
4 3 2 48 47 54144 ≅
P ( A1 ∩ A2 ∩ A3 ∩ A1C ∩ A2C ) = = 0.0001736
52 51 50 49 48 311875200
Ejemplo 3
En cierta ciudad 40% de los pobladores son hombres y 60% son mujeres, 70% de los hom-
bres y 80% de las mujeres, normalmente son afectados por una enfermedad tropical. Al
seleccionar una persona de esta ciudad; ¿cuál es la probabilidad de que esté afectada por
la enfermedad?
Solución
Apoyándonos en un diagrama de Venn, tenemos que:
U
H M
A∩H A∩M
Solución inciso b)
Sea B1 el evento de que la primera bolita sea de color blanco y sea N2 el evento de que la
segunda bolita sea de color negro. Entonces:
6 4 4
P ( B1 ∩ N 2 ) = P ( B1 ) P ( N 2 B1) = = ≅ 0.27
10 9 15
EJERCICIOS 9.5.3
1. Se sacan dos cartas sin restitución de una baraja de 52 cartas, cuál es la probabilidad
de que:
a) La primera carta sea una reina y la segunda sea un rey;
b) Se obtenga una reina y un rey;
c) Ninguna de las dos cartas sea reina;
d) Ninguna de las dos cartas sea reina ni rey.
2. Se sacan cinco cartas sin restitución de una baraja, cuál es la probabilidad de que:
a) Las primeras tres cartas sean reinas y las dos últimas sean reyes;
b) Solo las tres primeras cartas sean reinas;
c) Las tres primeras cartas sean reinas.
3. Se sacan tres cartas sin restitución de una baraja, ¿Cuál es la probabilidad de que haya
por lo menos un rey entre las tres cartas?
4. Una urna contiene 4 bolitas blancas y 3 rojas. Si se sacan dos bolitas sin restitución,
cuál es la probabilidad de que:
a) Las dos sean blancas b) La primera sea roja y la segunda blanca
c) Las dos sean rojas d) La primera sea blanca y la segunda negra
5. Un médico tiene cinco medicamentos numerados del 1 al 5, y todos surten el mismo
efecto para las enfermedades cutáneas. Cada vez que el médico proporciona a un
paciente una muestra médica de los medicamentos en mención, los extrae de un reci-
piente de manera aleatoria. Si el médico extrae a la vez tres de los medicamentos sin
restitución, cuál es la probabilidad de que:
a) El primer medicamento sea el número 4, el segundo el número 5 y el tercero el nú-
mero 1.
b) Los primeros dos medicamentos extraídos no sean el número 4 ni el número 5
6. En una pequeña ciudad se sabe que las afecciones bucales (encías y dientes) son
causadas por dos tipos de bacteria (bacteria tipo A y bacteria tipo B). La bacteria tipo
A se encuentra presente en 55% de la población y el tipo B en 45%. El 85% de la bac-
teria tipo A y 75% de la bacteria tipo B es destruida por un nuevo medicamento odon-
tológico. Si se selecciona una persona de esta pequeña ciudad, ¿cuál es la probabilidad
de que el medicamento haga el efecto esperado?
7. Un psicólogo aficionado a las estadísticas frecuentemente le gusta efectuar cálculos
de probabilidad sobre el desarrollo de la personalidad que se genera en todo niño
hasta la edad de siete años. Él sabe que de cada 20 pacientes adultos que atiende
diariamente el 20% son provenientes de hogares desintegrados, el 40% han sido afec-
tados por la pobreza, el 5% fueron rebeldes por naturaleza y el 35% recibieron la
protección necesaria de sus padres. Si un día cualquiera, de los 20 pacientes adoles-
centes que esperan turno en su clínica para ser atendidos, el psicólogo selecciona
cuatro pacientes al azar; ¿cuál es la probabilidad de que:
a) Solo los dos primeros fueron afectados por la pobreza;
b) Que el primero provenga de hogares desintegrados, el tercero y cuarto hayan sido
rebeldes por naturaleza.
Introducción a la probabilidad 141
9.5.4 Regla de Bayes
El procedimiento de la descomposición de los eventos para resolver problemas de probabi-
lidad, para su facilitación es aconsejable considerar el espacio muestral S como una unión
de subconjuntos que son mutuamente excluyentes, lo que permite que para una probabili-
dad condicional de la forma P(Bi ∣ A) se puede calcular mediante la siguiente fórmula:
P ( A ∩ Bi ) P ( B ) P ( A Bi )
P ( Bi A) = = K i
P ( A)
∑P (Bi )P ( A Bi )
i =1
P ( A ∩ B) P ( A) P ( B A)
P ( A B) = =
P ( B) P ( A) P ( B A) + P ( AC ) P ( B AC )
Luego se tiene que:
(0.20)(0.50)
= ≅ 0.172
(0.20)(0.50) +(0.80)(0.60)
Ejemplo 2
Tres médicos de un hospital de especialidades efectúan cirugías de corazón abierto todos
los días, el médico de la sala 1 efectúa el 35% de las operaciones, el médico de la sala 2 el
45% y el médico de la sala 3 el 20%. En las operaciones de corazón abierto, el médico de
la sala 1 fracasa en un 20% de sus operaciones, el de la sala 2 fracasa en el 15% y el médi-
co de la 3 fracasa en un 5%.
a) Si el paciente fallece ¿cuál es la probabilidad de que haya sido operado por el médico
de la sala número 3?;
b) Si la operación del paciente fue exitosa, ¿cuál es la probabilidad de que haya sido
operado por el médico de la sala número 1?
Solución inciso a)
Sea A la probabilidad de que el paciente haya sido operado por el médico de la clínica
número 3;
142 CAPÍTULO 9
Solución inciso b)
Sea A la probabilidad de que el paciente haya sido operado por el médico de la clínica
número 1;
Sea B el evento de que la operación del paciente fue exitosa;
(0.35)(0.80) 0.28
P ( A B) = = ≅ 0.3284
(0.35)(0.80)+ (0.45)(0.85) +(0.20)(0.95) 0.8525
EJERCICIOS 9.5.4
1. El doctor Sócrates Sánchez, gerente de crédito de un hospital privado en la zona sur
de Honduras, sabe que dicho hospital emplea tres métodos para alentar el cobro de
cuentas atrasadas de algunos pacientes. Al consultar los archivos de la cobranza,
descubre que 70% de las cuentas se cobran en forma personal, 20% se cobran por te-
léfono y al 10% se les envía una carta. La probabilidad de cobrar una deuda vencida
con los tres métodos es de 0.75, 0.60 y 0.65 respectivamente. El doctor Sánchez
acaba de recibir el pago de una cuenta vencida de un paciente. Cuál es la probabilidad
de que ese paciente:
a) Haya sido visitado en forma personal
b) Haya recibido una llamada telefónica o,
c) Haya recibido una carta.
2. Tres médicos de un hospital de especialidades efectúan cirugías de corazón abierto
todos los días, el médico de la sala 1 efectúa el 35% de las operaciones, el médico de
la sala 2 el 45% y el médico de la sala 3 el 20%. En las operaciones de corazón abier-
to, el médico de la sala 1 fracasa en un 20% de sus operaciones, el de la sala 2 fracasa
en el 15% y el médico de la 3 fracasa en un 5%.
a) Si la operación tuvo éxito ¿cuál es la probabilidad de que haya sido operado por el
médico de la sala número 1?;
b Si la operación fracasó ¿cuál es la probabilidad de que haya sido operado por el
médico de la sala número 2?
3. Cinco líneas de producción fabrican los fusibles electrónicos para todos los aparatos
eléctricos utilizados en pacientes con problemas cardiovasculares. Los fusibles son
caros, son bastante confiables, y se suplen en lotes de 100 unidades. La mayoría de
los compradores prueba solamente un pequeño número de los fusibles antes de deci-
dir si aceptan o rechazan los lotes de fusibles que llegan, ya que la prueba es destruc-
tiva. Las cinco líneas producen fusibles a la misma velocidad y normalmente producen
solo 2% de fusibles defectuosos, que se distribuyen aleatoriamente en el proceso de
producción. Desafortunadamente, la línea 1 sufrió una falla mecánica y produjo 5%
de defectuosos en el mes de noviembre recién pasado. El productor se enteró de esta
situación después de haber enviado los fusibles. El administrador de uno de los hos-
pitales, adquirió un lote producido en el mes de noviembre y probó tres fusibles; uno
era defectuoso.
a) ¿Cuál es la probabilidad de que el lote haya salido de la línea 1?
b) ¿Cuál es la probabilidad de que el lote haya salido de una de las otras cuatro líneas?
Introducción a la probabilidad 143
Distribuciones teóricas
de probabilidad 10
Contenido
n x n−x n!
P ( X = x) = pq = p x q n −x ;
x ( )
n − x ! x!
x = 0, 1, 2, 3, 4, . . . , n
n! = n factoria l donde n! = n(n – 1)(n – 2)(n – 3). . .(1)
Donde:
P = Probabilidad de éxito
q = (1 – P) = Probabilidad de fracaso
Notas especiales:
1. Simbólicamente, podemos representar la media de una distribución binomial por 𝜇 = np;
En la que:
n = número de ensayos
p = probabilidad de tener éxito
2. La desviación estándar de una distribución binomial se calcula por la fórmula si-
guiente: σ = npq ; donde:
Distribuciones teóricas de probabilidad 147
n = número de ensayos
p = probabilidad de éxito
q = probabilidad de fracaso
Cabe señalar que el maestro debe obligatoriamente enseñar a sus alumnos a plantear
y calcular probabilidades mediante la fórmula antes mencionada y con las tablas que apa-
recen en los anexos de cualquier texto de estadística. Las dos opciones son de legítima
obligatoriedad que el alumno las conozca, ya que ambos caminos tienen ventajas y des-
ventajas, por ejemplo, en un trabajo de campo el profesional no cuenta con una tabla de
probabilidades, o si cuenta con la tabla esta no tiene resultados para algunos valores de n,
más conocido como el tamaño del espacio muestral o el número de ensayos en un evento
de condiciones de Bernoulli. Asimismo, las disposiciones del presente párrafo deben ser
aplicadas para cualquier distribución de probabilidad discreta o continua.
Ejemplo 1
Con n = 7 y p = 0.4, determine las probabilidades binomiales siguientes:
a) P(x = 3)
b) P(x > 5)
c) P(x ≤ 2)
d) P(2 < x ≤ 4)
Solución inciso a)
n! 7!
P (x = 3) = P xq n−x = (0.4)3 (0.6)4 = 35(0.4)3 (0.6)4 ≅ 0.2903
(n − x )! x! (7 − 3)!3!
Solución inciso b)
7! 7!
P (x > 5) = P (x = 6) + P (x = 7) = (0.4)6 (0.6) + (0.4)7 (0.6)0 =
(7 − 6)!6! (7 − 7)!7 !
0.0172 + 0.0016 ≅ 0.0188
Solución inciso c)
P (x ≤ 2) = P (x = 0) + P (x = 1) + P (x = 2) =
7! 7! 7!
(0.4)0 (0.6)7 + (0.4)1 (0.6)6 + (0.4)2 (0.6)5 =
(7 − 0)!0! (7 −1)!1! (7 − 2)!2!
0.0280 + 0.1306 + 0.2613 ≅ 0.4199
Solución inciso d)
P (2 < x ≤ 4) = P (x = 3) + P (x = 4) =
7! 7!
(0.4)3 (0.6)4 + (0.4)4 (0.6)3 = 0.2903 + 0.1935 ≅ 0.4838
(7 − 3)!3! (7 − 4)!4!
Ejemplo 2
Una compañía distribuye un producto especial para hospitales y clínicas médicas de la
región sur del país, y sabe que la probabilidad de que le compren el producto cuando un
profesional de la medicina vea el anuncio por televisión es de 0.3. Suponga que 10 profe-
sionales de la medicina de la región sur ven el anuncio.
a) ¿Cuál es la probabilidad de que al menos unos de los hospitales o clínicas compren el
producto?
148 CAPÍTULO 10
Solución inciso a)
10!
P (x ≥ 1) = 1 − P (x = 0) = 1− (0.3)0 (0.7)10 = 1− 0.0282 ≅ 0.9718
(10 − 0)!0!
Solución inciso b)
P (x ≤ 3) = P (x = 0) +P (x = 1) +P (x = 2) +P (x = 3) =
10! 10! 10!
(0.3)0 (0.7)10 + (0.3)1 (0.7)9 + (0.3)2 (0.7)8 +
(10 − 0)!0! (10 −1)!1! (10 − 2)!2!
10!
(0.3)3 (0.7)7 = 0.0282 + 0.1211 + 0.2335 + 0.2668 ≅ 0.6496
(10 − 3)!3!
Solución inciso c)
P (x ≤ 4) = P (x = 0) + P (x = 1) + P (x = 2) + P (x = 3) + P (x = 4) =
10! 10! 10!
(0.3)0 (0.7)10 + (0.3)1 (0.7)9 + (0.3)2 (0.7)8 +
(10 − 0)!0! (10 −1)!1! (10 − 2)!2!
10! 10!
(0.3)3 (0.7)7 + (0.3)4 (0.7)6 = 0.0282 + 0.1211+ 0.2335 + 0.2668 +
(10 − 3)!3! (10 − 4)!4!
0.2001 ≅ 0.8498
Solución inciso d)
10!
P (x = 0) = (0.3)0 (0.7)10 ≅ 0.0282
(10 − 0)! 0!
EJERCICIOS 10.1
1. El 35% de los análisis clínicos en un laboratorio de Tegucigalpa no son confiables. Si
en éste laboratorio hay 20 reportes sobre análisis clínicos para ser entregados:
a) ¿Cuál es la probabilidad de que exactamente 2 no sean confiables?
b) ¿Cuál es la probabilidad de que al menos 3 sean confiables?
c) ¿Qué ninguno sea confiable?
d) ¿Qué menos de 3 sean confiables?
2. El 85% de los empleados de un complejo hospitalario, porta su identificación perso-
nal. Si en un día cualesquiera llegan 10 empleados a la entrada principal del complejo
hospitalario, cuál es la probabilidad de que el guardia de seguridad encuentre:
a) ¿Ocho empleados con identificación?
b) ¿Cuatro empleados sin identificación?
c) ¿Por lo menos 4 empleados sin identificación?
d) ¿A lo sumo 5 empleados con identificación?
e) ¿Entre 4 y 7 empleados inclusive con identificación?
Distribuciones teóricas de probabilidad 149
3. En un concurso para ocupar una plaza de médico general, un aspirante debe obtener
por lo menos el 60% en un examen de verdadero y falso con 18 preguntas por respon-
der. Si el aspirante lanza una moneda para determinar la respuesta a cada pregunta,
¿cuál es la probabilidad de que el aspirante apruebe el examen?
4. Para una distribución binomial con n = 7 y p = 0.20, encuentre:
a) P(x = 5) b) P(x > 2) c) P(x < 8) d) P(x ≥ 4)
e) P((x ≤ 4) /(x ≥ 2)) f) P((x ≤ 1) o (x > 5) /(x ≤ 6)) g)
P((1 ≤ x < 4) /(x ≥ 3))
5. En una encuesta realizada al personal de enfermería en un hospital público indica
que, de las enfermeras escogidas al azar, la probabilidad de que sean graduadas y con
experiencia es de 0.30, la probabilidad de que no sean graduadas y con experiencia es
de 0.55 y la probabilidad de que no sean ni graduadas ni con experiencia es 0.15.
Suponiendo que estas probabilidades son exactas, responda las preguntas siguientes
con respecto a un grupo de 10 enfermeras seleccionadas al azar.
a) ¿Cuál es la probabilidad de que cuatro sean graduadas y con experiencia?
b) ¿Cuál es la probabilidad de que ninguna sea graduada y con experiencia?
c) ¿Cuál es la probabilidad de que dos no sean ni graduadas ni con experiencia?
d) ¿Cuál es la probabilidad de que al menos ocho sean graduadas y con experiencia?
6. El jefe de proveeduría de una cadena de clínicas para salud mental se ha dado cuenta
de que la probabilidad de que un administrador de una de estas clínicas que ha reali-
zado cotizaciones durante la semana vía teléfono, compre algún implemento o apara-
to médico, es de 0.45. Supóngase que 15 clínicas de la cadena en mención cotizaron
durante una semana cualesquiera.
a) ¿Cuál es la probabilidad de que al menos unas de las clínicas compren algún im-
plemento o aparato médico esa semana?
b) ¿Cuál es la probabilidad de que al menos cuatro clínicas compren algún aparato o
implemento médico?
c) ¿Cuál es la probabilidad de que ninguna de las clínicas que cotizaron vía teléfono
durante la semana compren algún implemento o aparato médico?
d) ¿Cuál es la probabilidad de que no más de cuatro clínicas que cotizaron durante la
semana compren un aparato o implemento médico?
7. Una Comisión Especial de 15 médicos en un hospital público de San Pedro Sula es la
responsable de la toma de decisiones para la aprobación de cirugías y operaciones
complejas. Un paciente tiene cita para someterse a una operación complicada, y se
sabe que en estos casos la decisión es tomada por mayoría de votos en la Comisión
Especial de Médicos. Por experiencia se sabe que la Comisión Especial de Médicos
toma dichas decisiones en 95% de las veces. ¿Cuál es la probabilidad de que el pacien-
te sea intervenido quirúrgicamente?
8. Los estudiantes de la Carrera del Doctorado en Cirugía Dental de la Universidad
Católica de Honduras, en la clase de Cirugía I, se someten a un examen de opción
múltiple compuesto de 15 preguntas, con cinco respuestas posibles cada una, de las
cuales solamente una es correcta. Supóngase que uno de los estudiantes que realizan
el examen contesta las preguntas al azar. ¿Cuál es la probabilidad de que conteste
correctamente al menos 10 preguntas?
9. La probabilidad de que un ratón inoculado con un suero contraiga cierta enfermedad
es de 0.20. Encuentre la probabilidad que a lo más tres de 30 ratones inoculados
contraigan la enfermedad.
10. Los trabajadores de una empresa que fabrica aisladores son examinados para detectar
la presencia de asbesto en sus pulmones. La empresa debe enviar tres trabajadores
con pruebas positivas de asbesto a un centro médico para realizarles más exámenes.
Si el 40% de los trabajadores tienen pruebas positivas de asbesto en sus pulmones,
150 CAPÍTULO 10
Notas especiales:
1. La distribución de Poisson puede ser aproximada a la Distribución Binomial, median-
( np ) e ( )
x −mp
te la fórmula: P ( X = x ) =
x!
2. La Distribución de Poisson es una aproximación a la Distribución Binomial cuando
n es mayor o igual a 20, y p es menor o igual a 0.05.
3. Dependiendo de los eventos, la media global es la suma de las medias parciales des-
critas en el problema.
Distribuciones teóricas de probabilidad 151
Ejemplo 1
Dada λ = 4.2 para la distribución de Poisson, determinar:
a) P(x = 2)
b) P(x < 3)
c) P(x ≥ 5)
Solución inciso a)
(4.2)2 e −4.2 (17.64)(0.014995576)
P (x = 2) = = ≅ 0.1323
2! 2
Solución inciso b)
(4.2)0 e −4.2 (4.2)1 e −4.2 (4.2)2 e −4.2
P (x < 3) = P (x = 0) + P (x = 1) + P (x = 2) = + + ≅
0! 1! 2!
0.0149 + 0.0629 + 0.1323 = 0.2101
Solución inciso c)
P (x ≥ 5) =1 − P (x < 5) = 1− P (x = 0) + P (x = 1) + P (x = 2) + P (x = 3) + P (x = 4) =
1 − 0.0150 +0.0630 + 0.1323 + 0.1852 + 0.1944 = 1 − 0.5899 ≅ 0.4101
Ejemplo 2
Al estacionamiento de un hospital privado en la Ciudad de San Pedro Sula, cada 15 mi-
nutos por la entrada I, se cuantifica el ingreso de un promedio de 4 vehículos, y por la
entrada II un promedio de 3 vehículos. Durante un lapso de 15 minutos en una hora
cualesquiera, cual es la probabilidad que a éste estacionamiento ingresen:
a) Exactamente 5 vehículos; b) Más de 10 vehículos; c) No más de 3 vehículos.
Solución inciso a)
Como el promedio de vehículos que ingresan por la entrada I durante 15 minutos es de 4
y por la entrada II es de 3 vehículos, entonces λ = 4 + 3 = 7, por tanto:
λ x e−λ (7)5 e −7
P (x = 5) = = ≅ 0.1277
x! 5!
Solución inciso b)
P (x > 10) =1 − P (x =0) + P (x =1) +... +P (x = 10) = 1 −0.9014 ≅ 0.0986
Solución inciso c)
P (x ≤ 3) = P (x = 0) +P (x = 1) +P (x = 2) +P (x = 3) =0.0009 + 0.0064 +0.0223 +
0.0521 ≅ 0.0817
EJERCICIOS 10.2
1. En un complejo hospitalario de la Ciudad de La Ceiba, se han contratado a ocho re-
cepcionistas telefónicas para que tomen las citas de los pacientes solicitantes de aten-
ción médica. Una recepcionista está ocupada el 30% del tiempo tomando los datos de
un paciente. Como director del complejo hospitalario usted no desea que la probabi-
lidad de que la llamada de un paciente se reciba con una señal de ocupado y que esta
situación exceda el 50%. ¿Debería usted contratar más recepcionistas si 3 pacientes
llamaran al mismo tiempo?
152 CAPÍTULO 10
𝜇 – 3𝜎 𝜇 – 2𝜎 𝜇–𝜎 𝜇 𝜇+𝜎 𝜇 + 2𝜎 𝜇 + 3𝜎
La curva normal dependiendo del intervalo y las condiciones del evento probabilísti-
co puede ser acotada y representada por áreas como las siguientes:
1. El cálculo de probabilidades para la distribución normal en general está dada por;
2
1 x −µ
−
2 σ
b e
P (a ≤ x ≤ b ) = ∫ f (x ) dx f (x ) =
a σ 2π
a 𝜇 b
𝜇 a b
a b 𝜇
a 𝜇
𝜇 a
a 𝜇
Distribuciones teóricas de probabilidad 155
𝜇 a
Matemáticamente, el área bajo la curva normal es 1 o 100% de todos los casos de la dis-
tribución dada.
Ejemplo 1
Utilizando la tabla normal, calcular las siguientes probabilidades:
a) P(z > 2.1); b) P(–1.2 < z < 1.5); c) P(z < – 2.8); d) P(z = 2.4)
e) P(z < – 1.5 o z > 1.5)
Solución inciso a)
Si dibujamos la curva normal se puede apreciar que el área buscada es:
𝜇=0 z = 2.1
Entonces P(z > 2.1) = 0.5 – P(z = 2.1) = 0.5 – 0.4821 = 0.0179
Solución inciso b)
–1.2 0 1.5
P(–1.2 < z < 1.5) = P(z = 1.5) + P(z = 1.2) = 0.4332 + 0.3849 = 0.8181
Solución inciso c)
–2.8 𝜇=0
P(z < –2.8) = P(z > 2.8) = 0.5 – P(z = 2.8) = 0.5 – 0.4974 = 0.0026
156 CAPÍTULO 10
Solución inciso d)
𝜇=0 2.4
((z < –1.5) o (z > 1.5)) = 2P(z > 1.5) = 1 –2P(z = 1.5) = 1 – 2(0.4332) = 1 –0.8664
P
= 0.1336
Ejemplo 2
Los salarios anuales de los ejecutivos de mandos intermedios de una Unidad de la Secre-
taría de Salud están distribuidos normalmente con una desviación estándar de 1200 lem-
piras. Se tiene programado un recorte de personal de aquellos que ganen menos de 18,000
lempiras. Si tal medida representa el 10% de empleados de mandos medios.
a) ¿Cuál es actualmente el salario medio de estos funcionarios?
b) ¿Cuál es el sueldo mínimo que perciben estos funcionarios de tal forma que no se
exceda del 12%?
Solución inciso a)
x −µ x −µ
x = 18000; σ = 1200; P z < = 0.10 ; Entonces: z =
σ σ
De la tabla normal
40% 50%
10%
z 𝜇
Entonces Z = –1.178
x −µ x −19536
Luego de z = − 1.178 = ; despejando
σ 1200
x = 19536 – (1200)(1.178) ≅ 18,122.40
38% 50%
12%
x 𝜇 = 19536
38% 50%
12%
z 𝜇=0
Ejemplo 3
Una compañía fabrica marcos especiales de puertas para una obra en construcción. La
compañía quiere fabricar marcos de puertas lo más pequeños posible para ahorrar en los
costos de material, pero al mismo tiempo desea preservar su buena reputación entre la
población de la ciudad. Por otra parte, la compañía está obligada a fabricar puertas que
sean suficientemente grandes para que por ellas pase el 99% de las personas que se movi-
lizan al interior de los inmuebles. A fin de determinar la altura de las puertas, la empresa
está dispuesta a suponer que la talla de la población en esta ciudad tiene una distribución
normal, con una media de 71 pulgadas y una desviación estándar de 7 pulgadas.
¿Qué altura deben de tener las puertas en esta obra de construcción?
Solución
x −µ x −µ
µ = 71; σ = 7; P z < = 0.99 ; entonces: z =
σ σ
50% 49%
1%
𝜇 = 71 x
50% 49%
1%
𝜇=0 z
158 CAPÍTULO 10
x −µ x − 71
De z = 2.33 = ; despejando:
σ 7
x = (7)(2.33) + 71 ≅ 87.31 Pulgadas.
Ejemplo 4
En una editorial, el editor de revistas sobre cuidados e higiene bucal calcula que transcu-
rren en promedio 11 semanas antes de terminar el proceso de publicación, desde la elabo-
ración del manuscrito hasta terminar la revista, con una desviación estándar de 2.4 sema-
nas. Piensa que la distribución normal describe bien los tiempos de publicación. De 19
revistas que tendrá a su cargo este año. ¿Aproximadamente cuantas estarán terminadas en
menos de 12 semanas?
Solución
x −µ 12 −11
P( x ≤ 12) = P (z ≤ ) = P (z ≤ ) = P (z ≤ 0.42) = 0.5 + P (z = 0.42) = 0.5 + 0.1628
σ 2.4
= 0.6628
Luego el número n de revistas terminadas está dado por n = (0.6628) (19) = 12.59;
entre 12 y 13 revistas estarán terminadas.
EJERCICIOS 10.3
1. Calcular el área bajo la curva normal, para los incisos siguientes:
a) P(z = 1.52) b) P(z > 1.52) c) P(z < 1.52)
d) P(–2.1 < z < 0)
e) P(z < – 1.35) f) P(–1.5 < z < 2.1)
g) P(0.7 < z < 2.5)
2. En una preclínica del IHSS, se sabe que el peso promedio de los pacientes adultos se
ajusta a una distribución normal con una media de 170 libras y una desviación están-
dar de 25 libras. Calcular las probabilidades siguientes:
a) P(x ≥ 165) b) P(140 ≤ x ≤ 190) c) P(x < 155)
d) P(x <185) e) P(x ≥ 145) f) P(150 ≤ x ≤ 195)
3. Dado una variable aleatoria X que tiene una distribución binomial con n = 50 ensayos
y p = 0.25, utilice la aproximación de la distribución binomial a la normal para encon-
trar (usar distribución normal):
a) P(x > 10) b) P(x < 18) c) P(x > 21) d)
P(9 < x < 14)
4. En una distribución normal con una desviación estándar de 5.0, la probabilidad de
que una observación elegida al azar exceda 21 es de 0.1401:
a) Encuentre la media de la distribución;
b) Encuentre el valor por debajo del cual se halla el 4% de los valores de la distribu-
ción.
5. El médico responsable del área de emergencia en un hospital público de una gran
ciudad desea cuantificar la variación en la demanda semanal de pintas de sangre. Ha
decidido suponer que esta demanda está distribuida normalmente. El médico sabe
que en promedio se requieren 100 pintas de sangre semanalmente y que 90% de las
veces la demanda semanal está por debajo de 115 pintas.
Distribuciones teóricas de probabilidad 159
Técnicas de muestreo
11
Contenido
Técnicas de muestreo
Una de las aplicaciones más importantes de la estadística es hacer inferencias acerca de
grupos o poblaciones muy grandes, basándose en pequeños cúmulos llamados muestras.
En otras palabras, se trata de conocer características de interés de una población entera a
partir de datos de una o más muestras, tomadas de dicha población.
La medida en que estas inferencias sean funcionales y exactas, dependerá de lo ade-
cuado de las muestras.
Tipos de muestreo
Los muestreos se clasifican en:
1. No aleatorio;
2. Aleatorio
Primero se divide 500 entre 20, dando como resultado el cociente 25, donde 25 co-
rresponde al tamaño de cada grupo. Como segundo paso se selecciona al azar un número
entre 1 y 25, y, por ejemplo, si saliera seleccionado el número 17, entonces el 17 será el
primer elemento que formará parte de la muestra. Para seleccionar el segundo elemento
de la muestra solo se le suma 25 a 17, resultando el número 42, después a 42 se le suma
25 resultando el número 67 como el tercer elemento de la muestra, y así sucesivamente
hasta completar los 20 datos que en este caso en particular tendrá la muestra, y que serán
los siguientes: (recuerde que los participantes están en una nómina numerados del 1 al
500).
17, 42, 67, 92, 117, 142, 167, 192, 217, 242, 267, 292, 317, 342, 367, 392, 417, 442, 467 y 492.
Además, se sabe que 20% son estudiantes de medicina, 11% son estudiantes de Odon-
tología, 32% estudiantes de ingeniería, 8% estudiantes de Derecho y 18% estudiantes
de administración de empresas, y 11% restante estudiantes de otras carreras. Aplicando el
muestreo por estratificación, se desea obtener una muestra de tamaño 1000.
Aplicando los cálculos necesarios la muestra estará formada de la manera siguiente:
Ejemplo
Se va establecer un censo en la capital de la República de Honduras con el objetivo de
medir varias características en común de los pobladores de Tegucigalpa y Comayagüela.
La disponibilidad de recursos para llevar a cabo el censo es demasiada limitada, por tanto,
nos apoyaremos en el muestreo aleatorio por conglomerado, procediendo de la manera
siguiente:
Supongamos que la oficina responsable sobre dicho estudio solo cuenta con recursos
para contratar 40 encuestadores (dos por cúmulo), entonces, se obtiene un mapa de am-
bas ciudades y utilizando líneas rectas meridionales, en éste caso en particular se puede
dividir toda la periferia en unos 80 cúmulos, de los cuales solo 20 serán seleccionados
para ser encuestados.
EJERCICIOS 11.0
1. Una relacionadora pública del sector de salud del gobierno desea entrevistar a 15 de
6285 personas. Estas personas se numeran 0001, 0002,…, 6284, 6285. ¿A quiénes
seleccionará para la entrevista, si selecciona la muestra con la tabla de dígitos aleato-
rios de los anexos del presente texto, empleando las primeras 4 columnas de la tabla,
recorriendo la tabla hacia abajo y comenzando en el renglón 10?
166 CAPÍTULO 11
Distribuciones
muestrales 12
Contenido
Distribuciones muestrales
Generalmente las poblaciones son demasiado grandes como para ser estudiadas en su
totalidad, por tanto, es necesario seleccionar una muestra representativa de un tamaño
que sea más manejable. Esta muestra se utiliza para sacar las conclusiones de la población
en estudio. La muestra seleccionada y constituida en la base de datos a trabajar permitirá
calcular elementos muestrales como la media, la varianza, la desviación estándar, propor-
ciones etc.
Por otra parte, a lo interno de las distribuciones muestrales trataremos sobre temas
de importancia, como ser los estimadores, criterios que debe tener un buen estimador, el
valor, análisis y cálculo de la media de medias, los principios del límite central y sus apli-
caciones, como también el uso de las distribuciones muestrales en el cálculo de probabi-
lidades y otros elementos de distribuciones normales.
EJERCICIOS 12.1
1. Suponga que está muestreando una población con una media de 2.15. ¿Qué tamaño
de la muestra garantizará que?:
a) La media muestral sea de 2.15;
b) El error estándar de la media sea cero.
2. Se sabe que una máquina que llena envases de suero oral tiene un llenado promedio
de 125 gramos y una desviación estándar de 20 gramos. Un empleado de control de
calidad tomó una muestra aleatoria de envases llenos y descubrió que la media mues-
tral era de 130 gramos. El gerente de la empresa supuso que la muestra tomada por el
empleado no es representativa. ¿Es correcta su conclusión?
3. El presidente del Colegio de Odontólogos de Honduras quiere determinar el número
medio de veces que cada uno de sus afiliados participa en eventos de la organización.
Para lograrlo pide a 100 empleados del colegio en mención y que aleatoriamente se
encuesten a 50 de sus afiliados en forma aleatoria y entregar al colegio de odontólo-
gos la información sobre el número medio de veces que los afiliados participan en los
eventos sociales de todo el año. Esos números se calculan y se envían al presidente
del colegio. ¿Ha recibido el presidente del colegio una muestra extraída de la pobla-
ción de afiliados o de alguna otra distribución?
4. Si usted fuese un investigador profesional, ¿Creería que todos los estimadores son
confiables?
Distribuciones muestrales 169
Ejemplo
De una población de tamaño N, se extrajeron cinco muestras las cuales tienen medias
muestrales de 12.5, 14.2, 13.3, 13.8 y 12.9 respectivamente. Calcular la gran media:
Solución
n
∑X i
i =1 12.5 +14.2+13.3 +13.8 +12.9 66.7
X= = = ≅ 13.34
n 5 5
170 CAPÍTULO 12
EJERCICIOS 12.3
1. Si la Secretaría de Salud dispone de los valores promedios en sus cuatros hospitales
regionales sobre eficiencia de servicios, y estos son 95%, 88%, 92% y 85% respectiva-
mente, ¿cuál es el valor promedio nacional de servicios de eficiencia en el área de la
salud?
2. Se toman cinco muestras de igual tamaño de las edades del personal del Hospital Pú-
blico de Comayagua en cinco unidades diferentes, las que a continuación se detallan:
1. 23 24 18 17 26 34 45 48 54 53 37 35 35 38 44 46
2. 51 42 36 17 19 21 21 24 29 27 33 37 45 57 40 31
3. 41 34 32 26 26 26 37 19 22 25 25 49 50 55 43 18
4. 26 34 19 18 34 39 39 48 51 44 40 45 42 37 20 20
5. 32 23 45 54 36 24 48 25 52 23 32 19 22 20 21 27
a) Calcule la media de cada muestra;
b) Calcule la gran media;
c) ¿Cuál de las medias muestrales es más próxima a la gran media y porque?
3. Si los siguientes datos representan el error promedio en la aplicación de leyes y regla-
mentos por instituciones del Estado, en el área de salud a través de quince oficinas
públicas en las ciudades de San Pedro Sula y Tegucigalpa, ¿cuál es el error promedio
global cometido por dichas instituciones en las ciudades en mención?
Errores promedio: 0.05, 0.03, 0.12, 0.19, 0.18, 0.09, 0.09, 0.07, 0.13, 0.17, 0.17, 0.16,
0.10, 0.12, 0.13.
Ya que el tamaño de la muestra es grande el teorema del límite central establece que
X es aproximadamente una distribución normal con media 𝜇 = 1.5 y varianza
σ2 1
σ x2 = = , por tanto:
n 100
X −1.50 1.20 −1.50
P ( X ≤ 1.20 ) = P ≤ = P (z ≤−3) ≅ 0.0013
1 ⁄ 100 1 ⁄ 100
172 CAPÍTULO 12
EJERCICIOS 12.4
1. Un sociólogo dedicado a la investigación científica quiere estimar la estatura prome-
dio de los hombres de cierta raza. Si se supone que la desviación estándar de la po-
blación es de 2.5 pulgadas y se selecciona al azar a 100 hombres, encuentre la
probabilidad de que la diferencia entre la media de la muestra y la media verdadera
de la población, no exceda 0.5 pulgadas.
2. Suponga que el sociólogo del ejercicio 1 quiere que la diferencia entre la media de la
muestra y la media de la población sea menor de 0.4 pulgadas, con una probabilidad
de 0.95. ¿Cuántos hombres tendrían que seleccionar para alcanzar su objetivo?
3. Siete clínicas médicas privadas de la región noroccidental de Honduras, ofrecen a su
personal un salario promedio de 4.00 dólares por hora con una desviación estándar
de 0.50 dólares. Las clínicas en mención emplean 64 trabajadores de cierto grupo
étnico. Estos trabajadores tienen un salario promedio de 3.90 dólares por hora. ¿Es
razonable suponer que el grupo étnico es una muestra aleatoria de los trabajadores en
el área de las clínicas? Calcule la probabilidad de obtener una media muestral menor
que o igual a 3.90 dólares por hora.
4. Se diseña un experimento para probar cuál de los laboratoristas A o B obtienen el
trabajo para manejar un nuevo y complejo equipo médico en un hospital. Se toma el
tiempo de 50 pruebas que involucran la realización de cierto trabajo en el nuevo equi-
po para cada trabajador. Si las medias de las muestras para las 50 pruebas difieren en
más de un segundo, el operador con la media más pequeña obtiene el empleo. De otra
manera, se considera que el experimento termina en empate. Si se supone que las
desviaciones estándar de los tiempos para ambos operadores son de 2 segundos,
¿cuál es la probabilidad de que el operador a obtenga el trabajo aun cuando los dos
son igualmente hábiles?
EJERCICIOS 12.5
1. Sea X una variable aleatoria con media 11 y varianza 9. Utilice el teorema de Chebys-
hev para encontrar:
a) Un límite inferior para P(6 < X < 16)
b) El valor de C talque P(∣X – 11∣ ≥ C) ≤ 0.09
2. Una fábrica de aparatos acústicos promete a sus clientes hacer sondas especiales para
mejorar el audio con un diámetro de 0.5 centímetros y una desviación estándar de
0.01 de centímetro. Utilizando el teorema de Chebyshev, encuentre un límite inferior
para el número de sondas de un lote de 400 con un diámetro de 0.48 y 0.52 centíme-
tros,
3. El número de bacterias por centímetro cúbico en ciertos cuerpos humanos tiene una
media de 100. Encuentre un intervalo que incluya al menos 5/9 de los valores mues-
trales del número de bacterias obtenido de un gran número de muestras de un centí-
metro cúbico, suponiendo que las bacterias tienen una distribución de Poisson.
4. El número de centros de salud afectados por la inestabilidad de un terreno no sólido
en un área urbana de un kilómetro cuadrado, tiene una distribución de Poisson con
una media λ = 10. En ésta parte de la ciudad las autoridades municipales hacen man-
tenimientos del terreno a un costo de 3 dólares por centros de salud, y con un costo
fijo de 50 dólares por alquiler de un equipo especial. Sea C el costo total de manteni-
miento para un kilómetro cuadrado seleccionado al azar. Encuentre el valor esperado
y la desviación estándar de C. Encuentre el intervalo que contiene a C con una proba-
bilidad de al menos 0.75.
leccionado más de una vez. Bajo estas condiciones el error estándar de la media puede cal-
σ
cularse mediante la fórmula: σ X = ; donde 𝜎 es la desviación estándar de la población
n
y n el tamaño de la muestra.
Ejemplo
Una muestra de tamaño 80, tiene una desviación estándar poblacional de 1.34. Calcular
el error estándar de la media:
Solución
σ 1.34 1.34 ≅
σX = = = 0.1498 Error estándar de la media
n 80 8.9443
Si la población es finita, es decir, tiene un tamaño limitado o establecido, entonces el
error estándar de la media es calculado mediante la fórmula siguiente:
σ N −n
σX = ;
n N −1
N = Tamaño de la población;
n = Tamaño de la muestra;
Donde: 𝜎 = Desviación estándar de la población;
N −n
= Multiplicador de población finita o factor de corrección de población
N − 1 finita.
Ejemplo 1
Supóngase que el Ministro de Salud desarrolla su política de rotación del personal de los
hospitales públicos, centros de salud y otros de similar condición, en los sectores más
vulnerables. Un estudio indica que la desviación estándar de la rotación anual es de 75
empleados en todo el complejo de salud. Si se muestrean cinco hospitales, calcular el error
estándar de la media.
Solución
n 5
Como = = 0.25 > 0.05; entonces:
N 20
σ N − n 75 20 − 5 75 15 75
σX = = = = ( 0.888 ) ≅29.8
n N −1 5 20 −1 2.236 19 2.236
Ejemplo 2
De una población de 150 estudiantes de cirugía dental de la UNICAH, se toma una mues-
tra de 6, sabiendo que la desviación estándar de la distribución es de 1.5. Calcular el error
estándar de la media.
Solución
n 6
Como = = 0.04 < 0.05, no hay necesidad de utilizar el factor de corrección
N 150
Distribuciones muestrales 175
∧ pq
σP= ; De igual manera si la desviación estándar de la población es desconocida la
n
fórmula del error estándar es representada por:
∧
∧ σ s
σX = =
n n
Ejemplo
Una encuesta realizada a la facultad de medicina de la UNICAH, reveló que los estudian-
tes de esta carrera que cursan el primer año, ven televisión un promedio de 37.2 horas por
semana. Se asume una desviación estándar de 5.4 horas. En una muestra de 100 estudian-
tes de medicina de primer año, ¿qué tan probable es que la media muestral sea?:
a) Más de 38 horas b) Menos de 36.6 horas c) Entre 36.4 y 37.9 horas
Solución inciso a)
X −µ 38 − 37.2
P (X ≥ 38) = P (X ≥ ) = P (Z ≥ ) = P (Z ≥1.48) = 0.5 − P (Z = 1.48) =
σX 5.4 / 100
0.0694
Solución inciso b)
X −µ 36.6 − 37.2
P (X < 36.6) = P (X < ) = P (Z < ) = P (Z < −1.10) = 0.5 − P (Z = 1.10) =
σX 5.4 / 100
0.1357
176 CAPÍTULO 12
Solución inciso c)
36.4 − 37.2 37.9 − 37.2
P (36.4 ≤ X < 37.9) = P ( ≤Z ≤ ) = P (−1.48 ≤ Z ≤ 1.30) =
5.4 / 100 5.4 / 100
P (Z = 1.48) + P (Z =1.30) = 0.4306 + 0.4032 = 0.8338
EJERCICIOS 12.6
1. De una muestra de 50 observaciones con media 10 y desviación estándar 1.004. Cal-
cule el error estándar para la media.
2. De una población de 500 se extrae una muestra de 30. Se sabe que la media es 14 con
una varianza de 4. Calcule el error estándar de la media.
3. La población de estudiantes de finanzas en la UNICAH a finales del año 2007 era de
655, con una media de edad de 19.4 años y una desviación estándar de 1.7 años. Se
toma una muestra de 60 estudiantes. Calcule el error estándar de la media.
4. Cuando se muestrea a partir de una población infinita. ¿Qué sucede con el error es-
tándar de la media, si el tamaño de la muestra:
a) Se incrementa de 25 a 225?
b) Se disminuye de 480 a 30?
c) Se aumenta de 20 a 45;
d) Se disminuye de 250 a 40?
5. Cuál es el valor del factor de corrección de la población finita cuando sucede:
a) n = 5 y N = 150?
b) n = 10 y N = 150?
c) n = 50 y N = 150?
6. En una población de tamaño N = 80, con una media de 8.2 y una desviación estándar
de 2.1. Calcule el error estándar de la media para los siguientes tamaños de muestra:
a n = 16
b) n = 25
c) n = 49
d) n = 64
e) n = 81
7. Un psicólogo entrevistó a 150 médicos y encontró que 42% eran incapaces de sumar
fracciones. Estime el error estándar de la proporción muestral.
8. El 8% de los estudiantes de ingeniería en la UNAH son zurdos. Se seleccionan 150
alumnos de esa población. Calcule el error estándar de la proporción.
9. En una muestra de 16 observaciones de una distribución normal con una media de
150 y una desviación estándar de 16, encuentre:
– – –
a) P(X < 160) b) P(X < 142) b) P(140 < X < 160)
10. El costo promedio a nivel nacional de un local para oficinas de la Secretaría de Salud
es de L. 50,000, con una desviación estándar de L. 3,000.
a) ¿Cuál es la probabilidad de que, en cierta localidad del país, el costo de un local
sea de al menos 55,000 lempiras?
b) ¿Cuál es la probabilidad de que el costo sea de a lo más 45,000 lempiras?
c) Entre 48,000 y 53,000 lempiras.
Distribuciones muestrales 177
11. La doctora María Barrios es auditora de un complejo hospitalario privado, y sabe que
en promedio el saldo mensual de determinado paciente atendido al crédito es de
5000 lempiras con una desviación estándar de 600 lempiras. Si la Doctora Barrios
revisa 50 cuentas al azar, ¿cuál es la probabilidad de que el saldo mensual promedio
esté:
a) Por debajo de 3500 lempiras?
b) Entre 4000 y 6000 lempiras;
c) Más de 5500 lempiras.
12. Se escogieron 64 elementos de una población de 125 elementos, con una media de
105 y una desviación estándar de 17.
a) ¿Cuál es el error estándar de la media?
b) ¿Cuál es la probabilidad de que la media se encuentre entre 107.5 y 109.
13. Un psicólogo ha determinado que una pequeña comunidad de Honduras el 8% de los
pobladores son daltónicos. Si se selecciona al azar 150 habitantes de esa población.
¿Cuál es la probabilidad de que la proporción de que son daltónicos sea:
a) Tan grande como 0.15? b) Esté entre 0.10 y 0.13?
c) Menores que 0.12? d) Mayores que 0.14?
14. Según una clínica de especialidades, el 15% de las personas están sometidas a algún
tipo de dieta. ¿Cuál es la probabilidad de que una muestra al azar de tamaño 100 de
una proporción de aquellos que se encuentran a dieta:
a) Sea mayor o igual al 20%?
b) Esté entre el 10 y 20 por ciento?
c) No mayor de 0.12?
15. En una muestra al azar de 75 personas adultas, 35 dijeron que el cáncer mamario era
curable. Si la proporción real de quienes piensan que dicho cáncer puede ser curado
es de 0.55. ¿Cuál es la probabilidad de una obtener una proporción tan pequeña o
menor que la obtenida en esa muestra?
178 CAPÍTULO 12
CAPÍTULO
Metodología científica y
temas relacionados 13
Contenido
P (TV ) P ( H / TV )
P (TV / H ) =
P (H )
P (TV ) P ( H / TV )
P (TV / H ) =
P ( H ) P ( H / TV ) + P ( NH ) P ( H / NTV )
P (TV ) P ( H / TV ) (0.001)(0.85)
P (TV / H ) = =
P ( H ) P ( H / TV ) + P ( PH / NTV ) (0.001)(0.85) +(0.999)(0.005)
0.00085 0.00085
= = = 0.1454 o 14.54%
0.00085 +0.004995 0.005845
Metodología científica y temas relacionados 183
U = {1, 2, 3, 4, 5,}
Se puede decir que el 3 pertenece al conjunto de los números impares, mientras que
el 8 no. Igualmente, el 9 pertenece al conjunto de los números mayores que el 5, mientras
que el 3 no. La pertenencia a un conjunto de diferentes elementos suele representarse
gráficamente mediante la denominada función de pertenencia (ver cuadro 5). En la fun-
ción de pertenencia toman valor 1 aquellos elementos que pertenecen al conjunto, mien-
tras que toman valor 0 aquellos que no pertenecen. La teoría de conjuntos borrosos pro-
pone la extensión del concepto de pertenencia para que admita graduación entre la no
pertenencia y la pertenencia total al conjunto.
Así, si se trata del conjunto de las personas mayores, se puede decir que una persona
de 30 años pertenece a dicho conjunto con grado 0 (es decir, no pertenece), una de 50
pertenece con algún grado (es decir 0.4) y una persona de 78 años pertenece con grado 1
(es decir, pertenece completamente).
Los conjuntos borrosos proporcionan una manera de definir conjuntos para los que
la pertenencia sea una cuestión de grado, o no esté completamente definida. Establecen
una frontera gradual entre la no pertenencia y la pertenencia, y por tanto conforman una
herramienta para el modelado de la imprecisión o la incertidumbre.
Esta sistemática ha permitido tratar numerosos problemas cuya resolución según es-
quemas y técnicas clásicas no es completamente satisfactoria.
Un dominio como la medicina donde, en muchos casos, la imprecisión o la vaguedad
son parte intrínseca del conocimiento se beneficia de abordaje más relativista en cuanto a
cuál puede ser la mejor decisión ante un supuesto determinado influido por muchos fac-
tores de cuantificación imprecisa.
La utilización de la lógica borrosa es pues aconsejable para procesos muy complejos,
es decir, cuando se carece de un modelo matemático simple o para procesos altamente no
lineales, o si el procesamiento (lingüísticamente formulado) del conocimiento experto
puede ser desempeñado. Es un lenguaje que permite trasladar sentencias sofisticadas del
lenguaje natural a un formalismo matemático.
Por su parte la lógica clásica impone a sus enunciados únicamente los valores falso o
verdadero, modelando una gran parte del razonamiento natural. Pero el razonamiento
humano utiliza valores de verdad que no tienen por qué ser necesariamente tan determi-
nistas. Por medio de la lógica borrosa pueden formularse matemáticamente nociones
como “ligera mejoría”, “menos agresivo” u “orina más clara”. La lógica borrosa permite
trabajar con estos parámetros llegando a cuantificar expresiones humanas vagas o poco
precisas, pero que tienen un elevado valor expresivo en términos reales y que resultan
convincentes a la hora de justificar o no la toma de una decisión. Esta lógica cuantifica las
descripciones imprecisas que se usan en el lenguaje y otorgarles un grado, a partir del que
es posible establecer una concatenación de sucesos cuestionables y, en función de éstos,
184 CAPÍTULO 13
asignar una determinada vía de salida hacia una solución del problema. La habilidad de
la lógica borrosa para procesar de forma eficiente valores parciales ha sido de gran ayuda
para la ingeniería y la medicina, pues elabora aproximaciones matemáticas en la resolu-
ción de ciertos tipos de problemas, produciendo resultados exactos a partir de datos im-
precisos, lo cual resulta útil en la elaboración de guías clínicas o algoritmos de actuación.
La lógica borrosa puede llegar a redefinir los grados de veracidad de los enunciados
de salida conforme se refinan los de entrada, por lo que algunos de sus sistemas precisan
de aprendizaje, y son excelentes mecanismos de control de procesos. Se pueden evaluar
mayor cantidad de variables, como las lingüísticas y las no numéricas, que son habitual-
mente manejadas en el conocimiento humano. Con ello se hacen inteligibles complejos
algoritmos decisorios que parten de apreciaciones subjetivas. Es posible relacionar entra-
das y salidas, sin tener que entender todas las variables, permitiendo que el sistema pueda
ser más fiable y estable que un sistema de control lógico convencional. El sistema difuso
no precisa conocer todas las variables antes de empezar a trabajar, lo que permite simpli-
ficar la asignación de soluciones a problemas sin resolver previamente, y obtener prototi-
pos rápidamente.
Introducción
Puede encontrarse tantas definiciones de ensayo clínico como enfoques posibles tiene el
tema, aunque predomina el enfoque epidemiológico y el finalista (su uso para investigar
fármacos). Desde la más simple, que lo define como “una prueba científica de un fárma-
co, aceptada por el enfermo y amparada por la ley” a las más complejas; de las más am-
plias a las más restrictivas, hay una amplia variedad.1 Podemos decir que el ensayo clínico
consiste en un estudio experimental y prospectivo en el cual el investigador provoca y
controla las variables y los sujetos (pacientes, la mayoría de los casos) son asignados de
forma aleatoria a las distintas intervenciones que se comparan. Debido a que es el tipo de
estudio epidemiológico que presenta menores errores sistemáticos o sesgos, constituye la
mejor prueba científica para apoyar la eficacia de las intervenciones terapéuticas. El ele-
mento esencial del ensayo es la existencia de un grupo de comparación o grupo de con-
trol, que permite probar si la nueva intervención (por ejemplo un nuevo fármaco) es me-
jor o no que las ya existentes o que no intervenir (placebo).
Un ensayo clínico se inicia cuando surge una hipótesis a partir de estudios no contro-
lados observacionales, descriptivos o retrospectivos, o de estudios preclínicos. Frecuente-
mente se descubren en investigaciones preclínicas posibilidades terapéuticas que no tie-
nen ningún beneficio en un ensayo clínico. Muchas veces se realizan actividades médicas
cuya utilidad no ha sido demostrada mediante un ensayo clínico, sin embargo, llevarlo a
la práctica es difícil, sobre todo por el costo económico y de tiempo. Después de ser dise-
ñado debe ser aprobado por un comité de bioética, los pacientes que forman parte deben
Metodología científica y temas relacionados 185
conocer los objetivos del estudio, sus riesgos y beneficios y firmar el consentimiento infor-
mado y podrán abandonar el estudio cuando quieran. El ensayo clínico finaliza cuando
acaban los plazos de tiempo definidos en el protocolo, o cuando de forma prematura son
manifiestamente perjudiciales o beneficiosos los efectos en el brazo experimental.
El ensayo clínico es el estudio clínico que posee el nivel de evidencia más alto para
demostrar que el procedimiento médico que se realiza es el más adecuado con los cono-
cimientos científicos que existen en ese momento, debido al diseño del estudio, donde las
variables estadísticas están controladas para evitar los sesgos. Así pues, junto con los es-
tudios de meta análisis son la base de lo que se conoce como medicina basada en la evi-
dencia, que no es más que el respaldo de las prácticas clínicas con pruebas consistentes
desde el punto de vista científico.
Clasificación
Existen diferentes tipos de clasificaciones en virtud del factor que tengamos en cuenta
para realizarla. Las clases obtenidas no son, en la mayoría de los casos, incompatibles
entre sí, sino que se solapan, perfeccionándose en la combinación de unas con otras. Así,
en la adecuada combinación de las clases podremos llegar al ensayo clínico ideal (aunque
éste será variable en función de las circunstancias de la investigación). En la siguiente ta-
bla se muestran algunas de ellas.
ción del estudio, y cuya idoneidad depende de las características del ensayo a efectuar. En
medicina y otras ciencias biológicas, las técnicas de aleatorización más usadas son:
exhaustiva. Los ensayos clínicos deben pasar por un comité de ética. Este comité verifica-
rá el interés científico y médico del estudio, la relación riesgo/beneficio, la conformidad
con las buenas prácticas metodológicas sobre todo a las que conciernen al promotor y al
investigador principal del estudio y la presencia de un seguro que permita indemnizar a
los participantes en el estudio en caso de daño. Las relaciones financieras entre los inves-
tigadores y los promotores del estudio, cuando existan deben ser anunciadas. Los conflic-
tos de intereses deben ser evitados.
Ezequiel Emanuel refiere siete requisitos que deben guiar la evaluación del marco
ético de las propuestas de investigaciones clínicas. Estos requisitos especiales se hacen
necesarios porque los sujetos de investigación pasan a ser el medio por el cual se obtiene
el conocimiento y en esta condición, el hombre puede ser explotado al exponerlo al riesgo
de ser perjudicado en pos del bien de otros. En este contexto, estos requisitos reducen al
mínimo el riesgo de explotación y les asegura ser tratados con respeto.
Estos siete requisitos proporcionan un marco sistemático y racional para determinan
si una investigación clínica es ética. A su vez, éstos han sido elaborados para guiar el de-
sarrollo y la ejecución de los protocolos y su revisión. Los requisitos han sido elaborados
para ser universales, sin limitaciones a una situación en particular, un país o un grupo de
investigación.
Valor
La investigación clínica debe tener valor (importancia social, científica o clínica), es decir,
que sus resultados deben tener la probabilidad de promover mejoras en la salud, el bien-
estar o el conocimiento de la población. La razón por la cual una investigación clínica
debe tener valor está en dos puntos: el uso responsable de recursos limitados (dinero, es-
pacio y tiempo), esto de la mano del concepto de equidad, y evitar la explotación (la ex-
posición de personas a riesgos y daños potenciales sin obtener resultados valiosos). El
requisito de que la investigación clínica sea valiosa asegura a los sujetos de investigación
que no serán expuestos a riesgos sin la probabilidad de algún beneficio personal o social.
Validez científica
En este caso, la mala ciencia no es ética. Un estudio con sujetos humanos que ha sido mal
diseñado (y por lo tanto no puede producir observaciones reproducibles, o sea, hechos
científicos) no es ético. Su metodología debe ser válida y prácticamente realizable, tenien-
do un objetivo científico claro, estar diseñada usando principios, métodos y prácticas de
efecto seguro aceptados, tener poder suficiente para probar definitivamente el objetivo, un
plan de análisis de datos verosímil y poder llevarse a cabo.
La búsqueda de validez científica se basa también en los dos principios: utilización de
recursos limitados y evitar la explotación. Sin validez sería desperdiciar recursos y no se
podría generar ningún conocimiento, producir algún beneficio o justificar la exposición de
las personas a riesgos o daños.
Selección equitativa del sujeto
Este requisito tiene cuatro facetas: el requisito de la selección equitativa del sujeto se
sustenta en el principio de la equidad distributiva (los beneficios y las cargas de la vida
social deben ser distribuidos equitativamente). Así todos deben poder recibir los benefi-
cios obtenidos en la investigación, especialmente, aquellos que corrieron el riesgo, y los
riesgos a su vez no deben caer solo en grupos vulnerables.
Proporción favorable de riesgo-beneficio
Tomando en cuenta que el grado de riesgo-beneficio es incierto, siendo mayor la incerti-
dumbre en las primeras etapas, a una investigación clínica se le pide que:
1. Los riesgos potenciales a los sujetos individuales se minimizan.
2. Los beneficios potenciales a los sujetos individuales o a la sociedad se maximizan.
3. Los beneficios potenciales son proporcionales o exceden a los riesgos asumidos.
Metodología científica y temas relacionados 189
A su vez, todos los riesgos potenciales son sostenidos por los sujetos individuales,
pudiendo recibir beneficios potenciales, mientras que los beneficios principales son reci-
bidos por toda la sociedad. Por tal razón es válido tomar en cuenta los riesgos y beneficios
potenciales para los sujetos, y los riesgos para los sujetos comparados con los beneficios
de la sociedad.
A pesar de carecer de fórmulas que permitan determinar la proporcionalidad del
riesgo-beneficio, las evaluaciones de los riesgos y beneficios de la investigación son juicios
que pueden implicar normas explícitas basadas en un delineado sistemático, sobre la base
de datos existentes, de los tipos potenciales de riesgo y beneficio, su probabilidad de ocu-
rrir y sus consecuencias a largo plazo.
Se debe poner especial cuidado respecto a la cercanía a la explotación cuando los
riesgos potenciales de los sujetos individuales superan el potencial de beneficio a la socie-
dad, sobre todo en la primera fase de la experimentación donde no se espera ningún be-
neficio para el individuo. Los individuos no sopesan esta situación por lo general, pero los
responsables de las políticas habitualmente si lo hacen. Al respecto no existe un marco
determinado sobre cómo se debe balancear esta situación.
Los principios insertos en este requisito son los de beneficencia y no-maleficencia.
Esta última sostiene que no se debe causar daño a una persona, por lo que se deben mini-
mizar los riesgos de la investigación. El principio de beneficencia se refiere a la obligación
moral de actuar en beneficio de otros, en este caso maximizando los beneficios de la in-
vestigación para los sujetos involucrados y la sociedad. Asegurando que los beneficios
excedan los riesgos se evita la explotación.
Evaluación independiente
Dado que los investigadores tienen potencial de conflicto de múltiples intereses, pueden in-
voluntariamente distorsionar sus juicios sobre el diseño y la realización de la investigación,
el análisis de los datos y su adherencia a los requisitos éticos. Todo esto se puede minimizar
por medio de una evaluación independiente realizada por peritos independientes al estudio,
y con autoridad para aprobar, enmendar o cancelar la investigación. Otra razón para hacer
una evaluación independiente es la responsabilidad social. Así se vela por el cumplimiento
de los requisitos éticos de un estudio o investigación, garantizando a la sociedad que las
personas inscritas para los ensayos serán tratadas éticamente y no solo como medios.
Consentimiento informado
Su objetivo es que los sujetos que participan en investigaciones clínicas lo hagan cuando
esta sea compatible con sus valores, intereses y preferencias. El consentimiento informa-
do tiene los siguientes requisitos: la provisión de información sobre la finalidad, los ries-
gos, los beneficios y las alternativas a la investigación y de su propia situación clínica, y la
toma de una decisión libre no forzada sobre si participar o no. Con todo esto los sujetos
pueden tomar decisiones racionales y libres.
El consentimiento informado atiende a la necesidad del respeto por las personas y a
sus decisiones autónomas. Las personas tienen un valor intrínseco debido a su capacidad
de elegir, modificar y proseguir su propio plan de vida. El consentimiento informado res-
peta entonces a la persona y a su autonomía.
4. Debe informarse a los sujetos sobre los conocimientos científicos obtenidos como
resultado de la investigación.
5. Se debe ir evaluando a medida que avanza el estudio el bienestar de los sujetos, para
pesquisar la aparición de reacciones adversas, para poder prestarles un tratamiento
adecuado y oportuno, y retirarlo de la investigación si fuese necesario.
2. Objetivos de la investigación
Antes de iniciar cualquier investigación se debe tener bien definido qué, y por qué se va a
investigar, cómo se llevará a cabo dicha investigación, es decir, en qué condiciones y con
cuáles recursos. Cuándo y dónde se va realizar. La contestación adecuada al qué, cómo,
cuándo y dónde; su desglose en metas, tareas y actividades menores; la obtención de los
recursos físicos, financieros, bibliográficos y humanos son fundamentales para el desarro-
llo del cronograma de la investigación.
Una vez definidas las posibles respuestas a los anteriores interrogantes, complete se-
ñalando las acciones que usted va a realizar como investigador y que le van a permitir
cumplir lo que ha propuesto. Utilice el infinitivo al señalar la formulación de las acciones
que quiere ejecutar (los objetivos siempre deben empezar con un verbo infinitivo).
Debe haber un objetivo principal o general y como mínimo tres objetivos específicos
los cuáles serán las acciones o herramientas que servirán para alcanzar el objetivo general.
4. Formulacion de la hipotesis
La hipótesis es una proposición que nos permite establecer relaciones entre hechos. Su
valor reside en la capacidad para establecer unas relaciones entre los hechos y explicar del
por qué se producen. La hipótesis es una proposición para responder tentativamente un
problema; indica por lo tanto qué estamos buscando, va siempre hacia adelante; es una
proposición que puede ser puesta a prueba para determinar su validez. Al final esta afir-
mación puede ser rechazada o replanteada.
6. Recoleccion de la información
Una de las etapas más importantes de la investigación estadística es la recolección de
datos. La información se puede recolectar por diferentes medios, entre los cuales los más
comunes son: por observación directa, por encuestas, por publicaciones o fuentes exter-
nas confiables que se hayan realizado.
En esta etapa se deben de diseñar las preguntas que se realizarán en la encuesta, si se
va a tener criterios demográficos vinculados a factores que se relacionen con el área de la
salud y las ciencias médicas, como es el caso especial del presente texto.
7. Procesamiento de la información
Consiste en ordenar la información, filtrarla, eliminando los posibles errores, (donde es
fundamental el conocimiento de la población por parte de quien depura y filtra para po-
der detectar las falsedades en las respuestas), tabularla mediante la utilización de cuadros
o tablas estadísticas donde se resume la información de acuerdo al interés específico del
investigador, y analizar la información mediante los métodos y normas estadísticas.
Cabe anotar que para la presentación final hay que tener en cuenta a quien va dirigida
la información por lo tanto es indispensable combinar gráficos, tablas y cuadros con el fin
de que la información llegue con claridad y permita hacer los análisis fácilmente.
El avance tecnológico y la masificación de las computadoras hacen que estas tareas
manualmente engorrosas sean realizadas fácilmente y en muy corto tiempo. Se debe men-
cionar que tipos de análisis se van a realizar con la información, y cómo se van a tabular
las diferentes variables.
8. Publicacion
Es la etapa final de entrega de la información después de revisada, donde quedan consig-
nados todo el resultado de la investigación. Estos resultados deben presentarse adecuada-
mente de tal manera que puedan servir para estudios posteriores.
13.5.1 Sensibilidad
Es la probabilidad de clasificar correctamente a un individuo enfermo, es decir, la proba-
bilidad de que para un sujeto enfermo se obtenga en la prueba un resultado positivo. La
sensibilidad es, por lo tanto, la capacidad del test para detectar la enfermedad.
Cuando los datos obtenidos a partir de una muestra de pacientes se clasifican en una
tabla como la anterior, fácil estimar a partir de la información en ella la sensibilidad como
la proporción de pacientes enfermos que obtuvieron un resultado positivo en la prueba
diagnóstica. Es decir:
VP
Sensibilidad =
VP + FN
Donde VP es la prueba que resultó verdadera positiva y FN la prueba que resultó falsa
negativa. De ahí que también la sensibilidad sea conocida como “fracción de verdaderos
positivos (FVP)”.
13.5.2 Especificidad
Representa la probabilidad de una prueba en la que un paciente sano tenga un resultado
negativo en la prueba, y se puede calcular mediante la fórmula siguiente:
VN
Especificidad =
VN + FP
Donde VN serían los verdaderos negativos; y FP, los falsos positivos.
En conclusión, la sensibilidad es la fracción de verdaderos positivos (FVP) y la espe-
cificidad, la fracción de verdaderos negativos (FVN).
No obstante, cada prueba tendrá mayor o menos porcentaje tanto en especificidad
(SP) como en sensibilidad (SE) dependiendo de los resultados y el acompañamiento de
información adicional generada a través de los valores de predicción, probabilidades pre-
test y postest, y el coeficiente de verosimilitud, para establecer con mayor seguridad si el
paciente que tuvo una prueba negativa, está realmente enfermo, o el paciente que tuvo una
prueba positiva está sano.
La información o situaciones referidas en el párrafo precedente es de mucha utilidad
en el diagnóstico clínico, ya que por ejemplo se puede llegar a conclusiones aduciendo
que, si el valor de la especificidad supera 80% se considera que la prueba es buena.
Por regla general, se elige una prueba muy específica cuando prefieres obtener falsos
negativos en lugar de falsos positivos, y así asegurar de que un paciente tiene realmente
una enfermedad. Por ejemplo, una prueba para detectar una enfermedad que implique
una operación, es imprescindible asegurarse de que el paciente está enfermo y necesita la
operación, para no operar a un paciente sano.
Otros casos en los que se usa una prueba muy específica son: al tratarse de una enfer-
medad grave y prácticamente incurable, cuando es importante desde el punto de vista
sanitario y psicológico saber que no se padece la enfermedad, cuando un resultado positi-
vo falso supone un trauma económico y psicológico para el sujeto. En estas situaciones se
utiliza una prueba con un valor predictivo positivo alto, que aumenta de valor, conforme
la prevalencia de la enfermedad de esta es mayor.
En cambio, se elige una prueba muy sensible cuando se prefiere obtener falsos positi-
vos en lugar de falsos negativos, es decir, quieres que el número de enfermos sin detectar
sea mínimo. Por ejemplo, en una epidemia es importante usar una prueba muy sensible,
194 CAPÍTULO 13
puesto que es necesario aislar a los enfermos y para ello todos deben ser detectados. Se
usa en casos en que la enfermedad es grave pero curable, existiendo tratamiento para ella.
En estos casos se usan pruebas con valor predictivo negativo alto, cuyo valor aumenta
conforme disminuye la prevalencia de la enfermedad.
Concentración de glucosa % %
sanguinea (mg/100 ml) Sensibilidad Especificidad
70 98.1 8.8
80 97.1 25.5
90 94.3 47.6
100 88.6 69.8
110 85.7 84.1
120 71.4 92.5
130 64.3 96.9
140 57.1 98.4
150 50.0 99.6
160 47.1 99.8
170 42.9 100
180 38.6 100
190 34.3 100
200 27.1 100
13.5.4 Prevalencia
Es la proporción porcentual del resultado de casos identificados con una x enfermedad,
del total de pobladores en riesgo, para lo cual podemos aplicar la fórmula siguiente:
PREV =
∑P (+) × 100
Población en riesgo
Ejemplo
Si la comunidad de Santa Mónica en una provincia de Centroamérica tiene una población
de 450,000 habitantes de los cuales 25,835 de estos habitantes han sido diagnosticados
con un tipo de cáncer de piel. Determinar la prevalencia de esta enfermedad en dicha
comunidad.
Metodología científica y temas relacionados 195
Solución
Como la prevalencia está dada por:
∑P (+)
PREV = ×100 = (25835/450000)(100) = 5.74%
Población en riesgo
De este resultado se puede concluir que, de cada 100 pobladores en Santa Mónica, 6
pueden tener una prevalencia de la enfermedad.
13.5.6 Combinación de factores
Como en la teoría de los diagnósticos clínicos es de vital importancia el manejo de diver-
sos factores como la sensibilidad, la especificidad, la prevalencia y valores predictivos en
pruebas diagnósticas, a continuación conjugamos los resultados antes mencionados:
Ejemplo 1
Un estudio en el que se incluyó a 2641 pacientes con sospecha de cáncer prostático que
acudieron a una consulta de urología durante un periodo determinado.
196 CAPÍTULO 13
Durante su exploración, se recogió el resultado del tacto rectal realizado a cada uno
de estos pacientes, según fuese éste normal o anormal, y se contrastó con el posterior
diagnóstico obtenido de la biopsia prostática.
Los datos del estudio y los resultados obtenidos se muestran en la siguiente tabla:
Solución
Resultados tabla:
55
Sensibilidad = = 0.528×100 =52.88%
104
Metodología científica y temas relacionados 197
84
especificidad = = 0.9231×100 =92.31%
91
falsos positivos = 1 − especificidad = 1 − 0.9231 = 0.0769x100 = 7.69%
Ejemplo 3
La siguiente tabla representa los datos del ultrasonido en el diagnóstico del carcinoma
primario de hígado, establecidos a través de una biopsia por aspiración.
Solución
Resultados tabla:
16
sensibilidad = ×100 =76.2%
21
falsos negativos = 1 − sensibilidad = 1 − 0.762 = 0.238x100 = 23.8%
31
especificidad = ×100=79.4%
39
falsos positivos = 1 − especificidad = 1 − 0.794 = 0.206x100 = 20.6%
Ahora, el problema nos pide el cálculo del valor predictivo positivo (VPP) y valor
predictivo negativo (VPN).
Metodología científica y temas relacionados 199
{
Námesis
Circunstancias intermedias = Laboratorio
Exploración
Imagen
Probabilidad postest
Asimismo, la probabilidad postest se puede estimar o se puede medir, en ambos casos la
medición es mucho más exacta, ya que estimamos un x% vía la presencia de síntomas,
radiografías y otros; mientras que cuando ésta se mide podemos contar con el apoyo de
exámenes y sus resultados, identificación de otros focos de infección, cultivos y otros.
Notas:
1. Si el coeficiente de verosimilitud es igual a 1, entonces la probabilidad pretest y la
probabilidad postest, no cambia o sea sigue siendo la misma;
2. Si el coeficiente de verosimilitud es mayor que 1, entonces la probabilidad postest, es
más alta que la probabilidad pretest; y,
3. Si el coeficiente de verosimilitud es menor que 1, entonces la probabilidad postest, es
más baja que la probabilidad pretest.
Ejemplo
La siguiente tabla representa los resultados de 10,000 pacientes, en donde se puede veri-
ficar un 70% de sensibilidad, y un 95% de especificidad, con una Prevalencia de un 7%.
VN
b) Especificidad =
VN + FP
probabilidad PRETEST
a) ODDS PRETEST =
1 −probabilidad PRETEST
Si el test es positivo el factor CVERO en la fórmula, será el valor del CVERO (+) y si el
test es negativo el factor CVERO, será el valor numérico del CVERO (–).
Ejemplo 1
Tomando el cuadro del ejemplo anterior, en donde los resultados de 10,000 pacientes
verificaban un 70% de sensibilidad, un 95% de especificidad, y una prevalencia del 7%.
202 CAPÍTULO 13
Calcular:
a) Calcular el ODDS PRETEST;
b) Calcular el ODDS POSTEST, positivo y negativo;
c) Calcular la probabilidad POSTEST, cuando el test es positivo;
d) Calcular la probabilidad POSTEST, cuando el test es negativo;
Solución inciso a)
Datos:
Sensibilidad = 70%
Especificidad = 95%
Prevalencia = 7%
sensibilidad 0.7 0.7
CVERO(+) = = = =14
1 −especificidad 1 −0.95 0.05
Entonces el cálculo para un ODDS POSTEST, cuando el test sea positivo, tendre-
mos:
ODDS PRETEST = (ODDS PRETEST)(CVERO(+)) = (0.075)(14) = 1.054
Y en el caso del test negativo:
ODDS PRETEST = (ODDS PRETEST)(CVERO(–)) = (0.075)(0.315) = 0.236
Solución inciso c)
Datos:
ODDS PRETEST = 1.054 (test positivo)
Metodología científica y temas relacionados 203
ODDS POSTEST
Como la Probabilidad POSTEST =
1+ ODDS POSTEST
En el caso del test positivo tendremos:
ODDS POSTEST 1.054 1.054
Probabilidad POSTEST = = = = 0.513 o 51.3%
1 + ODDS POSTEST 1 +1.054 2.054
Solución inciso d)
Datos:
ODDS PRETEST = 0.236 (test negativo)
ODDS POSTEST
Como la probabilidad POSTEST =
1+ ODDS POSTEST
Ejemplo 2
Para la tabla del ejemplo 1, utilice una prevalencia de 15%, y calcule las probabilidades
POSTEST, tanto para el test positivo como para el test negativo.
(Recuerde que debe mantener la sensibilidad de 70% y especificidad de 95%)
Tabla anterior:
Nueva tabla con prevalencia del 15%, sensibilidad de 70% y especificidad de 95%.
Luego el riesgo relativo dependiendo de la razón pedida a calcular tendrá una fórmu-
la variante de acuerdo al caso. Por ejemplo, si se pide calcular el riesgo relativo de enfer-
mos expuestos, esta se plantea en la forma siguiente:
EE
EE + ES
RR =
NEE
NEE + NES
Ejemplo
De una población de 5000 pacientes, en donde según estudios se ha determinado la can-
tidad de pobladores afectados y no afectados por una epidemia de gripe no común, como
se presentan en el cuadro siguiente:
Solución inciso a)
Entonces la fórmula que aplicaríamos en éste caso para expuestos enfermos, tenemos:
EE 1500
EE + ES 0.75
RR = = 2000 = = 0.45
NEE 500 1.66666
NEE + NES 3000
Solución inciso b)
Entonces la fórmula que aplicaríamos en éste caso para no expuestos enfermos, tenemos:
NEE 500
NEE + NES 3000 1.66666
RR = = = = 2.23
EE 1500 0.75
EE + ES 2000
Solución inciso c)
Entonces la fórmula que aplicaríamos en éste caso para expuestos sanos, tenemos:
ES 500
ES + EE 2000 0.25
RR = = = = 0.30
NES 2500 0.83
NES + NEE 3000
Solución inciso d)
Entonces la fórmula que aplicaríamos en éste caso para no expuestos sanos, tenemos:
NES 2500
NES + NEE 3000 0.83
RR = = = = 3.34
ES 500 0.25
ES + EE 2000
13.5.11 Análisis de supervivencia
Esta medida no queda limitada a los términos de vida o muerte, sino a situaciones en la
que se mide el tiempo que transcurre hasta que sucede un evento de interés, como puede
ser tiempo de recurrencia, tiempo que dura la eficacia de una intervención, tiempo de un
aprendizaje determinado, etc. Por tanto, la supervivencia es una medida de tiempo a una
respuesta, fallo, muerte, recaída o desarrollo de una determinada enfermedad o evento. El
término supervivencia se debe a que en las primeras aplicaciones de este método de aná-
lisis se utilizaba como evento la muerte de un paciente. En las enfermedades crónicas,
tales como el cáncer, la supervivencia se mide como una probabilidad de permanecer vivo
durante una determinada cantidad de tiempo.
La supervivencia al año o a los 5 años, son a menudo expresadas como indicadores
de la severidad de una enfermedad y su pronóstico. Típicamente, el pronóstico del cáncer
se valora determinando el porcentaje de pacientes que sobrevive al menos cinco años
después del diagnóstico. Son muchos los textos que se pueden consultar acerca de la me-
todología estadística a emplear en estudios de supervivencia.
La teoría de la supervivencia en las ciencias médicas tiene como objetivo familiarizar-
se con los conceptos y terminología básica del análisis de supervivencia, conocer cómo
estimar la proporción acumulada de supervivencia, así como los tests estadísticos a em-
plear para comparar dos curvas de supervivencia.
Metodología científica y temas relacionados 207
Conceptos básicos:
La observación de cada paciente se inicia con el diagnóstico (tiempo = 0) y continua
hasta la muerte o hasta que el tiempo de seguimiento se interrumpe. Cuando el tiempo de
seguimiento termina antes de producirse la muerte o antes de completar el período de
observación se habla de paciente “censurado”. El periodo de seguimiento puede terminar
por las siguientes razones:
a) El paciente decide no participar más en el estudio y lo abandona;
b) El paciente se pierde y no tenemos información; y,
c) El estudio termina antes de aparecer el evento.
Cuando los tiempos de supervivencia no se conocen con exactitud, los datos se con-
sideran censurados. No se conoce el tiempo hasta el suceso de interés (muerte, recaída)
porque los individuos en estudio pueden haberse perdido o retirado, o el suceso puede no
haber ocurrido durante el período de estudio. El seguimiento viene definido por una fecha
de inicio y una fecha de cierre que determinan el tiempo de seguimiento.
Las fechas de inicio y cierre son diferentes para cada individuo, pues los pacientes o
personas incluidas en el estudio se incorporan en momentos diferentes. En las observacio-
nes incompletas (censuradas) el evento de interés no se ha producido, ya sea porque el
estudio se finalizó, antes de la aparición del evento, el paciente decide abandonar y no
participar en el estudio, perdemos al paciente por cambio en el lugar de residencia, muer-
te no relacionada con la investigación, etc.
Ejemplo
En el presente cuadro se detallan todas las posibles pérdidas para cada individuo, en un
tiempo determinado después del inicio de la observación.
F
E
D
C
B
A
0 2 4 6 8 10 12
EJERCICIOS 13.5
1. Investigadores médicos en Honduras, tomaron una muestra de 4500 personas pro-
pensas a padecer diabetes. Según información de los hospitales públicos en la zona
norte del país, y que según los médicos que atienden los casos de glicemia en dicha
zona, estiman que la prevalencia debido a pruebas de test realizadas con anterioridad
en la muestra tomada por estos investigadores, es de un 27%.
a) Construya la tabla adecuada de pruebas de test;
b) Calcular los valores: Verdaderos Positivos (VP), Verdaderos Negativos (VN),
Falsos Positivos (FP) y Falsos Negativos (FN);
c) Calcule la sensibilidad y especificidad de la prueba.
2. El siguiente cuadro representa la validez de procedimientos simplificados para deter-
minar que niños tienen sospecha de diabetes.
a) Calcular la sensibilidad
b) Calcular la especificidad
3. Si al completar la tabla del ejercicio anterior tenemos que:
Calcular:
a) El coeficiente de verosimilitud (CVERO);
b) Los ODDS RATIO;
c) La probabilidad POSTEST para un test positivo; y,
d) La probabilidad POSTEST para un test negativo.
Metodología científica y temas relacionados 209
Determinar:
a) La prevalencia
b) La sensibilidad
c) La especificidad;
d) Los valores de predicción positiva y negativa
e) El coeficiente de verosimilitud
f) Los ODDS RATIO
g) La probabilidad POSTEST, para test positivos
h) La probabilidad de POSTEST, para test negativos
i) El riesgo relativo (RR) del tacto rectal anormal benigno.
210 CAPÍTULO 13
CAPÍTULO
Estimaciones
14
Contenido
Estimaciones
Permanentemente todo mundo hace estimaciones. Cuando nos preparamos a cruzar una
calle, estimamos la velocidad del automóvil que se acerca, la distancia entre él y nosotros,
y también ambas velocidades. Una vez efectuadas estas estimaciones, decidimos cruzar la
calle o no, y en caso que decidamos hacerlo, pensamos si debemos cruzar en forma rápida
o caminando sin mucha prisa.
En asuntos relacionados a problemas administrativos y de la ingeniería, la mayoría de
profesionales responsables de la conducción y éxito de las instituciones o empresas que
rectoran, recurren a las estimaciones para la toma de decisiones, inclusive bajo las peores
condiciones de incertidumbre.
Este capítulo tiene como objetivo establecer los métodos que nos permitan estimar
con una exactitud razonable parámetros poblacionales de utilidad en la toma decisiones,
así como formular una afirmación sobre el error que posiblemente acompañe a dicha es-
timación, lo que nos permitirá aplicar algunos controles para evitar en lo posible el error.
Mediante esta teoría, en estadística se pueden realizar tres tipos de estimaciones res-
pecto a una población, entre ellas: la estimación puntual, la estimación por intervalo y la
estimación por intervalo de confianza.
dor como el comprador aceptan utilizar ésta estimación puntual como base de la factura-
ción y el fabricante se ahorrará el tiempo y dinero que supone contar cada jeringa que se
mete en la caja.
Ejemplo 2
Con los datos de la tabla del ejemplo 1 o ejemplo anterior, calcule la estimación puntual
de la varianza y la desviación estándar de la población.
Solución
Como el estimador de la varianza de la población está dado por:
∑x2 n (X )
2
365368 35(102)2 1228 ≅
s2 = − = − = 36.12
n −1 n −1 34 34 34
Luego el estimador para la desviación estándar lo calculamos por
s = s 2 = 36.12 ≅ 6.01
∑ ( x − x )2 ∑( x − x)2
s2 = y s=
n n
Estimación puntual de la proporción de la población
La proporción de unidades que poseen una característica particular en determinada po-
blación se representa con P. Si conocemos la proporción de unidades de una muestra que
—
tienen esa misma característica (denotada por P ), podemos utilizar esta última como es-
—
timador de P. Por otra parte, puede demostrarse que P tiene todas las propiedades desea-
bles mencionadas anteriormente como criterios de un buen estimador: insesgado, con-
gruente, eficiente y suficiente.
Ejemplo
Supóngase que el jefe del almacén central de la Secretaría de Salud desea estimar el nú-
mero de cajas que contienen medicamentos que llegaron dañadas por el deficiente mane-
jo en el embarque. Si en una muestra de 50 cajas se determina que en todo el viaje el daño
—
fue de 5 cajas, podremos afirmar que la proporción de la muestra dañada es de P = 0.10.
—
Para concluir, como P es un buen estimador adecuado de la proporción de la pobla-
ción P, podemos estimar que la proporción de cajas dañadas en la población es de 0.10.
EJERCICIOS 14.1
1. Las siguientes mediciones corresponden a 16 observaciones realizadas a micro orga-
nismos poco comunes en América Central.
0.06 0.24 0.90 0.00 0.31 1.12 0.09 0.45
0.02 0.43 0.83 0.17 0.32 0.00 0.50 0.21
Determine la media muestral de la precipitación o aparecimiento de éstos micro or-
ganismos en América Central.
214 CAPÍTULO 14
2 3 2 4 5 3 3 4 5 2 1 1 1 1 2 3 2 3
Determine las estimaciones puntuales de:
a) La media;
b) La desviación estándar;
c) La varianza;
Ejemplo
Se toma una muestra de 50 personas en espera para comprar un producto de escasa fabri-
cación y que esta tiene una media de 13 y una desviación estándar de 5.1
a) Encuentre el error estándar de la media;
b) Establezca una estimación por intervalo alrededor de la media, usando el error están-
dar calculado en el inciso anterior.
Solución inciso a)
Como la población es desconocida e infinita, entonces:
σ 5.1 5.1
σx= = = = 0.7212
n 50 7.0711
Solución inciso b)
X ± σ X = 13 ± 0.7212
= (13 −0.7212, 13 + 0.7212) = (12.2788, 13.7212) = (LI , LS)
Estimaciones 215
Nota: No debemos confundir que el hecho de usar un alto nivel de confianza, como ser
un 99% en todas las estimaciones, después de todo, un alto nivel de confianza parece sig-
nificar un importante grado de exactitud en la estimación; no obstante, en la práctica esos
niveles de confianza producirán grandes intervalos de confianza y éstos no son precisos,
más bien suelen darse estimaciones muy confusas.
Ejemplo entre nivel e intervalo de confianza:
Según la tabla anterior, las preguntas y las respuestas establecen una relación directa
entre el nivel y el intervalo de confianza en cualquier estimación. A medida que el pacien-
te establece niveles de confianza cada vez más estrechos, el médico acepta un nivel de
confianza más y más inferior. Nótese asimismo que, cuando el intervalo de confianza re-
sulta demasiado amplio, como el caso de una operación, la estimación puede tener escaso
valor real, aun cuando el médico atribuya un nivel de confianza de 99% a esa estimación.
De manera análoga, si el intervalo de confianza es demasiado estrecho la estimación se
asocia a un nivel de confianza tan bajo (1%) que ponemos en tela de juicio su utilidad.
216 CAPÍTULO 14
EJERCICIOS 14.2
1. Defina el nivel de confianza de una estimación por intervalo.
2. Defina el intervalo de confianza.
3. Si se tienen los siguientes niveles de confianza, exprese los límites inferior y superior
—
del intervalo de confianza de estos niveles en función de X y σ x .
a) 60% b) 80% c) 90% d) 96% e) 97% f) 98% g) 99%
4. ¿En qué forma puede una estimación ser menos significativa debido a:
a) Un alto nivel de confianza?
b) Un estrecho intervalo de confianza?
5. Si de una población de 1000 personas se toma una muestra de 125, y se sabe que esta
tiene una media de 24.5 con una varianza de 9. Determine el error estándar de la
media.
Ejemplo 1
El tratamiento de una afección cutánea con un nuevo medicamento promete períodos
más cortos de tiempo para curar totalmente dicha afección. Un grupo de médicos reúnen
una muestra de 200 pacientes de una población que frecuentemente padecen esta enfer-
medad y descubren que el nuevo medicamento tarda en promedio 10 días, con una desvia-
ción estándar de 1.5 días, hasta que el paciente sane totalmente.
a) Encuentre un intervalo de confianza de 90% para la media;
b) Encuentre un intervalo de confianza de 98% para la media.
Solución inciso a)
—
Haremos uso de la fórmula X ± Zσ x en donde X = 10 días; σ = 15 días, entonces
σ 1.5 1.5
σX = = = = 0.1061
n 200 14.1421
Solución inciso b)
De igual manera se hace uso de la fórmula X ± Zσ x y los mismos datos utilizados en el
inciso anterior, con la diferencia que el único valor que cambia es de Z, ya que el nivel de
confianza ahora es de 98% en vez de 90%, por tanto, de la tabla normal se tiene que para
un área de 98%, Z = 2.33
Luego X ± Zσ x = 10 ± (2.33)(0.1061) = 10 ± 0.2472
Estimaciones 217
EJERCICIOS 14.3
1. En una maquila del sur de Honduras, se toma una muestra de 38 trabajadores de una
población que tiene una desviación estándar de 5.1.
a) Encuentre el error estándar de la media;
b) Establezca una estimación por intervalo alrededor de la media, usando el error
estándar calculado en el inciso anterior.
2. Un maestro del área de matemáticas de la Universidad Católica de Honduras, está
realizando un estudio sobre el peso promedio de los estudiantes de la carrera de ciru-
gía dental. El profesor tomó una muestra de 130 estudiantes, la que generó una media
de 163.4 libras con una desviación estándar de 14.5 libras.
a) Encuentre el error estándar de la media;
b) ¿Cuál es el intervalo alrededor de la media muestral que incluirá la media de la
población 95.5% de las veces?
3. En una población con una varianza de 207, una muestra de 36 personas produce 143
como estimación de la media.
a) Encuentre el error estándar de la media;
b) Establezca una estimación por intervalo que incluya la media de la población
68.3% de las veces.
4. En el Departamento de Olancho, el jefe de mantenimiento de un hospital privado,
está interesado en determinar el número promedio de horas que dura un foco fabrica-
do por la compañía local proveedora. El jefe de mantenimiento toma una muestra de
35 focos y registró que el promedio de duración es de 842 horas y una desviación
estándar de 25 horas.
a) Calcule el error estándar de la media;
b) Construya un intervalo de confianza de 90% para la verdadera media de la pobla-
ción.
5. Al reunir una muestra de 200 en una población, cuya desviación estándar es de 5.23,
se descubre que la media es de 76.3.
a) Encuentre un intervalo de confianza de 90% para la media;
b) Encuentre un intervalo de confianza de 98% para la media.
6. Una muestra de 35 enfermeras se escoge de una población de 360. En la muestra, se
descubre que la media es de 20.9 y que la desviación estándar es de 6.1.
a) Calcule el error estándar estimado de la media;
b) Construya un intervalo de confianza de 96% para la media.
7. Ramiro Sánchez, es el encargado del mantenimiento del ornato de una compleja clíni-
ca de especialidades. A Don Ramiro le preocupa que en los últimos tres años sus 2500
plantas florales hayan sido dañadas por la excesiva lluvia. Al fin de averiguar el daño
causado a sus plantas toma una muestra de 42 y ha observado que la producción pro-
medio es de 24 flores por semana con una desviación estándar de 3 flores por planta.
a) Estime la desviación estándar de la población a partir de la desviación estándar
de la muestra;
b) Estime el error estándar de la media en esta población finita;
c) Construya un intervalo de confianza de 98% para la producción media de los 2500
plantíos de flores;
d) Si el rendimiento promedio de flores por plantío fue de 32 hace 5 años, ¿qué puede
decir Don Ramiro sobre la posible existencia de un daño en el ornato en éste mo-
mento?
218 CAPÍTULO 14
Distribución normal
Distribución t
n = 15
Distribución t
n=5
Ejemplo
La siguiente muestra representa el peso en libras de 8 productos empacados en una em-
presa de envíos en Honduras.
10.3 12.4 11.6 11.8 12.6 10.9 11.2 10.3
a) Encuentre la media para ésta muestra;
b) Estime la desviación estándar de la población;
c) Construya un intervalo de confianza de 98% para la media.
Solución inciso a)
∑X 10.3 +12.4 + 11.6 +11.8 + 12.6 + 10.9 + 11.2 +10.3 91.1
X= = = ≅ 11.3875
n 8 8
Solución inciso b)
Solución inciso c) ∧
Utilizaremos la fórmula X ± t σ X y se tiene que X = 11.3875 ; σ = 0.874132 y el error es
∧
∧ σ 0.874132 0.874132
σX = = = ≅ 0.30905
n 8 2.828
Por tanto el intervalo lo construiremos con 7 grados de libertad, y de la tabla t de
Student, se tiene que para una confianza de 98%, t = 2.998
Ahora X ±t σ X =11.3875 ± (2.998)(0.30905) =11.3875 ± 0.9265
EJERCICIOS 14.4
1. Para los siguientes tamaños de muestras y niveles de confianza, calcule los valores
apropiados de t con los cuales se construyen los intervalos de confianza.
a) n = 6; 95% b) n = 29; 99% c) n = 16; 95%
d) n = 16; 99% e) n = 12; 99%
2. Si tenemos los siguientes tamaños de muestra y valores de t usados para construir
intervalos de confianza, encuentre los niveles correspondientes de confianza:
220 CAPÍTULO 14
a) n = 21; t = ± 2.086
b) n = 13; t = ± 1.782
c) n = 8 ; t = ± 2.998
3. Una muestra de 12 observaciones, tiene una media de 6.2 y una desviación estándar
de 10. Construya un intervalo de confianza de 95% para la media de la población.
4. La siguiente muestra de 8 observaciones está tomada de una población infinita con
distribución normal:
µ = np y σ = npq ;
n = Número de ensayos
Donde: p = Probabilidad de un éxito
q = Probabilidad de fracaso que se obtiene tomando 1 – p
En teoría, la distribución binomial es la distribución correcta que ha de utilizarse al
construir los intervalos de confianza, para estimar una proporción de la población.
Por otra parte, podemos representar la media de distribución de muestreo de la pro-
porción de éxitos como:
µ P = P y de manera similar, el error estándar de la proporción podrá representarse
pq
y calcularse mediante σ P =
n
Nota: En el caso de que se desconozca la proporción de la población y los valores son es-
timados a partir de una muestra, el error estándar de la proporción debe representarse
por:
∧ pq
σP =
n
Conociendo el error estándar de la proporción y la media de éxitos en dicha propor-
ción, los intervalos de confianza pueden calcularse mediante las fórmulas siguientes:
∧
a) p ± z σ p (muestras grandes y población infinita)
Estimaciones 221
∧ N −n
b) p ± z σ p (muestras grandes y población finita)
N −1
∧
c) p ± t σ p (muestras menores o iguales a 30, desviación estándar desconocida y la
población es infinita)
∧ N −n
d) p ± t σ p (muestras menores o iguales a 30, desviación estándar descono-
N −1
cida y la población es finita)
Ejemplo 2
En un hospital odontológico de asistencia especial para niños, se toma una muestra de 20
niños, con el objetivo de determinar la proporción de la población infantil que carece de
buenos hábitos en la limpieza diaria y el correcto cepillado de sus dientes, durante sus
primeros diez años de vida. Por otra parte, los médicos estiman que en éste rango de eda-
des y por el domicilio de los pacientes infantes, la media proporcional de buena higiene
bucal es de apenas el 35%. Los médicos de éste hospital están interesados en conocer el
intervalo que contenga la verdadera proporción de la población de niños menores de diez
años con buena práctica de higiene bucal y que éste tenga una confianza de 98%.
Solución
Este problema requiere el empleo de la distribución t, puesto que el tamaño de la muestra
es menor que 30 y se ignora la desviación estándar de la población.
∧ pq (0.35)(0.65) 0.2275
Entonces: σ P = = = = 0.011375 = 0.1066
n 20 20
∧
p ± t σ p = 0.35 ± (2.539)(0.1066) = 0.35 ± 0.2706 = (LI, LS) =
(0.35 – 0.2706, 0.35 + 0.2706) ≅ (0.0794, 0.6206)
222 CAPÍTULO 14
EJERCICIOS 14.5
1. Cuando una muestra de 70 ejecutivos fue entrevistada en lo referente a su desempeño
insatisfactorio en las instituciones públicas, 65% manifestó que esto obedecía a la
falta de equipo y materiales en dichos lugares.
a) Estime el error estándar de la proporción de ejecutivos que atribuyó el bajo desem-
peño a la falta de equipo y materiales;
b) Encuentre los límites superior e inferior de ésta proporción, si se tiene un nivel de
confianza de 0.95.
2. La doctora Gabriela Midence, una psicóloga social, encuesta 150 enfermeras y en-
cuentra que 60% no tienen conocimientos de la aplicación de la regla de tres simple
para el cálculo proporcional de medicamentos según el volumen de masa corporal y
edad del paciente.
a) Estime el error estándar de la proporción;
b) Construya un intervalo de confianza de 99% para la verdadera proporción de en-
fermeras que no saben aplicar la regla de tres simple.
3. Una asociación estudiantil de una universidad pública muestreó 45 libros de textos en
la librería de dicha universidad y descubrió que 60% de ellos tenían un sobreprecio de
más de 50% sobre el costo al mayoreo. Construya un intervalo de la proporción de
libros con ese sobreprecio que ofrezcan una seguridad de 96% de contener la verda-
dera proporción de sobreprecio.
4. Un equipo de psicólogos cree que de los médicos hondureños, no todos alcanzan una
especialidad. Toman una muestra de 200 médicos y se dan cuenta que solo 55%
poseen al menos una especialidad.
a) Calcule el error estándar de la proporción;
b) Construya un intervalo de confianza de 95.5% que contenga la verdadera propor-
ción de los médicos con especialidad.
tamaño mínimo de una muestra adecuada a utilizar, entre éstas fórmulas tenemos las si-
guientes:
z 2 pq
a) n = (población infinita con proporción)
d2
z 2σ 2
b) n = (población infinita con datos absolutos)
d2
Nz 2 pq
c) n = 2 (población finita con proporciones)
d (N − 1) + z 2 pq
Nz 2σ 2
d) n = (población finita con datos absolutos)
− 1) + z 2 p 2
d 2 (N
— —
Nota: recuerde que d ≅ X ≅ P (mitad del ancho de clase)
14.6.2 Toma de decisiones
En el caso de la toma de decisiones sobre el tamaño adecuado de una muestra para la
realización de una investigación, a parte de los temas expuestos en los numerales anterio-
res de éste capítulo, deben tenerse en cuenta otros factores como los siguientes:
a) La experiencia del investigador;
b) Consultar especialistas o expertos en estadística;
c) El nivel de tolerancia del error a cometer dependerá de que tan crítico o complejo es
el fenómeno a investigar;
d) Tome una muestra piloto de tamaño razonable con el objeto de obtener los valores de
—
los estimadores X y S;
e) Utilice histogramas y polígonos de frecuencia para asegurarse de que la población
está distribuida normalmente;
f) Recuerde que, si usted quiere mejorar un intervalo de confianza o trabajar con un
mejor tamaño de muestra, incremente el número de las observaciones;
g) No olvide que incrementar el tamaño de la muestra, éste le genera más costos y tra-
bajo;
h) La decisión sobre el error a tolerar, consúltelo con un experto en el tema.
EJERCICIOS 14.6
1. Si la desviación estándar de la población es 150, encuentre el tamaño necesario de la
muestra para estimar la verdadera media dentro de 90 puntos para un nivel de con-
fianza de 95%.
2. Si tenemos una población con una desviación estándar de 2.1, ¿qué tamaño de la
muestra se necesita para estimar la media de la población dentro de ± 0.36, con una
confianza de 99%?
3. Tenemos fuertes motivos para pensar que la proporción es de 0.8 más o menos. En-
cuentre el tamaño de la muestra necesario para estimar la proporción dentro ± 0.06
con un nivel de confianza de 95%.
4. La gerencia de una empresa textil ha recibido últimamente muchos ataques por los
efectos supuestamente nocivos que su proceso de manufactura ejerce sobre la salud.
Un sociólogo propuso la teoría de que los empleados que mueren de causa natural
muestran una notable uniformidad a lo largo de su vida. Los límites superior e infe-
rior de la duración de su vida difieren en no más de 550 semanas. Para un nivel de
confianza de 98%, ¿de qué tamaño ha de ser una muestra examinada si se quiere cal-
cular la vida promedio de esos empleados dentro de ± 30 semanas.
Estimaciones 225
5. Una tienda que vende bolsas para basura en una pequeña ciudad, ha recibido muchas
quejas respecto a la resistencia de ellas. Parece ser que la bolsa de ésta tienda es más
débil que las que vende un segundo proveedor; por tanto, se rompen más pronto y el
personal de aseo corre riesgos en su salud. El gerente de la tienda en mención quiere
determinar el peso máximo promedio que puede meterse en las bolsas sin que estas
se rompan. Si la desviación estándar que se rompan las bolsas es de 1.2 libras, deter-
mine el número de bolsas que el gerente de la tienda debe probar y que éste tenga una
seguridad de 95% de que el peso de rotura promedio de la muestra se haya dentro de
0.5 libras del promedio verdadero.
6. Un curso de lectura veloz garantiza cierto incremento en la rapidez de lectura en un
plazo de dos días. El maestro sabe que habrá pocos que no logren ese aumento, por
lo cual antes de señalar el incremento garantizado quiere tener una confianza de 95%
de que el porcentaje haya sido estimado dentro de ± 3% del valor verdadero. ¿Cuál es
el tamaño más conservador de la muestra necesario en este problema?
7. Una clínica de rehabilitación quiere obtener una estimación por intervalo para el
número promedio de pacientes que visitan diariamente la clínica en mención. El
doctor Rogelio Maradiaga, médico en jefe de dicha clínica, tiene una seguridad razo-
nable de que la desviación estándar del número diario de pacientes es 15. Ayúdelo a
resolver el problema determinando el tamaño de la muestra que el doctor Maradiaga
debe usar si quiere lograr un intervalo de confianza de 96% para la verdadera media
que tendrá un ancho de 8 pacientes solamente.
226 CAPÍTULO 14
CAPÍTULO
Zona aceptación
𝜇H
0
Pruebas de hipótesis para una sola muestra 229
𝜇H
0
Zona aceptación
Zona rechazo
𝜇H
0
LI = µ H − Zσ X
a) Datos estandarizados para la media 0
LS = µ H + Zσ X
0
LI = PH − Z σ p
b) Datos estandarizados para proporciones 0
LS = PH + Z σ p
0
Datos estandarizados
Zona aceptación
–Z 𝜇H = 0 Z
0
Datos reales
Zona aceptación
𝜇H – z𝜎x– 𝜇H = 𝜇 𝜇H + z𝜎x–
0 0 0
Zona aceptación
Zona rechazo
𝜇H = 0 z
0
Datos reales
Zona aceptación
Zona rechazo
𝜇H = 𝜇 𝜇H + z𝜎x–
0 0
–z 𝜇H = 0
0
Datos reales
𝜇H – z𝜎x– 𝜇H = 𝜇
0 0
Ejemplo
Si el objetivo es aceptar la hipótesis nula de que la media es µ =185, con un 99% de certe-
za cuando esta sea cierta, sabiendo que el tamaño de la muestra es 450.
Haga un diagrama de las regiones de aceptación, rechazo y valores críticos o de fron-
tera, para las siguientes hipótesis alternativas:
a) Ha: µ ≠ 185
b) Ha: µ > 185
c) Ha: µ < 185
Solución inciso a)
Ha: µ ≠ 185
Para una confianza de 99% de la tabla normal y para dos colas, el valor crítico para Z
es de 2.578
Datos estandarizados
Zona de aceptación
–2.578 𝜇H = 0 2.578
0
232 CAPÍTULO 15
Solución inciso b)
Ha: µ > 185
Para una confianza de 99% de la tabla normal y para una cola (derecha), el valor
crítico para Z es de 2.33
Datos estandarizados
𝜇H = 0 2.33
0
Solución inciso c)
Ha: µ < 185
Para una confianza de 99% de la tabla normal y para una cola (izquierda), el valor
crítico para Z es de –2.33.
Datos estandarizados
–2.33 𝜇H = 0
0
EJERCICIOS 15.2
1. Formule una hipótesis nula y una alternativa, para probar que el número de ciudada-
nos que llegan a solicitar un servicio en los establecimientos públicos, es mayor al
70% de la población que conforman dichas comunidades.
2. Describa lo que una hipótesis nula y una hipótesis alternativa suelen representar en
el proceso de una prueba.
3. Defina la expresión nivel de significancia.
4. Defina los errores de tipo I y tipo II.
5. En un juicio, la hipótesis nula señala que un acusado es inocente de cierto crimen.
¿Preferiría el sistema legal cometer un error de tipo I o un error de tipo II?
6. ¿Cuál es la relación existente entre el nivel de significancia de una prueba y el error
de Tipo I?
7. ¿En qué condiciones conviene aplicar la prueba de un extremo? ¿Y una de dos extre-
mos?
8. Si tuviera que decidir que la prueba de un extremo es la adecuada, ¿Cómo determina-
ría si debería ser de extremo inferior o de extremo superior?
Pruebas de hipótesis para una sola muestra 233
–2.05 𝜇H = 0
0
Z* = –2.24
Conclusión: Se rechaza H0; y podemos decir que el precio promedio para éste medi-
camento infantil, si ha disminuido.
234 CAPÍTULO 15
Ejemplo 2
Una empleada de servicio al ciudadano en las oficinas de la Cruz Roja afirma que en un
mes cualesquiera se atienden un promedio de 7000 ciudadanos. Un empleado de la Cruz
Roja interesado en la veracidad de dicha información, toma una muestra de 35 ciudada-
nos y determina que el promedio de atenciones es de 7030 con una desviación estándar
muestral de 100 ciudadanos.
En un nivel de confianza de 95%, ¿Puede el empleado concluir que su compañera de
trabajo está equivocada?
Solución
Observe que, aunque no se conoce la verdadera desviación estándar poblacional, pero
como el tamaño de muestra es mayor que 30, para la prueba usaremos la distribución
normal.
—
Datos: σ =100; n = 35 ; X = 7030; µH0 = 7000
Planteamiento de las hipótesis
H0: µ = 7000
Ha: µ ≠ 7000
α = 0.05 ∧
∧ σ s 100 100 ≅
El error estándar lo calculamos por: σ X = = = = 16.903
n n 35 5.9161
Luego el estadístico de prueba lo calculamos por:
X − µ Ho 7030 − 7000 30 ≅
Z* = = = 1.77
σX 16.903 16.903
Para una confianza de 95%, de la tabla normal para dos colas se tiene que los valores
críticos de frontera son ± 1.96.
Zona de aceptación
–1.96 𝜇H = 0 1.96
0
Z* = 1.77
EJERCICIOS 15.3
1. Un laboratorio supone que la vida de su equipo más utilizado es de 14,500 horas, con
una desviación estándar de 2,100 horas. El laboratorio muestrea 25 equipos similares
fabricados por la misma compañía y obtiene una media muestral de 13,000 horas. En
un nivel de significancia de 0.01, ¿debe el dueño del laboratorio concluir que la vida
media de los equipos fabricados por ésta compañía, es menor que las 14,500 horas
supuestas?
Pruebas de hipótesis para una sola muestra 235
2. La comisión promedio que cobra una empresa extranjera por dar mantenimiento al
equipo de diálisis renal del Hospital Escuela, es de 144 dólares por componente, con
una desviación estándar de 52 dólares. El administrador del hospital ha extraído una
muestra aleatoria de 121 mantenimientos de la empresa en mención y determinó que
el gobierno pagó una comisión promedio de 151 dólares. En un nivel de significancia
de 0.10, ¿podemos afirmar que las comisiones de la empresa de mantenimiento son
superiores al promedio convenido?
3. El Gobierno de la República a través de oficinas contraloras, todos los meses descu-
bre un promedio de 8 millones de lempiras en pérdidas por la compra de medicamen-
tos con fechas cortas de vencimiento, con una desviación estándar de 5.5 millones de
lempiras. Se toma una muestra de los últimos 64 meses, y la institución gubernamen-
tal responsable de la compra de los medicamentos para los hospitales públicos, refle-
jó una media muestral de 10.5 millones de lempiras en pérdidas por compra de
medicamentos casi vencidos. En un nivel de significancia del 5%, ¿indica esta muestra
que a las autoridades del gobierno central debe preocuparles que el incremento de
pérdidas para el Estado por medicamentos que se compran casi vencidos, haya reba-
sado su nivel histórico?
4. Antes del embargo petrolero de 1973 y de los incrementos posteriores en los precios
del petróleo crudo, el consumo de gasolina en Estados Unidos de Norteamérica ha-
bía crecido a una tasa mensual de 0.57% ajustada a la estación del año, con una des-
viación estándar de 0.10% al mes. En 15 meses escogidos aleatoriamente en 1975 y
1985, el consumo de gasolina aumentó a un porcentaje promedio de apenas 0.33%
por mes. En un nivel de significancia de 0.01. ¿Puede afirmar usted que el crecimien-
to en el consumo de gasolina disminuyó a raíz del embargo y sus consecuencias?
5. Un empleado de recursos humanos de una cadena de farmacias a nivel nacional,
asegura que de las aproximadamente 80 solicitudes que se atendieron para nuevos
empleos en los últimos seis meses del año 2012, en un promedio mensual de 13 y más,
no tenían preparación académica. El director toma una muestra aleatoria de 37 per-
sonas atendidas en los meses de noviembre y diciembre de 2012 en dicho complejo
farmacéutico, y determinó una media de 15 con una desviación estándar de siete (7).
¿Es prudente creer que la aseveración del empleado es correcta?. (Realice su prueba
al nivel de 5%).
–1.943 𝜇H = 0
0
t * = –2.645
Conclusión: Se rechaza H0; y podemos decir que el precio promedio de renta es me-
nor a L. 6,000.00
Ejemplo 2
Las autoridades de salud dicen que, en un reportaje de una revista de mucha credibilidad,
se afirma que la glotonería para los pobladores de una ciudad con muchas industrias, les
produce un sobrepeso de 10 kilos aproximadamente. Para probar tal afirmación, un equi-
po de médicos examinó a 18 personas seleccionadas aleatoriamente y descubrió que su
exceso promedio de peso era de 12.4 kilos con una desviación estándar de 2.7 kilos.
En un nivel de significancia de 0.01, ¿Existen razones para dudar de la validez del
valor de 10 kilos?
Solución
Dado que el tamaño de muestra es menor que 30 y la desviación estándar de la población
desconocida, para la prueba haremos uso de la distribución t.
Datos:
—
µH = 10; X = 12.4; s = 2.7; n = 18; α = 0.01 ; Número de grados de libertad 17
0
Pruebas de hipótesis para una sola muestra 237
Zona de aceptación
–2.898 𝜇H = 0 2.898
0
t * = 3.771
Conclusión: Se rechaza H0; y podemos decir que si existen razones para dudar del
peso de 10 kilos, según lo publicado en la revista.
EJERCICIOS 15.4
1. Si tenemos una media muestral de 15.7, una desviación estándar de la muestra de 6 y
un tamaño de la muestra de 16, pruebe la hipótesis de que el valor de la media de la
población es 17 contra la alternativa de que ésta sea menor. Use un nivel de signifi-
cancia de 0.025
2. Si una muestra de 20 observaciones revela una media muestral de 16 y una varianza
muestral de 2.25, pruebe la hipótesis de que la media de la población es 15, contra la
alternativa de que sea algún otro valor. Use el nivel de significancia de 0.01.
3. El Departamento Administrativo de la Secretaría de Salud tomó una muestra de 7
casas con el objetivo de tomarlos en alquiler para la extensión de servicios de dicha
Secretaría de Estado. El administrador encontró que el valor promedio es de 20000
lempiras con una desviación estándar de 2000 lempiras. Pruebe la hipótesis de que,
todas las casas del área tienen un valor promedio de alquiler mensual de 23000 lem-
piras contra la alternativa de que sea menor que 23000 lempiras. Use un nivel de
significancia de 0.05.
238 CAPÍTULO 15
n − N (pH )
b) t* = 0
(muestras pequeñas y desviación estándar desconocida)
N ( p H ) (q H )
0 0
n = Tamaño de la muestra
N = Tamaño de la población
Donde: pH = p0 = p Proporción de éxito de la población
0
qH = q0 = q Proporción de fracaso de la población
0
2. Para poblaciones infinitas, usaremos las fórmulas siguientes:
p − pH
a) Z* = 0
(muestras grandes)
σP
p − pH
b) t * = 0
(muestras pequeñas y desviación estándar desconocida)
σP
PH = p0 = p Proporción de éxito de la población
0
x
Donde: p = Proporción de éxito de la muestra
n
σ P Error estándar de la población
3. Los valores críticos o de frontera estarán dados por PH ± Z σ P
0
Ejemplo 1
Las autoridades de la Dirección Nacional de Tránsito, en una muestra tomada al azar de
una población de 400 accidentes, descubrieron que 128 de ellos se debieron a la fatiga del
conductor.
Utilizar un nivel de significancia de 1% para determinar que las autoridades de trán-
sito, tienen razón de que 35% de los accidentes se debe a la fatiga de los conductores.
Solución
Datos: N = 400; n = 128; α = 0.01; PH = 0.35 y qH = 0.65
0 0
Planteamiento de las hipótesis
H0: P = 0.35
Ha: P ≠ 0.35
Como la muestra es grande (mayor de 30) y la población conocida, para calcular el
estadístico de prueba usaremos la fórmula:
n − N (pH ) 128 − (400)(0.35) 128 − 140 −12
Z* = 0
= = = ≅ −1.26
N ( p H ) (q H ) (400)(0.35)(0.65) 91 9.5394
0 0
Para una significancia del 1% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 2.58
Zona de aceptación
–2.58 𝜇H = 0 2.58
0
Z * = –1.26
Para una significancia de 2% de la tabla normal se tiene que el valor crítico para una
cola está dado por Z = 2.05
Zona de aceptación
Zona de rechazo
𝜇H = 0 2.05
0
Z * = 2.07
Ejemplo 3
Una nutricionista afirma que en Honduras no más de 75% de los niños de preescolar,
tienen dieta deficiente en proteínas. Una muestra de 206 niños reveló que esto es cierto
en 73%. Pruebe su hipótesis en un nivel de significancia de 5%.
Solución
Datos: n = 206; α = 0.05; PH = 0.75; —
p = 0.73 y q— = 0.27
0
Planteamiento de las hipótesis
H0: P = 0.75
Ha: P < 0.75
El error lo calcularemos por:
pq (0.73)(0.27) 0.1971
σP = = = = 0.000956796 ≅ 0.03
n 206 206
Como la muestra es grande (mayor de 30) y la población conocida, para calcular el
estadístico de prueba usaremos la fórmula:
–1.645 𝜇H = 0
0
Z * = –0.67
EJERCICIOS 15.5
1. Un ministro de salud pública, sabe que cierta enfermedad prevenible afecta la pobla-
ción de la zona norte en un 19%. Hace poco muestreó 85 familias de la zona sur y
descubrió que esta misma enfermedad en esta región, solo ha afectado a un 14.12% de
sus pobladores. En un nivel de significancia de 0.04, ¿debe el ministro de salud públi-
ca creer que la población de la región norte referente a esta enfermedad, está siendo
menos atendida?
2. De un total de 9700 préstamos otorgados por el INJUPEM a los empleados del sector
gobierno en los últimos 5 años, 350 fueron muestreados para determinar qué propor-
ción fue concedida a las mujeres. La muestra reveló que el 41% de los préstamos se
concedieron a empleadas. Un estudio similar, efectuado hace 5 años, mostró que 35%
de los prestatarios eran mujeres. En un nivel de significancia de 0.02. ¿Puede usted
afirmar que la proporción de préstamos otorgados a las mujeres ha cambiado signifi-
cativamente durante los últimos 5 años?
3. Un fabricante de analgésicos está a punto de decidir si producir un nuevo medicamen-
to de mayor efectividad, al mismo costo y con el mismo volumen de dosificación. El
departamento de investigación de la empresa farmacéutica aplicó una encuesta tele-
fónica a nivel nacional en 6000 familias y averiguó que el nuevo medicamento sería
comprado por 335 de ellas. Un estudio más exhaustivo hecho 2 años antes reveló que
5% de las familias estarían interesadas en adquirir un medicamento similar de mayor
eficacia contra dolores. En un nivel de significancia de 2%, ¿deberá la compañía con-
cluir que en la población hay un mayor interés por el nuevo medicamento?
4. Un fabricante de aparatos electrónicos de la marca RPX que provee a las empresas en
Centroamérica, quiere comparar la confiabilidad de dichos aparatos con los de otra
marca que se expende a nivel Centroamericano. Él sabe que apenas sus clientes le
han reclamado en 15% por defectos de fabricación. Una muestra de 120 clientes reve-
ló que, exactamente 22 de ellos hicieron reclamos por inconformidad con esta clase
de productos. En el nivel de significancia del 0.02, ¿hay evidencia de que los aparatos
electrónicos difieren en la confiabilidad con los de la otra marca que se expenden a
nivel de Centro América?
242 CAPÍTULO 15
CAPÍTULO
Pruebas de hipótesis
para dos muestras 16
Contenido
σX −
X2
1
Solución inciso a)
Como los datos son puramente muestrales, el error estándar lo calcularemos mediante la
fórmula:
∧ ∧
∧ σ 12 σ 22 s2 s2 (15)2 (11)2 225 121
σ X1 −X 2 = + = 1 + 2 = + = + = 5.625 + 2.2 =
n1 n2 n1 n2 40 55 40 55
7.825 ≅ 2.797
Solución inciso b)
— — ∧
Datos: X 1 = 198; X 2 = 204; (µ1 – µ2)H = 0; σ X1 −X 2 = 2.797
0
En cuanto a los datos recuerde que estamos asumiendo que las muestras provienen
de poblaciones con la misma media, por eso la diferencia de las medias poblacionales la
consideramos cero.
Planteamiento de hipótesis:
H0: µ1 = µ2
Ha: µ1 ≠ µ2
α = 0.01
El estadístico de prueba:
( X1 − X 2 ) −(µ 1 − µ 2 )H (198 − 204) −0 −6
Z* = 0
= = ≅ −2.14
σ X −X 2.797 2.797
1 2
Para una significancia de 1% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 2.58
Zona de aceptación
Z * = –2.14
Conclusión: Se acepta H0; Los investigadores pueden concluir que las muestras pro-
vienen de poblaciones con la misma media.
246 CAPÍTULO 16
Ejemplo 2
Una Secretaría de Estado está interesada en saber la variación en cuanto a los servicios de
calidad prestados a la ciudadanía. Se toma una muestra de 200 ciudadanos en la Ciudad
de Tegucigalpa, con una media de 8.95 y una varianza de 0.16. En la Ciudad de San Pedro
Sula, una muestra de 175 ciudadanos, genera una media de 9.10 y una varianza de 0.36.
Supóngase que la Secretaría de Estado en mención, desea probar la hipótesis a un
nivel de significancia de 5% de que no hay diferencia en los servicios de calidad prestados
por su personal en ambas ciudades.
Solución
— —
Datos: X 1 = 8.92; X 2 = 9.10; (µ1 – µ2) = 0; n1 = 200; n2 = 175
s12 = 0.16 y s22 = 0.36
∧ ∧
∧ σ2 σ2 s2 s2 0.16 0.36
σ X1 −X 2 = 1 + 2 = 1 + 2 = + = 0.0008 + 0.0021 =
n1 n2 n1 n2 200 175
0.0029 ≅ 0.0538
El estadístico de prueba:
Para una significancia de 5% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 1.96
Zona de aceptación
Z * = –2.78
EJERCICIOS 16.1
1. Se reunieron dos muestras independientes de observaciones. En la primera muestra
de 40 elementos, la media fue de 198 y la desviación estándar de 15. La segunda
muestra de 55 elementos tenía una media de 204 y una desviación estándar de 11.
a) Calcule el error estándar de la diferencia entre las dos medias;
b) Usando un 𝛼 = 0.01, pruebe si puede considerarse razonable que las dos muestras
provienen de poblaciones que tengan la misma media.
2. Dos laboratorios de investigación han producido independientemente medicamentos
que dan alivio a los que sufren de artritis. El primer fármaco fue probado en un grupo
de 90 pacientes con artritis, dando un promedio de 8.5 horas de alivio con una des-
viación estándar de 1.8 horas. El segundo fármaco fue probado en 80 pacientes con
artritis y produjo un promedio de 7.9 horas de alivio, con una desviación estándar de
2.1 horas. En un nivel de significancia del 5%. ¿Ofrece el segundo medicamento un
período significativamente más corto de alivio?
3. En septiembre de 1985, una compañía distribuidora de combustibles entrevistó 60
estaciones de servicio seleccionadas aleatoriamente, determinando que el precio pro-
medio de la gasolina regular sin plomo en las bombas de autoservicio era de $1.195,
con una desviación estándar de 6.8 centavos de dólar. Tres meses más tarde, otra
encuesta de 90 estaciones de servicio, encontró un precio promedio de $1.158, con
una desviación de 8.5 centavos de dólar. Cuando 𝛼 = 0.02. ¿Cree usted que durante
estos tres meses, hubo un cambio significativo al precio de la gasolina sin plomo en
las estaciones de auto servicio?
4. A la unidad responsable de monitorear la eficiencia de los servicios públicos y priva-
dos en Honduras, le han manifestado que estos servicios de similar condición son
mejores en los centros privados que en los públicos. Bajo una escala especial para la
medición de la eficiencia en la prestación de servicios a la ciudadanía, el director de
la unidad tomó una muestra de 108 ciudadanos que asisten a los centros de servicios
públicos y determinó una media de 24 con una desviación estándar de 5. De la pobla-
ción que asiste a los centros privados tomó una muestra de 120 ciudadanos, la cual
reveló una media de 23 con una desviación estándar de 12. A un nivel de significancia
de 5%, ¿debe concluir el director de la unidad técnica que si hay diferencia en la pres-
tación de servicios en el sector público versus el privado?
( X1 − X 2 ) −(µ 1 −µ 2 )H
t* = 0
σ X −X
1 2
Ejemplo
En una escala especial para medir el desempeño del personal de una cadena de drogue-
rías, una muestra de 30 empleados tomada en el año 2014, su tasa de rendimiento fue de
7.23% con una desviación estándar de muestra de 0.51%. Un año antes una muestra de 28
empleados tuvo una tasa de rendimiento de 8.36% con una desviación estándar de 0.84%.
A un nivel de significancia de 5% ¿Es razonable concluir que los rendimientos en cuanto
al desempeño del personal, disminuyó durante el año 2014?
Solución
— —
Datos: X 1 = 7.23%; X 2 = 8.36%; n1 = 30; n2 = 28; s1 = 0.51% y s = 0.36
Planteamiento de hipótesis:
H0: 𝜇1 = 𝜇2
Ha: 𝜇1 < 𝜇2
α = 0.05
Estimando de manera conjunta el valor de 𝜎2, tenemos que:
(n1 − 1)s12 + (n2 −1)s 22 (30 − 1)(0.51)2 + (28 −1)(0.84)2 (29)(0.2601) + (27)(0.7056)
s P2 = = =
n1 + n2 −2 30 + 28 −2 56
7.5429 +19.0512 26.5941
= = ≅ 0.475
56 56
Ahora el error lo calculamos por:
∧ 1 1 1 1
σ X1 −X 2 = s P + = (0.6892) + = (0.6892)(0.26277) ≅ 0.811
n1 n2 30 28
El estadístico de prueba:
t * = –6.24
EJERCICIOS 16.2
1. Para celebrar el primer aniversario, El doctor Raúl Pérez decidió comprarle a su es-
posa unos aretes de diamantes. Le mostraron 9 pares con gemas de marquesa que
pesaban aproximadamente dos quilates cada par. Debido a la diferencia en el color y
calidad de las piedras, los precios variaban de un juego a otro. El precio promedio era
de $ 2900 con una desviación estándar de $ 370. El doctor Raúl Pérez también exa-
minó 6 pares de piedras con forma de pera que tenían aproximadamente el mismo
peso de dos quilates. Estos aretes costaban un precio promedio de $3065, con una
desviación estándar de $805. Basándose en ésta evidencia, ¿puede el doctor Raúl
Pérez concluir a un nivel de significancia de 5%, que los diamantes en forma de pera
cuestan más en promedio que los diamantes de marquesa?
2. Los datos anexos son una muestra aleatoria de 9 empresas privadas y que operan en
el área de salud, y que en el año de 1986 se les investigó sus ganancias promedias por
acción en millones de dólares.
Empresa 1 2 3 4 5 6 7 8 9
Ganancias 1984 1.38 1.26 3.64 3.50 2.47 3.21 1.05 1.98 2.72
Ganancias 1985 2.48 1.50 4.59 3.06 2.11 2.80 1.59 0.92 0.47
a) Calcule el cambio medio de ganancias por acción entre 1984 y 1985;
b) Encuentre la desviación estándar del cambio y el error estándar de la media;
c) ¿Fueron en promedio diferentes las ganancias por acción en 1984 y 1985?, pruebe
su hipótesis a un nivel del 2%.
3. La Contraloría General de la República para compra de equipos informáticos, intere-
sada en un ahorro en la compra de equipos y suministros para oficinas estatales, en-
cuesta nueve distribuidores de computadoras en las grandes áreas metropolitanas y se
les preguntaron los precios de dos impresoras semejantes. El resultado de ésta en-
cuesta se dan a continuación.
Distribuidor 1 2 3 4 5 6 7 8 9
Precio Epson $350 419 385 360 405 395 389 409 375
Precio Okaydata $370 425 369 375 389 385 395 425 400
Cuando 𝛼 = 0.05, ¿es razonable afirmar que, en promedio, la impresora Epson cuesta
menos que la impresora Okaydata?
250 CAPÍTULO 16
En el caso que no se conozcan los parámetros p1, p2, q1 y q2, en consecuencia necesi-
tamos estimarlos a partir de los estadísticos muéstrales p—1; p—2; q—1 y q—2. Asimismo, podría-
mos suponer que la fórmula más adecuada a utilizar es:
∧ p 1q 1 p 2 q 2
σ P1−P2 = +
n1 n2
Por otra parte, debemos tener en cuenta que, si no existe diferencia entre las dos
proporciones de la población, nuestra mejor estimación de la proporción global de la
población de éxitos, probablemente sea la proporción combinada de éxitos en ambas
muestras, entonces:
∧ (n1)( p 1) + (n2 )( p 2 )
p= ; Luego se tiene que:
n1 + n2
∧∧ ∧∧
∧ pq pq
σ P1 −P2 = +
n1 n2
Por último, el estadístico de prueba lo calcularemos por:
( p 1 − p 2) − ( p1 − p 2 )H
Z* = 0
σp
1 −p 2
Pruebas de hipótesis para dos muestras 251
Ejemplo 1
Como parte de la preparación sobre los incrementos salariales y beneficios que periódica-
mente solicitan los empleados de los hospitales públicos, el sindicato hizo una investiga-
ción entre sus afiliados para determinar si existe una preferencia por un aumento grande
en el beneficio del retiro o un menor incremento al salario.
En un grupo de 1000 trabajadores de sexo masculino que fueron consultados, 750 es-
taban a favor de un aumento en los beneficios del retiro. De 500 trabajadores del sexo fe-
menino entrevistados, 405 estuvieron a favor en el aumento para los beneficios del retiro.
a) Estimar P;
b) Calcule el error estándar de la diferencia entre estas proporciones;
c) Pruebe la hipótesis de igual proporción de hombres y mujeres que están a favor de un
aumento en los beneficios del retiro. (Use 𝛼 = 0.05)
Solución inciso a)
750 405
Datos: n1 = 1000; n2 = 500; p 1 = = 0.75; p 2 = ≅ 0.81 ;
1000 500
∧ (n )( p ) + (n2)( p 2) (1000)(0.75) + (500)(0.81)
p= 1 1 = ≅ 0.77
n1 + n2 1000 + 500
Solución inciso b)
∧
Del inciso anterior tenemos que p = 0.77;
∧ ∧
Entonces q = 1 −p = 1 − 0.77 = 0.23, luego el error estándar estará dado por:
∧∧ ∧∧
∧ pq pq (0.77)(0.23) (0.77)(0.23)
σ P1 −P2 = + = + ≅ 0.023
n1 n2 1000 500
Solución inciso c)
Planteamiento de las hipótesis
H0: p1 = p2
Ha: p1 ≠ p2
α = 0.05
Cálculo del estadístico de prueba
( p 1 − p 2 ) −( p1 − p 2 )H (0.75 − 0.81) − 0
Z* = 0
= = −2.61
σp −p 2 0.023
1
Para una significancia de 5% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 1.96
Zona de aceptación
Z * = –2.61
252 CAPÍTULO 16
Ejemplo 2
Un laboratorio de investigación científica prueba dos nuevas sustancias con que se preten-
de reducir la presión sanguínea. Las sustancias se administran a dos distintos conjuntos
de animales de laboratorio. En el grupo 1, 71 de 100 animales sometidos a prueba respon-
den al fármaco 1 reduciendo la presión sanguínea. En el grupo 2, 58 de 90 animales res-
ponden al fármaco 2 disminuyendo la presión sanguínea. El laboratorio quiere probar en
un nivel de significancia de 0.05, si hay diferencia entre la eficacia de ambos fármacos.
Solución
71 58
p1 = = 0.71; q1 = 0.29; p2 = = 0.644; q 2 = 0.356
100 90
n1 = 100; n2 = 90
∧ p 1q 1 p 2 q 2 (0.71)(0.29) (0.644)(0.356)
σ P1 −P2 = + = +
n1 n2 100 90
= 0.002059 + 0.0025474 = 0.0046064 ≅ 0.06787
( p 1 − p 2) − ( p1 − p2 )H (0.71− 0.644) − 0
Z* = 0
= = 0.97
σp −p 2 0.06787
1
Para una significancia de 5% de la tabla normal se tiene que los valores de frontera o
valores críticos, están dados por Z = ± 1.96
Zona de aceptación
Z * = 0.97
EJERCICIOS 16.3
1. Dos áreas de una gran ciudad están siendo consideradas como sedes de centro de
atención diurna. De 200 familias entrevistadas en una sección, la proporción en que
la madre trabajaba a tiempo completo fue de 0.52. En la otra sección, 40% de las 150
familias entrevistadas tenían madres que trabajaban en empleos de tiempo completo.
En un nivel de significancia del 0.04, ¿existe una diferencia significativa en la propor-
ción de madres que trabajan en las dos áreas de la ciudad?
2. Los ingenieros ambientalistas y técnicos de una planta eléctrica alimentada por car-
bón, están estudiando la posibilidad de instalar dos sistemas diferentes de anticonta-
minación. El primero ha reducido la emisión de contaminantes a niveles aceptables
68% de las veces, determinados en 200 muestras de aire. El segundo sistema, más
costoso, ha disminuido las emisiones a niveles aceptables en 76% de las veces, deter-
minadas con 250 muestras de aire. Si el sistema caro es significativamente más eficaz
en la reducción de contaminantes a niveles aceptables, la gerencia de la planta eléc-
trica instalará el primer sistema. ¿Qué sistema será instalado si la gerencia se vale de
un nivel de significancia de 2% al tomar su decisión?
3. Los pobladores de una gran ciudad dicen que los análisis médicos de los hospitales
públicos son mejores que los análisis realizados por centros médicos privados. El
Colegio Médico interesado en verificar dicha aseveración, tomó una muestra de 200
personas que requieren de los servicios de los hospitales públicos y el 92% manifestó
estar satisfecho por este servicio. De 206 personas muestreadas que asisten a los
centros médicos privados para la realización de análisis, solo el 89% manifestó estar
conforme con la calidad del servicio. A un nivel de significancia del 0.01, ¿puede el
Colegio Médico respaldar la aseveración de los pobladores?
4. Un grupo de médicos clínicos está efectuando pruebas con algunos pacientes para de-
terminar la eficiencia de un nuevo antihipertensivo. Un grupo de enfermos con hiperten-
sión fueron elegidos al azar y luego fueron asignados aleatoriamente al grupo de control
(que recibía un antihipertensivo bien probado) o al grupo experimental (que recibía el
nuevo fármaco). Los médicos anotaron el porcentaje de pacientes cuya presión sanguí-
nea se redujo a un nivel normal en el lapso de un año. En un nivel de significancia de
0.01, pruebe las hipótesis apropiadas para comprobar si el nuevo medicamento es signi-
ficativamente más eficaz que el anterior para reducir la hipertensión.
Proporcion Número
Grupo que mejoró de pacientes
Experimental 0.45 120
De control 0.36 150
σp −p 2
1
ciones para el planteamiento de las hipótesis, las estimaciones de los parámetros pobla-
cionales y el manejo de los grados de libertad necesarios recomendados para el manejo
del tema.
Ejemplo
En la Universidad Nacional Autónoma de Honduras, UNAH, una muestra de 25 catedrá-
ticos varones, reflejó que el 75% tienen al menos una especialidad (maestría o doctorado).
Una segunda muestra de 28 catedráticos mujeres mostró que solo el 68% tienen al menos
una especialidad. El rector de la UNAH desea efectuar la prueba de hipótesis a un nivel
de 5% de que los catedráticos varones superan a las mujeres catedráticas en sacar una es-
pecialidad después de graduados en el pre grado.
Solución
Datos:
p1 = 0.75 q1 = 0.25 n1 = 25
p2 = 0.68 q2 = 0.32 n2 = 28
Número de grados de libertad = n1 + n2 – 2 = 25 + 28 – 2 = 51
Planteamiento de las hipótesis
H0: p1 = p2 ( No hay diferencia entre la proporción de catedráticos varones y catedrá-
ticos mujeres en obtener una especialidad)
Ha: p1 > p2 (En cuestiones de especialidades la proporción de catedráticos varones
es mayor que la proporción de catedráticos mujeres)
α = 0.05
Calculando el error estándar de las proporciones:
p1q 1 p 2q 2 (0.75)(0.25) (0.68)(0.32)
σ P −P = + = + = 0.0075 + 0.00777 =
1 2 n1 n2 25 28
0.01527 ≅ 0.1236
Cálculo del estadístico de prueba
( p1 − p 2) − ( p1 − p 2)H (0.75 − 0.68) − 0
t* = 0
= ≅ 0.566
σp −p 2 0.1236
1
Para una significancia de 5% y para una cola, se duplica el valor de 𝛼, de 0.05 a 0.10
(𝛼 = 0.10). De la tabla t, con 51 grados de libertad se tiene el valor de frontera o valor
crítico, y que es t = 1.671
Zona de aceptación
Zona de rechazo
t * = 0.566
EJERCICIOS 16.4
1. Una aspirina de lenta absorción perdió hace poco su preferencia en el mercado ante
un nuevo fármaco. Este nuevo fármaco anuncia en su publicidad que su marca pene-
tra en la corriente sanguínea más rápidamente que la aspirina de lenta absorción. El
laboratorio productor de aspirinas preocupado por dicha aseveración, le interesa pro-
bar que no existe diferencia en la absorción de ambos medicamentos en la sangre de
los pacientes. Toma una muestra de 9 personas y se les suministra la aspirina de lenta
absorción, 3 minutos después el 85% manifiesta que el dolor de cabeza ha desapare-
cido. En una segunda muestra de 10 personas se suministra el nuevo fármaco y 3
minutos más tarde, solo el 83% manifiesta el desaparecimiento de la cefalea. Realice
su prueba a un nivel de 2%. ¿Cuál es su conclusión?
2. Los pacientes creen que los medicamentos vía intravenoso son de alivio más rápido
que los que se usan vía oral. Un médico interesado en comprobar esta percepción,
entrevista un grupo de 15 pacientes tratados por enésima vez para una enfermedad en
particular, con medicamentos vía oral, el 80% manifestó que el alivio fue más lento,
contra un 94% que manifestaron haber percibido un alivio más rápido cuando fueron
tratados de manera intravenosa para la misma dolencia n1 = n2. Lleve a cabo su prue-
ba a un nivel de 5% de significancia. Establezca su conclusión.
3. Un psicólogo preocupado porque en la actualidad los jóvenes que estudian medicina
lo hacen por decisión caprichosa de sus padres ya que estos desean que su hijo o hija
se gradúe de médico, y no porque estos jóvenes tengan la actitud condicionante para
el desempeño de esta profesión. El psicólogo toma una muestra de 25 médicos gra-
duados hace 30 años, y descubre que el 96% cumplen con las pruebas actitudinales
que la profesión requiere. De 28 estudiantes en la actualidad evaluados con las mis-
mas pruebas, solo 65% tienen vocación para estudiar la carrera de medicina. Al nivel
de significancia de 4%, ¿puede el psicólogo respaldar su percepción?
Ejemplo
Un gimnasio anuncia un programa de reducción de peso, afirmando que el participante
promedio del programa pierde como mínimo 17 libras. Una persona con sobre peso inte-
resada en el programa, pero un tanto escéptico ante tales afirmaciones, pide pruebas al
gimnasio en mención. Los responsables del gimnasio le permiten seleccionar aleatoria-
mente los expedientes de 10 participantes y registrar su peso antes y después del progra-
ma. Los datos aparecen en la tabla siguiente:
Pesos en libras antes y después del programa de reducción de peso.
Antes 189 202 220 207 194 177 193 202 208 233
Después 170 179 203 192 172 161 174 187 186 204
256 CAPÍTULO 16
x= s= −
n n −1 n −1
197 4055 (10)(19.7)2
= =19.7 = −
10 9 9
= 19.34 ≅ 4.3977
∧
t* = µ H + tσ x = 17 + 1.833(1.39) = 19.55 Libras; límite superior.
0
Zona de aceptación
Zona de rechazo
𝜇H = 17 19.55
0
x– = 19.70
EJERCICIOS 16.5
1. Los siete empleados de una agencia de investigaciones científicas que utilizaron nue-
vas técnicas en sus trabajos, calificaron sus resultados en una escala de 0 a 20, donde
0 significa que las nuevas técnicas de investigación no produjeron ningún efecto sig-
nificativo y 20 la manifestación de ser efectivas en 100%.
Empleado 1 2 3 4 5 6 7
Antes 15 18 20 20 16 14 18
Después 14 18 19 19 17 15 16
A un nivel de significancia de 5%, ¿cree usted que las nuevas técnicas de investigación
produjeron resultados más efectivos?
2. Un psiquiatra está tratando desde hace 2 semanas a 10 de sus pacientes con un nuevo
medicamento para el cual, el fabricante asegura bajar los niveles de desorden mental
con mayor rapidez que los utilizados tradicionalmente.
Antes 89 85 90 78 94 77 93 85 83 84
Después 70 79 86 77 72 61 74 71 77 71
A un nivel de significancia de 2%, ¿Está el fabricante del nuevo fármaco diciendo la
verdad?
3. En una escala de 0 a 10, la gerencia de recursos humanos del Instituto Nacional del
Tórax, mide el nivel de rendimiento de su personal que asiste a pacientes internos
afectados por enfermedades cardio-pulmonares, con el objetivo de verificar, si des-
pués del incremento salarial como un incentivo, este mejoró el nivel de desempeño en
los empleados de dicho hospital. Se seleccionan 15 empleados y durante una semana
se mide su desempeño, respecto al mostrado antes del incremento salarial.
258 CAPÍTULO 16
Antes 8 5 9 7 9 7 9 5 8 8 7 6 6 5 7
Después 7 9 8 7 7 6 7 7 9 9 7 7 8 7 9
A un nivel de significancia de 5%, ¿pueden las autoridades del Instituto Nacional del
Tórax confirmar que el desempeño del personal asignado a las salas de pacientes internos
después del incremento salarial, ha mejorado?
CAPÍTULO
17
La distribución
Ji-Cuadrada y el
análisis de varianza
Contenido
17.1 Introducción
17.2 Ji-cuadrada como prueba de independencia
17.3 Ji-cuadrada como prueba de bondad de
ajuste
17.4 Análisis de varianza
17.5 Inferencia sobre una varianza de población
17.6 Inferencia sobre la varianza de dos
poblaciones
260 CAPÍTULO 17
Tablas de contingencia
Supóngase que, en cuatro regiones de Honduras, una Secretaría de Estado muestrea las
actitudes que sus empleados tienen ante las evaluaciones del desempeño del trabajo. A los
empleados se les da la opción de elegir entre el método actual (dos evaluaciones por año)
y un nuevo método propuesto de llevar a cabo evaluaciones trimestrales.
La siguiente tabla, que recibe el nombre de “tabla de contingencia” contiene la res-
puesta dada a ésta pregunta, según la muestra estudiada.
RT × CT
fe = ;
n
Zonas
Enfermedad Frecuencia Urbana Rural Total
Observe que para el dengue clásico las frecuencias esperadas fueron calculadas por:
RT × CT (863)(699) ≅
fe = = 641.74
n 940
RT × CT (863)(241) ≅
fe = = 221.26
n 940
En cuanto a las frecuencias esperadas del dengue hemorrágico tenemos:
RT × CT (77)(699) ≅
fe = = 57.26
n 940
RT × CT (77)(241) ≅
fe = = 19.74
n 940
Uso de la prueba Ji-cuadrada con tablas de contingencia
1. El estadístico de prueba se calcula por:
χ2 =∑
( f o − fe ) 2
fe
262 CAPÍTULO 17
Zona de aceptación
𝜒 2L 𝜒 2U
3. En la mayoría de casos las pruebas con Ji-cuadrada se hacen con cola derecha.
4. Al usar tabla de contingencias el número de grados de libertad está dado por ngl =
(r − 1)(c − 1); donde r es el número total de renglones y c el número total de colum-
nas.
5. las hipótesis se plantean de la manera siguiente:
a) Para medias
H o : µ 1= µ 2 = µ 3 =,..., = µ n
H a : µ 1≠ µ 2 ≠ µ 3 ≠, ..., ≠ µ n
b) Para proporciones
Ho : P1 = P2 = P3 =, ..., = Pn
Ha : P1 ≠ P2 ≠ P 3 ≠, ..., ≠ Pn
6. En vez de subíndices numéricos se pueden utilizar letras que asocien iníciales de pa-
labras en la información del problema, o también está la forma alternativa conocida
como explícitas ya que se expresan con palabras, haciéndolo en la forma siguiente:
Ho: No existe diferencia en las medias poblacionales
Ha: Existe diferencia en las medias poblacionales
Ejemplo
El Colegio Médico de Honduras está interesado en saber si existe diferencia entre las
personas que de acuerdo al nivel educativo tienen la cultura de automedicarse. Se levanta
una encuesta en los departamentos de Francisco Morazán y Cortés, habiendo entrevista-
do a 400 personas, información que se registra en la tabla siguiente:
Departamentos
Nivel de
Francisco Total
escolaridad Cortes
morazan
Primario 59 60 119
Secundario 57 55 112
Superior 30 40 70
Ningun nivel 48 51 99
Total 194 206 400
La distribución Ji-Cuadrada y el análisis de varianza 263
Solución inciso a)
Nivel de Departamentos
Frecuencias Total
escolaridad Fm Cortes
fo 59 60 119
Primario
fe 57.71 61.29
fo 57 55 112
Secundario
fe 54.32 57.68
fo 30 40 70
Superior
fe 33.95 36.05
fo 48 51 99
Ningun nivel
fe 48.02 50.98
Total 194 206 400
( fo – fe)2
f0 fe fo – fe (fo – fe)2 fe
59 57.71 1.29 1.6641 0.0288
60 61.29 –1.29 1.6641 0.0272
57 54.32 2.68 7.1824 0.1322
55 57.68 –2.68 7.1824 0.1245
30 33.95 –3.95 15.6025 0.4596
40 36.05 3.95 15.6025 0.4328
48 48.02 –0.02 0.0004 0.000008329
51 50.98 0.02 0.0004 0.000007846
∑ = 1.2051
Solución inciso c)
Ho: No hay diferencia en los niveles de escolaridad para las personas que se automedican.
Ha: Si hay diferencia en los niveles de escolaridad para las personas que se automedican.
Solución inciso d)
( fo − fe )
2
Ahora de la tabla Ji-cuadrada con tres grados de libertad y α = 0.05, se tiene que el
valor de frontera o valor crítico es 7.815
Zona de aceptación
Zona de rechazo
7.851
𝜒 = 1.2051
2
Conclusión: Se acepta H0; No existe diferencia en el nivel de educación para las per-
sonas que tienen la costumbre de automedicarse.
EJERCICIOS 17.2
1. Para averiguar si las ventas de pastillas de silicio son independientes del punto donde
se halla el ciclo económico de Estados Unidos, se han recabado datos sobre las ven-
tas semanales de una empresa y sobre el hecho de que la economía esté llegando a un
nivel máximo del ciclo, esté cayendo en una depresión cíclica o se encuentre ya en
una depresión. He aquí los resultados:
Ventas semanales de pastillas
Economía Altas Medianas Bajas Total
Nivel máximo 20 7 3 30
En depresión 30 40 30 100
En aumento 20 8 2 30
En disminución 30 5 5 40
Total 100 60 40 200
En el nivel de significancia del 10%, ¿La frecuencia de limpieza bucal de los poblado-
res en esta comunidad, difiere según el nivel de educación?
4. Un investigador sobre procesos de enseñanza-aprendizaje, opina que las calificacio-
nes que obtienen los estudiantes en la Carrera de Medicina, depende del tiempo que
dediquen a escuchar música. Con el objeto de probar su teoría, ha aplicado aleatoria-
mente un cuestionario a 400 alumnos. El cuestionario contiene dos preguntas: ¿cuán-
tas horas por semana escucha usted música? y ¿cuál es su calificación promedio en
todas las asignaturas? Los datos de la encuesta se incluyen en la tabla anexa. Usando
un nivel de significancia de 5%, pruebe si los factores en mención son dependientes
o independientes.
Ejemplo 1
El Doctor Rodríguez, supervisor de las operaciones de la Secretaría de Salud para el com-
bate del sancudo transmisor del dengue en la ciudad capital, tiene que visitar cinco ba-
rrios o colonias por día, con el objetivo de verificar el número de personas que padecieron
de dengue en los últimos dos meses. Se sugiere que la variable de personas que padecieron
la enfermedad puede ser descrita mediante una distribución binomial con una probabili-
dad de P = 0.40 de que una persona en esas comunidades haya padecido la enfermedad.
Solución
a) Las f0: 10 41 60 20 6 3
Calculando las fe :
i
fe = P(x = 0)
1 Σ f0 = (0.0778)(140) ≅ 10.892
fe = P(x = 1) Σ f0 = (0.2592)(140) ≅ 36.288
2
fe = P(x = 2) Σ f0 = (0.3456)(140) ≅ 48.384
3
fe = P(x = 3) Σ f0 = (0.0768)(140) ≅ 10.752
4
fe = P(x = 4) Σ f0 = (0.2304)(140) ≅ 32.256
5
fe = P(x = 5) Σ f0 = (0.0102)(140) ≅ 1.428
6
( fo – fe)2
f0 fe
fe
10 10.892
41 36.288
60 48.384
20 32.256
6 10.752
3 1.428
140
Como la última frecuencia esperada es menor que cinco, esta debe sumarse con la
penúltima fe y se tiene como resultado de dichas sumas 10.752 + 1.428 = 12.18 como éste
dato es mayor que 5, entonces la nueva tabla es:
La distribución Ji-Cuadrada y el análisis de varianza 267
( fo – fe)2
f0 fe
fe
10 10.892 0.0731
41 36.288 0.6118
60 48.384 2.7887
20 32.256 4.6567
9 12.18 0.8302
140 8.9605
( fo − fe )2 , entonces: χ2 = 8.9605
Como χ2= ∑ fe
c) Planteando las hipótesis:
H0: Los datos pueden ser descritos por la distribución binomial con P = 0.40
H1: Los datos no pueden ser descritos por la distribución binomial con P = 0.40
α = 0.05
d) Calculando el ji-cuadrado crítico o de frontera
Al principio teníamos 6 clases, por tanto, ahora n = 5, ya que se trata de la distribu-
ción binomial, luego de fusionarse las dos últimas filas, entonces el número de clases
se redujo a 5, y el número de grados de libertad es 4.
De la tabla ji-cuadrada con α = 0.05 y 4 grados de libertad se tiene que χ2Crit = 9.488
e) Decisión:
Zona de aceptación
Zona de rechazo
9.488
𝜒 = 8.9605
2
Se acepta H0
Conclusión: Los datos pueden ser descritos mediante una distribución Binomial con
P = 0.40.
Ejemplo 2
El Doctor Daniel Barrios, administrador de un complejo hospitalario en la zona norte de
Honduras, ha examinado los expedientes pasados de 210 turnos de 8 horas cada uno,
elegidos al azar, a fin de determinar la frecuencia con que se generan conflictos sobre los
procedimientos. El número de días en que 0, 1, 2, 3, 4, 5 o más personas reclamaron sobre
los procedimientos, se atendieron 25, 55, 65, 35, 20 y 10, respectivamente. En un nivel de
significancia de 0.05, ¿Podemos suponer razonablemente que la incidencia de los recla-
mos sobre procedimientos del personal siguen una distribución de Poisson con una media
de λ = 2?
268 CAPÍTULO 17
Solución
a) Calculando las frecuencias esperadas y el estadístico de prueba tenemos:
b) Estadístico de prueba:
( fo − fe )2 , entonces: χ2 = 2.0206
Como χ2= ∑ fe
c) Planteando las hipótesis:
H0: La incidencia de los reclamos siguen una distribución de Poisson con λ = 2
Ha: La incidencia de los reclamos no siguen una distribución de Poisson con λ = 2
α = 0.05
d) Calculando el ji-cuadrado crítico o de frontera
Como K = 6 clases, entonces el número de grados de libertad es 5.
De la tabla ji-cuadrada con α = 0.05 y 5 grados de libertad se tiene que χ2Crit = 11.070
e) Decisión:
Zona de aceptación
Zona de rechazo
11.070
𝜒 = 2.0206
2
Se acepta H0
Conclusión: La incidencia de reclamos siguen una distribución de Poisson con λ = 2.
Ejemplo 3
El administrador de una cooperativa con el objetivo de conservar cierta cantidad de efec-
tivo en caja como reserva de operaciones durante un horario especial extendido, quiere
saber si el pago de los clientes tiene una distribución normal. Para dicha prueba el admi-
nistrador recolecta la siguiente información:
Pagos $0 – 999 $ 1000 – 1999 $ 2000 y +
f0 20 65 25
a) Calcular las frecuencias esperadas si los datos tienen distribución normal con una
media de $ 1500 y una desviación estándar de $ 600.
La distribución Ji-Cuadrada y el análisis de varianza 269
Solución:
a) Calculando las fe
( fo – fe)2
x Probabilidad f0 fe
fe
<1000 0.2033 20 22.363 0.2496
1000 - 1500 0.5934 65 65.274 0.0012
≥ 2000 0.2033 25 22.363 0.3109
110 0.5617
( fo − fe )2 , entonces: χ2 = 0.5617
b) χ2= ∑ fe
Zona de aceptación
Zona de rechazo
4.605
𝜒 = 0.5617
2
Se acepta H0
Conclusión: Los pagos de los clientes siguen una distribución normal con una media de
$1500 y una desviación estándar de $600.
EJERCICIOS 17.3
1. El Doctor Luis Lemus, visitador médico de una compañía farmacéutica tiene 5 clien-
tes (médicos) que visitar al día. Se sugiere que la variable, o sea las ventas logradas
por el Doctor Lemus sean descritas mediante la distribución binomial, siendo 0.80 la
270 CAPÍTULO 17
probabilidad de lograr una venta con cada cliente. Si se tiene la siguiente distribución
de frecuencias del número de ventas hechas diariamente por el Doctor Lemus, usan-
do un nivel de significancia de 0.05, ¿Podemos concluir que la distribución sigue en
efecto la que ha sido sugerida?
Frecuencia observada 3 17 33 22 5
3. Una oficina postal quiere resolver el problema de las “cartas maltratadas”. Se ha di-
cho que cualquier carta enviada a cierta área tiene una probabilidad de 0.15 de ser
maltratada. Dado que la oficina postal es tan grande, puede suponerse que esas pro-
babilidades son independientes para cada carta. Se seleccionó una muestra de 310
personas y se les enviaron dos cartas de prueba. El número de personas que recibie-
ron 0, 1 o 2 cartas maltratadas fue de 260, 40 y 10, respectivamente. En el nivel de
significancia de 0.10, ¿es razonable concluir que el número de cartas maltratadas re-
cibidas por persona sigue una distribución binomial donde P = 0.15?
4. Un diligente estudiante del Doctorado en Cirugía Dental en la UNICAH, quiere veri-
ficar si es razonable suponer que algunos datos de ventas sobre equipos quirúrgicos
han sido muestreados de una población normal, antes de realizar una prueba de hipó-
—
tesis con las ventas promedio. Reunió algunos datos de ventas y calculó X = 78 y s = 9,
tabulando los datos como sigue:
a) ¿Es importante que el estudiante verifique si los datos tienen una distribución
normal?
b) Formule una hipótesis nula y una hipótesis alternativa explícita para verificar si los
datos tienen una distribución normal;
c) ¿Cuál es la probabilidad (aplicando una distribución normal con 𝜇 = 78 y 𝜎 = 9)
de que las ventas sean menores o iguales a 65, que fluctúen entre 66 y 70; entre 71
y 75; entre 76 y 80; entre 81 y 85; mayores o iguales que 86?;
d) En el nivel de 0.05 de significancia, ¿Sigue la distribución observada una distribu-
ción normal?
5. Luego de años de trabajar en una estación donde se pesan los camiones que transpor-
tan equipo médico y productos para los hospitales a nivel nacional, Jaime Rodas,
empleado de la Secretaría de Infraestructura piensa que el peso por camión (en miles
de libras) sigue una distribución normal con 𝜇 = 71 y 𝜎 = 15. Con el objeto de probar
su suposición, un lunes reunió los siguientes datos, registrando el peso de cada ca-
mión que entra a la estación de abastecimiento.
La distribución Ji-Cuadrada y el análisis de varianza 271
70 72 69 52 90 55 86 94 58 57
73 71 87 91 84 95 55 52 66 95
86 56 58 57 55 90 65 87 50 56
57 84 64 80 58 55 98 58 82 55
85 62 78 61 81 92 62 59 88 65
Si el señor Rodas aplicó una prueba Ji Cuadrada de bondad de ajuste en estos datos,
¿A qué conclusión llegará sobre la distribución de los pesos de los camiones? Use un nivel
de significancia de 0.10. (Sugerencia: Utilice 5 intervalos igualmente probables).
X = La gran media
x—1 = Media de la muestra 1
x—2 = Media de la muestra 2
Donde: x—k = Media de la muestra k
n1 = Tamaño de la muestra 1
n2 = Tamaño de la muestra 2
nk = Tamaño de la muestra k
2. Planteamiento de las hipótesis
H0: 𝜇1 = 𝜇2 = 𝜇3; ⋯ ; = 𝜇k
Ha: 𝜇1 ≠ 𝜇2 ≠ 𝜇3; ⋯ ; ≠ 𝜇k
Las hipótesis también pueden plantearse de manera explícita, así como los subín-
dices de los parámetros pueden utilizar letras iníciales de tal forma que relacionen la
información de los elementos actores en el problema.
Por ejemplo, si en tres muestras se refieren a tres grupos A, B y C, entonces los
parámetros se pueden representar por:
𝜇A, 𝜇B y 𝜇C; haciendo referencia a los grupos.
3. La varianza entre columnas
Esta la calcularemos a través de:
∧2 ∑nj (xj −X )2
σ EC =
k −1
nj = Tamaño de la muestra j-ésima
k = Número de muestras
Donde: x—j = Media muestral j-ésima
X = La gran media
272 CAPÍTULO 17
∧ n −1
σDC
2
= ∑ NTj − k s 2j
Solución inciso a)
Datos:
n1 = 5
n1 = 5; n2 = 6 y n3 = 4
n1 = 4
45 + 55 + 43 + 60 + 39
x1 = ≅ 48.4
5
54 +65 +38+ 48 + 52 +53
x2 = ≅ 51.67
6
65 +57 +37 + 44
x3 = ≅ 50.75
4
Ahora la gran media:
n1 x1 + n2 x 2 + n3 x3
X=
n1 +n2 +n3
∧
Entonces: σDC
2
= 15.06002
Solución inciso c)
Primero calculamos las varianzas muestrales:
∑( xi − x1 )2
s12 = =
n1 − 1
2 2 2 2 2
(45− 48.4) + (55− 48.4) + (43− 48.4) + (60 −48) + (39− 48.4)
=
5 −1
11.56+ 43.56 + 29.16 +134.56+ 88.36 307.2
= ≅ 76.8
4 4
Entonces: s12 ≅ 76.8
∑( xi − x1 )2
s22 = =
n2 −1
(54 −51.67)2 + (65 − 51.67)2 + (38 −51.67)2 + ( 48 −51.67)2 + (52 −51.67)2 + (53 − 51.67)2
=
6−1
5.4289 +177.6889 +186.8689 +13.4689 + 0.1089 +1.7689 385.3334
= ≅ 77.067
5 5
Entonces: s22 ≅ 77.067
∑( xi − x 2 )2
s32 = =
n3 − 1
2 2 2 2
(65 −50.75) + (57 −50.75) + (37− 50.75) + (44 −50.75)
=
4 −1
203.0625 +39.0625 +189.0625+ 45.5625 476.75
= ≅ 158.92
3 3
La distribucion F
La distribución F es utilizada para pruebas de hipótesis relacionadas al análisis de varian-
zas, en el que suponemos que los eventos son idénticos o iguales, sin importar la diferen-
cia entre el tamaño de las diversas muestras tomadas para la prueba.
Notas:
1. Para determinar los valores críticos o de frontera utilizaremos la Tabla F que se en-
cuentra en los apéndices del presente texto, para valores de significancia del cinco y
uno por ciento.
274 CAPÍTULO 17
Ejemplo
Los siguientes datos muestran el número de reclamaciones hechas por ciudadanos incon-
formes, las cuales fueron procesadas diariamente en un grupo de cuatro empleados que
atienden las áreas de servicio al ciudadano en una oficina gubernamental con orientación
en la salud. El supervisor de ésta área observó durante varios días a los cuatro empleados
más cuestionados. Pruebe la hipótesis de que las reclamaciones medias por día para los
cuatro empleados son iguales. (Use un 𝛼 = 0.01)
Empleado 1: 15 17 14 12
Empleado 2: 12 10 13 17
Empleado 3: 11 14 13 15 12
Empleado 4: 13 12 12 14 10 9
Solución
a) Datos
n1 = 4; n2 = 4; n3 = 5 y n4 = 6
n1 = 4
n1 = 5
n1 = 6
K = 4; NT = 19
Grados de libertad en el numerador = k – 1 = 4 – 1 = 3 g.l.n.
Grados de libertad en el denominador = NT – k = 19 – 4 = 15 g.l.d.
b) Calculando las medias muestrales, la gran media y las varianzas muestrales
s12 =
∑(xi − x1)2 = (15 −14.5)2 + (17 −14.5)2 +(14 −14.5)2 + (12 −14.5)2 =
n1 −1 4 −1
0.25 +6.25 + 0.25 + 6.25 13
= ≅ 4.34
3 3
Entonces: s12 ≅ 4.34
∑(xi − x2 )2 (12 − 13)2 + (10 − 13)2 + (13 −13)2 + (17 − 13)2 1 +9 + 0 +16
s22 = = = =
n2 − 1 4 −1 3
26
≅ 8.67
3
∑(xi − x3 )2 (11− 13)2 + (14 − 13)2 + (13 − 13)2 + (15 − 13)2 + (12 −13)2
s32 = = =
n3 − 1 5 −1
4 +1 + 0 + 4 +1 10
= ≅ 2.5
4 4
Entonces: s32 ≅ 2.5
∑(xi − x4 )2
s42 = =
n4 − 1
(13 − 11.67)2 + (12 − 11.67)2 + (12 −11.67)2 + (14 −11.67)2 + (10 −11.67)2 + (9 −11.67)2
=
6 −1
1.7689 + 0.1098 + 0.1098 + 5.4289 + 2.7889 +7.1289 17.3334
= ≅ 3.467
5 5
Entonces: s42 ≅ 3.467
∑n j ( x j − x )
2
∧2
σ EC = =
k −1
2 2 2 2
4 (14.5 −12.89) + 4 (13 −12.89) + 5 (13 −12.89) + 6 (11.67−12.89)
=
4 −1
10.3684 + 0.0484 + 0.0605 + 8.9304 19.4077
= ≅ 6.469
3 3
∧2
Entonces: σ EC ≅ 6.469
276 CAPÍTULO 17
n j −1
σ DC
2 =
∑ NT − k
s 2j =
4 −1 4 −1 5 −1 6 −1
(4.34) + (8.67) + (2.5) + (3.467) =
19 − 4 19 − 4 19 − 4 19 − 4
(0.2)(4.34) +(0.2)(8.67) + (0.267)(3.5) +(0.34)(3.467) = 0.868 + 1.734 + 0.6675 +
1.17878 = 4.45
Entonces: σ DC
2 ≅ 4.45
Zona de aceptación
Zona de rechazo
5.42
F = 1.47
Se acepta H0
Conclusión: Los reclamos de los ciudadanos para los cuatro empleados, son iguales.
EJERCICIOS 17.4
1. En un estudio que duró 30 días, se compararon los efectos que tuvieron cuatro pro-
mociones de incentivo para los pacientes y clientes permanentes de un hospital pri-
vado de la ciudad capital.
Servicios médicos gratuitos 78 87 81 89 85
Rebaja en servicios de laboratorio 94 91 87 90 88
Descuento por pagos en efectivo 73 78 69 83 76
Reembolso por atención de menores 79 83 78 69 81
a) Calcule la media de cada promoción y luego determine la gran media;
b) Estime la varianza de la población usando la varianza entre columnas;
c) Encuentre la varianza de la población usando la varianza dentro de columnas,
calculada a partir de la varianza dentro de las muestras;
d) Calcule la razón F. En un nivel de significancia de 0.01, ¿producen las promocio-
nes diferentes efectos en la atención médica?
2. Con el objetivo de medir la productividad para los empleados del Sector Minero en
Honduras y los riesgos de salud que estos enfrentan, se compararon tres métodos de
capacitación aplicados durante el año anterior. A continuación, se dan las medidas
de productividad de los empleados sin riesgos para su salud de una compañía minera
La distribución Ji-Cuadrada y el análisis de varianza 277
en el Departamento de Santa Bárbara, y que fueron instruidos con cada método por
las autoridades sanitarias.
Método 1 36 26 31 20 34 25
Método 2 40 29 38 32 39 34
Método 3 32 18 23 21 33 27
En el nivel de significancia de 0.05 ¿los tres métodos de capacitación conducen a di-
ferentes niveles de productividad sin riesgos en su salud?
3. Un Médico dedicado a la investigación científica, tiene las mediciones de las cuatro
muestras anexas. ¿Podemos concluir que estas proceden de poblaciones que tienen el
mismo valor medio? Use un nivel de significancia de 0.01.
Muestra 1 16 21 24 28 29
Muestra 2 29 18 20 19 30 21
Muestra 3 14 15 21 19 28 17
Muestra 4 21 28 20 22 18
4. El supervisor de los servicios de emergencia en un hospital público en Honduras, le
gustaría saber si el hospital atiende más pacientes en la temporada navideña que en
los meses que preceden o siguen a otros días festivos. Reunió datos sobre el número
de pacientes atendidos en las áreas de emergencia durante los meses de noviembre,
diciembre y enero en los últimos dos años.
Número de pacientes atendidos
Noviembre 43 37 59 55 38 48
Diciembre 54 41 48 35 50 49
Enero 36 28 34 41 30 32
En un nivel de significancia de 0.05, ¿es el número medio de pacientes el mismo,
durante estos tres meses?
5. Algunas empresas de Tegucigalpa y San Pedro Sula, han diseñado tres diferentes sis-
temas para limpiar los derrames de fluidos contaminantes en las oficinas y casas
particulares. La siguiente tabla contiene los resultados, medidos por la cantidad de
área de superficie que se limpia en una hora. Los datos se obtuvieron al probar cada
método en cinco ensayos. ¿Tienen igual eficacia los tres sistemas? Use el nivel de
significancia de 0.05.
Sistema A 55 60 58 61 54
Sistema B 52 58 59 54 57
Sistema C 61 57 56 62 61
2. Si se plantea que Ha: 𝜎2 ≠ 𝜎20, use dos colas con n – 1 grados de libertad, 𝛼– a la dere-
cha y 1 – 𝛼– a la izquierda, para los límites de aceptación y rechazo.
2
2
3. Si se plantea que Ha: 𝜎2 > 𝜎20, use la cola derecha con 𝛼 y n – 1 grados de libertad para
el límite de aceptación y rechazo.
4. Si se plantea que Ha: 𝜎2 < 𝜎20, use la cola izquierda con 1 – 𝛼 y n – 1 grados de libertad
para el límite de aceptación y rechazo.
( n −1) s 2
5. El estadístico de prueba se calcula por: χ 2 =
σ 02
n = tamaño de la muestra;
Donde: s2 = Varianza muestral;
𝜎20 = Varianza hipotética.
6. Cuando se construyen intervalos de confianza para varianzas los límites inferior y
superior, o límites críticos para la prueba pueden calcularse por:
( n −1) s 2
Límite inferior = σ L2 =
σ U2
Límite inferior = σ U2 =
( n −1) s 2
σ L2
7. Los valores de χU2 y χL2; se calculan en la tabla Ji-cuadrada en la columna 𝛼– para χU2 y
1 – 𝛼– para χL2, ambos con n – 1 grados de libertad.
2
2
8. Las curvas Ji-cuadrada pueden dibujarse como sigue:
Zona de aceptación
𝜒 2L 𝜒 2U
Zona de aceptación
Zona de rechazo
𝜒 2U
Zona de aceptación
Zona de rechazo
𝜒 2L
La distribución Ji-Cuadrada y el análisis de varianza 279
Ejemplo 1
En una fábrica de alimentos pasteurizados se toma una muestra de 30 productos fabrica-
dos en las últimas semanas, los cuales mostraron un promedio de 7 productos con fallas
en el empaque y una desviación estándar de ±3 productos. Construya un intervalo de
confianza del 95% para la verdadera varianza de ésta población.
Solución
a) Datos
n = 30; x– = 7 y s2 = 9
Número de grados de libertad = 29 y 𝛼 = 0.05
α 0.05
Con 29 grados de libertad y = = 0.025 , entonces: χU2 = 45.722
2 2
α 0.05
y con 1= =1− =1− 0.025 = 0.975; χL2 = 16.047
2 2
Luego:
Ejemplo 2
La Secretaría de Recursos Naturales y Ambiente con el objetivo de disminuir los niveles
de contaminación del medio ambiente en el país, inspecciona 30 de los vehículos asigna-
dos a dicha institución para ver si se ajustan a las normas de emisiones de contaminantes
establecidas por el gobierno, las cuales tienen una media de 10 y una varianza de 36. El
número promedio de partículas contaminantes emitidas no superó los niveles fijados,
pero la varianza de la muestra fue de 50. En un nivel de significancia del 5%, ¿Deberá la
Secretaría de Recursos Naturales y Ambiente poner fuera de circulación algunos de sus
vehículos?
Solución
a) Planteando las hipótesis
H 0: σ 2 = 36
H a: σ 2 > 36
α = 0.05
Zona de aceptación
Zona de rechazo
𝜒 2 = 40.27 𝜒 2U = 42.557
Como χ2 < χ2Crit (40.27 < 42.557); La Secretaría de Recursos Naturales y Ambiente,
no debería sacar de circulación sus vehículos.
EJERCICIOS 17.5
1. Una muestra de 15 observaciones tomada de una distribución normal tiene una me-
dia de 30 y una varianza de 15.5. Construya un intervalo de confianza de 95% para la
verdadera variancia de la población.
2. Se supone que la desviación estándar de una distribución es de 300. Si una muestra
observada de 20 produce una desviación estándar de la muestra de 250. ¿Deberíamos
rechazar la hipótesis nula según la cual la verdadera desviación estándar es de 300?
Utilice el nivel de significancia de 0.10.
3. Un fabricante de máquinas de rayos X quiere que estas tengan desviaciones estándar
en resolución que estén significativamente debajo de 2 unidades. Cuando una nueva
máquina de rayos X se usa en la tomografía de 30 pacientes, la desviación estándar
de la muestra resulta ser 1.46. ¿Debe venderse esta máquina de rayos X?
a) Formule la hipótesis nula y la alternativa
b) Pruebe sus hipótesis en el nivel de 𝛼 = 0.01
c) Formule una conclusión explícita.
4. Un psicólogo conoce estudios que muestran que la variabilidad de la atención de los
niños de cinco años puede resumirse mediante 𝜎2 = 64 min2. Quiere saber si la aten-
ción de los niños de seis años es diferente. Una muestra de niños de seis años da s2 =
64 min2.
a) Formule una hipótesis explicita y una hipótesis alternativa.
b) Pruebe sus hipótesis en el nivel de 𝛼 = 0.05
c) Formule una conclusión explícita.
2. En el caso de llevar a cabo la prueba con una cola izquierda o derecha, la varianza
que va en el numerador del cociente F, es obligatorio que ésta sea mayor que la varian-
za del denominador.
3. Las hipótesis se plantean de la manera siguiente:
H 0 : σ 12 = σ 22
σ12 ≠ σ 22
H a : σ12 > σ 22
σ12 < σ 22
Ejemplo 1
Bajo un método especial para medir la eficiencia de nuevos medicamentos, se obtuvo la
siguiente información sobre dos poblaciones que supuestamente pueden considerarse que
tienen la misma varianza en la rapidez y efectividad. Una muestra de 12 fue extraída de la
población 1, mostrando ésta una varianza de 1.96, en tanto que una muestra de tamaño
10 seleccionada de la población 2, produjo una varianza de 3.64.
a) Calcule la razón F para la prueba de igualdad de varianzas.
b) Obtenga el valor crítico de F del extremo superior empleando el nivel de significancia
de 0.05;
c) Obtenga el valor crítico de F correspondiente del extremo inferior;
d) Formule la conclusión de su prueba.
Solución inciso a)
Datos:
s12 1.96
n1 =12; s12 =1.96; n2 = 10 y s22 = 3.64 y F = = ≅ 0.54
s22 3.64
1
Solución inciso b) LS = FCRIT = = F (11, 9, 0.05) = 3.10
F ( n, d , α )
1 1 1
Solución inciso c) LI = FCRIT = = = = 0.39
F ( d , n, α ) F (9, 11, 0.05) 2.90
282 CAPÍTULO 17
Solución inciso d)
H 0 : σ 12 = σ 22
H a : σ 12 ≠ σ 22
α = 0.05
Zona de aceptación
0.39 3.10
F = 0.54
Como se acepta H0, concluimos que al nivel de significancia del 5%, se puede decir
que la eficiencia de los nuevos medicamentos, son iguales.
Ejemplo 2
A una empresa le preocupa mucho la variabilidad en el número de productos con defectos
producidos en el proceso de fabricación. Si estos tienen una variabilidad significativamen-
te diferente en el número de artículos con defectos, terminado el proceso de fabricación,
los experimentos se confunden y aparecen algunas cosas extrañas y por ende se recabaron
los siguientes datos:
Solución
Zona de aceptación
0.206 4.85
F = 0.56
Se acepta H0
Conclusión: Las varianzas son iguales
EJERCICIOS 17.6
1. En una muestra de 21 observaciones, la estimación de la desviación estándar de la
población resultó ser de 8.0. En otra muestra de 16 observaciones, se descubrió que
la estimación es de 3.2. ¿Podemos aceptar la hipótesis de que las dos muestras provie-
nen de poblaciones que tienen igual varianza, o debemos de afirmar que la varianza
de la segunda muestra es menor? Use un nivel de significancia de 0.01.
2. Una cooperativa de empleados públicos en el área de la salud, tiene algún dinero para
invertir, y ha reducido su selección a un fondo mutuo A o B. La tasa de rendimiento
del fondo A es menor, pero al parecer es más estable que el fondo B. Si su variabilidad
de la tasa de interés, en efecto, es significativamente menor que la del fondo B, la
cooperativa invertirá su dinero en él. En caso contrario, preferirá el fondo B. Para
tomar una decisión, la cooperativa ha tomado una muestra de las tasas de rendimien-
to de 21 meses. En el caso del fondo A la desviación estándar es de 2 y la del fondo B
fue de 3. ¿En qué fondo debe invertir la cooperativa en mención? Realice su prueba
a un nivel de significancia del 5%.
3. Un equipo de investigadores obtuvieron la siguiente información sobre dos poblacio-
nes que se consideraba que tenían la misma variancia. Una muestra de 12 extraída de
la población 1 mostró una varianza muestral de 1.96, en tanto que una muestra de 10
seleccionada de la población 2 dio una varianza de 3.64.
a) Calcule la razón F para la prueba de igualdad de varianzas.
b) Obtenga el valor crítico F del extremo superior, empleando el nivel de significancia
de 0.05.
c) Obtenga el valor F correspondiente del extremo inferior.
d) Formule la conclusión de su prueba.
4. Una compañía fabricante de equipo médico utilizado en los quirófanos, está a punto
de dar a conocer un nuevo aparato más confiable y de altas resoluciones (CAS2), para
sustituir su viejo modelo CAS1. Dos muestras de 25 pruebas en operaciones delicadas
consecutivas realizadas en un hospital público, generaron la siguiente información:
Rendimiento de confiabilidad
CAS2 CAS1
Media 50 75
Desviación estándar 20 10
284 CAPÍTULO 17
Regresión simple y
correlación 18
Contenido
Pendiente positiva
b) Relación inversa
Pendiente negativa
X
Regresión simple y correlación 287
Diagramas de dispersión
El primer paso al determinar si existe una relación entre dos variables consiste en exami-
nar la gráfica de los datos observados; a ésta gráfica se le conoce como diagrama de
dispersión
Ejemplo de posibles relaciones entre X y Y en los diagramas de dispersión:
X X
X X
X X
∑ xy − nx y
Ŷ = a + bX; Donde b = y a = –y – bx—
∑x − n ( x )
2
2
Ejemplo 1
Para el siguiente conjunto de datos:
X: 7 5 6 8 7 9 9 6 8
Y: 2 1.5 1.75 2.3 3.2 3.1 2.9 1.85 2.1
288 CAPÍTULO 18
10
X
2 4 6 8 10
Solución inciso b)
X Y XY X2
7 2 14 49
5 1.5 7.5 25
6 1.75 10.5 36
8 2.3 18.4 64
7 3.2 22.4 49
9 3.1 27.9 81
9 2.9 26.1 81
6 1.85 11.1 36
8 2.1 16.8 64
65 20.7 154.7 485
te sería sumar los valores absolutos y la ecuación que presente el mínimo valor absoluto
de error, será la línea de mejor ajuste en la gráfica.
Ejemplo
Supóngase que dos ecuaciones de estimación presentan los resultados siguientes:
Ecuación 1 Ecuación 2
Y Ŷ |Y – Ŷ| Y Ŷ |Y – Ŷ|
4 4 0 4 5 1
7 3 4 7 4 3
2 2 0 2 3 1
4 5
Se puede apreciar que el error absoluto total de la ecuación 1 es menor que el error
absoluto total de la ecuación 2, por tanto, concluimos que la ecuación 1 es la que mejor
ajusta los datos.
Por otra parte, el estándar de la estimación nos proporciona la medición de confiabi-
lidad de la ecuación de estimación, proceso matemático que nos permite medir la variabi-
lidad o dispersión de los valores observador alrededor de la línea de regresión.
El error estándar de la estimación se puede calcular a través de:
∑(Y −Ŷ )
2
∑Y 2
− a∑Y − b ∑xy
Se = o Se =
N −2 n −2
A la segunda ecuación se le conoce como el método abreviado o más rápido para
determinar el error estándar de estimación, ya que nos evitamos los tediosos cálculos de
determinar el valor de Ŷ, pero ambas tienen el mismo propósito y exactamente se llega al
mismo resultado.
X = Valores de la variable independiente
Y = Valores de la variable dependiente
a = Intersección en Y o término independiente en Ŷ = a + bX
b = Pendiente en la ecuación Ŷ = a + bX
n = Número de parejas de datos.
Ejemplo
Consideremos la ecuación del ejemplo número 1 de la presente sección, donde:
X: 7 5 6 8 7 9 9 6 8
Y: 2 1.5 1.75 2.3 3.2 3.1 2.9 1.85 2.1
X Y XY X2 Y2
7 2 14 49 4
5 1.5 7.5 25 2.25
6 1.75 10.5 36 3.0625
8 2.3 18.4 64 5.29
7 3.2 22.4 49 10.24
9 3.1 27.9 81 9.61
9 2.9 26.1 81 8.41
6 1.85 11.1 36 3.4225
8 2.1 16.8 64 4.41
65 20.7 154.7 485 50.695
b = 0.3465
a = − 0.2052
290 CAPÍTULO 18
Solución
Utilizando la segunda fórmula Se =
∑Y 2
− a∑Y − b∑ xy
n −2
Entonces:
∑Y 2
− a∑Y − b∑xy 50.695 − (− 03.63)( 20.7 ) − ( 0.3465)(154.7 )
Se = = ≅ 0.41
n −2 8
Ejemplo
Supóngase que un complejo industrial invierte en reparaciones de equipo de acuerdo al
tiempo de uso que estos tengan (medido en años). Para trabajar con mayor exactitud en
el manejo del presupuesto el gerente ha determinado una ecuación de estimación dada
por Ŷ = 375 + 75X, con un error de 0.866 y donde X es el tiempo de uso en años y Ŷ el
costo en dólares por mantenimiento de cada equipo clasificación A.
Uno de los equipos de refrigeración tiene 4 años de uso y debe recibir mantenimiento
el próximo mes. Construya un intervalo de confianza de 95% en donde fluctuará el verda-
dero valor de Y.
Solución
El límite superior = Ŷ + tSe y el límite inferior = Ŷ – tSe
Como Ŷ = 375 + 75X, entonces: Ŷ (4) = 375 + 75(4) = 675
Entonces con n − 1 = 4 − 1 = 3 grados de libertad y una significancia de 5% se tiene
que t = 3.182, (ver tabla t de Student), luego.
LI = Ŷ − tSe = 675 − (3.182)(86.6) = 399.94 dólares
LS = Ŷ + tSe = 675 + (3.182)(86.6) = 950.56 dólares
Intervalo de fluctuación para Y, (399.94 ≤ Y ≤ 950.56)
EJERCICIOS 18.1
1. ¿Qué es el análisis de regresión?
2. En el análisis de regresión, ¿qué es una ecuación de estimación?
3. ¿Cuál es la finalidad del análisis de correlación?
Regresión simple y correlación 291
Gastos indirectos 191 170 272 155 280 173 234 116 153 178
Pacientes atendidos 40 42 53 35 56 39 48 30 37 40
a) Desarrolle la ecuación de regresión para los que trabajan en la contabilidad de cos-
tos de dicho hospital;
b) Prediga el gasto general cuando se atiendan a 50 pacientes;
c) Calcule el error estándar de la estimación.
S ( xx ) = ∑x 2
−
n
S ( yy ) =∑ y2 −
(∑y) 2
n
b) r =
∑(Y − Ŷ )2 o,
∑(Y − Y )2
a∑Y − b∑xy −n (Y )
2
c) r =
∑Y 2 − n (Y )2
Regresión simple y correlación 293
Ejemplo
Un investigador recolecta la siguiente información sobre la influencia de los programas de
televisión y los grados de violencia en dichos programas, para lo cual estableció una esca-
la del 1 al 10, y recopiló el porcentaje de televidentes que ven dichos programas del modo
siguiente:
Programa Grado de violencia (x) % De televidentes (y)
1 10 15
2 20 16
3 30 20
4 40 24
5 40 25
6 50 30
7 55 30
8 65 35
9 70 35
10 70 35
Solución inciso a)
X Y X2 Y2 XY
10 15 100 225 150
20 16 400 256 320
30 20 900 400 600
40 24 1600 576 960
40 25 1600 625 1000
50 30 2500 900 1500
55 30 3025 900 1650
65 35 4225 1225 2275
70 35 4900 1225 2450
70 35 4900 1225 2450
450 265 24150 7557 13355
∑ x∑ y ( 450 )( 265 )
S ( xy ) = ∑ xy − = 13355 −
n 10
S ( xx ) = ∑ x2 −
( ∑x ) 2
= 24150 −
( 450 )2
= 3900
n 10
S ( yy ) = ∑ y2 −
( ∑y )2 = 7557 − ( 265 )2 = 534.5
n 10
S ( xy )
Ahora como r = , entonces:
s ( xx ) S ( yy )
294 CAPÍTULO 18
S ( xy ) 1430
r= = ≅ 0.9904
S ( xx ) S ( yy ) ( 3900 )( 534.5 )
Entonces el coeficiente de correlación es r = 0.9904
Solución inciso b)
Como el coeficiente de determinación es el cuadrado del coeficiente de correlación, en-
tonces: r2 = (0.9904)2 ≅ 0.9808
Entonces: r2 = 0.9808
Solución inciso c)
Como r = 0.9904, la relación es directamente proporcional, y 0.9904 es un valor muy
cercano a 1, o sea que las variables están muy bien relacionadas.
Solución inciso d)
El porcentaje de relación entre las variables está dado por:
% = r2x100 = 0.9808x100 = 98.08%
Las variables están relacionadas en 98.08%, o sea que, a mayor violencia en los pro-
gramas de televisión, mayor es el porcentaje de televidentes.
Nota: A la fórmula utilizada en este ejemplo, se le conoce como el coeficiente de correla-
ción de Pearson, en honor al matemático británico Karl Pearson quien vivió en los años
1837 a 1936, y que, según algunos historiadores, se le considera como el fundador de la
estadística. Karl Pearson trabajó en muchos campos de la matemática y por ende en el
tema que nos atañe, y fórmulas como las siguientes llevan su nombre.
S ( xy )
r=
S ( xx ) S ( yy )
∑ x∑ y
S = ( xy ) =∑ xy −
n
S = ( xx ) =∑ x2 −
(
∑x
2
)
n
S = ( yy ) =∑ y2 −
( ∑y )2
n
EJERCICIOS 18.2
1. Una editorial en la región centroamericana, edita revistas sobre salud física y men-
tal. Los empleados han estado tratando de persuadir al dueño de la casa editora para
que mejore las condiciones de trabajo en el taller de prensa. Están convencidos, de
que el nivel de ruido cuando las prensas están funcionando, produce niveles nocivos
de tensión y ansiedad. Hace poco se administró un test psicológico durante el cual los
trabajadores del taller fueron puestos en cuartos con diversos niveles de ruido. La si-
guiente tabla muestra el índice de su grado de excitación o nerviosismo y el nivel del
ruido al que fueron expuestos. (1.0 es un nivel bajo y 10.0 es un nivel alto)
Nivel del ruido 4 3 1 2 6 7 2 3
Grado de exaltación 39 38 16 18 41 45 25 38
Regresión simple y correlación 295
∑(Y −Y )
2
∑ Y 2 − a∑Y −b∑xy
Se = o Se =
n −2 n −2
Una vez calculado Sb, podremos emplear la distribución t de Student con n – 2 grados
de libertad y también la siguiente ecuación para calcular los límites inferior y superior de
la región de aceptación:
Límite superior = b + t(Sb)
Límite inferior = b – t(Sb)
t = Valor aproximado de t (con n – 2 grados de libertad) para el nivel de signifi-
cancia de la prueba.
Donde: b = Pendiente real que se supone para la población
Sb = Error estándar del coeficiente de regresión
Ejemplo
Si:
X: 7 5 6 8 7 9 9 6 8
Y: 2 1.5 1.75 2.3 3.2 3.1 2.9 1.85 2.1
Solución inciso a)
X Y XY X2 Y2
7 2 14 49 4
5 1.5 7.5 25 2.25
6 1.75 10.5 36 3.0625
8 2.3 18.4 64 5.29
7 3.2 22.4 49 10.24
9 3.1 27.9 81 9.61
9 2.9 26.1 81 8.41
6 1.85 11.1 36 3.4225
8 2.1 16.8 64 4.41
65 20.7 154.7 485 50.695
∑Y 2 − a∑Y − b∑xy
Utilizando la segunda fórmula Se =
n −2
Regresión simple y correlación 297
Entonces:
Sb = 0.1075
Solución inciso c)
Como:
Límite superior = b + t(Sb)
Límite inferior = b − t(Sb)
Pero como Ŷ = − 0.2052 + 0.3465X; entonces podemos asumir que b = 0.3465;
Sb = 0.1075 y como n = 9, entonces con n – 2 grados de libertad, tenemos 7 grados de
libertad y α = 0.10, de la tabla de t de Student, se tiene que t = 1.895.
Límite superior = b + t (Sb) = 0.3465 + (1.895)(0.1075) ≅ 0.55
Límite inferior = b − t (Sb) = 0.3465 − (1.895)(0.1075) ≅ 0.14
Solución inciso d)
Así pues, en esta situación, tenemos una seguridad de 90% de que el verdadero valor de B
se halla entre 0.14 y 0.55.
EJERCICIOS 18.3
1. En un problema de regresión con una muestra de tamaño 20, se observó que la pen-
diente era de 1.52 y el error estándar de estimación era de 50.375. La cantidad
–
(ΣX 2 – n(X )2) = 1200.37
a) Calcule el error estándar del coeficiente de la pendiente de regresión;
b) Construya un intervalo de confianza de 95% para la pendiente de la población;
c) Interprete el anterior intervalo de confianza.
2. Los supervisores de las empresas de limpieza a menudo quieren saber cuál es el costo
por metro cuadrado para desinfectar las áreas con mayor contaminación en los hos-
pitales y clínicas. A continuación, se incluyen algunos datos sobre la superficie en
metros cuadrados y el costo en lempiras en 11 hospitales y clínicas en sus áreas de
emergencia y de pacientes internos.
Área: 1.1 1.5 1.6 1.6 1.4 1.3 1.1 1.7 1.9 1.5 1.3
Valor (Lps.) 40 49 54 51 48 46 41 56 62 50 45
Horas extras 5.0 8.0 2.0 4.0 3.0 7.0 1.0 6.0
Antigüedad 1.0 6.0 4.5 2.0 7.0 8.0 4.5 3.0
a) Calcular la ecuación de estimación
b) Calcular el error estándar de la estimación;
c) Calcular el error estándar del coeficiente de regresión;
d) Usando una significancia de 5%, establezca los límites inferior y superior;
e) Establezca la interpretación del intervalo de confianza.
4. Usando los siguientes datos:
X 15 6 10 5 12 14
Y 6 16 15 18 9 10
a) Desarrolle la ecuación de estimación que mejor describa los datos.
b) Calcular Se y Sb
c) Determine los límites inferior y superior (use un α = 0.02);
CAPÍTULO
Regresión múltiple y
análisis de correlación 19
Contenido
19.1 Introducción
19.2 Deducción de la ecuación de regresión
múltiple
19.3 Técnicas de modelado
300 CAPÍTULO 19
Ejemplo
La siguiente tabla representa los datos recabados por una unidad de investigación de la
Policía Nacional de Honduras, en donde se representa el número de personas por semana
que llegan lesionadas a la sala de emergencia de un hospital público por accidentes de
tránsito o riñas, y si esta situación está relacionada por la ingesta de bebidas alcohólicas
y el bajo nivel educativo de los ciudadanos, en donde 50 representa un alto nivel de alco-
hol en la sangre y de 12 a 17 una escala especial de medición para nivel educativo.
Solución inciso a)
∑ Y = na + b1 ∑ X1 + b 2 ∑ X
2
∑ X1Y = a ∑ X1 + b1∑ X12 + b2 ∑ X 1 X 2
∑ X 2Y = a ∑ X 2 + b1 ∑ X 1 X 2 + b 2 ∑ X 22
Tenemos:
272 = 10a + 141b1 + 147b2
12005 = 441a + 19461b1 + 6485b2
4013 = 147a + 6485b1 + 2173b2
Resolviendo el sistema, tenemos que:
a = – 13.828
b1 = 0.564
b2 = 1.099
Luego como Ŷ = a + b1X1 + b2X2, entonces:
Ŷ = – 13.828 + 0.564X1 + 1.099X2
Solución inciso b)
Con X1 = 35 y X2 = 12, tenemos:
Ŷ = –13.828 + 0.564X1 + 1.099X2
Ŷ = –13.828 + 0.564(35) + 1.099(12)
Ŷ = 19
En la sala de emergencia durante una semana cualesquiera y con los valores antes
mencionados, solo se esperaría atender unos 19 pacientes lesionados por efectos del alco-
hol y la vinculación del nivel educativo.
302 CAPÍTULO 19
EJERCICIOS 19.2
1. Si tenemos el siguiente conjunto de datos:
Y X1 X2
32 1.3 5.0
27 3.6 5.5
42 1.4 9.5
10 8.5 2.5
33 4.2 5.0
25 5.0 3.1
Y X1 X2 X3
74.6 5.3 3.5 5.8
90.8 6.1 4.7 6.2
64.2 5.0 3.6 5.4
93.4 7.0 4.9 8.8
77.7 5.5 4.1 6.0
60.2 3.8 2.9 5.0
96.6 7.2 5.2 7.6
34.3 2.1 2.2 3.1
X1 X2 X3 X4 Y
112.4 92.6 91.12 –0.2 8.22
115.7 70.4 92.4 0.5 27.39
114.8 81.8 89.6 0.2 19.46
111.8 101.4 90.9 –0.4 2.91
117.6 62.2 92.1 0.8 38.55
119.9 51.6 90.3 1.0 70.32
a) Determine la ecuación de regresión múltiple;
b) Prediga los valores para X1 = 120.8, X2 = 86.0, X3 = 95.2 y X4 = – 0.3
a) ¿Cuál es el error estándar de la estimación?
5. Ciertas personas afirman que las mujeres van más al médico, que los varones. Un in-
vestigador interesado en conocer como la variable género tiene alguna peculiaridad
en la asistencia de pacientes para el tratamiento de enfermedades comunes. Tomó los
siguientes datos de registros generados durante el año 2014 en un centro asistencial,
de la manera siguiente:
Enfermeros Enfermeras
Meses de Salario base Meses de Salaro base
empleo (miles) empleo (miles)
6 7.5 5 6.2
10 8.6 13 8.7
13 9.1 15 9.4
18 10.3 21 9.8
30 13
Por el momento, ignoremos la antigüedad del empleo y apliquemos las técnicas ex-
puestas sobre pruebas de hipótesis para la diferencia entre las medias de dos poblaciones,
a fin de averiguar si los hombres con profesión de enfermeros ganaban más que las muje-
res con profesión de enfermeras. Probemos esto con α = 0.01, suponiendo que los enfer-
meros son la población 1 y las enfermeras son la población 2, estaremos probando:
H0∶ μ1 = μ2 No hay discriminación por sexo en los salarios base
Ha∶ μ1 > μ2 Si hay discriminadas referente al salario base
α = 0.01
SP2 =
( n1 − 1) S12 + ( n2 − 1)2s
n1 + n2 − 2
( 4 )( 4.415 ) +( 3)( 2.609 )
SP2 =
5 + 4 −2
Sp2 ≅ 3.641 y SP = SP2 = 3.642 ≅ 1.90814
1 1
Luego si: σ X1 −X2 = SP + = (1.90841)( 0.671) ≅ 1.28
n1 n2
Salario
en miles
12
4
Meses
de empleo
4 8 12 16 20 24 28 30
El diagrama de dispersión nos muestra claramente que los salarios base aumentan
con la antigüedad; pero si se intenta ajustar a simple vista la línea de regresión, notará el
lector que los cuadritos tienden a estar sobre y los círculos tienden a estar debajo.
En estos casos de técnicas de modelado para adecuar la mejor línea de regresión,
debemos también de recurrir a otros procesos matemáticos importantes como lo es el
análisis de la salida de regresión referente al examen de los residuos. Si la regresión inclu-
ye todos los factores de explicación relevante, estos residuales deberían ser aleatorios. En
otras palabras, si los residuales muestran patrones no aleatorios, ello indica que hay algún
detalle sistemático que no hemos tomado en cuenta. Como conclusión sobre este acápite
buscamos patrones en los residuales o en términos coloquiales decimos: hay que exprimir
los residuales hasta que hablen.
EJERCICIOS 19.3
1. Describa tres situaciones de la vida diaria en las que las variables ficticias podrían
usarse en los modelos de regresión;
2. El director de transporte piensa que el incremento de la atención de ciudadanos de
escasos recursos económicos con respecto al uso del transporte público subsidiado
por el Estado, puede ser predicha a partir de mantener bajas tarifas en buses y taxis.
a) Mencione un modelo cuadrático que describa el número de pasajeros de escasos
recursos económicos que usan el transporte público. Establezca la forma de la
ecuación de regresión;
b) Se ha dicho que la ciudad en donde se movilizan estos ciudadanos las tarifas son
cómodas y accesibles debido al subsidio gubernamental. Extienda el modelo soli-
citado utilizando una variable ficticia para incorporar la sugerencia. También ex-
prese la forma del modelo de regresión.
3. La doctora Linda Sánchez dirige una clínica médica en Honduras. La doctora reunió
datos sobre la edad, reacción a la penicilina y presión sanguínea sistólica en 17 pa-
cientes. Estableció la presión como la variable dependiente, la edad como X1 y la re-
acción a la penicilina como X2. Suponiendo que 0 representa una reacción positiva a
la penicilina y que 1 representa una reacción negativa, realizó una regresión múltiple
con el programa SAS. La ecuación de predicción fue: Ŷ = 12.6 + 3.0X1 + 0.572X2
306 CAPÍTULO 19
a) Después que la regresión ya había sido corrida, la doctora Sánchez descubrió que
había tenido la intención de codificar como 1 una reacción positiva y como 0 la
reacción negativa. ¿Tiene que volver a correr la regresión?, si su respuesta es afir-
mativa explique por qué. Y si su respuesta es negativa dele la ecuación que habría
obtenido si la variable hubiera sido codificada como ella pretendía originalmente.
b) Si Sb2 tiene un valor de 0.12, ¿hay evidencia en un nivel de significancia de 0.05 de que
la reacción a la penicilina es una variable explicativa significativa de la presión sanguí-
nea sistólica?
CAPÍTULO
Estadística no
paramétrica 20
Contenido
Estadística no paramétrica
En fechas recientes los estadísticos han desarrollado técnicas útiles que no hacen suposi-
ciones restrictivas sobre la forma de las distribuciones de población. A estos métodos o
técnicas se les conoce con el nombre de no paramétricas. Las hipótesis de una prueba
no paramétrica se ocupan de otra cosa que no es el valor de un parámetro de la población.
Se dispone de varias de éstas pruebas, pero en el presente capítulo examinaremos solo
unas cuantas de las mejor conocidas y de mayor uso.
Ventajas de los métodos no paramétricos
1. No exigen hacer la suposición de que una población está distribuida en la forma de
una curva normal o tiene otra forma específica;
2. En general, son más fáciles de llevar a cabo y de entender.
Ejemplo
Antes 5 9 4 3 1 7 6
Después 6 10 3 3 2 5 8
+ + – 0 + – +
6. En esta prueba puede utilizarse la distribución normal sí y solo si np > 5
7. Si utiliza la prueba normal construya el intervalo de confianza para los límites de
fronteras mediante PH ± Zσ P–.
o
∑+
8. El estadístico de prueba a utilizar se calcula mediante P = , y se utiliza sí y solo
n
si ∑+ > ∑–. De ocurrir lo contrario el estadístico de prueba a utilizar debe ser
∑−
P= . Sin embargo, al trabajar con una cola izquierda debe trabajarse con la
n
sumatoria de signos menor y en el caso de la cola derecha debe hacerse con la suma-
toria de signos mayor.
Estadística no paramétrica 309
Ejemplo
Los siguientes datos muestran las tasas de trabajo defectuoso de los empleados de una
droguería antes y después de un cambio en el plan de incentivos. Compare los dos conjun-
tos de datos anexos para comprobar si con el cambio disminuyen el número de trabajos
defectuosos producidos en medicamentos tradicionales. Utilice un nivel de significancia
de 0.10.
Antes 8 7 6 9 7 10 8 6 5 8 10 8
Después 6 5 8 6 9 8 10 7 5 6 9 5
Solución
a) H0∶ PH = 0.50 (Disminuyeron los trabajos defectuosos)
0
Ha∶ PH < 0.50 (No disminuyeron los trabajos defectuosos)
0
α = 0.10
b)
Antes 8 7 6 9 7 10 8 6 5 8 10 8
Después 6 5 8 6 9 8 10 7 5 6 9 5
– – + – + – + + 0 – – –
∑– = 7; ∑+ = 4 y n = 11
Como ∑– > ∑+, trabajaremos con la ∑–; por otra parte como np = (11)(0.5) =
5.5 > 5.0, es más conveniente utilizar la distribución normal.
7 ∑−
Entonces el estadístico de prueba estaría dado por: P = =
≅ 0.64 , pero se-
n 11
gún el numeral 8 y el planteamiento de la hipótesis alternativa debemos trabajar con la
∑+ 4 ≅
sumatoria menor, por tanto, calcularemos el estadístico de prueba por P = = 0.36
n 11
a) Cálculo de error y las fronteras:
PH 0 q H0 (0.5)(0.5) ≅
σP = = 0.1507
n 11
LI = PH – Zσ P– = 0.5 – (1.28)(0.1507) = 0.31
0
310 CAPÍTULO 20
Zona de aceptación
Zona de rechazo
0.31 pH = 0.5
0
–
P = 0.36
Conclusión
Se acepta H0; el incentivo no hizo producir cambios en los trabajos defectuosos produci-
dos por los empleados de la droguería.
Un comentario final sobre la prueba de signos
Una prueba de signos como la anterior, es muy sencilla de llevar a cabo y se aplica por
igual a las pruebas de un extremo y a las de dos extremos. Por lo regular se basa en la
distribución binomial. Pero no se olvide que pudimos emplear la distribución normal a la
distribución binomial como nuestra distribución de muestreo, porque tanto np como nq
eran mayores que 5. Si no se cumplen tales condiciones, es preciso aplicar entonces la
distribución binomial.
EJERCICIOS 20.1
1. Mediante una escala especial de medición del desempeño, el personal de un hospital
psiquiátrico, revisan los métodos de atención de sus pacientes antes y después de la
implementación de un nuevo método de mejoras para su asistencia. Use la prueba de
signo para verificar si existe una diferencia entre los métodos de asistencia en servi-
cios utilizados antes y después de establecer una nueva política. Use el nivel de signi-
ficancia de 0.5.
Antes 15 17 16 19 17 20 18 16 15 18 20 18
Después 13 15 18 16 19 18 20 17 15 16 19 15
2. Los siguientes datos muestran el desempeño del antes y el después de los empleados
de una cadena de farmacias en Tegucigalpa, después de recibir un incremento sala-
rial. Compare los dos conjuntos de datos anexos para comprobar si con el incremen-
to salarial mejoró el desempeño de los empleados de la cadena de farmacias en
mención. Utilice un nivel de significancia de 0.10.
Antes 7 6 5 8 6 6 6 7 8 9 4 5 5 5 6 5 7
Después 7 7 7 8 7 5 8 8 8 7 6 7 8 9 6 6 7
Antes 32 35 33 36 44 41 36 32 39 31 47 30 34 29 41
Después 36 37 34 40 40 42 36 40 42 33 46 29 38 35 39
Antes 2 3 5 3 4 4 4 3 3 4 6 7 5 4 6 3 3 4
Después 3 3 6 5 5 6 6 4 5 6 7 7 7 6 6 4 4 4
¿Existe diferencia entre el antes y el después a raíz del cambio a la tecnología láser?
Use la prueba de signos pareados y un nivel de significancia del 5%.
5. Una organización internacional asegura que la conducta sexual de los jóvenes ha
cambiado a raíz de las campañas para la prevención de enfermedades de transmisión
sexual. Un investigador interesado por corroborar esta información, verifica los regis-
tros en varios centros hospitalarios del país, obteniendo la siguiente información:
20.2 Prueba U de Mann-Whitney
Cuando se tienen exactamente dos poblaciones en estudio, la prueba U de Mann-Whitney
es la indicada para determinar si las muestras independientes fueron extraídas de la mis-
ma población o de distintas poblaciones con la misma distribución.
En ésta prueba haremos uso de las siguientes fórmulas:
n1n2
a) µ U = (media de U)
2
n1 ( n1 + 1) 12 (12 +1)
c) U = n1n2 + − R1 = (12)(12)+ −169 = 53 , entonces U = 53
2 2
n1n2 ((12)12)
µU = = =72; entonces: µ U = 72 ;
2 2
n1n2 (n1 + n2 +1) (12)(12)(12 + 12 +1)
σU = = ≅ 17.32; entonces: σU = 17.32
12 12
Zona de aceptación
43.51 100.49
μU = 72
U = 53
EJERCICIOS 20.2
3. Los empresarios dedicados a la venta de medicinas dicen que las promociones y anun-
cios no dejan ninguna ganancia significativa para sus empresas (droguerías y farmacias).
Un administrador reúne información para verificar dichas afirmaciones y encuentra los
datos siguientes de clientes atendidos por semana con y sin promociones en los tres
complejos comerciales más grandes de la Ciudad de Tegucigalpa.
Universidad Pública 97 69 73 84 76 92 90 88 84 87 93
Universidad Privada 88 99 65 69 97 84 85 89 91 90 87 91 72
Ejemplo
En una droguería de la Ciudad de Tegucigalpa, todos los pagos son realizados en lempiras,
separados de acuerdo a la forma de pago. Pruebe la hipótesis de que no existe diferencia
en la cantidad de lempiras (en miles) recibidos por pagos en efectivo, cheque o tarjeta de
crédito.
Solución
a) H0∶ μ1 = μ2 = μ3 (No hay diferencia)
Ha∶ μ1 ≠ μ2 ≠ μ3 (Si hay diferencia)
α = 0.05
b) Cálculo de los rangos
KW ≅ 0.34
d) Luego K-1 grados de libertad 3 – 1 = 2gl y α = 0.05 de la tabla Ji-cuadrada se tiene
que χU2 = 5.991
316 CAPÍTULO 20
Zona de aceptación
Zona de rechazo
KW = 0.34 𝜒 2U = 5.991
Se acepta H0; Las cantidades pagadas con los tres métodos, no son significativamente
diferentes.
EJERCICIOS 20.3
1. Un aparato electromecánico para uso en hospitales de la Ciudad de San Pedro Sula,
es utilizado en operaciones hidráulicas. El aparato se compra en el mercado bajo tres
marcas diferentes. Use la prueba Kruskal-Wallis para determinar si hay diferencia
entre los precios de las tres marcas en todo el país. Utilice un nivel de significancia
del 0.01.
Marca A $ 89 90 92 81 76 88 85 95 97 86 100
Marca B $ 78 93 81 87 89 71 90 96 82 85
Marca C $ 80 88 86 85 79 80 84 85 90 92
2. En un complejo hospitalario funcionan tres clínicas dedicadas a consultas médicas
en medicina general, las cuales supuestamente no difieren en calidad, comodidad y
prestigio para sus pacientes en ésta área. Usando una prueba Kruskal-Wallis, ¿En un
nivel de significancia de 0.05, ¿puede usted afirmar que las clínicas en mención atien-
den el mismo número de pacientes?
Región Norte 8 9 9 9 8 7 7 8
Región Occidental 8 9 8 8 9 7 9 8 8
Región Oriental 9 8 8 8 7 8 8 8 9 7
Región Centro-sur 7 8 9 7 8 7 8 9 7 8 7
A un nivel de significancia de 10%, ¿pueden creer las autoridades de la Secretaría de
Salud que, en sus oficinas regionales, existe diferencia en la prestación de dichos
servicios?
Estadística no paramétrica 317
b) σ r =
(2n1n2 ) (2n1n2 − (n1+ n2 )) (error estándar del estadístico r)
(n1 + n1 ) (n1 + n2 − 1)
2
Ejemplo
Un gerente de talento humano dedicado a la investigación sobre controles de riesgos para
los empleados en las áreas de salud, clasificó una muestra de la manera siguiente:
A,B,A,A,A,B,B,A,B,B,A,A,B,A,B,A,A,B,B,B,B,A,B,B,A,A,A,B,A,B,A,A,B,B,A,B,B,A,A,A,B,B,
A,A,B,A,A,A.
A un nivel de significancia de 5% pruebe la aleatoriedad o no aleatoriedad en la toma
de los datos.
Solución
a) H0∶ Existe aleatoriedad
Ha∶ No existe aleatoriedad
α = 0.05
b) Sean n1 = ∑A = Tipo I y n2 = ∑B = Tipo II; entonces: n1 = 26 y n2 = 22
c) Para determinar el valor de r, deben contarse el número de corridas o secuencias en
la forma siguiente:
A, B, A, A, A, B, B, A, B, B, A, A, B, A, B, A, A, B, B, B, B, A, B, B, A, A, A, B, A, B, A, A, B,
B, A, B, B, A, A, A, B, B, A, A, B, A, A, A.
Luego r = 27 (Número de secuencias o corridas subrayadas)
d) Cálculo de la media y el error
2n1n2 2 (26)(22)
µr = +1 = +1 ≅ 24.84
n1 + n2 26 +22
Entonces μr = 24.84
σr =
(2n1n2 ) (2n1n2 − (n1 + n2 )) = (2)(26)(22) ((2)(26)(22) −(26 +22)) ≅ 3.4027
(n1 + n1 ) (n1 + n2 −1)
2 2
(26+ 22) (26 +22 −1)
σr = 3.4027
Como los límites se determinan por: μr ± Zσr entonces:
Zona de aceptación
r = 27
EJERCICIOS 20.4
1. A nivel nacional, se inspeccionó una secuencia de actividades en los centros de aco-
pio para la prevención de desastres naturales que solo cuentan con un empleado para
atender las demandas de los pobladores en cada una de sus zonas. En seguida se
presenta la secuencia de atención conforme o no conforme manifiesta por sus pobla-
dores:
D,A,A,A,D,D,D,D,D,A,A,D,D,A,A,A,A,D,A,A,D,D,D,D,D
ruebe la aleatoriedad o no aleatoriedad de los centros de acopio seleccionados.
P
Aplique el nivel de significancia de 0.05.
2. Una trabajadora social de un hospital público en el Departamento de La Paz, con el
objetivo de mejorar los servicios en la atención de los pacientes de más escasos recur-
sos económicos que asisten a resolver problemas pre operatorios, lleva un registro por
sexo de las personas que asisten a dicha oficina para quejarse por problemas de mala
atención de parte de los empleados del hospital, antes de someterse a una cirugía. He
aquí los datos en un día cualesquiera de atenciones en el hospital.
M,F,F,F,M,M,F,M,F,F,F,F,M,M,M,F,M,F,M,F,F,F,F,M,M,M,M,M
tilizando un nivel de significancia de 5%, pruebe la aleatoriedad de la secuencia
U
anterior.
3. La oficina de trabajo social del Hospital San Felipe, lleva el siguiente registro del nú-
mero diario de los pacientes que solicitan orientación y apoyo en el tratamiento a su
enfermedad. Los siguientes datos representan el orden en que visitaron la oficina en
mención durante los últimos 30 días.
3,4,6,8,4,6,7,2,5,7,4,8,4,7,9,5,9,10,5,7,4,9,8,9,11,6,7,5,9,12
ruebe la aleatoriedad de la secuencia anterior, comprobando si los valores situados
P
por encima y por debajo de la media ocurren en un orden aleatorio. Utilice el nivel de
significancia de 10%, pruebe la aleatoriedad de la secuencia anterior.
4. La facultad de teología de la Universidad Católica de Honduras, sostiene la teoría de
que el éxito favorece al éxito. En otras palabras, en su opinión, el hecho de graduar
profesionales de calidad y con los mejores principios morales, religiosos y profesiona-
les, aumenta la motivación de manera plena para seguir sirviendo a la sociedad de
Estadística no paramétrica 319
6∑d 2
rs = 1−
n ( n2 −1)
n = Número de pareados
Donde:
d = Diferencia entre los rangos de cada pareja de observaciones
Notas
1. Si rechazamos H0, diremos que la correlación es significativa;
2. Para n ≤ 30 la correlación no es normal y debe utilizarse la tabla de Rango de Spear-
man propuesta en los anexos del presente texto;
3. Si n > 30 utilice la tabla de la distribución normal con:
1 1
σ= yσr =
n −1 S
n −1
4. El valor de n es igual al número de parejas dado en el problema.
5. Las hipótesis se plantean explícitamente o utilizando nomenclaturas como las si-
guientes.
H0∶ ρs = 0
Ha∶ ρs ≠ 0
Ejemplo
La alcaldía municipal del Distrito Central tiene un estudio con relación al personal que
presta sus servicios profesionales en el área de atención al ciudadano, referente a los gas-
tos de capacitación sobre gestión de la calidad y el número de ciudadanos que se quejan
por la mala atención de los empleados municipales.
La siguiente tabla, muestra la cantidad de dólares invertidos por empleado y la rela-
ción número de empleados denunciados por un mal servicio en atención al ciudadano.
Número $ invertidos 60 37 30 20 24 42 39 54 48 58 26
# de inconformes 2 7 6 9 7 4 8 2 4 3 8
Al nivel de significancia del 5%, ¿existe una correlación significativa entre los gastos
y el número de ciudadanos inconformes?
Solución
a) Planteamiento de hipótesis
H0∶ ρS = 0 (Existe correlación significativa)
Ha∶ ρS ≠ 0 (No existe correlación significativa)
α = 0.05
320 CAPÍTULO 20
No. de
Cantidad de $ contaminados Diferencia
Pareja y rango y rango de rangos d d ²
60 2 20 1 2 1 11-1.5 9.5 90.25
37 7 24 2 2 2 5-7.5 –2.5 6.25
30 6 26 3 3 3 4-6.0 –2 4
20 9 30 4 4 4 1-11.0 –10 100
24 7 37 5 4 5 2-7.5 –5.5 30.25
42 4 39 6 6 6 7-4.5 2.5 6.25
39 8 42 7 7 7 6-9.5 –3.5 12
54 2 48 8 7 8 9-1.5 7.5 25
48 4 54 9 8 9 8-4.5 3.5 56.25
58 3 58 10 8 10 10-3.0 7 12.25
26 8 60 11 9 11 3-9.5 –6.5 49
409
∑d 2 = 409 y n = 11
c) Como:
6∑d 2 6 (409)
rs = 1− = 1− ≅ −0.86, Entonces: rs = −0.86
n( n2 −1) ( 2
11 (11) −1 )
d) Con n = 11 y α = 0.05, de la tabla de Spearman se obtiene que: rL = ± 0.6091
Zona de aceptación
Zona de rechazo
Zona de rechazo
rs = –0.86
EJERCICIOS 20.5
1. A continuación se dan las evaluaciones (X), y el rendimiento en el desempeño (Y)
obtenido por 8 jefes de departamento de la Secretaría de Salud. ¿Existe una correla-
ción significativa por rangos entre las dos medidas? Use un nivel de significancia de
0.10.
X 30 17 35 28 42 25 19 29
Y 35 31 43 46 50 32 33 42
Estadística no paramétrica 321
Horas extras 5.0 8.0 2.0 4.0 3.0 7.0 1.0 6.0 5.5 6.4
Antigüedad 1.0 6.0 4.5 2.0 7.0 8.0 4.5 3.0 4.7 6.0
3. La generalidad de la gente y los profesionales en salud mental, piensa que la experien-
cia produce mejores relaciones interpersonales entre un jefe y sus subordinados. En
una institución estatal se cuenta con los siguientes datos, referente a los jefes de uni-
dades, su edad y quejas expuestas por sus subalternos. En un nivel de significancia de
0.05, ¿sugiere la correlación por rangos entre los dos resultados que las relaciones
mejoran con la experiencia?
Notas
1. Los valores críticos o de frontera se calcularán de la tabla Kolmogorov-Smirnov (Ca-
pítulo 21);
2. n = ∑ f0 (f0 frecuencias observadas)
3. Si n > 35, los valores críticos se determinan por las fórmulas siguientes:
1.07
a) , si α = 0.20
n
1.14
b) , si α = 0.15
n
322 CAPÍTULO 20
1.22
c) , si α = 0.10
n
1.36
d) , si α = 0.05
n
e) 1.63 , si α = 0.01
n
4. Sí n ≤ 35, los valores críticos se buscan directamente de la tabla Kolmogorov-Smir-
nov, en los anexos del presente texto.
Ejemplo
La siguiente tabla muestra los datos del número de llegadas tarde de los empleados del
Hospital Viera, dado que sufrieron un retraso por congestión de tráfico.
Al nivel de significancia de 0.05; ¿podemos concluir que los datos en mención provie-
nen de una distribución de Poisson con λ = 3?
Solución
a) H0∶ Los datos provienen de una distribución de Poisson con λ = 3
Ha∶ Los datos no provienen de una distribución de Poisson con λ = 3
α = 0.05 y n = ∑ f0 = 100
b) Cálculo de KS
Como n > 35, ya que n = 100 y α = 0.05 , se tiene que el KS crítico o de la tabla, lo
1.36 1.36
determinamos por: = =0.1360
n 100
Como KS calculado es menor que el KS de la tabla, o sea que 0.1328 < 0.1360, se
concluye que debe aceptarse H0, y concluir que los datos provienen de una distribución
de Poisson con λ = 3.
Estadística no paramétrica 323
EJERCICIOS 20.6
1. El doctor Núñez, visitador médico de una compañía farmacéutica, tienen 7 clientes
que visitar por semana. Se considera que sus ventas pueden ser descritas con una
distribución binomial siendo de 0.45 la probabilidad de venderle a cada cliente. Exa-
mine la distribución de frecuencias observadas del número de ventas que el doctor
Núñez realiza por semana y determine si la distribución efectivamente corresponde a
la distribución sugerida. Utilice el nivel de significancia de 0.05.
2. Se adjunta una tabla de frecuencias observadas, junto con las frecuencias que cabe
esperar en una distribución normal.
a) Calcule el estadístico de Kolmogorov-Smirnov.
b) ¿Puede usted afirmar que esta distribución efectivamente sigue una distribución nor-
mal? Use el nivel de significancia de 0.10.
Puntuacion de la prueba
51-60 61-71 71-80 81-90 91-100
Frecuencia observada 30 100 440 500 130
Frecuencia esperada 40 170 500 390 100
Ganancias en miles
25-30 31-36 37-42 43-48 49-54 55-60 61-66
F.O 9 22 25 30 21 12 6
F.E 6 17 32 35 18 13 4
4. Un ingeniero químico que trabaja en los servicios de alimentos de una cadena famosa
de restaurantes en Tegucigalpa, examinó los registros de 200 platos de comida selec-
cionados aleatoriamente y que fueron servidos a los clientes-trabajadores de tres gran-
des empresas. El ingeniero se dio cuenta que estos alimentos se servían con poco sodio.
El número de personas que ha ingerido 1, 2, 3, 4 o más comidas con poco sodio, fueron
25, 45, 67, 43 y 20, respectivamente. En el nivel de significancia de 0.05, ¿puede el
ingeniero concluir con suficiente seguridad que el consumo de estas comidas con
poco sodio, siguen una distribución de Poisson con λ = 1?
324 CAPÍTULO 20
CAPÍTULO
Series temporales
21
Contenido
21.1 Introducción
21.2 Variaciones en las series de tiempo
21.3 Análisis de tendencia
21.4 Variación cíclica
21.5 Variación estacional
21.6 Variación irregular
326 CAPÍTULO 21
Series temporales
21.1 Introducción
El pronóstico o predicciones, es una herramienta imprescindible en cualquier proceso de
toma de decisiones. Entre sus aplicaciones se cuentan desde la determinación de las ne-
cesidades de un inventario hasta los más grandes acontecimientos que puedan suscitarse.
Por ejemplo, en el área laboral y comercial, los centros de trabajo incrementan su perso-
nal en las áreas de mayor demanda para fechas festivas como semana santa, fiestas de
navidad y fin año.
Por otra parte, las instituciones de prevención, mitigación y asistencias por acciones
inclementes de la naturaleza como en la llegada de huracanes, inundaciones o desastres
naturales que lesionan en gran escala a centenares de pobladores, y así sucesivamente
podríamos continuar dando más ejemplos sobre el tema.
La calidad de los pronósticos que los profesionales y técnicos puedan realizar, guar-
dan estrecha relación con la información que extraen de datos pasados secuenciales o no
secuenciales.
En general, el análisis de las series de tiempo se utiliza para descubrir los patrones de
cambio en la información estadística durante intervalos regulares de tiempo. Estos patro-
nes los proyectamos para llegar a una estimación en el futuro. Así pues, el análisis de se-
ries de tiempo nos ayuda a sortear la incertidumbre ante el porvenir.
Y Tendencia secular
X
Tiempo en años
incrementan o disminuyen en el tiempo como en las obras civiles, los incrementos de las
lluvias, los largos períodos de sequía, las demandas de adquisiciones personales en tempo-
radas específicas como lo es las fiestas navideñas y semana santa, etc…
Y Línea de tendencia
Fluctuación cíclica
X
Tiempo en años
El tercer tipo de cambio en los datos de una serie temporal es la variación estacional.
Como cabe suponer por el nombre, esta modalidad incluye patrones de cambio dentro de
un año, que tienden a repetirse año tras año. Por ejemplo, un administrador esperará un
aumento considerable de trabajo y acciones recurrentes en los períodos con altas exigen-
cias por clientes y empleados. Puesto que se trata de patrones periódicos, y que son útiles
en el pronóstico a futuro.
Y Variación estacional
X
Tiempo en años
Y Variación irregular
X
Tiempo en años
328 CAPÍTULO 21
Para concluir la presente sección, hasta ahora hemos dicho que una serie de tiempo
ofrece uno u otro de los tipos de variación. No obstante, en la generalidad de los casos una
serie contendrá varios de ellos. Por tanto, podemos percibir la variación global de una
serie en función de cuatro distintas clases de variación, razón por la cual, en las secciones
siguientes, examinaremos esos cuatro componentes y las formas en que se miden.
Ŷ = a + bX ; b =
∑xy − nx y y a = y − bx
∑x2 − n ( x )2
y = valores de la variable dependiente;
x = Valores de la variable independiente;
x– = media de los valores de la variable dependiente
Donde: –y = media de los valores de la variable independiente
n = número de puntos o parejas en la serie temporal
a = intercepto en y
b = pendiente de la ecuación
Codificación de tiempos
Cuando se usan códigos para los tiempos se obvian cálculos tediosos de la manera si-
guiente:
Para tiempos impares
–
X (años) X−X Tiempo codificado (x)
1995 1995-1997 –2
1996 1996-1997 –1
1997 1997-1997 0
1998 1998-1997 1
1999 1999-1997 2
Series temporales 329
Ŷ = a + bx; b =
∑xy y a = y , dado que la sumatoria de las variables codificadas siem-
∑x 2
pre será cero, entonces la media también será cero.
Ejemplo
Una compañía que fabrica aparatos utilizados en las unidades de cuidados intensivos de
los hospitales, registra el número de unidades entregadas por año de la siguiente manera:
Como Ŷ = a + bX ; b =
∑xY y a = y , entonces:
∑x 2
∑xY 615 y 667
b= = = 3.661; a = y = = = 83.375
∑x 168
2 n 8
Solución inciso b)
Para dar respuesta al inciso b, debe tenerse en cuenta lo siguiente:
1. El valor de x se calcula por la diferencia del año a estimar y el año medio;
2. Si el número de años es par, duplique el valor de x encontrado de acuerdo al proceso
del numeral anterior y evalúelo en la ecuación Ŷ = a + bx;
3. Si el número de años es un dato impar, para la estimación use exactamente el valor
de x determinado de acuerdo a lo que establece el numeral 1.
4. Debido a los tiempos codificados, cuando el número de años son pares, los intervalos
de tiempo se consideran cada 6 meses o medios años.
Continuando con la solución del inciso b de nuestro ejemplo y como Ŷ = 83.375 +
3.661x y la estimación es al año 2015, se tiene que:
x = 2015 – 1993.5 = 21.5 y por tratarse en el presente ejemplo que la cantidad de años
es un número par, entonces el valor de x a evaluar es x = 2(21.5) = 43, por tanto:
Ŷ = a + bx + cx2
∑Y = na + c ∑x2 Ecuación 1
Ejemplo
Los siguientes registros representan el número de trasplantes de riñón efectuadas por un
hospital de especialidades.
Solución inciso a)
X Y x x2 x4 xY x 2Y
2000 14 –3 9 81 –42 126
2001 18 –2 4 16 –36 72
2002 16 –1 1 1 –16 16
2003 21 0 0 0 0 0
2004 17 1 1 1 17 17
2005 24 2 4 16 48 96
2006 23 3 9 81 69 207
Total 133 0 28 196 40 534
b=
∑xY = 40 =1.43, entonces b =1.43
∑x2 28
Como:
∑Y = na + c ∑x2
∑x2 Y = a ∑x2 + c∑x4
Entonces:
133 = 7a + 28c
534 = 28a + 196c
Resolviendo el sistema se tiene que: a = 18.9 y c = 0.024
Luego Ŷ = a + bx + cx2 estará dada por Ŷ = 18.9 + 1.43x + 0.024x2
Solución inciso b)
x = 2013 − 2003 = 10 y como el número de años es impar, la ecuación de estimación
Ŷ = 18.9 + 1.43x + 0.024x2, debe ser evaluada exactamente en x = 10, por tanto:
Ŷ = 18.9 + 1.43x + 0.024(10)2 = 35.6
EJERCICIOS 21.3
Aproximadamente las autoridades del hospital de especialidades en mención, deben espe-
rar unos 36 trasplantes para el año 2013.
1. Una pequeña compañía que fabrica camillas móviles para el traslado de pacientes en
emergencia, desde que la fundaron han abastecido los pedidos de la Cruz Roja Hon-
dureña, y el número de camillas que se venden por año está representado por la si-
guiente serie de tiempo:
Año 2009 2010 2011 2012 2013 2014
Camillas vendidas 42 50 61 75 92 111
a) Encuentre la ecuación lineal que describe la tendencia del número de camillas
vendidas por la compañía;
b) Estime las ventas de camillas al año 2025.
2. Un ingeniero supervisor para la construcción de pequeños edificios para centros de
salud en la zona rural que funcionarán con energía solar, está examinando el número
de inmuebles a construir en todo el país durante los últimos 7 meses:
Mes Junio Julio Agosto Sept. Oct. Nov. Dic.
Número de edificios 6 17 25 28 32 43 50
332 CAPÍTULO 21
Y −Ŷ
x100 –7.26 4.46 9.45 0.67 –3.46 –1.23 1.86
Ŷ
% de tendencia
110
Línea de tendencia
105
100
95
90
2000 2001 2002 2003 2004 2005 2006 Años
EJERCICIOS 21.4
1. Una compañía de gas propano que abastece a pequeños clíper en los lugares más re-
motos del país, ha suministrado 18, 20, 21, 25 y 26 mil pies cúbicos de gas, respecti-
vamente del 2002 al 2006.
334 CAPÍTULO 21
Solución
Como el promedio es
∑xi =1000 +1050+ 896 +1070 = 1004
n 4
w 22.31
GVE = (Promedio) = (1004) ≅ 224
100 100
GVE = 224 Personas por día
El método de relación con el promedio móvil nos ayuda a tomar mejores decisiones
en el manejo del recurso necesario (humano y material) para atender de mejor manera las
afluencias de personas, por ejemplo, en el área administrativa puede relacionarse a clien-
tes que buscan un servicio en instituciones públicas o privadas.
Para llevarse a cabo un trabajo matemático de éste tipo y referente a las series tempo-
rales estacionales en relación con el promedio móvil o índice estacional, éste debe efec-
tuarse en cuatro pasos.
1. Calcular el total móvil de los n períodos en la serie de tiempo;
2. Determinar el promedio móvil de los n períodos dividido entre los n totales de la serie
de tiempo;
3. Encontrar el promedio móvil de los n períodos; y
4. Calcular el porcentaje del valor real respecto al valor promedio móvil en cada período
de la serie de tiempo.
Ejemplo
En una guardería del Estado utilizada para familiares de escasos recursos económicos
que provienen del interior del país, y que acompañan a su familiar enfermo durante la
hospitalización. El director de dicho complejo desea mejorar los servicios prestados a
estas personas y está examinando planes para asignar personal durante los períodos de
mayor afluencia.
336 CAPÍTULO 21
La siguiente tabla mostrará las modificaciones de los datos en los cuatro pasos.
Paso 4
Porcentaje
Paso 3
de los
Promedio
valores del
Paso 1 Paso 2 móvil
promedio
Total, Promedio centrado
real respecto
móvil de 4 móvil de 4 de 4
al móvil
Año Trimestre Ocupacion trimestres trimestres trimestres
(1) (2) (3) (4) (5) = (4) ÷ (4) (6) ( 7 ) = 63 x100
I 1861
II 2203 8387 2096.75 2104.250 114.8
1982
III 2415 8447 2111.75 2129.250 89.6
IV 1908
I 1921 8557 2146.75 2159.125 89.0
II 2343 8686 2171.50 2181.250 107.4
1983
III 2514 8764 2191.00 2180.125 115.3
IV 1986 8677 2169.25 2145.625 92.6
I 1834 8488 2122.00 2070.000 88.6
II 2154 8072 2018.00 1994.625 108.0
1984
III 2098 7885 1971.25 1971.625 106.4
IV 1799 7888 1972.00 1955.875 92.0
I 1837 7759 1939.75 1965.500 93.5
II 2025 7965 1991.25 2012.000 100.6
1985
III 2304 8131 2032.75 2062.250 111.7
IV 1965 8367 2091.75 2140.375 91.8
I 2073 8756 2189.00 2193.375 94.5
II 2414 8791 2197.75 2198.000 109.8
1986
III 2339 8793 2198.25
IV 1967
Explicación de la tabla:
En el paso 1 para el año de 1982 sumamos los valores de la columna (3) lo que resulta
8,387, el cual se ubicó entre los renglones de los trimestres 1982-II y 1982-III.
Para el dato 8447 ubicado en la cuarta columna debajo de 8387, se eliminó el dato
1861 del renglón 1982-I y se sumaron los datos restantes del año 1982 y el renglón 1983-
I o sea 2203 + 2415 + 1908 + 1921 = 8447. Al suprimir el primer valor y sumar el quinto
Series temporales 337
182.5
Trimestre I: = 91.25
2
215.4
Trimestre II: = 107.70
2
226.5
Trimestre III: = 113.25
2
183.8
Trimestre IV: = 91.90
2
Nótese que los cuatro índices de la tabla anterior dan un total de 404.1. No obstante,
la base de un índice es 100. En consecuencia, los cuatro índices trimestrales deberán su-
mar 400, y su media debería ser 100. Para corregir éste error, multiplicamos cada uno de
los índices trimestrales por una constante de ajuste. Este número se obtiene dividiendo la
suma deseada de los índices (400) entre la suma real (404.1).
338 CAPÍTULO 21
En este caso el resultado es 0.9899 y los cálculos restantes los presentamos mediante
la siguiente tabla.
EJERCICIOS 21.5
1. El dueño de una cadena de tiendas de zapatos ortopédicos en el país, ha recopilado
las siguientes cifras trimestrales relativas a la inversión en cuentas por cobrar durante
los últimos cinco años:
Estación
Año
Primavera Verano Otoño Invierno
1982 102 120 90 78
1983 110 126 95 83
1984 111 128 97 86
1985 115 135 103 91
1986 122 144 110 98
a) Calcule un promedio móvil centrado de 4 trimestres;
b) Obtenga el porcentaje del promedio real respecto al promedio móvil para cada
período;
c) Determine los índices estacionales modificados y los índices estacionales.
2. El jefe de personal de una fábrica de cosméticos y cremas para cuidados de la piel,
registró los siguientes índices de ausentismo de los empleados en sus puestos de tra-
bajo trimestralmente durante un período de cuatro años.
a) Construya un promedio móvil centrado de 4 trimestres y trácelo sobre una gráfica
junto con los datos originales;
b) ¿Qué puede concluir sobre el ausentismo en la parte a)?
3. El director de la sección de adquisiciones de un complejo hospitalario en la zona
norte del país, ha recopilado las siguientes cifras trimestrales referente a la inscrip-
ción de proveedores durante los años anteriores (X 100).
Estación
Año
Otoño Invierno Primavera Verano
1982 220 203 193 84
1983 235 208 206 76
1984 236 206 209 73
1985 241 215 206 92
1986 239 221 213 115
Series temporales 339
EJERCICIOS 21.6
1. ¿Por qué no proyectamos en el futuro las variaciones irregulares?
2. ¿Cuáles de los siguientes factores ejemplifica una variación irregular?
a) Una larga sequía que aumenta los precios de los alimentos.
b) El efecto de un volcán sobre las vías respiratorias de los niños.
c) El colapso del petróleo durante 1986.
d) El incremento abrupto del barril del petróleo en el 2008.
3. ¿Qué elementos permite al director de una institución de servicios públicos sortear la
variación irregular en una serie de tiempo?
340 CAPÍTULO 21
ANEXOS
Contenido
ANEXO A1
Tablas de distribuciones de probabilidad
Tabla 1. Distribución normal
Tabla 2. Distribución t de Student
Tabla 3. Distribución binomial
Tabla 4. Distribución de Poisson
Tabla 5. Distribución Ji-cuadrada
Tabla 6. Distribución F
Tabla 7. Correlación rangos de Spearman
Tabla 8. Kolmogorov-Smirnov
Tabla 9. Tabla de dígitos aleatorios
ANEXO A2
Respuestas a ejercicios de número par
ANEXO A3
Bibliografía
342 ANEXOS
Si Z es 2.25, se busca en la
columna de Z 2.2 y en
la columna 0.05, generan
el valor de área de 0.4878
𝜇=0 Z = 2.25
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2442 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3816 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
ANEXO A1 Tablas de distribuciones de probabilidad 343
1.729 1.729
Grados de
0.10 0.05 0.02 0.01
libertad
1 6.314 12.706 31.821 63.657
2 2.920 4.303 6.965 9.925
3 2.353 3.182 4.541 5.841
4 2.132 2.776 3.747 4.604
5 2.015 2.571 3.365 4.032
6 1.943 2.447 3.143 3.707
7 1.895 2.365 2.998 3.499
8 1.860 2.306 2.896 3.355
9 1.833 2.262 2.821 3.250
10 1.812 2.228 2.764 3.169
11 1.796 2.201 2.787 3.106
12 1.782 2.179 2.681 3.055
13 1.771 2.160 2.650 3.012
14 1.761 2.145 2.624 2.977
15 1.753 2.131 2.602 2.947
16 1.746 2.120 2.583 2.921
17 1.740 2.110 2.567 2.898
18 1.734 2.101 2.552 2.878
19 1.729 2.093 2.539 2.861
20 1.725 2.086 2.528 2.845
21 1.721 2.080 2.518 2.831
22 1.717 2.074 2.508 2.819
23 1.714 2.069 2.500 2.807
24 1.711 2.064 2.492 2.797
25 1.708 2.060 2.485 2.787
26 1.706 2.056 2.479 2.779
27 1.703 2.052 2.473 2.771
28 1.701 2.048 2.467 2.763
29 1.699 2.045 2.462 2.756
30 1.697 2.042 2.457 2.750
40 1.684 2.021 2.423 2.704
60 1.671 2.000 2.390 2.660
120 1.658 1.980 2.358 2.617
Distribución
1.645 1.960 2.326 2.576
Normal
344
Tabla 3. Probabilidades binomiales (A1)
P
n x x n
0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18
2 0 0.9801 0.9604 0.9409 0.9216 0.9025 0.8836 0.8649 0.8464 0.8281 0.8100 0.7921 0.7744 0.7569 0.7396 0.7225 0.7056 0.6889 0.6724 2
1 0.0198 0.0392 0.0582 0.0768 0.0950 0.1128 0.1302 0.1472 0.1638 0.1800 0.1958 0.2112 0.2262 0.2408 0.2550 0.2688 0.2822 0.2952 1
2 0.0001 0.0004 0.0009 0.0016 0.0025 0.0036 0.0049 0.0064 0.0081 0.100 0.0121 0.0144 0.0169 0.0196 0.0225 0.0256 0.0289 0.0324 0 2
3 0 0.9703 0.9412 0.9127 0.8847 0.8574 0.8306 0.8044 0.7787 0.7536 0.7290 0.7050 0.6815 0.6585 0.6361 0.6141 0.5927 0.5718 0.5514 3
1 0.0294 0.0576 0.0847 0.1106 0.1354 01590 0.1816 0.2031 0.2236 0.2430 0.2614 0.2788 0.2952 0.3106 0.3251 0.3387 0.3513 0.3631 2
ANEXOS
2 0.0003 0.0012 0.0026 0.0046 0.0071 0.0102 0.0137 0.0177 0.0221 0.0270 0.0323 0.0380 0.0441 0.0506 0.0574 0.0645 0.0720 0.0797 1
3 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0005 0.0007 0.0010 0.0013 0.0017 0.0022 0.0027 0.0034 0.0041 0.0049 0.0058 0 3
4 0 0.9606 0.9224 0.8853 0.8493 0.8145 0.7807 0.7481 0.7164 0.6857 0.6561 0.6274 0.5997 0.5729 0.5470 0.5220 0.4979 0.4746 0.4521 4
1 0.0388 0.0753 0.1095 0.1416 0.1715 0.1993 0.2252 0.2492 0.2713 0.2916 0.3102 0.3271 0.3424 0.3562 0.3685 0.3793 0.3888 0.3970 3
2 0.0006 0.0023 0.0051 0.0088 0.0135 0.0191 0.0254 0.0325 0.0402 0.0486 0.0575 0.0669 0.0767 0.0870 0.0975 0.1084 0.1195 0.1307 2
3 0.0000 0.0000 0.0001 0.0002 0.0005 0.0008 0.0013 0.0019 0.0027 0.0036 0.0047 0.0061 0.0076 0.0094 0.0115 0.0138 0.0163 0.0191 1
4 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0004 0.0005 0.0007 0.0008 0.0010 0 4
5 0 0.9510 0.9039 0.8587 0.8154 0.7738 0.7339 0.6957 0.6591 06240 0.5905 0.5584 0.5277 0.4984 0.4704 0.4437 0.4182 0.3939 0.3707 5
1 0.0480 0.0922 0.1328 0.1699 0.2036 0.2342 0.2618 0.2866 0.3086 03280 0.3451 0.3598 0.3724 0.3829 0.3915 0.3983 0.4034 0.4069 4
2 0.0010 0.0038 0.0082 0.0142 0.0214 0.0299 0.0394 0.0498 0.0610 0.0729 0.0853 0.0981 0.1113 0.1247 0.1382 0.1517 0.1652 0.1786 3
3 0.0000 0.0001 0.0003 0.0006 0.0011 0.0019 0.0030 0.0043 0.0060 0.0081 0.0105 0.0134 0.0166 0.0203 0.0244 0.0289 0.0338 0.0392 2
4 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0004 0.0007 0.0009 0.0012 0.0017 0.0022 0.0028 0.0035 0.0043 1
5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0 5
6 0 0.9415 0.8858 0.8330 0.7828 0.7351 0.6899 0.6470 0.6064 0.5679 0.5314 04970 0.4664 0.4336 0.4046 0.3771 0.3513 0.3269 0.3040 6
1 0.0571 0.1085 0.1546 0.1957 0.2321 0.2642 0.2922 0.3164 0.3370 0.3543 0.3685 0.3800 0.3888 0.3952 0.3993 0.4015 0.4018 0.4004 5
2 0.0014 0.0055 0.012 0.0204 0.0305 0.0422 0.0550 0.0688 0.0833 0.0984 0.1139 0.1295 0.1452 0.1608 0.1762 0.1912 0.2057 0.2197 4
3 0.0000 0.0002 0.0005 0.0011 0.0021 0.0036 0.0055 0.0080 0.0110 0.0146 0.0188 0.0236 0.0289 0.0349 0.0415 0.0486 0.0562 0.0643 3
4 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005 0.0008 0.0012 0.0017 0.0024 0.0032 0.0043 0.0055 0.0069 0.0086 0.0106 2
5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0004 0.0005 0.0007 0.0009 1
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 6
7 0 0.9321 0.8681 0.8080 0.7514 0.6983 0.6485 0.6017 0.5578 0.5168 0.4783 0.4423 0.4087 0.3773 0.3479 0.3206 0.2951 0.2714 0.2493 7
1 0.0659 0.1240 0.1749 0.2192 0.2573 0.2897 0.3170 0.3396 0.3578 0.3720 0.3827 0.3901 0.3946 0.3965 0.3960 0.3935 0.3891 0.3830 6
2 0.0020 0.0076 0.0162 0.0274 0.0406 0.0555 0.0716 0.0886 0.1061 0.1240 0.1419 0.1596 0.1769 0.1936 0.2097 0.2248 0.2391 0.2523 5
3 0.0000 0.0003 0.0008 0.0019 0.0036 0.0059 0.0090 0.0128 0.0175 0.0230 0.0292 0.0363 0.0441 0.0525 0.0617 0.0714 0.0816 0.0923 4
4 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0011 0.0017 0.0026 0.0036 0.0049 0.0066 0.0086 0.0109 0.0136 0.0167 0.0203 3
5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0004 0.0006 0.0008 0.0012 0.0016 0.0021 0.0027 2
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 1
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 7
x 0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82
n x n
P
Tabla 3. Probabilidades binomiales (A2)
P
n x x n
0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.9 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18
8 0 0.9227 0.8508 0.7837 0.7214 0.6634 0.6096 0.5596 0.5132 0.4703 0.4305 0.3937 0.3596 0.3282 0.2992 0.2725 0.2479 0.2252 0.2044 8
1 0.0746 0.1389 0.1939 0.2405 0.2793 0.3113 0.3370 0.3570 0.3721 0.3826 0.3892 0.3923 0.3923 0.3897 0.3847 0.3777 0.3691 0.3590 7
2 0.0026 0.0099 0.0210 0.0351 0.0515 0.0695 0.0888 0.1087 0.1288 0.1488 0.1684 0.1872 0.2052 0.2220 0.2376 0.2518 0.2646 0.2758 6
3 0.0001 0.0004 0.0013 0.0029 0.0054 0.0089 0.0134 0.0189 0.0255 0.0331 0.0416 0.0511 0.0613 0.0723 0.0839 0.0959 0.1084 0.1211 5
4 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0013 0.0021 0.0031 0.0046 0.0064 0.0087 0.0115 0.0147 0.0185 0.0228 0.0277 0.0332 4
5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0006 0.0009 0.0014 0.0019 0.0026 0.0035 0.0045 0.0058 3
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0002 0.0003 0.0005 0.0006 2
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1
8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 8
9 0 0.9135 0.8337 0.7602 0.6925 0.6302 0.5730 0.5204 0.4722 0.4279 0.3874 0.3504 0.3165 0.2855 0.2573 0.2316 0.2082 0.1869 0.1676 9
1 0.0830 0.1531 0.2116 0.2597 0.2985 0.3292 0.3525 0.3695 0.3809 0.3874 0.3897 0.3884 0.3840 0.3770 0.3679 0.3569 0.3446 0.3312 8
2 0.0034 0.0125 0.0262 0.0433 0.0629 0.0840 0.1061 0.1285 0.1507 0.1722 0.1927 0.2119 0.2295 0.2455 0.2597 0.2720 0.2823 0.2908 7
3 0.0001 0.0006 0.0019 0.0042 0.0077 0.0125 0.0186 0.0261 0.0348 0.0446 0.0556 0.0674 0.0800 0.0933 0.1069 0.1209 0.1349 0.1489 6
4 0.0000 0.0000 0.0001 0.0003 0.0006 0.0012 0.0021 0.0034 0.0052 0.0074 0.0103 0.0138 0.0179 0.0228 0.0283 0.0345 0.0415 0.0490 5
5 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005 0.0008 0.0013 0.0019 0.0027 0.0037 0.0050 0.0066 0.0085 0.0108 4
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0004 0.0006 0.0008 0.0012 0.0016 3
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 2
8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 9
10 0 0.9044 0.8171 0.7374 0.6648 0.5987 0.5386 0.4840 0.4344 0.3894 0.3487 0.3118 0.2785 0.2484 0.2213 0.1969 0.1749 0.1552 0.1374 10
1 0.0914 0.1667 0.2281 0.2770 0.3151 0.3438 0.3643 0.3777 0.3851 0.3874 0.3854 0.3798 0.3712 0.3603 0.3474 0.3331 3178 0.3077 9
2 0.0042 0.0153 0.0317 0.0519 0.0746 0.0988 0.1234 0.1478 0.1714 0.1937 0.2143 02330 0.2496 0.2639 0.2759 0.2856 0.2959 0.2980 8
3 0.0001 0.0008 0.0026 0.0058 0.0105 0.0168 0.0248 0.0343 0.0252 0.0574 0.0706 0.0847 0.0995 0.1146 0.1298 0.1450 0.1600 0.1745 7
4 0.0000 0.0000 0.0001 0.0004 0.0010 0.0019 0.0033 0.0052 0.0078 0.0102 0.0153 0.0202 0.0260 0.0326 0.0401 0.0483 0.0573 0.0670 6
5 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0003 0.0005 0.0009 0.0015 0.0023 0.0033 0.0047 0.0064 0.0085 0.0111 0.0141 0.0177 5
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0006 0.0009 0.0012 0.0018 0.0024 0.0032 4
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0004 3
ANEXO A1 Tablas de distribuciones de probabilidad
8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1
10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 10
x 0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82
n x n
P
345
346
12 0 0.8864 0.7847 0.6938 0.6127 0.5404 0.4759 0.4186 0.3677 0.3225 0.2824 0.2470 0.2157 0.1880 0.1637 0.1422 0.1234 0.1069 0.0924 12
1 0.1074 0.1922 0.2575 0.3064 0.3413 0.3645 0.3781 0.3837 0.3827 0.3766 0.3663 0.3529 0.3372 0.3197 0.3012 0.2821 0.2627 0.2434 11
2 0.0060 0.0216 0.0438 0.0702 0.0988 0.1280 0.1565 0.1835 0.2082 0.2301 0.2490 0.2647 0.2771 0.2863 0.2924 0.2955 0.2960 0.2939 10
3 0.0002 0.0015 0.0045 0.0098 0.0173 0.0272 0.0393 0.0532 0.0686 0.0852 0.1026 0.1203 0.1380 0.1553 0.1720 0.1876 0.2021 0.2151 9
ANEXOS
4 0.0000 0.0001 0.0003 0.0009 0.0021 0.0039 0.0067 0.0104 0.0153 0.0213 0.0285 0.0369 0.0464 0.0569 0.0683 0.0804 0.0931 0.1062 8
5 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0008 0.0014 0.0024 0.0038 0.0056 0.0081 0.0111 0.0148 0.0193 0.0245 0.0305 0.0373 7
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0003 0.0005 0.0008 0.0013 0.0019 0.0028 0.0040 0.0054 0.0073 0.0096 6
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0006 0.0009 0.0013 0.0018 5
8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0002 4
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 3
10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 12
15 0 0.8601 0.7386 0.6333 0.5421 0.4633 0.3953 0.3367 0.2863 0.2430 0.2059 0.1741 0.1470 0.1238 0.1041 0.0874 0.0731 0.0611 0.0510 15
1 0.1303 0.2261 0.2938 0.3388 0.3658 0.3785 0.3801 0.3734 0.3605 0.3432 0.3228 0.3006 0.2775 0.2542 0.2312 0.2090 0.1878 0.1678 14
2 0.0092 0.0323 0.0636 0.0988 0.1348 0.1691 0.2003 0.2273 0.2496 0.2669 0.2793 0.2870 0.2903 0.2897 0.2856 0.2787 0.2692 0.2578 13
3 0.0004 0.0029 0.0085 0.0178 0.0307 0.0468 0.0653 0.0857 0.1070 0.1285 0.1496 0.1696 0.1880 0.2044 0.2184 0.2300 0.2389 0.2452 12
4 0.0000 0.0002 0.0008 0.0022 0.0049 0.0090 0.0148 0.0223 0.0317 0.0428 0.0555 0.0694 0.0843 0.0998 0.1156 0.1314 0.1468 0.1615 11
5 0.0000 0.0000 0.0001 0.0002 0.0006 0.0013 0.0024 0.0043 0.0069 0.0105 0.0151 0.0208 0.0277 0.0357 0.0449 0.0551 0.0662 0.0780 10
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0003 0.0006 0.0011 0.0019 0.0031 0.0047 0.0069 0.0097 0.0132 0.0175 0.0226 0.0285 9
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0003 0.0005 0.0008 0.0013 0.0020 0.0030 0.0043 0.0059 0.0081 8
8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0005 0.0008 0.0012 0.0018 7
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 6
10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 5
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 4
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 3
13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1
15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 15
0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82
n x x n
P
Tabla 3. Probabilidades binomiales (A4)
P
n x x n
0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18
20 0 0.8179 0.6676 0.5438 0.4420 0.3585 0.2901 0.2342 0.1887 0.1516 0.1216 0.0972 0.0776 0.0617 0.0490 0.0388 0.0306 0.0241 0.0189 20
1 0.1652 0.2725 0.3364 0.3683 0.3774 0.3703 0.3526 0.3282 0.3000 0.2702 0.2403 0.2115 0.1844 0.1595 0.1368 0.1165 0.0986 0.0829 19
2 0.0159 0.0528 0.0988 0.1458 0.1887 0.2246 0.2521 0.2711 0.2818 0.2852 0.2822 0.2740 0.2618 0.2466 0.2293 0.2109 0.1919 0.1730 18
3 0.0010 0.0065 0.0183 0.0364 0.0596 0.0860 0.1139 0.1414 0.1672 0.1901 0.2093 0.2242 0.2347 0.2409 0.2428 0.2410 0.2358 0.2278 17
4 0.0000 0.0006 0.0024 0.0065 0.0133 0.0233 0.0364 0.0523 0.0703 0.0898 0.1099 0.1299 0.1491 0.1666 0.1821 0.1951 0.2053 0.2125 16
5 0.0000 0.0000 0.0002 0.0009 0.0022 0.0048 0.0088 0.0145 0.0222 0.0319 0.0435 0.0567 0.0713 0.0868 0.1028 0.1189 0.1345 0.1493 15
6 0.0000 0.0000 0.0000 0.0001 0.0003 0.0008 0.0017 0.0032 0.0055 0.0089 0.0134 0.0193 0.0266 0.0353 0.0454 0.0566 0.0689 0.0819 14
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0005 0.0011 0.0020 0.0033 0.0053 0.0080 0.0115 0.0160 0.0216 0.0282 0.0360 13
8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0012 0.0019 0.0030 0.0046 0.0067 0.0094 0.0128 12
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0007 0.0011 0.0017 0.0026 0.0038 11
10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0004 0.0006 0.0009 10
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 9
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 8
13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 7
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 6
15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 5
16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 4
17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 3
18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2
ANEXO A1 Tablas de distribuciones de probabilidad
19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1
20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 20
0.99 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.90 0.89 0.88 0.87 0.86 0.85 0.84 0.83 0.82
n x x n
P
347
348
Tabla 3. Probabilidades binomiales (A5)
P
n x x n
0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.30 0.31 0.32 0.33 0.34 0.35 0.36
2 0 0.6561 0.6400 0.6241 0.6084 0.5929 0.5776 0.5625 0.5476 0.5329 0.5184 0.5041 0.4900 0.4761 0.4624 0.4489 0.4356 0.4225 2
0.4096
1 0.3078 0.3200 0.3318 0.3432 0.3542 0.3648 0.3750 0.3848 0.3942 0.4032 0.4118 0.4200 0.4278 0.4352 0.4422 0.4488 0.4550 0.4608 1
2 0.0361 0.0400 0.0441 0.0484 0.0529 0.0576 0.0625 0.0676 0.0729 0.0784 0.0841 0.0900 0.0961 0.1024 0.1089 0.1156 0.1225 0.1296 0 2
3 0 0.5314 0.5120 0.4930 0.4746 0.4565 0.4390 0.4219 0.4052 0.3890 0.3732 0.3579 0.3430 0.3285 0.3144 0.3008 0.2875 0.2746 0.2621 3
1 0.3740 0.3840 0.3932 0.4015 0.4091 0.4159 0.4219 0.4271 0.4316 0.4355 0.4386 0.4410 0.4428 0.4439 0.4444 0.4443 0.4436 0.4424 2
ANEXOS
2 0.0877 0.0960 0.1045 0.1133 0.1222 0.1313 0.1406 0.1501 0.1597 0.1693 0.1791 0.1890 0.1989 0.2089 0.2189 0.2289 0.2389 0.2488 1
3 0.0069 0.0080 0.0093 0.0106 0.0122 0.0138 0.0156 0.0176 0.0197 0.0220 0.0244 0.0270 0.0298 0.0328 0.0359 0.0393 0.0429 0.0467 0 3
4 0 0.4305 0.4096 0.3895 0.3702 0.3515 0.3336 0.3164 0.2999 0.2840 0.2687 0.2541 0.2401 0.2267 0.2138 0.2015 0.1897 0.1785 0.1678 4
1 0.4039 0.4096 0.4142 0.4176 0.4200 0.4214 0.4219 0.4214 0.4201 0.4180 0.4152 0.4116 0.4074 0.4025 0.3970 0.3910 0.3845 0.3775 3
2 0.1421 0.1536 0.1651 0.1767 0.1882 0.1996 0.2109 0.2221 0.2331 0.2439 0.2544 0.2646 0.2745 0.2841 0.2933 0.3021 0.3105 0.3185 2
3 0.0222 0.0256 0.0293 0.0332 0.0375 0.0420 0.0469 0.0520 0.0575 0.0632 0.0693 0.0756 0.0822 0.0891 0.0963 0.1038 0.1115 0.1194 1
4 0.0013 0.0016 0.0019 0.0023 0.0028 0.0033 0.0039 0.0046 0.0053 0.0061 0.0071 0.0081 0.0092 0.0105 0.0119 0.0134 0.0150 0.0168 0 4
5 0 0.3487 0.3277 0.3077 0.2887 0.2707 0.2536 0.2373 0.2219 0.2073 0.1935 0.1804 0.1681 0.1564 0.1454 0.1350 0.1252 0.1160 0.1074 5
1 0.4089 0.4096 0.4090 0.4072 0.4043 0.4003 0.3955 0.3898 0.3834 0.3762 0.3685 0.3601 0.3513 0.3421 0.3325 0.3226 0.3124 0.3020 4
2 0.1919 0.2048 0.2174 0.2297 0.2415 0.2529 0.2637 0.2739 0.2836 0.2926 0.3010 0.3087 0.3157 0.3220 0.3275 0.3323 0.3364 0.3397 3
3 0.0450 0.0512 0.0578 0.0648 0.0721 0.0798 0.0879 0.0962 0.1049 0.1138 0.1229 0.1323 0.1418 0.1515 0.1613 0.1712 0.1811 0.1911 2
4 0.0053 0.0064 0.0077 0.0091 0.0108 0.0126 0.0146 0.0169 0.0194 0.0221 0.0251 0.0283 0.0319 0.0357 0.0397 0.0441 0.0488 0.0537 1
5 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008 0.0010 0.0012 0.0014 0.0017 0.0021 0.0024 0.0029 0.0034 0.0039 0.0045 0.0053 0.0060 0 5
6 0 0.2824 0.2621 0.2431 0.2252 0.2084 0.1927 0.1780 0.1642 0.1513 0.1393 0.1281 0.1176 0.1079 0.0989 0.0905 0.0827 0.0754 0.0687 6
1 0.3975 0.3932 0.3877 0.3811 0.3735 0.3651 0.3560 0.3462 0.3358 0.3251 0.3139 0.3025 0.2909 0.2792 0.2673 0.2555 0.2437 0.2319 5
2 0.2331 0.2458 0.2577 0.2687 0.2789 0.2882 0.2966 0.3041 0.3105 0.3160 0.3206 0.3241 0.3267 0.3284 0.3292 0.3290 0.3280 0.3261 4
3 0.0729 0.0819 0.0913 0.1011 0.1111 0.1214 0.1318 0.1424 0.1531 0.1639 0.1746 0.1852 0.1957 0.2061 0.2162 0.2260 0.2355 0.2446 3
4 0.0128 0.0154 0.0182 0.0214 0.0249 0.0287 0.0330 0.0375 0.0425 0.0478 0.0535 0.0595 0.0660 0.0727 0.0799 0.0873 0.0951 0.1032 2
5 0.0012 0.0015 0.0019 0.0024 0.0030 0.0036 0.0044 0.0053 0.0063 0.0074 0.0087 0.0102 0.0119 0.0137 0.0157 0.0180 0.0205 0.0232 1
6 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0007 0.0009 0.0011 0.0013 0.0015 0.0018 0.0022 0 6
7 0 0.2288 0.2097 0.1920 0.1757 0.1605 0.1465 0.1335 0.1215 0.1105 0.1003 0.0910 0.0824 0.0745 0.0672 0.0606 0.0546 0.0490 0.0440 7
1 0.3756 0.3670 0.3573 0.3468 0.3356 0.3237 0.3115 0.2989 0.2860 0.2731 0.2600 0.2471 0.2342 0.2215 0.2090 0.1967 0.1848 0.1732 6
2 0.2643 0.2753 0.2850 0.2935 0.3007 0.3067 0.3115 0.3150 0.3174 0.3186 0.3186 0.3177 0.3156 0.3127 0.3088 0.3040 0.2985 0.2922 5
3 0.1033 0.1147 0.1263 0.1379 0.1497 0.1614 0.1730 0.1845 0.1956 0.2065 0.2169 0.2269 0.2363 0.2452 0.2535 0.2610 0.2679 0.2740 4
4 0.0242 0.0287 0.0336 0.0389 0.0447 0.0510 0.0577 0.0648 0.0724 0.0803 0.0886 0.0972 0.1062 0.1154 0.1248 0.1345 0.1442 0.1541 3
5 0.0034 0.0043 0.0054 0.0066 0.0080 0.0097 0.0115 0.0137 0.0161 0.0187 0.0217 0.0250 0.0286 0.0326 0.0369 0.0416 0.0466 0.0520 2
6 0.0003 0.0004 0.0005 0.0006 0.0008 0.0010 0.0013 0.0016 0.0020 0.0024 0.0030 0.0036 0.0043 0.0051 0.0061 0.0071 0.0084 0.0098 1
7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0008 0 7
0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0.73 0.72 0.71 0.70 0.69 0.68 0.67 0.66 0.65 0.64
n x x n
P
Tabla 3. Probabilidades binomiales (A6)
P
n x x n
0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.30 0.31 0.32 0.33 0.34 0.35 0.36
8 0 0.1853 0.1678 0.1517 0.1370 0.1236 0.1113 0.1001 0.0899 0.0806 0.0722 0.0646 0.0576 0.0514 0.0457 0.0406 0.0360 0.0319 0.0281 8
1 0.3477 0.3355 0.3226 0.3092 0.2953 0.2812 0.2670 0.2527 0.2386 0.2247 0.2110 0.1977 0.1847 0.1721 0.1600 0.1484 0.1373 0.1267 7
2 0.2855 0.2936 0.3002 0.3052 0.3087 0.3108 0.3115 0.3108 0.3089 0.3058 0.3017 0.2965 0.2904 0.2835 0.2758 0.2675 0.2587 0.2494 6
3 0.1339 0.1468 0.1596 0.1722 0.1844 0.1963 0.2076 0.2184 0.2285 0.2379 0.2464 0.2541 0.2609 0.2668 0.2717 0.2756 0.2786 0.2805 5
4 0.0393 0.0459 0.0530 0.0607 0.0689 0.0775 0.0865 0.0959 0.1056 0.1156 0.1258 0.1361 0.1465 0.1569 0.1673 0.1775 0.1875 0.1973 4
5 0.0074 0.0092 0.0113 0.0137 0.0165 0.0196 0.0231 0.0270 0.0313 0.0360 0.0411 0.0467 0.0527 0.0591 0.0659 0.0732 0.0808 0.0888 3
6 0.0009 0.0011 0.0015 0.0019 0.0025 0.0031 0.0038 0.0047 0.0058 0.0070 0.0084 0.0100 0.0118 0.0139 0.0162 0.0188 0.0217 0.0250 2
7 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008 0.0010 0.0012 0.0015 0.0019 0.0023 0.0028 0.0033 0.0040 1
8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0 8
9 0 0.1501 0.1342 0.1199 0.1069 0.0952 0.0846 0.0751 0.0665 0.0589 0.0520 0.0458 0.0404 0.0355 0.0311 0.0272 0.0238 0.0207 0.0180 9
1 0.3169 0.3020 0.2867 0.2713 0.2558 0.2404 0.2253 0.2104 0.1960 0.1820 0.1685 0.1556 0.1433 0.1317 0.1206 0.1102 0.1004 0.0912 8
2 0.2973 0.3020 0.3049 0.3061 0.3056 0.3037 0.3003 0.2957 0.2899 0.2831 0.2754 0.2668 0.2576 0.2478 0.2376 0.2270 0.2162 0.2052 7
3 0.1627 0.1762 0.1891 0.2014 0.2130 0.2238 0.2336 0.2424 0.2502 0.2569 0.2624 0.2668 0.2701 0.2721 0.2731 0.2729 0.2716 0.2693 6
4 0.0573 0.0661 0.0754 0.0852 0.0954 0.1060 0.1168 0.1278 0.1388 0.1499 0.1608 0.1715 0.1820 0.1921 0.2017 0.2109 0.2194 0.2272 5
5 0.0134 0.0165 0.0200 0.0240 0.0285 0.0335 0.0389 0.0449 0.0513 0.0583 0.0657 0.0735 0.0818 0.0904 0.0994 0.1086 0.1181 0.1278 4
6 0.0021 0.0028 0.0036 0.0045 0.0057 0.0070 0.0087 0.0105 0.0127 0.0151 0.0179 0.0210 0.0245 0.0284 0.0326 0.0373 0.0424 0.0479 3
7 0.0002 0.0003 0.0004 0.0005 0.0007 0.0010 0.0012 0.0016 0.0020 0.0025 0.0031 0.0039 0.0047 0.0057 0.0069 0.0082 0.0098 0.0116 2
8 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0007 0.0008 0.0011 0.0013 0.0016 1
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0 9
10 0 0.1216 0.1074 0.0947 0.0834 0.0733 0.0643 0.0563 0.0492 0.0430 0.0374 0.0326 0.0282 0.0245 0.0211 0.0182 0.0157 0.0135 0.0115 10
1 0.2852 0.2684 0.2517 0.2351 0.2188 0.2030 0.1877 0.1730 01590 0.1456 0.1330 0.1211 0.1099 0.0995 0.0898 0.0808 0.0725 0.0649 9
2 0.3010 0.3020 0.3011 0.2984 0.2942 0.2885 0.2816 0.2735 0.2646 0.2548 0.2444 0.2335 0.2222 0.2107 0.1990 0.1873 0.1757 0.1642 8
3 0.1883 0.2013 0.2134 0.2244 0.2343 0.2429 0.2503 0.2563 0.2609 0.2642 0.2662 0.2668 0.2662 0.2644 0.2614 0.2573 0.2522 0.2462 7
4 0.0773 0.0881 0.0993 0.1108 0.1225 0.1343 0.1460 0.1576 0.1689 0.1798 0.1903 0.2001 0.2093 0.2177 0.2253 0.2320 0.2377 0.2424 6
5 0.0218 0.0264 0.0317 0.0375 0.0439 0.0509 0.0584 0.0664 0.0750 0.0839 0.0933 0.1029 0.1128 0.1229 0.1332 0.1434 0.1536 0.1636 5
6 0.0043 0.0055 0.0070 0.0088 0.0109 0.0134 0.0162 0.0195 0.0231 0.0272 0.0317 0.0368 0.0422 0.0482 0.0547 0.0616 0.0689 0.0767 4
7 0.0006 0.0008 0.0011 0.0014 0.0019 0.0024 0.0031 0.0039 0.0049 0.0060 0.0074 0.0090 0.0108 0.0130 0.0154 0.0181 0.0212 0.0247 3
ANEXO A1 Tablas de distribuciones de probabilidad
8 0.0001 0.00001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0014 0.0018 0.0023 0.0028 0.0035 0.0043 0.0052 2
9 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 1
10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 10
0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0.73 0.72 0.71 0.70 0.69 0.68 0.67 0.66 0.65 0.64
n x x n
P
349
350
ANEXOS
12 0 0.0798 0.0687 0.0591 0.0507 0.0434 0.0371 0.0317 0.0270 0.0229 0.0194 00164 0.0138 0.0116 0.0098 0.0082 0.0068 0.0057 0.0047 12
1 0.2245 0.2062 0.1885 0.1717 0.1557 0.1407 0.1267 0.1137 0.1016 0.0906 0.0804 0.0712 0.0628 0.0552 0.0484 0.0422 0.0368 0.0319 11
2 0.2897 0.2835 0.2756 0.2663 0.2558 0.2444 0.2323 0.2197 0.2068 0.1937 0.1807 0.1678 0.1552 0.1429 0.1310 0.1197 0.1088 0.0986 10
3 0.2265 0.2362 0.2442 0.2503 0.2547 0.2573 0.2581 0.2573 0.2549 0.2511 0.2460 0.2397 0.2324 0.2241 0.2151 0.2055 0.1954 0.1849 9
4 0.1195 0.1329 0.1460 0.1589 0.1712 0.1828 0.1936 0.2034 0.2122 0.2197 0.2261 0.2311 0.2349 0.2373 0.2384 0.2382 0.2367 0.2340 8
5 0.0449 0.0532 0.0621 0.0717 0.0818 0.0924 0.1032 0.1143 0.1255 0.1367 0.1477 0.1585 0.1688 0.1787 0.1879 0.1963 0.2039 0.2106 7
6 0.0123 0.0155 0.0193 0.0236 0.0285 0.0340 0.0401 0.0469 0.0542 0.0620 0.0704 0.0792 0.0885 0.0981 0.1079 0.1180 0.1281 0.1382 6
7 0.0025 0.0033 0.0044 0.0057 0.0073 0.0092 0.0115 0.0141 0.0172 0.0207 0.0246 0.0291 0.0341 0.0396 0.0456 0.0521 0.0591 0.0666 5
8 0.0004 0.0005 0.0007 0.0010 0.0014 0.0018 0.0024 0.0031 0.0040 0.0050 0.0063 0.0078 0.0096 0.0116 0.0140 0.0168 0.0199 0.0234 4
9 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0015 0.0019 0.0024 0.0031 0.0038 0.0048 0.0059 3
10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0003 0.0003 0.0005 0.0006 0.0008 0.0010 2
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 1
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.00000 0.0000 0.0000 0.0000 0.0000 0 12
0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0.73 0.72 0.71 0.70 0.69 0.68 0.67 0.66 0.65 0.64
n x x n
P
Tabla 3. Probabilidades binomiales (A8)
P x n
n x
0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29 0.30 0.31 0.32 0.33 0.34 0.35 0.36
15 0 0.0424 0.0352 0.0291 0.0241 0.0198 0.0163 0.0134 0.0109 0.0089 0.0072 0.0059 0.0047 0.0038 0.0031 0.0025 0.0020 0.0016 0.0012 15
1 0.1492 0.1319 0.1162 0.1018 0.0889 0.0772 0.0668 0.0576 0.0494 0.0423 0.0360 0.0305 0.0258 0.0217 0.0182 0.0152 0.0126 0.0104 14
2 0.2449 0.2309 0.2162 0.2010 0.1858 0.1707 0.1559 0.1416 0.1280 0.1150 0.1029 0.0916 0.0811 0.0715 0.0627 0.0547 0.0476 0.0411 13
3 0.2489 0.2501 0.2490 0.2457 0.2405 0.2336 0.2252 0.2156 0.2051 0.1939 0.1821 0.1700 0.1579 0.1457 0.1338 0.1222 0.1110 0.1002 12
4 0.1752 0.1876 0.1986 0.2079 0.2155 0.2213 0.2252 0.2273 0.2276 0.2262 0.2231 0.2186 0.2128 0.2057 0.1977 0.1888 0.1792 0.1692 11
5 0.0904 0.1032 0.1161 0.1290 0.1416 0.1537 0.1651 0.1757 0.1852 0.1935 0.2005 0.2061 0.2103 0.2130 0.2142 0.2140 0.2123 0.2093 10
6 0.0353 0.0430 0.0514 0.0606 0.0705 0.0809 0.0917 0.1029 0.1142 0.1254 0.1365 0.1472 0.1575 0.1671 0.1759 0.1837 0.1906 0.1963 9
7 0.0107 0.0138 0.0176 0.0220 0.0271 0.0329 0.0393 0.0465 0.0543 0.0627 0.0717 0.0811 0.0910 0.1011 0.1114 0.1217 0.1319 0.1419 8
8 0.0025 0.0035 0.0047 0.0062 0.0081 0.0104 0.0131 0.0163 0.0201 0.0244 0.0293 0.0348 0.0409 0.0476 0.0549 0.0627 0.0710 0.0798 7
9 0.0005 0.0007 0.0010 0.0014 0.0019 0.0025 0.0034 0.0045 0.0058 0.0074 0.0093 0.0116 0.0143 0.0174 0.0210 0.0251 0.0298 0.0349 6
10 0.0001 0.0001 0.0002 0.0002 0.0003 0.0005 0.0007 0.00009 0.00133 0.0017 0.0023 0.0030 0.0038 0.0049 0.0062 0.0078 0.0096 0.0118 5
11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0006 0.0008 0.0011 0.0014 0.0018 0.0024 0.0030 4
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0006 3
13 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 2
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1
15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 15
20 0 0.0148 0.0115 0.0090 0.0069 0.0054 0.0041 0.0032 0.0024 0.0018 0.0014 0.0014 0.0011 0.0006 0.0004 0.0003 0.0002 0.0002 0.0001 20
1 0.0693 0.0576 0.0477 0.0392 0.0321 0.0261 0.0211 0.0170 0.0137 0.0109 0.0087 0.0068 0.0054 0.0042 0.0033 0.0025 0.0020 0.0015 19
2 0.1545 0.1369 0.1204 0.1050 0.0910 0.0783 0.0669 0.0569 0.0480 0.0403 0.0336 0.0278 0.0229 0.0188 0.0153 0.0124 0.0110 0.0080 18
3 0.2175 0.2054 0.1920 0.1777 0.1631 0.1484 0.1339 0.1199 0.1065 0.0940 0.0823 0.0716 0.0619 0.0531 0.0453 0.0383 0.0323 0.0270 17
4 0.2168 0.2182 0.2169 0.2131 0.2070 0.1991 0.1897 0.1790 0.1675 0.1553 0.1429 0.1304 0.1181 0.1062 0.0947 0.0839 0.0738 0.0645 16
5 0.1627 0.1746 0.1845 0.1923 0.1979 0.2012 0.2023 0.2013 0.1982 0.1933 0.1868 0.1789 0.1698 0.1599 0.1493 0.1384 0.1272 0.1161 15
6 0.0954 0.1091 0.1226 0.1356 0.1478 0.1589 0.1686 0.1768 0.1833 0.1879 0.1907 0.1916 0.1907 0.1881 0.1839 0.1782 0.1712 0.1632 14
7 0.0448 0.0545 0.0652 0.0765 0.0883 0.1003 0.1124 0.1242 0.1356 0.1462 0.1558 0.1643 0.1714 0.1770 0.1811 0.1836 0.1844 0.1836 13
8 0.0171 0.0222 0.0282 0.0351 0.0429 0.0515 0.0609 0.0709 0.0815 0.0924 0.1034 0.1144 0.1251 0.1354 0.1450 0.1537 0.1614 0.1678 12
9 0.0053 0.0074 0.0100 0.0132 0.0171 0.0217 0.0271 0.0332 0.0402 0.0479 0.0563 0.0654 0.0750 0.0849 0.0952 0.1056 0.1158 0.1259 11
10 0.0014 0.0020 0.0029 0.0041 0.0056 0.0075 0.0099 0.0128 0.0163 0.0205 0.0253 0.0308 0.0370 0.0440 0.0516 0.0598 0.0686 0.0779 10
11 0.0003 0.0005 0.0007 0.0010 0.0015 0.0022 0.0030 0.0041 0.0055 0.0072 0.0094 0.0120 0.0151 0.0188 0.0231 0.0280 0.0336 0.0398 9
12 0.0001 0.0001 0.0001 0.0002 0.0003 0.0005 0.0008 0.0011 0.0015 0.0021 0.0029 0.0039 0.0051 0.0066 0.0085 0.0108 0.0136 0.0168 8
13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0002 0.0003 0.0005 0.0007 0.0010 0.0014 0.0019 0.0026 0.0034 0.0045 0.0058 7
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0005 0.0006 0.0009 0.0012 0.0016 6
15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0004 5
ANEXO A1 Tablas de distribuciones de probabilidad
16 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 4
17 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 3
18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 2
19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1
20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 20
x 0.81 0.80 0.79 0.78 0.77 0.76 0.75 0.74 0.73 0.72 0.71 0.70 0.69 0.68 0.67 0.66 0.65 0.64 x n
n
P
351
352
4 0.2067 0.2157 0.2242 0.2322 0.2397 0.2465 0.2526 0.2580 0.2627 0.2665 0.2695 0.2717 0.2730 0.2734 4
5 0.0971 0.1058 0.1147 0.1239 0.1332 0.1428 0.1525 0.1622 0.1719 0.1816 0.1912 0.2006 0.2098 0.2187 3
6 0.0285 0.0324 0.0367 0.0413 0.0463 0.0517 0.0575 0.0637 0.0703 0.0774 0.0848 0.0926 0.1008 0.1094 2
7 0.0048 0.0057 0.0067 0.0079 0.0092 0.0107 0.0124 0.0143 0.0164 0.0188 0.0215 0.0244 0.0277 0.0312 1
8 0.0004 0.0004 0.0005 0.0007 0.00008 0.0010 0.0012 0.0014 0.0017 0.0020 0.0024 0.0028 0.0033 0.0039 0 8
9 0 0.0156 0.0135 0.0117 0.0101 0.0087 0.0074 0.0064 0.0054 0.0046 0.0039 0.0033 0.0028 0.0023 0.0020 9
1 0.0826 0.0747 0.0673 0.0605 0.0542 0.0484 0.0431 0.0383 0.0339 0.0299 0.0263 0.0231 0.0202 0.0176 8
2 0.1941 0.1831 0.1721 0.1612 0.1506 0.1402 0.1301 0.1204 0.1110 0.1020 0.0934 0.0853 0.0776 0.0703 7
3 0.2660 0.2618 0.2567 0.2508 0.2442 0.2369 0.2291 0.2207 0.2119 0.2027 0.1933 0.1837 0.1739 0.1641 6
4 0.2344 0.2407 0.2462 0.2508 0.2545 0.2573 0.2592 0.2601 0.2600 0.2590 0.2571 0.2543 0.2506 0.2461 5
5 0.1376 0.1475 0.1574 0.1672 0.1769 0.1863 0.1955 0.2044 0.2128 0.2207 0.2280 0.2347 0.2408 0.2461 4
6 0.0539 0.0603 0.0671 0.0743 0.0819 0.0900 0.0983 0.1070 0.1160 0.1253 0.1348 0.1445 0.1542 0.1641 3
7 0.0136 0.0158 0.0184 0.0212 0.0244 0.0279 0.0318 0.0360 0.0407 0.0458 0.0512 0.0571 0.0635 0.0703 2
8 0.0020 0.0024 0.0029 0.0035 0.0042 0.0051 0.0060 0.0071 0.0083 0.0097 0.0114 0.0132 0.0153 0.0176 1
9 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0008 0.0009 0.0011 0.0014 0.0016 0.0020 0 9
10 0 0.0098 0.0084 0.0071 0.0060 0.0051 0.0043 0.0036 0.0030 0.0025 0.0021 0.0017 0.0014 0.0012 0.0010 10
1 0.0578 0.0514 0.0456 0.0403 0.0355 0.0312 0.0273 0.00238 0.0207 0.0180 0.0155 0.0133 0.0114 0.0098 9
2 0.1529 0.1419 0.1312 0.1209 0.1111 0.1017 0.0927 0.0843 0.0763 0.0688 0.0619 0.0554 0.0494 0.0439 8
3 0.2394 0.2319 0.2237 0.2150 0.2058 0.1963 0.1865 0.1765 0.1665 0.1564 0.1464 0.1364 0.1267 0.1172 7
4 0.2461 0.2487 0.2503 0.2508 0.2503 0.2488 0.2462 0.2427 0.2384 0.2331 0.2271 0.2204 0.2130 0.2051 6
5 0.1734 0.1829 0.1920 0.2007 0.2087 0.2162 0.2229 0.2289 0.2340 0.2383 0.2417 0.2441 0.2456 0.2461 5
6 0.0849 0.0934 0.1023 0.1115 0.1209 0.1304 0.1401 0.1499 0.1596 0.1692 0.1786 0.1878 0.1966 0.2051 4
7 0.0285 0.0327 0.0374 0.0425 0.0480 0.0540 0.0604 0.0673 0.0746 0.0824 0.0905 0.0991 0.1080 0.1172 3
8 0.0063 0.0075 0.0090 0.0106 0.0125 0.0147 0.0171 0.0198 0.0229 0.0263 0.0301 0.0343 0.0389 0.0439 2
9 0.0008 0.0010 0.0013 0.0016 0.0019 0.0024 0.0029 0.0035 0.0042 0.0050 0.0059 0.0070 0.0083 0.0098 1
10 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0054 0.0005 0.0006 0.0008 0.0010 0 10
0.63 0.62 0.61 0.60 0.59 0.58 0.57 0.56 0.55 0.54 0.53 0.52 0.51 0.50
n x x n
P
Tabla 3. Probabilidades binomiales (A10)
P
n x x n
0.37 0.38 0.39 0.40 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 0.49 0.50
12 0 0.0039 0.0032 0.0027 0.0022 0.0018 0.0014 0.0012 0.0010 0.0008 0.0006 0.0005 0.0004 0.0003 0.0002 12
1 0.0276 0.0237 0.0204 0.0174 0.0148 0.0126 0.0106 0.0090 0.0075 0.0063 0.0052 0.0043 0.0036 0.0029 11
2 0.0890 0.0800 0.0716 0.0639 0.0567 0.0502 0.0442 0.0388 0.0339 0.0294 0.0255 0.0220 0.0189 0.0161 10
3 0.1742 0.1634 0.1526 0.1419 0.1314 0.1211 0.1111 0.1015 0.0923 0.0836 0.0754 0.0676 0.0604 0.0537 9
4 0.2302 0.2254 0.2195 0.2128 0.2054 0.1973 0.1886 0.1794 0.1700 0.1602 0.1504 0.1405 0.1306 0.1208 8
5 0.2163 0.2210 0.2246 0.2270 0.2284 0.2285 0.2276 0.2256 0.2225 0.2184 0.2134 0.2075 0.2008 0.1934 7
6 0.1482 0.1580 0.1675 0.1766 0.1851 0.1931 0.2003 0.2068 0.2124 0.2171 0.2208 0.2234 0.2250 0.2256 6
7 0.0746 0.0830 0.0918 0.1009 0.1103 0.1198 0.1295 0.1393 0.1489 0.1585 0.1678 0.1768 0.1853 0.1934 5
8 0.0274 0.0318 0.0367 0.0420 0.0479 0.0542 0.0611 0.0684 0.0762 0.0844 0.0930 0.1020 0.1113 0.1208 4
9 0.0071 0.0087 0.0104 0.0125 0.0148 0.0175 0.0205 0.0239 0.0277 0.0319 0.0367 0.0418 0.0475 0.0537 3
10 0.0013 0.0016 0.0020 0.0025 0.0031 0.0038 0.0046 0.0056 0.0068 0.0082 0.0098 0.0116 0.0137 0.0161 2
11 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008 0.0010 0.0013 0.0016 0.0019 0.0024 0.0029 1
12 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.00001 0.0001 0.0001 0.0002 0.0002 0 12
15 0 0.0010 0.0008 0.0006 0.0005 0.0004 0.00003 0.0002 0.0002 0.0001 0.0001 0.0001 0.0001 0.0000 0.0000 15
1 0.0086 0.0071 0.0058 0.0047 0.0038 0.0031 0.0025 0.0020 0.0016 0.0012 0.0010 0.0008 0.0006 0.0005 14
2 0.0354 0.0303 0.0259 0.0219 0.0185 0.0156 0.130 0.0108 0.0090 0.0074 0.0060 0.0049 0.0040 0.0032 13
3 0.0901 0.0805 0.0716 0.0634 0.0558 0.0489 0.0426 0.0369 0.0318 0.0272 0.0232 0.0197 0.0166 0.0139 12
4 0.1587 0.1481 0.1374 0.1268 0.1163 0.1061 0.0963 0.0869 0.0780 0.0696 0.0617 0.0545 0.0478 0.0417 11
5 0.2051 0.1997 0.1933 0.1859 0.1778 0.1691 0.1598 0.1502 0.1404 0.1304 0.1204 0.1106 0.1010 0.0916 10
6 0.2008 0.2040 0.2059 0.2066 0.2060 0.2041 0.2010 0.1967 0.1914 0.1851 0.1780 0.1702 0.1617 0.1527 9
7 0.1516 0.1608 0.1693 0.1771 0.1840 0.1900 0.1949 0.1987 0.2013 0.2028 0.2030 0.2020 0.1997 0.1964 8
8 0.0890 0.0985 0.1082 0.1181 0.1279 0.1376 0.1470 0.1561 0.1647 0.1727 0.1800 0.1864 0.1919 0.1964 7
9 0.0407 0.0470 0.0538 0.0612 0.0691 0.0775 0.0863 0.0954 0.1048 0.1144 0.1241 0.1338 0.1434 0.1527 6
10 0.0143 0.0173 0.0206 0.0245 0.0288 0.0337 0.0390 0.0450 0.0515 0.0585 0.0661 0.0741 0.0827 0.0916 5
11 0.0038 0.0048 0.0060 0.0074 0.0091 0.0111 0.0134 0.0161 0.0191 0.0226 0.0266 0.0311 0.0361 0.0417 4
12 0.0007 0.0010 0.0013 0.0016 0.0021 0.0027 0.0034 0.0042 0.0052 0.0064 0.0079 0.0096 0.0116 0.0139 3
ANEXO A1 Tablas de distribuciones de probabilidad
13 0.0001 0.0001 0.0002 0.0003 0.0003 0.0004 0.0006 0.0008 0.0010 0.0013 0.0016 0.0020 0.0026 0.0032 2
14 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 1
15 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 15
0.63 0.62 0.61 0.60 0.59 0.58 0.57 0.56 0.55 0.54 0.53 0.52 0.51 0.50
n x x n
P
353
354
20 0 0.0001 0.0001 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 20
ANEXOS
1 0.0011 0.0009 0.0007 0.0005 0.0004 0.0003 0.0002 0.0001 0.0001 0.0001 0.0001 0.0000 0.0000 0.0000 19
2 0.0064 0.0050 0.0040 0.0031 0.0024 0.0018 0.0014 0.0011 0.0008 0.0006 0.0005 0.0003 0.0002 0.0002 18
3 0.0224 0.0185 0.0152 0.0123 0.0100 0.0080 0.0064 0.0051 0.0040 0.0031 0.0024 0.0019 0.0014 0.0011 17
4 0.0559 0.0482 0.0412 0.0350 0.0295 0.0247 0.0206 0.0170 0.0139 0.0113 0.0092 0.0074 0.0059 0.0046 16
5 0.1051 0.0945 0.0843 0.0746 0.0656 0.0573 0.0496 0.0427 0.0365 0.0309 0.0260 0.0217 0.0180 0.0148 15
6 0.1543 0.1447 0.1347 0.1244 0.1140 0.1037 0.0936 0.0839 0.0746 0.0658 0.0577 0.0501 0.0432 0.0370 14
7 0.1812 0.1774 0.1722 0.1659 0.1585 0.1502 0.1413 0.1318 0.1221 0.1122 0.1023 0.0925 0.0830 0.0739 13
8 0.1730 0.1767 0.1790 0.1797 0.1790 0.1768 0.1732 0.1683 0.1623 0.1553 0.1474 0.1388 0.1296 0.1201 12
9 0.1354 0.1444 0.1526 0.1597 0.1658 0.1707 0.1742 0.1763 0.1771 0.1763 0.1742 0.1708 0.1661 0.1602 11
10 0.0875 0.0974 0.1073 0.1171 0.1268 0.1359 0.1446 0.1524 0.1593 0.1652 0.1700 0.1734 0.1755 0.1762 10
11 0.0467 0.0542 0.0624 0.0710 0.0801 0.0895 0.0991 0.1089 0.1185 0.1280 0.1370 0.1455 0.1533 0.1602 9
12 0.0206 0.0249 0.0299 0.0355 0.0417 0.0486 0.0561 0.0642 0.0727 0.0818 0.0911 0.1007 0.1105 0.1201 8
13 0.0074 0.0094 0.0118 0.0146 0.0178 0.0217 0.0260 0.0310 0.0366 0.0429 0.0497 0.0572 0.0653 0.0739 7
14 0.0022 0.0029 0.0038 0.0049 0.0062 0.0078 0.0098 0.0122 0.0150 0.0183 0.0221 0.0264 0.0314 0.0370 6
15 0.0005 0.0007 0.0010 0.0013 0.0017 0.0023 0.0030 0.0038 0.0049 0.0062 0.0078 0.0098 0.0121 0.0148 5
16 0.0001 0.0001 0.0002 0.0003 0.0004 0.0005 0.0007 0.0009 0.0013 0.0017 0.0022 0.0028 0.0036 0.0046 4
17 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0005 0.0006 0.0008 0.0011 3
18 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 2
19 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 1
20 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0 20
0.63 0.62 0.61 0.60 0.59 0.58 0.57 0.56 0.55 0.54 0.53 0.52 0.51 0.50
n x x n
P
ANEXO A1 Tablas de distribuciones de probabilidad 355
Valores (χ2)
14.631
Grados de
0.99 0.975 0.95 0.90 0.80
libertad
1 0.00016 0.00098 0.00398 0.0158 0.0642
2 0.0201 0.0506 0.103 0.211 0.446
3 0.115 0.216 0.352 0.584 1.005
4 0.297 0.484 0.711 1.064 1.649
5 0.554 0.831 1.145 1.610 2.343
6 0.872 1.237 1.635 2.204 3.070
7 1.239 1.690 2.167 2.833 3.822
8 1.646 2.180 2.733 3.490 4.594
9 2.088 2.700 3.325 4.168 5.380
10 2.558 3.247 3.940 4.865 6.179
11 3.053 3.816 4.575 5.578 6.989
12 3.571 4.404 5.226 6.304 7.807
13 4.107 5.009 5.892 7.042 8.634
14 4.660 5.629 6.571 7.790 9.467
15 5.229 6.262 7.261 8.547 10.307
16 5.818 6.908 7.962 9.312 11.152
17 6.408 7.564 8.672 10.085 12.002
18 7.015 8.231 9.390 10.865 12.857
19 7.633 8.907 10.117 11.651 13.716
20 8.260 9.591 10.851 12.443 14.578
21 8.897 10.283 11.591 13.240 15.445
22 9.542 10.982 12.338 14.041 16.314
23 10.196 11.689 13.091 14.848 17.187
24 10.856 12.401 13.848 15.658 18.062
25 11.524 13.120 14.611 16.473 18.940
26 12.198 13.844 15.379 17.292 19.820
27 12.879 14.573 16.151 18.114 20.703
28 13.565 15.308 16.928 18.939 21.588
29 14.256 16.047 17.708 19.768 22.475
30 14.953 16.791 18.493 20.599 23.364
362 ANEXOS
Tabla 6. Distribución F
Con 4 grados de libertad
en el numerador y 5 grados
de libertad en el denomainador
se encuentra F = 3.52, con una
0.10
significancia de 0.10
3.52
α = 0.10
Grados de libertad Grados de libertad en el numerador
en el denominador 1 2 3 4 5 6 7 8 9
1 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86
2 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38
3 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24
4 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94
5 4.06 3.78 3.62 3.52 3.45 3.4 3.37 3.34 3.32
6 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96
7 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72
8 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56
9 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44
10 3.29 2.92 2.13 2.61 2.52 2.46 2.41 2.38 2.35
11 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.3 2.27
12 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21
13 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16
14 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12
15 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09
16 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06
17 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03
18 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00
19 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98
20 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96
21 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95
22 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93
23 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92
24 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91
25 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89
26 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88
27 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87
28 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87
29 2.89 2.5 2.28 2.15 2.06 1.99 1.93 1.89 1.86
30 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85
40 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79
60 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74
120 2.75 2.35 2.13 1.99 1.9 1.82 1.77 1.72 1.68
∞ 2.71 2.3 2.08 1.95 1.85 1.77 1.72 1.67 1.63
364 ANEXOS
-0.4424 0.4424
Para una prueba de dos colas de nivel de significado 0.20, con n = 10, el valor apropiado de r↓s
puede hallasrse buscando bajo la columna 0.20 y bajando hasta n igual a 10; alli encontraba el valor
apropiado de r↓s que es 0.4424
n 0.20 0.10 0.05 0.02 0.01 0.002
4 0.8000 0.8000 0.0000 0.0000 0.0000 0.0000
5 0.7000 0.8000 0.9000 0.9000 0.0000 0.0000
6 0.6000 0.7714 0.8286 0.8857 0.9429 0.0000
7 0.5357 0.6786 0.7450 0.8571 0.8929 0.9643
8 0.5000 06190 0.7143 0.8095 0.8571 0.9286
9 0.4667 0.5833 0.6833 0.7667 0.8167 0.9000
10 0.4424 0.5515 0.6364 0.7333 0.7818 0.8667
11 0.4182 0.5273 0.6091 0.7000 0.7455 0.8364
12 0.3986 0.4965 0.5804 0.6713 0.7273 0.8182
13 0.3791 0.4780 0.5549 0.6429 0.6978 0.7912
14 0.3626 0.4593 0.5341 0.6220 0.6747 0.7670
15 0.3500 0.4429 0.5179 0.6000 0.6536 0.7464
16 0.3382 0.4265 0.5000 0.5824 0.6324 0.7265
17 0.326 0.4118 0.4853 0.5637 0.6152 0.7083
18 0.3148 0.3994 0.4716 0.548 0.5975 0.6904
19 0.3070 0.3895 0.4579 0.5333 0.5825 0.6737
20 0.2977 0.3789 0.4451 0.5203 0.5684 0.6586
21 0.2909 0.3688 0.4351 0.5078 0.5545 0.6455
22 0.2829 0.3597 0.4241 0.4963 0.5426 0.6318
23 0.2767 0.3518 0.4150 0.4852 0.5306 0.6186
24 0.2704 0.3435 0.4061 0.4748 0.5200 0.6070
25 0.2646 0.3362 0.3977 0.4654 0.5100 0.5962
26 0.2588 0.3299 0.3894 0.4564 0.5002 0.5856
27 0.2540 0.3236 0.3822 0.4481 0.4915 0.5757
28 0.2490 0.3175 0.3749 0.4401 0.4828 0.5660
29 0.2443 0.3113 0.3685 0.4320 0.4744 0.5567
30 0.2400 0.3059 0.3620 0.4251 0.4665 0.5479
374 ANEXOS
Ejercicios 2.4
2.
Asistencia de pacientes en el Hospital la Policlínica durante año 2015
Ejercicios 2.5
2. a) 100% b) 31.54% c) 13.27% d) 14.52%
4. a) 36.36% b) 63.63%
Ejercicios 2.6
2. 4,417 personas
4. 3,798 bacterias
6. a) t = 0.0214 o 2.14% b) TCA = 1697672 y TCR = 0.2358
c) P2040 = 15102230
8. Población inicial = 3564 enfermeras
Ejercicios 2.7
2. a) 0.022% b) 0.21% c) 4.27% d) 1.006% e) 2.36%
Ejercicios 2.8
2. 132,758 habitantes
ANEXO A2 Respuestas a ejercicios de número par 377
Ejercicios capítulo 3
Ejercicios 3.1
2.
200
159
149
150
TEG.
125
S.P.S.
100
O.C.
73 75 66
60
50
26 27 27
16
0
Años 1975 1976 1977 1978
4.
500
450 112
400 Series 3
350
300 Series 2
210 60
250 Series 1
200 120 27
150 70
100 134
98 85
50
0
Gastrointestinales Respiratorias Psicomáticas
Ejercicios 3.2
2.
Peso f fa fra Xm Límites Reales
4.5 – 5.4 5 5 5.26 4.95 4.45 - 5.45
5.5 – 6.4 10 15 15.78 5.95 5.45 - 6.45
6.5 – 7.4 28 43 45.26 6.95 6.45 - 7.45
7.5 – 8.4 32 75 78.95 7.95 7.45 - 8.45
8.5 – 9.4 16 91 95.78 8.95 8.45 - 9.45
9.5 – 10.4 4 95 100.00 9.95 9.45 - 10.45
Total 95
378 ANEXOS
4.
X f fa fr fra Xm Límites Reales
1.01 – 1.07 11 11 0.22 22 1.04 1.005 - 1.075
1.08 – 1.14 11 22 0.22 44 1.11 1.075 - 1.145
1.15 – 1.22 8 30 0.16 60 1.18 1.145 - 1.215
1.23 – 1.28 7 37 0.14 74 1.25 1.215 - 1.285
1.29 – 1.35 7 44 0.14 88 1.32 1.285 - 1.355
1.36 – 1.42 6 50 0.12 100 1.39 1.355 - 1.425
Total 50 1.00
Ejercicios 3.3
2.
a)
100
80
60
40
20
14 17 20 23 26 29 32
LR f fa Fra(%)
>15.5 52 288 100
>18.5 75 236 81.94
>21.5 95 161 55.90
>24.5 42 66 22.92
>27.5 24 24 8.33
>30.5 0 0 0.00
b)
Fra(%)
100
50
LR f fa Fra(%)
<15.5 0 0 0.00
<18.5 52 52 18.05
<21.5 75 127 44.09
<24.5 95 222 77.08
<27.5 42 264 91.67
<30.5 24 288 100.00
c) Fra(%)
100
50
Ejercicios capítulo 4
Ejercicios 4.2
2. a) 182048 b) X1 + X2 + X3 + ⋯ + X10 c) 3.552713679 × 1033
d) 7207.31 e) 0.3077 f) 2.079
Ejercicios 4.3
2. μ = 18.333…
—
4. X = 7.58
6. a) μ = 12.94 b) μ = 14.925
8. μ = 44.69
Ejercicios 4.4
2. Me = 18
4. Me = 8.5
6. a) Me = 12.966 b) Me = 14.71
8. Me = 44.82
Ejercicios 4.5
2. M0 = 18
4. M0 = 8.5
6. a) M0 = 12.005 y M0 = 12.005 b) M0 = 12.46
8. M0 = 44.01
Ejercicios 4.6
—
2. X W = 81.19%
—
4. X W = 2.02
380 ANEXOS
Ejercicios 4.8
2. Factor = 1.1796
4. a) 4.66% b) $ 75.66
Ejercicios capítulo 5
Ejercicios 5.2
Ejercicios 5.3
2. a) RP(1.52) = 8% y RP(7.77) = 83.21%
b) El 8% de los datos están por debajo de 1.52 y 92% por arriba de 1.52.
El 83.21% de los datos están por debajo de 7.77 y 16.79% están por arriba de 7.77
Ejercicios capítulo 6
Ejercicios 6.2
—
2. a) X = 4.155 b) σ = 1.504485 y σ2 = 2.263475
c) s = 1.513977 y s2 = 2.292126
—
4. X = 0.00173529; S = 0.000506138; S2 = 0.000000256176
Ejercicios 6.3
2. a) 7.14, 7.55, 7.74, 7.77, 7.86, 7.93, 7.98, 8.07, 8.16, 8.20, 8.27, 8.34, 8.45, 8.87, 8.88,
9.03, 9.04, 9.15, 9.73, 9.75, 9.87, 9.89
—
b) c) X = 8.53 ; s = 0.8012; s2 = 0.64187
X f
7.14 1
7.55 1
7.74 1
7.77 1
7.86 1
7.93 1
7.98 1
8.07 1
8.16 1
8.20 1
8.27 1
8.34 1
8.45 1
8.87 1
8.88 1
9.03 1
9.04 1
9.15 1
9.73 1
9.75 1
9.87 1
9.89 1
Total 22
ANEXO A2 Respuestas a ejercicios de número par 381
Ejercicios 6.4
2. a) μ = 0.431315789; σ = 0228464; σ2 = 0.05219564
—
b) X = 0.431315789; s = 0.229067247; s2 = 0.052471804
4. a) μ = 84.7 b) σ = 4.91 y σ2 = 24.0895
Ejercicios 6.5
2. Los maestros de la facultad de medicina muestran mayor dispersión ya que 8.03% >
6.15%
4. Juan José es el empleado más constante.
6. a) x = 120 b) x = 144 c) x = 92 d) x = 161 e) x = 65
8. A: z = 1.625; B: z = 1.2
10. El tomate
Ejercicios 6.6
2. a) GC = 0.75 Loptocúrtica
b) GC = 1.27 Loptocúrtica
c) GC = - 2.34 Platicúrtica
d) GC = 2.15 Loptocúrtica
Ejercicios 6.7
2. a) ASF = 0.48
b) ASP = 0.36
Ejercicios capítulo 7
Ejercicios 7.0
2. Utilizando las tablas de estandarización directa e indirecta, y los análisis correspon-
dientes al tema; en vez de utilizar datos brutos.
4. Factor de confusión: Es aquel factor que muchas veces se desestima en una investiga-
ción y se utiliza otro que tienen menor impacto sobre la misma. Por otra parte, se
puede considerar como un tercer factor que oscurece la relación del primer y segundo
factor en análisis.
6. Si las poblaciones tienen componentes homogéneos o características muy idénticas,
estos elementos favorecen el desarrollo y análisis de las tablas de estandarización.
8. a) 14.38 por cada 1000 (unos 14 niños)
b) Unos 6 niños por cada 1000.
10. a) 1940: 1.2 y 1986: 1.95 (índice de muertes en 1986 es mayor que el índice de 1940)
b)
Edad Proporción 1940 Proporción 1986
0-4 0.00004686 0.00003669
5-14 0.00002973 0.000034406
15-24 0.000053799 0.000054201
25-34 0.0001732 0.00013099
35-44 0.0006108 0.000453311
45-54 0.0016877 0.0016568
55-64 0.003695705 0.004444
65-74 0.00695123 0.008470
75 + 0.011834657 0.013625
Total
382 ANEXOS
c)
Tasa especifica mortalidad Tasa especifica mortalidad
Edad por cáncer 1940 por cáncer 1986
0-4 46.86 36.69
5-14 29.73 34.41
15-24 53.799 54.201
25-34 173.2 130.99
35-44 610.8 453.3111
45-54 1687.725 1656.8
55-64 3695.7 4444.2695
65-74 6951.23 8470.055
75 + 11834.657 13634.7584
Total 1201.488 1946.64
Si existe relación entre la mortalidad por cáncer y edad, ya que a mayor edad la tasa
es mayor.
d) Si es necesaria, ya que las tasas para poblaciones con minoría de edad son bastante
bajas.
e)
Población Población
1940 Muertes 1986 Muertes
Edad (en miles) Tasa esperadas (en miles) Tasa esperadas
0-4 10541 46.86 493.95 18152 36.69 665.99
5-14 22431 29.73 666.87 33860 34.41 1165.12
15-24 23922 53.799 1286.97 39021 54.201 2114.977
25-34 21339 173.2 3695.91 42779 130.99 5603.62
35-44 18333 610.8 11197.79 33070 453.3111 14990.99
45-54 15512 1687.7 26179.6 22815 1656.8 37868.34
55-64 10572 3695.7 39070.94 22232 4444.2695 98804.99
65-74 6377 6951.23 44327.99 17332 8470.055 146802.99
75 + 2643 11834.657 31278.99 11836 13634.76 161381
Total 131670 1201.488 158199.01 241097 1946.644 469398
158199
= 1.2 por cada 1000
131670
469398
= 1.95 por cada 1000
241097
ANEXO A2 Respuestas a ejercicios de número par 383
f )
158200
= 0.92 o sea el 92%
171789.96
Tasa porcentual estandarizada de la población de 1986 en Estados Unidos
469330
=1.03 o sea el 103%
455739.66
Ejercicios capítulo 8
2. Función de riesgo es la proporción de individuos vivos al comienzo del intervalo de
edad x a x + n que mueren en algún momento durante el intervalo.
4. El lector en función de una tabla de vida debe saber diferenciar una población esta-
cionaria, de una población expansiva o constrictiva.
Ejercicios capítulo 9
Ejercicios 9.5
Ejercicios 9.5.1
2. a) 0.005 b) 0.987 c) 0.013
4. a) 0.8333…. b) 0.3333…. c) 0.666….
6. a) S = {B1 B2, B1 B3, B2 B3, B1 D1, B1 D2, B2 D1, B2 D2, B3 D1, B3 D2, D1 D2}
b) 0.30 c) 0.70 d) 0.10 e) 0.60
8. 0.888…
384 ANEXOS
Ejercicios 9.5.2
Ejercicios 9.5.3
288
2. a) = 0.000000923
311875200
b) 0.0001736
56448
c) 311875200 = 0.00018995
4. a) 0.2857 b) 0.2857 c) 0.1428 d) 0
6. 0.805
Ejercicios 9.5.4
2. a) 0.3284 b) 0.4576
4. a) 0.00286 b) 0.4007
6. a) 0.26 b) 0.46
Ejercicios capítulo 10
Ejercicios 10.1
2. a) 0.2758 b) 0.04009 c) 0.05 d) 0.0013 e) 0.1796
4. a) 0.0043 b) 0.1480 c) 1 d) 0.0333 e) 0.9891
f ) 0.5771 g) 0.2627
6. a) 0.9999 b) 0.9575 c) 0.0001 d) 0.1205
8. 0.0001
10. 0.06
12. E(x) = 0.1503
Ejercicios 10.2
2. a) 0.1363 b) 0.8647 c) 0.3067
4. P(x > 3) = 0.9896 > 0.30; Dejará de comprarle
6. a) 0.0183 b) 0.1465 c) 0.1954 d) 0.3711
8. 0.5858 > 0.50 Lo cambiará a otra tarea.
10. a) 0.0107 b) 0.0003 c) 0.9577 d) 0.0966
Ejercicios 10.3
2. a) 0.5793 b) 0.6730 c) 0.2743 d) 0.7257 e) 0.8413 f) 0.6294
4. a) µ = 15.6 b) x = 6.85
6. 0.4832
8. 0.7745 < 0.80; El prototipo no satisface los requerimientos.
10. µ = 4.3
12. Alrededor de 21 revistas.
ANEXO A2 Respuestas a ejercicios de número par 385
Ejercicios capítulo 11
Ejercicios 11.0
2.
22 20 84 89 68 15 25 92 98 62
4. (año 2009)
6 y 24 de enero, 11 de febrero, 1 y 19 de marzo, 6 y 24 de abril, 12 y 30 de mayo, 17
de junio, 5 y 23 de julio, 10 y 28 de agosto, 15 de septiembre, 3 y 21 de octubre, 8 y
26 de noviembre, 14 de diciembre.
6. Se pueden tomar diferentes probetas mediante el muestreo sistemático y la tabla de
dígitos aleatorios.
Ejercicios capítulo 12
Ejercicios 12.1
Ejercicios 12.3
2. a) x—1 = 36.0625, —
x 2 = 33.125, —
x 3 = 33.0, —
x 4 = 34.75, —
x 5 = 31.4375
—
b) x = 33.675
c) La media muestral que más se aproxima a la gran media es: — x 2 = 33.125
Ejercicios 12.4
2. n = 157
4. 0.0062
Ejercicios 12.5
2. 300
4. (61.03, 98.97)
Ejercicios 12.6
2. 0.3544
4. a) El error disminuye b) El error aumenta
c) El error aumenta no significativamente d) El error aumenta
6. a) 0.4725 b) 0.3504 c) 0.1879 d) 0.1181
8. 0.02215
10. a) 0.0475 b) 0.0475 c) 0.7011
12. a) 1.49 b) 0.0428
14. a) 0.0808 b) 0.8384 c) 0.2005
Ejercicios capítulo 13
Ejercicios Secciones 13.1 a 3.4
1. Realizar proyecto relacionado
2. Realizar proyecto relacionado
3. Realizar proyecto relacionado
386 ANEXOS
Ejercicios 13.5
2. a) Sensibilidad = 0.76 b) Especificidad = 0.91
4. a) CVERO (+) = 8.4 y CVERO (–) = 0.26
b) ODDS RATIO (+) = 2.352 y ODDS RATIO (–) = 0.0728
c) Probabilidad POSTEST (+) = 0.7016 y Probabilidad POSTEST (–) = 0.0678
Ejercicios capítulo 14
Ejercicios 14.1
2. μ = 142.77 y σ2 = 1877.28
Ejercicios 14.2
2. Un intervalo de confianza es la acotación por un límite inferior y límite superior, te-
niendo en cuenta el valor de la probabilidad de confianza que permite asegurar que
dentro de dicho intervalo caerá el verdadero parámetro de la población.
4. a) Los niveles altos de confianza producen intervalos amplios, de modo que sacrifi-
camos la precisión con tal de lograr mayor seguridad.
b) Los intervalos pequeños provienen de bajos niveles de confianza, de modo que
sacrificamos la confianza con tal de lograr precisión.
Ejercicios 14.3
2. a) σ–x = 1.2717 b) IC = 163.4 ± 2.556
4. a) 4.226 b) 842 ± 6.931
6. a) 0.981 b) 20.9 ± 2.011
Ejercicios 14.4
2. a) 95% b) 90% c) 98%
4. a) 11.3875 b) 0.8741 c) 11.3875 ± 2.6206
Ejercicios 14.5
2. a) 0.04 b) 0.6 ± 0.10312
4. a) 0.0352 b) 0.55 ± 0.0707
Ejercicios 14.6
2. n ≥ 2 25
4. n ≥ 51
6. n ≥ 1068
Ejercicios capítulo 15
Ejercicios 15.2
2. Una hipótesis nula representa la hipótesis que usted está tratando de rechazar; la hi-
pótesis alternativa representa todas las otras posibilidades.
4. El error tipo I: Rechazar una hipótesis cuando es cierta.
El error tipo II: Aceptar una hipótesis cuando esta es falsa.
6. El nivel de significancia de una prueba es la probabilidad de un error de tipo I.
8. Podríamos usar una cola izquierda si las hipótesis se plantean de la manera siguiente:
H0: μ = valor especificado
H1: μ < valor esperado
ANEXO A2 Respuestas a ejercicios de número par 387
Podríamos usar una cola derecha si las hipótesis se plantean de la manera siguiente:
H0: μ = valor especificado
H1: μ > valor esperado
Ejercicios 15.3
– –
2. X = $151 y X U = $150; se rechaza H0; sus comisiones son significativamente más
altas.
– –
4. X = 0.33% y X L = 0.51%; se rechaza H0; la tasa de crecimiento ha disminuido de
modo significativo.
Ejercicios 15.4
2. (14.04, 15.96) ; como x– =16 > 15.96; se rechaza H0
– – –
4. X U = 86.11; como X = 101 y X > 86.11; se rechaza H0
Ejercicios 15.5
— —
2. IC = (0.3245, 0.3755); P = 0.41 entonces P > 0.3755
Se rechaza H0; la proporción de préstamos otorgados a mujeres ha cambiado signifi-
cativamente.
— —
4. PU = 0.05577; P = 0.05583 y P > 0.05577
Podríamos rechazar H0 , pero debe tenerse cuidado ya que la diferencia no es signifi-
cativa.
Ejercicios capítulo 16
Ejercicios 16.1
2. 0 + σ x1 −x2 = 0.4951; x − x = 8.5 − 7.9 = 0.6 > 0.4951
Se rechaza H0, el segundo fármaco ofrece un periodo más corto de alivio.
4. Z* = 0.8358; ZL = –2.01 y ZU = 2.01
Se acepta H0, No existe diferencia en los dos tipos de servicio.
Ejercicios 16.2
– – –
2. a) X = X 1985 – X 1984 = –0.19$
b) s = 1.05$ y σ x = 0.35$
c) IC = (–1.01, 1.01)
De modo que aceptamos a H0; No fueron significativamente diferentes.
– – – – –
4. X = X despues - X antes = 11 y X U = 10.76; Como X > 10.76
Se rechaza H0, la información se corrobora.
Ejercicios 16.3
2. ZL = – 0.08 y Z* = –0.087; Se acepta H0; se instalará el sistema menos caro.
4. ZU = 0.1398; Z* = 0.09 < 0.1398
Se acepta H0; el nuevo medicamento no es significativamente más eficaz.
Ejercicios 16.4
2. t*= –1.1656; tL = –2.048 y tU = 2.048
Se acepta H0; No hay diferencia en la aplicación de los medicamentos vía oral o intra-
venosa.
388 ANEXOS
Ejercicios 16.5
–
2. IC = (5.512, 18.487) y X = 12; Se acepta H0, el fabricante no dice la verdad.
Ejercicios capítulo 17
Ejercicios 17.2
2. χ2 = 0.393 y χU2 = 4.605; Como χ2 < χU2, se acepta H0
La estructura de capital en los tres niveles de las gerencias administrativas, son igua-
les.
2
4. χOBS = 63.829 y χCRIT
2 = 21.026
2
χOBS > χCRIT
2 ; Se rechaza H0, Los factores son independientes.
Ejercicios 17.3
2.
0.2881 0.2881
0.0548 0.1571 0.2119
F0 2.2 2.6 3 3.4
Z –1.6 –0.8 0 0.8
b) Fe: 4.384 12.568 23.048 23.048 16.952
2
c) χOBS = 14.7715
d) χCRIT = 7.779; Como χOBS
2 2 > χCRIT
2 ; se acepta H0. La distribución no es bien descrita
por la distribución normal con μ = 3 y σ = 0.5
4. a) No: Con n = 200 el teorema del límite central nos permite basar una prueba de μ
en la distribución normal aun cuando la población no sea normal.
b) H0: Los datos están normalmente distribuidos (con parte de μ y σ sin especificar);
H1: los datos no están distribuidos normalmente.
c) χ2 = 4.455 y χU2 = 7.815, por lo cual aceptamos H0 y podemos decir que los datos
están descritos por una distribución normal.
Ejercicios 17.4
2. F = 4.76 y FCRIT = 3.68; Como F > FCRIT; se rechaza H0; los tres métodos si conducen
a diferentes niveles de productividad.
4. F = 6.67 y FU = 3.68; F > FU; Se rechaza H0. El número promedio de pacientes difie-
re significativamente durante estos meses.
Ejercicios 17.5
2. χ2 = 13.194 y χU2 = 30.144; Como χ2 < χU2, se acepta H0.
4. a) H0∶ σ2 = 64; H1∶ σ2 ≠ 64
b) χ2 = 8.31; χL2 = 8.907 y χU2 = 35.852; Se acepta H0
c) La extensión de la atención de los niños de seis años de edad, tiene variación sig-
nificativamente diferente de los niños de cinco años.
ANEXO A2 Respuestas a ejercicios de número par 389
Ejercicios 17.6
2. F = 2.25 y FU = 2.12; por consiguiente, rechazamos H0, el primer fondo tiene una
variación significativamente menor, de manera que deberá invertirse en él.
4. F = 4; FU = 1.98; por lo cual rechazamos H0. La velocidad de procesamiento de
CAS2, es significativamente más variable.
Ejercicios capítulo 18
Ejercicios 18.1
2. Es la fórmula que describe las relaciones existentes entre una variable dependiente y
una o más variables independientes.
4. En una relación directa, la variable dependiente aumenta al crecer la variable inde-
pendiente; en una relación inversa, la variable dependiente disminuye al aumentar la
variable independiente.
6.
3.5
3.0
2.5
2.0
1.5
1.0
0.5
8 10 12 14 16 18 20
8. Pasajeros
450
400
350
300
Precio
10 20 30 40 50
390 ANEXOS
Ejercicios 18.2
2. r = 0.9798 y r2 = 0.9602
4. r = 0.9728 y r2 = 0.9464
Ejercicios 18.3
2. a) Se = 1.0589
b) 1.3572
c) El intervalo (27.5123, 32.4877) tiene una confianza de 90%.
4. a) Ŷ = 23.5447 − 1.08363x
b) Se = 1.58578 y Sb = 0.1725
c) (–1.73, –0.44); éste intervalo garantiza 98% de confianza de que el verdadero valor
de B, estará entre (–1.73, –0.44)
Ejercicios capítulo 19
Ejercicios 19.2
2. a) Ŷ = 763.68 − 64.18x1 − 50.24x2
b) Si x1 = 10 y x2 = 9, entonces Ŷ = − 330.6
c) Este tipo de variables no tienen una buena correlación.
4. a) Ŷ = –1635.268 + 14.979x1 – 2.737x2 + 1.481x3 – 113.853x4
b) Se = 0.195
c) R2 20.9999
d) (–0.98; 3.98)
Ejercicios 19.3
2. a) Ŷ(Atención) = a + b1Flujo + b2Flujo2
b) Atención = a + b1Flujo + b2Flujo2 + b3(lugar procedencia)
Ejercicios capítulo 20
Ejercicios 20.1
– –
2. (0.26; 0.74); Como P = 0.84, entonces P > 0.74, por tanto se rechaza H0
Con el incremento, el desempeño del personal ha mejorado.
– –
4. (0.24; 0.76) y P = 1.0, como P > 0.74 entonces se rechaza H0. Si existe diferencia a
raíz del cambio en la tecnología.
Ejercicios 20.2
2. (24.06; 75.93) y U = 72. Se acepta H0. No hay diferencia en en el número de pasajeros
viajando en días hábiles y no hábiles.
4. (37.7; 105.3) y U = 74.5
Se acepta H0. No existe una diferencia significativa en la enseñanza de las universida-
des públicas y privadas.
ANEXO A2 Respuestas a ejercicios de número par 391
Ejercicios 20.3
2. K = 1.065 y X22,0.5 = 5.991; se acepta H0. Las empresas en mención atienden la misma
cantidad de clientes.
Ejercicios 20.4
2. n1 = 14 ; n2 = 14; r = 13 y IC = (9.9 ;20.1). Se acepta H0. La secuencia parrece ser
aleatoria.
4. n1 = 21; n2 = 4; r = 7 y a = 0.10; µr = 7.72 y σr = 1.27
IC = (5.64; 9.80). Se acepta H0. La secuencia es aleatoria.
Ejercicios 20.5
2. rs = 0.185; rL = −0.8571 y rU = 0.8571, entonces: rL < rS < rU
Se acepta H0. La correlación por rangos no es significativa.
4. rs = − 0.0030 ; IC = (−0.6364 ;0.6364); Se acepta H0. La correlación no es significa-
tiva.
Ejercicios 20.6
2. a) KS = 0.1121 b) 0.1121 < 0.5515; Se acepta H0. Los datos siguen una distribu-
ción normal.
4 Dn = 0.3858. El valor crítico del extremo superior es de 0.0962 y por lo mismo recha-
zamos H0. Los datos no están bien descritos por una distribución de Poisson con λ = 1
Ejercicios capítulo 21
Ejercicios 21.3
2. a)
55
50
45
40
35
30
25
20
15
10
Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
392 ANEXOS
60
50
40
30
20
10
0
1978 1979 1980 1981 1982 1983 1984 1985 1986
Ejercicios 21.4
2. a) 94.12 106.48 95.42 107.14 96.05
b) –5.88 6.48 –4.58 7.14 –3.95
c) La fluctuación mayor se dio en 1985.
Ejercicios 21.5
2. a)
Tasa Promedio Promedio
Año Estacion ausentismo movimiento centrado
1983 Primavera 5.6
Verano 6.8 5.98
Otoño 6.3 6 5.988
Invierno 5.2 5.98 5.988
1984 Primavera 5.7 6 5.988
Verano 6.7 6.05 6.025
Otoño 6.4 5.95 6
Invierno 5.4 5.93 5.938
1985 Primavera 5.3 5.85 5.888
Verano 6.6 5.78 5.813
Otoño 6.1 5.8 5.788
Invierno 5.1 5.88 5.838
1986 Primavera 5.4 5.9 5.888
Verano 6.9 5.95 5.925
Otoño 6.2
Invierno 5.3
ANEXO A2 Respuestas a ejercicios de número par 393
6.9
6.8
6.7
6.6
6.5
6.4
6.3
6.2
6.1
6.0
5.9
5.8
5.7
5.6
5.5
5.4
5.3
5.2
5.1
I II III IV I II III IV I II III IV I II III IV
b) El patrón estacionario es bajo en primavera e invierno, y alto en las demás estacio-
nes. El promedio centrado muestra un patrón cíclico en un período de tres años.
Ejercicios 21.6
2. Todos los incisos.
394 ANEXOS
ANEXO A3 Bibliografía
Estadística matemática con aplicaciones
William Mendenhall, Richard L. Scheaffer, Dennis D. Wackerly, tercera edición
Editorial Iberoamérica 1986
Estadística aplicada
Horacio Reyes Núñez, tercera edición, Talleres de Impresión UPNFM 1996
Fundamentos de bioestadística
Marcelo Pagano y Kimberley Gauvreau, segunda edición, Editorial Thompson Learning
2001
Bioestadística
Wayne W. Daniel, segunda edición, Editorial Limusa-México 1977
Estadística
Murray – Spiegel, segunda edición, Editorial Mc Graw Hill 2011