Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PARA INGENIERÍA
Y CIENCIAS
Héctor Adolfo Quevedo Urías
Universidad Autónoma de Ciudad Juárez
www.editorialpatria.com.mx
Revisión técnica:
Dr. Pedro Lara Velázquez
Profesor-Investigador
Universidad Autónoma Metropolitana-Azcapotzalco
Impreso en México
Printed in Mexico
A mi esposa Gloria y a mis hijos Héctor, Rocío, Christopher, Anabel, Abigail, Jordyn, Lauren y Adriana.
De forma especial y con profundo agradecimiento dedico este libro a las siguientes personas,
por su valioso apoyo en la realización de este proyecto:
Agradezco a mis tres hijos, Armando, Blanca y Rosendo, por su paciencia y apoyo.
iv | Estadística para ingeniería y ciencias
Prólogo
Este libro de estadística está orientado a la aplicación y solución de problemas en ingeniería
y ciencia. Busca darle al lector los conocimientos estadísticos y matemáticos necesarios para
que pueda resolver sus problemas de estadística, no sólo dentro de las aulas, sino también en
la práctica.
En estos tiempos tan cruciales que vivimos, es decir, con tantos cambios políticos, econó-
micos, sociales, climáticos y ambientales, es muy importante que se esté enterado de lo que
está pasando y la razón por la cual vendrán muchos más cambios en nuestro modo de vivir.
Sin embargo, para poder enfrentar a estos problemas necesitamos conocer sus orígenes. Es por
ello que una de las finalidades de esta obra es la de concientizar a la gente de estos cambios,
algunos tan profundos como el calentamiento global.
La finalidad de este libro es el dar muchos ejemplos y ejercicios con variadas aplicaciones
estadísticas en la ingeniería ambiental, la ingeniería civil, la química, física, biología, ingeniería
mecatrónica, la ingeniería agrícola, hidrología, medicina y muchas más. Además, este libro
brinda un mensaje de ideas creativas, reflexivas e innovadoras, para que el lector medite sobre
los conceptos aplicados a las diferentes disciplinas que interaccionan con la vida del hombre.
Siendo así, este texto lleva una comunicación importante, no sólo en el punto de vista estadís-
tico, también en los puntos de vista de la salud, la sociedad, economía, política, etcétera.
La estadística y los métodos probabilísticos o estocásticos juegan un papel muy importan-
te en todas las fases del comportamiento humano. De esta manera, el uso de la probabilidad
y la estadística se ha extendido, no sólo a las áreas tradicionales universitarias o escolares, sino
también a todos los campos de la ingeniería, agricultura, biología, química, comunicaciones,
economía, electrónica, mecatrónica, medicina, física, hidrología, ciencias políticas, psicolo-
gía, sociología, encuestas políticas, mercadotecnia, ecología, meteorología, control de calidad,
etcétera.
Este texto de probabilidad y estadística está diseñado para cursos de licenciatura y postgra-
do, para ingeniería ambiental y demás ramas de la ciencia. No obstante, los prerrequisitos para
entender mejor los conceptos mostrados aquí, son tener cursos básicos de cálculo diferencial e
integral, con derivaciones parciales e integración múltiple.
En este texto se encuentra una compilación de casi 70 libros de referencias bibliográficas
de probabilidad y de estadística, además de ideas originales e innovadoras, no sólo aplicadas a
la ingeniería ambiental, sino también a la ingeniería en general, la economía, química, física,
agricultura, medicina, etc. Este texto consta de más de 400 páginas que incluyen conceptos
teóricos y muchos ejemplos prácticos. Además, al final de cada capítulo se listan ejercicios
aplicados a la ingeniería y la ciencia. Es decir, el cuerpo del libro consta de un total de casi 900
ejercicios con respuestas.
El propósito de esta obra es el de ayudar al lector a entender los conceptos, ideas y fun-
ciones de la probabilidad y de la estadística con aplicación a problemas de ingeniería y demás
ramas de la ciencia. Este texto deberá ser útil para aquellos estudiosos que deseen hacer aplica-
ciones de la probabilidad y la estadística a problemas de investigación.
Cada capítulo cuenta con definiciones pertinentes y claras, teoremas y principios, abun-
dantes gráficas de materiales descriptivos, además de muchos ejemplos y ejercicios.
Por ejemplo, el Capítulo 1 da la introducción a la estadística descriptiva, trata de la clasi-
ficación de variables, medidas de tendencia central, dispersión, distribuciones de frecuencia,
etc., así como también del uso de los programas Excel y Minitab. Más adelante, el Capítulo
2 discute los conceptos básicos de la teoría de probabilidad, la introducción axiomática de la
probabilidad, técnicas de conteo, teorema de Bayes, etc. Después, el Capítulo 3 está relacio-
nado con funciones de distribución de variables aleatorias discretas, esperanza matemática de
Prologo |
7.1.4 Uso del programa Minitab para resolver problemas hipótesis alternativas H1: r ≠ 0, para el
de ANOVA de una clasificación 331 coeficiente de correlación poblacional r
7.2 Análisis de varianza de diseño de bloques estimado por R 370
completamente aleatorizados 333 8.3 Regresión y correlación lineal múltiple 377
7.2.1 Suposiciones del modelo de bloques aleatorios 8.3.1 Modelo de regresión múltiple generalizado 378
completos 335 8.3.2 Modelo de regresión múltiple con más de dos
7.2.2 Uso de Excel para resolver problemas de diseños variables independientes 378
aleatorizados de bloques completos 336 8.3.3 Cálculos y aplicaciones de regresión lineal simple
7.3 Clasificaciones cruzadas: Análisis de varianza en dos usando el programa Minitab 379
sentidos 338 8.3.3 Cálculos y aplicaciones de regresión múltiple
7.3.1 Interacción con ANOVA de dos factores 338 usando el programa Minitab 380
7.4 Problemas de ANOVA de dos clasificaciones Problemas propuestos 386
usando el programa Minitab 343
7.5 Análisis de varianza de tres sentidos: diseño Capítulo 9
completamente aleatorizado (efectos fijos) 346 Regresión no lineal 393
7.5.1 Interacción con ANOVA de diseños 9.1 Introducción 394
factoriales de tres clasificaciones 347 9.2 Modelo de regresión polinomial paramétrico o
7.5.2 Uso del programa para resolver análisis de varianza poblacional 394
de tres clasificaciones con efectos fijos 349 9.3 Modelos polinomiales de segundo orden (k 5 2) con una
Problemas propuestos 354 variable independiente 394
9.4 Modelo de polinomios de tercer orden (k 5 3) con una
Capítulo 8 variable independiente 395
Regresión lineal simple y múltiple 359 9.5 Interacción en los modelos polinomiales de regresión 396
Introducción 359 9.5.1 Modelo de segundo orden (cuadrático) con
8.1 Regresión lineal simple 360 interacción 396
8.1.1 Suposiciones del modelo de regresión lineal 360 9.6 Modelo polinomial (de segundo orden o cuadrático) con
8.1.2 Aplicación de análisis objetivos estadísticos tres variables independientes sin interacción 397
para la evaluación del modelo de regresión 361 9.6.1 Modelo polinomial (de segundo orden o
8.1.3 Aplicación de análisis gráficos subjetivos para la cuadrático), con tres variables independientes
evaluación del modelo de regresión 363 con interacción 397
8.2 Ecuaciones normales para calcular el intercepto en la 9.7 Evaluación de la utilidad de los modelos de regresión 398
ordenada a y la pendiente b de la curva o línea de 9.7.1 Análisis de estadísticos como R 2, s, criterio Cp
regresión manualmente 364 y PRESS, para evaluar la utilidad del modelo
8.2.1 Cálculo del coeficiente de determinación polinomial 399
R 2 de la muestra que estima a r2 el coeficiente 9.8 Resumen de los modelos de regresión usados 401
de determinación poblacional 365 9.9 Prueba estadística para comparar la suma de los
8.2.2 Cálculo manual del coeficiente de correlación R cuadrados del error (SSE) de cada modelo probado,
de la muestra que estima a r, el coeficiente de para saber cuál modelo es superior 404
correlación poblacional 365 9.10 Cálculos y aplicaciones de regresión cuadrática con el
8.2.3 Tipos de correlación lineal 366 programa Minitab 409
8.2.4 Intervalo de confianza para el coeficiente 9.11 Procedimientos para la identificación de valores atípicos
poblacional b componente de la línea de extremos, también conocidos como “outliers” 416
regresión mY|X 5 a 1 bX, estimado por b, la 9.11.1 Procedimientos para identificar valores
pendiente de la línea 367 extremos 416
8.2.5 Intervalo de confianza para el parámetro 9.12 Diagnóstico de multicolinealidad 416
poblacional a, el intercepto de la ordenada 9.12.1 Medidas para corregir multicolinealidad
de la línea de regresión mY|X 5 a 1 bX, cuyo severa 418
estimador es a 367 9.13 Autocorrelación en datos de series de tiempo 422
8.2.6 Hipótesis nula H0: b 5 b0 contra las hipótesis 9.14 Heteroscedasticidad y homoscedasticidad 425
alternativas H1: b , 1 y H2: b . 2 368 9.14.1 Prueba de White para el problema de
8.2.7 Hipótesis nula H0: a 5 a0 contra las hipótesis heteroscedasticidad 426
alternativas H1: a ≠ a0, H2: a . a0 y 9.15 Transformaciones a las variables de los modelos
H3: a , a0 368 probabilísticos de regresión, para corregir las
8.2.8 Intervalo de confianza para mY|X de la línea violaciones a las suposiciones del análisis de
poblacional estimada por Y 368 regresión 427
8.2.10 Hipótesis nula de H0: a 5 a0 contra las hipótesis 9.16 Valores inusuales extremos, su identificación y sus
alternativas H1: a . 0 y H2: a , 0 369 consecuencias 427
8.2.9 Hipótesis nula de H0: 0 contra las hipótesis Problemas propuestos 429
alternativas H1: b . 0 y H2: b , 0 369 Bibliografía B-435
8.2.11 Pruebas de hipótesis H0: r 5 0, contra las Índice analítico I-437
Capítulo 1
Estadística descriptiva
Efectos de la radiación UVB
• Efectos sobre la piel:
Las radiaciones UV entre 290 y 320 nm se denominan B (UVB) y son las responsables de los efectos biológicos más
importantes de dichas radiaciones en el ser humano. Tienen efectos nocivos sobre la piel a corto y largo plazos. El
enrojecimiento de la piel (eritema solar), desde leve a quemaduras importantes, es el principal efecto nocivo inmedia-
to. Los efectos a largo plazo suelen ser infravalorados por el público debido a que tardan años en producirse, pues no
existen anormalidades inmediatas en la piel que alerten a las personas de su inadecuada exposición a la luz del Sol.
Destacan la mayor frecuencia de cánceres cutáneos y el envejecimiento prematuro de la piel.
Sin embargo, la radiación UV sólo constituye un riesgo para la salud cuando el ser humano se somete repetida-
mente, durante años, a exposiciones excesivas para su tipo de piel.
El riesgo ante la radiación UV disminuye a medida que aumenta el grado de pigmentación natural de la piel del
ser humano; es máximo en pieles muy blancas y mínimo en personas de piel negra.
La explicación anterior cita los efectos en la salud del hombre debido a la radiación ultravioleta (UV) proce-
dente del Sol. Antes del advenimiento de la era industrial, la capa de ozono estratosférico tenía como función
principal proteger a los seres vivos de la dañina radiación ultravioleta. Sin embargo, en tiempos modernos
esta capa natural de ozono se ha reducido por las emisiones de sustancias químicas como los clorofluoro-
carbonos y óxidos de nitrógeno, entre otros.
En el hombre, los efectos en la salud más notables son el cáncer de piel, la inhibición del sistema inmune,
las cataratas, etc. Según las estadísticas de la Organización Mundial de la Salud (oms) se estima que más
de 2 millones de casos de cáncer de piel se presentan en todo el mundo cada año, de los cuales 200 000
corresponden a melanomas de carácter maligno. La oms también ha determinado que la sobreexposición
a los rayos solares es responsable de un 20% de los 12 a 15 millones de casos de cataratas en el mundo.
Según la oms, la exposición prolongada a la radiación ultravioleta se asocia con casos de fotoqueratitis y
fotoconjuntivitis, y en algunas personas con la degeneración de la retina, tal como es el caso de las máculas
oculares. Según el reporte de la oms, la radiación ultravioleta también debilita el sistema inmunológico, por
tanto aumenta el riesgo de contraer enfermedades infecciosas. Los factores que intervienen en los efectos
de la radiación UV son el nivel de reducción de la capa de ozono, la hora del día, la época del año, la latitud,
la altitud, las condiciones climáticas, la luz reflejada, etcétera.
| Estadística para ingeniería y ciencias
Introducción
El propósito de este capítulo es presentar y estudiar los principales tópicos de la estadística descriptiva. La pa-
labra estadística se deriva del latín status que significa “estado”. En términos generales, la estadística descriptiva
está relacionada con el arreglo, el resumen y la presentación de datos, de tal manera que la información sea
extraída y entendida con facilidad. Asimismo, se discuten igualmente las medidas de tendencia central como
la media, la mediana y la moda. Se discute igualmente, las medidas de variabilidad como la varianza, la des-
viación estándar y el rango, y la elaboración de tablas de frecuencia y algunos métodos gráficos. Estas técnicas
tienen como finalidad desarrollar en los estudiantes su pensamiento estadístico.
El propósito de los autores en este capítulo es explicar sus tópicos de manera sencilla y auxiliándose de
varios ejemplos propuestos y ejercicios.
En un esfuerzo para introducir a los estudiantes en el uso de la computadora como herramienta del análisis
estadístico, al final del capítulo se da una explicación detallada de cómo usar los programas Minitab y Excel
para obtener los cálculos de los conceptos vistos en este capítulo.
Muchos estudiantes de ingeniería ambiental, medicina, economía, biología y todas las demás disciplinas
de ingeniería, encontrarán numerosas oportunidades de hacer de la estadística descriptiva presentada en este
capítulo una herramienta valiosa.
Estadística descriptiva. Conjunto de métodos que se utilizan para organizar, clasificar y presentar la
información contenida en los datos por medio de gráficas o tablas, así como el conjunto de medidas
para indicar su dispersión y su localización. Esta rama de la estadística presenta una descripción de
la información contenida en los datos.
Estadística inferencial. Conjunto de métodos que se utilizan para deducir alguna característica de la
población con únicamente información parcial. Con esta rama de la estadística se infiere cómo es la po-
blación de donde se obtuvo un subconjunto de datos.
Para entender mejor la diferencia de estos dos tópicos, es importante conocer el significado de los concep-
tos de población y muestra.
Por ejemplo, en un estudio sobre ingreso, la población puede ser representada por los habitantes de un
país. Mientras que en un estudio sobre producción agrícola, la población puede ser las hectáreas de cultivo
en un estado determinado. Además, una población puede ser finita o infinita. Por ejemplo, la población con-
sistente de todos los tornillos producidos en una fábrica, durante un día, es finita. En contraste, la población
consistente de todos los posibles resultados (caras o águilas) de los lanzamientos sucesivos de una moneda es
infinita.
A menudo es imposible, impráctico o caro, observar todas las unidades de la población; por ello, en lu-
gar de examinar el grupo en su totalidad, es conveniente hacerlo sólo con una parte de la población llamada
muestra.
Los métodos de la estadística descriptiva proporcionan únicamente la descripción de los datos muestrales.
Los métodos de estadística inferencial proporcionan deducciones de la población total utilizando únicamente
los datos de la muestra.
Por ejemplo, al estudiar un nuevo colorante para telas de algodón se pueden hacer mediciones de la resis-
tencia del colorante en sólo 10 piezas de un metro del material.
La muestra consiste en las 10 piezas de algodón tratadas con el colorante. La población consta de todas las
piezas de algodón posibles de un cierto tipo que pudieran ser tratadas con el nuevo colorante. Al estudiar las
10 piezas de algodón se puede hacer una descripción del efecto del colorante en esas 10 piezas, o se pueden
hacer inferencias del efecto del colorante en cualquier otra pieza de algodón de la población.
En otras palabras, la estadística inferencial se refiere al proceso de sacar conclusiones acerca de una po-
blación basándose en una muestra obtenida por un proceso aleatorio (al azar), de tal manera la exactitud de
los resultados se mide mediante la probabilidad. Por tanto, para hacer un estudio adecuado de la estadística
inferencial se deben conocer las bases de la teoría de probabilidades.
Las técnicas utilizadas en la estadística inferencial son: la estimación de parámetros y las pruebas de
hipótesis, que se estudiarán más adelante.
Definición 1.3. La media aritmética es el promedio común de los datos; esto es, dados los datos x1,
x2, . . . , xn su media aritmética es
x1 1 x2 1 … 1 xn 1 n
x5
n
5 ∑x
n i=1 i
(1.1)
La notación para la media aritmética es con una raya sobre la variable, por ejemplo:
La media aritmética de la variable x se denota como x–.
La media aritmética de la variable y, se denota como y–, etcétera.
315191416 27
x5 5 5 5.4
5 5
Esto significa que los datos están posicionados alrededor de 5.4.
Capítulo 1 Estadística descriptiva |
Solución:
8 1 3 1 5 1 12 110 38
x5 5 5 7.6
5 5
Como se puede ver, la media aritmética únicamente tiene sentido cuando se calcula
con variables cuantitativas o numéricas.
1.3.2 Mediana
A continuación se da la definición de mediana:
Definición 1.4. La mediana es el valor que se encuentra en el centro cuando se han ordenado los
datos. La mediana se denota con la letra M.
Para determinar la mediana se deben ordenar primero los datos, por ello sólo se puede calcular a variables
cuantitativas o a variables cualitativas ordinales. ( n11)
La posición de la mediana se calcula con la fórmula , donde n es el número de datos. Si el resul-
2
tado de esta fórmula es un entero, entonces, la mediana es(el
5 1dato
1) que ocupa esa posición; si el resultado de la
fórmula es fraccionario, la mediana es el promedio entre los valores
2 que se encuentran en las posiciones de los
enteros más cercanos al resultado de la fórmula. ( 6 1 1)
2
( 6 1 8)
Ejemplo 1.3. Determinar la mediana de los datos 8, 3, 5, 2 12, 10.
(10 11)
Solución:
2
Primero se ordenan los datos de menor(5a1 mayor,
5)
2( n11)
3, 5, 8, 10, 12
2
(5 11)
La mediana es el dato que está en el lugar 5 3, 3 es entero; entonces, es el tercer
2
dato en orden creciente: M 5 8.
(6 11)
Si el número de datos es par, entonces, la mediana es el promedio de los dos datos
2
del centro.
( 6 1 8)
2
Ejemplo 1.4. Encontrar la mediana de los datos 8, 3, 5, 12, 10, 6.
(10 11)
Solución: 2
(5 1 5)
Primero se ordenan los datos de menor a mayor, es decir:
2
3, 5, 6, 8, 10, 12
( n11)
| Estadística para ingeniería y ciencias ( n121)
(5211)
(5 121)
(6211)
Hay 6 datos, entonces la fórmula es(6 11) 5 3.5, esto significa que la mediana es el
2
promedio de los datos que están en los(62lugares
1 8) 3 y 4, esto es, el promedio de 6 y 8, que
(6 128)
son los datos centrales. Mediana 5 5 7.
2 11)
(10
(10 121)
(521 5)
(5 125)
1.3.3 Moda
2
Definición 1.5. La moda de un conjunto de datos es el valor que ocurre con más frecuencia y se de-
nota como Mo.
Ejemplo 1.5. Se tiene los datos del tipo de sangre de 9 personas. Obtener su moda.
A, A, B, AB, A, O, AB, B, B
Solución:
Para obtener la moda de estos datos primero se agrupan por tipo de sangre.
A A A AB AB B B B O
Los datos tienen dos modas, el tipo de sangre A y el tipo de sangre B, pues la frecuencia
de ambos tipos es igual a 3 y es la máxima frecuencia.
Observe que con los datos de tipo de sangre no es posible calcular la media aritmé-
tica o la mediana, pues no se pueden sumar ni ordenar
Ejemplo 1.6. Los datos 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 tienen una moda igual a 9, es decir, el valor
que ocurre con más frecuencia.
Ejemplo 1.9. Encontrar la media aritmética, la mediana y la moda para la muestra del análisis de
plomo en el aire, la cual está medida en partes por millón (ppm):
3, 5, 2, 6, 5, 9, 5, 2, 8, 6
Solución:
La media aritmética es
Capítulo 1 Estadística descriptiva |
( n11)
2
(5 11) ( n11)
3 125 1 2 1 6 1 5 1 9 1 5 1 22 1 8 1 6
x5 (5 11) 5 5.1 ppm
(6 11) 10
2 2
• Para obtener la (mediana
6 1 8) se ordenan los datos: (6 12,1)2, 3, 5, 5, 5, 6, 6, 8, 9; el lugar
( n11)
donde se encuentra2la mediana es . Como2 son 10 datos, entonces la mediana
(10 11) 2 ( 6 1 8)
está en el lugar 5 5.5. (5 11)
2 2
2 (10 11)
• La mediana es el(5promedio
1 5) entre los
(6 1datos
1) que ocupan los lugares 5 y 6.
2 2
2 (5 1 5)
La mediana(es M 5
6 1 8) 5 5.
2
2
• Para obtener la moda se utiliza la lista de datos ordenados, en la que se muestra que
(10 11)
el 5 aparece más veces, entonces, la moda es Mo 5 5.
2
(5 1 5)
Ejemplo 1.10. Encontrar la media aritmética, la mediana y la moda de los datos: 48.7, 48.8, 49.5,
2
50.3, 51.6.
Solución:
• La media es x– 5 49.8.
• La mediana es M 5 49.5.
• La moda Mo no existe.
(1.2)
La media geométrica es útil para promediar tasas de crecimiento (aumento o decremento) de una
muestra estadística. Esta medida de localización sólo se calcula en datos numéricos positivos.
Un resultado importante de esta medida de localización es que el logaritmo de G es igual a la
media aritmética de los logaritmos de los datos. Al calcular el logaritmo de (1.2), se obtiene:
…
log(G) 5 3 n
5 log( x) (1.3)
n
Solución:
Definición 1.7. La media armónica de los datos x1, x2, . . . , xn se define como:
n
MA 5 (1.4)
∑
n
i =1
1 / xi
Nota: La relación entre las medias aritmética, geométrica y armónica es la siguiente: La media geométrica
de un juego de valores positivos x1, x2, . . . , xn es menor o igual que su media aritmética, pero mayor o
igual que su media armónica. Esta relación en símbolos se denota como: MA # G # x–.
1.3.6 Cuartiles
Los cuartiles son medidas que indican la posición de los datos sin que ésta sea central.
Definición 1.8. Los cuartiles son tres datos, Q1, Q2, Q3, que dividen a la muestra en cuatro partes
iguales cuando se han ordenado previamente.
• E
l primer cuartil, Q1, es la mediana de la mitad de los datos más chicos y se localiza en la posición
( m11) ( n11)
dada por , donde m es la parte entera del resultado de la fórmula .
2 2
• El segundo(4cuartil,
11) Q , coincide con la mediana; esto es, Q 5 M. (5 11)
2 2
2 2
• El tercer cuartil, Q , es la mediana de la mitad de los datos mayores y se encuentra localizado en
( 3 1 4) 3 (6 11)
( m11) 2
la posición 2 , contando los datos en forma descendente.
(6 1 72) ( 6 1 8)
(4 11) ( m11)
• De acuerdo 2con el resultado de la fórmula , los cuartiles se calculan2 siguiendo la misma
( 9 1 2
1) 2 (10 11)
regla que se utilizó para encontrar la mediana.
(23 1 4) (4 11) 2
(5 112) 2 (5 1 5)
(26 1 7) ( 3 1 4) 2
2 2
Capítulo 1 Estadística descriptiva |
1.4.1 Rango
El rango es la medida de dispersión más simple y su definición formal es la siguiente:
Definición 1.9. El rango es igual al valor máximo menos el valor mínimo y se denota con la letra R.
Así pues, el rango corresponde a la longitud del intervalo donde se encuentran distribuidos los datos.
Si el rango es pequeño, los datos son poco variables; y si el rango es grande, los datos pueden estar
muy dispersos.
Solución:
El número más pequeño es mín 5 2 y el más grande es el máx 5 12, entonces:
R 5 12 2− 2 5 10
Esta medida de dispersión es muy sensible a valores extremos, pues si algún dato está
alejado del resto, será determinante para indicar una variación grande.
Definición 1.10. El rango intercuartílico es igual al valor del tercer cuartil menos el valor del primer
cuartil. El rango intercuartílico se denota con el símbolo RI.
RI 5 Q3 2 Q1 (1.5)
( m11)
El rango intercuartílico corresponde a la longitud del intervalo donde se encuentra la mitad de los
2 los datos
datos centrales, dejando fuera la cuarta parte de los datos más chicos y la cuarta parte de
(4 11)
mayores.
2
( m11) ( 3 1 4)
2 2
Ejemplo 1.15. Encontrar el rango intercuatílico de 2, 3, 3, 5, 5, 5, 8, 10, 12.
(4 11) (6 1 7)
Solución: 2 2
( 3 1 4) (9 11)
El número de datos es n 5 9; entonces, la posición de la mediana es 5 5, en
2 2
los datos la mediana es el número 5.
(6 1 7) (5 11)
M 5 Q2 5 2 5 2
( 9 1 1)
El valor m es igual a m 5 5; entonces, la posición de los dos cuartiles es:
2
( m11) (5 11)
5 53
2 2
(4 11)
2
( 3 1 4)
Capítulo 1 Estadística descriptiva | 11
1.4.3 Varianza
La varianza es una de las medidas de dispersión más utilizada y se define así:
La varianza es una clase de promedio al cuadrado de las desviaciones de cada dato respecto a la
media. Cuando todos los datos son iguales la varianza es igual a cero y conforme la dispersión de los
datos aumenta el valor de la varianza también se incrementa. Para calcular esta medida de dispersión
se utilizan todos los datos.
Teorema 1.1. Una fórmula equivalente para la varianza que resulta más simple para hacer cálculos es:
1 n 2 1 n
2
1 n
s2 5 ∑ (
n 21 i51 i
x 2 x ) 2
5 ∑ x 2 ∑ x
n 2 1 i51 i n i51 i
(1.7)
12 | Estadística para ingeniería y ciencias
Demostración:
Al desarrollar los términos al cuadrado de la suma en la fórmula de la varianza, se tiene que:
n n
∑ ( x 2 x) 5 ∑ ( x
2
i
2 2
i
2 2 xi x 1 x ) (1.7a)
i51 i51
∑ ( x 2 x) 5 ∑ x 2 ∑ 2 x x 1 ∑ x
2
i
2 2
i i
(1.7b)
i51 i51 i51 i51
∑ ( x 2 x) 5 ∑ x 2 2 x∑ xi 1 nx
2
i
2 2
i
(1.7c)
i51 i51 i51
2 2
n n
n n
∑ ( x 2 x) 5 ∑ x 2 2 ∑ xi / n 1 ∑ xi / n
2
i
2
i
(1.7d)
i51 i51 i51 i51
Al simplificar, se hallará la expresión buscada:
1 n 2 1 n
2
1 n 1 n 2
∑ ∑ xi 2 ∑ xi 5 ∑
2
2
s 5 ( xi 2 x) 5 xi 2 n x 2 (1.7e)
n 21 i51 n 21 i51 n i51 n 2 1 i51
Ejemplo 1.18. La variable x es igual a la calidad del artículo elaborado. Los valores que toma la varia-
ble son: x 5 b cuando el artículo es bueno y x 5 d cuando el artículo es defectuoso.
Se inspecciona una muestra de la producción de un día, dando los resultados:
b, b, d, b, b, b, b, d, d, b, b, b, b, d, b
Los datos se agrupan en dos categorías:
Tabla 1.1.
Clase Datos Frecuencia
Bueno bbbbbbbbbbb 11
Defectuoso dddd 4
Cuando los datos son números enteros, las clases pueden ser cada uno de los posibles
valores de la variable.
Si la variable es entera o continua en un rango amplio, las clases se forman por inter-
valos de preferencia de la misma longitud. Para estudiar cómo agrupar los datos se
definen los siguientes conceptos:
Definición 1.13. El intervalo de clase es el conjunto de valores que determina una clase, por ejemplo
los valores entre 60 y 62 forman un intervalo de clase.
Los números 60 y 62, de este ejemplo, se llaman límites de clases o límites de clases inferior o
superior. El intervalo 60262 incluye, teóricamente, las mediciones 59.5262.5 y se llaman límites de
clases.
14 | Estadística para ingeniería y ciencias
Definición 1.14. La marca de clases, es el punto medio de un intervalo de clase y se obtiene suman-
do los límites superior e inferior y dividiendo entre dos.
(60 1 62)
Por ejemplo, el punto medio del intervalo 60262 es 5 61 y, así sucesivamente.
2
Definición 1.15. El tamaño de los intervalos de clase es la diferencia entre los límites o linderos
superiores e inferiores.
Ejemplo 1.20. Agrupar los siguientes datos en seis intervalos de clases iguales.
3.45 2.76 4.06 2.65 6.43 4.70 3.24 4.12 3.25 2.67 3.65
4.56 3.45 4.53 4.56 2.43 3.65 2.48 5.46 2.54 1.36 4.30
2.54 3.54 1.23 3.43 5.43 2.76 3.14 5.36
Solución:
Primero se forman los intervalos de clase:
• mín 5 1.23, máx 5 6.43; entonces, el rango es R 5 6.43 2 1.23 5 5.20.
• Como se quiere 6 intervalos de clase; entonces, la longitud del intervalo de clase
5.20
es l 5 5 0.8667.
6
• Los intervalos de clase son:
[1.2300, 2.0967), [2.0967, 2.9634), [2.9634, 3.8301),
[3.8301, 4.6968), [4.6968, 5.5635), [5.5635, 6.4302]
La siguiente tabla muestra la frecuencia de estos datos.
Tabla 1.3.
Ejemplo 1.21. Con los mismos datos del ejemplo anterior, formar los intervalos de clase consideran-
do únicamente enteros para el límite inferior de cada clase.
Solución:
Observe los datos:
3.45 2.76 4.06 2.65 6.43 4.70 3.24 4.12 3.25 2.67 3.65 4.56 3.45 4.53 4.56 2.43
3.65 2.48 5.46 2.54 1.36 4.30 2.54 3.54 1.23 3.43 5.43 2.76 3.14 5.36
Como el mínimo valor es 1.23 y el máximo es 6.43, los intervalos de clase son:
(1, 1.9), (2, 2.9), (3, 3.9), (4, 4.9), (5, 5.9), (6, 6.9)
La tabla de frecuencias con esta clasificación se muestra a continuación.
Tabla 1.4.
Observe que esta última forma de obtener los intervalos de clase es simple y tiene
la ventaja que si se agregan nuevos datos, éstos se pueden clasificar sin modificar la
agrupación ya hecha; en cambio, con la clasificación que utiliza el rango para calcular
la longitud del intervalo de clase, si se agregan más datos y el rango cambia, se debe
modificar toda la clasificación.
Definición 1.16. La frecuencia relativa de una clase es igual a su frecuencia absoluta entre el total
de datos.
f
fr 5 n (1.9)
16 | Estadística para ingeniería y ciencias
La suma de las frecuencias relativas es igual a 1, independientemente del número de datos que se
tengan.
Solución:
La tabla 1.5 muestra la solución de este problema.
Tabla 1.5.
Intervalo de clase Frecuencia Frecuencia relativa
1 2 1.9 2 0.0666667
2 2 2.9 8 0.2666667
3 2 3.9 9 0.3000000
4 2 4.9 7 0.2333333
5 2 5.9 3 0.1000000
6 2 6.9 1 0.0333333
Ejemplo 1.23. Escribir la frecuencia relativa de la tabla 1.4 con la notación de porcentaje.
Solución:
La tabla 1.6 da la respuesta a este ejemplo.
Tabla 1.6.
Intervalo de clase Frecuencia Frecuencia relativa
1 2 1.9 2 6.66667%
2 2 2.9 8 26.66667%
3 2 3.9 9 30.00000%
4 2 4.9 7 23.33333%
5 2 5.9 3 10.00000%
6 2 6.9 1 3.33333%
Definición 1.17. La frecuencia acumulada de una clase es igual al número de elementos que están
en las clases menores o iguales de dicha clase.
Capítulo 1 Estadística descriptiva | 17
Ejemplo 1.24. Calcular las frecuencias acumuladas de los datos de la tabla 1.5.
Solución:
Se escriben los datos, la frecuencia acumulada en la clase 121.9 es 2, la frecuencia
acumulada en la clase 222.9 es 2 1 8 5 10, etcétera. Esto se describe en la tabla 1.7.
Tabla 1.7
Ejemplo 1.25. Este es un ejemplo adaptado del libro Statistics for Management and Economics, a Syste-
matic Approach de los autores Keller, et al., 1990. Los datos de la tabla 1.8 muestran la
duración de las llamadas de larga distancia (en minutos) durante un día.
0.6 0.6
0.567
0.4 0.4
0.300
0.2 0.2
0.100
0.0 0.0
5.0 7.5 10.0 12.5 15.0 17.5 20.0
Límites de clase
En la figura anterior se observa que 30% de las llamadas telefónicas duraron menos
de 8 minutos y 80% duraron menos de 14 minutos. De manera que 20% de las llama-
das fueron más largas que 14 minutos y así sucesivamente.
Ejemplo 1.26. Con los siguientes 40 datos de la tabla 1.10 construir el diagrama de tallo-hoja.
Tabla 1.10.
2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5
Solución:
Para hacer el diagrama de tallo-hoja, se separa cada observación en dos partes: una
para formar el tallo y otra para la hoja. En este caso, el tallo se forma con el dígito de
Capítulo 1 Estadística descriptiva | 19
los enteros, y la hoja con el dígito de los decimales. Por ejemplo, para el número 3.7,
el dígito 3 representa el tallo y el dígito 7 representa la hoja. El tallo de los datos del
ejemplo está formado por los números 1, 2, 3 y 4.
tallo
1.*
• Primero se forman los tallos con la parte entera de
2.*
los datos.
3.*
4.*
tallo hojas
• Después, se escriben las hojas.
1.*
Para el dato 2.2, se pone en el tallo 2, el decimal 2. 2.* 2
Para el dato 4.1, se pone en el tallo 4, el número 1,
3.*
etcétera.
4.* 1
tallo hojas
1.* 69
• El diagrama de tallo-hoja
2.* 26596
terminado queda así:
3.* 5270413817463913172482905
4.* 15734172
tallo hojas
1.* 69
• Finalmente, en cada clase se
2.* 25669
pueden ordenar los datos
3.* 0011112223334445567778899
4.* 11234577
Si en el diagrama se observa que en una clase hay muchos números, se puede ha-
cer un refinamiento, es decir, para cada elemento del tallo se forman dos diferentes
conjuntos de hojas. En el diagrama de tallo-hoja con dos tallos por clase se puede
representar de la siguiente manera: el primero con los dígitos del 0 al 4 y el segundo
con los dígitos del 5 al 9:
Frecuencia tallo hojas
2 *1 69
3 *2 2
7 *2 5669
15 *3 001111222333444
18 *3 5567778899
8 *4 11234
3 *4 577
1.6.2 Histograma
La manera más común de representación gráfica de los datos son los histogramas que consisten en rectángulos
adyacentes, cuyas alturas son las frecuencias de clases, mientras que sus bases se extienden entre sucesivas
20 | Estadística para ingeniería y ciencias
fronteras de clases. Esto quiere decir que cada barra tiene su base sobre la abscisa con centro en la marca de
clase y con la altura igual a la frecuencia de clase.
Ejemplo 1.27. Elaborar el histograma de los 500 casos de fosfatos agrupados en la siguiente tabla.
Tabla 1.11.
Intervalo
f f. r.(%) f. a. f. r. a. (%)
de clase
< 30.5 13 2.6 13 2.6
30.5 2 35.5 24 4.8 37 7.4
35.5 2 40.5 49 9.8 86 17.2
40.5 2 45.5 78 15.6 164 32.8
45.5 2 50.5 96 19.2 260 52.0
50.5 2 55.5 94 18.8 354 70.8
55.5 2 60.5 72 14.4 426 85.2
60.5 2 65.5 43 8.6 469 93.8
65.5 2 70.5 21 4.2 490 98.0
> 70.5 10 2.0 500 100.0
Solución:
25.5 30.5 35.5 40.5 45.5 50.5 55.5 60.5 65.5 70.5 85.5
Figura 1.3. H
istograma que muestra la distribución de frecuencias
de los datos de la tabla 1.11.
60 60
Capítulo 1 Estadística descriptiva | 21
Solución:
80 80
60
Frecuencia
60
40 40
20 20
0 0
20 30 40 50 60 70
Marca de clase
Definición 1.18. El diagrama de cajas es una representación gráfica que utiliza los valores extremos
y los cuartiles. La forma del diagrama de cajas se representa en la siguiente figura:
mín Q1 M Q3 máx
La distancia entre cada una de las medidas de posición está graduada a escala. Con este diagrama
se visualiza la posición, la dispersión y la simetría de los datos; la caja es un rectángulo que indica la
posición de la mitad de los datos centrales.
22 | Estadística para ingeniería y ciencias
0 1 2 3 4 5 6 7 8
• En la línea ubique la posición del mínimo, máximo, primer cuartil, tercer cuartil y mediana.
0 1 2 3 4 5 6 7 8
mín Q1 M Q3 máx
0 1 2 3 4 5 6 7 8
mín Q1 M Q3 máx
• Dibuje el diagrama.
0 1 2 3 4 5 6 7 8
mín Q1 M Q3 máx
Ejemplo 1.29. Encontrar el diagrama de cajas de los datos que se reportan en el diagrama de tallo-
hoja siguiente:
tallo hojas
1.* 69
2.* 25669
3.* 0011112223334445567778899
4.* 11234577
Capítulo 1 Estadística descriptiva | 23
Solución:
Primero se deben encontrar los valores extremos, los cuartiles y la mediana de estos
datos.
• Los valores extremos son mín 5 1.6 y máx 5 4.7.
• El número de datos es n 5 40.
(40 11)
• La posición de la mediana es 5 20.5.
2
(4031.411
) 3.4
• Entonces, la mediana es el promedio
M 5 2 de los5datos
3.4 que están en la posición 20 y 21.
2
(40 11) 3.4 1 3.4
(20 11) 5 3.4
2M 5 2
2
3.4 1 3.4
• El valor de m es: m 5 20. M 5 (20 11) 5 3.4
22
(20 11)
La posición de los cuartiles es 5 10.5.
2
3.1 1 3.1
El primer cuartil es Q1 5 5 3.1 .
2
3.8 1 3.9
El tercer cuartil es Q3 5 5 3.85 .
2
1.6.5 Simetría
Los histogramas y los diagramas de cajas permiten visualizar la distribución de los datos. Éstos pueden distri-
buirse o comportarse de manera simétrica alrededor del promedio, o pueden estar cargados a uno u otro lado
de la recta numérica; en este sentido la relación entre las tres medidas de centralidad más comunes: media
aritmética (o simplemente media), moda (la barra más alta) y mediana, con respecto a la simetría de los datos,
está dada en las siguientes gráficas:
24 | Estadística para ingeniería y ciencias
Mo Mo
M M
X
X
Figura 1.7. H
istogramas con diferentes sesgos y los diagramas de caja correspondientes
a cada histograma.
Ejemplo 1.30. Se tiene una muestra de tamaño 36 de análisis de fosfatos (PO423), reportados en la
tabla 1.12. Encuentre la media y la varianza de estos datos.
Tabla 1.12.
Valores de x 61 64 67 68 69 70 73
Frecuencia 5 8 4 3 4 7 5
Solución:
El total de datos en la muestra se obtiene sumando las frecuencias de todas las
clases.
5 1 8 1 4 1 3 1 4 1 7 1 5 5 36
Son 36 datos.
La media se obtiene sumando todos los datos y dividiendo el resultado de la
suma entre 36.
La suma de un mismo valor se puede abreviar con una multiplicación, así al sumar
los cinco datos, igual a 61, más los ocho datos, igual a 64, más, etcétera, se obtiene:
61 1 61 1 61 1 61 1 61 1 64 1 64 1 64 1 64 1 64 1 64 1 64 1 64 1 . . . 5 5(61)
1 8(64) 1 . . .
Capítulo 1 Estadística descriptiva | 25
∑ ∑
n
xi f xi
i51 i
x5 i51
5 (1.10)
n ∑ i51 i
f
De igual manera, para la varianza muestral se obtiene la fórmula
∑ ∑ ∑
n 2
( xi 2 x)2 ( xi 2 x)2 fi xi2 fi 2 nx
s2 5 i51
5 i51
5 i51
(1.11)
n 21 ∑ f 21
i51 i
n 21
Esta fórmula también puede utilizarse cuando los datos están agrupados en intervalos
de clase. Se emplea la frecuencia fi y la marca de clase o punto medio mi de clase.
x5
∑ f mi
i51 i (1.12)
∑ i51 i
f
Solución:
Al usar la fórmula (1.12), se obtiene:
1.7 3 2 1 2.2 31 1 2.7 3 4 1 3.2 315 1 3.7 310 1 4.2 3 5 1 4.7 3 3
x5 53.4125
2 11 1 4 115 110 1 5 1 3
se aprende a usar uno de ellos, es relativamente fácil usar otro. Excel no es un paquete de cómputo estadístico,
es una hoja de cálculo. Tiene la ventaja de estar en español, pero los cálculos estadísticos que puede hacer
son limitados si se comparan con los paquetes estadísticos especializados. Sin embargo, por ser una hoja de
cálculo que se encuentra casi en cualquier computadora personal es adecuado utilizarlo como una primera
herramienta de cálculo.
Nota: Para un curso introductorio de estadística basta y sobra con el uso de Excel, incluso activando estadística
VBA es suficiente para un curso de estadística aplicada.
Al abrir Excel se despliega la siguiente pantalla, o una muy semejante.
Figura 1.8.
Cada celda se identifica por la letra de la columna y el número del renglón que se encuentra, así la primera
celda es la A1, etcétera.
En la parte superior de la pantalla se encuentra un menú con las siguientes opciones Archivo, Edición, Ver,
Insertar, Formato, Herramientas, Datos, Ventana y Ayudas (?) y una serie de iconos que permiten realizar una
serie de funciones. Para activarlas se usa el ratón de la computadora. La mayoría de los cálculos estadísticos que
brinda Excel se encuentran en la subrutina Análisis de datos en la opción Herramientas del menú principal.
La opción Análisis de datos no se carga al instalar Excel, por lo que hay que activarla la primera vez que
se use. Para ello, oprima el ratón sobre la opción Herramientas y en el menú que se despliega elija la opción
Complementos.
Figura 1.9.
Capítulo 1 Estadística descriptiva | 27
En la ventana que aparece señale la opción Herramientas para análisis y oprima la opción aceptar. Con esto
se activa la aplicación y la próxima vez que entre a la opción Herramientas aparecerá un menú que ya incluye la
opción Análisis de datos.
Figura 1.10.
Figura 1.11.
28 | Estadística para ingeniería y ciencias
5. Si la primera celda de los datos corresponde a un rótulo (edad, concentración de plomo, etc.), señale en
esta misma pantalla. En este ejemplo no se puso rótulo.
6. Los cálculos de salida saldrán en la misma página, si señala en Opciones de salida la opción Rango de
salida; luego, coloque el cursor del ratón en la ventana correspondiente y señale una celda vacía desde
donde aparecerán los resultados.
Columna 1
Media 36.5
Error típico 3.45258304
Mediana 34
Moda 23
Desviación
12.9183828
estándar
Varianza de la
166.884615
muestra
Curtosis 0.06723329
Coeficiente de
0.76365412
asimetría
Rango 42
Mínimo 23
Máximo 65
Suma 511
Cuenta 14
Resultados obtenidos
Figura 1.12.
Tabla 1.14.
Si la clase es Se debe escribir
60 – 62 62
63 – 64 64
1. Escriba los datos de la muestra en una columna y el límite superior de cada clase en otra columna dife-
rente, uno en cada celda.
2. Elija la opción Herramientas y ahí la opción Análisis de datos.
Capítulo 1 Estadística descriptiva | 29
Con los datos del ejemplo de la sección anterior y con las clases 20224, 25229, 30234, etc., se obtiene la
siguiente tabla y gráfica.
2.5 39 0
Frecuencia
2 44 3
1.5 49 1
54 1
0.5
59 0
0
64 0
24 34 44 54 64 y mayor
69 1
Clase y mayor 0
Figura 1.13.
Ejemplo 1.32. Utilizando los datos de la siguiente tabla de frecuencias elaborar la gráfica de frecuencia
relativa contra puntos medios.
30 | Estadística para ingeniería y ciencias
Tabla 1.15.
Punto medio Frecuencia Frecuencia relativa
16.5 7 0.039
21.5 13 0.073
26.5 20 0.002
31.5 26 0.145
36.5 32 0.179
41.5 34 0.189
46.5 19 0.106
51.5 13 0.072
56.5 3 0.017
61.5 6 0.034
66.5 6 0.034
Solución:
1. Abra la hoja de Minitab.
2. Vaya a: Graph → Seatter-Plot.
3. En la ventanilla de “Scatterplot-Simple” introduzca las variables.
4. En la ventanilla de “Labels” y en “Data Labels” haga clic en “Use y Value Labels”
y luego haga clic en OK y OK.
5. En la ventana de “Scatteplot-Simple” y en la ventanilla de “Scatterplot-Simple
View” haga clic en “Symbols” y “Project Lines” y siga las instrucciones señaladas.
Al seguir todas las indicaciones anteriores se produce la gráfica de frecuencias relativas
contra puntos medios.
Figura 1.14.
Capítulo 1 Estadística descriptiva | 31
Ejemplo 1.33. Para explicar el manejo del Minitab se utilizarán los datos de un problema de me-
catrónica adaptado del libro Mechatronics. Principles and Applications de Godrey C.
Onwubolu, 2005, pues está relacionado con una prueba de confiabilidad. Los datos
consisten en los tiempos de falla de 25 emisores de luz de rectificadores de corriente
alterna. Los datos son los siguientes:
Tabla 1.16.
0.5 5 7 1 4
7.5 1.5 4.5 8 1.3
5 8.1 2 5.5 8.6
2.5 5.5 9 3 6
9.5 3.5 6.5 10 3
Fuente: Mechatronics. Principles and Applications. Godrey C. Onwubolu.
Elsevier Butterworth-Heinemann, Ámsterdam (2005).
Solución:
Para encontrar la solución al ejemplo se va a utilizar Minitab.
1. En el menú de la parte superior de la pantalla, elija las opciones:
Stat → Basic Statistics → Display Descriptive Statistics
Con esto, aparecerá la ventana de diálogo Display Descriptive Statistics.
2. En la ventana de diálogo de Display Descriptive Statistics y en la ventana de
Variables escriba C1 para indicar que los datos que se van a utilizar están en esa
columna.
3. Con el cursor seleccione la opción Statistics y en la ventana de diálogo que apa-
rece escoja todas las estadísticas descriptivas deseadas y luego haga clic en OK.
4. Estas indicaciones producen los siguientes resultados:
Descriptive Statistics: Tiempos de fallas
Total
Mean
Variable Count N N* CumN Percent CumPct Mean SE
StDev
Tiempos
25 25 0 25 100 100 5.220 0.573 2.864
de falla
Figura 1.15.
Ejemplo 1.34. Con las instrucciones anteriores y los datos de la siguiente tabla de un ejercicio adapta-
do del libro Probability and Statistics for Engineering and the Sciences del investigador esta-
dístico J. L. Devore, 2000, que corresponde al octanaje de varios tipos de gasolinas, se
siguieron las instrucciones anteriores, con el objeto de hacer un diagrama de tallo.
La siguiente tabla muestra la información del octanaje de varios tipos de gasolina.
Tabla 1.17.
88.5 87.7 83.4 86.7 87.5 91.5 88.6 103.3
95.6 93.3 94.7 91.1 91.0 94.2 87.8 89.9
88.3 87.6 84.3 86.7 88.2 90.8 88.3 98.8
94.2 92.7 93.2 91.0 90.3 93.4 88.5 90.1
89.2 88.3 85.3 87.9 88.6 90.9 89.0 96.1
93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9
89.8 89.6 87.4 88.9 91.2 89.3 94.4 92.7
91.8 91.6 90.4 91.1 92.6 89.8 90.6 91.1
90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.7
92.2 92.2 91.2 91.0 92.2 90.0 90.7
Fuente: Probability and Statistics for Engineering and the Sciences. J. L. Devore, Thomson Learning, Inc. (2000).
22 92 22236777
14 93 023347
8 94 2247
4 95 6
3 96 1
2 97
2 98 8
1 99
1 100 3
La distribución de los datos tiene un sesgo ligeramente positivo. Sin embargo, para
mejorar la simetría de los datos, se pueden eliminar los valores extrínsecos. Si-
guiendo las instrucciones de arriba, seleccione las ventanillas Trim y haga clic en OK.
Esto generará el histograma que sale del diagrama tallo-hoja que a continuación se
muestra.
Stem-and-Leaf Display: Relación de octanaje de gasolina
Stem-and-leaf of Rel. de octanos de gasolina: N 5 79
Leaf Unit 5 0.10
LO 83.4 (valor inusual pequeño eliminado)
2 84 3
3 85 3
5 86 77
11 87 456789
21 88 2333556679
31 89 0233678899
(13) 90 0113344456789
35 91 0001112256688
22 92 22236777
14 93 023347
8 94 2247
4 95 6
3 96 1
HI 98.8, 100.3 (valores inusuales altos eliminados)
Note que sí hubo alguna mejoría en la simetría de los datos, al eliminar los valores
extrínsecos.
Ejemplo 1.35. La intención de este ejercicio es usar la información del ejemplo 1.25, pero ahora se debe
aplicar el programa Minitab para demostrar cómo se puede abreviar el trabajo del cálcu-
lo manual de los intervalos de clase y cálculo de frecuencias relativas acumuladas.
1. Primero, introduzca los datos en la hoja de trabajo del Minitab en la columna C1
dados en la tabla 1.8 del ejemplo 1.25.
Capítulo 1 Estadística descriptiva | 35
7. En la ventana Optional Storage ubique los datos de la columna C2, o sea, la co-
lumna donde se almacenarán los datos de la frecuencia relativa acumulada (f.r.a.)
y haga OK.
12. Todas estas órdenes producen la ojiva o gráfica de frecuencia relativa mostrada a
continuación.
1.0 1.0
0.8 0.8
0.6 0.6
0.4 0.4
0.2 0.2
0.0 0.0
0 5 10 15 20
Duración llamadas telefónicas
Al igual que en el ejemplo 1.26 de la gráfica se puede ver que de manera aproximada
30% de las llamadas duraron menos de ocho minutos. Asimismo, 80% duraron me-
nos de 14 minutos y así sucesivamente.
36 | Estadística para ingeniería y ciencias
Problemas propuestos
1.1 Calcular el promedio, la varianza y la desviación estándar de las a) ¿Qué tipo de sesgo tiene esta distribución?
observaciones de la siguiente muestra: 12, 6, 7, 3, 15, 10, 18, 5. b) ¿Dónde se halla la mayor concentración de valores?
1.2 Encontrar la desviación estándar y el promedio de los valores: 1.11 En un examen final de estadística, los grados fueron: 100, 100,
3, 6, 2, 1, 7, 5, de acuerdo con los valores obtenidos del pro- 66, 65, 64, 60, 59, 57, 58, 50.
medio y la desviación estándar. ¿Qué conclusiones se pueden ¿Los datos tienen una distribución oblicua hacia la derecha
obtener de la localización y la dispersión de los datos? o hacia la izquierda? Justificar el argumento usando la rela-
1.3 Escribir los siguientes términos usando anotación de suma. ción del promedio, la mediana y la moda.
a) x21 1 x22 1 x23 1 . . . 1 x210 1.12 Encontrar la media geométrica de la muestra aleatoria con
b) (x1 1 y1) 1 (x2 1 y2) 1 . . . 1 (x5 1 y5) observaciones 10, 12, 16.
c) f1 x1y1 1 f2 x2y2 1 f3 x3y3 1 f4 x4y4 1.13 La siguiente tabla muestra los coeficientes de inteligencia de
1.4 Encontrar la desviación estándar. 550 niños de una escuela elemental. Calcular la media arit-
a) 23, 7, 29, 5 mética, la desviación estándar, la moda, la mediana, los cuar-
b) 2.4, 1.6, 3.8, 4.1, 3.4 tiles, el rango, el rango intercuartílico, el diagrama de caja y el
1.5 El rango de los números 5, 3, 8, 4, 7, 6, 12, 4, 3 es: histograma.
1.6 De 50 mediciones la más grande es 8.34 kg. Si el rango es R 5
Marca de clase (x) Frecuencia (y)
0.46, determinar la medición más pequeña.
1.7 Escribir las siguientes sumatorias en su forma desarrollada. 75 5
6 78 5
a) ∑X j 79 2
j=1
82 2
4
∑( y 23) 3 86 5
b) j
j =1 91 3
5
94 5
c) ∑ fk x j 98 2
k=1
102 4
1.8 Con los datos de la siguiente tabla y usando el programa de
106 3
computadora Minitab, Excel o una calculadora de bolsillo,
determinar: 110 4
a) La media aritmética. 114 2
b) La varianza. 118 1
c) La desviación estándar.
122 3
Observación (x) Frecuencia ( f )
126 2
70 49
1.14 La siguiente tabla muestra las temperaturas, en oC, de 10 re-
74 16 giones de México. Llene los valores que están vacíos.
78 28 Temp. (oC) 20 21 22 23
82 45 Frecuencia 3 2 1
86 66 Frecuencia
3 9
90 85 acumulada
98 72 Frecuencia
relativa (%) 30% 20%
102 54 acumulada
106 38 Frecuencia
30% 90%
relativa
110 27
Total 10
114 18
1.15 Se hicieron análisis químicos de cloruros (Cl2) expresados en
118 115
unidades de mg/L procedentes de una muestra de aguas resi-
1.9 En una distribución, si la media es 5.0, la mediana es 7.0 y duales usando el método de nitrato de mercurio. Los resulta-
la moda es 9.0, contestar los siguientes enunciados: dos se muestran en la siguiente tabla:
a) ¿Qué tipo de sesgo tiene esta distribución? 17.2 17.1 17.0 17.1 16.9 17.0 17.1
b) ¿Dónde se encuentra la mayor concentración de valores?
17.0 17.3 17.2 16.9 17.0 17.1 17.3
1.10 En una distribución, si el promedio es de 10.0, la mediana es
de 8.0 y la moda es de 5.0, contestar las siguientes preguntas: 17.2 17.4 17.1 17.1 17.0 17.1
Capítulo 1 Estadística descriptiva | 37
a) Hallar el promedio aritmético, la varianza y la desviación 1.18 Con los datos de la siguiente tabla:
estándar.
Marca de Frecuencia
b) Encontrar el rango intercuartil. Altura (pulgadas) clase (x) f (x)
c) Hacer un histograma de frecuencia.
60–62 61 5 5 × 61 5 305
d) Hallar el coeficiente de variación. Buscar su definición.
e) ¿Son simétricos los datos? 63–65 64 18 64 × 18 5 1152
f ) Encontrar el primer cuartil, el segundo cuartil y el tercer 66–68 67 42 67 × 42 5 2814
cuartil.
69–71 70 27 70 × 27 5 1890
1.16 Se hace un estudio de análisis de concentraciones de demanda
72–74 73 8 73 × 8 5 584
bioquímica de oxígeno (DBO). Para esto se da un avance de la
información. Hay que hacer lo siguiente: Calcular la media con la fórmula para datos agrupados.
a) Completar la tabla de abajo calculando los puntos in- 1.19 Completar los faltantes de la tabla siguiente, de una distribu-
termedios, la frecuencia relativa y la frecuencia relativa ción de frecuencia de las vidas de 400 tubos. Además, hacer
acumulada. los cálculos pedidos a continuación.
b) Hacer el histograma. a) Encontrar el límite superior de la quinta clase.
c) Calcular el primer cuartil y el tercer cuartil. b) Hallar el límite inferior de la octava clase.
d) Señalar en el histograma la media, la moda y la mediana. c) Determinar la marca de clase de la séptima clase.
Frecuencia d) Localizar los límites de la última clase.
Número Frecuencia relativa e) Encontrar el tamaño del intervalo de clase.
Intervalos de Puntos relativa acumulada
f ) Hallar la frecuencia de la cuarta clase.
(Conc. DBO) análisis intermedios (%) (%)
g) Determinar la frecuencia relativa de la sexta clase.
50.00–59.99 8
h) Encontrar el porcentaje de los tubos cuyas vidas sean <
60.00–69.99 10 600 horas.
70.00–79.99 16 i) Hacer una gráfica de frecuencia relativa versus puntos
medios y revisar la simetría de los datos.
80.00–89.99 14
Estas fotografías muestran el interior de un casino y un cohete interplanetario, ambos lugares extremos
en donde se aplican modelos de probabilidad. La probabilidad es una medida de la incertidumbre en los
resultados de un proceso; se puede pensar en la probabilidad cuando se jala la palan ca de las máquinas
tragamonedas; de igual manera se puede pensar en la probabilidad al medir el consumo de combustible de un
cohete que es lanzado al espacio, inclusive la probabilidad está presente para medir la incertidumbre de que el
lanzamiento sea exitoso o fallido.
Los juegos de azar siempre han ejercido una especial atracción tanto en hombres como en mujeres; la
naturaleza aleatoria de los resultados y la posibilidad de obtener grandes ganancias rodea de glamour a los
casinos; fue en estos ambientes donde se desarrolló con mayor vigor la teoría de la probabilidad. De manera
paralela se desarrollaron los modelos probabilísticos, tanto en otros ámbitos diametralmente opuestos,
como en la modelación del átomo y la posición de las partículas subatómicas, como en los procesos físicos
y químicos, ya que es una herramienta esencial en el desarrollo de la ciencia y tecnología.
Introducción
En este capítulo se presentan las bases para el estudio de la probabilidad; el objetivo es que los estudiantes
adquieran los conocimientos acerca de los modelos aleatorios, los cuales les permitan generar inferencias esta-
dísticas plausibles sobre fenómenos específicos, ya sea en la ingeniería o en las ciencias aplicadas.
Capítulo 2 Introducción a la probabilidad | 39
Definición 2.1. Se llama experimento a cualquier proceso que es susceptible de ser observado.
Ejemplo 2.4. Si el experimento es seleccionar al azar una carta de un mazo de 52 cartas, el espacio
muestral es:
S 5 {as de espadas, 2 de espadas, . . . , rey de diamantes}
Ejemplo 2.5. Si el experimento es lanzar dos monedas al aire, el espacio muestral es:
S 5 {aa, as, sa, ss}
40 | Estadística para ingeniería y ciencias
Definición 2.3. Un evento es un subconjunto del espacio muestral. Los eventos se denotan con las
letras mayúsculas del alfabeto.
Ejemplo 2.6. Si el espacio muestral es S 5 {águila, sol}, dos eventos posibles son:
A 5 {águila} y B 5 {sol}
Ejemplo 2.7. Si el espacio muestral es: S 5 {1, 2, 3, 4, 5, 6}, algunos ejemplos de eventos son:
A 5 {1, 2}, B 5 {5, 3, 1}, C 5 {4}
Se dice que un evento A ocurre si sucede cualquiera de sus elementos, por ejemplo,
si en el experimento de lanzar un dado se tiene el evento F 5 {3, 4, 5}. Se dice que F
ocurre, si al lanzar el dado sale el 4; o bien, sale el 3; o el 5; cualquiera de sus elementos
hace que ocurra el evento F.
Por ejemplo, si en una rifa se compran todos los boletos, se juega con el evento seguro. Si en un volado se
pide tanto águila o como sol, se juega con el evento seguro. El evento seguro es igual al espacio muestral.
Si no se compran boletos para una rifa se juega con el evento imposible, si en un volado se pide algo dife-
rente a águila o sol, se juega con el evento imposible. El evento imposible se denota con el símbolo de conjunto
vacío, φ.
Definición 2.6. Se dice que un evento es elemental o simple, si está formado por un único elemento.
Ejemplo 2.8. Considérese el experimento de lanzar dos monedas no cargadas. Suponer que las águi-
las se denotan con a y los soles con s. Citar los eventos elementales o simples.
Solución:
Los eventos simples son: {aa}, {as}, {sa}, {ss}.
Capítulo 2 Introducción a la probabilidad | 41
Hay tres operaciones que se pueden llevar a cabo entre eventos: la unión, la intersección y el comple-
mento.
Definición 2.7. La unión de dos eventos es otro evento igual a la ocurrencia de al menos uno de los
eventos y se indica con el símbolo ∪; esto es, la unión de los eventos A y B se indican como A ∪ B
y significa que ocurre A, B o ambos simultáneos. Con diagramas de Venn, la unión de los eventos A
y B es:
B A
La unión se relaciona con la conjunción “o”. Por ejemplo, al elegir un estudiante al azar se tiene una unión
cuando se pide que el estudiante elegido sea mujer o estudie derecho. En este caso, es la unión de todas las
mujeres junto con todos los estudiantes de derecho, ya sean hombres o mujeres.
Definición 2.8. La intersección de dos eventos es otro evento igual a la ocurrencia de los dos eventos
simultáneamente y se indica con el símbolo ∩, es decir, la intersección de los eventos A y B se indican
como A ∩ B.
42 | Estadística para ingeniería y ciencias
B A
La intersección se relaciona con la conjunción “y”. Por ejemplo, al elegir un estudiante al azar se tiene una
intersección cuando se pide que el estudiante elegido sea mujer y que estudie derecho, esto es, la intersección,
incluye todas las mujeres estudiantes de derecho.
Por ejemplo, si al realizar el experimento de lanzar un dado, se tiene que A 5 {2, 3}; entonces, se sigue
que Ac 5 {1, 4, 5, 6}.
Con diagramas de Venn el complemento de A se representa de la siguiente manera:
Ac
Los elementos de un evento se pueden escribir en forma de lista o por la descripción de una característica
común. Por ejemplo, el conjunto de las vocales del alfabeto latino se puede escribir de estas dos maneras:
Ejemplo 2.9. S 5 {x | x es una ciudad con una población de más de un millón de personas}
Capítulo 2 Introducción a la probabilidad | 43
La descripción de los elementos de un conjunto también puede ser establecida mediante relaciones de
orden.
Ejemplo 2.10. Considerar el experimento de observar el tiempo requerido para completar una tarea en
particular y en un intervalo de 0 a 40 segundos. En este caso, el espacio muestral es:
S 5 {x | 0 < x < 40}
Ejemplo 2.11. Determinar el número de automóviles que los mecánicos encargados de verificar la emi-
sión de óxidos de nitrógeno deben inspeccionar antes de encontrar uno que no satisface
los reglamentos gubernamentales. En este caso, puede ocurrir que el que no cumple la
norma sea el primer auto inspeccionado, o el segundo, o el tercero, etcétera; no se puede
determinar cuántos autos tendrán que inspeccionar antes de hallar el primero que falle,
por tanto el espacio muestral es infinito:
S 5 {1, 2, 3, 4, 5, 6, 7, 8, . . .}
Ejemplo 2.12. Sean los eventos A 5 {a, b, c} y B 5 {b, c, d, e}, encuentre la unión A ∪ B.
Solución:
La unión de dos eventos se forma al juntar los elementos que están en los dos con-
juntos.
A ∪ B 5 {a, b, c, d, e}
Ejemplo 2.13. Si el espacio muestral es S 5 {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, y se tienen los eventos A 5 {0,
2, 4, 6, 8}, B 5 {1, 3, 5, 7, 9} y C 5 {2, 3, 4, 5}, encontrar:
a) A ∩ B
b) A ∩ C
Solución:
a) Debido a que A y B no tienen elementos en común; entonces, A ∩ B 5 φ, ya que
es imposible que ocurran simultáneamente los eventos A y B.
b) Como el 2 y el 4 son elementos de A y C; entonces, A ∩ C 5 {2, 4}.
Solución:
a) A ∪ B 5 {1, 2, 3, 4, 5, 6} 5 S
b) A ∪ C 5 {1, 2, 3, 4, 5}
c) A ∩ B 5 {3, 4}
d) A ∩ C 5 {1, 3}
e) Ac 5 {5, 6}
f) (A ∪ C)c 5 {6}
Ejemplo 2.15. El experimento aleatorio es lanzar dos monedas al aire; entonces, el espacio muestral
es: S 5 {aa, as, sa, ss}. En este espacio muestral se definen los eventos:
E1 5 {aa, as, sa} y E2 5 {as, sa, ss},
entonces, encuentre:
a) E1 ∪ E2
b) E1 ∩ E2
c) E1c
d) E2c
Solución:
a) E1 ∪ E2 5 {aa, as, sa, ss}
b) E1 ∩ E2 5 {as, sa}
c) E1c 5 {ss}
d) E2c 5 {aa}
Definición 2.10. Dos eventos A y B son mutuamente excluyentes si cuando ocurre uno de ellos es
imposible que suceda el otro; en otras palabras dos eventos A y B son mutuamente excluyentes si no
pueden ocurrir, de manera simultánea, si uno excluye al otro; esto es, A ∩ B 5 Φ.
Ejemplo 2.16. En los siguientes eventos determinar cuáles son mutuamente excluyentes y cuáles no
lo son.
Solución:
a) Los eventos son mutuamente excluyentes, pues un artículo no puede ser bueno y
defectuoso al mismo tiempo.
b) Los eventos son mutuamente excluyentes, ya que una persona no puede tener un
coeficiente intelectual mayor a 100 y al mismo tiempo tener un coeficiente intelec-
tual menor que 95.
c) Los eventos no son mutuamente excluyentes, pues una persona sí puede ser mé-
dico cirujano y mujer al mismo tiempo.
d) Los eventos son mutuamente excluyentes, pues una persona tiene personalidad
dominante o personalidad sumisa, pero no puede tener ambas.
46 | Estadística para ingeniería y ciencias
Ejemplo 2.17. Si el experimento es: elegir una carta de un mazo de 52 naipes, sean los eventos E1 5
{x | x es un as} y E2 5 {x | x es un rey}. ¿Estos eventos son mutuamente excluyentes?
Solución:
En este caso, estos eventos son mutuamente excluyentes, porque no se puede sacar el
as y el rey al mismo tiempo.
Demostración:
Para cualquier evento A, se tiene que A y Ac son mutuamente excluyentes, A ∩ Ac 5 Φ; entonces, se
puede aplicar el tercer axioma a la unión de estos dos eventos:
Por otro lado, también se satisface A ∪ Ac 5 S, por lo que P(A ∪ Ac) 5 1; entonces, se sigue que P(A)
1 P(Ac) 5 1, de donde al despejar da como resultado P(Ac) 5 1 2 P(A).
Demostración:
Se sabe que Φ 5 Sc, por lo que al aplicar el teorema 2.1, se determina que
A
B
A A
B B
S S
P(A) P(B)
Figura 2.7. En estos casos, se ejemplifica la probabilidad del área sombreada
en ambos diagramas.
A
B
B
Figura 2.8.
48 | Estadística para ingeniería y ciencias
La probabilidad de la intersección se contó dos veces en P(A) 1 P(B), por eso hay que restarle una
vez este valor:
P(A ∪ B) 5 P(A) 1 P(B) 2 P(A ∩ B)
Ejemplo 2.18. Este caso es una adaptación del libro Probabilidad y Estadística para Ingenieros de Miller
y Freund (1994), editado por Richard A. Jonson. Al probar el servicio de un nuevo
dispositivo anticontaminante, se puede citar cada una de las seis clasificaciones con
sus respectivas probabilidades:
Solución:
a) P(muy deficiente) 5 0.07
b) P(deficiente) 5 0.12
c) P(suficiente o buena) 5 0.17 1 0.32 5 0.49
d) P(bueno, muy bueno o excelente) 5 0.32 1 0.21 1 0.11 5 0.64
Los incisos c) y d) corresponden a la unión de eventos mutuamente excluyentes, por
eso se suman las probabilidades.
Definición 2.11. Un espacio muestral finito es equiprobable si cada uno de sus eventos elementales
tienen la misma oportunidad de ocurrir.
En un espacio equiprobable tiene sentido la definición clásica de probabilidad.
#A
P(A) 5 (2.1)
#S
Donde #A 5 el número de elementos en A.
Capítulo 2 Introducción a la probabilidad | 49
Ejemplo 2.19. Si un dado está bien balanceado, el espacio muestral generado por un lanzamiento es
equiprobable, pues todas las caras tienen la misma oportunidad de aparecer. En este
espacio muestral encontrar:
a) La probabilidad de obtener el número 1.
b) La probabilidad de obtener un número par.
c) La probabilidad de obtener los números 3 o 4.
d) La probabilidad de no obtener los números 3 o 4.
Solución:
1 3 1 2 1 2
a) P({1}) 5
6 6 2 6 3 3
3 1 11 3 23 1 71 2 12 1 41 2 12
b) P({2, 4, 6})
8 6586 6 8652 82 6 46 3 83 3 23
1 1 3 3 1 1 32 23 11 11 22 22 7 71 1 4 4 1 1
c) P({3, 4}) 5 8 858 8 8 8 8 8 4 4 8 8 2 2
6 66 62 26 63 33 3
3 3 1 1 2 2 7 7 1 1 4 14 11 31 31 12 21 12 2
d) P({3,
8 8 84}8 )85
c
8 8182
4 4P({3,
8 68 264}) 51− 5
62 62 26 63 33 3
3 31 12 27 71 14 41 1
Ejemplo 2.20. Encontrar la probabilidad de que una pareja con 3 hijos tenga:
8 88 88 88 84 48 82 2
a) Exactamente 2 varones: A 5 {(v, v, n), (v, n, v), (n, v, v)}
b) Tres varones o 3 niñas: B 5 {(v, v, v), (n, n, n)}
c) A lo más dos varones: C 5 {(n, n, n), (v, n, n), (n, v, n), (n, n, v), (v, v, n), (v, n, v),
(n, v, v)}
d) Cuando menos 2 varones D 5 {(v, v, n), (v, n, v), (n, v, v), (v, v, v)}
e) Más de 2 niñas: E 5 {(n, n, n)}
f) Menos de 2 varones: F 5 {(n, n, n), (v, n, n), (n, v, n), (n, n, v)}
Solución:
El espacio muestral de este experimento, cuando v representa a los varones y n repre-
senta a las niñas, es:
S 5 {vvv, vvn, vnv, nvv, vnn, nvn, nnv, nnn}
Entonces, el1número
3 1 de
2 elementos
1 2 en
1 S3 es18, 2y todos
1 2 los elementos son igualmente
probables: 6 6 2 6 3 3 6 6 2 6 3 3
1 1 2 7 11 134 311 12 21 12 2
3 11113323111712221211412212 3
a) P(A) 5 5 0.375 d) P(D) 5 5
6 8 8 8 64 668 622 26 63 33 3
68 6628666686223826634633833323 8
1 3 13 3 1 2 13 321 12 27 71 14 41 1
21 331231127122127747111144 411 1
b) P(B) 5 1 5 5 e) P(E) 5
6 6 28 6 2 6 38 838 88 88 84 48 82 2
68 883888838888488888442488 822 26
3 1 2 7 1 4 1 1 2 7 1 1 4 31 1 2 1 2
3
c) P(C) 5 f ) P(F) 5 5
8 8 8 8 4 8 2 8 8 8 4 68 62 2 6 3 3
8
3 1 2 7 1 4 1
Como se observa, si el espacio muestral es equiprobable, el calcular la probabilidad
8 8 8 8 4 8 2
de un evento se reduce a contar cuántos elementos tienen ese evento y el espacio
muestral, por esta razón es importante contar con métodos de conteo eficientes, ya
que algunos de estos métodos serán revisados en la siguiente sección.
50 | Estadística para ingeniería y ciencias
Ejemplo 2.21. ¿Cuántos puntos tiene el espacio muestral del experimento que consiste en lanzar dos
dados una vez?
Solución:
El primer dado puede caer en n 5 6 diferentes maneras. Para cada una de éstas, tal
vez el segundo dado caiga en m 5 6 diferentes maneras. Por tanto, el par de dados
caen en nm 5 (6) (6) 5 36 maneras.
Los elementos del espacio muestral de este experimento se listan en la tabla si-
guiente:
11 12 13 14 15 16
21 22 23 24 25 26
31 32 33 34 35 36
41 42 43 44 45 56
51 52 53 54 55 56
61 62 63 64 65 66
Ejemplo 2.22. En un estudio médico los pacientes se clasifican de acuerdo con su tipo de sangre;
es decir, AB1, AB−, A1, A−, B1. B− o O1, O−; y también se clasifican de acuerdo con su
presión arterial en alta, baja o normal. Encontrar el número de maneras en las cuales
un paciente se pueda clasificar.
Solución:
n 5 8 tipos de sangre y m 5 3 presiones arteriales. Por tanto, nm 5 (8) (3) 5 24 ma-
neras de clasificar a los pacientes.
n1 n2 n3, . . . , nk (2-2)
Capítulo 2 Introducción a la probabilidad | 51
Ejemplo 2.24. Si una clínica en un centro médico tiene 4 especialistas del corazón, 3 en medicina
interna y cirujanos generales, ¿cuántas maneras existen de seleccionar un médico de
cada tipo?
Solución:
n1 n2 n3 5 (4)(3)(2) 5 24
La regla de la multiplicación se puede representar de manera gráfica mediante los
llamados diagramas de árbol; para describir cómo se elaboran estos diagramas se
presenta el siguiente ejemplo.
Ejemplo 2.25. Si una computadora selecciona, aleatoriamente, uno de dos factores, Rh (positivo y
negativo) y uno de tres tipos de sangre, ¿cuántos elementos tiene el espacio muestral
de este experimento? ¿Cuál es la probabilidad de tener el tipo de sangre A positivo?
Solución:
El número de elementos del espacio muestral de este experimento es:
n1 n2 5 (2) (3) 5 6
por tanto el diagrama de árbol es:
A 1A
1 O 1O
B 1B
A 2A
2 O 2O
B 2B
Figura 2.9. Diagrama que muestra el factor Rh, el tipo de sangre y el resultado.
Del diagrama de árbol de la figura 2.9, se obtiene el espacio muestral, que es:
S 5 {1A, 1O, 1B, 2A, 2O, 2B}
Al examinar esta situación se observa que una sola rama corresponde a: 1A. Por
1 3 1 2 1 2
tanto, la probabilidad de este evento es P(1A) 5 suponiendo que en la población
6 6 2 6 3 3
de interés los tres tipos de sangre y los dos factores3RL1 son
2 igualmente
7 1 4 1probables.
8 8 8 8 4 8 2
52 | Estadística para ingeniería y ciencias
Ejemplo 2.26. Encontrar la probabilidad de que un infante sea una niña con ojos azules. Suponer
que la probabilidad de varones y mujeres es igual y que puedan tener ojos cafés, ver-
des, azules o castaños, también es igualmente probable.
Solución: 1 3 1 2 1 2
6 6 se2obtiene:
Si se usa la regla de productos 6 3 n 3 n 5 (2) (4) 5 8. La probabilidad de tener
1 2
3 1 2 7 1 4 1
una niña con ojos azules es . El diagrama de árbol de este espacio muestral es:
8 8 8 8 4 8 2
Sexo Color de ojos Resultado
Cafés Varón de ojos cafés
Azules Varón de ojos azules
Varón
Verdes Varón de ojos verdes
Castaños Varón de ojos castaños
En el diagrama de árbol hay ocho resultados posibles al lanzar una moneda tres veces
consecutivas o tres monedas simultáneamente. El espacio muestral es:1 3 1 2 1 2
S 5 {(s, s, s), (s, s, a), (s, a, s), (a, s, s), (s, a, a), (a, s, a), (a, a, s),6(a,6a, 2a)} 6 3 3
3 1 2 7 1 4 1
b) La probabilidad de que caigan exactamente 2 1es: 2P{(s, s, s)} 5
1 3tres1 soles 8 8 8 8 4 8 2
c) La probabilidad de que caigan cuando menos
6 6 dos
2 6soles
3 es:
3
3 1 2 7 1 1 4 31 1 2 1 2
P({(s, s, s), (s, s, a), (s, a, s), (a, s, s)}) 5 5 1 3 1 2 1 2
8 8 8 8 4 68 62 2 6 3 3
d) La probabilidad de caigan a lo más dos águilas es: 3 1 26 76 12 46 13 3
3 1 2 7 1 4 1
P({(s, s, s), (s, s, a), (s, a, s), (a, s, s), (s, a, a), (a, s,8a),8(a,8a, s)})8 45 8 2
8 8 8 8 4 8 2
e) La probabilidad de 1todo 3 el
11 espacio
32 111 32muestral
2111 322111es 3221P(S) 1111;32es
11 3225 211decir:
1 322 11 22 1 2
P(s, s, s) 1 P(s, s, a) 16 P(s,6 6a,
2 s)661623P(s,
66362a,3 6a)6361
23P(a,
663623s,6s)
6361
23 6P(a,
63623s,66a)
3 21
3 6P(a,
3 3 s, 3s) 1
3 1 32 17 321 17432111743211174321117432111743211174 211 74 11 4 1
P(a, a, a) 5 1 1 1 1 1 1 1 5 1
8 8 88 88 884 88888428888842888884288888428888842888 842 88 42 8 2
Ejemplo 2.28. Una pareja de recién casados desea tener cuatro hijos.
a) Listar el espacio muestral para este experimento.
b) ¿Cuál es la probabilidad de tener tres varones?, ¿cuatro varones?
c) ¿Cuál es la probabilidad de tener sólo niñas? ¿Más de dos niñas?
Solución:
a) S 5 {vvvv, vvvn, vvnv, vvnn, vnvv, vnvn, vnnv, vnnn, nvvv, nvvn, nvnv, nvnn, nnvv,
nnvn, nnnv, nnnn}
4 11 5 4 1 5
b) P(3 varones) 5 5 ¼ ; P(4 varones) 5
4
16 16 16 16 16 16
4 1 5 4 1 5
c) P(4 niñas) 5 ; P(más de 2 niñas) 5
16 16 16 16 16 16
2.4.3 Permutaciones
En una permutación el orden es importante y los diferentes elementos del conjunto aparecen una única
vez.
Para elegir el primer elemento del arreglo se tienen n posibles resultados. Para elegir el segundo
elemento del arreglo se tienen (n 2 1) posibles resultados, pues si ya se eligió un elemento, sólo que-
dan n 2 1 donde se puede hacer la elección. Para elegir el tercer elemento se tienen (n 2 2) posibles
resultados, uno menos que antes. De esta manera, para elegir el elemento k del arreglo, se tienen (n
2 (k 2 1)) posibles resultados, por lo que aplicando la regla de la multiplicación, el total de maneras
de completar el proceso es:
n(n 2 1)(n 2 2)(n 2 3) . . . (n 2 k 1 1)
Corolario Si n 5 k, el número de permutaciones es igual a n(n 2 1)(n 2 2)(n 2 3) . . . (3)(2)(1).
Notación factorial
En los métodos de conteo es muy común que aparezcan productos de números que disminuyen en una uni-
dad. Entonces, es conveniente introducir una notación para este tipo de productos la cual se llama notación
factorial.
Definición 2.13. Para un entero n positivo el factorial n, o n factorial, denotado como n!, es igual a:
n! 5 n(n 2 1)(n 2 2)(n 2 3) . . . (3)(2)(1)
y para 0 se define como 0! 5 1.
Solución:
a) 7! 5 (7)(6)(5)(4)(3)(2)(1) 5 5 040
b) 5! 5 (5)(4)(3)(2)(1) 5 120
c) 0! 5 1
Ejemplo 2.30. Un candidato presidencial planea visitar cada uno de los 28 estados de un país, ¿cuán-
tas rutas diferentes son posibles?
Solución:
Las capitales de los diferentes 28 estados se pueden arreglar en 28! maneras; así el
número de diferentes rutas es 28! 5 3.049 × 1029.
Ejemplo 2.31. En la facultad de ingeniería, en cierta oficina, los escritorios de cuatro becarias se po-
nen en línea contra una pared. Cada becaria se puede sentar en cualquier escritorio.
¿Cuántos arreglos para sentar a las becarias son posibles?
Solución:
n! 5 4! 5 (4)(3)(2)(1) 5 24
Capítulo 2 Introducción a la probabilidad | 55
Teorema 2.7. La fórmula para calcular el total de permutaciones de n elementos en k lugares es:
n!
n
Pk 5 (2.3)
( n 2 k )!
Demostración: n( n 21)( n 2 2) . . . (n 2 k 11)(n 2 k ). .
P 5 n( n 21)( n 2 2) . . . (n 2 k 11) 5
n! n k
( n 2 k )(n 2 k 21). . . (3)(2)(1)
P
Por 5
n k la definición de permutaciones se tiene que:
( n 2 k )!
n( n 21)( n 2 2) . . . (n 2 k 11)(n 2 k ). . . (3)(2)((1) n!
n
Pk 5 n( n 21)( n 2 2) . . . (n 2 k 11) 5 5 (2.4)
( n 2 k )(n 2 k 21). . . (3)(2)(1) ( n 2 k )!
Ejemplo 2.32. Con una calculadora de bolsillo evalúe las siguientes permutaciones:
a) 8
P3
b) P
6 4
c) P
15 1
d) P
3 3
Solución:
a) 8
P3 5 n!/(n 2 r)! r 5 8!/(8 2 3)! 5 336
b) P 5 (6)(5)(4)(3) 5 360
6 4
c) P 5 15
15 1
d) P 5 (3)(2)(1) 5 6
3 3
Ejemplo 2.34. En una lotería en la cual hay un primer y un segundo premio se emitieron 20 boletos.
De cuántas maneras posibles se puede tener el par de boletos ganadores.
Solución:
Como se obtiene un primer y un segundo premios, sí importa el orden de los boletos
premiados; entonces, se debe usar la fórmula de las permutaciones para n 5 20 y
k 5 2, la solución es:
20!
P2 5 5 380
20
(20 2 2)!
Ejemplo 2.35. Bajo las condiciones del problema anterior, ¿cuál es la probabilidad de ganar si se
compra un solo boleto?
Solución:
Si el experimento es escoger a los dos boletos premiados de los 20 boletos que se emi-
tieron, el espacio muestral tiene 380 elementos. Los elementos del espacio muestral
56 | Estadística para ingeniería y ciencias
son de la forma (n, m), donde n es el boleto que gana el primer premio y m el boleto
que gana el segundo premio.
S 5 {(1, 2), (1, 3), (1, 4), (1, 5), (1, 6), . . . , (19, 20), (20, 1), (20, 2), . . . , (20, 19)}
Si se compra solamente el boleto con el número k, se gana si:
1. Obtiene el primer premio; esto es, si los boletos ganadores son de la forma (k, n)
con n ≠ k son 19 posibles casos.
2. Obtiene el segundo premio; esto es, si los boletos ganadores son de la forma (n, k)
con n ≠ k, son también 19 casos diferentes a los anteriores.
Entonces, hay 2·19 5 38 casos en que se puede ganar y la probabilidad de ganar es:
38 38 1 1
P(ganar con un solo boleto) 5 5 5 0.10
38038010 10
Solución:
La solución es 3! 5 (3)(2)(1) 5 6, y éstas son: abc, bac, acb, cab, bca, cba.
Ejemplo 2.37. Es una carrera de 10 caballos hay un premio para cualquiera que pueda escoger el
orden exacto y ganar desde el primero hasta el décimo lugar. ¿Cuántos arreglos dife-
rentes hay?
Solución:
10
P10 5 3 628 800 permutaciones
2.4.4 Combinaciones
Solución:
Los subconjuntos de dos elementos del conjunto de cuatro elementos son:
{a, b}, {a, c}, {a, d}, {b, c}, {b, d}, {c, d}.
Entonces, el número total de combinaciones de 4 en 2 es igual a 6.
En las combinaciones el orden no es importante, pues el conjunto {a, b} es igual
que {b, a}.
Capítulo 2 Introducción a la probabilidad | 57
5!n 2 r )!
r !(
Ejemplo 2.41. Se elegirán a tres inspectores de cinco disponibles para inspeccionar las actividades de
3!n!
una industria contaminante. ¿De cuántas maneras se pueden seleccionar?
( n 2 r )!
Solución:
7!
Los tres inspectores integran un subconjunto 4! de los cinco inspectores disponibles; en-
tonces se pide que se diga cuántos diferentes10subconjuntos
! de tres inspectores se pueden
formar de los cinco disponibles, y esto corresponde
6! a las combinaciones de 5 en 3:
5!
C3 5 2! 5 10
5 3!
58 | Estadística para ingeniería y ciencias
n!
r !( n 2 r )!
Ejemplo 2.42. ¿De cuántas maneras puede la Sociedad Química Mexicana seleccionar las fechas en
que tres conferencistas dicten su conferencia,n!si cada conferencia debe ser dictada en
( n 2disponibles?
días diferentes y únicamente hay cinco fechas r )!
7!
Solución: 4!
10
Se pide elegir un subconjunto de tres días de! un total de cinco días; esto es, las com-
binaciones de 5 en 3: 6!
5!
C 5 2! 5 10
5 3 3!
Ejemplo 2.43. Se tienen cuatro cajas para almacenar cuatro de seis objetos; ¿cuántas maneras posi-
bles hay de escoger los cuatro objetos que queden en las cajas?
Solución:
Los cuatro objetos que se empacarán es un subconjunto de los seis objetos totales, por
lo que la solución es la combinación de 6 en 4:
6
C4 5 15
Teorema 2.9. Si de un conjunto de n elementos se quiere obtener k subconjuntos con n1, n2, n3, . . . ,
nk, elementos cada uno (n1 1 n2 1 n3 1 . . . 1 nk 5 n), la fórmula para obtener el total de maneras en
que se puede hacer es:
n!
n
C n n ... n 5 (2.8)
1 2 k
n1!n2!n3! . . . nk!
Demostración:
El proceso de selección de los k subconjuntos se hace en k etapas, en cada etapa se selecciona uno de
los subconjuntos.
En la primera etapa se selecciona un subconjunto de n1 elementos del conjunto total de n elemen-
tos. El total de maneras en que se puede realizar la primera etapa es:
n!
Cn 5 (2.9)
n 1
n1 !( n − n1 )
En la segunda etapa se elige un subconjunto de n2 elementos del conjunto de n 2 n1 elementos
que quedan. El total de maneras en que se puede realizar la segunda etapa es:
( n 2 n1 )!
n2n1
Cn 5 (2.10)
2
n2 !( n 2 n1 2 n2 )
En la etapa i, se selecciona un subconjunto de ni elementos del conjunto de n 2 n1 2 n2 … 2 ni−1
elementos que quedan. El total de maneras en que se puede realizar la etapa i es:
( n 2 n1 2 n2 2. . . 2 ni21 )!
n2n1 2... 2ni 21
Cn 5 (2.11)
i
ni ( n 2 n1 2 n2 2. . . 2 ni21 2 ni )!
Capítulo 2 Introducción a la probabilidad | 59
Hasta la etapa k-ésima, y por la regla del producto, el total de formas de hacer la selección es
igual a la multiplicación del total de formas de hacer la selección de cada etapa. Al multiplicar cada
una de las diferentes combinaciones se cancelan algunos términos:
n!
C n ,n ... nr 5 n C n 3 n2n C n 3... 3 n2n 2...2n C n 5 (2.12)
n 1 2 1 1 2 1 k 22 k .1
n1!n 2!n 3! . . . n k!
Ejemplo 2.44. ¿De cuántas maneras pueden arreglarse en un cordón eléctrico con nueve portalám-
paras, tres focos rojos, cuatro focos amarillos y dos focos azules?
Solución:
Como se observa, lo que se pide es seleccionar tres subconjuntos de las nueve porta-
lámparas de 3, 4 y 2 elementos cada uno, para poner los focos de diferente color. Esto
n!
implica que se utilice la fórmula El resultado es:
(n1!n2!n3!)
9!
5 1 260
[(3!4!2!)]
12!
Ejemplo 2.45. El equipo de un colegio juega 12 partidos durante la temporada. ¿De cuántas maneras
[( 7!)(3!)(2!)]
pueden darse los resultados de los juegos para el equipo si al terminar la temporada
ganó 7 juegos, perdió 3 y empató 2? 7!
(3!2!2!)
Solución:
10!
El total de maneras en que pueden darse 3!3!los
(3 2!2resultados
!) es igual al número de subcon-
juntos de 7, 3 y 2 elementos del total de los 12 juegos, por lo que para encontrar este
valor se debe usar la fórmula del teorema9! anterior con n 5 12, n 5 7, n 5 3 y n 5
1 2 3
2 para resolver este problema: [( 3! 4 !2!)]
12!
5 7 920
[( 7!)(3!)(2!)]
7!
Ejemplo 2.46. ¿En cuántas maneras pueden siete científicos ser asignados a una habitación triple y a
(3!2!2!)
dos habitaciones dobles en un hotel?
10! 9!
Solución: 3!3!2![(
(3 2!)3!4!2!)]
La solución es igual a decir, ¿de cuántas maneras 12!se pueden obtener tres subconjuntos
de 3, 2 y 2 científicos, del total de siete que[( 7son? La2!)]
!)(3!)( fórmula es:
7!
C3,2,2 5 5 210
7 9! (3!2!2!)
[(3!4!2!)] 10!
Ejemplo 2.47. ¿De cuántas maneras se pueden acomodar 10 viajeros en un hotel asignándoles dos
12! (3
3!3!2!2!)
habitaciones triples y dos habitaciones dobles?
[( 7!)(3!)(2!)]
Solución: 7!
Con la fórmula de las combinaciones
(3!2del
!2!)teorema anterior, se obtiene:
10!
5 25 200
(3
3!3!2!2!)
60 | Estadística para ingeniería y ciencias
Solución:
Al aplicar la fórmula de la probabilidad para espacios equiprobables, sabiendo que son 21 personas las que
estudian ingeniería, se tiene que:
#B 3 118 21
P(B) 5 5 5 5 0.7
#S 30 30
La probabilidad de que la persona seleccionada sea mujer es:
#A 10 1
P(A) 5 5 5
#S 30 3
y la probabilidad que la persona seleccionada sea una mujer que estudia ingeniería, es
#A ∩B 3
P(A ∩ B) 5 5 5 0.1
#S 30
Si se decide escoger a la persona únicamente de entre las mujeres, el espacio muestral se reduce y la pre-
gunta sería: ¿cuál es la probabilidad de elegir a una persona que estudie ingeniería dado que es mujer?
Solución:
El resultado se encuentra dividiendo el número de mujeres que estudia ingeniería entre el total de mujeres,
esto es:
Definición 2.15. Dados dos eventos A y B de un espacio muestral S, se define como probabilidad
condicional de A dado B a la probabilidad que ocurra A dado que ocurrió B, y se calcula mediante
la siguiente fórmula:
Capítulo 2 Introducción a la probabilidad | 61
« P(A B)
® si P(B) x 0
P(A | B) 5 ¬ P(B)
® 0 si P(B) 5 0
Ejemplo 2.49. Los resultados obtenidos de 266 muestras de aire se clasifican de acuerdo con la pre-
sencia de dos moléculas raras. Sean los eventos:
A 5 {x | x es una muestra con la molécula rara tipo 1}
B 5 {x | x es una muestra con la molécula rara tipo 2}
¥ 12 ´ ¥ 36 ´
Se sabe que P(A ∩ B) 5¦ µy P(A) 5¦ , entonces, para calcular la probabilidad de
§ 266 ¶ § 266 µ¶
tener una muestra con la molécula rara del tipo 2, si se sabe que ya tiene la molécula
del tipo 1, es (Montgomery et al. 1996):
Solución:
¥ 12 ´ ¥ 36 ´ 12 1
P(B|A) 5 P(A ∩ B)/P(A) 5 ¦ / 5 5
§ 266 µ¶ ¦§ 266 µ¶ 36 3
¥ 30 ´
Ejemplo 2.50. Refiriéndose al problema anterior, encontrar P(A|B), si P(B) es igual a¦
§ 266 µ¶
Solución:
¥ 12 ´ ¥ 30 ´ 12
P(A|B) 5 P(A ∩ B)/P(B) 5 ¦ / 5 0.4
§ 266 µ¶ ¦§ 266 µ¶
5
30
Demostración:
Se usa sucesivamente la fórmula P(A ∩ B) = P(A | B)P(B)
P(A1 ∩ [A2 ∩ A3 ∩ . . . ∩ An]) 5 P(A1 | A2 ∩ A3 ∩ . . . ∩ An) P(A2 ∩ [A3∩ . . . ∩ An])
5 P(A1 | A2 ∩ A3 ∩ . . . ∩ An) P(A2 | A3 ∩ . . . ∩ An) P(A3 ∩ . . . ∩ An).
5 P(A1 | A2 ∩ A3 ∩ . . . ∩ An) P(A2 | A3 ∩ . . . ∩ An) . . . P(An − 1|An)P(An)
Ejemplo 2.51. Se tiene una urna con 3 bolas rojas, 4 bolas blancas y 5 bolas verdes. Se eligen sucesi-
vamente sin reemplazo las bolas de la urna. Encontrar la probabilidad que:
a) Las dos primeras bolas sean verdes.
b) La tercer bola sea roja si la primera fue verde y la segunda es roja.
c) La primera bola sea roja, la segunda sea blanca y la tercera sea verde.
Solución:
Sean los eventos:
a) Ei la i-ésima bola es roja.
b) Fi la i-ésima bola es blanca.
c) Gi la i-ésima bola es verde.
El total de bolas en la urna son 12, conforme se seleccionan las bolas se reduce este
número.
a) G1 ∩ G2 es el evento: las primeras dos bolas son verdes, entonces:
¥ 4 ´¥ 5 ´ ¥ 5´
P(G1 ∩ G2) 5 P(G2 | G1) P(G1) 5 ¦ µ ¦ µ 5 ¦ µ
§ 11 ¶ § 12 ¶ § 33 ¶
b) Si ya se sacaron 2 bolas, una verde y otra roja, sólo quedan 10 bolas y de ella 2 son
rojas, por lo que:
2
P(E3 | G1 ∩ E2) 5
10 ¥ 5 ´¥ 4 ´¥ 3 ´ 5
c) P(E1 ∩ F2 ∩ G3) 5 P(G3 | E1 ∩ F2) P(F2 | E1) P(E1) 5 ¦ µ ¦ µ ¦ µ 5
§ 10 ¶ § 11 ¶ § 12 ¶ 110
Teorema 2.12. (Probabilidad total) Sea E1, E2, E3, . . . , En eventos tales que:
1. Ei ≠ φ, para i 5 1, 2, 3, . . . , n
2. Ei ∩ Ej 5 φ, . . . si i ≠ j
3. E1 ∪ E2 ∪ E3 ∪ . . . ∪ En 5 S
Capítulo 2 Introducción a la probabilidad | 63
Demostración:
Los eventos Ei forman una partición del espacio muestral, pues la unión de todos ellos determina el
espacio muestral y por parejas son mutuamente excluyentes, esto se puede representar con diagramas
de Venn, tales como:
E1 E2 E3 E4 E5 E6 … En
El evento A es igual a la unión de eventos mutuamente excluyentes, por lo que por el axioma 3 de la
probabilidad sucede lo siguiente:
P(A) 5 P(A ∩ E1) 1 P(A ∩ E2) 1 P(A ∩ E3) 1 . . . 1 P(A ∩ En)
y por la definición de probabilidad condicional se obtiene:
P(A) 5 P(A|E1)P(E1) 1 P(A|E2)P(E2) 1 P(A|E3)P(E3) 1 ... 1 P(A|En )P(En)
La probabilidad condicional generalmente se utiliza cuando se quiere determinar la probabilidad
de un evento posterior dado otro evento anterior; por ejemplo, cuál es la probabilidad del color de la
segunda bola extraída dado el color de la primera bola extraída; con el teorema de Bayes se calcula la
probabilidad de lo que ocurrió antes conociendo lo que sucedió después esto corresponde a la interfe-
rencia de causas conociendo el resultado. El teorema de Bayes se enuncia como:
Teorema 2.13. (de Bayes) Sea E1, E2, E3, ..., En eventos, tales que:
Ei ≠ φ, para i 5 1, 2, 3, . . . , n
Ei ∩ Ej 5 φ, . . . si i ≠ j
E1 ∪ E2 ∪ E3 ∪ . . . ∪ En 5 S
Demostración:
P(A ∩ E j ) P(A | E j )P(E j )
Se sabe que P(E j | A ) 5 5 y por el teorema de la probabilidad total, el
P(A ) P(A )
denominador se transforma:
P(A | E j )P(E j )
P (E j | A) 5 (2.14)
P(A | E1 )P(E1 ) 1 P(A | E 2 )P(E 2 ) 1. . . 1 P(A | E n )P(E n )
Los experimentos en los que se aplica la fórmula de Bayes presentan en dos etapas: una etapa anterior
(una antes) y una etapa posterior (una después). La etapa anterior se relaciona con los eventos de la
partición (E1, E2, E3, . . . , En); la etapa posterior se relaciona con el evento A.
Ejemplo 2.52. Considerar una urna con 4 bolas blancas y 6 bolas negras. Si se sacan 2 bolas al azar
sin reemplazo, encontrar la probabilidad de que la primera bola sea negra dado que
la segunda bola es blanca.
Solución:
Sean los eventos:
E1: la primera bola es blanca.
E2: la primera bola es negra.
D: la segunda bola es blanca.
Con la fórmula de Bayes, se obtiene:
P(D | E 2 )P(E 2 )
P(E 2 | D) 5
P(D | E1 )P(E1 ) 1 P(D| E 2 )P(E 2 )
(4 / 9)(6 / 10) 6 2
P(E 2 | D) 5 5 5
(3 / 9)(4 / 10) + (4 / 9)(6 / 10) 9 3
Ejemplo 2.53. En un lote de 5 artículos se elige uno al azar. El artículo elegido se prueba y sale de-
fectuoso; si el lote puede tener de 1 a 5 artículos defectuosos con igual probabilidad,
¿cuál es el número de artículos defectuosos más probable, dada la información de que
se sacó un artículo defectuoso?
Solución:
La primera etapa del experimento se relaciona con la condición de los artículos del
lote (cuántos artículos defectuosos hay en el lote); la segunda etapa se relaciona con
la prueba del artículo para ver si es bueno o defectuoso.
La primera etapa está relacionada con la partición:
a) E1, en el lote hay 1 artículo defectuoso.
b) E2, en el lote hay 2 artículos defectuosos.
c) E3, en el lote hay 3 artículos defectuosos.
Capítulo 2 Introducción a la probabilidad | 65
P(D | Ei )P(Ei )
P(Ei | D) 5 5
∑ P(D | E k
)P(E k )
k =1
Se puede ver que la máxima probabilidad se tiene cuando todos los focos del lote
son defectuosos.
Definición 2.16. Dos eventos A y B se dice que son independientes si y sólo si la ocurrencia de
uno de ellos no cambia la probabilidad de ocurrencia del otro; es decir A y B son independientes si
P(A | B) 5 P(A) y P(B | A) 5 P(B).
Teorema 2.15. Los eventos A1, A2, A3, . . . , An son independientes si y sólo si:
P(A1 ∩ A2 ∩ A3 ∩ . . . ∩ An) 5 P(A1) P(A2) . . . P(An−1)P(An)
Ejemplo 2.54. Encontrar la probabilidad de sacar dos soles en dos lanzamientos de una moneda no
cargada.
Solución:
Puesto que la moneda no está cargada, la probabilidad de obtener un sol en un volado
es igual a 0.5; los resultados de los dos lanzamientos son independientes, por tanto la
probabilidad de tener dos soles es:
66 | Estadística para ingeniería y ciencias
Ejemplo 2.55. Se sacan dos cartas, aleatoriamente, de un mazo de 52 naipes; ¿qué probabilidad hay
de obtener dos ases si. . .
a) la primera carta se reemplaza antes de que se saque la segunda?
b) la primera carta no se reemplaza antes de que se saque la segunda?
Solución:
Sean los eventos:
A1: se obtiene as en la primera extracción.
A2: se obtiene as en la segunda extracción.
a) Si para sacar la segunda carta se regresa al mazo la carta que ya se sacó, la probabi-
lidad del resultado de la segunda carta es independiente de lo que haya ocurrido con
la primera extracción. Los dos resultados son independientes. Por otro lado, entre
los 52 naipes hay cuatro ases, la probabilidad de sacar un as en cada extracción es
44 11 11 11 11
5 , por tanto,5 la5probabilidad de tener dos ases es:
5252 1313 1313 1313 169 169
4 1 1 1 1
P(A1 ∩ A2) 5 P(A1)P(A2) 5 5
52 13 13 13 169
b) Si 3al3 sacar
44 la segunda
11 carta no se regresa la carta4que1ya se1 sacó,
1 entonces,1 sólo
5151 5252 55221
221 52 13 13 13 5 169
quedan 51 cartas y 3 ases si la primera carta fue
3 4
as. Los1
resultados de las 2 extrac-
ciones son dependientes; entonces, la probabilidad 51 52 5 de221
tener dos ases es:
2020 44 3 4 1
P(A1 ∩ A2) 5 P(A2 | A1)P(A1) 5 5
2626 2626 51 52 221
20 4
Ejemplo 2.56. Se sabe que las probabilidades asociadas a los 26dos 26eventos J y K son P(J) 5 0.60, P(K) 5
0.4 y P(J 44 ∩ K) 20205 0.10. ¿Estas probabilidades indican que 20 J y4 K son independientes?
2626 / / 2626 550.020
.20
4 1 1 4 1 1 126 1 1 1
4 520 26 5
Solución: 52 13 1352 13 /
13
169 135 0 .
20
13 169
26 26 4 1 1 1 5 1
Para que los eventos J y K sean independientes, se debe 452 13 20 13
satisfacer 13 169
larelación:
/ 5 0.20
P(J ∩ K) 5 P(J)P(K) 3 4 13 4 26 1 26
5 5
En este caso, se tiene que P(J)P(K) 51 52 5 (0.60)(0.40)
51 52 5221
221 0.24 y P(J ∩ K) 5 0.10, que
3 4 1
son valores diferentes, por tanto J y K no son independientes. 51 52 5 221
20 4 20 4
Ejemplo 2.57. Encontrar P(A|B), si P(B) 5 y P(A ∩ B) 5
26 26 26 26
20 4
Solución: 26 26
4 20 4 20
Al aplicar la fórmula de la probabilidad condicional
.20 / se
26 / 26 5026 5tiene:
0.20
26
4 20
P(A|B) 5 P(A ∩ B)/P(B) 5 P(A|B) 5 / 5 0.20
26 26
Ejemplo 2.58. (Ejemplo adaptado del libro Statistics for Management and Economics de G. Keller,
Brian Warrock, Henry Bartel, Wardsworth Publishing Co., Belmont, California,
1990.) Considerar el espacio muestral S 5 {a, b, c, d), donde P({a}) 5 P({d}) 5 0.3 y
P({b}) 5 P({c}) 5 0.2.
Capítulo 2 Introducción a la probabilidad | 67
Ejemplo 2.61. Supóngase que en una caja hay 20 fusibles, de los cuales 5 están defectuosos. Si se
seleccionan sucesivamente 2 fusibles aleatoriamente, ¿cuál es la probabilidad de que
los 2 fusibles seleccionados estén defectuosos?
Solución:
Si se tienen los eventos:
A: el primer fusible seleccionado es defectuoso.
B: el segundo fusible seleccionado es defectuoso.
Se pide calcular la probabilidad de la intersección, es decir:
4 5 1
P(A ∩ B) 5 P(B|A)P(A) 5 5
19 20 19
Ejemplo 2.62. Si P(A) 5 0.5, P(B) 5 0.4 y P(B|A) 5 0.3, encontrar P(A ∩ B).
1 1 1 11
Solución: 1 2 5
6 6 36 36
P(A ∩ B) 5 P(A)P(B|A) 5 (0.5)(0.3) 5 0.15.
4 1
Ejemplo 2.63. Con referencia al problema anterior, encontrar P(A 9∪ B).
4
Solución:
Para resolver este problema se utiliza la fórmula P(A ∪ B) 5 P(A) 1 P(B) 2 P(A ∩ B).
P(A ∪ B) 5 0.5 1 0.4 2 0.15 5 0.75
Ejemplo 2.64. ¿Cuál es la probabilidad de obtener al menos un 6, al tirar dos dados no cargados?
Solución:
Sean los eventos:
A1: sale 6 en el primer dado.
A2: sale 6 en el segundo dado.
4 5 1
19y se20usa 5
la19fórmula:
Se quiere calcular la probabilidad de la unión
P(A ∪ A ) 5 P(A1) 1 4P(A
2)52
P(A1 1 ∩ A2) 4 5 1
4 15 2 1 511
5 1 1 1 19 20 5 19
Se tiene que P(A1) 5 1/6,
19 P(A
20 2) 5191/6 y P(A1 ∩2
19 A 20
)5 19
5
6 1 6 236 36
Sustituyendo todos estos valores en la fórmula da como resultado:
1 1 1P(A11∪ A ) 54 1 1 1 1 11
1 2 5 1 1 1 11
1 2 51 2
6 6 36 36 1 2 5
6 6 36 36 9 4 6 6 36 36
2
Ejemplo 2.65. La probabilidad de que Marina pase matemáticas es y la probabilidad de que pase
4 1 4 1 3 4 1
el curso de inglés es . Si la probabilidad de 9pasar
4 ambos cursos es de , ¿cuál es la
9 4 9 4
probabilidad de que Marina pase cuando menos uno de los cursos?
Solución:
Sean los eventos:
A: Marina pasa matemáticas. B: Marina pasa inglés.
Se pide la probabilidad de la unión:
Capítulo 2 Introducción a la probabilidad | 69
sa
B
ss
aa
A as
Ejemplo 2.69. Tres naipes se sacan sucesivamente, sin reemplazo; sean los eventos:
2 4 1 2 4 1
A1: la primera carta es un as rojo (hay dos ases rojos).
1 2 1 2
3 9 4 3 9 4
2 4 1A : la segunda carta es un 10 o una sota (hay cuatro 10 y cuatro sotas).
1 2 2 31 31
3 9 4
36 36
A3: la tercera carta tenga un número mayor que 3 y menor que 7 (hay doce cartas
31
entre el 3 y el 7). 4 13 1 4 1613 1 16
36 1 2 51 2 5
Encontrar la probabilidad de que ocurra el 52
evento A52 ∩ A52 222∩52A 42452
4 .52 1411 152 52
4 13 1 16 1 2 111 2 1
322 2
1 2 5 1 1 1333 1 9399 14944 41
52 52 52 52 1 5 1 5
Solución: 10 10 531 31 1031 10 5
31
1 1 1
1 5 2 8 1236 36362 36 8 8 12 8
10 10 Las 5 probabilidades condicionales son: P(A1) 5 , P(A2|A1) 5 , P(A3|A1 ∩ A2) 5
52 51 50 44452 5525 413
1351 1350
13 111 15525
16
16
16 16
2 8 12 8 111 12 22 25 55 5
. (Aquí nótese que, en la primera selección hay8 5212cartas, 52
5252en
8 52 52
52
la 52 52
12segunda 52
5252 5252
52
52 52
selección el
52 51 50 5525
52 52 111
52 1 111
52 1111 1
8 12 número de cartas baja a 51 y en la tercera selección2 4baja1a 10 2101
50 11410
cartas.) 15 5
10110
5 Por 5
555 5 tanto:
1 2 10 1 10 102
52 52 3 9 4 3222 92888 412 812
12 12888 8
P(A1 ∩ A2 ∩ A3) 5 P(A1)P(A22|A14)P(A ∩ A2) 5 ( 31 )( )( ) 5
1 3|A131
1 2 52
5252 52555111 5
50
50
1
50 50 5525
5525
55255525
3 9 4 36 36
888 12 812
12 12
Ejemplo 2.70. El mismo experimento del ejemplo 31anterior, sólo4 que 13la selección
14 16 13 se1hace 16con reem-
1 22 24452 52525
11152 52
52
52 2 52 5
36 A1 ∩ A2 ∩52
plazo, encontrar la probabilidad que A3. 521 1 52 52
22 52 52 52 52
33 99 44
4 13 1 116 1 1 1 1 1
Solución: 1 2 52 1431 315 1 510 1 10 5 5
52 52 52 52 10 1 2 10
Al haber reemplazo de cartas, el problema se 32reduce 9836
36 4a la regla multiplicativa para
12 2 88 12 8
1 1 1
31 5144 1
eventos independientes. Los valores de las probabilidades
1 5
52 50
1 2
13
13
52 de los
5525
2 5 5
11 tres
1 5 50
16
16eventos son:
5525
10 10 5
36 52 52 52 52 52 52 52 52
2 8 12 88 12 8 12
P(A1) 5 ; P(A ) 5 4 ; y 13 1 1
P(A 11
)15 11
16
52 51 250 5525 52 152 1 13 52
2 55
552
52 10 10
52 10 10
52 5552
En seguida, sustituyendo los valores8 en12la siguiente expresión
212 818 12 12 se obtiene:88
1
52 52 1 5
P(A1 ∩ A2 ∩ A3) 5 P(A 52
52
)P(A
10 1 10 2 5 3 55 1
1
)P(A 50
50 ) 5525
5525
2 888 12 12
12 8
5 ( )( )( )
52 552 52
1 50 52
52 5525
5 0.0013655
8 12
52 52
Capítulo 2 Introducción a la probabilidad | 71
Solución:
Sean los eventos:
A: la primera carta seleccionada sea un rey (hay cuatro reyes).
B: la segunda carta seleccionada sea el 9 de diamantes (hay un solo 9 de diamantes).
C: la tercera carta sea cualquier carta menor o igual que una sota (empezando con
el as, luego el 2 hasta el 10 hay 10 cartas antes de la sota, son 11 con la sota; por
tanto, hay 11(4) 5 44 de estas cartas).
D: la cuarta carta sea un 7 negro (hay dos 7 negros).
Se puede ver que un 7 negro es menor que la sota, por tanto el evento C se puede
descomponer como la unión de dos eventos mutuamente excluyentes, C 5 C1 ∪ C2,
donde:
C1: la tercera carta sea una carta menor o igual que una sota que no sea 7 negro (hay
42 casos)
C2: la tercera carta sea un 7 negro. (Hay dos casos)
Por las leyes de Morgan se tiene que:
A ∩ B ∩ C ∩ D 5 A ∩ B ∩ (C1 ∪ C2) ∩ D
5 (A ∩ B ∩ D) ∩ (C1 ∪ C2)
5 (A ∩ B ∩ D ∩ C1) ∪ (A ∩ B ∩ D ∩ C2)
5 (A ∩ B ∩ C1 ∩ D) ∪ (A ∩ B ∩ C2 ∩ D)
Entonces,
P(A ∩ B ∩ C ∩ D) 5 P((A ∩ B ∩ C1 ∩ D) ∪ (A ∩ B ∩ C2 ∩ D))
5 P(A ∩ B ∩ C1 ∩ D) 1 P(A ∩ B ∩ C2 ∩ D)
Las probabilidades condicionales de las diferentes extracciones son:
4 1 41 2 1 2
P(A) 5 , como es la primera extracción, ésta se realiza con las 52 cartas.
52 51 50 50 49 49
4 1 41 2 1 2
P(B | A) 5 , ya se extrajo un rey; entonces, hay 51 cartas.
52 51 50 50 49 49
4 1 41 2 1 2
P(C1 | A ∩ B) 5 , ya se extrajeron dos cartas, un rey y un 9 de diamantes que es
52 51 50 50 49 49
menor que una sota, quedan 50 cartas; sólo 41 están en C1.
4 1 41 2 1 2
P(C2 | A ∩ B) 5 , ya se extrajeron dos cartas, quedan 50, y dos 7 negros.
52 51 50 50 49 49
4 1 41 2 1 2
P(D | A ∩ B ∩ C1) 5 , ya se extrajeron tres cartas, quedan 49 y dos 7 negros.
52 51 50 50 49 49
4 1 41 2 1 2
P(D | A ∩ B ∩ C2) 5 , ya se extrajeron tres cartas, quedan 49 y sólo un 7 negro.
52 51 50 50 49 49
72 | Estadística para ingeniería y ciencias
Entonces:
P(A ∩ B ∩ C1 ∩ D) 5 P(A) P(B | A) P(C1 | A ∩ B) P(D | A ∩ B ∩ C1)
¥ 4 ´ ¥ 1 ´ ¥ 41 ´ ¥ 2 ´
5 ¦ µ¦ µ¦ µ¦ µ
§¥ 52 1 ¶´ §¥ 50
4 ¶´ §¥ 51 41 ¶´ §¥ 49
2 ¶´
¦§ 52 µ¶ ¦§ 51 µ¶ ¦§ 50 µ¶ ¦§ 49 µ¶
5 0.00005048
¥ 4 ´P(B
P(A ∩ B ∩ C2 ∩ D) 5 P(A) ¥ 1 |´ ¥A)2 P(C
´ ¥ 1 |´ A ∩ B) P(D | A ∩ B ∩ C )
¦§ 52 µ¶ ¦§ 51 µ¶ ¦§ 50 µ¶ ¦§ 49 µ¶
1 1
¥ 4 ´¥ 1 ´¥ 2 ´¥ 1 ´
5 ¦ µ¦ µ¦ µ¦ µ
§ 52 ¶ § 51 ¶ § 50 ¶ § 49 ¶
5 0.00000123
P(A ∩ B ∩ C ∩ D) 5 0.00005048 1 0.00000123 5 0.00005171
Problemas propuestos
2.1 Al lanzar una moneda no cargada, ¿cuál es la probabilidad 2.12 Hallar el número de combinaciones de las letras a, b, c en
de que salga sol? subconjuntos de dos elementos.
2.2 Al lanzar un dado no cargado de 6 caras, ¿cuál es la proba- 2.13 Si dos eventos A y B son tales que P(A) 5 0.10, P(B) 5 0.40
bilidad de que caiga 1? y P(A ∩ B) 5 0.05. Determinar:
2.3 ¿Cuál es la probabilidad de que caiga cualquiera de los nú- a) P(A|B)
meros 3 o 4 al lanzar un dado no cargado? b) P(B|A)
2750
2.4 Si una persona es seleccionada al azar de un grupo de 20 2.14 Si dos eventos A y B son tales que P(B) 5 y P(A ∩
10 000
psicólogos y 30 sociólogos, ¿cuál es la probabilidad de que B) 5 0.14. Encontrar P(A|B).
la persona seleccionada sea un sociólogo? 2.15 Si al lanzar un dado se tiene el evento E 5 {2, 4, 6}. Encon-
2.5 ¿Cuál de los siguientes números no representa una probabi- trar la probabilidad de E.
lidad y por qué? 2.16 Si de un grupo de 80 estudiantes, 30 son mujeres y se elige
3/7, 2, 21/2, 3/4, 99/101, 0, 1, 5, 1.11, 1.0001, 0.0001, 0.001, una persona al azar, encontrar la probabilidad de que la per-
0.9999 sona seleccionada no sea mujer.
2.6 La probabilidad de que Juan esté vivo en 20 años es de 0.7 y 2.17 De los siguientes eventos decir cuáles son mutuamente ex-
la probabilidad de que Pedro esté vivo en 20 años es de 0.5. cluyentes:
Si se supone que hay independencia entre la vida de estas a) A 5 {x | x asiste a las clases de estadística regularmente};
personas, ¿cuál es la probabilidad de que ambos estén vivos B 5 {x | x posee una computadora}.
en 20 años? b) A 5 {x | x tiene cabello rubio};
2.7 Si al lanzar sucesivamente una moneda no cargada se defi- B 5 {x | x tiene ojos cafés}.
nen los eventos: 2.18 Sean los eventos:
E1: en el quinto lanzamiento sale águila. A: el vuelo de un avión que llega a tiempo.
E2: en el sexto lanzamiento sale águila. B: el vuelo de un avión que sale a tiempo.
¿Cuál es la probabilidad de que salgan águila en ambos lan- Las probabilidad correspondientes son: P(A) 5 0.82; P(D)
zamientos? 5 0.83 y la probabilidad de que el avión salga a tiempo y
2.8 ¿Cuál es la probabilidad de sacar cuando menos un 6 en 2 llegue a tiempo es P(D ∩ A) 5 0.78. Hallar la probabilidad
lanzamientos de un dado no cargado? de que el avión:
Sugerencia: usar la regla de adición. a) Llegue a tiempo dado que partió a tiempo.
2.9 Suponiendo que el sexo de un hijo por nacer es igualmente b) Haya salido a tiempo dado que arribó a tiempo.
probable, y que es independiente del sexo de sus hermanos o 2.19 Se tiene una caja que contiene 3 bolas blancas y 2 bolas
hermanas. Para una familia de tres hijos: negras. Se eligen sucesivamente las bolas sin reemplazo,
a) Describa el espacio muestral y calcule la probabilidad de entonces:
que la familia tenga: a) ¿Cuál es la probabilidad de que la primera bola sea ne-
• exactamente 2 varones. gra?
• exactamente 2 niñas. b) ¿Cuál es la probabilidad de que la segunda bola sacada
• cuando menos 2 varones. sea negra dado que la primera bola sacada fue negra?
2.10 Lanzar 2 veces una moneda no cargada. Encontrar: c) ¿Cuál es la probabilidad de que ambas bolas sacadas
a) El espacio muestral. sean negras?
b) La probabilidad de que salgan exactamente sol y águila. 2.20 Con la siguiente figura y la simbología del diagrama de Venn
2.11 Encontrar el número de permutaciones de las letras a, b, c en definir las regiones:
dos lugares. a) Regiones 1 y 2.
Capítulo 2 Introducción a la probabilidad | 73
2.39 Responder las siguientes preguntas: b) Planea visitar únicamente los estados que colindan con
a) ¿Cuántos elementos tiene el espacio muestral, generado Estados Unidos de América.
por lanzar dos dados no cargados? ¿Cuál es este espacio 2.53 Evaluar los siguientes factoriales:
muestral? a) 7!
b) ¿Cuántos puntos muestrales hay en un espacio muestral b) 70!/68!
cuando se lanzan tres dados simultáneamente? c) 10!/0!
2.40 Un diseñador de una nueva subdivisión ofrece a los com- 2.54 Supóngase que hay 50 personas compitiendo por tres diferen-
pradores de casas una selección de estilos exteriores de in- tes puestos, ordenados en primero, segundo y tercero. ¿De
glés, rústico, colonial y tradicional combinados con tipos de cuántas maneras se puede seleccionar a las tres personas para
rancho de dos pisos y un desnivel. ¿De cuántas maneras se ocupar los tres puestos?
puede ordenar una de estas casas con esos estilos de cons- 2.55 En cierta compañía, 5 escritorios de secretaria se sitúan en lí-
trucción? Hacer un diagrama de árbol. Sugerencia: usar la nea contra la pared. Cada secretaria puede sentarse en cual-
regla del producto n1n2. quier banco de los escritorios. ¿Cuántos arreglos se pueden
2.41 Un estudio de tráfico vehicular indica que de 3 756 automó- hacer para sentar a las secretarias?
viles que se acercan a la plaza, 857 entran en el aparcamien- 2.56 En un almacén hay 5 cajas adyacentes para almacenar 5
to. ¿Cuál es la probabilidad de que un auto no entre en el objetos diferentes. El depósito de cada objeto puede almace-
aparcamiento? narse satisfactoriamente en una caja. ¿De cuántas maneras
2.42 En una prueba la primera pregunta es de falso y verdadero y pueden asignarse 5 objetos a 5 cajas?
la segunda es de selección múltiple con posibles respuestas 2.57 Supóngase que hay 7 partes diferentes para ser almacenadas,
de a, b, c, d, e. Siendo así, ¿cuántas secuencias de posibles pero sólo hay 4 cajas disponibles. ¿Cuántas maneras de aco-
respuestas hay en estas dos preguntas? modar los 4 objetos hay?
2.43 En el diseño de un sistema de computadora, si un byte se 2.58 ¿De cuántas maneras diferentes se pueden realizar una pri-
define como una secuencia de 8 bits y, cada bit debe ser 0 o mera, segunda, tercera o cuarta selección entre 12 empresas
1, ¿cuántos bytes diferentes son posibles? arrendadoras de equipo de control de contaminación am-
2.44 Explicar detalladamente o con sus propias palabras lo que biental?
significan los siguientes términos: 2.59 Contestar lo siguiente.
a) Experimento aleatorio. a) ¿Cuál es el número de permutaciones de las letras a, b, c?
b) Espacio muestral. b) ¿Cuáles son estas permutaciones? Escribirlas.
c) Evento. 2.60 Un mecanismo electrónico de control requiere de 5 chips de
2.45 Evaluar 50! Sugerencia: usar la aproximación de Stirling: memoria idénticos. ¿De cuántas maneras puede habilitarse
n! ~ 2pn n e
n 2n este mecanismo colocando los 5 chips en las 5 posibles po-
siciones dentro del controlador?
2.46 Se lanza una moneda tres veces consecutivas. Hacer un
2.61 Se requiere sentar a 5 hombres y 4 mujeres en una fila, de
diagrama de árbol con los resultados de sol y águila y escri-
bir el espacio muestral. Calcular lo siguiente: tal manera que las mujeres ocupen lugares pares. ¿Cuántos
a) Se obtienen cuando menos 2 soles. arreglos hay?
b) El segundo lanzamiento es un sol. 2.62 Un aparato de seguridad de un negocio con 10 botones se
c) El número de soles es exactamente 2. inhabilita cuando 3 botones diferentes se oprimen en la se-
d) El segundo lanzamiento cae en águila. cuencia apropiada (los botones no pueden oprimirse dos ve-
e) Todos los lanzamientos muestran la misma imagen. ces). Si el código correcto se olvida, ¿cuál es la probabilidad
f ) El número de soles es menor que 2. de inhabilitar el aparato a través de oprimir aleatoriamente,
g) El segundo lanzamiento no es sol. tres botones?
h) El número de soles es de cuando menos 2. 2.63 Se sacan dos boletos de la lotería entre 30 posibles para el
i) El número de soles es no más de 3. primero y segundo premios. ¿Cuál es la probabilidad de ga-
j) El número de águilas es a lo más 3. nar comprando un boleto?
k) Que el número de soles exceda al número de águilas. 2.64 En una carrera de ocho perros se juega un premio de exacta.
2.47 ¿De cuántas maneras diferentes una sección sindical con 25 Si se seleccionan tres números de perros, ¿cuál es la probabi-
miembros puede elegir un presidente y un vicepresidente? lidad de acertar el ganador comprando un solo boleto?
2.48 Si se lanza 3 veces consecutivas un dado, ¿cuál es la proba- 2.65 Considérese una carrera de 10 caballos con un premio para
bilidad de que salga un 6? cualquiera que pueda seleccionar el orden exacto y ganar des-
2.49 Se seleccionan tres cartas, sucesivamente, de un mazo de 52; de el primero hasta el décimo lugar.
encontrar el número de resultados si: a) ¿Cuántas permutaciones posibles hay?
a) Hay reemplazo. b) ¿Cuál es la probabilidad de ganar si se compra un solo
b) Si no hay reemplazo. boleto?
2.50 ¿De cuántas maneras pueden acomodarse cinco canicas de c) ¿Cuál es la probabilidad de acertar a los caballos que lle-
diferentes colores en una fila? guen en los tres primeros lugares?
2.51 Calcular de cuántas maneras pueden formarse seis personas
para subir a un autobús.
2.52 Un candidato presidencial planea hacer campaña política. Problemas de tarea
Encontrar el número de permutaciones si:
a) Planea visitar todos los estados de la República Mexi- Revisa tu CD-ROM para encontrar más problemas.
cana.
Capítulo 3
Funciones de distribución
de variables aleatorias
discretas
En esta fotografía se muestra el trabajo que se
realiza en un laboratorio de análisis clínicos. En
este ambiente se obtiene un gran número de re-
sultados aleatorios, entre los que se encuentran
el tipo y el número de análisis solicitados, que pue-
den ser: análisis de sangre, de orina y para descu-
brir hepatitis, embarazo o sida, etc. Existen otros
resultados aleatorios menos evidentes, como el
número de falsos positivos o falsos negativos que
pueden presentarse.
En un laboratorio clínico es importante cuan-
tificar los resultados, tales como el número de so-
licitantes de servicios en el laboratorio de análisis
clínico, el número de falsos positivos que puede
haber en un día, el número de análisis que se pue-
den procesar en una hora, etc. Si en este tipo de
empresa se conoce la probabilidad de que se ten-
ga una demanda de x o de y análisis, se podrá pla-
near con mejores resultados los insumos que hay
que comprar y tener en el inventario, y el número
(Jupiter Images Corporation)
Introducción
En este capítulo se estudiarán las variables aleatorias que modelan alguna característica numérica discreta de
los experimentos aleatorios. El propósito del capítulo es que los estudiantes identifiquen las características
que definen a los diferentes modelos de probabilidad y así poder seleccionar el que corresponda al problema
o proceso que está estudiando.
76 | Estadística para ingeniería y ciencias
A la función que asocia un número real a cada elemento del espacio muestral se le llama variable alea-
toria, y se denota en general con las últimas letras mayúsculas del alfabeto. En este ejemplo, se llamará X a
la variable aleatoria:
X: S → R
Los valores que puede tomar la variable aleatoria son X 5 0, 1, 2 y 3, y la probabilidad asociada con cada
uno de estos valores está relacionada con la probabilidad del evento que se asocia a esos valores:
1 3 4 7
P(X 5 0) 5 P({(sss)}) 5
8 8 8 8
1 3 4 7
P(X 5 1) 5 P({(ssa), (sas), (ass)}) 5
8 8 8 8
1 3 4 7
P(X 5 2) 5 P({(saa), (asa), (aas)}) 5
8 8 8 8
1 3 4 7
P(X 5 3) 5 P({(aaa)}) 5
8 8 8 8
Definición 3.1. Una variable aleatoria es una función medible cuyo dominio es el espacio muestral
y cuyo codominio es igual a los números reales.
Esta función se llama variable porque puede tomar diferentes valores, y se llama también aleato-
ria porque los valores que toma son al azar, y es medible porque se le puede calcular su probabilidad
(la idea de medible tiene un significado relacionado con el concepto de espacio de probabilidad y
sigmas álgebras, cuyo estudio formal sale del alcance de este texto).
Definición 3.2. Una variable aleatoria discreta es aquella cuyo rango de posibles valores es finito o
infinito, pero numerable.
Ejemplo 3.1. El número de hijos que puede tener una familia es una variable aleatoria discreta.
Ejemplo 3.2. El número de artículos que se deben inspeccionar en un lote de una producción deter-
minada antes de encontrar el primer artículo defectuoso es una variable aleatoria.
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 77
Definición 3.3. El rango o recorrido de una variable aleatoria es el conjunto de valores que
puede tomar la variable con probabilidad positiva.
La función de densidad siempre se denota con una letra minúscula, en este caso se usó f, pero
se puede utilizar g o h, etc. Se debe puntualizar que en la probabilidad es muy importante el uso de
las letras mayúsculas y minúsculas, pues el significado cambia. En esta expresión, la X mayúscula
corresponde al nombre de la variable aleatoria, la x minúscula corresponde al valor que puede tomar
la variable aleatoria, en este sentido se puede escribir en lugar de x cualquier número, pero X siempre
es igual: f (3) 5 P(X 5 3), f (5) 5 P(X 5 5), etcétera.
Dado que la función de densidad representa la probabilidad de un evento, entonces satisface las
propiedades de la probabilidad.
b) ∑ f ( x) 51
x
Definición 3.5. Se llama función de distribución de la variable aleatoria X a la función que indi-
ca su probabilidad acumulada y se denota con la misma letra que representa la función de densidad,
pero en mayúsculas.
78 | Estadística para ingeniería y ciencias
F ( x) 5 P( X # x) 5 ∑ f (i ) (3.2)
i#x
d) lím F ( x)51
xqh
Ejemplo 3.4. Sea X la variable que indica el número de águilas al lanzar tres veces una moneda no
cargada, escriba la función de densidad y la función de distribución acumulada de X.
Solución:
El espacio muestral de este experimento es:
S 5 {(sss), (ssa), (sas), (ass), (saa), (asa), (aas), (aaa)}
y el recorrido de la variable aleatoria que indica el número de águilas es X 5 0, 1, 2, 3;
como este espacio muestral es equiprobable, la función de densidad de X es:
1 3 4 7 1 3 4 7
a) f (0) 5 d) f (3) 5
8 8 8 8 8 8 8 8
1 3 4 7
b) f (1) 5 e) f (x) 5 0 en cualquier otro valor de x
8 8 8 8
1 3 4 7
c) f (2) 5
8 8 8 8
La función de distribución de X es:
¯0 si x , 0
²
²1 si 0 # x , 1
²8
²² 4
F ( x)5 ° si 1 # x , 2
²8
²7
²8 si 2 # x , 3
²
²± 1 si 3 # x
Las gráficas de f (x) y de F(x) de la variable aleatoria en este ejemplo son las siguientes:
Función de densidad
Función de X de X
de densidad Función de distribución
Función de X de X
de distribución
0.4 0.4 1.2 1.2
0.35 0.35 1 1
0.3 0.3
0.8 0.8
Probabilidad
Probabilidad
Probabilidad
Probabilidad
0.25 0.25
0.6 0.6
0.2 0.2
0.15 0.15 0.4 0.4
0.1 0.1
0.2 0.2
0.05 0.05
0 0 0
0
21 21 0 0 1 1 2 2 3 3 4 4 21 21 0 0 1 1 2 2 3 3 4 4
RangoRango
de X de X RangoRango
de X de X
Figura 3.1.
P(3 # X # 8) 5 P( X 5 3) 1 P( X 5 4) 1 P( X 5 5) 1 P( X 5 6) 1 P( X 5 7) 1 P( X 5 8)
P(3 # X # 8) 5 P( X # 8) 2 P( X # 2)
5 F (8) 2 F (2)
Con la función de densidad el cálculo de la probabilidad siempre se hace con la suma de los diferentes
valores que están entre 3 y 8, con la función de distribución el cálculo se hace con la diferencia de la probabili-
dad acumulada hasta el máximo valor a calcular menos el mínimo valor a calcular menos uno, en el ejemplo
8 y 2.
Ejemplo 3.5. Si X es la variable aleatoria con función de densidad f (x) = cx, para x 5 1, 2, 3, 4. ¿Cuál
es el valor de c?
Solución:
Como f (x) es función de densidad, se deben satisfacer las dos condiciones:
a) f ( x)$ 0 para todo real x.
b) ∑ f ( x) 51 .
x
80 | Estadística para ingeniería y ciencias
La primera condición implica que c debe ser positiva; la segunda condición dice que la
suma de la función de densidad sobre los cuatro valores que puede tomar X debe ser
igual a 1, entonces:
c (1) 1 c (2) 1 c (3) 1 c (4) 5 c (10) 5 1
F ( x, y) 5 P( X # x, Y # x) (3.4)
Ejemplo 3.6. Considerar el vector aleatorio (X, Y) cuya función de densidad conjunta está dada en
la tabla 3.1:
Tabla 3.1.
X
1 2 3 4 5
1 0.03 0.08 0.10 0.06 0.02
Y 2 0.05 0.12 0.15 0.14 0.04
3 0.02 0.05 0.08 0.04 0.02
Así, para los diferentes valores de (x, y), la función f (x, y), se encuentra en la columnas
x y el renglón y correspondiente; de esta manera se tiene que f (1, 1) 5 0.03, f (4, 2) 5
0.14, etcétera.
Ejemplo 3.7. Considerar la función de densidad del ejemplo anterior para encontrar la probabilidad
de que X sea igual a 2.
Solución:
Hay tres posibilidades para que X sea igual a 2, (2, 1), (2, 2) y (2, 3), entonces
P(X 5 2) 5 f (2, 1) 1 f (2, 2) 1 f (2, 3) 5 0.08 1 0.12 1 0.05 5 0.25
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 81
Cuando se quiere obtener la probabilidad de una de las dos variables que son coorde-
nadas del vector aleatorio, se realiza una suma sobre la otra variable, como se indica
en las dos definiciones siguientes.
fX ( x) 5 P( X 5 x) 5 ∑ f ( x, y) (3.5)
y
y la función de densidad marginal de Y está dada por:
fY ( y) 5 P(Y 5 y) 5 ∑ f ( x, y) (3.6)
x
A estas funciones se les llama marginales porque en la tabla de la función de densidad conjunta
el valor de las probabilidades para las variables X y Y, fX y fY se encuentra sumando los valores en las
columnas y en los renglones y se registra el resultado en el margen de la tabla.
Ejemplo 3.8. Dada la tabla 3.1 del ejemplo 3.6, encontrar las funciones de densidad marginales de
X y Y.
Solución:
Para hallar las funciones de densidad marginales de X y Y se suman en la tabla los
valores que están en la misma columna y los que se encuentran en el mismo renglón,
quedando así:
Tabla 3.2.
X
1 2 3 4 5 Suma
1 0.03 0.08 0.10 0.06 0.02 0.29
Y 2 0.05 0.12 0.15 0.14 0.04 0.50
3 0.02 0.05 0.08 0.04 0.02 0.21
Suma 0.10 0.25 0.33 0.24 0.08 1.00
fX (1) 5 0.10, fX (2) 5 0.25, fX (3) 5 0.33, fX (4) 5 0.24, fX (5) 5 0.08
¯ f ( x, y)
² si fY ( y) | 0
fX |Y ( x | y) 5 ° fY ( y) (3.7)
² 0 si fY ( y) 5 0
±
De esta definición se obtiene lo siguiente f (x, y) 5 fX |Y ( x | Y
y) .
fX |Y ( x | y) 5 fX ( x) o f ( x, y) 5 fX ( x) fY ( y) (3.8)
Observe que estas definiciones son semejantes a las definiciones de probabilidad condicional y even-
tos independientes citadas en el capítulo 2.
Ejemplo 3.9. Dada la tabla del ejemplo 3.6, encontrar las funciones de densidad condicionales.
a) fX |Y ( x | 3)
b) fY|X ( y | 2)
Solución:
Para hallar la función de densidad condicional de X dado que Y 5 3, se usa la fórmula
f ( x, 3)
fX |Y ( x | 3) 5 , los valores que se utilizan son cuando Y 5 3 y se encuentran som-
fY (3)
breados en la tabla 3.3:
Tabla 3.3.
X
1 2 3 4 5 Suma
1 0.03 0.08 0.10 0.06 0.02 0.29
Y 2 0.05 0.12 0.15 0.14 0.04 0.50
3 0.02 0.05 0.08 0.04 0.02 0.21
Suma 0.10 0.25 0.33 0.24 0.08 1.00
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 83
f (5, 3) 0.02
fX |Y (5 | 3) 5 5 5 0.0952
fY (3) 0.21
Tabla 3.4.
X
1 2 3 4 5 Suma
1 0.03 0.08 0.10 0.06 0.02 0.29
Y 2 0.05 0.12 0.15 0.14 0.04 0.50
3 0.02 0.05 0.08 0.04 0.02 0.21
Suma 0.10 0.25 0.33 0.24 0.08 1.00
f (2, 3) 0.05
fY |X (3 | 2) 5 5 5 0.20
fX (2) 0.25
Ejemplo 3.10. Dada la tabla del ejemplo 3.6, analizar si las variables X y Y son o no independientes.
Demostración:
Si X y Y son independientes, se debe satisfacer que fX |Y ( x | y) 5 fX ( x) para todos los
valores de X y Y.
Como del ejercicio anterior se tiene que:
f (1, 3) 0.02
fX |Y (1 | 3) 5 5 5 0.0952 ≠ fX (1) 5 0.10
fY (3) 0.21
Definición 3.11. La moda de una variable aleatoria X es el valor que tiene mayor probabilidad; es
decir, si Mo es la moda de X, entonces P(X 5 Mo) $ P(X 5 x) para toda x.
Cuando se dibuja la gráfica de la función de densidad, la moda corresponde al valor de X cuya probabi-
lidad tiene mayor altura.
Ejemplo 3.11. C
onsiderar la variable aleatoria X que indica el número de hijos que decide tener una
familia. La función de densidad de X se encuentra en la siguiente tabla:
X 0 1 2 3 4 5
F(x) 0.03 0.17 0.31 0.25 0.19 0.05
Esto significa que es más probable que una familia decida tener 2 hijos a que decida
tener 0 hijos, etc. Encontrar la moda y la mediana de esta variable aleatoria.
Solución: 0.35
Figura 3.2.
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 85
X 1 2 3 4 5 6
Frecuencia observada 12 9 8 9 15 7
Si se lanzara de nuevo el dado 60 veces, los resultados observados podrían cambiar y en consecuencia la
media calculada tomaría otro valor.
Por otro lado, si en lugar de lanzar el dado 60 veces considera lo que indica la probabilidad: cada cara del
dado tiene la misma probabilidad de aparecer, en este caso teóricamente se esperaría que cada cara del dado
apareciera de manera exacta 10 veces.
X 1 2 3 4 5 6
Frecuencia esperada 10 10 10 10 10 10
Los valores de la tabla son independientes de los resultados que pudieran observarse en un experimento,
éste es en esencia el concepto de esperanza matemática de una variable aleatoria, cuya definición formal se
establece en seguida.
Definición 3.13. Dada X una variable aleatoria con función de densidad igual a f (x), se conoce como
valor esperado o esperanza matemática de X, al resultado de la expresión:
E( X ) 5 ∑ xf ( x) (3.10)
x
Este valor corresponde a la media aritmética que en teoría tiene la variable X. Entonces, el valor
esperado de X se denota con la letra griega µ, y corresponde a la media de X.
E(X) 5 µ (3.11)
86 | Estadística para ingeniería y ciencias
Ejemplo 3.12. Para el caso de la tirada de un dado, X puede tomar los valores 1, 2, 3, 4, 5 y 6, con
1 21
probabilidad igual a , así la media de esta variable es:
6 6
1 21 1 21 1 21 1 21 1 21 1 121 21
E(X) 5 1( ) 1 2( ) 1 3( ) 1 4( ) 1 5( ) 1 6( ) 5 5 3.5
6 6 6 6 6 6 6 6 6 6 6 66 6
Este valor corresponde a la media esperada de la variable aleatoria y coincide con el
valor obtenido antes en el ejemplo de introducción.
Definición 3.14. Si X es una variable aleatoria con función de densidad f (x), y g es cualquier función,
entonces el valor esperado de g(X) es igual a:
E( g ( X )) 5 ∑ g ( x) f ( x) (3.12)
x
Definición 3.15. Si X y Y son variables aleatorias con función de densidad conjunta igual a f (x, y),
entonces el valor esperado de g(X, Y ) es igual a:
E( g ( X , Y )) 5 ∑ g ( x, y) f ( x, y) (3.13)
x
En todos los casos, el valor esperado corresponde a la media aritmética teórica de la variable aleatoria
que se esté considerando.
Teorema 3.1. (Propiedades del valor esperado de X ) Sea X y Y dos variables aleatorias y c una
constante, entonces se satisfacen las relaciones:
a) E(c) 5 c
b) E(cX ) 5 cE(X )
c) E(X 1 Y ) 5 E(X ) 1 E(Y )
d) E(XY) 5 E(X)E(Y) cuando las variables aleatorias son independientes
Demostración:
E( g ( X )) 5 ∑ cf ( x) 5 c∑ f ( x) 5 c
x x
E( X 1Y ) 5 E( g ( X , Y )) 5 ∑ ∑ ( x 1 y) f ( x, y) 5 ∑ ∑ xf ( x, y) 1 ∑ ∑ yf ( x, y)
x y x y x y
5 ∑ ∑ xf ( x, y) 1 ∑ ∑ yf ( x, y) 5 ∑ x∑ f ( x, y) 1 ∑ y∑ f ( x, y)
x y x y x y y x
Teorema 3.2. La varianza de la variable aleatoria X se puede calcular con la fórmula equivalente:
5 ∑ ( x 2 2 2 xE( X ) 1(E( X )2 ) f ( x)
x
5 ∑ x 2 f ( x) 2 2 E( X )∑ xf ( x) 1(E( X ))2 ∑ f ( x)
x x x
5 ∑ x 2 f ( x) 2(E( X ))2
x
88 | Estadística para ingeniería y ciencias
Ejemplo 3.13. La variable aleatoria que describe la demanda de servicio en un servicio de lavado de
autos tiene la función de probabilidad reportada en la tabla,
X 0 1 2 3 4 5 6 7
f (x) 0.05 0.10 0.13 0.18 0.23 0.17 0.11 0.03
Solución:
La media es:
E( X ) 5 0(0.05) 11(0.10) 1 2(0.13) 1 3(0.18) 1 4(0.23)) 1 5(0.17) 1 6(0.11) 1 7(0.03) 5 3.54
E( X ) 5 0(0.05) 11(0.10) 1 2(0.13) 1 3(0.18) 1 4(0.23)) 1 5(0.17) 1 6(0.11) 1 7(0.03) 5 3.54
X 2 ) 5 0 2 (0.05) 112 (0.10) 1 2 2 (0.13) 1 32 (0.18) 1 4 2 (0.23) 1 52 (0.17) 1 6 2 (0.11) 1 72 (0.03) 5 15.6
y, finalmente,
V(X) 5 E(X2) 2 (E(X))2 5 15.6 2 3.542 5 3.0684
3.3.3 Covarianza
La covarianza de dos variables aleatorias indica la asociación promedio entre dos variables y su definición
formal es la siguiente.
Para facilitar los cálculos de la covarianza se tiene una fórmula equivalente en el siguiente teorema.
Teorema 3.4. La covarianza de dos variables aleatorias se puede calcular también con la fórmula
equivalente:
Cov( X , Y ) 5 E( XY ) 2 E( X )E(Y ) 5 ∑ ∑ xyf ( x, y) 2 E( X )E(Y ) (3.17)
x y
Demostración:
Cov( X , Y ) 5 E( X 2 E( X ))(Y 2 E(Y )) 5 E( XY 2 XE(Y ) 2YE( X ) 1 E( X )E(Y ))
5 E( XY ) 2 E( XE(Y )) 2 E(YE( X )) 1 E(E( X )E(Y )) se separan las sumas
Ejemplo 3.14. Sean X y Y variables aleatorias con función de densidad conjunta dada en la siguiente
tabla, encuentra la covarianza de X y Y.
Tabla 3.5.
X
1 2 3 4 5 Suma
1 0.03 0.08 0.10 0.06 0.02 0.29
Y 2 0.05 0.12 0.15 0.14 0.04 0.50
3 0.02 0.05 0.08 0.04 0.02 0.21
Suma 0.10 0.25 0.33 0.24 0.08 1.00
Solución:
Para calcular la covarianza se utiliza la segunda fórmula. Primero se obtienen las
medias de X y Y y el valor esperado de XY:
90 | Estadística para ingeniería y ciencias
E(X ) 5 1× (0.10) 1 2×× (0.25) 1 3× ×(0.33) 1 4×× (0.24) 1 5×× (0.08) 5 5(0.08) 5 2.95
E(Y ) 5 1× (×0.29) 1 2×× (0.50) 1 3×× (0.21) 5 1.92
E(XY ) 5 1× 3 ×1× 3 ×0.03 1 1×× 3 2× 3 ×0.08 1 1×× 3 3× 3 ×0.10 1 1×× 3 4×× 3 0.06 1 1×× 3 5× 3
×0.02 1 2×× 3 1×× 3 0.05 1 2×× 3 2× 3 ×0.12 1 2× 3 ×3 3 0.15 1 2×× 3 4× 3 ×0.14 1 2××
3 5×× 3 0.04 1 3 3 1× 3 ×0.02 1 3×× 3 2×× 3 0.05 1 3 3 3 3 0.08 1 3 3 4×× 3
0.04 1 3 3 5×× 3 0.02 5 5.69
Cov (X, Y ) 5 5.69 2− 2.95× 3 ×1.92 5 0.026
5 ∑ ( x 2 E( X )) fX ( x)∑ ( y 2 E(Y )) fY ( y)
x y
La primera de las propiedades de la covarianza hace suponer que con ella se puede determinar el grado
de asociación de las dos variables; si las variables son independientes no hay asociación entre ellas, ¿cómo se
determina cuando hay la máxima asociación? y ¿qué tipo de asociación indica la covarianza?
Con el coeficiente de correlación se determina que tipo de asociación entre X y Y considera la covarianza.
Corolario 1. Dadas X y Y variables aleatorias se tiene que rxy 5 61 si y sólo si X = aY + b, con a y
b constantes.
Demostración:
E[(Z1 6 Z2)2] 5 0 si y sólo si Z1 = 6Z2, entonces (X 2 µx)/σx 5 6(Y 2 µy)/σy y al despejar de esta
ecuación la variable X, se obtiene:
σx σx
X 56 Y7 µ y 1µ x
σy σy
a b
Definición 3.19. Se conocen como momentos de orden i de la variable aleatoria X al valor esperado
de la potencia i-ésima de X, y se denota como Mi; esto es Mi 5 E( X i ) ; para i 5 1, 2, 3, ...
Definición 3.20. Dada X variable aleatoria con función de densidad f (x), se llama función genera-
triz de momentos a MX(t) 5 E(eXt).
La función generatriz de momentos corresponde a una serie de potencias de t, cuyos coeficientes son los
momentos de orden i.
t 2 E( X 2 ) t 3 E( X 3 ) t 4 E( X 4 )
MX (t ) 5 E(etX ) 5 1 1 tE( X ) 1 1 1 1. . . (3.20)
2! 3! 4!
Dada la función generatriz de momentos, se pueden obtener los momentos de orden i, derivan esta fun-
ción y evaluando t 5 0, como se indica en el siguiente teorema.
dk
M X (t ) 5 E ( X k ) (3.21)
dt k t 50
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 93
Demostración:
k 12
dk k k 11 2 E( X )
M X
( t ) 5 E ( X ) 1 tE ( X ) 1 t 1. . . 5 E( X k )
dt k
t 50
2 ! t 50
El siguiente teorema indica la principal propiedad de la función generatriz de momentos, pues aplican-
do este resultado se puede caracterizar la función de distribución acumulada de la variable aleatoria.
Solución:
1 21 1 21 1 21 1 21 1 21 1 21
E(eXt) 5 et( ) 1 e2t( ) 1 e3t( ) 1 e4t( ) 1 e5t( ) 1 e6t( ) 5(et 2 e7t)/6(1 2 et)
6 6 6 6 6 6 6 6 6 6 6 6
Definición 3.21. Un experimento uniforme discreto tiene n posibles valores que pueden ser observa-
dos con igual probabilidad. La función de densidad uniforme discreta es:
¯1
² si x 51, 2, 3, . . . , n
f ( x) 5 ° n (3.22)
² 0 en otro caso
±
El ejemplo más conocido de variable aleatoria uniforme es el relacionado con la tirada de un dado
no cargado.
Otro ejemplo es el de una lotería con n boletos numerados del 1 al n, con un solo premio y eligiendo el
boleto premiado con un proceso en que todos los números tienen igual probabilidad.
Teorema 3.9. Sea X una variable aleatoria uniforme con parámetro n, entonces la media, la varianza
y la función generatriz de momentos son:
94 | Estadística para ingeniería y ciencias
a) µ 5 (n 1 1)/2;
b) σ2 5 [n2 2 1]/12
c) MX(t) 5 et (ent 2 1)/n(et 2 1)
Demostración:
Para encontrar la media y la varianza se utilizan las fórmulas de la suma de los primeros n enteros
positivos y la suma de los primeros n enteros positivos al cuadrado; estas fórmulas se citan al princi-
pio del este libro.
a) µ 5 E(X ) 5 1(1/n) 1 2(1/n) 1 ... 1 n(1/n) 5 (1 1 2 1 3 1 ... 1 n)/n 5 (n 1 1)n/2n 5 (n 1 1)/2
b) Para la varianza primero se encuentra E(X2):
E(X 2) 5 12(1/n) 1 22(1/n) 1 . . . 1 n2 (1/n) 5 (12 1 22 1 32 1 . . . 1 n2)/n 5 n (n 1 1) (2n 1 1)/
6n 5 (n 1 1)(2n 1 1)/6
Entonces:
σ2 5 (n 1 1)(2n 1 1)/6 2 (n 1 1) 2/4
5 [2(2n2 1 3n 1 1) 2 3(n2 1 2n 1 1)]/12
5 [4n2 1 6n 1 2 2 3n2 2 6n 2 3]/12
5 [n2 21]/12
b) Para la función generatriz de momentos se tiene que MX(t) 5 E(e tX ) 5 e t(1/n) 1 e 2t (1/n) 1 . . . 1
e nt (1/n)
5 (e t 1 e 2t 1 . . . 1 e nt)/n
5 e t (e nt 2 1)/ n(e t 2 1)
Tabla 3.6.
Definición 3.22. Cualquier experimento que tiene dos posibles resultados se llama experimento Ber-
noulli.
Tabla 3.7.
Experimento Resultados
Volados Águila Sol
Nacimientos Niño Niña
Análisis clínico Positivo Negativo
Control de calidad Defectuoso Bueno
Toma de decisiones De acuerdo En desacuerdo
Para caracterizar a los experimentos Bernoulli en un solo modelo, a uno de los resultados se denota
como éxito y al otro como fracaso; dicha asignación de los resultados del experimento es arbitraria.
Definición 3.23. La variable que asigna 1 al éxito y 0 al fracaso se llama variable aleatoria Bernoulli.
Éxito → 1 Fracaso → 0
Por convención a la probabilidad de que ocurra éxito en un experimento Bernoulli se le denota con
la letra p y de que ocurra un fracaso se denota con la letra q.
f (0) 5 P(X 5 0) 5 q, f (1) 5 P(X 5 1) 5 p
y por la segunda propiedad de la funciones de densidad se obtiene que p 1 q 5 1.
µ 5 p y σ2 5 p(1 2 p) 5 pq (3.23)
Demostración:
La media de la variable es el valor esperado de X, siguiendo la fórmula se tiene que
MX(t ) 5 1 2 p 1 pe t (3.24)
Demostración:
MX(t ) 5 E(e tX) 5 e 0tf (0) 1 e1tf (1) 5 1 2 p 1 pe t
96 | Estadística para ingeniería y ciencias
Tabla 3.8.
f (0) 5 1 2 p 5 q
Función de densidad
f (1) 5 p
Media µ5p
Varianza σ2 5 pq
Función generatriz de momentos MX(t ) 5 1 2 p 1 pe t
Definición 3.24. La variable que indica el número de éxitos en n experimentos Bernoulli iguales e
independientes se llama variable aleatoria binomial.
Los experimentos Bernoulli son iguales cuando la probabilidad de éxito es la misma, y son independientes
si la función de densidad conjunta es igual al producto de las densidades marginales. Por ejemplo:
Si se lanzan 20 veces una moneda y X indica el número de águilas observadas en este experimento, X es
una variable aleatoria binomial, porque es la misma moneda que se lanza y porque el resultado en un volado
es independiente de los resultados de los otros volados.
Si se inspeccionan 30 artículos en una línea de ensamblaje y X indica el número de artículos defectuosos
encontrados, X es una variable aleatoria binomial, porque los artículos fueron fabricados con el mismo proce-
dimiento y el que un artículo sea defectuoso es independiente de que otro artículo lo sea.
Si en un matrimonio con 5 hijos, X indica el número de hijos varones, entonces X es una variable aleatoria
binomial.
El recorrido de la variable aleatoria binomial va de 0 a n.
Teorema 3.12. Sea X una variable aleatoria binomial con parámetros n y p, su función de densi-
dad es:
¯² C p x q n2x si x 5 0, 1, . . . , n
f ( x) 5 ° n x (3.25)
²± 0 en otro caso
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 97
Demostración:
Se hará para el caso particular n 5 7 y k 5 3. Esto es, cuando se realizan siete experimentos Bernoulli
iguales e independientes y se quieren observar tres éxitos. Ésta no es una demostración formal, pero
da una idea de cómo efectuar la demostración en general.
Suponga que Xi es la variable aleatoria del i-ésimo experimento Bernoulli, esto es, Xi 5 0 si en
el i-ésimo experimento Bernoulli ocurre un fracaso y Xi 5 1 cuando en ese experimento ocurre un
éxito.
Alguna de las diferentes formas de tener tres éxitos en los siete experimentos Bernoulli, son:
X1 5 1, X2 5 1, X3 5 1, X4 5 0, X5 5 0, X6 5 0, X7 5 0
X1 5 1, X2 5 1, X3 5 0, X4 5 1, X5 5 0, X6 5 0, X7 5 0
X1 5 1, X2 5 1, X3 5 0, X4 5 0, X5 5 1, X6 5 0, X7 5 0
X1 5 1, X2 5 1, X3 5 0, X4 5 0, X5 5 0, X6 5 1, X7 5 0
X1 5 1, X2 5 1, X3 5 0, X4 5 0, X5 5 0, X6 5 0, X7 5 1
X1 5 1, X2 5 0, X3 5 1, X4 5 1, X5 5 0, X6 5 0, X7 5 0
X1 5 1, X2 5 0, X3 5 1, X4 5 0, X5 5 1, X6 5 0, X7 5 0
X1 5 1, X2 5 0, X3 5 1, X4 5 0, X5 5 0, X6 5 1, X7 5 0
X1 5 1, X2 5 0, X3 5 1, X4 5 0, X5 5 0, X6 5 0, X7 5 1
X1 5 0, X2 5 1, X3 5 1, X4 5 1, X5 5 0, X6 5 0, X7 5 0
X1 5 0, X2 5 1, X3 5 1, X4 5 0, X5 5 1, X6 5 0, X7 5 0
Aquí se muestran 11 formas de obtener tres éxitos en siete experimentos Bernoulli. El total de
formas es igual al número de subconjuntos de tres elementos del total de siete, es decir, hay
7
C3 5 7!/3!4! 5 35
diferentes formas de obtener tres éxitos en siete experimentos. Cada una de estas formas tiene la mis-
ma probabilidad y por ser las variables Bernoulli independientes, se tiene que:
P(X1 5 1, X2 5 1, X3 5 1, X4 5 0, X5 5 0, X6 5 0, X7 5 0)
5 P(X1 5 1)P(X2 5 1)P(X3 5 1)P(X4 5 0)P(X5 5 0)P(X6 5 0)P(X7 5 0)
5 pppqqqq 5 p3q4
La probabilidad de tener tres éxitos en los siete experimentos Bernoulli es igual al número de for-
mas que dan tres éxitos, multiplicados por la probabilidad de cada una de estas maneras, por lo que
P(X 5 3) 5 35 p3q4
De las 11 formas listadas antes de obtener tres éxitos en los siete experimentos se puede ver que
el número de éxitos es igual a la suma de las variables Bernoulli individuales, esto es:
X 5 X1 1 X2 1 X3 1 X4 1 X5 1 X6 1 X7
98 | Estadística para ingeniería y ciencias
Este resultado siempre es cierto: para cualquier n la variable binomial es igual a la suma de n
variables aleatorias Bernoulli iguales e independientes.
Teorema 3.13. Si X es una variable aleatoria binomial con parámetros n y p, entonces existen n va-
riables Bernoulli iguales e independientes Xi, tales que:
X 5 X1 1 X2 1 X3 1 . . . 1 Xn (3.26)
Demostración:
La demostración es directa, basta recordar que una variable Bernoulli toma el valor de 0 cuando ocu-
rre un fracaso y toma el valor de 1 cuando ocurre un éxito, por tanto, esta suma es igual al número de
unos en ella y esto equivale al número de éxitos en los n experimentos Bernoulli.
Teorema 3.14. Si X es una variable aleatoria binomial con parámetros n y p, entonces su media es
µ 5 np y su varianza es σ2 5 npq.
Demostración:
Si X es variable aleatoria binomial, entonces existen X1, X2, X3, X4, X5, . . . , Xn variables aleatorias
Bernoulli iguales e independientes, tales que:
X 5 X1 1 X2 1 X3 1 X4 1 X5 1 X6 1 . . . 1 Xn
Entonces, por las propiedades del valor esperado y de la varianza se obtiene:
a) µ 5 E(X ) 5 E(X1 1 X2 1 X3 1 X4 1 X5 1 X6 1 . . . 1 Xn)
5 E(X1) 1 E(X2) 1 E(X3) 1 E(X4) 1 E(X5) 1 E(X6) 1 . . . 1 E(Xn)
5p1p1p1...1p
5 np
b) σ2 5 V(X) 5 V(X1 1 X2 1 X3 1 X4 1 X5 1 X6 1 . . . 1 Xn) por ser variables aleatorias indepen-
dientes
5 V(X1) 1 V(X2) 1 V(X3) 1 V(X4) 1 V(X5) 1 V(X6) 1 . . . 1 V(Xn)
5 pq 1 pq 1 pq 1 . . . 1 pq
5 npq
Teorema 3.15. Si X es una variable aleatoria binomial con parámetros n y p, entonces su función
generatriz de momentos es MX(t ) 5 (1 2 p 1 pe t )n.
Demostración:
El desarrollo de un binomio elevado a la n es igual a:
n
(a 1 b)n 5 ∑ n Ck a k bn2k (3.27)
0
Entonces, la función generatriz de momentos de la variable aleatoria binomial es:
n n n
MX (t ) 5 E(etX ) 5 ∑ etx f ( x) 5 ∑ n C x etx p x q n2x 5 ∑ n C x (et p) x q n2x (3.28)
0 0 0
esta última expresión es el desarrollo de un binomio a la n, por lo que:
Tabla 3.9.
Resumen Variable aleatoria b�������
inomial
f (x ) 5 nCx pxqn2x
Función de densidad
f (x ) 5 0 en otro caso
Media µ 5 np
Varianza σ2 5 npq
Función generatriz de momentos MX(t ) 5 (1 2 p 1 pe t )n
0.4
0.35
de éxitos
0.4 0.25
de éxitos
0.45
0.45
0.35 0.3 0.35
0.35
de éxitos
0.35
de éxitos
0.20.25
0.25
de éxitos
0.25
0.4 0.4
de éxitos
0.3
0.25
0.3 0.2
0.30.3
0.2
0.35 0.15
Número
0.2
éxitos
0.35
de éxitos
0.25 0.2
0.25 0.2
0.15
Número
0.25
Número
éxitos
0.25
de éxitos
0.15
0.3
Número
0.2 0.3
0.15 0.10.15
0.15
Número
0.2
Número
0.1 0.1
0.20.2
Número
0.25
0.25
Número
de
0.15 0.1
0.15 0.05
0.1
de
0.05
0.2 0.2 0.15 0.1
0.05
Número
0.1 0.15
Número
0.05
0.1
Número
Número
0
0.15
0.15 0 0
0.05
0.05
0.050 0.10.05
0.1
0.1
00.100 01 12 23 34 45 56 67 78 89 9 10 10 0 00 01 12 23 34 45 56 67 78 89 9
0.05
0.05
10 10
0.05
0.050 1 2 3 Probabilidad 0 01 12 23 Probabilidad
0 1 2 34 Probabilidad
45 5 6 67 78 8 9 10
9 10 34 Probabilidad
45 5 6 67 78 8 9 10
9 10
0 0 0 0
Probabilidad Probabilidad
0 01 12 23 34 Probabilidad
45 56 67 78 89 9 10 10 0 01 12 23 34 Probabilidad
45 56 67 78 89 9 10 10
Probabilidad
Probabilidad Probabilidad
Probabilidad
n 5n10; p 5p0.30; media 5 3,5varianza 5 2.1 n 5 10; p 5 0.50; media 5 5, varianza 5 2.5
5 10; 5 0.30; media 3, varianza 5 2.1 n 5 10; p 5 0.50; media 5 5, varianza 5 2.5
n 5n10;
0.30.3 p 5p0.30;
5 10; media
5 0.30; 5 3,5varianza
media 5 2.1
3, varianza 5 2.1 0.3 n 5n10; p 5p0.50;
5 10; media
5 0.50; 5 5,5varianza
media 5 2.5
5, varianza 5 2.5
0.3
0.3 0.3
0.25 0.3 0.3
0.25 n 5n10; p 5p0.50; media 5 5,5varianza 5 2.5
5 10; 5 0.50; media 5, varianza 5 2.5
de éxitos
de éxitos
de éxitos
0.25
0.2 0.25
0.2
0.30.25
de éxitos
de éxitos
0.30.25 0.3
de éxitos
de éxitos
0.3
0.2 0.2
0.2
0.15 0.2 0.2
0.15
0.25 0.2
0.25
0.25
0.25 0.15
Número
Número
éxitos
éxitos
de éxitos
de éxitos
0.15
Número
Número
0.15
0.10.15 0.15
0.10.15
0.20.2
Número
Número
Número
0.1
de
de
Número
0.05
Número
Número
0.05
00.05 0.05
00.05
0.1 0.1
0.1 0.1
0 0
0 00 01 12 23 34 45 56 67 78 89 10 0 0 1 2 3 4 5 6 7 8 9 10
0.05
0.05 9 10 0.050 0 1 2 3 4 5 6 7 8
0.05 9 10
0 01 12 23 Probabilidad
34 Probabilidad
45 5 6 67 78 89 10
9 10 0 01 12 23 Probabilidad
34 Probabilidad
45 5 6 67 78 8
9 10
9 10
0 0 0 0
0 01 12 23 Probabilidad
Probabilidad
3 4 5 6 7 89
4 5 6 7 8 10 10
9 0 01 12 23 Probabilidad
34 Probabilidad
45 56 67 78 89 10 10
9
Probabilidad
Probabilidad Probabilidad
Probabilidad
n 5n10; p 5p0.70; media 5 7,5varianza 5 2.1 n 5 10; p 5 0.90; media 5 9, varianza 5 0.9
5 10; 5 0.70; media 7, varianza 5 2.1 n 5 10; p 5 0.90; media 5 9, varianza 5 0.9
0.30.3n 5n10; p 5p0.70; media 5 7,5varianza 5 2.1 0.45 n 5n10; p 5p0.90;
5 10; media
5 0.90; 5 9,5varianza
media 5 0.9
9, varianza 5 0.9
5 10; 5 0.70; media 7, varianza 5 2.1 0.45
0.4
0.45
0.3 0.3 0.4
0.45
de éxitos
de éxitos
de éxitos
0.25 0.4
0.35
0.4
0.3
de éxitos
de éxitos
0.25 0.45
0.45
de éxitos
de éxitos
0.2
0.30.25
0.3
0.2 0.35 0.3
0.35
0.25
0.4
0.3 0.4
0.2
0.15 0.25
0.3
Número
Número
0.2
éxitos
éxitos
0.25
de éxitos
de éxitos
0.25
0.15 0.2
0.35
Número
Número
0.35
0.25 0.2
0.25
0.15 0.15
0.3
Número
Número
0.1
0.20.15 0.3
Número
Número
0.2
0.1 0.2
0.15
0.2
de
de
0.1
0.25
0.25
0.1 0.1 0.15 0.1
0.15
0.05
0.15
Número
Número
0.15 0.05
Número
Número
0.05 0.2
0.1 0.2
0.05
0.1
0.05
00.05
0.1 0
0.15
0.15
0.05
0.1
0 0.050
0.1 0.1
0 00 01 12 23 34 45 56 67 78 89 9 10
0 00 01 12 23 34 45 56 67 78 89
0.05
10
9 10 10
0.05 0.05
0.050 1 2 3 4 5 6 7 8 9 10
0 01 12 23 Probabilidad
34 Probabilidad
45 5 6 67 78 8
9 10
9 10 0 1 2 Probabilidad
3 Probabilidad
4 5 6 7 8 9 10
0 0 0 0
Probabilidad
Probabilidad
0 01 12 23 34 45 56 67 78 89 10 10
9 0 01 12 23 Probabilidad
34 Probabilidad
45 56 67 78 89 9 10 10
Figura 3.3. Probabilidad
Probabilidad
Probabilidad Probabilidad
100 | Estadística para ingeniería y ciencias
Como se puede ver, en todos los casos el valor más probable es cuando X toma el valor de la media, y la
mayor variación es cuando p 5 0.5.
Figura 3.5.
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 101
X Densidad Distribución
0 0.11602906 0.11602906
1 0.31238594 0.428415
2 0.33641563 0.76483063
3 0.18114688 0.9459775
4 0.04877031 0.99474781
5 0.00525219 1
Con el asistente de gráficas se pueden obtener las gráficas de las dos funciones de probabilidad. Siga las
instrucciones para obtenerlas.
1. Señale las celdas donde están los valores de la
función de densidad.
2. Haga clic en el icono del asistente de gráfica.
3. Elija el tipo de gráfica Columnas y haga clic en
Siguiente.
4. En la pantalla que aparece haga clic en Series y
ponga el cursor en la ventanilla de Rótulos del
eje de categorías (X ).
5. Luego coloque el cursor en la celda donde está
el 0 y arrastre el cursor hasta cubrir los datos
del 0 al 5. Haga clic en Siguiente.
6. Puede ponerle nombre a la gráfica, a los ejes y Figura 3.8.
termínela.
Haga lo mismo con los datos de la función de distribución acumulada. Las gráficas que obtendrá son las
siguientes.
102 | Estadística para ingeniería y ciencias
Función Función
de densidad
de densidad Función Función
de distribución
de distribución
0.4 0.4 1.2 1.2
0.35 0.35
1 1
0.3 0.3
0.8 0.8
0.25 0.25
0.2 0.2 0.6 0.6
0.15 0.15
0.4 0.4
0.1 0.1
0.2 0.2
0.05 0.05
0 0 0 0
0 10 2 1 32 4 3 5 4 5 0 1 0 21 32 4 3 5 4 5
NúmeroNúmero
de éxitosde éxitos NúmeroNúmero
de éxitosde éxitos
Figura 3.9.
También, para hacer gráficas con los valores de las probabilidades acumuladas y de la probabilidad de
densidad proceda de la siguiente manera:
1. Graph → Scatterplot
2. En la ventana Scatterplot-Simple introduzca las probabilidades acumuladas (en la ventanilla Y va-
riable). Asimismo, introduzca las probabilidades de densidad de masa (en la ventanilla Y variable).
Igualmente, introduzca los valores de la variable aleatoria X (en la ventanilla de x variables), para cada
uno de sus casos.
Ejemplo 3.16. Se utiliza Minitab en un estudio de higiene industrial y seguridad llevado a cabo en
muchas maquiladoras industriales, supóngase que hay una población grande com-
puesta de operadores de maquiladoras con dos características: tomadores de licor y
abstemios. Si se elige una persona al azar de esta población se considerará éxito si la
persona seleccionada es tomadora de licor y fracaso si es abstemio. La probabilidad
de obtener un éxito se supone igual a p 5 0.4 y la probabilidad de fracaso es q 5 0.6.
Si se saca una muestra al azar de n 5 11 operadores de la maquiladora:
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 103
a) Preparar una tabla mostrando las probabilidades con sus respectivos valores de X.
b) Preparar una gráfica con los valores obtenidos en el inciso a).
c) Calcular la media y la varianza de esta distribución.
d) Calcular la probabilidad de que el valor de X sea de cuando menos 5.
e) Calcular la probabilidad de que el valor de X esté entre 3 y 6 inclusivamente.
f ) Calcular la probabilidad de que el valor de X esté entre 3 y 6 exclusivamente.
g) Calcular la probabilidad de que el valor de X sea igual a 4.
Solución:
a) La variable que indica el número de éxitos en las 11 observaciones es binomial
con parámetros n 5 11 y p 5 0.4. La tabla siguiente muestra las funciones de
densidad y de distribución de esta variable aleatoria.
Tabla 3.11.
Variable aleatoria Función de distribución Función de densidad
binomial X P(X ≤ x) P(X = x)
0 0.003628 0.003628
1 0.030233 0.026605
2 0.118917 0.088684
3 0.296284 0.177367
4 0.532774 0.23649
5 0.753498 0.220724
6 0.900647 0.147149
7 0.970719 0.070071
8 0.994076 0.023357
9 0.999266 0.00519
10 0.999958 0.000692
11 1.000000 0.000042
Figura 3.10.
104 | Estadística para ingeniería y ciencias
3.6.4 Ejemplos
Usar el Minitab o Excel para comparar los resultados obtenidos.
n!
b( x; n, p) 5 p x (1 2 p)n2x
x!( n 2 x)!
a) b(3; 8, 0.6)
b) b(5; 8, 0.6)
c) P(3 # X # 5) cuando n 5 8 y p 5 0.6
d) P(1 # X ) cuando n 5 12 y p 5 0.1
e) b(x; 8, 0.6) donde x 5 0
Solución:
a) b(3; 8, 0.6) es la densidad binomial cuando X 5 3, n 5 8, p 5 0.6.
P(X 5 3) 5 8!/3!(8 2 3)! (0.6)3 (1 2 0.6)8−3
5 0.124
b) b(5; 8, 0.6) es la densidad binomial cuando X 5 5, n 5 8 y p 5 0.6.
P(X 5 5) 5 8C5 (0.6)5 (0.4)825 5 8!/5!(8 2 5)! (0.6)5 (0.4)3
5 (56) (0.078) (0.064)
5 0.279
c) P(3 # X # 5) es la suma de los valores de la densidad binomial en X 5 3, 4 y 5.
Por tanto: P(3 # X # 5) 5 b(3; 8, 0.6) 1 b(4; 8, 0.6) 1 b(5; 8, 0.6)
5 0.124 1 0.232 1 0.279
5 0.635
d) P(X $ 1) con n 5 12 y p 5 0.1. Se debe hacer el cálculo de b(x; 12, 0.1) para x 5 1,
2, 3, . . . , 12 y luego sumarlos, o se puede utilizar la fórmula vista en el capítulo 2:
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 105
P(Ac) 5 1 2 P(A),
es decir:
P(X $ 1) 5 1 2 P(X , 1) 5 1 2 P(X 5 0)
5 1 2 0.282
5 0.718
Solución:
a) B(4; 10, 0.3) en la tabla se buscan los valores para n 5 10, luego la columna para
p 5 0.3, y finalmente el renglón correspondiente a x 5 4; el valor que se obtiene
es: 0.8497.
Por tanto, P(X # 4) 5 B(4; 10, 0.3) 5 0.8497.
b) B(6; 10, 0.7) en la tabla se buscan los valores para n 5 10, luego la columna para
p 5 0.7 y finalmente el renglón correspondiente a x 5 6; el valor que resulta es:
0.3504.
Por tanto, P(X # 6) 5 B(6; 10, 0.3) 5 0.3504.
Ejemplo 3.19. Una moneda no cargada se lanza 6 veces (que es lo mismo que lanzar seis monedas a
la vez). Calcular las siguientes probabilidades:
a) La probabilidad de que salgan exactamente 2 soles.
b) La probabilidad de que salgan cuando menos 4 soles.
c) La probabilidad de tener 0 soles.
Solución:
Cada lanzamiento de la moneda es un experimento Bernoulli, por tanto, éxito corres-
ponde a que salga sol en el volado y los resultados de cada volado son independientes
y la moneda no está cargada, por lo que la variable que determina el número de soles
es una binomial con parámetros n 5 6 y p 5 0.5.
a) Entonces, la probabilidad de que salgan exactamente 2 soles es:
15 1
P(X 5 2) 5 b(2; 6, 0.5) 5 6C2 (0.5)2 (0.5)62−2 5
64 64
b) La probabilidad de que salgan cuando menos 4 soles (X $ 4) es:
P(X 5 4 o 5 o 6) 5 b(4; 6, 0.5) 1 b(5; 6, 0.5) 1 b(6; 6, 0.5)
5 6C4(0.5)4 (0.5)624 1 6C5 (0.5)5 (0.5)625 1 6C6 (0.5)6 (0.5)626
5 0.34375
15 1
c) La probabilidad de tener 0 soles es: P(X 5 0) 5 6C0 (0.5)0 (0.5)620 5 .
64 64
106 | Estadística para ingeniería y ciencias
Ejemplo 3.20. Por un estudio de toxicología se sabe que la probabilidad de que un enfermo se recu-
pere de una intoxicación es de 0.4. Si se tiene una muestra de 15 personas que se han
intoxicado, calcular las siguientes probabilidades:
a) La probabilidad de cuando menos 10 personas sobrevivan.
b) La probabilidad de que 3 de 8 personas (inclusivamente) intoxicadas sobrevivan.
c) La probabilidad de que exactamente 5 personas intoxicadas sobrevivan.
Solución:
Sea X el número de intoxicados que sobrevivan. Dado que cada persona intoxicada
puede recuperarse o no, cada persona corresponde a un experimento Bernoulli, y la
recuperación de cada una de las personas en la muestra es independiente, entonces X
es una variable aleatoria binomial con n 5 15 y p 5 0.4.
a) El término “cuando menos 10” equivale a X $ 10. Entonces, se utiliza la fórmula
de la probabilidad del complemento y se encuentra el valor en la tabla de la distri-
bución binomial:
P(X $ 10) 5 1 2 P(X # 9) 5 1 2 0.9662 5 0.0338
b) La probabilidad de que se recuperen entre 3 y 8 intoxicados, inclusivamente, equi-
vale a P(3 # X # 8). Se puede calcular usando la tabla de distribución binomial.
P(3 # X # 8) 5 P(X # 8) 2 P(X # 2)
5 0.9050 2 0.0271
5 0.8779
c) La probabilidad de que exactamente 5 intoxicados sobrevivan es:
P(X 5 5) 5 P(X # 5) 2 P(X # 4)
5 0.4032 2 0.2173
5 0.1859
Ejemplo 3.21. Si 20% de los tornillos producidos por una máquina están defectuosos, determinar la
probabilidad que de 4 tornillos seleccionados aleatoriamente:
a) Uno esté defectuoso.
b) Ninguno esté defectuoso.
c) A lo más 2 estén defectuosos.
d) Cuando menos uno esté defectuoso.
Solución:
Si al elegir 4 tornillos al azar X indica el número de tornillos defectuosos, X se distri-
buye binomialmente de acuerdo con unos parámetros n 5 4 y p 5 0.20. Entonces:
a) P(X 5 1) 5 4C1 (0.2)1 (0.8)421 5 0.4096
b) P(X 5 0) 5 4C0 (0.2)0 (0.8)420 5 0.4096
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 107
Ejemplo 3.22. Suponer que 40% de los ríos de cierta región industrial de México están contaminados
con benceno. Si se toma una muestra aleatoria de tamaño n 5 30, calcular la proba-
bilidad:
a) Exactamente 15 ríos en la muestra estén contaminados con benceno.
b) Cuando menos 15 ríos en la muestra estén contaminados con benceno.
c) No más de 10 ríos, pero cuando menos de 5 ríos en la muestra estén contamina-
dos con benceno.
Solución:
Cada río elegido puede o no estar contaminado, esto es un experimento Bernoulli,
y la condición de cada río es independiente de los otros: entonces, la variable X que
indica el número de ríos contaminados es binomial con n 5 30 y p 5 0.40. Para el
cálculo se usa Excel o Minitab porque no se tienen valores tabulados para n 5 30.
a) P(X 5 15) 5 30!/(30 2 15)! (0.4)15(0.6)30∼15
5 0.0783
b) Cuando menos 15 indica que X $ 15.
P(X $ 15) 5 1 2 P(X , 15) 5 1 2 P(X # 14)
5 1 2 0.8246 5 0.1754
c) “No más de 10 ríos, pero cuando menos de 5” equivale a 5 # X # 10.
P(5 # X # 10) 5 P(X # 10) 2 P(X # 4)
5 0.2915 2 0.0015
5 0.2900
Ejemplo 3.23. En un estudio de laboratorio bacteriológico de aguas se afirma que 3% de las tomas
domiciliarias contienen la bacteria E. coli, en concentraciones arriba del límite estipula-
do por las leyes ambientales. Suponiendo que esta afirmación es correcta, encontrar la
probabilidad de que en una muestra aleatoria de 25 tomas domiciliarias, se encuentre:
a) Ninguna toma contaminada.
b) Cuando menos 1 toma contaminada.
c) Entre 1 y 5 tomas contaminadas.
d) Más de 5 tomas contaminadas.
e) Más de 5, pero menos de 10 tomas contaminadas.
108 | Estadística para ingeniería y ciencias
Solución:
Cada toma muestreada puede o no estar contaminada, independientemente de las
otras tomas en la muestra. Por tanto, la variable aleatoria X que indica el número de
tomas domiciliarias contaminadas en la muestra, es una variable aleatoria binomial
con parámetros n 5 25 y p 5 0.03. Debido a que para el valor de p 5 0.03, no hay
valores en la tabla de distribución binomial incluida en este libro, los cálculos para
este problema se deben calcular usando la fórmula o con ayuda de Excel o Minitab.
a) Ninguna toma contaminada:
P(X 5 0) 5 25C0 (0.03)0 (0.97)25
5 0.4070
b) Cuando menos se encuentra 1 toma contaminada es equivalente a X $ 1 y se
expresa como:
P(X $ 1) 5 1 2 P(X , 1) 5 1 2 P(X 5 0)
5 1 2 0.4670
5 0.5330
c) Entre 1 y 5 tomas contaminadas:
P(1 # X # 5) 5 P(X # 5) 2 P(X , 1) 5 0.9999 2 0.467 5 0.5329
d) Más de 5 tomas contaminadas:
P(X . 5) 5 1 2 P(X # 5) 5 1 2 0.9999 5 0.0001
e) Más de 5, pero menos de 10 tomas contaminadas.
P(5 , X , 10) 5 P(X # 9) 2 P(X # 5) 5 1 2 0.9999 5 0.0001
Ejemplo 3.24. En un río adyacente a una zona industrial, la probabilidad de que al tomar una mues-
tra de agua ésta exceda el límite de cromo que es de 10 mg/L, es de 0.10. Si se toman
n 5 18 muestras de agua del río y se supone que las muestras de agua son indepen-
dientes con respecto a la presencia de cromo, entonces:
a) Encontrar la probabilidad de que dos de las muestras excedan el límite de 10 mg/L
de cromo.
b) Hallar la probabilidad de que, al menos 4 muestras excedan el límite.
c) Determinar la probabilidad de que, cuando menos 3 muestras, pero menos de 7
excedan el límite estipulado.
d) Encontrar la probabilidad de que más de 3 muestras, pero menos de 7 excedan el
límite estipulado de cromo.
Solución:
Sea X 5 número de muestras de agua que excedan el límite estipulado de 10 mg/L
del total de las 18 observaciones. Entonces, X es una variable aleatoria binomial con
parámetros p 5 0.1 y n 5 18.
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 109
Ejemplo 3.25. Se sabe que la probabilidad de que una industria elegida al azar no cumpla con las
regulaciones ambientales es igual a p 5 0.5; si se elige una muestra de 10 industrias al
azar y X indica el número de industrias que no cumplen con las regulaciones ambien-
tales del aire y del agua en esa muestra, encontrar:
Solución:
a) P(X 5 5) 5 P(X # 5) 2 P(X # 4) 5 0.246 (usando la tabla binomial)
Ejemplo 3.26. La fabricación de accesorios para un sistema de control de partículas (ciclón) se asocia
con un proceso Bernoulli. Si la probabilidad de obtener una parte defectuosa es igual
a 0.20, estimar la probabilidad:
a) De no encontrar partes defectuosas del sistema de control en una muestra aleato-
ria de 10 partes.
b) De no hallar partes defectuosas de los ciclones fabricados en una muestra de 20
partes.
Solución:
a) Usando la fórmula binomial: b(x; n, p) 5 nCx px qn2x
P(X 5 0) 5 10C0 (0.2)0 (0.8)2100 5 0.107
Este resultado también se puede obtener con la tabla de la distribución binomial con
n 5 10, p 5 0.2 y X 5 0.
b) Nuevamente usando la fórmula binomial y sustituyendo da:
P(X 5 0) 5 20C0 (0.2)0 (0.8)2200
5 (1)(1)(0.012)
5 0.012
Ejemplo 3.27. Se toma una muestra aleatoria de n 5 20 (peces), sea p 5 0.05, la probabilidad que un
pez muera por la exposición a cierta concentración tóxica proveniente de una descar-
ga industrial a un río. Sea X el número de peces de la muestra que morirán durante el
experimento, entonces
a) Calcular la media μ y la desviación estándar σ de X.
b) La probabilidad de que muera a lo más 1 pez de la muestra.
c) La probabilidad de que no muera ningún pez de la muestra.
d) La probabilidad de que mueran cuando menos 3 peces de la muestra.
e) La probabilidad P(X 5 10).
Solución:
a) Media: μ 5 np 5 (20)(0.05) 5 1
Varianza: s2 5 npq 5 (1.0)(0.95) 5 0.95
Desviación estándar: s5 npq 5 0.95 5 0.9747
b) P(X # 1) 5 0.736
c) P(X 5 0) 5 0.358
d) P(X $ 3) 5 1 2 P(X , 3) 5 1 2 0.9245 5 0.0755
e) P(X 5 10) 5 1.08(1028)
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 111
Ejemplo 3.28. La posibilidad de que una muestra de aire contenga un microorganismo letal es de
10%. Suponiendo que las muestras son independientes, con respecto a la presencia del
microorganismo y que se toman 18 muestras. Encontrar la probabilidad de que:
a) Exactamente 2 muestras contengan el germen.
b) Al menos 4 muestras contengan el germen.
c) La probabilidad de que menos de 7 muestras de aire contengan el germen, pero
cuando menos 3 muestras también lo tengan, e.g., P(3 # X , 7).
Solución:
Sea X el número de muestras de aire que contienen el germen patógeno en las 18
muestras analizadas. Entonces, X es una variable aleatoria binomial con parámetros
p 5 0.1 y n 5 18. Por consiguiente:
a) P(X 5 2) 5 18C2 (0.1)2 (0.9)16 5 0.284
b) P(X $ 4) 5 1 2 P(X # 3) 5 1 2 0.9018 5 0.982
c) P(3 # X , 7) 5 P(X # 6) 2 P(X # 2) 5 0.9983 2 0.7338 5 0.2645
Solución:
Sea X la variable aleatoria que indica el número de pozos productivos de los 12 pozos
perforados, entonces X es una variable aleatoria binomial con parámetros n 5 12 y
p 5 0.15, entonces:
a) P(X 5 12) 5 1.297(10210)
b) P(X 5 0) 5 0.1422
c) P(X 5 1) 5 0.3012
d) P(X $ 3) 5 1 2 P(X # 2) 5 1 2 0.7358 5 0.2642
112 | Estadística para ingeniería y ciencias
Ejemplo 3.30. Un fabricante de precipitadores electrostáticos afirma que 6% de los equipos que
fabrica para controlar las partículas contaminantes del aire están defectuosos. Si esta
afirmación es correcta y se toma una muestra aleatoria de 10 aparatos, encontrar la
probabilidad de que:
a) Exactamente dos aparatos estén defectuosos.
b) Cuando menos dos aparatos estén defectuosos.
c) Menos que un aparato esté defectuoso.
d) Entre 2 y 5 estén defectuosos (incluyendo los extremos y sin incluirlos).
e) P(S).
f ) Graficar la función de densidad P(X = x) y la función de distribución P(X ≤ x).
Solución:
Sea X 5 número de aparatos defectuosos contenidos en la muestra, entonces X es
variable aleatoria binomial con parámetros n 5 10 y p 5 0.06, entonces se pueden
utilizar los valores de la tabla binomial,
a) P(X 5 2) 5 P(X # 2) 2 P(X # 1) 5 0.0988
b) P(X $ 2) 5 1 2 P(X # 1) 5 1 2 0.8824 5 0.1176
c) P(X , 1) 5 P(X 5 0) 5 0.5386
d) P(2 # X # 5) 5 P(X # 5) 2 P(X # 1)
5 0.1176
e) P(2 , X , 5) 5 P(X # 4) 2 P(X # 2)
5 0.0187
f ) P(S) 5 1
g) La siguiente figura muestra la función de distribución acumulada a) y de densidad
de X b).
a) b)
Figura mostrando
Figura mostrando la gráfica delaP(X
gráfica versus
5 x)de x) versus
P(X 5variable variable
aleatoria x aleatoria
Figurax mostrando
Figura mostrando
la gráfica delaP(X
gráfica versus
5 x)de x) versus
P(X 5variable variable
aleatoria x aleatoria x
0 1 0 2 1 3 2 4 3 5 4 6 5 6
1.0 1.0 0.6
0.6 0.6 0.6
Figura 3.11.
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 113
Ejemplo 3.31. Teóricamente, cierta forma de desnutrición ocurre en 15% de personas sin que se den
cuenta. Este tipo de desnutrición no se debe a que no se coma lo suficiente, sino a
situaciones en que el cuerpo no asimila los nutrientes, sin importar cuánto o cómo se
alimente. Esto se debe a la alteración química de la sangre por vida antinatural. Sien-
do así, determinar las siguientes probabilidades para una muestra de 5 personas.
a) Ninguna persona la tiene.
b) Cuando menos 2 personas la tienen.
c) Entre 2 y 4 la tienen, inclusivamente.
Solución:
La variable X que indica el número de personas con el problema de desnutrición en
la muestra es binomial con parámetros n 5 5 y p 5 0.15, entonces
a) P(X 5 0) 5 0.59049
b) P(X $ 2) 5 1 2 0.91854 5 0.08146
c) P(2 # X # 4) 5 0.99999 2 0.91854 5 0.08145
Nota: se le pide a usted que use el programa Minitab o el programa Excel para resol-
ver los ejemplos anteriores y comparar los resultados.
X 5 5, 6, 7, 8, . . .
Definición 3.25. La variable aleatoria X que indica el número de experimentos Bernoulli iguales e
independientes que son necesarios realizar para obtener k-éxitos se llama variable aleatoria binomial
negativa.
El recorrido de la variable aleatoria binomial negativa es infinito e igual a
X 5 k, k 1 1, k 1 2, k 1 3, k 1 4, . . .
114 | Estadística para ingeniería y ciencias
¯² C pk q x2k si x 5 k, k 11, k 1 2, . . .
f ( x) 5 ° x21 k21 (3.30)
±² 0 en otro caso
Demostración:
Suponga que X 5 x, esto significa que en los primeros x 2 1 experimentos Bernoullis independientes
ya ocurrieron k 2 1 éxitos, y en el experimento número x ocurrió el éxito número k y ahí se detiene
el proceso, esto es:
P(X 5 x) 5 P(en x 2 1 experimentos ocurren k 2 1 éxito, y hay un éxito en el experimento x)
5 P(en x 2 1 experimentos ocurren k 2 1 éxito) P (hay un éxito en el experimento x)
5 x–1Ck21 pk–1qx2k p 5 b(k21; x21, p) p
5 x21Ck21 pkqx2k
k
µ 5
p
kq
σ 2 5
p2
k
pet
MX (t )5
1 2 qet
Demostración:
Para calcular la media, la varianza y la función generatriz de momentos se utiliza la relación que se
deriva de la segunda propiedad de las funciones de densidad:
∞
( x 21)!
∑ (k 21)!( x 2 k )! p k
(1 2 p) x2k 51
x5k
para toda k . 0 y 0 , p , 1.
∞
a) µ 5 E(X) 5 ∑ xf ( x)
x5k
∞
x( x 21)!
5∑ pk (1 2 p) x2k
x5k ( k 2 1)!( x 2 k )!
k ∞ x!
5 ∑
p x5k k !( x 2 k )!
pk11 (1 2 p) x2k
k ∞ ( x * 21)! k
5 ∑
p x*5k* (k * 21)!( x * 2 k*)!
pk* (1 2 p) x*2k* 5 (1)
p
k
5
p
b) Para la varianza primero se calcula E(X(X11)) 5 E(X2) 1 E(X ), y luego con este resultado, se
calcula V(X ) 5 E(X2) 2 (E(X ))2 5 E(X(X 1 1)) 2 E(X ) 2 (E(X ))2
∞
c) E(X(X 1 1)) 5 ∑ x( x 11) f ( x)
x5k
∞
x( x 1 1)( x 2 1)! k
5∑ p (1 2 p) x2k
x5k ( k 2 1)!( x 2 k )!
∞
k(k 11) ( x 11)!
5
p 2 ∑ (k 11)!( x 2 k )! p k 12
(1 2 p) x2k
x5k
haciendo la sustitución:
x 1 1 5 x* 2 1 y k 1 1 5 k*2 1
∞
k(k 11) ( x * 21)!
5
p 2 ∑ (k * 21)!( x * 2 k*)! p k*
(1 2 p) x*2k*
x*5k*
k(k 1 1)
5
p2
La varianza de X es:
σ2 5 V(X) 5 E(X(X 1 1)) 2 E(X) 2 (E(X))2
k(k 11) k k 2 kq
5 2 2 25 2
p2 p p p
∞
d) MX(t ) 5 E(e tX) 5 ∑e tx
f ( x)
x5k
∞
etx ( x 21)!
5∑ pk (1 2 p) x2k
x5k ( k 2 1)!( x 2 k )!
∞
pk ( x 21)!
5
qk
∑ (k 21)!( x 2 k )! (e q) t x
x5k
∞
pk etk ( x 21)!
5
(1 2 et q)k
∑ (k 21)!( x 2 k )! (1 2 e q) t k
(et q) x2k
x5k
pk etk
5
(1 2 et q)k
116 | Estadística para ingeniería y ciencias
Tabla 3.12.
pk etk
Función generatriz de momentos MX(t ) 5
( 12 et q ) k
Ejemplo 3.32. Se sabe que 10% de los empleados de una industria padecen de una enfermedad de-
generativa. Para el estudio de la enfermedad, se requiere de 3 pacientes que tengan
la enfermedad por lo que se analiza sucesivamente al azar a los empleados de la
industria hasta tener a los 3 pacientes que den positivo en los análisis. Encontrar la
probabilidad de que:
a) Se tenga que analizar exactamente 5 empleados para tener a los 3 con la enfer-
medad.
b) Se tengan que hacer más de 7 análisis.
c) Se tengan que hacer exactamente 3 análisis.
Solución:
Considerar que X es la variable aleatoria que indica el número de análisis que es nece-
sario hacer para encontrar los tres positivos, entonces X se distribuye de acuerdo con
una binomial negativa con parámetros k 5 3 y p 5 0.10:
a) P(X 5 5) 5 b(k21; x21, p) p 5 b(2; 4, 0.10) (0.10) 5 (0.0486)(0.10) 5 0.00486
b) P(X . 7) 5 1 2 P(X # 7)
5 1 2 (b(2; 2, 0.10) 1 b(2; 3, 0.10) 1 b(2; 4, 0.10) 1 b(2; 5, 0.10)
1 b(2; 6, 0.10))p
5 1 2 0.02569
5 0.97431
c) P(X 5 3) 5 b(2; 2, 0.10) 5 0.001
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 117
BinomialBinomial
negativa;negativa;
p 5 0.1,pk550.1,
3 k53 BinomialBinomial
negativa;negativa;
p 5 0.3,pk550.3,
3 k53
Probabilidad
Probabilidad
Probabilidad
0.02 0.02 0.08 0.08
0.04 0.04
0.01 0.01
0.02 0.02
0.005 0.005
0 0
0 0 3 6 9
3 12
6 15 18 15
9 12 21 18
24 21 24
1 6 1111662111
2616
3121
3626
4131
4651 564651 56
36 41
Número de experimentos
Número de experimentos Número de experimentos
Número de experimentos
Media 5 30 Media 5 10
Figura 3.12.
Figura 3.14.
Tabla 3.13.
X Densidad Distribución
3 0.064 0.064
4 0.1152 0.1792
5 0.13824 0.31744
6 0.13824 0.45568
7 0.124416 0.580096
8 0.10450944 0.68460544
9 0.08360755 0.76821299
10 0.06449725 0.83271025
11 0.04837294 0.88108319
12 0.03547349 0.91655668
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 119
En esta tabla la función de distribución acumulada no llega a 1 porque sólo se graficaron los primeros 12
valores para X.
Definición 3.26. La variable aleatoria que indica el número de experimentos Bernoulli independien-
tes que se deben realizar para encontrar el primer experimento exitoso se llama variable aleatoria
geométrica.
²¯ pq x21 si x 51, 2, 3, . . .
f ( x) 5 ° (3.32)
±² 0 en otro caso
Demostración:
Observe que la variable aleatoria geométrica es una variable binomial negativa con parámetros k 5 1
y p, entonces:
( x 21)! 0 x21
P(X 5 x) 5 b(0; x21, p)p 5 p q p 5 pq x21
0!( x 21)!
1 q pet
µ 5 σ 2 5 MX (t )5
p p2 1 2 qet
Demostración:
Es suficiente sustituir k 5 1, en la media, varianza y función generatriz de momentos de la función
de densidad binomial negativa.
Tabla 3.14.
pe t
Función generatriz de momentos MX(t ) 5
( 12 et q )
120 | Estadística para ingeniería y ciencias
Definición 3.27. Supóngase que se tiene una población de tamaño N cuyos elementos son de dos
clases: unos elementos tienen una característica de interés y otros elementos no la tienen. Entonces M
elementos tienen la característica de interés y N–M no la tienen, y para utilizar la misma nomencla-
tura ya vista se dirá que es éxito si el elemento elegido presenta la característica de interés y fracaso
si no la tiene. Si de esa población se elige una muestra al azar sin reemplazo, la variable X que indica
el número de éxitos en la muestra se llama hipergeométrica.
Teorema 3.20. Si X es una variable aleatoria hipergeométrica, entonces su función de densidad es:
« M C x ( N 2M ) C n2x
® si máx {0, n 2 N 1 M} # x # mín{n, M}
f ( x) 5 ¬ N
Cn
®
0 en otro caso
Demostración:
El espacio muestral de este experimento es equiprobable, por lo que para calcular la probabilidad de
la variable aleatoria X, se cuentan los elementos del espacio muestral y los elementos con el valor X
especificado.
El total de maneras en que se pueden escoger n elementos de un total de N elementos es igual a
las combinaciones de N en n, esto es #S 5 NCn.
El total de formas de tener x éxitos de un conjunto total de M éxitos, es igual a las combinaciones
de M en x, esto es MCx, y el total de maneras de tener n–x éxitos de N–M éxitos son las combinaciones de
N–M en n–x, esto es, N–MCn–x y por la regla de la multiplicación, el total de maneras de tener x éxitos y n–x
fracasos es igual al producto de estos dos números MCx N–MCn–x.
En resumen:
N
Cn Representa la cantidad de formas en las que se puede seleccionar una muestra de tamaño n
de una población de tamaño N.
M
Cx Representa la cantidad de maneras en las que se puede seleccionar x éxitos de un total de k
éxitos de la población.
N–M
Cn–x Representa la cantidad de maneras en las que se puede seleccionar n2x fracasos de un total
de N2M fracasos en la población.
Ahora, para determinar el recorrido de x, basta con ver que la expresión rCk, r y k satisfaga la
relación 0 # k # r, entonces de la expresión MCx N2MCn2x se sigue que
0#x#M y 0#n2x#N2M
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 121
0#x#M y n2N1M#x#n
De aquí se sigue que:
máx{0, n 2 N 1 M} # x # mín{M, n}
Teorema 3.21. Si X es una variable aleatoria hipergeométrica, entonces su media y su varianza son:
Mn
µ 5
N
Mn( N 2 M )( N 2 n) M M N 2n
σ 2 5 5n 12 (3.34)
2
N ( N 21) N N N 21
Demostración:
Se utiliza la segunda propiedad de las funciones de densidad para cualquiera de los valores factibles
de N, M y n.
C x N 2M C n2x
∑ f ( x) 5 ∑ M
Cn
51
x x N
xMCxN 2M C n2x
∑ x f ( x) 5
x N
Cn
xM ! M! ( M 21)!
xM C x 5 5 5M 5 MM21 C x21
x!( M 2 x)! ( x 21)!( M 2 x)! ( x 21))!( M 2 x)!
y en el denominador:
N! N ( N 21)! N C
N
Cn 5 5 5 N 21 n21
n!( N 2 n)! n ( n 2 1)!( N 2 n) n
Para calcular la varianza, primero se encuentra E(X(X 2 1)) 5 E(X2) 2 E(X ) y luego se calcula el
término σ2 5 E(X(X 2 1)) 1 E(X ) 2 (E(X ))2.
x( x 21)M C x N 2M C n2x
E( X ( X 21)) 5 ∑
x N
Cn
122 | Estadística para ingeniería y ciencias
x( x 21)M ! M!
x( x 21)M C x 5 5
x!( M 2 x)! ( x 2 2)!( M 2 x)!
( M 2 2)!
5 M ( M 21) 5 M( M 21)M22 C x22
( x 2 2)!( M 2 x)!
y en el denominador:
M ( M 21)n( n 21)
E( X ( X 2 1)) 5
N ( N 21)
De esta manera:
M ( M 21)n( n 21) Mn M 2 n2 M( N 2 M )( N 2 n)
σ2 5 1 2 5
N ( N 21) N N2 N 2 ( N 21)
Tabla 3.15.
M
C x( N 2M ) C n2x
f (x) 5
N
Cn
Función de densidad
si x 5 máx{0, n − N 1 M}, . . . , mín{n, M}
f (x) 5 0 en otro caso
Media µ 5 nM/N
Varianza σ2 5 nM(N 2 M)(N 2 n)/N2(N 2 1)
Función generatriz de momentos No tiene una expresión analítica simple
M! ( N 2 M )!
M
C x N 2M C n2x x!( M 2 x)! ( n 2 x)!( N 2 M 2 n 1 x)
5
N
Cn N!
n!( N 2 n)!
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 123
M 2i M i M
• 5 2 ≈ cuando 1 # i # x 21 , n y
N 2i N 2i N 2i N
N 2M 2 j N M1 j M
• 5 2 ≈ 12 cuando 0 # j # n 2 x 21 o x # x 1 j # n 21
N 2x2 j N 2x2 j N 2x2 j N
Por esta razón, la media y la varianza de la distribución hipergeométrica se pueden aproximar mediante
las fórmulas: x n2x
C x N 2M C n2x n! ¥ M´ ¥ M´ ¥ M´
M
z µ¦5 npµ 51 2
¦ n µ 5 b ¦x; n, µ (3.35)
N
Cn x!( n 2 x)! § N ¶ § N¶ § N¶
¥ M ´ ¥ M ´
σ2 5 npq 5 n ¦ µ ¦ 1 2 µ (3.36)
§N¶ § N¶
cuando N es grande con respecto a n.
la gráfica. 0.50000
0.40000
X h(x; 8, 3) 0.30000
0.20000
0 0.01786
0.10000
1 0.26786 Figura 3.16.
0.00000
2 0.53571 0 1 2 3
Probabilidad
3 0.17857
124 | Estadística para ingeniería y ciencias
Las probabilidades acumuladas se calculan de la misma manera que se hizo la probabilidad acumulada
de la variable aleatoria binomial negativa.
Solución:
Aquí, N 5 10, k 5 4, n 5 3, X 5 0, 1, 2, 3.
a) La siguiente tabla muestra los resultados requeridos.
Tabla 3.16.
Variante aleatoria Probabilidad
P(X = x)
hipergeométrica X acumulada
0 0.16667 0.166667
1 0.66667 0.5
2 .96667 0.3
3 1 0.03333
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 125
Con los cálculos computarizados de la tabla generada por Minitab, los resultados se
simplifican:
b) P(X 5 1) 5 0.5000 (de la tabla anterior columna 2)
c) P(X 5 2) 5 0.3000
d) P(X 5 3) 5 0.0333
e) P(X # 2) 5 0.9667
f ) P(1 # X # 3) 5 (1 2 0.16667) 5 (0.5000 1 0.3000 1 0.0333) 5 0.8333
Solución:
Aquí, N 5 8, M 5 3 (los químicos) y n 5 5, el comité es un subconjunto de las ocho
personas disponibles, por lo que la distribución de X es una hipergeométrica con pa-
rámetro N 5 8 y M 5 3, éstos son:
C x 5 C 52x
f ( x)5 3 con x 5 0, 1, 2, 3
8
C5
Recorrido de X 0 1 2 3
h(x; 8, 3) 0.018 0.268 0.536 0.179
Solución:
Con los datos de la distribución hipergeométrica obtenidos en el problema anterior,
se tiene que
126 | Estadística para ingeniería y ciencias
a) P(X 5 1) 5 0.268
b) P(X $ 1) 5 1 2 P(X 5 0) 5 1 2 0.018 5 0.982
c) P(1 # X # 3) 5 P(X 5 1) 1 P(X 5 2) 1 P(X 5 3)
5 (0.268) 1 (0.536) 1 (0.179) 5 0.983
Ejemplo 3.36. Un embarque de 20 computadoras contiene cinco que están defectuosas. Si 10 de estas
computadoras se seleccionan aleatoriamente, para su inspección, ¿cuál es la probabi-
lidad de que 2 de las 10 estén defectuosas?
Solución:
La variable X que indica el número de computadoras defectuosas que hay entre las
10 seleccionadas para su inspección es una variable aleatoria hipergeométrica con
parámetros n 5 10, M 5 5 y N 5 20 y se pide la probabilidad que X 5 2.
Ahora, sustituyendo estos valores en la fórmula hipergeométrica se obtiene:
Ejemplo 3.37. Con ayuda del ejemplo anterior resolver el problema. Si un lote de 100 computadoras
tiene 25 defectuosas:
a) Usar la fórmula hipergeométrica.
b) Con la fórmula binomial obtener una aproximación de la distribución hiper-
geométrica.
Solución:
a) Sustituyendo x 5 2, n 5 10, k 5 25, N 5 100 en la fórmula da:
P(X 5 2) 5 h(2; 100, 10, 25) 5 25C2 • 75C8/100C10
5 (300)(1.687×1010)/1.731×1013
5 0.292
b) Si considera que N 5 100 y que es grande con relación a n 5 10; entonces, se puede
usar la fórmula binomial como una aproximación a la hipergeométrica; en este caso
se utiliza como parámetros de la binomial n 5 10, p 5 k/N 5 25/100 5 0.25.
P(X 5 2) 5 B(2; 10, 0.25) 5 10C2 (0.25)2 (0.75)8
5 (45)(0.0625)(0.100) 5 0.2813
Nota: obsérvese que la diferencia entre los dos valores es de sólo 0.01. En general, es
posible usar la distribución binomial como una aproximación a la distribución
hipergeométrica, si n , N/10.
Solución:
Dado que los elementos de la muestra se seleccionan sin reemplazo, se tiene que la
variable X que indica el número de unidades defectuosas en la muestra es una va-
riable aleatoria hipergeométrica con parámetros N 5 10, M 5 4 y n 5 3; entonces,
aplicando la fórmula binominal realizar los cálculos.
a) P(X 5 1) 5 4C1 • 6C2/10C3 5 0.500
b) P(X 5 2) 5 4C2 • 6C1/10C3 5 0.300
c) P(X 5 3) 5 4C3 • 6C0/10C3 5 0.033
d) P(X # 2) 5 0.5000 1 0.1667 1 0.3000 5 0.9667
Ejemplo 3.39. Una encuesta universitaria hecha a 24 estudiantes del último año reveló que 12 de
ellos recomiendan tomarse cuando menos una o dos cervezas diariamente para estu-
diar mejor. Si se seleccionan de manera aleatoria 11 de estos estudiantes, ¿cuál es la
probabilidad de que 4 estudiantes en la muestra tengan esta opinión?
Solución:
La variable X que indica el número de estudiantes en la muestra que piensan que
tomarse cuando menos una o dos cervezas diariamente para estudiar mejor es una
variable aleatoria hipergeométrica con parámetros N 5 24, n 5 11, M 5 12, entonces,
X 5 4 y sustituyendo los valores en la fórmula hipergeométrica:
P(X 5 4) 5 h(4; 24, 11, 12) 5 12C4 • 24−12C11−4/24C11
5 (495)(792)/2 496 144
5 0.26
Teorema 3.22. Sea X una variable aleatoria Poisson, entonces la función de densidad de X es:
¯ Q x e2Q
² si x 5 0, 1, 2, 3, . . .
f ( x) 5 ° x! (3.37)
² 0 en otro caso
±
Demostración:
Si X es variable aleatoria Poisson, entonces se satisfacen las tres propiedades enlistadas en el subtema
3.10.1. Represente el intervalo de interés con el intervalo [0, 1], y considere los subintervalos de longi-
tud igual a 1/n, cuya unión es igual a [0, 1]
( n 21)
[0, 1/n], [1/n, 2/n], [2/n, 3/n], [3/n, 4/n], . . . ,
n, 1
Sea Xi la variable que indica el número de éxitos que ocurren en el intervalo [(i 2 1)/n, i/n], de esta
manera la variable aleatoria Poisson X que indica el número de éxitos en el intervalo [0, 1] es igual a:
X 5 X 1 1 X 2 1…1 X n
son Bernoulli independientes, con p 5 pn , por lo que Y 5Y1 1Y2 1…1Yn es una variable aleatoria
binomial con parámetros n y p 5 pn , y por la propiedad 3 de los experimentos Poisson se sigue que
lím P ( X i $ 2) 5 0 lo que implica que Y → X cuando n→ ∞ y en consecuencia la función de densi-
n→∞
dad de Y fn, converge a la función de densidad de X cuando n va a infinito, esto es lím fn 5 fX .
nmd
Entonces, para encontrar la función de densidad Poisson se debe encontrar fn y luego calcular su
límite cuando n va a infinito.
fn ( x) 5 b( x; n, pn )
n!
5 p x q n2x
x!( n 2 x)! n n
[ npn ][( n 21) pn ][( n 2 2) pn ] …[( n 2 x 11) pn ]
5 (1 2 pn )n2x
x!
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 129
Teorema 3.23. Si X es la variable aleatoria Poisson, entonces la media, la varianza y la función ge-
neratriz de momentos de X son:
µ 5 λ
σ2 5 λ
MX(t ) 5 e2λ 1λetx
Demostración:
Para la demostración se utiliza:
∞
xi
ex 5∑
i51 i !
130 | Estadística para ingeniería y ciencias
∞ ∞
xλ x e2λ
La media es µ 5 ∑ xf ( x) 5 ∑
x50 x50 x!
*
∞
λ x e2λ ∞
λx
5∑ 5 λe2λ ∑ *
x51 ( x − 1)! x* 50 x !
sustituyendo a x 5 x* 1 1, se obtiene:
5 λe2λ e λ 5 λ
Para calcular la varianza primero se encuentra E(X(X 2 1)) 5 E(X 2) 2 E(X) y luego se obtiene σ2
5 E(X(X 2 1)) 1 E(X) 2 [E(X)]2
∞ ∞
x( x 21)λ x e2λ
E( X ( X 21)) 5 ∑ x( x 21) f ( x) 5 ∑
x50 x50 x!
*
∞
λ x e2λ ∞
λx
5∑ 5 λ 2 e2λ ∑ *
x52 ( x 2 2 )! x* 50 x !
sustituyendo a x 5 x* 1 2, se obtiene:
5 λ 2 e2λ e λ 5 λ2
Tabla 3.17.
λ x e2λ
F(x) 5 si x 5 0, 1, 2, 3, . . .
Función de densidad x!
f (x) 5 0 en otro caso
Media µ5λ
Varianza σ2 5 λ
MX(t) 5 e2λ 1λe
tx
Función generatriz de momentos
Demostración:
Es directa de la propiedad 2 de los experimentos Poisson.
Ejemplo 3.40. Si durante un mes el número de accidentes laborales en una factoría es una variable
Poisson con media igual a λ 5 3, entonces:
El número de accidentes laborales en una factoría durante dos meses es una variable
Poisson con media igual que 2λ 5 6.
El número de accidentes laborales en una factoría durante medio mes es una variable
Poisson con media igual que λ/2 5 1.5.
Tabla 3.18.
Con estas instrucciones se obtiene la tabla de probabilidades siguiente y con estas probabilidades se puede
elaborar la gráfica de la densidad.
6 0.05040941
0.05
7 0.02160403
8 0.00810151
0
9 0.00270050 0 1 2 3 4 5 6 7 8 9 10
Número de éxitos
10 0.00081015
Figura 3.17.
Para hacer gráficas sobrepuestas debe usar el programa Minitab y proceda de la siguiente manera:
1. Vaya a Scatterplot-Simple y en las ventanillas Y-variable y X-variable escriba las probabilidades y
los valores de la variable aleatoria discreta Poisson X.
2. En la ventana Scatterplot-Multiple graphs haga clic en Overlaid on the same graph y haga clic en
OK.
Ejemplo 3.41. Para la distribución Poisson con parámetro λ 5 8, siga las instrucciones anteriores
para generar una tabla con los valores de la distribución y la densidad Poisson. En
la misma gráfica poner las dos funciones. Una vez hecho esto, calcular las siguientes
probabilidades:
a) P(X $ 5)
b) P(8 # X # 10)
c) P(X 5 7)
d) P(4 , X , 8)
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 133
Solución:
La tabla y la gráfica siguientes muestran los resultados requeridos.
Tabla 3.19.
0.4 0.4
Datos
0.3 0.3
0.2 0.2
0.1 0.1
0.0 0.0
0 1 2 3 4 5 6 7 8 9
Var. aleatoria X
Figura 3.18.
a) P(X $ 5) 5 0.9084
b) P(8 # X # 10) 5 0.3629
c) (X 5 7) 5 0.1396
d) P(4 , X , 8) 5 0.3053
134 | Estadística para ingeniería y ciencias
Ejemplo 3.42. Suponer que X se distribuye de acuerdo con la Poisson dada por:
f (x) 5 [(0.72)x e20.72]/x!
Encontrar:
a) f (0)
b) f (1)
c) f (2)
d) f (3)
Solución:
a) f (0) 5 [(0.72)0 e20.72]/0! 5 0.4868
b) f (1) 5 [(0.72)1 e20.72]/1! 5 0.3505
c) f (2) 5 [(0.72)2 e20.72]/2! 5 0.1262
d) f (3) 5 [(0.72)3 (0.4868]/3! 5 0.030
Ejemplo 3.43. Un estudio de higiene y seguridad industrial que se realizó a largo plazo llevó a la
gerencia a concluir que el número de accidentes por trabajador, durante un año (X),
sigue una distribución Poisson. Si el promedio anual de accidentes por trabajador fue
de 0.3, estimar lo siguiente:
a) ¿Cuál es la probabilidad de que un trabajador seleccionado, aleatoriamente, no
tenga un accidente durante el año siguiente?
b) ¿Cuál es la probabilidad de que un empleado seleccionado, aleatoriamente, tenga
cuando menos 1 accidente durante el siguiente año?
c) ¿Cuál es la probabilidad de que un trabajador tenga, exactamente, 1 accidente?
d) ¿Cuál es la probabilidad de que un trabajador seleccionado al azar de la fábrica
tenga entre 2 y 4 accidentes, inclusivamente, el próximo año?
Solución:
El número de accidentes por trabajador durante un año, X es una variable aleatoria
Poisson con parámetro λ 5 0.3; entonces, para resolver el problema se usa la función:
f (x; λ) 5 λxe2λ /x!:
Esto se puede interpretar como que en el próximo año, de cada 100 trabajadores,
en promedio 74 no tendrán ningún accidente y 26 si lo pueden tener.
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 135
Ejemplo 3.44. El número de defectos por pie cuadrado de la tela de un equipo de filtros se distribuye
de acuerdo con la ley Poisson, con λ 5 0.08. Si se elige un pie cuadrado de tela al
azar, calcular la probabilidad de que la tela tenga:
a) Ningún defecto.
b) Cuando menos 1 defecto.
c) Exactamente, 2 defectos.
Solución:
Se utiliza la fórmula de la función de densidad Poisson con λ 5 0.08.
a) Ningún defecto:
Solución:
Para usar la aproximación Poisson y la fórmula binomial, se calcula primero el valor
de λ usando la relación λ 5 np 5 (60)(0.05) 5 3; para resolver los diferentes incisos
primero calcular las probabilidades para x 5 0, 1, 2, 3, 4.
Con la función P(X = x) 5 f (x) 5 λx e−λ/x! y sustituyendo los valores, obtener:
Ejemplo 3.46. De los artículos producidos por una factoría, 3% están defectuosos. Una muestra de
25 artículos se selecciona para una inspección. Calcular la probabilidad:
a) Exactamente 4 artículos estén defectuosos.
b) 3 o más objetos estén defectuosos.
Use las distribuciones binomial y la Poisson para encontrar estas probabilidades y
compare los resultados.
Solución:
Con la distribución binomial y los parámetros n 5 25 y p 5 0.03.
a) P(X 5 4) 5 0.0054
b) P(X $ 3) 5 0.038
Con la distribución de Poisson con parámetro λ 5 25(0.03) 5 0.75.
a) P(X 5 4) 5 0.006
b) P(X $ 3) 5 0.041
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 137
Ejemplo 3.47. Un promedio de 3 autos arriban a la caseta de cobro de una carretera cada minuto.
Si esta tasa es aproximada por un proceso Poisson, ¿cuál es la probabilidad de que,
exactamente, 5 autos arribarán en un periodo de un minuto?
Solución:
En este caso, se tiene que λ 5 3, x 5 5.
Ejemplo 3.48. 10% de las herramientas producidas en cierto proceso de manufactura son defectuo-
sas. Encontrar la probabilidad de que, en una muestra de 10 herramientas selecciona-
das, aleatoriamente sólo 2 herramientas estén defectuosas. Utilice lo siguiente:
a) La distribución binomial.
b) La distribución de Poisson.
Solución:
La variable aleatoria X que indica el número de herramientas defectuosas en la mues-
tra de 10 es binomial con parámetros n 5 10 y p 5 10% 5 0.10, entonces:
1. P(X 5 2) 5 10C2 (0.1)2 (0.9)1022 5 10!/[2!(10− 2 2)!] 5 0.19
2. Si usa la aproximación Poisson, se calcula λ 5 np 5 (10)(0.10) 5 1,
Ejemplo 3.49. Si 3% de los focos eléctricos manufacturados por una compañía son defectuosos en-
contrar la probabilidad de que, en una muestra de 100 focos:
a) Ningún foco esté defectuoso. d) Tres focos estén defectuosos.
b) Un foco esté defectuoso. e) Cuatro focos estén defectuosos.
c) Dos focos estén defectuosos. f ) Cinco focos estén defectuosos.
Solución:
Dado que n es grande, es más conveniente usar la aproximación Poisson en lugar
de la distribución binomial que es exacta, y como los parámetros de la distribución
binomial son n 5 100, p 5 0.03, entonces λ 5 np 5 (100)(0.03) 5 3,
Ejemplo 3.50. La probabilidad de que una persona muera de un ataque cardiaco por fumar en exceso
es de 0.002. Encontrar la probabilidad de que menos de 5 personas, de las siguientes
2 000, mueran de un problema cardiaco y obtener el promedio y la varianza de la varia-
ble aleatoria X que indica el número de personas que mueren de un problema cardiaco
de las 200 de la muestra.
Solución:
Primero calcule el promedio y la varianza. Las fórmulas para esto son:
µ 5 np 5 (2000)(0.002) 5 4.0
σ2 5 npq 5 (2 000)(0.002)(0.998) 5 3.992
Para calcular la probabilidad se utiliza la aproximación Poisson, pues n es grande y
p es muy pequeña.
P(X , 5) 5 P(X # 4) 5 0.6288
Ejemplo 3.51. En un estudio de contaminación ambiental se instala una red de 3 840 sensores de alto
volumen para medir las concentraciones de partículas atmosféricas menores que 10
micras. Si la probabilidad de que cualquiera de estos muestreadores falle es de 0.00083
durante un año, entonces, determinar las probabilidades de que 0, 1, 2, 3, 4, . . . de
los muestreadores fallen durante el año en cuestión. Hacer una gráfica usando papel
semilogarítmico.
Solución:
Si X indica el número de sensores que fallan, X se distribuye de acuerdo con una
binomial con parámetros n 5 3 840 y p 5 0.00083. Además, debido a que n es muy
grande y p muy pequeña es conveniente utilizar la aproximación Poisson, por lo que
se calcula el valor de λ.
λ 5 np 5 (3840)(0.00083) 5 3.2
Los cálculos se realizan con la fórmula o con la computadora,
f (x) 5 p(x; 3.2) 5 (3.2)x e− 23.2/x!
Al sustituir los valores de la variable aleatoria X en la fórmula anterior tenemos:
Para graficar los datos de la variable aleatoria X (abscisa) y de la probabilidad f (x) 5
p(x; μ) (ordenada), se usó papel semilogarítmico.
0.2230
0.2090 0.1780
0.1300 0.1140
0.100
0.0610
0.0410
0.0280
f(x)
0.0110
0.010
0.0034
0.0013
0.001
0 5 10
Figura 3.19.
Ejemplo 3.53. El número X de huracanes observados en la región del Caribe, durante los últimos 3
años, tiene una distribución de Poisson con una media λ 5 8. Calcular las siguientes
probabilidades:
a) La probabilidad de que ocurran a lo más 8 huracanes.
b) La probabilidad de que ocurran exactamente 8 huracanes.
c) La probabilidad de que ocurran cuando menos 9 huracanes.
d) La probabilidad de que ocurran entre 5 y 8 huracanes, de manera inclusiva.
e) La probabilidad de que ocurran entre 5 y 8 huracanes, de manera exclusiva.
f ) La probabilidad de que ocurran a lo más 8 huracanes, pero más de 5.
g) La probabilidad de que ocurran más de 2 huracanes.
h) Graficar las probabilidades P(X 5 x) y P(X # x) en función de x.
Solución:
Los resultados se encuentran usando Excel o Minitab.
a) P(X # 8) 5 0.59255
b) P(X 5 8) 5 0.1396.
c) P(X $ 9) 5 1 2 P(X , 9) 5 1 2 0.5925 5 0.4075.
d) P(5 # X # 8) 5 0.492
e) P(5 , X , 8) 5 0.251
f ) P(5 , X # 8) 5 P(X 5 6) 1 P(X 5 7) 1 P(X 5 8) 5 0.3159
g) 1 2 P(X # 2) 5 0.9863
Densidad
Densidad Poisson,
Poisson, media
media 5588 Distribución
Distribución Poisson,
Poisson, media
media 5588
0.16
0.16 1.2
1.2
0.14
0.14
11
Probabilidad
Probabilidad
0.12
Probabilidad
Probabilidad
0.12
0.1
0.1 0.8
0.8
0.08
0.08 0.6
0.6
0.06
0.06 0.4
0.4
0.04
0.04
0.2
0.2
0.02
0.02
00 00
Número
Número dede éxitos
éxitos Número
Número dede éxitos
éxitos
Figura 3.20.
Capítulo 3 Funciones de distribución de variables aleatorias discretas | 141
Problemas propuestos
3.1 Si la variable aleatoria X tiene una distribución binomial con emocionales del trabajo, sino que dan solamente una solu-
parámetros n 5 10 y p 5 0.5. Calcular las siguientes probabi- ción paliativa al problema de las depresiones emocionales,
lidades: encontrar la media y la varianza suponiendo que el tamaño
a) P(X 5 5) de la muestra n es igual a 20.
b) P(X # 2) 3.8 En una investigación de higiene y seguridad industrial, el
c) P(X $ 9) ingeniero encargado del departamento de seguridad afirma
d) P(3 # X , 5) que sólo 40% de todos los trabajadores usan cascos de segu-
3.2 La variable aleatoria X tiene una distribución binomial con n ridad cuando almuerzan en el lugar del trabajo. Suponiendo
5 10 y con p 5 0.01. Calcular lo siguiente: que esta afirmación sea correcta, hallar la probabilidad de
a) P(X 5 5) que 4 de los siguientes 6 trabajadores de la industria, elegi-
b) P(X # 2) dos, aleatoriamente, usen los cascos de seguridad, mientras
c) P(X $ 9) comen en el lugar del trabajo.
d) P(3 # X # 5) 3.9 Una compañía constructora de precipitadores electrostáti-
3.3 Se sabe que 20% de la producción de sensores de alto volumen cos sabe que en promedio 29% de este equipo de control
son defectuosos y fallarán al realizarse una prueba de mues- de partículas requerirán de reparaciones después de un año
treo de partículas con filtros de cierta porosidad. Si se eligen al de usarse. Si se seleccionan, aleatoriamente, 20 precipita-
azar 15 sensores y X indica el número de sensores que fallan dores electrostáticos, de la producción total, encontrar la
la prueba en esta muestra, entonces, X tiene una distribución probabilidad que:
binomial con n 5 15 y p 5 0.2. Determinar lo siguiente: a) Al menos 5 precipitadores requieran de reparaciones
a) La probabilidad de que a lo sumo 9 sensores fallen la después de un año.
prueba. b) Exactamente 5 de estas unidades de control de la conta-
b) La probabilidad de que exactamente 8 fallen. minación atmosférica requieran reparación después de
c) La probabilidad de cuando menos 8 sensores fallen. un año.
d) La probabilidad de que fallen entre 4 y 7 de manera ex- 3.10 En un estudio de ahorro de energía, se argumenta que, en
clusiva. el 40% de las calefacciones activadas con energía solar, la
3.4 De acuerdo con la Chemical Engineering Progress (noviem- cuenta por servicio baja considerablemente. De acuerdo con
bre de 1990), aproximadamente 30% de todas las fallas de este argumento, ¿cuál es la probabilidad de que la cuenta
operación de tuberías en plantas químicas son ocasionadas de servicio baje, en cuando menos 5 de una muestra de 50
por errores del operador. Calcular: calefacciones? Hacer este problema usando la distribución
a) La probabilidad de que de las siguientes 20 fallas al me- binomial y después la distribución normal.
nos 10 fallas se deban al error del operador. 3.11 Hacer el mismo problema 3.10, pero usando 50% con n 5 25
b) La probabilidad de que, no más de 4 de 20 fallas se deban y P(X $ 5).
a error del operador. 3.12 Se argumenta que 60% de las instalaciones de calefacción
solar reduce la cuenta por concepto de servicio en al menos
3.5 De acuerdo con un reporte publicado en la revista Parade,
un tercio. En consonancia con esto, ¿cuáles son las probabi-
una encuesta nacional de Estados Unidos de América de la
lidades de que la cuenta de servicio se reduzca en al menos
Universidad de Michigan a estudiantes universitarios del úl-
un tercio en:
timo año, revela que casi 50% fuman marihuana. Si se selec-
a) cuatro de cinco instalaciones?
cionan 12 estudiantes aleatoriamente y se les pide su opinión
b) al menos cuatro de cinco instalaciones?
al respecto, encontrar la probabilidad de que el número que
fuman marihuana todos los días sea: 3.13 En estudios de ingeniería civil, si la probabilidad de que cierta
a) Entre 7 y 9 inclusive. columna de ala ancha caiga bajo una carga axial de 0.05, cal-
b) A lo más 5. cular la probabilidad de que entre 16 columnas de ese tipo:
c) No menos de 8. a) ¿Caigan cuando más dos?
b) ¿Caigan al menos cuatro?
3.6 Un estudio de higiene industrial examinó las actitudes de los
trabajadores industriales acerca de los antidepresivos. Esta 3.14 Considerar el experimento de probar sucesivamente los com-
investigación reveló que, aproximadamente, 70% de los tra- ponentes que salen de una línea de producción deteniéndose
bajadores entrevistados creen que los antidepresivos no curan cuando se encuentra el primer artículo defectuoso. Suponga
nada, sino que sólo encubren el problema real y no ayudan que la probabilidad que un componente sea defectuosos es
a resolver los problemas de trabajo. De acuerdo con esta in- igual a 0.3. Encontrar la probabilidad que se detenga el ex-
vestigación, ¿cuál es la probabilidad de que al menos 3 de los perimento al probar el sexto componente.
siguientes 5 trabajadores seleccionados, aleatoriamente, sean 3.15 Ejemplo adaptado del libro Probability and Statistics for Engi-
de esta opinión? neers and Scientists de Walpole et al. (1993). Se afirma que 2/3
3.7 Con respecto al problema anterior de los antidepresivos, si X de los 20 millones de personas que toman Valium son mu-
representa el número de trabajadores de la industria que cree jeres. Suponiendo que esta afirmación es correcta, encuen-
que los antidepresivos no ayudan a resolver los problemas tre la probabilidad de que en un día determinado la quinta
142 | Estadística para ingeniería y ciencias
persona que se le prescribe Valium sea la primera paciente distribuidor local, 50 tienen defectos leves. Si un motorista
mujer de ese día. compra, al azar, 10 de estas llantas, ¿cuál es la probabilidad
3.16 Un agente vendedor de equipo de laboratorio de química de que 4 de estas llantas estén un poco dañadas? Hacer este
compra un lote de 7 medidores de pH, 3 de los cuales son problema usando la distribución hipergeométrica y la bino-
defectuosos; porque no están bien calibrados. El agente ven- mial.
dedor entrega cinco de estos medidores a un laboratorio; si 3.25 Un fabricante de aparatos de monitoreo ambiental para la
X es el número de medidores defectuosos adquiridos por el medición de monóxido de carbono (CO) sabe que sólo 10%
laboratorio, encontrar el promedio de X. de los aparatos requieren de reparación, dentro del periodo
3.17 Se lanza un dado no cargado; sea X la variable aleatoria que de garantía de un año. Si se saca una muestra al azar de 10
indica la cara del dado que cae hacia arriba. Encontrar el es- de estos aparatos, entonces, calcular:
pacio muestral de este experimento y la función de densidad a) La probabilidad de que cuando menos 3 de los 10 aparatos
de X. requieran de reparación dentro del periodo de garantía.
3.18 Se lanza una moneda no cargada sucesivamente; encontrar b) Si cinco de los 10 aparatos requirieron de reparación en
la probabilidad de que salga la primera cara en el cuarto lan- el primer año, ¿apoyaría esto o refutaría la afirmación del
zamiento. fabricante? ¿Qué significado tiene la probabilidad calcu-
3.19 Suponga que la probabilidad de que una industria en un lada (en cuanto a la afirmación del fabricante de que sólo
complejo industrial esté procesando objetos a base de mer- 10% de los aparatos requieren de reparación dentro de
curio (metal pesado muy peligroso) es igual a 0.01. Bajo el un año), cuando la probabilidad de que cualquiera de los
supuesto que la inspección de las industrias es independien- aparatos requiera de reparación en el periodo de garan-
te, encontrar la probabilidad de que sea imperativo inspec- tía?
cionar exactamente 125 industrias de ese complejo industrial 3.26 Se sabe que 50% de las personas que sufren enfermedades
antes de que se pueda detectar una industria que procese ese genéricas padecen de un tipo de desnutrición no tradicio-
tipo de objetos a base de mercurio. nal. Si se toma una muestra aleatoria de 20 enfermos gené-
3.20 En un complejo industrial hay industrias que emiten 4 to- ricos, encuentre la probabilidad de que:
neladas de SO2 por hora, 5 toneladas de SO2 por hora, 7 a) Todas las personas en la muestra tengan problemas de
toneladas de SO2 por hora, 9 toneladas de SO2 por hora y desnutrición.
10 toneladas de SO2 por hora. Suponga que los 5 tipos de in- b) Cuando menos 15 personas enfermas estén desnutridas.
dustrias tienen la misma probabilidad de ser seleccionadas. c) Ninguna persona esté desnutrida.
Si se escoge una industria al azar del complejo industrial y X 3.27 En una encuesta a cierta universidad del hemisferio norte
indica la cantidad de SO2 que emite la industria selecciona- aplicada a estudiantes del último año revela que casi 40% de
da, entonces: esa población de estudiantes aprueba el consumo diario de
a) Encontrar la función de densidad de X. marihuana. Si se seleccionan al azar 10 estudiantes y se les
b) Dibujar la gráfica de su función de densidad de X. pide su opinión al respecto, calcular las siguientes probabili-
c) Encontrar la media y la varianza de X. dades:
3.21 La probabilidad de que cierta clase de componente resista a) Entre 6 y 8 estudiantes aprueban este hábito diariamente.
una prueba de choque es de 0.55. Encontrar la probabili- b) A lo más 5 estudiantes lo aprueba.
dad de que sobrevivan, exactamente, dos de los siguientes 4 c) No menos de 6 lo aprueban.
componentes que se prueben. 3.28 Supóngase que 0.01 es la probabilidad de que un enfermo,
3.22 La probabilidad de que un paciente se recupere de un pro- quien padece de los síntomas del llamado cáncer hepático,
blema cardiaco es de 0.4. Si se selecciona aleatoriamente pudiera recuperarse. Si se selecciona una muestra aleatoria
una muestra de 15 pacientes con síntomas de problemas car- de 15 enfermos de este síntoma, calcular la probabilidad de
diacos y si X indica el número de paciente que se recuperan, que 3 enfermos se recuperen de este mal.
¿cuál es la probabilidad de: 3.29 Dos éxitos ocurrieron en los primeros 6 ensayos de un pro-
a) P(X $ 10). ceso de Bernoulli con p 5 0.3. Siendo así, calcular la proba-
b) P(3 # X # 8). bilidad de tener 2 éxitos en los siguientes 6 ensayos.
c) P(X 5 5). 3.30 Supóngase que X tiene una distribución Poisson con media
d) P(3 , X , 8). igual a 4. Calcular las siguientes probabilidades:
3.23 Supóngase que X tiene distribución hipergeométrica con a) P(X 5 0).
parámetros N 5 10, M 5 3 y n 5 4 entonces, calcular las b) P(X # 2).
probabilidades para los siguientes valores de X. c) P(X 5 4).
a) X 5 1. d) P(X 5 8).
b) Si el valor de la variable aleatoria X es de cuando menos e) P(X $ 2).
uno.
c) Si P(1 # X # 4). Problemas de tarea
3.24 Un fabricante de llantas para autos reporta que entre un car-
gamento de 600 llantas de la marca Goodyear remitidas a un Revisa tu CD-ROM para encontrar más problemas.
Capítulo 4
Funciones de distribución de
variables aleatorias continuas
Esta fotografía muestra las columnas que sos-
tienen un puente o paso a desnivel, el cual debe
tener la suficiente resistencia para soportar el
tránsito de un innumerable número de autos que
circulen sobre él, la velocidad del viento en ese
lugar, la fuerza de los temblores y otros factores
más. Para la construcción de este tipo de estruc-
(Jupiter Images Corporation)
Introducción
En este capítulo se discutirá el concepto de variable aleatoria continua y las funciones de probabilidad asociadas
a ésta y para explicar mejor estos conceptos se comienza con la definición de intervalo en los números reales.
144 | Estadística para ingeniería y ciencias
Definición 4.1. Dados dos números reales a y b, tales que a , b, se conoce como intervalos a los
conjuntos de números reales definidos como:
• (a, b) 5 {x | a < x < b} intervalo abierto.
• [a, b) 5 {x | a # x < b} intervalo semiabierto o semicerrado.
• (a, b] 5 {x | a < x # b} intervalo semiabierto o semicerrado.
• [a, b] 5 {x | a # x # b} intervalo cerrado.
Estos conjuntos son continuos. observe que si el conjunto incluye los extremos se llama cerrado y si
no los incluye se llama abierto.
Definición 4.2. Una variable aleatoria continua es una variable cuyo rango de valores es un inter-
valo o la unión de dos o más intervalos.
Ejemplo 4.1. E
l tiempo de vida de un componente eléctrico es una variable aleatoria continua por-
que un componente electrónico se puede descomponer en cualquier momento dentro
de un intervalo de tiempo.
Ejemplo 4.2. L
a cantidad de precipitación pluvial en la temporada de lluvia es una variable aleatoria
continua, porque el volumen de agua puede tomar cualquier nivel en un intervalo de
volumen.
Definición 4.3. Se llama función de distribución de la variable aleatoria X a la función que indica su
probabilidad acumulada y se denota con una letra mayúscula.
F ( x) 5 P ( X # x)
c) lím F(x) 5 0
xm
d
d) lím F(x) 5 1
xmd
Definición 4.4. La función de densidad de una variable aleatoria continua es igual a la derivada de
la función de distribución, y se denota con la misma letra, pero minúscula:
d
f ( x) 5 F ( x) (4.1)
dx
En este sentido, una función de densidad no representa propiamente una probabilidad, sin embargo,
satisface las propiedades siguientes:
La primera propiedad se satisface porque la derivada de una función creciente siempre es mayor o igual
a cero. La segunda propiedad se deriva de que la integral sobre todos los reales corresponde a la probabilidad
del espacio muestral.
Por el teorema fundamental del cálculo se sigue que:
x
F ( x) 5 ∫ f (t )dt (4.2)
−∞
Para el cálculo de probabilidades, se utiliza la relación:
b
P(a ≤ X ≤ b) 5 ∫ f ( x)dx 5 F(b) 2 F(a) (4.3)
a
Nótese que en las funciones de densidad continuas se usan integrales donde las funciones de densidad
discretas tienen sumatorias. La probabilidad se puede obtener
P (1 < X < 3)
usando la integral de la función de densidad o la diferencia de 0.045
la función de distribución acumulada evaluada en los extremos 0.04
del intervalo. 0.035
En este sentido, la probabilidad de X corresponde al área 0.03
bajo la curva de la gráfica de la función de densidad en el inter- 0.025
valo correspondiente de acuerdo con la figura siguiente. 0.02
0.015
Figura 4.1. Gráfica que muestra la probabilidad de X co- 0.01
rrespondiente al área bajo la curva de la grá- 0.005
fica de la función de densidad en el intervalo
0
correspondiente. 0 1 2 3 4
146 | Estadística para ingeniería y ciencias
Solución:
∞
El valor de c debe ser tal que se satisfagan las condiciones f (x) $ 0 y ∫ f ( x)dx 51; la
−∞
primera condición implica que c . 0; la segunda condición implica que:
2
2 cx 2
∫ 0
cxdx 5
2 0
5 2c 5 1
1
De donde se concluye que c5 .
2
¯²2e 2 x si x $ 0
f ( x)5 °
²± 0 en otro caso
Solución:
b
Se usa la fórmula P(a , X , b) 5 ∫ f ( x)dx
a
3
a) P(1 , X , 3) 5 ∫ 2e −2 x dx
1
3
5− e −2 x
1
5 − e −6 1 e −2
5 0.3654
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 147
∞
b) P( X . 0.5) 5 ∫ 2e −2 x dx
0.5
∞
5− e −2 x
0.5
5 − 0 1 e −1
5 0.3679
2
c) P(1 , X , 2) 5 ∫ 2e −2 x dx
1
2
5− e −2 x
1
5 − e −4 1 e −2
5 0.3496
Ejemplo 4.5. L
a variable aleatoria X indica la cantidad de tiempo de incubación de bacterias en un
plato de prueba durante 2 horas y su función de densidad es igual a f (x) 5 0.5x, para 0 #
x # 2. Calcular las siguientes probabilidades:
a) P (X # 1)
b) P (0.5 # X # 1.5)
c) P (1.5 , X)
Solución:
1 1
0.5 x 2
a) P (X # 1) 5 ∫ 0.5 xdx 5 5 0.25
0 2 0
1.5 1.5
0.5 x 2
b) P (0.5 # X # 1.5) 5 ∫ 0.5 xdx 5 5 0.5
0.5 2 0.5
2 2
0.5 x 2
c) P (1.5 , X) 5 ∫ 0.5 xdx 5
1.5 2
5 0.4375
1.5
Ejemplo 4.6. E
l error en la reacción de temperatura (en °C) de una incubadora en un laboratorio de
bacteriología para la incubación de un plato de agar es una variable X continua que tiene
x2
una densidad de probabilidad de f (x) 5 cuando −1 , X # 2, y 0 en otro caso. En-
3
contrar la probabilidad de que la temperatura esté entre 0 °C y 1 °C.
Solución:
1 1
x2 x3 1
P(0 , X # 1) 5 ∫0 3 dx 5 5
9 0 9
Ejemplo 4.7. L
a proporción de industrias que responden a cierto cuestionario ecológico es una variable
aleatoria continua X cuya función de densidad es:
148 | Estadística para ingeniería y ciencias
2( x 1 2) / 5 si 0 , x , 1
f ( x) 5
0 en otro caso
Solución:
a) Si f (x) es densidad se deben satisfacer las relaciones f (x) $ 0 para todo real x y
∞
∫ −∞
f ( x)dx 51 .
Observe que la función es mayor o igual que cero, ahora basta probar que la integral de
la función es igual a 1:
1
∞ 1 2( x 1 2) x2 1 4 x 1 1 4 0 1 4(0)
∫ −∞
f ( x)dx 5 ∫
0 5
dx 5
5
5
5
−
5
51
0
Definición 4.6. Se llama función de densidad conjunta de X y Y, f (x, y) a la función definida como:
d2
f (x, y) 5 F ( x, y) (4.6)
dxdy
La función de densidad conjunta de las variables aleatorias X y Y satisface las condiciones:
Ejemplo 4.8. P
ruebe que la siguiente función es una función de densidad conjunta de las variables
aleatorias X y Y.
1
si −1 # x # 1, x − 1 # y # x 11
f ( x, y) 5 4
0 en otro caso
Solución:
1
• La primera condición se satisface, pues . 0.
4
• La segunda condición se satisface porque:
1 x +1 1 1 x +1
∫ ∫
−1 x −1
f ( x, y)dxdy 5
4 ∫−1 ∫ x−1
dydx
x +1
1 x +1 y
5∫ ∫ dx
−1 x −1 4 x −1
1 1
5∫ dx51
−1 2
Se concluye que f (x, y) es función de densidad conjunta de las variables X y Y.
Definición 4.7. Dado el vector aleatorio (X, Y) con función de densidad conjunta dada por f (x, y),
se define
• La función de densidad marginal de X como:
∞
fX ( x) 5 ∫ f ( x, y)dy (4.7)
−∞
Ejemplo 4.9. E
ncontrar las dos funciones de densidad marginal cuando la función de densidad con-
junta está dada por:
1
si −1 # x # 1, x − 1 # y # x 11
f ( x, y) 5 4
0 en otro caso
Solución:
La región donde f (x, y) es positiva es el interior del romboide de la figura 4.2. Es sobre
esta región donde se debe integrar para obtener la función de densidad marginal de X,
al integrar sobre los posibles valores de y:
150 | Estadística para ingeniería y ciencias
Figura 4.2.
y5x11
x51
x +1 x +1
1 y
fX ( x) ∫
x −1
dy
x −1
x 11 x − 1 1
5 − − 1,x,1
5 si 2 x 52 1
4 4 2 y5x21
y +1
x y 11 −1 y 1 2
• Caso 2−2 , y , 0, dx 5 − 5
−1
4 4 4
y12
si −2 , y , 0
4
2− y
fY ( y)5 si 0 # y , 2
4
0 en otro caso
f ( x, y)
si fY ( y) ≠ 0
fX |Y ( x | y) 5 fY ( y) (4.9)
0 si fY ( y) 5 0
De esta definición se obtiene que: f ( x, y) 5 fX |Y ( x | y) fY ( y) .
fX |Y ( x | y) 5 fX ( x) o f ( x, y) 5 fX ( x) fY ( y) (4.10)
Como se puede ver, estas definiciones son iguales que en el caso discreto.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 151
Definición 4.10. El valor esperado o esperanza matemática de la variable aleatoria X cuya función
de densidad es f (x), es igual a:
∞
E( X ) 5 ∫ xf ( x)dx (4.11)
−∞
este valor corresponde a la media teórica de la variable X, y se denota con la letra griega µ. E(X ) es
una medida de posición.
Ejemplo 4.10. E
ncontrar el valor esperado de la variable aleatoria cuya función de densidad es
igual a:
−2 x
f ( x)5
0 en otro caso
Solución:
∞ ∞ ∞
e −2 x 1
µ5 E( X ) 5 ∫ xf ( x)dx 5 ∫ x 2e −2 x dx 5 − xe −2 x 5
−∞ 0
2 0
2
Definición 4.11. Si X es una variable aleatoria con función de densidad f (x), entonces el valor espe-
rado de g(X ) es igual a:
(4.12)
Definición 4.12. Si X y Y son variables aleatorias con función de densidad conjunta igual a f (x, y),
entonces el valor esperado de g(X, Y) es igual a:
∞
E( g ( X , Y )) 5 ∫ −∞
g ( x, y) f ( x, y)dxdy (4.13)
En todos los casos, el valor esperado corresponde a la media aritmética teórica de la variable aleatoria
que se esté considerando.
Teorema 4.1. (Propiedades del valor esperado) Sean X y Y dos variables aleatorias y c una constan-
te, entonces, se satisfacen las relaciones:
1. E(c) 5 c
152 | Estadística para ingeniería y ciencias
2. E(cX ) 5 cE(X )
3. E(X + Y ) 5 E(X ) 1 E(Y )
4. E(XY ) 5 E(X )E(Y ), cuando las variables aleatorias X y Y son independientes.
Demostración:
a) Si g (x) 5 c, entonces por la definición 4.11 se sigue que:
∞ ∞
E( g ( X )) 5 ∫ cf ( x)dx 5 c ∫ f ( x)dx 5 c
0 0
∞ ∞
∫-∞
xf ( x)dx 1 ∫ yf ( y)dy 5 E( X ) 1 E(Y )
-∞
Teorema 4.2. La varianza de la variable aleatoria X se puede calcular con la fórmula equivalente:
∞
V ( X ) 5 E( X 2 ) − (E( X ))2 5 ∫ x 2 f ( x)dx − (E( X ))2 (4.15)
−∞
Demostración:
∞
V ( X ) 5 E( X − E( X ))2 5 ∫ ( x − E( X ))2 f ( x)dx
−∞
∞
5 ∫ ( x 2 − 2 xE( X ) 1(E( X )2 ) f ( x)dx
−∞
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 153
∞
5 ∫ ( x 2 f ( x) − 2 xE( X ) f ( x) 1(E( X )2 f ( x))dx
−∞
∞ ∞ ∞
5 ∫ x 2 f ( x)dx − 2 E( X ) ∫ xf ( x)dx 1(E( X ))2 ∫ f ( x)dx
−∞ −∞ −∞
∞
5 ∫ x 2 f ( x)dx − 2 E( X )E( X ) 1(E( X ))2
−∞
∞
5 ∫ x 2 f ( x)dx − (E( X ))2
−∞
Ejemplo 4.11. S
e están lanzando dardos a una ruleta giratoria. Sea X la variable que indica la dis-
tancia entre el punto donde cayó el dardo y el centro de la ruleta, suponiendo que la
función de densidad de X es igual a:
6 x(1 − x) si 0 , x , 1
f ( x) 5
0 en otro caso
Encontrar la media y la varianza de X.
Solución:
La media es:
1
1 1 3x 4 3 1
E( X ) 5 ∫ xf ( x)dx 5 ∫ 6 x (1 − x)dx 5 2 x −
2 3
52 − 5
0 0 2 0 2 2
Para la varianza primero se calcula:
1
1 1 3x 4 6 x 5 3 6 15 − 12 3
E( X ) 5 ∫ x f ( x)dx 5 ∫ 6 x (1 − x)dx 5
2 2 3
− 5 − 5 5 5 0.3
0 0 2 5 0 2 5 10 10
y, finalmente,
σ2 5 V(X) 5 E(X2) 2 (E(X))2 5 0.3 2 0.52 5 0.05
b) V(cX) 5 E(cX 2 E(cX))2 5 E(cX – cE(X))2 5 E(c2(X 2 E(X))2) 5 c2E(X – E(X))2 5 c2V(X)
c) V(X 1 c) 5 E(X 1 c 2 E(X 1 c))2 5 E(X 1 c 2 E(X) − c))2 5 E(X 2 E(X))2 5 V(X)
d) Cuando X y Y son variables aleatorias independientes se tiene que f ( x, y) 5 fX ( x) fY ( y) , entonces
4.2.3 Covarianza
La covarianza de dos variables aleatorias continuas tiene una definición semejante a la del caso discreto.
Teorema 4.4. La covarianza de dos variables aleatorias se puede calcular también con la fórmula
equivalente:
∞ ∞
Cov( X ,Y ) 5 E( XY ) − E( X )E(Y ) 5 ∫ ∫ xyf ( x, y)dxdy − E( X )E(Y ) (4.17)
−∞ −∞
Demostración:
Cov( X ,Y ) 5 E( X − E( X ))(Y − E(Y )) 5 E( XY − XE(Y ) − YE( X ) 1 E( X )E(Y ))
5 E( XY ) − E( XE(Y )) − E(YE( X )) 1 E(E( X )E(Y )) (se separan las sumas)
5 E( XY ) − E(Y )E( X ) − E( X )E(Y ) 1 E( X )E(Y ) (se sacan las constantes)
5E( XY ) − E(Y )E( X )
Ejemplo 4.12. Sean X y Y variables aleatorias con función de densidad conjunta dada por:
1
si −1 # x # 1, x − 1 # y # x 11
f ( x, y) 5 4
0 en otro caso
Encontrar la covarianza de X y Y.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 155
Solución:
Para calcular la covarianza se utiliza la segunda fórmula. Primero se obtienen las
medias de X y Y y el valor esperado de XY.
E(X) 5
E(Y) 5
E(XY) 5
Demostración:
a) Debido a que X y Y son independientes se tiene que E(XY) 5 E(X)E(Y), por tanto:
Cov( X ,Y ) 5 E( XY ) − E( X )E(Y )
5 E( X )E(Y ) − E( X )E(Y ) 5 0
Ejemplo 4.13. Sea X y Y variables aleatorias con función de densidad conjunta dada por:
1
si x 2 1 y2 # 1
f ( x, y)5 π
0 en otro caso
a) Compruebe que X y Y no son independientes.
b) Encuentre la covarianza de X y Y.
Solución:
a) Para probar que X y Y no son independientes, se debe ver que f (x, y) ≠ fx(x)fy(y).
Para encontrar las funciones de densidad marginales de X y Y se debe integrar a x en
el rango − 1 − y2 # x # 1 − y2 y a y en el rango − 1 − x 2 # y # 1 − x 2 .
1 dy 5 2 1 − y
2
1 dy 5 2 1 − x y f ( y)5
2
1− x 2 1− y2
fX ( x)5 ∫
− 1− x 2
π π Y ∫− 1− y 2
π π
con esto se obtiene f (x, y) ≠ fx(x)fy(y) y se concluye que X y Y no son independientes.
1− x 2
1 1− x 2 y y2 1
b) E( X )5 ∫−1 ∫− dydx 5 ∫ dx 5 0 de la misma manera se llega a
1− x 2 π −1
2π − 1− x 2
−1 # rxy # 1 (4.19)
Demostración:
Considérese las variables Z1 5 (X − µx) /σx y Z2 5 (Y 2 µy) /σy, donde µx 5 E(X), σx2 5 V(X), µy 5
E(Y) y σy2 5 V(Y),
observe que:
µ1 5 E(Z1) 5 E[(X 2 µx) /σx] 5[E(X) 2 µx] /σx 5 0; de la misma manera µ2 5 E(Z2) 5 0.
Entonces V(Z1) 5 E(Z1 − E(Z1))2 5 (E(Z1)2 5 E((X 2 µx) /σx)2 5 E((X 2 µx)2) / V(X) 5 1, de la misma
manera V(Z2) 5 1.
Por tanto, Cov(Z1, Z2) 5 E[(Z1−µ1)(Z2 2 µ2)] 5 E(Z1Z2).
Por otro lado, se sabe que (Z1 ± Z2)2 $ 0, entonces E[(Z1 ± Z2)2] $ 0.
Al desarrollar el cuadrado y aplicar las propiedades del valor esperado, se tiene que:
E[(Z1− Z2)2] 5 E[(Z1)2 ± 2 Z1 Z2 + (Z2)2]
5 E[(Z1)2] ± 2Ε(Z1 Z2) + E[(Z2)2]
5 V(Z1) ± 2Cov(Z1 Z2) + V(Z2)
5 1 ± 2Cov(Z1 Z2) + 1
5 2(1 ± Cov(Z1 Z2)) $ 0
De esto se obtienen dos desigualdades:
1 + Cov (Z1 Z2)) $ 0 implica que −1 # Cov (Z1,Z2).
1 − Cov (Z1 Z2)) $ 0 implica que Cov (Z1,Z2) # 1.
De las dos desigualdades resulta: −1 # Cov (Z1,Z2) # 1.
Cov (Z1,Z2) 5 E(Z1Z2) 5 E[(X 2 µx) /σx] [(Y 2 µy ) /σy]
5 E[(X 2 µx)(Y 2 µy)] /σxσy
5 Cov (X, Y)/σxσy 5 rxy
Corolario 4.1. Dadas X y Y variables aleatorias se tiene que rxy 5 ±1 si y sólo si X 5 aY + b, con a
y b constantes.
Demostración:
E[(Z1 ± Z2)2] 5 0 si y sólo si Z1 = ±Z2, entonces (X 2 µx) /σx 5 ±(Y 2 µy) /σy; al despejar de esta ecua-
ción la variable X, se obtiene:
σx σx
X 5± Y µ y 1µ x
σy σy
{
a b
158 | Estadística para ingeniería y ciencias
Definición 4.17. Dada X variable aleatoria con función de densidad f (x), se llama función genera-
triz de momentos de X a la función MX(t) definida como MX(t) 5 E(eXt).
El nombre de función generatriz de momentos se justifica en que a partir del desarrollo en series
de potencia de la función exponencial
t 2 E( X 2 ) t 3 E( X 3 ) t 4 E( X 4 )
MX (t ) 5 E(etX ) 51 1 tE( X ) 1 1 1 1. . . (4.21)
2! 3! 4!
Conocida la función generatriz de momentos, se pueden obtener los momentos de orden i, derivando
esta función y evaluando en t 5 0; como se indica en el siguiente teorema.
dk
M (t ) 5 E ( X k ) (4.22)
dt k X t =0
Demostración:
dk E( X k +2 )
M (t ) 5 E( X k ) 1 tE( X k +1 ) 1 t 2 1... 5 E( X k )
dt k X t =0
2! t =0
El siguiente teorema se aplica para identificar la función de distribución de una variable aleatoria.
Ejemplo 4.14. C
alcular la función generatriz de momentos de la variable aleatoria X cuya función
de densidad está dada por:
−2 x
f ( x)5
0 en otro caso
Solución:
∞
∞ ∞ 2 e( t − 2 ) x 2
MX (t ) 5 E(etX ) 5 ∫ etx 2e −2 x dx 5 ∫ 2e( t −2 ) x dx 5 5
0 0 t −2 0
2−t
Definición 4.18. Se conoce como variable aleatoria uniforme continua en el intervalo (a, b) a la
variable X que tiene función de densidad igual a:
1
si a # x # b
f ( x)5 b − a (4.23)
0 en otro caso
Teorema 4.9. Si X es una variable aleatoria uniforme en (a, b), entonces su media, varianza y su
función generatriz de momentos son iguales a:
µ 5 (a 1 b)/2
σ2 5 (a − b)2/12
etb − eta
MX(t) 5 (4.24)
t (b − a )
Demostración:
b
b x x2 b2 − a 2 (a − b)(a 1 b) a 1 b
µ 5 E(X ) 5 ∫a b− a
dx 5 5
2(b − a) a 2(b − a)
5
2(b − a)
5
2
4(a 2 1 ab 1 b2 ) − 3(a 2 1 2 ab 1 b2 )
5
12
a 2 − 2 ab 1 b2
5
12
(b − a ) 2
5
12
Tabla 4.1.
etb − eta
Función generatriz de momentos MX (t)5
5
t (b − a )
Ejemplo 4.15. Sea X una variable aleatorias uniforme en el intervalo [2, 4]; (X , U(2, 4)). Calcular:
a) P(2.3 # X # 3.4)
b) Graficar f (x)
c) La media de X
d) La varianza de X
e) La función generatriz de momentos
Solución:
3.4
3.4 1 x 3.4 − 2.3 1.1
a) P(2.3 # X # 3.4) 5 ∫2.3 4−2
dx 5
2
5
2
5
2
5 0.55
2.3
e) MX(t) 5 e − e 5 e − e
t4 t2 4t 2t
0.1
t ( 4 − 2) 2t
0
Figura 4.3. 0 1 2 3 4 5 6 7
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 161
Definición 4.19. Se dice que una variable aleatoria continua X está exponencialmente distribuida si
su función de densidad es:
f (x) 5 e2λx para X $ 0 con λ $ 0 (4.25)
Donde:
λ es el parámetro de la distribución.
Considerando la definición de función de distribución, se tiene que:
F(x) 5
P(X $ x) 5 e2λx
Teorema 4.10. Sea X una variable aleatoria exponencial con parámetro λ, entonces su media,
varianza y función generatriz de momentos son iguales a:
µ 5 1/λλ
σ2 5 1/λ2
MX(t) 5 λ/(λ − t) (4.26)
Demostración:
∞ e − λx ∞ 1
µ 5 E(X) 5 ∫0
λ x2e− λ xdx 5 −
λ
− xe − λ x 5
0 λ
2 1 1
5 − 5
λ2 λ2 λ2
162 | Estadística para ingeniería y ciencias
Tabla 4.2.
λ
Función generatriz de momentos MX (t)
5 ;t,λ
λ−t
Ejemplo 4.16. S
ea X la variable aleatoria que indica el tiempo en años en que un componente elec-
trónico se mantiene en servicio, X se distribuye de acuerdo con una exponencial con
parámetro λ 5 0.2. Calcular la probabilidad de que:
a) El componente se mantenga trabajando después de cumplir dos años.
b) El componente esté funcionando entre tres y cuatro años.
c) El componente deje de funcionar antes de cumplir el año.
Solución:
a) El componente se mantenga trabajando después de cumplir dos años.
∞ ∞
P(X . 2) 5 ∫ 2
λe − λx dx 5 −e −0.2 x 5 e −0.4 5 0.67
2
La distribución exponencial es una Gráfica de curvas exponenciales de densidad para valores lambda 5 2, .5, 1
0.5 0.5
Figura 4.4. Gráfica con curvas de funciones
de probabilidad de densidad de la 0.0 0.0
distribución exponencial con dife- 0 2 4 6 8 10
Variable aleatoria X
rentes valores de λ.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 163
Ejemplo 4.17. E
l tiempo en años que tarda una sustancia radiactiva en degradarse se distribuye ex-
ponencialmente con función de densidad:
1 12x/15
f (x) 5 e para x . 0
15 5
¿Cuál es la probabilidad de que el tiempo que tarda en degradarse sea...
a) A lo más de 6 años?
b) Entre 6 y 18 años?
Solución:
6 6
a) P(X # 6) 5 ∫0
λe − λx dx 5 −e − x/15 51 − e −6/15 5 0.3297
0
18
x 6 18
18 − − −
∫ 5 0.6988 − 0.3297 5 0.3691
− λx
b) P(6 # X # 18) 5 λe dx 5 −e 15
5e 15
−e 15
6
6
Ejemplo 4.18. E
l tiempo requerido para que ocurra una reacción química está exponencialmente
distribuido con un tiempo esperado de 5 minutos.
a) ¿Qué proporción de la sustancia se formará dentro de 1 minuto?
b) ¿Dentro de 5 minutos?
c) ¿Entre 4 y 8 minutos?
Solución:
1 1 1
Se sabe que el valor esperado es igual a E(X ) 5 5 5, por lo que λ 5 5 0.20;
λ 15 5
entonces:
a) P(X # 1) 5 1 2 e−0.20(1) 5 0.1813
b) P(X # 5) 5 1 2 e−0.20(5) 5 0.6321
c) P(4 , X , 8) 5 e−0.20(4) 2 e−0.20(8) 5 0.2474
Demostración:
a) Al aplicar integración por partes a la función gamma, se tiene que:
u 5 xα 21 du 5 (α 2 1)xα22
dv 5 e–x v 5 2e2x
∞ ∞ ∞
∫
0
x α−1e − x dx 5 − x α−1e − x 1(α − 1) ∫ x( α−1)−1e − x dx 5 (a 2 1) G(G 2 1)
0 0
b) Para n entero mayor que 1, se satisface la relación anterior, esto es GГ(n) 5 (n 2 1) 2 G(n 2 1); de
esta manera, aplicando la misma relación repetidamente se llega a que:
c) Para demostrar que G(0.5) 5 π, se requiere aplicar la técnica de cambio de variable en la inte-
1 1 1 1
2 2
gración; al hacer el cambio de variable u 5 x , se
x tiene que 2dux5 x dx, entonces:
2 2 2 2
∞
El siguiente paso es calcular la integral I 5 ∫ e − u du como una integral iterada doble:
2
∞ ∞ ∞ ∞
I 2 5 ∫ e − u du ∫ e − v dv 5 ∫ ∫
2 2 2 2
e − ( u +v )dudv
0 0 0 0
π
De esto se obtiene que: Γ(0.5) 5 2 I 5 2 5 π , lo cual se quería probar.
2
Definición 4.21. Una variable aleatoria X tiene distribución gamma si su función de densidad es:
La función f (x) satisface la primera propiedad de una función de densidad, ya que es positiva; para ver
que también cumpla con la segunda propiedad se aplica el cambio de variable y 5 x/b, se sigue que
dy 5 dx/ b, entonces se obtiene la función gamma dividida entre la función gamma que da igual a 1.
h x F 1 e x /b hx
F 1 y
e
µ 0 F
b ,( F)
dx 5 µ0 , (F )
dy 51 (4.29)
la distribución gamma se convierte en la distribución exponencial. Esto se ve en la figura 4.5.
La siguiente figura presenta la función de densidad gamma para diferentes valores de los pará-
metros α y b.
a) b)
Gráfica sobrepuesta
Gráfica sobrepuesta de fdp gamma
de fdp gamma vs. diferentes
vs. diferentes valores
valores de alfa yde alfa y beta
beta Gráfica sobrepuesta
Gráfica sobrepuesta de fdp gamma
de fdp gamma incompleta
incompleta vs. de
vs. valores valores
alfa de alfa
alfa 5
Prob. densidadProb. densidad
alfa 5 .6 alfa 5 .6
Prob. densidadProb. densidad
alfa 5 2, beta alfa
5 25 2, beta 5 2
0.6 0.6 Prob. densidadProb. densidad
alfa 5 2 alfa 5 2
0.6 0.6 Prob. densidadProb. densidad
alfa 5 2, beta alfa
5 15 2, beta 5 1 0.8 0.8 0.8 0.8
Prob. densidadProb. densidad
alfa 5 5 alfa 5 5
Teorema 4.12. Si X es una variable aleatoria que se distribuye como una gamma con parámetros α
y β, entonces la media, la varianza y la función generatriz de momentos de X es:
E(X) 5 µ 5 αβ,
V(X) 5 σ2 5 αβ2
MX(t) 5 (1 − tβ)2α (4.30)
Demostración
h x F 1 e x /b
Para encontrar la media, la varianza y la función generatriz de momentos se utiliza µ 0 bF ,( a)
dx 51
para todos los valores de α y β positivos.
∞ ∞ xx α−1e − x/β ∞ x
( α +1 )−1 − x /β
e
E(X) 5 ∫0
xf ( x)dx 5 ∫
0 α
β Γ (α )
dx 5 αβ ∫0 α +1
β Γ(α 11)
dx 5 αβ
∞ ∞ x 2 x α − 1 e − x /β ∞ x
( α + 2 )−1 − x /β
e
E(X2) 5 ∫ x 2 f ( x)dx 5 ∫ α
dx 5 α ( α 1 1)β 2
∫ α+2
dx 5 α(α 11)β 2
0 0 β Γ (α ) 0 β Γ (α 1 2 )
Entonces, la varianza es:
σ2 5 E(X 2) 2 (E(X ))2 5 α(α 1 1)β2 − α2β2 5 αβ2
La función generatriz de momentos es:
∞ ∞ etx x α−1e − x/β tx α −1 x ( t −1/β )
∞e x e
MX(t) 5 ∫0
etx f ( x)dx 5 ∫
0 α
β Γ (α )
dx 5 ∫0 α
β Γ (α )
dx
*
∞ x α−1e − x/β
tβ −α
∫ dx tβ −α
, donde β* 5 β/(1−tβ)
0 β * α Γ (α )
Tabla 4.3.
x α − 1 e − x /β
f (x) 5 α si x . 0, con α, β . 0
Función de densidad β Γ (α )
f (x) 5 0 en cualquier otro caso
Media µ 5 αβ
Varianza σ2 5 αβ2
Función generatriz de momentos MX (t) 5 (12tβ)2α; t , 1/β
Definición 4.22. Se conoce como distribución gamma estándar a la distribución gamma con b 5 1.
Ejemplo 4.19. S
ea X una variable aleatoria con función de distribución gamma estándar con pará-
metro α 5 3, calcular:
a) La probabilidad de que X esté entre 4 y 5.
b) La probabilidad de que X sea mayor que 4.
Solución:
Para obtener los cálculos, se usa la tabla de la distribución gamma que se incluye en
el apéndice de este libro o usando Excel o Minitab, de acuerdo con las instrucciones
que vienen en la última sección de este capítulo. Para ello, se utiliza la fórmula P(a #
X # b) 5 F(b) 2 F(a).
a) P(4 # X # 5) 5 F(5) 2 F(4)
5 0.875 2 0.762 5 0.113
b) P(X . 4) 5 1 2 P(X # 4) 5 1 2 F(4) 5 1 − 0.762 5 0.238
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 167
Ejemplo 4.20.* S
ea X el tiempo de supervivencia, en días, de los conejillos de indias expuestos a una
radiación gamma de 400 rads (dosis de radiación absorbida). Se supone que X sigue
a una distribución gamma con parámetros α 5 10 y β 5 20.
a) Calcular la media y la varianza de la supervivencia.
b) Calcular la probabilidad de que un conejillo sobreviva entre 80 y 120 días.
c) Calcular la probabilidad de que un animal sobreviva cuando menos 20 días.
Solución:
De acuerdo con las fórmulas obtenidas,
a) La media de X es E(X) 5 µ 5 αβ 5 (10)(20) 5 200 días.
La varianza es V(X) 5 σ2 5 αβ2 5 (10)(20)2 5 4 000.
Para saber la variación promedio de la supervivencia en días se debe obtener la
desviación estándar, σ 5 63.25 días.
b) P(80 # X # 120) 5 F(120/20, 10) 2 F(80/20, 10)
5 F(6, 10) 2 F(4, 10)
5 0.084 2 0.008 (de la tabla de la distribución de gamma)
5 0.076
c) P(X $ 20) 5 1 2 P(X , 20) 5 1 2 F(20/20, 10)
≈ 0.000 (de la tabla de la distribución gamma)
Ejemplo 4.21. S
upóngase que el consumo de electricidad X en kilowatts-hora, sigue a una distribu-
ción gamma con parámetro de forma α 5 3 y parámetro de escala β 5 3. Encontrar:
a) La media y la varianza de X.
b) La probabilidad de que en cierto día el consumo de electricidad sea mayor que 15
kilowatts-hora.
c) La probabilidad de que el consumo diario de electricidad sea de cuando menos
20 kilowatts-hora.
d) La probabilidad de que el consumo por día esté entre 30 y 50 kilowatts-hora.
Solución:
Para calcular la media y la varianza µ y σ2 se utilizan las fórmulas: µ 5 αβ y que
σ2 5 ααβ2.
a) μ 5 (3)(3) 5 9 y σ2 5 (3)(3)2 5 27
b) P(X . 15) 5 0.4490
c) P(X $ 20) 5 0.2928
d) P(30 # X # 50) 5 0.0797
*Problema adaptado de Probabilidad y estadística para Ingeniería y Ciencias de J. L. Devore, Thomson (2001).
168 | Estadística para ingeniería y ciencias
Definición 4.23. La variable aleatoria X se distribuye de acuerdo con una distribución Weibull si su
función de densidad es:
α
αx α−1e − ( x/β )
f (x) 5 α (4.31)
β
1.6 1.6
1.0 1.0
Datos Y
0.8 0.8
0.6 0.6
0.4 0.4
0.2 0.2
0.0 0.0
0 1 2 3 4 5 6
Figura 4.6. Gráfica que muestra la curva de densidad de Weibull. Nótese que cuando α 5 1,
la curva se torna exponencial.
El siguiente teorema muestra una forma simple de la función de distribución acumulada Weibull, lo que
ayudará a calcular las probabilidades de que X esté en cualquier intervalo.
Teorema 4.13. La función de distribución acumulada de una variable aleatoria Weibull con pará-
metros α y β es:
Demostración:
La demostración es directa, por tanto sólo es necesario derivar esta función respecto a x y ver que el
resultado es la función de densidad Weibull.
El resultado de este teorema permite tener una manera directa de calcular probabilidades para la
variable aleatoria Weibull mediante la fórmula:
Teorema 4.14.
Si X es una variable aleatoria Weibull, entonces su media y varianza son:
1
E(X) 5 µ 5 Γ( 11)
2 α 1
V(X) 5 Γ( 11) [Γ( 11)]2 (4.33)
α α
Demostración:
α
∞ ∞ x α e2( x /β )
E(X) 5 ∫ 0
xf ( x)dx 5 ∫
0 βα
dx
x dx
Si se hace el cambio de variable u 5 ( )α se tiene que du 5 xα−1 α y, por tanto, la integral se
β β
convierte en:
∞ 1
E(X) 5 ∫0
u(1/α+1)−1e − udu 5 Γ(
α
11)
Para calcular la varianza se determina primero E(X 2), en donde se usa el cambio de variable
x
u 5 ( )α
β
α
α + 1 − ( x /β )
∞ ∞x e ∞ 2
E(X 2) 5 ∫ x 2 f ( x)dx 5 ∫ dx 5 ∫ u( 2/α+1)−1e − udu 5 Γ( 11)
0 0 βα 0 α
α
x α−1e − ( x/β )
f (x) 5
α
si x . 0, con α, β . 0
Función de densidad β
f (x) 5 0 en cualquier otro caso
La función generatriz de momentos no tiene una expresión simple, por tal razón no la incluimos.
170 | Estadística para ingeniería y ciencias
Ejemplo 4.22.* S
ea X una variable aleatoria con función de distribución acumulada Weibull con
parámetros α 5 20 y β 5 100. Calcular:
a) P(X # 105)
b) P(98 # X # 102)
Solución:
105 20
a) P(X # 105) 5 F(105; 20, 100) 5 1 2 exp[−( ) ]
100
5 1 2 0.070 5 0.930
b) P(98 # X # 102) 5 F(98; 20, 100) 2 F(102; 20, 100)
98 20 102 20
5 exp[2( ) ] 2 exp[2( ) ]
100 100
5 0.513 2 0.226
5 0.287
Definición 4.24. La variable aleatoria X se distribuye según una normal con parámetros µ y σ, si la
función de densidad de X es:
1
e − ( x−µ ) /2 σ para 2` , x , `, con 2` , µ , ` y σ . 0
2 2
f ( x) 5 (4.34)
2 πσ
Se utiliza la expresión: Densidad Normal
X ~ N(µ, σ2)
para indicar que X es normal con parámetros µ y σ2.
La gráfica de la función de densidad normal es simé- s
trica con respecto al parámetro µ; la amplitud de la
gráfica está dada por el parámetro σ.
m
Figura 4.7.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 171
La probabilidad de que X esté en un intervalo es igual al área bajo la curva de la función de densidad.
Entonces se observa que:
mm mm
Figura 4.8.
El área bajo la curva antes de µ es igual al área después de µ: P(X , µ) 5 P(X . µ) 5 0.5.
El área antes de µ − a y área después de µ + a son iguales:
P(X , µ 2 a) 5 P(X . µ 1 a)
m2a m m1a
Figura 4.9.
Para intervalos de igual longitud, si el intervalo está más cerca de µ, el área correspondiente es
mayor que si se está lejos de µ. En la gráfica se ve que b – a 5 d 2 c, pero:
P(a , X , b) , P(c , X , d)
a b c m d
Figura 4.10.
Por ser la normal una función de densidad se tiene que el área total bajo la curva normal es igual que 1.
172 | Estadística para ingeniería y ciencias
Teorema 4.15. Si X es una variable aleatoria normal con parámetros µ y σ2, entonces la media, va-
rianza y función generatriz de momentos de X son:
E(X) 5 µ
V(X) 5 σ2
t 2σ 2
tµ1
Mx(t) 5 e 2 (4.35)
Demostración:
Se calcula el valor esperado E(X − µ ) 5 E(X) − µ y se utiliza el cambio de variable: y 5 x 2 µ, lo
que implica que dy 5 dx.
∞ 1 ∞
E(X − µ ) 5 ∫ ∫
2 2
( x − µ) f ( x)dx 5 ( x − µ)e − ( x−µ ) /2 σ dx
−∞ 2 πσ −∞
∞
1 ∞ 1
2 πσ ∫−∞
2 2 2 2
5 ye − y /2 σ dy 5 e − y /2 σ 50
2 πσ −∞
∞
σ2 σ2 ∞
∫
2 2 2 2
5 ye − y /2 σ 1 e − y /2 σ dy 5 σ 2
2 πσ −∞
2 πσ −∞
t 2S 2
t M t 2S 2
e 2 d t M
2 PS °0
5
2 2 2
e
( y
t S ) /2 S 2
dy 5 e 2
Tabla 4.5.
1 2 2
Función de densidad e − ( x−µ ) /2 σ si 2` , x , ` con σ . 0
f (x) 5
2 πσ 2` , µ , `
Media µ
Varianza σ2
t 2S 2
tM1
Función generatriz de momentos MX (t) 5 e 2
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 173
f (z)
68.27%
En estas gráficas se observa que, aproximadamente, 68.27% de los valores de los datos están dentro de
una desviación estándar a cada lado de la media; aproximadamente, 95.45% de los valores están dentro de dos
desviaciones estándar en cada lado de la media; y aproximadamente, 99.73% de las observaciones están dentro
de tres desviaciones estándar de la media.
Teorema 4.16. Si X ~ N(µ, σ2), entonces la variable Z definida como Z 5 (X 2 µ)/σ se distribuye
como una normal con media 0 y varianza 1; esto es, Z ~ N(0, 1).
Demostración:
Para probar este resultado primero se encuentra la función de distribución Z en términos de la función
de distribución de X, a partir de la definición de la función de distribución como la probabilidad acu-
mulada de Z:
FZ(z) 5 P(Z # z) 5 P((X 2 µ)/σ # z) 5 P(X # zσ 1 µ) 5 FX(zσ 1 µ)
d d
fZ (z) 5 FZ (z) 5 FX (zσ 1 µ) 5 fX (zσ 1 µ)σ
dz dz
1 2 2 1 − z2 /2
5 e − ( zσ + µ − µ ) / 2 σ × σ 5 e
2 πσ 2π
174 | Estadística para ingeniería y ciencias
Definición 4.25. La distribución normal con media µ 5 0 y varianza σ2 5 1 se conoce como normal
estándar.
Nota: La distribución normal estándar se denota como φ(z) 5 P(Z # z).
En el apéndice se anexa una tabla de la distribución normal estándar, con ella se resuelven los siguientes
ejemplos.
Ejemplo 4.23. S
ea Z una variable aleatoria con distribución normal estándar. Encontrar el área bajo
la curva que esté entre z 5 −1.97 y z 5 0.86.
Solución:
El área entre z 5 −1.97 y z 5 0.86 es igual a la probabilidad:
P(−1.97 , Z , 0.86) 5 φ(0.86) 2 φ(−1.97)
5 0.8051 2 0.0244 5 0.7807
Estos valores se encuentran en la tabla de la normal estándar.
Ejemplo 4.25. S
ea Z la variable aleatoria, tal que Z ~ N(0, 1). Encontrar su gráfica y la probabilidad
que esté entre z 5 −1.73 y z 5 12.45.
Solución:
P(−1.73 # Z # 2.45) 5 φ(2.45) 2 φ(−1.73)
5 0.9929 − 0.0418
5 0.9511
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 175
21.73 0 2.45
Solución:
En la tabla de la distribución normal se busca el valor de la variable aleatoria z 5 −1.96:
P(z , −1.96) 5 φ(−1.96) 5 0.0250
Solución:
Se busca el valor de z 5 −2.58 en la tabla de la normal estándar:
P(z , −2.58) 5 φ(−2.58) 5 0.005
Ejemplo 4.28. Calcular la probabilidad de que la variable z esté entre −0.5 y 1.25.
Solución:
P(−0.5 , z , 1.25) 5 φ(1.25) 2 φ(−0.5) 5 0.8944 2 0.3085 5 0.5859
z
20.5 1.25
Solución:
(19 2 24) 25
z 5 (X 2 µ) / σ 5 5 5 −1.67
3 3
176 | Estadística para ingeniería y ciencias
.4772 .4772
Ejemplo 4.32. S
e sabe que el coeficiente intelectual de un grupo de personas se distribuye como una
normal con parámetros µ 5 120 y σ 520. ¿Cuál es la probabilidad de que una persona
elegida al azar de esa población tenga un coeficiente intelectual entre 80 y 140 puntos?
Solución:
Buscar la probabilidad P(80 , X , 140), estandarizando la variable se obtiene:
P(80 , X , 140) 5 P(−2 , Z , 1) 5 φ( 2) 2 φ(− 1) 5 0.9772 2 0.1587 5 0.8185.
Esto significa que cerca de 82% de la población tiene un IQ entre 80 y 140 puntos.
Ejemplo 4.33. L
a intensidad del viento en m/s se distribuye normalmente con parámetros µ 5 10 y
σ2 5 4.
a) ¿Qué porcentaje (probabilidad) de la intensidad del viento cae entre 9 y 14 m/s?
b) ¿Entre 13 y 15 m/s?
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 177
Solución:
a) P(9 # X # 14) 5 P(20.5 # Z # 2) 5 0.9772 − 0.3085 5 0.6687 5 66.87%
b) P(13 # X # 15) 5 P(1.5 # Z # 2.5) 5 0.9938 2 0.9332 5 0.06 5 6%
o Za
Figura 4.15.
Hasta ahora, los problemas presentados tienen como finalidad hallar la probabilidad α conociendo el
valor de zα.
En esta sección se debe encontrar el valor de zα conociendo el valor de α, de ahí el nombre de distribución
normal inversa. En este caso los problemas se reducen a encontrar el valor de z que satisfaga alguna de las
cuatro relaciones siguientes:
P(Z , z) 5 α, P(Z . z) 5 α, P(−z , Z , z) 5 α o P(0 , Z , z) 5 α (4.37)
cuando el valor de α es conocido.
Ejemplo 4.34. Considerar a Z , N(0, 1) y encontrar el valor de z, tal que P(Z , z) 5 0.05.
Solución:
La probabilidad P(Z , z) es acumulada, por lo que coincide con la función de distri-
bución acumulada normal. Se busca en la tabla de la distribución normal en la colum-
na de probabilidad (área) al valor más cercano a 0.05, en este caso hay dos valores:
z 5 −1.65 con probabilidad P(Z , −1.65) 5 0.0495 y
z 5 −1.64 con probabilidad P(Z , −1.64) 5 0.0505
Como 0.0495 , 0.05 , 0.0505, entonces el valor de z que se busca debe estar entre
−1.65 y −1.64, de esta manera se acuerda que z sea el promedio de estos dos números.
Resultado:
z 5 −1.645; P(Z , −1.645) 5 0.05
178 | Estadística para ingeniería y ciencias
Ejemplo 4.35. Considere a Z , N(0, 1). Encontrar el valor de z, tal que P(Z . z) 5 0.6305.
Solución:
La probabilidad que se pide no se puede determinar directamente en la tabla, pues
ésta sólo da probabilidades acumuladas para Z # z. Si se considera el complemento
de esta probabilidad, se tiene que:
P(Z # z) 5 1 − P(Z . z) 5 1 − 0.6305 5 0.3695
Entonces se busca en la tabla el valor de z que corresponde a la probabilidad 0.3695, y
en la columna área se ve el valor de z. En este caso también hay dos valores cercanos
a 0.3695:
z 5 −0.34 con probabilidad P(Z , −0.36) 5 0.3669.
z 5 −0.33 con probabilidad P(Z , −0.35) 5 0.3707.
Como 0.3669 , 0.3695 , 0.3707, entonces el valor de z que se busca debe hallarse
entre −0.34 y −0.33, de esta manera se acuerda que z sea el promedio de estos dos
números.
Resultado:
z 5 −0.335; P(Z . −0.335) 5 0.6305
Ejemplo 4.36. Considere a Z ~ N(0, 1). Encontrar el valor de z, tal que P(−z , Z , z) 5 0.732.
Solución:
La probabilidad que se pide no se encuentra en la tabla de la distribución normal,
entonces se debe hallar una probabilidad que se pueda buscar en la tabla.
Por la simetría de la función de densidad normal, se tiene que P(Z # −z) 5 P(Z
$ z), y además la probabilidad de Z en los números reales es igual que 1 y se puede
escribir como la suma de tres términos:
P(Z # −z) 1 P(−z , Z , z) 1 P(Z $ z) 5 2P(Z # −z) 1 P(−z , Z , z) 5 1
De donde se tiene que 2 P(Z # −z) 5 1 − P(−z , Z , z) 5 1 − 0.732 5 0.268.
Se encuentra que P(Z # −z) 5 0.134 y es un valor que sí se puede hallar en las
tablas.
De nuevo se determinan dos valores cercanos a 0.134:
−z 5 −1.11 con probabilidad P(Z , −1.11) 5 0.1335.
−z 5 −1.10 con probabilidad P(Z , −1.10) 5 0.1357.
Como 0.1335 , 0.134 , 0.1357, entonces el valor de −z que se busca debe estar
entre −1.11 y −1.10, de esta manera se acuerda que −z sea el promedio de estos dos
números.
Resultado:
−z 5 −1.105 lo que implica que z 5 1.105; P(−1.105 , Z , 1.105) 5 0.732
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 179
Ejemplo 4.37. Considere a Z , N(0, 1). Encontrar el valor de z, tal que P(0 , Z , z) 5 0.105.
Solución:
La probabilidad que se pide no se halla en las tablas, pero se sabe que antes de la
media el área es igual a 0.5, entonces:
P(Z , z) 5 P(Z # 0) 1 P(0 , Z , z) 5 0.5 1 0.105 5 0.605
Se busca en la tabla de distribución normal y en la columna de probabilidad (área) el
valor más cercano a 0.605. Hay dos valores:
z 5 0.26 con probabilidad P(Z , 0.26) 5 0.6026.
z 5 0.27 con probabilidad P(Z , 0.27) 5 0.6064.
Como 0.6026 , 0.6050 , 0.6064, entonces el valor de z que se busca debe estar entre
0.26 y 0.27, de esta manera se acuerda que z sea el promedio de estos dos números.
Resultado:
z 5 0.265; P(0 , Z , 0.265) 5 0.105
Ejemplo 4.38. U
n área de 0.4370 está bajo la curva normal entre la media y un valor positivo de z.
¿Cuál es el valor de z?
Solución:
La probabilidad que se pide es P(0 , Z , z) y no se encuentra en las tablas, pero se
sabe que antes de la media el área es igual a 0.5. Entonces:
P(Z , z) 5 P(Z # 0) 1 P(0 , Z , z) 5 0.5 1 0.4370 5 0.9370
Se busca en la tabla de distribución normal y en la columna de probabilidad el valor
más cercano a 0.9370, y se halla que z 5 1.53.
Ejemplo 4.39. U
n área de 0.4808 está bajo la curva normal entre la media y un valor de z negativo.
¿Cuál es el valor de z?
Solución:
La probabilidad que se da es P(z , Z , 0) 5 0.4808 con z negativo; esta probabilidad
no corresponde a un valor de la tabla de distribución normal; para encontrar la pro-
babilidad acumulada se observa que:
P(Z # z) 1 P(z , Z , 0) 5 P(Z , 0) 5 0.5 de donde se obtiene que:
P(Z # z) 5 P(Z , 0) 2 P(z , Z , 0) 5 0.5 2 0.4808 5 0.0192
Se busca en la tabla de distribución normal y en la columna de probabilidad el valor
más cercano a 0.0192; así que se encuentra que z 5 −2.07.
Ejemplo 4.40. 9 0% de la distribución de partículas atmosféricas de una curva normal está a la iz-
quierda de un valor de z en particular. ¿Cuál es el valor de z?
180 | Estadística para ingeniería y ciencias
Solución:
Se está buscando el valor de z, tal que P(Z , z) 5 0.90; este valor se halla directamen-
te en la tabla normal. Se debe buscar el valor más cercano a 0.90. Hay dos valores:
z 5 1.28 con probabilidad P(Z , 1.28) 5 0.8997.
z 5 1.29 con probabilidad P(Z , 1.29) 5 0.9015.
Como 0.8997 , 0.9000 , 0.9015, entonces el valor de z que se busca debe estar entre
1.28 y 1.29, pero como 0.90 se encuentra más cerca de 0.8997 se decide que z 5 1.28.
Resultado:
z 5 1.28; P(Z , 0.128) 5 0.90
Ejemplo 4.41. C
onsidere que X ~ N(10, 4). ¿Dentro de qué rango está comprendido 95% de los
valores centrales de X?, es decir, ¿cuál debe ser el valor de a tal que, P(µ − a , X ,
µ 1 a) 5 0.95?
Solución:
Primero se estandarizan los valores de X 5 µ − a y de X 5 µ 1 a, esto es:
(µ − a − µ) a (µ − a − µ) a
5 − y 5 σ
σ σ σ
por lo que:
a a
P(µ − a , X , µ 1 a) 5 P(− σ , Z , σ ) 5 0.95
Esta probabilidad equivale a P(− z , Z , z) 5 0.95 y no se puede encontrar en la
tabla de distribución normal; sin embargo, por la simetría de la función de densidad
normal se tiene que para el mismo valor de z, P(Z , −z) 5 0.025, y consecuentemente
P(Z # z) 5 0.975, esta probabilidad sí se encuentra en la tabla de distribución normal
estándar. Ahora, se busca el valor de z con probabilidad más cercana a 0.975 y se
determina que z 5 1.96 5 a/σ.
De esta ecuación se despeja el valor de a quedando como a 51.96σ, y por el
enunciado del problema se sabe que σ 5 2, por lo que a 5 1.96(2) 5 3.92, así que:
P(µ − a , X , µ 1 a) 5 P(10 − 3.92 , X , 10 1 3.92) 5 P(6.08 , X , 13.92) 5 0.95
95%
2.5%
2.5%
21.96 1.96 z
6.08 13.92 X
Teorema 4.17. Sea X variable aleatoria normal con media µ y varianza σ2, X ~ N(µ, σ2), el valor de
a, tal que P(µ − a , X , µ 1 a) 5 1 2 α es igual a z1−α/2 σ.
Demostración:
Al estandarizar los valores de µ 2 a y µ 1 a, se obtiene la relación:
a a
P(µ − a , X , µ 1 a) 5 P(− , Z , ) = 1 − α (4.38)
σ σ
El problema equivale a encontrar el valor de z 5 a/σ, tal que P(−z , Z , z) 5 1 − α, probabilidad que
no se halla en la tabla de la distribución normal estándar, por lo que se debe encontrar la probabilidad
acumulada para Z. Por la simetría de la función de densidad se tiene que P(Z ,− z) 5 P(Z , z) 5
α/2, y por tanto:
α α
P(Z , z) 5 P(Z , −z) 1 P(−z , Z , z) 5 1 − α 1 5 1 − (4.39)
2 2
a
De donde se sigue que z1−α/2 5 , lo que implica que a 5 z1−α/2 σ.
σ
Ejemplo 4.42. C
onsidere que X ~ N(10, 4). ¿Dentro de qué rango está comprendido 99% de los
valores centrales de X ?, es decir, ¿cuál debe ser el valor de a tal que P(µ − a , X ,
µ 1 a) 5 0.99?
Solución:
Este ejemplo se resuelve aplicando el teorema 4.17. obsérvese que 1 − α 5 0.99, de donde
se sigue que α 5 0.01 y consecuentemente α/25 0.005, por lo que 1 − α/2 5 0.995.
Se busca el valor de z0.995 en la tabla, y se encuentra que z0.995 5 2.575, ahora se
aplica la fórmula a/σ = 2.575, por lo que a 5 2.575 σ 5 2.575(2) 5 5.15, así que:
P(µ − a , X , µ 1 a) 5 P(10 − 5.15 , X , 10 15.15) 5 P(4.85 , X , 15.15) 5 0.95
99%
0.5%
0.5%
22.58 2.58 z
4.85 15.15 X
Figura 4.17. Gráfica que muestra la curva relacionada con el ejemplo anterior.
Solución:
Para encontrar el valor de a se usa la fórmula a 5 z1−α/2 σ, y luego se hallan los valores
de los extremos del intervalo donde está contenida la X, (µ − a , X , µ 1 a).
α
a) En este caso 1 − α 5 0.99, entonces α 5 1 2 0.99 5 0.01, por lo que 5 0.005,
α 2
de donde se obtiene que 1 2 5 0.995.
2
En la tabla de distribución normal estándar se busca la probabilidad más cercana a
0.995, el valor de z correspondiente es 2.575, entonces el valor de a es:
a 5 z0.995 σ 5 2.575(3) 5 7.725
Finalmente:
µ − a 5 20 − 7.725 5 12.275
µ 1 a 5 20 + 7.725 5 27.725
α
b) En este caso, 1 − α 5 0.90; entonces α 5 1 2 0.90 5 0.10. Por tal razón, 5 0.05,
α 2
de donde se obtiene que 1 2 5 0.95.
2
En la tabla de distribución normal estándar se busca la probabilidad más cercana a
0.95. Como el valor de z correspondiente es 1.645, entonces el valor de a es:
a 5 z0.95 σ 5 1.645(3) 5 4.935
Por último:
µ − a 5 20 2 4.935 5 15.065
µ 1 a 5 20 1 4.935 5 24.935
α
c) En este caso, 1 2 α 5 0.80; entonces α 5 1 2 0.80 5 0.20. Por ello 5 0.10, de
α 2
donde resulta que 1 2 5 0.90.
2
En la tabla de distribución normal estándar se busca la probabilidad más cercana a
0.90 y como el valor de z correspondiente es 1.28, entonces el valor de a es:
a 5 z0.90 σ 5 1.28 (3) 5 3.84
Finalmente:
µ 2 a 5 20 2 3.84 5 16.16
µ 1 a 5 20 1 3.84 5 23.84
4.8.1 Presentación
Este teorema es uno de los resultados que justifican la importancia que tiene la distribución normal en la infe-
rencia estadística y se enuncia como:
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 183
Teorema 4.18. (Teorema del límite central) Sea X1, X2, X3, … Xn, variables aleatorias independien-
tes e igualmente distribuidas con función de densidad arbitraria, tal que su media y varianza son E(Xi)
5 µ y V(Xi) 5 σ2, entonces:
n ( X − µ)
lím 5 Z~N (0,1)
n→∞ σ
X 1 1 X 2 1... 1 X n
con X 5 (4.40)
n
Demostración:
Para probar este teorema se encuentra primero la función generatriz de momentos de la variable
y luego se calcula el límite de esta función generatriz de momentos cuando n va a
infinito. Si este límite coincide con la función generatriz de momentos de la normal estándar, se con-
cluye que el teorema es cierto. Algunos pasos se saltan para hacer más ágil la demostración.
n
n ( X − µ ) i =1 i
− µ)∑( X
Primero se observa que: Yn 5 5
σ σ n
entonces,
tY t ( X 1 −µ )/ σ n +...+t ( X n −µ )/ σ n
MY (t ) 5 E(e n ) 5 E(e )
n
t ( X 1 −µ )/ σ n t ( X n −µ )/ σ n
5E(e . . .e )
La última expresión es el valor esperado de un producto de variables aleatorias independientes, en-
tonces se convierte en el producto de valores los esperados:
tY t ( X 1 −µ )/ σ n t ( X −µ )/ σ n
MY (t ) 5 E(e ) 5 E e . . . E (e )
n
Y utilizando el desarrollo en series de la función exponencial, y las propiedades del valor esperado,
resulta que:
n
t 2 t 3 E ( X − µ )3 t 4 E ( X − µ )4
MY (t ) 5 1 1 1 1 1...
n
2 n 3! n σ
3/ 2 3
4 ! n σ
2 4
n n− 1
t2 1 t2 t 3 E ( X − µ )3 t 4 E ( X − µ )4
5 1 1 1 1/ 2 1 1 1 1. . .
2n n 2n 3!σ 3
4! n σ
1/ 2 4
n− 2 2
1 t2 t 3 E ( X − µ )3 t 4 E ( X − µ )4
1 1 1 1 . . . ...
2 n 2 n
3!σ 3 4!n1/2 σ 4
Esta función coincide con la función generatriz de momentos de la normal estándar, y dado que la
función generatriz de momentos es inyectiva, se concluye que el teorema es cierto.
184 | Estadística para ingeniería y ciencias
Como una consecuencia del teorema central del límite se pueden establecer los siguientes resultados
equivalentes:
Si n es suficientemente grande, entonces la variable:
X1 1 X2 1 X3 1 … 1 Xn tiene una distribución aproximadamente normal con media nµ y varian-
za nσ2.
tiene una distribución aproximadamente normal con media µ y varianza σ2/n.
tiene una distribución aproximadamente normal con media 0 y varianza 1.
El siguiente ejemplo muestra de qué manera los promedios de una variable aleatoria no normal se
van acercando a la distribución normal.
Ejemplo 4.44. S
i se lanza un dado no cargado cada una de sus caras tiene la misma probabilidad de
aparecer. Sea X1 la variable que indica el resultado del lanzamiento de un dado; su
1
función de densidad es f (x) 5 6 con x 5 1, 2, 3, 4, 5, 6.
Si se lanzan dos dados no cargados, los resultados corresponden a un vector
aleatorio (X1, X2); la primera coordenada es el resultado del primer dado y la segunda
coordenada es el resultado del segundo dado. La siguiente tabla indica la probabili-
(X 1 X2)
dad del promedio del resultado de los dos dados Y2 5 1 .
2
Tabla 4.6.
(X1 + X2)/2 Probabilidad Resultados en los dados que dan este promedio
1.0 1/36 (1, 1)
1.5 2/36 (1, 2)(2, 1)
2.0 3/36 (1, 3)(2, 2)(3, 1)
2.5 4/36 (1, 4)(2, 3)(3, 2)(4, 1)
3.0 5/36 (1, 5)(2, 4)(3, 3)(4, 2)(5, 1)
3.5 6/36 (1, 6)(2, 5)(3, 4)(4, 3)(5, 2)(6, 1)
4.0 5/36 (2, 6)(3, 5)(4, 4)(5, 3)(6, 2)
4.5 4/36 (3, 6)(4, 5)(5, 4)(6, 3)
5.0 3/36 (4, 6)(5, 5)(6, 4)
5.5 2/36 (5, 6)(6, 5)
6.0 1/36 (6, 6)
Si se lanzan 3 dados, el resultado es una terna de la forma (X1, X2, X3); la primera co-
ordenada corresponde al resultado observado en el primer dado, la segunda coorde-
nada corresponde al resultado observado en el segundo dado y la tercera coordenada
es el resultado del tercer dado. Hay 216 posibles resultados al lanzar tres dados. Por
la cantidad de resultados posibles no es fácil citarlos en una tabla, pero sí se pueden
contar y saber cuántos casos hay que dan el mismo promedio. Para contar de cuántas
maneras se obtiene un mismo promedio, se observan de cuántas maneras se tiene la
suma de los primeros dos dados y se completa con el resultado del tercer dado.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 185
(X 1 X2)
Por ejemplo, si 1 5 2, implica que X1 1 X2 1 X3 5 6 y los valores que pueden
3
tomar los dados para tener una suma de seis es:
Tabla 4.7.
Suma de los dos primeros dados Valor del tercer dado Número de resultados
X1 1 X2 5 2 (1, 1) X3 5 4 1
Suma total 10
P((X1 1 X2 1 X3)
Hay 10 formas de obtener una suma igual a 6 y, por tanto, 5 2) 5
10 . 3
216
En la tabla 4.8 se muestran los resultados posibles para el promedio de las caras
de tres dados que fueron lanzados. Para cada valor del promedio se revisa de cuántas
maneras se obtiene la suma de los dos primeros dados y se completa con el tercer
dado, igual que se hizo antes para el promedio igual que 2.
Tabla 4.8.
1.00 1/216 1
1.33 3/216 11253
1.67 6/216 1 1 21 3 5 6
2.00 10/216 1 1 2 1 3 1 4 5 10
2.33 15/216 1 1 2 1 3 1 4 1 5 5 15
2.67 21/216 1 1 2 1 3 1 4 1 5 1 6 5 21
3.00 25/216 2 1 3 1 4 1 5 1 6 1 5 5 25
3.33 27/216 3 1 4 1 5 1 6 1 5 1 4 5 27
3.67 27/216 4 1 5 1 6 1 5 1 4 1 3 5 27
4.00 25/216 5 1 6 1 5 1 4 1 3 1 2 5 25
4.33 21/216 6 1 5 1 4 1 3 1 2 1 1 5 21
4.67 15/216 5 1 4 1 3 1 2 1 1 5 15
5.00 10/216 4 1 3 1 2 1 1 5 10
5.33 6/216 3121156
5.67 3/216 21153
6.00 1/216 1
186 | Estadística para ingeniería y ciencias
El teorema del límite central se satisface para cualquier variable aleatoria. En el caso
de las distribuciones simétricas, la convergencia a la normal es más rápida (para n
no tan “grande” la aproximación a la normal es bastante buena), para distribuciones
asimétricas la convergencia puede ser muy lenta (n debe ser muy “grande” para que
apenas se comience a aproximar a la normal).
a) b)
k k k k
Figura 4.19. En la binomial P(X 5 k) corresponde a la altura de cada línea que se observa
en la gráfica a); esa altura es igual al área del rectángulo de base igual a uno
y altura igual que la probabilidad de que X sea igual que k. Con la aproximación
normal, la probabilidad P(X 5 k) corresponde al área bajo la curva entre los
puntos k 2 0.5 y k 1 0.5. El valor de 0.5 que se suma o se resta al valor de k
se denomina factor de corrección por pasar de una distribución discreta a una
continua.
Tabla 4.9.
Conforme el valor del parámetro p esté más cercano a 0.5, la densidad binomial es más simétrica y con-
secuentemente la convergencia a la normal es más rápida; si p está más cerca de 0 o de 1, se requerirá un valor
de n más grande para que la distribución binomial se aproxime a una normal, en cualquier caso, con n sufi-
cientemente grande (se recomienda que np . 10 y nq . 10) se puede considerar como buena la aproximación
normal.
La fórmula de la normal estándar aproximada a la distribución binomial es:
X − np
Z5 (4.43)
npq
Ejemplo 4.45. U
na máquina produce tornillos de los cuales 10% son defectuosos. Encontrar la
probabilidad de que en una muestra aleatoria de 400 tornillos producidos por esta
máquina:
a) A lo más 30 tornillos estén defectuosos.
b) Entre 30 y 50 estén defectuosos.
c) Entre 35 y 45 estén defectuosos.
d) 55 o más tornillos estén defectuosos.
188 | Estadística para ingeniería y ciencias
Solución:
Como 400 es suficientemente grande, se puede aplicar el teorema del límite central.
Primero se calcula el promedio y la desviación estándar de la binomial:
µ 5 np 5 (400)(0.1) 5 40 y σ 5 npq 5 [(400)(0.1)(0.90)]0.5 5 6.0
En seguida, se calcula el valor de la variable aleatoria Z usando la relación Z 5
(X 2 µ) .
σ
a) Para calcular P(X # 30) primero se corrige el valor de 30 para quedar como 30.5
y luego se transforma el valor de 30.5 a valores de Z usando la fórmula de estan-
darización, es decir:
z 5 (30.5 2 40)/6.0 5 21.75
Por tanto: P(X # 30) ≈ P(Z # 21.75) 5 0.04
b) P(30 # X # 50) 5 P(29.5 # X # 50.5).
Para calcular esto, primero transformamos los valores de 29.5 y 50.5 a valores de
(29.5 2 40) (50.5 2 40)
Z, es decir, z 5 5 21.75; z 5 5 1.75
6.0 6.0
Por tanto,
P(30 # X # 50) 5 P(X # 50) 2 P(X # 30)
≈ P(Z # 1.75) 2 (Z # 21.75)
5 0.96 2 0.04
5 0.92
c) La probabilidad de que entre 35 y 45 tornillos estén defectuosos es P(34.5 # X #
45.5). Para esto, primero se transforman los valores de X a valores de Z.
(34.5 2 40) (45.5 2 40)
z5 5 20.92 y z 5 5 0.92
6.0 6.0
Por tanto, P(35 # X # 40) ≈ P(−0.92 # Z # 0.92)
5 0.8212 2 0.1788 5 0.6424
d) P(X $ 55) 5 P(X $ 54.5). Primero se estandariza el valor de X 5 55.5 a valores
de Z.
(54.5 2 40)
z5 5 2.41 que corresponde a una probabilidad de 0.992.
6.0
Por tanto:
P(X $ 55) 5 1 2 P(X # 55) 5 P(Z # 2.41) 5 1 − 0.992 5 0.008
Solución:
a) Con la tabla binomial se encuentra que:
P(X 5 4) 5 b(4; 15, 0.4) 5 0.1268
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 189
P(X 5 4), con X binomial es aproximadamente igual que P(3.5 , X , 4.5), con
X normal. Se estandarizan los valores de 3.5 y 4.5:
(3.5 2 6) (4.5 2 6)
z5 5 21.32 y z5 5 20.79
1.9 1.9
P(X 5 4) 5 b(4; 15, 0.4) ≈ P(21.32 , Z , 20.79)
5 P(Z , 2 0.79) 2 P(Z , 21.32)
5 0.2148 2 0.0934 5 0.1214
El valor 0.1214 obtenido con la distribución normal está muy cercano al 0.1268
calculado con la distribución binomial.
Definición 4.26. Una variable aleatoria X se dice que es lognormal si log(X) ~ N(µ, σ2).
d d f (log( x)) 1 2 2
fX (x) 5 FX ( x) 5 FY (log( x)) 5 Y 5 e − (log( x )−µ ) /2 σ
dx dx x xσ 2 π
190 | Estadística para ingeniería y ciencias
f (x)
Moda Media x
Mediana
Figura 4.20. La gráfica muestra la curva de densidad lognormal. Se observa que se satisface
la relación: media . mediana . moda. La distribución lognormal tiene un sesgo
positivo. Es importante considerar que en las observaciones pequeñas el cálculo
de su logaritmo aumenta de manera considerable. Fuente: Hines et al. Probabi-
lidad y estadística para Ingeniería (2005).
0.15 0.15
Datos Y
0.10 0.10
0.05 0.05
0.00 0.00
0 5 10 15 20 25
Teorema 4.20. Sea X variable aleatoria lognormal con parámetros µ y σ2, su media y varianza son:
2
2 µx 5 e
µ1σ /2
E(X)
µ1σ /52
e 2 2
2 σ 2 5(2 e σ 21)e 2 µ1σ
σ 2x 5(e σ 21)e 2xµ1σ (4.45)
Demostración:
2 2
∞ ∞ e − (log( x )−µ ) /2 σ
E(X) 5 ∫ 0
xf ( x)dx 5 ∫
0 2 πσ
dx
Si se hace el cambio de variable y 5 log(x), se tiene que x 5 ey, en consecuencia resulta que dx 5
eydy, por tanto, la integral se convierte en:
E(X) 5
Para calcular la varianza se calcula primero E(X 2); en este cálculo también se usa el cambio de
variable y 5 log(x):
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 191
E(X 2) 5
2 2
X 2
5(e X 21)e 2 R1X con µ y σ son la media y la desviación
x
Varianza
estándar
R 5 eR1X de
/ 2 log(X)
2
Solución:
a) La media es E(X) 5 exp[10 1 (0.5)(4)] 5 e12 ≈ 162,754
La varianza es:V(X) 5 (exp(4)21) 3 exp(24) 5 1.41977E 3 1012
La mediana corresponde al valor de x, tal que FX(x) 5 0.05, esto significa que log(x)
5 µ, pues en la distribución normal antes de µ y después de µ la probabilidad es 0.5,
entonces la mediana es:
x 5 e µ 5 e10 ≈ 22 026
La moda corresponde al valor más alto de la función de densidad; se debe derivar la
función de densidad y encontrar la raíz de la derivada, entonces la moda es:
Problema adaptado del libro Probabilidad y estadística para Ingeniería de Hines et al. Grupo Editorial Patria (2005).
*
192 | Estadística para ingeniería y ciencias
Mo 5 e10 2 4 5 e 6 ≈ 403.43
b) P(X # 1000) 5 P(ln X # ln 1000) 5 P(Y # ln 1000)
5 P(Y # 6.91) 5 P(Z # (6.91 2 10)/2)
5 P(Z # 2 1.55) 5 0.0606
Definición 4.27. Sea Z1, Z2, . . . , Zk variables aleatorias independientes con distribución normal es-
tándar, entonces la variable aleatoria dada por:
Teorema 4.21. Sea X variable aleatoria ji-cuadrada con k grados de libertad, entonces su función de
densidad es:
1
fk ( x) 5 x k /2−1e − x/2 para x $0; y 0 en otro caso (4.47)
Observe que la función de densidad ji-cuadrada corresponde a una densidad gamma con parámetros
k
β52 y α5 .
2
La siguiente gráfica muestra la función de densidad de esta variable para distintos valores de k;
observe que cuando k es pequeño, la probabilidad 0.16
yores. k 5 12
0.06 k 5 18
k 5 24
k 5 30
0.04
Figura 4.22. G
ráfica que muestra la familia de
la distribución de ji-cuadrada con
0 10 20 30 40
diferentes grados de libertad.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 193
Dado que la ji-cuadrada es la suma de variables aleatorias independientes por el teorema del límite cen-
tral, esta distribución se aproxima a una normal conforme k crece, como se puede ver en la gráfica.
El único parámetro de la distribución ji-cuadrada son los grados de libertad (el parámetro k) que
corresponde al número de variables aleatorias independientes en la suma que define la variable. La
variable ji-cuadrada siempre es positiva, pues corresponde a la suma de variables al cuadrado.
Teorema 4.22. Si X1 y X2 son dos variables aleatorias independientes, tales que X1 ~ ji-cuadrada con
n grados de libertad y X2 ~ ji-cuadrada con m grados de libertad, entonces X1 1 X2 ~ ji-cuadrada
con n 1 m grados de libertad.
Demostración:
Por la definición de la variable ji-cuadrada se sigue que:
con Z1, Z2, . . . , Zn, W1, W2, . . . , Wm variables aleatorias independientes tales que Zi ~ N(0, 1) y Wi
2 2 2 2 2 2
~ N(0, 1). Entonces, X1 1 X2 5 Z1 1 Z2 1 . . . 1 Zn 1 W1 1 W2 1 . . . 1 Wn es la suma de
n 1 m variables normales estándar independientes al cuadrado, por lo que se deben distribuir como
ji-cuadrada con n 1 m grados de libertad.
Teorema 4.23. Si X se distribuye como una ji-cuadrada con k grados de libertad, entonces la media,
la varianza y la función generatriz de momentos de X son:
E(X ) 5 k
V(X ) 5 2k
MX(t) 5 (1 2 2t)2k (4.48)
Demostración:
k
Como la distribución ji-cuadrada es una densidad gamma con parámetros β 5 2 y α 5 , se tiene
2
que:
k
E(X ) 5 αβ 5 ( )2 5 k
2
k
V(X ) 5 αβ2 5 ( )4 5 2k
2
MX(t) 5 (1 2 tβ)2α 5 (1 2 2t)2k/2
Tabla 4.11.
x k /2−1e − x/2 si x $ 0
f (x) 5
Función de densidad
k /2
Γ
Ejemplo 4.48. S
ea X una variable aleatoria ji-cuadrada con 9 grados de libertad, encontrar el valor
de x, tal que:
P(X . x) 5 0.025
P(X , x) 5 0.025
Solución:
Para hallar el valor de x, tal que:
P(X . x) 5 0.025
en la tabla de la ji-cuadrada busque en la columna correspondiente la probabilidad
0.025 y el renglón de 9 grados de libertad para encontrar x 5 19.023.
Para determinar el valor de x, tal que:
P(X , x) 5 0.025,
se encuentra la probabilidad del complemento, P(X . x) 5 0.975, ahora en la columna
de 0.975 busque el renglón de 9 grados de libertad y ahí se halla a x 5 2.700.
0.1
0.08
0.06
0.04
0.02
0.025 0.025
0
0 2.7 5 10 15 19.023 25 30
20.02 Figura 4.24.
Definición 4.28. Sea X y Y variables aleatorias independientes, tales que X ~ N(0, 1) y Y ~ ji-cuadrada
con n grados de libertad, entonces la variable:
X
W5 (4.49)
Y /n
es una variable t de Student con n grados de libertad. Los grados de libertad corresponden a los grados
de libertad de la ji-cuadrada del denominador.
0,45
0,4 k 51
k 52
0,35 k 55
k 5 10
0,3 k 5 infini
0,25
0,2
0,15
0,1
0,05
0
25 24 23 22 21 0 1 2 3 4 5
Las tablas en el cd-rom (apéndices) del libro reportan los valores de la función de distribución acumu-
lada t de Student, esto es, si X ~ t con n grados de libertad, en la tabla se dan los valores de:
P(X , x) 5 α
En el renglón superior de la tabla se hallan los valores para α 5 0.75, 0.90, 0.95, 0.975, 0.99, 0.995.
0.9975, 0.999, 0.9995, 0.99975, 0.9999, 0.99995, 0.999975 y 0.99999.
En la primera columna de la izquierda están los grados de libertad y en las restantes columnas
se encuentran los valores de x.
Ejemplo 4.49. S
ea X distribuida como t de Student con 10 grados de libertad, encontrar la probabi-
lidad:
P(X , x) 5 0.95
P(X . x) 5 0.05
P(X , x) 5 0.05
Solución:
4.10.3 La distribución F
La función F la introdujeron George Waddell Snedecor y Ronald Fisher, razón por la cual a esta distribución
se le conoce como distribución F de Snedecor o como distribución F de Fisher-Snedecor, y se define de la
siguiente manera.
Definición 4.29. Sea X1 y X2 variables aleatorias independientes con distribución ji-cuadradas con
grados de libertad ν1 y ν2, respectivamente; entonces, la variable aleatoria:
X 1 / ν1
F5 (4.50)
X 2 / ν2
tiene distribución F con ν1 y ν2 grados de libertad. Observe que los grados de libertad son los de las
variables ji-cuadrada que están en el numerador y en el denominador.
La función de densidad F tiene una gráfica semejante a la gráfica de la función de densidad ji-
cuadrada, como se puede observar en la siguiente gráfica.
Gráfica sobrepuesta de prob. de densidad vs. valores de F
1.2 1.2
1.0 1.0
Variable
0.8 0.8 Prob. de densidad F.05; 30, 30
Prob. de densidad F.05; 20, 6
Prob. de densidad F.05; 6, 6
f(F)
0.6 0.6
0.4 0.4
0.2 0.2
0.0 0.0
0 1 2 3 4 5
Valores de F
Figura 4.26. Gráfica que muestra curvas F típicas, con diferentes grados de libertad v1 y v2.
Teorema 4.24. Si la variable aleatoria X se distribuye como una F con ν1 y ν2 grados de libertad,
1
entonces la variable se distribuye como una F con ν2 y ν1 grados de libertad.
X
Demostración:
X 1 / ν1
Si X se distribuye como una F con ν1 y ν2, entonces X 5 donde X1 y X2 son variables alea-
X 2 / ν2
torias independientes y X1 ~ ji-cuadrada con ν1 grados de libertad y X2 ~ ji-cuadrada con ν2 grados
1 X /ν
de libertad; por tanto: 5 2 2 que corresponde a una variable aleatoria F con ν2 y ν1 grados de
X X 1 / ν1
libertad.
Solución:
a) Los grados de libertad del numerador son ν1 5 6 y los grados de libertad del de-
nominador son ν2 5 10. Con α 5 0.05 de la tabla de F del apéndice, se lee 3.22.
Por tanto, F0.05;6, 10 5 3.22.
b) Para este inciso se busca α 5 0.01 en la tabla de F con ν1 5 6 y ν2 5 10 y da
F0.01;6, 10 5 5.39.
4.11 C
álculo de las funciones de distribución acumuladas
continuas usando Excel
4.11.1 Presentación
Para obtener los cálculos de las distribuciones continuas con Excel se utiliza el asistente de gráficas. Al ha-
cer clic en el asistente de gráficas aparece una pantalla de diálogo en la que se debe elegir primero el tipo de
198 | Estadística para ingeniería y ciencias
función y luego la función específica que se quiere. En esta pantalla se eligen las funciones Estadísticas y se
busca la distribución particular que se requiere calcular; en la figura 4.27 se observa una ventana con diferentes
opciones de funciones de distribución acumulada, la ji-cuadrada (DISTR.CHI), la distribución exponencial
(DISTR.EXP), la distribución F (DISTR.F), etc. Cuando se selecciona la distribución deseada aparece otra
pantalla de diálogo en la que se solicitan los valores de los parámetros de la distribución. En algunas distribu-
ciones hay una ventanilla asignada como Acumulado, si en esta ventanilla se pone 0, se obtiene el valor de la
función de densidad y si se pone 1, resulta el valor de la función de distribución para el valor particular de x.
Figura 4.27.
Figura 4.28.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 199
4. Colóquese frente de la celda en donde está el 24 (en la B2) y haga clic en el asistente de función, bus-
que en las funciones Estadísticas la función DISTR.NORM.
5. En la pantalla de diálogo que aparece en la ventanilla de X, escriba la ubicación de la celda donde está
el 24 (la A2, en este caso); esto lo puede hacer al poner el cursor del ratón sobre esta celda corres-
pondiente; en la ventanilla de Media escriba 0, en Desv_estándar escriba 1, y en acum., 0, como se
muestra en la figura 4.29.
Figura 4.29.
6. Ahora, ponga el cursor del ratón en la esquina inferior derecha de esta celda y oprimiendo el botón
izquierdo arrástrelo (hasta la celda B82). Con estas instrucciones se calculan las dos columnas, la de
los valores de X y la de la densidad normal estándar.
7. En seguida señale los datos de las dos columnas que se acaban de calcular y haga clic en el asistente
de gráficas.
Figura 4.30.
9. Puede rotular la gráfica poniéndole nombre y termine. Al final se obtiene la gráfica siguiente:
0.5
0.4
0.3
0.2
0.1
0
26 24 22 0 2 4 6
Figura 4.32.
4.12 C
álculo de distribuciones continuas usando
el programa Minitab
4.12.1 C
álculo de los valores de la funciones de densidad
y de distribución normal
Los valores de la función de distribución (probabilidad acumulada) normal se obtienen con las instrucciones
siguientes:
1. Vaya a Calc > Probability distributions > Normal
2. En la ventana de diálogo de Normal Distribution haga clic en Cummulative distribution, es decir,
para calcular las probabilidades acumuladas.
3. En la ventanilla de Mean escriba el valor de la media y en la ventanilla de Standard deviation el valor
de la desviación estándar.
4. Haga clic en OK. Todo esto generará la columna de los valores de la distribución acumulada corres-
pondiente a la media y desviación estándar impuestos.
De manera similar, para generar los valores de la función de densidad se debe proceder de la siguiente
manera:
1. En la ventana de diálogo de Normal Distribution haga clic en Probability density, es decir, para
calcular las probabilidades de densidad.
2. Proceda como en los incisos 3) y 4).
Ejemplo 4.51. Calcular las siguientes probabilidades bajo la curva normal estándar.
a) Entre z 5 21.5 y z 5 21
b) Entre z 5 1 y z 5 21
c) La probabilidad de que el valor de z sea de cuando menos 2.
d) La probabilidad de que el valor de z sea de cuando mucho 2.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 201
Solución:
Aquí es conveniente introducir un rango de valores apropiados de la variable alea-
toria z en la hoja de Minitab, de acuerdo con lo que se desee hacer: en este caso, por
ejemplo, de 24 a 14. La figura 4.33 muestra esta situación.
Figura 4.33.
Solución:
a) P(21.5 # Z # 21.0) ) 5 0.1587 2 0.0668 5 0.0919 (de la tabla de la figura 4.33)
b) P(21 # Z # 1) (en este caso no se necesita usar ninguna tabla. ¿Por qué?)
c) P(Z $ 2) 5 1 2 P(Z # 0.9332) 5 0.0668
d) P(Z # 2) 5 0.9773
Ejemplo 4.52. C
alcular la distribución de las probabilidades acumuladas para los valores de la varia-
ble aleatoria normal X de 2.5, 2.6, 2.7, 2.8, 2.9, 3.0, 3.1, 3.2, 3.3, 3.4.
Determinar lo siguiente:
a) P(X $ 2.9)
b) P(2.7 # X # 3.0)
Solución:
Siga las instrucciones para calcular las probabilidades pedidas por el problema.
202 | Estadística para ingeniería y ciencias
Tabla 4.12.
4.12.2 C
álculo de los valores de la función de distribución
exponencial
Los valores de la función de distribución acumulada (probabilidad acumulada) exponencial se obtienen con
las instrucciones siguientes:
1. Escriba en una columna los valores de X donde quiere tener los cálculos de la función de distribución
acumulada.
2. Vaya a Calc > Probability distributions > Exponential.
3. En la ventana de Exponential distribution haga clic en Cummulative probability. En la ventana de
1
Mean escriba el valor de μ (recuerde que μ 5 ).
λ
4. En la ventana de Input column escri-
ba el número de la columna donde está
la variable aleatoria X y en la ventani-
lla de Optional Storage ponga la co-
lumna donde se almacenarán los datos
y haga clic en OK.
Para hacer las gráficas correspondientes
introduzca los valores como se muestra en el
recuadro de la figura 4.34.
Figura 4.34.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 203
Ejemplo 4.53. S
uponer que el tiempo promedio que se tarda una sustancia radiactiva (un isótopo ra-
diactivo que tiene el mismo número atómico pero diferente peso molecular) en descom-
ponerse es una variable aleatoria exponencial con μ 5 15 años. Hacer lo siguiente:
a) Una tabla con los valores de las probabilidades acumuladas y de función de masa
para los valores de la variable aleatoria exponencial X de 0, 5, 10, 15, 20, 25, 30,
35, 40, 45 y 50 años.
Solución:
a) Siga las instrucciones para calcular los valores de la función exponencial dadas
por Minitab:
Figura 4.35.
b) P(X # 5) 5 0.2835
Figura 4.36. G
ráficas de las probabilidades exponenciales acumuladas e individuales en fun-
ción del tiempo.
Ejemplo 4.54. H
acer el mismo ejemplo 4.20 de la supervivencia de los conejillos de indias con pa-
rámetro de forma α 5 10 y con escala β 5 20. Calcular las siguientes probabilidades,
pero ahora usando Minitab:
a) P(80 # X # 120)
b) P(X $ 80)
c) P(X # 80)
d) P(X $ 20)
Solución:
Tabla 4.13.
Variable aleatoria de
Probabilidad acumulada Función de densidad
distribución gamma X
19 0.0000001 0
20 0.0000001 1E-07
21 0.0000002 1E-07
79 0.0074911 0.000621
80 0.0081322 0.000662
81 0.0088148 0.000704
119 0.0805251 0.003356
120 0.083924 0.003442
De la tabla anterior:
a) P(80 # X # 120) 5 0.0839 2 0.0081 5 0.0758
b) P(X $ 80) 5 1 2 0.0081 5 0.9919
c) P(X # 80) 5 0.0081
d) P(X $ 20) 5 1 2 0.0000001 5 0.9999999
Nótese que los valores correspondientes son muy parecidos usando la fórmula y Mini-
tab.
1. Escriba en una columna los valores de X donde quiere tener los cálculos de la función de distribución
acumulada.
Ejemplo 4.55. S
i los datos de un experimento siguen a una distribución lognormal y dan un modelo
de probabilidad razonable para la variable aleatoria X lognormal, con valores para-
métricos de μ 5 3.3 y σ 5 1.1, entonces calcular las siguientes probabilidades:
a) La probabilidad de que el valor de X esté entre 40 y 60.
b) La probabilidad de que el valor de X sea igual o mayor que 99.
c) La probabilidad de que el valor de X sea 50.
d) Para atestiguar la suposición del modelo lognormal, hacer una gráfica de probabi-
lidad lognormal.
Solución:
Siguiendo las instrucciones anteriores se genera la tabla siguiente, para la distribución
lognormal, la cual puede usarse para calcular las probabilidades pedidas.
Tabla 4.14.
80 0.8
70
60
50 0.6
40
30
20 0.4
10
5 0.2
1 0
20 30 40 50 60 70 80 90100 150
0 50 100 150 200 250
4.12.5 C
álculo de los valores de la función de distribución acumulada
Weibull
Las instrucciones para el uso de la función Weibull con Minitab son las siguientes:
1. Vaya a Calc → Probability distributions → Weibull
2. En la ventana de diálogo Weibull Distribution y en las ventanillas de Shape parameter y Scale para-
meter introduzca los valores del parámetro de forma y escala que definen la distribución Weibull.
3. Prosiga con las instrucciones pedidas por el programa.
Ejemplo 4.56. É
ste es un ejercicio de ingeniería civil, es decir, de calidad de seguridad y confiabilidad
adaptado del libro Statistics in Civil Engineering de Metcalfe (1997), el cual está rela-
cionado con las vidas (en semanas) de 23 bombas sumergibles, suponga que la vida
de estas bombas es una variable aleatoria Weibull. Los valores de los parámetros de
forma y escala son, respectivamente, 2.109 y 82.163. Los datos se encuentran en la tabla
siguiente.
Efectúe lo siguiente:
a) Una tabla con la probabilidad acumulada y la probabilidad de función de masa.
b) Una gráfica de probabilidad Weibull. ¿Qué tanta fidelidad tienen los datos bajo
estas condiciones?
c) Calcular la probabilidad de que la vida de las bombas sea de 70 semanas.
d) Calcular la probabilidad de que la vida de las bombas esté entre 68 y 70 sema-
nas.
Solución:
a) Siga las instrucciones anteriores para generar la tabla siguiente.
208 | Estadística para ingeniería y ciencias
Tabla 4.16.
Vidas de las bombas Probabilidad Función de
(semanas) acumulada densidad
18 0.039858 0.0045757
29 0.105249 0.0072365
33 0.135883 0.0080655
41 0.206133 0.0094265
42 0.215629 0.009566
46 0.254903 0.0100516
48 0.27521 0.0102502
52 0.316866 0.0105579
54 0.338096 0.010667
56 0.359515 0.0107467
68 0.488792 0.0106383
69 0.499406 0.0105875
70 0.509965 0.0105309
72 0.530901 0.0104009
84 0.64927 0.0092262
93 0.727089 0.008037
99 0.772735 0.0071733
105 0.81314 0.0062956
106 0.819363 0.0061503
128 0.921695 0.0032863
129 0.924927 0.003178
173 0.991838 0.0004784
90
99
90
Shape
Scale
2.108
82.16
N 23
80 80 AD 0.287
c) P(X 5 75) 5 φ 70
60
50
70
60 P-Value >0.250
50
Porciento
40 40
d) P(68 # X # 70) 5 0.021173 30
20
30
20
10 10
tab. 1 1
10 100
Vidas de las bombas (semanas)
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 209
Problemas propuestos
4.1 Dada la tabla siguiente: ción a los efectos en la salud producidos por la radiación de
Tabla 4.17 microondas debidas a la proximidad de los teléfonos celulares
a la cabeza del usuario y a la proximidad a las estaciones de
X P(X) antenas base de telefonía celular, a estaciones eléctricas, a lí-
0 0.8574 neas de alta tensión, a hornos de microondas, antenas base
de televisión y de radio, etc. La mayoría de estas investigacio-
1 0.1354
nes coinciden en que los efectos de las RE están afectando el
2 0.0071 cerebro y al sistema nervioso en mayor o menor grado. Hay
3 0.0001 estudios que han relacionado las emisiones electromagnéticas
con casos de cáncer en el cerebro, efectos en la actividad enzi-
Calcular las sumas: mática y espermática, efectos visuales y auditivos, prevalencia
1 de dolores de cabeza entre los usuarios de teléfonos móviles,
a) ∑ P( x) .
1
∑ 2
x 50
1
b) ∑ P( x) 2 ∑ P( x) .
proximidad de las antenas base de telefonía móvil y sus efectos
en la salud, algunos países han estipulado, como un criterio se-
x 50 x 50
20 10
x5 x5 guro, el establecimiento de las antenas de microondas a distan-
4.2 Con∑ x)) 2 ∑ P( x)
3
∑
∑
P
P(( x
3
referencia
P( x) al ejercicio 4.1, calcular:
x 50 x 50
cias mínimas de 600 metros de complejos habitacionales (reco-
x 50
x530 mendaciones que no se han considerado). De acuerdo con lo
c) ∑ P( x) . anterior, se diseña un ejemplo hipotético relacionado con las
x 50 mediciones de radiación electromagnética y la proximidad a
4.3 Este ejercicio (adaptado del libro Probability and Statistics la fuente emisora, es decir, haciendo mediciones a diferentes
de Devore (2000)), está relacionado con el estudio que hizo distancias de las antenas base de telefonía celular. Esto se hace
un ecologista, quien deseaba marcar una región circular de con el objeto de examinar el efecto que tienen factores como
muestreo con un radio de 10 metros. Sin embargo, el radio re- distancia, hora del día, estación del año, etc. Para este ejemplo,
sultante R de la región muestreada es en realidad una variable en particular, se calculan los promedios de una muestra aleato-
aleatoria R con una función de probabilidad de densidad de: ria de 30 mediciones de radiación electromagnética para cada
una de las siguientes distancias: 25, 50, 100, 200, 300, 400, 500
2 y 600 metros de la antena base de telefonía celular. Los pro-
f (r ) 3(1 2 (104 2 r ) ) si 9 ≤ r ≤11 medios de la radiación electromagnética para cada distancia
0 en otro caso
son: 950 MHz, 800 MHz, 550 MHz, 300 MHz, 125 MHz, 30
Hallar el área esperada de la región circular resultante. MHz, 0.02 Hz y 0.001 Hz, respectivamente. El estudio se llevó
4.4 Este ejercicio (adaptado del libro Elementary Statistics de M. a cabo durante todo un año (cada mes) para evaluar variables
Tripla, 6a. edición. Addison-Wesley ([1995]) está relacionado como la distancia, la altura, época del año, factores meteoro-
con una distribución uniforme de temperaturas que tienen un lógicos (como temperatura, presión atmosférica, intensidad
rango de 0 °C a 5 °C. Si una temperatura se selecciona al azar, y dirección del viento, humedad relativa, contaminación del
encontrar P(X . 1 °C). aire, por partículas y gases, etc.), que pudieran afectar el poder
4.5 Dar el dominio de cada una de las siguientes variables y decir de la densidad de la radiación electromagnética emitida. Para
si las variables son continuas o discretas. resolver este problema haga lo siguiente:
a) El número de litros de agua en un radiador de automóvil. a) Una gráfica de intensidad de radiación electromagnética
b) El número de libros en el estante de una librería. en función de las distancias. Si hubiese valores atípicos
c) El diámetro D de una esfera. extremos, enlistar tres posibles factores físicos (no esta-
4.6 Actualmente hay mucho debate por saber si las emisiones de dísticos) que puedan explicar estas situaciones.
campos electromagnéticos producidos por los teléfonos móvi- b) Una gráfica de probabilidad exponencial y calcular el
les (celulares) y sus estaciones de antenas base pueden estar valor del parámetro histórico. ¿Se ajustan bien los datos
afectando la salud de las personas. De acuerdo con la fuente bajo estas condiciones?
SRI International, 2007, la cantidad de teléfonos celulares au- c) De acuerdo con los resultados obtenidos en el inciso (b)
mentó de 500 millones en 2003 a 2 500 millones de teléfonos hacer una tabla con las probabilidades acumuladas y su
móviles en 2007. (http://www.sri.com/policy/csted/reports/ gráfica correspondiente y calcular las siguientes probabi-
sandt/techin2/chp4.html). Este incremento tan desmesurado lidades.
del uso de la telefonía celular y sus consiguientes efectos en 1) P(X # 200).
las funciones cognitivas y fisiológicas debido a las radiaciones 2) P(100 # X # 400).
electromagnéticas (RE) es una situación que está causando
d) Desde el punto de vista de la salud, ¿cree usted que a me-
mucha preocupación entre las personas conocedoras de este
dida que las antenas base de telefonía celular se sitúen más
problema. Se han realizado muchas investigaciones con rela-
alejadas de los complejos habitacionales la gente estará
210 | Estadística para ingeniería y ciencias
menos expuesta a daños a la salud por los efectos de la desarrollo) depositado en la Tierra es una variable aleatoria
radiación electromagnética? con función de densidad:
4.7 Supóngase que la función de densidad de cierto experimento f (x) 5 1/60 e−x/60 para x $ 0
de mediciones de oxígeno disuelto (OD) es exponencial con a) Dar el promedio del tiempo de degradación del pesticida.
λ 5 1. Encontrar las siguientes probabilidades: b) Calcular la probabilidad de que el pesticida, sobreviva a
a) P(0 , X , 4). los 100 días.
b) P(X , 4). 4.13 Supóngase que el tiempo en horas requeridas para reparar
c) P(2 , X , 5). una bomba de calor es una variable aleatoria X que tiene
d) P(0 , X , 3). una distribución gamma con parámetros históricos de α 5 2
4.8 La vida promedio de una partícula en la atmósfera sigue la y β 5 0.5.
ley de Stoke. Ésta se encuentra en función del diámetro de a) Encontrar el promedio, la varianza y la desviación están-
sedimentación, misma que se halla en función de la densidad dar de la variable X.
de la partícula, la densidad del medio, la viscosidad absoluta b) ¿Cuál es la probabilidad de que el siguiente servicio re-
del medio, la aceleración de la gravedad (981 cm/s2), etc. De quiera más que 4 horas para reparar la bomba?
esta manera, X, la vida promedio de la partícula, se modela c) La probabilidad de que se requieran entre 3 y 4 horas
con la función densidad exponencial. Suponiendo que la vida para reparar la bomba.
promedio en la atmósfera de esa partícula sea de 12 años, en- 4.14 Suponiendo que un estudio relacionado con la producción de
tonces: cierta sustancia química siga a una distribución gamma con
α 5 3; entonces, encontrar las siguientes probabilidades:
a) ¿Cuál es la probabilidad de que la vida de residencia at-
a) P(X . 5)
mosférica de la partícula sea a lo más de 6 años?
b) P(3 # X # 5)
b) ¿Cuál es la probabilidad de que la vida de residencia at-
mosférica de la partícula sea entre 5 y 10 años? 4.15 Éste es un problema que involucra el uso de la distribución
Sugerencia: Usar las siguientes relaciones: gamma en donde aparecen distribuciones que no son están-
dares. (Devore 2001, p. 171.) Supóngase que el tiempo X de
P(X # x0) 5 1 2 e−x/μ y
supervivencia, en semanas, de un ratón macho, selecciona-
P(5 # X # 10) 5 P(X # 10) 2 P(X # 5)
do al azar y expuesto a 240 rads de radiación gamma tiene
4.9 La vida (en horas) de un dispositivo electrónico es una va-
una distribución gamma con α 5 8 y β 5 15.
riable aleatoria con función de densidad exponencial f (x) 5
a) Calcular la media y la varianza de X.
1/50 e−x/50 para x $ 0.
Encontrar la probabilidad de que un ratón sobreviva:
a) ¿Cuál es la vida media del dispositivo?
b) Entre 60 y 120 semanas.
b) Hacer una gráfica con valores de x 5 5, 6, 7, 8, 9, 10, 11,
c) A lo más 30 semanas.
12, 13, 14, 15, 20 con su probabilidades correspondientes
4.16 Sea X la resistencia final a la tensión (ksi) a −200 °F de un
f (x).
tipo de metal que presenta problemas de resistencia a tempe-
Sugerencia: Usar el programa Minitab.
raturas bajas. Supóngase que X tiene una distribución Weibull
c) Calcular P(X # 10). Hacerlo con la fórmula y también
con parámetros α 5 20 y β 5 100. Calcular lo siguiente:
revisando la gráfica.
a) La probabilidad de que la resistencia final a la tensión
d) Calcular P(10 # X # 15). Hacerlo con la fórmula y la
(ksi) a −200 °F se dé 105 a lo más.
gráfica. b) Entre 98 y 102.
4.10 La vida de un transistor de televisión está exponencialmente 4.17 La duración de cierta refacción (en meses) para automóviles
distribuida con un promedio de 1 000 horas. Encontrar la pro- sigue a una distribución Weibull con α 5 25 y β 5 105.
babilidad de que semejante transistor de televisión durará: Calcular:
a) Entre 800 y 1 200 horas. a) P(X # 110 meses).
b) Cuando menos 1 500 b) P(90 # X 115 meses).
4.11 Este ejercicio está adaptado del libro Probabilidad y estadísti- c) La probabilidad de que la refacción se desgaste después
ca aplicadas a la ingeniería de los autores Montgomery et al. de 60 meses.
(1996). Supóngase que la variable aleatoria X tiene una dis- 4.18 Se sabe que la distribución de Weibull se usa ampliamente en
tribución exponencial con promedio igual que 10. Calcular: problemas de estadística relacionados con el envejecimiento y
a) P(X $ 10) deterioro de materiales sólidos aislantes sujetos a voltajes de
b) P(X $ 20) CA. Los valores de los parámetros dependen del voltaje y de
c) P(X $ 30) la temperatura; considere que se tiene un aparato cuya vida
d) P(X $ 60) útil (en horas) sigue una distribución Weibull con parámetros
e) Entre 5 y 50 de densidad α 5 2.5 y β 5 200.
f ) P(X # 30) a) ¿Cuál es la probabilidad de que la vida de uno de estos
aparatos sea a lo más de 200?
Sugerencia: Para esto, usando el paquete de computadora
b) Menos que 200 horas.
Minitab, hacer una gráfica con la función exponencial en los
c) Más de 300 horas.
valores x 5 0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 y 60
d) Entre 100 y 200 horas.
en función de las probabilidades acumuladas. Una vez hecho
esto, determinar los valores de las probabilidades requeridas. 4.19 Éste es un ejercicio relacionado con la distribución
normal inversa. Considerar a Z ≈ N(0, 1). Encontrar
4.12 La vida promedio de un pesticida organoclorado (pestici-
el valor de la variable aleatoria z de tal manera que
da muy tóxico y persistente que todavía se usa en países en
P(Z , z) 5 0.04.
Capítulo 4 Funciones de distribución de variables aleatorias continuas | 211
4.20 Se tiene una variable aleatoria con media igual a 1800 y des- 10 mm. Encontrar la probabilidad de que X tenga un valor
viación estandar igual a 200; si se obtiene una muestra alea- entre 45 mm y 62 mm de lluvia.
toria de 60 unidades, utilice el teorema central del límite para 4.33 Si la concentración de nitratos, en mg/L, en aguas residuales
promedio muestral esté entre 1 800 y 1 900. tiene distribución normal con media µ y desviación estándar
4.21 Calcular las siguientes probabilidades de precipitaciones plu- σ. ¿Cuál es la probabilidad de que las concentraciones estén:
viales suponiendo que los datos siguen una distribución nor- a) dentro del rango (µ ± 2σ)?
mal. b) sea mayor que (µ −1.5σ)?
a) ¿Cuál es la probabilidad de que las mediciones de preci- 4.34 Sea X variable aleatoria normal con µ 5 300 y σ 5 50. En-
pitaciones pluviales de 24 horas no difieran del promedio contrar la probabilidad de que X tome un valor mayor que
por 3/4 de la desviación estándar? Dibujar la gráfica. 362.
b) ¿Cuál es la probabilidad de que las mediciones de preci- 4.35 Dada X, una variable aleatoria normal, con µ 5 40 y σ 5 6,
pitaciones anuales no difieran del promedio por más de hallar el valor de X que tenga:
0.5 de la desviación estándar? Dibujar la gráfica. a) 45% del área a la izquierda.
c) ¿Cuál es la probabilidad de que las precipitaciones anua- b) 14% del área a la derecha.
les difieran del promedio por más de la mitad de la des- 4.36 La tela de fibra de vidrio del equipo de control para partículas
viación estándar? atmosféricas tiene una duración con distribución normal con
4.22 Sea X una variable aleatoria normal con media de 72 micras media de 3.0 años, y una desviación estándar de 0.5 años.
y desviación estándar de 15 micras. Determinar los valores Encontrar la probabilidad de que una tela de un filtro dure
de la función de distribución acumulada de X en: menos de 2.3 años.
a) 60 micras. 4.37 Una compañía fabrica electrodos para precipitadores elec-
b) 93 micras. trostáticos (equipo de control para partículas contaminantes
c) 72 micras. en aire), cuya duración está normalmente distribuida con
4.23 Refiriéndose al problema anterior, encontrar los valores de una media igual a 800 horas y una desviación estándar de
X correspondientes a la variable aleatoria normal Z y su fun- 40 horas. Determinar la probabilidad de que un electrodo se
ción de distribución acumulada para los valores: funda entre 778 y 834 horas.
a) z 5 21. 4.38 Se utilizan medidores para rechazar todos los componentes
b) z 5 1.6. cuyas dimensiones no se encuentren dentro de la especifi-
4.24 Encontrar el área bajo la curva normal estándar entre z 5 0 cación dada por 1.50 ± d. Se sabe que esta dimensión está
y z 5 1.2. normalmente distribuida con un promedio de 1.50 y una
4.25 Considere que el nivel de contaminación X de las industrias desviación estándar de 0.2; determinar el valor de d para
en una región es tal que X ~ N(µ, σ2). Se observa el nivel de que la especificación cubra 95% de las mediciones.
contaminación de dos industrias independientemente; los 4.39 En un estudio de ingeniería de higiene industrial y seguri-
valores que dieron son: X1 5 90 y X2 5 74; si al estandarizar dad, el supervisor de producción encuentra que, los traba-
los valores de X1 y X2 se obtuvieron Z1 5 0.7, y Z2 5 20.5, jadores, en promedio, completan una tarea en 10 minutos
respectivamente, encontrar la media y la desviación están- cuando están expuestos a altas concentraciones de gases.
dar de X. Los tiempos requeridos para completar la tarea son aproxi-
4.26 Hallar el área bajo la curva normal estándar entre z 5 0 y madamente normales con una desviación estándar de 3 mi-
z 5 2.05. nutos. Encontrar lo siguiente:
4.27 Determinar el área bajo la curva normal entre z 5 10.92 y a) La proporción de empleados que completan la tarea en
z 5 1.94. menos de 4 minutos.
4.28 Encontrar la probabilidad de que una Z observada se encuen- b) El porcentaje de empleados que requieren más de 5 mi-
tre a la derecha de z 5 2.05 y a la izquierda de z 5 1− .44. nutos en completar la tarea.
4.29 Si X es el promedio y s es la desviación estándar de una c) La probabilidad de que un empleado, quien acaba de ser
muestra aleatoria de 40 mediciones de partículas atmosféri- asignado a la tarea, la completará dentro de 3 minutos.
cas menores de 10 micras, encontrar la probabilidad de que 4.40 En un estudio de meteorología de precipitación pluvial, el
las mediciones estén fuera del rango de ( X ± 1.2 s). Dibujar promedio de lluvia registrado, a la centésima de un centí-
la gráfica. metro, para el mes de marzo fue de 9.22 centímetros. Supo-
4.30 Determinar el valor o los valores de z cuando: niendo que estos valores están normalmente distribuidos con
a) La probabilidad entre 0 y z es de 0.3770. una desviación estándar conocida de 2.83 cm, encontrar la
b) La probabilidad a la izquierda de z es de 0.8621. probabilidad de que en el mes de marzo del siguiente año, se
4.31 Si los diámetros de las chumaceras de una maquinaria están reciban:
normalmente distribuidos con una media de 0.6140 pulgadas a) Menos de 1.84 cm de lluvia.
y una desviación estándar de 0.0025 pulgadas, determinar la b) Más de 5 cm de lluvia.
probabilidad de que las chumaceras tengan diámetros: c) Cuando menos 13.8 cm de lluvia.
a) Entre 0.610 y 0.618 pulgadas inclusivamente. d) Igual que 5 cm de lluvia, e.g., P(4.5 # X # 5.5).
b) Menor que 0.617 pulgadas. e) Graficar cada inciso.
c) Mayor que 0.608 pulgadas. 4.41 Sea Z una variable aleatoria normal estándar, calcular las si-
d) Igual que 0.615 pulgadas. guientes probabilidades y dibujar las gráficas.
4.32 La precipitación pluvial tiene distribución normal con me- a) P(0 # Z # 2.17)
dia igual que 50 mm y una desviación estándar igual que b) P(0 # Z # 1)
212 | Estadística para ingeniería y ciencias
La fotografía que se muestra corresponde a un auto deportivo. Éste es uno de los inventos que más fascinan
a hombres y mujeres de todas las edades. Existe en el mercado una gran variedad de marcas y modelos de
automóviles. Cuando de elegir auto se trata, una de las características deseables es que sea económico en
el consumo de combustible y en el costo de las refacciones. En este sentido, se dice que los autos europeos
o japoneses cumplen con estas características, pues el consumo de gasolina es menor comparado con los
autos elaborados en Estados Unidos de América. El consumo de gasolina por kilómetro recorrido es una
variable aleatoria que depende de varios factores, entre ellos: la marca y el modelo del auto, pero también
depende de la velocidad y la temperatura ambiente a las cuales se maneja, además de la presión atmosférica,
etc. Se puede suponer de manera simplista que el consumo de gasolina sigue un modelo de probabilidad f (x)
(por ejemplo, una densidad normal), pero los parámetros de esta distribución, como la media y la varianza,
son desconocidos y sólo se puede obtener cierta información acerca de ellos a través de datos obtenidos al
experimentar el manejo de un auto, esto es por medio de datos muestrales.
Introducción
En este capítulo se estudiará el concepto de parámetro y de su estimador estadístico, así como se revisará el
método de estimación de máxima verosimilitud (el más común de los métodos de estimación), se analizarán
las propiedades deseables para ser considerados buenos estimadores y se citarán varios ejemplos en cada uno
de los temas tratados.
214 | Estadística para ingeniería y ciencias
Definición 5.1. Se llama muestra aleatoria al conjunto de observaciones independientes Xl, X2, X3,
. . . , Xn de la función de distribución F(x; θ).
En este contexto, θ denota de manera genérica a cualquier parámetro, es decir, θ representa in-
distintamente a µ, σ, λ, etc., además por ser las observaciones de la muestra independientes entre sí,
su función de densidad conjunta es igual al producto de las funciones de densidad marginales.
Definición 5.2. Sea Xl, X2, X3, . . . , Xn una muestra aleatoria de una función de distribución F(x, θ). Se
llama estimador del parámetro θ a una función de los datos muestrales. Al estimador del parámetro θ
se denota como θ̂ , es decir, con la misma letra que se designa el parámetro y un gorrito encima:
Si θ es el parámetro, entonces θ̂ 5 h(Xl, X2, X3, . . . , Xn ) es un estimador.
Capítulo 5 Estimación | 215
Definición 5.3. Dado θ̂ , un estimador del parámetro θ, se llama estimación de θ al valor del estima-
dor evaluado en una muestra particular.
De manera que un estimador es una regla para calcular y una estimación es el valor que toma
un estimador.
Ejemplo 5.1. S
upóngase que se tiene una muestra aleatoria X1, X2, X3, . . . , Xn de una función de
distribución Bernoulli con parámetro p. Un estimador de p está dado por p̂ 5 X ; es
decir, el estimador de p es el promedio de los datos muestrales. Ahora, supóngase que
se tomó una muestra de 10 observaciones dadas por:
X1 5 1, X2 5 0, X3 5 1, X4 5 1, X5 5 0, X6 5 1, X7 5 1, X8 5 0, X9 5 0, X10 5 1
(1 1 0 11 11 1 0 1 1 11 1 0 1 0 11) 6
El promedio de estos 10 datos es 5 5 0.6, enton-
10 10
ces una estimación del parámetro es p50
ˆ .6 .
Insesgamiento
El insesgamiento está relacionado con el concepto de exactitud. Una manera simple de explicarlo es la si-
guiente: cada posible muestra aleatoria proporciona un diferente valor de estimación para el parámetro θ; si se
encuentran todos los valores posibles de θ̂ y se obtiene su promedio y éste concuerda con θ, entonces, se dice
que el estimador θ̂ es insesgado. La definición formal de esta propiedad es:
Definición 5.4. Un estimador θ̂ del parámetro θ se dice que es insesgado si se satisface la relación
E( θ̂ ) 5 θ.
Ejemplo 5.2. S
ea X1, X2, X3, . . . , Xn una muestra aleatoria de una distribución Poisson con pa-
rámetro λ, mostrar que la media aritmética de los datos muestrales es un estimador
insesgado de λ.
Solución:
Dado que Xi tiene distribución Poisson con parámetro λ, se tiene que E(Xi) 5 λ para
toda i 5 1, 2, . . . , n. Por otro lado, se tiene que la media aritmética de los datos mues-
1 n
trales es X 5 ∑ X , entonces por la propiedad de linealidad del valor esperado (la
n i =1 i
esperanza matemática saca constantes y separa sumas) se obtiene:
216 | Estadística para ingeniería y ciencias
1 n
n
1
E ( X ) 5 E ∑ i =1 X i 5 E
n (∑ X )5 1n ∑
n
i =1 i
n
i =1
E( X i )5
1 n
n i =1
nλ
∑ λ 5 n 5λ
En general, la media aritmética de la muestra es un estimador insesgado de la media
de la variable aleatoria. En efecto, si una muestra X1, X2, X3, . . . , Xn procede de una
población de media µ, quiere decir que:
E[Xi] 5 µ para cualquier i 5 1, . . . , n
lo cual corresponde a la solución del problema anterior.
Eficiencia
El concepto de eficiencia está relacionado con la precisión del estimador, así que primero se citará la definición
de eficiencia relativa.
Definición 5.5. Si θ̂1 y θ̂2 son ambos estimadores insesgados de θ y V ( θ̂1 ) # V( θ̂2 ), diremos que θ̂1
es más eficiente que θ̂2 . Un estimador es más eficiente (más preciso), si su varianza es menor.
Cuando se tiene un estimador insesgado de un parámetro θ es útil saber si hay otro estimador
insesgado más eficiente; en este sentido el teorema de Cramér-Rao proporciona una cota mínima para
las varianzas de los estimadores insesgados. Antes de citar el teorema veremos dos lemas siguientes.
Lema 5.1. Si X1, X2, X3, . . . , Xn es una muestra aleatoria de una función de densidad, tal que f (x,
θ) . 0 para x en una región que no depende del parámetro θ , entonces:
(5.1)
Demostración:
Primero encontremos el valor esperado de
Para ello, se utiliza el hecho de que f (x1, x2, . . . , xn; θ), es una función de densidad conjunta, entonces:
y como la región donde f (x1, x2, . . . , xn; θ) . 0 no depende del parámetro se puede intercambiar la
derivada con las integrales, quedando así:
h h h y
µ µ …µ f ( x1 , x2 , … , xn ; V)dx1dx2 … dxn
h h h yV
h h h
y
f ( x1 , x2 , … , xn ; V)
µ µ …µ yV
f ( x1 , x2 , … , xn ; V)dx1dx2 … dxn
h h h f ( x1 , x2 , … , xn ; V)
Capítulo 5 Estimación | 217
© y ¹
Eª
« yV
log( f ( X 1 , X 2 , … , X n ; V)) º» 0
Por otro lado, se sabe que X1, X2, X3, . . . , Xn son variables aleatorias independientes que satisfacen
la relación:
f (x1, x2, . . . , xn; θ) 5 f (x1; θ) f (x2; θ) . . . f (xn, θ)
entonces:
y dado que X1, X2, X3, . . . , Xn son variables aleatorias independientes, se obtiene:
Lema 5.2. Si X1, X2, X3, . . . , Xn es una muestra aleatoria de una función de densidad, tal que f (x;
θ ) . 0 para x en una región que no depende del parámetro θ y θ̂ es un estimador insesgado de θ,
entonces:
(5.2)
Demostración:
Teorema 5.1. (Cramér-Rao) Si X1, X2, X3, . . . , Xn es una muestra aleatoria de una función de den-
sidad, tal que f (x; θ) . 0 para x en una región que no depende del parámetro θ, entonces, para todo
θ̂ estimador insesgado de θ satisface la desigualdad:
(5.3)
Demostración:
Se sabe que el coeficiente de correlación de dos variables aleatorias es un valor entre –1 y 1, entonces
para las variables aleatorias θ̂ y , se tiene que:
1 / (b − a) si a # x # b
f ( x; a, b) 5
0 en otro caso
Capítulo 5 Estimación | 219
la cual significa que el rango de x está determinado por los parámetros a y b. Con esta función de
densidad no se aplica el teorema.
Ejemplo 5.3. E
ncontrar la cota de Cramér-Rao para la función de densidad Bernoulli y mostrar que
la media aritmética de la muestra es un estimador eficiente de p.
Solución:
Se sabe que la función de densidad Bernoulli es igual a f (0) 5 12 p y f (1) 5 p; estas
funciones se pueden escribir como f (x; p) 5 px(12 p)1−x para x 5 0, 1, 0 , p , 1 y 0 en
otro caso.
El logaritmo de esta función de densidad es log( f (x; p)) 5 xlog(p) 1 (1 2 x)log(1 – p).
Su derivada respecto a p es .
0 1 − 0 2 1 1−1
2
1− p p n
5 n − (1 − p) 1 p − 1 − p p = n 1 25
p 1 − p (1 − p) p p(1 − p)
2
Por otro lado, se encuentra que la varianza de la media aritmética de los datos mues-
trales es:
n 1 n 1 n np(1 − p) p(1 − p)
V ( X ) 5V 1n ∑ X i 5 2 ∑ V ( X i ) 5 2 ∑ p(1 − p) 5 5
i =1 n i =1 n i =1 n2 n
Consistencia
Si no es posible emplear estimadores de mínima varianza, el requisito mínimo deseable para un estimador es
que a medida que el tamaño de la muestra crece, el valor del estimador tienda a estar cerca del valor del pará-
metro, propiedad que se denomina consistencia. Existen diversas definiciones de consistencia, más o menos
restrictivas, pero la más utilizada es la siguiente.
220 | Estadística para ingeniería y ciencias
Definición 5.7. Un estimador θ̂ del parámetro θ se dice que es consistente si cuando n crece, θ̂ tiende
en probabilidad a θ. Esto significa que si para toda ε . 0 es imposible que cuando n sea grande, la
distancia entre θ̂ y θ es mayor que ε; en símbolos esto se expresa:
Demostración:
Sea g( θ̂ ) la función de densidad del estimador θ̂ , entonces:
∞
V (θˆ ) 5 ∫ (θˆ − θ)2 g (θˆ )dθˆ 5 ∫ ˆ (θˆ − θ)2 g (θˆ )dθˆ $ ε 2 ∫ ˆ g (θˆ )dθˆ 5 ε 2 P (| θˆ − θ | . ε)
−∞ |θ − θ )| > ε |θ − θ )| > ε
Por tanto,
V( θ̂ ) $ ε2 P(| θ̂ 2 θ|. ε) $ 0
Si lím V( θ̂ ) 5 0, entonces necesariamente para una ε fija lím P(| θ̂ 2 θ|. ε) 5 0 y θ̂ es un estimador
nmd nmd
consistente de θ.
Suficiencia
E1 concepto de estadística suficiente lo introdujo Fisher en 1922, y ha sido objeto de numerosas e importantes
investigaciones. Como originalmente indicó Fisher, un estadístico (o función de la muestra de valores obser-
vados) es suficiente para el objetivo de la inferencia estadística si contiene, en un cierto sentido, toda la “infor-
mación” sobre la distribución generadora (función de distribución de acuerdo con la cual ha sido generada la
muestra de valores observados). ¿En qué sentido hemos de usar la palabra “información” aquí? Supondremos
que el modelo estadístico de las variables aleatorias observables tiene una cierta función de distribución con-
junta que pertenece a una familia especificada F(x; θ) de funciones de distribución. Sin embargo, la verdadera
función de distribución generadora es desconocida, pues se ignora el valor de θ.
Definición 5.8. Sea Xl, X2, . . . , Xn una muestra aleatoria de la función de densidad f (x; θ); se llama
estadística a cualquier función de los datos muestrales, es decir, cualquier función de la forma T 5
h(Xl, X2, . . . , Xn) es una estadística.
La única información que se tiene para tomar una decisión sobre θ es el resultado del experimen-
to aleatorio, es decir, la muestra aleatoria Xl, X2, . . . , Xn. Sin embargo, los datos muestrales son un
Capítulo 5 Estimación | 221
Definición 5.9. Se dice que una estadística T es suficiente para el parámetro θ si la función de densi-
dad condicional de U (cualquier otra estadística dada T ), no depende del parámetro. Esto es, si para
toda U se tiene que fU|T(u|t) no depende de θ, entonces T es estadística suficiente para θ.
En otras palabras, un estimador es suficiente para θ cuando ya tiene toda la información sobre el
parámetro que está contenida en la muestra.
Es difícil probar con todas las posibles estadísticas si fU|T(u|t) no depende de θ, y debido a que
todas las estadísticas dependen de la muestra, se puede tomar en lugar de todas las estadísticas la
propia muestra Xl, X2, . . . , Xn. Entonces, un método para verificar si una estadística T es suficiente,
es determinar la distribución condicionada de Xl, X2, . . . , Xn, dado T. Sin embargo, este método es
también laborioso y de gran dificultad. Fisher y después Neyman proporcionaron un criterio simple,
con el cual generalmente podemos determinar si una familia F(x; θ) de funciones de distribución
admite un estadístico suficiente no trivial y definir cuál es la forma de este estadístico. Este criterio lo
proporciona el célebre teorema de factorización de Neyman-Fisher.
f (x1, x2, . . . , xn; θ) 5 f (x1; θ) f (x2; θ) . . . f (xn; θ) 5 g(T; θ)h(x1, x2, . . . , xn) (5.6)
Demostración:
Primero se demuestra que si T es estadística suficiente, entonces se satisface la relación:
f (x1, x2, . . . , xn; θ) 5 g(T; θ)h(x1, x2, . . . , xn)
Por la definición de función de densidad condicional se tiene que:
f ( x1 , x2 , … , xn , t ; V) f ( x1 , x2 , … , xn ; V)
g (T ; V) g (T ; V)
f ( x1 , x2 , … , xn , t ; V)
h( x1 , x2 , … , xn )
g (T ; V)
f ( x1 , x2 , … , xn ; V)
h( x1 , x2 , … , xn )
g (T ; V)
Ejemplo 5.4. C
omprobar que la función de distribución exponencial admite una estadística suficien-
te para el parámetro λ.
Solución:
La función de densidad conjunta de la muestra es:
f (x1, x2, . . ., xn; λ) 5 f (x1; λ) f (x2; λ) . . . f (xn; λ)
5 λ exp(2λ x1) λ exp(2λ x2) . . . λ exp(2λ xn)
5 λn exp(2λ[ x1 + x2 1 . . . 1 xn])
5 λn e2λΤ
Las dos funciones de la factorización son g(T, λ) 5 λn e2λΤ y h(x1, x2, . . . , xn) 5 1. De lo
anterior, resulta que la estadística suficiente para λ es T 5 X1 + X2 1 . . . 1 Xn.
Robustez
Al estudiar un proceso aleatorio es posible que la función de distribución generadora de la muestra sea F(x; θ)
(por ejemplo, una exponencial) y se está suponiendo que la distribución correcta es G(x; θ), (por ejemplo, una
Weibull) si la estimación de θ no se afecta fuertemente por considerar la verdadera distribución es G(x; θ), en
lugar de F(x; θ), entonces se dice que el estimador es robusto.
Definición 5.11. Dada una muestra aleatoria X1, X2, X3, . . . , Xn con función de densidad f (x; θ),
se conoce como función de verosimilitud a la función de densidad conjunta de la muestra. En esta
función, el parámetro θ es la variable, y la muestra se considera fija, esto es:
L(θ; x1, x2, x3, . . . , xn) 5 f (x1; θ) f (x2; θ) f (x3; θ) . . . f (xn; θ) con θ en Θ∗
Ejemplo 5.5. S
ea X1, X2, X3, . . . , Xn una muestra aleatoria de una función de densidad Bernoulli con
parámetro p, encontrar la función de verosimilitud de esta distribución.
Solución:
La función de densidad Bernoulli es f (x; p) 5 p x(1 2− p)1−x para x 5 0, 1, 0 , p , 1 y 0
en otro caso. Entonces, la función de verosimilitud es:
… p xn (1 p)1 xn p x1 x2
x 1 x1 x 1 x2 … xn n( x1 x2 … xn )
L( p) p 1 (1 p) p 2 (1 p) (1 p)
Definición 5.12. Dada una muestra aleatoria X1, X2, X3, . . . , Xn con función de densidad f (x; θ), se
conoce como estimador de máxima verosimilitud del parámetro θ al número θ̂ , donde la función de
verosimilitud alcanza el valor máximo.
Entonces, el objetivo del método de máxima verosimilitud es encontrar el valor del posible rango
de valores del parámetro que optimiza la función de verosimilitud, dados los datos de la muestra.
Ejemplo 5.6. D
eterminar el estimador de máxima verosimilitud del parámetro p en la función de
densidad Bernoulli.
Solución:
La función de verosimilitud en este caso es:
224 | Estadística para ingeniería y ciencias
… p xn (1 p)1 xn p x1 x2
x 1 x1 x 1 x2 … xn n( x1 x2 … xn )
L( p) p 1 (1 p) p 2 (1 p) (1 p)
Para hallar el valor de p donde L(p) alcanza su valor máximo, se debe derivar la función
de verosimilitud respecto a p y encontrar la raíz de esta derivada, así que su función de
verosimilitud es:
y x … xn 1 n( x … xn ) x … xn n ( x … xn ) 1
L( p) ( x1 … xn ) p 1 (1 p) 1 p 1 ( n ( x1 … xn ))(1 p) 1
yp
p 1
x K xn 1
(1 p)
n( x1 K xn )1
( x … x )(1 p) p(n ( x … x ))
1 n 1 n
Los puntos críticos de L(p) son las raíces o soluciones de la relación ∂p∂ L( p)50 . Hay
tres soluciones: p 5 0, 1 2 p 5 0 y (x1 1 x2 1 . . . 1 xn)(1 2 p) 2 (n 2 (x1 1 x2 1 . . .
1 xn))p 5 0.
• La primera ecuación implica que: p 5 0 y L(0) 5 0.
• La segunda ecuación implica que: p 5 1 y L(1) 5 0.
• La tercera ecuación implica que:
(x1 1 x2 1 . . . 1 xn) 2 p(x1 1 x2 1 . . . 1 xn) 5 np 2 (x1 1 x2 1 . . . 1 xn)p
Ψ (x1 1 x2 1 . . . 1 xn) 5 np
x1 x2 … xn n( x1 x2 … xn )
Ψ p 5 (x1 1 x2 1 . . . 1 xn)/n 5 x y L( x ) 5 x (1 x) 0
De las tres posibles soluciones de la ecuación ∂p∂ L( p)50 , la tercera es la que da mayor
valor al sustituirse en la función de verosimilitud. Entonces, el estimador del paráme-
tro p de máxima verosimilitud es p̂ = x .
Una manera de simplificar la obtención del estimador de máxima verosimilitud es
utilizar el logaritmo de L(θ); ya que la función logaritmo es estrictamente creciente, el
valor que hace máxima la función L(θ) también maximiza la función log(L(θ)).
En general, el método de máxima verosimilitud consiste en los siguientes pasos:
a) Obtener la función de verosimilitud L(θ; x1, x2, x3, . . . , xn) como el producto de las
funciones de densidad marginales evaluadas en los datos muestrales.
b) Obtener el logaritmo de la función de verosimilitud, Log(L(θ; x1, x2, x3, . . . , xn)).
c) Derivar el logaritmo de la función de verosimilitud.
d) Encontrar las raíces del logaritmo de la derivada de la función de verosimilitud.
e) Las raíces obtenidas en el punto anterior más los extremos en el intervalo de la de-
finición del parámetro son los candidatos de ser el valor que maximiza a la función
de verosimilitud. Determinar cuál de estos puntos maximiza la función de verosi-
militud; ese punto es el estimador de máxima verosimilitud.
Ejemplo 5.7. S
ea X1, X2, . . . , Xn una muestra aleatoria de una función de distribución Weibull con
parámetros α 5 2 y β desconocida, encontrar el estimador de máxima verosimilitud
de β.
Capítulo 5 Estimación | 225
Solución:
La función de verosimilitud para la función de densidad Weibull, con α 5 2 y β es:
2 x e −( x /β ) 2
f (x) 5 para x $ 0, 0 en otro caso; con β . 0.
β
Entonces, la función de verosimilitud es:
( x12 x22 … xn2 )/G 2
2 n ( x1 x2 … xn )e
L(G)
Gn
El logaritmo de esta función es:
y
log[ L(G)] 2( x12 x22 … xn2 ) / G 3 n / G
yG
Ejemplo 5.8. S
ea X1, X2, . . . , Xn una muestra aleatoria de una variable aleatoria exponencial con
parámetro desconocido λ, encontrar el estimador de máxima verosimilitud de λ.
Solución:
La función de densidad exponencial con parámetro λ es igual a:
f (x) 5 λe − λx para x $ 0, 0 en otro caso; con λ . 0
Entonces la función de verosimilitud es:
Q ( x1 x2 … xn )
L(Q) Q n e
El logaritmo de esta función es:
Ejemplo 5.9. S
ea X1, X2, . . . , Xn una muestra aleatoria de una variable aleatoria uniforme en el in-
tervalo [0, θ], encontrar el estimador de máxima verosimilitud de θ.
226 | Estadística para ingeniería y ciencias
Solución:
La función de densidad uniforme en el intervalo [0, θ] es igual a:
f (x) 5 1/ θ para 0 # x # θ, 0 en otro caso
Entonces, la función de verosimilitud es:
L(θ) 51 / θ n para 0 # x1, x2, . . . , xn # θ
ˆ máx{ x x … x }
V 1 2 n
c) Los estimadores de máxima verosimilitud son los más eficientes. Si el dominio de la función de
densidad no depende de θ, entonces, θ̂ alcanza la cota de Cramér-Rao.
d) Si existe una estadística suficiente para θ, entonces el estimador de máxima verosimilitud es sufi-
ciente.
Capítulo 5 Estimación | 227
e) Los estimadores de máxima verosimilitud son invariantes bajo transformaciones funcionales. Esto
significa que si θ̂ es el estimador insesgado de θ, entonces, u( θ̂ ) es el estimador de máxima verosimi-
litud de u(θ).
Los estimadores de máxima verosimilitud no necesariamente son insesgados; sin embargo, en la mayoría
de los casos se puede eliminar el sesgo con operaciones aritméticas simples de suma o multiplicación.
− 1 ∑ ( xi − µ )2
n
1
L(µ) 5 e 2 σ2 i =1
(5.9)
(2 π )n/ 2 σ n
El logaritmo de esta función es:
∑
n
log(L(µ)) = 2log((2π)n/2) 2 nlog(σ) 2 1
2 σ2 i =1
( xi − µ)2 (5.10)
(5.11)
La raíz de esta derivada es ∑ i =1 ( xi 2 µ) 5 0 ⇒ µˆ 5 x , esto significa que el estimador de máxima verosimi-
n
litud de la media de la normal es la media aritmética de la muestra y como se ve no depende del valor de la
varianza.
− 1 ∑ ( xi − µ )2
n
1
L(σ) 5 e 2 σ2 i =1 (5.12)
(2 π ) σ
n/ 2 n
∑
n 2
log(L(σ)) = 2log((2π)n/2) 2 nlog(σ) 2 1
2 σ2 i =1
( xi − µ) (5.13)
(5.14)
228 | Estadística para ingeniería y ciencias
n 1 1 n 1 n
∑ ( x 2µ) 5 0 ⇒ σˆ 2 5 n ∑ i=1 ( xi 2µ) , entonces, σˆ 2 5 n ∑ i=1 ( xi 2 µ) ,
n 2 2 2
La raíz de esta derivada es 2 1
σ σ 3 i =1 i
es el estimador de máxima verosimilitud de la varianza de la normal cuando se conoce µ.
∑
n 2
log(L(σ)) 5 2log((2π)n/2) 2 nlog(σ) 2 1
2 σ2 i =1
( xi 2 µ) (5.16)
y sus derivadas parciales respecto a µ y σ son:
(5.17)
Al igualar a cero las dos derivadas se obtiene un sistema de dos ecuaciones con dos incógnitas:
1
2 ∑ i =1
n
( xi − µ) 5 0
2σ
n 1
2 1 3 ∑ i =1 ( xi 2 µ) 5 0
n 2
(5.18)
σ σ
1
La solución de este sistema de ecuaciones está dada por µˆ = x y σˆ 22 5 ∑ i =1 ( xi 2 x) , éstos son los estima-
n 2
n
dores de máxima verosimilitud de los respectivos parámetros.
Teorema 5.4. Para una muestra aleatoria de una distribución normal, se tiene que µˆ = x es y un
estimador insesgado para la µ.
Demostración:
nµ
E(µˆ ) 5 E( X ) 5 1n E(∑ i =1 X i ) 5 1n ∑ i =1 E( X i ) 5 1n ∑ i =1 µ 5
n n n
5µ
n
Teorema 5.5. Para una muestra aleatoria de una distribución normal, se tiene que el estimador
1 n
∑
2
σˆ 2 5 ( xi 2 µ) es insesgado para σ2.
n i =1
Capítulo 5 Estimación | 229
Demostración:
1 n 2
1 n
E(σˆ 2 ) 5
n
∑ i =1
E ( X i − µ ) 5 ∑ i =1 σ 2 5 σ 2
n
Teorema 5.6. Para una muestra aleatoria de una distribución normal se tiene que el estima-
1 n
dor de σ2 dado por Sˆ 2 5 ¤ i 1 ( xi 2 x) es sesgado, mientras que el estimador de σ2, dado por
2
n
n 2 1
∑
n 2
2
s 5 σˆ 5 ( xi 2 x) es insesgado.
n−1 n−1 i =1
Demostración:
1 n 1 n 2
∑ E( xi 2 x) 5 ∑ i =1 E ( xi 2 µ) − 1n ∑ j =1 ( x j 2 µ)
2 n
E(σˆ 22 ) 5
n i =1
n
1 n
∑ E( xi 2 µ)2 1 n12 ∑ j =1 E( x j 2 µ)2 2 n2 ∑ j =1 E( xi 2 µ)( x j 2 µ) 1 1n ∑ j ≠ k E( xk 2 µ)E( x j 2 µ)
n n
5 i =1
n
1 n 2 1
∑ σ 1 n2 ∑ j =1 σ 2 2 n2 σ 2
n
5
n i =1
1 n
5 ∑ σ 2 1 nn2 σ 2 2 n2 σ 2
n i =1
n 21 2
5 σ
n
n−1 2
Como vemos, en este caso, E(σˆ 2 ) 5 σ , por tanto, el estimador de la varianza tiene sesgo.
n
n 2
Por otro lado, el valor esperado s 2 5 σ̂ es igual a:
n−1 2
n n n 21 2
E( s 2 ) 5 E(σˆ 22 ) 5 σ 5σ2
n 21 n 21 n
µ µ̂5 X µ
σˆ 2 5 1n ∑ i =1 ( X i 2 µ)
n 2
σ2 σ2 (µ conocida)
s 2 5 n1−1 ∑ i =1 ( X i 2 X )
n 2
σ2 σ2
230 | Estadística para ingeniería y ciencias
5.2.1 Introducción
La estimación puntual de un parámetro da una idea de su valor, pero nada dice de la precisión y la exactitud
con la cual se está estimando ese valor. Para remediar esta deficiencia se puede estimar la distancia media entre
el estimador y el parámetro y con esta estimación se construye un intervalo de confianza.
La idea de la estimación de un parámetro mediante un intervalo se basa en encontrar dos estadísticas T1 y
T2, tales que satisfagan la relación P(T1 # θ # T2) 5 1 2 α, donde 1 2 α se conoce como nivel de confianza.
Las dos estadísticas definen el intervalo (T1, T2) que con una probabilidad de 12 α contiene al parámetro θ.
Es importante aclarar la diferencia que existe entre decir intervalo aleatorio e intervalo de confianza.
Cuando se tiene el intervalo indicando los extremos mediante la fórmula de las estadísticas T1 y T2, se con-
sidera que el intervalo es aleatorio. Cuando se obtiene la muestra y con sus datos se evalúan las estadísticas
T1 y T2, el intervalo obtenido se dice que es de confianza, pues lo que se tiene es la confianza que la muestra
obtenida sea una de las que harían que T1 # θ # T2. El valor de 1 2 α corresponde a la probabilidad de que el
intervalo aleatorio contenga el parámetro; cuando se evalúan los extremos del intervalo en la muestra particu-
lar, se tiene un intervalo de confianza y el término (1 2 α)100% corresponde al porcentaje de confianza que
el parámetro se encuentra contenido en el intervalo.
En general, para determinar los intervalos de confianza del parámetro θ se debe tener una estadística cuya
función de distribución no dependa de algún parámetro desconocido. El siguiente ejemplo muestra la forma
de obtener un intervalo de confianza para el parámetro λ de la exponencial.
Ejemplo 5.10. S
ea X1, X2, . . . , Xn una muestra aleatoria de una distribución exponencial con pa-
rámetro λ. Encontrar el intervalo de confianza del parámetro λ usando la suma de
valores muestrales como base.
Solución:
Primero se determina la función de distribución de la variable Y 5λ ∑ i =1 X i , utili-
n
1 h h Q ( 1 t ) ¨ i "1 Xi dx … dx (1 t ) n
n
(1 t )n µ 0
… µ Q n (1 t )n e
0 1 n
y n−1 e − y
fY ( y) 5 si y . 0, con n . 0
Γ( n)
Como se puede ver, la función de densidad no depende de ningún parámetro desco-
nocido, pues n es el tamaño de la muestra.
Capítulo 5 Estimación | 231
5{x1, . . . , xn | a/ ∑ i =1 xi # λ # b/ ∑ i =1 xi }
n n
Ejemplo 5.11. U
na muestra aleatoria de una función de distribución exponencial de tamaño 20 da
una suma igual a 34.7. Encontrar un intervalo de 95% de confianza para λ.
Solución:
Dado que se quiere un intervalo de 95% de confianza, entonces 1 2 α 5 0.95 y se de-
ben hallar los números a y b, tales que P(a # Y # b) 5 0.95, cuando Y es una variable
aleatoria gamma con α 5 20, β 5 1. Existen infinidad de parejas a y b que satisfacen
la relación y por facilidad y conveniencia se elegirán los números considerando que
en los dos extremos se deja fuera la misma área, esto es:
P(Y # a) 5 P(Y $ b) 5 0.025
De aquí se obtiene que P(Y # b) 5 0.975. Los valores de a y b que satisfacen esta
relación se encuentran usando Excel con el asistente de función f . Elija funciones
ESTADÍSTICAS, luego DISTR.GAMMA.INV, introduzca los datos que se piden y
se obtiene que a 5 12.22 y b 5 29.67.
El extremo inferior del intervalo es 12.22/34.7 5 0.352 y el extremo superior del
intervalo es 29.67/34.7 5 0.855, usando la fórmula obtenida en el ejemplo 5.10 se
determina que:
0.352 # λ # 0.855 con 95% de confianza
Teorema 5.7. Si X1, X2, . . . , Xn es una muestra aleatoria de una función de distribución normal con
media µ y varianza σ2, entonces n ( X 2µ) / σ ~ N(0, 1).
Demostración:
Encontrar la función generatriz de momentos de la variable aleatoria:
Z 5 n ( X 2 µ) / σ 5(∑ i =1 ( X i 2 µ)) / nσ
n
1
… µ e ¨ i "1 e ¨ i "1 i
n n
h h t ( xi R )/ nX ( x R )2 / 2 X 2
MZ(t) 5 E(etZ) 5
(2 U )n/ 2 X n µ h h
dx1 … dxn
2
et / 2
… µ e ¨ i "1 i
n
h h ( x R tX / n )2 / 2 X 2
(2 U )n/ 2 X n µ h h
dx1 … dxn
2
/2
5et
ésta es la función generatriz de momentos de la normal estándar y así queda demostrado el teorema.
Teorema 5.8. Si X1, X2, . . . , Xn es una muestra aleatoria de una función de distribución normal con
media µ y varianza σ2, entonces ( n 21)s2 / σ 2 5 ∑ i =1 ( X i 2 X )2 / σ 2 ~ ji-cuadrada con n 2 1 grados
n
de libertad.
La demostración de este teorema sale del alcance de este libro.
Teorema 5.9. Si X1, X2, . . . , Xn es una muestra aleatoria de una función de distribución normal con
media µ y varianza σ2, entonces las variables n ( X 2µ) / σ y ( n 21)s2 / σ 2 5 ∑ i =1 ( X i 2 X )2 / σ 2 son
n
independientes.
La demostración de este teorema no será tema de este libro.
µ µ̂5 X µˆ 5 X ≈ N (µ, σ 2 / n) µ
1
σˆ 2 5 1n ∑ i =1 ( X i 2 µ)2 ∑ ( X 2 µ) ≈ χ2 con n grados de libertad
n n 2
σ2
σ 2 i =1 i
1
s 2 5 n1−1 ∑ i =1 ( X i 2 X ) ∑ ( X 2 X ) ≈ χ2 con n 1 grados de libertad
n 2 n 2
σ2
σ 2 i =1 i
Tabla 5.3. Valores de zα/2 para los niveles de confianza más comúnmente usados.
Determinación del tamaño de la muestra. La selección más apropiada del tamaño de la muestra es impor-
tante, porque no queremos una muestra de tamaño excesivamente grande, ya que será muy costosa, ni tan
pequeña que dé resultados deficientes. Como vemos, la longitud del intervalo de confianza para µ está deter-
minado por el error E 5 zα/2σ/ n . De esta ecuación, se puede despejar el término zα/2 o el valor de n. Entonces,
manipulando esta ecuación se pueden calcular tres términos:
a) E 5 zα/2σ/ n es la mitad de la longitud del intervalo; es el error máximo permitido para la distancia
entre µ y X . Para calcularlo se deben conocer los valores de 1 2 α y n.
b) zα/2 5 E/ n /2σ es el valor de Z para una confianza de 1 2 α; para calcularlo se deben conocer los va-
lores del error E y de n.
c) n 5 (2zα/2σ/E)2 es el tamaño de la muestra; para calcularlo se deben conocer los valores del error E y
de 1 2 α.
La primera ecuación se utiliza para construir el intervalo de confianza cuando se tiene el tamaño de la
muestra n y la confianza del estimador. La segunda ecuación se usa si se quiere determinar el valor de la con-
fianza y se conoce la longitud del intervalo de confianza y el tamaño de la muestra. La tercera ecuación se em-
plea para encontrar el tamaño de la muestra, la longitud del intervalo de confianza y el nivel de confianza.
Ejemplo 5.12. S
upóngase que se tiene una muestra aleatoria de 100 observaciones de concentraciones
de óxidos de nitrógeno (NO) atmosférico obtenida de una población normal con σ 5
25. Se calculó el promedio muestral y se obtuvo X 5 20. Encontrar el intervalo de
confianza de 95% y 99% para el promedio poblacional μ.
Solución:
La estimación puntual de μ es X 5 20. Se utiliza la primera de las tres fórmulas.
Intervalo de 95% para μ.
α 5 0.05, entonces α/2 5 0.025. En la tabla de la distribución normal estándar se en-
cuentra que z0.025 5 1.96
• El extremo inferior del intervalo es X 2 zα/2σ/ n 5 20 – 1.96 (25)/ 100 5 15.1
• El extremo superior del intervalo es X 1 zα/2σ/ n 5 20 1 1.96 (25)/ 100 5
24.9
234 | Estadística para ingeniería y ciencias
Ejemplo 5.13. U
n consultor estadístico intenta usar el promedio de una muestra aleatoria de tamaño
n 5 150, para estimar la aptitud mecánica promedio (promedio mediante cierta prue-
ba) de obreros de la línea de montaje de una industria. Si con base en la experiencia,
el estadístico puede suponer que σ 5 6.2 y la normalidad de las observaciones, en-
tonces, para estos datos, ¿qué puede afirmar este consultor con probabilidad de 0.99,
acerca de la dimensión máxima del error E?
Solución:
Los datos que se tienen son: n 5 150, σ 5 6.2, α 5 0.01; entonces, zα/2 5 z0.005 5 2.575.
Al usar la fórmula E 5 zα/2 (σ/ n ) y sustituyendo, resulta:
E 5 2.575(6.2/ 150 )
5 1.30
Con este resultado, el consultor estadístico puede afirmar, con un nivel de confianza
de 99%, que la distancia entre la media poblacional y la media muestral será a lo
mas de 1.30.
Ejemplo 5.14. S
uponer que el consultor estadístico del problema anterior desea un nivel de confian-
za de 95%; siendo así, ¿cuál sería la magnitud del error, E?
Solución:
Al usar nuevamente la fórmula E 5 zα/2 (σ/ n ) con zα/2 5 z0.025 5 1.96
E 5 1.96(6.2 150 ) 5 0.992
Nótese que debido a que se quiere menos precisión (usando el nivel de confianza de
95%), el intervalo es de menor longitud que en el ejemplo anterior. Observe que si
se cambia la confianza o el tamaño de la muestra, el error de estimación máximo E
también cambia.
Ejemplo 5.15. E
n un estudio de química, en un artículo publicado en el Journal of Heat Transfer, se
describe un nuevo método para medir la conductividad térmica del hierro Armco.
Suponer que se desea que el error promedio en la conductividad térmica del hierro
Capítulo 5 Estimación | 235
Armco sea menor que 0.05 Btu/h-ft-oF, con un nivel de confianza de 95%. Entonces,
si de estudios previos se sabe que la desviación estándar es de σ 5 0.10, estimar el
tamaño de muestra requerido.
Solución:
Aquí, zα/2 5 z0.05/2 5 z0.025 5 1.96, σ 5 0.10, E 0.05.
Al sustituir estos valores en la ecuación n 5 (zα/2 σ/E)2 obtenemos:
n 5 [(1.96)(0.10) / 0.05)]2
5 15.37 ≈ 16
Nota: Siempre debemos redondear por arriba el tamaño de la muestra, de manera
que el número requerido sea cuando menos adecuado. Esto es un convencio-
nalismo usado en estadística.
Ejemplo 5.16. E
n un estudio de recolección de basura desechada por el sector doméstico, es decir,
del reciclado de basura, queremos estimar el promedio del plástico desechado en las
casas. ¿Qué tamaño de muestra de casas debe ser seleccionado, aleatoriamente, si
deseamos estar seguros en 99% que el promedio muestral esté dentro de 0.250 kilo-
gramos del verdadero promedio poblacional μ? Suponer que estudios pilotos dan una
desviación estándar conocida de σ 5 1.100 kilogramos.
Solución:
Queremos un tamaño de muestra n, dado que α 5 0.01 (99% de nivel de confianza),
de manera que zα/2 5 z0.005 5 2.575 (valor constante de la tabla de la distribución nor-
mal con 99% nivel de confianza). Además, E 5 0.250, σ 5 1.100.
Así, sustituyendo los datos en la fórmula n 5 (zα/2 σ/E)2, obtenemos:
n 5 [(2.575)(1.100) / (0.250)]2
5 128.37
≈ 129
En conclusión, debemos de obtener una muestra de cuando menos 129 casas domés-
ticas seleccionadas aleatoriamente (que están descartando el plástico). Con semejante
muestra, estaremos confiados en un 99% de que el promedio muestral X no se aleja-
rá de μ más de 0.250 kilogramos.
Ejemplo 5.17. R
efiriéndose al ejemplo anterior, si quisiéramos tener resultados menos precisos em-
pleando un margen de error de 0.500 kilogramos, calcular el tamaño de la muestra n
suponiendo las mismas condiciones anteriores.
Solución:
Usando la fórmula n 5 (zα/2 σ/E)2, obtenemos:
n 5 [(2.575)(1.100) / (0.500)]2
5 32.09
≈ 33
236 | Estadística para ingeniería y ciencias
Observaciones:
a) Conforme disminuye la longitud del intervalo 2E, el tamaño requerido de la mues-
tra n aumenta para un valor fijo de σ y para el nivel de confianza especificado.
b) A medida que aumenta, el tamaño requerido de la muestra n se incrementa el
nivel de confianza, para una longitud deseada 2E fija.
c) Conforme aumenta el nivel de confianza, el tamaño requerido de la muestra n tam-
bién se incrementa para una longitud fija deseada 2E.
n ( X 2 µ) / σ n ( X 2 µ)
5 (5.20)
s/σ s
se distribuye como una t con n – 1 grados de libertad. Así que se satisface la relación:
P(2t12α/2 # n ( X 2µ) / s # t12α/2) 5 1 2 α (5.21)
Si se despeja de este intervalo el parámetro, resulta:
{2t12α/2 # n ( X 2µ) / s # t12α/2 } 5 { X 2 t12α/2 s/ n # µ # X 1 t12α/2 s/ n } (5.22)
Determinación del tamaño de la muestra. En este caso se pueden utilizar las mismas fórmulas derivadas de la
longitud del intervalo de confianza para µ que está determinado por el error E 5 t12α/2s/ n . De esta ecuación
se pueden despejar tres términos:
• E 5 t12α/2s/ n es la mitad de la longitud del intervalo y es el error máximo permitido para la distancia
entre µ y X . Para calcularlo se deben conocer los valores de 1 2 α y n.
• t12α/2 5 E n /2s es el valor de t para una confianza de 1 2 α. Se calcula al conocer el error E y n. Es
poco probable que el resultado del cálculo de la parte de la derecha de la ecuación sea uno de los que
cita la tabla de t de Student (recuerde que la tabla de t únicamente contiene los reportes para unos
cuantos valores de la probabilidad) entonces, t12α/2 y se obtiene usando las funciones de Excel o Mi-
nitab; otra opción es que cuando n es suficientemente grande se puede considerar que la distribución
t es aproximadamente normal estándar.
• n 5 (t12α/2 s/E)2 es el tamaño de la muestra; para calcularlo se debe conocer el error E y 1 2 α, pero
también se debe tener una estimación de σ, por lo que se requiere obtener una muestra piloto prelimi-
nar para calcular el valor de s.
Ejemplo 5.18. E
l gerente de una fábrica sabe que el tiempo que usan los trabajadores para hacer una
determinada faena se distribuye como una normal con media desconocida µ y varian-
za desconocida σ. Se seleccionó una muestra de 18 empleados y se les tomó el tiempo
Capítulo 5 Estimación | 237
Solución:
El intervalo de confianza se encuentra con la fórmula;
X 2 t12α/2 s/ n # µ # X 1 t12α/2 s/ n
σ2 σ2
y X 2 son las medias muestrales, entonces X 1 − X 2 ~ N µ1 2 µ 2 , 1 1 2 .
n n 1 2
Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las varianzas
poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas si son iguales o diferentes.
Cada uno de estos tres casos se analizará por separado.
Si las varianzas poblacionales son conocidas, los pasos a seguir para encontrar el intervalo de confianza son
los siguientes:
a) Se calcula X 1 − X 2 , el estimador suficiente de µ1 2 µ2.
X 1 2 X 2 2 (µ 1 2 µ 2 )
P 2zα / 2 , , z 51 2 α
σ 12 / n1 1 σ 22 / n2
α / 2
c) Al manipular la expresión anterior en forma similar a como se hizo en los casos de una sola muestra,
se llega al siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos me-
dias µ1 – µ2 con varianzas conocidas σ 12 y σ 22 .
238 | Estadística para ingeniería y ciencias
Teorema 5.10. Si X 1 y X 2 son las medias de dos muestras aleatorias independientes de tamaño n1
y n2 tomadas de poblaciones que tienen varianzas conocidas σ 1 y σ 2 , respectivamente; entonces un
2 2
X 1 2 X 2 2 zα / 2 σ 12 / n1 1 σ 22 / n2 , (µ1 2 µ 2 ) , X 1 2 X 2 1 zα / 2 σ 12 / n1 1σ 22 / n2
Ejemplo 5.19. C
onstruir un intervalo de confianza de 94% para la diferencia real entre las duraciones
de dos marcas de focos, si una muestra de 40 focos tomada al azar de la primera mar-
ca dio una duración media de 418 horas y una muestra de 50 focos de otra marca dio
una duración media de 402 horas. Las desviaciones estándares de las dos poblaciones
son 26 horas y 22 horas, respectivamente.
Solución:
Se tiene que X 1 5 418, X 2 5 402, σ1 5 26, σ2 5 22, n1 5 40, n2 5 50, a 5 0.04, z0.03
5 1.88. El intervalo de confianza es:
6.3 R1 R 2 25.7
El hecho de que ambos límites sean positivos y, por tanto, el intervalo no contenga el
valor cero, indica que es poco probable que ambas marcas tengan la misma duración
media, y sugiere que la primera marca de focos tenga una duración media superior a
la segunda.
Ejemplo 5.20. C
on la finalidad de reducir el consumo de gasolina (para que se contamine menos el
medio ambiente, especialmente, con CO2 que está calentando la Tierra y cambiando
el clima), se hizo un estudio para comparar el rendimiento en kilómetros por litro de dos
tipos de máquinas A y B. Para esto se seleccionó una muestra de 50 unidades del tipo
de máquina A y otra muestra de 50 unidades del tipo de máquina B. El promedio de
gasolina consumida para las máquinas tipo A fue de X 1 5 36 km por litro y el prome-
dio para las máquinas tipo B fue de X 2 5 42. Las desviaciones estándar fueron de 6
y 8 km para las máquinas A y B, respectivamente. Encontrar el 95% de intervalo de
confianza para (µA 2 µB).
Solución:
Los promedios aritméticos y las desviaciones estándar son: X 1 5 36 km y X 2 5 42 km
con σ1 5 6 y σ2 5 8, respectivamente. Los tamaños de las muestras son n1 5 n2 5 50.
Intervalo de 95%:
α 5 0.05, entonces α/2 5 0.025. En la tabla de la distribución normal estándar se en-
cuentra que z0.025 5 1.96.
Capítulo 5 Estimación | 239
Ejemplo 5.21. S
e prueban dos fórmulas diferentes de gasolina oxigenada para reducir las emisiones de
monóxido de carbono (CO) emitidas por los motores de combustión interna. Se sabe
de antemano que la varianza para la primera fórmula es de 1.5, mientras que la varianza
para la segunda fórmula es de 1.2. ¿Qué tamaño de muestra debe usarse para cada po-
blación muestreada, si se desea tener una confianza de 95% de que el error, al estimar la
diferencia entre los promedios de las dos fórmulas diferentes, sea menor que 1?
240 | Estadística para ingeniería y ciencias
Solución:
Se sustituyen los datos en la fórmula:
zα2 / 2 (σ 12 1 σ 22 ) 1.96 2 × (1.5 11.2)
n5 2
5 510.37 ≈ 11
E 12
Por tanto, el tamaño de la muestra para las poblaciones µ1 y µ2 es:
n 5 n1 5 n2 5 11
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadística para verificar si
son iguales o diferentes, esto se puede hacer usando las técnicas que se verán en el siguiente capítulo. Si se
concluye que no hay diferencia significativa entre las dos varianzas, entonces se efectúan los pasos siguientes
para obtener el intervalo de confianza.
El estadístico usado como estimador puntual de la diferencia de medias µ1 2 µ2 será X 1 − X 2 , que es un
estimador suficiente. Para el caso que las dos muestras sean independientes y obtenidas de una distribución
normal, resulta:
X 1 2 X 2 2 (µ 1 2 µ 2 ) ( n1 21)s12 1( n2 21)s22
~ N(0, 1) y ~χ (5.25)
2
σ 1 / n1 11 / n2 σ2
X 1 2 X 2 2 (µ 1 2 µ 2 )
sp 1 / n1 11 / n2 ~ t con n1 1 n2 2 2 grados de libertad
( n1 21)s12 1( n2 21)s22
donde: sp2 5
n1 1 n2 2 2
De esta expresión resulta el siguiente teorema.
Teorema 5.11. Si X 1 , X 2 , s12 y s22 son las medias y las varianzas de dos muestras aleatorias de tama-
ños n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas
desconocidas pero iguales, entonces un intervalo de confianza de 100(1 – α)% para la diferencia de
las medias µ1 2 µ2 es:
X 1 2 X 2 2 t1−α / 2 sp 1 / n1 11 / n2 , µ1 2 µ 2 , X 1 2 X 2 2 t1−α / 2 sp 1 / n1 11 / n2
( n1 21)s12 1( n2 21)s22
con sp2 5
n1 1 n2 2 2
Ejemplo 5.22. L
a siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el
contenido de nicotina de dos marcas de cigarros.
Capítulo 5 Estimación | 241
Marca A Marca B
ni 10 8
Xi 3.1 2.7
8i 0.5 0.7
20.2 , µ1 2 µ 2 , 1.0
Debido a que la diferencia real entre las dos medias puede ser cero, no se concluye
que existe una diferencia en el contenido de nicotina de las dos marcas de cigarros.
Ejemplo 5.23. E
l gerente de una refinería piensa modificar el proceso para producir gasolina a partir
de petróleo crudo. Él hará la modificación sólo si la gasolina promedio que se obtiene
por este nuevo proceso (expresada como un porcentaje del crudo) aumenta su valor
con respecto al proceso en uso. Con base en experimentos de laboratorio y mediante
el empleo de dos muestras aleatorias de tamaño 12, una para cada proceso, la canti-
dad de gasolina promedio del proceso en uso es de 24.6 con una desviación estándar
de 2.3, y para el proceso propuesto fue de 28.2 con una desviación estándar de 2.7. El
gerente piensa que los resultados proporcionados por los dos procesos son variables
aleatorias independientes normalmente distribuidas con varianzas iguales. Con base
en esta evidencia, ¿debe adoptarse el nuevo proceso?
Solución:
Para determinar si hay diferencia significativa entre los dos procesos de elaboración de
gasolina se encuentra el intervalo de confianza de µ1 2 µ2, con 95% de confianza.
Como las varianzas son iguales pero desconocidas, calculamos el valor de sp:
(11 × (2.3)2 111 × (2.7)2
sp2 5 5 6.29 ⇒ sp 5 2.508
22
El valor de t0.975 con 22 grados de libertad es igual a 2.074, entonces el intervalo de
confianza de 95% está dado por
242 | Estadística para ingeniería y ciencias
25.724 , µ1 2 µ2 , 21.476
Debido a que el cero no está contenido en este intervalo y que los dos extremos son
negativos, se puede concluir que el nuevo proceso de obtención de gasolina tiene una
media mayor.
Ejemplo 5.24. S
e hace un experimento agrícola para probar dos tipos de fertilizantes (fosfatados y
nitrogenados) en el cultivo de maíz sembrado en dos tipos de suelos. Uno de cada tipo
de fertilizantes se aplica a cada suelo por separado. Después del crecimiento de las
plantas de maíz se selecciona una muestra de 13 mazorcas cultivadas en la parcela con
la aplicación del fertilizante fosfatado. El peso promedio muestral fue de 2.1 libras,
con una varianza de 0.5 libras. Similarmente, se seleccionan 12 mazorcas cultivadas
en la parcela con la aplicación del fertilizante nitrogenado. El peso promedio muestral
fue de 1.0 libras con una varianza de 0.6 libras. Suponiendo que las dos poblaciones
de la producción de maíz son normales y que las dos varianzas son iguales, hacer un
intervalo de confianza de 90% para la diferencia de los dos promedios poblacionales.
Solución:
Los datos son: X 1 5 2.1, s12 5 0.6, n1 5 13, X 2 5 1.0, s22 5 0.6, n2 5 12, n2 5 12.
Para determinar si hay diferencia significativa entre los dos procesos de elaboración de
gasolina se encuentra el intervalo de confianza para µ1 2 µ2, con 90% de confianza.
Como las varianzas son iguales pero desconocidas, calculamos el valor de sp:
(12 × 0.5 111 × 0.6
sp2 5 5 0.548 ⇒ sp 5 0.740
23
El valor de t0.975 con 22 grados de libertad es igual a 2.074, entonces el intervalo de
confianza de 95% está dado por:
0.48 , µ1 2 µ2 , 1.713
Debido a que el cero no está contenido en este intervalo, se puede concluir que el fer-
tilizante fosfatado da mazorcas son significativamente más pesadas que el fertilizante
nitrogenado.
X 1 2 X 2 2 (µ 1 2 µ 2 ) ( s 2 / n 1 s 2 / n )2
~ t con ( n 21)s 4 / n2 1( n 21)s 4 / n2 grados de libertad
1 1 2 2
s12 / n1 1 s22 / n2 1 1 1 2 2 2
Teorema 5.12. Si X 1 , X 2 , s12 y s22 son las medias y las varianzas de dos muestras aleatorias de tama-
ños n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas
desconocidas y diferentes, entonces un intervalo de confianza de 100(1 – α)% para la diferencia de
las medias µ1 2 µ2 es:
X 1 2 X 2 2 t1−α / 2 s12 / n1 1 s22 / n2 , µ1 2 µ 2 , X 1 2 X 2 1 t1−α / 2 s12 / n1 1 s22 / n2 (5.27)
( s12 / n1 1 s22 / n2 )2
la variable t tiene grados de libertad.
s14 / n12 ( n1 21) 1 s24 / n22 ( n2 21)
Ejemplo 5.25. U
n ingeniero sanitario muestrea dos poblaciones de concentraciones de DBO (de-
manda bioquímica de oxígeno) provenientes de dos plantas de tratamiento de aguas
residuales. Para la primera planta se toma una muestra de n1 5 16 análisis del DBO,
los 16 datos dan un promedio muestral igual a X 1 5 4.00 con una varianza de s12 5
1.5. Para la segunda planta de tratamiento se toma una muestra de n2 5 15 análisis
de DBO, de estos 15 datos se obtiene un promedio muestral de X 2 5 3.6 con una
varianza s22 5 1.3. El ingeniero desea construir un intervalo de confianza de 95% para
las diferencias de promedios µ1 y µ2 de cada planta.
Solución:
Primeramente, se calculan los grados de libertad usando la ecuación:
( s12 / n1 1 s22 / n2 )2 (1.5 / 16 11.3 / 15)2 0.033
5 5 5 30
s14 / n12 ( n1 21) 1 s24 / n22 ( n2 21) (1.5 ) / (16 × 15) 1(1.3 ) / (15 × 14) 0.0011
2 2 2 2
• X1i 5 Número de accidentes en el mes anterior a la aplicación del método de prevención de accidentes.
• X2i 5 Número de accidentes después de aplicarse el método.
Las dos mediciones son dependientes porque miden la misma unidad muestral; en estos casos el efecto del
método está contenido en la diferencia de las dos mediciones; de esta manera se elimina el efecto de las distintas
industrias. Si el método de prevención de accidentes es efectivo, entonces la diferencia X2i 2 X1i deberá tener un
valor esperado positivo, sin importar qué tan grandes o qué tan chicos sean los valores que tomen las variables
X1i y X2i. La diferencia X2i 2 X1i contiene el efecto del método aplicado, el efecto de las distintas industrias ha
sido eliminado en esta diferencia. El método de construcción de parámetros de datos pareados consiste en los
siguientes pasos:
• Se obtienen datos pareados (X11, X21), (X12, X22), (X13, X23), . . . , (Xn, Xn).
• Se calculan las diferencias de los dos datos.
D1 5 X11 2 X21, D2 5 X12 2 X22, D3 5 X13 2 X23, . . . , Dn 5 Xn 2 Xn
• Y bajo el supuesto de que Di ~ N(µd, σd2), se aplica la misma fórmula que para el intervalo de confianza
de una media cuando la desviación estándar es desconocida.
D 2 t12α/2 sd/ n # µ D # D 1 t12α/2 sd/ n
donde D y sd son la media y la desviación estándar de las diferencias Di.
De la misma manera, se pueden comparar dos diferentes métodos de prevención de accidentes aplicados
a dos conjuntos de industrias independientes:
• D11, D12, . . . , Dn son las diferencias correspondientes al método A.
• D21, D22, . . . , Dm son las diferencias correspondientes al método B.
Se puede determinar un intervalo para la diferencia de las medias R D R D , utilizando las fórmulas de
1 2
intervalos de confianza para la diferencia de medias con muestras independientes.
Ejemplo 5.26. E
jercicio adaptado del texto Statistical Inference de Jerome C. R. Li (1964). En un estudio
para determinar el efecto de un fertilizante nitrogenado en la producción de betabeles, se
dividió un campo agrícola en 10 bloques del mismo tamaño y cada bloque se fraccionó
en dos parcelas iguales haciendo 10 pares de bloques. Un bloque de cada par fue selec-
cionado aleatoriamente para la aplicación del fertilizante a una tasa de 50 libras por acre
y el otro bloque quedó sin fertilizante. La tabla 5.5 muestra los datos obtenidos de los
20 bloques. Si se supone normalidad, construir un intervalo de confianza de 95% para
µD 5 µ1 – µ2.
Tabla 5.5. Datos de la aplicación del fertilizante nitrogenado en parcelas con
dos bloques.
Fertilizante
Bloque sin aplicación Bloque con aplicación Diferencias
Bloque
a) b) b) – a)
1 140.4 170.5 30.1
2 174.7 207.4 32.7
3 170.2 215.9 45.7
4 174.6 209.0 34.4
5 154.5 171.6 17.1
(Continúa)
Capítulo 5 Estimación | 245
(Continuación)
6 185.0 201.2 16.2
7 118.9 209.9 91.0
8 169.8 213.3 43.5
9 174.7 184.1 9.4
10 176.7 220.4 43.7
Suma total 1 639.5 2 003.3 363.8
Solución:
a) Se usa la fórmula de intervalos de confianza para datos pareados, entonces se cal-
cula la media y la desviación estándar de las diferencias: D 5 36.38, sd 5 22.95
y el valor de t con 9 grados de libertad: tα/2; n-1 5 t975;9 5 2.262, sustituyendo y sim-
plificando da el intervalo de confianza de 95% para la diferencia de los promedios
µd 5 µ1 – µ2.
19.9626 , µ1 – µ2 , 52.7974
Intervalo de confianza para una media o para la diferencia de dos medias en poblaciones
que no están normalmente distribuidas (muestras grandes)
El teorema del límite central afirma que con un tamaño de muestra suficientemente grande el promedio
muestral de variables aleatorias distribuidas de acuerdo con cualquier función de distribución se distribuye
aproximadamente normal. Según este resultado se concluye que cuando las poblaciones bajo estudio no son
normales todavía se puede encontrar un intervalo de confianza, tanto para una media o para la diferencia de
dos medias si el tamaño de muestra es “grande” (en la mayoría de los casos es suficiente y es mayor que 30).
Las fórmulas estudiadas en esta sección se pueden utilizar cuando n (el tamaño de una sola muestra) es grande,
o cuando el tamaño de n1 y n2 (dos muestras independientes) también es grande.
Existe una infinidad de parejas a y b que pueden satisfacer esta relación, y por simplicidad se puede elegir
que en ambos lados del intervalo se tenga la misma probabilidad, es decir, se eligen los valores de a y b, tales
que:
P((n 2 1)s2/σ2 , a) 5 α/2 y P((n 2 1)s2/σ2 , b) 5 1 2 α/2
y de la segunda parte:
((n 2 1)s2/σ2 , χ1−α / 2 Ψ ((n 2 1)s2/ χ1−α / 2 , σ2
2 2
De estas dos desigualdades se concluye que el intervalo de 100(1 2 α)% de confianza de σ2 está dado por:
( n 21)s 2 ( n 21)s 2
, σ 2
,
χα2 / 2 χ12−α / 2
Ejemplo 5.27. S
i una muestra aleatoria de 17 mediciones tiene una varianza de s2 5 196.38, encon-
trar los intervalos de 95% y 99% de confianza para σ2.
Solución:
( n 21)s 2 ( n 21)s 2
a) Se utilizará la relación , σ2 , 2 con α 5 0.05, α/2 5 0.025
χα / 2
2
χ 1− α / 2
Primero se encuentra en las tablas de la ji-cuadrada con 16 grados de libertad los
valores de χ 20.975 = 6.91 y χ 20.025 = 28.85, entonces se halla el intervalo:
16 × 196.38 16 × 196.38
, σ2 ,
28.85 6.91
108.91 , σ2 , 454.71
b) Ahora se tiene que α 5 0.01, α/2 5 0.005, entonces los valores correspondientes
de la ji-cuadrada con 16 grados de libertad son χ 20.995 = 5.14 y χ 20.005 5 34.27, por lo
que el intervalo es:
16 × 196.38 16 × 196.38
, σ2 ,
34.27 5.14
91.69 , σ2 , 611.30
El intervalo de confianza para la desviación estándar σ se calcula obteniendo la raíz
cuadrada de los extremos del intervalo de confianza para la varianza, es decir, α 5 0.05
y el intervalo de confianza para σ es (10.45, 21.32) y para α 5 0.01, es (9.59, 24.72).
Tabla 5.6. Resumen de los intervalos de confianza para los parámetros de la normal.
Extremo inferior: X 1 2 X 2 2 zα / 2 σ 12 / n1 1 σ 22 / n2
µ1 2 µ 2 σ1 y σ2 conocidas
Extremo superior: X 1 2 X 2 1 zα / 2 σ 1 / n1 1 σ 2 / n2
2 2
(Continúa)
Capítulo 5 Estimación | 247
(Continuación)
p̂
tamaño de la muestra n
entonces, si n es suficientemente grande se puede aplicar el teorema del límite central, considerando que p̂ ~
N(p, p(12p)/n).
De donde se deduce que el intervalo de confianza para p está determinado por:
pq
ˆˆ pq
ˆˆ
pˆ 2 zα / 2 , p , pˆ 1 zα / 2 (5.28)
n n
Ejemplo 5.28. E
n un experimento agrícola se sembraron 36 semillas de girasol germinando 31 de ellas.
Con estos datos se quiere obtener el intervalo de 90% de confianza de la proporción de
semillas que pueden germinar de la población total de semillas.
Solución:
Las semillas pueden germinar o no germinar, entonces cada semilla que se siembra
corresponde a un experimento Bernoulli; si se considera que el evento “la semilla germi-
na” es éxito, entonces se tiene una muestra aleatoria de variables Bernoulli X1, X2, . . . ,
X36, con las que se puede calcular la probabilidad p de que las semillas germinen.
248 | Estadística para ingeniería y ciencias
33
De manera que p5
ˆ 5 0.9167, y en la tabla de la distribución normal se encuentra que
36
z0.05 5 1.645; con estos valores se aplica la fórmula para el intervalo de confianza para
p, quedando así:
∑ ∑
n n
X 1i X 2i
p̂1 5 i =1
y p̂2 5 i =1
(5.29)
n1 n2
se distribuyen aproximadamente normal:
pˆ 1qˆ 1 pˆ 2 qˆ 2 pˆ qˆ pˆ qˆ
pˆ 1 2 pˆ 2 2 zα / 2 1 , p1 2 p2 , pˆ 1 2 pˆ 2 1 zα/ 2 1 1 1 2 2 (5.31)
n1 n2 n1 n2
Ejemplo 5.29. S
e eligieron al azar 140 hombres y 150 mujeres entre 40 y 50 años de edad y se halló que
56 de los hombres y 27 de las mujeres usan lentes; con estos datos construir un intervalo
de confianza de 95% para la diferencia de las proporciones reales de hombres y mujeres
que usan lentes en la población.
Solución:
De acuerdo con los datos obtenidos, se tiene que pˆ 1 5 56 / 140 5 0.40 y pˆ 2 27 / 150 0.18,
y debido a que las dos muestras son grandes se puede suponer normalidad, entonces se
determina que z0.025 5 1.96, y el intervalo de confianza es:
p Extremo inferior: pˆ 2 zα / 2 pq / n
Extremo superior: pˆ 1 z pq / n
α /2
Figura 5.1.
250 | Estadística para ingeniería y ciencias
One-Sample Z
The assumed standard deviation 5 25
N Mean SE Mean 95% CI
100 20.0000 2.5000 (15.1001, 24.8999)
Ejemplo 5.31. S
i para el ejemplo 5.18 del gerente de la fábrica que desea estimar el tiempo con n 5
18 empleados y en la muestra dio que X 5 15 minutos, s 5 2, se quiere obtener el
intervalo de confianza de 95%. Usando las instrucciones de Minitab se obtienen los
siguientes resultados:
Figura 5.2.
One-Sample T
N Mean StDev SE Mean 95% CI
18 15.0000 2.0000 0.4714 (14.0054, 15.9946)
2. En la ventana de diálogo de 2-Sample (Test and Confidence Interval) puntear Summarized data.
3. En las ventanillas Simple size, Mean y Standard deviation se deben poner los valores correspondien-
tes del tamaño de la muestra, del promedio y de la desviación estándar, para la primera y segunda
muestra, respectivamente.
Ejemplo 5.32. C
on los siguientes datos: X 1 5 10.0, n1 5 15, s12 5 1.3, X 2 5 6.19, n2 5 13, s22 5
1.0. Encontrar el intervalo de confianza para µ1 2 µ2 con nivel de confianza de 95%.
Siguiendo las instrucciones anteriores se obtiene:
Solución:
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1 15 10.00 1.14 0.29
2 13 6.19 1.00 0.28
Difference 5 µ (1) 2 µ (2)
Estimate for difference: 3.81000
95% CI for difference: (2.97061, 4.64939)
Figura 5.3.
Ejemplo 5.33. S
e sacó una muestra aleatoria de 100 industrias potencialmente contaminadoras del
medio ambiente. Se encontró que 26 industrias estaban violando los límites de con-
centraciones del aire impuestos por las legislaciones ambientales. Hallar un intervalo
de confianza de 95% y 99% para la proporción de industrias que violaron los límites
gubernamentales.
Solución:
Test and CI for One Proportion
Figura 5.4.
Exact
Sample X N Sample p 95% CI
1 26 100 0.260000 (0.177394, 0.357312)
2. En la ventana de 2 Proportions (Test and Confidence Interval) haga clic en Samples in different
columns.
3. En la ventanilla First en Trials ponga n1, el número de ensayos y en la ventanilla Events registre el
número de éxitos en la primera muestra.
4. En la ventanilla Second en Trials ponga n2, el número de ensayos y en la ventanilla Events escriba el
número de éxitos en la segunda muestra.
Capítulo 5 Estimación | 253
Ejemplo 5.34. É
ste es un estudio adaptado del libro de Probabilidad y estadística de Walpole, et. al.
(1992). En un estudio médico en el que el especialista en genética está interesado
en la proporción de hombres y mujeres en la población que tienen un leve desorden
sanguíneo, se tiene una muestra aleatoria de 1 000 hombres y se encontró que 250
presentaron esta afección, mientras que en otra muestra aleatoria de 1 000 mujeres,
275 de ellas lo padecían. Calcular un intervalo de confianza de 95% para la diferencia
entre la proporción de hombres y mujeres que sufren este desorden sanguíneo.
Solución:
Con el programa Minitab y siguiendo las instrucciones de anteriores, se obtienen los
siguientes resultados:
Test and CI for Two Proportions
Sample X N Sample p
1 250 1000 0.250000
2 275 1000 0.275000
Figura 5.5.
Problemas propuestos
5.1 Se llevó a cabo un análisis de las concentraciones de nitratos a) Construir un intervalo de 95% de confianza para la tasa
(NO-3) de un sistema de tratamiento de aguas industriales. Las sensorial promedio de la población de la cual fue obtenida
concentraciones de nitratos se reportaron en mg/L en la si- la muestra.
guiente tabla: b) Usar la regla de 68-95-99.7 para probar que efectivamen-
te la población muestreada es normal. (Esta regla es una
6.9 7.8 8.9 5.2 7.7 9.6 8.7
forma rápida de revisar la normalidad de la distribución
6.7 4.8 8.0 10.1 8.5 6.5 9.2 muestreada.) Siendo así, para que la distribución de los
7.4 6.0 9.4 6.1 6.3 5.6 5.2 datos sea normal o, aproximadamente normal, el 68% de
5.4 7.3 8.2 8.3 7.2 7.5 6.1 las observaciones deben estar dentro de σ y el promedio
6.0 5.4 7.6 8.1 7.9 8.5 µ; el 95% de las observaciones deben caer dentro de 2σ y
promedio µ, y 99.7% de las observaciones se encuentran
Con estos datos realizar lo siguiente: dentro de 3σ y el promedio µ.
a) Un resumen de estadística descriptiva. Tasas sensoriales para este estudio.
b) Un intervalo de confianza para el promedio poblacional
(µ). 8.8 6.6 8.4 6.5 8.4 7.0 9.0 10.3
Sugerencia: Usar el programa Minitab para resolver este pro- 8.7 11.3 8.1 5.2 6.3 11.6 6.2 10.9
blema.
5.6 Una muestra de 56 partículas atmosféricas de plomo (Pb)
5.2 El problema de los reactores nucleares es que los fragmentos
dio un promedio de 148.48 ppm (partes por millón) y una
fisionables o desintegrados son siempre radiactivos y su dispo-
desviación estándar de 12.44; con estos datos construya un
sición, como residuos peligrosos, siempre ha sido muy cues-
intervalo de 99% de confianza para µ, suponiendo que los
tionable. Esto se debe a que los fragmentos fisionables típicos
datos se distribuyen de acuerdo con una ley normal.
incluyen cesio 137, estroncio 90 y yodo 131. La EPA (Envi-
5.7 Las proporciones muestrales de dos muestras de distribuciones
ronmental Protection Agency) define como residuos peligrosos
Bernoulli son 0.6 y 0.4, respectivamente, con n1 5 400 y n2 5
aquellas sustancias que poseen las características de reactivi-
350. Construir un intervalo de confianza de 99% para la dife-
dad, carácter ígneo, corrosividad, radiactividad y toxicidad.
rencia de dos proporciones.
Otra definición de residuos peligrosos se refiere a cualquier
5.8 Con los siguientes datos: D 5 6.0, sd 5 9.0 y n 5 10 construir
cosa que, debido a su cantidad, concentración, o característi-
un intervalo de confianza de 99% para µd.
cas físicas, químicas o infecciosas, puede causar o contribuir a
5.9 Para medir la eficiencia de una planta piloto de filtros por
la muerte o enfermedades irreversibles o representar peligros
goteo, en cuanto a las concentraciones de los sólidos sus-
presentes o potenciales a la salud humana, cuando son inapro-
pendidos (SS) expresados en miligramos por litro (mg/L), se
piadamente manejados, almacenados o transportados. Se ob-
tomaron los datos en la entrada y en el efluente de la plan-
tuvo una muestra aleatoria de 40 trabajadores expuestos a esos
ta. Los datos muestreados se dan en la tabla 5.8. Construir
residuos peligrosos y sus análisis de sangre y orina dieron un
un intervalo de confianza de 95% para la media poblacional
promedio de 5.0 mg/L de estroncio con una desviación están-
usando las fórmulas para datos pareados.
dar de 0.25. Calcular un intervalo de confianza para el prome-
dio poblacional con los niveles de confianza de 95 y 99%. Tabla 5.8.
5.3 Las temperaturas en grados Celsius medidas en un experi- Concentraciones de SS Concentraciones de SS
mento se consideran normales. Si se tomaron las siguientes en la entrada de la planta en el efluente de la planta
muestras: 22, 24, 22, 25, 30, 28, 29, 28, 24, 23, 25, 27, 26, 23, (mg/L) (mg/L)
24, 21, 22, 21, 25, 21, 23, 24, 21, 20, 21, 20, 22, 28, 27, 31, cons-
75.5 39.1
truir los intervalos de 95 y 99% de confianza para el promedio
poblacional µ. 47 25
5.4 Describir qué sucedería al intervalo de confianza de µ, en el 33 23
ejercicio anterior si:
56 32
a) La confianza del intervalo aumenta de 90 a 95%.
b) El tamaño de la muestra aumenta con α constante, es 61 38
decir, con el nivel de confianza de 95%. 33 20
c) El tamaño de la muestra disminuye con α constante, es
decir, con el nivel de confianza de 95%. 32 23
d) El valor de σ aumenta o si disminuye con n y α constan- 26 19
tes.
38 22
5.5 Ejercicio adaptado del libro de Elementary Statistics de Mario
Triola (1995). En un estudio médico sobre terapia de hipnosis 49 30
para aminorar el dolor se midieron las tasas sensoriales a 16 pa- 100 77
cientes tomados al azar; las mediciones se reportan en la tabla
92 55
siguiente. Suponer que la población muestreada es normal.
Capítulo 5 Estimación | 255
ssaa
absorbida por la superficie S FERA TRO
PO PO incrementan la cantidad de
y otra parte es TRO 12km 12 km SF
ER
A gases de efecto invernadero
reflejada.
Fuente: http:/www.clarin.com|diario|2005|07|06|um|calentamiento_global_jpg
en la atmósfera.
2 Una parte de la
radiación reflejada Gases
es retenida por los de efecto
gases del efecto invernadero
Tropopausa
Tropopausa
Gases 2 La atmósfera
de efecto modificada retiene
3 ... otra parte vuelve invernadero más calor. Así se
al espacio. daña el equilibrio
natural y aumenta
la temperatura de
12 km 12 km
la Tierra.
Ca o
pa zon
de 20 km 20 km
ozono apa de o
C
50 km 50 km
En alusión al calentamiento global, la mayoría de los científicos están de acuerdo con que este fenómeno
está cambiando los patrones meteorológicos de temperatura, precipitaciones, incidencias de tornados, hu-
racanes, granizadas, vientos y así sucesivamente. La foto de arriba muestra en el lado izquierdo el efecto in-
vernadero cuando la Tierra estaba en su estado prístino; en el lado derecho, se citan los efectos después de
la era industrial debido a la quema indiscriminada de compuestos fósil; esto ha propiciado que las emisiones
de gases de invernadero estén calentando la Tierra y distorsionado el clima, situación que está alterando
todas nuestras formas de vida.
La estadística puede ayudar a entender y a resolver los problemas causados por el calentamiento glo-
bal. El comparar estadísticamente las mediciones de la temperatura, antes y después de la industrialización
masiva, permite determinar la existencia de un aumento de temperatura. Por otra parte, la estadística posi-
bilita probar si nuevos motores para automóviles, o nuevos filtros de maquinarias disminuyen las emisiones
de gases que provocan el calentamiento global.
Introducción
En este capítulo se estudian las pruebas de hipótesis estadística. Esta técnica se utiliza para determinar con
base en datos muestrales cuáles conjeturas son estadísticamente verdaderas.
Capítulo 6 Prueba de hipótesis | 257
Definición 6.1. Una hipótesis estadística es una afirmación o conjetura acerca de la función de
distribución F(x, θ) generadora de la muestra aleatoria. Si la hipótesis estadística identifica por com-
pleto la distribución, recibe el nombre de “hipótesis simple” (por ejemplo, que el parámetro de una
exponencial es λ 5 10) y si no la especifica recibe el nombre de “hipótesis compuesta” (por ejemplo,
λ . 10).
De esta manera, se tiene que:
• Una hipótesis simple es de la forma: µ 5 100, σ2 5 16, θ 5 0.03 o “la función generadora de la
muestra es una normal estándar”.
• Una hipótesis compuesta es de la forma: µ ≠ 100, µ . 100, σ2 . 16, θ , 0.03, o “la función gene-
radora es simétrica respecto a la media”.
Como ya se citó, la prueba de hipótesis esencialmente consiste en decidir entre dos conjeturas contrapuestas
cuál es la verdadera. Una de las conjeturas se supone verdadera ya sea porque la historia o la experiencia así
lo ha establecido o porque así lo indica el modelo que genera los datos. La otra conjetura es la que los datos
parecen respaldar. La primera conjetura se denota como hipótesis nula y la segunda conjetura se denota como
hipótesis alternativa. Generalmente, la hipótesis alternativa es aquella que defiende el investigador.
Definición 6.2. Se llama hipótesis alternativa a la conjetura que se pone a prueba. Es la hipótesis de
investigación. La hipótesis alternativa se denota como Ha o H1.
Definición 6.3. Se llama hipótesis nula a la conjetura que se considera cierta, ya sea porque el
modelo así lo indica, porque la historia lo ha probado o porque es lo aceptado. La hipótesis nula se
identifica con el símbolo H0.
258 | Estadística para ingeniería y ciencias
Ejemplo 6.1. Suponer que una máquina programada para verter un contenido de 250 mililitros está
llenando botellas de refresco. Al observar la banda de llenado el ingeniero de produc-
ción nota que las botellas parecen tener un contenido mayor al esperado. Ante esta
situación el ingeniero de producción debe tomar una decisión:
• Puede decidir que la máquina está bien calibrada y que el sobrellenado observado
se debe sólo al azar, pues el proceso es aleatorio y es probable que algunas botellas
tengan un contenido por arriba de la media sin que cambie el valor de la media de
llenado real que es de 250 mililitros.
• Puede decidir que la máquina necesita ajustes, pues el sobrellenado se debe a algo
más que el azar.
La primera conjetura: “la máquina sigue bien calibrada” es la hipótesis nula porque
es lo que indica la programación de la máquina. La conjetura: “la máquina necesita
ajustes” es la hipótesis alternativa. En este sentido, la hipótesis nula es verdadera hasta
que se demuestre lo contrario.
El rechazo o la aceptación de la hipótesis nula se hace con base en los datos obser-
vados. Si bajo el supuesto que la hipótesis nula es cierta, lo que ocurre con los datos
muestrales es poco probable, entonces rechazaremos la hipótesis nula.
La prueba se establece como:
H0: µ 5 250 mililitros contra Ha: µ . 250 mililitros
Ejemplo 6.2. Considerar el ejemplo 6.1. El ingeniero de producción decide tomar una muestra alea-
toria de 30 botellas de refresco llenadas por la máquina sospechosa y con el promedio
del contenido de las 30 botellas seleccionadas elegirá una de las dos conjeturas como
verdadera. ¿Cómo debe hacerlo?
Solución:
El ingeniero de producción sabe que si la hipótesis nula es verdadera, entonces el con-
tenido de cada botella se distribuye como una normal con media µ 5 250 mililitros y
varianza desconocida σ2; entonces, si X1, X2, . . . , X30 es el contenido de las 30 botellas
de la muestra, se tiene que el promedio de su contenido es una variable aleatoria nor-
σ
mal con media igual a 250 mililitros y desviación estandar mililitros. Si es verdad
n
que la media del contenido de las botellas es µ 5 250, entonces se espera que X 2 250 . c
sea un valor cercano a cero. En el caso que µ sea mayor que 250, se esperaría que
X 2 250 .sea c un valor “grande”. Se tiene que dar una definición objetiva de “grande”.
Se puede decir que el término es grande si X 2 250 . c , donde c es un valor tal que
P ( X 2 250 . c | µ 5 250) 5 α con α un valor pequeño. Si se está de acuerdo con esta
definición
n ( Xde2 µgrande,
) 30el( X
siguiente
2 250) paso es encontrar el valor de c y para hacerlo, como
tc 5se conoce el valor
no 5 de σ,
s s sePutiliza la variable.
( X 2 250 . c | µ 5 250) 5 α
n ( X 2 µ) 30 ( X 2 250)
tc 5 5
s s
que se distribuye como una t de Student con n 2 1 5 29 grados de libertad.
Capítulo 6 Prueba de hipótesis | 259
Si tc se encuentra cerca del cero no habrá evidencia para rechazar la hipótesis nula y la
decisión será que la máquina sigue bien calibrada. Si por el contrario tc es positiva y
se encuentra alejado de cero se tendrá evidencia de que la hipótesis nula es falsa y se
concluirá que la máquina necesita ajustes.
El ingeniero de producción decide que no desea equivocarse al rechazar la hipótesis
nula en más de 0.05 de probabilidad, por tanto busca que:
30 ( X 2 250)
P( X 2 250 . c | µ 5 250) 5 P . t 0.95 5 0.05
s
Y encuentra en la tabla de la distribución t con n 2 1 5 29 grados de libertad que
t0.095 5 1.699.
El ingeniero de producción decide que rechazará la hipótesis nula cuando tc . 1.699.
Definición 6.4. Se llama estadística de prueba a la función de los datos muestrales que se utiliza para
tomar la decisión.
n ( X 2 µ)
En el ejemplo 6.1 la estadística de prueba es tc 5 .
s
Definición 6.5. Se llama región crítica o región de rechazo para H0 al conjunto de valores de la esta-
dística de prueba que hace que se rechace la hipótesis nula.
En el ejemplo 6.1. la región de rechazo es tc . 1.699.
Dado que la decisión se toma según una variable aleatoria, se puede equivocar si se rechaza la
hipótesis nula como si no se rechaza.
Tabla 6.1. Relación entre la veracidad de la hipótesis de prueba y la decisión del investigador.
En la realidad
H0 es verdadera H0 es falsa
No rechazar H0 Acierto Error tipo II
Decisión es
Rechazar H0 Error tipo I Acierto
Definición 6.7. Se conoce como potencia de la prueba a la probabilidad de acertar cuando se rechaza
H0, esto es potencia 5 1 2 P(error II), a la probabilidad del error II, P(error II), se le denota con la
letra β, entonces
260 | Estadística para ingeniería y ciencias
Ejemplo 6.3. Se diseña un examen de 10 preguntas de opción múltiple. Cada pregunta tiene cinco
posibles respuestas marcadas con la letra a, b, c, d, e. Al aplicar este examen a una
persona se establece una prueba de hipótesis. Identificar los elementos de la prueba de
hipótesis en este ejemplo.
Solución:
Un estudiante al entrar a un curso no conoce el material de la materia, esto no se
pone en duda, porque en otro caso no se inscribiría. Cuando se aplica un examen al
estudiante es porque se quiere probar si el estudiante ya conoce el material estudiado o
sigue sin conocerlo. Éstas son las dos conjeturas.
En este caso se tienen dos conjeturas:
a) El estudiante ya conoce el material estudiado.
b) El estudiante no conoce el material estudiado.
La hipótesis nula es la que nos arroja la historia del estudiante, si nació sin conocer el
material estudiado entonces ésta debe ser la hipótesis nula. Las dos hipótesis son:
a) Hipótesis nula. H0: el estudiante no conoce el material estudiado.
b) Hipótesis alternativa. Ha: el estudiante ya conoce el material estudiado.
Capítulo 6 Prueba de hipótesis | 261
Ejemplo 6.4. En referencia al ejemplo 6.3, encuentre el nivel de significancia de esta prueba de hi-
pótesis.
Solución:
La hoja de respuesta del examen del ejemplo 6.3 es de la forma:
1. (a) (b) (c) (d) (e) 5. (a) (b) (c) (d) (e) 9. (a) (b) (c) (d) (e)
2. (a) (b) (c) (d) (e) 6. (a) (b) (c) (d) (e) 10. (a) (b) (c) (d) (e)
3. (a) (b) (c) (d) (e) 7. (a) (b) (c) (d) (e)
4. (a) (b) (c) (d) (e) 8. (a) (b) (c) (d) (e)
Ejemplo 6.5. En referencia al ejemplo 6.3, encuentre la potencia de esta prueba de hipótesis.
262 | Estadística para ingeniería y ciencias
Solución:
Cuando la hipótesis nula es falsa porque el estudiante sí sabe, se tiene que p . 0.20,
pero no se conoce qué tanto es lo que el estudiante sabe. La probabilidad de cometer
el error tipo II es igual a:
P(error II) 5 P(que el estudiante repruebe cuando sí sabe)
5 P(C , 6 | p . 0.20)
y la potencia de la prueba es:
Potencia 5 1 – P(error II)
5 1 – P(C # 5 | p . 0.20)
5 1 – β(p)
Con Excel se calcula la potencia de esta prueba para diferentes valores de p y los resul-
tados se reportan en la siguiente tabla y figura.
Tabla 6.2.
p P(Error II) Potencia
0.25 0.9803 0.0197
0.3 0.9527 0.0473
0.35 0.9051 0.0949
Potencia de la prueba
0.4 0.8338 0.1662 1.2
0.45 0.7384 0.2616 1.0
0.5 0.6230 0.3770 0.8
Potencia
o igual a 8, se reduce la probabilidad de que alguien que no sabe pase el examen, pero
aumenta la probabilidad de que alguien que sabe no pase. Si para pasar el curso se pide
que la calificación sea mayor o igual a 4, entonces disminuye la probabilidad de repro-
bar a alguien que sabe, pero aumenta la probabilidad que pase alguien que no sabe. Por
esto, se debe elegir una región crítica donde los dos errores tengan una probabilidad
pequeña y de ser posible, semejante.
En resumen, una prueba o contraste de una hipótesis estadística es una regla o
procedimiento que conduce a la decisión de aceptar o rechazar cierta hipótesis, iden-
tificada como hipótesis nula, con base en los resultados de una muestra. Los procedi-
mientos de prueba de hipótesis dependen del empleo de la información contenida en
una muestra aleatoria de la población de interés. Si esta información es consistente con
la hipótesis nula se concluye que ésta es verdadera; sin embargo, si esta información es
inconsistente con la hipótesis se concluye que es falsa.
Los pasos a seguir en una prueba de hipótesis es:
Ejemplo 6.6. Un laboratorio quiere probar que un nuevo medicamento tiene una efectividad de 90%
comparado con la efectividad de un medicamento en uso que es de 60%. Se aceptará el
nuevo medicamento si al aplicarse el medicamento a 20 personas el número de éxitos
es mayor o igual a 16; en caso contrario se rechazará. Establecer las hipótesis adecua-
das (según lo planteado) y evaluar los valores de α y β.
Solución:
La aplicación del medicamento a un paciente es un experimento Bernoulli donde éxi-
to es que el medicamento sea efectivo y p es la probabilidad de éxito. El nuevo me-
dicamento se aceptará sólo si prueba que es mejor que el medicamento en uso y la
efectividad demostrada por el medicamento en uso es que la probabilidad de éxito es
p 5 0.60, entonces la hipótesis nula es que a lo más el nuevo medicamento es igual al
medicamento en uso. Las hipótesis se pueden formular de la siguiente manera:
264 | Estadística para ingeniería y ciencias
H0: p 5 p0 5 0.60
Ha: p 5 pa 5 0.90
n 5 20
Región de rechazo. Si se denota por X el número de éxitos observados, entonces la re-
gión crítica es C 5 {X | X $ 16}. Observe que X se distribuye binomial con parámetros
n 5 20 y p desconocida.
Error tipo I. Rechazar que p 5 0.60 cuando en realidad sí lo es; esto ocurre cuando X
$ 16 y p 5 0.60. El nivel de significancia es igual a:
α 5 P(error I) 5 P(X $ 16 | p 5 0.60) 5 0.051, valor que se obtiene
de tablas de la binomial.
Error tipo II. Aceptar que p 5 0.60 cuando en realidad es igual a 0.90. Esto ocurre
cuando X # 15 y p 5 0.90. La probabilidad del error tipo II es:
β 5 P(error II) 5 P(X # 15 | p 5 0.90) 5 0.043, valor que se obtiene
de tablas de la binomial.
Un buen procedimiento de prueba es aquel en que tanto α como β sean pequeños. Para
este ejemplo, α 5 0.051 y β 5 0.043, ambos datos son relativamente bajos, lo que se
puede considerar como adecuado.
En la siguiente tabla se presentan los términos más importantes que deben ser recor-
dados.
los productos manufacturados o de los artículos producidos por la industria de manufactura. Esto se hace con
el objeto de revisar la eficiencia de la línea de producción de la fábrica.
En las pruebas de hipótesis, el valor de s o de σ es muy importante, porque ahí se reflejan las técnicas del
laboratorio refinadas o defectuosas. Un valor bajo de s refleja técnicas de laboratorio muy sofisticadas o refina-
das, mientras que un valor alto de s refleja lo contrario. Todo esto se explica y se prueba a través del poder de la
prueba y de los errores estándares del promedio, de la desviación estándar, etcétera.
• P # 0.05. La prueba está en el umbral de la significancia. Aquí casi siempre se acepta la hipótesis
nula. Es un argumento débil y no convincente. Nos deja en una situación de incertidumbre. Esto
dice que, “tal vez así sea”.
266 | Estadística para ingeniería y ciencias
Ejemplo 6.7. A continuación se dan los valores de la z calculada; así, encontrar el valor de la proba-
bilidad p, si:
a) El valor de z 5 3.2, con H0: µ 5 µ0.
b) El valor de z 5 3.0, con H0: µ # µ0.
c) El valor de z 5 23.2, con H0: µ $ µ0.
Solución:
a) Buscamos el valor de z 5 3.2 en la tabla de la distribución normal y da un valor de
0.9993. Entonces, p 5 1 2 0.9993 5 0.0007. Sin embargo, debido a que la prueba
es bilateral, este valor de p se multiplica por 2 para dar p 5 0.0014.
b) Buscamos el valor de z 5 3.0 en la tabla de la distribución normal y nos da 0.9987.
Entonces,
p 5 1 20.9987 5 0.0013. No obstante, como la prueba es unilateral, así se queda.
c) Para z 5 23.2 con H0: µ $ µ0. Ésta es una prueba unilateral izquierda (porque el
valor de z es negativo) y este valor en la tabla de la distribución normal da 0.0007.
Metodología para calcular los valores de la probabilidad p por medio de fórmulas empíricas
Para las pruebas de hipótesis no tradicionales, es decir, usando el valor de la probabilidad p, es necesario hacer
interpolaciones de los valores obtenidos. Sin embargo, en el caso de la distribución normal, para calcular el
valor de la probabilidad p no es necesario hacer interpolaciones, porque se puede leer directamente en la tabla
Capítulo 6 Prueba de hipótesis | 267
Ejemplo 6.8. Para explicar cuál sería la diferencia en la decisión de aceptar o rechazar una hipótesis
nula, supongamos que el valor de la hipótesis nula es igual a un valor esperado de µ0
–
5 10, esto es, H0: µ 5 10. Además, supongamos que X 5 12, σ 5 4.5 y n 5 25 y, si
–
después de sustituir los valores en la variable aleatoria normal calculada por zcalc. 5 (X 2
µ0) / σ / n , con α 5 0.05 con sus valores críticos de 61.96, entonces, zcalc. 5 2.22, y,
por tanto, 2.22 . 1.96 y se rechaza H0. Aquí, la certidumbre es dictada por el valor de la
probabilidad p, esto es, p 5 1 2 0.9861 5 0.0139.
Ejemplo 6.9. Ahora, supongamos que zcalc. 5 1.2, con σ 5 8.333 y con las demás variables constantes.
Bajo estas condiciones, 1.2 , 1.96 y, se acepta H0 con un valor de probabilidad de p 5
1 2 0.8849 5 0.12. Aquí, el valor de p dice que la probabilidad de haber hecho una
decisión errónea y aceptar una hipótesis falsa es de una posibilidad en diez. Entonces,
de acuerdo con el razonamiento expuesto anteriormente, ¿en cuál de las dos situaciones
hay más confiabilidad, es decir, más certeza en nuestras decisiones?
Ejemplo 6.11. Se dan los siguientes datos de una muestra aleatoria de 15 mediciones (micras) de
partículas atmosféricas en unidades de partes por millón (ppm): 33.38, 32.15, 33.99,
34.10, 33.97, 34.34, 33.95, 33.85, 34.23, 32.73, 33.46, 34.13, 34.45, 34.19, 34.05.
Hacer los siguientes cálculos:
a) Probar la hipótesis nula de H0: µ 5 34.5 contra la hipótesis alternativa de H1: µ ≠
34.5. Calcular el valor de la probabilidad p.
b) Probar la hipótesis de H0: µ $ 34.5 contra la hipótesis alternativa de H1: µ , 34.5.
Calcular el valor de p.
Solución:
a) Al hacer los cómputos pertinentes y sustituir en la variable aleatoria t, obtenemos.
–
tcalc. 5 ( X 2 µ0) / s/ n 5 (33.8 – 34.5) / 0.63/ 15 5 2 4.3
El valor de la probabilidad p se calcula usando la fórmula de interpolación:
( λ2 2 λ1)/(t2 2 t1) 5 ( λ2 2 X ) / (t2 2 tcalc.)
Se consulta la tabla de la distribución t y se busca el valor |24.3|, vemos que:
λ2 5 0.99975, t2 5 4.499, λ1 5 0.9995, t1 5 4.14, tcalc. 5 24.3 (aquí en este caso, se
toma el valor absoluto), X igual a valor buscado, el cual corresponde a la interpo-
lación de t 5 24.3 con n 5 14 g.l. Sustituyendo los valores en la fórmula anterior
se obtiene:
(0.99975 – 0.9995)/(4.499 – 4.140) 5 (0.99975 2 X)/(4.499 – 4.3)
X 5 0.99987 y el valor de p 5 2(1 2 0.99999) 5 0.00002. Este valor es mucho
muy significativo y apoya, muy contundentemente, la contención de que el pro-
medio no es mayor que 34.5.
b) Probando la hipótesis nula de H0: µ $ 34.5 contra H1: µ , 34.5
La t calculada es la misma que en el inciso a), es decir, 24.3. Ésta es una
prueba unilateral izquierda con α 5 0.5 con el valor porcentual de t.95;14 5 21.761,
o sea que la región crítica izquierda es 21.761 (de la tabla de la distribución de
t). Para hacer una decisión de rechazar o aceptar H0: se compara el valor de t.95;14
Capítulo 6 Prueba de hipótesis | 269
Ejemplo 6.12. Supóngase que se saca una muestra de 8 mediciones de nitratos (NO32) y se calcula
un valor de t 5 23.62, con un nivel de significancia de α 5 0.05. Probar la hipótesis
nula de H0: µ 5 32.0. Calcular el valor de la probabilidad p.
Solución:
Aquí la prueba es bilateral. Las regiones críticas son de t[.05;7] 5 2.365. El valor de t
es 23.62. Se usa la función de P para dos colas dadas como: p 5 P(t.025 , 2|t|) 1
P(t.025 . |t|)
Estamos buscando la probabilidad de sacar un valor de t que exceda 3.62 con
y 5 7 grados de libertad, pero vemos que este valor no se encuentra en la tabla de la
distribución t. Entonces, tenemos que interpolar el valor y lo buscamos en la tabla y
vemos que está entre λ2 5 0.9975 con t2 5 4.029 y 1λ 5 0.995 con t1 5 3.499. Además,
sabemos que t[.05;7] 5 22.375 (porque es de la cola izquierda). Luego, se sustituyen
todos estos valores en la fórmula de interpolación siguiente:
P 5 ( λ2 2 λ1) / (t2 2 t1) 5 ( λ2 2 X ) / (t2 2 tcalc. )
En seguida se sustituyen los valores anteriores:
p 5 [(0.9975 2 0.995)/(4.029 2 3.499) 5 (0.9975 2 X)/(4.029 2 3.62)]
5 (0.0025)/(0.53) 5 (0.9975 2 X)/(0.409)
5 0.99785. .95
0.025 0.025
La probabilidad p es 1 2 0.99785 5 0.002. Sin embargo, debido a que la prueba in-
volucra dos extremos, por tanto, el valor de la probabilidad
t
t
p se multiplica
t
t
por 2 para
(1F/2; n1) (1F/2; n1)
(1.05/2; 81) (1.05/2; 81)
dar p 5 0.0043. Este valor es mucho muy significativo.
t Las figuras
t de abajo muestran
(.975;7) (.975;7)
t 2.365 t 2.365
esta situación.
.95 .996
0.025 0.025 p .002 p .002
se inclina t
por Ha. Sin embargo,t esta
3.499 3.499
prueba de hipótesis tradicional no dice qué tanta
270 | Estadística para ingeniería y ciencias
convicción se le puede dar al resultado obtenido. Para esto, se hace una prueba de
hipótesis no tradicional usando el valor de la probabilidad p. Siendo así, se busca en
la tabla de la distribución F el valor de Fcalc. 5 5.70, con 4 y 6 grados de libertad, y con
α 5 0.05, pero vemos que no está explícitamente mostrado; es decir, está entre 4.53 y
9.15 con sus valores respectivos de α 5 0.50 y 0.010, por tanto la probabilidad es 0.01
, p , 0.05. Ahora, para obtener un valor de p más preciso se usa la siguiente fórmula
de interpolación:
( λ2 2 λ1)/(F2 2 F1) 5 ( λ2 2 X)/(F2 2 Fcalc.)
Donde: 5 λ2 5 Valor porcentual más alto que el valor de Fcalc.
λ1 5 valor porcentual más bajo que Fcalc.
F2 5 Valor de la distribución F correspondiente a λ2.
F1 5 Valor de la distribución F correspondiente a λ1.
X 5 Valor que se quiere interpolar.
Fcalc. 5 Valor calculado.
Ahora, con λ2 5 0.05, λ1 5 0.01, F2 5 4.53, F1 5 9.15 y Fcalc. 5 5.70 y sustituyendo
y resolviendo por X, se obtiene:
(0.05 2 0.01)/(4.53 2 9.15) 5 (0.05 2 X )/(4.53 2 5.70)
X 5 p 5 0.04
El valor es 0.025.
Esto significa que cuando se tiene una muestra aleatoria, la mejor decisión se hace de acuerdo con
la siguiente regla:
a) Si L(θ0)/L(θ1) , k, entonces se rechaza la hipótesis nula (si ocurre C ).
b) Si L(θ0)/L(θ1) $ k, entonces no se rechaza (si ocurre C c ).
Demostración:
Si C es una región crítica o región de rechazo de tamaño α para H0, se tiene que:
• P(error I) 5 P(C | θ 5 θ0) 5 α
• 1 2P(error II) 5 1 2 P(Cc | θ 5 θ1) 5 P(C | θ 5 θ1) 5 1 2 βc 5 potencia en C
Para probar que C es la mejor región crítica se debe ver que para cualquier otra región de rechazo C *
de tamaño α; el error tipo II tiene probabilidad menor en C que en C * (βc , βc*) en consecuencia, la
potencia es mayor en C que en C *.
El error tipo I y el error tipo II en la región C *:
• P(error I) 5 P(C * | θ 5 θ0) 5 α
• 1 2 P(error II) 5 1 2 P(C *c | θ 5 θ1) 5 P(C * | θ 5 θ1) 5 1 2 βc 9 potencia en C *.
La prueba se hará considerando que la distribución generadora de la muestra es continua, con algu-
nas modificaciones se puede hacer la demostración para variables discretas.
Las dos regiones críticas se pueden descomponer en la unión de dos conjuntos mutuamente exclu-
yentes: C 5(C ∩ C * ) ∪ (C ∩ C *c ) y C * 5(C * ∩ C ) ∪ (C * ∩ C c ).
De aquí se sigue que:
P(C | θ 5 θ0 ) 5 P(C ∩ C ∗ | θ 5 θ0 ) 1 P(C ∩ C ∗c | θ 5 θ0 ) 5 α
∫
*c 0 0
*(cC ∩ C | θ 5 θ ) # k *c f ( x1 ; θ*1 ). . . fc( xn ; θ1 )dx1 dx2 . . . dxn 5 kP(C ∩ C | θ 5 θ1 )
*c
P
Ahora,
P(Cse | θ5calculará P
θ0 *) 2 P(C ( C ∩
cada *C | θ5 |
uno θ θ
θ0 *)de
5 )
50 Plos 5 (C∫términos
∩
C ∩C
0 f
C *c | θ 5
* c ( x 1de
; θ ) f
C ∩C la diferencia. ( x ; θ
θ00*) 2 P2c(C 0 ∩ C | θn5 θ00 ) 510 2 ) . . . f ( x ; θ ) dx dx . . . dx n
P(C | θ 5 θ0 )2 (C* ∩∩CCc ||θθ5 5θθ00 ))*1 ∩cCf (|xθ ;5θθ)0 f)(5xα; θ ). . . f ( x ; θ )dx dx *. c. . dx
cP
x)∫.1c.;C|.θ*θf∩1(5
5P P(C
|(CθC5 52
0 0 ∫ C ∩C2
• P(C *∩| θC5*cθ| 0θ)P5 5 (C θP0∩ ()C 5 C* *∩
∫ | θfθ5
C ∩C **c
(0 x)θ1# ;)θk1)Pf (C x *c;∩ θf (0C C)x. θ . .; fθ)(51x ;0θ )dx2 dx0 . . . dx 5
)dx
n 0 0 n 1 1 2* 1
α dx . . . dx2cn n
n kP 0 (C 1∩ C 2 | θ 5n θ1 )
P(C | θ 5 θ0 )**2 P ( C * | θ 5θ c ) 5 P(C ∩ C | θ 5 θ ) 2 P(C ∩ C | θ 5 θ ) 5 0
*c
2P θPC (C θ|0θ)∩ 5C θP0x()|C52 θ5 θ0*)c #2
∫ θc5fk;(θθ∫x0 1)C);2 (ffC((xx*.21.∩ ;;. θθdx
C01 ))c..|5
..θ.. 5 (θxxn);;θ5
fkf(P θ10))dx
dx dx2......dx dxn 52kP(C * ∩ C c | θ 5 θ1 )
0 0 0
| θC5*θc 0| θ ) #∩ ; θ∩1 )C θ∩C0P)cdx
c
Pθ*(c*cC
∫
P((C )2 |k * c1dx
P C∩ 5 5 *f|( (0nC ∩que:0 C 1| θ 5 2 θ1 ) n
*c f ( . .C.)/L(θ
∩Cx dx
*
En la región C ∩ 5C 0 se satisface que 1 L(θ n ) , 1 k, 1 entonces n se sigue
P*(*|C ∩ C | θ 5(C
cθ 5 θ ) 5*P
θ0* )∩C 5 ∫ |Cθ∩5
∩ C
*c f* c( x1 0; θ 0 ) f* (1x2 ; θ c ). . . f*(
2
c xn ; θ 0 )dx1 dx2 . . . dxn
P(PC(PC(C kc[|PθC x∩C ; θθ00))f|1 θk P(;θC ∩
. f.P.C (.1.x|;.θθ θ.θ0.)0.;dx
)| θ55 αθ1.)]. .5
0 ∩5 P(C | θ 5 θ1 ) 2kP C * |∩θ C
5cθ|1θ)]5 θ )
*
) 50∩∫,C (5C CC
( x5 θ1x0))2 (f(x)C ;C k[dx P((C
c 0f ( x1 ; θ 0 ∫
∩ *C | θ θ(0C *c f (θ f (1)dx ; θ1 )dx
2
P
∩ C c2P
( C
|5 θP05
C * c θ 0 ) 52
P(C | *θc 5 θ0* ) 2 P(C 0| θ 5*cθ0∫* )C5
∩ | θ 5 θ
C ∩C
* )# ∫ Ck*
∩C
1 ) #2
f
*c(C ∩ ( x
)2fC(* ∩
; θ
1 C 1 | θ5
C 2
c; θ
0
nf1()x
n
θ ) 21Pc (C1 ∩2C | θ 5
θ
* c). . . f ( x ; θ )dx *dx . . c. dx 5 kP(C ∩ C | θ 5 θ )
0
xdx n 21 dx 2
. .n1. dx2 . . . dxn 52
n θ0 ) 5
n * c 1
∩CP * c0
C)∫5 * c *0n 1
P (C ∩ *C P|(θ
P(C ∩ C *0|c*θ,|5
cC θθk0 θ )
[ Pθ)(#2 k ∩C C(C| θ∩5
P f ( x 1C
; θ
θ | 1θ) 2) .
5P . . f
θ(0C ( x
.).1 .∩ ;
n fPC
θ((x1C ;|θθ∩15
) dx dx)Cdxθ2 1|)]
. .
θ5.k. dx θn.[0.P )dx k P
(Cα52 ( C ∩
| θ 5kθP1()C2 P∩(C
C | θ θ
C 1|| θθ 5
*
) 5θθ11 )]
|0θ) 5 θ∫ 0C∫)∩52
5 5 # 5 5 5
c f (1x1 ; θ1 )
* c
2P Ck∩C *c * dx )
* *c f∫( C
0c 0
P(C 2∩PC (C |∩ θ5 Cθ C ∩C x*1∩; Cθc0 f)(f x(1x;2θ; 0θ)0f)(.n*c.x.2f1;(θx0n);.1θ. .0f)2(dx xn1dx ; θ*n02 ). dx
. . dx dx . . . dxn
1 ∫ C ∩C
• 20, P(kC[ P(∩CP
*
(CC
C∩C c
| θ| *θ5
c5
| θθθc05)0 )52
θ2 )P2(C P* (C| cθ∩
C
f5(C xθ1*0;c)θ|5 Pf ((θC
θ0 )5 x2)]∩ ;5 θC0k).[.P|.θ(fC 5 ( x|θnθ0;5 )θ2 )P dx(C
0θ1 ) 2
dx∩
1 P(
. .C*. dx| θn 5θθ)]0 ) 5 0
2C | θ 5
1c n 2
Por tanto, P(C * | V V1 ) P(C | V V1 ) , con lo que se prueba que la potencia en C es mayor que la
potencia en C*, por tanto
n C es mejor región
( x x . .crítica.
.x )/G 2 2 2 2
2 ( x1 , x 2 , ..., x n e ) 1 2 n
L(G)
Lo que nos dice en palabras simples G n el lema de Neyman Pearson es que la probabilidad del error II
en C es menor que en2 nC( x, ,por
*
lo que
x , ..., x ) la mejor región crítica
( x x . . .x )/G 2
1
2
2 es C. 2
n
( x x . . .x )/10
n
0 2 2 2 2
1 2 n e 1 2 n
n
L(G 0 ) G n
n © 3 ¹ ( x12 x22 . . .xn2 )/180
0
( x2 x10 2 ª e k
L(G1 ) 2 ( x , x , ..., x )( x12 x22 . . .xn2 )/G1n
« 2 º»
2 2
n . . . x )/ 15
1 2 n
e 1 2 n
n
Ejemplo 6.14. Sea X , X , . . . , X G1 una muestra aleatoria15de una función de distribución Weibull
n
1 2 100
con parámetros α 5 2 y β desconocida; encontrar la mejor región crítica de tamaño α
5 0.05 para la prueba:
H0: β 5 10 contra Ha: β 5 15
Solución:
La función de verosimilitud en* este caso es:
P(C | V V1 ) P(C | V V1 )
( x12 x22 . . .xn2 )/G 2
2 n ( x1 , x 2 , ..., x n e )
P(C | V V1 ) P(C | V V1 )L(G)
*
2 n ( x1 , xe 2 , ..., xn ) 1 2
1 2 (nx 2 x 2 . . .xn2 )/G1n ( x 2 x 2 . . .xn2 )/152
1 n e 1 2
L(G 0 ) G0n
n © 3¹
( x2 x10
2 2
. .xnn2 )/180
G1n 2 2 ª º e( x1 x2 .15 k
L(G1 ) 2 ( x , x , ..., x ) ( x12 x22 . . .xn2 )/G1n
« 2»
2
n . . . x )/ 15
1 2 n
e 1 2 n
G1n 15 n
Para conocer el valor de c para un nivel de significancia α (cα) se debe conocer la distribu-
ción de la variable aleatoria Yn X 12 . . . X n2 ; la manera de encontrar esta distribución
es calculando la función generatriz de momentos 1 h deh Ynn y después buscar si coincide con
n µ0 µ0
2 2 2 2 2
tY ( x x . . .x )( 1t G ) /G
la función Y
generatriz de M de
momento E(ealguna ) distribución
2 x1, conocida.
x 2 , ..., xn e
n
dx1dx2 . . . dxn1 2 n
2 2 Y
X 2 . . . X 2 G n
1 ∞ ∞ 1
∫ ∫
tY − ( x12 1x22 1…1xn2 )/β*2
MY 5 E(e n ) 5 1
2 n x1 x2 … xne dx1dx2 …dxn 5
n
(1 2 t β 2 )n/ 2 β* n 0 0 (1 2 t β 2 )n/ 2
51
Ésta es la función generatriz de momentos de una distribución gamma con parámetros:
α 5 n/2 5 50 y β∗ 5 β2.
Capítulo 6 Prueba de hipótesis | 273
Se tiene que P(error I) 5 P( x12 x22 … xn2 c0.05 |β 5 10) 5 0.05, el valor de c0.05 se
busca usando Excel y se encuentra que c0.05 5 6217.1044.
1 ( x R ) / 2 X 1 ( x R ) / 2 X 1 2 2 2 2
( xn R )2 / 2
L(R; x1 , ..., xn ) e 1 e 2 ... e
Se rechaza la hipótesis nula cuando x12 x22 … 2 UX
xn2 c6217.1044 y 2 UX
es la mejor de las 2 UX
0.05
pruebas. 1 ¨ ( xi R )2 / 2 X22 2
n
1 i 1 ( x1 R ) / 2 X 1 1
L(R; x1 , ..., e ( x R )2 / 2 X 2
(2 Ux)nn/)2
X n 2 UX e 2 UX
e 2 ...
2 UX
Ejemplo 6.15. Considerar una muestra aleatoria de una normal, esto x 2 σ
2
1 es X ©
~ N(µ,
ª ¨ R ). Use
¨
x nR el
¹ lema de n 2 n 2 2
«1 º /2 X
¨
n
( x R ) »/ 2 X i 1 i i 1 i 2 2
Neyman-Pearson y encuentre la mejor región crítica e
n / 2para e
n lasn/ 2hipótesis. i 1 i
(2 U ) X n
(2 U ) X
H0: µ 5 µ0 contra Ha: µ 51µ1 ©
ª ¨ i 1 xi2 2 R ¨ i 1 xi nR2 ¹»º / 2 X 2
n n
«
e
Solución: (2 U )n/ 2 X n
1 ( x R )2 / 2 X 2 1 ( x R )2 / 2 X 2 1 ( x R )2 / 2 X 2
L(R; x1 , ..., xn ) e 1 e 2 ... e n
2 UX 2 UX 2 UX
1
e ¨ i 1 i
n
( x R )2 / 2 X 2
(2 U ) X
n/ 2 n
© ¹
ª ¨ xi2 2 R ¨ xi nR 2 º / 2 X 2
n n
1 « i 1 »
e i 1
(2 U )n/ 2 X n
(2 π ) σ
n/ 2 n
=e
∑ i 51 xi2 222 µ 1∑∑
n n
x2 1nµ 2 / 2nσ 2x 1nµ 2 / 2 σ 2
∑
2 n
1 i22 µ 01
i 5x 0
e e i 51 i i 51 i
= e 0 1 ∑ i 51 i , k
n
( µ 2µ ) x /2 σ2
µ1 )∑
nn
Al obtener el logaritmo(µ 2σ
2 n 2
natural 2 ∑
de esta µ1 ∑ xi 1nµ1 / 2se
xi 2desigualdad
2
σ tiene que:
2
0
e i5i151 i i 51
µ1 )∑ i51
n
(µ 0 i
σ2
Aquí se tienen dos casos:
Caso 1. µ0 2 µ1 . 0 (µ1 , µ0).
y dado que la parte derecha es constante, que x– ~ N(µ, σ2) y que el tamaño de la
región crítica es α se tiene que se rechaza la hipótesis nula si:
n( x 2µ 0 ) n( x 2µ 0 )
zc 5 ,2zα si σ es conocida, o tc 5 ,2t12α si σ es desconocida.
σ s
Caso 2. µ0 2 µ1 , 0 (µ0 , µ1).
274 | Estadística para ingeniería y ciencias
(2 U )nson:
/2
e i 1
(2 U )n/ 2 X n
© ¹
ª ¨ xi2 2 R ¨ xi nR 2 º / 2
n n
1 « i 1 »
e i 1
(2 U )n/ 2
(2 π ) n/ 2
9 ( x 10 ) 9( x 10)
Al
P (estandarizar (∑
Error _ I ) Pla suma, secsigue:
n
x |µ 10) P z0.05 1.645 0.05
i1 1
σ σ
9 ( x 10 ) 9( x 10)
(∑
n
P (Error _ I )9( xP µ 0i)1 x1 c |µ 10) P z0.05 1.645 0.05
zc 1.645 σ σ
σ 9 ( x 10 ) 9( x
(∑
n
9 ( x µ0 ) P ((Error _ nI )(cP10 x1 c |µ 10) P z0.05
zc DeP (esta _ I
Errormanera,)1.P 645X | µ 10 ) Z
se sigue que la mejor región crítica está
) i z
1 ) 0
0.05dada por:
.05 σ σ
σ
P (Error _ II ) P X | µ 11) (Z n ( c 11 ) z ) 0.0 6
P (Error _ I ) P X | µ 10) (Z n (9c( x 10µ) )
0 z0.05 ) 0.05
0.06
zc 1.645
σ
P (Error _ II ) P X | µ 11) (Z n (c 11) z0.06 ) 0.06
P (Error _ I ) P X | µ 10) (Z n (c 10) z0.05 ) 0.05
P (Error _ II ) P X | µ 11) (Z n (c 11) z0.06 ) 0.06
Capítulo 6 Prueba de hipótesis | 275
Ejemplo 6.17. Refiérase al ejemplo 6.16. ¿Cuál será el tamaño mínimo requerido de la muestra para
efectuar las pruebas de hipótesis con la condición de que α 5 0.05 y β 5 0.06?
9 ( x 10 ) 9( x 10)
P (Error _ I ) P (∑ i1 x1 c |µ 10) P
n
Solución: z0.05 1.645 0.0
σ σ
La hipótesis nula se rechaza sin x– . c para un valor de9c( positivo.
x 1 0 ) 9( x 10)
P (Error9_(Ix)µP0 )(∑ i1 x1 c |µ 10) P z0.05 1.645 0.0
zc del error tipo
La probabilidad I1.es:
645 σ σ
σ
9 ( x_I µ
P (Error ) )
0 P X | µ 10) ( Z n (c 10) z0.05 ) 0.05
zc 1.645
σ
P (Error _ II ) P X | µ 11) (Z n (c 11) z0.06 ) 0.06
y la probabilidad del_ Ierror
P (Error ) Ptipo
X II es:
| µ 10) (Z n (c 10) z0.05 ) 0.05
P (Error _ II ) P X | µ 11) (Z n (c 11) z0.06 ) 0.06
De estas dos relaciones se obtiene un sistema de dos ecuaciones con dos incógnitas,
cuando se sustituye z0.05 y z0.06, buscando en la tabla de la normal estándar:
1.645 1.555
n5 52 ⇒ 1.645(c 211) 521.555(c 210)
c 210 c 211
⇒ (1.645 11.555)c 51.555(10) 11.645(11)
⇒ c 5 10.514
De aquí se sigue que:
1.645
n5 5 3.2 ⇒ n 510.2424 ≈ 11
10.514 210
se requiere de una muestra Error
de 11 elementos . c | µsatisfacer
) 5 P ( X para 510) las condiciones pedidas.
n ( X 2 µ) n (c 2 µ )
P
Ejemplo 6.18. Refiérase al ejemplo 6.16.5Considerar . µ 510
σ la prueba de
σ hipótesis anterior,
pero modifican-
do la hipótesis alternativa de la siguiente manera:
H0: µ 5 10 contra Ha: µ . 10
La región crítica de esta prueba para un nivel de significancia de α 5 0.05 está deter-
1.645
–
n 5
minada por un valor c, tal 10
que P(X .5c 3|.21µ.⇒
.514 2n105
645 510
5n10) 5 .2 ⇒≈nesto
5.2424
30.05; 11
510implica que:
.2424 ≈ 11
10.514 210
Error )5 P ( X . c |)µ55P10
Error (X) . c | µ 510)
n ( X 2 µ) n (nX 2µµ))
(c2
5P 5 P . . 10(c 2 µ) µ 510
µ 5n
σ σσ σ
5 P (Z . 9 (c 210)) 5 0.05
De esta manera, se tiene que zα/ 2 51.645 5 9 (c 2 10) ⇒ c 510 11.645 / 3 510.548 , es
decir, se rechaza H0: µ 5 10 si X $ 10.548 .
P (Error
Debe observarse que el valor crítico c no_ II ) 5 P ( Xdel
depende , 10 | µ 511) que tome la hi-
.548específico
valor
pótesis alternativa, sino que sólo depende del hecho que µ es mayor o menor que µ0.
276 | Estadística para ingeniería y ciencias
© n ( X R) n(10.548 R) ¹
P ª R 11º
« X X »
(
5 P Z , 9 (10.548 211) )
5 P (Z ,21.356) 5 0.08754
La probabilidad de cometer el error tipo II en función de µ es igual a:
P (Error _ II ) P ( X 10.548 | R)
© n ( X R) n (10.548 R) ¹
P ª Rº
« X X »
P (Z 9 (10.548 R)) G(R)
Con estos datos se hacen las dos gráficas siguientes: la primera es de la probabilidad del
error tipo II, P(error II) 5 β(µ) y la segunda es de la función potencia de esta prueba.
b
b
0.4 0.4
0.4 0.4
0.3 0.3
0.2 0.2
0.1 0.2 0.2
0.1
0 0
9 10 11 12 13
9 10 0
11 12 13 0
9 10 11 12 913 10 11 12 13
m m m m
Definición 6.7. Sea la prueba de una hipótesis simple contra otra compuesta.
H0: θ 5 θ0 contra H1: θ P Θ1
Se dice que una prueba es uniformemente más potente de tamaño α si es la mejor prueba para las
hipótesis simples H0: θ 5 θ0 contra H1: θ 5 θ1; para toda θ1 P Θ1.
Ejemplo 6.19. Considerar que se tiene una muestra de una distribución normal con media µ y va-
rianza conocida igual a σ2 5 4. ¿Cuál es la prueba uniformemente más potente para
las hipótesis?
H0: µ 5 10 contra Ha: µ > 10
Solución:
La hipótesis alternativa es compuesta, entonces para encontrar la prueba uniformemen-
te más potente se debe escoger la mejor prueba para las hipótesis simples H0: µ 5 10
contra H1: µ 5 µ1 cuando µ1 . 10.
Aplicando el lema de Neyman-Pearson se tiene:
2 ∑ x12 220 ∑ xi 1100 n / 2 α 2
n n
1 i 51 n
e i 51
2 ∑ x12 220 ∑ xi 1100 n / 2 α 2
n
e i 51 1 in
x2 2 20
∑ i 51 xi 1100n / 2 α 2
L((µ20π5 ) σ5n10
/ 2 ) n (2 π ) n / 2
σ n
e i 51 1
x1 2n20 ∑ x2i11002n 5
n 2
1 1 2 ∑ei 51 x12∑22i 5µ11 ∑
n
/2 α2 n 2
1µ
n2
xi( ) 2 2 ∑ x1 22nµ1 ∑
2 ∑ x12 220 ∑ L
n
n n x 1i 5 nµ1
/2α
1 i 52 1 ∑ x 2 2i 20
xi 1nnµ12 / 2 α 2
51 ∑ x 1100 n / 2 α 2
1001 n /2α i 51 i
Por tanto,e la hipótesis i 51nula H se rechaza nne
si / 2sensatisface que: e
i 51
L(µ 0 5
0 10) ( 102 n2
( /µ21π )∑ ) n xσ 2 2
e i 51 1 i 51 i
5 (n2e5 π2 2)20 σn ix511i100 / 2 α1 2 n n , k n
/ σ 1 ( µ 2 100 )
5
2 ∑ x12 22 µ1 ∑ 1xi n1nL 2 α2)∑ ∑ i 51 i n 2 ∑ x12 22µ1 ∑n 2xi 1nµ12 n/ 2 α 2
x
/µ
i 51 1 2
µ12 (
i 51 2 ∑ i 5x11 220 ∑ xi 1100 n / 2α∑
2 2 i 51 x1 22 µ1 ∑ i 51 xi 1nµ1 / 2 α
n n 2 n n
1 n x 1100 / 2 α1
2 2
i 51 2i5∑ e
20 ∑
e
L(µ 0 510) (e2 π) σ
1
n / i2 1
x12n2
i 1 i n
2
e n e
i 51 i 51 e
(2 π)2n 5σe(102µ1 )∑
n/ 2 n
5 5
2 2
5 n 5i 51 xi /σ 1n( µ1 22 100 )n ,n k 2 2
) µ1 )∑ i521x∑ n/ σ2 , µ 22
2
L(10
(µ12 1 i 2x1 22nµ1x∑
2lo
gnn( k 2) 2 (
2∑ i 51xi 1 nn2
x1 2 µµ2 1 ∑
/ 2 α1i 5 x1
1 i
100nµ12 )/ 2nα 2
2 ∑ x1 22 µ1 ∑ xi 1nµ1 / 2 α
e2 ne/i251 ∑ 51 ∑
2 i 51
e 1 2i20 x 1100 n / 2 α
1
en 2n
∑
i 51
1 1 xi /∑
n
i 51 i
π σ n i 51 1 2( 102µ1 i)5∑
x 220 σ 2 1( µxi21 100 / 2 α 2
∑ i51 xi .nσ(10 ( 2 )
n 2
21 1 2100n)n
(log(k) 2n (µn2 1 2100 2
)n) ⇒ x ,5σ e (log(k ) 2(µ1 2100), n)k/ n(µ20 ∑ 2i 5µ1 x112)2520 ∑c i 51 xi 1100n / 2 α 2
i5 n n
ne 2
i 51
µ 2∑ µ σ /)2 α σ (µse
n 2
Al obtener n el2 logaritmo
2 ∑ x1 220 ∑ xi 1100 n / 2α
2 natural
2
1
L
∑) ( x10de
2
i51
5 2x µ10
i
1 ∑/
está ) x, 1(nlo 2µ12π
desigualdad
i
g
(nk/22) 2
1
2 100
tiene ) nque e
e i 5 1 i 5
5n
1
5 n 2
e i 51 n ( X i 51
210 n ) n2(((µ
L X 102 )2 µ1 10
) ∑) xi / σ 2 1( µ12 2100 )n2 ∑ x 2 22 µ ∑ x 1nµ 2 / 2 α 2
i 51. z2 1
n n
2 ∑ x1 22 µ1 ∑ xi 1nµ12 / 2 α 2
n
n ∑
z 5 x 5 σ
5 e (log( 1 n k)2 ( µ 100 ) n k
)
, ⇒ x σ 1 2 i 51 i
(log( k )1
( µ 2
100 )
i 51
n ) / n ( µ µ )
5c
1 ∑ i51 i ( 2 π ) n / 2 σ n
i 51 1
2 ∑ x1 22 µ1 ∑σ xi 1nµ1 / 2 α
cn 2 i 5 (
12 10
i
.2 2 µ )
2 x / σ 2
1a
, 2 lo g ( k e ) 2 ( µ 2 ,
2 100 ) n 2 1
2 e 0
2
i 51
1
i 51 1
e i 51
n ( X 210) n ( X 210)
zc 5 5 . za
σ 2
por tanto, ésta es la prueba uniformemente más potente para la prueba con Ha: µ > 10.
Hay pruebas que no admiten una región crítica uniformemente más potente. Por
ejemplo, para la prueba:
H0: µ 5 10 contra Ha: µ ≠ 10
278 | Estadística para ingeniería y ciencias
No hay una mejor región crítica para la prueba, pues cuando 10 , µ1 la mejor región
es x– . c y cuando 10 . µ1 la mejor región es x– , c; en ambos casos la mejor región es
diferente y por tanto no existe la prueba uniformemente más potente.
Ejemplo 6.20. Se ha propuesto un nuevo diseño para el sistema de frenos de un automóvil. Se sabe
que para el sistema actual la distancia de frenado a una velocidad de 60 kilómetros por
hora bajo condiciones específicas tiene una media real igual a 40 metros. Se propone
que el nuevo diseño se ponga en práctica sólo si los datos muestrales indican una fuerte
reducción en el verdadero promedio de la distancia de frenado para el nuevo diseño.
a) Definir el parámetro de interés e indicar las hipótesis pertinentes.
b) Suponer que la distancia de frenado para el nuevo diseño está distribuida nor-
malmente con una desviación estándar de 3 metros. Si x– es la distancia media de
frenado para una muestra aleatoria de 36 observaciones, ¿cuál de las siguientes
regiones de rechazo es apropiada?
• C1 5 { x–|x– . 51.3}
• C2 5 { x–|x– , 38.56}
• C3 5 { x–|x– . 51.3} o {x–|x– , 38.56}
c) ¿Cuál es el nivel de significancia para la región crítica pertinente del inciso b)?
Cómo cambia la región crítica para obtener una prueba con α 5 0.02?
d) ¿Cuál es la probabilidad de que el nuevo diseño no se ponga en práctica cuando
su verdadera distancia media de frenado es de 38 metros y se usa la región crítica
definida en el inciso b)?
e) Si se desea un nivel de significancia del 0.05, ¿cuál es la mejor región crítica para
probar la hipótesis H0: µ 5 40 contra la hipótesis alternativa H1: µ 5 38?
Solución:
a) El parámetro de interés es µ, la media de la distancia de frenado a una velocidad
de 60 kilómetros por hora y las hipótesis respectivas son:
H0: µ 5 40 contra Ha: µ < 40
Si el tamaño de la región crítica fuera α 5 0.02, la región crítica estaría definida por
c, que satisface la relación:
Capítulo 6 Prueba de hipótesis | 279
6(c 2 40)
)5 Z , 5 P(Z ,2z0.02 ) 5 0.02
3
De aquí se obtiene que:
6(c 2 40)
52z0.02 522.055 ⇒ c 5 40 2 2.055 3 3 / 6 5 38.9725
3
d) ¿Cuál es la probabilidad de que el nuevo diseño no se ponga en práctica cuando
su verdadera distancia media de frenado es 38 metros y se usa la región crítica
definida en el inciso b)? Se está pidiendo la probabilidad de que se cometa el error
tipo II, esto es, que no se rechace que µ 5 40 cuando en realidad es 38. El nuevo
diseño no se pone en práctica si la media muestral es mayor o igual a 38.56, por
tanto esta probabilidad está dada por:
n ( X 38) 6(38.56 38)
β P( X 38.56 | µ 38) P P(Z 1.12 0.1314
σ 3
Ejemplo 6.21. La experiencia dice que el tiempo promedio de secado de la pintura de un fabricante
es igual a 20 minutos. El fabricante modificó la composición química de su pintura y
quiere probar que esta modificación disminuya significativamente el tiempo de seca-
do. ¿Qué hipótesis alternativa debe usar el fabricante?
280 | Estadística para ingeniería y ciencias
Como se puede ver en los diferentes ejemplos revisados sobre región crítica, ésta de-
pende del nivel de significancia, α; es posible que para algunos valores de α se rechace
la hipótesis nula y para otros valores no se rechace.
Ejemplo 6.22. Ver ejemplo 6.14 para una muestra aleatoria de 17 muestras de secado de pintura con
la modificación en la composición química, el promedio y la desviación estándar de
los datos muestrales son iguales a x– 5 18.2 y s 5 3.6 para la prueba
H0: µ 5 20 contra Ha: µ , 20.
Entonces, para cada uno de los diferentes niveles de significancia se tienen regiones
de rechazo.
Tabla 6.5.
Resultado
Nivel de significancia Región de rechazo de H0 Decisión
tc respecto a tα
hipótesis nula? La respuesta es: el valor αc que satisface la relación P(t , 22.0616) 5
αc; este valor se encuentra usando Excel y resulta ser αc 5 0.02794. En conclusión:
Definición 6.8. Al valor p 5 αc que satisface las dos condiciones siguientes para una muestra alea-
toria dada:
n( x 2µ 0 )
• zc 5 cuando el valor de σ es conocido, zc es normal estándar.
σ
n( x 2µ 0 )
• tc 5 cuando el valor de σ es desconocido, tc es t de Student con n 2 1 grados de libertad.
s
Por otro lado, son tres las posibles formas en que se puede formular una prueba de hipótesis. En la siguien-
te tabla se cita la región de rechazo para cada una de estas tres formas.
282 | Estadística para ingeniería y ciencias
Tabla 6.6.
Región de rechazo, Región de rechazo, Valor de P según σ
Formulación de la prueba
σ conocida σ desconocida sea conocida o no
p 5 P (z . zc)0
a) H0: µ 5 µ0 contra Ha: µ . µ0 zc . zα tc . t12α
p 5 P (t . tc)
p 5 P (z , zc)0
b) H0: µ 5 µ0 contra Ha: µ , µ0 zc , 2 zα tc , 2 t12α
p 5 P (t , tc)
p 5 2P (z . zc)0
c) H0: µ 5 µ0 contra Ha: µ ≠ µ0 | zc | . zα/2 | tc | . t12α/2
p 5 2P (t . tc)
• s2 5
1
n 21
∑
n
(
i =1 )
X i2 2 n( X )2 , este estimador se calcula en el caso de que s sea desconocida.
• z n (( x
n x2 2µ
µ 00 ))
zcc 5
5 σ
σ
ttc 5
n
n (
( x
x 2µ
2 µ 00 ))
• c
5 ss
d) Tome la decisión más conveniente si la estadística de prueba cae en la región de rechazo o en la región
de aceptación.
Ejemplo 6.23. El gerente de ventas de una fábrica empacadora de especias quiere verificar si el peso
neto de las bolsas de canela para venta al público es realmente el indicado en la eti-
queta. El gerente de producción asegura al gerente de ventas que el peso promedio de
cada bolsa es de 750 gramos con una desviación estándar de 5 g. El gerente de ventas
selecciona, al azar, 100 bolsas y encuentra que el peso promedio es de 748 g. Bajo
estas condiciones y usando un nivel de significancia de 0.05, ¿qué actitud debe tomar
el inspector de calidad?
Solución:
El gerente de ventas debe establecer una prueba de hipótesis donde la hipótesis nula
es H0: µ 5 µ0 5 750; hay dos posibles maneras de formular la hipótesis alternativa:
a) Ha: µ 5 µ1 ≠ 750
b) Ha: µ 5 µ1 , 750
n( x 2µ 0 )
La estadística de prueba es zc 5 , porque se conoce el valor de σ y la región
σ
de rechazo de tamaño 0.05 es igual a zc , 2z0.05 5 21.645. De acuerdo con los datos
n( x 2µ 0 ) 100 ( 748 2 750)
muestrales se encuentra que zc 5 5 524 y como 24 <
σ 5
21.645 se rechaza la hipótesis nula, concluyendo que la media del peso real de las
cajas es menor que 750, cantidad correspondiente al peso especificado.
Ejemplo 6.24. Las siguientes son las lecturas del aumento de la temperatura en un contenedor que
transporta verduras para exportación: 6.9, 4.8, 6.2, 5.4, 7.0, 6.4, 6.9 y 5.6. El fabrican-
te afirma que sus contenedores están bajo control, por lo que la temperatura media
del agua no es mayor que 6 grados centígrados. Con un nivel de significancia de 5%,
¿es posible que los datos contradigan la información del fabricante?
Solución:
La afirmación del fabricante “la temperatura media del agua no es mayor que 6 gra-
dos centígrados, esta conjetura corresponde a la hipótesis nula. Las hipótesis son
entonces:
H0: µ ≤ 6 contra H1: µ . 6
Para aplicar las técnicas estudiadas en este capítulo, se requiere que la hipótesis nula
sea una hipótesis simple entonces se escoge el valor de 6, pues si se rechaza la hipótesis
nula para µ 5 6 también se rechazará con cualquier otro valor de µ , 6. Entonces, se
debe plantear las hipótesis de prueba como:
H0: µ 5 6 contra H1: µ . 6
Con n 5 8, α 5 0.05.
La media y la desviación estándar de los datos muestrales son x– 5 6.16 y s 5 0.81, el
valor calculado de la estadística de prueba es:
n( x 2µ 0 ) 8 (6.16 2 6)
tc 5 5 5 0.5587
s 0.81
El valor de las tablas de la distribución t con 7 grados de libertad es igual a t120.05 5
1.895.
La región de rechazo es tc . 1.895.
En este caso, la estadística de prueba cae en la región de aceptación, pues 1.895 .
0.5587, y se concluye que no hay suficiente evidencia para rechazar la hipótesis nula
y por tanto se acepta.
Solución:
Debido a que se busca evidencia de que la media de las concentraciones de NOx está
por arriba de 70 mg/L, dicha conjetura corresponde a la hipótesis alternativa. Las
hipótesis de prueba son:
H0: µ 5 70 contra Ha: µ . 70.
La estadística de prueba es:
n( x R 0 ) 36 ( 74. 70)
zc 2.66
X 9
La región crítica es zc . zα 5 z0.05 5 1.645.
En este caso se tiene que zc 5 2.66 . 1.645; esto significa que la estadística de prueba
cae en la región de rechazo, por tanto hay suficiente evidencia para rechazar la hipó-
tesis nula y decir que la alternativa es cierta.
Ejemplo 6.26. Para evitar la contaminación ambiental producida por el consumo excesivo e innece-
sario de gasolina se realiza un estudio de la ingeniería ambiental atmosférica. En el
departamento de ingeniería de una fábrica de autos se está diseñando un nuevo modelo
de motor de combustión interna; se afirma que este nuevo motor tiene rendimiento del
millaje por arriba de 35 millas por galón. Se tiene la convicción que el valor de la desvia-
ción estándar es σ 5 4 millas. La Environmental Protection Agency de Estados Unidos
de América quiere probar si el nuevo motor cumple las especificaciones reportadas
por el fabricante. Para ello se eligen 50 autos nuevos con este motor y se prueban bajo
circunstancias iguales. Los resultados de la prueba dan un promedio muestral de 36.4
millas por galón. ¿Estos datos confirman lo afirmado por el fabricante? Usar el nivel de
significancia de 0.025.
Solución:
El fabricante afirma que su motor tiene un rendimiento de cuando menos 35 millas
por galón, entonces lo que se quiere probar es que µ . 35. Como hipótesis nula se
establece la frontera de esta afirmación; entonces la prueba se formula así:
n( x 2µ 0 ) 50 (36.4 2 35)
zc 5 5 5 2.47
σ 4
La región crítica de la prueba está dada por zc . z0.025 5 1.96.
En este caso se tiene que zc 5 2.47 . 1.96, esto significa que la estadística de prueba
cae en la región de rechazo, por tanto hay suficiente evidencia para rechazar la hi-
pótesis nula y decir que el nuevo motor sí tiene un rendimiento mayor que 35 millas
por galón.
Capítulo 6 Prueba de hipótesis | 285
Ejemplo 6.27. Se sabe que el estándar químico para el agua potable, en cuanto a sólidos disueltos tota-
les (SDT), es de 500 mg/L y una muestra de 144 casos tomados en diferentes domicilios
de una ciudad da un promedio aritmético estadístico de 503 mg/L, con una desviación
estándar de 15 mg/L. La diferencia de la media muestral con respecto al estándar permi-
tido, ¿es suficiente para decir que el agua de esa ciudad está por arriba en la concentra-
ción del químico? Usar α 5 0.05. Encontrar el valor de p.
Solución:
Dado que se quiere probar si la concentración del químico está por arriba del estándar
químico, las hipótesis de prueba son:
H0: µ 5 500 contra Ha: µ . 500.
Como se desconoce el valor de σ y se tiene su estimación, la estadística de prueba es:
Ejemplo 6.28. Un fabricante de sistemas de aspersión contra incendios que se instalan dentro de casas
y edificios, argumenta que sus sistemas tienen una media poblacional de temperatura
de 54.4 oC. Para probar su aseveración se obtiene una muestra aleatoria de 16 unidades,
que al probarse dan un promedio estadístico de 55.0 oC, con una desviación estándar
de 1.0 oC. Si se sabe que la distribución de los tiempos de activación de los sistemas de
aspersión contra los incendios, de este fabricante, es normal, ¿se refutaría el argumento
del fabricante de que el verdadero promedio es el que se menciona antes? Suponer un
nivel de significancia de 0.05.
Solución:
Dado que no se indica hacia qué lado se quiere obtener evidencia estadística, la prueba
se puede formular como:
H0: µ 5 54.4 contra Ha: µ ≠ 54.4
Como se desconoce el valor de σ y se tiene su estimación, la estadística de prueba es:
n( x 2µ 0 ) 16 (55 2 54.4)
tc 5 5 5 2.4
s 1
La prueba es bilateral, entonces se debe buscar el valor de tablas en α/2 5 0.025 y la
región crítica de la prueba está dada por la desigualdad | zc | . z0.025 5 1.96.
286 | Estadística para ingeniería y ciencias
En este caso, se tiene que zc 5 2.4 . 1.96, esto significa que la estadística de prueba
cae en la región de rechazo, por tanto hay suficiente evidencia para rechazar la hipó-
tesis nula y decir que la afirmación del fabricante es falsa.
La siguiente tabla muestra la forma de la región crítica con base en esta variable aleatoria y de acuerdo con
la región crítica formulada.
Tabla 6.7.
El valor de c depende del nivel de significancia seleccionado y para obtener este valor se requiere conocer
una función de distribución asociada a la diferencia de los promedios muestrales independiente de cualquier otro
parámetro desconocido,
σ2 para ello se tienen tres casos.
1
σ 2 se puede obtener una normal estándar al restar la media y dividirla entre su desviación estándar; así
En este caso
2
se tiene que:
X 1 2 X 2 2 (µ 1 2 µ 2 )
≈ N (0, 1)
σ 12 / n1 1 σ 22 / n2
P(error I ) 5 P( X 1 2 X 2 . c | µ1 2 µ 2 5 δ 0 )
X 1 2 X 2 2δ c 2δ0 X 1 2 X 2 2δ
5P 0
. | µ1 2 µ 2 5 δ 0 5 P 0
. zα
σ 1 / n1 1 σ 2 / n2 σ 1 / n1 1 σ 2 / n2 σ 1 / n1 1 σ 2 / n2
2 2 2 2 2 2
La estadística de prueba es:
X 1 2 X 2 2δ0
zc 5
σ 12 / n1 1 σ 22 / n2
Tabla 6.8.
X 1 2 X 2 2 (µ 1 2 µ 2 )
≈ N (0, 1)
σ 2 1 / n1 11 / n2
Se distribuye como una ji-cuadrada con n1 1 n2 2 2 de libertad, y siguiendo la definición 4.29 al efectuar
la división de la variable normal estándar entre la raíz cuadrada de la variable ji-cuadrada entre sus grados de
libertad, se obtiene que:
X 1 2 X 2 2 (µ 1 2 µ 2 )
, t con n1 1 n2 2 2 grados de libertad
sp 1 / n1 11 / n2
(
P(error I ) 5 P X 1 2 X 2 . c | µ1 2 µ 2 5 δ 0 )
X 1 2 X 2 2δ c 2δ0 X 1 2 X 2 2δ
5P 0
. | µ1 2 µ 2 5 δ 0 5 P 0
. t12α
sp 1 / n1 11 / n2 sp 1 / n1 11 / n2 sp 1 / n1 11 / n2
La estadística de prueba es:
X 1 2 X 2 2δ0
tc 5
sp 1 / n1 11 / n2
y se rechaza la hipótesis nula cuando esta estadística de prueba cae en la región de rechazo:
Tabla 6.9.
Tabla 6.10.
n(D2µd 0 )
tc 5 ≈ t y se distribuye como una t con n 2 1 grados de libertad.
sd
Lo anterior corresponde a la prueba de una media con varianza desconocida. El procedimiento para
realizar la prueba es:
a) Se recoge la muestra aleatoria de los datos como un conjunto de n parejas:
(X11, X21), (X12, X22), . . . , (X1n, X2n).
b) Con los datos de la muestra se calculan las diferencias Di 5 X1i 2 X2i para i 5 1, 2, . . . , n.
–
c) Se calculan la media y la varianza muestral de los datos Di, D y sd2, respectivamente.
d) Como la varianza muestral es desconocida, el estadístico de prueba se calcula como:
n(D2µd 0 )
tc 5
sd
e) La decisión se toma de acuerdo con la siguiente tabla:
Tabla 6.11.
Ejemplo 6.29. S
e realiza un estudio para medir la efectividad de dos tipos de antigripales y el aumen-
to del sueño. Para este efecto, a seis personas se les suministra el primer antigripal en
una noche y el segundo antigripal en una segunda noche. Se registran los respectivos
tiempos de sueño y se reportan en la siguiente tabla:
Tabla 6.12.
Paciente
1 2 3 4 5 6
Antigripal A 4.8 4.1 5.8 4.9 5.3 7.4
Antigripal B 3.9 4.2 5.0 4.9 5.4 7.1
Con un nivel de significancia de 5%, ¿hay diferencias significativas entre los periodos
de sueño provocados por ambos remedios?
Solución:
Como los antigripales se aplicaron a las mismas personas durante dos noches diferen-
tes, se trata de un experimento con observaciones apareadas y como no hay informa-
ción sobre cuál de los dos antigripales produce mayor tiempo de sueño las hipótesis a
probar se formulan de la siguiente manera:
H0: µd 5 0 contra Ha: µd ≠ 0
Con los datos pareados se calculan las diferencias.
Tabla 6.13.
Paciente
1 2 3 4 5 6
Antigripal A 4.8 4.1 5.8 4.9 5.3 7.4
Antigripal B 3.9 4.2 5.0 4.9 5.4 7.1
Diferencia 0.9 20.1 0.8 0.0 20.1 0.3
–
La media y la desviación estándar muestrales de las diferencias son d 5 0.30 y s 5
0.452, respectivamente.
La estadística de prueba evaluada en los valores muestrales es:
n(D2µd 0 ) 6 (0.30 2 0)
tc 5 5 51.63
sd 0.452
Ejemplo 6.30. N
ueve pares de gemelos participan en un experimento en el cual a uno de cada par de
gemelos se les entrena para anotar en el lanzamiento hacia la canasta de básquetbol;
290 | Estadística para ingeniería y ciencias
después de una semana se les pide a todos los gemelos, entrenados o no, a que rea-
licen 30 lanzamientos. Los datos se reportan en la siguiente tabla. ¿La información
de la tabla reporta que el programa de adiestramiento es efectivo? Use un nivel de
significancia de α 5 0.05.
Tabla 6.14.
Números de canastas anotadas
1 2 3 4 5 6 7 8 9
Con adiestramiento 18 27 17 28 25 23 13 22 28
Sin adiestramiento 23 20 12 29 22 20 10 21 25
Solución:
Dado que los gemelos tienen características genéticas semejantes, los datos obtenidos
son pareados; entonces, se debe considerar la diferencia de las anotaciones entre el
gemelo que recibió el adiestramiento menos las anotaciones del que no lo recibió. La
hipótesis alternativa es que con el adiestramiento se anotan en promedio más canas-
tas. Las hipótesis de prueba:
H0: µd 5 0 contra Ha: µd . 0
Las diferencias se reportan en la siguiente tabla:
Tabla 6.15.
Números de canastas anotadas
1 2 3 4 5 6 7 8 9
Con adiestramiento 18 27 17 28 25 23 13 22 28
Sin adiestramiento 23 20 12 29 22 20 10 21 25
Diferencia 25 7 5 21 3 3 3 1 3
a) H 0: σ 2 5 σ 20 contra H a: σ 2 . σ 20
b) H 0: σ 2 5 σ 20 contra H a: σ 2 , σ 20
c) H 0: σ 2 5 σ 20 contra H a: σ 2 ≠ σ 20
El estimador de la varianza poblacional σ² es la varianza muestral s², y la variable aleatoria asociada con
este estadístico es la distribución ji-cuadrada, esto es:
( n 21)s 2 / σ 2 5 ∑ i51 ( X i 2 X )2 / σ 2 ~ χ2 con n 2 1 grados de libertad.
n
Tabla 6.16.
H 0: σ 5 σ 0 contra
a)
2 2
H a: σ 2 . σ 20 χc2 . χ122α p 5 P(χ2 . χ2c )
H 0: σ 5 σ 0 contra
b)
2 2
H a: σ 2 , σ 20 χc2 , χα2 p 5 P(χ2 , χ2c )
H 0: σ 5 σ 0 contra
c)
2 2
H a: σ 2 ≠ σ 20 χc2 , χα2 / 2 o χc2 . χ122 α / 2 p 5 ZP(χ2 . χ2c )
Ejemplo 6.31. Suponga que el diámetro de los balines de una herramienta hidráulica es una magnitud
que se distribuye normalmente con una desviación estándar de 0.6 milésimas de pul-
gada. El proceso de producción se sale de control si la desviación estándar es mayor a
0.6. Para controlar el proceso se toman muestras periódicas de 20 piezas, y se considera
que el proceso está fuera de control cuando la evidencia estadística hace que se rechace
la H0 que afirma que la desviación estándar del proceso es a lo más de 0.6 con un nivel
de significancia de 0.01. ¿Qué se puede concluir si para una muestra dada la desviación
estándar es de 0.84 milésimas de pulgada?
Solución:
El proceso se considera fuera de control si la desviación estándar y consecuentemente
la varianza exceden de cierto límite. Por tanto, las hipótesis pueden plantearse como:
H 0: σ 2 5 0.36 contra H 0: σ 2 . 0.36
El valor 37.24 es mayor que 36.19077, lo que significa que el estadístico de prueba cae
en la región de rechazo y se concluye con la evidencia de la muestra que la varianza
es mayor que 0.36, de manera que el proceso se encuentra fuera de control.
Ejemplo 6.32. Un fabricante de medidores de CO2 afirma que la desviación estándar poblacional de
sus aparatos es menor que 3 partes por trillón (ppt). Se toma una muestra aleatoria de 10
aparatos y se calcula la desviación estándar muestral que resulta ser 1.6. ¿Existe suficien-
te evidencia (en términos del valor de p), para apoyar la afirmación del fabricante?
Solución:
a) El fabricante desea probar que sus medidores tienen una desviación estándar ma-
nor que 3, y ésta es la hipótesis alternativa, entonces las hipótesis de prueba son:
H1: σ2 , 9, la prueba de hipótesis nula debe ser H0: σ2 $ 9 con esta prueba se
utiliza la distribución χ2.
b) La región de rechazo es χ2calc. , χ212α;n21, o sea, χ2calc., χ2.95;9, o sea, χ2 , 3.33.
c) La estadística a usar es χ2 5 (n – 1)s2/σ2.
d) Los cálculos son χ2calc. 5 9(1.6)2/9 5 2.56.
e) En conclusión, se rechaza la hipótesis nula y se dice que sí hay suficiente eviden-
cia para apoyar la afirmación del fabricante.
f) El valor de p se hace buscando 2.56 en la tabla de la distribución de ji-cuadrada
con ν 5 9 y vemos que es (0.025 , p , 0.01). Usando la función de interpolación
de ji-cuadrada y sustituyendo los valores da (0.025 – 0.01)/(2.7 – 2.09) 5 (0.025
– X)/(2.7 – 2.56) y la probabilidad es p 5 0.022. La figura siguiente muestra esta
situación. Este cálculo también se puede realizar con las herramientas estadísticas
de Excel.
f (D2)
Valor de p .022
Región de rechazo D2
Región crítica
D2 2.56
Figura 6.5.
a) H 0: σ 12 5 σ 22 contra H a: σ 12 , σ 22
b) H 0: σ 12 5 σ 22 contra H a: σ 12 . σ 22
c) H 0: σ 12 5 σ 22 contra H a: σ 12 ≠ σ 22
Se sabe que:
( n 21)s12 / σ 12 , χ 2 con n1 2 1 grado de libertad y
Tabla 6.17.
H 0: σ 12 5 σ 22 contra
a) H a: σ 12 , σ 22 F21c . F21α p 5 P(F . F21c)
H 0: σ 12 5 σ 22 contra
b) H a: σ 12 . σ 22 F12 c . F12 α p 5 P(F . F12c)
H 0: σ 12 5 σ 22 contra
c) H a: σ 12 ≠ σ 22 p 5 P(F . F21c) 1 P(F . F12c)
p̂ (6.4)
tamaño de la muestra n
Entonces, Xc 5 n p̂ se distribuye como una binomial con parámetros n y p, así que la región de rechazo
se determina con esta distribución de probabilidades. Debido a que esta variable aleatoria es discreta se debe
escoger la región de rechazo de tamaño lo más cercano al valor de α seleccionado. La región de rechazo de
acuerdo con la forma de la hipótesis alternativa se describe en la siguiente tabla:
Tabla 6.18.
Ejemplo 6.33. Un agricultor asegura que al menos 90% de sus semillas germinarán, sin embargo, al
sembrar 20 de estas semillas resulta que sólo 15 de ellas germinan. ¿Estos datos dan
evidencia suficiente para rechazar la afirmación del fabricante?
Solución:
Las semillas germinadas dan pauta para considerar que el porcentaje de semillas úti-
les en el lote es menor al que afirma el agricultor. Si p es la probabilidad de que cada
semilla germine al sembrarlas, la prueba se puede formular como H0: p 5 0.90 contra
Ha: p , 0.90.
Bajo el supuesto de que la afirmación del agricultor es cierta, la variable X igual
al número de semillas que germinan de las 20 sembradas; es binomial con parámetros
n 5 20 y p 5 0.90, X ~ B(20, 0.90). Los siguientes datos de la tabla son de la distri-
bución binomial.
Tabla 6.19.
En la tabla anterior se busca el valor de P(X # x) que está más cercano a α 5 0.05 y
que es P(X # 15) 5 0.0432, por tanto la región de rechazo es X # 15. Y como fueron
15 semillas que germinaron, entonces se tiene suficiente evidencia para rechazar la
afirmación del agricultor.
Muestras grandes
El teorema del límite central afirma que la variable binomial se aproxima a una normal cuando n es grande.
Así que cuando la muestra de variables Bernoulli es grande (n . 30) se puede suponer que p̂ ~ N(p, p(12p)/n)
y por tanto, la estadística de prueba es:
Capítulo 6 Prueba de hipótesis | 295
n ( pˆ 2 p0 )
zc 5 (6.5)
p0 (1 2 p0 )
y la región de rechazo se encuentra en la tabla siguiente:
Tabla 6.20.
pˆ 1 2 pˆ 2
Zc 5 ≈ N (0, 1) (6.8)
pˆ (1 2 pˆ )(1 / n1 11 / n2 )
La región de rechazo se reportan en la tabla siguiente:
296 | Estadística para ingeniería y ciencias
Tabla 6.21.
Ejemplo 6.34. En 1987 un artículo del New York Times reportó que se puede reducir el riesgo de
sufrir ataques al corazón ingiriendo una aspirina diaria. Para llegar a esta conclusión
el articulista se basó en los resultados de un experimento diseñado con dos grupos de
individuos. El primer grupo tenía 11 034 personas y a éstas se le suministró una dosis
diaria de una pastilla que no contenía ninguna droga (un placebo), de éstos 189 sufrie-
ron posteriormente ataques cardiacos. Por su parte, al otro grupo de 11 037 personas
se les suministró una aspirina diaria y sólo 104 sufrieron un ataque cardiaco. ¿Usando
una prueba de hipótesis y un nivel de significancia de 1%, considera que el articulista
del New York Times estaba en lo correcto?
Solución:
Sea p1 la proporción real de personas que sin tomar aspirina sufren un infarto cardiaco,
y p2 la proporción real de personas que al tomar aspirina sufren posteriormente un
infarto; las hipótesis de prueba se plantean de la siguiente manera:
H0: p1 2 p2 5 0 contra Ha: p1 2 p2 . 0
Para obtener la región de rechazo se calculan los estimadores y la estadística de
prueba:
X1 1 X 2 189 1104
• p̂ 5 5 5 0.0133
n1 1 n2 11 034 111 037
pˆ 1 2 pˆ 2 0.0171 2 0.0094
• Zc 5 5 5 5.00
pˆ (1 2 pˆ )(1 / n1 11 / n2 ) 0.0133(1 2 0.0133)(1 / 11 034 11 / 11 037)
Como Zc 5 5.00 . Z0.99 5 2.33, se rechaza la hipótesis nula y se concluye que hay
evidencia estadística suficiente para afirmar que tomar una aspirina diaria reduce las
posibilidades de sufrir infarto en el futuro.
Tabla 6.22.
Intervalo de clase [c0, c1) [c1, c2) [c2, c3) ... [ck−1, ck)
Probabilidad de que X esté
p1 p2 p3 pk
en [ci−1, ci)
Valor esperado E1 5 np1 E2 5 np2 E3 5 np3 Ek 5 npk
La estadística de prueba se distribuye aproximadamente como una ji-cuadrada con k 2 1 grados de li-
bertad. La razón por la cual se tiene esta distribución aproximada es porque al obtener una observación ésta
puede caer o no en un intervalo de clase, lo cual lleva a que el número de observaciones en un intervalo de
clase se distribuya como binomial; por esta razón si el número de datos es suficientemente grande, el número
de datos en cada intervalo de clase se distribuye aproximadamente normal con media npi y varianza npi(12pi),
y entonces, se puede demostrar que la estadística de prueba definida antes se distribuye aproximadamente
como una ji-cuadrada con k 2 1 grados de libertad.
Si los valores observados son cercanos a los valores esperados, no se puede rechazar la hipótesis nula; en
caso contrario, se rechaza la hipótesis nula (H0) de acuerdo con la formulación de las hipótesis y se muestra
en la siguiente tabla.
Tabla 6.23.
Es importante tener en cuenta las siguientes recomendaciones al aplicar esta prueba de hipótesis:
a) El número de intervalos de clase k debe estar entre 5 y 20 para que sea adecuada y fácil la identifica-
ción de la posible función de distribución.
b) El número esperado de observaciones en cada intervalo debe ser mayor o igual a cinco; en caso con-
trario, deben agruparse varios intervalos para lograr esto, ya que la distribución ji-cuadrada es una
aproximación para números grandes.
c) El primer intervalo de clase viene desde 2` y el último intervalo de clase va hasta `. Con estos inter-
valos de clase se calculan las probabilidades.
Ejemplo 6.35. A un grupo de 80 empleados de una maquiladora se les aplicó una prueba para deter-
minar sus habilidades en el manejo de una nueva maquinaria. Las calificaciones se
dan en un rango de 0 a 100 y se reportan en la tabla siguiente:
Tabla 6.24.
29 78 48 29 30 44 72 73 45 82 84 71 75 84 45 45
47 32 33 54 56 33 62 63 64 36 38 53 54 38 40 57
42 51 52 53 56 57 58 71 76 77 58 60 60 62 65 65
14 16 73 74 45 21 23 66 67 42 43 51 67 70 57 78
55 27 78 48 49 50 51 86 58 59 89 36 37 91 92 93
Los datos dan evidencia de que las calificaciones provienen de una distribución nor-
mal.
Solución:
La prueba a resolverse es:
H0: X ~ N( µ, σ2) contra H1: X ~ f (x, θ) ≠ N( µ, σ2)
La hipótesis nula no está completamente identificada, pues se desconocen los valo-
res de los parámetros de la normal; entonces, se estiman los parámetros siguientes:
x– 55.8 y s 5 18.6.
Capítulo 6 Prueba de hipótesis | 299
Con los datos obtenidos para los valores esperados y los valores observados, se puede
elaborar un histograma. Con Excel se hicieron los siguientes histogramas: El histogra-
ma de los valores observados tiene cierta asimetría y no se tiene la forma de campana
perfecta; sin embargo, en el centro se tiene la mayor concentración de los datos. El he-
cho de que los valores observados no tenga un histograma totalmente apegado a los va-
lores esperados se debe a que es un proceso aleatorio y se tienen variaciones aleatorias,
la prueba de hipótesis indicará si estas variaciones son extremadamente inusuales.
Los histogramas de los valores observados y esperados son los siguientes.
Valores esperados
Valores esperados Valores observados
Valores observados
18.0000 18.0000 18 18
16.0000 16.0000 16 16
14.0000 14.0000 14 14
12.0000 12.0000 12 12
10.0000 10.0000 10 10
8.0000 8.0000 8 8
6.0000 6.0000 6 6
4.0000 4.0000 4 4
2.0000 2.0000 2 2
0.0000 0.0000 0 0
.58.8
3575 .58.8
5955 5.58.8
8.8
.8
8
35 5. .8.8
555.9 5.8.8
5. .8
.9 .8
5.
.8
5.5
<5
5.
.8
.9.9 .8
55
9 4 85
- 6 05
15 < 5
5.
-2
<- 54
- 2- 6
- 4- 8
- 610
5
05
5.
-2
-4
- 2- 6
05
-8
.9 - 1
-8
.9 9 -
-1
.9
.9
.59.9
.9.9
..99 -
-1
.9
.9
15
35
.9
35
.9
155
75
.9
7
75
95
95
La diferencia que hay antre ambas gráficas puede deberse al azar, o puede deber-
se a que los datos muestrales provienen de una distribución distinta a la normal.
Ahora, se calculará el valor de la estadística de prueba para determinar si las
evidencias estadísticas de la muestra dicen que se debe rechazar la hipótesis y que la
función generadora de los datos es una distribución normal.
(Oi 2 Ei )2
El estadístico de prueba χc 5 ∑ i51
2 k
5 3.73643705.
Ei
Este valor se debe comparar con el valor de tablas de ji-cuadrada con k – 1 5 11
grados de libertad. Vamos a utilizar un nivel de significancia de a 5 0.10. El valor de
tablas de la ji-cuadrada es χ2 5 17.275.
Para concluir, se encuentra que el valor calculado 3.73643705 es menor que el
valor de tablas, 17.275, por lo que se tiene que la estadística de prueba está en la región
de aceptación y se concluye que no hay suficiente evidencia estadística para rechazar
la hipótesis de normalidad asumida como hipótesis nula.
Ejemplo 6.36. Las tablas de números aleatorios se elaboran con algún algoritmo computacional
generalmente relacionado con números primos grandes; es decir, en realidad no son
aleatorios, pero se aproximan bastante a un proceso aleatorio. Para probar que el
procedimiento generador es aceptable, se toma una serie de 100 números generados
por el algoritmo y se pide verificar si son congruentes con el supuesto de que los da-
tos están uniformemente distribuidos en el intervalo [0, 1]. Los datos clasificados en
rangos se presentan en la tabla siguiente. Haga la prueba ji-cuadrada con un nivel de
confianza de 1%.
Capítulo 6 Prueba de hipótesis | 301
Tabla 6.26.
Intervalos
0-0.1 0.1-0.2 0.2-0.3 0.3-0.4 0.4-0.5 0.5-0.6 0.6-0.7 0.7-0.8 0.8-0.9 0.9-1
de clase
Frecuencia 14 15 9 8 4 11 10 10 7 12
Solución:
Las hipótesis de prueba son:
H0: X ~ U(0, 1) contra H1: X ~ f (x, θ) ≠ U(0, 1)
Si se supone que la distribución generadora de los datos es uniforme en el intervalo
(0, 1), la probabilidad de que una observación esté en cualquiera de los intervalos de
clase es igual a pi 5 0.10, y los valores esperados en cada intervalo de clase es Ei 5
100 pi 5 10. Entonces, se obtiene la tabla siguiente:
Tabla 6.27.
Clase 1 2 3 4 5 6 7 8 9 10
Oi 14 15 9 8 4 11 10 10 7 12
pi 0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.10
Ei 10 10 10 10 10 10 10 10 10 10
(Oi 2 Ei )2
El cálculo de la estadística de prueba es χc 5 ∑ i51
2 k
5 9.6 y el valor de tablas
Ei
de la ji-cuadrada con 9 grados de libertad y α 5 0.01 es χ2 5 21.666.
En conclusión, se encuentra que el valor calculado 9.6 es menor que el valor
de tablas 21.666, por lo que se tiene que la estadística de prueba está en la región de
aceptación de H0 y no hay suficiente evidencia estadística para rechazar la hipótesis
de uniformidad asumida como hipótesis nula.
Valores observados
Valores observados Valores esperados
Valores esperados
20 20 12 12
10 10
15 15 8 8
10 10 6 6
4 4
5 5 2 2
0 0 0 0
1 2 3 4
1 5
2 6
3 7
4 8
5 9
6 10
7 8 1
9 10 2 3 41 5
2 6
3 7
4 8
5 9
6 10
7 8 9 10
Tabla 6.28.
Número de plagas 0 1 2 3 4 5 6 7 8 9
Frecuencia 12 35 45 43 32 19 9 3 1 1
Solución:
Las hipótesis planteadas son:
H0: X ~ P(λ 5 3) contra H1: X ~ f (x, θ) ≠ P(λ 5 3)
La tabla siguiente presenta los cálculos requeridos para realizar la prueba de bondad
de ajuste. Para el cálculo de f (x,λ) que es una distribución de Poisson se usó la si-
guiente relación:
x
λ i 2λ
pi 5 e
xi !
Tabla 6.29.
(Oi 2 Ei )2
El cálculo de la estadística de prueba es χc2 5 ∑ i51
k
5 2.3496 y el valor de
Ei
tablas de la ji-cuadrada con 8 grados de libertad y α 5 0.05 es χ2 5 15.507.
Así pues, el valor calculado es igual a 2.3496 y es menor que el valor de tablas,
15.507, por lo que se tiene que la estadística de prueba está en la región de aceptación
de H0 y se concluye que no hay suficiente evidencia estadística para rechazar la hipó-
tesis nula.
Capítulo 6 Prueba de hipótesis | 303
Ejemplo 6.38. Refiérase al ejemplo 6.28. Pruebe que las calificaciones obtenidas por los 80 emplea-
dos siguen una distribución normal; ahora use la prueba de Kolmogorov- Smirnov
con un nivel de significancia de 0.10.
304 | Estadística para ingeniería y ciencias
Solución:
Las hipótesis de prueba son:
H0: X ~ N(µ, σ2) contra H1: X ~ f (x, θ) ≠ N(µ, σ2)
y de la tabla 6.24 presentada en el ejemplo 6.28 se genera una nueva tabla con los
datos para |F0(x) 2 Sn(x)|.
Tabla 6.30.
Prob. acum.
Clase pi Oi F. acum. Sn = F. Ac./n |F0(x)2Sn(x)|
F0(x)
, 5.8 0.0036 0.0036 0 0 0.0000 0.0036
5.9 – 15.8 0.0122 0.0158 1 1 0.0125 0.0033
15.9 – 25.8 0.0376 0.0534 3 4 0.0500 0.0034
25.9 – 35.8 0.0877 0.1411 7 11 0.1375 0.0036
35.9 – 45.8 0.1543 0.2954 14 25 0.3125 0.0171
45.9 – 55.8 0.2046 0.5000 14 39 0.4875 0.0125
55.9 – 65.8 0.2046 0.7046 17 56 0.7000 0.0046
65.9 – 75.8 0.1543 0.8589 11 67 0.8375 0.0214
75.9 – 85.8 0.0877 0.9466 8 75 0.9375 0.0091
85.9 – 95.8 0.0376 0.9842 5 80 1.0000 0.0158
95.9 – 105.8 0.0122 0.9964 0 80 1.0000 0.0036
105.9 , 0.0036 1.0000 0 80 1.0000 0.0000
Sea (X1, X2, . . . , Xn) la muestra aleatoria. Los pasos a seguir para esta prueba son los siguientes:
a) Se ordenan los valores de la muestra de menor a mayor.
Sea X(1), X(2), . . . , X(n) la muestra ordenada.
b) Se denomina “rango de Xi” a la posición en que queda el valor Xi al ordenar la muestra de menor a
mayor. Si consideramos los valores ya ordenados, el rango de X(i ) será simplemente i, ya que (i ) de-
nota la i-ésima posición al ordenar la muestra.
i 23 / 8
c) El término pi 5 , para i 5 1, 2, 3, 4, . . . , n; corresponde, aproximadamente, a la probabilidad
n 11 / 4
empírica del valor X(i).
Se define como “Calificación normal” al valor de Z en la distribución normal que tiene una probabilidad
acumulada de pi, es decir, Zi 5 φ21(pi ). Si al graficar los pares (Zi, X(i )) se tiene una figura aproximadamente
lineal, entonces se concluye que los datos provienen de una población normal.
La gráfica (Zi, X(i )) recibe el nombre de gráfica cuantil normal.
Ejemplo 6.39. Verifique que los siguientes datos fueron generados de una distribución normal.
Tabla 6.31.
Cálculos para el gráfico de probabilidad normal
Rango o Calificación Rango o Calificación
Valor orde- Valor orde-
posición Pi normal posición Pi normal
nado X(i ) nado X(i )
i Zi i Zi
1 86.8 0.021 –2.04 16 99.6 0.517 0.04
2 89.6 0.054 –1.61 17 100.0 0.550 0.12
3 89.9 0.087 –1.36 18 100.3 0.583 0.21
4 91.6 0.120 –1.18 19 100.7 0.616 0.29
5 93.7 0.153 –1.02 20 101.5 0.649 0.38
6 95.3 0.186 –0.89 21 101.6 0.682 0.47
7 95.8 0.219 –0.78 22 102.1 0.715 0.57
8 96.0 0.252 –0.67 23 102.2 0.748 0.67
9 96.2 0.285 –0.57 24 102.5 0.781 0.78
10 96.4 0.318 –0.47 25 102.8 0.814 0.89
11 96.4 0.351 –0.38 26 103.0 0.847 1.02
12 97.1 0.384 –0.29 27 103.7 0.880 1.18
13 97.2 0.417 –0.21 28 103.8 0.913 1.36
14 98.9 0.483 –0.12 29 104.1 0.946 1.61
15 98.9 0.483 –0.04 30 107.2 0.979 2.04
306 | Estadística para ingeniería y ciencias
120
Valores
110
100
90
80
2.5 1.5 0.5 0.5 1.5
Calificación normal
Figura 6.10.
Solución:
Primero, deben ordenarse los datos.
0.066, 0.075, 0.080, 0.119, 0.178, 0.228, 0.262, 0.348, 0.573, 0.620,
0.635, 0.695, 0.709, 0.719, 0.829, 0.908, 0.916, 0.945, 0.964, 0.973
i 2 3 / 8 i 2 0.375
Luego con esta fórmula: pi 5 5 , se encuentran las probabilidades
n 11 / 4 20 2 0.25
esperadas y se halla el valor de z, con la normal inversa. Los resultados se muestran
en la siguiente tabla.
Tabla 6.32.
Figura 6.11.
En la gráfica se observa una tendencia no lineal, sin embargo la tendencia de los datos
no se aleja de la línea recta, por lo que no se rechaza que los datos sean normales.
6.7 U
so de Minitab y Excel para las pruebas de hipótesis
de la media de la normal
6.7.1 Prueba de hipótesis para μ con Minitab
Las hipótesis que se prueban con estas instrucciones son:
Tabla 6.33.
Región de rechazo, σ Región de rechazo, σ
Formulación de la prueba
conocida desconocida
1. H0: µ 5 µ0 contra Ha: µ . µ0 zc . zα tc . t12α
2. H0: µ 5 µ0 contra Ha: µ , µ0 zc , 2 zα tc , 2 t12α
3. H0: µ 5 µ0 contra Ha: µ ≠ µ0 | zc | . zα/2 | tc | . t12α/2
Con conocida
Para estas pruebas se deben tener calculados los valores del promedio y el valor conocido de s (o que la mues-
tra sea mayor o igual a 30).
Las instrucciones son las siguientes:
1. Vaya a: Stat → Basic Statistics → 1-Sample z.
2. En la ventana de diálogo de 1-Sample z (Test and Confidence Interval) haga clic en Sample in columns.
3. En la ventanilla de Standard deviation escriba el valor de la desviación estándar.
4. En la ventanilla de Test mean ponga el valor de µ0.
5. En la ventanilla de Options escriba el valor del nivel de significancia α deseado.
Ejemplo 6.41. Los siguientes datos corresponden a una muestra aleatoria de una distribución normal:
23, 25, 23, 26, 31, 29, 30, 29, 25, 24, 26, 28, 27, 24, 25, 22, 23, 22, 26, 22, 24, 25, 22, 21,
22, 21, 23, 29, 28, 27.
308 | Estadística para ingeniería y ciencias
a) Hacer una gráfica de probabilidad normal con los datos para verificar la normalidad
de Anderson-Darling.
b) Probar la hipótesis nula de H0: µ 5 27.0 contra H1: µ ≠ 27.0 usando α 5 0.05.
c) Calcular el valor de la probabilidad p.
d) Hacer una prueba de normalidad de Kolmogorov-Smirnov.
Solución:
a) La figura siguiente muestra la gráfica de probabilidad con un valor de prueba de nor-
malidad de Anderson-Darling igual a 0.565, lo que indica que hay buena simetría en
los datos.
Gráfica de probabilidad
normal 295% CI
0.99 0.99 Mean 25.07
StDev 2.84
N 30
0.95 0.95 AD 0.565
0.9 0.9 P-Value >0.250
Probabilidad
0.8 0.8
0.7 0.7
0.6 0.6
0.5 0.5
0.4 0.4
0.3 0.3
0.2 0.2
0.1 0.1
0.05 0.05
0.01 0.01
15 20 25 30 35
Variable aleatoria X
Figura 6.12.
Figura 6.13.
Capítulo 6 Prueba de hipótesis | 309
Figura 6.14.
70
60
50
40
30
20
10
5
1
20.0 22.5 25.0 27.5 30.0 32.5
var. X
Figura 6.15.
Ejemplo 6.42. Se dan las siguientes mediciones de una muestra aleatoria de 15 mediciones de partícu-
–
las atmosféricas menores de 10 micras en unidades de ppm, con un promedio de X 5
33.798 con s 5 0.6303.
a) Probar la hipótesis nula de H0: µ 5 34.5 contra H1: µ ≠ 34.5.
b) Probar la hipótesis nula H0: µ 5 34.5 contra H1: µ , 34.5.
c) Probar la hipótesis nula H0: µ 5 33.2 contra H1: µ . 33.2.
d) Calcular el valor de p en cada uno de sus casos.
Solución:
Siguiendo las instrucciones anteriormente dadas se tiene que:
a) One-Sample T: Partículas atmosféricas
Test of mu 5 34.13 vs. not 5 34.13
Variable N Mean StDev SE Mean t P
Partículas atmos. 15 33.7980 0.6303 0.1627 22.04 0.061
b) One-Sample T: Partículas atmosféricas
Test of mu 5 34.05 vs. , 34.05
N Mean StDev SE Mean t P
15 33.7980 0.6303 0.1627 21.55 0.072
c) One-Sample T: Partículas atmosféricas
Test of mu 5 33.2 vs . 33.2
Variable N Mean StDev SE Mean t P
Partículas atmos. 15 33.7980 0.6303 0.1627 3.67 0.001
Figura 6.16.
Capítulo 6 Prueba de hipótesis | 311
Figura 6.17.
Las figuras 6.15 y 6.16 muestras las entradas a la hoja del Minitab para los incisos a)
y b).
Solución:
Los resultados obtenidos con las instrucciones antes citados son:
Two-Sample T-Test and CI
Las figuras 6.17 y 16.18 muestran las ventanas para las entradas de los datos.
Figura 6.20.
Capítulo 6 Prueba de hipótesis | 313
• La prueba t para la media de dos muestras emparejadas es la diferencia de dos medias cuando los
datos son pareados.
• La prueba t para dos muestras que suponen varianzas iguales es la prueba de diferencia de dos medias
cuando las muestras son independientes y las varianzas son iguales pero desconocidas.
• La prueba t para dos muestras suponiendo varianzas desiguales, es la prueba de diferencia de dos
medias cuando las muestras son independientes y las varianzas son desiguales y desconocidas.
• La prueba z para medias de dos muestras es la prueba de diferencia de dos medias cuando las muestras
son independientes y las varianzas son conocidas.
Ejemplo 6.44. Se tienen dos muestras, una de hombres y otra de mujeres, dadas por:
Edades de hombres: 34, 44, 36, 38, 47, 37, 56, 47, 46, 38.
Edades de mujeres: 29, 35, 33, 28, 31, 34, 27, 29, 32, 36.
Si se suponen varianzas iguales, haga la prueba H0: µ1 – µ2 5 3 contra Ha: µ1 – µ2 . 3
con Excel. Use α 5 0.01.
Se escriben los datos en dos columnas y luego se elige la prueba t para dos muestras
suponiendo varianzas iguales. En la ventana de diálogo se escribe la siguiente infor-
mación:
Figura 6.21.
El rango de las variables 1 y 2 se introduce colocando el cursor sobre las celdas donde
están los datos y arrastrándola se palomea el cuadrito de rótulos porque el rango de
las variables incluye las celdas donde están los rótulos, es decir, las celdas A1 y B1. La
salida se pondrá desde la celda A13. Los resultados son:
314 | Estadística para ingeniería y ciencias
Problemas propuestos
6.1 En un estudio de meteorología, después de analizar una 6.3 La siguiente es una muestra aleatoria de 16 observaciones
muestra de 106 tomas de temperaturas ambientales, un inge- del análisis de contenido de cobre (Cu) en el agua: 62, 43, 60,
niero ambiental sospecha que la media real de la temperatura 49, 72, 56, 45, 46, 37, 56, 41, 43, 36, 45, 56, 49, estos datos
–
es menor que 98.6 oF. Encontrar: dan una media muestral igual a X 5 49.75 y una desviación
a) La hipótesis nula H0. estándar de 10. Suponer que los datos son generados de una
b) La hipótesis alternativa H1. distribución normal y con un nivel de significancia de 0.01
c) Si esta prueba es de dos colas, de cola izquierda o de cola comprobar las hipótesis.
derecha. a) H0: µ 5 40 contra Ha: µ ≠ 40
6.2 El proceso de envasado de café llena bolsas con 200 gramos b) H0: µ 5 49 contra Ha: µ ≠ 49
de peso. En forma periódica se escogen al azar 25 bolsas c) H0: µ 5 52 contra Ha: µ ≠ 52
llenas y se pesa el contenido real de cada una de ellas. Se 6.4 Un proceso de producción envasa el producto en bolsas de 600
considera que el proceso de llenado está fuera de control si la gramos. Para controlar el proceso se toman muestras de 20
media muestral se encuentra por debajo de 197.9 g o por arri- artículos cada cinco horas, se pesan y se acepta que el proceso
ba de 201.9 g. Se supone que la cantidad de café contenido está bajo control si sus pesos promedio se encuentran entre los
en cada bolsa sigue una distribución normal con desviación límites aceptables. Cuando se rechaza el proceso, éste se debe
estándar igual a 5 gramos. Hacer lo siguiente: detener para investigar cuál es la causa del problema y corre-
a) Enunciar las hipótesis nula y alternativa adecuadas para girlo. El proceso se considera fuera de control (se rechaza) si
este proceso de control. el peso medio es o muy pequeño, caso en el cual se estaría
b) Obtener la probabilidad del error de tipo I. engañando al consumidor, o es muy grande, caso en el cual
c) Como una región crítica alternativa, considerar rechaza- perdería la empresa. Si la desviación estándar del proceso es de
da H0 cuando la media muestral está por debajo de 197.7 4 gramos y tiene un nivel de significancia de 0.001:
g o por encima de 202.3 g. Si el tamaño máximo del error a) Enunciar las hipótesis nula y alternativa adecuadas para
de tipo I es de 0.05, ¿cuál de las dos pruebas es la mejor? esta situación.
d) Si la media real de llenado es de 201 gramos, ¿cuál es la b) Establecer los límites adecuados (de control) para decidir
potencia de la prueba? cuándo se debe aceptar o rechazar el proceso.
Capítulo 6 Prueba de hipótesis | 315
c) Si el nivel medio del proceso se aumenta a 603 gramos, negocios. Los datos obtenidos dieron un promedio de 52.9 y
¿cuál es la probabilidad de que se descubra este cambio en 50.1 con desviación estándar de 4.7 y 5.1, respectivamente.
la siguiente muestra que se tome después de ocurrido el Si se supone que los tiempos de limpieza se distribuyen de
cambio? acuerdo con una normal con varianzas iguales, ¿se puede
6.5 Escribir las siguientes conjeturas sobre la media poblacional decir que uno de los dos negocios de autolavado es más efi-
en cada uno de los seis casos como una hipótesis de prueba. ciente que el otro? Usar α 5 0.01 para efectuar la prueba.
En todos los casos, el parámetro es µ. 6.11 Para determinar si en las aguas residuales de una ciudad se
a) La media del coeficiente de los instructores de estadística encuentran disueltos pesticidas clorinados hidrocarbonados
es 185. (estos pesticidas ya no se usan en países industrializados por
b) La media del peso del papel descartado cada semana en un su persistencia tan acentuada), se usan cromatografía de gas
estudio de reciclaje de papel es menor que 10 kilogramos. en dos laboratorios distintos. Los tamaños de las muestras
c) El tiempo medio requerido para que los estudiantes pue- usadas por los laboratorios fueron de 40 y 50 observaciones,
dan adquirir su título es mayor que 5 años. respectivamente. Si los análisis procedentes del primer labo-
d) La media anual de ingresos de los médicos es de $300 000 –
ratorio dan un resultado de X 1 5 74 con desviación están-
dólares. dar de s1 5 8 y los resultados del segundo laboratorio dan
e) La media de la edad de los aviones comerciales es de –
un promedio de X 2 5 78 con una desviación estándar de
cuando menos 10 años. s2 5 7, determinar si hay una diferencia significante entre
f ) La tasa media de consumo de gasolina de los automóvi- los resultados de los dos laboratorios. Suponer niveles de
les Chevrolet es de no más de 17 millas/galón. significancia de α 5 0.05 y α 5 0.01, y que la varianza real
6.6 Una empresa de investigación de mercados reparte un pro- de ambas muestras son iguales.
ducto nuevo a 200 personas y luego de que éstas lo prueban 6.12 Decidir en cada caso si la hipótesis dada es simple o com-
les dicen el precio de venta y les pregunta si comprarían el puesta:
producto, 82 personas dijeron que no; luego, ofrece el mis- a) Una variable aleatoria tiene una distribución Weibull
mo producto a 400 personas distintas y después de probarlo con α 5 3 y β 5 2.
les dice el precio de venta aumentado en 10% y les pregunta b) Una variable aleatoria tiene una distribución Weibull
si lo comprarían y 116 dijeron que no. ¿Estos datos dan evi- con α 5 3 y β . 2.
dencia de que la modificación del precio del producto cam- c) Una variable aleatoria tiene una densidad exponencial.
bia la proporción de personas dispuestas a comprarlo? d) Una variable aleatoria tiene una distribución Bernoulli
6.7 El presidente de cierta compañía fabricante de partes de au- con P 5 0.35.
tomóvil afirma que el número promedio de partes vendidas e) Una variable aleatoria tiene una distribución de Poisson
diariamente es de 1 500. El director general de toda la cade- con λ 5 3.25.
na de establecimientos quiere comprobar esta afirmación. f) Una variable aleatoria tiene una distribución de Poisson
Para ello, se toma una muestra aleatoria consistente en 36 con λ . 2.65.
días, la cual mostró un promedio de 1 450 partes vendidas g) Una variable aleatoria tiene una distribución normal con
por día. Suponer que σ 5 120 partes. ¿Estos datos dan evi- desviación estándar s 5 10.
dencia de que el fabricante está equivocado? Usar α 5 0.05. i) Una variable aleatoria tiene una distribución binomial
6.8 El administrador de una empresa de investigación de merca- negativa con k 5 4 y p , 0.60.
dos desea determinar si los jugadores de ajedrez prefieren sus 6.13 Para la prueba H0: µ ≥ 32 contra Ha: µ , 32, se dan los
–
piezas en madera o en plástico. De un total de 250 jugadores siguientes valores de la muestra aleatoria: n 5 50, X 5 31.8
entrevistados, 145 expresaron su preferencia por las piezas de y σ 5 0.75. Encontrar la estadística de prueba si α 5 0.05 y
madera y los restantes, 105 jugadores, por las piezas de plásti- calcular el valor de la probabilidad p correspondiente.
co. Estos datos una evidencia fuerte de que hay una diferencia 6.14 Un recipiente contiene 10 canicas de las cuales m son rojas
entre las preferencias por estos dos tipos de materiales? Use y las otras son azules. Para demostrar la hipótesis nula m 5
un nivel de significancia de 0.025. 2 contra la alternativa m 5 4, se sacan del recipiente al azar
6.9 En un estudio de oceanografía (el estudio físico, químico y dos de las canicas sin reemplazo y se rechaza la hipótesis
biológico de las aguas de los océanos), un oceanógrafo re- nula si y sólo si ambas son rojas. Determinar las probabili-
quiere que la profundidad promedio del océano sea de 62.3 dades de cometer errores de tipo I y II con este criterio.
brazas para poder llevar a cabo sus estudios de ciertos aná- 6.15 Para una muestra al azar de 36 casos de análisis de aguas
lisis biológicos. Para determinar si la zona que ha elegido que contienen cloratos (mg/L de ClO322), se usa el méto-
–
satisface esta condición, tomó una muestra de sondeos de do argento métrico de titulaciones. Los resultados dan X 5
profundidad en 40 localizaciones marinas y encontró que el 138.84 y una desviación estándar igual a 10.0.
promedio de la muestra estadística es de 64.8 brazas con una a) Probar la hipótesis de que el promedio poblacional es
desviación estándar de 5.1. ¿Son estos datos suficiente evi- igual a 145.0 mg/L, contra la hipótesis de que este pro-
dencia para rechazar la zona seleccionada a fin de hacer los medio es diferente con niveles de significancia de α 5
estudios biológicos? Usar niveles de significancia de 0.05 y 0.05 y α 5 0.01.
0.01 para hacer la prueba. b) Calcular el valor de la probabilidad p.
6.10 Dos negocios de autolavado tienen métodos diferentes para c) Estimar el intervalo de confianza para el promedio po-
hacer la limpieza integral de un automóvil. Se desea compa- blacional.
rar los dos métodos de lavado y para ello se toma el tiempo 6.16 Con referencia a las siguientes pruebas de hipótesis: H0: p 5
en que se terminaron de limpiar 100 autos en cada uno de los 0.95, H1: p 5 0.6, n 5 20 donde p es la probabilidad de éxito
316 | Estadística para ingeniería y ciencias
en los ensayos de Bernoulli, ¿cuáles son las probabilidades la media muestral es de 76.4 mg/L con una desviación es-
de cometer los errores tipo I y II si la región de aceptación es tándar de 3.6. Empleando un nivel de significancia de 0.05,
X $ 16 y la región de rechazo correspondiente es X , 16. probar la hipótesis cuyo promedio poblacional es mayor que
6.17 Sean X1 y X2 una muestra aleatoria de tamaño 2 tomada de 75 mg/L y calcular el valor de p.
una población normal con σ2 5 1. Sea la prueba H0: µ 5 µ0 6.26 Para la prueba de hipótesis H0: λ 5 4 contra H1: λ 5 9
contra Ha: µ 5 µ1, donde µ1 . µ0. Si se rechaza H0 cuando de una población exponencial utilizar el lema de Neyman y
–
X . µ0 1 1, ¿cuál es el nivel de significancia? Pearson para obtener la región crítica de mayor potencia de
6.18 Se utiliza una sola observación de una variable aleatoria con tamaño α 5 0.10.
una distribución exponencial para probar la hipótesis nula 6.27 Con referencia a los datos de precipitaciones de la tabla 5.10
de que la media de la distribución es 1/λ 5 2 contra la alter- de Comisión Nacional del Agua (CONAGUA) del capítulo
nativa de que es 1/λ 5 5. Si se acepta la hipótesis nula si y 5 de distribuciones continuas, ejercicio 5.21 relacionado con
sólo si el valor observado de la variable aleatoria es menor o la estadística histórica de los promedios anuales de precipita-
mayor que 0.3, determinar las probabilidades de cometer los ciones pluviales correspondientes al periodo de 1957 a 2006
errores de tipo I y II. de Ciudad Juárez, Chihuahua, México, hacer lo siguiente:
6.19 En un estudio de química acerca del agua, el promedio de a) Un resumen de la estadística descriptiva.
una muestra aleatoria de 100 análisis de sulfatos (SO422) es de b) Probar la hipótesis nula de H0: µ $ 28.0 cm contra la
1 570 mg/L, con una desviación estándar de 120 mg/L. Si µ es hipótesis alternativa de H1: µ , 28.0 cm a un nivel de
el promedio de todos los casos de sulfatos, probar la hipótesis significancia de 0.01.
nula de H0: µ 5 1 600 mg/L contra la hipótesis alternativa de c) Hacer una gráfica de probabilidad en función de los 50
H1: µ ≠ 1 600 mg/L usando los niveles de significación de 0.05 valores anuales y por medio de extrapolación calcular el
y 0.01. Calcular el valor de la probabilidad p. promedio y la desviación estándar y compararlos con los
6.20 Sea λ el parámetro de la Poisson; encontrar la mejor región calculados.
crítica para la prueba: 6.28 Utilizar el lema de Neyman y Pearson para obtener la mejor
H0: λ 5 10 contra H1: λ 5 20 región crítica para una distribución binomial en la prueba
H0: p 5 0.4 contra H1: p 5 0.8.
6.21 Un fabricante de fusibles afirma que con una sobrecarga de
6.29 Una empresa de camiones de carga sospecha que el ciclo
25% los fusibles se fundirán en 14 minutos en promedio. Para
de vida de ciertos neumáticos que usa es menor que 28 000
probar esta afirmación se tomó una muestra aleatoria de 20
millas (µ # 28 000), lo cual va en contra de lo que afirma su
fusibles y se sometió a una carga de 25% y los tiempos que
distribuidor. Para verificar su sospecha la empresa instala 40
tardaron en fundirse tuvieron un promedio de 10.63 minutos,
de esas llantas en sus camiones y obtiene al final un ciclo de
con una desviación estándar de 2.48 minutos. Suponiendo
vida promedio de 27 463 con σ 5 1 348 millas. ¿Estos datos
que la población muestreada es normal, hacer una prueba de
confirman la sospecha de la empresa?
hipótesis para refrendar o rechazar la afirmación del fabri-
6.30 Utilizar la aproximación normal para obtener la región crí-
cante de fusibles. Usar un nivel de significancia de α 5 0.05.
tica de tamaño α 5 0.01 para la prueba H0: p 5 0.40 contra
También, calcular el valor de p. H1: p 5 0.30, cuando se tiene una muestra de variables alea-
6.22 Suponer que X1 y X2 constituyen una muestra aleatoria de torias Bernoulli de tamaño n 5 100. Determinar la probabi-
tamaño 2 tomada de la población dada por: lidad de cometer un error de tipo II.
θ21 para 6.31 Una muestra aleatoria de 100 muertes en Estados Unidos
f ( x; θ) 5 de América. reportó un promedio de vida de 71.8 años con
0 en otro caso
una desviación estándar de 8.9 años. ¿Puede esto indicar
Encontrar la mejor región crítica para la prueba H0: θ 5 1 que la vida promedio de hoy en día es mayor que 70 años?
contra Ha: θ 5 2 con un nivel de significancia de a 5 0.06. Usar α 5 0.05.
Calcular la potencia para esta región crítica. 6.32 Se utilizará una sola observación de una variable aleatoria
6.23 Se utilizará una muestra aleatoria de tamaño 100 para pro- que tiene una distribución uniforme (0, θ) para verificar la
bar la hipótesis de que la media de una población normal es prueba H0: θ 5 θ0 contra H1: θ 5 θ1, con θ0 , θ1. Aplicar
menor que 30. Se sabe que la varianza σ2 5 169. Si se recha- el lema de Neyman y Pearson para obtener la mejor región
za la hipótesis nula si y sólo si la media de aleatoria excede crítica de tamaño α.
de 33, determinar la probabilidad de cometer el error tipo I. 6.33 Un fabricante de cables de acero afirma que su producto tie-
6.24 Suponer que X1 y X2 constituyen una muestra aleatoria de ne una resistencia de ruptura de 8.0 kg. Probar la hipótesis
tamaño 2 tomada de la población dada por: nula de que H0: µ 5 8.0 kg, contra la prueba alternativa de
que H1: µ ≠ 8.0 kg. Para ello, se sacó una muestra aleatoria
θ21 para de 50 cables y se encuentra que tiene una resistencia prome-
f ( x; θ) 5 –
0 en otro caso dio de X 5 7.8 kg, con una desviación estándar de 0.5 kg.
En esta prueba se usó un nivel de significancia de α 5 0.05
Encontrar la mejor región crítica para la prueba H0: θ 5 1
y α 5 0.01.
contra Ha: θ 5 2 con un nivel de significancia de a 5 0.05.
Calcular la potencia para esta región crítica. 6.34 Dada una muestra aleatoria de tamaño n tomada de una
6.25 En un estudio relacionado con el análisis de aguas industria- población normal con µ 5 µ0, aplicar el lema de Neyman y
les relativas a su contenido de calcio (mg/L) usando el méto- Pearson para construir la mejor región crítica de tamaño α,
do gravimétrico se obtiene una población de 48 muestras de con el fin de probar la H0: σ 5 σ0 contra H1: σ 5 σ1, tal que
agua y se analiza su contenido de calcio y se encuentra que σ1 . σ0.
Capítulo 6 Prueba de hipótesis | 317
6.35 En un estudio de la aplicación del pH (potencial hidrógeno de metales. Hay algunos métodos para determinar las con-
que tiene una escala de 0 a 14, donde 7 es neutral y abajo de centraciones de Pb en el agua. Uno de ellos es el método de
7 es ácido y arriba de 7 es alcalino), para medir la alcalinidad absorción atómica espectrométrico (método A) y otro es el
y la acidez de soluciones, un ingeniero, dedicado al estudio método calorimétrico (método B). En una investigación se
de la contaminación del agua, asegura que dos muestras de pretende comparar los resultados de los métodos de absor-
soluciones (A y B) provienen del mismo lugar de un río, ción atómica y el de ditizone. El método de absorción ató-
donde supuestamente hubo una descarga industrial de ácido mica espectrométrica consiste en aspirar la muestra prepa-
clorhídrico (HCl). Si esto fuera cierto el pH y las medias rea- rada en una flama y atomizarla. El método ditizone consiste
les relativas a las dos muestras de soluciones serían iguales. en extraer en tetracloruro de carbono (CCl4) el Pb en una
Los datos recolectados se encuentran en la tabla siguiente. solución ligeramente básica. Los datos que se citan a con-
Suponer que las observaciones provienen de poblacionales tinuación dan las concentraciones (en mg/L) de las lecturas
normales. obtenidas por los métodos A y B. Usando un nivel de signi-
a) Probar la hipótesis nula de igualdad de las medias de pH ficación de 0.05 y suponiendo que las poblaciones muestrea-
contra las que son diferentes, usar α 5 0.05. das son normales:
b) Construir un intervalo de 95% de confianza para la dife- a) Probar que no hay diferencia entre las medias de los dos
rencia de las medias e interpretarlo acordemente. métodos de análisis utilizados.
c) ¿Desaprueben los datos la afirmación del ingeniero? b) Calcular el valor de p.
c) Hacer un intervalo de confianza de 95%.
Tabla 6.35. Datos de las mediciones del pH.
Método A
Mediciones de pH de Mediciones de pH de
solución A solución B 0.055, 0.051, 0.052, 0.053, 0.055, 0.053, 0.055, 0.049,
6.24 6.27 0.048, 0.049, 0.05, 0.053, 0.052, 0.054, 0.056, 0.054,
6.31 6.25 0.057, 0.049, 0.048, 0.05, 0.057, 0.059, 0.040, 0.042,
6.28 6.33 0.043, 0.046, 0.055, 0.03, 0.07, 0.075, 0.08, 0.086,
6.30 6.27 0.056, 0.078, 0.076, 0.077
6.25 6.24
6.26 6.31 Método B
6.24 6.28 0.057, 0.06, 0.07, 0.057, 0.059, 0.059, 0.049, 0.06,
6.29 6.29 0.07, 0.075, 0.06, 0.067, 0.068, 0.064, 0.069, 0.078,
6.22 6.34
0.07, 0.079, 0.074, 0.05, 0.06, 0.07, 0.08, 0.081,
6.28 6.27
0.072, 0.082, 0.079, 0.087, 0.04, 0.04, 0.04, 0.043,
6.36 El gerente de un restaurante sabe que 60% de sus clientes pre- 0.044, 0.046, 0.081, 0.083
fieren la zona de fumar, sin embargo, a últimas fechas cree 6.40 Un laboratorio clínico realizó ocho análisis para identificar a
que este porcentaje ha aumentado. Establecer las hipótesis de los portadores de cierta bacteria; m es el número de pacien-
prueba y decir en qué condiciones cometerían un error de tipo tes que dio positivo en la prueba. Con el fin de demostrar la
I y en qué condiciones uno de tipo II, si p 5 0.70. hipótesis nula m 5 2 contra la alternativa m . 2, se extraen
6.37 Una compañía está en el proceso de decidirse si producirá al azar dos de los resultados de los análisis y se rechaza la
un nuevo componente electrónico. En la planta hay dos má- hipótesis nula si y sólo si ambos resultados son positivos.
quinas que pueden ser adaptadas para hacer este componen- a) Determinar las probabilidades que existen de cometer
te. Para ello, se hace una prueba en la máquina 1 y se mide el errores de tipo I cuando m 5 0, 1 y 2.
tiempo de producción por componente y da un promedio de b) Obtener las probabilidades de cometer errores de tipo II
–
X 1 5 5.23 minutos para una muestra de 100 componentes. cuando m 5 4, 5, 6 y 7. Además, trazar la gráfica de la
–
En la máquina 2 el promedio de tiempo fue de X 2 5 5.37 función de potencia.
minutos para una muestra de 64 componentes. En pasadas 6.41 Ejercicio adaptado del libro Probabilidad y estadística para in-
experiencias, se sabe que las desviaciones estándar fueron de geniería y ciencias de Jay L. Devore (2001). Para probar si la
0.15 y 0.10 minutos, respectivamente. media real de la resistencia del acero laminado en frío es di-
a) Probar la hipótesis nula de que no hay diferencias entre ferente que la media de la resistencia del acero galvanizado
las medias de las dos poblaciones de componentes mues- de los dos lados, se tomaron dos muestras, una de cada tipo
treadas. de acero y se obtuvieron los siguientes datos: n1 5 20 especí-
–
b) Hacer un intervalo de confianza para la diferencia de las menes de acero laminado en frío, con X 1 5 29.8 ksi; n2 5 25
–
medias. especímenes de acero galvanizado de dos lados, X 2 5 34.7
c) Calcular el valor de p. ksi. Si se supone que las dos distribuciones de resistencia de
6.38 Un buscador de talentos entrevista a un ejecutivo para pro- los aceros son normales con σ1 5 4.0 y σ2 5 5.0 ksi (sugeri-
bar la hipótesis nula de que podrá ocupar un puesto de ma- das por una gráfica en el artículo “Zinc-Coated Sheet Steel: An
yor nivel. De qué manera él cometería un error de tipo I y en Overview”, Automotive Engr., diciembre de 1984, pp. 39-43).
qué condiciones uno de tipo II. ¿Significan estos datos que las verdaderas resistencias pro-
6.39 A pesar de que el plomo (Pb) es un elemento muy peligroso, medio µ1 y µ2 son diferentes?
los seres vivos se adaptan crónicamente a las acumulaciones 6.42 Supóngase que en el caso de una distribución binomial con
de este metal pesado. La presencia de Pb en el agua potable n 5 20 se tiene la prueba H0: p 5 0.10 contra H1: p . 0.10;
puede venir de descargas industriales, minas y fundiciones se acepta la hipótesis nula si X # 4 y se rechaza si X . 4.
318 | Estadística para ingeniería y ciencias
–
Construir la función potencia evaluada en distintos valores 6.50 Con los siguientes datos: X 5 31.8, σ 5 0.25, n 5 50 para
de p de esta región de rechazo y graficar. H0: µ ≥ 32.
6.43 Dos astrónomos registraron observaciones de cierta estrella a) Formular la hipótesis alternativa.
en el firmamento. El primer astrónomo obtuvo 12 observa- b) Establecer las regiones críticas cuando α 5 0.05 y α 5
ciones y dio un promedio de 1.20 mediciones. El segundo as- 0.01
trónomo obtuvo una muestra de 8 observaciones y obtuvo un c) Calcular la estadística zc.
promedio de 1.15 mediciones. La experiencia pasada indicó 6.51 Para construir las carreteras estatales se requiere un concre-
que estos astrónomos obtuvieron mediciones con varianzas to con bajo valor de conductividad térmica para reducir al
iguales a 0.40 mediciones. Suponer que la población mues- mínimo los daños ocasionados por cambios de temperatura
treada es normal. Usar el nivel de significación de 0.05 para y, así, evitar accidentes automovilísticos en las carreteras.
probar las hipótesis: H0: µ1 2 µ2 5 0 contra Ha: µ1 2 µ2 ≠ 0. Supóngase que hay dos tipos de concreto, uno es un agre-
6.44 Se usará una sola observación para probar la hipótesis nula gado escalonado y el otro no tiene agregados finos. La tabla
de que el parámetro de una distribución exponencial es igual siguiente resume los datos de un experimento realizado para
a 15 contra la hipótesis alternativa de que no es igual a 15. comparar los dos tipos de concreto. ¿Sugiere esta informa-
La hipótesis nula se rechazará si y sólo si el valor observado ción que el verdadero promedio de conductividad del con-
es menor que 13 o mayor que 17, determinar: creto, con agregado escalonado, supera al del concreto sin
a) La probabilidad de cometer un error tipo I. agregado fino? (Adaptado del libro Probabilidad y estadística
b) Las probabilidades de cometer errores tipo II cuando λ para ingeniería y ciencias de J. L.Devore, 2000.)
5 2, 4, 8, 16 y 20.
Tabla 6.36.
c) Trazar la gráfica de la función de potencia.
6.45 Decir qué tipo de prueba se tiene (bilateral o unilateral). Tipo de Tamaño de Promedio Desviación
a) H0: µ 5 14.00 contra Ha: µ . 14.00. concreto muestra muestral estándar muestral
b) H0: µ 5 14.00 contra Ha: µ ≠ 14.00. Con agregados 42 0.486 0.187
c) H0: µ 5 14.00 contra Ha: µ , 14.00.
Sin agregados 42 0.359 0.158
6.46 Dada una muestra Poisson de tamaño 10:
a) Encontrar la región crítica uniformemente más potente Fuente: Adaptación del libro Probabilidad y estadística para ingeniería y ciencias, quinta
edición de Jay. L.Devore (2000). Thomson-Learning.
de tamaño α 5 0.01 para la prueba H0: λ 5 3 contra H1:
λ # 3. 6.52 El gerente de una cadena de hoteles está considerando cons-
b) Hallar las probabilidades de cometer errores de tipo II truir un motel a lo largo de una autopista. El dueño que
cuando la media de la población es 2.0, 1.5, 1.0 y 0.5. vende el terreno al gerente para la construcción del motel,
c) Trazar la gráfica de la función potencia. asegura qué por ahí pasan 1 100 vehículos por día. Sin em-
6.47 Se usó una muestra de 49 mediciones de ruidos (en deci- bargo, el gerente de la cadena de hoteles dice que una cifra
beles, dB) para probar las hipótesis H0: µ 5 145 contra Ha: mayor que 1 100 vehículos sería adecuada para la construc-
– ción del motel en ese sitio. Para esto se cuentan los autos que
µ ≠ 145. Si la media muestral es X 5 138.00 dB con una
desviación estándar de 20. pasan por el lugar durante 18 días; los datos observados son:
a) Establecer la región crítica con un nivel de significancia 1 150; 1 225; 1 195; 1 195; 1 210; 1 100; 1 150; 1 195; 1 105;
α 5 0.05. 1 205; 1 121; 1 190; 1 195; 1 192; 1 100; 1 20; 1 09; 1 095. ¿Los
b) Calcular la estadística de prueba y decir si de acuerdo resultados reafirman o desaprueban la afirmación del dueño
con su valor, se rechaza o se acepta la hipótesis nula. del terreno? Usar α 5 0.05.
6.48 Una persona dice que tiene la capacidad de determinar la 6.53 Una muestra al azar de 49 análisis de aguas residuales dio un
–
marca de café con sólo probarlo; si se le dan a probar 10 promedio igual a X 5 800 mg/L y una desviación estándar de
tazas de café de dos marcas diferentes y acierta en 8 casos, s 5 60.0 mg/L. Con estos datos efectuar la prueba de hipótesis
¿estos datos son evidencia suficiente para aceptar que esta H0: µ 5 850 contra Ha: µ . 850; usar α 5 0.05. Calcular el
persona tiene la habilidad que dice? Formular las hipótesis y valor de p.
concluir con α 5 0.05. 6.54 Se sacó una muestra aleatoria de SO3 atmosférico en unida-
6.49 El médico de una empresa de refrigeración afirma que la des de ppm provenientes de un complejo industrial, los datos
temperatura promedio de sus empleados no baja de 98.6 oF, obtenidos son 50, 52, 56, 57, 55, 55, 54, 55, 56, 57, 56, 54.
la cual es frío tolerable para el cuerpo. El departamento de Probar H0: µ 5 52 contra H0: µ 5 52 que es diferente. Se sabe
sanidad quiere probar si esto es cierto; para ello se tomó una que la población muestreada es normal. Usar α 5 0.01.
muestra al azar de 50 trabajadores del frigorífico y se midió 6.55 49 muestras de agua tomadas al azar de cierto río fueron ana-
su temperatura. El promedio de la temperatura de este gru- lizadas para medir las concentraciones de fosfatos (PO234) y
– los datos resultantes dieron una media muestral de 60.0 mg/L
po fue de X 5 98.2 oF con una desviación estándar de σ 5
0.62. Para este problema: de PO234 y una desviación estándar igual a 5.5 mg/L.
a) Identificar la hipótesis nula H0 y la hipótesis alternativa a) Probar la hipótesis nula de H0: µ 5 62.0 mg/L contra Ha:
H a. µ ≠ 62.0 mg/L. Usar α 5 0.05.
b) Establecer las regiones críticas para los niveles de signifi- b) ¿Qué tanta confiabilidad se le puede dar a los resultados
cación de α 5 0.05 y α 5 0.01. considerando el valor de p estimado?
c) Calcular la estadística de prueba. 6.56 Un maestro de estadística y asiduo cliente de un banco dijo
d) Si se rechaza la hipótesis nula, calcular el valor de la al gerente que de acuerdo con sus estimaciones él considera
probabilidad p. que el tiempo requerido para cambiar un cheque tiene una
Capítulo 6 Prueba de hipótesis | 319
Tabla 6.39. Datos. medio. Para probar esta afirmación, se tomó una muestra
aleatoria de 25 bombillas y se sometió a una carga de 25% y
Supervivencia en años
los tiempos que tardaron en fundirse tuvieron un promedio
Sujetos tratados 2.1 5.3 1.4 4.6 2.9 de 12.13 minutos, con una desviación estándar de 2.48 mi-
Sujetos sin tratamiento 1.9 1.5 2.8 3.1 2.0 nutos. Suponiendo que la población muestreada es normal,
hacer una prueba de hipótesis para refrendar o rechazar la
6.63 La tabla siguiente muestra los datos de oxígeno disuelto afirmación del fabricante de fusibles. Usar un nivel de signi-
(OD) obtenidos por varios laboratorios usando el método ficancia de α 5 0.05. También, calcular el valor de p.
de Winkler y el método de electrodos en la misma muestra 6.67 En un estudio de seguridad de caminos, la policía federal cree
de agua. Las concentraciones del oxígeno disuelto (OD), se que los accidentes carreteros se deben a que la velocidad pro-
expresan en mg/L. medio de los automovilistas que manejan sobre cierta zona
Use la prueba de diferencia de medias para datos pareados a carretera exceden el límite de velocidad de 110 kilómetros
fin de determinar si los dos métodos de análisis dan el mismo por hora. Para probar esta aseveración se tomó una muestra
resultado. Usar α 5 0.05. aleatoria de 20 vehículos con sus respectivas velocidades en
(Sugerencia: Utilizar los programas de computadora Minitab kilómetros por hora registrada por el radar. Los resultados de
o Excel.) los 20 vehículos fueron: 113.6, 115.0, 117.0, 118.0, 115.9, 84.0,
Tabla 6.40. 87.0, 90.0, 110.0, 95.0, 98.0, 99.0, 118.0, 120.0, 121.0, 119.0,
Método de Winkler 118.0, 111.0, 112.0, 112.6.
1.2 1.4 1.4 1.3 1.2 1.3 1.4 2.0 1.9 .1 1.8 1.0 1.1 1.4 a) ¿Proveen estos datos suficiente evidencia para apoyar la
aseveración de la policía federal de caminos de que los
Método de electrodos
automovilistas están violando el reglamento del límite de
1.6 1.4 1.9 2.3 1.7 1.3 2.2 1.4 1.3 1.7 1.9 1.8 1.8 .8 velocidad de 110 kilómetros por hora? Usar α 5 0.05.
b) Estimar el intervalo de confianza con α 5 0.05 y con α 5
6.64 Se instaló un nuevo equipo de seguridad para reducir los ac-
0.1 para el promedio poblacional de velocidad.
cidentes industriales en una industria tendiente a disminuir el
6.68 En un esfuerzo por establecer el tiempo estándar para realizar
número de horas-hombre perdidas. Para medir la eficiencia
determinada tarea en el ensamble de partes de carburadores
del equipo de seguridad instalado, se examinó una muestra
para automóviles, el ingeniero de producción de una fábrica
aleatoria en varios departamentos de esta industria. El núme-
selecciona aleatoriamente a 10 trabajadores experimentados
ro de horas-hombre perdido en el mes antes de la instalación
para realizar esta faena y se calcula una desviación estándar
del equipo y el siguiente mes después de instalar el equipo se
de 1.22 minutos. El ingeniero de producción afirma que la
reporta en la siguiente tabla.
desviación estándar poblacional es menor que 2.00 minutos.
Tabla 6.41. ¿Existe suficiente evidencia para apoyar la aseveración del
Horas perdidas ingeniero? Usar α 5 0.05.
por departamento 6.69 Se tomaron las temperaturas de los hornos de ladrillo medidas
en grados Celsius (oC) y en grados Fahrenheit (oF). La hipóte-
Mes 1 2 3 4 5 6
sis nula es que el promedio de la temperatura del horno es de
Antes de instalar el equipo 18 26 43 17 29 30 50 oC. Hacer la misma prueba, pero con el promedio en oF. La
Después de instalar el equipo 15 20 31 17 25 27 tabla siguiente muestra los resultados de las temperaturas de
los hornos en oC. Convertir estas temperaturas a oF para com-
¿Realmente valió la pena la inversión en la instalación del pletar la tabla y comparar los resultados de las dos pruebas
equipo de seguridad? Usar α 5 0.05. de hipótesis. ¿Los resultados de la estadística de prueba son
6.65 Los siguientes datos forman una muestra aleatoria de óxidos iguales para las dos escalas de temperatura? (Sugerencia: Usar
de azufre (SO2) atmosféricos, en ppm, provenientes de una la fórmula de conversión de temperaturas de grados Celsius a
fundición: 56, 58, 58, 59, 57, 57, 56, 57, 58. Suponiendo que Fahrenheit dada como: oF 5 9/5(oC) 1 32). Usar α 5 0.05.
los datos provienen de una población normal de óxidos de
azufre. Temperaturas oC
a) Estimar el intervalo de confianza de 95% e interpretarlo 47 55 68 55 51 50 49 45 53 47 48 51
acordemente. Temperaturas oF
b) Probar la hipótesis nula de que el promedio poblacional es
de 58.5 ppm contra que es diferente. Establecer las regio-
nes de rechazo y aceptación. Usar α 5 0.05.
c) Si la hipótesis nula no se rechaza, explicar por qué podría
haber ocurrido esto. Problemas de tarea
6.66 Un fabricante de bombillas afirma que, con una sobrecarga
de 25%, las bombillas se fundirán en 15 minutos, en pro- Revisa tu CD-ROM para encontrar más problemas:
Capítulo 7
Análisis de varianza
(ANOVA)
6
Promedios máximos de cadmio
0
1 2 3 4 5
Tipos de laboratorios
Gráfica de las mediciones de los promedios del metal pesado cadmio (sustancia muy peligrosa), las cuales
proceden de cinco laboratorios distintos.
Los resultados obtenidos por los diferentes laboratorios presentan cierta variación que se observa en la
gráfica, esta variación puede deberse al azar o a que los laboratorios tienen métodos diferentes de análisis
que dan resultados significativamente diferentes. El análisis de varianza (ANOVA) es una técnica estadística
que permite decidir cuál de estas dos conjeturas es la verdadera disminuyendo la probabilidad de cometer
un error. En este capítulo se estudiará esta técnica estadística.
Introducción
Este capítulo discutirá diseños de ANOVA completamente aleatorizados, métodos de comparaciones múl-
tiples para saber qué poblaciones son iguales y cuáles no, el ANOVA de diseños de bloques completamente
aleatorizados y las clasificaciones cruzadas: análisis de varianza de dos sentidos, análisis de varianza de tres
sentidos (efectos fijos) e interacciones de ANOVA con dos o más factores. Además, este capítulo demostrará,
detalladamente, las aplicaciones de ANOVA usando el programa Minitab.
322 | Estadística para ingeniería y ciencias
7.1.1 P
ropiedades y suposiciones en el análisis de varianza (ANOVA)
1. Para las pruebas del análisis de varianza se usa la distribución de F. Ésta no es simétrica, sino sesgada,
es decir, oblicua hacia la derecha.
2. Los valores de F pueden ser cero o positivos, pero no negativos.
3. La prueba de la hipótesis es siempre unilateral derecha.
4. Hay una distribución de F diferente para cada par de grados de libertad, (g.l.). La figura 7.1 muestra
esta situación. Para denotar los grados de libertad con el numerador se usa la anotación y1 y para los
grados de libertad en el denominador se usa la anotación y2.
5. Las poblaciones tienen distribuciones normales.
6. Las poblaciones tienen la misma varianza o desviación estándar. Si esta condición no puede ser cum-
plida, la prueba de F no es válida. En este caso se debe usar una prueba de hipótesis diferente.
7. Las muestras son aleatorias e independientes.
Nota: Cuando no se pueden cumplir las condiciones de normalidad o de independencia de los datos, uno se
tiene que remitir a la pruebas no paramétricas, que no requieren de estas suposiciones.
8
f
r Z1 4, Z2 25 (grados de libertad)
6
Z1 4, Z2 4 (grados de libertad)
4
Z1 1, Z2 4 (grados de libertad)
1 2 3 4 5 F6
de la prueba es que si las medias son iguales para todos los grupos, la variación dentro de los grupos es igual a
la variación entre grupos. Si hay diferencia en las medias de los grupos, entonces la variación entre grupos es
mayor que la variación dentro de los grupos. Por ejemplo, supóngase que se quiere probar cuatro marcas de
neumáticos, 1, 2, 3 y 4, para determinar si hay diferencias con respecto a la duración. Para esto se puede asignar,
aleatoriamente, una muestra de 8 neumáticos de cada marca y colocarlos a 8 vehículos (dos con el mismo tipo
de llantas), luego se corren los autos en condiciones semejantes de clima, carretera, entre otras y al final se mide
el dasgaste de las llantas. Si el deasgaste sufrido tiene igual media para cada tipo de llanta, entonces la variación
entre el dasgaste de las llantas de un mismo grupo es igual a la variación en el desgaste de las llantas de diferente
grupo. El análisis de varianza (ANOVA) compara estas dos variaciones.
El diseño de bloques completamente aleatorizados, se utiliza cuando las unidades experimentales no son
homogéneas y debido a eso aumenta la probabilidad de cometer los errores tipo I o tipo II. Por ejemplo, en el
caso anterior de las llantas, el interés se ubica en la influencia de la marca de las llantas sobre el desgaste de las
mismas, sin embargo, los operarios de los automóviles de prueba pueden introducir una variación adicional no
controlada, por lo que sería conveniente que todos los choferes manejaran los autos con los cuatro tipos de llan-
tas, y considerar a cada chofer como un bloque.
Una suposición importante del modelo para un diseño de bloques completos aleatorizados es que se supo-
ne que los efectos de tratamiento y bloqueo son aditivos. Por ejemplo, para ilustrar esta situación, si se grafican
los promedios poblacionales versus tratamientos, digamos de bloque 1 y 2 y, si las gráficas son paralelas, se
dice que los efectos de tratamiento y de bloques son aditivos o que no interactúan. Sin embargo, si las líneas
se cruzan entre sí, se dice que hay interacción o no aditividad.
El formato de la tabla de ANOVA de un sentido completamente aleatorizado se da abajo. La tabla 7.1 da una
descripción de todos los componentes de clasificaciones unilaterales o de diseños completamente aleatorizados.
Total SSt an 2 1
Donde:
(7-1)
a n
SSe ∑
SSa representa la variación entre las diferentes ∑ ( yij (variación
muestras yi ) SStexplicada).
SSa 2
i1 j 1
a n a n
SSe ∑
SS∑
t
( y∑
ij ∑ (iyij y. .t .)
y )2 SS 2
SSa
(7-2)
i1 j 1 i1 j 1
a n a n
i1 j 1
a n
SSt representa la suma total de los cuadrados y esSSlo
e
∑ ∑ (que
mismo yij Σ yij
i
)2 2 (Σyij
SSt
/n).a
2SS
i1 j 1
a n
SSt ∑ ∑ ( yij y. . .)2
i1 j 1
324 | Estadística para ingeniería y ciencias
Donde:
yij 5 j-ésima observación del i-ésimo tratamiento
y–i 5 promedio de todas las observaciones para el i-ésimo tratamiento
y–... 5 promedio de todas las an observaciones o promedio de los promedios
a 5 número de tratamientos
n 5 tamaño de la muestra
Tratamiento. El término “tratamiento” no se refiere a un tratamiento propiamente dicho, sino a diferen-
tes muestras de las cuales es el resultado de distintos factores que estamos analizando. Es decir, combina-
ciones de un nivel de cada factor en el experimento.
Error o residual. Para cualquier juego de mediciones de la misma cosa hay un promedio que se identifica
con el “verdadero valor” teórico, es decir, un valor singular, el cual existe, solamente, como un concepto.
El “error” o residual se debe a las variaciones de las observaciones individuales acerca de su propia media.
Este error algunas veces se llama variación inexplicable, porque el error de la suma de los cuadrados mide
la diferencia entre los valores de la muestra que se deben a variación casual, por la que no se encuentra
una causa identificada. En estadística, el error puede ser la variación debido a factores incontrolables o
a un muestreo de error debido a la naturaleza arbitraria de la muestra seleccionada para representar a la
población. El término “error” no es un error en el sentido estricto de la palabra.
Valor de p. Esto se refiere al nivel de probabilidad de la cola derecha usando la distribución F. Cuando el
valor de p es menor que un valor predeterminado de alfa, digamos 0.05, se rechaza la hipótesis de que la
influencia de los términos es cero.
Ejemplo 7.1. Éste es un ejemplo relacionado con el uso de ANOVA unilateral o de diseño comple-
tamente aleatorizado. Para esto se coleccionaron las concentraciones atmosféricas de
óxidos de azufre, SO2, en partes por millón (ppm) provenientes de cinco muestreadores
localizados a diferentes distancias (aleatoriamente asignadas), de una fuente emisora
industrial. Se busca probar la hipótesis nula de que las cinco poblaciones de SO2 son
iguales, es decir, H0: µ1 5 µ2 5 µ3 5 µ4 5 µ5. Calcule el valor de p. Los datos se dan en
la tabla siguiente. Use un paquete de computadora para procesar los datos.
Capítulo 7 Análisis de varianza (ANOVA) | 325
Solución:
Usando un programa de computadora dan los resultados de abajo:
Ejemplo 7.2. Los nitratos (NO23) representan la fase más oxidada en el ciclo del nitrógeno. General-
mente, esto ocurre en muy pequeñas cantidades en las superficies de los almacenamien-
tos de agua, pero puede existir en grandes cantidades en algunas aguas subterráneas. En
cantidades excesivas, los nitratos pueden ocasionar una enfermedad infantil llamada
metemeglobinemia. Por esta razón, el límite establecido para los NO23 es de 45 mg/L
para el agua potable. Para los análisis de los nitratos, existen varios métodos. Por ejem-
plo, un método es el del ácido fenoldisulfónico; otro es el de la reducción de cadmio;
otro es el del ácido cromotrópico y, otro más es el de brucina o alcaloide tóxico. Para
esto, se hizo un estudio estadístico para comparar los resultados de los cuatro métodos
mencionados antes para analizar los nitratos. Los siguientes datos se dan abajo. Para
esto, llamemos tratamiento (1) al método del ácido fenoldisulfónico, tratamiento (2) al
método de la reducción del cadmio, tratamiento (3) al método de ácido cromotrópico,
y tratamiento (4) al método de brucina. La tabla 7.4 da los resultados en mg/L. Suponer
un nivel de significancia de 0.05. Hacer los siguientes cálculos:
a) Enlistar las suposiciones implicadas por el modelo de ANOVA.
b) Hacer una tabla de análisis de varianza y probar que no hay diferencias entre los 4
métodos.
c) Estimar el valor de la probabilidad p y sacar las conclusiones apropiadas.
326 | Estadística para ingeniería y ciencias
Solución:
a) Las suposiciones implicadas por el modelo de análisis de varianza de una sola
clasificación son:
1. Las cuatro poblaciones de los nitratos están normalmente distribuidas.
2. Las varianzas de las cuatro poblaciones de nitratos son iguales.
3. Las 24 observaciones (análisis) son independientes, es decir, que las muestras
fueron seleccionadas aleatoriamente.
b) Usando un programa de computadora da los resultados de abajo.
Tabla 7.5. ANOVA para los resultados del ejemplo de arriba mediante el uso de
un programa de computadora.
Resolviendo por X 5 0.0038 5 p 5 0.0038. Este valor está de acuerdo con el valor de
0.0044 de la tabla 7.5. En conclusión, el valor de p 5 0.0044 apoya contundentemente
la decisión de aceptar Ha.
Por otra parte, un método corto para hacer análisis de varianza de un sentido, es
decir, manualmente, se da usando el formato de la tabla de abajo.
Donde:
T 2 5 cuadrado de los totales
g.l. 5 n 5 grados de libertad
n 5 tamaño de la muestra
G 5 gran total
a 5 número de muestras
Ejemplo 7.3. La tabla siguiente muestra los datos de los análisis de demanda química de oxígeno
(DQO) hechos por tres laboratorios diferentes. Se tomaron 3 muestras de 5 observacio-
nes cada una. Suponer que las tres muestras vienen de poblaciones normales aleatorias
y que tienen la misma varianza. Suponer un nivel de significancia de α 5 0.05. Hacer
el problema manualmente aplicando el método corto mostrado en la tabla 7.6. Desa-
rrollar los siguientes enunciados:
c) Probar la hipótesis nula de H0: µ1 5 µ2 5 µ3, o sea que σµ2 5 0, es decir, que los pro-
medios de las tres poblaciones de DQO son iguales. Además, establecer la hipótesis
alternativa apropiada.
Solución:
Usando las estadísticas de la tabla 7.8, los cálculos son:
G 5 ΣT 5 ΣX 5 T1 1 T2 1 T3 1 . . . 1 Tk 5 25 1 45 1 20 5 90, an 5 (3)(5) 5 15
–
Promedio general o promedio de los promedios 5 X 5 G/an 5 90/15 5 6
– – – –
También, X 5 (X 1 1 X 2 1 X 3)/a 5 (5 1 9 1 4)/3 5 6
ΣX 2 5 688, n 5 5, a 5 3, ΣT 2/n 5 3 050 / 5 5 610
SS(entre las muestras) 5 (2T 2/n) − (2T )2/an 5 2T 2/n 2 G 2/an
5 (252 1 452 1 202)/5 2 [(25 1 45 1 20)2] / [(3)(5)] 5 70.0
Nota: La suma de los cuadrados SSa 5 SS(entre las muestras) mide la variación entre los pro-
medios muestrales.
SS 5 ΣX2 − ΣT 2/n 5 Σ(X − –
(dentro de las muestras)
X )2 5 688 − 610 5 78
• SSr 5 SS(dentro de las muestras) mide la variación de las observaciones dentro de los prome-
dios muestrales.
SS 5 SS
(total)
1 SS
(entre las muestras)
5 ΣX 2 − G 2/an 5 Σ(X − –
(dentro de las muestras)
X )2
7.1.3 M
étodo de comparaciones múltiples para saber cuáles poblaciones
son iguales y cuáles son desiguales
Una vez dado que el análisis de varianza encuentra una diferencia significante entre los promedios de los tra-
tamientos, la siguiente tarea consiste en determinar cuáles tratamientos son diferentes. Hay distintas opciones
para determinar qué tratamientos son iguales y cuáles no. Ejemplos de éstos son los métodos de Tykey-Kra-
mer, Fisher LSD, Dunnett, Duncan, Newman-Keuls, Bonferroni, etcétera.
El análisis de varianza es un procedimiento poderoso para probar la homogeneidad de un grupo de pro-
medios. Sin embargo, si rechazamos la hipótesis de igualdad (H0: µ1 5 µ2 5 µ3 5 µn), y nos inclinamos por
la hipótesis alternativa de que cuando menos dos de los promedios son iguales, todavía no sabemos cuáles
de los promedios son iguales y cuáles no. El uso del método de comparaciones múltiples implica hacer varias
comparaciones emparejadas entre los tratamientos o promedios.
Por ejemplo, Walpole y colaboradores (1993) da las funciones para comparaciones emparejadas de prue-
bas como la de abajo, las cuales dicen que son iguales o que no hay diferencia:
H0: µi 2 µj 5 0 (7-5)
H1: µi 2 µj ≠ 0 (7-5a)
Para hacer estas pruebas emparejadas usamos la versión de t de Student de la forma de:
Xi Xj
t (7-6)
s2$n
a
Donde: SSa b¨ ( y i y. . .)2
– i1
X 5 unos de los promedios que se quiere comparar.
i b
– SSb a¨ ( y j y. . .)2
X j 5 otro de los promedios que se quiere comparar.
j 1
Número de agregados
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Adaptación de Probability and Statistics for Engineers and Scientists. Fifth edition. E.R. Walpole, H. Myers.
Prentice-Hall, Inc. Nueva York (1993).
Solución:
a) Usando un programa de computadora como Excel da los siguientes resultados.
ANOVA
Al juzgar por los resultados obtenidos se rechaza los hipótesis de igualdad de prome-
dios, es decir, H0: µ1 5 µ2 5 µ3 5 µ4 5 µ5, con una probabilidad de p 5 0.009.
b) Ahora bien, para probar la hipótesis de que la población del agregado 1 es igual a
la población del agregado 5, se usa la relación: H0: µ1 5 µ5 y H1: µ1 ≠ µ5. Usando la
función (7-6) y sustituyendo los valores de la tabla 7.11 de µ1 5 553.33, µ5 5 610.67,
desviación estándar combinada 5 s 5 4960.813 5 70.43 y n 5 6 da:
2
Xi X j
t 6
s2$n
4960.813
a
a
SS i
b¨ ( y y. .2.)2
t 5 (553.33 2 610.67) / [(70.43)
i1 ( )] 5 21.41
b
6
Para calcular el valor de la probabilidad ¨ ( y elj valor
SSpb se abusca 2
y. . .) absoluto, |−1.41| en la tabla
j 1
de la distribución de t de Student y está entrea 0.05 b y 0.10 y por interpolación da p 5
0.17. Este valor no es significante y, porSStanto,
e ¨se¨dice( yij queyi “tal jvez” .µ. .)
1
2
5 µ5.
i1 j 1
c) Aquí se quiere probar la hipótesis nula dea que b no hay diferencias entre las pobla-
SS ¨ ¨ ( yµ
ciones de los agregados 4 y 5, esto es,t H0i:1µj415 y. . .)2
ij . Para esto, se procede en forma
5
análoga al inciso b) usando los valores de la tabla
a 11 de µ4 5 465.17, µ5 5 610.67, s 5
70.43 y tamaño de muestra de n 5 6. bn¨ ( yi... todos
SSSustituyendo
a
2
. . .)estos valores en la función
i1
(7-6) da: b
4960 .813
SS an¨ ( ...
. . 2.)2
t 5 (465.17 2 610.67) / j[(70.43)(
1 ) 5 23.58
a b
6
n ¨ ¨ (layij...
Para calcular el valor de la probabilidadSSpabse consulta y. . .)
tablayi...de laydistribución
j... de t con
2
i1 j 1
25 grados de libertad y vemos que el valor p correspondiente
a b n
a 3.58 está entre 0.0005
, p , 0.001. Por interpolación, el valor n ¨ ¨ de
SSe calculado ¨ ijk ij...
pyes igualy 2
a 0.0008. Este valor
apoya, muy contundentemente, la hipótesis alternativa de H1: µ4 ≠ µ5.
i1 j 1 k 1
a b n
SSt ¨¨ ¨( ijk
y. . .)2
i1 j 1 k 1
j 1
Tabla 7.12. K
ilometraje de cada uno de los seis modelos después de consumir
los 10 litros de gasolina.
Tipos de autos
Auto 1 Auto 2 Auto 3 Auto 4 Auto 5 Auto 6
Kilometraje 34 38 38 40 38 41
38 38 38 44 39 39
36 35 40 46 42 40
Solución:
Seguir las indicaciones del programa Minitab como:
1. Vaya a: Stat → ANOVA → One Way (unstacked).
2. En la ventana de diálogo de One Way Analysis of Variance y en la ventanilla
de Responses introduzca las columnas de datos.
3. Si desea evaluar la utilidad del modelo de ANOVA vaya a Graphs y luego
seleccione OK.
Fuente de Valor
g.l. SS MS Fcalc. Ftab.
variación de p
Debido a los
5 99.78 19.96 5.21 3.11 0.009
autos
Error 12 46.00 3.83
Total 17 145.78
En conclusión, debido a que Fcalc. 5 5.21 es mayor que 3.11 se rechaza la hipótesis
sustentada con un valor de p 5 0.009, el cual es muy significante.
b) La figura 7.3 muestra los diagnósticos gráficos para verificar la utilidad del modelo
de ANOVA de este estudio.
Porcentaje
90
Residual
0
50
10 2
1 4
4 2 0 2 4 36 38 40 42 44
Residual Valor ajustado
Histograma de residuales
4.8
Frecuencia
3.6
2.4
1.2
0.0
3 2 1 0 1 2 3
Residual
Con relación a la figura 7.2, debido a que los valores residuales están muy cercanos a
la línea, dan un fuerte apoyo a la suposición de normalidad. Igualmente para la prueba
de independencia, de valores ajustados versus residuales, hay de manera aproximada el
mismo número de residuales positivos y negativos y la variabilidad de los residuos no
dependen de modo alguno del valor de y–i., lo que sugiere un buen ajuste del modelo de
ANOVA. Esto se explicará detalladamente en el capítulo de regresión.
suelos semejantes. De no ser así, las parcelas a las que se le aplica fertilizante, no todas podrían tener el mismo
tipo de tierra, nutrientes o humedad (lo que causaría variaciones en los rendimientos agrícolas). Al agrupar
las parcelas por características similares de suelos, minerales, nutrientes, humedad, etc., el error experimental
se reduce.
Otro ejemplo es el relacionado con experimentos médicos. Si los tratamientos son tres drogas y hay 24
pacientes, usando el diseño completamente aleatorizado, ocho pacientes son asignados de manera aleatoria a
cada uno de los tratamientos. Pero puede ocurrir que el historial clínico de los 24 pacientes no sea el mismo,
lo cual puede afectar su comportamiento con las drogas (lo que puede causar un error o residual grande). Sin
embargo, agrupando a los pacientes por historiales clínicos similares, edades, sexo, pesos, fumadores, toma-
dores, orientaciones sexuales, etc., se controla esta variación.
En el caso de la ingeniería ambiental, usando modelos de contaminación atmosférica, se esperaría que las
concentraciones de los contaminantes disminuyeran en función de la distancia (siempre y cuando las alturas
de los muestreadores fueran iguales, las condiciones meteorológicas fueran uniformes y el tipo de terreno por
donde está pasando la pluma fuera similar). Al controlar estos factores, las concentraciones de los contami-
nantes disminuyen exponencialmente, en función de la distancia de la fuente emisora, sin producir mucha
variación.
La tabla de abajo da el formato de ANOVA para el diseño de bloques completos.
Tabla 7.14. ANOVA de un diseño aleatorizado por bloques completos.
¨ b (
(
y
y ij...
de
yi... y j... y. . .)22
yi... las
todas . . .)
y ab yobservaciones o el promedio de los promedios.
SS...ab 5 n¨ i1 ¨
a b
i1 j 1 ( yij... yi... y j... y. . .)22
SSab n
y ab 5 j-ésima ¨
a ¨
j 1 ( yij...
b n
ai1 bj 1 observación
i1 j 1 ij...
y i...
y j...
del
j...
y . . .)
i-ésimo tratamiento.
SSij...e n ¨ a ¨ b ¨
n
yijk yij... 22
SSe n ¨ i1 ¨ j 1 k¨
n
y y
SSe n ¨ i1 ¨
a
j 1 k¨
b n
1 yijk yij... 2
SSe n ¨ ia1 ¨ jb 1 k¨
1 yijk
n
1 ijk
yij...
ij...
2
SSt
SSt ¨
¨
i
a ¨
a1 j
a1 ¨
b ¨
b 1 kn
b 1 k¨
1(
n
n 1 ( ijk
ijk
y. . .)2
y. . .)2
2
i j
Capítulo 7 Análisis de varianza (ANOVA) | 335
Tabla 7.16. A
NOVA de los resultados de las resistencias a la corrosión de las
telas mediante el uso de un diseño aleatorizado de bloques
completos.
Fuente de Valor
SS g.l. MS Fcalc. Ftab.
variación de p
Debido
16.778 3 5.596 68.04 3.49 8.39 × 1028
a los ácidos
Debido
6.593 4 1.648 20.04 3.26 3.03 × 1025
a las telas
Error 0.987 12 0.082
Total 24.368 19
Debido a que el valor de la Fcalc. 5 68.05 . F0.05,3,12 5 3.49 se rechaza la hipótesis nula de
igualdad de tratamientos, y se dice que hay una diferencia muy marcada en la acción de
los ácidos, en cuanto el efecto que tienen sobre la resistencia promedio de las telas. Esta
contención está muy bien sustentada por el valor tan pequeño de p 5 8.39 3 1028.
Por otra parte, en cuanto a modelos estadísticos para controlar la variación, existe
otro tipo de diseño para reducir el error experimental llamado cuadrados latinos. Aun
cuando el diseño en bloques aleatorizados es muy efectivo para reducir el error expe-
rimental (residual), al eliminar una fuente de variación, los cuadrados latinos son muy
útiles para reducir dos fuentes de variación, mientras se reduce el número de combina-
ciones. Este diseño, sin embargo, no se discutirá en este texto.
Ejemplo 7.7. Supóngase que queremos usar cuatro vehículos diferentes para probar el kilometraje
dado por cuatro tipos de combustibles. Usando un diseño de bloques aleatorizado se
quema cada tipo de combustible en cada uno de los cuatro vehículos, seleccionando
aleatoriamente el orden en que se hace esto. Así, se tienen cuatro tratamientos corres-
pondientes a cuatro tipos de combustibles. Es decir, cuatro bloques correspondientes
a los cuatro vehículos probados. Los datos se dan en la tabla 7.17. Usando α 5 0.05 y
suponiendo que no hay interacción, sacar las conclusiones apropiadas.
Tabla 7.17. Kilometraje por litro dado de los diferentes tipos de combustibles y
de los cuatro tipos de vehículos.
Tipos de automóviles
Tipos de gasolinas 1 2 3 4
Gasolina con aditivo 13.5 15.8 17.8 18.9
Gasolina sin plomo 13.2 15.6 17.3 18.7
Gasolina premium 13.3 15.2 17.1 18.5
Gas propano 19.3 18.9 18.8 20.0
Capítulo 7 Análisis de varianza (ANOVA) | 337
Solución:
Usando el programa Excel, se procede así:
1. Introduzca los datos en la hoja de Excel.
2. Vaya a: Tools → Data Analysis
3. En la ventana de Data Analysis seleccione ANOVA: Two-Factor Without Repli-
cation y en la ventanilla de Input Range introduzca las columnas de datos y haga
clic en OK.
Fuente de
SS g.l. MS Fcalc. Valor de p Fcrítica
variación
Vehículos 27.61188 3 9.203958 7.599163 0.00774 3.862548
Combustibles 39.13688 3 13.04563 10.771 0.002465 3.862548
Error 10.90063 9 1.211181
Total 77.64938 15
7.3 C
lasificaciones cruzadas: Análisis de varianza en dos sentidos
El análisis de varianza en dos direcciones, de dos clasificaciones o de dos sentidos es útil para estudiar más
de dos tipos diferentes de tratamientos. La característica del diseňño factorial en dos sentidos es que, cada
nivel de un factor, se usa en combinación con cada nivel del otro factor. Por ejemplo, considérese el caso de
n réplicas de las combinaciones del tratamiento que se determinan por a niveles del factor A y b niveles del
factor B. En este aspecto, las observaciones se estructuran por medio de un arreglo rectangular, donde los
renglones representan los niveles del factor A y las columnas representan los niveles del factor B. Así, hay ab
celdas, cada una de las cuales contienen n observaciones (tamañňo de la muestra).
Por ejemplo, si un ingeniero agrónomo investiga el comportamiento de dos tipos de semillas, por medio
de variar el nivel del fertilizante, digamos, a tres niveles, alto, mediano y bajo, un factor sería el tipo de semilla
y el otro el nivel de fertilizante. Éste sería un ejemplo factorial con dos factores, el cual consistiría en usar seis
tratamientos formados por medio de usar cada tipo de semilla con cada nivel de fertilizante.
Otro ejemplo, de ANOVA de dos factores está relacionado con la medición de las concentraciones de
contaminantes del aire emitidos por una fuente industrial. Aquí para un factor se pueden seleccionar distintos
niveles de distancias de la fuente emisora y, para el otro factor, se pueden seleccionar diferentes alturas donde
están situados los muestreadores (porque la altura afecta las concentraciones).
1 2 3
Nivel de fertilizante
Fuente: Adaptación del libro Applied Statistics: Analysis of Variance and Regression. Dunn et al. 1974. John Wiley and Sons.
Nueva York, (1974).
Capítulo 7 Análisis de varianza (ANOVA) | 339
Nivel alto Nivel alto Nivel alto de agua Nivel alto de agua
de agua de agua
Respuesta media
Respuesta media
Respuesta media
Respuesta media
Nivel mediano Nivel mediano
Nivel mediano Nivel mediano de agua de agua
de agua de agua
Nivel bajo Nivel bajo
de agua de agua
Nivel bajo Nivel bajo
de agua de agua
1 2 3 1 2 3 1 2 31 2 3
Nivel de fertilizante Nivel de fertilizante Nivel de fertilizante Nivel de fertilizante
Cuando ocurre una interacción en algún experimento es importante investigar por qué ocurrió. Por ejem-
plo, cuando se establece la tabla de análisis de varianza, se estudian los comportamientos de los efectos prin-
cipales y también la posible interacción entre los dos factores bajo estudio. En términos estadísticos, si la F
calculada es mayor que la F crítica eso indica que los factores están interactuando. No obstante, la interacción
puede ocurrir por mera casualidad. Pero también, la interacción puede ocurrir, causalmente, debido a algún
valor extremo o factor que no se ha podido controlar. La interacción, también se puede deber a algún pro-
blema en los datos o a una respuesta errónea. De cualquier manera, cuando los datos obtenidos indican que
existe una interacción grande, los efectos principales correspondientes serán de poca utilidad.
Como se verá en el siguiente ejemplo, si hay interacciones entre las alturas y las distancias. Cuando se
modelan las emisiones de contaminantes atmosféricos, hay muchas variables que pueden afectar los resulta-
dos. En este ejemplo, tal vez hubo cambios meteorológicos imprevistos, emisiones fugitivas o diferencias en
los tipos de terreno por donde pasa la pluma de la chimenea. Esto pudo contribuir a la interacción de los dos
factores estudiados en ese ejemplo.
Situaciones similares pueden ocurrir en estudios de agricultura. Por ejemplo, si el ingeniero agrónomo
desea estudiar los rendimientos agrícolas usando dos factores, como el tipo de semilla y la cantidad de fer-
tilizante aplicado, tiene que analizar si hubo interacción entre los factores semilla-fertilizante. Si la hubo,
pudo deberse a que, en las parcelas seleccionadas para los cultivos experimentales, no había uniformidad de
variables como humedad, tipos de suelos, cantidad de nutrientes, etc. Para remediar esta situación se tendría
que hacer un experimento por bloques aleatorizados, es decir, teniendo cuidado de que las parcelas agrícolas
fueran todas uniformes en las variables anteriormente descritas.
De cualquier manera, la tabla de abajo muestra el formato que se usa para experimentos factoriales en
dos sentidos o con dos tratamientos. La tabla 7.19 muestra el formato que se sigue para los análisis de varianza
en dos sentidos.
Tabla 7.19. Análisis de varianza en dos sentidos.
Fuente de variación SS g.l. MS Fcalc. Ftab.
Efecto principal
Debido a A SSa a21 MSa 5 SSa/(a 2 1) F1 5 MSa/s2e F[12α;a21,ab(n21)]
Debido a B SSb b21 MSb 5 SSb/(b 2 1) F2 5 MSb/s2e F[12α;b21,ab(n21)]
Interacción de dos factores
Debido a AB SSab (a 2 1)(b 2 1) MSab 5 SSab/(a 2 1)(b 2 1) F3 5 MSab/s2e F[12α;(a21)(b21),ab(n21)]
Residual SSe ab(n 2 1) s e 5 SSe/[ab(n 2 1)]
2
SS aaa¨j 1b( y j
b b
y. . .)2
SSbbe ¨ aa¨ j ¨ 1b( y ( yj ij y.y. .) . . .)22
340 | SS
SSe ¨
¨
Estadística ¨ (parayij ingeniería yii j y ciencias . . .)2
i1 ¨
j
a b (y 1
e i 1 j 1
yi j
. . .)
SSe ¨ a1 ¨
j 1 ij j
a bb
a ( yij yi 2 j . . .)22
SSte ¨ a1¨
b1
i j
b 1 ( yijij y. . .) . . .)
Donde: SSt ¨ i
11 ¨
j
( yij y.i . .)22 j
SSt ¨ i1 ¨
ii
a jj 11
j 1 ( yij
b y. . .)
SSt ¨ i1 ¨
a b a (y y. . .)22
SSta ¨ 1 ¨
a1
j ij
bn a 1 ( yi...
y. . .) 2 Suma de los cuadrados debido al factor A (7-11)
1 ¨
SSa iibn j
( yij . . .)2
SSa bn
SSa bn¨
¨ij
i
a 1 ( yi...
ab
1 i...
. . .)
. . .)222
b1 ( yi...
an¨
i
SSa bn b1 ( yi... . . .) 2
SS an¨ i
( ... ... . . .)2 Suma de los cuadrados debido al factor B (7-12)
SS an¨ j 1 ( ...
ij b11 . . .)2
SS an¨ j 1 ( b ...
ba b
. . .)2
SSab n ¨
SS
SSab an n jaa1 (¨ b ( y . . .) yi... y j... y. . .)22
SSab n ¨
¨ ¨ ( y
... ij...
yi... y j... y. . .)2
i1 ¨ yi... y j... y. . .) Suma de los cuadrados de la interacción
ji 1
a b (y j 1 ij...
SSab n ¨ ai1 ¨
j 1
a bb n ij...
a (y yi... y2j... y. . .)22 de los factores AB (7-13)
nn ¨ ¨
SSeeab n ¨ ai1¨ bj 1¨
bj 1 n ij...
S
SSS (nyij...yijk yi... yij... y2j... y. . .)
SSe n ¨
¨ 1 1¨ ¨ yijk yij... 2
i1 ¨ j 1 k¨
ai bj 11k n1
1 yijk yij...
i j
SSe n ¨ a1 ¨
a
b 1 k¨
b
1 yijk
nn yij... 222 Suma de los cuadrados del error o residual (7-14)
SSet n ¨ a1 ¨ ¨
i j n
1( yijk yy. ij...
. .)2
SSt ¨
¨
i
¨b 11 kk¨
j b 1k n
( ijk y. . .)2
ijk
i1 ¨ j 1 k¨
ia 11 j 11
SSt 1 ( ijk y. . .)2
n
SSt ¨i1 a¨
a ab
j 1 k¨ 1 ( ijk
n
y. . .)
SSta bcn
SSa bcn ¨i1¨
¨ a¨j (1y
( yk¨ i...1
( yijk. . .)y22 . . .)2 Suma de los cuadrados del total
y . . .)
(7-15)
SSa bcn¨ i1i a j 1 1 k
1 ( y i...
i...1
y. . .) 2
SSa bcn¨
i
ab
b1 ( y i... y. . .)222
SSbba acn¨
i
Donde: SS ac n
bcn ib1 i... ( y yy......))
SSb acn¨
¨ ( y jj..., y. . .)22
j 1 ( y j..., y. . .)2
j
i b 11 ...,
A5 acn¨
SSvariación j c1debido
bc
( y j..., yal. .primer .) factor A
SSbb ac abn n¨ j c1 ((y yjk... y. . .)22
B5 abn¨
SSvariación debido
(y ...,
al. . segundo
.) factor B
SSbb abnjkk¨ c11 ( y k...
. . .)22
abnk¨ a 1
c b k...
AB 5 SSinteracción a1 ( y
b entre el. .factor
.)2 A y B (interacción que ocurre cuando no hay aditividad)
SSbab abn cn¨ ¨a1¨ (b y(k... . . .) y j... y. . .)22
2SSb cn ¨
¨
k
¨ (k...ij... i...
y y. . .)2
i1 ¨
s 1, s 2SS
2
, sab3 y scne son
2 2
bla1 formaciónij... i...
ydej... los cuadrados medios y se obtienen dividiéndolos entre sus correspon-
j 1 ( ij... y. . .)2
i ka 1 1j
cn¨ 1¨
ab i... j...
dientes SSabgrados iade
a bc
(
libertad y y. . .)
cn¨ ia1 ¨
j 1
SSab bn c
( ij...
c1 ( ij...
i...
yyj... y.y...). .)2 22
yijk 5SS
ac
suma
SSac bn¨
bn de ¨
ialas 1 k ¨
j
¨
j
( ik...
11observaciones
ik...
i...i...
i...
yj...k...
y k... lay.(ij
en y. . .))-ésima
. .)22 celda
1 ( ik...
ac
c k...
¨ ¨
i b 1k i...
– SS
y i.. 5SSpromedio bn a c
( y y . . .)
. . .)22 el i-ésimo nivel del factor A
b de c las observaciones
an¨ ¨ ypara
ac i 1 k 1 ik... i...
bn c 1 ( jk... y k...
SSbc ac an¨ i b1 k
¨
( jk... ik... j...
i... y k... . . .)2
–
y … 5SSpromedio
bc
an¨ ij b 1
¨
k
de1 (todas
c 1 j...
lasj... abny k... observaciones
k...
. . .)
SSbc an¨ ¨
bc j 1 k jk...
ba cb
( c y k... . . .)22
– n¨ a1 k
¨ b1 ¨
b 1 c jk...
j j...
y .j. 5SSpromedio an de (las (observaciones
y j... yij... y 2 ik...para . . .) jk... el j-ésimo nivel del factor
. . .)22B
SSbc abc n¨ j a1 k
¨
¨ c jk...
( yijk... yij...k...
2 ik... i... j... k...
. . .)2
y–ij. 5SSpromedio
abc
n¨ ji a
i1 de
1 k
¨
j b 1
1 k
¨
las
c 1 ijk...
1 (observaciones
yijk... yij...2 ik...en lajk... jk... i...
(ij)-ésima
j...
celda
k...
. . .)
SSabc n ¨ ai1 ¨ j 1 kc¨
abc j 1 k i... j... k...
a a b b c
1(
c ny yij...2 ik... . . .)22
yijk 5SS ann ¨
eabc an¨ ai1¨ ¨
j 1¨
b
kc¨ ¨ 1(
n ijk...
y (yen y 2 jk... i...
) del factor j... k...
. . .)j-ésimo nivel del factor B
SSk-ésima ¨ observación
¨ b
1 1k¨ 1 l¨
n ijk...
(y ijkl elij...i-ésimo ijk... ik... nivel
)
ijk...jk... i... j...A y k...
el nivel
a5 SS e
SSnúmero
an ¨j ai
j 1de
11k
¨1 k¨c 1 l¨
j
b kc
1n 1 (y ijkl ijk... ijk...
)
an¨ ¨bb 1muestras
k¨ c 1 l¨
(ydel
ijkl primer factor
e k 1 ijk... ijk...
a n
)
¨ a1 k
¨ k¨ c 1 l¨
n1
e j ijkl ijk... ijk...
SS an (y y y . . .) )
b5 SSe an¨
número
e j a de 1k
¨
¨c 1 l¨
b 1muestras n1 del
ijkl segundo
(y ijkl yijk... y. . .)ijk... factor
ijk...
SSe an¨ j a 1 k
¨ 1 k¨
b1k
1 l¨
n1
1 (y ijkl
yijk... y. . .)
SSe an¨ ¨ 1 k¨ 1 l¨
j 1 k
n5 número a total b cde ncasos
1 (y ijkl yijk... y. . .)
SSe an¨ ¨1 k¨ 1 l¨
j 1 k
j 1 k 1 (y ijkl yijk... y. . .)
Aquí es importante recapitular
j 1 k 1 k 1 l 1 las suposiciones del modelo de ANOVA en dos direcciones, es decir:
1. Los residuales o errores εijk deben ser independientes.
2. Los residuales εijk deben estar normalmente distribuidos.
3. Los residuales εijk deben de venir de una población con la misma varianza.
De no cumplirse con estas suposiciones, el diseño será incierto.
Ejemplo 7.8. Para estudiar los efectos de la altura y la distancia en las concentraciones de contami-
nantes atmosféricos (SO3), que son emitidos por una chimenea industrial se instalaron,
viento debajo de la fuente emisora, tres muestreadores, a tres alturas diferentes (tres
niveles de A) y, a cuatro distancias distintas (cuatro niveles de B), con dos observaciones
obtenidas para cada una de las 12 combinaciones de altura-distancia. Para esto se dan
Capítulo 7 Análisis de varianza (ANOVA) | 341
los siguientes avances informativos: SSa 5 7.00, SSb 5 20.00, SSe 5 7.0 y SSt 5 45.00.
Suponiendo un nivel de significancia de α 5 0.05, resolver los siguientes enunciados:
a) Establecer una tabla de análisis de varianza.
b) Hacer pruebas de F para demostrar que ninguno de los valores de F, para interac-
ciones de la altura y la distancia, es significativo. Probar la hipótesis nula H’0: de
que no hay diferencias en las concentraciones promedio de SO3 en las distancias,
cuando se usan tres alturas diferentes, en las cuales fueron situados los muestreado-
res que están midiendo las concentraciones del bióxido de azufre. Además, probar
la hipótesis nula H”0: de que no hay diferencia en las concentraciones promedio en
las cuatro distancias a las que se situaron los sensores. Finalmente, probar la hipó-
tesis nula H’’’0: de que no hay interacción entre las diferentes alturas y las distintas
distancias de los sensores.
c) Ver cuáles efectos principales son significativos.
d) Calcular los valores de p.
Solución:
Usando un programa de computadora se obtienen los siguientes resultados.
a) La tabla de ANOVA con los valores sustituidos se da abajo.
Tabla 7.20. ANOVA para el problema de los efectos de la altura y la distancia
en las concentraciones del contaminante SO3 atmosférico.
Conclusión:
Se rechaza H 90: y se concluye que las concentraciones de SO3 por el efecto de la altura
son diferentes a aquéllas debidas al efecto de la distancia. Esta contención es apoyada
por el valor de p 5 0.023. Análogamente, H 00: también se rechaza con un valor muy
significativo de p ,, 0.001. La interacción entre la altura y la distancia, es decir, Fcalc.
5 3.16 . Ftab. 5 3.00 está en el umbral de la interacción, con un valor de p 5 0.05.
Esto indica que la interacción debe de considerarse. Lo que quiere decir que tienen que
considerarse variables como el tipo de terreno, cambios imprevistos en las condiciones
meteorológicas, sensores mal situados, mal funcionamiento del equipo, emisiones fu-
gitivas, cuerpos de agua y así sucesivamente.
c) y d) explicados por el inciso a). De acuerdo con la tabla todos los efectos son signi-
ficativos, especialmente, debido a la distancia.
Ejemplo 7.9. Éste es un ejemplo de ingeniería agrícola, el cual hace un estudio de ANOVA de dos
clasificaciones relacionado con el rendimiento de algodón. En este experimento se in-
volucran dos tipos de semillas (1 y 2), cada uno de estos factores usados en tres niveles
de agua, es decir, bajos, medianos y altos. Saque todas las conclusiones debidas. La
tabla de abajo muestra la información requerida para este problema.
Nivel de agua
Tipo de semilla Bajo Mediano Alto
1 2.4 3.0 2.9
3.0 3.3 3.4
2.3 3.2 3.5
3.3 3.1 3.4
2 2.9 2.5 4.2
2.7 2.9 4.6
2.4 2.1 4.3
2.5 2.3 4.2
Conclusiones:
Debido a que el valor de la estadística Fcalc. 5 91.90 es mucho mayor que Ftab. 5 4.41
se rechaza la hipótesis de que no hay diferencias entre los tipos de semillas, es decir
H0: µ1 5 µ2 5 µ3 5 µ4 y se inclina por la hipótesis alternativa de H1: µ1 ≠ µ2 ≠ µ3 ≠ µ4.
Esta decisión es apoyada por un valor de p muy significativo. Situación similar ocurre
con los niveles de riegos. En cuanto a la interacción se ve que los factores semilla y
niveles de agua están interactuando porque 7.50 . 3.55. En este caso la interacción
pudo ocurrir por mera casualidad, pero también por algún valor extremo o problema
relacionado con el diseño experimental.
Ejemplo 7.10. Se prueban 16 autos de diferentes tamaños de motores (1.6, 2.3, 3.0 y 3.7 litros) del
mismo cilindraje y de dos tipos distintos de transmisiones (manual y automática) con
objeto de comparar el consumo de gasolina (en kilómetros por litro), es decir, después
de ser manejados bajo condiciones similares. Con un nivel de significancia de α 5
0.05 hacer lo siguiente:
a) Hacer una matriz con la información dada e introducirla a la hoja de Minitab.
b) Hacer una tabla de análisis de varianza de dos clasificaciones y sacar todas las
conclusiones debidas.
c) Hacer gráficas de los efectos principales y de los efectos de interacción entre mo-
tores y tipos de transmisiones.
d) Usando gráficos subjetivos evaluar la utilidad del modelo de ANOVA bidirec-
cional.
Tabla 7.23. Kilometraje para los tipos de motores y tipos de transmisiones.
Solución:
Usando el programa Minitab proceder así:
1. Vaya a: Stat → ANOVA → Two Way
2. Después en la hoja de Minitab introduzca los datos como se muestra en la
figura 7.7.
344 | Estadística para ingeniería y ciencias
Tabla 7.24.
Fuente de
g.l. SS MS Fcalc. Ftab. Valor de p
variación
Debido a la
1 31.08 31.08 37.53 5.32 0.000
transmisión
Debido a la
3 5.79 1.93 2.33 4.07 0.151
máquina
Interacción 3 8.16 2.72 3.28 4.07 0.079
Error 8 6.63 0.83
Total 15 51.65
Conclusión:
Para los efectos de la transmisión, debido a que la Fcalc. 5 37.53 es mayor que Ftab. 5
4.84, se rechaza la hipótesis de que no hay diferencias entre los efectos de las transmi-
Capítulo 7 Análisis de varianza (ANOVA) | 345
siones y se inclina por la hipótesis alternativa. Esta decisión es apoyada por un valor
de p 5 0.001, el cual es muy significante. En cuanto a los efectos de interacción debido
a que Fcalc. 5 1.44 menor que Ftab. 5 3.59 no hay interacción entre el factor transmisión
y el factor máquina.
c) Para generar las gráficas de los efectos principales y de interacción usando el pro-
grama Minitab proceder de la siguiente manera:
1. Para hacer gráficas de los efectos principales entre motores y tipos de transmi-
siones, vaya a: Stat → ANOVA → Main effects. En seguida, en la ventana
de Main Effects y en la ventanilla de Response introduzca la variable de
respuesta (kilometrajes en columna 1). En la ventanilla de Factors ponga las
columnas C2 y C3 (tipos de transmisión y máquina) y haga clic en OK.
2. Igualmente, para generar la gráfica de los efectos de interacción vaya a: Stat
→ ANOVA → Interaction Plot. En seguida, en la ventana de Interaction
Plot introducir las variables de respuesta y de factores y haga clic en OK.
Además, si se desea seleccionar Display full interaction plot matrix.
Todo lo anterior genera las gráficas de los efectos principales y de interacción.
Efectos principales
Efectos principales
(promedios(promedios
de datos) de
para
datos)
kilometraje
para kilometraje Gráfica deGráfica
interacción
de interacción
(datos de (datos
promedios)
de promedios)
para kilometraje
para kilometraje
Tipo transmisión
Tipo transmisión Tipo de máquina
Tipo de máquina 1.6 2.3 1.6
3.0 2.3
3.7 3.0 3.7
14.5 14.5 16 16
Tipo de transmisión
Tipo de transmisión
Promedio de kilometraje
Promedio de kilometraje
Transmisión automática
Transmisión automática
14.0 14.0 14 14
Transmisión manual
Transmisión manual
Tipo transmisión
Tipo transmisión
12 12
13.5 13.5
16 16 10 10
13.0 13.0 Tipo de máquina
Tipo de máquina
14 14 1.6 1.6
Tipo de máquina
Tipo de máquina 2.3 2.3
12.5 12.5
12 12 3.0 3.0
3.7 3.7
12.0 12.0 10 10
ic a icaal ua
l
11.5 11.5 át ánt u an
om ma
om
ut utn nm
na nisaió isió
11.0 11.0 isió ió
niss
m s m
sm srma an
Transmisión automática
Transmisión
Transmisión
automáticamanual 1.6 manual
Transmisión 2.3 1.6 3.02.3 3.73.0 3.7 an anT Tr
Tr Tr
c) Los gráficos subjetivos para evaluar la utilidad del modelo de ANOVA bidireccio-
nal se muestran en las gráficas de abajo.
Gráficas de residuales
Gráficas de probabilidad normal de residuales Residuales versus valores ajustados
99 2
Porcentaje
90 1
Residual
50 0
1
10
1 2
4 2 0 2 4 11 12 13 14 15
Residual Valor ajustado
Histograma de residuales Residual versus el orden
2
4.8
Frecuencia
Residual
3.6 1
2.4 0
1.2 1
0.0 2
2.0 1.5 1.0 20.5 0.0 0.5 1.0 1.5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Fuente de
SS g.l. Cuadrado medio Fcalc. Ftab.
variación
Efectos principales
ABC SSabc (a 2 1)(b 2 1)(c 2 1) MSabc 5 SSabc/[(a 2 1)(b 2 1)(c 2 1)] MSabc/s27 F7[12α;(a21)(b21)(c21),abc(n21)]
¨ii¨a11¨
a1 ¨
¨ jba
aj b1(¨
a
j
b1(k¨
nk
y n1 ( y. . .)y2. . .)
n1( .. .. ..y)).22y...). .)2
2 (7-16)
¨ 1 (ky¨
j 1 k i... ijk
SS ta
bcn yi... 1 (ijky
SS
SSt a bcn
i¨ 1 ji¨ ¨ 11(ky¨
y
SSaat bcnii¨
ia 2
SSSS bcn
at 1 ( y. . .) y. . .)
i... ijk 2
¨ii¨
ai 1 b1j
SS
SSab bcn ba ((yy i... yy. . .).)2
SSSS
SS
SS ac
bcn
ac
bcn n
n ¨
¨
ba1( y
11 ( y
( yi...i...jj..., y.yy...).. 2..) .))222 (7-17)
ni¨ ¨
ab jb ...,
SSSSba ac
ba bcn j1b1((yy j ...,
i... yy .. . ..). )
SSb acn¨ jic1
c (y
j...,
i... y. . .)222
SS
SS ac
abn n ¨bj
¨ i bc11((yyj..., y . .. ..) .)
ac¨ ¨ 2
SS cb1( y y.y....).. .)
bb acn j
nj¨
1 2
SS
SS
SS abn
abn 1( jy
( y...,j...,k... .)2222 (7-18)
j ¨
bb
SSb abnk¨
k k...
SSSSbbbb abn acn 1c1((y y j...,
k... y . .. .
.) .)
¨
k
kajc 11 b k...
1(by k...
j...,
. . .)22
SS
SSbab abn cn¨ caj
a c1¨ (by(k... ij... . . .)i... y y. . .)22
SSSS
SS
SSab abncn
cn¨
abn ¨ ¨ k
a¨
a c(¨
1
¨ by (
b( y(k...ij...
. . .) 2
.)2 y j... y
. . i... 2 y j...
y.. .. .).)22
¨ 11¨
¨
b ab ik 1 1 j k...
1 ij... i... j...
SSSSabbb cn abn ( (
1y . . .) y y . . .) (7-19)
SSab cn¨ ¨
ki jb
a
iak 11j
( ij...
c1 k... i...
y j... y. . .)22 2
SS
SSSS
SS ac cn
ab
cn
bn
bn ¨ ¨ i ¨
aiak1
¨ aa1¨
a1 j¨ ¨bj
1 cb1 ( ij...
¨
b1 c (
c1( (ij...ik... i... i... y j...
ij...
i...
i...
y y
y
j... y. . ..)2. .)2
j...k... y. .y.)
y. .. .)
.. .)
SS
SSabac cn
bn i¨
i
¨ 1j k ¨
¨
1 ( ik... yy k... yy
2
.)222
SSac bn¨ b1¨
ia i...
SSSSacacab bn
ab cn 1j1k 11((
c ij...
ik... i...
i...
y k... y
j...
y .. .. .).)
an¨ ¨
i
ia kjcc 1 ik...
c11( ik...
ij... i... j...
y k... y. . .)222 (7-20)
SS
SSacbc bn ¨ ai
¨ i
ba ¨
b11k
¨
cj
cc (( i...
yyk... y.....).)
i¨
¨ ba ¨
jb1¨
2 2
SS an c c( ( y y.y....).. .)
SS bn
¨ ¨ y k...
i 1 k 1 ik...
jk... i...
j... k...
k...
SS
SS an
bn 11 ( ik... y .)2222
SSbcac an¨ ¨ a1¨ ¨
acbc 1kk jk... i...j... k...
c
SSSSbcac
bc anbn ( ( jk...
ik... j...
i...
y y k...
k... y . . ..) .)
¨ ¨
i j1 k 1 k 1 1
jb
i kkc
b1 1( cjk...
b 11 cjk... ik... j...i...
y k... k... . . .)22
SSbcabc ann¨ j¨ ¨ ¨c1 ¨
bj ck
SS an i a11k
( jk...( y j... yij...k...
j...
y k... . . .)
. . .)22 (7-21)
¨ ¨ a1¨ ¨ b 1( ¨
2 ik...
b
a c
b c 2 jk...
SSSS n b1 k
c ( yijk... y . . .) .. .. .)
n¨ ia1 ¨ k¨
2 2 i... j... k...
SSabc
SS an jb 1 ( 1 ( yijk... j... yij... y2 ik.... . .) jk... .)2
a¨ ¨
bc j k jk... j... k...
nj¨ 11¨ 1¨
i... j... k...
1 1 ( cjk... k... ik.... . .)2 jk...
SSSSabcbc an i1ak1 kc 1( y ijk... y ij...y2 i... j... k...
. . .)22
¨ ¨ ¨
jb
ij k kc jk... 1 n ijk... j... ij... k... ik...
SSabc bc
n j
b
( y y 2 jk... i... j... k...
. . .)2
SS
SS abc
an n
n n¨ ¨
¨
aia j 1
¨ ¨b
b 1¨
k
a1 j bb1 kcc1 n ijk...
aia1¨
¨
b¨
1
¨c
c 1¨ ( nyijk... (y y ij...
2 ik... jk...
) i... j... k...
. . .)
11l¨
a
SS c(ny ijkly 2 . ...). 2.)2 (7-22)
¨ ¨ ¨
1 ij... ik... jk... i... j... k...
SS abc
an i j k
(y jk...)
¨ a 1 j¨ b 1 k¨ c 1 ¨
e ijk... ijk...
SS
SS an b 1kkc ( y (y y 2 )
a¨ b¨ ck¨
abc j ijk... ij... ijk...ik... i... j... k...
SSe abc an¨ 1¨ 1¨ 1¨
e j 1 k 1 1 ijkl ijk...
SS eabc
n i n
( y ijk... ijkl
(y y ij... ijk... ik... ijk...jk...
ij... ijk... ik... ijk...)jk...
2 i... j... k...
. . .)2
SSe an¨ ¨ b1bj1k¨ c1 ck ¨
j 1 k 1 k 1 l 1
ja i 1kb j k1c l1n
n 1 ijk...ijkl i... j... k...
(y )
an¨ j¨
a¨
¨ bb1 k¨
b cc1 l¨
¨c1 l ¨
aj ai1k n 1n1
SS an n (y ijkl yijk... . .)))
y.iijk...
SSee an nn1 (yijkl
SSSS
SS
SS an
an
an ¨ j¨
¨ a 1¨
aa1 k
¨
¨ b 1¨ kk¨
¨ c 1¨
c1 l ¨
l l¨ n 1 (y(y
(y
(y
ijkl y
y
ijk...
ijk... y ..jk...
yijk... .. .)
.) ) (7-23)
j¨ k¨ k¨ l¨
e e kk ijklijkl ijk...
an¨ 1¨ 1¨ 1¨
j 1 1 1 1 ijk...
SSSSe e an
ee j a1 k b1 k n1
1 (y (y ijkl
ijkl
y ijk...
ijk...
y . . i.)
ijk... )
SSe an¨ 1¨ 1¨ ck1 1l¨
a
jj 11 kk b 1 k c 1 ln 1 ijk...
1 k 1 l 1
(y ijkl
ijkl
y ijk...
y . . .)
jk...
SSe an¨ aj j
a1 k ¨ bk b1 k¨ c ¨
n l 1 1
n (y ijkl y ijk...
y . . .)
SSSS anan ¨jj¨a11¨ k¨ 1¨ k¨
k b1 k c1 l n1
1¨ ¨ (y(y ijkl
yijk... y.y...). .)
yijk...ijk...
j ¨ 1 k ¨ 1 k ¨ 1 l ¨
e l 1 ijkl
SSee an j 1 k 1 k 1 l 1
1 (y ijkl
ijkl
y ijk...
y. . .) (7-24)
j 1 k 1 k 1 l 1
y–ij.. 5 promedio de los casos para el i-ésimo nivel del factor A y el j-ésimo nivel del factor B.
yijkl 5 denota la l-ésima observación de la combinación del ijk-ésimo tratamiento.
to ambiental. Por ejemplo, una aplicación sería medir las concentraciones que ocurren a lo largo de la pluma.
Para un diseño factorial con tres tratamientos, se puede agregar otro factor más al ejemplo de la difusión
atmosférica con dos tratamientos, el cual explicamos antes. En este caso, además de los factores distancia y
altura, podemos agregar un tercer factor relacionado con diferentes marcas de muestreadores.
En cuanto el efecto de interacción, en estudios de impacto ambiental usando modelos de difusión atmos-
férica, la interacción de los factores bajo estudio puede descubrir situaciones que afecten el estudio. Aunque si
bien los modelos de difusión atmosférica suponen condiciones climatológicas uniformes, las emisiones fugi-
tivas o las diferencias en los tipos de terrenos como arena, arcilla, piedras, agua, tipo de vegetación, etc., por
donde pasa la pluma de la chimenea, pueden ocasionar que los factores bajo estudio interactúen.
Situaciones similares pueden ocurrir con diseños factoriales aplicados a la agricultura cuando se aplican
dos factores como tipos de semilla y niveles de fertilizantes. Aquí se puede agregar otro factor más, el nivel
de agua para hacer un diseño factorial, es decir, con tres factores. Sin embargo, si hay interacción, tal vez los
tipos de suelos de las parcelas no tienen las mismas características de humedad, de tipos de suelos, tipos de
temperaturas, tipos de nutrientes, etc.; en cuyo caso hay que remitirnos a los diseños de bloques completa-
mente aleatorizados.
Ejemplo 7.11. En un estudio hipotético de difusión atmosférica, es decir, usando un modelo de difu-
sión atmosférica, se hicieron análisis de concentraciones de contaminantes del aire las
cuales se midieron en cuatro distancias diferentes a lo largo de la pluma (500, 1 000,
1 200 y 1 500 metros), en dos alturas distintas (500 y 800 metros) y con cuatro marcas
diferentes de sensores, y con tamaños de muestras de tres observaciones para cada una
de las combinaciones de niveles de los tres factores. Para esto se dio una avanzada de
los valores en la siguiente forma: suma de los cuadrados del factor A 5 SSa 5 1.50,
suma de los cuadrados del factor B 5 SSb 5 19.40, suma de los cuadrados del factor C
5 SSc 5 147.00, suma de los cuadrados de la interacción de factores A y B 5 SSab 5
0.006, suma de los cuadrados de la interacción de factores A y C 5 SSac 5 4.83, suma
de los cuadrados de la interacción de B y C 5 SSbc 5 2.64, suma de los cuadrados de
la interacción de los factores A, B y C 5 SSabc 5 0.75, suma total de los cuadrados 5
SSt 5 183.72. Al asumir un nivel de significancia de 0.05. Se probarán las hipótesis
de los efectos principales sólo si todas las interacciones no son significativas. Hacer lo
siguiente:
a) Asignar los simbolismos apropiados para cada uno de los componentes de la
fuente de variación.
b) Hacer una tabla de análisis de varianza que incluya la F crítica y el valor de p.
c) Hacer pruebas de significancia sobre los efectos principales.
d) Hacer una prueba de significancia sobre todas las interacciones.
Solución:
a) Las distancias de los muestreadores situados a lo largo de la pluma, es decir, vien-
to abajo, son el factor A con i 5 4. Las diferentes alturas a las que están situados
los muestreadores son el factor B con j 5 2. Finalmente, los muestreadores son el
factor C con k 5 4. El número de casos es n 5 3. Por tanto, el número de combi-
naciones es 4 3 2 × 4 5 32 y el número total de observaciones es 32 3 3 5 96.
b) El análisis de varianza se da en la tabla 7.26.
Capítulo 7 Análisis de varianza (ANOVA) | 349
Tabla 7.26. D
atos y el llenado de los faltantes en la tabla, de acuerdo con los
datos proporcionados por el problema.
Cuadrado
Fuente de
SS g.l. del Fcalc. Ftab. Valor de p
variación
promedio
Efectos principales
Debido a A 1.50 3 0 .50 4.17 2.76 0.0098
Debido a B 19.40 1 19.40 161.17 3.94 p ,,, 0.001
Debido a C 147.00 3 49.00 408.33 2.76 p ,,, 0.001
Interacción de dos factores
Debido a AB 0.006 3 0.002 0.02 2.76 p . 0.100
Debido a AC 4.83 9 0.54 4.50 1.97 p , 0.001
Debido a BC 2.64 3 0.88 7.33 2.76 p , 0.001
Interacción de tres factores
Debido a ABC 0.75 9 0.08 0.67 1.97 p . 0.100
Error 7.59 64 0.12
Total 183.72 95
Conclusión:
Los efectos principales son significativos sustentados con valores de p que son muy
pequeños, de 0.009 y p ,,, 0.001. Al juzgar por estos valores de p, existen efectos
principales muy fuertes de distancia, altura y sensores (las diferentes alturas, distan-
cia) y tipos de sensores sí afecta el promedio verdadero de las concentraciones de
contaminantes; los niveles de los contaminantes si dependen de esas tres variables).
Por otro lado, debido a que F7 5 MSabc/s27 5 0.67 , F7[0.05;9,64] 5 1.97, las interacciones
entre los factores distancia, altura y sensores no son de importancia. Sin embargo, las
interacciones AC y BC son variables importantes del experimento.
En el análisis de varianza, también hay lo que se llama diseños factoriales con
todos los factores a dos niveles. Aquí se incluyen temas como combinaciones ortogo-
nales lineales, diseños de replicaciones fraccionales, diseños anidados o jerárquicos,
cuadrados latinos, etc. Estas funciones, sin embargo, no se discutirán aquí.
El análisis de varianza también se puede aplicar a problemas de regresión lineal
y múltiple para evaluar la significancia total de la ecuación de regresión, es decir,
probando la hipótesis nula de que todos los coeficientes poblacionales del modelo de
regresión son iguales a cero. Este tema, sin embargo, se discutirá más ampliamente
en el capítulo dedicado a regresión múltiple.
7.5.2 U
so del programa para resolver análisis de varianza de tres
clasificaciones con efectos fijos
cómo se estructura una matriz con los datos que se introducen en el programa Mini-
tab, para construir una tabla de ANOVA de tres clasificaciones y sus gráficas de efec-
tos principales, de efectos de interacción y de diagnósticos gráficos para la validación
del modelo. Se debe suponer un nivel de significancia de α 5 0.05. Para esto, haga lo
siguiente usando el programa Minitab (versión 14):
a) Siguiendo las instrucciones dadas por el programa Minitab explicadas abajo, cree
una matriz con los datos del problema. Una vez hecho esto, introduzca manual-
mente los datos del problema y, de nuevo, estructure la tabla de análisis de varian-
za de tres clasificaciones.
b) Después, siga las instrucciones a fin de generar gráficas de residuales para la eva-
luación del modelo de ANOVA.
c) Luego, siguiendo las instrucciones del paquete Minitab, haga gráficas para anali-
zar los efectos principales y las interacciones que pudieran suscitarse.
d) Saque todas las conclusiones debidas y analice los resultados de los criterios esta-
dísticos para la evaluación del modelo.
Los datos se dan en la tabla 7.27.
Solución:
Aquí, el factor A tiene tres niveles (i 5 1, . . . , a 5 3); el factor B dos (j 5 1, . . . , b 5
2) y el factor C dos (k 5 1, . . . , c 5 2) o sea 3 × 2 × 2 5 12 posibles combinaciones
de tratamientos. Además, hay l 5 1, . . . , n 5 4 observaciones en cada uno de las abc
combinaciones de tratamientos (celdas) o sea abcn 5 3 3 2 3 2 3 4 5 48 observa-
ciones.
A continuación se muestra el procedimiento para construir una tabla de ANOVA
de tres factores o en tres sentidos para los datos de este problema señalados en la
tabla 7.27.
Capítulo 7 Análisis de varianza (ANOVA) | 351
Figura 7.10. Esquema de los valores de los factores A, B y C (columnas C5, C6 y C7) siguien-
do las instrucciones hasta el inciso 4. Además muestra la columna C8 con los
valores de respuesta introducidos manualmente siguiendo las instrucciones del
inciso 5. Nótese que las primeras cuatro columnas no se usan.
352 | Estadística para ingeniería y ciencias
99
figura 7.11. 1
23.0 21.5 0.0 1.5 3.0
22
10 15 20
Standardized Residual Fitted Value
Histogram of the Residuals Residuals versus the Order of the Data
Standardized Residual
16
Frequency
2 2
Mean of Y
Figura 7.12. Gráfica de efectos principales.
1 2 3 1 2
C
19.5
18.0
16.5
15.0
1 2
9. Para generar las gráficas de los efectos de interacción, vaya nuevamente, a la ven-
tana de Factorial Plots-Interaction y seleccione Options, lo que lleva a la ventana
de Factorial Plots-Interaction, ahí escoja Draw full interaction matrix y ponga
el título de la gráfica, luego seleccione OK. Esto genera la gráfica de los efectos de
interacción. Estas gráficas se observan en la figura 7.13.
12
20 C
1
2
16 C
12
1 2 3 1 2
Conclusiones:
Los efectos principales de los factores A, B y C son significativos sustentados con va-
lores de p muy pequeños. Al juzgar estos valores de p existen efectos principales muy
fuertes entre los factores A, B y C. Las interacciones entre los factores AB son importan-
tes. Sin embargo, las interacciones entre los factores AC y BC no son de importancia.
No obstante las interacciones entre los tres factores ABC son variables importantes del
experimento. En cuanto a la evaluación del modelo de ANOVA de tres direcciones es
decir, de los gráficos de residuales, esto sugiere un buen ajuste del modelo de ANOVA.
354 | Estadística para ingeniería y ciencias
Problemas propuestos
7.1 Los siguientes datos se obtuvieron de un muestreo atmosfé- Tabla 7.32. Tabla con la información requerida.
rico de óxidos de azufre (SO2) proveniente de cuatro lugares
Método A Método B Método C
diferentes. Calcular lo siguiente:
a) Hacer un análisis de varianza con un nivel de significan- 71 90 72
cia de α 5 0.05 y completar la tabla de 7.30. 75 80 77
b) Determinar si hay diferencias entre los cuatro sitios. 65 86 76
Tabla 7.29. Datos del SO2.
69 84 79
Sitio # 1 Sitio # 2 Sitio # 3 Sitio # 4 a) Llenar los espacios en blanco de la tabla 7.33 y probar la
20 25 28 31
hipótesis que no existen diferencias entre los tres prome-
dios poblacionales con α 5 0.05.
17 25 31 15 b) Elaborar una gráfica que muestre la región crítica y la F
calculada.
18 26 34 12
Tabla 7.33. Análisis de varianza.
10 14 17 24
Suma
Fuente Cuadrado Valor
Tabla 7.30. Resultados usando un programa de computadora de los
de g.l. del Fcalc. Ftab. de
como Excel. Llenar las faltantes de la tabla. cuadrados
variación promedio p
(SS)
Fuente Cuadrado
Valor Debido al
de SS g.l. del Fcalc. Ftab.
de p tratamiento
variación promedio 2 228.0 15.78
(variación entre
Debido al los grupos)
261.69 3 1.93
tratamiento
Residual (error)
Residual (variación dentro 130.0 14.4
(error 543.75 45.31 de los grupos)
experimental)
Total 11 586.0
Total 15
7.4 Supóngase que cuatro laboratorios ambientales están analizan-
7.2 Un investigador desea estudiar el efecto de cuatro fertilizan-
do una muestra de un filtro con partículas de plomo atmosféri-
tes diferentes para ver sus efectos en la producción de maíz.
co provenientes de un complejo industrial. Para esto, se quiere
Para esto, se dividió una zona agrícola en 24 parcelas del mis-
saber la efectividad entre los métodos de análisis usados por
mo tamaño y forma. Usar un nivel de significancia de 0.05.
estos cuatro laboratorios. Hacer los siguientes cálculos:
Probar que no hay diferencia entre los cuatro tratamientos.
a) Probar la hipótesis nula H0: µ1 5 µ2 5 µ3 5 µ4, es decir,
Usar el programa Minitab.
que no hay diferencias en los promedios poblacionales de
Tabla 7.31 Producción de maíz bajo cuatro diferentes trata-
mientos de fertilizantes.
los resultados de los análisis de los cuatro métodos dife-
rentes usados por los laboratorios. Establecer la hipótesis
Tratamientos Rendimientos alternativa de este problema.
b) Calcular el valor de la probabilidad p. La tabla 7.34 mues-
Sin aplicación de fertilizante 1) 99 40 61 72 76 84 tra los valores obtenidos por los cuatro laboratorios por los
tres métodos usados por estos cuatro laboratorios. Éste es
Con aplicación de fertilizante 2) 96 84 82 104 99 105 un ejemplo de análisis de varianza con dos factores.
Tabla 7.34. E
stimaciones de los cálculos de los 12 resultados
Con aplicación de fertilizante 3) 63 57 81 59 64 72 por los tres métodos diferentes usados por los cua-
tro laboratorios distintos.
Con aplicación de fertilizante 4) 79 92 91 87 78 71 Método Suma de los
de análisis renglones
Las suposiciones son que las cuatro poblaciones del rendi-
Laboratorio 1 2 3 Ti
miento de maíz están normalmente distribuidas, con las
varianzas de las poblaciones iguales y con las observaciones 1 16 19 24 59
independientes. 2 21 20 21 62
7.3 Para comparar la efectividad de tres muestreadores de gases 3 18 21 22 61
contaminantes atmosféricos, es decir, usando métodos A, B
4 13 20 25 58
y C, se seleccionaron muestras de tamaño cuatro y se regis-
traron los siguientes resultados en ppm. Suma de las
68 80 92 240
columnas (Tj)
Capítulo 7 Análisis de varianza (ANOVA) | 355
Obtener las conclusiones debidas de la hipótesis para los tres torios, ¿qué factores físicos se podrían tomar en conside-
métodos de análisis y decir si se rechaza o se acepta la hi- ración para ver si se pudiera obtener alguna mejoría o
pótesis. reducción del error experimental?
7.5 En un estudio de ingeniería ambiental relacionado con las me- 7.7 Los datos de la tabla 7.37 representan el número de horas de
diciones en el suelo de ozono (O3) (desde el punto de vista de alivio paliativo dado por cinco tabletas diferentes (A, B, C,
la química atmosférica, el O3 troposférico se produce por la D, E), para el dolor de cabeza, que se administraron a 25 su-
interacción de los óxidos de nitrógeno, la temperatura y, hasta jetos, quienes experimentaban dolores de cabeza (migrañas).
cierto punto, por los compuestos volátiles orgánicos y otros Hacer un análisis de varianza para probar la hipótesis al nivel
contaminantes del aire), se recabó la información de un mues- de significancia de 0.05 de que el número promedio de horas
treo de este contaminante atmosférico (O3 en unidades de par- de alivio paliativo dado por las tabletas es el mismo para las
tes por trillón) proveniente de cinco muestreadores localizados cinco tabletas usadas. Calcular los siguientes enunciados:
en cinco diferentes lugares. Hacer los siguientes cálculos. a) Hacer una tabla de análisis de varianza.
a) Establecer la hipótesis nula y la hipótesis alternativa de b) Calcular el valor de la probabilidad p e interpretarla acor-
que no hay diferencias entre las cinco poblaciones de O3 demente.
muestreadas, con α 5 0.05. Tabla 7.37. Horas de alivio con las cinco tabletas.
b) Hacer una tabla de ANOVA que incluya la F crítica.
c) Calcular e interpretar el valor de la probabilidad p. Tipos de tabletas
Tabla 7.35. D
atos de ozono con los números de los mues- A B C D E
treadores.
5 9 3 2 7
1 2 3 4 5 4 7 5 3 6
55.1 59.5 63.9 41.7 56.3 8 8 2 4 9
45.7 58.0 61.5 44.9 63.1 6 6 3 1 4
45.0 50.8 51.1 51.7 52.2 3 9 7 4 7
73.1 58.3 57.3 43.8 61.3
7.8 En un estudio de ingeniería de usos del agua, específicamente,
49.9 63.3 64.8 41.5 65.6 de contaminación de corrientes, a fin de revisar que no hu-
63.2 51.7 67.7 55.5 67.9 biera descargas industriales, previo a un proyecto de dilución,
se analizó la demanda bioquímica de oxígeno de cinco días
7.6 Supóngase que 15 personas han sido seleccionadas de una (DBO)5 en mg/L. Para esto, se hizo un muestreo aleatorio a lo
población con problemas de obecidad y han sido separados largo de la corriente, es decir, en cuatro lugares diferentes. Para
al azar dentro tres grupos. Cada grupo fue alimentado con tales fines hacer los siguientes cálculos:
tres tipos de comidas diferentes para perder peso, es decir, a) Hacer un análisis de varianza usando un nivel de signifi-
alimentos 1), 2) y 3). Después de algún tiempo, los pesos que cancia de 0.05. Observar si hay diferencias entre las con-
perdieron los participantes de los tres grupos se registraron centraciones de DBO de los cuatro lugares muestreados.
en la tabla 7.36: b) Si no se pudiera rechazar la hipótesis nula de desigual-
Tabla 7.36. Pesos perdidos (gramos) de los participantes. dad de las cuatro poblaciones de concentraciones de la
demanda bioquímica de oxígeno (DBO5), ¿qué factores
Tipos de comidas estadísticos se deberían tomar en consideración?
c) ¿De acuerdo con estudios de contaminación de corrien-
Tipo (1) Tipo (2) Tipo (3)
tes, con qué objeto se tendría que hacer este tipo de estu-
42 112 70 dio analítico?
96 96 17 Tabla 7.38. Resultados del muestreo del DBO en mg/L.
81 88 49
Sitio # 1 Sitio # 2 Sitio # 3 Sitio # 4
95 135 24
20 25 28 31
76 119 40
17 25 31 15
Estos datos están en conformidad con un factor de un diseño
18 26 34 12
completamente aleatorio. Un factor es el alimento dado a la
muestra. Esto es un diseño completamente aleatorio, porque 10 14 17 24
las unidades experimentales de los 15 sujetos han sido asig- 7.9 Se diseñó un experimento de ingeniería agrícola en el cual
nadas aleatoriamente a los tres tipos de comidas. Hacer lo se usaron dos parcelas de tierra arenosa y de tierra arcillosa.
siguiente: Además, se aplicaron cuatro niveles de fertilizantes es decir,
a) Decir qué tipo de análisis de varianza se está usando. sin ninguna aplicación, con niveles bajo, mediano y alto. La
b) Hacer la tabla del análisis de varianza para la muestra y cantidad de agua de irrigación fue uniforme, así como las
sacar conclusiones al respecto. temperaturas y los tipos de semillas plantadas. Aplicar el ex-
c) Evaluar el modelo de ANOVA usando criterios o diag- perimento de ANOVA apropiado y sacar todas las conclusio-
nósticos gráficos. nes debidas acerca de este experimento. La tabla 7.39 da la
d) Si se revirtiera este problema a un diseño de bloques alea- información requerida.
356 | Estadística para ingeniería y ciencias
Tabla 7.39. Información requerida para este experimento de carburador, mismo tipo de aceite, mismo tipo de man-
agrícola. tenimiento, mismo peso, mismas temperaturas ambientales,
Nivel de fertilizante mismo millaje, igual edad y tamaño del motor, etc. Probar la
hipótesis de que no hay diferencias en el kilometraje de los
Tipo de coches probados usando α 5 0.01. Suponer un análisis de
Nada Bajo Mediano Alto
tierra varianza de bloques completamente aleatorizados y aplicar
Arcillosa 3.0 3.5 3.9 4.5 un programa de computadora para resolver este problema.
3.1 3.4 3.8 4.4 Tabla 7.42. Kilometrajes por litro de los 4 coches pro-
bados.
Arenosa 2.5 3.0 3.4 4.0
Kilometraje
2.4 2.9 3.3 3.9
Coche núm.
a) Hacer una tabla de ANOVA.
1 2 3 4 5
b) Hacer gráficas que muestren los efectos principales e in-
terpretarlos acordemente. 1) 13 16 15 12 11
c) Hacer gráficas con los efectos de interacción e interpre- 2) 22 24 14 20 18
tarlos acordemente. 3) 18 17 16 15 13
7.10 Se hace un estudio de química ambiental entre el nivel de
4) 39 38 28 31 34
acidez en términos de pH (factor A) y la concentración de
cloro (factor B) en el agua. Aquí se supone un análisis de 7.13 Este ejercicio es una adaptación del libro de Montgomery
varianza de dos vías con un diseño completamente aleatori- et al., Probabilidad y estadística aplicadas a la ingeniería p. 672,
zado. Los datos se dan en la tabla 7.40. Hacer una tabla de (1996) el cual cita un artículo publicado en el American Indus-
análisis de varianza y sacar las conclusiones debidas. trial Hygiene Association Journal (vol. 37, 1976, pp. 418-422).
Tabla 7.40. Datos de este problema del pH y la concentración Este estudio describe una prueba de campo para detectar la
de cloro. presencia de arsénico en muestras de orina. La prueba ha
Nivel del pH
sido propuesta para su uso entre trabajadores forestales de-
bido al uso cada vez mayor de arsénico orgánico en dicha
pH 5 7.0 pH 5 7.2 pH 5 7.4 pH 5 7.6 industria. El experimento compara los resultados obtenidos
con la prueba al ser efectuada por un inexperto y un entrena-
Nivel de concentración de cloro
dor experimentado con el análisis efectuado en un laborato-
Baja 22 17 8 6 rio remoto. Para la prueba se escogen cuatro sujetos, los cua-
Mediana
les son considerados como bloques. La variable de respuesta
9 11 7 4
es el contenido de arsénico (en ppm) en la orina del sujeto.
Alta 8 8 6 5 Los datos son los siguientes:
Tabla 7.43. Datos del problema.
7.11 Éste es un experimento de análisis de varianza que se hace
para cumplir con los llenados de la tabla de ANOVA. Para Sujeto
esto se da la tabla 7.41 de ANOVA. Suponiendo un nivel Prueba 1 2 3 4
de significancia de α 5 0.05, hacer lo siguiente: llenar los Inexperto 0.05 0.05 0.04 0.15
faltantes de la tabla de ANOVA y decir qué diseño se usó.
Decir si la interacción entre los dos factores A y B es signifi- Experto 0.05 0.05 0.04 0.17
cante. Incluir en la tabla el valor crítico de F. Laboratorio 0.04 0.04 0.03 0.10
Tabla 7.41. Tabla de ANOVA. (Llenar los faltantes.) Fuente: Adaptación del libro de Montgomery, et al. (1996), Probabilidad y esta-
dística aplicadas a la ingeniería. McGraw-Hill Interamericana Editores
Fuente de Valor S.A. de C.V., (1996).
g.l. SS MS Fcalc. Fcrítica
variación de p a) ¿Existe diferencia alguna en el procedimiento de prueba
Factor A 1 382.72 de arsénico?
b) Analizar gráficamente, los residuos de este experimento.
Factor B 2 503.72
7.14 Cuatro niveles de fertilizantes se usaron en un experimento
Interacción 2 1020.06 agrícola con dos niveles de agua, es decir, frugal y abundan-
te. Los ocho tratamientos fueron asignados aleatoriamente
Error 192.67
a ocho parcelas. La respuesta es en toneladas por hectárea.
Total 17 3622.94 La tabla 7.44 da la información requerida.
Tabla 7.44. Datos de este problema.
7.12 Este es un ejercicio relacionado con una investigación para
determinar el consumo de gasolina (por litro) de cuatro co- Nivel de fertilizante
ches. Para esto, se agrupan los cuatro tipos de autos tratan-
Nivel de agua Nada Bajo Mediano Alto
do de homogenizar o de controlar las variables que pudie-
ran afectar el consumo de gasolina (bloqueo para eliminar Poca agua 3.0 3.3 3.7 3.1
las variables no deseables). Las variables controladas son Mucha agua 2.3 4.0 4.3 5.0
caballajes del motor, mismo rodaje de llantas, mismo tipo
Capítulo 7 Análisis de varianza (ANOVA) | 357
a) Generar la matriz de datos e introducirlos a la hoja del acción en la decisión de rechazar o aceptar la hipótesis
programa Minitab. sustentada?
b) Usar el modelo más apropiado de ANOVA y hacer una 7.17 En un experimento de agronomía se estudió el rendimiento
tabla de análisis de varianza. de trigo usando tres niveles diferentes de fertilizantes fosfa-
c) Hacer una gráfica que muestre los efectos principales de tados, es decir, bajo, mediano y alto. Como segundo factor
los dos factores y de los efectos de interacción y decir si se usaron tres variedades distintos de semillas de trigo (1, 2,
son significativos. 3) haciendo, con esto, un total de nueve combinaciones de
e) Evaluar la utilidad del modelo de ANOVA a través de tratamientos. De esta manera, cada combinación de trata-
diagnósticos gráficos de residuales. miento se asignó aleatoriamente a una de las 27 parcelas (de
7.15 En un estudio hipotético de ingeniería del aire, de difusión extensiones de dos hectáreas), de tal manera que tres parcelas
atmosférica situando los sensores para medir la calidad del recibieron cada tratamiento. Los rendimientos de trigo, en
aire con respecto a SO2 a tres diferentes distancias y a tres toneladas métricas se dan en la tabla 7.47.
distintas alturas, hacer lo siguiente: suponiendo α 5 0.05. Tabla 7.47. Rendimiento de la cosecha de trigo en toneladas
a) Estructurar una matriz con los datos e introducirlos a la métricas.
hoja del programa Minitab.
Nivel del fertilizante
b) Hacer una tabla de ANOVA.
c) Analizar las gráficas de los efectos principales y de los Variedad de la
Bajo Mediano Alto
efectos de interacción que pudieran ocurrir entre los fac- semilla
tores de distancias y alturas. 7 10 12
La tabla 7.45. Muestra la información requerida para este 1 10 10 14
problema.
9 12 12
Tabla 7.45. C
oncentraciones (ppm) de SO2 para este 8 12 17
problema.
2 10 14 16
Distancias en metros
8 13 17
Alturas 1 000 1 500 2 000 9 14 16
A nivel del mar 350 250 100 3 10 14 18
300 metros 280 210 90 12 16 21
500 metros 250 190 70 a) Aplicar la función de ANOVA más apropiada para este
7.16 Las siguientes observaciones se obtuvieron de un diseño experimento y sacar las conclusiones debidas.
de bloques aleatorizados, es decir, de seis poblaciones nor- b) Hacer una gráfica de residuales para el rendimiento de
males. La finalidad de este ejercicio es analizar las dife- trigo.
rencias entre un ANOVA con bloques aleatorizados y un 7.18 Este estudio tiene el fin de que el lector adquiera destreza en
análisis de varianza sin agrupar las características de las el cumplimiento del llenado de tablas de análisis de varian-
observaciones de este diseño experimental. La tabla 7.46 za. Para tal efecto, se pide completar la tabla de ANOVA
da la información requerida. 7.48 y decir qué diseño se usó.
Tabla 7.48. Datos del problema.
Tabla 7.46. Datos de este experimento de bloques aleatoriza-
dos. Fuente de Valor
SS g.l. MS Fcalc. Ftab.
variación de p
Tratamientos
Debido a los
2 000 10
Bloques 1 2 3 4 5 6 tratamientos
1 20 31 29 25 35 31 Debido a las
1 200
columnas
2 27 28 32 34 30 33
Debido a los
7 400 5
3 19 23 27 30 28 27 renglones
4 23 23 25 32 29 28 Residual 25
5 21 20 19 18 25 26 Total 12 000 45
Regresión lineal
simple y múltiple
La radiación electromag-
nética (UV-C, UV-B y UV-A)
está localizada entre 100 y
380 nanómetros (nm). Por
ejemplo, la radiación UV-C
(la más dañina) de longitud
de onda de 100-280 nm,
es totalmente absorbida
por el ozono estratosférico,
el vapor de agua, O2 y CO2,
por lo que no llega a la Tie-
rra. La radiación UV-B está
localizada entre 280-315
nm en el espectro electro-
magnético y es muy dañina
para los seres vivos, por-
(Jupiter Images Corporation)
que parte de la radiación
que llega a la Tierra está ligada a daños genéticos (DNA), cáncer en la piel y cataratas. Según la NASA la
radiación UV-B causa incrementos en las concentraciones de ozono a ras del suelo. Igualmente, la radiación
UV-A está localizada entre longitudes de onda de 315-380 nm, y aunque no es tan perjudicial como la UV-B,
este tipo de radiación causa envejecimiento prematuro de la piel.
La escala del índice de radiación ultravioleta, varía de , 2 hasta . 11 (extremo).
Introducción
Este capítulo estudia la regresión lineal simple y múltiple. Discute la aplicación de diagnósticos estadísticos
y gráficos para la evaluación del modelo de regresión seleccionado. También estudia intervalos de confianza
para los coeficientes del modelo de regresión y así sucesivamente.
Para fines de aplicaciones prácticas, a fin de calcular las concentraciones de radiación ultravioleta, se puede
estructurar un modelo de regresión lineal múltiple de la forma de Y 5 b0 1 b1X1 1 b2X2 1 . . . 1 bkXk, cuyo
modelo poblacional es Yj 5 β0 1 β1X1j 1 β2X2j 1 . . . . . . . 1 βkXkj 1 εj . En este caso, la variable de respuesta
sería el índice de radiación ultravioleta. Las variables independientes serían latitud, altitud, hora del día, esta-
ción (verano, invierno), presencia de nubes, bruma, concentraciones de contaminantes atmosféricos (partículas
orgánicas e inorgánicas, ozono a ras del suelo, etc.), y la concentración de ozono estratosférico arriba del lugar
donde se aplique el modelo.
360 | Estadística para ingeniería y ciencias
En esta sección veremos el problema de regresión lineal de una variable dependiente (Y) y otra indepen-
diente (X), con fines de predicción y estimación. Sin embargo, una vez que se obtiene la ecuación de regresión
lineal, ésta se tiene que evaluar o validar para ver qué tanta fidelidad se le puede poner al modelo para usos de
predicción. Esto se logra utilizando enfoques objetivos y subjetivos. Por ejemplo, el enfoque objetivo se logra haciendo
pruebas estadísticas de inferencia. Este enfoque se complementa usando enfoques subjetivos, es decir, analizando las grá-
ficas de los residuales estandarizados o no estandarizados (crudos), es decir, a través de inspecciones visuales.
8.1.2 A
plicación de análisis objetivos estadísticos para la evaluación
del modelo de regresión
En cuanto al enfoque objetivista (estadística inferencial), para la validación del modelo de regresión, éste se
relaciona con el uso de estadísticas como el coeficiente de determinación múltiple R2 (o r 2), el coeficiente de
determinación ajustado R2ajustada, el error estándar estimado s, tablas de análisis de varianza, pruebas de t de Stu-
dent, intervalos de confianza, el criterio de Mallow de Cp, PRESS, y así sucesivamente. De esta manera, cuando
se habla de coeficientes en el modelo de regresión múltiple, existen cuatro tipos:
a) El coeficiente de determinación múltiple (R2).
b) El coeficiente de correlación múltiple (R).
c) El coeficiente de determinación ajustado (R2ajustada).
d) El coeficiente parcial de correlación múltiple (Rij.k ).
El coeficiente de determinación múltiple R2 es, tal vez, la medida estadística más popular usada para
medir el grado de ajuste del modelo de regresión con los datos de la muestra. El coeficiente R2 es el coeficiente
entre la variación de Y debida al modelo de regresión lineal entre la variación total de Y. Este término toma
valores entre 0 y 1, y multiplicado por 100 determina el porcentaje de variación debido al modelo de regresión.
Si el valor de R2 está cercano a cero, esto indica que no hay una relación lineal entre Y y las X, mientras que,
un valor cercano a uno, indica un ajuste perfecto. Sin embargo, el valor del coeficiente R2 no debe de interpretarse
ligeramente, sin el apoyo del error estándar estimado, del residual (PRESS), del criterio de Mallow (Cp) o de los factores
de variación inflados (variance inflation factors, VIF). Además, la validación del modelo debe estar apoyada por los
análisis de los gráficos subjetivos.
De acuerdo con la lógica del programa de computadora NCSS, los siguientes enunciados dan algunas
calificaciones de la interpretación de R2.
a) El valor de R2 puede incrementarse agregando más variables independientes, pero esto puede causar
un aumento en el error del cuadrado medio, especialmente, cuando la muestra es pequeña.
b) La magnitud de R2 está influenciada por el rango de cada variable independiente. R2 aumenta a medi-
da que el rango de las X se incrementa y viceversa.
c) El valor de R2 no mide la magnitud de las pendientes.
d) La magnitud de R2 no mide la aptitud del modelo lineal; mide la fuerza lineal del componente del
modelo.
e) Un valor grande de R2 no necesariamente significa una predicción grande. Lo opuesto también es
correcto. Todo esto tiene que ser complementado o corroborado por otras funciones estadísticas y por
el análisis gráfico subjetivo.
f ) El valor de R2 es altamente sensible al número de observaciones. Entre más grande sea el tamaño de
la muestra, más alto será el valor de R2.
362 | Estadística para ingeniería y ciencias
Más adelante hay lo que se llama el valor ajustado del coeficiente de determinación múltiple ajustado
(R ajustada). Este coeficiente de determinación múltiple ajustado R2ajustada es una versión ajustada de R2, la cual
2
busca remover la distorsión causada por un tamaño de muestra pequeño. Igualmente, también hay lo que se
llama PRESS (predicted sum of squares), que se usa para validar el modelo de regresión en términos de predic-
ción. Aquí, entre más pequeño sea el valor de PRESS, mejor será el modelo candidato.
En forma análoga, también hay lo que se llama el coeficiente de correlación múltiple R. Este coeficiente
R mide la fuerza de la relación lineal entre la variable dependiente Y y las variables independientes X1, X2, X3,
. . . , Xk. En contraste con el coeficiente de correlación lineal simple, el rango de este coeficiente de correlación
múltiple es de 0 # R # 1. Esto se debe a que R no indica la pendiente de la ecuación de regresión debido a que
no es posible indicar los signos de todos los coeficientes de regresión que relacionan la variable dependiente Y
a la variable independiente Xi. Así como en el caso de la correlación lineal, la medición de R2 es más fácil de
interpretar que el coeficiente de correlación múltiple, R.
Otro tipo de correlación relacionado con regresión y correlación múltiple es lo que se llama coeficiente
parcial de correlación múltiple. Este coeficiente mide la fuerza de la relación lineal entre la variable dependien-
te Y y las variables independientes X1, X2, X3, . . . , Xk. Este coeficiente se puede expresar como Rij.k, que es el
estimador del coeficiente de correlación múltiple poblacional ρij.k. Rij.k se puede usar para ver la relación causal
entre Y y una de las variables independientes, manteniendo las demás constantes. Este coeficiente, también se
puede usar para ver la relación entre dos variables independientes.
Prosiguiendo dentro de la categoría de análisis objetivos de estadística inferencial relacionados con regre-
sión múltiple, tenemos lo que se llama análisis de varianza (ANOVA) discutido en el capítulo 7; en forma aná-
loga como el uso de R2, este análisis es un método complementario para revisar las suposiciones del modelo de
regresión. La fidelidad de los resultados del ANOVA está mancomunada a la suposición de que los residuales
están normalmente distribuidos. El uso de ANOVA prueba los promedios poblacionales donde se analiza la variación
total. ANOVA evalúa la utilidad del modelo de regresión probando la hipótesis nula de que todos los coeficientes (βi) de
la ecuación de regresión (pendientes) son iguales a cero. Los componentes del análisis de varianza o de ANOVA son
parecidos a los del análisis de varianza simple dados en capítulos anteriores. Los componentes son la fuente
de variación, los grados de libertad, la suma de los cuadrados, el cuadrado del promedio, la prueba de F y el
nivel de probabilidad. Por ejemplo, la fuente de variación representa las particiones de la variación en Y. Hay
cuatro fuentes de variación: intercepto, modelo, residuo o error y total ajustado. La prueba de inferencia con
la estadística F se usa para probar la hipótesis de todas las βi 5 0.
Más importante todavía es el cálculo del nivel de probabilidad p. El valor de p es la probabilidad de ob-
tener un estadístico de prueba, al menos tan contradictorio o más extremo para H0:, como el valor observado
que se obtuvo, asumiendo que H0: es verdadera. Si el valor de p es menor qué, digamos α 5 0.05, la hipótesis
nula se rechaza; de otra manera se retiene. Entre más pequeño sea el valor de p, más certidumbre habrá en la
hipótesis alternativa, Ha:.
Otras funciones estadísticas usadas en la evaluación de la utilidad del modelo de regresión son los llama-
dos VIF (por sus siglas en inglés de Variance Inflation Factors), la estadística Cp de Mallow y la estadística de
Durbin-Watson. Los factores de varianza inflada (VIF) están relacionados con problemas de multicolineali-
dad, los cuales causan toda clase de problemas con el análisis de regresión. En forma análoga, el diagnóstico
Cp da el número óptimo de variables para el modelo de regresión. De manera semejante, la estadística Durbin-
Watson está relacionada con la autocorrelación. Usualmente, este criterio se usa para probar por correlación
en serie de primer orden positiva o negativa.
Otros estadísticos objetivistas para validar el modelo de regresión son las pruebas individuales de t de
Student para probar la hipótesis de que β1, β2, β3, βk son iguales a cero. Además, se pueden usar los intervalos
de confianza. Por ejemplo, en regresión múltiple el valor de t de Student se usa para probar la hipótesis de
que uno de los coeficientes es igual a cero, después de remover la influencia de los otros. Los investigadores
Capítulo 8 Regresión lineal simple y múltiple | 363
Paffenberger et al. (1987) dan la función para el intervalo de confianza para βi. Sin embargo, si se concluye que
β1 o βk no son igual a cero esto no necesariamente dice que el modelo de regresión es útil para predicción. En
verdad, para determinar si el modelo es apropiado, en lugar de probar que β1 5 0 y β2 5 0, separadamente
(usando la prueba de t), se usa una prueba conjunta, como el análisis de varianza (ANOVA).
8.1.3 A
plicación de análisis gráficos subjetivos para la evaluación
del modelo de regresión
En cuanto al uso de análisis de gráficos para evaluar la utilidad del modelo de regresión, esto se logra anali-
zando los gráficos de los residuales crudos o estandarizados. Los residuales estandarizados son los residuales
ei divididos entre una estimación de su desviación estándar. Estos residuales estandarizados toman en consi-
deración que los residuales pueden tener diferentes varianzas, lo cual hace que sea más fácil detectar valores
inusuales extremos. El programa Minitab considera valores extremos aquellos residuales mayores que 2 o
menores que 22. Los residuales crudos o regulares son la diferencia entre la respuesta actual (Y ) y el valor
estimado del modelo.
De acuerdo con la lógica del programa de computadora Minitab los diagnósticos gráficos subjetivos se
dan como:
a) Histograma de residuales
b) Gráfica normal de residuales
c) Gráfica de residuales en función de los valores ajustados
d) Gráfica de residuales versus órdenes
El histograma de residuales son herramientas exploratorias para analizar las características de los datos
como valores inusuales, variación y forma. Cuando el error de la variable es aproximadamente normal, el
histograma tiene forma de campana.
Con respecto a la gráfica normal de residuales, los puntos en ésta, por lo general, deberán formar una
línea recta, si los residuales están normalmente distribuidos. Si no es así, la suposición de normalidad puede
invalidarse. Así, los valores de la variable aleatoria estadística ei deben estar normalmente distribuidos. Para
lograr esto, se grafican los residuales de la variable dependiente en función de los valores de z o normales
esperados. Para que se reúna la condición de normalidad de los datos, todos los puntos deben estar dentro
de las bandas de confianza muy cercanos a la línea de regresión. Además, si los términos del error ei están
normalmente distribuidos, los residuales deberán estar, de manera aproximada, de acuerdo con las reglas del
68%, 95% y 99.7%. Esto quiere decir que el 68% de los residuales deberán estar entre z 5 61; el 95% entre z
5 62 y, finalmente, el 99.7% de los residuales entre z 5 63.
Con relación a la gráfica de residuales, en función de valores ajustados, ésta debe mostrar aleatoriedad de
los residuales con, aproximadamente, el mismo número de residuales positivos y negativos, sin tendencias de-
finidas que indiquen colinealidad o correlación en serie, es decir, falta de independencia entre las variables.
Por último, la gráfica de los residuales versus órdenes está relacionada con todos los residuales en el orden
en que los datos se coleccionaron y se usa para encontrar errores no aleatorios, especialmente de efectos rela-
cionados con el tiempo.
Otros factores que tienen que revisarse es lo que se llama homoscedasticidad o sea cuando la variable
aleatoria ei tiene la misma varianza, lo cual se hace graficando los residuales contra cada valor de las variables
independientes (Xi). Aquí, tiene que haber la misma cantidad de valores positivos y negativos expresados en la
gráfica, lo cual se denomina homoscedasticidad. Sin embargo, de no ser así, existe el problema de heteroscedasti-
cidad, mismo que se retomará en el capítulo de regresión polinomial.
364 | Estadística para ingeniería y ciencias
Recapitulando lo anterior, las condiciones o suposiciones requeridas para validar el modelo, subjetiva-
mente, se hacen a través de los análisis de los residuales crudos o no estandarizados. Como se dijo antes, los
llamados residuales se definen como las diferencias entre el valor actual de Y y el valor pronosticado de Y por
el modelo de regresión estimado. Los residuales se denotan por ei, esto es, ei 5 Yi 2 Y9i. Las gráficas de los resi-
duales dan información muy importante acerca de la naturaleza y fuerza de la relación entre las variables. La figura 8.1
muestra los residuales que son las diferencias entre los valores de Y1, Y2, Y3, . . . , Yk y los valores observados
de Y91, Y92, Y93, . . . , Y9k de la línea de regresión de la muestra. Por otra parte, los residuales estandarizados se
obtienen dividiéndolos entre sus respectivas desviaciones estándares.
50 y1 y 1
40
30 y2 y 2
y3 y 3 y4 y 4
20
10 y5 y 5 y6 y 6
x
0 5 10 15 20
Σ Y Σ X Σ X Σ XY n Σ X Σ X X
n n i 512i Σ 2 i 5 1 Σ n 2 i5n 2
222
Y i5 1n Σ X 2
n2 i 5 1 Σ X XY 1 Σ
n X i 5 1 Σ
51 i 5 1 i 51 i 5 1 1
i 5
Intercepto 5 a 5 i Σ Y Σ X
Σ
i 51 i 51
2 X
i 51
Σ
XY n Σ
X Σ
i 5 1
2 X
51 i 51 i 5 1
n n n n n n2 n n 2
2
– n–Σ XY
n
n
5n Y 2bX nn Σ XY 2 n2 Σ X X
i 5 1 i 5 1 i 5 1i Σ iΣ YnY
5 1 Σ
n i Σ n1 XΣ X
5n
2 2 Σ X
2 2
i 5 1 Σ X (8-5)
5 1 i 51 2
i 5 1 i 5 1
n
i 51Σ XY 2 Σ X Σ
i5 1 i 5 1 Y n Σ X Σ
i 5 1
2 X
2
i 51
n
n2 n n 2
n Sxx 5 Sxxi Σn X
55 1 Σ X
22 2 Σ X
2i 5 1 Σ X n n
2 i 51 i 51
n n n
Σ XY 5 a ΣX 1 b Σ X
i 51 i 51 i 51
nnn nn
ΣΣ YY
n
12bb ΣΣ nCapítulo 8 n | 365
2
5 2 ymúltiple
n n n n
5an an1 Regresión lineal simple
i Σ Y111 Σ X i2 5111 Σ X
i 5 1 i Σ XY n Σ X 2 Σ X
i 5 1
iii5
55 ii55
nnn
51 i 51
nn
51 i 51
n nnn
ΣΣ XY XY5 5aaΣΣX X1 1bb ΣΣ X X
iii5
n 55111
n iii55 5111
iii5
n 55111
n
n
2
Pendiente 5 b 5 n Σ XY 2 ΣnnnX Σ Y nnn nnn Σ X 2 2 Σ X nn 222 (8-6)
i 5 1 nnn 222 n 222 n
nn
ΣΣ YY ΣΣ X ΣΣ XY
i 5 1 i 5 1 ni 5 1 i 5 1
X 2
2 Σ Σ XX XY nn Σ Σ XX 22 Σ
Σ X X
Sxyii/i555S111xx iii555111 2 iii555111 iii555111 iii555111 iii555111 (8-7)
n
n
Donde: Sxx 5 ΣnnnX 2 2 Σ nnnX n
i 521se dan por n 222
Σxy y Σx i5 1 ecuaciones n
n n nnn nn
Σ nnni iΣ Σ XY XY2 2 ΣΣlas X X ΣΣ YY (8-8) nn ΣyΣ (8-9).
XX2222 2 ΣΣ X X
5
i 515 1 1 i 5 1 i 5 1 i 5 1
n i i
5 5 1 1 i i
5 5 11 i i
5 5 11 iii555111
• Las siguientes ecuaciones son S
muy 5importantes.
Σ XY 2 Σ X ΣY n
xy i 51 i 51 222
nnn
2 nnn
8.2.2 C
álculo del coeficiente de correlación R de la muestra
que estima a r, el coeficiente de correlación poblacional
Como se dijo antes, el coeficiente de correlación R, que estima a ρ, también se llama coeficiente de correla-
ción de Pearson. Este coeficiente es un índice de la fuerza de la asociación lineal entre las variables X y Y. El
coeficiente de correlación R es:
Sxy
(8-14)
R
Sxx Syy
Donde Sxy , Sxx , Syy se dan por las ecuaciones (8-8), (8-9) y (8-10).
366 | Estadística para ingeniería y ciencias
Nota: El coeficiente de correlación R explica el grado de asociación entre las variables X y Y. Este
coeficiente R varía de 21 a 0, si la correlación es negativa, con pendiente negativa. Pero, si la
correlación es positiva, entonces, R varía de 0 a 1. Así, a medida que R se aproxima a 61, mejor
asociación habrá entre las variables X, Y y σ2 será igual a 0. Nótese que, en caso de la regresión li-
neal múltiple, hay lo que se llaman coeficientes parciales de regresión para medir la relación lineal
entre la variable dependiente Y y la variable independiente especificada.
x x x x x x x x x
a) a) a) b) b) b) c) c) c)
x x x x x x x x x
a) a) a) b) b) b) c) c) c)
d) e) f)
y y y y y y y y y
y y y y y y y y y
x x x x x x x x x
a) simple y múltiple
Capítulo 8 Regresión lineal | 367 b)
a) b) c)
y
y y y y
x x x x x
a) b) c)
a) b)
Figura 8.3. Diagramas de dispersión donde se muestra una correlación cero. Por ejemplo, la figura
a) representa un diagrama esparcido donde no hay ninguna asociación o correlación
entre las variables y . La figura b) representa una relación no lineal (posiblemente una
parábola) entre las variables y . La figura c) representa también una correlación no
lineal y las variables y posiblemente una parábola con curvatura negativa.
y entre
Donde:
b 5 Sxy Sxx
t[12α/2;n22] 5 valor de la distribución de t de Student
Sxy 2 bSxy
s5 (8-16)
n 22
5 SSE/(n 2 2)
2
s ∑ 2
i 2
s ∑ 2
i
i 1 i 51
a αx a (8-18)
nSxx nSxx
368 | Estadística para ingeniería y ciencias
Donde:
a ya se definió anteriormente
t[12α/2;n22] 5 a un valor usando la distribución de t de Student con ν 5 n 2 2 grados de libertad
s ya se definió de la ecuación (8-16)
Sxx ya se definió de la ecuación (8-9)
1 1
Y09 2 t[α/2;ν] s 1 (X0 2 –
X )2/Sxx , μY|X , Y09 1 t[α/2;ν] s 1 (X0 2 –
X )2/Sxx (8-21)
n n
Donde:
Y09 5 a 1 b X0 5 valor de la línea de regresión con un valor de X0 dado (8-22)
Capítulo 8 Regresión lineal simple y múltiple | 369
t[α/2;n22] 5 valor de la distribución de t con un nivel de significancia de α 5 0.05 o bien 0.01 con ν 5 n 2 2
grados de libertad
a, ya definida anteriormente
s, ya definida anteriormente
X0 5 un valor dado
–
X 5 promedio de la muestra
8.2.9 H
ipótesis nula H0: b 5 0 contra las hipótesis alternativas
H1: b 0 y H2: b 0
Para hacer esta prueba usamos la distribución de t de Student con ν 5 n 2 2 grados de libertad. La función esta-
dística usada para tales fines es:
8.2.10 H
ipótesis nula de H0: a 5 a0 contra las hipótesis alternativas
H1: a 0 y H2: a 0
Para hacer esta prueba de hipótesis se usa la estadística de t de Student mostrada abajo:
a 2F 0
t5 n
(8-24)
s ¨x 2
i
/ nSxx
i51
Donde:
s, ya definida anteriormente
b ya definida anteriormente de la ecuación (8-7)
Aquí también se tiene que establecer las regiones críticas usando la distribución de t de Student. Estas regio-
nes críticas son: t[12α/2;ν], donde α es el nivel de significancia usado.
370 | Estadística para ingeniería y ciencias
8.2.11 P
ruebas de hipótesis H0: r 5 0, contra la hipótesis alternativas
H1: r 0, para el coeficiente de correlación poblacional r
estimado por R
Para estos fines se usa la estadística de t de Student:
t 5 vR / 1 2 R 2
(8-25)
Donde:
R 5 Sxy S / Sxx Syy (8-26)
ν 5 n 2 2 grados de libertad
Aquí, nuevamente, para calcular las regiones críticas se usa la t de Student, es decir, t[α/2;n22].
Ejemplo 8.1. Este problema está relacionado con un estudio acerca de la cantidad de precipitación
pluvial y la remoción de contaminación atmosférica.
Lluvia
18 7 14 31 21 5 11 16 26 29
(0.066 cm)
Remoción de
55 17 36 85 62 18 33 41 63 87
contaminación
50.0 Y
25.0
0.0 x
0.0 8.8 17.5 26.3 35.0
Figura 8.4. Gráfica que muestra Y versus X, con una línea recta horizontal corres-
–
pondiente al valor del promedio de Y 5 49.7000.
90 5
Residual
50 0
10 25
1 210 210
25 0 5 10 20 40 60 80
Residual Fitted Value
Histograma de residuales Residual versus the Order of the Data
3
Frecuencia
5
Residual
2
0
1 25
0 210
28 24 0 4 1 2 3 4 5 6 7 8 9 10
Residual Orden de observación
• Para el análisis de varianza (ANOVA), que también sirve para validar el mo-
delo de regresión, es una función estadística objetivista que prueba la hipótesis
nula de que la pendiente es igual a 0. Aquí se verá que un valor grande de F in-
dica que el modelo de regresión seleccionado es útil. Sin embargo, es necesario
analizar todos los demás criterios antes de emitir un juicio final. La tabla 8.2 de
ANOVA da los resultados.
Tabla 8.2. Análisis de varianza (ANOVA) para el ejemplo 8.1.
Fuente de Suma de los Cuadrado del Valor
g.l. Fcalc. Ftab.
variación cuadrados promedio de p
Debido al
5 396.77 1 5 396.77 202.38 5.32 0.00001
tratamiento
Residual
213.33 8 26.67
(error)
Total 5 610.1 9
Tabla 8.3. Valores del intercepto, pendiente, pruebas t de Student, valor del nivel
de p y sus intervalos.
Aquí, nótese que el intervalo de confianza para el intercepto es muy amplio y la hipóte-
sis no se puede rechazar, puesto que el valor de t es muy pequeño y el valor de p 5 0.79
es grande. Esto lo apoya el valor de 0.79 de p y un error estándar de 3.79, relativamente
grande; lo contrario ocurre con las pruebas estadísticas de la pendiente, cuyo valor de
t es grande y de p es muy pequeño.
Ejemplo 8.2. En un estudio de microbiología ambiental, en muestras de agua, se dieron los datos
de la tabla 8.4. Estos datos se refieren al crecimiento de una colonia de bacterias en un
medio de cultivo.
Tabla 8.4. Datos del ejemplo 8.2.
Tiempo en días
de inoculación 3 6 9 12 15 18
(X )
Núm. de
115 000 147 000 189 000 230 600 257 900 286 400
bacterias (Y )
Solución:
a) La gráfica con el número de bacterias en función del tiempo de inoculación es la
figura 8.6.
300 000
Número de bacterias (Y)
250 000
200 000
150 000
100 000
5 10 15 20
Tiempo de inoculación (X)
99 2
90 1
Porcent
50 0
10
21
1
22 21 0 1 2 1000000 1500000 2000000 2500000 3000000
Standardized Residual Fitted Value
Histogram of the Residuals Residual versus the Order of the Data
Standardized Residual
1.00 2
Frecuency
0.75 1
0.50 0
0.25
21
0.00
21.5 21.0 20.5 0.0 0.5 1.0 1.5 1 2 3 4 5 6
Standardized Residual Orden de observación
Ejemplo 8.3. En un estudio de agricultura, relacionado con la siembra de algodón, en cierto estado
del norte de México, la precipitación anual y el rendimiento de la cosecha de algodón
son como sigue.
Capítulo 8 Regresión lineal simple y múltiple | 375
Ejemplo 8.4. En un estudio de ingeniería del agua relacionado con las reducciones de los sólidos sus-
pendidos, en función de la demanda química de oxígeno (DQO), se sacó una muestra
aleatoria, cuyos datos se dan en la tabla 8.8. Para lo siguiente:
a) Identificar la variable dependiente y la independiente y hacer una gráfica de DQO
versus reducción de sólidos.
b) Calcular la ecuación de la línea de regresión con línea de regresión.
c) Hacer una tabla de análisis de varianza que incluya la F crítica y el valor de p.
d) Validar el modelo candidato, a través de estadísticas como R2, PRESS, s y de la
estadística de Durbin-Watson (para la prueba de autocorrelación de residuales).
e) Evaluar la utilidad del modelo a través de gráficos subjetivos:
Solución:
a) La variable dependiente es DQO y la variable independiente es reducción de sólidos
suspendidos. La figura 8.8 muestra las concentraciones de DQO versus reducción de
sólidos suspendidos con línea de regresión.
35.0 35.0
32.5 32.5
DQO (Y)
30.0 30.0
27.5 27.5
25.0 25.0
Figura 8.8. Gráfica del DQO versus reducción de sólidos con línea de regresión.
Standardized Residual
99 2
90
Porcent
0
50
22
10
124 24
22 0 2 25.0 27.5 30.0 32.5 35.0
Standardized Residual Fitted Value
Histogram of the residuals Residual versus the Order of the Data
Standardized Residual
2
Frecuencia
10.0
7.5 0
5.0
22
2.5
0.0 24
24 23 22 21 0 1 2 1 5 10 15 20 25 30 35
Standardized Residual Observation Order
Figura 8.9. L
a figura superior izquierda muestra la prueba de normalidad. La
figura superior derecha muestra los residuales estandarizados versus
valores ajustados. La figura inferior izquierda muestra el histograma.
Finalmente, la figura inferior derecha muestra los residuales estanda-
rizados versus el orden de las observaciones. Nótese que hay un valor
inusual extremo en el renglón 11, cuyo valor ajustado es 33.2681 y
cuyo residual estandarizado tiene un valor de 3.8259.
(estadística de inferencia), como los cálculos de los coeficientes de determinación (R2) o de correlación (R),
como en el caso de la regresión lineal simple. Sin embargo, en este caso, se puede calcular el coeficiente
de correlación general y coeficientes de correlación parciales, es decir, en forma análoga a como se hace con
los coeficientes β0, β1, etcétera.
Cuando hablamos de regresión lineal múltiple tenemos las siguientes situaciones:
a) Modelo de primer orden con dos variables regresoras o independientes.
b) Modelo de primer orden con más de dos variables independientes.
8.3.2 M
odelo de regresión múltiple con más de dos variables independientes
Yi 5 β0 1 β1Xi1 1 β2Xi2 1 . . . 1 βp21Xi,p21 1 ε (8-30)
Cuando hablamos de regresión lineal múltiple, el principal objetivo es la obtención de la ecuación de la línea
de regresión muestral, para predicción y estimación, la cual emula a la ecuación poblacional. Sin embargo,
antes de poder usar el modelo de regresión calculado, éste se tiene que evaluar, para ver qué tanta certeza se le
puede adjudicar. La evaluación o validación del modelo de regresión estimado se hace a través de análisis ob-
jetivos y subjetivos, en forma análoga como en la regresión lineal simple. Por ejemplo, los análisis objetivistas
se hacen a través de funciones estadísticas de inferencia. Posteriormente, para que la validación del modelo
sea completa, el procedimiento se complementa usando enfoques subjetivistas, a través de análisis de las
gráficas de los valores residuales. Si la validación no es satisfactoria, se procede con remediación del modelo,
Capítulo 8 Regresión lineal simple y múltiple | 379
ya sea haciendo transformaciones de los ejes o probando otros modelos más apropiados, como cuadráticos o
cúbicos, etcétera.
Tabla 8.10.
Hacer lo siguiente:
a) Identificar la variable de respuesta y la variable independiente.
b) Hacer una gráfica con los datos.
c) Ajustar un modelo de regresión lineal y calcular la presión del gas cuando la tem-
peratura es de 80.6 °F. Validar el modelo de regresión lineal simple usando los
diagnósticos s, R2, PRESS.
Solución:
La entrada de los datos se muestra adelante en la hoja de Minitab de la figura 8.10.
380 | Estadística para ingeniería y ciencias
Figura 8.10.
0.1300 0.1300
0.1275 0.1275
Presión (atm)
0.1250 0.1250
0.1225 0.1225
0.1200 0.1200
0.1175 0.1175
0.1150 0.1150
0 10 20 30 40 50
5. En la ventana de Regression-Options seleccione las funciones deseadas, v.g., Variance Inflation Factors,
Durbin-Watson statistics, PRESS, etcétera.
6. En la ventana de Regression-Results escoja las funciones deseadas de las cuatro enlistadas, v.g., In addi-
tion de sequential sum.
Solución:
La figura 8.12 muestra la entrada de los datos en la hoja de Minitab.
Figura 8.12.
382 | Estadística para ingeniería y ciencias
30 30
25 25
20 20
15 15
20 30 40 50 60
X - Datos
Figura 8.13. G
ráfica del consumo de electricidad en función de las temperaturas
de la calefacción y del calentador de agua, con ajustamiento de línea
de regresión en cada uno de sus casos.
Standardized Residual
99
1
90
Porcent
0
50
21
10
1 22
23.0 21.5 0.0 1.5 3.0 15 20 25 30 35
Standardized Residual Fitted Value
Histogram of the residuals Residual versus the Order of the Data
Standardized Residual
2.0
Frecuencia
1
1.5
0
Figura 8.14. Gráfica de la evaluación del mo- 1.0
0.5 21
Ejemplo 8.7. Considerar los datos de la tabla 8.12 y usando el programa de computadora Minitab
hacer lo siguiente:
a) Obtener un modelo de regresión lineal múltiple (modelo 1).
b) Obtener un modelo con transformación logarítmica en el eje vertical (modelo 2).
c) Obtener un modelo con transformaciones logarítmicas de los ejes horizontales y
del eje vertical (modelo 3).
d) Se le pide al lector que decida cuál modelo es el más apropiado al juzgar por los
resultados obtenidos.
Tabla 8.12. Datos bivariados de regresión.
Y X1 X2
3 4 3
2 4 4
7 4 3
6 6 4
5 3 2
6 6 4
7 3 2
4 2 2
Solución:
La figura 8.15 muestra la
entrada de los datos origi-
nales y los transformados.
Al juzgar por los resulta-
dos, se le pide al lector
que decida cuál modelo es
el más apropiado.
Source DF SS MS F P
Regression 2 0.18242 0.09121 5.63 0.052
Residual
5 0.08095 0.01619
Error
Total 7 0.26336
Durbin-Watson statistic 5 1.47105
c) Resultados del modelo 3.
Regression Analysis: Log Y versus Log X1, Log X2
The regression equation is: Log Y 5 0.595 1 1.83 Log X1 2 2.16 Log X2
Analysis of Variance
Source DF SS MS F P
Regression 2 0.15333 0.07666 3.48 0.113
Residual Error 5 0.11003 0.02201
Total 7 0.26336
Durbin-Watson statistic 5 1.52837
Modelo 1
Gráfica de residuales para Y Gráfica de residuales para log
Gráfica de la probabilidad normal de residuales Residuales versus valores ajustados Gr
áfica de la probabilidad normal de residuales Residu
Residual estandarizado
99 99
Residual estandarizado
1
1
90
Porcentaje
90
Porcentaje
0
50 0 50
10 21
10
21
1 1 22
22 21 0 1 2 2 3 4 5 6 22 21 0 1 2 0
Residual estandarizado
Histograma de residuales Residuales versus orden de los datos
Residual estandarizado
4 4
Frecuencia
1
Frecuencia
1
3 3
0 2 0
2
1 1 21
21
0 0
21.5 21.0 20.5 0.0 0.5 1.0 1.5 1 2 3 4 5 6 7 21.5 21.0 20.5 0.0 0.5 1.0 1.5 1 2
Modelo 2
Gráfica de residuales para Y Gráfica de residuales para log Y
Gráfica de residuales para Y Gráfica de la probabilidad normal de residuales Residuales versus valores ajustadosGráfica de residuales para log Gr
Yáfica de la probabilidad normal de residuales Residuales versus valores ajustados
Residual estandarizado
99 99
Gráfica de residuales para log Y
Residual estandarizado
1 Gráfica
90 de la probabilidad normal de residuales Residuales versus valores ajustados
Porcentaje
90 99
Porcentaje
Residual estandarizado
Residual estandarizado
1 99 0
1 50 0 90 50 1
Porcentaje
Porcentaje
0 90 21
10 50 10
0 21
50 0
1 10 21 1 22
21 22 21 0 1 2 2 3 4 5 6 22 21 0 1 2 0.4 0.6 0.8
10 Residual estandarizado 21 Valores ajustados
Residual estandarizado 1 Valores ajustados 22
0 1 2 22 21 0 1 2 1 0.4 0.6 0.8
0.4Residuales versus0.6
orden de los
0.7 datos
2 3 4 5 6
Histograma de 1residuales
Residual estandarizado
1
Residual estandarizado
4
Frecuencia
1 0 1 2.0
2 0
2
Frecuencia
3 1
1.5 1
0 1 21 2 0 21
1.0
0
0 0
1 21 1 2 3 4 5 6 7 8
21 21.5 21.0 20.5 0.0 0.5 1.0 1.5 1 2 3 4 5 6 7 21.5 21.0 20.5 0.0 0.5 1.0 1.5
Residual estandarizado Orden de la observación
0.5
Residual estandarizado
21 Orden de la observación
0
0.0 0.5 1.0 1.5 1 2 3 4 5 6 7 21.5 21.0 20.5 0.0 0.5 1.0 8 1.5 1 2 3 4 5 6 7 8
0.0
dual estandarizado Orden de la observación Residual estandarizado Orden
21.5 de21.0
la observación
20.5 0.0 0.5 1.0 1.5 1 2 3 4 5 6 7 8
8
Residual estandarizado Orden de la observación
Modelo 3
Gráfica de residuales para log Y
Gráfica de la probabilidad normal de residuales Residuales versus valores ajustados
Residual estandarizado
90
Residual estandarizado
99
1 50 0
Porcentaje
90
10 21
50 0
1
0.4 0.5 0.6 0.7 0.8
10 21 22 21 0 1 2
Residual estandarizado Valores ajustados
1
22 21 0 1 2 0.4 0.5 Histograma
0.6 de
0.7residuales
0.8 Residuales versus orden de los datos
Residual estandarizado
1.5
2.0
0
Frecuencia
1 1.0
1.5
0.5 21
1.0
0
0.0
21.5 21.0 20.5 0.0 0.5 1.0 1.5 1 2 3 4 5 6 7 8
0.5 21
Residual estandarizado Orden de la observación
0.0
21.5 21.0 20.5 0.0 0.5 1.0 1.5 1 2 3 4 5 6 7 8
Figura 8.16. Las gráficas muestran la validación de los tres modelos usando gráficos de re-
siduales.
386 | Estadística para ingeniería y ciencias
Problemas propuestos
8.1 Los datos de la tabla 8.13 muestran las emisiones promedio c) Usando una aproximación de función de potencia de la
de óxidos de nitrógeno (NOx) provenientes de calderas de forma de Ln (Y ) 5 Ln (a) 1 b (Ln X ) y, además, calcular
plantas eléctricas. los criterios estadísticos.
Tabla 8.13. Tabla de datos del problema 8.1. d) ¿Cuál modelo es superior?
8.3 En la tabla 8.15 se muestran los resultados de un estudio de
MBtu/ 100 125 125 150 150 200 200 química de una sustancia y en la que aparece la relación entre
h-pie2 (X) 250 250 300 300 350 400 400 la temperatura y la molaridad (en moles por litro)
150 140 180 210 190 320 280 a) Estimar el modelo de regresión más apropiado basado
NOx (Y) en análisis estadísticos de R2, R2ajustada, PRESS, s, y Cp
400 430 440 390 600 610 570
y en análisis gráficos subjetivos de los valores residuales.
a) Hacer una gráfica de NOx vs MBtu/h-pie con línea de
2
Tabla 8.15. Relación entre la temperatura y la molaridad.
regresión e intervalos de confianza y de predicción.
b) Evaluar el modelo de regresión seleccionado estimando 4.3 4.5 4.8 5.5 5.7
Temperatura oC
la ecuación de regresión y calculando los diagnósticos es- 5.9 6.4 6.7 7.5 7.9
tadísticos. 12.1 12.5 12.9 13.0 13.1
c) Complementar la evaluación del modelo analizando las Molaridad
14.0 14.2 14.8 15.0 15.5
gráficas de la prueba de normalidad y de los residuales en
función de los valores ajustados, órdenes, etcétera. Nota: En química, la molaridad es una manera de cuantificar
d) Usando el modelo seleccionado, ¿cuál es la estimación es- las concentraciones de las soluciones. Se define matemática-
perada de la emisión de NOx cuando la tasa de liberación mente como M 5 moles de soluto/volumen de solución en
es de 225 MBtu/h-pie2? litros.
8.2 En un estudio de agricultura, para ver los efectos de los cam- 8.4 El aluminio es el tercer elemento más abundante en minera-
bios climáticos globales relacionados con los patrones pluviales les, rocas y barros; se puede analizar con el método de ab-
alterados debido al calentamiento global, por las emisiones de sorción atómica espectrométrica (método A), este elemento
CO2, se estudió la precipitación pluvial anual y el rendimiento está exento de interferencias como fluoruros y fosfatos. El
de la cosecha de gramíneas. La tabla 8.14 da los datos. aluminio también se puede analizar por medio del método de
Nota: El calentamiento global y la consecuente distorsión cli- calorimetría de cianuro de eriocromo R (método B), el cual
mática están alterando no solamente los patrones meteoroló- es más simple que el anterior. La tabla 8.16 muestra los resul-
gicos, sino también a la agricultura, la salud, la economía, la tados de los análisis (en mg/L) de los dos métodos usados.
política y todos los demás sistemas interactivos que gobiernan Hacer los siguientes cálculos usando el programa de compu-
al hombre moderno. tadora de Minitab o SAS.
Tabla 8.14. Datos del problema 8.2. a) Calcular e interpretar el coeficiente de determinación R2 y
el coeficiente de correlación R.
Precipitación pluvial en Rendimiento de la cosecha en
Tabla 8.16. Datos del problema 8.4.
pulgadas (X ) libras por acre (Y )
7.12 1 037 5 6 6 8
Método A
10 10 11 11
63.54 380
8 9 9 11
47.38 416 Método B
13 13 14 14
45.92 427
8.5. El berilio (Be) y sus compuestos son extremadamente vene-
8.68 619
nosos y capaces de causar la muerte en concentraciones altas.
50.86 388 La inhalación del Be causa una seria afección llamada berilio-
44.86 321 sis. El berilio también puede causar dermatitis, conjuntivitis,
neumonía aguda y beriliosis pulmonar crónica. Este elemento
Determina cuál modelo de regresión encaja mejor en los da- químico se usa en reactores atómicos, aviones, cohetes y en
tos, al juzgar por las estadísticas y por los análisis gráficos, es combustibles para mísiles. Hay dos métodos para el análisis
decir, usando una aproximación lineal, una logarítmica y una (en μg/L) del berilio, es decir, el método espectrométrico de
aproximación de función de potencia de la forma de Ln (Y ) absorción atómica (método 1) y el método aluminon (método
5 Ln(a) 1 b(LnX ). 2). Los resultados de los análisis de los dos métodos se dan en
a) Usar una aproximación lineal como Y 5 a 1 bX y, ade- la tabla 8.17. Hacer los siguientes cálculos.
más, calcular los criterios estadísticos, v. g., el coeficiente a) Hacer un estudio estadístico objetivista, es decir, estimando
de determinación R2, s, PRESS, etcétera. los valores de R2, R2ajustada, PRESS, s y tablas de ANOVA.
b) Usar una aproximación logarítmica como Y 5 a 1 b Ln b) Complementar el estudio haciendo análisis gráficos sub-
(X ) y, además, calcular los diagnósticos estadísticos. jetivistas.
Capítulo 8 Regresión lineal simple y múltiple | 387
Tabla 8.17. Resultados de los métodos 1 y 2 para la medición a) Elaborar una gráfica en función de la cantidad de NaCl
del berilio. en función de la temperatura (K).
0 3 4 5 9
b) Calcular la ecuación de regresión y estimar la cantidad de
Método 1 NaCl que se disolverá a una temperatura de 300 K.
12 15 17 20 20
c) Si se sabe que a medida que aumenta la temperatura, la
1 7 11 19 24 disolución de las sales de sodio se incrementa en forma
Método 2
31 31 35 41 41 proporcional a la temperatura, entonces, usando estadísti-
cas objetivistas y subjetivistas verificar que existe un buen
8.6 En investigaciones de toxicología existen estudios que han de- ajuste del modelo.
mostrado que la probabilidad de que un fumador de 40 años d) Hacer una prueba de hipótesis para el coeficiente de
de edad, quien lo ha sido por los últimos 10 años, contraiga correlación muestral R, para verificar que sí existe una
cáncer pulmonar en los próximos 20 años es alta (suponiendo asociación lineal significante entre las dos variables. Su-
que continúe fumando al mismo ritmo). Esta relación va en poner α 5 0.05. Sugerencia: usar la estadística de t de Stu-
función del número promedio de cigarrillos que fuma al día. dent dada abajo:
Suponer un modelo de regresión lineal. La tabla 8.18 presenta
los datos de esta investigación de toxicología. t 5 R / 1 2 R 2 / n 2 2 con ν 5 n 2 2 grados de libertad
Tabla 8.18. Datos del problema 8.6. e) Teóricamente, la disolución de muchas sales va en fun-
Número de cigarrillos Probabilidad de cáncer ción directa a la temperatura y, en teoría, el valor del co-
fumados por día pulmonar eficiente de determinación, R2 debería de ser de 1.0. Así,
listar dos factores (no estadísticos sino químicos) que pu-
5 0.100
dieran afectar la disolución de las sales y no dar un valor
10 0.113 igual a 1.0.
20 0.225 8.8 En un estudio de meteorología entre la cantidad de lluvia y la
30 0.300 remoción de contaminantes atmosféricos, se dio la siguiente
información:
40 0.450
Tabla 8.20. Datos del problema 8.8.
50 0.540
60 0.700 Precipitación (X ) Remoción de partículas (Y )
(0.01 cm/día) (μg/m3)
80 0.860
4.3 126
a) Identificar la variable dependiente y la variable indepen- 4.5 121
diente.
5.9 116
b) Describir la ecuación de regresión que mejor encaje en los
datos. 5.6 118
c) Calcular R2, R2ajustada, s, y PRESS. 6.1 114
d) Analizar e interpretar los componentes de la tabla de 5.2 118
ANOVA como Fcalc., Fcrítica y el valor de p.
e) Discutir la relación existente entre los diagnósticos esta- 3.8 132
dísticos R2, s, PRESS, Fcalc., el valor de p, criterio de Ma- 2.1 141
llow Cp y la estadística de Durbin-Watson (para prueba 7.5 108
de autocorrelación).
f) Evaluar la utilidad del modelo de regresión seleccionado, a) Calcular la remoción de contaminantes (Y ) cuando el va-
es decir, subjetivamente, esto es, por medio de analizar lor de la precipitación pluvial es de X 5 8.0.
los gráficos de los residuales estandarizados. b) Validar el modelo de regresión objetiva y subjetivamente.
8.7 Se realizó un estudio de química inorgánica y se registraron 8.9 Éste es un ejercicio relacionado con un estudio para evaluar
las cantidades de cloruro de sodio (NaCl), el cual, cuando se la capacidad de los sistemas de flujo freático, usados para la
disolvió en 100 gramos de agua destilada, a diferentes tempe- degradación de la materia orgánica de las aguas residuales;
raturas en grados Celsius (oC), dio los siguientes resultados: se usó el parámetro de la demanda bioquímica de oxígeno
(DBO) y varios otros componentes químicos. Este estudio
Tabla 8.19. Datos del problema 8.7.
dio como resultado los siguientes datos que están relaciona-
Temperatura NaCl disuelto en gramos dos con la carga de masa de DBO (en kg/hectárea/día), la
(X ) de agua (Y ) cual se usó como la variable independiente (X ) y la degra-
0 8 6 8 dación de la concentración de masa carbonosa de DBO5 (en
kg/ha/día), la cual se usó como la variable dependiente (Y ).
15 12 10 14
Tabla 8.21. Datos del problema 8.9.
30 25 21 24
5 10 12 14 15 18 29
45 31 33 28 (X )
32 37 39 40 46 105 144
60 44 39 42 7 10 11 11 13 15 19
(Y )
75 48 51 44 29 24 12 34 34 78 93
388 | Estadística para ingeniería y ciencias
Calcular los siguientes enunciados: 5 0.16 pulg2; 1.0567 cuartos 5 1 L; 1 pulgada cuadrada 5
a) Graficar los datos. 6.25 cm2; 1 m3 5 1 000 L 5 106 cm3.
b) Establecer el modelo de regresión más apropiado para 8.11 Se coleccionó una muestra de 26 casos de una descarga de
este problema. Hacer los mismos cálculos que en el pro- aguas residuales municipales. Esta muestra se analizó para la
blema anterior. demanda bioquímica de oxígeno de 5 días (DBO5), en libras
c) Validar el modelo de regresión seleccionado, objetivista- por día, y la demanda química de oxígeno, DQO (en libras por
mente, usando los siguientes criterios o diagnósticos: día). La tabla 8.23 muestra la información requerida.
• Cálculo del coeficiente de determinación R2.
Tabla 8.23. Mediciones de DBO5 y DQO.
• Cálculo del coeficiente de determinación ajustado,
R2ajustado. Demanda química Demanda bioquímica
• El coeficiente de correlación R. de oxígeno (lb/día) de oxígeno (lb/día)
• La estadística PRESS. 493 485 214 200
• El error estándar estimado, s (se selecciona el modelo 443 555 198 238
que tenga el valor de s más pequeño aunado a otras
527 599 236 278
consideraciones).
d) Evaluar el modelo candidato a través de diagnósticos 395 427 162 182
gráficos que incluyan: 531 439 228 192
• Prueba de normalidad.
307 290 114 132
• Residuales en función de los órdenes.
• Residuales en función de los valores ajustados. 349 489 148 213
e) Una vez que se haya seleccionado el modelo más apro- 455 544 188 244
piado, calcular la remoción de la DBO después de que el 439 582 188 290
agua residual se degradó en el wetland cuando la carga
544 368 246 176
fue de 50 kg/ha/día.
Nota: Los sistemas de flujo freático (áreas pantanosas) se 308 385 118 191
usan como sistemas de tratamiento natural, porque tienen 536 397 224 163
la capacidad de degradar las aguas residuales, es decir, las 479 345 198 158
concentraciones de DBO (demanda bioquímica de oxíge-
no), el cual mide la concentración de la materia orgánica. Hacer lo siguiente:
Estas áreas actúan como especie de lagunas de oxidación o a) Identificar la variable dependiente y la variable indepen-
estabilización. En Minatitlán y Coatzacoalcos, Veracruz, se diente.
usan estos tipos de tratamientos naturales, para degradar las b) ¿Existe una correlación significativa entre los valores de
aguas residuales. la DBO5 y la DQO?
8.10 En estudios de fisicoquímica, la presión de un gas que co- c) Ajustar un modelo con intervalos de confianza e inter-
rresponde a varios volúmenes (de acuerdo con la ley de los valos de predicción graficando la demanda bioquímica
gases de Boyle, la cual relaciona la presión y el volumen) se de oxígeno (DBO) en función de la demanda química de
da en la tabla 8.22. Suponer que el volumen del gas es (X ) y oxígeno (DQO).
la presión es (Y ). Hacer los siguientes cálculos: d) Predecir la DBO cuando la DQO es de 600.
a) Hacer una gráfica con los datos. Nota: La demanda bioquímica de oxígeno de cinco días
b) Estimar la línea de regresión de la muestra. (DBO5) mide la concentración, en mg/L (miligramos por
c) Estimar el coeficiente de determinación R2 y el coefi- litro) o en libras por día de la materia carbonosa del agua
ciente de correlación R. Interpretar los resultados. residual. De hecho la DBO mide la fracción biodegradable
d) Predecir la presión del gas, cuando el volumen es de del drenaje o del agua residual industrial o doméstica, en tér-
0.001 m3. minos del carbono. Usualmente, las unidades son en mg/L.
e) Predecir la presión del gas, en libras por pulgada cuadrada Sin embargo, esto se debe a que, antes, se usaban en forma
(lb/pulg2) y en atmósferas (atm), cuando el volumen del indiscriminada las unidades de ppm (partes por millón) y
gas es de 0.0528 cuartos (0.05 L). mg/L. Después, se descubrió que, con los residuos tóxicos, la
f ) En teoría, debido a que la relación entre el volumen del gravedad específica era diferente a la de los residuos carbono-
gas y la presión es inversamente proporcional, el coefi- sos. Por esta razón es mejor usar las unidades de mg/L. Por
ciente de correlación debería ser de R 5 21.0, sin embar- otra parte, la prueba de la DBO es de cinco días, para evitar
go, si R difiriera del valor de −1.0, enlistar 3 factores (en la nitrificación. En cambio, la prueba de la demanda química
el laboratorio de química) que pudieran intervenir para de oxígeno mide los compuestos orgánicos biodegradables y
explicar esta situación. los compuestos orgánicos tóxicos. Esto quiere decir que, la
demanda química de oxígeno (DQO) oxida la cantidad de
Tabla 8.22. Volúmenes y las presiones del gas.
materiales totales oxidables presentes en el agua residual y
Volumen en cm3 50.0 60.0 70.0 85.0 100.0 varía con la composición del agua, la temperatura, el periodo
Presión en kg/cm2 64.7 51.3 40.5 25.0 7.8 de contacto y otros factores más.
8.12 Los metales pesados, como el mercurio (Hg), cromo (Cr), el
Sugerencias: Se dan los siguientes factores de conversión: plomo (Pb), etc., pueden interferir con el tratamiento bioló-
1 atm 5 14.7 lb/pulg2 5 760 torr 5 1.0668 kg/cm2; 1 cm2 gico en las plantas municipales de aguas residuales domés-
Capítulo 8 Regresión lineal simple y múltiple | 389
a) Suponer un modelo de regresión lineal y evaluarlo usan- 8.17 Se analizaron treinta muestras del efluente de una planta de
do enfoques de diagnóstico de estadística de inferencia tratamiento para la medición de la DBO5 y la demanda quí-
(objetivistas) y de gráficos estadísticos. mica de oxígeno (DQO). Los datos se muestran en la tabla
b) Usar el modelo de regresión y predecir la concentración 8.29. Hacer lo siguiente.
de cadmio, cuando la altura del muestreador es de X1 5 a) Identificar la variable de respuesta y la variable indepen-
25 metros y la distancia a la fuente emisora industrial es diente.
X2 5 851 metros. b) Aplicar el modelo de regresión más adecuado para estos
Tabla 8.28. Datos del problema 8.16. datos y validarlo objetiva y subjetivamente.
c) Graficar los datos en papel de probabilidad.
Y (concentración d) Determinar la DBO5 y la DQO que excederá 50% de las
193 230 172 91 113 125
de Cd)
veces.
X1 (altura del e) Determinar la DBO5 y la DQO que excederá 90% del
1.6 15.5 22.0 43.0 33.0 40.0
muestreador) tiempo.
X2 (distancia) 851 816 1058 1201 1357 1115
494 494 528 396 532 308 350 456 440 544
DQO
310 538 480 500 396 486 556 600 428 440
(lb/día)
291 490 546 582 368 386 400 347 278 304
216 200 238 164 230 116 150 190 190 248
DBO5
120 226 200 222 176 202 240 280 184 194
(lb /día)
134 215 246 292 177 193 165 160 125 137
8.18 En un estudio de laboratorio para determinar la relación en- del viento es de 2.0 m/s con una estabilidad atmosférica de
tre los sólidos suspendidos y las concentraciones de la DBO clase A. Se requiere calibrar un modelo de difusión atmos-
se optuvo una muestra con los datos que se muestran en la férica (Caline) y, para esto, se situaron ocho muestreadores,
tabla 8.30. a diferentes distancias de la autopista, para analizar el CO,
Tabla 8.30. Datos del problema 8.18. es decir, a distancias de 100.0, 125.0, 150.0, 200.0, 250.0,
300.0, 400.0 y 500.0 metros del tramo carretero a modelarse.
Sólidos 18 7 14 31 21 La tabla 8.32 muestra la información requerida.
suspendidos 5 11 16 26 29
Tabla 8.32. Distancias (metros) de los muestreadores, las con-
55 17 36 85 62 centraciones de campo (de los sensores) y las con-
DBO5 centraciones teóricas (del modelo matemático).
18 33 41 63 87
a) Identificar la variable dependiente y la variable indepen- Distancias Valores de campo Valores del modelo
diente. (m) (μg/m3) (μg/m3)
b) Hacer una gráfica que vaya en función de la variable de- 100 1 700.00 1 600.00
pendiente y de la variable independiente.
c) Validar el modelo de regresión objetiva y subjetivamen- 125 1 200.00 1 105.00
te. 150 800.00 750.00
d) Hacer una tabla de ANOVA que incluya el valor de F y
p, es decir, completando la tabla 8.31. 200 450.40 400.68
e) Usando el modelo de regresión seleccionado, calcular la 250 200.00 235.00
DBO5 cuando los sólidos suspendidos son de 80 mg/L.
Tabla 8.31. Tabla de ANOVA. Llenar los faltantes. 300 120.00 100.56
8.22 Éste es un ejercicio de física relacionado con la posición de Tabla 8.37. Datos del problema 8.24.
una partícula que cae y que se puede representar mediante x
% Mezclas de
5 x0 1 v0t 2 0.5gt2, donde v0 es la velocidad (m/s) de caída Contenido % de % de
diferentes tipos
de la partícula, t el tiempo, g la constante gravitacional (9.8 energético papel
de basuras
plástico
m/s2) y x la posición de la partícula a un tiempo t. Calcular la
ecuación de regresión que mejor ajuste los datos y validarla 950 16 46 19
acordemente. 1 408 24 40 19.8
Tabla 8.35.
1 450 24.8 43 19.4
Tiempo (segundos) Vel. (m/s) Y
1 558 23 36 23
0.5 0.75
990 24 41.5 17
1.5 1.75
1 164 24 36 21.8
2.5 8.75
1 443 24.8 40 20
3.5 21.75
Concentraciones 1 159 21 41 22
75 80 86 94 99 107
de O3 (y)
1 455 23 37 25.4
Temperatura
65 71 79 85 93 100
(°F) (x) 1 280 27 39 21
NO 1 COV → NO2
NO2 1 luz solar → NO 1 O
O 1 O 2 → O3
Existe una relación entre el calentamiento global de la Tierra y la generación de O3, puesto que las altas temperaturas
son factores muy importantes.
Desde el punto de vista de regresión estadística se pueden establecer modelos de regresión para pronosticar
las concentraciones de O3 y así poder alertar a la población del peligro de altas concentraciones de O3, sobre todo
en verano. Se pueden probar varios modelos de regresión lineal múltiple o polinomial para ver cuál es el óptimo. Por
ejemplo, el modelo de regresión múltiple poblacional es
Y 5 β0 1 β1 X 1 β2 X 2 1 … 1 βi Xk 1 βk X 2k 1 ε.
El procedimiento para estructurar el modelo de regresión es tomando como variable de respuesta las concentraciones
de O3 y como variables independientes, NO, NO2, temperatura, punto de rocío, intensidad y velocidad del viento, humedad
relativa, COV, altura de la mezcla (incidencia de inversiones térmicas), etc. Investigaciones hechas han demostrado que el
mejor modelo de regresión de ozono que encaja en los datos es un modelo cuadrático. Este capítulo está encaminado a
estudiar regresión polinomial. Además, busca hacer evaluaciones de la utilidad de los modelos probados.
Fuente: http:www.windows.ucar.edu/tour/link5/Herat/images/ozone_tropo_big_jpg_omage.sp.ht
394 | Estadística para ingeniería y ciencias
9.1 Introducción
La regresión no lineal incluye regresión polinomial, regresión logística, regresión con variables transforma-
das y así sucesivamente. La regresión polinomial es un caso especial de la regresión lineal simple o múltiple.
Hay modelos polinomiales de segundo o tercer orden. Con la regresión polinomial existen modelos con una
variable independiente, con ecuaciones cuadráticas, cúbicas o con órdenes más altos que k 5 3. También
hay modelos polinomiales con dos o más variables independientes, con ecuaciones de segundo orden, tercer
orden, etc. Igualmente, puede haber modelos de segundo orden o tercer orden con interacción. Sin embargo,
los modelos polinómicos que tienen tres o más variables independientes, con valores de k . 3 son aplicaciones
muy dificultosas y raras.
Dentro del tema de regresión, también hay modelos de regresión no lineal, como los modelos de regresión
exponenciales, en los cuales los parámetros no son lineales.
y 5 β0 1 β1x 1 β2 x2 1 … 1 βk xk 1 e
9.3 M
odelos polinomiales de segundo orden (k 5 2)
con una variable independiente
El modelo polinomial de segundo orden (k 5 2) con una variable independiente llamada función de respuesta
cuadrática se puede expresar de la siguiente forma:
y 5 β0 1 β1x 1 β2 x2 1 e (9-1a)
Donde:
y 5 variable dependiente o función de respuesta
β0 5 intercepto en la ordenada. Este coeficiente de regresión representa la respuesta promedio de y, cuan-
do x 5 0
β1 5 coeficiente de efecto lineal
β11 o β2 es el coeficiente de efecto cuadrático
Capítulo 9 Regresión no lineal | 395
x 5 variable independiente
e 5 término de error o residuo
La función de respuesta para este modelo de regresión (Neter et al. 1996) es:
Esta función es la forma básica de una parábola convexa, es decir, cuando β2 , 0. Sin embargo, cuando
β2 . 0, la parábola es cóncava. Estas situaciones se ven en la figura 9.1a) y b). El coeficiente β0 representa el
intercepto en la ordenada. Los coeficientes ββ 1 y β2 controlan la parábola, relativo a la ordenada. Por ejemplo,
si β1 5 0, la parábola es simétrica y centrada alrededor de y 5 0. No obstante, si β1 y β2 tienen el mismo signo,
la parábola se desvía hacia la izquierda, pero si β1 y β2 tienen signos opuestos, la parábola se desvía hacia la
derecha. Además, el coeficiente β2 describe la curvatura. Por otra parte, si β2 5 0, no hay curvatura. Esto se
ve en la figura 9.1c). Entre más grande sea el valor de β2, mayor será la tasa de curvatura. Sin embargo, entre
más pequeño sea el valor de β2, menor será la curvatura (Keller et al. 1990). Todas estas situaciones se ven en
estas gráficas.
9.4 M
odelo de polinomios de tercer orden (k 5 3)
con una variable independiente
El modelo de polinomios de tercer orden (k 5 3) con una variable independiente se expresa como:
Las figuras 9.1d) y e) muestran este tipo de ecuación. Como se ve, cuando β3 , 0, sobre el rango de x, el
valor de y disminuye, pero cuando β3 . 0, el valor de y aumenta. Sin embargo, las aplicaciones del modelo
cúbico son pocas.
y y
a) b)
x x
Modelo de segundo orden con β , 0 Modelo de segundo orden con β . 0
Modelo de segundo orden con β . 0
y y y
c) d) e)
β2 grande
β2 pequeña
β2 5 0
x x x
Modelo de segundo orden con varios Modelo de tercer orden con β2 , 0 Modelo de tercer orden con β2 , 0
valores de β2
Figura 9.1. G
ráficas del modelo cuadrático y cúbico. Por ejemplo, la gráfica a) muestra el modelo de
segundo orden, con β2 , 0; la gráfica b) muestra el modelo con β2 . 0 y con varios valores
de β2. La gráfica c) muestra los modelos de tercer orden con β3 , 0 y d), con β3 . 0.
y
Los modelos polinomiales de poderes más altos que k 5 3 deben de usarse con precaución. Esto se debe a
y
que la interpretación
d)
de los coeficientes es difícil ye)las interpolaciones pueden ser peligrosas. Además, cuando
hablamos de modelos con valores de k 5 4, o k 5 5, el comportamiento de semejantes modelos es extraño y
de aplicaciones raras y, por tanto, no se discutirán aquí.
x
9.5 Interacción en los
x modelos
Modelo polinomiales
de tercer orden con β , 0 de regresión 2
Modelo de tercer orden con β2 , 0
Antes de discutir estos modelos de regresión hay que definir el término interacción, el cual significa que el
efecto de x1 sobre y está influido por el valor de x2, que también significa que el efecto de x2 sobre y está influido
por el valor de x1.
Para ver el efecto de interacción, supóngase que la ecuación de la línea de regresión muestral es y 5 6 1
4x1 1 5x2 2 3x1x2. Para explicar este efecto supóngase que le demos valores a x2 de 1, 2, y 3. Al sustituir los
y
valores de x2 5 1, 2, y 3, en la ecuación muestral anterior, se producen las siguientes ecuaciones: y 5 5 1 x1,
e)
con x2 5 1; y 5 10 2 2x1 con x2 5 2 y, además, y 5 15 2 5x1, con x2 5 3. Analizando estas tres ecuaciones
modificadas vemos que el intercepto y los coeficientes de x1 también varían. Aquí se ve que el efecto de x1 sobre
y está influido por el valor de x2. Al graficar estas tres ecuaciones vemos que las tres líneas rectas se cruzan
entre sí. Esto se ve en la figura 9.1b). En esta gráfica, se ve claramente que hay interacción, es decir, cuando
las líneas rectas se cruzan entre sí.
x
Modelo de tercer orden con β2 , 0
Este modelo, también se puede expresar con diferentes anotaciones, como las señaladas abajo:
Donde:
β12 5 coeficiente de efecto de interacción, donde x1 y x2 representan la interacción entre los pronosticado-
res o variables independientes x1 y x2.
Nótese que la diferencia entre la ecuaciones (922) y (923) es el último término de la derecha, el cual
denota el efecto de la interacción.
9.6 M
odelo polinomial (de segundo orden o cuadrático) con tres
variables independientes sin interacción
El modelo de segundo orden con tres variables independientes, cuando estas variables no interaccionan entre
sí, es:
y 5 β0 1 β1x1 1 β2 x2 1 β3 x3 1 β11 x21 1 β22 x22 1 β33 x23 1 e (9-4)
9.6.1 M
odelo polinomial (de segundo orden o cuadrático), con tres variables
independientes con interacción
El modelo de segundo orden con tres variables independientes, con interacción es:
y 5 β0 1 β1x1 1 β2x2 1 β3x3 1 β11x21 1 β22x22 1 β33x23 1 β12x1x2 1 β13x1x3 1 β23x2x3 1 e (9-5)
Donde:
y 5 variable dependiente o función de respuesta
β0 5 intercepto en la ordenada
β12, β13, β23 5 los coeficientes del efecto de interacción entre los pares de variables de predicción x1x2, x1x3 y
x2x3 x1x2, x1x3, x2x3 representan la interacción entre las variables independientes x1, x2, x3, x1, x2, x3 5 variables
independientes
En la solución de problemas relacionados con modelos de regresión lineal, múltiple o de regresión polino-
mial, con una o más variables independientes es siempre conveniente graficar los datos y examinar el diagrama
esparcido. Esto se hace con objeto de analizar, visualmente, el diagrama esparcido y ver el tipo de curva mos-
trado y, por consiguiente, el modelo de regresión o función que pueda encajar mejor en los datos.
y y y y
y 11 4xy1, 11 3 1, con x2 3
4x
con x2
y 16 4xy1, 16 2 1, con x2 2
con x24x
y 21 4x1y, 21 11, con x2 1
con x24x
y 5
y 5 x1, con 1x1, con x2 1
x2
a) a) b) b)
y y (β 0) (β2 0) y y
2
x1 x1 x1 x1
c) c) d) d)
Figura 9.2. G
ráficas de modelos polinomiales de primero y segundo orden, con dos variables in-
dependientes. La gráfica a) es la ecuación y 5 6 1 4x1 1 5x2. Cuando x2 5 1, 2 y 3,
las ecuaciones modificadas se ven en la gráfica en cada uno de sus casos. En estas
figuras se ve que no hay interacción (las líneas no se cruzan, porque es un modelo
aditivo). La gráfica b) muestra la ecuación y 5 6 1 4x1 1 5x2 2 3x1x2. Cuando x2 5
1, 2 y 3, la gráfica muestra las ecuaciones modificadas. Aquí se ve que la ecuación
polinomial de primer orden tiene interacción. Finalmente, la gráfica c) muestra un
modelo de regresión polinomial de segundo orden sin interacción. Igualmente, la
gráfica d) muestra un modelo de regresión con interacción.
9.7.1 A
nálisis de estadísticos como R 2, s, criterio Cp y PRESS, para evaluar
la utilidad del modelo polinomial
a) Cálculo del coeficiente de determinación, ( Σxy
R2). 2 Este criterio indica qué proporción de la variación
total en la respuesta Y se explica con el modelo
Σx 2 Σyajustado.
2
En términos simples, esto dice que R2 indica
la proporción de variación explicada
( Σxy) por las
2
ΣXvariables
ΣY independientes x1, x2, x3, …, xk. Este coeficiente
de determinación R2 ya se describió
Σx Σy
2 anteriormente,
2
n, Σx 2 es decir
)2 ( Σxy)
2
( Σxy)2 ΣXΣY ( ΣRX2 5 (9-6)
2 Σx Σy
2 2
Donde: Σ x 2
Σ y 2
n , Σ x 2
n y Σ Y
R 2 5 ( Σxy ) 2 ΣΣxX2 Σ
ΣYy 22 ( ΣX2)2 ( ΣY )2 ΣX ΣY
Σxy 5 ΣΣXY 2ΣΣXY
xy 5 X Σ2 Y ΣnX, ΣΣxY 5n,ΣΣXx 22 5
2 Σ( ΣXX2 )2 (2nΣ2yΣ
X ) 2Y n2 2 yΣ YY2 )2
,( Σlas 2
2(nΣ
cuales 2
, Y )se n,
definen por las ecuaciones (8-8), (8-9) y
n, Σx 2
n y ΣR Y2 5 ( Σxyn) 2 Σx 2 Σyx2 n, Σ
(8-10) dadas en( ΣelXcapítulo 8. ( ΣY )2 MSE p ( ΣX )
2
)2
MSEk n y ΣY
2
b) Cálculo del n y Σestándar
SSEerror Yp ) 2 n s:
Y 2Σ (Y 2estimado,
sε 5 5 ( ΣY )2
n 2 1 2(kΣY )2 (n 2 2) MSE p SSE Σ (Y 2 Yp ) 2
MS E s 5 5 n (9-6a)
n ε
k n 212 k (n 2 2)
MSE p MSE p
Donde:
MSsumaEk de 2los cuadrados MSEk
SSE 5 Σe 2i es la 2del error o residuo
R 5 ( ΣR xy2 )52
(ΣΣxxy Σ)y2 2 Σx 2 Σy 2
2
yp 5 línea de regresión, n es el tamaño SSE 5 deΣe muestra
i y k es el número de coeficientes βi probados.
( Σxy)2
(
Cp 5 MSE p MSE
la utilidad del modelo, k )
Un valor de sε cercano a cero indica un buen ajuste del modelo, pero sin ser una medida absoluta de
(n 2 p 2 1) 2 (nΣ2
es decir, SSE sin antes 2Σ(yanalizar
x 2SSE p2 1
Σ (Y 1) 2 Yp Σ ()Y2 2los
todos )2
Ypdemás diagnósticos. Un valor grande de sε
indica un modelo deficiente que
sε 5 sε 5
1Cp
n 2tiene 2ΣnkX ( 5
ΣY
5que
2 MSE
12
5
mejorarse.
k(pn 2 MSE )
2) k(n(2 n2 2) p 2 1) 2 (n 2 2( p 1 1)
n, Σx 2
c) Criterio Cp. Este diagnóstico está relacionado con el error cuadrático medio de un valor ajustado. En
( )
pequeños( Σde )2 El modelo óptimo tiene un valor de Cp cercano a (p 1 1),
X Cp.
2
general,
PREES 5seΣprefieren
yi 2 yi , 2valores
i
y Σ2Y 2
donde, p es el número de variables 5nΣe Un Cp mayor
( )
2 independientes. que (p 1 1) indica que el modelo de re-
SSE 5 ΣeSSEi PREES i 5Σ y 2 y
2
2
que (p 1 1), esto indica que se han omitido nR 5 ( Σxy ) 2 importantes.
variables Σx 2 Σy 2 La fórmula para esta estadística es:
MSE p
(
Cp 5 MSE
Cp 5
p
MSEkkp
(
MSE (MSE
n 2 pk 2) ) 2p2
(n12 (n12 )
) 22(p(n121)2( p 1 1) (9-6b)
Donde MSE es el cuadrado del error medio, p esSSE
el númeroΣde Yp ) 2 independientes y k es el nú-
variables
(Y 2
s
mero máximo de variables independientes
ε
5disponibles. 5
n 2 1 22 k (n 2 2)
( () )
2
d) Criterio PRESS. ComoPRE se Edijo
S5 antes, este
Σ EySi 5
PRE 2 Σyi ,criterio
y 2 yi , 2oi diagnóstico estadístico mide qué tan bien el uso de
2i i
los valores ajustados para un modelo puede predecir las respuestas observadas de Yi. Modelos con valo-
res bajos de PRESS son deseables, porque cuando2 los errores de predicción son bajos, también lo serán
SSE 5 Σe i
los errores del cuadrado de predicción y la suma de estos errores. Esta estadística se usa para evaluar el
modelo de regresión en términos de predicción. Para calcular PRESS cada observación es individual-
mente omitida y las observaciones restantes (n 2 1) se usan para calcular la regresión y estimar el valor
de las observaciones omitidas haciendo Cp esta5operación
MSE p MSE ( k
(n 2espdecir,
n veces, (nvez
2 1) 2una )
2 2para 1) caso. La di-
( p 1 cada
ferencia entre el valor de actual de Y, yi y el valor pronosticado de Y de la i-ésima observación eliminada,
se llama error de predicción. La fórmula matemática para la estadística PRESS se define como:
( )
2
PREES 5 Σ yi 2 yi , 2i (9-6c)
Donde:
yi, 2i, se llama el error de predicción.
400 | Estadística para ingeniería y ciencias
9.7.4 A
nálisis de gráficos para diagnosticar colinealidad (correlación o
dependencia casi lineal entre las variables de regresión)
Para mitigar esto hacer transformaciones como Y 9 5 Log Y , Y 9 5 Y 2 , Y 9 5 Y , Y 9 5 1/Y, etc. Las transformacio-
nes de los ejes se discutirán ampliamente en la sección 9.15.
t 5 β 2 sβ2
9.7.5 Prueba de heteroscedasticidad y homoscedasticidad
El término heteroscedasticidad (hetero 5 desigual; scedasticidad 5 esparcido) o de residuales no uniformes
(implica error de varianza de s2e no constante en todos los casos). En contraste, el término homoscedasticidad
implica error de varianza s2e constante. Para diagnosticar el problema de heteroscedasticidad se grafican los
residuales versus los valores predecidos Y. Análogamente, para diagnosticar este problema de heteroscedasti-
cidad se puede hacer aplicando las pruebas de White y de Breusch-Pagan. Para mitigar el problema de la falta
de homoscedasticidad, esto se puede hacer por medio de transformaciones. También se puede hacer probando
otros modelos que ajusten mejor los datos.
Capítulo 9 Regresión no lineal | 401
y 5 β0 1 β1x1 1 β2 x2 1 e (9-7)
c) Modelo de regresión lineal múltiple, con dos variables independientes, con interacción
y 5 β0 1 β1x1 1 β2x2 1 β3x3 1 β11x21 1 β22x22 1 β33x23 1 β12x1x2 1 β13x1x3 1 β23x2x3 1 e (9-7g)
Ejemplo 9.1 Este ejemplo proviene del artículo del J. Agricultural Eng. Research, 1975 (p. 353-361),
donde se reportan los datos con el número de días después de la floración (x), el rendi-
miento de la cosecha, en kg/ha (y). La tabla 9.1 muestra los datos.
x 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46
y 2 508 2518 3 304 3 423 3 507 3 190 3 500 3 883 3 823 3 646 3 708 3 333 3 517 3 241 3 103 2 776
Fuente: Probabilidad y estadística para ingeniería y ciencias. J.L. Devore. Quinta edición. Thomson. México (2001).
402 | Estadística para ingenieros
3 750 3 750 50
10
3 500 3 500
1
-2 -1 0 1 2
Residuales estandarizado
3 250 3 250
Histograma de residuales
3 000 3 000
4. 8
3. 6
2 750 2 750
2. 4
2 500 2 500 1. 2
15 20 25 30 35 40 45 50 0. 0
-2 -1 0 1
No. días de floración (x)
Residual estandarizado
Gráfica de residuales de Y
Figura 9.3. D
iagrama de puntos con línea Residuales
Gráfica de la probabilidad normal de residuales
de regresión
versus valores ajustados
de los datos del rendimiento
Gráfica de resi
de la cosecha, y, y el número de días de floración, x.
99 3. 0
Gráfica de probabilidad normal de residuales Re
90 1. 5 99
Residual estandarizado
Fuente: Adaptado de Probabilidad y estadística para ingeniería y ciencias. J.L. Devore. Thomson. México
50 0. 0 90
2
Porcentaje
1
(2001). 10
- 1. 5 50
0
1 - 3. 0 10 -1
- 3. 0 - 1. 5 0. 0 1. 5 3. 0 400 450 500 550 600
1 -2
Residual estandarizado Valor ajustado
-2 -1 0 1 2
Residual estandarizado
Residual estandarizado
6 1. 5 2
0. 0 1
4
3. 0
-1
0 - 3. 0 -2
0. 0
-3 -2 -1 0 1 2 3 2 4 6 8 10 12 14 16 18 20 -2 -1 0 1 2
Residual estandarizado Orden de la observación Residual estandarizado
90 2
Porcentaje
50 35
0
10
30 -2
R2Sq(pred) 5 75.74% 1
- 3. 0 - 1. 5 0. 0
Residual estandarizado
1. 5 3. 0 450 500 550
Valor ajustado
600 650
2
4. 5
Source DF SS MS F P20
Frecuencia
3. 0
0
Regression 1. 5
2 2164649 -2
1082324 31.49 0.0000 10 20 30
0. 0
-2 -1 0 1 2 3 2 4 6 8 10 12 14 16 18 20
% arena
Residual Error 13
Residual estandarizado
446850 34373 Orden de la observación
Total 15 2611499
Capítulo 9 Regresión no lineal | 403
0
3 750 50
-1
10
3 500 -2
1
-2 -1 0 1 2 2 500 3 000 3 500
Residuales estandarizado Valor ajustado
3 250
Gráfica de residuales de Y
abilidad normal de residuales Residuales versus valores ajustados
Figura 9.4. G
ráfica de prueba de normalidad de residuos versus valores
Gráfica de residuales
3. 0
ajustados. versus
Gráfica de probabilidad normal de residuales Residuales valores ajustados
1. 5 99
Residual estandarizado
2
0. 0 90
Como lo indica la figura superior derecha de la figura 9.4, la gráfica de prueba de nor-
Porcentaje
1
- 1. 5 50
0
0. 0
dual estandarizado
1. 5 3. 0
- 3. 0
400 450 500
Valor ajustado
550 malidad indica que la distribución de los datos es aproximadamente normal, puesto
600
10
1
-1
-2
-2 -1 0 1 2 400 450 500 550 600
ma de residuales Residuales versus el orden de los datos que los puntos están muy cercanos a la línea de regresión y dentro de las bandas de
Residual estandarizado
Histograma de residuales
Valors ajustados
1. 5 2
4. 5
indican que hay, aproximadamente, ocho valores positivos y ocho negativos, sin ten-
Frecuencia
0. 0 1
3. 0
0
- 1. 5
0. 0
-1
-2
0 1 2 3 2 4 6 8 10 12 14 16 18 20 -2 -1 0 1 2 2 4 6 8 10 12 14 16 18 20
dual estandarizado Orden de la observación Residual estandarizado Orden de la observación
Gráfica de residuales de Y
Gráfica de la fuerza de compresión versus % arena
ad normal de residuales Residuales versus valores ajustados
40
404 | Estadística para ingeniería y ciencias
9.9 P
rueba estadística para comparar la suma de los cuadrados del
error (SSE) de cada modelo probado, para saber cuál modelo es
superior
Los autores Keller et al. (1990) del libro Statistics for Management and Economics dan una prueba estadística que
mide las diferencias de la suma de los cuadrados del error (SSE), para probar la superioridad de cada modelo
probado. Esto se debe a que SSE mide qué tan bien encajan los datos en el modelo. Esta prueba se hace com-
parando la suma de los cuadrados del error (SSE1) del modelo simple o abreviado y la suma de los cuadrados
del error (SSE2) del modelo completo o complejo. Esto se hace porque siempre es conveniente usar modelos
simples (el uso de modelos complejos no necesariamente los hace superiores). La prueba estadística para me-
dir la relación entre SSE1 y SSE2 es:
F5
( SSE 2 SSE ) ( k 2 k )
1 2 2 1
(9-9)
SSE ( n 2 k 21)
2 2
Donde:
Nota: Si el ajuste del modelo completo no es significativamente mejor que el modelo simple o abreviado,
el valor de SS1 será pequeño. Por ende, la relación SS1 2 SS2 será pequeña y, por tanto, el valor de F también
será así y no se podrá rechazar la hipótesis nula. Sin embargo, si el ajuste del modelo completo es bueno, el
valor de SS2 será pequeño y la relación SS1 2 SS2 será grande y, por consiguiente, el valor de F será grande y
se rechazará la hipótesis nula.
Donde:
Ejemplo 9.2 Éste es un ejemplo encaminado a ajustar modelos de regresión lineales múltiples y
cuadráticos, con y sin interacción. Los datos se dan en la tabla 9.2. Hacer los siguientes
cálculos:
a) Probar un modelo de regresión cuadrático, con interacción. Este caso, lo llamare-
mos modelo superior o modelo completo.
b) Después, probar un modelo de regresión cuadrático, sin interacción. En este caso,
lo llamaremos modelo abreviado.
c) Finalmente, probar un modelo de regresión lineal múltiple, sin interacción. Este
modelo lo llamaremos modelo lineal simple.
d) Describir las ecuaciones de los modelos de regresión poblacionales de los incisos
a), b) y c).
e) Para decidir cuál modelo es mejor, hacer una tabla con los resultados de los tres mo-
delos, basándose en los diagnósticos objetivistas como las estadísticas R2, R2ajustada,
s, PRESS, ANOVA, etcétera.
f) Se le pide al lector usar la ecuación (9-9), para seleccionar el modelo más apropiado
de los dos finalistas.
Solución:
a) Primero, se prueba el modelo de regresión polinomial cuadrático con interacción;
es decir, el modelo completo. En seguida se muestran los resultados obtenidos de
los modelos de regresión probados.
3 750 3 750 50
Source DF SS MS F P
10
3 500 3 500
Regression 5 66987 13397 35.44 0.000 1
-2 -1 0 1 2
Residuales estandarizado
Residual Error 14
3 250
5292 378 3 250
Histograma de residuales
Total 19
3 000
72279 3 000
4. 8
3. 6
2 750 2 750
Durbin-Watson statistic 5 1.40280 2. 4
2 500 2 500 1. 2
Gráfica de residuales de Y
Gráfica de la probabilidad normal de residuales Residuales versus valores ajustados
99 3. 0
Gráfica de r
Gráfica de probabilidad normal de residuales
90 1. 5 99
Residual estandarizado
50 0. 0 90
Porcentaje
- 1. 5 50
10
1 - 3. 0 10
- 3. 0 - 1. 5 0. 0 1. 5 3. 0 400 450 500 550 600
Residual estandarizado Valor ajustado 1
-2 -1 0 1 2
Residual estandarizado
Histograma de residuales Residuales versus el orden de los datos
8 3. 0 Histograma de residuales
6. 0
Residual estandarizado
6 1. 5
4. 5
Frecuencia
4 0. 0
3. 0
2 - 1. 5
1. 5
0 - 3. 0
0. 0
-3 -2 -1 0 1 2 3 2 4 6 8 10 12 14 16 18 20 -2 -1 0 1 2
Residual estandarizado Orden de la observación Residual estandarizado
Figura 9.5. G
ráficos de residuales para modelo cuadrático de regresión con
Gráfica de residuales de Y
Gráfica de la fuerza de compresión versus %
interacción.
Gráfica de probabilidad normal de residuales
99
Residuales versus valores ajustados
40
Residual estandarizado
90 2
Porcentaje
50 35
0
de compresión
10
-2 30
1
- 3. 0 - 1. 5 0. 0 1. 5 3. 0 450 500 550 600 650
Residual estandarizado Valor ajustado
Capítulo 9 Regresión no lineal | 407
Regression
2 750
4 66704 16676 44.87 0.000
3. 6
1
2
0. 0 90
Porcentaje
1
- 1. 5 50
0
- 3. 0 10 -1
1. 5 0. 0 1. 5 3. 0 400 450 500 550 600
1 -2
Residual estandarizado Valor ajustado
-2 -1 0 1 2 400 450 500 550 600
Residual estandarizado Valors ajustados
stograma de residuales Residuales versus el orden de los datos
3. 0 Histograma de residuales Residuales versus valores ajustados
6. 0
Residual estandarizado
1. 5 2
4. 5
Frecuencia
0. 0 1
3. 0
0
- 1. 5
1. 5 -1
- 3. 0 -2
0. 0
-1 0 1 2 3 2 4 6 8 10 12 14 16 18 20 -2 -1 0 1 2 2 4 6 8 10 12 14 16 18 20
Residual estandarizado Orden de la observación Residual estandarizado Orden de la observación
35
0
Fuerza de compresión
0. 0 1. 5 3. 0
-2
450 500 550 600 The regression
650
30
equation is: Y 5 263 1 18.3 X1 1 15.6 X2
sidual estandarizado Valor ajustado
0
Constant 263.01
20
27.29 9.64 0.000
0 1 2 3
-2
2 4 6 8 10 12 14 16
X1
18 20
18.256
0 10 4.040 20
% arena
4.52
30 0.000
40 2.7
Residual estandarizado Orden de la observación
2 500 2 500 1. 2
15 20 25 30 35 40 45 50 0. 0
Gráfica de residuales de Y
Gráfica de la probabilidad normal de residuales Residuales versus valores ajustados
99 3. 0
Gráfica
S 5 23.7185 R2Sq 5 86.8% R2Sq(adj) 5 85.2% PRESS 5 15427.3
90 1. 5 99
Gráfica de probabilidad normal de residuales
R2Sq(pred) 5 78.66% 50 0. 0 90
Porcentaje
- 1. 5 50
10
Analysis of Variance 1
- 3. 0 - 1. 5 0. 0 1. 5 3. 0
- 3. 0
400 450 500 550 600
10
Source DF SS MS
Histograma de residuales F P
Residuales versus el orden de los datos
Residual estandarizado
8 3. 0 Histograma de residuales
4. 5
Frecuencia
0. 0
Residual Error 17 9564 4
563 - 1. 5
3. 0
2
1. 5
Total 19 72279 0
-3 -2 -1 0 1 2 3
- 3. 0
2 4 6 8 10 12 14 16 18 20
0. 0
-2 -1 0 1 2
Residual estandarizado Orden de la observación Residual estandarizado
Gráfica de residuales de Y
Gráfica de la fuerza de compresión versu
Gráfica de probabilidad normal de residuales Residuales versus valores ajustados
40
99
Residual estandarizado
90 2
Porcentaje
50 35
0
Fuerza de compresión
10
-2 30
1
- 3. 0 - 1. 5 0. 0 1. 5 3. 0 450 500 550 600 650
Residual estandarizado Valor ajustado
Residual estandarizado
2
4. 5
Frecuencia
20
3. 0
0
1. 5
-2 0 10 20 3
0. 0
-2 -1 0 1 2 3 2 4 6 8 10 12 14 16 18 20
% arena
Residual estandarizado Orden de la observación
Nota: P
ara probar que los coeficientes son iguales, en cuanto al análisis de varianza, la
función de ANOVA prueba la longitud total de la utilidad del modelo.
d) La descripción de los tres modelos poblacionales son:
1. El modelo cuadrático con interacción o completo es:
y 5 β0 1 β1x1 1 β2 x2 1 β3 x21 1 β4 x22 1 β5 x1x2 1 e
Tabla 9.3. Resultados de las estadísticas de los tres modelos de regresión probados.
Tipo de modelo R2 s PRESS R 2(ajustada)
Modelo completo 92.7% 19.4 25 801.0 90.1%
Modelo abreviado 92.3% 19.28 15 849.9 90.2%
Modelo lineal simple 86.8% 23.72 15 427.3 85.2%
Al juzgar por los resultados, tal parece que los mejores modelos son el cuadráti-
co sin interacción (modelo abreviado) y el modelo lineal simple. (Para tomar una
decisión final usar la función [9-9]). Sin embargo, se podría pensar que el modelo
cuadrático, con interacción, es el modelo óptimo. Pero esto no puede ser, porque el
Capítulo 9 Regresión no lineal | 409
valor de PRESS es más grande que los otros dos modelos. Cuando a los modelos de
regresión se les agregan variables innecesarias, que pudieran dar un mejoramiento
pequeño, no es recomendable su uso. Bajo estas condiciones, la adición de variables
innecesarias conlleva a problemas de colinealidad como lo muestran los grandes
VIF del modelo completo (correlación entre las variables regresoras). Por esta razón,
es conveniente dejar el modelo de regresión, lo más simple posible, a menos de que
existan buenas razones estadísticas para agregarle variables adicionales.
f) Cuando la selección final de los dos modelos de regresión finalistas se vuelve peren-
toria, se puede usar la ecuación (9-9). Esta estadística está relacionada con la suma de
los cuadrados SS, la cual mide qué tan bien encajan los datos en el modelo. Como se
dijo antes, este procedimiento consiste en comparar la suma de los cuadrados SS1 del
modelo simple y SS2 del modelo abreviado (como en este caso). Los valores de k2 y k1
corresponden al modelo abreviado y simple, respectivamente. Aquí se le pide al lector
tomar la iniciativa para decidir cual de los dos modelos finalistas es el óptimo.
9.10 C
álculos y aplicaciones de regresión cuadrática
con el programa Minitab
Ejemplo 9.3 E
n un estudio de ingeniería civil se da la información de la fuerza de compresión del
cemento (mortero) en función del porcentaje de arena. Para esto hacer lo siguiente:
a) Identificar la variable de respuesta.
b) Graficar los datos para anticipar el tipo de función de regresión esperada.
c) Establecer el modelo de regresión que mejor ajuste a los datos y evaluar su utilidad
usando diagnósticos estadísticos y gráficos.
Residual estandarizado
2
50 0. 0 90
Porcentaje
1
- 1. 5 50
10 0
Residual estandarizado
6 1. 5 2
4. 5
Frecuencia
0. 0 1
4
3. 0
0
2 - 1. 5
0 - 3. 0 -2
0. 0
-3 -2 -1 0 1 2 3 2 4 6 8 10 12 14 16 18 20 -2 -1 0 1 2 2 4 6 8 10 12 14 16 18 20
Residual estandarizado Orden de la observación Residual estandarizado Orden de la observación
b) La figura 9.8 sugiere una función cuadrática como y 5 β0 1 β1x 1 β2x2 1 e.
Gráfica de residuales de Y
Gráfica de la fuerza de compresión versus % arena
Gráfica de probabilidad normal de residuales Residuales versus valores ajustados
40
99
Residual estandarizado
90 2
Porcentaje
50 35
0
Fuerza de compresión
10
-2 30
1
- 3. 0 - 1. 5 0. 0 1. 5 3. 0 450 500 550 600 650
Residual estandarizado Valor ajustado
2
4. 5
Frecuencia
20
3. 0
0
1. 5
-2 0 10 20 30 40
0. 0
-2 -1 0 1 2 3 2 4 6 8 10 12 14 16 18 20
% arena
Residual estandarizado Orden de la observación
Analysis of Variance
Source DF SS MS F P
Regression 2 566.76 283.38 823.85 0.000
Residual Error 8 2.75 0.34
Total 10 569.51
Residual estandarizado
45
Frecuencia
90
1
50
35 0 40
10
Residual estandarizado
25 25
1
Porcentaje
2
0 20
1
-1
20
0
- 1. 5 - 1. 0 - 0. 5 0. 0 0. 5 1. 0 1. 5 2. 0 1 2 3 4 5 6 7 8 9 10 11
35 40 45 50 55
40 45 50 55 60 Residual estandarizado Orden de la observación
Cambios de velocidad (X)
(X)
En conclusión, al juzgar por los resultados obtenidos el valor del error estándar estima-
Gráfica ajustando un modelo cúbico
do s 5 0.586488, R2 5 99.5%, R2(ajustada) 5 99.4%, PRESS 5 5.49196 y R2(pred.)
Gráfica de residuales para el modelo cuadrático Gráficas de residuales para el modelo cúbico
5 99.04% sugieren que el modelo de regresión encaja bien en los datos. Además, los
Millas por galón (Y) = - 81.12 + 2.336 Cambios de velocidad (X)
13 Cambios de velocidad (X)**2 - 0.000997 Cambios de velocidad (X)**3 99
Normal Probability Plot of the Residuals
2
Residuals versus the Fitted Values Grafica de probabilidad normal de residuales
99
Residuales versus valores ajustados
2
95% C I 1
Porcentaje
95% P I 0
10
-1
50 0
-1
R-Sq 96.7% 10
R-Sq(adj) 95.7% -2
-2
1 1
-2 -1 0 1 2 20 25 30 35 40 -2 -1 0 1 2 20 25 30 35 40
Standardized Residual Fitted Value S ta nda r dize d R e s idua l F itte d V a lue
Ejemplo 9.4 É
ste es un ejemplo de química inorgánica adaptado de Chemistry the Central Science de
Histogram of the Residuals Residuals versus the Order of the Data Histograma de residuales Residuales versus el orden de los datos
2
Frecuencia
(C5H6), que reacciona por sí mismo, para formar C10H12. Una solución de 0.0400 M
Frecuencia
0 0
2. 4 2
-1 -1
de C5H6 se analizó en función del tiempo, a medida que la reacción se fue de C5H6 →
1. 2 1
-2
40 45 50 55 60 -2
0. 0 0
Cambios de velocidad (X) -2 -1 0 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 -2 -1 0 1 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0.5C10H12. Los datos son los siguientes: Standardized Residual Observation Order S ta nda r dize d R e s idua l O bs e r v a tion O r de r
Solución:
Con Minitab se dan los siguientes resultados:
1. Conc. Ciclopentadine 5 0.0373 2 0.000110 Tiempo(s)
s 5 0.00263717 R2Sq 5 93.6% R2Sq(adj) 5 91.5%
PRESS 5 0.0000899635 R2Sq(pred) 5 72.37%
2. Ln[Pentadine] 5 23.27 2 0.00414 Tiempo(s)
s 5 0.0522804 R2Sq 5 98.1% R2Sq(adj) 5 97.5% PRESS 5 0.0356509
R2Sq(pred) 5 91.84%
Capítulo 9 Regresión no lineal | 413
3. ��������������
1/[Pentadine] 5 25.2 1 0.163 Tiempo(s)
s 5 0.314783 R2Sq 5 100.0% R2Sq(adj) 5 99.9% PRESS 5 1.21807
R2Sq(pred) 5 99.82%
Se le pide al lector usar el programa Minitab y complementar los resultados estadísti-
cos de arriba con diagnósticos gráficos y de análisis de problemas potenciales tanto de
autocorrelación como colinealidad y decir cuál modelo es superior.
Para el inciso b) la constante de reacción es el valor de la pendiente de la ecuación.
Ejemplo 9.5 Este problema está relacionado con un experimento del consumo de gasolina usando la
velocidad baja de una camioneta. Hacer los siguientes cálculos:
a) Identificar la variable dependiente y la independiente. Graficar los datos con línea
de regresión y pronosticar qué tipo de función se pudiera esperar.
b) Usando Minitab ajustar un modelo cuadrático y uno cúbico con intervalos de con-
fianza e intervalos de predicción.
c) Hacer un análisis de diagnósticos estadísticos para el modelo cuadrático y cúbico.
d) Complementar el diagnóstico del inciso c) con los análisis de los gráficos subjetivos
para la suposición del modelo cuadrático. Hacer lo mismo con el modelo cúbico
del inciso.
e) De acuerdo con los análisis de los criterios objetivistas y subjetivistas, se le pide al
lector decidir cual de los dos modelos es superior.
Solución:
a) La variable dependiente es el millaje y la variable independiente son las velocida-
des. La gráfica con línea de regresión se da en la figura 9.12.
Frecuencia
90
50
35 35
10
1
-2 -1 0 1 2
(Y)
30 30 Standardized Residual
Histograma de residuales
3
25 25
Porcentaje
20 20
0
- 1. 5 - 1. 0 - 0. 5 0. 0 0. 5 1. 0 1. 5 2. 0
35 40 45 50 55 60 Residual estandarizado
(X)
95% C I
95% P I 0
50
40
2. En la ventana de Fitted Line Plot introduzca las variables y dé clic en Quadra-
S 1.35772 -1
Millas por galón
R-Sq 96.7% 10
-2
35 R-Sq(adj) 95.7%
1
30
Histogram of the Residuals Residuals ve
2
25 4. 8
1
3. 6
Frecuencia
0
20 2. 4
-1
1. 2
-2
35 40 45 50 55 60 0. 0
Cambios de velocidad (X) -2 -1 0 1 1 2 3 4
414 | Estadística para ingenieros
Figura 9.13.
3. En seguida seleccione Graphs para hacer las gráficas de residuales. Luego vaya a
Options para poner los intervalos de confianza y de predicción. Luego haga clic
en OK. Haga lo mismo para el modelo cúbico. Esto se muestra en la figura 9.14.
Gráfica de diagrama esparcido
Gráfica
40 40 Gráfica de prob
99
Frecuencia
90
50
35 35
10
1
-2
(Y)
30 30
Hist
3
25 25
Porcentaje
2
Figura 9.14. 20 20
0
- 1. 5 - 1. 0
35 40 45 50 55 60
(X)
Todas estas instrucciones generan las gráficas de la figura 9.15, las cuales mues-
tran el ajuste de un modelo de regresión cuadrático y cúbico con sus respectivos
intervalos de confianza e intervalos de predicción.
45 45 R egr ession
R egr ession 90
Porcentaje
95% C I
95% C I
95% P I
95% P I 50
40 40
S 1.35772
S 1.37104
Millas por galón
R-Sq 96.7% 10
Millas por galón
R-Sq 96.3%
35 R-Sq(adj) 95.6% 35 R-Sq(adj) 95.7%
1
30 35 40 -2 -1 0 1
ajustado Standardized Residual
30 30
el orden de los datos Histogram of the Residuals
25 4. 8
25
3. 6
Frecuencia
20 20 2. 4
1. 2
6 7 8 9 10 11
35 40 45 50 55 60 35 40 45 50 55 60 0. 0
la observación -2 -1 0
Cambios de velocidad (X) Cambios de velocidad (X)
Standardized Residual
Figura 9.15. L
a figura de la izquierda muestra el ajuste del modelo cuadrático, mientras
que la de la derecha muestra el modelo cúbico.
90 1
Porcentaje
50 0
-1
10
-2
1
-2 -1 0 1 2 20 25 30 35 40
S ta nda r dize d R e s idua l F itte d V a lue
Capítulo 9 Regresión no lineal | 415
45 45
Frecuencia
90 R egr ession
Frecuencia
90 R egr ession
35 50
XSCUBE
50
20.0009968 0.0009036 21.10 0.296 1
21197.2 1
95% C I 95% C I
95% P I 95% P I
35 40 40 0
30
1
42.8730
1
-2 -- 1
2 -0
1 R2Sq(pred) 5 92.27%
Standardized
0
1 1
2 2
35 35
20 20
25 2530 30
35 35
40 40
R-Sq(adj)R-Sq(adj)
95.6% 95.6%
Analysis of Variance
Histograma
Histograma de residuales
de residuales Residuales
Residuales ordeneldeorden
versus elversus de los datos
los datos
2 2
30 30
3
Residual estandarizado
3
Residual estandarizado
25 25 Source DF SS MS 1 1
25 25F P
Porcentaje
2
Porcentaje
1
Regression 3 536.42 178.81 0 0 97.00
20 20 0.000
1
20 20
0 0
Residual Error 10 18.43 1.84 -1 -1
- 1.-5 - 1.0.
0 0- 0.0.
5 50. 0
1. 00. 5
1. 51. 0
2. 01. 5 2. 0 13 24 35 46 57 68 79 8 9 10 11
- 1. 5 - 1. 0 0. 5 1 2 10 11
35 35 40 40 45 45 50 50 55 55 60 60
50
(X)
50 55 55 60 60
Total
Residual estandarizado
13 554.86
Residual estandarizado Orden de Orden de la observación
la observación
Cambios
Cambios de velocidad
de velocidad (X) (X)
90 1
Porcentaje
95% C I 95% C I 1
Porcentaje
Porcentaje
0
95% P I 95% P I 50 0 0
50 50 50 0
S S 1.357721.35772 -1 -1
-1 -1
R-Sq 96.7% 96.7% 10 10 10
R-Sq 10
-2 -2
R-Sq(adj) R-Sq(adj)
95.7% 95.7% 1 -2 -2
1 1 1
-2 --12 0-1 10 21 2 20 2025 2530 3035 3540 40
-2 - -12 -1
0 10 21 2 20 2025 2530 3035 3540 40
Standardized
Residual Residual Fitted Value S ta nda
Standardized Fitted Value S ta nda r dize d R re dize d lR e s idua l
s idua F itte d V aFlue
itte d V a lue
Histogram
Histogram of the Residuals
of the Residuals Residuals
Residuals versus
versus the theofOrder
Order of the Data
the Data Histograma
Histograma de residuales
de residuales Residuales
Residuales versus elversus
ordeneldeorden de los datos
los datos
2 2 2
4. 8 4 2
4. 8 4
1 1 1
3. 6 3 1
3. 6 3
Frecuencia
Frecuencia
Frecuencia
Frecuencia
0 0 0
2. 4 2 0
2. 4 2
-1 -1 -1
1. 2 1 -1
1. 2 1
-2 -2
0 55 55 60 60 -2 -2
0. 0 0. 0 0 0
d (X) -2 - -21 -1
0 01 1 1 2 3 1 4 2 5 3 6 4 7 5 8 6 9 710811912101311
1412 13 14 -2 -2
-1 -1
0 01 12 2 1 2 3 14 25 36 47 58 69 71081191210 13111412 13 14
Standardized
Standardized Residual Residual Observation
Observation Order Order S ta nda
S ta nda r dize d R re dize
s iduad lR e s idua l O bs e r v a O bs eOr rv de
tion a tion
r O r de r
Figura 9.16. L
a figura de la izquierda muestra los gráficos subjetivos para el modelo
cuadrático y la derecha para el modelo cúbico.
e) De acuerdo con todos los resultados el lector decidirá cual de los dos modelos es
superior.
416 | Estadística para ingenieros
9.11 P
rocedimientos para la identificación de valores atípicos
extremos, también conocidos como “outliers”
Los procedimientos para refinar el modelo de regresión son la identificación y eliminación de valores inusuales
extremos. En algunas ocasiones, estos valores extremos se encuentran en la generación de datos muestrales.
Estos valores extremos se refieren a datos univariados que son inconsistentes con el resto de la información.
Los valores extremos ocurren a menudo debido a errores de medición, ya sea por mal funcionamiento del
equipo o por negligencia del personal, falta de mantenimiento de los instrumentos, etc. En regresión múltiple,
los valores extremos pueden ocurrir con las variables independientes y con la variable dependiente. Estos
valores, una vez analizados se pueden eliminar o retener, si se sabe que son, en realidad, valores extremos.
Si es así es necesario eliminarlos porque pueden distorsionar el modelo de regresión ajustado o causar serios
errores en los cálculos de regresión.
k) Los valores extremos también se pueden identificar con los gráficos de los residuos que van en función
de X o de Y.
t es más pequeña de lo que debería ser. Además, algunas variables independientes o exógenas aparecen como
si no estuvieran relacionadas linealmente con la variable Y, cuando en realidad sí lo están.
Existen dos métodos para descubrir la multicolinealidad: los métodos informales y los métodos formales.
Los informales para detectar colinealidad severa son los siguientes:
a) Estudios de los signos algebraicos de los coeficientes del modelo de regresión. Si hay colinealidad,
los signos algebraicos de los coeficientes son opuestos a lo que se debería esperar de consideraciones
teóricas o de experiencia a posteriori.
b) Otra situación que pudiera indicar multicolinealidad es el hecho de que ocurren grandes cambios en
los coeficientes estimados de regresión, cuando una variable explicativa o independiente se agrega o
se elimina.
c) Cuando se hacen pruebas de hipótesis de H0:β9s 5 0, las pruebas de t no son significativas. Esta condi-
ción también pudiera indicar colinealidad.
d) Cuando hay grandes correlaciones entre pares de variables independientes (esta situación también
indica multicolinealidad).
e) Con la lógica del modelo de computadora NCSS, cuando hay números de los Eigenvalues mayores
que 1 000, esta condición indica colinealidad severa. Sin embargo, con valores de Eigenvalues entre
100 y 1 000, esta condición implica colinealidad moderada a fuerte.
f) Nuevamente, con la lógica del programa NCSS, en la sección de correlación de matrices, grandes
correlaciones entre las variables explicativas conllevan diagnósticos de colinealidad.
g) Los valores extremos también pueden causar problemas de colinealidad.
Por otra parte, los métodos formales para detectar multicolinealidad son los factores de inflación de va-
rianza (Variance Inflation Factors, VIF). En este contexto, el problema de multicolinealidad se considera severo,
cuando el máximo valor de VIP es mayor que 10 o bien, cuando el promedio de los VIF es considerablemente
. 1 (Pfaffenberger, 1987).
En cuanto a situaciones relacionadas con la multicolinealidad se enlistan los siguientes postulados:
a) Si el modelo se va a usar, únicamente, para estimar respuestas promedio o para hacer predicciones de los
valores de la variable dependiente Y, y las predicciones se hacen, solamente, sobre las región de los valo-
res de las variables independientes y, los coeficientes de regresión estimados no se usan para propósitos de
interpretación, concerniendo las relaciones de las variables explicativas (X) y de la variable de respuesta
(Y), entonces, la multicolinealidad, aun cuando sea severa, no será un problema (Pfaffenberger, 1987).
Aquí, sin embargo, la determinación de la región muestreada es difícil. Por ejemplo, si hay una variable
independiente, entonces, la región es un intervalo sobre la línea real entre el valor mínimo de x y el valor
máximo de x en la muestra. Además, con cuatro variables independientes, la región muestreada es en el
espacio de cuatro dimensiones de las x y sus linderos no son obvios. Por tanto, bajo estas condiciones,
hay que tener precaución, de tal manera que la predicción no represente una extrapolación más allá de la
región muestreada de las x, cuando existe multicolinealidad severa. No obstante, si se desea hacer inter-
pretaciones de los coeficientes de correlación (bi), entonces la multicolinealidad no se puede tolerar.
b) El hecho de que algunos o todas las variables independientes estén correlacionadas entre sí, en general,
no obstruye la habilidad para obtener un buen ajuste de los datos. Esta situación tampoco interfiere en
las inferencias acerca de las respuestas promedio de predicciones de nuevas observaciones, siempre y
cuando estas inferencias sean hechas dentro de la región de las observaciones.
c) Cuando las variables independientes están altamente correlacionadas, los coeficientes de regresión
estimados tienden a tener una gran variación de muestreo. Por tanto, bajo estas condiciones, los coefi-
cientes de regresión tienden a variar ampliamente de una muestra a otra. Como resultado de esto, se
obtiene información imprecisa acerca de los coeficientes individuales.
418 | Estadística para ingeniería y ciencias
La pregunta de cuántas variables independientes (incluidas las variables transformadas) deben de incluir-
se en el modelo de regresión es el tema a tratar, cuando se habla de los procedimientos usados en el programa
Minitab, como “Todas las regresiones posibles” (All Possible Regressions), “Regresión por pasos” (Stepwise Re-
gression) y “Regresión de los mejores conjuntos” (Best Subset Regression).
Encontrar el número ideal de variables independientes involucra dos objetivos opuestos. Primero se de-
sea que el modelo de regresión sea lo más completo y realista posible. Esto significa que se debe incluir cada
variable independiente, aunque parezca remotamente relacionada con la variable dependiente. En segundo
término, se debe incluir lo menos posible de variables independientes. Esto se debe a que, cada variable in-
dependiente, que no sea relevante al modelo, disminuye la precisión de los coeficientes calculados y de los
Capítulo 9 Regresión no lineal | 419
valores pronosticados. De esta manera, la finalidad de la selección de las variables es parsimoniosa, esto quiere
decir que debe haber un balance entre lo simple (lo menos posible de variables) y el ajuste (la inclusión de todas
las variables que sean pertinentes).
Hay diferentes estrategias para la selección de las variables más apropiadas para el modelo de regresión.
Por ejemplo, la lógica del modelo NCSS recomienda que, si no hay más de 15 candidatos de variables inde-
pendientes (sin incluir el intercepto), entonces, se debe usar el procedimiento de “Todas las regresiones posi-
bles” (All Possible Regressions). Esto se debe a que este procedimiento dará modelos tan buenos o mejores que
el procedimiento de “Regresión por pasos”. Sin embargo, si hay más de 15 candidatos de variables, enton-
ces, se recomienda el procedimiento de “Regresión por pasos” (Stepwise Regression). Otra función dada por
el programa Minitab está relacionada con la “Regresión de mejores conjuntos” (Best Subsets Regression).
Después de que se haya formado un conjunto de candidatos de variables independientes (una vez que se
eliminaron las observaciones extremas y se mitigó la multicolinealidad), la siguiente tarea es la de establecer
una base para comparar dos modelos finalistas. ¿Cómo se puede decir si el modelo A es mejor que el B? Para
tomar esta decisión crítica el consenso de investigadores de estadística está basado en las funciones estadísti-
cas citadas anteriormente, como R2, s, PRESS, etc. Como ya se explicó anteriormente, estas funciones son, el
coeficiente de determinación R2, el error estándar estimado s, el criterio Cp de Mallow y la estadística PRESS.
Otros criterios son los valores de t, tablas de ANOVA, análisis de gráficos, etc., pero los penúltimos cuatro
diagnósticos son los más populares.
Ejemplo 9.6 Este ejemplo está encaminado a identificar los valores extrínsecos. Así, se obtiene una
muestra aleatoria de 25 mediciones de partículas atmosféricas (menores que 10 mi-
cras). Se desea saber si hay valores inusuales extremos o moderados. Usar un diagrama
de caja.
DFITS . 2 Tabla
p n , 9.6. Datos del ejemplo 9.6
7 9 14 74 74 85 91 92 92 93 94 95 95 95 96 96 97 97 97 99 99 102 104 107 120
Solución:DFITS . 2 p n ,
$ 62 n
En primer lugar, se ponen los datos en forma ascendente (ya están) y luego se calculan
los cuartos inferiores y superiores de la siguiente manera.
$ 62 n
Cuarto Mediana de los mínimos n/2 casos, cuando n es par.
5
inferior Mediana de los mínimos (n 1 1)/2 casos, cuando n es impar.
Cuarto inferior para observaciones impares 5 mediana de los mínimos (25 1 1)/2 5
13, y el cuarto inferior (con n impar 5 25) 90. Igualmente, el cuarto superior es igual
a 97. La cuarta dispersión fs 5 cuarto superior 2 cuarto inferior 5 97 2 90 5 7. Ade-
más, 1.5fs 5 (1.5)(7) 5 10.5 y 3fs 5 (3)(7) 5 21.
Para estimar los valores atípicos inusuales, el criterio es: cualquier observación me-
nor que el cuarto inferior, menos 1.5fs o mayor que el cuarto superior más 1.5fs es un
valor atípico inusual. Esto es: 90 2 10.5 5 79.5 y 97 1 10.5 5 107.5. Analizando los
gráficos de la figura 9.17, se observa que hay un valor atípico (120) mayor en el extremo
superior de la muestra. Además, hay tres valores de este tipo (7, 9 y 14), en el extremo in-
ferior. Para identificar los valores extremos se calcula la diferencia entre el cuarto inferior
y 3fs, es decir, 90 2 21 5 69. Refiriéndose a la tabla 9.6 y la figura 9.17, vemos que las tres
observaciones 7, 9 y 14 son valores extremos (que se eliminarán) y el valor de 120 es un
valor atípico moderado.
Figura 9.17. L a figura del lado izquierdo muestra un diagrama de caja con los
3 valores atípicos extremos (7, 9, 14) y el valor atípico moderado
(120).
Diagrama de dispersión de la variable LaX figura del ladoDiagrama
aleatoria derecho
Diagrama muestra
dededispersión
dispersión elaleatoria
dedelalavariable
variable diagrama
aleatoriaXX con todosDiagrama de dispersión de la var
los valores. 120 120
100 100
Ejemplo 9.7 Este ejemplo está encaminado a analizar el efecto que pueda ocurrir en el modelo pro-
Var aleatoria X
Var aleatoria X
80 80
babilístico de regresión estimado, cuando se eliminan valores extremos. Para los datos 60 60
sigla de suma de cuadrados de predicción), ANOVA, etc. Ver si hay diferencias signifi-
cantes en cada uno de los dos casos. Hacer una tabla con el resumen de los dos modelos
probados, es decir, con y sin valores extremos.
Tabla 9.7. D
atos de mediciones (micras) de partículas atmosféricas de la variable depen-
diente, en función de sus respectivos casos (X).
6 8 14 85 88 90 92 92 93 94 94 95 95 96 96 96 97 97 98 99 101 104 106 114
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Solución:
Primeramente, se identificarán los valores extrínsecos analizando la gráfica de disper-
sión de los datos y el diagrama de caja como se ve en la figura 9.18.
0 0 20 20 40 40 60 60 80 80 100 100 120 120 0 0 20 20 40 40 60 60 80 80 100100 120120
Mediciones de partículas
Mediciones de partículas Mediciones de partículas
Mediciones de partículas
Capítulo 9 Regresión no lineal | 421
Diagrama de dispersión
Diagrama de lade
de dispersión variable aleatoria
la variable X X
aleatoria Diagrama de dispersión
Diagrama de la
de dispersión devariable aleatoria
la variable X X
aleatoria
120 120
100 100
Var aleatoria X
Var aleatoria X
80 80
60 60
40 40
20 20
Tabla 9.8. R
esumen de los resultados de los dos modelos probados, es
decir, con y sin los valores extremos.
Tipo de modelo R2 R 2ajustada s PRESS
Modelo con valores extremos 88.2% 86.4% 11.06 3 564.96
Modelo sin valores extremos 99.3% 99.2% 0.4405 4.83
los términos de los errores ei están positivamente correlacionados sobre el tiempo. Bajo semejantes condiciones,
los errores aleatorios ei se dice que están autocorrelacionados o serialmente correlacionados (autocorrelación).
La causa primordial de obtener errores aleatorios positivamente autocorrelacionados se debe a la omisión de
variables claves del modelo (Neter et al. 1996). Por lo común, cuando los datos están agrupados secuencialmen-
te sobre un periodo de tiempo es decir, en series de tiempo, los valores residuales están correlacionados.
Por ejemplo, las figuras 9.19 y 9.20 muestran gráficas de los residuales, en función del tiempo, los cuales
exhiben autocorrelación, mientras que la gráfica de la figura 9.21 indica independencia de los residuales.
Las maneras de detectar problemas de autocorrelación de primer orden, una condición que implica una
correlación entre los residuos et y et 2 1, donde t es el periodo de tiempo, son usando la estadística Durbin-
Watson. Matemáticamente, esta ecuación se define como:
∑ (e )
n 2
t
2 et 21
t 52
D5 n
(9-10)
∑e t
2
t 51
Donde:
D es la estadística de Durbin-Watson
( )
20
∑ et 2 et 21
2
et y et21 relación entre los residuos sobre el periodo
T 52 0. 09794
n es el número de casos D5 20
5 0. 735 5
0. 13330
En general, a menos que las observaciones sean ∑ e 2
de series
t de tiempo, la estadística de Durbin-Watson
t 51
debería ser ignorada, porque esta estadística da una prueba de autocorrelación positiva o negativa, solamente,
para series de tiempo. Cuando se están aplicando series de tiempo y existen problemas de autocorrelación pue-
den existir varias importantes consecuencias. Por ejemplo, coeficientes de regresión pueden ser ineficientes, el
MSE seriamente subestimará los errores de la varianza, el s{bk} calculado por la función de los mínimos cua-
drados seriamente subestimará la desviación estándar y los coeficientes de regresión, etc. (Neter et al. 1996).
Las medidas para mitigar problemas de autocorrelación son los de agregar una o más variables predictoras al
modelo de regresión o de usar variables transformadas.
0 Tiempo
Figura 9.19. G
ráfica de valores residuales versus
tiempo que muestra patrones de au-
tocorrelación (falta de independen-
cia).
e e
0 Tiempo 0 Tiempo
Figura 9.20. G
ráfica de valores residuales versus
tiempo que indica autocorrelación
(falta de independencia).
424 | Estadística para ingeniería y ciencias
e e
0 Tiempo
Figura 9.21. G
ráfica de valores residuales versus tiempo que indica
independencia de los datos.
Debido a que estas estimaciones tienden a mostrar correlación de serie parcial, en aplicaciones en la eco-
nomía y negocios se pueden usar pruebas de hipótesis como:
H0:ρ 5 0 (no hay autocorrelación o independencia) (9-11)
Ha:ρ . 0 (autocorrelación) (9-12)
La prueba consiste en determinar si el parámetro de autocorrelación ρ es igual a cero o es mayor que
cero. Por ejemplo, si ρ 5 0 los términos del error et son independientes debido a que los términos ut son in-
dependientes. No obstante, los valores críticos son difíciles de obtener, pero la prueba de Durbin-Watson ha
obtenido los linderos superiores e inferiores dU y dL de tal manera que un valor de D fuera de estos linderos
lleva a una decisión definitiva.
Neter et al. (1996) dan la regla de decisión para probar entre estas alternativas, esto es:
si D . dU, se concluye H0: (9-13)
si D , dL se concluye Ha: (9-14)
si dL # D # dU, la prueba es inconclusa (9-15)
Valores pequeños de D conllevan a la conclusión de que la prueba de hipótesis de Ha:ρ . 0, porque los
errores aleatorios adyacentes et y et21 tienden a ser de la misma magnitud, cuando están positivamente auto-
correlacionados. Por tanto, la diferencia en los resultados et 2 et21 tiende a ser menor cuando ρ . 0, lo cual
lleva a un numerador pequeño en la función de D y a una prueba estadística de D pequeña.
El apéndice de este texto muestra las tablas con las pruebas de los linderos de Durbin-Watson, para niveles
de significancia de α 5 0.05 y α 5 0.01, respectivamente. Como se muestra en estas tablas, la columna de la
izquierda señala los valores de n y las siguientes columnas señalan los valores para cada k con sus correspon-
dientes linderos.
Ejemplo 9.8 E
ste problema está adaptado del libro Applied Linear Regresión Models de los investiga-
dores John Neter, Michael H. Kutner, Christopher J. Nachtsheim y William Wasser-
man (1996). La información se da de la siguiente manera: (et 2 et21)2 5 0.09794, e2t 5
0.1333018 con una tamaño de muestra de n 5 20. Probar las hipótesis (de autocorrela-
ción positiva) señaladas abajo usando niveles de significancia de 0.05 y 0.01:
H0:ρ 5 0
Ha:ρ . 0
∑ (e )
n 2
2 et 21
t 52
t
Capítulo 9 Regresión no lineal | 425
D5 n
∑e t
2
t 51
Solución:
Usando la ecuación (9-10) y sustituyendo los datos da:
∑ (e )
20 2
t
2 et 21
T 52 0. 09794
D5 20
5 5 0. 735
0. 13330
∑e t
2
t 51
El método más común para diagnosticar el problema de heteroscedasticidad es graficando los residuales
contra los valores pronosticados de y. Así, se analiza el esparcimiento de los puntos graficados. Por ejemplo la
figura 9.22 describe los residuales mostrando heteroscedasticidad, es decir, cuando el error 2σ ε no es constante.
Como resultado de esto, sí existen cambios sistemáticos de los residuales con las funciones de las variables
independientes. Esta condición se prueba analizando esta figura, porque el error σ2e aparece pequeño cuando
el valor pronosticado de y es pequeño y grande cuando el valor de y lo es. En contraste, la figura 9.23 muestra
una condición de homoscedasticidad, es decir, de σ2e constante. Como resultado de esto, no hay cambios apa-
rentes en la variación de los residuales.
e
Figura 9.22. G
ráfica de residuales que mues-
tran la condición de heterosce-
ŷ
dasticidad, es decir, de la varian-
za del error, σ2ε no constante.
426 | Estadística para ingeniería y ciencias
Tiempo
ŷ
Figura 9.23. G
ráfica de residuales que muestra la condición de homosce-
dasticidad, cuando la varianza del error, σ2ε es constante o
los residuales son independientes.
H 0;X 21nulas
Las pruebas de hipótesis z…
X 2 2 se (1Xzz, 2ix
pueden hacer
1,, xx, ix2de
,…
i 2 ((1
, xla2 ix2siguiente
,,ik…
2 ,, x
… ,…
ik,2 x i 2…
2
, x22, x,,… , manera.
xix222x2 iki 3,,,xx…
ik ,, x
… xxi 3i ,, k
… 2xx1i,x,k… ) 11xxik2))
kik
i
i
n
H i;2X X ik i2 X Hikn0;Xii2221x i3 X
… i Xik n
Por ejemplo, la pruebaHde ;Xhipótesis
2
X 2 2de
0 H 1;X 2
2 … homoscedasticidad,
…X2 n X 2 2
2 0 1 2 es decir, de que la varianza 2
del error, σ2ε es
X …
constante es: 0 1 H 0;X 1 X 2 X n
2 n 2
H 0;X 21 X 2 2 H…; X
X 2H
H
2
X22221
;X …22 X…
XX …
2
XX…2
2
(9-18)
1 0n; 2 2 2n [ k2 n(k 1) 2 ]1
1 ;X 2 X n X
0
0 H n
H 0;X 1 2X 2 2 …
2 2
X 2 0 1 2
H 0;X 1 X 2 …2 n X 22n …
La prueba de hipótesis alternativa deH ;X 1 X 2 Xes:
heteroscedasticidad
0
2
n
H 2
nR 2 nR
nR22
H 2
H
H 2
2
2
Capítulo 9 Regresión no lineal | 427
a) función exponencial
428 | Estadística para ingeniería y ciencias
los
y rangos). Bajo estas condiciones
y y9 5cada
reemplazando 1 βx
lny ( a )medición por su raízy cuadrada, por lo general
da por resultado varianzas
α
homogéneas y así sucesivamente.β.1 α
De acuerdo a Johnson (Probabilidad y estadística para ingenieros de Miller y Freund, 1997) transforma-
ciones útiles β.0
para la reducción de valores β,0
, x 1 4 y 0,β,1
grandes son2 1 x , ln xβ.0 x . Análogamente, β,0
para incremen-
to de valores grandes las transformaciones más útiles son x y x . 2 3 β.0
Porαejemplo, la figura 9.24 muestra gráficas de funciones α lineales intrínsecas, como funciones exponencia-
x x α
les, funciones de potencia, funciones recíprocas y funciones hiperbólicas. Por síxmismas, las funciones xlineales
llevan a modelos probabilísticas que, a pesar de no ser lineales, en x como
a) función exponencial a) función,
b) función
función tienen parámetros cuyos
exponencial
de potencia
0
β.0 0,β,1 β,0 0,β,1 β,0
β.0 β.0 β.0
α α
α
x xx α x
x x
b) función
función exponencial
de potencia c) función
b) función de
recíproca
potencia
a)
y y y y y
y y
1
β.1 β
0 0
α α
x α x x x x
x x
c) función recíproca c)d)función
funciónrecíproca
hiperbólica
b) función de potencia
Figura 9.24. G
ráficas de funciones lineales intrínsecas. La figura a) representa la función
y exponencial;
y y la figura b) representa la función dey potencia; la figura c) una
1función recíproca, y la d) una función hiperbólica.
1
β β c)
a) y b) y y
0
β,0
9.16
β.0
α
alores inusuales extremos,
V x
x x1
su identificación y sus consecuencias
x x 1 x
c)d)función
funciónrecíproca
hiperbólica d) función hiperbólica
Por otra parte, en cuanto a la presencia de valores atípicos, como se mencionó en el ejemplo 9.6, se puede decir f) y
d)
que toda observación que
y difiera de 1.5fs del cuarto más cercano
y es inusual. e) y
Además, un valor inusual es extrín-
seco o extremo cuando 1 ese valor está a más de 3f del cuarto más cercano. Sin embargo, un valor inusual será
β s c) c)
moderado b)
en cualquier otro caso. Dey cualquiera) manera,ylos valores inusualesb) extremos se
a) y y y definen como obser- y
vaciones que aparecen como datos inconsistentes con el resto de la información. Estos valores pueden aparecer
x1
en cualquier extremo de los datos. La identificación potencial de losx1valores inusuales puede hacerse analizan-
do los diagramas esparcidos, los diagramas de caja, los diagramas de tallo y hoja, las gráficas de probabilidad
x1 x1 x x1 x
normal o las gráficas de los residuales semiestudentizados.
x También el1 comportamiento del sesgo y la1 kurtosis
pueden señalar valores extrínsecos. Sin embargo, de acuerdo con la lógica del programa NCSS, hay que estar
d) función hiperbólica
f) y f) y
d) e) y d) e) y
y y
Capítulo 9 Regresión no lineal | 429
conscientes que los diagramas de caja y los gráficos de pruebas de normalidad evalúan la potencialidad de un
valor extremo suponiendo que la población muestreada es normal, porque de otra manera, estas pruebas mos-
trarán muchos valores extrínsecos. De acuerdo con esta lógica, se recomienda que, si se sospecha de valores ex-
tremos, deberá hacerse una comparación del promedio, la mediana y la moda. Si los valores atípicos extremos
están solamente a un lado del promedio, la mediana es una mejor medida de localización, pero si los valores
extremos están igualmente divergentes en cada lado del centro, el promedio y la mediana estarán cercanos, pero
la desviación estándar estará inflada. Además, de acuerdo con esta lógica computacional, el rango intercuartil
es la única medida de variación que no es grandemente afectada por los valores extrínsecos.
Los valores atípicos extremos causan muchas dificultades y pueden afectar las predicciones de los mo-
delos de regresión. Sin embargo, un valor inusual extremo debe eliminarse, cuando haya evidencia de que
ese caso representa un mal funcionamiento del equipo, errores de medición, errores del personal técnico, etc.
Debe de pensarse que los valores extremos pueden ocurrir casualmente o causalmente (por ejemplo debido a
cambios bruscos en los patrones meteorológicos por donde pasa la pluma de algún complejo industrial, etc.).
De cualquier manera, si se comprueba que un valor es extrínseco, debe de eliminarse. Esto ocasionará que los
modelos de regresión den resultados más precisos debido a la consecuente normalidad de las distribuciones,
ocasionada por la eliminación de los susodichos valores extrínsecos.
Problemas propuestos
9.1 Se hace un experimento con un nuevo modelo de automóvil, 9.3 La viscosidad de un tipo de lubricante se midió con seis ve-
para determinar la distancia, después de frenar a varias velo- locidades diferentes en kilómetros por hora. Se supuso un
cidades. La información es la que aparece en la tabla 9.4. modelo cuadrático de regresión como el más apropiado y la
función de regresión polinomial estimada resultante de una
Tabla 9.4. Datos del problema 9.1.
muestra de n 5 6 fue:
Velocidad, v (km/h) 37 52 67 82 97 113 y 5 2113.0937 1 3.3684x 2 0.01780x2
Distancia después de a) Identificar la variable dependiente.
17 27 43 63 89 120
frenar el auto, d (m) b) Identificar la variable independiente.
a) Hacer una gráfica con la variable independiente y la va- c) Calcular la viscosidad del lubricante cuando la velocidad
riable dependiente. es de 75 kilómetros por hora.
b) Ajustar el modelo o la ecuación de regresión lineal pobla- 9.4 Con la microbiología es bien sabido que el crecimiento bacte-
cional de la forma μd|n 5 β0 1 β1n1 1 β2n2, la cual es esti- rial o de virus sigue a una función matemática exponencial.
mada por la ecuación de la muestra Y 5 b0 1 b1x1 1 e. Un modelo de regresión poblacional que involucre el creci-
c) Estimar la distancia después de frenar, con velocidad de miento bacterial en función de las horas que ha pasado puede
70 kilómetros por hora. expresarse como y 5 β0 1 β1x 1 β2x2 1 β3x3 1 e, donde y es
d) Estimar la distancia después de frenar, cuando la veloci- el conteo de las bacterias y x es el número de horas que han
dad es de 120 km/h. pasado. Si en cierto estudio de microbiología la ecuación de
9.2 Éste es un ejercicio relacionado con el ajustamiento del mejor regresión se diera como, y 5 27.99 1 12.5x 2 0.91 x2 1 2.2
modelo de regresión. La tabla 9.10 da los datos. x3, entonces calcular el número de bacterias que aparecerían
después de un día.
Tabla 9.10. Datos del problema 9.2.
9.5 Se dan los siguientes datos en la tabla 9.11.
X 0 1 2 3 4 5 6 7 8 9 Tabla 9.11. Información del problema 9.5.
Y 9.1 7.3 3.2 4.6 4.8 2.9 5.7 7.1 8.8 10.2 X 0 1 2 3 4 5 6
Y 24.60 24.71 23.90 39.50 39.60 57.12 67.11 67.24 67.15 77.87 80.11 84.67
X 4.0 4.0 4.0 5.0 5.0 6.0 6.5 6.5 6.8 7.0 7.1 7.3
ficos.
c) Hacer un resumen de los resultados de los cuatro modelos
de regresión probados y decidir cual sistema es superior.
Para esto completar la tabla 9.14. x1 x1
d) Con el modelo superior seleccionado estimar el número
de accidentes con X1 5 a 70 vehículos y X2 5 95 kilóme- Figura 9.25. G
ráficas a), b), c), d), e) y f) de y en función de
tros por hora. varios valores de x.
Capítulo 9 Regresión no lineal | 431
9.10 En un estudio de ingeniería automotriz se discute la eficien- de radiación ultravioleta (que varían de 0 a 14 y que
cia de un tipo de mecanismo de transmisión que funciona a están siendo causado por los compuestos hidrobro-
más de la capacidad normal, el cual se prueba para reducir mo-fluorocarbonados y los compuestos clorofluoro-
el consumo de gasolina y, por ende, la reducción de la conta- carbonados que están destruyendo la protectora capa
minación ambiental (por las emisiones de gases de inverna- estratosférica de ozono). Además de éstos, hay otros
dero). Este estudio se hizo utilizando un tamaño de muestra factores más que tendrán que incluirse en el modelo
de 11 pruebas, con una camioneta equipada con este tipo de de regresión agrícola, como las concentraciones de
transmisión. La tabla 9.16 muestra la velocidad constante, en ozono troposférico artificial (O3), los óxidos de nitró-
millas por hora, en función de las millas por galón obtenidas. geno (NOx), los óxidos de azufre (SOx) y otros más
Suponer un modelo de regresión de segundo orden. Los da- que están afectando el rendimiento agrícola. De cual-
tos se dan en la tabla 9.16. quier manera, bajo estas condiciones, el estadístico
Tabla 9.16. Datos del problema del rendimiento de gasolina. Cp va a ser de gran utilidad para revisar las variables
faltantes o superfluas.
Velo- 9.12 La suma de los cuadrados del error de un modelo de regre-
36 36 41 41 46 46 51 51 56 57 61
cidad sión polinomial cuadrático completo, con interacción y con
Rendi-
19 19 27 30 36 37 40 38 33 36 26
dos variables independientes es de SSe 5 200.0. La suma de
miento los cuadrados del modelo simple, sin interacción, con una
Hacer lo siguiente: variable independiente es de SSa 5 500. Suponer k1 5 4, k2
a) Identificar la variable de respuesta y la variable indepen- 5 5, n 5 50 y α 5 0.05. Determinar cuál de los dos modelos
diente. es superior. Sugerencia: usar la ecuación (9-9).
b) Graficar los datos de millas por galón versus velocidad. 9.13 Contestar las siguientes preguntas usando la función (9-9),
c) Ajustar un modelo de regresión polinomial de segundo con la información dada.
orden. a) Se dan los siguientes datos: k1 5 2, k2 5 5, n 5 100, α 5
d) Validar la función probabilística cuadrática usando diag- 0.05, SSE1 5 7 000.0 del modelo abreviado y SSE2 5 6
nósticos estadísticos objetivistas. 000.0 del modelo completo. De acuerdo con esto, ¿cuál
e) Validar el modelo cuadrático estimado usando gráficos de los dos modelos es superior?
subjetivos. b) Se dan los siguientes datos: k1 5 3, k2 5 7, n 5 45, α 5
f ) Usando la ecuación del modelo de regresión obtenida, 0.05, SS1 5 1 600 del modelo abreviado, SS2 5 900.0 del
estimar el rendimiento de gasolina con velocidades de 55 modelo completo. ¿Cuál de los dos modelos de regresión
millas por hora y 80 millas por hora y comparar ambos es el mejor?
resultados. c) Se dan los siguientes datos: k1 5 2, k2 5 4, n 5 30, α 5
g) ¿Cree usted que la reducción de las velocidades vehicula- 0.05, suma del error de las cuadrados del modelo simple
res en los caminos pueda contribuir a contaminar menos es SS1 igual a 130.0. La suma de los cuadrados del mo-
el medio ambiente? delo complejo es de SS2 igual a 100.0. ¿Cuál de los dos
9.11 En una investigación científica agrícola, se estudió, en 10 modelos de regresión es el mejor?
pruebas, los efectos de la humedad de la tierra (x1 en pulga- 9.14 La tabla 9.18 muestra datos de un experimento, el cual
das) y la temperatura (x2 en oC) en función del rendimiento consiste en cuatro variables independientes y una variable
(en fanegas), de cierta variedad de plantas de maíz (Y). Los dependiente. Se usa un paquete de computadora, el cual se-
datos se dan en la tabla 9.17. lecciona tres de los modelos candidatos más apropiados.
Tabla 9.18. Datos del problema 9.14.
Tabla 9.17. Datos del problema 9.11.
(Y) X1 X2 X3 X4
Humedad (x1) 6 6 6 6 14 14 14 15 16 16
79.3 5.5 31 10 8
Temperatura
20 21 22 22 22 23 23 23 24 24 200.1 2.5 55 8 6
(x2)
Rendimiento 163.2 8.0 67 12 9
49 48 48 48 48 42 44 44 40 40
(Y) 200.1 3.0 50 7 16
El ingeniero agrónomo estadístico está presuponiendo un 146.0 3.0 38 8 15
modelo de regresión cuadrático con interacción, aunque se 177.7 2.9 71 12 17
sospecha de un modelo cuadrático sin interacción.
30.9 8.0 30 12 8
a) Describir el modelo cuadrático poblacional con interac-
ción y sin interacción. 291.9 9.0 56 5 10
b) Evaluar ambos modelos a través de diagnósticos esta- 160.0 4.0 42 8 4
dísticos y gráficos y tomar la decisión final usando la
339.4 6.5 73 5 16
ecuación (9-9).
Nota: E n futuras investigaciones agrícolas es de observar- 159.6 5.5 60 11 7
se que, además de las variables tradicionales como 86.3 5.0 44 12 12
temperatura, humedad, tipo de suelos, etc., que se in- 237.5 6.0 50 6 6
cluyen en los modelos de regresión, hay otras varia-
107.2 5.0 39 10 4
bles que deberán incluirse, porque están afectando la
producción agrícola, como por ejemplo, los índices 155.0 3.5 55 10 4
432 | Estadística para ingeniería y ciencias
a) Se le pide al lector usar un programa de computadora y b) Una vez tomada una decisión sobre los dos modelos fi-
ratificar los datos calculados en la tabla 9.19. Basándose nalistas, confirmarla usando la ecuación (9-9) (recordar
en los resultados de esta tabla (o los calculados por el lec- que se tendrán que calcular las tablas de ANOVA que
tor), la cual muestra los tres modelos de regresión, con dan las sumas de los cuadrados (SS).
sus respectivos diagnósticos estadísticos, tomar una deci- La tabla 9.19 muestra los tres mejores candidatos de mode-
sión final sobre el modelo óptimo, sustentándola con los los, para que el lector tome una decisión sobre cuál de los
diagnósticos gráficos. tres modelos es el óptimo.
Tabla 9.19. Resultados.
Hay que notar que la tabla 9.19 incluye las estadísticas Cp, c) Evaluar la utilidad del modelo usando los criterios esta-
la estadística de Durbin-Watson y los factores de varianza dísticos R2, R2ajustada, s, Cp y PRESS.
inflada (VIF). Como se asentó en otra parte, la estadística Cp d) Complementar la utilidad del modelo de regresión selec-
evalúa el número óptimo de variables que se incluirán en el cionado aplicando criterios subjetivos (gráficas de resi-
modelo. Por ejemplo, el modelo superior debe de tener un Cp duales y prueba de normalidad).
cercano a (p 1 1), donde p es el número de variables inde- La tabla 9.20 muestra la información requerida.
pendientes. Similarmente, la estadística de Durbin-Watson, Tabla 9.20. Datos del problema 9.15.
que está relacionada con la autocorrelación entre los residua-
Ozono
les, menciona que si el valor de esta estadística está cercano Mes
(ppb)
NO (ppb) NO2 (ppb) Temperatura (oF)
a dos, entonces, los residuales no están correlacionados, pero
si difiere mucho de dos, entonces hay problemas de autoco- Enero 16.7 28.2 21.0 49.68
rrelación. Igualmente, con relación a los factores de varianza Febrero 19.4 23.0 18.9 53.06
inflada (VIF), esta estadística es una indicadora de multi-
colinealidad, es decir, de relación lineal entre las variables Marzo 30.0 12.5 16.3 58.82
independientes. De esta manera, grandes valores de VIF con-
Abril 34.4 10.2 14.4 68.00
llevan muchos problemas. Por ejemplo, la multicolinealidad
hace que los coeficientes de regresión sean inexactos, infla los Mayo 35.8 6.2 12.8 77.36
errores estándar de los coeficientes de regresión, desinfla la
Junio 37.5 4.0 10.9 82.94
pruebas parciales de t y da valores falsos de no significancia
de la probabilidad p. Julio 38.7 3.3 12.7 83.66
9.15 En una investigación relacionada con la contaminación
del aire por el ozono, a ras del suelo, se sacó una mues- Agosto 36.4 3.9 14.4 83.12
tra de cinco años (1999-2003) procedente de una estación Septiembre 30.7 8.8 16.6 78.44
muestreadora localizada en el Parque Chamizal en El Paso,
Texas. El mantenimiento y calibración de los aparatos de Octubre 21.2 9.8 20.9 67.10
esta estación muestreadora los realizó la EPA de Estados
Noviembre 16.6 33.0 22.7 56.30
Unidos. El estudio consistió en el procesamiento estadístico
de variables, como el ozono (O3), el monóxido de nitrógeno Diciembre 14.9 34.9 23.8 46.18
(NO), el bióxido de nitrógeno (NO2) y la temperatura en
grados Fahrenheit (oF). Esto se hizo con objeto de obtener 9.16 Este problema está relacionado con una información de da-
un modelo de regresión estadístico para fines de predicción. tos de un experimento relacionado entre el pH (X ) y la con-
El procedimiento consistió en obtener los promedios (de los ductividad eléctrica (Y ). Los datos se dan en la tabla 9.21.
valores espacio-temporales de una hora), de cada una de las Basando el razonamiento en los resultados dados por el pa-
cuatro variables independientes de cada una de las 24 horas quete Minitab, decidir si el modelo de regresión más apro-
del día de cada mes de cada uno de los cinco años. Aproxi- piado es un modelo cuadrático o un modelo de regresión
madamente, se procesaron 178 560 datos (24 horas × 31 días cúbico. Justificar la respuesta en la decisión seleccionada de
× 12 meses × 5 años × 4 variables). Los promedios de los acuerdo con la información proporcionada.
promedios, en partes por billón (ppb) se dan abajo. Hacer los Tabla 9.21. Datos del problema 9.16.
siguientes cálculos:
C1 C2 C3 C4 C5 C6
a) Graficar los datos para ver el tipo de la función gráfica
que se pueda esperar. Sugerencia: usar el programa de (Y) (X) XSQ XCUBE COEF1 COEF2
computadora Excel. 1 1.20 4.01 16.0801 64.481 46.9072 247.908
b) Para obtener el mejor candidato del modelo de regresión 2 0.78 4.07 16.5649 67.419 219.9094 2157.905
usar un Best Subset Regression (mejor subconjunto de re-
3 0.83 4.08 16.6464 67.917 2.1161 33.643
gresión) y un Stepwise Regression (regresión por pasos).
Capítulo 9 Regresión no lineal | 433
Mediciones 2.75 3.00 3.50 3.85 1.00 4.30 3.93 4.21 4.30 4.33 4.00 4.20 2.75 3.65 2.70 3.00 2.00
No.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
muestra
Hacer los siguientes cálculos: que el aparato analizador que muestreaba el CO pudo ha-
a) Hacer una gráfica de mediciones en función del número ber tenido fallas durante el muestreo de CO debido a que
de muestra con línea de regresión suponiendo un modelo se notaron valores fuera de lo normal. Para verificar si en
cuadrático. verdad hubo valores atípicos en las concentraciones de CO,
b) Determinar el valor del cuarto inferior y del cuarto su- se requiere saber cuáles fueron los valores extremos. Para
perior. tales fines usar diagramas de caja que identifiquen valores
c) Hacer una gráfica de caja y determinar visualmente al- inusuales extremos. Para esto se da la tabla 9.23.
gún valor atípico extremo. Hacer los siguientes cálculos:
d) Calcular un modelo de regresión que incluya todos los a) Hacer un diagrama de dispersión.
datos con los valores extremos.
e) Calcular otro modelo de regresión que excluya los valo- b) Hacer una gráfica con un diagrama de caja e identificar
res atípicos extremos identificados en la gráfica. los valores atípicos extremos de CO.
f) De acuerdo con los diagnósticos estadísticos y diagnós- c) Correr una estadística descriptiva y analizar todos los
ticos gráficos de residuales, determinar cuál de los dos resultados incluyendo la prueba de normalidad de An-
modelos es superior. derson-Darling.
9.18 En la tabla 9.23 se presentan datos relacionados con las con- d) Eliminar los valores atípicos extremos y hacer un diagra-
centraciones de monóxido de carbono (CO) emitidas por ma de dispersión con los valores inusuales extremos que
motores de combustión interna. Sin embargo, se argumenta se eliminaron.
Tabla 9.23. Valores de las concentraciones de monóxido de carbono (ppm).
Concentración
20 57 60 65 75 80 90 90 95 95 97 99 99 100 103 105 120 125 160
de CO
Número de
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
muestra
434 | Estadística para ingeniería y ciencias
e) Correr una estadística descriptiva y comparar los resul- Tabla 9.25. Datos promedio del problema 9.20
tados obtenidos en el inciso que incluyó los valores atí-
Tiempo (s) [NO2] (M)
picos.
f) De acuerdo con los resultados obtenidos con la inclusión 0.0 0.1000
de los datos originales y la exclusión de los valores extre- 5.0 0.0170
mos, ¿hubo alguna mejoría significativaen la uniformi- 10.0 0.0090
dad de los datos?
15.0 0.0062
9.19 Éste es un problema relacionado con la solubilidad del oxíge-
20.0 0.0047
no, en milimoles por litro (mM/L), en función de la tempera-
tura (oC). La disminución de la solubilidad de oxígeno en el Fuente: Chemistry: The Central Science. Brown et al. (2000). Prentice-
Hall, Upper Saddle River, New Jersey. Eight edition.
agua, a medida que la temperatura del agua aumenta, es uno
de los efectos de la llamada contaminación termal (produ- 9.21 En un estudio de microbiología ambiental se proporcionan
cida por enfriamiento de calderas en procesos industriales o los siguientes datos provenientes de un experimento para
plantas eléctricas, y cuya agua caliente es arrojada a los lagos evaluar la desinfección de un almacenamiento de agua, con
o ríos). Este efecto de contaminación termal es una situación una dosis de cloro dada para aniquilar las bacterias colifor-
seria en vasos profundos de agua, porque el agua caliente mes. Usando el programa Minitab o cualquier otro progra-
es menos densa que el agua fría. Por tanto el agua caliente ma de computadora, correr un análisis de regresión estadís-
tiende a permanecer arriba de la fría, es decir, en la superfi- tico y hacer lo siguiente:
cie. Esta situación impide la disolución del oxígeno a aguas a) Identificar la variable dependiente y la variable indepen-
más profundas, lo que ocasiona el sofocamiento de la respi- diente.
ración de la vida acuática que necesita del oxígeno disuelto. b) Decir el orden de la reacción de estos datos.
Todo esto sin mencionar el efecto en el metabolismo (que el c) ¿Qué tan bien encajan los datos en el modelo de regre-
agua caliente lo acelera) de la fauna marina. Especulativa- sión? Para esto, usar un criterio objetivista y uno subjeti-
mente, el calentamiento global pudiera estar causando efec- vista para justificar la aserción.
tos similares en aguas marinas, ríos, lagos, etc. De cualquier d) Calcular la tasa de la reacción.
manera, este problema está relacionado con la solubilidad e) Calcular la vida media de las bacterias.
del oxígeno (moles/l, con una presión constante de 760 mm f) Predecir el tiempo que se llevaría aniquilar el 50% de las
Hg), en función de la temperatura. bacterias coliformes.
Tabla 9.26. Datos promedio del problema 9.21.
Tabla 9.24. Información del problema 9.19.
Tiempo Porcentaje de coliformes
Solubilidad (min) que van quedando
0.95 1.00 1.07 1.15 1.25 1.37 1.50 1.65
del O2 (mM) �0 100.0
Temperatura ��
10 70.0
45.0 40.0 35.0 30.0 25.0 20.0 15.0 10.0
(oC) ��
20 21.0
a) Hacer un diagrama esparcido con los datos de la tabla 6150 0.255 0.237
9.27.
b) Correr un modelo de regresión sin ninguna transforma- 6200 0.0003 0.00012
ción de los ejes, es decir, con los datos originales. Analizar
9.24 Para una tasa de crecimiento bacteriano con promedio de
los diagnósticos estadísticos y gráficos de los residuales.
μ 5 1.0 hora−1 (base de logaritmos naturales), ¿qué masa de
c) Correr un modelo de regresión transformando logarítmi-
microorganismos (en mg) estarían presentes después de dos
camente la ordenada. Analizar los diagnósticos estadís-
horas, si una concentración de 150 mg de microorganismos
ticos y gráficos de los residuales.
estuviera presente originalmente? Sugerencia: suponer una
d) Correr un modelo de regresión transformando los ejes
reacción de primer orden, dx/dt 5 μx, donde x es el número
usando el recíproco de la variable dependiente e indepen-
total de microorganismos presentes.
diente. Analizar los diagnósticos estadísticos y gráficos.
9.25 En un estudio hipotético de contaminación atmosférica,
e) Decir cuál de los modelos es superior y justificar la aser-
ción. se usó un modelo de dispersión atmosférica y se obtuvie-
f) Usando el modelo seleccionado, predecir la presión ron los valores teóricos correspondientes de las concen-
del vapor de agua, cuando la temperatura es de 39 oF. traciones de SO2 y sus correspondientes valores promedio
9.23 Éste es un ejemplo relacionado con la ingeniería de difusión de campo. Sin embargo, para calibrar la precisión del mo-
atmosférica de una planta siderúrgica, la cual emite óxidos delo y del diseño del experimento, se tomaron muestras
de azufre a la atmósfera. Las características de la chimenea físicas en cada uno de las distancias dadas por el modelo
son las siguientes: la altura física es de 120.0 metros, la velo- experimental. La tabla 9.29 da los resultados. Realizar lo
cidad del flujo de salida es de 15.0 m/s, el diámetro promedio siguiente:
de la chimenea es de 1.0 metro, la presión atmosférica es de a) Hacer una tabla con los logaritmos de las concentra-
2 000 pascales y la temperatura del flujo del gas es de 60 oC. ciones esperadas, los logaritmos de las concentraciones
Las características meteorológicas al hacer las estimaciones observadas y los logaritmos de las distancias.
son: intensidad del viento de 3.0 m/s con una temperatura b) Ajustar un modelo de regresión lineal y evaluar su utili-
ambiental de 25 oC. Suponer una pluma flotante de Briggs y dad en términos de diagnósticos estadísticos objetivistas
una estabilidad atmosférica de clase F (muy estable). A cier- y diagnósticos gráficos.
tas distancias viento debajo de la fuente emisora, como las se- c) Ajustar un modelo con transformaciones logarítmicas y
ñaladas en la tabla de datos, se coleccionaron varias muestras evaluar su utilidad en términos de diagnósticos estadísti-
y se estimaron los promedios de los valores de campo y los cos y diagnósticos gráficos.
teóricos. La tabla 9.28 da los datos teóricos y los promedios d) ¿Cuál de los dos modelos encaja mejor en los datos?
aritméticos de los datos de campo, esto es, de las concentra- e) Si hubiere discrepancias entre los dos juegos de valores
ciones de azufre. Hacer lo siguiente. dar una explicación al respecto usando una lógica a pos-
a) Una gráfica sobrepuesta con los promedios de los va- teriori de ingeniería de contaminación atmosférica.
lores de campo de las concentraciones de azufre y los Tabla 9.29. Valores teóricos y observados.
valores teóricos o esperados en función de las distancias
Concentración de SO2 en g/m3 Concentración de SO2 en g/m3
de la planta siderúrgica. (valores esperados del modelo) (valores observados del modelo)
b) Una correlación estadística entre los valores de campo y
los valores teóricos. 0.013 0.0900
c) Calcular la concentración de SO2 a una distancia de 10 2.700 3.5000
metros del centro de la pluma. 31.800 33.000
d) Desde el punto de vista de la ingeniería del aire, si se qui-
sieran reducir las emisiones de SO2 hacia la atmósfera, 95.600 92.0000
es decir, para diluir las concentraciones de los contami- 199.000 195.000
nantes, mencionar cuatro factores físicos relevantes a la 269.000 280.000
chimenea, que se tuvieran que modificar.
Nota: P ara la descripción de los parámetros de una chime- 23.700 30.000
nea como los enlistados en este ejemplo, consultar el 9.440 8.000
texto de Bruce Turner intitulado Workbook of Atmos- 4.170 7.400
pheric Dispersion Estimates (1970).
2.350 2.500
Tabla 9.28. D
atos promedio de campo versus las distancias
para el ejercicio 9.23. 1.660 1.050
Anderson, D. R., Sweeney, Dennis J. (Williams) Thomas A. Estadística para Administración y Economía. South-
Western Publishing, vol. 1, séptima edición, México, 1999.
Bennett, C. A., Norman L. Franklin. Statistical Analysis in Chemistry and the Chemical Industry. John Wiley &
Sons, Inc., Nueva York, 1961.
Bland, M. An Introduction to Medical Statistics., Oxford University Press Inc., second edicion, Nueva York,
1995.
Brace, C. H., Corrinne Pellillo Brase. Understanding Statistics. Concepts and Methods, D. C. Heath and Company,
Nueva York, 1995.
Brown L. Theodore, H. Eugene Le May, Jr., Bruce E. Bursten. Chemistry. The Central Science. Prentice Hall,
Upper Saddle River, eight edition, Nueva Jersey, 2000.
Daniel, W. W., James C. Terrell. Business Statistics. Houghton Mifflin Company, Nueva York, 1989.
D. Bruce Turner. Workbook of Atmospheric Dispersion Estimates. Air Resources Field Research Office, Environ-
mental Science Services Administration. Environmental Protection Agency. Office of Air Programs. Re-
search Triangle Park, North Carolina, 1970.
Devore, J. L. Probabilidad y estadística para ingeniería y ciencias. Thomson Learning, quinta edición, México,
2001.
Devore, J. L. Probability and Statistics for Engineering and the Sciences. Duxbury, Brooks/Cole, fifth edition, Nueva
York, 2000.
Dunn, O. J., Virginia A. Clark. Applied Statistics: Analysis of Variance and Regression. John Wiley and Sons, Nue-
va York, 1974.
Dunn, O. J. Basic Statistics: A Primer for the Biomedical Sciences. John Wiley & Sons, Nueva York, 1977.
Fisher, P. M., Stephen Gasiorawicz, Stephen T. Thornton. Física para ciencias e ingeniería, Prentice-Hall Hispa-
noamericana, vol. 1, México, 1993.
Freund, J.E. Statistics. A First Course. Prentice Hall, Inc., Englewood Cliffs, second edition, Nueva Jersey, 1976.
Gilbert, R. O. Statistical Methods for Environmental Pollution. Van Nostrandf Reinhold Company Inc., USA,
1987.
Goldber, S. Probability. An Introduction. Prentince Hall Inc., Englewood Cliffs, Nueva Jersey, 1960.
Godrey C. Onwubolu. Mechatronics. Principles and applications. Elsevier Butterworth-Heinemann, USA,
2005.
Harbold, Harry, S. Sanitary Engineering. Problems and Calculations for the Professional Engineer. Engineering Press,
Inc., San José, California, 1989.
Hamburg, M. Statistical Analysis for Decision Making. Harcourt Brace Jovanovich, Publishers, Academic Press,
fifth edition, Nueva York, 1989.
Herber A., Colton Raymond R. Statistical Methods. Barnes and Noble, Inc., fourth edition, Nueva York, 1966.
Hann, C. T. Statistical Methods in Hydrology. The Iowa State University Press/Ames, Nueva York, 1977.
Hines, W. W., Douglas C. Montgomery, Goldsman David M., Borror Connie M. Probabilidad y estadística para
ingeniería. Grupo Patria Cultural, México, 2005.
Bibliografía | B-437
ISBN 978-970-817-232-5