Análisis de Datos Experimentales 2021-A

Análisis de Datos Experimentales
IQF-1001
M. en C. José Antonio Cuatepotzo Varela

Análisis de Datos Experimentales | M. en C. José Antonio Cuatepotzo Varela
Contenido
1. Estadística descriptiva y fundamentos de probabilidad...........................................................................2

1.1 Conceptos básicos..............................................................................................................................2
1.2 Medidas de tendencia central para datos agrupados y no agrupados.................................................3
1.3 Representación gráfica de datos.........................................................................................................9
1.4 Permutaciones y combinaciones......................................................................................................17
1.5 Tipos de probabilidad.......................................................................................................................20
1.6 Manejo de software estadístico........................................................................................................31
2. Variables aleatorias y funciones de distribución de probabilidad.........................................................38
2.1 Variables aleatorias discretas...........................................................................................................38
2.2 Variables aleatorias continuas..........................................................................................................38
2.3 Funciones de distribución................................................................................................................39
2.4 Distribuciones de probabilidad para variables discretas..................................................................40
2.5 Distribución de probabilidad para variables continuas....................................................................47
3. Técnicas de Muestreo y Pruebas de Hipótesis.......................................................................................59
3.1 Bases teóricas para el muestreo.......................................................................................................59
3.2 Tipos de muestreo............................................................................................................................59
3.3 Parámetros y estadificados...............................................................................................................60
3.4 Errores estadísticos..........................................................................................................................71
3.5 Estimación por intervalos de confianza...........................................................................................72
3.6 Pruebas de hipótesis.........................................................................................................................89
4. Análisis estadístico..............................................................................................................................112
4.1 Experimentos con un factor...........................................................................................................116
4.2 Experimentos con dos factores......................................................................................................135
4.3 Experimentos con dos o más factores............................................................................................146
pág. 1
1. Estadística descriptiva y fundamentos de probabilidad
1.1 Conceptos básicos
El objetivo de la Estadística es medir y modelar la variabilidad del proceso mediante un modelo

probabilístico. Para modelar la variabilidad de una variable aleatoria si sólo se dispone del conocimiento
de una muestra de la misma se sigue el siguiente modo de actuación:
 Planteamiento del problema.

 Selección de la muestra (Muestreo estadístico), en algunos estudios la muestra se obtiene por
simulación (Simulación Estadística).
 Estudio descriptivo de la muestra, analítico y gráfico (Estadística Descriptiva).
Con base al conocimiento de los modelos probabilísticos más utilizados y teniendo en cuenta el
planteamiento del problema y el estudio descriptivo previo, elegir un modelo de probabilidad (Teoría de
la Probabilidad).
Estimar los parámetros del modelo supuesto a partir de las observaciones muestrales utilizando los
métodos de Inferencia Estadística: estimación puntual, estimación por intervalos de confianza y
contrastes de hipótesis paramétricos.
Checar que el modelo de probabilidad ajustado a los datos es adecuado y que se verifican las hipótesis
supuestas en el estudio, por ejemplo, que las observaciones muestrales son independientes, que no
existen observaciones erróneas, etc. Para ello se utilizan los métodos de Inferencia no Paramétrica.
Si se acepta que el modelo ajustado es adecuado se puede utilizar para obtener resultados y conclusiones
sobre la variable en estudio. En caso contrario, se debe reformular el modelo de probabilidad y repetir el
proceso desde el paso 4.
Puede definirse la Inferencia Estadística como:
“El conjunto de métodos estadísticos que permiten deducir (inferir) como se distribuye la población en
estudio o las relaciones estocásticas entre varias variables de interés a partir de la información que
proporciona una muestra”.
La importancia de la Estadística en la Ingeniería, la Ciencia y la Administración ha sido subrayada por la

participación de la industria en el aumento de la Calidad; y las técnicas de ésta se emplean para describir
y comprender la variabilidad en algún proceso y/o proyecto determinado.
Se presenta la variabilidad, como resultado de los cambios en las condiciones bajo las que se hacen las
observaciones, al sistema de medición utilizado o a causas que, en algunos casos no se pueden controlar.
pág. 2
El campo de la Estadística tiene que ver con la recopilación, presentación, análisis y uso de datos para
tomar decisiones y resolver problemas; de manera más específica el conocimiento de la Estadística y la
Probabilidad puede constituirse en una herramienta poderosa para ayudar a los científicos e ingenieros a
diseñar nuevos productos y sistemas, a perfeccionar los existentes y a diseñar, desarrollar y mejorar los
procesos de producción.
1.2 Medidas de tendencia central para datos agrupados y no agrupados
Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por filas.
En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las
agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos.
Las medidas de tendencia central, indican mediante un valor o atributo la localización central de la
distribución de frecuencias.
Media de datos no agrupados
Media: Centro de un grupo de datos es el promedio aritmético ordinario y se le conoce como media
muestral.
∑ xi x 1+ x2 +…+ xi
x= i=1 =
n n
Ejemplo #1: Un experimento en el que un ingeniero agrega un polímero de látex a un mortero de

cemento para determinar los efectos del polímero sobre la resistencia a la tensión: 16.85, 16.4, 17.21,
16.35, 16.52, 17.04, 16.96, 17.15, 16.59, 16.57. Calcule la media muestral.
∑ xi
x= i=1
n
16.85+16.4+17.21+16.35+ 16.52+ 17.04+16.96+17.15+ 16.96+16.57

x=
10
x=16.764
Media de datos agrupados
Cuando se tiene un conjunto de n datos, que se encuentran agrupados en una distribución de frecuencias
una aproximación de la media es:
pág. 3
∑ F i∗M i
X = i =1
N
X = valor de la media
K = Es el número de intervalos
Fi = Es la frecuencia del i-ésimo intervalo.
Li+ Ls
Mi = Es la marca de clase del i-ésimo intervalo
2
N = Es el número de datos.
Ejemplo #2: Supóngase la siguiente tabla de datos ordenados de algún grupo en particular:
Intervalo Frecuencia Fi Mi Fi*Mi

0-10 5 5 25
10-20 12 15 180
20-30 21 25 525
30-40 27 35 945
40-50 31 45 1395
50-60 35 55 1925
60-70 21 65 1365
70-80 14 75 1050
80-90 9 85 765
90-100 5 95 475
Total 180 8650
∑ F i∗M i 8650
X = i =1 = =48.05555
N 180
Mediana de datos no agrupados
Mediana: Es el punto donde los datos se dividen en 2 partes iguales, para esto se ordena de manera
creciente cumpliendo con los siguientes parámetros:
{
x n +1
Impar
2
~
x= x n + x n+ 1
2 2
¿ Par
2
pág. 4
Ejemplo #3: Las siguientes tomas corresponden a las de un horno registradas en los lotes sucesivos en
un proceso de fabricación de semiconductores en (ºF): 950, 948, 955, 951, 949, 957, 954, 955,
ordenados de mayor tenemos: 948, 949, 950, 951, 954, 955, 955, 957, los datos son pares la mediana es:
~ 951+954
x=948 , 949, 950, 951 , 954 , 955, 955, 957= =952.5
2
Mediana de datos agrupados
Ejemplo #4: Supongamos que también calculamos la mediana del salario inicial de los egresados de la
escuela de economía. Ordenamos los 12 elementos de la tabla:
Egresado Sueldo Mensual Egresado Sueldo Mensual

1 2350 7 2390
2 2450 8 2630
3 2550 9 2440
4 2380 10 2850
5 2255 11 2420
6 2210 12 2380
~
x=2210, 2255, 2350, 2380, 2380, 2390, 2420 , 2440, 2450, 2550, 2630, 2850
~ 2390+2420
x= =2405
2
Moda de datos no agrupados
Es la observación que se presenta con mayor frecuencia en la muestra; esta puede ser una sola o más
cuando se iguala el número de veces que n datos se presentan en la muestra de igual forma.
Ejemplo #5: Considere las siguientes observaciones que fueron el número de veces que una persona
tomó agua al día: 3, 6, 9, 3, 5, 8, 3, 10, 4, 6, 3, 1, 6, 2, 5, 6 los datos de moda son 3 y 6 pues se presentan
4 veces en la muestra.
Moda de datos agrupados
Ejemplo #6: Se tiene como resultado de la compra de refrescos la siguiente distribución de frecuencias:
Marca Frecuencia
Coke Classic 19
Diet Coke 8
pág. 5
Dr. Pepper 5
Pepsi-Cola 13
Sprite 5
Total 50
La moda o el refresco que se compra con mayores frecuencias es Coke Classic. Para este tipo de datos es
claro que no tiene sentido hablar de la media o de la mediana.
Las medidas de dispersión o también llamadas medidas de variación, son aquellas que indican que tan
alejados o dispersos se encuentran los datos, con respecto a sí mismos o con respecto a la media del
conjunto de datos. Entre estos se encuentran el rango, la desviación media, la varianza y la desviación
estándar.
Rango de datos no agrupados
Está definido como la diferencia entre la observación más grande y más pequeña; mientras más grande
sea el rango mayor será la variabilidad en los datos.
Ejemplo #7: En un experimento donde se investigó el efecto de varias variables de un proceso sobre la
oxidación en fase de vapor de naftaleno. La siguiente es una muestra del porcentaje de conversión de
moles a anhídrido de maleico: 4.2, 4.7, 4.7, 5, 3.8, 3.6, 3, 5.1, 3.1, 3.8, 4.8, 4, 5.2, 4.3, 2.8, 2, 2.8, 3.3,
4.8, 5. Primero ordenamos los datos de menor a mayor: 2, 2.8, 2.8, 3, 3.1, 3.3, 3.6, 3.8, 3.8, 4, 4.2, 4.3,
4.7, 4.7, 4.8, 4.8, 5, 5, 5.1, 5.2.
El rango muestral es: R = 5.2 – 2.= 3.2
Desviación media de datos no agrupados
Es el promedio de los valores absolutos de las desviaciones de los datos con respecto a la media. Indica
en promedio el número de unidades en que cada dato se encuentra alejado de la media:
DM =
∑|xi −x|
n
Ejemplo #8: Un experimento en el que un ingeniero agrega un polímero de látex a un mortero de

cemento para determinar los efectos del polímero sobre la resistencia a la tensión: 16.85, 16.4, 17.21,
16.35, 16.52, 17.04, 16.96, 17.15, 16.59, 16.57. Sabemos que la media es 16.764 por lo tanto la
desviación media es:
DM =
∑|xi −x|
n
pág. 6
|16.85−16.764|+|16.4−16.764|+…+|16.57−16.764|
DM = =0.278
10
Desviación media de datos agrupados
Intervalo Frecuencia Fi Mi Fi*Mi Mi-X |Mi-X| Fi*|Mi-X|

10-20 5 15 75 -44.35 44.35 221.75
20-30 12 25 300 -34.35 34.35 412.2
30-40 22 35 770 -24.35 24.35 535.7
40-50 27 45 1215 -14.35 14.35 387.45
50-60 36 55 1980 -4.35 4.35 156.6
60-70 30 65 1950 5.65 5.65 169.5
70-80 33 75 2475 15.65 15.65 516.45
80-90 22 85 1870 25.65 25.65 564.3
90-100 13 95 1235 35.65 35.65 463.45
Total 200 11870 204.35 3427.4
DM =
∑ F i|M i−X|
n
∑ F i∗M i 11870
X = i =1 = =59.35
N 200
DM =
∑ F i|M i−X|= 3427.4 =17.1375
n 200
Varianza y Desviación Estándar de datos no agrupados
En un conjunto de datos la varianza se define como el promedio de los cuadrados de las desviaciones de
los datos con respecto a la media. Su valor indica la forma en que están distribuidos los datos con
respecto a la media:
(∑ )
n 2
n
xi
∑ ( xi ) −2 i=1
n
s = i=1
2
n−1
pág. 7
4.8, 5.
2
s =0.866315
s=0.930760
pág. 8
Varianza y Desviación Estándar de datos agrupados
Intervalo Frecuencia Fi Mi Fi*Mi Mi-X (Mi-X)2 Fi*(Mi-X)2

10-20 5 15 75 -44.35 1966.923 9834.613
20-30 12 25 300 -34.35 1179.923 14159.07
30-40 22 35 770 -24.35 592.9225 13044.3
40-50 27 45 1215 -14.35 205.9225 5559.908
50-60 36 55 1980 -4.35 18.9225 681.21
60-70 30 65 1950 5.65 31.9225 957.675
70-80 33 75 2475 15.65 244.9225 8082.443
80-90 22 85 1870 25.65 657.9225 14474.3
90-100 13 95 1235 35.65 1270.923 16521.99
Total 200 11870 6170.303 83315.5
s=
∑
2
F i∗( M i− X )2
n
∑ F i∗M i 11870
X = i =1 = =59.35
N 200
2
s=
∑ F i∗( M i− X )2 83315.5
= =416.5775
n 200
s=20.410230
Coeficiente de Variación en datos no agrupados
El coeficiente de variación también llamado coeficiente de dispersión, es una medida de variación

relativa, se presenta en forma de porcentaje y su valor se obtiene mediante:
s
V=
x
4.8, 5.
pág. 9
s 0.930760
V= = =0.23269 o 23.269 %
x 4
Coeficiente de Variación en datos agrupados
Intervalo Frecuencia Fi Mi Fi*Mi Mi-X (Mi-X)2 Fi*(Mi-X)2

10-20 5 15 75 -44.35 1966.923 9834.613
20-30 12 25 300 -34.35 1179.923 14159.07
30-40 22 35 770 -24.35 592.9225 13044.3
40-50 27 45 1215 -14.35 205.9225 5559.908
50-60 36 55 1980 -4.35 18.9225 681.21
60-70 30 65 1950 5.65 31.9225 957.675
70-80 33 75 2475 15.65 244.9225 8082.443
80-90 22 85 1870 25.65 657.9225 14474.3
90-100 13 95 1235 35.65 1270.923 16521.99
Total 200 11870 6170.303 83315.5
s=
∑
2
F i∗( M i− X )2
n
∑ F i∗M i 11870
X = i =1 = =59.35
N 200
2
s=
∑ F i∗( M i− X )2 83315.5
= =416.5775
n 200
s=20.410230
s 20.410230
V= = =0.34389 o 34.389 %
x 59.35
1.3 Representación gráfica de datos
Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por filas.
En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las
agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos.
pág. 10
Ejemplo #14: La NASA en EUA, está evaluando una muestra de aleación metalúrgica como posible
material de una parte específica de sus aeronaves, las cuales representan una resistencia a la tensión, en
libras por pulgada cuadrada (psi); de 80 muestras donde se tomaron los siguientes datos:
105 221 183 186 121 181 180 143

97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
1.- ¿Qué podemos hacer con estos datos?
2.- ¿De qué manera podemos utilizar esta información para determinar si el material probado es fuerte o
débil?
Diagrama Tallo – Hoja
Un diagrama de tallo y hoja es una buena manera de obtener una representación visual informativa del
conjunto de datos a analizar, para formar éste, se componen de un tallo que está formado por uno o más
de los dígitos principales, y una hoja, la cual contiene el resto de los dígitos.
Una vez ordenados los datos y habiendo estructurado el diagrama tallo – hoja, podemos organizar los
datos en un diagrama de frecuencias, el cual ofrece un resumen más compacto de los datos que el
diagrama anterior.
pág. 11
Lo primero será ordenar los datos de mayor a menor, una herramienta útil para tal efecto es el diagrama
tallo – hoja:
7 6
8 7
9 7
10 15
11 058
12 013
13 133455
14 12356899
15 001344678888
16 0003357789
17 0112445668
18 0011346
19 034699
20 0178
21 8
22 189
23 7
24 5
Entonces:
76 123 145 154 163 172 181 200

87 131 146 156 163 174 183 201
97 133 148 157 165 174 184 207
101 133 149 158 167 175 186 208
105 134 149 158 167 176 190 218
110 135 150 158 168 176 193 221
115 135 150 158 169 178 194 228
118 141 151 160 170 180 196 229
120 142 153 160 171 180 199 237
121 143 154 160 171 181 199 245
pág. 12
Podemos organizar los datos en un diagrama de frecuencias, el cual ofrece un resumen más compacto de
los datos que el diagrama anterior.
Diagrama de Frecuencias
Para un diagrama de frecuencias se necesita:
1).- Intervalo de clase.

2).- Conteo.
3).- Frecuencia.
4).- Frecuencia Relativa.
5).- Frecuencia Relativa Acumulada.
Intervalo de Clase: en muchos casos resulta satisfactorio utilizar entre 5 y 20 clases y el número de
clases debe aumentar en función de n. Para los datos de la tabla de muestras anterior se tienen 80 datos,
dado que: √2 80=8.9442≈ 9 clases serán adecuadas para la distribución de frecuencias; dado que el dato
más pequeño es 76 y el más grande 245; 245 – 76 = 169 unidades de rango se tendrán. Para determinar
el ancho de intervalo se divide el rango entre el número de clases.
169
Amplitud= =18.7777
9
Conteo: es el número de datos que están dentro el intervalo de clase.

Frecuencia: el número de veces que aparecen los datos en los intervalos.
F. Relativa: es el cociente de la frecuencia entre el número total de datos.
F. R. Acumulada: es la acumulación de las F. Relativas, su último dato debe ser 1.
Intervalo de Clase Conteo Frecuencia F. Relativa F. R. Acumulada

76 ≤ x < 94.7777 II 2 0.025 0.025
94.7777 ≤ x < 113.5554 IIII 4 0.05 0.075
113.5554 ≤ x < 132.3331 IIIII I 6 0.075 0.15
132.3331 ≤ x < 151.1108 IIIII IIIII IIIII I 16 0.2 0.35
151.1108 ≤ x < 169.8885 IIIII IIIII IIIII IIII 19 0.2375 0.5875
169.8885 ≤ x < 188.6662 IIIII IIIII IIIII II 17 0.2125 0.8
188.6662 ≤ x < 207.4439 IIIII IIII 9 0.1125 0.9125
207.4439 ≤ x < 226.2216 III 3 0.0375 0.95
226.2216 ≤ x ≤ 245 II 4 0.05 1
Total 80 1
pág. 13
Para representar gráficamente los datos se utiliza el histograma, normalmente representado por barras,
donde el eje horizontal se utiliza para representar la escala de medición y el vertical la escala de
frecuencias o frecuencias relativas acumuladas.
Histograma
Histograma
20 19
18 17
16
16
14
12
10 9
8
6
6
4 4
4 3
2
2
0
76 ≤ x < 94.7777 ≤ x 113.5554 ≤ x 132.3331 ≤ x 151.1108 ≤ x 169.8885 ≤ x 188.6662 ≤ x 207.4439 ≤ x 226.2216 ≤ x
94.7777 < 113.5554 < 132.3331 < 151.1108 < 169.8885 < 188.6662 < 207.4439 < 226.2216 ≤ 245
Histograma de Frecuencias Relativas Acumuladas
F. R. Acumulada
1.2
1
1 0.95
0.9125
0.8
0.8
0.5875
0.6
0.4 0.35
0.2 0.15
0.075
0.025
0
76 ≤ x < 94.7777 ≤ x 113.5554 ≤ x 132.3331 ≤ x 151.1108 ≤ x 169.8885 ≤ x 188.6662 ≤ x 207.4439 ≤ x 226.2216 ≤ x
94.7777 < 113.5554 < 132.3331 < 151.1108 < 169.8885 < 188.6662 < 207.4439 < 226.2216 ≤ 245
pág. 14
Medidas de tendencia central para datos agrupados y no agrupados
A continuación, aplicaremos medidas de tendencia central para el ejemplo #14:
Datos no agrupados:
13013
x= =162.6225
80
~ 160+163
x= =161.5
2
|76−162.6225|+|87−162.6225|+…+|250−162.6225|
DM = =25.8125
80
( 13,013 )2
2,206,837−
2 80
s= =1140.63149
80−1
s= √ 1140.63149=33.7723
2
33.7723
v= =0.2076=20.76 %
162.6225
Moda :158
Rango :169
Datos agrupados:
Intervalo de Clase Fi Mi Fi*Mi Mi-X (Mi-X)2 Fi*(Mi-X)2 |Mi-X| Fi*|Mi-X|
76 ≤ x < 94.7777 2 85.38885 170.7777 -77.927473 6072.691 12145.3819 77.927473 155.85495
94.7777 ≤ x < 113.555 4 104.16655 416.6662 -59.149773 3498.6956 13994.7823 59.149773 236.59909
113.555 ≤ x < 132.333 6 122.94425 737.6655 -40.372073 1629.9042 9779.42543 40.372073 242.23244
132.333 ≤ x < 151.111 16 141.72195 2267.5512 -21.594373 466.31692 7461.07078 21.594373 345.50996
151.111 ≤ x < 169.889 19 160.49965 3049.4934 -2.8166725 7.933644 150.739235 2.8166725 53.516777
169.889 ≤ x < 188.666 17 179.27735 3047.715 15.9610275 254.7544 4330.82478 15.961028 271.33747
188.666 ≤ x < 207.444 9 198.05505 1782.4955 34.7387275 1206.7792 10861.0127 34.738728 312.64855
207.444 ≤ x < 226.222 3 216.83275 650.49825 53.5164275 2864.008 8592.02404 53.516428 160.54928
226.222 ≤ x ≤ 245 4 235.6108 942.4432 72.2944775 5226.4915 20905.9659 72.294478 289.17791

80 13065.306 21227.574 88221.2272 378.37102 2067.4264
pág. 15
13065.306
x= =163.3163
80
~
x=160.49965
2067.4264
DM = =25.8428
80
2 88221.2272
s= =1102.7653
80
s= √ 1102.7653=33.2079
2
33.2079
v= =0.2033=20.33 %
163.3163
Cuartiles y Percentiles
Cuartiles: es cuando se divide un conjunto ordenado en 4 partes iguales, los puntos de división se
conocen como cuartiles, el primer cuartil q1 es un valor que tiene aproximadamente el 25% de las
observaciones por debajo de él y el 75% restante por encima de él. El segundo cuartil q 2 es igual a la
mediana, y el tercer cuartil q3, tiene 75% de las observaciones por debajo de él.
Ejemplo #15: Considere las observaciones siguientes para determinar q 1, q2 y q3. Los siguientes datos
representan la resistencia en psi de aleación aluminio – litio:130, 150, 145, 158, 165, 140;
acomodándolos de menor a mayor tenemos: 130, 140, 145, 150, 158, 165; por lo tanto:
145 +150
q 2= =147.5
2
q 1=140
q 3=158
Ejemplo #16: El tiempo de falla en horas de un material aislante eléctrico es el siguiente: 204, 228, 252,
300, 324, 444, 624, 720, 816, 912, 1176, 1296, 1392, 1488, 1512, 2520, 2856, 3192, 3528, 3710.
(No hay necesidad de acomodarlos)
912+1176
q 2= =1044
2
pág. 16
324 + 444
q 1= =384
2
1512+ 2520
q 3= =2016
2
Percentiles: Conjunto de Datos que se divide en 100 partes iguales, el 100 k – ésimo percentil es un
valor de tal, que al menos el 100 k% de las observaciones están por debajo de él y al menos 100 (1 – k)
% están en el valor o por encima de él.
Pk =n∗k
Si n*k es entero, agregar 0.5 y promediar los valores de la ubicación. Sin n*k no es entero, entonces
redondear al próximo entero más grande.
Ejemplo #17: El tiempo de falla en horas de un material aislante eléctrico es el siguiente: 204, 228, 252,
300, 324, 444, 624, 720, 816, 912, 1176, 1296, 1392, 1488, 1512, 2520, 2856, 3192, 3528, 3710.
Calcule los percentiles 23, 45, 68 y 92.
P23=20∗0.23=4.6 ≅ 5 → P23=324
816+912
P45=20∗0.45=9+0.5=9.5 → P 45= =864
2
P68=20∗0.68=13.6 ≅ 14 → P68=1488
P92=20∗0.92=18.4 ≅ 19 → P92=3528
Diagrama de Caja – Bigotes
El Diagrama de Cajas es una presentación visual que describe al mismo tiempo varias características
importantes de un conjunto de datos, tales como el centro, la dispersión, la desviación de la simetría y la
identificación de observaciones que se alejan de manera poco usual del resto de los datos. Éste diagrama
presenta los 3 cuartiles, y los valores máximo y mínimo de los datos sobre un rectángulo, alineado
horizontal o verticalmente, el rectángulo delimita el rango intercuartílico con la arista a la izquierda
ubicada en el primer cuartil y a la derecha ubicada en el tercer cuartil; se dibuja una línea a través del
rectángulo que representa el segundo cuartil; de las aristas al rectángulo se dibuja una línea que se
denomina bigote que va hacia los valores extremos.
Diagrama de caja del ejemplo #14:
pág. 17
1.4 Permutaciones y combinaciones
Combinaciones
Una segunda regla de conteo que con frecuencia es de utilidad, permite contar la cantidad de resultados
experimentales cuando en un experimento se deben seleccionar r objetos entre un conjunto de n objetos
(por lo común más grande). Se llama regla de conteo para combinaciones. El orden de los objetos
seleccionados no es importante en el orden.
Regla de conteo para combinaciones: La cantidad de combinaciones de n objetos tomados r a la vez es:
C= ( nr)= r ! ( n−r
n!
)!
Ejemplo #18: Con parte de su primer salario un chavo decide comprar tres de los siete álbumes digitales
que le faltan de Bad Bunny. ¿Cuántas posibilidades tiene? Hay que elegir 3 objetos (sin importar el
orden) de un conjunto de siete. Hay entonces:
C= ( nr)= r ! ( n−r
n!
=( )=
7 7!
=
7!
) ! 3 3 ! ( 7−3 ) ! 3 ! 4 !
=35
Existen 35 combinaciones de comprar 3 de 7 álbumes digitales de Bad Bunny.
pág. 18
Ejemplo #19: En un examen de Historia se requiere contestar cuatro de doce preguntas. ¿Cuántas
maneras diferentes hay de contestar este examen? Se requiere ahora escoger cuatro objetos de un
conjunto de doce. Observemos que se nuevo el orden en que se escogen las ocho preguntas resulta
irrelevante, puesto que, por ejemplo, da lo mismo seleccionar las preguntas 4,5,8 y 11 que las preguntas
11,4,5 y 8.
C= ( nr)= r ! ( n−r
n!
)!
=( )=
12
4
12!
4 ! ( 12−4 ) !
=
4
12 !
!8!
=495
El estudiante puede responder este examen de 495 formas.
Ejemplo #20: Una prueba de “verdadero-falso” comprende doce preguntas. Calcule los números de
maneras en que un estudiante puede marcar cada pregunta ya sea como verdadero o falso y obtener.
a) Ocho aciertos y cuatro errores:
C= ( nr)= r ! ( n−r
n!
)!
=( )=
12
8
12 !
=
12 !
8 ! ( 12−8 ) ! 8 ! 4 !
=495
b) Diez aciertos y dos errores:
C= ( nr)= r ! ( n−r
n!
=( )=
12 12 !
=
12 !
) ! 10 10 ! ( 12−10 ) ! 10 ! 2!
=66
Ejemplo #21: Un paquete de diez baterías tiene dos piezas defectuosas ¿De cuántas maneras se pueden
seleccionar tres de estas baterías y sacar:
a) Ninguna de las baterías defectuosas:
C= ( nr)= r ! ( n−r
n!
)!
=( )=
8
3
8!
3 ! ( 8−3 ) !
=
3
8!
!5!
=56
b) Una de las baterías defectuosas:
C= ( nr)∗(nr)=(21)∗( 82)=2∗28=56
c) Las dos baterías defectuosas:
C= ( nr)∗(nr)=(22)∗( 81)=1∗8=8
pág. 19
pág. 20
Permutaciones
Una permutación de objetos implica orden mientras que una combinación no toma el orden de los
objetos considerados. Dado un conjunto que contiene n elementos distintos X = {x1, x2, .... xn}.
a) Una permutación de X es una ordenación de los n elementos x1, x2, .... xn

b) Una permutación–r (ó r-permutación) de X donde r≤n, es una ordenación de un subconjunto de r
elementos de X.
c) El número de permutaciones-r de un subconjunto de n elementos distintos se denota P(n, r)
d) Una combinación-r (r-combinación) es una selección no ordenada de r elementos de X, es decir, un
subconjunto de r elementos de X.
P= (nr)= ( n−rn! ) !
Ejemplo #22: Una cadena de tiendas de muebles tiene tres almacenes y veinte sucursales de venta al
menudeo. ¿De cuantas maneras diferentes pueden embarcar un artículo de uno de los almacenes a una
de las sucursales de menoreo?:
P= (nr)= ( n−rn! ) ! =( 203)= ( 20−3

20 !
=
20 !
) ! 17 !
=6840
Existen 6840 maneras diferentes pueden embarcar un artículo de uno de los almacenes a una de las
sucursales de menoreo.
Ejemplo #23: En unas vacaciones una persona querría visitar tres de diez Sitios históricos de Filadelfia.
¿De cuántas maneras distintas puede planear su viaje si el orden de las visitas tiene importancia?
P= (nr)= ( n−rn! ) ! =( 103)= (10−3

10 !
=
10 !
)! 7!
=720
Ejemplo #24: ¿De cuántas maneras distintas se puede asignar a once representantes de servicio para
cuatro nuevos clientes corporativos, suponiendo que a cada representante de servicio se le pueda asignar
a lo sumo uno de los clientes corporativos?
P= (nr)= ( n−rn! ) ! =( 114)= ( 11−4

11!
=
11!
)! 7 !
=7920
Ejemplo #25: Un parque de diversiones tiene 28 recorridos distintos. ¿De cuántas maneras diferentes
una persona puede tomar cuatro de estos recorridos, suponiendo que el orden es importante y que esta
persona no quiera tomar un recorrido más de una vez?
pág. 21
P= (nr)= ( n−rn! ) ! =( 284)= ( 28−4

28 !
=
28 !
) ! 24 !
=491400
Ejemplo #26: Si en una carrera participan nueve caballos ¿De cuántas maneras distintas pueden terminar
en primero, segundo y tercer lugar?
P= (nr)= ( n−rn! ) ! =( 93)= ( 9−3

9! 9!
= =504
)! 6 !
Ejemplo #27: Hay cinco rutas entre la casa de una ejecutiva y su sitio de trabajo:
a) ¿De cuantas maneras distintas puede ir al trabajo y regresar?:
P= (nr)= ( n−rn! ) ! =( 55)= (5−5

5! 5!
= =120
)! 0!
b) ¿De cuantas maneras distintas puede ir al trabajo y regresar si no quiere tomar la misma ruta de ida y
vuelta?:
P= (nr)= ( n−rn! ) ! =( 52)= (5−2

5! 5!
= =20
) ! 3!
c) Si una de sus cinco rutas corre sobre una calle de un solo sentido, entonces ¿de cuantas maneras
distintas puede ir al trabajo y regresar (suponiendo que quiera tomar la misma ruta de ida y vuelta) ?:
P= (nr)= ( n−rn! ) ! =( 54)= ( 5−4

5! 5!
= =120
) ! 1!
1.5 Tipos de probabilidad
Generalidades
El estudio de fenómenos de diversa naturaleza permite clasificar éstos en dos grandes grupos:
Fenómenos determinísticos: aquellos en los cuales una misma acción produce siempre el mismo efecto.
Fenómenos probabilísticos o aleatorios: aquellos en los cuales no siempre puede predecirse con certeza
el resultado de una misma acción.
Incertidumbre
La falta de conocimiento cierto de las cosas es la mayor fuente de ansiedad para el hombre y es natural
su deseo de remediarla. La carencia de certeza o de conocimiento cierto de la ocurrencia de
pág. 22
determinados eventos, lleva a correr ciertos riesgos en las decisiones esto es incertidumbre y es ahí
donde el uso de las probabilidades es de gran ayuda para minimizarlos.
“Es una verdad cierta que, cuando no está en nuestra mano distinguir las opiniones verdaderas, debemos
seguir las más probables”. (Descartes).
Experimento Aleatorio E
Es un fenómeno empírico que, repetido bajo las mismas condiciones, no siempre arroja el mismo
resultado.
Características:
 Es repetible: se puede realizar u observar en forma indefinida (n veces) en las mismas

condiciones.
 Se conocen a priori los resultados posibles: se puede conocer o delimitar el conjunto de todos los
resultados posibles, aun cuando no se puede predecir el resultado particular en una realización
del experimento.
 Presenta regularidad estadística: si el experimento se repite pocas veces los resultados parecen
mostrar un comportamiento caótico, mientras que al repetirlo un gran número de veces se puede
detectar cierta regularidad en el comportamiento de los resultados.
Ejemplo #28:
a) Analizar 5 solicitudes de crédito y registrar el número de las que resultaron aprobadas.

b) Analizar solicitudes de crédito hasta que por primera vez se obtenga una solicitud aprobada.
c) Observar durante 1 hora una taquilla de cierta agencia bancaria y registrar el número de
personas que realizan por lo menos una operación.
d) Hacer un pedido para reponer inventario y registrar el tiempo (en días) que tardamos en
recibirlo.
La probabilidad se encarga de evaluar todas aquellas actividades en donde se tiene incertidumbre acerca
de los resultados que se pueden esperar, esto quiere decir que la probabilidad está presente en casi en
todas las actividades que se pretenda realizar:
 Cualquier proyecto de Ingeniería o de otras áreas

 Competencias deportivas
 Juegos de azar, etc.
La Teoría de la Probabilidad constituye la base o fundamento de la Estadística, ya que las injerencias

que hagamos sobre la población o poblaciones en estudio se moverán dentro de unos márgenes de error
controlado, el cual será medido en términos de probabilidad.
pág. 23
Enfoque Clásico
Está basado en el concepto de equiprobabilidad del espacio muestral y fue introducido por Laplace. El
cálculo de la probabilidad bajo la concepción clásica, se realiza mediante la siguiente regla.
Regla de Laplace: La probabilidad de un suceso A es igual al cociente del número de casos favorables al
suceso, sobre el número total de casos posibles.
No .de casos favorables al suceso A

P ( A )=
No .de casos posibles
Enfoque Frecuentista o a posteriori
Esta Ley propuesta por Bernoulli, plantea que la frecuencia relativa de un suceso tiende a estabilizarse
en torno a un número, a medida que el número de pruebas del experimento crece indefinidamente. Así
bajo la concepción frecuentista, si se repite un experimento indefinidamente, la probabilidad de un
suceso A es un número ideal al que se aproxima su frecuencia relativa cuando el total de repeticiones
tiende a infinito.
NA
( A ) = lim
N→∞ N
Siendo NA la frecuencia absoluta del suceso A. En ocasiones cuando se habla de probabilidad o

posibilidad de que un evento ocurra, se pierde la credibilidad acerca del evento en cuestión, pero ¿es
posible tener siempre la certeza total en todo proyecto o actividad que se desea realizar?, es muy difícil
tenerla, debido a que el llevar a efecto un proyecto cualquiera por más simple que este sea, éste está
sujeto a una gran diversidad de factores que afectan su ocurrencia, ¿entonces que es lo más aconsejable
para predecir su ocurrencia?
La probabilidad es la que nos ayuda en estos casos, ya que, basándose en estadísticas, podemos
cuantificar la posibilidad de ocurrencia de los eventos y por consiguiente tomar una buena decisión
basados en esta información.
Espacio Muestral (Conjunto Universal)
El espacio muestral de un experimento es el conjunto de todos los posibles resultados distintos del
experimento.
Ejemplo #29:
pág. 24
a.- Se lanza al aire un dado normal (perfectamente equilibrado), enumere los posibles resultados de este
experimento. Ω= {1, 2, 3, 4, 5, 6}
b.- Se lanza al aire dos veces una moneda normal, defina su espacio muestral. Ω = {AA, AS, SA, SS}
Evento A: El evento A es un subconjunto del espacio muestral. Obsérvese que los resultados de cada
uno de estos experimentos son fenómenos aleatorios. Es por eso que un resultado de cualquier
experimento con frecuencias se denomina Evento Aleatorio. Los Eventos aleatorios se clasifican como
simples y compuestos.
Evento Simple: Es el resultado de un solo ensayo en cualquier experimento particular. Evento

Compuesto: Es un subconjunto del espacio muestral, que contiene dos o más eventos aleatorios simples.
Los experimentos y eventos probabilísticos se pueden expresar con la notación de conjuntos y a

continuación se enumeran algunas operaciones que es posible realizar con los eventos. Evento
mutuamente excluyentes o disjuntos. Aquellos que no pueden ocurrir al mismo tiempo. Dos eventos son
mutuamente excluyentes si y solo sí, la intersección de los dos conjuntos es el conjunto vacío.
Como se observa los experimentos y eventos probabilísticos se pueden expresar con la notación de
conjuntos y a continuación se enumeran algunas operaciones que es posible realizar con los eventos.
Evento mutuamente excluyentes o disjuntos. Aquellos que no pueden ocurrir al mismo tiempo. Dos
eventos son mutuamente excluyentes si y solo sí, la intersección de los dos conjuntos es el conjunto
vacío.
Eventos Independientes: Éstos no se ven afectados por otros, por ejemplo, el color de mis zapatos y la
probabilidad de que llueva hoy en la tarde.
Ejemplo #30: Una caja contiene 6 billetes de $500.00, 3 de $50.00 y 1 de $100.00. Determine la
probabilidad de que, al extraer al azar uno de éstos, éste sea de $100.00.
Eventos Dependientes: Cuando un evento afecta la probabilidad de que suceda otro; por ejemplo, si un
trabajo se hace descuidadamente, es más probable que resulte mal.
Ejemplo #31: Una caja contiene 6 billetes de $500.00, 3 de $50.00 y 1 de $100.00. Determine la
probabilidad de que, al extraer al azar dos de éstos, ambos sean de $500.00
Eventos No Excluyentes entre sí: Cuando la ocurrencia de uno de ellos no impide que suceda también
otro, por ejemplo, que una persona sea doctor y que tenga más de 35 años.
Ejemplo #32: De un grupo de 45 estudiantes Universitarios, 28 estudian inglés y 16 estudian francés,

además de que 12 no estudian idiomas. Determine la probabilidad de que, al entrevistar al azar a un
alumno del grupo, éste estudie inglés y francés.
pág. 25
En el caso de eventos no excluyentes entres sí, debe considerarse que la probabilidad de que ocurran
ambos eventos está incluida en ellos, por lo que debe restarse esa probabilidad de la suma directa, esto
se conoce como Regla general de la suma de probabilidades.
P ( A ∪ B )=P ( A ) + P ( B ) −P ( A ∩ B )
Si los eventos son dependientes, deben considerarse las probabilidades de que ocurra un segundo evento,
ya ocurrió un primero, esto se conoce como Regla de la multiplicación de probabilidades. P(A|B) indica
la probabilidad de que ocurra el evento A, si ya se sabe que ocurrió el evento B, otra forma de
interpretarlo es la probabilidad de A dada B.
P ( B∩ A )
P ( A ∩B )=P ( A )∗P ( B| A ) → P ( B| A ) =
P (A )
P(A∩B)
P ( B ∩ A )=P ( B )∗P ( A|B ) → P ( A|B )=
P(B)
Regla general de la suma de probabilidades
Para eventos mutuamente excluyentes:
P ( A ∪ B )=P ( A ) + P ( B )
Para eventos no excluyentes entre sí:
P ( A ∪ B )=P ( A ) + P ( B ) −P ( A ∩ B )
Para eventos complementarios:
P ( A ' )=1−P ( A )
Regla General de la Multiplicación de Probabilidades
Para eventos independientes:

P ( A ∩B )=P ( A )∗P (B)
P ( B ∩ A )=P ( B )∗P( A)
Para eventos dependientes:

P ( A ∩B )=P ( A )∗P ( B| A )
P ( B ∩ A )=P ( B )∗P ( A|B )
Leyes de Morgan
P ( A ' ∪ B ' )=P ( ( A ∩ B )' )=1−P ( A ∩ B )
pág. 26
P ( A ' ∩B ' )=P ( ( A ∪ B )' )=1−P ( A ∪ B )
Probabilidad de que ocurra “al menos” un suceso de dos A y B; probabilidad de que ocurra A o B:
P ( A ∪B )
Probabilidad de que ocurra “simultáneamente” o ambos sucesos A y B; probabilidad de que ocurra A y
B: P ( A ∩B )
Probabilidad de que ocurra A y no B; probabilidad de que ocurra sólo A:
P ( A ∩B ' )=P ( A )−P( A ∩ B)
Probabilidad de que ocurra B y no A; probabilidad de que ocurra sólo B:
P ( B ∩ A ' )=P ( B )−P(B ∩ A )
Probabilidad de que ocurra sólo uno de los dos:
P ( A ∩B ' )+ P ( B ∩ A ' )
Ejemplo #33: De los 39 alumnos de una clase, 16 escogieron francés y 27 inglés. 9 alumnos eligieron
ambos, y el resto no escogió ninguno de ellos. Si se elige al azar un alumno de dicha clase, halla las
siguientes probabilidades:
a) Escogió francés.
b) Escogió inglés.
c) Escogió ambos idiomas.
d) Escogió francés o inglés.
e) Escogió francés, pero no inglés.
f) No escogió ni inglés ni francés.
U F I
7 9 18
a) Escogió francés:
pág. 27
16
P ( F)= =0.410256
39
b) Escogió inglés:
27
P ( I)= =0.692307
39
c) Escogió ambos idiomas:

9
P ( F ∩ I )= =0.230769
39
d) Escogió francés o inglés:
16 27 9 34
P ( F ∪ I )=P ( F ) + P ( I )−P ( F ∩ I )= + − = =0.871794
39 39 39 39
e) Escogió francés, pero no inglés:
16 9 7
P ( F ∩ I ' )=P ( F ) −P ( F ∩ I ) = − = =0.179448
39 39 39
f) No escogió ni inglés ni francés.
34 5
P ( F ' ∩ I ' )=P ( ( F ∪ I ) )=1−P ( F ∪ I )=1−
'
= =0.128205
39 39
Diagrama de Árbol
Un diagrama de árbol es una herramienta que se utiliza para determinar todos los posibles resultados de
un experimento aleatorio. En el cálculo de muchas probabilidades se requiere conocer el número de
objetos que forman parte del espacio muestral, estos se pueden determinar con la construcción de un
diagrama de árbol.
El diagrama de árbol es una representación gráfica de los posibles resultados del experimento, el cual
consta de una serie de pasos, donde cada uno de estos tiene un número infinito de maneras de ser llevado
a cabo. Se utiliza en los problemas de conteo y probabilidad. Para la construcción de un diagrama en
árbol se partirá poniendo una rama para cada una de las posibilidades, acompañada de su probabilidad.
Cada una de estas ramas se conoce como rama de primera generación.
Un diagrama de árbol es una herramienta que se utiliza para determinar En el final de cada rama de
primera generación se constituye a su vez, un nudo del cual parten nuevas ramas conocidas como ramas
pág. 28
de segunda generación, según las posibilidades del siguiente paso, salvo si el nudo representa un posible
final del experimentó (nudo final).
Hay que tener en cuenta que la construcción de un árbol no depende de tener el mismo número de ramas
de segunda generación que salen de cada rama de primera generación y que la suma de probabilidades
de las ramas de cada nudo ha de dar 1. Existe un principio sencillo de los diagramas de árbol que hace
que éstos sean mucho más útiles para los cálculos rápidos de probabilidad: multiplicamos las
probabilidades si se trata de ramas adyacentes (contiguas).
Ejemplo #34: El 1% de la población de un determinado lugar padece una enfermedad. Para detectar esta
enfermedad se realiza una prueba de diagnóstico. Esta prueba da positiva en el 97% de los pacientes que
padecen la enfermedad; en el 98% de los individuos que no la padecen da negativa. Si elegimos al azar
un individuo de esa población:
a) ¿Cuál es la probabilidad de que el individuo dé positivo y padezca la enfermedad?

b) Si sabemos que ha dado positiva, ¿cuál es la probabilidad de que padezca la enfermedad?
Solución:
Primero dibujamos nuestro diagrama de árbol:
0.97
Positivo
Enfermo
0.01
Negativo
0.03
Enferme
dad
0.02
Postivo
0.99
No enfermo
Negativo
0.98
a) P(Enfermo y Positiva)
P(E)∗P (P)=0.01∗0.97=0.0097
pág. 29
b) P(Enfermo | Positiva)
P ( Enfermo y Positiva ) 0.0097

= =0.328813
P ( Positiva) 0.0097+ 0.0198
Ejemplo #35: Una urna A contiene 7 bolas numeradas del 1 al 7. En otra urna B hay 5 bolas numeradas
del 1 al 5. Lanzamos una moneda equilibrada, de forma que, si sale cara, extraemos una bola de la urna
A y, si sale cruz, la extraemos de B.
a) ¿Cuál es la probabilidad de obtener un número par?

b) Sabiendo que salió un número par, ¿cuál es la probabilidad de que fuera de la urna A?
Solución:
Primero dibujamos nuestro diagrama de árbol:
3/7
Par
A
1/2
Impar
4/7
Enferme
dad
2/5
Par
1/2
B
Impar
3/5
a) ¿Cuál es la probabilidad de obtener un número par?
3 1 29
P ( Par )= + = =0.414228
14 5 70
b) Sabiendo que salió un número par, ¿cuál es la probabilidad de que fuera de la urna A?
pág. 30
3
P ( A y Par ) 14 15
P ( A|Par )= = = =0.517241
P ( Par ) 29 29
70
Probabilidad Total
Sean A1, A2,…, An un conjunto completo de sucesos incompatibles entre sí. Sea B el suceso del cual se
conocen las probabilidades condicionadas P(B/A i), entonces, la probabilidad de ocurrencia de B se
conoce como probabilidad total (completa) y su valor se determina mediante la expresión:
P(B)=P( A 1)∗P(B/ A 1)+ P ( A 2)∗P(B/ A 2)+ …+ P( A n)∗P (B / A n)
Es importante destacar que la probabilidad total puede entenderse como la suma de las probabilidades
compuestas P(Ai ∩ B).
Sean A1, A2,…, An un conjunto completo de sucesos incompatibles entre sí. Sea B el suceso del cual se
conocen las probabilidades condicionadas P(B/A i), entonces, la probabilidad de ocurrencia de A i dado
que ha ocurrido el suceso B, lo que se denota por “P(A i/B)”, se conoce como el teorema de Bayes y su
valor se determina mediante la expresión:
P ( A i )∗P(B / A i)
P( Ai /B)=
P( A 1)∗P(B/ A 1)+ P( A 2)∗P (B / A 2)+…+ P (A n)∗P(B/ A n)
Ejemplo #36: En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De los niños el
35% son menores de 24 meses. El 20% de las niñas tienen menos de 24 meses. Un pediatra que ingresa
a la sala selecciona un infante al azar.
a) Determine el valor de la probabilidad de que sea menor de 24 meses.

b) Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea una niña.
Solución:
 Se definen los sucesos:

 Suceso H: seleccionar una niña.
 Suceso V: seleccionar un niño.
 Suceso M: infante menor de 24 meses.
En los ejercicios de probabilidad total y teorema de Bayes, es importante identificar los sucesos que
forman la población y cuál es la característica que tienen en común dichos sucesos. Estos serán los
sucesos condicionados.
pág. 31
En este caso, la población es de los infantes. Y la característica en común es que sean menores de 24
meses. Por lo tanto, la probabilidad de seleccionar un infante menor de 24 meses es un ejemplo de
probabilidad total. Su probabilidad será:
P ( M )=P ( H )∗P ( M| H ) + P (V )∗P ( M|V )=0.6∗0.2+0.4∗0.35=0.26
Para identificar cuando en un ejercicio se hace referencia al teorema de Bayes, hay que partir de
reconocer esta es una probabilidad condicionada y que la característica común de los sucesos
condicionantes ya ha ocurrido. Entonces, la probabilidad de que sea niña un infante menor de 24 meses
será:
P ( H )∗P ( M |H ) 0.6∗0.2
P ( H∨M )= = =0.461538
P ( H )∗P ( M| H ) + P (V )∗P ( M|V ) 0.6∗0.2+ 0.4∗0.35
Ejemplo #37: Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se
realizan correcciones faciales, un 35% implantes mamarios y el restante en otras cirugías correctivas. Se
sabe, además, que son de género masculino el 25% de los que se realizan correcciones faciales, 15%
implantes mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente al azar, determine:
a) Determine la probabilidad de que sea de género masculino.

b) Si resulta que es de género masculino, determine la probabilidad que se haya realizado una cirugía de
implantes mamarios.
Solución:
Se definen los sucesos:
 Suceso F: pacientes que se realizan cirugías faciales

 Suceso M: pacientes que se realizan implantes mamarios
 Suceso O: pacientes que se realizan otras cirugías correctivas
 Suceso H: pacientes de género masculino
a) La probabilidad de que sea de género masculino se refiere a un problema de probabilidad total, ya que
es el suceso condicionado y las cirugías los condicionantes. Dicho valor será:
P ( H )=P ( F )∗P ( H| F ) + P ( M )∗P ( H|M ) + P (O )∗P ( H|O )
P ( H )=0.2∗0.25+0.35∗0.15+0.45∗0.4=0.2825
pág. 32
b) Como el suceso condicionado ha ocurrido entonces se aplica el teorema de Bayes, luego, el valor de
la probabilidad será:
P ( M )∗P ( H|M )
P ( M ∨H )=
P ( F )∗P ( H|F ) + P ( M )∗P ( H|M )+ P ( O )∗P ( H|O )
0.35∗0.15
P ( M ∨H )= =0.185840
0.2∗0.25+0.35∗0.15+0.45∗0.4
1.6 Manejo de software estadístico
Retomemos el ejemplo #14 anteriormente descrito, y vamos a utilizar el software Minitab® 18:
A.- Vamos a abrir el software y deberá a parecer una ventana como esta:
B.- En la parte de hoja de trabajo, es la columna C1, deberá llenar los 80 datos sin importar el orden:
pág. 33
C.- Vamos a seleccionar estadísticas básicas y seleccionar mostrar estadísticos descriptivos:
D.- En la casilla de variables deberá seleccionarse la columna C1, y deberemos dar aceptar, algunos
criterios podemos ajustarlos:
pág. 34
pág. 35
E.- Ahora tendremos una pantalla de salida de esta forma:
F.- Deberemos acomodar los datos y las gráficas en Word® para poder analizar la información:
Estadísticos descriptivos: C1
Estadísticas
Variable N N* Media Desv.Est. Varianza CoefVar Mínimo Q1 Mediana Q3
C1 8 0 162.66 33.77 1140.63 20.76 76.00 143.5 161.50 181.00
0 0
N para
Variable Máximo Rango IQR Modo moda
C1 245.00 169.0 37.50 158 4
0
Histograma de C1
pág. 36
Gráfica de caja de C1
G.- Para visualizar el Diagrama Tallo – Hoja deberemos hacer los siguiente:
pág. 37
H.- Se desplegará la información en la sesión que deberemos acomodar:
pág. 38
Diseño de tallo y hoja: C1
Tallo y hoja de C1 N = 80
1 7 6
2 8 7
3 9 7
5 1 15
0
8 1 058
1
11 1 013
2
17 1 133455
3
25 1 12356899
4
37 1 001344678888
5
(10) 1 0003357789
6
33 1 0112445668
7
23 1 0011346
8
16 1 034699
9
10 2 0178
0
6 2 8
1
5 2 189
2
2 2 7
3
1 2 5
4
Unidad de hoja = 1
pág. 39
pág. 40
Retomemos el ejemplo #10, y utilizaremos la Texas Instruments® Voyage 200:
A.- Lo primero que tenemos que hacer es declarar los datos que irán entre llaves {}, y se les asignará
una variable:
B.- Al darle Enter, deberemos digitar la opción Onevar a y darle Enter:
pág. 41
C.- El siguiente comando será Showstat y darle Enter, para poder visualizar los resultados:
pág. 42
2. Variables aleatorias y funciones de distribución de probabilidad
2.1 Variables aleatorias discretas
Generalidades
Una variable aleatoria discreta es aquella que puede asumir un número contable de valores. Por ejemplo,
si realizamos el experimento de salir a calle y seleccionar 10 personas al azar para un examen sorpresa
de matemáticas, podemos definir la variable aleatoria A:
A = número de personas que aprobaron el examen. Los valores que asume A (en su rango), van del 0 al
10 (0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10). El rango lo expresaríamos de la siguiente manera:
RA = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
La variable aleatoria A asume un número contable de valores, por ello, es una variable aleatoria discreta.
Otro ejemplo, vamos a realizar el experimento de registrar los automóviles a una caseta de peaje.
Podemos definir la variable aleatoria V:
V = número de vehículos que llegan durante el periodo de un día.
Los valores que asume V (en su rango), son 0, 1, 2, 3, 4, 5, …; así sean muchos vehículos los que llegan,
siempre podremos contar la cantidad de valores que asume V. Por ello, la variable V es una variable
aleatoria discreta.
2.2 Variables aleatorias continuas
Una variable aleatoria continua, es aquella que puede asumir un número incontable de valores.
Ejemplo #38: Si realizamos el experimento de ir a mi granja y estudiamos las características de las

vaquitas, podemos definir la variable aleatoria C:
B = peso de una vaca en la granja de Jorge (en kilogramos). Alguna vaquita puede pesar 425,1872 kg;
otra puede pesar 612,5874541 kg; otra puede pesar 545,897512121 kg. Si tomamos más vacas,
podríamos tener más valores y nunca terminaríamos. Se conoce que el becerro más pequeño tiene un
peso de 30 kg, y la vaca más grande tiene un peso de 1000 kg.
Y así, tendríamos un número incontable de valores para el rango de esta variable. El rango de esta
variable puede ser cualquier valor dentro del intervalo que va desde 30 kg hasta 1000 kg. Por ello, se
trata de una variable aleatoria continua.
pág. 43
Ejemplo #39: Si vamos a una agencia del banco y registramos los datos de atención a los clientes,
podemos definir la variable aleatoria D:
D = tiempo de atención a los clientes del banco (en segundos). Un cliente puede ser atendido en 24,123
s; otro cliente en 72,32142 s; otro en 51,123123 s. Si seguimos tomando más clientes, tendríamos más
valores. Se conoce además que el tiempo mínimo de atención en ventanilla es de 1 s y el tiempo máximo
es de 240 s.
Y así, tendríamos un número incontable de valores para el rango de esta variable. El rango de esta
variable puede ser cualquier valor dentro del intervalo que va desde 1 s hasta 240 s. Por ello, se trata de
una variable aleatoria continua. En general, las variables aleatorias discretas representan datos que
provienen del conteo del número de elementos, mientras que, las variables aleatorias continuas
representan datos que provienen de mediciones, por ejemplo, tiempo, peso, longitud, etc.
2.3 Funciones de distribución
Las distribuciones de probabilidad son idealizaciones de los polígonos de frecuencias. En el caso de una
variable estadística continua consideramos el histograma de frecuencias relativas, y se comprueba que al
aumentar el número de datos y el número de clases el histograma tiende a estabilizarse llegando a
convertirse su perfil en la gráfica de una función.
Caracterización:
Las distribuciones de probabilidad de variable continua se definen mediante una función y=f (x )
llamada función de probabilidad o función de densidad. Así como en el histograma la frecuencia viene
dada por el área, en la función de densidad la probabilidad viene dada por el área bajo la curva, por lo
que:
1. El área encerrada bajo la totalidad de la curva es 1.

2. Para obtener la probabilidad P(a≤ x ≤ b) obtenemos la proporción de área que hay bajo la curva
desde a hasta b.
3. La probabilidad de sucesos puntuales es 0, P(x=a)=0.
Una variable aleatoria, X, es una función que asocia un número real a cada elemento del espacio
muestral XR. Pueden ser: Discretas: si su recorrido es un número finito de valores, que suele ser
pág. 44
entero y Continuas: si su recorrido está formado por los infinitos números reales comprendidos en un
intervalo.
Parámetros en una distribución de probabilidad
Por analogía con las variables estadísticas podemos definir también aquí la media µ y la desviación
típica  de la variable aleatoria.
La media µ, también llamada esperanza matemática, es un valor representativo de todos los valores que
toma la variable aleatoria x, lo podemos imaginar como el punto sobre el eje de abscisas donde al poner
una cuña la figura plana definida por la función de densidad quedará en equilibrio. La desviación típica
 es una medida de la dispersión de los valores que toma la variable aleatoria de la media. Como ocurría
con las variables estadísticas la desviación típica será más pequeña o más grande según la gráfica de la
función de densidad sea más estrecha o más ancha en torno a la media.
Una distribución de probabilidad es un modelo matemático que asocia valores de una variable aleatoria
con sus respectivas probabilidades, es decir: P(x )=F (x).
Las distribuciones se caracterizan por una fórmula que determina el tipo de distribución y por un
conjunto de parámetros, que son propios de cada espacio muestral. En el caso de una variable discreta ,
la distribución puede describirse mediante una función de probabilidad, que para cada valor de x de la
variable X determina la probabilidad de ser asumido: P( X=x)=p (x) ; o bien por medio de una función
de distribución de probabilidad acumulada o simplemente función de distribución, la que, para cada
valor provee la probabilidad de no ser superado: P( X ≤ x)=F (x ) evidentemente, el valor de la función
de distribución es igual a la suma de todos los valores de la función de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive.
2.4 Distribuciones de probabilidad para variables discretas
Distribución Binomial
La distribución binomial se utiliza en situaciones cuya solución tiene dos posibles resultados. Por
ejemplo:
 Al nacer un/a bebé puede ser varón o hembra.

 En el deporte un equipo puede ganar o perder.
 En pruebas de cierto o falso sólo hay dos alternativas.
Estos ejemplos los podemos considerar como “experimentos de Bernoulli”
1.- En cada prueba del experimento sólo hay dos posibles resultados: éxitos o fracasos.
2.- El resultado obtenido en cada prueba es independiente de los resultados obtenidos en pruebas
anteriores.
pág. 45
3.- La probabilidad de un suceso es constante, la representamos por p, y no varía de una prueba a otra.
La probabilidad del complemento es 1- p y la representamos por q.
Si repetimos el experimento n veces podemos obtener resultados para la construcción de la distribución
binomial.
La distribución de probabilidad binomial es un ejemplo de distribución de probabilidad discreta. Está

formada por una serie de experimentos de Bernoulli. Los resultados de cada experimento son
mutuamente excluyentes. Para construirla necesitamos:
1. la cantidad de pruebas n.
2. la probabilidad de éxitos p.
3. utilizar la función matemática.
A continuación, vemos la función de probabilidad de la distribución Binomial, también denominada

Función de la distribución de Bernoulli:
n! k n−k
P ( x=k ) = ∗p ∗( 1−p )
k ! ( n−k ) !
Donde:
k: es el número de aciertos.
n: es el número de experimentos.
p:es la probabilidad de éxito, por ejemplo, que salga "cara" al lanzar la moneda.
1-p: también se le denomina como “q”
Ejemplo #40: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? El número de
aciertos k es 6. Esto es x=6; El número de experimentos n son 10; La probabilidad de éxito p, es decir,
que salga "cara" al lanzar la moneda es 50% ó 1/2.
n! k n−k
P ( x=k ) = ∗p ∗( 1−p )
k ! ( n−k ) !
()( )
6 10−6
10! 1 1
P ( x=6 ) = ∗ ∗ 1− =0.205078
6 ! ( 10−6 ) ! 2 2
Esto significa que la probabilidad de obtener 6 caras al lanzar 10 veces una moneda es de 20.5078%.
Ejemplo #41: ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho
veces? El número de aciertos es 4. Esto es x=4; El número de experimentos n son 8; La probabilidad de
éxito p (probabilidad de que salga un 3 al tirar el dado) es 1/6.
pág. 46
n! k n−k
P ( x=k ) = ∗p ∗( 1−p )
k ! ( n−k ) !
() ( )
4 8−4
8! 1 1
P ( x=4 )= ∗ ∗ 1− =0.026048
4 ! ( 8−4 ) ! 6 6
Esto significa que la probabilidad de obtener cuatro veces el número 3 al tirar un dado 8 veces es de
2.6048%.
Ejemplo #42: En una fábrica de cámaras el 5% sale con defectos. Determine la probabilidad de que en
una muestra de 12 se encuentren 2 cámaras defectuosas.
n! k n−k
P ( x=k ) = ∗p ∗( 1−p )
k ! ( n−k ) !
( )( )
2 12−2
12! 1 1
P ( x=2 )= ∗ ∗ 1− =0.098792
2 ! ( 12−2 ) ! 20 20
Esto significa que la probabilidad de que en una muestra de 12 se encuentren 2 cámaras defectuosas es
de 9.8792%.
Propiedades
La distribución binomial se forma de una serie de experimentos de Bernoulli

La media (μ) en la distribución binomial se obtiene con el producto de n*p.
La desviación estándar (σ) en la distribución binomial se obtiene de la raíz cuadrada del producto de
n*p*q.
El valor de q es el complemento de p y se obtiene con 1 – p.
Ejemplo #43: En pruebas realizadas a un amortiguador para automóvil se encontró que el 20%
presentaban fuga de aceite. Si se instalan 20 de estos amortiguadores, hallar la probabilidad de que:
a) 4 salgan defectuosos,
b) más de 5 tengan fuga de aceite.
c) de 3 a 6 amortiguadores salgan defectuosos.
d) Determine el promedio y la desviación estándar de amortiguadores con defectos.
a) 4 salgan defectuosos:
n! k n−k
P ( x=k ) = ∗p ∗( 1−p )
k ! ( n−k ) !
pág. 47
()( )
4 20−4
20 ! 1 1
P ( x=4 )= ∗ ∗ 1− =0.218199 o 21.8199 %
(
4 ! 20−4 !) 5 5
b) más de 5 tengan fuga de aceite:
1− [ P ( x=0 )−P ( x=1 )−P ( x=2 )−P ( x=3 ) −P ( x=4 )−P ( x=5 ) ]
1−0.011529−0.057646−0.136909−0.205364−0.218199−0.17456=¿
0.195788 o 19.5788 %
c) de 3 a 6 amortiguadores salgan defectuosos:
P ( x=3 ) + P ( x=4 ) + P ( x=5 ) + P ( x=6 )

0.205364 +0.218199+0.17456+ 0.1091=0.707223 o 70.7223 %
d) Determine el promedio y la desviación estándar de amortiguadores con defectos:
20∗1
μ=n∗p= =4
5
√
20∗1
∗4
√
2
2 5 2 16
σ =√ n∗p∗q= = =1.78885
5 5
Distribución Poisson
La distribución de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de ocurrencia
aleatoria. En otras palabras, no se sabe el total de posibles resultados. Permite determinar la probabilidad
de ocurrencia de un suceso con resultado discreto.
Es muy útil cuando la muestra o segmento n es grande y la probabilidad de éxitos p es pequeña. Se

utiliza cuando la probabilidad del evento que nos interesa se distribuye dentro de un segmento n dado
como por ejemplo distancia, área, volumen o tiempo definido.
Utilidad
 La llegada de un cliente al negocio durante una hora.

 Las llamadas telefónicas que se reciben en un día.
 Los defectos en manufactura de papel por cada metro producido.
 Los envases llenados fuera de los límites por cada 100 galones de producto terminado.
La distribución de Poisson se emplea para describir procesos con un elemento en común, pueden ser
descritos por una variable aleatoria discreta.
pág. 48
Propiedades de un proceso de Poisson
1. La probabilidad de observar exactamente un éxito en el segmento o tamaño de muestra n es

constante.
2. El evento debe considerarse un suceso raro.
3. El evento debe ser aleatorio e independiente de otros eventos.
Si repetimos el experimento n veces podemos obtener resultados para la construcción de la distribución

de Poisson.
La distribución de probabilidad de Poisson es un ejemplo de distribución de probabilidad discreta. La

distribución de Poisson parte de la distribución binomial. Cuando en una distribución binomial se realiza
el experimento muchas veces, la muestra n es grande y la probabilidad de éxito p en cada ensayo es baja,
es aquí donde aplica el modelo de distribución de Poisson.
Se tiene que cumplir que:
 p < 0.10
 p * n < 10
 µ=¿
 √2 ❑
La función de probabilidad de la distribución de Poisson es:
−λ k
( ) e ∗λ
P x=k =
k!
Donde:
 P(x=k ) es la probabilidad de ocurrencia cuando la variable discreta x toma un valor finito k.

 λ = Lambda es la ocurrencia promedio por unidad (tiempo, volumen, área, etc.). Es igual a p por
el segmento dado. La constante e tiene un valor aproximado de 2.711828
 k = es el número de éxitos por unidad.
Ejemplo #44: La probabilidad de que haya un accidente en una compañía de manufactura es de 0.02 por
cada día de trabajo. Si se trabajan 300 días al año, ¿cuál es la probabilidad de tener 3 accidentes? Como
la probabilidad p es menor que 0.1, y el producto n*p es menor que 10 (300 * 0.02 = 6), entonces,
aplicamos el modelo de distribución de Poisson:
−λ k −6 3
e ∗λ e ∗6
P ( x=k ) = → P ( x=3 ) = =0.089235
k! 3!
Esto significa que la probabilidad de tener 3 accidentes laborales en 300 días de trabajo es de 8.9235%.
pág. 49
Ejemplo #45: La probabilidad de que un producto salga defectuoso es de 0.012. ¿Cuál es la probabilidad
de que entre 800 productos ya fabricados hayan 5 defectuosos? En este ejemplo vemos nuevamente la
probabilidad p menor que 0.1, y el producto n*p menor que 10, por lo que aplicamos el modelo de
distribución de Poisson:
− 48
( )
5
5 48
−λ k
e ∗
e ∗λ 5
P ( x=k ) = → P ( x=5 ) = =0.046020
k! 5!
Esto significa que la probabilidad de que entre 800 productos ya fabricados hayan 5 defectuosos es de
4.6020%.
Ejemplo #46: Si 8 de 100 viviendas violan el código de construcción. ¿cuál es la probabilidad de que un
inspector de viviendas, que selecciona aleatoriamente a 50 de ellas, descubra que:
a) ninguna de las casas viola el código de construcción

b) una viola el código de construcción
c) dos violan el código de construcción
d) al menos tres violan el código de construcción
e) Hallar la media y la desviación estándar típica
a) ninguna de las casas viola el código de construcción:
−4 0
e−λ∗λ k e ∗( 4 )
P ( x=k ) = → P ( x=0 )= =0.018315 o 1.8315 %
k! 0!
b) una viola el código de construcción:
−4 1
e−λ∗λ k e ∗( 4 )
P ( x=k ) = → P ( x=1 )= =0.073262 o 7.3262 %
k! 1!
c) dos violan el código de construcción:
−4 2
e−λ∗λ k e ∗( 4 )
P ( x=k ) = → P ( x=2 ) = =0.146525 o 14.6525 %
k! 2!
d) al menos tres violan el código de construcción:
1− [ P ( x=0 )−P ( x=1 )−P ( x=2 ) ] =1−0.018315−0.073262−0.146525

1− [ P ( x=0 )−P ( x=1 )−P ( x=2 ) ] =0.761898 o 76.1898 %
e) Hallar la media y la desviación estándar típica
pág. 50
μ=¿ 4 y √2 4=2
Distribución Hipergeométrica
La distribución hipergeométrica es una distribución discreta que modela el número de eventos en una
muestra de tamaño fijo cuando se conoce el número total de elementos en la población de la cual
proviene la muestra. Cada elemento de la muestra tiene dos resultados posibles (es un evento o un no
evento). Las muestras no tienen reemplazo, por lo que cada elemento de la muestra es diferente.
Cuando se elige un elemento de la población, no se puede volver a elegir. Por lo tanto, la probabilidad
de que un elemento sea seleccionado aumenta con cada ensayo, presuponiendo que aún no haya sido
seleccionado.
Se utiliza la distribución hipergeométrica para muestras obtenidas de poblaciones relativamente

pequeñas, sin reemplazo. La distribución hipergeométrica se define por 3 parámetros: tamaño de la
población, conteo de eventos en la población y tamaño de la muestra.
Los experimentos que tienen este tipo de distribución tienen las siguientes características:
 Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados.
 Las probabilidades asociadas a cada uno de los resultados no son constantes.
 Cada ensayo o repetición del experimento no es independiente de los demás.
 El número de repeticiones del experimento (n) es constante.
Si en una población de N elementos se tienen k éxitos, la probabilidad de que en una muestra aleatoria
de n elementos seleccionados sin reemplazo se tengan x éxitos está dada por:
P ( x )=
( x )( n−x ) nCr ( k , x )∗nCr (N−k , n−x) k C x∗N −kCn−x
k N−k
= =
(n )
N nCr(N , n) NCn
Donde:
 N = número de elementos en la población.

 n = número de elementos en la muestra.
 k = número de éxitos en la población.
 x = número de éxitos en la muestra.
Ejemplo #47: Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si
de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos?,: N=10, n=4, k=3 y
x=2
pág. 51
kCx∗N−kCn−x 3 C 2∗10−3 C 4−2 63

P ( x )= = = =0.3
NCn 10C 4 210
Esto significa que la probabilidad de que 2 sean defectuosos es de 30%.
Ejemplo #48: De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene 3

proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que:
a) los 4 exploten
b) al menos 2 no exploten
c) calcule la media y la desviación estándar típica
Tome en cuenta que N=10, k=3, n=4
a) los 4 exploten:
k C x∗N−kCn−x 3 C 0∗10−3C 4−0 35 1

P ( x=0 ) = = = = o 16.66666 %
NC n 10 C 4 210 6
b) al menos 2 no exploten:
k C x∗N −kCn−x 3C 2∗10−3 C 4−2 3 C 3∗10−3 C 4−3 63+7 1

P ( x=2 ,3 )= = + = = o 33.33333 %
N Cn 10 C 4 10 C 4 210 3
c) calcule la media y la desviación estándar típica:
n∗K 4∗3 6
μ= = = =1.2
N 10 5
√ √
N−n 10−4
2 ∗n∗K 2 ∗4∗3
σ=
N −1
N
K
∗ 1− =
N (
10−1
10 )
∗ 1−
3
10
=0.7483314( )
2.5 Distribución de probabilidad para variables continuas
Las distribuciones de probabilidad de variable continua son idealizaciones de las distribuciones

estadísticas de variable continua. Estas se obtienen empíricamente (experimentando u observando).
Aquellas son distribuciones teóricas.
Las distribuciones de probabilidad de variable continua se definen por medio de una función y = f(x)
que se llama función de probabilidad o función de densidad. Ha de ser f(x) ≥ 0 para todo x.
pág. 52
Las probabilidades vienen dadas por el área bajo la curva. Por tanto, el área encerrada bajo la totalidad
de la curva es 1. Es decir, tomamos como unidad el área bajo la curva completa.
La Normal es la distribución de probabilidad más importante. Multitud de variables aleatorias continuas

siguen una distribución normal o aproximadamente normal. Una de sus características más importantes
es que casi cualquier distribución de probabilidad, tanto discreta como continua, se puede aproximar por
una normal bajo ciertas condiciones. La distribución de probabilidad normal y la curva normal que la
representa, tienen las siguientes características:
La curva normal tiene forma de campana y un solo pico en el centro de la distribución. De esta manera,
la media aritmética, la mediana y la moda de la distribución son iguales y se localizan en el pico. Así, la
mitad del área bajo la curva se encuentra a la derecha de este punto central y la otra mitad está a la
izquierda de dicho punto. La distribución de probabilidad normal es simétrica alrededor de su media. La
curva normal desciende suavemente en ambas direcciones a partir del valor central. Es asintótica, lo que
quiere decir que la curva se acerca cada vez más al eje X, pero jamás llega a tocarlo. Es decir, las
“colas” de la curva se extienden de manera indefinida en ambas direcciones.
Área bajo la curva:
La curva es simétrica
Media
Colas
pág. 53
Tablas de áreas bajo la curva:
Valores de Tablas de Estadística (Normal Estándar Acumulada)

Autor: M. en C. José Antonio Cuatepotzo Varela
Probabilidad 0 ≤P(x)<1= 0.52

Valor de Tabla de Z= 0.050
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
-3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
-3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
-3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
-3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
-3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
-3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
-3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
-3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
-3.1 0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
-3 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00104 0.00100
-2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139
-2.8 0.00256 0.00248 0.00240 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193
-2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.00280 0.00272 0.00264
-2.6 0.00466 0.00453 0.00440 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357
-2.5 0.00621 0.00604 0.00587 0.00570 0.00554 0.00539 0.00523 0.00508 0.00494 0.00480
-2.4 0.00820 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639
-2.3 0.01072 0.01044 0.01017 0.00990 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842
-2.2 0.01390 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.01160 0.01130 0.01101
-2.1 0.01786 0.01743 0.01700 0.01659 0.01618 0.01578 0.01539 0.01500 0.01463 0.01426
-2 0.02275 0.02222 0.02169 0.02118 0.02068 0.02018 0.01970 0.01923 0.01876 0.01831
Estadístico de Prueba:
Formalmente, si X ∼ N(µ, σ), entonces la variable aleatoria Z:
x −μ
Z=
σ
se distribuye según una normal de media 0 y desviación estándar 1, i.e.: Z ∼ N(0,1) , que es la
distribución llamada normal estándar o tipificada. De esta manera, un valor Z mide la distancia entre un
valor especificado de X y la media aritmética, en las unidades de la desviación estándar. Al determinar
el valor Z utilizando la expresión anterior, es posible encontrar el área de probabilidad bajo cualquier
curva normal haciendo referencia a la distribución normal estándar en las tablas correspondientes.
pág. 54
Ejemplo #49: Encuentre las siguientes áreas bajo la curva:
pág. 55
pág. 56
Ejemplo #50: En una ciudad se estima que la temperatura máxima en el mes de junio sigue una
distribución normal, con media 23° y desviación típica 5°. Calcular la probabilidad y el número de días
del mes en los que se espera alcanzar máximas entre 21° y 27°.
x−μ 21−23 −2
Z 1= = = =−0.4
σ 5 5
x−μ 27−23 4
Z 2= = = =0.8
σ 5 5
La probabilidad y el número de días del mes en los que se espera alcanzar máximas entre 21° y 27°, es
de 44.36% y 30*(0.4436) =13.3≈13 días.
pág. 57
Ejemplo #51: La media de los pesos de 500 estudiantes de un Instituto es 70 kg y la desviación típica 3
kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuántos estudiantes pesan:
a) Entre 60 kg y 65 kg.
b) Más de 90 kg.
c) Menos de 64 kg.
d) 64 kg o más.
a) Entre 60 kg y 65 kg:
x−μ 60−70 −10
Z 1= = = =−3.33
σ 3 3
x−μ 65−70 −5
Z 2= = = =−1.66
σ 3 3
pág. 58
b) Más de 90 kg:
x −μ 90−70 20
Z= = = =6.66
σ 3 3
c) Menos de 64 kg:
x −μ 64−70 −6
Z= = = =−2
σ 3 3
pág. 59
d) 64 kg o más:
x −μ 64−70 −6
Z= = = =−2
σ 3 3
pág. 60
Distribución Chi-cuadrada ꭓ2
La distribución de chi-cuadrada es una distribución continua que se especifica por los grados de libertad
y el parámetro de no centralidad. La distribución es positivamente asimétrica, pero la asimetría
disminuye al aumentar los grados de libertad.
Se utiliza la distribución de chi-cuadrada 2 en pruebas de significancia estadística para:
a) Comprobar qué tan bien se ajusta una muestra a una distribución teórica. Por ejemplo, puede
utilizar una prueba de bondad de ajuste de chi-cuadrada para determinar si los datos de la
muestra se ajustan a una distribución de Poisson.
b) Comprobar la independencia de las variables categóricas. Por ejemplo, un fabricante desea saber
si la ocurrencia de cuatro tipos de defectos (espárrago faltante, abrazadera rota, sujetador flojo y
sello con fugas) está relacionada con los turnos (diurno, vespertino, nocturno).
Cuando los grados de libertad son 30 o más, la distribución de chi-cuadrada puede aproximarse
razonablemente con una distribución normal, como se ilustra en las siguientes gráficas:
Estadístico de Prueba:
( n−1 )∗s 2
2=
σ2
Propiedades de las distribuciones ji-cuadrada:
 Los valores de 2 son mayores o iguales que 0.

 La forma de una distribución 2 depende del gl=n-1. En consecuencia, hay un número infinito de
distribuciones 2.
 El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
 Las distribuciones 2 no son simétricas. Tienen colas estrechas que se extienden a la derecha;
esto es, están sesgadas a la derecha.
 Cuando n>2, la media de una distribución 2 es n-1 y la varianza es 2(n-1).
pág. 61
 El valor modal de una distribución 2 se da en el valor (n-3).
Ejemplo #52: Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos
en una ciudad grande forman una distribución normal con una desviación estándar =1 minuto. Si se elige
al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que
2.
( n−1 )∗s 2 ( 17−1 )∗2

2= = =32
σ2 1
Gráfica de distribución
Chi-cuadrada, df=16
0.08
0.07
0.06
0.05
Densidad
0.04
0.03
0.02
0.01
0.01
0.00
0 32.00
X
El valor de tabla donde encontramos 32 con 16 grados de libertad es de 0.01 por tanto, la probabilidad
de que la varianza muestral sea mayor que 2 es de 1%.
Distribución Binomial
Una distribución binomial B (n, p) se puede aproximar por una distribución normal, siempre que n sea
grande y p no esté muy próxima a 0 ó 1. La aproximación consiste en utilizar una distribución normal
con la misma media y desviación típica de la distribución binomial.
En la práctica se utiliza la aproximación cuando: n>30, np>5, nq>5. En cuyo caso: x= B(n,p) se puede
aproximar a N(μ=np, σ = npq )
Ejemplo #53: La probabilidad de que un paciente se recupere de una rara enfermedad de la sangre es de
0.4. Si se sabe que 100 personas han contraído esta enfermedad, ¿Cuál es la probabilidad de que:
a) al menos 30 sobrevivan?
b) más de 46 sobrevivan?
c) menos de 50 sobrevivan?
μ=n∗p=100∗0.4=40
pág. 62
σ =√ n∗p∗q=√ 100∗0.4∗0.6=4.8989
2 2
a) al menos 30 sobrevivan:
x −μ 30−40 −10
Z= = = =−2.04
σ 4.8989 4.8989
b) más de 46 sobrevivan:
x −μ 46−40 6
Z= = = =1.22
σ 4.8989 4.8989
pág. 63
c) menos de 50 sobrevivan:
x −μ 50−40 10
Z= = = =2.04
σ 4.8989 4.8989
pág. 64
3. Técnicas de Muestreo y Pruebas de Hipótesis
3.1 Bases teóricas para el muestreo
La inferencia estadística tiene que ver con toma de decisiones sobre una población, con base en la
información contenida en una muestra aleatoria de ésta. La media muestral es una estadística; esto es,
una variable aleatoria que depende de los resultados obtenidos en cada muestra en particular. Dado que
una estadística es una variable aleatoria, entonces se tiene una distribución de probabilidad.
Definición: La distribución de probabilidad de una estadística recibe el nombre de distribución de

muestreo. Ésta depende de la distribución de la población, del tamaño de muestra y del método utilizado
para seleccionar ésta.
Uno de los propósitos de la estadística inferencial es estimar las características poblacionales

desconocidas, examinando la información obtenida de una muestra, de una población. El punto de
interés es la muestra, la cual debe ser representativa de la población objeto de estudio. Se seguirán
ciertos procedimientos de selección para asegurar de que las muestras reflejen observaciones a la
población de la que proceden, ya que solo se pueden hacer observaciones probabilísticas sobre una
población cuando se usan muestras representativas de la misma.
Una población está formada por la totalidad de las observaciones en las cuales se tiene cierto observa.
Una muestra es un subconjunto de observaciones seleccionadas de una población. Muestras Aleatorias:
Cuando nos interesa estudiar las características de poblaciones grandes, se utilizan muestras por muchas
razones; una enumeración completa de la población, llamada censo, puede ser económicamente
imposible, o no se cuenta con el tiempo suficiente. Los tipos más comunes de técnicas de muestreo
aleatorios son el muestreo aleatorio simple, el muestreo estratificado, el muestreo por conglomerados y
el muestreo sistemático. Si una muestra aleatoria se elige de tal forma que todos los elementos de la
población tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.
3.2 Tipos de muestreo
El muestreo estratificado requiere de separar a la población según grupos que no se traslapen llamados
estratos, y de elegir después una muestra aleatoria simple en cada estrato. La información de las
muestras aleatorias simples de cada estrato constituiría entonces una muestra global. El muestreo por
conglomerados requiere de elegir una muestra aleatoria simple de unidades heterogéneas entre sí de la
población llamadas conglomerados. Cada elemento de la población pertenece exactamente a un
conglomerado, y los elementos dentro de cada conglomerado son usualmente heterogéneos o disímiles.
El muestreo sistemático es una técnica de muestreo que requiere de una selección aleatoria inicial de
observaciones seguida de otra selección de observaciones obtenida usando algún sistema o regla.
pág. 65
3.3 Parámetros y estadificados
Distribución muestral de la media con varianza conocida
La distribución de muestreo de la media se obtiene tomando la estadística bajo estudio de la muestra

como la media. Calcular esto significa tomar todas las muestras posibles de tamaño n de la población de
tamaño N y luego trazar la distribución de probabilidad. Se puede demostrar que la media de la
distribución de muestreo es, de hecho, la media de la población. Sin embargo, la desviación estándar es
diferente para la distribución de muestreo en comparación con la población. Si la población es lo
suficientemente grande, esto está dado por:
σ
σ x=
√n
Donde σ es la desviación estándar de la distribución de la población y σ x es la media de población.
Si x1, x2, …, xn es una muestra aleatoria de tamaño n tomada de una población (finita o infinita) con
media  y varianza infinita ², y si se tiene una media muestral, entonces la forma del límite de la
distribución es:
x −μ
Z=
σ
√n
Cuando n  , es la distribución normal estándar.
Ejemplo #54: Una compañía electrónica fabrica resistores que tienen una resistencia promedio de 100 y
una desviación estándar de 10 . La distribución de la resistencia es normal. Encuéntrese la
probabilidad de que, al tomar una muestra de 25 resistores, la resistencia promedio de éstos será menor
que 95 .
Solución:
1) Identificar los datos:  = 100;  = 10; n = 25 y x = 95

2) Analizar qué tipo de distribución se requiere (según los datos de la muestra): Distribución normal.
3) Sustitución de datos:
x −μ 95−100
Z= = =−2.5
σ 10
√n √ 25
4) Calcular lo que se pide: P ( x < 95) = P (Z < -2.5) = 0.0062 (Valor tomado de la tabla de distribución
normal estándar acumulada).
pág. 66
5) Dar conclusión (es): “La probabilidad de que la resistencia promedio de los 25 resistores sea menor
que 95  es de 0.62%”.
Ejemplo #55: Se fabrica tubería de PVC con un diámetro promedio de 1.01 pulgadas y una desviación
estándar de 0.003 pulgadas. Encuentra la probabilidad de que, en una muestra aleatoria de 9 secciones
de tubería, el diámetro promedio de la muestra sea mayor que 1.009 y menor que 1.012 pulgadas.
Solución:
1) Identificar los datos:  = 1.01;  = 0.003; n = 9 y 1.009 ≤ x ≤ 1.012

2) Analizar qué tipo de distribución se requiere (según los datos de la muestra): Distribución normal.
x −μ 1.009−1.01
Z= = =−1
σ 0.003
√n √9
x −μ 1.012−1.01
Z= = =2
σ 0.003
√n √9
4) Calcular lo que se pide: P (1.009 ≤ x ≤ 1.012) = P (-1 ≤ Z ≤ 2) = (0.97725 – (1 – 0.84134)) = 0.81859
(Valores tomado de la tabla de distribución normal estándar acumulada).
5) Dar conclusión (es): “La probabilidad de que, en una muestra aleatoria de 9 secciones de tubería, el
diámetro promedio de la muestra sea mayor que 1.009 y menor que 1.012 pulgadas es de 81.859%”.
Distribución muestral de la diferencia de medias con varianza conocida y desconocida
Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviación estándar 1 y la
segunda con media 2 y desviación estándar 2, Más aún, se elige una muestra aleatoria de tamaño n 1 de
la primera población y una muestra independiente aleatoria de tamaño n 2 de la segunda población; se
calcula la media muestral para cada muestra y la diferencia entre dichas medias.
La colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias o la
distribución muestral del estadístico x 1−x 2. La distribución es aproximadamente normal para n 1≥30 y
n2≥30. Si las poblaciones son normales, entonces la distribución muestral de medias es normal sin
importar los tamaños de las muestras.
La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de medias es:
( x1−x 2 ) −( μ1−μ2 )
Z=
√
2 2
σ1 σ2
+
n1 n2
pág. 67
Ejemplo #56: En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una
escuela primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para
niños como para niñas los pesos siguen una distribución normal. El promedio de los pesos de todos los
niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de 14.142, mientras que
el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación
estándar es de 12.247 libras. Si x 1 representa el promedio de los pesos de 20 niños y x 2 es el promedio de
los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los
20 niños sea al menos 20 libras más grande que el de las 25 niñas.
Solución:
1) Identificar los datos: 1 = 100; 1 = 14.142; n1 = 20; 2 = 85; 2 = 12.247; n2 = 25; x 1 = ?; x 2 = ?;

x 1−x 2 = 20; (1 - 2) = 15.
2)Analizar qué tipo de distribución se requiere (según los datos de la muestra): Distribución muestral de
la diferencia de medias.
( x1−x 2 ) −( μ1−μ2 ) 20−( 100−85 )

Z= = =1.25002
√ √
2 2 2 2
σ σ 14.142 12.247
1
+
2
+
n1 n2 20 25
4) Calcular lo que se pide: P ( x 1−x 2 ≥ 20) = P (Z ≥ 1.25) = 0.10565

5) Dar conclusión (es): la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20
libras más grande que el peso de 25 niñas es del 10.56%.
Ejemplo #57: Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a
dos compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación
estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una desviación
estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A
tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la
compañía B.
Solución:
1) Identificar los datos: 1 = 7.2; 1 = 0.8; n1 = 34; 2 = 6.7; 2 = 0.7; n2 = 40; x 1= ?; x 2 = ?; x 1−x 2 = 1
(1 - 2) = 0.5.
2) Analizar qué tipo de distribución se requiere (según los datos de la muestra): Distribución muestral de
la diferencia de medias.
pág. 68
( x1−x 2 ) −( μ1−μ2 ) 1−( 7.2−6.7 )

Z= = =2.83645
√ √
2 2 2 2
σ1 σ2 0.8 0.7
+ +
n1 n2 34 40
4) Calcular lo que se pide: P ( x 1−x 2 ≥ 1) = P (Z ≥ 2.83) = 0.0023
5) Dar conclusión (es): la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A tenga
una vida promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la compañía
B es de 0.23%.
Distribución muestral de una proporción
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos
investigar una proporción, la distribución muestral de proporciones es la adecuada para ello, esta
distribución se genera al extraer las muestras de la población, para ello se calcula el estadístico
proporción: (p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la
muestra) en lugar del estadístico media.
Una población binomial está estrechamente relacionada con la distribución muestral de proporciones;
una población binomial es una colección de éxitos y fracasos, mientras que una distribución muestral de
proporciones contiene las posibilidades o proporciones de todos los números posibles de éxitos en un
experimento binomial, y como consecuencia de esta relación, las afirmaciones probabilísticas referentes
a la proporción muestral pueden evaluarse usando la aproximación normal a la binomial, siempre que np
≥ 5 y n(1-p) ≥ 5.
La fórmula que se utilizará para el cálculo de probabilidad del estadístico de la proporción es:
x−n∗Po
Z=
√n∗Po∗(1−P¿¿ o)¿
Ejemplo #58: Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarros.
Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la
muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solución:
1) Identificar los datos: Po = 0.6; x/n = 0.55; n = 800; x=440

la proporción.
x−n∗P o
Z=
440−800∗0.6
√n∗Po∗(1−P¿¿ o)= 800∗0.6∗0.4 =−2.886751 ¿
√
pág. 69
4) Calcular lo que se pide: P (p < 0.55) = P (Z < -2.88) = 0.002. (Valor tomado de la tabla de
distribución normal estándar acumulada).
5) Dar conclusión (es): “La probabilidad de que la proporción de la muestra de la gente que fuma
cigarrillos sea menor que 0.55 es del 0.20%”
Ejemplo #59: Se sabe que la verdadera proporción de los componentes defectuosos fabricadas por una
firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:
Menos del 3% de los componentes defectuosos.

Más del 1% pero menos del 5% de partes defectuosas.
Solución:
1) Identificar los datos: Po = 0.04; x/n = 0.03; n = 60; x=1.8; Po = 0.04; x/n = 0.01; n = 60; x=0.6; Po =
0.04; x/n = 0.05; n = 60; x=3
la proporción.
x −n∗P o
Z=
1.8−60∗0.04
√n∗Po∗(1−P¿¿ o)= 60∗0.04∗0.96 =−0.395284 ¿
√
x −n∗P o
Z=
0.6−60∗0.04
√n∗Po∗(1−P¿¿ o)= 60∗0.04∗0.96 =−1.185854 ¿
√
x −n∗P o
Z=
3−60∗0.04
√n∗Po∗(1−P¿¿ o)= 60∗0.04∗0.96 =0.395284 ¿
√
4) Calcular lo que se pide: P (p < 0.03) = P (Z < -0.39) = 0.3483. P (0.01 < p < 0.05) = P (-1.18 < Z <
0.39) = 0.5327. Valor tomado de la tabla de distribución normal estándar acumulada).
5) Dar conclusión (es): “La probabilidad de que la proporción de la muestra sea menos del 3% de los
componentes defectuosos es del 34.83% y de que la proporción de la muestra sea menos del 1% y no
más de 5% de los componentes defectuosos es del 53.27%”.
Distribución muestral de dos proporciones
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribución muestral de diferencia de proporciones es aproximadamente normal para
tamaños de muestra grande (n1p1 ≥ 5, n1q1 ≥ 5, n2p2 ≥ 5 y n2q2 ≥ 5). Entonces p1 y p2 tienen distribuciones
muestrales aproximadamente normales, así que su diferencia p 1-p2 también tiene una distribución
muestral aproximadamente normal.
pág. 70
La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de proporciones
es:
(P ¿ ¿ 1−P2 )
Z=( p ¿ ¿1−p 2)− ¿¿
√
P 1∗Q1 P2∗Q2
n1
+
n2
Ejemplo #60: Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus
opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que
el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres
adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre
la promulgación de la pena de muerte.
Determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las
mujeres.
Determine la probabilidad de que el porcentaje de hombres a favor sea al menos 1% que el de las
mujeres, pero no más del 12%.
Solución:
1) Identificar los datos: P1 = 12%; Q1 = 88%; n1 = 100; P2 = 10%; Q2 = 90%; n2 = 100; p1 = ?; p2 = ?; (p1-
p2) = 3%; 1%; 12%.
la diferencia de proporciones.
(P ¿ ¿ 1−P2 ) 0.03−(0.12−0.1)
Z=( p ¿ ¿1−p 2)− = =0.226107 ¿ ¿
√ P 1∗Q1 P2∗Q2
n1
+
n2 √ 0.12∗0.88 0.1∗0.9
100
+
100
(P ¿ ¿ 1−P2 ) 0.01−(0.12−0.1)
Z=( p ¿ ¿1−p 2)− = =−0.226107 ¿ ¿
√ P 1∗Q1 P2∗Q2
n1
+
n2 √ 0.12∗0.88 0.1∗0.9
100
+
100
(P ¿ ¿ 1−P2 ) 0.01−(0.12−0.1)
Z=( p ¿ ¿1−p 2)− = =2.261078 ¿ ¿
√ P 1∗Q1 P2∗Q2
n1
+
n2 √ 0.12∗0.88 0.1∗0.9
100
+
100
4) Calcular lo que se pide: P (p ≥ 0.03) = P (Z ≥ 0.22) = 0.4129. P (0.01 < p < 0.12) = P (-0.22 < Z <
2.26) = 0.5752. Valores tomados de la tabla de distribución normal estándar acumulada).
pág. 71
5) Dar conclusión (es): “La probabilidad de que el porcentaje de hombres a favor sea al menos 3%
mayor que el de las mujeres es del 41.29% y probabilidad de que el porcentaje de hombres a favor sea al
menos 1% que el de las mujeres, pero no más del 12% es del 57.52%”.
Distribución muestral de la media con varianza desconocida
Una distribución para el caso en que ² sea desconocido y se pueda reemplazar por un estimativo, tal
como s². Tal distribución es la distribución t. La función de distribución no puede calcularse en forma
analítica; sin embargo, ha sido tabulada para diferentes valores de la probabilidad acumulada, y para
varios grados de libertad. Como la distribución es simétrica, solamente se presentan probabilidades
acumuladas para valores positivos de t (t≥0).
Los valores que se presentan en los encabezamientos de las columnas de la tabla corresponden a las
probabilidades de exceder los respectivos valores de t, es decir, presentan las colas a la derecha de los
valores respectivos de t.
El estadístico a utilizar es el siguiente:
x−μ
t=
s
√n
Ejemplo #61: Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso
en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra
de 25 lotes cada mes. Si el valor de t calculado cae entre –t 0.05 y t0.05, queda satisfecho con su afirmación.
¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una
desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente
normal.
Solución:
1) Identificar los datos:  = 500; s = 40; n = 25; x = 518; ±t0.05 = ±1.711

2) Analizar qué tipo de distribución se requiere (según los datos de la muestra): Distribución t-Student.
x−μ 518−500
t= = =2.25
s 40
√n √25
pág. 72
T, df=24
0.4
0.3
Densidad
0.2
0.1
0.05 0.05
0.0
-1.711 0 1.711
X
4) Calcular lo que se pide: (-1.711≤ t ≤ 1.711) = 2.25

5) Dar conclusión (es): De aquí que es probable que el fabricante concluya que el proceso produce un
mejor producto del que piensa.
Ejemplo #62: Al fabricante de un agente propulsor utilizado en sistemas de escape de emergencia de

aeronaves, le gustaría afirmar que su producto tiene una tasa promedio de combustión de 40 pulgadas
por minuto. Para investigar esta afirmación, el fabricante prueba 20 granos de propulsor seleccionados al
azar, y si el valor de t cae entre –t 0.05 y t0.05 entonces estará satisfecho. ¿A qué conclusión debe llegar el
fabricante si tiene une media muestral 42?5 pulgadas por minuto y una desviación estándar de 0.75
pulgadas por minuto?
Solución:
1) Identificar los datos:  = 40; s = 0.75; n = 20; x = 42.5; ±t0.05 = ±1.729

2) Analizar qué tipo de distribución se requiere (según los datos de la muestra): Distribución t-Student.
x−μ 42.5−40
t= = =14.90
s 0.75
√n √ 20
pág. 73
T, df=20
0.4
0.3
Densidad
0.2
0.1
0.05 0.05
0.0
-1.725 0 1.725
X
4) Calcular lo que se pide: (-1.729≤ t ≤ 1.729) = 14.90

5)Dar conclusión (es): Sencillamente que su combustible no se quema a dicha aseveración de 40
pulgadas por minuto.
Distribución F (Fisher)
La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es
evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de un
instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o
hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podríamos comparar las varianzas de dos poblaciones, σ 21 y σ22, utilizando la razón de
las varianzas muestrales s21/s22. Si s21/s22 es casi igual a 1, se tendrá poca evidencia para indicar que s 21 y
s22 no son iguales. Por otra parte, un valor muy grande o muy pequeño para s 21/s22, proporcionará
evidencia de una diferencia en las varianzas de las poblaciones.
La distribución F tiene una apariencia muy similar a la distribución ji-cuadrada; sin embargo, se
encuentra centrada respecto a 1, y los dos parámetros v 1 y v2 proporcionan una flexibilidad adicional con
respecto a la forma de la distribución. Si s21 y s22 son las varianzas muestrales independientes de tamaño
n1 y n2 tomadas de poblaciones normales con varianzas 21 y  22, respectivamente, entonces:
2
s1
2
σ1
F=
s 22
2
σ2
pág. 74
Para esta distribución nos limitaremos a encontrar valores de tabla, dado que los problemas aplicados se
encuentran en los intervalos de confianza y pruebas de hipótesis.
Ejemplo #63: Encontrar el valor de F, en cada uno de los siguientes casos:
a) El área a la derecha de F, es de 0.25 con n1=4 y n2=9.
F, df1=4, df2=29
0.8
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.25
0.0
0 1.427
X
f 0.25 ,4 ,9=1.43
b) El área a la izquierda de F, es de 0.95 con n1=15 y n2=10.
F, df1=15, df2=10
0.8
0.7
0.6
0.5
Densidad
0.4
0.3
0.2 0.05
0.1
0.0
0 0.3931
X
1 1
f 0.95 ,15 ,10= = =0.3931
f 0.05 ,10 ,15 2.5437
pág. 75
c) El área a la derecha de F es de 0.95 con n1=6 y n2=8.
F, df1=8, df2=6
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.95
0.0
00.2793
X
1 1
f 0.95 ,8 , 6= = =0.2792
f 0.05 , 8 ,6 3.5805
d) El área a la izquierda de F, es de 0.10 con n1=24 y n2=24.
F, df1=24, df2=24
1.2
1.0
0.8
Densidad
0.6
0.4
0.1
0.2
0.0
0 0.5876
X
1 1
f 0.90 ,24 , 24= = =0.5875
f 0.10 , 24 ,24 1.7018
pág. 76
3.4 Errores estadísticos
Al iniciar cualquier investigación, la primera pregunta que surge es: ¿de qué tamaño debe ser la o las
muestras? La respuesta a esta pregunta la veremos en esta sección, con conceptos específicos para cada
tipo de estimación.
Basado en la media de la Población
¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la media
poblacional? La respuesta depende del error estándar de la media, si este fuera cero, entonces se
necesitaría una sola media que será igual necesariamente a la media poblacional desconocida μ, porque
σ = 0. Este caso extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras menor
sea el error estándar de la media, menor es el tamaño de muestra necesario para lograr un cierto grado de
precisión.
( )
2
Z α ∗σ
2
n=
ε
Ejemplo #64: Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado de
Maryland. Un estudio anterior de diez ciervos cazados mostró que la desviación estándar de sus pesos es
de 12.2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de
que el error de estimación es a lo más de 4 libras?
Solución:
 Sustituir y dar resultado:
( )
2
Z α ∗σ
n= 2
ε (
=
1.96∗12.2 2
4 )
=35.7364 ≅ 36
Se desea saber qué tan grande se requiere que sea una muestra para asegurar que el error al estimar P sea
menor que una cantidad específica.
2
Z ∗p∗q
n= 2
ε
Esta fórmula está algo engañosa, pues debemos utilizar p para determinar el tamaño de la muestra, pero
p se calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una idea del comportamiento
de la proporción de la población y ese valor se puede sustituir en la fórmula, pero si no se sabe nada
referente a esa proporción entonces se tienen dos opciones: Tomar una muestra preliminar mayor o igual
a 30 para proporcionar una estimación de P. Después con el uso de la fórmula se podría determinar de
pág. 77
forma aproximada cuántas observaciones se necesitan para proporcionar el grado de precisión que se
desea.
Tomar el valor de p como 0.5 ya que sustituyendo este en la fórmula se obtiene el tamaño de muestra
mayor posible.
Ejemplo #65: Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se sustituirán en la
fórmula para observar los diferentes tamaños de muestras. El nivel de confianza que se utilizará es del
95% con un error de estimación de 0.30.
2 2
Z ∗p∗q 1.96 ∗0.5∗0.5
n= 2
= 2
=10.67
ε 0.3
Tamaños de muestra de los cuales fluctúan al no conocerse con certeza “p”.
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el tamaño de la muestra se
convierte en:
2
Z ∗p∗q∗N
n= 2 2
ε ∗( N −1 )+ Z ∗p∗q
Ejemplo #66: De una población de 278 empresas se desea calcular un tamaño de muestras representativo
para realizar cierto estudio, tomando en cuenta un error máximo del 10% y un nivel de confianza del
95%.
2 2
Z ∗p∗q∗N 1.96 ∗0.5∗0.5∗278
n= 2 2
= 2 2
=71.57 ≅ 72
ε ∗( N −1 )+ Z ∗p∗q 0.1 ∗277+1.96 ∗0.5∗0.5
3.5 Estimación por intervalos de confianza
Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información alguna sobre la
precisión y confiabilidad de la estimación. Debido a la variabilidad de la muestra, nunca se tendrá el
caso de que x = μ. El estimado puntual nada dice sobre lo cercano que esta de m. Una alternativa para
reportar un solo valor del parámetro que se esté estimando es calcular e informar todo un intervalo de
valores factibles, un estimado de intervalo o intervalo de confianza (IC). Un intervalo de confianza se
calcula siempre seleccionando primero un nivel de confianza, que es una medida del grado de fiabilidad
en el intervalo.
Un nivel de confianza de 95% implica que 95% de todas las muestras daría lugar a un intervalo que
incluye μ o cualquier otro parámetro que se esté estimando, y sólo 5% de las muestras producirá un
intervalo erróneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro
que se estima está dentro del intervalo.
pág. 78
Insesgado. - Se dice que un estimador puntual θ^ es un estimador insesgado de θ si (θ^ )= θ, para todo
valor posible de θ. En otras palabras, un estimador insesgado es aquel para el cual la media de la
distribución muestral es el parámetro estimado. Si se usa la media muestral x para estimar la media
poblacional μ, se sabe que la μx = μ, por lo tanto, la media es un estimador insesgado.
Eficiente o con varianza mínima. - Suponga que θ^ 11 y θ^ 2 son dos estimadores insesgados de θ. Entonces,
aun cuando la distribución de cada estimador esté centrada en el valor verdadero de θ, las dispersiones
de las distribuciones alrededor del valor verdadero pueden ser diferentes. Entre todos los estimadores de
θ que son insesgados, seleccione al que tenga varianza mínima. El θ^ resultante recibe el nombre de
estimador insesgado con varianza mínima de θ.
Coherencia. - Una estadística es un estimador coherente de un parámetro de población, si al aumentar el

tamaño de la muestra se tiene casi la certeza de que el valor de la estadística se aproxima bastante al
valor del parámetro de la población. Si un estimador es coherente se vuelve más confiable si tenemos
tamaños de muestras más grandes.
Suficiencia. - Un estimador es suficiente si utiliza una cantidad de la información contenida de la

muestra que ningún otro estimador podría extraer información adicional de la muestra sobre el
parámetro de la población que se está estimando. Es decir, se pretende que al extraer la muestra el
estadístico calculado contenga toda la información de esa muestra. Por ejemplo, cuando se calcula la
media de la muestra, se necesitan todos los datos. Cuando se calcula la mediana de una muestra sólo se
utiliza a un dato o a dos. Esto es solo el dato o los datos del centro son los que van a representar la
muestra. Con esto se deduce que, si utilizamos a todos los datos de la muestra, se tendrá un estimador
suficiente.
La inferencia estadística está casi siempre concentrada en obtener algún tipo de conclusión acerca de
uno o más parámetros (características poblacionales). Para hacerlo, se requiere que un investigador
obtenga datos muestrales de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden
estar basadas en los valores calculados de varias cantidades muestrales. Cuando se analizan conceptos
generales y métodos de inferencia es conveniente tener un símbolo genérico para el parámetro de
interés. Se utilizará la letra griega θ para este propósito. El objetivo de la estimación puntual es
seleccionar sólo un número, basados en datos de la muestra, que represente el valor más razonable de θ.
El símbolo θ^ (theta crestada) suele utilizarse para representar el estimador de θ y la estimación puntual
resultante de una muestra dada.
Intervalo de confianza para la media con varianza conocida
Con base a la distribución muestral de medias que se generó en el tema anterior, la fórmula para el
cálculo de probabilidad es la siguiente:
pág. 79
x −μ
Z=
σ
√n
Como en este caso no conocemos el parámetro y lo queremos estimar por medio de la media de la
muestra, sólo se despejará μ de la formula anterior, quedando lo siguiente:
( )
Z α ∗σ Z α ∗σ
2 2
P x− ≤ μ≤x+ =( 1−α ) %
√n √n
Si los intervalos son unilaterales, estos se dividen en unilateral derecho o inferior y α no se divide entre
2:
(
P x−
Z α∗σ
√n )
≤ μ =( 1−α ) %
(
P μ ≤ x+
Z α∗σ
√n )=( 1−α ) %
Cuando no se especifique que tipo de intervalo se pida, se entenderá que se pide el intervalo completo.
Ejemplo #67: Se encuentra que la concentración promedio de zinc que se saca del agua a partir de una
muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los
intervalos de confianza de 95% y 99% para la concentración media de zinc en el río. Suponga que la
desviación estándar de la población es 0.3.
Solución:
1) Establecemos Datos:
x = 2.6 n = 36 σ = 0.3 1-α = 95% 1-α = 99%
2) Identificamos Intervalo de Confianza:
( )
2 2
P x− ≤ μ≤x+ =( 1−α ) %
√n √n
3) Sustituimos Datos y Obtenemos Resultados:
pág. 80
( )
2 2
P x− ≤ μ≤x+ =( 1−α ) %
√ n √n
(
P 2.6−
1.96∗0.3
√ 36
≤ μ≤ 2.6+
1.96∗0.3
√36 )
=95 % → P ( 2.502≤ μ ≤2.698 )=95 %
( )
2 2
P x− ≤ μ≤x+ =( 1−α ) %
√n √n
(
P 2.6−
2.58∗0.3
√ 36
≤ μ≤ 2.6+
2.58∗0.3
√36 )
=99 % → P ( 2.471≤ μ ≤2.729 )=99 %
4) Emitimos Conclusión: “Con un nivel de confianza del 95% la concentración media de zinc en el río
estará entre 2.502 y 2.698 gramos y con el 99% estará entre 2.471 y 2.729 gramos”.
Comprobación en hoja de trabajo Microsoft Excel®:
Intervalo de Confianza Bilateral para la Media con σ2 conocida

P ( 2.50200 ≤ μ ≤ 2.69800 ) = 95%

P ( 2.47121 ≤ μ ≤ 2.72879 ) = 99%
Ejemplo #68: Una empresa eléctrica fabrica focos que tienen una duración aproximadamente distribuida
de forma normal con una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una duración
promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media de la población de
todos los focos que produce esta empresa.
Solución:
x = 780 n = 30 σ = 40 1-α = 96%
( )
2 2
P x− ≤ μ≤x+ =( 1−α ) %
√n √n
pág. 81
( )
2 2
P x− ≤ μ≤x+ =( 1−α ) %
√n √n
(
P 780−
2.05∗40
√ 30
≤ μ≤ 780+
2.05∗40
√30 )
=96 % → P ( 765.0289 ≤ μ ≤ 794.9710 )=96 %
4) Emitimos Conclusión: “Con un nivel de confianza del 96% la media de la población de todos los
focos que produce esta empresa estará entre 764.955 y 795.044 horas”.
pág. 82

P ( 765.00154 ≤ μ ≤ 794.99846 ) = 96%
Intervalo de confianza para la media con varianza desconocida
Si x y s son la media y la desviación estándar de una muestra aleatoria de una población normal con
varianza desconocida, un intervalo de confianza de (1-α)100% para μ es:
( )
t α ∗s t α ∗s
,v ,v
2 2
P x− ≤ μ ≤ x+ = (1−α ) %
√n √n
Si los intervalos son unilaterales, estos se dividen en unilateral derecho e izquierdo y α no se divide entre
2:
(
P x−
t α ,v ∗s
√n )
≤ μ =( 1−α ) %
(
P μ ≤ x+
t α ,v ∗s
√n )
=( 1−α ) %
Ejemplo #69: El contenido de siete contenedores similares de ácido sulfúrico son 9.8, 10.2, 10.4, 9.8,
10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los
contenedores si se supone una distribución aproximadamente normal.
Solución:
x = 10 n=7 s = 0.2828 1-α = 95%
2) Identificamos Intervalo de Confianza
( )
t α ∗s t α ∗s
,v ,v
2 2
P x− ≤ μ ≤ x+ = (1−α ) %
√n √n
pág. 83
( )
t α ∗s t α ∗s
,v ,v
2 2
P x− ≤ μ ≤ x+ = (1−α ) %
√n √n
(
P 10−
2.447∗0.2828
√7
≤ μ ≤ 10+
2.447∗0.2828
√7 )
=95 % → P ( 9.7384 ≤ μ ≤ 10.2615 )=95 %
4) Emitimos Conclusión: “Con un nivel de confianza del 95% la media de todos los contenedores de
ácido sulfúrico estará entre 9.7384 y 10.2615 litros”.
Intervalo de Confianza Bilateral para la Media con σ2 desconocida

P ( 9.73845 ≤ μ ≤ 10.26155 ) = 95%
Ejemplo#70: Un artículo publicado en el Journal of Testing and Evaluation presenta las siguientes 20
mediciones del tiempo de combustión residual en segundos de especímenes tratados de ropa de dormir
para niños: 9.85, 9.93, 9.75, 9.77, 9.67, 9.87, 9.67, 9.94, 9.85, 9.75, 9.83, 9.92, 9.74, 9.99, 9.88, 9.95,
9.95, 9.93, 9.92, 9.89. Se desea encontrar un nivel de confianza del 95% para el tiempo de combustión
residual promedio. Supóngase que el tiempo de combustión residual sigue una distribución normal.
Solución:
x = 9.8525 n = 20 s = 0.0964 1-α = 95%
( )
t α ∗s t α ∗s
,v ,v
2 2
P x− ≤ μ ≤ x+ = (1−α ) %
√n √n
( )
t α ∗s t α ∗s
,v ,v
2 2
P x− ≤ μ ≤ x+ = (1−α ) %
√n √n
(
P 9.8525−
2.093∗0.0964
√20
≤ μ ≤ 9.8525+
2.093∗0.0964
√20
=95 %
)
P ( 9.8073 ≤ μ ≤ 9.8976 )=95 %
4) Emitimos Conclusión: “Con un nivel de confianza del 95% el tiempo de combustión residual
promedio estará entre 9.8073 y 9.8976 segundos”.
pág. 84
Intervalo de Confianza Bilateral para la Media con σ2 desconocida

P ( 9.80738 ≤ μ ≤ 9.89762 ) = 95%
Intervalo de confianza para la diferencia de medias con varianzas iguales y conocidas
Si se tienen dos poblaciones con medias μ1 y μ2 y varianzas σ21 y σ22, respectivamente, un estimador
puntual de la diferencia entre μ1 y μ2 está dado por la estadística x 1−x 2. Por tanto, para obtener una
estimación puntual de μ1 – μ2, se seleccionan dos muestras aleatorias independientes, una de cada
población, de tamaño n1 y n2, se calcula la diferencia x 1−x 2, de las medias muestrales.
P¿
2:
P¿
P¿
Ejemplo #71: Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide
el rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y 75
con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen constantes. El
rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el promedio para el motor
B es 24 millas por galón. Encuentre un intervalo de confianza de 96% sobre la diferencia promedio real
para los motores A y B. Suponga que las desviaciones estándar poblacionales son 6 y 8 para los motores
A y B respectivamente.
Solución:
x 1 = 36 σ1 = 6 n1 = 50 1-α = 96%
x 2 = 24 σ2= 8 n2= 75
P¿
pág. 85
P¿
( √ √ )
2 2 2 2
6 8 6 8
P ( 36−24 )−2.06∗ + ≤ μ≤ ( 36−24 )+ 2.06∗ + =96 %
50 75 50 75
P ( 9.4160 ≤ μ ≤ 14.5839 )=96 %
4) Emitimos Conclusión: “Con un nivel de confianza del 96% la diferencia del rendimiento de gasolina
promedio estará entre 9.416 y 14.583 millas por galón”.
Intervalo de Confianza Bilateral para la Diferencia de Medias con σ 12 = σ22 y conocidas

P ( 9.42393 ≤ μ1 - μ 2 ≤ 14.57607 ) = 96%
Intervalo de confianza para la diferencia de medias con varianzas iguales y desconocidas
Si, x 1 y x 2, s21 y s22 son las medias y las varianzas de dos muestras aleatorias de tamaño n 1 y n2,
respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas
pero iguales, entonces un intervalo de confianza del 100(1-α) por ciento para la diferencia entre medias
es:
S p=
√
2 s 21∗( n1−1 ) + s22∗( n2−1 )
n1+ n2−2
P¿
2:
P¿
P¿
Ejemplo #72: Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en
cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el
mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque varias partes
de una estructura de cemento. Al tomar diez muestras de cemento estándar, se encontró que el peso
promedio de calcio es de 90 con una desviación estándar de 5; los resultados obtenidos con 15 muestras
de cemento contaminado con plomo fueron de 87 en promedio con una desviación estándar de 4.
pág. 86
Supóngase que el porcentaje de peso de calcio está distribuido de manera normal. Encuéntrese un
intervalo de confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Por otra
parte, supóngase que las dos poblaciones normales tienen la misma desviación estándar.
Solución:
x 1 = 90 s1 = 5 n1 = 10 1-α = 95%
x 2 = 87 s2= 4 n2= 15
S p=
√
2 s 21∗( n1−1 ) + s22∗( n2−1 )
n1+ n2−2
P¿
S p=
√
2 52∗(10−1 ) +4 2∗( 15−1 )
10+ 15−2
=4.4183
(
P ( 90−87 )−2.069∗4.4183∗
√ 1 1
+ ≤ ( μ1−μ2 ) ≤ ( 90−87 ) +2.069∗4.4183∗
10 15
P (−0.7319 ≤ ( μ1−μ2 ) ≤ 6.7319 ) =95 %
1 1
+
10 15
=95 %
√ )
4) Emitimos Conclusión: “Con un nivel de confianza del 95% la diferencia promedio de las medias está
entre -0.73202 y 6.73202 y como este intervalo incluye al cero no se puede determinar que haya una
diferencia entre estos dos cementos”
Intervalo de Confianza Bilateral para la Diferencia de Medias con σ 12 = σ22 y desconocidas

P ( -0.73140 ≤ μ1 - μ 2 ≤ 6.73140 ) = 95%
Intervalo de confianza para la diferencia de medias con varianzas diferentes y desconocidas
Consideremos ahora el problema de encontrar una estimación por intervalos de μ1-μ2 cuando no es
probable que las varianzas poblacionales desconocidas sean iguales. La estadística que se usa con más
frecuencia en este caso es:
pág. 87
P¿
que tiene aproximadamente una distribución t con v grados de libertad, donde:
( )
2 2 2
s1 s2
+
n1 n 2
v= −2
( ) ( )
2 2 2 2
s1 s2
n1 n2
+
n 1+1 n2 +1
Como v rara vez es número entero, lo redondeamos al número entero más cercano menor. Si los
intervalos son unilaterales, estos se dividen en unilateral derecho e izquierdo y α no se divide entre 2:
P¿
P¿
Ejemplo #73: El departamento de zoología de la Universidad de Virginia llevó a cabo un estudio para
estimar la diferencia en la cantidad de ortofósforo químico medido en dos estaciones diferentes del río
James. El ortofósforo se mide en miligramos por litro. Se reunieron 15 muestras de la estación 1 y se
obtuvo una media de 3.84 con una desviación estándar de 3.07 miligramos por litro, mientras que 12
muestras de la estación 2 tuvieron un contenido promedio de 1.49 con una desviación estándar 0.80
miligramos por litro. Encuentre un intervalo de confianza de 95% para la diferencia del contenido
promedio real de ortofósforo en estas dos estaciones, suponga que las observaciones vienen de
poblaciones normales con varianzas diferentes.
Solución:
x 1 = 3.84 s1 = 3.07 n1 = 15 1-α = 95%

x 2 = 1.49 s2= 0.8 n2= 12
pág. 88
( )
2 2 2
s1 s2
+
n1 n 2
v= −2
( ) ( )
2 2 2 2
s1 s2
n1 n2
+
n 1+1 n2 +1
P¿
( )
2 2 2
3.07 0.8
+
15 12
v= −2 ≈16.6659 ≈ 16
( ) ( )
2 2 2 2
3.07 0.8
15 12
+
15+1 12+1
( √ √ )
2 2 2 2
3.07 0.8 3.07 0.8
P ( 3.84−1.49 )−2.120∗ + ≤ ( μ 1−μ2 ) ≤ ( 3.84−1.49 ) −2.120∗ + =95 %
15 12 15 12
P ( 0.5996 ≤ ( μ1−μ2 ) ≤ 4.1003 ) =95 %
4) Emitimos Conclusión: “Con un nivel de confianza del 95% la diferencia del contenido promedio real
de ortofósforo en estas dos estaciones está entre 0.5996 y 4.1003 miligramos por litro”.
Intervalo de Confianza Bilateral para la Diferencia de Medias con σ 12 ≠ σ22 y desconocidas

P ( 0.59975 ≤ μ1 - μ 2 ≤ 4.10025 ) = 95%
Intervalo de confianza para una proporción
Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística

P=X/N, donde x representa el número de éxitos en n pruebas. Por tanto, la proporción de la muestra p
=x/n se utilizará como estimador puntual del parámetro P. Si no se espera que la proporción P
desconocida esté demasiado cerca de 0 o de 1, se puede establecer un intervalo de confianza para P al
considerar la distribución muestral de proporciones.
(
P P−Z α ⋅
2 √ P ⋅Q
n
≤ p ≤ P+ Z α ⋅
2
P ⋅Q
n
=(1−α )%
√ )
pág. 89
2:
(
P P−z α ⋅
√ P ⋅Q
n )
≤ p =( 1−α ) %
También está el unilateral izquierdo o superior y α no se divide entre 2:
(
P p ≤ P+ z α ⋅
√ )
P ⋅Q
n
=( 1−α ) %
Ejemplo #74: Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas

amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos
deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como
resultado 15 que fallan en una o más pruebas. Encuentre intervalo de confianza de 90% y 95% para la
proporción de los reproductores de CD’s de la población que no pasan todas las pruebas.
Solución:
P = 15/500 Q = 485/500 n = 500 1-α = 90% y 95%
(
P P−Z α ⋅
2 √ P ⋅Q
n
≤ p ≤ P+ Z α ⋅
2 √ )
P ⋅Q
n
=(1−α )%
(
P P−Z α ⋅
2 √ P ⋅Q
n
≤ p ≤ P+ Z α ⋅
2 √ )
P ⋅Q
n
=(1−α )%
( √ √ )
15 485 15 485
⋅ ⋅
15 500 500 15 500 500
P −1.645 ⋅ ≤ p≤ +1.645 ⋅ = 90 %
500 500 500 500
P ( 0.0174 ≤ p ≤ 0.0425 )=90 %
pág. 90
( √ √ )
15 485 15 485
⋅ ⋅
15 500 500 15 500 500
P −1.96 ⋅ ≤ p≤ +1.96 ⋅ =95 %
500 500 500 500
P ( 0.0150 ≤ p ≤ 0.0449 )=95 %
4) Emitimos Conclusión: “Con un nivel de confianza del 90% la proporción de reproductores que no
pasan las pruebas está entre 0.00174 y 0.0425 y con el 95% estará entre 0.0150 y 0.0449”.
Intervalo de Confianza Bilateral para la Proporción

P ( 0.01745 ≤ p ≤ 0.04255 ) = 90%
P ( 0.01505 ≤ p ≤ 0.04495 ) = 95%
Intervalo de confianza para la diferencia de proporciones
Para este caso en particular se utilizará la distribución muestral de diferencia de proporciones para la
estimación de las misma. Recordando la fórmula:
(P ¿ ¿ 1−P2 )
Z=( p ¿ ¿1−p 2)− ¿¿
√ P 1∗Q1 P2∗Q2
n1
+
n2
Despejando la diferencia de proporciones tenemos:
(
P ( P 1−P2 )−Z α ⋅
2 √ P1 ⋅Q1 P2 ⋅Q 2
n1
+
n2
≤ p1− p 2 ≤ ( P1−P2 ) + Z α ⋅
2 √
P1 ⋅Q1 P2 ⋅Q 2
n1
+
n2 )
=( 1−α ) %
Al igual que los otros intervalos, en este caso tenemos intervalos unilaterales inferior y superior en los
cuáles α no se divide entre 2:
(
P ( P 1−P2 )−Z α ⋅
√ P 1 ⋅Q1 P2 ⋅ Q2
n1
+
n2 )
≤ p1 −p 2 = (1−α ) %
(
P p1− p 2 ≤ ( P1−P2 ) + Z α ⋅
√ P 1 ⋅Q1 P2 ⋅Q2
n1
+
n2 )
=( 1−α ) %
Ejemplo #76: Se considera cierto cambio en un proceso de fabricación de partes componentes. Se toman
muestras del procedimiento existente y del nuevo para determinar si éste tiene como resultado una
mejoría. Si se encuentra que 75 de 1,500 artículos del procedimiento actual son defectuosos y 80 de
pág. 91
2,000 artículos del procedimiento nuevo también lo son, encuentre un intervalo de confianza de 90%
para la diferencia real en la fracción de defectuosos entre el proceso actual y el nuevo.
Solución:
P1 = 75/1,500 Q1 = 1,425/1,500 n1 = 1,500 1-α = 90%

P2 = 80/2,000 Q2 = 1,920/2,000 n2= 2,000
(
P ( P 1−P2 )−Z α ⋅
2 √ P1 ⋅Q1 P2 ⋅Q 2
n1
+
n2 2√
≤ p1− p 2 ≤ ( P1−P2 ) + Z α ⋅
P1 ⋅Q1 P2 ⋅Q 2
n1
+
n2 )
=( 1−α ) %
(
P ( P 1−P2 )−Z α ⋅
2 √ P1 ⋅Q1 P2 ⋅Q 2
n1
+
n2 2√
≤ p1− p 2 ≤ ( P1−P2 ) + Z α ⋅
P1 ⋅Q1 P2 ⋅Q 2
n1
+
n2 )
=( 1−α ) %
(( √ √
75 1,425 80 1,920 75 1,425 80
⋅ ⋅ ⋅
P
75
−
80
1,500 2,000 )
−1.645 ⋅
1,500 1,500 2,000 2,000
1,500
+
2,000
≤ p1− p 2 ≤
75
−
80
1,500 2,000
+1.645 ⋅( 1,500
+ )
1,500 1,500 2,00
P (−0.0017 ≤ p 1− p2 ≤0.0217 )=90 %
4) Emitimos Conclusión: “Con un nivel de confianza del 90% la diferencia real en la fracción de
defectuosos entre el proceso actual y el nuevo está entre -0.0017 y 0.0217 y como este intervalo incluye
al cero no existe razón para creer que los dos procesos sean diferentes”.
Intervalo de Confianza Bilateral para la Diferencia de Proporciones

P ( -0.00173 ≤ p1 - p2 ≤ 0.02173 ) = 90%
Intervalo de confianza para la varianza
Si X1, X2, Xn es una muestra aleatoria de tamaño n tomada de una población normal, y si s² es la
varianza muestral, entonces s² es un estimador puntual razonable de la varianza poblacional σ². Por otra
pág. 92
parte, si la población es normal, la distribución muestral de la siguiente variable es una distribución ji-
cuadrado con n-1 grados de libertad.
2 ( n−1 ) ⋅ s 2
χ n−1 =
σ2
Por lo tanto, para obtener un intervalo de confianza del 100 (1-α) % para la varianza σ² nos basamos en
el estadístico s² y en la distribución chi cuadrado. Por lo tanto, tenemos la siguiente probabilidad:
( )
( n−1 ) ⋅ s 2 2 ( n−1 ) ⋅s 2
P 2
≤σ ≤ 2 = (1−α ) %
χα χ α
, n−1 1− ,n −1
2 2
2:
P
(
( n−1 ) ⋅ s 2 2
χ 2α , n−1
≤σ = ( 1−α ) %
)
(
( n−1 ) ⋅ s2
P σ ≤ 2 2
χ 1−α , n−1
= ( 1−α ) %
)
Ejemplo #77: Un proceso produce cierta clase de cojinetes de bola cuyo diámetro interior es de 3 cm. Se
seleccionan en forma aleatoria 12 de estos cojinetes y se miden sus diámetros interiores, y los valores
resultantes son los siguientes: 3.01, 3.05, 2.99, 2.99, 3.02, 3.00, 2.98, 2.99, 2.97, 2.97, 3.02 y 3.01.
Suponiendo que el diámetro es una variable aleatoria normal, determine un intervalo de confianza para
la varianza poblacional. Use un intervalo de confianza del 99%.
Solución:
s2 = 0.0005454 n = 12 1-α = 99%
pág. 93
( )
( n−1 ) ⋅ s 2 2 ( n−1 ) ⋅s 2
P 2
≤σ ≤ 2 = (1−α ) %
χα χ α
, n−1 1− ,n −1
2 2
( )
( n−1 ) ⋅ s 2 2 ( n−1 ) ⋅s 2
P 2
≤σ ≤ 2 = (1−α ) %
χα χ α
, n−1 1− ,n −1
2 2
P ( ( 12−1)26.757
⋅ ( 0.0005454 )
≤σ ≤
( 12−1 ) ⋅ ( 0.0005454 )
2.603
2
)=99 %
P ( 0.000224 ≤ σ 2 ≤ 0.002304 ) =99 %
4) Emitimos Conclusión: “Con un nivel de confianza del 99% la varianza poblacional del diámetro de
los cojinetes estará entre 0.000224 y 0.002304 centímetros”.
Intervalo de Confianza Bilateral para la Varianza σ2

P ( 0.00022 ≤ σ2 ≤ 0.00230 ) = 99%
Intervalo de confianza para el cociente de varianzas
Supóngase que se tienen dos poblaciones normales e independientes con varianzas desconocidas σ21 y
σ22, respectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de
tamaños n1 y n2, respectivamente, sean s21 y s22 las dos varianzas muestrales. Se desea conocer un
intervalo de confianza del 100(1-α) por ciento para el cociente de las dos varianzas, σ21 / σ22.
1
f α =
1− , n2−1 ,n1−1
2
fα
,n1−1 , n2−1
2
( )
2 2 2
s1 σ1 s1
P 2
⋅f α ≤ 2
≤ 2
⋅f α =( 1−α ) %
s2 1− ,n2−1 ,n1−1
2 σ2 s2 2
, n2 −1 , n1−1
2:
pág. 94
( )
2 2
s1 σ1
P 2
⋅ f 1−α ,n −1 ,n −1 ≤ =( 1−α ) %
s2 2 1
σ 22
( )
2 2
σ1 s1
P ≤ ⋅ f α ,n −1 ,n −1 =( 1−α ) %
σ 22 s 22 2 1
1
f 1−α, n −1 ,n −1=
2 1
f α , n −1 , n −1
1 2
Ejemplo #78: Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de
motores respecto al tiempo en minutos. El método 1 con 31 muestras obtuvo una varianza muestral de
50 minutos y el método 2 con 25 muestras obtuvo una varianza muestral de 24 minutos. Construya un
intervalo de confianza del 90% para el cociente de las varianzas.
Solución:
s21 = 50 s22 = 24 n1 = 31 n2 =25 1-α = 90%
( )
2 2 2
s1 σ1 s1
P ⋅f α ≤ ≤ ⋅f α =( 1−α ) %
s 22 1− ,n2−1 ,n1−1
2 σ 22 s 22 2
, n2 −1 , n1−1
( )
2
50 σ 1 50
P ⋅0.5157 ≤ 2 ≤ ⋅1.887 =90 %
24 σ 2 24
( )
2
σ1
P 1.0743 ≤ ≤ 3.931 =90 %
σ 22
4) Emitimos Conclusión: “Con un nivel de confianza del 90% el cociente de las varianzas poblacionales
se encuentra entre 1.0743 y 3.931 minutos”.

pág. 95
Intervalo de Confianza Bilateral para el Cociente de Varianzas σ 12 / σ22

P ( 1.07446 ≤ σ12 / σ22 ≤ 3.93200 ) = 90%
3.6 Pruebas de hipótesis
Muchos problemas de ingeniería, ciencia, y administración, requieren que se tome una decisión entre
aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre de
hipótesis. Este es uno de los aspectos más útiles de la inferencia estadística, puesto que muchos tipos de
problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniería, pueden
formularse como problemas de prueba de hipótesis.
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más poblaciones.
La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de poblaciones
que al inicio se supone cierta (es decir, la “creencia a priori”).
La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta es la hipótesis
del investigador. La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia
muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se continúa creyendo
en la validez de la hipótesis nula.
Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar Ho o no
rechazar Ho. Para probar si la hipótesis nula es cierta, se toma una muestra aleatoria y se calcula la
información, como el promedio, la proporción, etc. Esta información muestral se llama estadística de
prueba. Estadística de Prueba: Una estadística de prueba se basa en la información de la muestra como la
media o la proporción.
Tipos de errores en las hipótesis
El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera. También es
conocido como α o nivel de significancia. Si tuviéramos un nivel de confianza del 95% entonces el nivel
de significancia sería del 5%. Análogamente si se tiene un nivel de confianza del 90% entonces el nivel
de significancia sería del 10%. El error tipo II o error β se define como la aceptación de la hipótesis nula
cuando ésta es falsa.
Decisión H0 es verdadera H0 es falsa

Aceptar H0 No hay error Error tipo II o β
Rechazar H0 Error tipo I o α No hay error
Se puede seguir seis pasos básicos para configurar y realizar correctamente una prueba de hipótesis. Por
ejemplo, el gerente de una fábrica de tuberías desea determinar si el diámetro promedio de los tubos es
diferente de 5 cm. El gerente sigue los pasos básicos para realizar una prueba de hipótesis.
pág. 96
1) Especificar las hipótesis. En primer lugar, el gerente formula las hipótesis. La hipótesis nula es: la
media de la población de todos los tubos es igual a 5 cm. Formalmente, esto se escribe como: H0: μ = 5
Luego, el gerente elige entre las siguientes hipótesis alternativas:
Condición que se probará Hipótesis alternativa

La media de la población es menor que el objetivo Unilateral, µ<5
La media de la población es mayor que el objetivo Unilateral, µ>5
La media de la población es diferente que el objetivo Unilateral, µ≠5
Como tiene que asegurarse de que los tubos no sean más grandes ni más pequeños de 5 cm, el gerente
elige la hipótesis alternativa bilateral, que indica que la media de la población de todos los tubos no es
igual a 5 cm. Formalmente, esto se escribe como H1: μ ≠ 5.
2)Elegir un nivel de significancia (también denominado alfa o α). El gerente selecciona un nivel de
significancia de 0.05, que es el nivel de significancia más utilizado.
3) Determinar la potencia y el tamaño de la muestra para la prueba. El gerente utiliza un cálculo de

potencia y tamaño de la muestra para determinar cuántos tubos tiene que medir para tener una buena
probabilidad de detectar una diferencia de 0.1 cm o más con respecto al diámetro objetivo.
4) Recolectar los datos. Recoge una muestra de tubos y mide los diámetros.
5) Comparar el valor p de la prueba con el nivel de significancia. Después de realizar la prueba de

hipótesis, el gerente obtiene un valor p de 0.004. El valor p es menor que el nivel de significancia de
0.05.
6)Decidir si rechazar o no rechazar la hipótesis nula. El gerente rechaza la hipótesis nula y concluye que
el diámetro medio de todos los tubos no es igual a 5 cm.
Consideraciones:
H0: μ=X
H1:μ≠X
pág. 97
Zonas de Aceptación y de Rechazo
Aceptación de Ho
Rechazo de Ho Rechazo de Ho
α/2 X α/2
Consideraciones:
H0: μ≤X
H1:μ>X
Zonas de Aceptación y Rechazo
Aceptación de Ho
Rechazo de Ho
X α
Consideraciones:
H0: μ≥X
H1:μ<X
pág. 98
Aceptación de Ho
Rechazo de Ho
α X
pág. 99
Prueba de Hipótesis sobre una media con varianza conocida
Ejemplo #79: Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado
muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años,
¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice un nivel de
significancia de 0.05.
Solución:
a) Identificar datos:
x =71.8 μ=70 σ =8.9 n=100 α =0.05
b) Establecer hipótesis:
Ho: μ ≤ 70 años
H 1: μ> 70 años
c) Establecer Estadístico de Prueba

x −μ
Z=
σ
√n
2
d) Establecer Zonas de Aceptación y Rechazo:
Aceptación de Ho
Rechazo de Ho
-∞ 1.645
e) Sustituir Valores en Estadístico de Pruebas:
pág. 100
71.8−70
Z= =2.02247
8.9
√2 100
f) Verificar el Valor Obtenido contra los Criterios de Aceptación y Rechazo: Dado que Z>1.645 el valor
de 2.02247 cae en la zona de rechazo de Ho
g) Emitir conclusión: “Con un 5% de significancia se puede decir que existe suficiente evidencia
estadística para determinar que el promedio de vida excede los 70 años en Estados Unidos”.
Prueba de Hipótesis para la Media con σ2 conocida
H0: μ≥ 70 H0: μ≤ 70 H0: μ= 70

H1: μ< 70 H1: μ> 70 H1: μ≠ 70
Z calculada = 2.02 Z calculada = 2.02 Z calculada = 2.02

Z tablas = -1.645 Z tablas = 1.645 Z tablas = -1.960 y 1.960
S N
Se Acepta Ho Se Rechaza Ho Se Rechaza Ho
Prueba de Hipótesis sobre una media con varianza desconocida
Ejemplo #80: El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-hora que gastan
varios aparatos electrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-hora
al año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las
aspiradoras gastan un promedio de 42 kilowatt-hora al año con una desviación estándar de 11.9 kilowatt-
hora. ¿Esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos
de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es normal.
Solución:
x =42 μ=46 s=11.9 n=12 α =0.05
pág. 101
Ho: μ ≥ 46 kilowatt-hora
H 1: μ< 46 kilowatt-hora

x−μ
t=
s
√n
2
T, df=11
0.05
-1.796 0
X
42−46
t= =−1.1644
11.9
√2 12
f) Verificar el Valor Obtenido contra los Criterios de Aceptación y Rechazo: Dado que t>-1.796 el valor
de −1.1644 cae en la zona de aceptación de Ho.
estadística para determinar que el promedio de consumo de las aspiradoras es mayor o igual a 46
kilowatt-hora anualmente”.
Prueba de Hipótesis para la Media con σ2 desconocida
pág. 102
H0: μ≥ 46 H0: μ≤ 46 H0: μ= 46

H1: μ< 46 H1: μ> 46 H1: μ≠ 46
t calculada = -1.16 t calculada = -1.16 t calculada = -1.16

t tablas = -1.796 t tablas = 1.796 t tablas = -2.201 y 2.201
S S
Se Acepta Ho Se Acepta Ho Se Acepta Ho
Prueba de Hipótesis sobre dos medias con varianzas iguales y conocidas
Ejemplo #81: Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16.0
onzas. Las distribuciones de los volúmenes de llenado pueden suponerse normales, con desviaciones
estándar σ1= 0.020 y σ2 = 0.025 onzas.
Máquina #1 Máquina #2
16.03 16.01 16.02 16.03
16.04 15.96 15.97 16.04
16.05 15.98 15.96 16.02
16.05 16.02 16.01 16.01
16.02 15.99 15.99 16.00
Un miembro del grupo de ingeniería de calidad sospecha que el volumen neto de llenado de ambas
máquinas es el mismo, sin importar si éste es o no de 16 onzas. De cada máquina se toma una muestra
aleatoria de 10 botellas. ¿Se encuentra el ingeniero en lo correcto? Utilice α = 0.05
Solución
x 1=16.015 μ1=? σ 1=0.02 n1=10 α =0.05

x 2=16.005 μ2=? σ 2=0.025 n2 =10
Ho: μ 1=μ2
H 1: μ 1 ≠ μ 2
c) Establecer Estadístico de Prueba:
pág. 103
( x 1−x 2 )−(μ1−μ 2)
Z=
√
2 2
2 σ1 σ 2
+¿ ¿
n1 n2
Normal, Media=0, Desv.Est.=1
0.025 0.025
-1.960 0 1.960
X
(16.015−16.005 )−(0)
Z= =0.98773
√
2 0.022 0.0252
10
+
10
f) Verificar el Valor Obtenido contra los Criterios de Aceptación y Rechazo: Dado que -1.96<Z<1.96 el
valor de 0.98773 cae en la zona de aceptación de Ho.
estadística para determinar que el promedio de contenido de las botellas es el mismo”.
Prueba de Hipótesis para la Diferencia de Medias con σ12 = σ22 y conocidas
H0: μ1 ≥ μ2 H0: μ1 ≤ μ2 H0: μ1 = μ2

H1: μ1 < μ2 H1: μ1 > μ2 H1: μ1 ≠ μ2
pág. 104

S S
Prueba de Hipótesis sobre dos medias con varianzas iguales y desconocidas
Ejemplo #82: Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo
humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada
medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se
eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que
tardó en alcanzar un nivel específico en la sangre. Calcule con α = 0.05 si existe diferencia entre los
tiempos promedio (minutos). Suponga varianzas iguales, toda vez que la media muestral del fármaco A
fue de 26.8 con una varianza de 15.57 y con muestra de 12 y del fármaco B, la media muestral fue de
32.6 con una varianza de 17.54 y con muestra de 12 también.
Solución:
x 1=26.8 μ1=? 2
s1=15.57 n1=12 α =0.05
x 2=32.6 μ2=? 2
s2=17.54 n2 =12
Ho: μ 1=μ2
H 1: μ 1 ≠ μ 2
( x 1−x 2 )−(μ1−μ2 )
t=
√ √
2 2
2 s1∗( n1−1 ) + s 2∗( n2−1 ) 2 1 1
∗ +
n1+ n2−2 n1 n2
pág. 105
T, df=22
0.025 0.025
-2.074 0 2.074
X
( 26.8−32.6 ) −(0)
t= =−3.49172
√
2 15.57∗( 12−1 ) +17.54∗( 12−1 ) 2 1 1
12+12−2
∗ +
12 12 √
f) Verificar el Valor Obtenido contra los Criterios de Aceptación y Rechazo: Dado que -2.074<t<2.074,
el valor de −3.49172 cae en la zona de rechazo de Ho.
estadística para determinar que el tiempo de efectividad para ser absorbido entre ambos medicamentos
es diferente”.
Prueba de Hipótesis para la Diferencia de Medias con σ12 = σ22 y desconocidas
H0: μ1 ≥ μ2 H0: μ1 ≤ μ2 H0: μ1 = μ2

H1: μ1 < μ2 H1: μ1 > μ2 H1: μ1 ≠ μ2

N S
Se Rechaza Ho Se Acepta Ho Se Rechaza Ho
pág. 106
Prueba de Hipótesis sobre dos medias con varianzas diferentes y desconocidas
Ejemplo #83: Dos proveedores fabrican un engrane de plástico utilizado en una impresora láser. Una
característica importante de estos engranes es la resistencia al impacto la cual se mide en pies-libras.
Una muestra aleatoria de 10 engranes suministrados por el primer proveedor arroja los siguientes
resultados: x 1=290 y s1 = 12. Del segundo proveedor se toma una muestra aleatoria de 16 engranes,
donde los resultados son x 2=321 y s2 = 45. ¿Existe evidencia que apoye la afirmación de que los
engranes del proveedor 2 tienen una mayor resistencia promedio al impacto? Use un nivel de
significancia de 0.05.
Solución:
x 1=290 μ1=? s1=12 n1=10 α =0.05

x 2=321 μ2=? s2=45 n2 =16
Ho: μ1 ≥ μ 2
H 1: μ 1< μ 2
( )
2 2 2
s1 s2
+
n1 n 2
v= −2
( ) ( )
2 2 2 2
s1 s2
n1 n2
+
n 1+1 n2 +1
( x 1−x 2 ) −(μ1 −μ 2)
t=
√
2 2
2 s 1 s2 1
+
n1 n 2
pág. 107
T, df=18
0.05
-1.734 0
X
( )
2 2 2
12 45
+
10 16
v= −2 ≅ 18
( ) ( )
2 2 2 2
12 45
10 16
+
10+ 1 16+1
( 290−321 ) −(0)
t= =−2.61
√2 12 2 452
+
10 16
f) Verificar el Valor Obtenido contra los Criterios de Aceptación y Rechazo: Dado que t>-1.734, el valor
de −2.61 cae en la zona de rechazo de Ho.
g) Emitir conclusión: “Con un 5% de significancia se puede decir que la afirmación de que los engranes
del proveedor 2 no tienen una mayor resistencia promedio al impacto”.
Prueba de Hipótesis para la Diferencia de Medias con σ12 ≠ σ22 y desconocidas
H0: μ1 ≥ μ2 H0: μ1 ≤ μ2 H0: μ1 = μ2

H1: μ1 < μ2 H1: μ1 > μ2 H1: μ1 ≠ μ2
pág. 108

N S
Se Rechaza Ho Se Acepta Ho Se Rechaza Ho
Prueba de Hipótesis sobre una sola proporción
Ejemplo #83: Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se
construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación si una
investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas bombas de calor?
Utilice un nivel de significancia de 0.10.
Solución:
x=8 po =0.7 α =0.05 n=15
Ho: p o=0.7 hogares

H 1: p o ≠ 0.7 hogares
x−n∗p o
Z= 2
√n∗po∗(1−p o )
pág. 109
0.025 0.025
-1.960 0 1.960
X
8−15∗0.70
Z= 2 =−1.40859
√15∗0.70∗0.30
valor de −1.40859 cae en la zona de aceptación de Ho.
estadística para determinar el 70% de las casas tienen bombas de calor instaladas”.
Prueba de Hipótesis para la Proporción
H0: p≥ 0.7 H0: p≤ 0.7 H0: p= 0.7

H1: p< 0.7 H1: p> 0.7 H1: p≠ 0.7
Z calculada = -1.41 Z calculada = -1.41 Z calculada = -1.41

S S
pág. 110
Prueba de Hipótesis sobre dos proporciones
Ejemplo #84: Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una
operación de pulido en la fabricación de lentes intraoculares utilizados en el ojo humano después de una
cirugía de cataratas. Se pulen 300 lentes con la primera solución y, de éstos, 253 no presentaron defectos
inducidos por el pulido. Después se pulen otros 300 lentes con la segunda solución, de los cuales 196
resultan satisfactorios. ¿Existe alguna razón para creer que las dos soluciones para pulir son diferentes?
Utilice α = 0.01.
Solución:
x 1=253 p1=253 /300 n1=300 α =0.01

x 2=196 p2=49/75 n2 =300
Ho: p 1=p 2
H 1: p1 ≠ p 2
x 1+ x2 ( p1 − p2 )
^p= Z=
√
n1 + n2 2
(
^p∗( 1− ^p )∗ 1 + 1
n 1 n2 )
pág. 111
0.005 0.005
-2.576 0 2.576
X
^p=
253+196 449
= Z=
( 253
=5.36215
− )
49
300 75
√
300+300 600 449
2 ∗151
600
600
∗
1
+
1
300 300 ( )
valor de 5.36215 cae en la zona de rechazo de Ho.
estadística para determinar que las 2 soluciones para pulir son diferentes”.
Prueba de Hipótesis para la Diferencia de Proporciones
H0: p1 ≥ p2 H0: p1 ≤ p2 H0: p1 = p2

H1: p1 < p2 H1: p1 > p2 H1: p1 ≠ p2

S N
pág. 112
Prueba de Hipótesis sobre datos pareados
Ejemplo #85: Se hizo un estudio para definirse si los ejercicios aeróbicos reducen el ritmo cardiaco de
una persona durante el descanso, y al examinar a diez voluntarios antes y después de seguir un programa
de ese tipo durante seis meses, sus pulsaciones, en latidos por minuto, dieron los siguientes registros:
Voluntario 1 2 3 4 5 6 7 8 9 10
Ejercicio 73 77 68 62 72 80 76 64 70 72
Reposo 68 72 64 60 71 77 74 60 64 68
Use α = 0.05 para calcular si los ejercicios aeróbicos reducen el ritmo cardiaco durante el reposo.
Solución:
Primero se procederá a calcular las diferencias de cada par:
Voluntario 1 2 3 4 5 6 7 8 9 10
Ejercicio 73 77 68 62 72 80 76 64 70 72
Reposo 68 72 64 60 71 77 74 60 64 68
Diferencia 5 5 4 2 1 3 2 4 6 4
sd =1.57762 d=3.6 n=10 α =0.05
Ho: μ1 ≤ μ 2
H 1: μ 1> μ 2
d
t=
sd
2
√n
pág. 113
T, df=9
0.05
0 1.833
X
3.6
t= =7.21606
1.57762
√2 10
f) Verificar el Valor Obtenido contra los Criterios de Aceptación y Rechazo: Dado que t>1.833 el valor
de 7.21606 cae en la zona de rechazo de Ho.
estadística para determinar que los ejercicios aeróbicos si reducen el ritmo cardiaco durante el reposo”.
Prueba de Hipótesis para Observaciones Pareadas
H0: μD ≥ 0 H0: μD ≤ 0 H0: μD = 0

H1: μD < 0 H1: μD > 0 H1: μD ≠ 0
t calculada = 7.251 t calculada = 7.251 t calculada = 7.251

S N
pág. 114
Prueba de hipótesis para la varianza
Ejemplo #86: Una compañía que produce una parte maquinada para un motor, afirma que tiene una
varianza de diámetro no mayor a 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes dio una
varianza de muestra s2 = 0.0003. Si se supone que las medidas del diámetro se distribuyen en forma
normal, ¿hay evidencia para refutar lo que afirma el proveedor? Use α = 0.05.
Solución:
a) Identificar Datos:
s2 = 0.0003 σ2 = 0.0002 α = 0.05 n = 10
b) Establecer Hipótesis:
H0: σ2 ≤ 0.0002
H1: σ2 > 0.0002
( n−1 )∗s 2
2=
σ2
Chi-cuadrada, df=9
0.05
0 16.92
X
pág. 115
( 10−1 )∗0.0003
2= =13.5
0.0002
f) Verificar el Valor Obtenido contra los Criterios de Aceptación y Rechazo: Dado que 2<16.92 el valor
de 13.5 cae en la zona de aceptación de Ho.
estadística para determinar que el proveedor cumple con lo que dice respecto a su producto”.
Prueba de Hipótesis para la Varianza σ2
H0: σ2 ≥ 0.0002 H0: σ2 ≤ 0.0002 H0: σ2 = 0.0002

H1: σ2 < 0.0002 H1: σ2 > 0.0002 H1: σ2 ≠ 0.0002
χ2calculada = 13.5 χ2calculada = 13.5 χ2calculada = 13.5

χ2 tablas = 3.325113 χ2 tablas = 16.919 χ2 tablas = 2.700 y 19.023
S S
Prueba de hipótesis para la relación de varianzas
Ejemplo #87: La variabilidad en la cantidad de impurezas presentes en un lote de productos químicos,

utilizada para un proceso en particular, depende del tiempo que tarda el proceso. Un fabricante que
emplea dos líneas de producción 1 y 2, hizo un pequeño ajuste al proceso 2, con la esperanza de reducir
la variabilidad, así como la cantidad media de impurezas en los productos químicos. Muestras de n 1=25
y n2=20 mediciones de dos lotes produjeron las siguientes medias y varianzas:
2 2
x 1=3.2 , s 1=1.04 , x 2 =3.0 , s 2=0.51. ¿Presentan los datos evidencia suficiente para indicar que las
variaciones del proceso son menores para el 2? Realice una prueba con un α = 0.05.
Solución:
a) Identificar Datos:
x 1 = 3.2 s12 = 1.04 n1 = 25 α = 0.05
pág. 116
x 2 = 3.0 s22 = 0.51 n2 = 20
b) Establecer Hipótesis
H0: σ12 = σ22

H1: σ12 > σ22
2
s1
F= 2
s2
F, df1=24, df2=19
0.05
0 2.114
X
1.04
F= =2.0392
0.51
f) Verificar el Valor Obtenido contra los Criterios de Aceptación y Rechazo: Dado que F <2.114 el valor
de 2.0392 cae en la zona de aceptación de Ho.
estadística para determinar que las variaciones del proceso son menores para el 2”.
pág. 117

Prueba de Hipótesis para el Cociente de Varianzas σ12 / σ22
H0: σ12 ≥ σ22 H0: σ12 ≤ σ22 H0: σ12 = σ22

H1: σ12 < σ22 H1: σ12 > σ22 H1: σ12 ≠ σ22
f calculada = 2.039 f calculada = 2.039 f calculada = 2.039

f tablas = 0.473 f tablas = 2.114 f tablas = 0.408 y 2.452
S S
pág. 118
4. Análisis estadístico
Conceptos
Este tipo de diseño de experimento se considera un sólo factor de interés y el objetivo es comparar más
de dos tratamientos, con el fin de elegir la mejor alternativa entre las varias que existen, o por lo menos
para tener una mejor comprensión del comportamiento de la variable de interés en cada uno de los
distintos tratamientos. Se presentan los diseños experimentales que se utilizan cuando el objetivo es
comparar más de dos tratamientos. Puede ser de interés comparar tres o más máquinas, varios
proveedores, cuatro procesos, tres materiales, cinco dosis de un fármaco, etc.
Al hacer tales comparaciones, existe un interés y un objetivo claro. Por ejemplo, una comparación de
cuatro dietas de alimentación en la que se utilizan ratas de laboratorio, se hace con el fin de estudiar si
alguna dieta que se propone es mejor o igual que las que ya existentes; en este caso, la variable de
interés es el peso promedio alcanzado por cada grupo de animales después de ser alimentado con la dieta
que le toco.
Generalmente, el interés del experimentador está centrado en comparar los tratamientos en cuanto a sus
medias poblacionales, sin olvidar que también es importante compararlos con respecto a sus varianzas.
Así, desde el punto de vista estadístico, la hipótesis fundamental a probar cuando se comparan varios
tratamientos es:
H 0 : μ1=μ2=…=μn
H 1 : μ i ≠ μ j para algún i ≠ j
De este modo, decidir si los tratamientos son iguales estadísticamente en cuanto a sus medias, frente a la
alternativa de que al menos dos de ellos son diferentes. La estrategia natural para resolver este problema
es obtener una muestra representativa de mediciones en cada uno de los tratamientos, y construir un
estadístico de prueba para decidir el resultado de dicha comparación. Se podría pensar que una forma de
probar la hipótesis nula de la expresión anterior, es mediante la prueba t de Student, aplicadas a todos los
posibles pares de medias; sin embargo, esta manera de proceder incrementaría de manera considerable el
error tipo I o α.
Como algún caso práctico, suponga que, al comparar varias máquinas, si cada máquina es manejada por
un operador diferente y se sabe que éste tiene una influencia en el resultado, entonces, es claro que el
factor operador debe tomarse en cuenta si se quiere comparar a las máquinas de manera justa. Un
operador más hábil puede ver a su máquina (aunque ésta sea la peor) como la que tiene el mejor
desempeño, lo que impide una comparación adecuada de los equipos. Para evitar este sesgo habría dos
maneras de anular el posible efecto del factor operador:
 Utilizando el mismo operador en las cuatro máquinas. Esta estrategia no es aconsejable, ya que,
al utilizar el mismo operador, se elimina el efecto del factor operador, pero restringe la validez de
pág. 119
la comparación a dicho operador, y es posible que el resultado no se mantenga al utilizar otros

operadores.
 Cada operador trabaje durante el experimento con cada una de las máquinas, esta estrategia es
más recomendable, ya que al utilizar todos los operadores con todas las máquinas permite tener
resultados de la comparación que son válidos para todos los operadores. Esta última de manera
nulificar el efecto de operadores, recibe el nombre de Bloqueo.
Factores de bloqueo
Son factores adicionales al factor de interés que se incorporan de manera explícita en un experimento
comparativo, para estudiar de manera más adecuada y eficaz al factor de interés.
Observación. Cuando se comparan varias máquinas, manejadas por operadores diferentes, es pertinente
incluir explícitamente al factor operadores (bloques) para lograr el propósito del estudio. También se
podrían controlar el tipo de material, lotes, tipo de producto, día, turno, etc. Se controlan factores que,
por conocimiento del proceso o experiencia previa, se sabe que pueden afectar en forma sensible el
resultado de la comparación.
En el campo de la industria es frecuente hacer experimentos o pruebas con la intención de resolver un

problema o comprobar una idea (conjetura, hipótesis); por ejemplo, hacer algunos cambios en los
materiales, métodos o condiciones de operación de un proceso, probar varias temperaturas en una
máquina hasta encontrar la que dé el mejor resultado o crear un nuevo material con la intención de
lograr mejoras o eliminar algún problema.
Sin embargo, es común que estas pruebas o experimentos se hagan sobre la marcha, con base en el
ensayo y error, apelando a la experiencia y a la intuición, en lugar de seguir un plan experimental
adecuado que garantice una buena respuesta a las interrogantes planteadas. Algo similar ocurre con el
análisis de los datos experimentales, donde más que hacer un análisis riguroso de toda la información
obtenida y tomar en cuenta la variación, se realiza un análisis informal, ¨intuitivo¨ Es tal el poder de la
experimentación que, en ocasiones, se logra mejoras a pesar de que el experimento se hizo con base en
el ensayo y error. Sin embargo, en situaciones de cierta complejidad no es suficiente aplicar este tipo de
experimentación, por lo que es mejor proceder siempre en una forma eficaz que garantice la obtención
de las respuestas a las interrogantes planteadas en un lapso corto de tiempo y utilizando pocos recursos.
El diseño estadístico de experimentos es precisamente la forma más eficaz de hacer pruebas. El diseño
de experimentos consiste en determinar cuáles pruebas se deben realizar y de qué manera, para obtener
datos que, al ser analizados estadísticamente, proporcionen evidencias objetivas que permitan responder
las interrogantes planteadas, y de esa manera clarificar los aspectos inciertos de un proceso, resolver un
problema o lograr mejoras. Algunos problemas típicos que pueden resolverse con el diseño y el análisis
de experimentos son los siguientes:
1. Comparar a dos o más materiales con el fin de elegir al que mejor cumple los requerimientos.
pág. 120
2. Comparar varios instrumentos de medición para verificar si trabajan con la misma precisión y
exactitud.
3. Determinar los factores (las x vitales) de un proceso que tienen impacto sobre una o más
características del producto final.
4. Encontrar las condiciones de operación (temperatura, velocidad, humedad, por ejemplo) donde
se reduzcan los defectos o se logre un mejor desempeño del proceso.
5. Reducir el tiempo de ciclo del proceso.
6. Hacer el proceso insensible o robusto a oscilaciones de variables ambientales.
7. Apoyar el diseño o rediseño de nuevos productos o procesos
8. Ayudar a conocer y caracterizar nuevos materiales.
En general, cuando se requiere mejorar un proceso existen dos maneras básicas de obtener la
información necesaria para ello:
 Observar o monitorear vía herramientas estadísticas, hasta obtener señales útiles que permitan
mejorarlo; se dice que ésta es una estrategia pasiva.
 La otra manera consiste en experimentar, es decir, hacer cambios estratégicos y deliberados al
proceso para provocar dichas señales útiles.
Al analizar los resultados del experimento se obtienen las pautas a seguir, que muchas veces se
concretan en mejoras sustanciales del proceso. En este sentido, experimentar es mejor que sentarse a
esperar a que el proceso nos indique por sí solo cómo mejorarlo. El diseño de experimentos es un
conjunto de técnicas activas, en el sentido de que no esperan que el proceso mande las señales útiles,
sino que éste se ¨manipulan¨ para que proporcione la información que se requiere para su mejoría.
El saber diseño de experimentos y otras técnicas estadísticas, en combinación con conocimientos del
proceso, sitúan al responsable del mismo como un observador perceptivo y proactivo que es capaz de
proponer mejoras y de observar algo interesante (oportunidades de mejora) en el proceso y en los datos
donde otra persona no ve nada.
Familia de diseños para comparar tratamientos
Los diseños experimentales más utilizados para comparar tratamientos son (Jiménez, 2012):
1. Diseño completamente al azar (DCA)
2. Diseño en bloque completamente al azar (DBCA)
3. Diseño en cuadro latino (DCL)
4. Diseño en cuadro grecolatino (DCGL)
La diferencia fundamental entre estos diseños es el número de factores de bloque que incorporan o
controlan de forma explícita durante el experimento. La comparación de los tratamientos en cuanto a la
respuesta media que logran, en cualquiera de estos diseños, se hace mediante la hipótesis:
H 0 : μ1=μ2=…=μn
pág. 121
que se prueba con la técnica estadística llamada Análisis de Varianza (ANOVA) con uno, dos, tres o
cuatro criterios de clasificación, dependiendo del número de factores de bloques incorporados al diseño.
Factores de ANOVA Modelo

Diseño
Bloqueo (n, criterios) Estadístico
DCA 0 1 criterio Y i=μ+ τ i +ε i
DBCA 1 2 criterios Y ij =μ+ τ i+ γ i + ε ij
DCL 2 3 criterios Y ijk =μ+τ i + γ i +δ k + ε ijk
DCGL 3 4 criterios Y ijkl =μ+ τ i+ γ i + δ k +φl + ε ijk
Donde:
Y es la variable de salida,
μ la media global,
τ i el efecto del i-ésimo tratamiento,
ε ierror aleatorio,
γ i δ k ε ijk son los efectos de tres factores de bloqueo.
El modelo estadístico que describe el comportamiento de la variable observada Y en cada diseño,

incorpora un término adicional por cada factor de bloqueo controlado. De acuerdo con los modelos
dados en la tabla, para cada diseño comparativo se tienen al menos dos fuentes de variabilidad: los
tratamientos o niveles del factor de interés y el error aleatorio. Se agrega una nueva fuente de
variabilidad por cada factor de bloque que se controla directamente. Se observa que los diseños suponen
que no hay efectos de interacción entre los factores, lo cual sería lo deseable que ocurra; de no ocurrir
así, tal efecto se recarga al error y el problema de comparación no se resuelve con éxito.
Un efecto de interacción entre dos factores hace referencia a que el efecto de cada factor depende del
nivel en que se encuentra el otro.
El modelo de efectos fijos
El modelo de efectos fijos (es cuando se estudian todos los posibles tratamientos) de análisis de la
varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a
varios factores, cada uno de los cuales le afecta sólo a la media, permaneciendo la "variable respuesta"
con una distribución normal.
Este modelo se supone cuando el investigador se interesa únicamente por los niveles del factor presentes
en el experimento, por lo que cualquier variación observada en las puntuaciones se deberá al error
experimental. En caso que los tratamientos tengan efecto, las observaciones se podrán describir con el
modelo estadístico lineal dado por:
Y ij =μ+ τ i+ ε ij
pág. 122
Donde:
μ es el parámetro de escala común a todos los tratamientos, llamado media global,

τ i es un parámetro que mide el efecto del tratamiento i y
ε ij es el error atribuible a la medición Y ij .
Este modelo implica que en el diseño completamente al azar actuarían a lo más dos fuentes de
variabilidad: Los tratamientos y el error aleatorio. La media global μ de la variable de respuesta no se
considera una fuente de variabilidad por ser una constante común a todos los tratamientos, que hace las
veces de punto de referencia con respecto al cual se comparan las respuestas medias de los tratamientos.
Si la respuesta media de un tratamiento particular es ¨muy diferente¨ de la respuesta media global μi , es

un síntoma de que existe un efecto de dicho tratamiento, ya que como se verá más adelante, τ i =μi−μ .
La diferencia que debe tener las medias entre sí para concluir que hay un efecto (que los tratamientos
son diferentes), nos lo dice el análisis de varianza (ANOVA). En la práctica puede suceder que los
tratamientos que se desea comparar sean demasiados como para experimentar con todos. Cuando esto
sucede es conveniente comparar sólo una muestra de la población de tratamientos, de modo que τ i pasa a
ser una variable aleatoria con su propia varianza σ 2τ que deberá estimarse a partir de los datos. En este
capítulo sólo se presenta el caso en que todos los tratamientos que se tienen se prueban, es decir, se
supone una población pequeña de tratamientos, lo cual hace posible compararlos a todos. En este caso,
el modelo dado por la ecuación Y ij =μ+ τ i+ ε ij se llama modelo de efectos fijos.
4.1 Experimentos con un factor
En muchas comparaciones, como las antes mencionadas, se hacen con base en el diseño completamente
al azar (DCA), que es el más simple de todos los diseños que se utilizan para comparar dos o más
tratamientos, dado que sólo consideran dos fuentes de variabilidad: los tratamientos y el error aleatorio.
En la siguiente unidad veremos diseños que consideran la influencia de otras fuentes de variabilidad
(bloques).
Este diseño se llama completamente al azar porque todas las corridas experimentales se realizan en
orden aleatorio completo. De esta manera, si durante el estudio se hacen en total N pruebas, éstas se
corren al azar, de manera que los posibles efectos ambientales y temporales se vayan repartiendo
equitativamente entre los tratamientos.
El análisis de la varianza de un criterio (ANOVA de un criterio) es una metodología para analizar la

variación entre muestras y la variación al interior de las mismas con varianzas, en lugar de rangos.
Como tal, es un método estadístico útil para comparar dos o más medias poblacionales. El objetivo del
análisis de varianza en el DCA es probar las hipótesis de igualdad de los tratamientos con respecto a la
media de la correspondiente variable de respuesta:
pág. 123
H 0 : μ1=μ2=…=μn
Tabla de ANOVA
Los resultados del análisis de varianza se presentan en una tabla ANOVA que resume los valores
importantes de la prueba. Esta tabla tiene un formato estándar que usan los libros y los problemas de
computadora que ejecutan ANOVA. La siguiente tabla muestra la forma general de la tabla ANOVA.
En dicha tabla se resumen los cálculos necesarios para la prueba de igualdad de las medias poblacionales
usando análisis de varianza. Primero se usa el método dentro para estimar δ 2. Cada valor de los datos se
compara con su propia media, y la suma de las diferencias al cuadrado se divide entre los grados de
libertad c (n−1).
Fuente de Suma de Grados de Estimación de Coeficiente

2
Variación Cuadrados Libertad δ F
2 2
2 n ⋅ Σ ( x i−x ) sb
Grupos Entre n ⋅ Σ ( x i−x ) c−1 2
sb = 2
c−1 sw
2
2 ∑ ( xi −x j )
Grupos Dentro ∑ ( x i −x ) c ( n−1 ) 2
sw = j
c ( n−1 )
j
2 2
Total n ⋅ Σ ( x i−x ) + ∑ ( x i −x ) j
La tabla ANOVA contiene columnas con las fuentes de variación, las sumas de cuadrados, los grados de
libertad, las estimaciones de la varianza y el valor F para el procedimiento de análisis de varianza.
Ejemplo #88: Comparación de cuatro métodos de ensamble. Un equipo de mejora investiga el efecto de
cuatro métodos de ensamble A, B, C y D, sobre el tiempo de ensamble en minutos con un nivel de
significancia de 0.05. En primera instancia, la estrategia experimental es aplicar cuatro veces los cuatro
métodos de ensamble en orden completamente aleatorio (las 16 pruebas en orden aleatorio). Los tiempos
de ensamble obtenidos se muestran en la siguiente tabla:
Método de ensamble
A B C D
6 7 11 10
8 9 16 12
7 10 11 11
8 8 13 9
Si se usa el diseño completamente al azar (DCA), se supone que, además del método de ensamble, no
existe ningún otro factor que influya de manera significativa sobre la variable de respuesta (tiempo de
ensamble).
pág. 124
Solución:
1.- Planteamos la hipótesis:
H 0 : μ A =μ B =μ C =μ D
H 1 : por lo menos dos μi son diferentes
2.- Procedemos a sustituir fórmulas y calcular resultados:
Método de ensamble
A B C D
6 7 11 10
8 9 16 12
7 10 11 11
8 8 13 9
xi 7.25 8.5 12.75 10.5
x 9.75
c=4 ; n=4 ; α =0.05
n ⋅ Σ ( x i−x )2=4 ( ( 7.25−9.75 )2 + ( 7.25−8.5 )2+ (7.25−12.75 )2 + ( 7.25−10.5 )2 )=69.5
2 2 2 2 2
∑ ( x i −x ) =( 6−9.75 ) + ( 8−9.75 ) + …+ ( 11−9.75 ) + ( 9−9.75 ) =29.5
j
c−1=4−1=3; c ( n−1 )=4 ( 4−1 )=12

Fuente de Suma de Grados de Estimación de Coeficiente
2
Variación Cuadrados Libertad δ F
Grupos Entre 69.5 3 23.167 9.42
Grupos Dentro 29.5 12 2.458
Total 99
3.- Contrastar el resultado FC y FP:
pág. 125
F, df1=3, df2=12
0.7
0.6
0.5
Aceptar H0
Densidad
0.4
Rechazar H0
0.3
0.2
0.1
0.05
0.0
0 3.490
X
Como FC>FP se rechaza H0.
4.- Se emite conclusión: “Con un nivel de significancia del 5%, se puede decir que existen diferencias en
por lo menos 2 promedios de los métodos de ensambles A, B, C y D.
En MiniTab® Ver. 18:
1.- Introducimos los datos:
2.- Seleccionamos la siguiente opción:
pág. 126
4.- Se despliega otra ventana que nos dice:
pág. 127
5.- En Opciones, dejamos como está, en Comparaciones, seleccionaremos Tukey y Fisher, en Gráficas
activamos todas las casillas de gráfica de datos y seleccionamos tres en uno, en Resultados dejamos
como está y finalmente en Almacenamiento dejamos como esta:
6.- De la imagen anterior acomodamos la información como se va requiriendo:
pág. 128
Sesión:
ANOVA de un solo factor: A, B, C, D
Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales
Nivel de significancia α = 0.05
Se presupuso igualdad de varianzas para el análisis.
Información del factor

Facto
r Niveles Valores
Facto 4 A, B, C, D
r
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Factor 3 69.50 23.167 9.42 0.002
Error 12 29.50 2.458
Total 15 99.00
Contraste del resultado FC y FP:
F, df1=3, df2=12
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.05
0.0
0 3.490
X
pág. 129
FC>FP Se acepta H1 y se rechaza H0

Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1.56791 70.20% 62.75% 47.03%
Medias
Facto
r N Media Desv.Est. IC de 95%
A 4 7.250 0.957 (5.542, 8.958)
B 4 8.500 1.291 (6.792, 10.208)
C 4 12.75 2.36 (11.04, 14.46)
D 4 10.500 1.291 (8.792, 12.208)
Desv.Est. agrupada = 1.56791
Comparaciones en parejas de Tukey

Agrupar información utilizando el método de Tukey y una confianza de 95%
Factor N Media Agrupación
C 4 12.75 A
D 4 10.500 A B
B 4 8.500 B
A 4 7.250 B
Las medias que no comparten una letra son significativamente diferentes.
pág. 130
ICs simultáneos de 95% de Tukey

Diferencia de las medias para A, B, ...
B-A
C-A
D-A
C-B
D-B
D-C
-5.0 -2.5 0.0 2.5 5.0 7.5 10.0
Si un intervalo no contiene cero, las medias correspondientes son significativamente

diferentes.
Comparaciones en parejas de Fisher

Agrupar información utilizando el método LSD de Fisher y una confianza de 95%
Factor N Media Agrupación
C 4 12.75 A
D 4 10.500 A B
B 4 8.500 B C
A 4 7.250 C
pág. 131
ICs individuales de 95% de Fisher

B-A
C-A
D-A
C-B
D-B
D-C
-5.0 -2.5 0.0 2.5 5.0 7.5

diferentes.
Gráfica de intervalos de A, B, ...

95% IC para la media
15.0
12.5
Datos
10.0
7.5
5.0
A B C D
La desviación estándar agrupada se utilizó para calcular los intervalos.
pág. 132
Gráfica de valores individuales de A, B, ...

17.5
15.0
12.5
Datos
10.0
7.5
5.0
A B C D
Gráfica de caja de A, B, ...

17.5
15.0
12.5
Datos
10.0
7.5
5.0
A B C D
pág. 133
Gráficas de residuos para A, B, ...

Gráfica de probabilidad normal vs. ajustes
99 4
90
Porcentaje
Residuo
50
0
10
1 -2
-4 -2 0 2 4 8 10 12
Residuo Valor ajustado
Histograma
4
3
Frecuencia
0
-2 -1 0 1 2 3
Residuo
Ejemplo #89: Se investigaron cuatro métodos diferentes para preparar el compuesto superconductor
Pb Mo6 S 8. Los autores sostienen que la presencia de oxígeno durante el proceso de preparación afecta la
temperatura de transición de superconducción T c del material. Los métodos de preparación 1 y 2 usan
técnicas que están diseñadas para eliminar la presencia de oxígeno, mientras que los métodos 3 y 4
permiten la presencia de oxígeno. Se hicieron cinco observaciones de T c (en °K) para cada método, y los
resultados son los siguientes:
Método de preparación
A B C D
de Transición
Temperatura
14.8 14.6 12.7 14.2

14.8 15 11.6 14.4
°K
14.7 14.9 12.4 14.4

14.8 14.8 12.7 12.2
14.9 14.7 12.1 11.7
1. ¿Hay evidencia que apoye la afirmación de que la presencia de oxígeno durante la preparación
afecta la temperatura de transición media? Use α=0.05.
2. ¿Cuál es el valor P para la prueba F del inciso anterior
3. Analice los residuales de este experimento.
4. Aplique el método de la LSD en el experimento. ¿Qué métodos de preparación difieren? Use
α=0.05
pág. 134
ANOVA de un solo factor: A, B, C, D

Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales
Nivel de significancia α = 0.05
Se presupuso igualdad de varianzas para el análisis.

Facto
r Niveles Valores
Facto 4 A, B, C, D
r
Fuent Valor
e GL SC Ajust. MC Ajust. F Valor p
Factor 3 22.124 7.3747 14.85 0.000
Error 16 7.948 0.4968
Total 19 30.072
Contraste del resultado FC y FP:
F, df1=3, df2=12
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.05
0.0
0 3.490
X
pág. 135
FC>FP Se acepta H1 y se rechaza H0
Resumen del modelo

R-cuad.
(ajustado R-cuad.
S R-cuad. ) (pred)
0.704805 73.57% 68.61% 58.70%
Medias
Facto
r N Media Desv.Est. IC de 95%
A 5 14.8000 0.0707 (14.1318, 15.4682)
B 5 14.8000 0.1581 (14.1318, 15.4682)
C 5 12.300 0.464 (11.632, 12.968)
D 5 13.380 1.320 (12.712, 14.048)
Desv.Est. agrupada = 0.704805
Comparaciones en parejas de Tukey

Agrupar información utilizando el método de Tukey y una confianza de 95%
Facto
r N Media Agrupación
B 5 14.8000 A
A 5 14.8000 A
D 5 13.380 B
C 5 12.300 B
Pruebas simultáneas de Tukey para diferencias de las medias

Diferencia Diferencia EE de IC de 95% Valor T Valor p
de niveles de las diferencia ajustado
pág. 136
medias
B-A 0.000 0.446 (-1.277, 1.277) 0.00 1.000
C-A -2.500 0.446 (-3.777, - -5.61 0.000
1.223)
D-A -1.420 0.446 (-2.697, - -3.19 0.027
0.143)
C-B -2.500 0.446 (-3.777, - -5.61 0.000
1.223)
D-B -1.420 0.446 (-2.697, - -3.19 0.027
0.143)
D-C 1.080 0.446 (-0.197, 2.357) 2.42 0.113
Nivel de confianza individual = 98.87%
pág. 137

B-A
C-A
D-A
C-B
D-B
D-C
-4 -3 -2 -1 0 1 2 3

diferentes.
Comparaciones en parejas de Fisher

Agrupar información utilizando el método LSD de Fisher y una confianza de 95%
Facto
r N Media Agrupación
B 5 14.8000 A
A 5 14.8000 A
D 5 13.380 B
C 5 12.300 C
pág. 138
Pruebas individuales de Fisher para diferencias de las medias

Diferencia
Diferencia de las EE de Valor p
de niveles medias diferencia IC de 95% Valor T ajustado
B-A 0.000 0.446 (-0.945, 0.945) 0.00 1.000
C-A -2.500 0.446 (-3.445, - -5.61 0.000
1.555)
D-A -1.420 0.446 (-2.365, - -3.19 0.006
0.475)
C-B -2.500 0.446 (-3.445, - -5.61 0.000
1.555)
D-B -1.420 0.446 (-2.365, - -3.19 0.006
0.475)
D-C 1.080 0.446 (0.135, 2.025) 2.42 0.028
Nivel de confianza simultánea = 81.11%

B-A
C-A
D-A
C-B
D-B
D-C
-4 -3 -2 -1 0 1 2

diferentes.
pág. 139

95% IC para la media
16
15
14
Datos
13
12
A B C D
La desviación estándar agrupada se utilizó para calcular los intervalos.

15.0
14.5
14.0
13.5
Datos
13.0
12.5
12.0
11.5
A B C D
pág. 140

15.0
14.5
14.0
13.5
Datos
13.0
12.5
12.0
11.5
A B C D

99
1
90
Porcentaje
0
Residuo
50
-1
10
1 -2
-2 -1 0 1 12.5 13.0 13.5 14.0 14.5
Histograma
12
9
Frecuencia
0
-1.5 -1.0 -0.5 0.0 0.5 1.0
Residuo
pág. 141
Finalmente:
1. ¿Hay evidencia que apoye la afirmación de que la presencia de oxígeno durante la preparación
afecta la temperatura de transición media? Use α=0.05.
R=si
2. ¿Cuál es el valor P para la prueba F del inciso anterior

R= 0.00007
3. Analice los residuales de este experimento.

R=(antes descrito)
4. Aplique el método de la LSD en el experimento. ¿Qué métodos de preparación difieren? Use

α=0.05
R= C y D.
4.2 Experimentos con dos factores
Conceptos
Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor, es deseable que las
posibles diferencias se deban principalmente al factor de interés y no a otros factores que no se
consideran en el estudio. Cuando esto no ocurre y existen otros factores que no se controlan o nulifican
para hacer la comparación, las conclusiones podrían ser afectadas sensiblemente.
Ejemplo #90: supongamos que se quieren comparar varias máquinas, si cada máquina es manejada por
un operador diferente y se sabe que éste tiene una influencia en el resultado, entonces es claro que el
factor operador debe tomarse en cuenta si se quiere comparar a las máquinas de manera justa.
Un operador más hábil puede hacer ver a su máquina (aunque ésta sea la peor) como la que tiene el
mejor desempeño, lo cual impide hacer una comparación adecuada de los equipos. Para evitar este sesgo
hay dos maneras de anular el posible efecto del factor operador: la manera lógica es utilizar el mismo
operador en las cuatro maquinas; sin embargo, tal estrategia no siempre es aconsejable, ya que utilizar el
mismo sujeto elimina el efecto del factor operador, pero restringe la validez de la comparación con
dicho operador, y es posible que el resultado no se mantenga al utilizar a otros operadores. La otra forma
de anular el efecto operador en la comparación consiste en que cada operador trabaje durante el
experimento con cada una de las máquinas. Esta estrategia es la más recomendable, ya que utilizar a
todos los operadores con todas las máquinas permite tener resultados de la comparación que son válidos
para todos los operadores. Esta forma de nulificar el efecto de operadores, recibe el nombre de bloqueo.
pág. 142
Factores de bloque
A los factores adicionales al factor de interés que se incorporan de manera explícita en un experimento
comparativo se les llama factores de bloque. Éstos tienen la particularidad de que no se incluyen en el
experimento porque interese analizar su efecto, sino como un medio para estudiar de manera adecuada y
eficaz al factor de interés. Los factores de bloque entran al estudio en un nivel de importancia secundaria
con respecto al factor de interés y, en este sentido, se puede afirmar que se estudia un solo factor, porque
es uno el factor de interés. En un diseño en bloques completos al azar (DBCA) se consideran tres fuentes
de variabilidad:
 El factor de tratamientos
 El factor de bloque
 El error aleatorio
se tienen tres posibles ¨culpables¨ de la variabilidad presente en los datos. La palabra completo en el
nombre del diseño se debe a que en cada bloque se prueban todos los tratamientos, o sea, los bloques
están completos. La aleatorización se hace dentro de cada bloque; por lo tanto, no se realiza de manera
total como en el diseño completamente al azar. Los factores de bloqueo que aparecen en la práctica son:
Turno, lote, día, tipo de material, línea de producción, operador, maquina, método, etc. Supongamos una
situación experimental con k tratamientos y b bloques. El aspecto de los datos para este caso se muestra
en la siguiente tabla, considerando una repetición en cada combinación de tratamiento y bloque:
Bloque
Tratamiento B1 B2 B3 Bk
… Total Media
1 Y 11 Y 12 Y 13 … Y 1b T 1. y 1.
2 Y 21 Y 22 Y 23 … Y 2b T 2. y 2.
3 Y 31 Y 32 Y 33 … Y 3b T 3. y 3.
⋮ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ ⋮
k Yk1 Yk2 Yk3 … Y kb Tk. yk .
Total T .1 T .2 T .3 … T .b T .. ⋮
Media y .1 y .2 y .3 … y. b … y ..
Modelo estadístico
Cuando se decide utilizar un DBCA, el experimentador piensa que cada medición será el resultado del efecto
del tratamiento donde se encuentre, del efecto al que pertenece y de cierto error que se espera sea aleatorio.
El modelo estadístico para este diseño está dado por:
Y ij =μ+ τ i+ γ i + ε ij
Donde:
Y ij Es la medición que corresponde al tratamiento y al bloque

pág. 143
μ Es la media global poblacional

τ i Es el efecto debido al tratamiento
γ iEs el efecto debido al bloque
ε ijEs el error aleatorio atribuible a la medición
Hipótesis a probar
La hipótesis de interés es la misma para todos los diseños comparativos, y está pada por:
H 0 : μ1=μ2=…=μn
la afirmación a probar es que la respuesta media poblacional lograda con cada tratamiento es la misma para
los k tratamientos y que, por lo tanto, cada respuesta media μ1 es igual a la media global poblacional µ. De
manera alternativa, es posible afirmar que todos los efectos de tratamiento sobre la variable de respuesta son
nulos, porque cuando el efecto τ i =μ1−μ=0, entonces necesariamente la respuesta media del tratamiento es
igual a la media global ( μi=μ ).
Tabla de ANOVA
La hipótesis dada se prueba con un análisis de varianza con dos criterios de clasificación, porque se controlan
dos fuentes de variación: el factor de tratamientos y el factor de bloque. En la tabla siguiente se muestra el
aspecto del ANOVA para diseño DBCA:
Fuente de Suma de Grados de Cuadrado Medio

FC
Variación Cuadrados Libertad
k 2
T i. T ..
2
SCTrat CM Trat
Tratamientos SCTrat =∑ − b−1 CM Trat=
i=1 b N k−1 CM E
k 2 2
T . j T .. SC B CM B
Bloques SC B=∑ − k −1 CM B=
i=1 k N b−1 CM E
SC E
Error SC E=SC T −SC Trat −SC B (k −1)(b−1) CM E =
(k −1)(b−1)
k n 2
Y ..
SCT =∑ ∑ Y −
2
Total ij
N−1
i=1 j=1 N
Ejemplo #90: Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas.
Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas
expresando en porcentajes. Se hicieron seis replicas, pero en días diferentes; por ello, se sospecha que
puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran
a continuación. Utilice un nivel de significancia del 5%. Para comparar los cuatro métodos se plantea la
hipótesis:
pág. 144
H 0 : μ1=μ2=…=μn
Los tiempos de ensamble obtenidos se muestran en la siguiente tabla:
Marca
Atomizador Número de Réplicas
A 72 65 67 75 62 73
B 55 59 68 70 53 50
C 64 74 61 58 51 69
Solución:
Marca
Atomizador Número de Réplicas
A 72 65 67 75 62 73 414
B 55 59 68 70 53 50 355
C 64 74 61 58 51 69 377
191 198 196 203 166 192 1146
k 2 2
T i. T .. 414 2+355 2+377 2 1146 2
SCTrat =∑ − = − =296.3333
i=1 b N 6 18
k 2 2
T . j T .. 1912+ 1982+ 1962 +2032 +1662 +1922 1146 2
SC B=∑ − = − =281.3333
i=1 k N 3 18
k n 2 2
Y .. 1146
SCT =∑ ∑ Y − = 72 +65 +…+69 −
( )
2
2 2 2
ij =1092
i=1 j=1 N 18
SC E=SC T −SC Trat −SC B =1092−296.3333−281.3333=514.3333
SCTrat 296.3333
CM Trat= = =148.1667
b−1 2
SC B 281.3333
CM B= = =56.2667
k −1 5
SC E 514.3333
CM E = = =51.4333
(k −1)(b−1) 10
pág. 145
CM Trat 148.1667
F C= = =2.8817
CM E 51.4333
CM B 56.2667
F C= = =1.0939
CM E 51.4333

FC
Tratamientos 296.3333 2 148.1667 2.8807
Bloques 281.3333 5 56.2667 1.0939
Error 514.3333 10 51.4333
Total 1092 17
Comparar resultados de FC y FT: (FT=F(k-1),(k-1)(b-1),α)
F, df1=2, df2=10
0.05
0 4.103
X
Por lo tanto, FC esta en la zona de aceptación de Ho.
Por último, se emite conclusión: “Con un nivel de significancia del 5%, se puede decir que no existen
diferencias en los promedios de efectividad en los atomizadores A, B y C”.
pág. 146
En MiniTab® Ver. 18:
1.- Introducimos los datos:
pág. 147
4.- En Opciones, dejamos como está, en Gráficas activamos cuatro en uno y finalmente en
Almacenamiento dejamos como esta:
5.- De la imagen anterior acomodamos la información como se va requiriendo:
pág. 148
Modelo lineal general: Respuestas vs. Atomizadores, Réplicas
Método
Codificación de factores (-1, 0, +1)

Factor Tipo Niveles Valores
Atomizadore Fijo 3 A, B, C
s
Réplicas Fijo 6 1, 2, 3, 4, 5, 6
2 296.3 148.17 2.88 0.103
Atomizadores
Réplicas 5 281.3 56.27 1.09 0.421
Error 10 514.3 51.43
Total 17 1092.0
Comparar resultados de FC y FT: (FT=F(k-1),(k-1)(b-1),α)
F, df1=2, df2=10
0.05
0 4.103
X
Resumen del modelo

S R-cuad. R-cuad. R-cuad.
pág. 149
(ajustado) (pred)
7.17170 52.90% 19.93% 0.00%
Coeficientes
EE del Valor
Término Coef coef. T Valor p FIV
Constante 63.67 1.69 37.66 0.000
Atomizadores
A 5.33 2.39 2.23 0.050 1.33
B -4.50 2.39 -1.88 0.089 1.33
Réplicas
1 -0.00 3.78 -0.00 1.000 1.67
2 2.33 3.78 0.62 0.551 1.67
3 1.67 3.78 0.44 0.669 1.67
4 4.00 3.78 1.06 0.315 1.67
5 -8.33 3.78 -2.20 0.052 1.67
Ecuación de regresión
Respuesta = 63.67 + 5.33 Atomizadores_A - 4.50 Atomizadores_B - 0.83 Atomizadores_C
s - 0.00 Réplicas_1 + 2.33 Réplicas_2 + 1.67 Réplicas_3 + 4.00 Réplicas_4
- 8.33 Réplicas_5 + 0.33 Réplicas_6
Gráficas de residuos para Respuestas

Gráficas de residuos para Respuestas
99 10
90 5
Porcentaje
Residuo
50 0
-5
10
1 -10
-10 -5 0 5 10 50 55 60 65 70
Histograma vs. orden

10
4.8
5
Frecuencia
3.6
Residuo
0
2.4
1.2 -5
0.0 -10
-10 -5 0 5 10 2 4 6 8 10 12 14 16 18
Residuo Orden de observación
pág. 150
pág. 151
Ejemplo #91: Se realizó un experimento para determinar el efecto de cuatro sustancias químicas
diferentes sobre la resistencia de una tela. Estas sustancias químicas se usan como parte del proceso de
acabado del planchado permanente. Se seleccionaron cinco muestras de tela, y se corrió un diseño de
bloques completos aleatorizados para probar cada tipo de sustancia química sobre cada muestra de tela
en orden aleatorio. Las respuestas se muestran en resistencia al desgaste N (Newton). Se probarán las
diferencias de las medias utilizadas en el análisis de varianza con α=0.05.
Sustancia Muestra de la Tela

Química 1 2 3 4 5
A 1.3 1.6 0.5 1.2 1.1
B 2.2 2.4 0.4 2 1.8
C 1.8 1.7 0.6 0.5 1.3
D 3.9 4.4 2 4.1 3.4
Solución:
H 0 : μ1=μ2=…=μn
Modelo lineal general: Respuesta vs. Sustancia, Telas
Método

Sustanci Fijo 4 A, B, C, D
a
Telas Fijo 5 1, 2, 3, 4, 5
Sustancia 3 19.354 6.4513 43.23 0.000
Telas 4 6.413 1.6033 10.74 0.001
Error 12 1.791 0.1492
Total 19 27.558
Comparación de Fc y FR
pág. 152
F, df1=3, df2=12
0.05
0 3.490
X
Resumen del modelo

R-cuad.
(ajustado R-cuad.
S R-cuad. ) (pred)
0.386329 93.50% 89.71% 81.95%
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constant 1.9100 0.0864 22.11 0.000
e
Sustancia
A -0.770 0.150 -5.15 0.000 1.50
B -0.150 0.150 -1.00 0.336 1.50
C -0.730 0.150 -4.88 0.000 1.50
Telas
1 0.390 0.173 2.26 0.043 1.60
2 0.615 0.173 3.56 0.004 1.60
3 -1.035 0.173 -5.99 0.000 1.60
4 0.040 0.173 0.23 0.821 1.60
pág. 153
Respuesta = 1.9100 - 0.770 Sustancia_A - 0.150 Sustancia_B - 0.730 Sustancia_C
+ 1.650 Sustancia_D + 0.390 Telas_1 + 0.615 Telas_2 - 1.035 Telas_3
+ 0.040 Telas_4 - 0.010 Telas_5
Ajustes y diagnósticos para observaciones poco comunes

Resi
d
Obs Respuesta Ajuste Resid est.
14 0.500 1.220 -0.720 -2.41 R
Residuo grande R
Gráficas de residuos para Respuesta
Gráficas de residuos para Respuesta

99
0.5
90
Porcentaje
Residuo
0.0
50
10 -0.5
1
-0.8 -0.4 0.0 0.4 0.8 0 1 2 3 4

8 0.5
6
Frecuencia
Residuo
0.0
4
2 -0.5
0
-0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 2 4 6 8 10 12 14 16 18 20
Se rechaza Ho. Por tanto, se puede decir con un α=0.05 que si existe diferencia promedio en la
resistencia al desgaste a las telas en por lo menos dos de ellas.
4.3 Experimentos con dos o más factores
En el diseño en cuadro latino (DCL) se controlan dos factores de bloque y se estudia un factor de
tratamientos, por lo que se tienen cuatro fuentes de variabilidad que pueden afectar la respuesta
observada, estas son:
pág. 154
 Los tratamientos
 El factor de bloque I (renglones)
 El factor de bloque II (columnas)
 El error aleatorio
Se llama cuadro latino por dos razones: es un cuadro debido a que tiene la restricción adicional de que
los tres factores involucrados se prueban en la misma cantidad de niveles, y es latino porque se utilizan
letras latinas para denotar a los tratamientos o niveles del factor de interés. Sean A, B, C, …, K, los k
tratamientos a comparar, por lo tanto, ambos factores de bloques tienen también k niveles cada uno. El
aspecto de los datos se muestra en la siguiente tabla:
Bloque II (columnas)
1 2 3 ⋯ k
1 A=Y111 B=Y212 C=Y313 ⋯ K=YK1K
2 B=Y221 C=Y322 D=Y423 ⋯ A=Y12K
Bloque I
3 C=Y331 D=Y432 E=Y533 ⋯ B=Y23K
(filas)
⋮ ⋮ ⋮ ⋮ ⋱ ⋮
k K=Ykk1 A=Y1k2 B=Y2k3 ⋯ j=YJkK
Ahora se necesitan al menos tres subíndices, por ejemplo, la respuesta Y313 se generó en el tratamiento
tres (C), en el primer nivel del factor renglón y en el tercer nivel del factor columna. El modelo
estadístico para describir el comportamiento de las observaciones está dado por:
Y ijk =μ+τ i + γ i +δ k + ε ijk
Donde Y ijk es la observación del tratamiento i , en el nivel j , del factor renglón y en el nivel l del factor
columna; ε ijkes el error atribuible a dicha observación. De acuerdo con este modelo, la variabilidad total
presente en los datos se puede descomponer como:
SCT =SCTrat +SC B 1+ SC B 2 +SC B 3
y los grados de libertad correspondientes son:
2
k −1=(k−1)+( k−1)+(k−1)+(k−2)(k −1)
El ANOVA para el diseño en cuadro latino se muestra en la tabla siguiente. En él se prueba la hipótesis
sobre los efectos de tratamiento del factor renglón y del factor columna. Otra vez, la hipótesis
fundamental es la de los tratamientos; las otras dos proporcionan un adicional al objetivo inicial y
permiten comprobar la relevancia de controlar los factores de bloque.
pág. 155

FC
k 2 2
T .i . T .. SCTrat CM Trat
Tratamientos SCTrat =∑ − k −1 CM Trat=
i=1 f N k−1 CM E
k 2 2
T i . T .. SC B 1 CM B 1
Filas SC B 1=∑ − k −1 CM B 1=
i=1 c N k −1 CM E
k 2 2
T . j T .. SC B 2 CM B 2
Columnas SC B 2=∑ − k −1 CM B 2=
i=1 t N k −1 CM E
( k −2 ) SC E
Error SC E=SC T −SC Trat −SC B 1−SC B 2 CM E =
(k −1) ( k−2 ) ( k−1)
k n 2
Y ..
SCT =∑ ∑ Y ij −
2 2
Total k −1
i=1 j=1 N
Ejemplo #92: Una compañía de mensajería está interesada en determinar cuál marca de llantas tiene mayor
duración en términos del desgaste. Para ello se planea un experimento en cuadro latino, en el que se
comparan las cuatro marcas de llantas sometiéndolas a una prueba de 32 000 kilómetros de recorrido,
utilizando cuatro diferentes tipos de auto y las cuatro posiciones posibles de las llantas en el auto. Así, el
factor de interés es el tipo de llantas o marca, y se controlan dos factores de bloque: el tipo de carro y la
posición de la llanta en el auto. Estos factores de bloque se controlan ya que, por experiencia, se sabe que el
tipo de carro y la posición de la llanta tienen efecto en el desgaste de la misma.
La elección del cuadro latino a utilizar se hace antes de obtener los datos. Para ello, a partir de un cuadro
latino inicial se aleatorizan las columnas y los renglones; después, las diferentes marcas de llantas se asignan
de manera aleatoria a las letras latinas que denotan los niveles del factor de interés
Carro
Posición
1 2 3 4
1 C 12 D 11 A 13 B 8
2 B 14 C 12 D 11 A 3
3 A 17 B 14 C 10 D 9
4 D 13 A 14 B 13 C 9
Las pruebas se hacen al mismo tiempo con choferes, a quienes se les instruye para que manejen de manera
similar sobre el mismo terreno para los cuatro automóviles. Al hacer las pruebas de los cuatro autos al mismo
tiempo se evita el efecto del ambiente en el desgaste; asimismo, el conductor y el tipo de terreno podrían
influir, pero se considera suficiente mantenerlos lo más homogéneo posible durante el experimento. El
diseño y los datos observados se muestran en la tabla anterior. Se mide la diferencia máxima entre el grosor
de la llanta nueva y el grosor de la llanta después de recorrido los 32 000 kilómetros. Obviamente, a mayor
diferencia en grosor mayor desgaste. Las unidades de medición son milésimas de pulgada. Se utiliza un
α=0.05.
Solución:
Posición Carro
pág. 156
1 2 3 4
1 C 12 D 11 A 13 B 8 44
2 B 14 C 12 D 11 A 3 40
3 A 17 B 14 C 10 D 9 50
4 D 13 A 14 B 13 C 9 49
56 51 47 29 183
∑A= 47
∑B= 49
∑C= 43
∑D= 44
Planteamiento de Hipótesis:
H 0 : μ1=μ2=…=μn
k 2 2
T .i . T .. 47 2+ 492 +43 2+ 44 2 1832
SCTrat =∑ − = − =5.6875
i=1 f N 4 16
k 2 2
T i . T .. 442 +40 2+50 2+ 492 183 2
SC B 1=∑ − = − =16.1875
i=1 c N 4 16
k 2 2
T . j T .. 562 +512+ 472 +292 1832
SC B 2=∑ − = − =103.6875
i=1 t N 4 16
k n 2 2
Y .. 2 183
SCT =∑ ∑ Y ij −
2 2 2
=12 + 11 +…+9 − =155.9375
i=1 j=1 N 16
SC E=SC T −SC Trat −SC B 1−SC B 2=155.9375−5.6875−16.1875−103.6875=30.375
pág. 157
Tabla ANOVA

FC
Tratamientos 5.6875 3 1.8958 0.3744
Filas 16.1875 3 5.3958 1.0658
Columnas 103.6875 3 34.5625 6.8271
Error 30.375 6 5.0625
Total 155.9375 15
Contraste de FC y FT:
F, df1=3, df2=6
0.05
0 4.757
X
Por lo tanto, aceptamos Ho. Se puede decir que, con un α=0.05 que las llantas se desgastan en promedio
de igual forma sin importar el carro, marca o posición.
En Minitab® se hace de similar forma que en el tema anterior:
pág. 158
Modelo lineal general: Desgaste vs. Posición, Carro, Marca

Método

Posició Fijo 4 1, 2, 3, 4
n
Carro Fijo 4 1, 2, 3, 4
Marca Fijo 4 A, B, C, D
Posición 3 16.188 5.396 1.07 0.431
Carro 3 103.688 34.563 6.83 0.023
Marca 3 5.687 1.896 0.37 0.775
Error 6 30.375 5.063
Total 15 155.938
Resumen del modelo

R-cuad.
(ajustado R-cuad.
S R-cuad. ) (pred)
2.25 80.52% 51.30% 0.00%
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constant 11.438 0.563 20.33 0.000
e
Posición
1 -0.438 0.974 -0.45 0.669 1.50
2 -1.437 0.974 -1.48 0.191 1.50
3 1.062 0.974 1.09 0.317 1.50
Carro
1 2.563 0.974 2.63 0.039 1.50
2 1.313 0.974 1.35 0.227 1.50
pág. 159
3 0.313 0.974 0.32 0.759 1.50

Marca
A 0.312 0.974 0.32 0.759 1.50
B 0.812 0.974 0.83 0.436 1.50
C -0.687 0.974 -0.71 0.507 1.50
Desgast = 11.438 - 0.438 Posición_1 - 1.437 Posición_2 + 1.062 Posición_3 + 0.812 Posición_4
e + 2.563 Carro_1 + 1.313 Carro_2 + 0.313 Carro_3 - 4.188 Carro_4 + 0.312 Marca_A
+ 0.812 Marca_B - 0.687 Marca_C - 0.437 Marca_D
Resid
Obs Desgaste Ajuste Resid est.
8 3.00 6.12 -3.12 -2.27 R
Residuo grande R
Gráficas de residuos para Desgaste

Gráficas de residuos para Desgaste
99
1
90
Porcentaje
0
Residuo
50
-1
10 -2
-3
1
-4 -2 0 2 4 5.0 7.5 10.0 12.5 15.0

4
1
3
Frecuencia
0
Residuo
2 -1
1 -2
-3
0
-3 -2 -1 0 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Ejemplo de DCGL, lo veremos solamente en Minitab® dado que sus cálculos son bastos y algo tediosos.
Ejemplo #93: El rendimiento de un proceso químico se midió utilizando cinco lotes de materia prima,
cinco concentraciones del ácido, cinco tiempos de procesamiento (A, B, C, D y E) y cinco
concentraciones del catalizador (α , β , γ , δ , ε ). Se usó el cuadrado grecolatino siguiente. Analizar los
datos de este experimento (utilizar α= 0,05) y sacar conclusiones.
pág. 160
pág. 161
Concentración de ácido
Lote
1 2 3 4 5
1 A α 26 B β 16 C γ 19 D δ 16 E ε 3
2 B γ 18 C δ 21 D ε 18 E α 11 A β 21
3 C ε 20 D α 12 E β 16 A γ 25 B δ 13
4 D β 15 E γ 15 A δ 22 B ε 14 C α 17
5 E δ 10 A ε 24 B α 17 C β 17 D γ 14
Modelo lineal general: Rendimiento vs. Lote, Concentración de Ácido, Tiempo de Procesamiento y
Concentraciones de Catalizador
Método

Lote Fijo 5 1, 2, 3, 4, 5
Concentración Ácido Fijo 5 1, 2, 3, 4, 5
Tiempo de Procesamiento Fijo 5 A, B, C, D, E
Concentraciones de Catalizador Fijo 5 α, β, γ, δ, ε
SC
Fuente GL Ajust. MC Ajust. Valor F Valor p
Lote 4 10.00 2.500 0.27 0.891
Concentración Ácido 4 72.40 18.100 1.94 0.198
Tiempo de Procesamiento 4 442.80 110.700 11.84 0.002
Concentraciones de Catalizador 4 16.00 4.000 0.43 0.785
Error 8 74.80 9.350
Total 24 616.00
pág. 162
Comparación de FC y FT:
F, df1=4, df2=8
0.05
0 3.838
X
Se acepta Ho.
Resumen del modelo

R-cuad. R-cuad.
3.05778 87.86% 63.57% 0.00%
Coeficientes
EE del Valor
Término Coef coef. Valor T p FIV
Constante 16.80 0.612 27.47 0.000
0
Lote
1 -0.80 1.22 -0.65 0.531 1.60
2 1.00 1.22 0.82 0.437 1.60
3 0.40 1.22 0.33 0.752 1.60
4 -0.20 1.22 -0.16 0.874 1.60
Concentración Ácido
1 1.00 1.22 0.82 0.437 1.60
pág. 163
2 0.80 1.22 0.65 0.531 1.60

3 1.60 1.22 1.31 0.227 1.60
4 -0.20 1.22 -0.16 0.874 1.60
Tiempo de Procesamiento
A 6.80 1.22 5.56 0.001 1.60
B -1.20 1.22 -0.98 0.355 1.60
C 2.00 1.22 1.64 0.141 1.60
D -1.80 1.22 -1.47 0.179 1.60
Concentraciones de Catalizador
α -0.20 1.22 -0.16 0.874 1.60
β 0.20 1.22 0.16 0.874 1.60
γ 1.40 1.22 1.14 0.285 1.60
δ -0.40 1.22 -0.33 0.752 1.60
Rendimiento = 16.800 - 0.80 Lote_1 + 1.00 Lote_2 + 0.40 Lote_3 - 0.20 Lote_4 - 0.40 Lote_5
+ 1.00 Concentración Ácido_1 + 0.80 Concentración Ácido_2
+ 1.60 Concentración Ácido_3 - 0.20 Concentración Ácido_4
- 3.20 Concentración Ácido_5 + 6.80 Tiempo de Procesamiento_A
- 1.20 Tiempo de Procesamiento_B + 2.00 Tiempo de Procesamiento_C
- 1.80 Tiempo de Procesamiento_D - 5.80 Tiempo de Procesamiento_E
- 0.20 Concentraciones de Catalizador_α + 0.20 Concentraciones de Catalizador_β
+ 1.40 Concentraciones de Catalizador_γ - 0.40 Concentraciones de Catalizador_δ
- 1.00 Concentraciones de Catalizador_ε

Resi
Rendimient d
Obs o Ajuste Resid est.
12 12.00 16.00 -4.00 -2.31 R
Residuo grande R
pág. 164
Gráficas de residuos para Rendimiento
Gráficas de residuos para Rendimiento

99
2
90
Porcentaje
Residuo
0
50
-2
10
-4
1
-5.0 -2.5 0.0 2.5 5.0 5 10 15 20 25

6.0
2
4.5
Frecuencia
Residuo
0
3.0
-2
1.5
-4
0.0
-4 -3 -2 -1 0 1 2 3 2 4 6 8 10 12 14 16 18 20 22 24
Conclusiones: Con un α= 0,05 se puede decir que el rendimiento de un proceso químico en promedio es
el mismo sin importar, los lotes de materia prima, las concentraciones del ácido, los tiempos de
procesamiento y las concentraciones del catalizador.
pág. 165
5. Análisis de diseños de factoriales
Conceptos
Existen frecuentemente varios factores de los que es necesario investigar de manera simultánea su
influencia sobre una o varias variables de respuesta, donde cada factor tiene la misma importancia,
desde el momento que se decide estudiarlo, y es poco justificable suponer de antemano que los factores
no interactúan entre sí. Los diseños experimentales que permiten estudiar de manera simultánea el efecto
de varios factores son los llamados diseños factoriales.
Un diseño factorial es aquél en el que se investigan todas las posibles combinaciones de los niveles de
los factores en cada ensayo completo. Se dicen que están cruzados, apareciendo el concepto de
interacción. Supone la existencia de repeticiones del experimento en cada una de las posibles
combinaciones de los niveles del factor correspondiente.
El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una o varias respuestas o
características de calidad y determinar una combinación de niveles de los factores en la cual, el
desempeño del proceso sea mejor que en las condiciones de operación actuales; es decir, encontrar
nuevas condiciones de operación del proceso que eliminen o disminuyan ciertos problemas de calidad en
la variable de salida.
Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador, la presencia o
ausencia de una operación previa, etc.), o de tipo cuantitativo (temperatura, humedad, velocidad,
presión, etc.). Para poder analizar la manera en que incluye cada factor sobre la variable respuesta, es
necesario elegir al menos dos niveles de prueba para cada uno de ellos (tres máquinas, dos operadores,
tres velocidades, dos temperaturas, etc.). Con el diseño factorial completa se corren aleatoriamente en el
proceso todas las posibles combinaciones que pueden formarse con los niveles seleccionados.
Concepto de Interacción
Ilustrando de forma intuitiva lo que es la interacción, se toman dos conjuntos de datos. Consideramos
dos factores: α (niveles α1 y α2) y β (niveles β1 y β2). Primer caso: dos factores sin interacción. Los datos
son:
α/ β1 β2
β
α1 10 20
α2 30 40
El efecto principal del factor α es la diferencia entre la respuesta promedio de α 1 y α2:
pág. 166
10+20 30+ 40
Eα = − =−20
2 2
y el efecto principal del factor β es:
10+ 30 20+ 40
Eβ= − =−10
2 2
Ahora bien, para el nivel β1, el efecto del factor α es:
Eα ∨β 1=10−30=−20
y para el nivel β2 es:
Eα ∨β 2=20−40=−20
De forma similar, los efectos del factor β para los niveles α1 y α2 son, respectivamente:
Eβ∨α 1=10−20=−10
Eβ∨α 2=30−40=−10
Entonces, el efecto de uno de los factores no depende de los niveles del otro factor, lo cual indica que no
hay interacción entre los factores. Cuando ambos factores tienen dos niveles, el efecto de la interacción
es la diferencia entre los promedios de las diagonales, que es en este caso:
10+ 40 30+ 20
Eαβ= − =0
2 2
lo que indica que no hay interacción. Los siguientes gráficos de perfil muestran la falta de
interacción ya que las rectas que aparecen son paralelas.
pág. 167
Gráfica de efectos principales para Interacción

Medias ajustadas
α β
35
Media de Interacción
30
25
20
15
α1 α2 β1 β2
Otros datos o cambios en los datos pueden arrojar interacciones entre los factores.
5.1 Diseño factorial 2 a la k
El experimento factorial más sencillo es en el que intervienen solamente dos factores, por ejemplo, A y
B. Hay niveles del factor A y niveles del factor B. El experimento tiene n réplicas y cada réplica
contiene todas las combinaciones de tratamientos ab . Hay que considerar los factores A y B con a y b (
a , b ≥ 2) niveles de prueba, respectivamente. Con ellos se puede construir el arreglo o diseño factorial
axb , que consiste de tratamientos. Se llama réplica cada repetición completa del arreglo factorial. Los
diseños factoriales que involucran menos de cuatro factores se corren replicados para poder tener la
potencia necesaria en las pruebas estadísticas sobre los efectos de interés, de tal forma que, si se hacen
réplicas, el número total de corridas experimentales es n(axb).
Efecto principal y efecto de interacción
El efecto de un factor se define como el cambio observado en la variable de respuesta debido a un

cambio de nivel de tal factor. En particular, los efectos principales son los cambios en la media de la
variable de respuesta que se deben a la acción individual de cada factor. En términos matemáticos, el
efecto principal de un factor con dos niveles es la diferencia entre la respuesta media observada cuando
tal factor estuvo en su primer nivel, y la respuesta media observada cuando el factor estuvo en su
segundo nivel.
Ejemplo #94: Suponga que, en un proceso de fermentación tequilera, se tienen dos factores A: tipo de
levadura y B: temperatura, cada uno con dos niveles denotados por A1=1 , A2=2 y B 1=22° C , B2=30 ° C
respectivamente. La respuesta de interés es el rendimiento del proceso de fermentación.
pág. 168
En la tabla siguiente, se muestran los cuatro tratamientos o puntos del diseño factorial 2 2, y entre
paréntesis se ha indicado cada nivel con los códigos (1, -1). En el experimento original cada tratamiento
se corrió tres veces (tres réplicas), lo cual da un total de 12 corridas del proceso, pero, por simplicidad,
en la última columna de la tabla sólo se anotaron los resultados de la primera réplica.
A: Levadura B: Temperatura Relación Yates Y: Rendimiento

A1=1 B1=22 °C (−1 ,−1) 28
A2=2 B1=22 °C (1 ,−1) 41
A1=1 B2=30 °C (−1 , 1) 63
A2=2 B2=30 °C (1 , 1) 45
La región experimental, estará dada gráficamente (Yates) por:
(-1,1) (1,1)
b ab
Factor B
(1) a
(-1,-1) Factor A (1,-1)
Los efectos principales están dados por:
41+ 45 28+63 −5
Efecto A= − = =−2.5
2 2 2
63+45 28+ 41 39
Efecto B= − = =19.5
2 2 2
por lo que en términos absolutos el efecto principal de B es mayor. Por otra parte, se dice que dos
factores interactúan entre sí o tienen un efecto de interacción sobre la variable de respuesta, cuando el
efecto de un factor depende del nivel en que se encuentra el otro. Por ejemplo, los factores A y B
interactúan si el efecto de A es muy diferente en cada nivel de B, o viceversa. Ahora veamos esto con
los datos de la tabla 4.1: el efecto de A cuando B es baja está determinado por:
Efecto A (con B bajo)=41−28=13
y cuando la temperatura es alta, el efecto de A es:
Efecto A ( con B alta )=45−63=−18
pág. 169
Como estos dos efectos de A en función del nivel de B son muy diferentes, entonces es evidencia de que
la elección más conveniente del nivel de A depende del nivel en que esté B, y viceversa. Es decir, eso es
evidencia de que los factores de A y B interactúan sobre Y. En la práctica, el cálculo del efecto A en
cada nivel de B no se hace, y más bien se calcula el efecto global de la interacción de los dos factores,
que se denotan por AB y se calculan como la diferencia entre la respuesta media cuando ambos factores
se encuentran en el m ismo nivel: (-1, -1); (1, 1), y la respuesta media cuando los factores se encuentran
en niveles opuestos: (-1, 1) (1, -1). Para el ejemplo, el efecto de interacción levadura x temperatura está
dado por:
28+45 41+ 63 −31

AB= − = =−15.5
2 2 2
Los valores absolutos (sin importar el signo) de los efectos principales y del efecto de interacción son
una medida de importancia de su efecto sobre la variable de respuesta. Sin embargo, como se tienen
estimaciones muestrales, para saber si los efectos son estadísticamente significativos (diferentes de coro)
se requiere el análisis de varianza (ANOVA).
Modelo estadístico
Con un diseño factorial axb se pueden estudiar los dos efectos individuales y el efecto de interacción de
ambos factores. En términos estadísticos, lo que se afirma es que el comportamiento de la respuesta Y
en el experimento con k réplicas se podría describir mediante el modelo de efectos:
Y ijk =μ+α i+ β j+(αβ)ij + ε ijk
donde μ es la media general, α ies el efecto debido al i-ésimo nivel del factor A, β j es el efecto del j-
ésimo nivel del factor B, (αβ )ij representa al efecto de interacción en la combinación ij y ε ijk es el error
aleatorio que supone sigue una distribución con media cero y varianza constante σ 2 ( N ( 0 ,σ 2 ) ) y son
independientes entre sí. Para que la estimación de los parámetros en este modelo sea única, se
introducen las restricciones:
a b a b
∑ αi=0 ∑ β i=0 ∑ ∑ ( αβ )ij=0

i=1 j=1 i=1 j=1
Es decir, los efectos dados en el modelo son desviaciones respecto de la media global. Puede usarse el
análisis de varianza para probar hipótesis relativas a los efectos principales de los factores A y B y la
interacción AB. En este modelo, las hipótesis de interés para los tres efectos son:
Ho: A=0
H 1: A ≠ 0
Ho: B=0
H 1: B ≠ 0
pág. 170
Ho: AB=0
H 1: AB ≠ 0
Estas hipótesis se prueban mediante la técnica de análisis de varianza que para un diseño factorial axb
con n réplicas resulta de descomponer la variación total como:
SCT =SC A + SC B + SC AB+ SC E
donde los respectivos grados de libertad de cada una de ellas son:
nab−1=( a−1 ) + ( b−1 ) + ( a−1 ) ( b−1 )+ ab(n−1)
El factor (n−1) en los grados de libertad de la suma de cuadrados del error SC E señala que se necesitan
al menos dos réplicas del experimento para calcular ese componente y, por ende, para construir una tabla
de ANOVA. Recordemos que las sumas de cuadrados divididas entre sus correspondientes grados de
libertad se llama cuadrados medios CM. Al dividir éstos entre el cuadrado medio del error CM E se
obtienen estadísticos de prueba con distribución F. Toda esta información se sintetiza en la siguiente
tabla:
Considere que:
1
A=
2n
[ ab+a−b−( 1 ) ]
1
B=
2n
[ ab+ b−a− (1 ) ]
1
AB=
2n
[ ab+ (1 )−a−b ]
ANOVA para el diseño factorial axb

Factor de Grados de Valor
Suma de Cuadrados Cuadrado Medio
Variación Libertad de F
2
[ ab+a−b−( 1 ) ] CM A
Efecto A SC A = 1 CM A=SC A
4n CM E
2
[ ab+b−a−( 1 ) ] CM B
Efecto B SC B= 1 CM B=SC B
4n CM E
2
[ ab + ( 1 )−a−b ] CM AB
Efecto AB SC AB = 1 CM AB=SC AB
4n CM E
SC E
Error SC E=SC T −SC A−SC B−SC AB 4 (n−1) CM E =
4(n−1)
a b n 2
T ...
SCT =∑ ∑ ∑ T ijk −
2 2
Total n∗2 −1
i=1 j=1 k =1 4n
pág. 171
pág. 172
Ejemplo #95: Considere la investigación del efecto de la concentración del reactivo y de la cantidad del
catalizador sobre la conversión (rendimiento) de un proceso químico. Sea la concentración del reactivo
el factor A, y sean 15 y 25 por ciento los dos niveles de interés. El catalizador es el factor B, con el nivel
alto denotando el uso de 2 libras del catalizador y el nivel bajo denotando el uso de 1 libra. Se hacen tres
réplicas del experimento, y los datos son los siguientes:
Factor Réplicas
Combinación de Total
A B I II III
tratamientos
15 (-) 1 (-) A bajo, B bajo (-1,-1) 28 25 27 80
25 (+) 1 (-) A alto, B bajo (1,-1) 36 32 32 100
15 (-) 2 (+) A bajo, B alto (-1,1) 18 19 23 60
25 (+) 2 (+) A alto, B alto (1,1) 31 30 29 90
Considere un nivel de significancia del 0.05
Solución:
(-1,1) (1,1)
60 b 90 ab
Cantidad de
catalizador B
80 (1) 100 a
(-1,-1) Concentración del (1,-1)
reactivo A
Datos:
(1)=80 a=100 b=60 ab=90
Cálculos:
1
A=
2n
[ ab+a−b−( 1 ) ]= 1 [ 90+100−60−80 ] =8.33333
2(3)
1 1
B=
2n
[ ab+ b−a− (1 ) ] = [ 90+60−100−80 ] =−5
2 (3)
1 1
AB=
2n
[ ab+ (1 )−a−b ] = [ 90+ 80−100−60 ]=1.66666
2(3)
pág. 173
El efecto de A (concentración del reactivo) es positivo; esto sugiere que al incrementar A del nivel bajo
(15%) al nivel alto (25%), el rendimiento se incrementará. El efecto de B (catalizador) es negativo; esto
sugiere que al incrementar la cantidad del catalizador que se agrega al proceso se reducirá el
rendimiento.
2
SC A =
[ ab+a−b−( 1 ) ] =
[ 90+ 100−60−80 ] 2
=208.33333
4n 4 (3 )
SC B =
[ ab+b−a−( 1 ) ] =
[ 90+ 60−100−80 ]2
=75
4n 4(3)
2
SC AB =
[ ab + ( 1 )−a−b ] =
[ 90+80−100−60 ] 2
=8.33333
4n 4 (3)
a b n 2
T ... 108900
SCT =∑ ∑ ∑ T ijk −¿
2
=9398− =323 ¿
i=1 j=1 k =1 4n 12
SC E=SC T −SC A−SC B−SC AB=323−208.33333−75−8.33333=31.33333
ANOVA para el diseño factorial axb

Factor de Grados de
Suma de Cuadrados Cuadrado Medio Valor de F
Variación Libertad
Efecto A SC A =208.33333 1 CM A=208.33333 53.1915
Efecto B SC B=75 1 CM B=75 19.1489
Efecto AB SC AB =8.33333 1 CM A=8.33333 2.1276
Error SC E=31.33333 8 CM E =3.91666
Total SCT =323 11
Zona de Contraste: fα,glA,glE=f0.05,1,8=5.318
pág. 174
F, df1=1, df2=8
0.4
0.3
Densidad
0.2
0.1
0.05
0.0
0 5.318
X
Conclusión: “Con un nivel de significancia del 5%, existe suficiente evidencia estadística para
determinar que la concentración del reactivo y la cantidad del catalizador afectan significativamente el
rendimiento en el proceso. El factor que se debe analizar es la concentración del reactivo”.
Instrucciones para Minitab 18©: https://www.youtube.com/watch?v=TBu_xC1iUGA
Respuestas en Minitab 18©:
Diseño factorial completo

Resumen del diseño
Factores: 2 Diseño de la base: 2, 4
Corridas: 12 Réplicas: 3
Bloques: 1 Puntos centrales (total): 0
Todos los términos están libres de estructuras alias.
Regresión factorial: Réplicas vs. Concentración, Catalizador

Modelo 3 291.667 97.222 24.82 0.000
Lineal 2 283.333 141.667 36.17 0.000
Concentración 1 208.333 208.333 53.19 0.000
Catalizador 1 75.000 75.000 19.15 0.002
Interacciones de 2 términos 1 8.333 8.333 2.13 0.183
1 8.333 8.333 2.13 0.183
Concentración*Catalizador
Error 8 31.333 3.917
pág. 175
Total 11 323.000
pág. 176
Zona de Contraste: fα,glA,glE=f0.05,1,8=5.318
F, df1=1, df2=8
0.4
0.3
Densidad
0.2
0.1
0.05
0.0
0 5.318
X
Resumen del modelo

R-cuad. R-cuad.
1.9790 90.30% 86.66% 78.17%
6
Coeficientes codificados
EE del
Término Efecto Coef coef. Valor T Valor p FIV
Constante 27.500 0.571 48.14 0.000
Concentración 8.333 4.167 0.571 7.29 0.000 1.00
Catalizador -5.000 -2.500 0.571 -4.38 0.002 1.00
Concentración*Catalizado 1.667 0.833 0.571 1.46 0.183 1.00
r
Ecuación de regresión en unidades no codificadas

Réplicas = 27.500 + 4.167 Concentración - 2.500 Catalizador + 0.833 Concentración*Catalizador
Estructura de alias
Factor Nombre
A Concentración
B Catalizador
Alias
I
A
B
pág. 177
AB
Pareto de los efectos para Réplicas
Diagrama de Pareto de efectos estandarizados

(la respuesta es Réplicas, α = 0.05)
Término 2.306
Factor Nombre
A Concentración
B Catalizador
A
AB
0 1 2 3 4 5 6 7 8
Efecto estandarizado
Gráficas de residuos para Réplicas
Gráficas de residuos para Réplicas

99
90 2
Porcentaje
Residuo
50
0
10
-2
1
-5.0 -2.5 0.0 2.5 5.0 20 25 30 35

4
2
3
Frecuencia
Residuo
2
0
-2
0
-2 -1 0 1 2 3 1 2 3 4 5 6 7 8 9 10 11 12
pág. 178
Gráfica de efectos principales para Réplicas

Medias ajustadas
Concentración Catalizador
32
31
30
Media de Réplicas
29
28
27
26
25
24
23
A bajo A alto B bajo B alto
Gráfica de interacción para Réplicas

Medias ajustadas
Concentració * Catalizador Catalizador
34 B bajo
B alto
32
Media de Réplicas
30
28
26
24
22
20
A bajo A alto
Concentració
pág. 179
Ejemplo #96: Un bacteriólogo está interesado en los efectos de dos medios de cultivo diferentes y dos
tiempos diferentes sobre el crecimiento de un virus particular. Realiza seis réplicas de un diseño 2 2,
haciendo las corridas de manera aleatoria. Analizar los datos del crecimiento viral que se presentan
enseguida y sacar las conclusiones apropiadas. Analizar los residuales y comentar la adecuación del
modelo. α=0.05
Tiempo (h) Medio de cultivo

1 2
21 22 25 26
12 23 28 24 25
20 26 29 27
37 39 31 34
15 38 38 29 33
35 36 30 35
Factor Réplicas
A B Combinación de tratamientos I II III Total

15 (-) 1 (-) A bajo, B bajo 28 25 27 80
25 (+) 1 (-) A alto, B bajo 36 32 32 100
15 (-) 2 (+) A bajo, B alto 18 19 23 60
25 (+) 2 (+) A alto, B alto 31 30 29 90
pág. 180
pág. 181

Análisis de Datos Experimentales 2021-A

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Análisis de Datos Experimentales 2021-A

Cargado por

Copyright:

Formatos disponibles

Análisis de Datos Experimentales

M. en C. José Antonio Cuatepotzo Varela

1. Estadística descriptiva y fundamentos de probabilidad...........................................................................2

1. Estadística descriptiva y fundamentos de probabilidad

1.1 Conceptos básicos

El objetivo de la Estadística es medir y modelar la variabilidad del proceso mediante un modelo

 Planteamiento del problema.

Puede definirse la Inferencia Estadística como:

La importancia de la Estadística en la Ingeniería, la Ciencia y la Administración ha sido subrayada por la

1.2 Medidas de tendencia central para datos agrupados y no agrupados

Media de datos no agrupados

Ejemplo #1: Un experimento en el que un ingeniero agrega un polímero de látex a un mortero de

16.85+16.4+17.21+16.35+ 16.52+ 17.04+16.96+17.15+ 16.96+16.57

Media de datos agrupados

Intervalo Frecuencia Fi Mi Fi*Mi

Mediana de datos no agrupados

Mediana de datos agrupados

Egresado Sueldo Mensual Egresado Sueldo Mensual

Moda de datos no agrupados

Moda de datos agrupados

Rango de datos no agrupados

El rango muestral es: R = 5.2 – 2.= 3.2

Desviación media de datos no agrupados

Ejemplo #8: Un experimento en el que un ingeniero agrega un polímero de látex a un mortero de

Desviación media de datos agrupados

Intervalo Frecuencia Fi Mi Fi*Mi Mi-X |Mi-X| Fi*|Mi-X|

Varianza y Desviación Estándar de datos no agrupados

Varianza y Desviación Estándar de datos agrupados

Intervalo Frecuencia Fi Mi Fi*Mi Mi-X (Mi-X)2 Fi*(Mi-X)2

Coeficiente de Variación en datos no agrupados

El coeficiente de variación también llamado coeficiente de dispersión, es una medida de variación

Intervalo Frecuencia Fi Mi Fi*Mi Mi-X (Mi-X)2 Fi*(Mi-X)2

1.3 Representación gráfica de datos

105 221 183 186 121 181 180 143

1.- ¿Qué podemos hacer con estos datos?

Diagrama Tallo – Hoja

76 123 145 154 163 172 181 200

Para un diagrama de frecuencias se necesita:

1).- Intervalo de clase.

Conteo: es el número de datos que están dentro el intervalo de clase.

Intervalo de Clase Conteo Frecuencia F. Relativa F. R. Acumulada

Histograma de Frecuencias Relativas Acumuladas

Medidas de tendencia central para datos agrupados y no agrupados

A continuación, aplicaremos medidas de tendencia central para el ejemplo #14:

Intervalo de Clase Fi Mi Fi*Mi Mi-X (Mi-X)2 Fi*(Mi-X)2 |Mi-X| Fi*|Mi-X|

76 ≤ x < 94.7777 2 85.38885 170.7777 -77.927473 6072.691 12145.3819 77.927473 155.85495

226.222 ≤ x ≤ 245 4 235.6108 942.4432 72.2944775 5226.4915 20905.9659 72.294478 289.17791

Diagrama de Caja – Bigotes

Diagrama de caja del ejemplo #14:

1.4 Permutaciones y combinaciones

Existen 35 combinaciones de comprar 3 de 7 álbumes digitales de Bad Bunny.

El estudiante puede responder este examen de 495 formas.

a) Ocho aciertos y cuatro errores:

b) Diez aciertos y dos errores:

a) Ninguna de las baterías defectuosas:

b) Una de las baterías defectuosas:

a) Una permutación de X es una ordenación de los n elementos x1, x2, .... xn

P= (nr)= ( n−rn! ) ! =( 203)= ( 20−3

P= (nr)= ( n−rn! ) ! =( 103)= (10−3

P= (nr)= ( n−rn! ) ! =( 114)= ( 11−4

P= (nr)= ( n−rn! ) ! =( 284)= ( 28−4

P= (nr)= ( n−rn! ) ! =( 93)= ( 9−3

a) ¿De cuantas maneras distintas puede ir al trabajo y regresar?:

Intervalo Frecuencia Fi Mi FiMi Mi-X |Mi-X| Fi|Mi-X|

Intervalo Frecuencia Fi Mi FiMi Mi-X (Mi-X)2 Fi(Mi-X)2

Intervalo Frecuencia Fi Mi FiMi Mi-X (Mi-X)2 Fi(Mi-X)2

Intervalo de Clase Fi Mi FiMi Mi-X (Mi-X)2 Fi(Mi-X)2 |Mi-X| Fi*|Mi-X|