Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA APLICADA
Notas de clase
2017
Introducción
El presente trabajo está basado en las antiguas notas de clase del curso de Estadı́stica Aplicada,
el cual según el nuevo plan de estudios se subdivide ahora en los cursos de Estadı́stica Aplicada 1
y Estadı́stica Aplicada 2. Estas notas son la sı́ntesis de varios semestres de cátedra que el autor ha
desarrollado en la Facultad de Ciencias e Ingenierı́a de la Pontificia Universidad Católica del Perú. Si
bien el curso está principalmente dirigido a estudiantes de Ingenierı́a Industrial, su contenido puede
ser también útil para estudiantes o profesionales de otras áreas de la Ingenierı́a, la Administración o
la Economı́a.
La Estadı́stica, como campo de estudio, se puede definir como el arte y la ciencia de dar sentido
a los datos. Ella nos proporciona un conjunto de métodos, técnicas o procedimientos para recopilar,
organizar, presentar y analizar datos a fin de describirlos o realizar con ellos generalizaciones válidas.
Estos aspectos resultan invaluables para todo profesional, pues es finalmente la evidencia empı́rica
la que brinda al profesional la información necesaria para que tome decisiones.
Los tópicos que cubriremos en el curso recaen básicamente en el análisis de los datos e intentan dar
una introducción a las distintas técnicas estadı́sticas que se emplean en campos tan diversos como el
control de calidad, la investigación de operaciones, la simulación de sistemas, la teorı́a de decisiones y
la planificación entre otros. Dada la gran diversidad de aplicaciones en el campo Industrial, no existe
en la actualidad un texto que englobe de manera fundamentada, práctica y aplicada tales puntos.
Estas notas de clase, que pretenden precisamente cubrir tal vacı́o, introducen también como novedad
el uso intensivo del software estadı́stico libre R.
1. ESTADÍSTICA DESCRIPTIVA 1
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3. Organización de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.1. Distribución de frecuencias para el caso cualitativo . . . . . . . . . . . . . . . . 3
1.3.2. Distribución de frecuencias para el caso cuantitativo discreto . . . . . . . . . . 4
1.3.3. Diagramas de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.4. Distribución de frecuencias para el caso cuantitativo continuo . . . . . . . . . . 7
1.4. Una breve introducción a R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5.1. La media aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5.2. La mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.5.3. La moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6. Cuantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.7. Medidas de Dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.7.1. La varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.7.2. La desviación estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.7.3. El Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.7.4. El Rango intercuartı́l . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.7.5. El coeficiente de variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.8. Medidas de asimetrı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.8.1. El coeficiente de asimetrı́a de Pearson . . . . . . . . . . . . . . . . . . . . . . . 28
1.8.2. El coeficiente de asimetrı́a de Fisher . . . . . . . . . . . . . . . . . . . . . . . . 29
1.9. Curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.9.1. El coeficiente de curtosis de Pearson . . . . . . . . . . . . . . . . . . . . . . . . 30
1.9.2. El coeficiente de curtosis de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.10. Puntajes estandarizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.11. Tratamiento con datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.12. Diagramas de cajas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.13. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3
2. NOCIONES DE PROBABILIDAD 45
2.1. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2. Definición axiomática de probabilidad y propiedades . . . . . . . . . . . . . . . . . . . 46
2.3. Cálculo de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.1. Definición clásica de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.2. Definición frecuencial de probabilidad . . . . . . . . . . . . . . . . . . . . . . . 49
2.4. Técnicas de conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.5. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5.1. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.5.2. Los teoremas de probabilidad total y Bayes . . . . . . . . . . . . . . . . . . . . 56
2.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3. VARIABLES ALEATORIAS 63
3.1. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.2. Funciones de probabilidad, densidad y distribución . . . . . . . . . . . . . . . . . . . . 64
3.3. Valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.4. Distribuciones discretas importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.4.1. Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.4.2. Distribución de Pascal o binomial negativa. . . . . . . . . . . . . . . . . . . . . 69
3.4.3. Distribución hipergeométrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.4.4. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.5. Distribuciones continuas importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.5.1. Distribución uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.5.2. Distribución exponencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.5.3. Distribución gamma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.5.4. Distribución beta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5.5. Distribución de Weibull. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5.6. Distribución normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5.7. Distribución lognormal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.6. Distribuciones y R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.7. Aplicación a la confiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4. DISTRIBUCIONES MUESTRALES 91
4.1. Propiedades de la distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.2. Distribuciones muestrales asociadas a la normal . . . . . . . . . . . . . . . . . . . . . . 92
4.2.1. La distribución chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.2.2. La distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.2.3. La distribución F de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
0
ESTADÍSTICA DESCRIPTIVA
1.1. Introducción
Como comentamos la Estadı́stica es la ciencia y el arte de dar sentido a los datos. Si bien algunos
autores consideran la Estadı́stica como una rama de las Matemáticas en la que se requieren hacer
ciertos cálculos, no existe siempre una regla fija de como hacer estos y por tanto uno podrı́a imaginar
y utilizar diversas herramientas para tal fin, muy en especial cuando la intención es mostrar lo que
los datos esconden. En tal sentido, el pensamiento estadı́stico difiere al matemático y su dominio
recae mucho en la práctica y el conocimiento del problema a enfrentar.
Desde una clasificación muy general uno podrı́a hablar de Estadı́stica Descriptiva y de Estadı́stica
Inferencial. La primera, como su nombre lo indica, busca simplemente describir o encontrar patrones
en un conjunto de datos; mientras que la segunda busca extrapolar resultados a una población en
base a las observaciones que se realicen de una parte de ella (muestra). Para que ello sea posible
y podamos confiar en tales resultados es necesario que la muestra sea probabilı́stica, en el sentido
de que siempre podamos saber con que probabilidad cualquier elemento en la población será se-
leccionado. Nuevamente, el esquema de selección que garantice que la muestra represente bien a
la población dependerá de distintos criterios que artı́sticamente el estadı́stico deberá de diseñar o
controlar. En nuestro curso, por simplicidad, tal esquema será usualmente el de una asignación com-
pletamente al azar; es decir, en el cual cualquier elemento en la población tendrá la misma chance
de ser seleccionado.
1
2
x1 , x2 , ..., xn
Si bien los datos son números (aunque a veces no parece ser necesario el usarlos y ocasionalmente
podrı́amos usar otros sı́mbolos o textos), ellos no pueden manipularse arbitrariamente si saber lo
que en realidad están midiendo. En tal sentido es importante clasificar, para un futuro análisis, a las
variables como resumidamente detallamos a continuación:
Variables cuantitativas: Toman valores numéricos con los que se pueden realizar operaciones
aritméticas. Se dividen en
• Discretas. Aquellas variables que toman un número enumerable finito o infinito de valo-
res. Usualmente se consideran números enteros.
• Continuas. Aquellas variables que pueden asumir cualquier valor dentro de un intervalo
de valores, por lo que pueden tomar un número no enumerable de valores.
Variables cualitativas: Toman como valores categorı́as que representan una clasificación en
la población. Si bien estas pueden representarse por números, estos no admiten operaciones
aritméticas. Las variables cualitativas se denominan:
Algunos ejemplos de variables cualitativas son el genero, estado civil, profesión, nivel educativo,
nivel de satisfacción y liderazgo. De estas las tres primeras son nominales; mientras que las tres últi-
mas ordinales. De otro lado, algunos ejemplos de variables cuantitativas son el peso, la temperatura,
el tiempo de vida y el número de accidentes, donde sólo la última es discreta.
ESTADISTICA APLICADA Luis Valdivieso 3
Si la variable es cualitativa, una tabla de frecuencias está constituida por una lista de sus posibles
categorı́as j acompañadas del número de veces nj , proporción fj o porcentaje pj de veces en que
estas ocurren. Si asumimos que la variable tiene k categorı́as usaremos la notación:
Gráfico de barras. A cada categorı́a se la identifica con una barra cuya altura es proporcional a
la frecuencia con que ocurre. En este tipo de gráficos se suele dejar un espacio entre las barras
para indicar que se está presentando información de una variable cualitativa.
Gráfico de sectores circulares. A cada categorı́a se la representa por un sector del cı́rculo
proporcional a la frecuencia con que ocurre.
Ejemplo 1.1 Durante un mes se ha monitoreado el estado de la calidad del aire en una ciudad,
estos fueron los resultados:
Bueno Moderado Bueno Malo Moderado Malo
Malo Moderado Malo Moderado Malo Moderado
Moderado Moderado Moderado Malo Muy Malo Malo
Moderado Moderado Malo Moderado Moderado Malo
Malo Moderado Moderado Bueno Moderado Malo
Obtenga su distribución de frecuencias y los gráficos de barras y sectores circulares.
Solución: En este caso la variable x, que denota a la clasificación de la calidad del aire, es una variable
cualitativa de nivel ordinal. En este caso se sugiere ordenar las categorı́as desde la que represente al
menor valor hasta la del mayor valor. En el caso nominal el orden es arbitrario. La distribución de
frecuencias para los datos de esta variable viene dada por:
4
Esta puede también representarse gráficamente, ya sea por un gráfico de barras o por uno de sectores
circulares. Estas se ilustran en las Figuras 1.1 y 1.2.
8
6
4
2
0
En este caso la distribución de frecuencias es similar al caso cualitativo, siempre que el número
de valores que tome la variable de interés no sea demasiado grande. La diferencia radica en la
representación gráfica y la posibilidad de también considerar no sólo frecuencias simples sino también
acumuladas1 . Estas ultimas las definiremos como:
Nj : Frecuencia (absoluta) acumulada para el valor j, calculada como el número de casos que
P
toman un valor menor o igual que j; esto es, Nj = jh=1 nh .
1
Opcionalmente estas podrı́an también considerarse para la distribución de frecuencias de una variable cualitativa
ordinal.
ESTADISTICA APLICADA Luis Valdivieso 5
Malo 36.7 %
Bueno 10 %
Moderado 50 %
Fj : Frecuencia relativa acumulada para el valor j, calculada como la proporción de casos que
P
toman un valor menor o igual a j; esto es, Fj = jh=1 fh .
Pj : Porcentaje acumulado para la clase j, calculada como el porcentaje de casos que toman un
P
valor menor o igual que j; esto es, Pj = jh=1 ph ó Pj = 100 × Fj .
Ejemplo 1.2 En cierto distrito se registró durante un mes el número de accidentes de tránsito por
dı́a, encontrándose los datos siguientes:
1 2 0 3 1 0 1 0 4 2 1 1 2 0 1
1 0 3 1 1 0 2 1 0 4 0 1 2 2 2
Solución: Note que la variable subyacente x = número de accidentes de tránsito por dı́a es cuantitativa
discreta y puede tomar sólo los valores: 0, 1, 2, 3 y 4. A continuación presentamos la tabla de
frecuencias para el conjunto de datos dados:
La información contenida en esta tabla la representaremos ahora por un gráfico de bastones. Este
es básicamente un gráfico de barras que en lugar de barras utiliza bastones debido a que la cantidad
de valores que la variable de interés podrı́a tomar es usualmente mayor al del caso cualitativo.
6
4
2
0
0 1 2 3 4
Ejemplo 1.3 Consideremos la siguiente distribución de frecuencias de las fallas encontradas en los
productos devueltos por reclamo de garantı́a de un aparato electrónico,
Solución: Como primer paso podrı́amos ordenar las categorı́as de la variable x = causa del problema,
desde la más frecuente a la menos frecuente incluyendo los porcentajes y porcentajes acumulados.
Ello nos da
Si la variable de interés es cuantitativa continua difı́cilmente será posible encontrar dos valores
en el conjunto de datos que tomen exactamente el mismo valor. Por esta razón todo el tratamiento
anteriormente carecerı́a de sentido ya que prácticamente todas las frecuencias observadas serı́an 1
y tendrı́amos una tabla tan grande como el número de datos con el que contamos. Para solucionar
ello se acostumbra mas bien agrupar las observaciones en clases o intervalos. Una práctica común, es
convenir que los intervalos sean de igual longitud y naturalmente uno necesitará de más intervalos
mientras más datos tenga. Bajo esta convención el procedimiento para construir una distribución de
frecuencias por intervalos es el siguiente:
8
Determinar el rango de los datos; es decir, la longitud del menor intervalo, R =máx − mı́n,
que contenga a todos ellos.
R
Determinar el ancho de los intervalos, c = . Es importante considerar aquı́ de que esta
k
cantidad se debe de redondear por exceso al número de decimales de los datos, pues de lo
contrario podrı́amos correr el riesgo de perder uno o más de los datos mayores.
Usar c para construir los intervalos de cada clase. En este caso consideraremos intervalos
cerrados por la derecha y abiertos por la izquierda, con excepción del primero que es cerrado en
ambos lados. Si bien convendremos en que todos los intervalos serán de igual longitud, en ciertas
situaciones, como el caso de una distribución con colas pesadas, podrı́a ser más conveniente
considerar intervalos de distinta longitud.
Construir la tabla, calculando los puntos medios de cada intervalo (marcas de clase) y las
frecuencias absolutas y acumuladas para cada intervalo.
fj : Frecuencia relativa para el intervalo j, calculada como fj = nj /n, siendo n el número total
de datos.
j
X
Nj : Frecuencia acumulada para el intervalo j, calculada como Nj = nh .
h=1
j
X
Fj : Frecuencia relativa acumulada para el intervalo j, calculada como Fj = fh .
h=1
j
X
Pj : Porcentaje acumulado para el intervalo j, calculado como Pj = ph .
h=1
Histograma. Gráfico de barras, donde cada intervalo j es representada por una barra sobre él
y altura proporcional a su frecuencia nj . Este tipo de gráficos no considera espacios entre las
barras para indicar que se presenta información de una variable cuantitativa continua.
Polı́gono de frecuencias. Se forma uniendo con rectas los puntos medios altos de cada barra
del histograma y es útil para ver la forma de la distribución. Convendremos que este empieza
en el menor valor de los datos y termina en el extremo derecho del último intervalo.
Gráfico de frecuencias acumuladas u ojiva. Se forma uniendo con rectas los puntos conformados
por las frecuencias acumuladas y los limites superiores de cada intervalo.
Ejemplo 1.4 Recientemente se ha inaugurado un puesto de control de pesaje en un punto de una ca-
rretera cercana a una mina. Hasta el momento en este puesto se ha registrado los pesos, en toneladas,
de 60 vehı́culos junto con información del tipo del vehı́culo. Los datos son:
10
Tipo Peso Tipo Peso Tipo Peso Tipo Peso Tipo Peso
Camioneta 24.65 Camioneta 21.98 Camioneta 26.59 Camión 30.18 Camión 34.36
Auto 8.07 Camioneta 22.45 Camioneta 26.72 Camión 30.34 Bus 34.95
Auto 11.66 Auto 23.34 Auto 14.23 Auto 17.35 Camión 35
Auto 13 Camioneta 23.35 Camioneta 27.09 Camión 30.47 Camioneta 23.76
Auto 13.46 Camioneta 23.55 Camión 27.18 Camión 30.72 Camión 35.8
Camioneta 27.05 Camión 35.49 Camión 28.58 Bus 31.36 Camión 36.7
Auto 15.59 Camioneta 24.4 Camión 48 Camión 31.46 Camión 37
Camión 30.37 Camioneta 24.6 Bus 28.98 Bus 31.72 Camión 38.09
Auto 18.96 Auto 4.34 Camión 29.07 Camión 32.27 Camión 39.98
Camioneta 19.98 Camioneta 25 Bus 29.4 Bus 33.31 Camión 43.56
Camioneta 20.17 Camioneta 25.62 Camión 29.5 Camión 33.32 Camión 47.35
Camioneta 21.5 Camioneta 26.22 Camión 29.62 Camión 34.34 Camión 28.8
Obtenga la distribución de frecuencias de los pesos de estos vehı́culos con sus gráficos correspondientes
¿Qué es lo que el polı́gono de esta distribución le dice?
Solución: Asumiendo que no tenemos experiencia en el manejo de datos y no se nos indica cuantos
intervalos usar, la regla de Sturges nos sugiere que el número de intervalos a considerar es k =
1 + 3.3 log10 (60) = 6.867 ≈ 7. Dado que tenemos como valores mı́nimo 4.34 toneladas y máximo 48
toneladas, el rango es R = 48 − 4.34 = 43.66 y el ancho de cada intervalo es:
43.66
c= = 6.237143
7
Puesto que nuestros datos tiene dos decimales, debemos aproximar esta cantidad por exceso a esta
cantidad de decimales. Esto es el valor de c será c = 6.24 A partir de esto debemos de construir
ahora los intervalos y realizar el conteo de cuantos datos caen en cada intervalo (los nj ’s). Si los
datos estuvieran ordenados este conteo serı́a inmediato. Naturalmente si trabajamos en R o Excel
podrı́amos ordenar primero los datos, pero si lo hacemos de forma manual ello no es muy recomen-
dable, ya que nos demorarı́amos más probablemente en ordenarlos que en realizar directamente el
conteo. La distribución de frecuencias será
Intervalo Marca Frec. Frec. Porcentaje Frec. Frec. Rel. Porcentaje
de clase relativa acum. acumulada acumulado
x̂j nj fj pj Nj Fj Pj
[ 4.34, 10.58] 7.46 2 0.0333 3.33 2 0.0333 3.33
]10.58, 16.82] 13.70 5 0.0833 8.33 7 0.1167 11.67
]16.82, 23.06] 19.94 7 0.1167 11.67 14 0.2333 23.33
]23.06, 29.30] 26.18 19 0.3167 31.67 33 0.55 55
]29.30, 35.54] 32.42 19 0.3167 31.67 52 0.8667 86.67
]35.54, 41.78] 38.66 5 0.0833 8.33 57 0.95 95
]41.78, 48.02] 44.90 3 0.05 5 60 1 100
Total 60 1 100
ESTADISTICA APLICADA Luis Valdivieso 11
Se puede observar
Que las frecuencias, van cambiando a partir del valor 2 en el primer intervalo hasta alcanzar
el valor 19 en los intervalos 4 y 5 para luego decrecer en los intervalos 6 y 7. Esto sugiere que
la mayorı́a de vehı́culos tienen pesos entre los intervalos 4 y 5 (de 23.06 a 35.54 toneladas).
Que existen pocos vehı́culos con pesos bajos ó altos. Estos resultados también se pueden ob-
servar si analizamos las frecuencias relativas y los porcentajes.
Otras posibles interpretaciones que podemos hacer son: solamente el 3.33 % de los vehı́culos
tienen pesos que no superan las 10.58 toneladas; mientras que el 45 % de los vehı́culos tienen
pesos que no superan las 29.3 toneladas
La información contenida en esta tabla se presenta también en forma gráfica en la siguiente figura
Distribución de frecuencias
de los pesos de los vehículos
20
15
Frecuencia
10
5
0
peso
Figura 1.5: Histograma y polı́gono de frecuencias para la distribución de los pesos de los 60 vehı́culos
en el control de peaje.
El polı́gono indica una distribución asimétrica para los datos, con una concentración de valores
en pesos relativamente altos y una cola a la izquierda; es decir con muy pocos valores con pesos
bajos.
La Ojiva de esta distribución, que la daremos en términos de porcentajes acumulados, se ilustra
en la figura 1.6.
2
100
80
Porcentaje acumulado
60
40
20
0
Peso en toneladas
Figura 1.6: Ojiva para la distribución de los pesos de los 60 vehı́culos en el control de peaje.
estadı́sticos y gráficos. R es un software open source que es mantenido por muchos contribuyentes
y debe su popularidad a ser precisamente libre (no requiere de pago ni registro alguno) y a que es
constante actualizado gracias a los nuevos desarrollos que demorarı́an años en ser implementados en
un software estadı́stico comercial. R puede ser instalado en Windows, Mac o Linux a través de su
página web
http://www.R-project.org
Aquı́ también se pueden encontrar manuales, tutoriales y todo tipo de información concerniente a
este software. La página web de R se aprecia en la figura 1.7.
Para instalar el sistema base, uno sólo tiene que ir al sitio web de R y seguir las instrucciones de
instalación. Adicionalmente al sistema base se tiene una serie de paquetes adicionales de contribu-
yentes. Un paquete es una colección de funciones, ejemplos y documentación que usualmente están
enfocados en realizar una tarea especı́fica. El sistema base contiene solamente algunos paquetes. Para
instalar un paquete adicional, por ejemplo el paquete qcc, útil en control de calidad, basta escribir:
> install.packages("qcc")
Si no ha sido configurado antes, aparecerá una ventana para seleccionar el mirror más cercano, luego
todo es automático. Antes de usar un paquete es necesario cargarlo en la consola mediante
> library(qcc)
La consola de R es dónde se realizan los diferentes cálculos. Cuando una expresión es introducida a
la consola ella es seguidamente evaluada. Dependiendo de la expresión, el sistema puede responder
mediante la salida de resultados a esta o la creación de un gráfico en una nueva ventana. Luego otra
expresión es ingresada y evaluada. Algo que ahorra mucho tiempo es recordar que las expresiones
previamente ingresadas pueden volverse a obtener presionando la flecha hacia arriba y que cualquier
procedimiento puede interrumpirse usándose la tecla Esc.
Un primer uso que haremos de R será como calculadora. R contiene todas las formas conocidas de
funciones básicas como el logaritmo natural (log), raı́z cuadrada (sqrt), coseno (cos), etc. Aquı́ unos
cálculos en la consola:
> 5/4
[1] 1.25
> log(2) ; cos(pi) ; ceiling(3.2)
[1] 0.6931472
[1] -1
[1] 4
Note que podrı́amos introducir varias expresiones en una misma lı́nea si es que los separamos por un
punto y coma.
Comúnmente se crean en R objetos y se aplican a estos funciones. Para asignar un nombre x a
un objeto usar x < − objecto, (objecto − > x) ó x = objeto. Las funciones, por otro lado, se llaman
mediante:
Toda función tiene un conjunto formal de argumentos con valores por defecto. Véase la documentación
de la función con ?nombrefuncion ó help(nombrefuncion). Es importante indicar que R distingue
mayúsculas de minúsculas. Como ilustración, supongamos deseamos encontrar la media aritmética
de un conjunto de números (suma de estos números divididos entre la cantidad total de ellos).
Primero asignamos el vector de números con el nombre x y el comando c. Luego llamamos a la
función mean().
14
> x[2]
[1] 5
> x[c(2,5)]
[1] 5 1
Si deseamos los elementos de x mayores a 5 o los elementos de x en los que y sea mayor o igual a 4,
bastará escribir
> x[x>5]
[1] 7 9 8
> x[y>= 4]
[1] 0 9 1 8
Definimos ahora a y como una matriz A de orden 4 × 2 a través del comando matrix y obtengamos
su segunda columna
> A = matrix(y,nrow=4,ncol=2)
> A
ESTADISTICA APLICADA Luis Valdivieso 15
[,1] [,2]
[1,] 4 5
[2,] 2 3
[3,] 0 10
[4,] 9 3
> A[,2]
[1] 5 3 10 3
Note que los elementos de y son por defecto ingresados por columnas. En caso que se desee el ingreso
por filas escribir
> A = matrix(y,4,2,byrow=TRUE)
> A
[,1] [,2]
[1,] 4 2
[2,] 0 9
[3,] 5 3
[4,] 10 3
En adelante será común omitir el sı́mbolo del cursor >, esto para que los comandos que escribamos
puedan ser fácilmente copiados, pegados y reproducidos.
Veamos ahora cómo recrear los ejemplos anteriormente dados en R. Un primer punto estará re-
ferido a cómo introducir la data. Ello se puede hacer directamente en R o indirectamente con otro
software (por ejemplo con Excel) para luego importar esta data a R. Vemos la primera estrategia
para el ejemplo 1.2. y la segunda para el ejemplo 1.3.
x = c(1, 2, 0, 3, 1, 0, 1, 0, 4, 2, 1, 1, 2, 0, 1, 1, 0, 3, 1, 1, 0, 2, 1, 0,
4, 0, 1, 2, 2, 2)
tab = table(x)
tab
x
0 1 2 3 4
8 11 7 2 2
100*tab/length(x)
x
16
0 1 2 3 4
26.666667 36.666667 23.333333 6.666667 6.666667
Vale indicar que la variable tab tiene un formato de tabla, el cual podrı́a pasarse fácilmente a otro
formato, como por ejemplo el de vector si escribimos
> as.vector(tab)
[1] 8 11 7 2 2
cumsum(tab)
0 1 2 3 4
8 19 26 28 30
y la distribución de frecuencias completas (sin porcentajes) podrı́a construirse con el comando cbind,
el cual sirve para agrupar vectores en columnas. Concretamente
plot(tab,type="h",ylab="Frecuencia")
title("Distribución de frecuencias del número mensual
de accidentes en el distrito")
6
4
2
0
0 1 2 3 4
2
ESTADISTICA APLICADA Luis Valdivieso 17
Ejemplo 1.6 (Ejemplo 1.3 en R) Para introducir la data del problema optaremos alternativa-
mente por escribirla primero en Excel de tal manera que cada variable de interés ocupe una sola
columna de la hoja de cálculo, teniendo como primera fila el nombre de la variable. Esto se muestra
en la figura 1.8. Luego grabaremos el archivo en formato csv (delimitado por comas). La importación
pesaje = read.csv(file.choose())
La opción file.choose() lo direccionará a su hardware para que elija el archivo buscado. Otra posi-
bilidad es colocar entre comillas el nombre del archivo pero este deberá estar en su directorio de
trabajo. Puesto que nuestra base de datos contiene dos variables, una cualitativa (Tipo de vehı́culo)
y otra cuantitativa de pesos, que fue la trabajada en el ejemplo 1.3, realizaremos primero a manera
de práctica el análisis de la variable cualitativa. Si deseamos extraer ella para su análisis podrı́amos
escribir
En cualquiera de los casos esto define una variable categórica (cualitativa), lo cual se revela, pues
al final de ella aparece Levels, caracterı́stica única de este tipo de variables. La distribución de
frecuencias de esta variable se obtiene con
> table(tipo)
tipo
Auto Bus Camion Camioneta
10 6 26 18
barplot(table(tipo))
En este se aprecia claramente que la mayorı́a de vehı́culos que pasan por el peaje son camiones.
Retomemos ahora si el problema 1.3 en el análisis de los pesos, definiendo la variable de interés
peso = pesaje$Peso
El comando central para el análisis de este tipo de variables es hist (de histograma), el cual nos
provee de no sólo su distribución frecuencias sino también de su gráfica a través del histograma. El
comando es simplemente hist(peso); pero este nos dará una cantidad de intervalos por defecto que
podrı́a no coincidir con nuestro criterio. Para que esto último sea posible podemos decirle a R que
respete los intervalos que hemos construido a través de los comandos
> c = diff(range(peso))/7
> c
[1] 6.237143
c = 6.24
bb = min(peso) + (0:7)*c % lı́mites de los intervalos
h = hist(y,breaks=bb)
Es importante notar que h es un objeto (recordemos que R en un lenguaje orientado a objetos). Esto
es, h es un elemento que contiene mucha información como seguidamente se aprecia
> h
$breaks
[1] 4.34 10.58 16.82 23.06 29.30 35.54 41.78 48.02
$counts
[1] 2 5 7 19 19 5 3
$density
[1] 0.005341880 0.013354701 0.018696581 0.050747863
[5] 0.050747863 0.013354701 0.008012821
$mids
[1] 7.46 13.70 19.94 26.18 32.42 38.66 44.90
$xname
[1] "peso"
$equidist
ESTADISTICA APLICADA Luis Valdivieso 19
[1] TRUE
attr(,"class")
[1] "histogram"
De el podemos extraer, para un análisis posterior, cualquiera de sus componentes anexando al objeto
el sı́mbolo $ y el nombre de la componente requerida . Por ejemplo, las frecuencias absolutas (nj )
las podemos definir con el vector
> nn = h$counts
> nn
[1] 2 5 7 19 19 5 3
La utilidad de trabajar con objetos se puede mejor vislumbrar en la concreción de las figuras 1.5
y 1.6. Estas fueron obtenidas en R y los comandos respectivos, como usted los debe de explorar y
correr, son los siguientes
h = hist(peso,breaks=bb,xaxt=’n’,ylab="Frecuencia",ylim = c(0,20),
main = "Distribución de frecuencias \n de los pesos de los vehı́culos")
polygon(c(4.34,h$mids,48.02),c(0,h$counts,0),border="red")
axis(side=1,at = h$breaks)
P = c(0,cumsum(h$counts/length(peso))*100)
plot(h$breaks,P,xlab="Peso en toneladas",ylab="Porcentaje acumulado",xaxt=’n’)
axis(side=1,at = h$breaks)
lines(h$breaks,P,col="red")
title("Distribución de frecuencias acumuladas \n para los pesos de los vehı́culos")
La media (aritmética) está definida como la suma de todos los datos dividido por el número de
datos. Se suele denotar por una letra con una barra encima (x̄); esto es:
Pn
i=1 xi x1 + x2 + ... + xn
x̄ = = .
n n
La media puede verse fuertemente afectada por la presencia de valores atı́picos (observaciones
que son muy grandes o muy pequeñas con respecto al resto de observaciones). Estos valores
atı́picos tienden a jalar la media hacia su lado.
Pn
Es el valor de a que minimiza j=1 (xj − a)2 .
Ejemplo 1.7 (Calidad del aire) Una forma de evaluar la calidad del aire en un ambiente es medir
la cantidad de material particulado menor de 10 micrómetros, el cual podrı́a tener efectos nocivos en
la salud de las personas. Suponga que se tienen las siguientes mediciones en µg/m3 (microgramos
por metro cúbico) durante 6 dı́as en una ciudad.
Consideremos ahora que el primer valor sea reemplazado por un valor atı́pico quedando ahora el
conjunto de datos como:
Observamos entonces como un único valor atı́pico grande puede tener un gran impacto incrementando
considerablemente el valor de la media. 2
ESTADISTICA APLICADA Luis Valdivieso 21
P
k
xj nj k
j=1 X
x̄ = = xj fj ,
n
j=1
donde la variable toma x1 , ..., xk valores distintos; nj representa la frecuencia de cada uno de estos
datos y fj es la frecuencia relativa de cada dato xj . Esta medida se suele denominar una media
ponderada. Como ejemplo consideremos nuevamente los datos del ejemplo 1.2. referente al número
de accidentes por dı́a en un mes. Se tiene que en este mes la media de accidentes por dı́a es de:
0 × 8 + 1 × 11 + 2 × 7 + 3 × 2 + 4 × 2
x̄ = = 1.3
30
Es importante indicar que las ponderaciones no siempre se dan a través de las frecuencias. En ciertas
ocasiones los pesos tienen otra naturaleza. Por ejemplo en nuestra Universidad, el promedio de un
ciclo de estudios se representa por la media ponderada la cual consiste en multiplicar las notas de
cada curso que el alumno llevó, por el número de créditos del curso respectivo para luego dividir la
suma de estos por el número de créditos que el alumno llevó.
Proposición 1.1 Las siguientes propiedades de linealidad y de agregación son de gran utilidad.
ȳ = a + bx̄
b) Si 2 conjuntos de datos de tamaños n1 y n2 tienen medias x̄1 y x̄2 , entonces la media de estos
n = n1 + n2 datos viene dada por:
n1 x̄1 + n2 x̄2
x̄ =
n
1 1
x̄ = (x1 + x2 + . . . + xn1 + xn1 +1 + xn1 +2 , . . . , xn ) = (n1 x̄1 + n2 x¯2 ).
n n
2
22
1.5.2. La mediana
La mediana es el valor que ocupa la posición central cuando los datos se ordenan desde el menor
hasta el mayor valor. Si tenemos un conjunto de datos x1 , x2 , ..., xn , debemos primero ordenarlos
como
x(1) ≤ x(2) ≤ ... ≤ x(n) ,
donde x(1) es el menor valor de los datos, x(n) el mayor valor de los datos y en general x(j) es el dato
que ocupa la posición j. Luego la mediana se calcula por:
x( n+1 ) , si n es impar
2
Me =
x n + x( n +1)
(2) 2
2 , si n es par
El 50 % de los datos tienen valores menores o iguales a la mediana y el resto valores mayores.
Ejemplo 1.8 Consideremos nuevamente los datos del ejemplo 1.6 para la calidad de aire y calcule-
mos su mediana ordenando primeramente estos:
Como el número de datos es par, la mediana será el promedio de las observaciones centrales
Al igual que antes consideremos ahora que la observación 39.39 es reemplazada por 89.39. Ordenando
1.5.3. La moda
Se define como el valor M0 que más se repite en el conjunto de datos. Esta medida es poco usada,
pero vale comentar que es la única medida de tendencia central válida para variables cualitativas
nominales. Un problema con esta medida es que los datos podrı́an mostrar más de un valor con la
frecuencia más alta, o en particular todos los datos podrı́an ser diferentes. En este caso convendre-
mos de que existen múltiples modas y la distribución de los datos diremos que es multimodal, en
contraposición al caso unimodal. Note también que en distribuciones multimodales la moda carece
de sentido, pues los datos no presentan tendencia central.
Ejemplo 1.9 Para los datos del estado de la calidad del aire del ejemplo 1.1 la moda será Moderado.
En el ejemplo 1.2 del número de accidentes por dı́a la moda será 1.
1.6. Cuantiles
El cuantil p (0 < p < 1) de un conjunto de datos x1 , x2 , ..., xn es el valor qp tal que el 100p % de
los valores del conjunto de datos sea menores o iguales a este valor y el 100(1 − p) % mayores. Por
ejemplo, el cuantil 0.5, q0.5 , será la ya definida mediana.
Un problema con los quantiles es que si el número de datos no es muy grande difı́cilmente se
podrá encontrar la posición exacta (entera) que ocupa el cuantı́l en los datos ordenados. Como
ejemplo tomemos los 6 datos del ejemplo 1.6 de la calidad del aire y supongamos nos piden el cuantil
0.7. Para determinar su posición o rango podrı́amos hacer una simple regla de tres que nos dirı́a
que ella deberı́a ocupar una posición entre la 4 y 5 y por tanto su valor estarı́a entre x(4) = 39.12 y
x(5) = 39.39. El problema radica en como encontrar este valor, lo cual nos lleva a un problema de
interpolación, para el cual existen muchas convenciones (R por citar tiene 9). Nosotros para estar en
concordancia con R usaremos la utilizada por defecto en este paquete (Excel también usa la misma).
El procedimiento es el siguiente
Ordenar los n datos desde el menor al mayor valor como: x(1) ≤ x(2) ≤ . . . ≤ x(n) .
Calcular la posición teórica que ocupa el cuantil p, h. Ella está definida por
h = (n − 1)p + 1.
Calcular la mı́nima posición que podrı́a ocupar el cuantil, j = JhK, donde JhK denota a la
función mayor entero en h; es decir al menor valor entero que sea menor o igual que h.
El cuantil p se obtendrá interpolando linealmente los valores x(j) y x(j+1) y viene dado explı́ci-
tamente por:
qp = x(j) + (x(j+1) − x(j) )(h − j).
24
Los cuartiles: dividen a los datos en 4 partes iguales, se denotan por Q1 , Q2 y Q3 que serian
los cuantiles 0.25, 0.50 y 0.75.
Los deciles: dividen a los datos en 10 partes iguales, se denotan por D1 , D2 , .... y D9 que serian
los cuantiles 0.10, 0.20, ... y 0.90.
Los percentiles: dividen a los datos en 100 partes iguales, se denotan por P1 , P2 , ... y P99 que
serian los cuantiles 0.01, 0.02, ... y 0.99.
Ejemplo 1.10 Retomando los datos de calidad del aire, calculemos sus cuartiles. El segundo de los
cuales se pide comprobar que coincide con el dado en el ejemplo 1.7.
Para Q1 = q0.25 tenemos que h = 5 × 0.25 + 1 = 2.25, j = 2 y por tanto
Vale comentar que R posee para estos cálculos la función quantile, la cual como adelantamos
posee 9 opciones o convenciones de interpolación. Nosotros usaremos la dada por defecto (de tipo
7). Para comprobar que efectivamente es ası́ podemos simplemente escribir para nuestro ejemplo
anterior
o también llamar al comando summary que nos provee además de los valores mı́nimo y máximo
> summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
29.85 33.08 37.61 37.46 39.32 48.25
ESTADISTICA APLICADA Luis Valdivieso 25
1.7.1. La varianza
P
n P
n
(xj − x̄)2 x2j − nx̄2
j=1 j=1
S2 = = .
n−1 n−1
Note que esta medida considera las distancias xj − x̄ de cada observación a la media . Ası́ mientras
más dispersión exista, mayor será el el valor de algunas de estas distancias. La variancia considera
una especie de media de estas distancias al cuadrado.
Ejemplo 1.11 La varianza de los datos para el ejemplo de la calidad de aire es:
> var(x)
[1] 42.32759
2
La variancia puede ser difı́cil de interpretar debido a que está medida en unidades al cuadrado.
Por esta razón se suele más utilizar la desviación estándar definida como la raı́z cuadrada de la
varianza
√
S= S2.
Ejemplo 1.12 Considerando los datos del último ejemplo, la desviación estándar está dada por
√
S = 42.33 = 6.51
Las siguientes propiedades son análogas a las dadas en la proposición 1.1, pero para la varianza.
Se incluye también una desigualdad famosa conocida como de Chebychev. Ella nos da más luces
sobre el rol que desempeña la varianza o desviación estándar en la distribución de la data.
26
a) Si a estos datos se les aplica la transformación yi = a + bxi , entonces la varianza de estos nuevos
datos vendrá dada por
Sy2 = b2 Sx2 ,
b) Si los datos están subdivididos en dos grupos de tamaños n1 y n2 , cuyas medias y varianzas son
respectivamente x̄1 y x̄2 y S12 y S22 , entonces la varianza de estos n = n1 + n2 datos viene dada
por:
1
Sx2 = (n1 − 1)S12 + (n2 − 1)S22 + n1 x̄21 + n2 x̄22 − nx̄2 .
n−1
c) Para cualquier k > 0, se cumple que la proporción de los datos que caen en el intervalo
1
es de al menos 1 − k2
.
Demostración: a) Si a los datos se los transforma por yi = a + bxi , entonces por la parte a) de la
proposición 1.1, tenemos que:
n n
1 X 1 2X
Sy2 = (yi − ȳ)2 = b (xi − x̄)2 = b2 Sx2 .
n−1 n−1
i=1 i=1
Para la parte b), sea x1 , x2 , . . . , xn1 el primer conjunto de datos y xn1 +1 , xn1 +2 , . . . , xn el segundo.
Sabemos que para estos se cumplen las relaciones
n1
X n
X
x2i = (n1 − 1)S12 + n1 x̄21 y x2i = (n2 − 1)S22 + n2 x̄22 .
i=1 i=n1 +1
Por tanto, juntando ambas sumas y utilizando la parte b) de la proposición 1.1 se tiene que
n
1 X 2 1
Sx2 = ( xi − nx̄2 ) = (n1 − 1)S12 + n1 x̄21 + (n2 − 1)S22 + n2 x̄22 − nx̄2 .
n−1 n−1
i=1
Para la desigualdad de Chebychev en c), denotemos por I al intervalo dado y por I c a su complemento,
siendo respectivamente n(I) y n(I c ) el número de datos que caen en cada uno. Notando que para
cualquier dato xi en I c se cumple que |xi − x̄| > kSx se tiene que
1 X X 1 X 1 2 2
Sx2 = ( (xi − x̄)2 + (xi − x̄)2 ) > (xi − x̄)2 > k Sx n(I c ).
n−1 n n
{i/xi ∈I} {i/xi ∈I c } {i/xi ∈I c }
1
Ası́ la proporción de datos que caen fuera del intervalo i es menor a k2
o, equivalentemente, la
proporción de los datos que caen en el intervalo I es de al menos 1 − 1
k2
. 2
ESTADISTICA APLICADA Luis Valdivieso 27
1.7.3. El Rango
R = x(n) − x(1)
Ejemplo 1.13 Considerando los datos de calidad del aire, el rango es dado por
En R el procedimiento es:
> diff(range(x))
[1] 18.4
RIC = Q3 − Q1
Note que entre el primer y tercer cuantil está contenido el 50 % de las observaciones, donde hemos
descartado el 25 % de las observaciones más grandes y el 25 % de las más pequeñas.
Esta es una medida alternativa al rango que no es afectada por valores extremos y que puede ser
utilizada incluso con variables cualitativas ordinales..
Ejemplo 1.14 Considerando los datos de calidad del aire, el rango intercuartı́l está dado por
Ejemplo 1.15 Considerando los datos de la calidad del aire, el coeficiente de variabilidad es dado
por
6.51
CV = 100 × = 17.37
37.46
1.5. MEDIDAS DE FORMA 13
2
Asimetrı́a
Un conjunto de datos será simétrico si se distribuyen con igual frecuencia alrededor de un
Las medidas quepunto central, en este caso la media, mediana y moda coinciden (X = M e = M o). Se pueden
seguidamente presentaremos en esta sección son válidas sólo para conjuntos de
presentar dos tipos de asimetrı́a:
datos unimodales.
Asimetrı́a positiva o hacia la derecha: La mayor parte de los observaciones se con-
centran en valores bajos y pocos en valores altos. En este caso M o < M e < X.
3(X − M e)
A2 =
Asimetrı́a positiva o hacia la derecha: LaS mayor parte de los observaciones toman valores
bajos y se presentan
que se basapocos valores
en la siguiente altos.
relación En
3(X − M e)este
≈ X caso M ose <
− M o que M ecuando
cumple < x̄.los datos
presentan poca asimetrı́a. Una medida más exacta de asimetrı́a es dada por
n
X
1 3
Asimetrı́a negativa o hacia la izquierda: La
xi −mayor
X parte de los observaciones se concentran
n
i=1
en valores altos y se presentan pocos γvalores
1 =
bajos.
s3 En este caso x̄ < M e < M o.
que se interpreta de manera similar al coeficiente de asimetrı́a de Pearson.
Density
Media
Media Mediana Moda Moda Mediana Media
Mediana
Moda
Curtosis
Es una medida del apuntalamiento de la distribución de frecuencias de un conjunto de datos
Aqui presentaremos dos coeficientes
con referencia de asimetrı́a:
a la distribución Normal. Se pueden presentar los siguientes tipos de curtosis:
1.9. Curtosis
Es una medida del apuntalamiento de la distribución de frecuencias a un conjunto de datos con
referencia a una distribución patrón o Normal. Se pueden presentar los siguientes tipos:
Leptocúrtica: Es más apuntalada que la distribución Normal, los datos se concentran en los
valores centrales y pocos en los valores extremos de la variable.
Platicúrtica: Es más achatada que la distribución Normal, los datos se encuentran más dis-
persos.
0.35
0.35
0.30
0.30
0.30
0.25
0.25
0.25
0.20
0.20
0.20
Density
Density
Density
0.15
0.15
0.15
0.10
0.10
0.10
0.05
0.05
0.05
0.00
0.00
0.00
-15 -5 0 5 10 -10 -5 0 5 10 -5 0 5
Ejemplo 1.16 Aquı́ crearemos nuestra primera función en R, a llamarse Mak. Ella calculará los
diferentes indicadores de asimetrı́a y kurtosis estudiados. Lo aplicaremos luego a los datos del ejemplo
1.3 para el peso de los vehı́culos. Hágalo también manualmente!!.
> Mak(peso)
A = -0.4009137
G1 = -0.2206919
K = 0.2157948
G2 = 3.342449
ESTADISTICA APLICADA Luis Valdivieso 31
Como se aprecia, y adelantamos en el ejemplo, se presenta una asimetrı́a negativa; mientras que
para la curtosis hay resultados un tanto discordantes aunque aproximadamente podrı́amos decir que
la distribución es mesocúrtica. 2
Ejemplo 1.17 Los datos siguientes muestran los tiempos de trabajo real en horas por semana que
han sido registrados en una inspección ciega para los empleados pertenecientes a las dos secciones
en que está dividida una pequeña empresa. Si bien la dedicación teórica de ellos es de 40 horas
semanales, como se aprecia no todos cumplen esta normatividad.
Sección A 40 42 36 35 45
Sección B 29 50 40 60 48 43 35 55 46
a) ¿ Cuál serı́a la media de las horas por semana de trabajo real en la empresa y cuál su desviación
estándar?
b) Suponga que para una promoción están concursado el empleado de la sección A con 40 horas de
trabajo real registradas y el empleado de la sección B con 43 horas de trabajo real registradas ¿ a
quien le darı́a la promoción y porque?
Solución: a) Las medias y desviaciónes estándar para las horas de trabajo real en las dos secciones
están dadas, respectivamente, por x̄A = 39.6 y SA = 4.159 y x̄B = 45.111 y SB = 9.65. La media y
desviación estándar pedida se pueden obtener en base a las proposiciones 1.1 y 1.2. Estas serán en
horas:
5x̄A + 9x̄B
x̄ = = 43.143
14
32
y r
1
2 + 8S 2 + 5x̄2 + 9x̄2 − 14x̄2 = 8.374
S= 4SA B A B
13
b) De otro lado, si bien el empleado de la sección B trabaja a la semana más horas que el de la
sección A, uno puede apreciar a través de sus puntajes estandarizados relativos a sus secciones que
denotaremos, respectivamente por zB y zA , que:
40 − 39.6 43 − 45.111
zA = = 0.096 > zB = = −0.219.
4.159 9.65
Ası́ el empleado de la sección A por tener un puntaje z positivo, tiene un número de horas de trabajo
semanal por encima de la media de los de su sección; mientras que lo contrario ocurre con B. La
decisión de la promoción dependerá del promotor y de otros factores. Por ejemplo, si la labor de la
sección A fuese menos exigente en la necesidad del uso del tiempo, como lo sugieren los datos, que
la labor de la sección B, entonces quizás sea una buena recomendación promocionar al empleado de
la sección A, ya que este, en relación a sus compañeros de sección, muestra una mayor dedicación. 2
donde i es el número del intervalo donde se ubica el cuantil, Li−1 es el extremo izquierdo del intervalo
i, c el ancho del intervalo, pi el porcentaje de datos en el intervalo i y Pi−1 el porcentaje de datos
acumulados hasta el intervalo anterior i − 1. Como se aprecia, estos últimos porcentajes pueden
también reemplazares por sus correspondientes frecuencias relativas o absolutas.
Ejemplo 1.18 Suponga que en el ejemplo 1.4 se deseen calcular los cuantiles 0.3 y 0.6 y también la
proporción de vehı́culos que pesaron entre 15 y 25 toneladas. Haga ello bajo primero la asunción de
que conoce los datos y luego de que no dispone de estos sino tan sólo de su distribución de frecuencias.
Solución: Si conociéramos los datos, los valores pedidos estarı́an dados por
> c(quantile(peso,0.3),quantile(peso,0.6))
30% 60%
24.208 29.844
y respectivamente
> sort(peso)
[1] 4.34 8.07 11.66 13.00 13.46 14.23 15.59 17.35 18.96 19.98 20.17 21.50
[13] 21.98 22.45 23.34 23.35 23.55 23.76 24.40 24.60 24.65 25.00 25.62 26.22
[25] 26.59 26.72 27.05 27.09 27.18 28.58 28.80 28.98 29.07 29.40 29.50 29.62
[37] 30.18 30.34 30.37 30.47 30.72 31.36 31.46 31.72 32.27 33.31 33.32 34.34
[49] 34.36 34.95 35.00 35.49 35.80 36.70 37.00 38.09 39.98 43.56 47.35 48.00
> 16/60
[1] 0.2666667
En tal caso serı́a ya innecesario el aproximar estas cantidades con la fórmula de datos agrupados.
De otro lado, si sólo dispusiéramos de la distribución de frecuencias, las aproximaciones pedidas
serı́an
6.24
q0.3 = 23.06 + (0.3 − 0.2333) = 24.3742
0.3167
y
6.24
q0.6 = 29.3 + (0.6 − 0.55) = 30.28516
0.3167
para el caso de los cuartiles; mientras que en el caso de la proporción pedida podrı́amos trabajar
en el sentido contrario al de los cuantiles; es decir, hallar a que cuantiles p1 y p2 corresponden los
valores 15 y 25 (que caen en los intervalos 2 y 4) ; esto es,
6.24 6.24
15 = 10.58 + (p1 − 0.0333) y 25 = 23.06 + (p2 − 0.2333) .
0.0833 0.3167
Despejando obtenemos p1 = 0.0923 y p2 = 0.33177, por lo que el proporción pedida se aproximará por
p2 − p1 = 0.24. Observe los valores bastante cercanos de estas aproximaciones con respecto a los
verdaderos valores obtenidos con los datos reales. 2
1.6. GRÁFICOS 15
34
Dibujar una caja con limites el primer y tercer cuartil.
1.12. Diagramas
Dibujar unade
lineacajas
central en la posición de la mediana.
* *
Q1 Mediana Q3
menor valor antes de Q1−1.5 RIC mayor valor antes de Q3+1.5 RIC
Dibujar una caja (horizontal de representarse una sola variable o vertical de representarse 2 o
asimetría negativa simetrica asimetría positiva
más variables) cuyos lı́mites sean el primer y tercer cuartil.
Calcular el intervalo tı́pico [LI, LS] = [Q1 − 1.5RIC, Q3 + 1.5RIC], donde RIC es el rango
intercuartı́l. Todo dato contenido en él se denominará tı́pico.
Figura 1.7: Asimetrı́a y Boxplot
Dibujar los bigotes, una linea desde Q1 hasta el menor valor tı́pico y una linea desde Q3 hasta
el mayor valor tı́pico.
Ejemplo 1.21.
Marcar los valores
Se registró menores
el tiempo a LI eny horas
de duración mayores
de 10 componentes un o, ∗ elegidos
a LS conelectrónicos u otroal sı́mbolo.
azar Estos serán
considerados valores atı́picos
126 130u outliers.
130 133 136 148 148 157 189 199
126, 130, 130, 133, 136, 148, 148, 157, 189, 199
tiempo = c(126,130,130,133,136,148,148,157,189,199)
> summary(tiempo)
ESTADISTICA APLICADA Luis Valdivieso 35
Luego, el rango intercuartil es RIC = 24 con el cual obtenemos LI = 94.8 y LS = 190.8. Ası́ tenemos
que el bigote del lado izquierdo irá hasta 126 (el primer valor observado no menor a LI) y el bigote
del lado derecho irá hasta 189 (último valor observado no mayor a LS). Finalmente, el dato 199
será marcado como un valor atı́pico. El gráfico es el siguiente.
Figura 1.12: Diagrama de cajas para los datos del ejemplo 1.19
boxplot(tiempo, horizontal=TRUE)
title("Distribución de frecuencias para \n los tiempos de duración de las 10
componentes electrónicas")
R presenta por defecto los boxplots en forma vertical, de allı́ que hemos usado la opción horizontal
= TRUE. 2
Ejemplo 1.20 R dispone de varias bases de datos para uso público, una de las cuales es mtcars. Ella
contiene información proporcionada por Motor Trends acerca del consumo y otras 10 caracterı́sticas
de 32 modelos de autos para los años 1973-1974. Los datos se obtienen escribiendo simplemente
mtcars en la consola. Nuestro interés se centrará en comparar el consumo de gasolina (en millas
por galón) según el tipo de transmisión que poseen los autos (automática ó mecánica). Para mayor
información sobre esta base de datos escribir
36
> ?mtcars
Note que una de las variables de interes aquı́ es mpg, el consumo de gasolina. Los datos de esta
variables se podrán obtener con mcars$mpg pero no escribiendo mpg. Para que ello ocurra y podamos
traer a memoria toda la información contenida en la base de datos, se puede utilizar el comando
attach (al término de su uso se recomienda usar el comando detach) como:
> attach(mtcars)
> mpg
[1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4
[16] 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7
[31] 15.0 21.4
dispondremos de los datos de la variable mpg sin necesidad de extraer del dataframe la variable
especı́fica.
Para la comparación pedida se requiere de los siguientes comandos
Automática Mecánica
Figura 1.13: Diagrama de cajas para los datos del ejemplo 1.20
Como se ve, los autos con transmisión automática muestran marcadamente no sólo un menor
consumo promedio sino también menor variabilidad. Además mientras en los autos automáticos
hay cierta simetrı́a con una pequeña tendencia hacia consumos superiores al promedio, en los de
transmisión mecánica la asimetrı́a es fuertemente positiva con una tendencia hacia consumos bajos.
No hubo consumos atı́picos. 2
ESTADISTICA APLICADA Luis Valdivieso 37
1.13. Ejercicios
1.- En la siguiente tabla se muestra la distribución de frecuencias los asistentes a una charla infor-
mativa de un nuevo programa de especialización, según su profesión.
Profesión Número de asistentes
Ingenierı́a 24
Administración 8
Contabilidad 10
Economı́a 15
Derecho 3
a) Construya un gráfico que permita observar la composición porcentual de los asistentes, según sus
profesiones, a la charla informativa. Haga ello manualmente y usando el software R.
b) Calcule una medida de tendencia central adecuada para la variable cualitativa.
2.-Indique si cada una de las afirmaciones siguientes es verdadera o falsa. Justifique sus respuestas.
a) Las notas de un grupo de alumnos tuvieron una media de 11 con una desviación estándar de 3,
siendo el porcentaje de desaprobados del 65 %. Entonces la asimetrı́a de la distribución de estas
notas es positiva.
q0.75 −q0.5
b) Se define un nuevo coeficiente de asimetrı́a cuartı́lico como AC = q0.5 −q0.25 . Se puede decir entonces
que mientras más alto y mayor a 1 sea este coeficiente más asimetrı́a positiva existirá y también se
tendrá una mayor dispersión ya que su rango intercuartil se verá incrementado.
d) Al calcularse el coeficiente de variación (CV) de los tiempos de atención por parte de un empleado
de un Banco durante una jornada de trabajo se encontró un valor del 14 %. Al conocer este valor el
empleado reclamó que este CV estaba subestimado, pues los clientes se demoraban en llegar desde
la cola hasta ser atendidos por él 2 minutos y por tanto este tiempo deberı́a de ser descontado de
los cálculos. Si se aceptó el reclamo del empleado y se encontró ahora un CV del 21 %, entonces se
puede concluir que la verdadera media de los tiempos de atención a los clientes fue de 4 minutos.
3.- Los puntajes en una prueba de aptitud de una muestra de 200 postulantes en una prueba de
selección de personal se tabularon en cinco intervalos de modo que se obtuvo :
4.- Un municipio ha llevado la siguiente contabilidad de los montos de deuda en soles por arbitrios
durante el año 2013 de las 13 familias aun morosas del distrito. Para motivar el pago de los arbitrios
durante este año la municipalidad ofreció un descuento del 20 % a las familias que pagaran todas
sus deudas y un recargo a cargarse el próximo año del 25 % al saldo de deuda más un monto fijo
adicional por gastos administrativos para quienes pagaran parcialmente o no pagaran su deuda. En
base a esta información, responda las siguientes preguntas, donde cada parte vale un punto.
Deuda al 201 425 345 119 120 175 180 332 250 175 180 732 50
01/01/2013
Pagó 2013 1 1 2 2 3 2 1 3 1 1 1 2 1
Deuda desde 0 0 501.25 218.75 120 288.75 0 360 0 0 0 985 0
el 01/01/2014
Aquı́ Pagó 2013 vale 1, si la familia pago toda su deuda; vale 2, si la familia no pago su deuda y vale
3, si la familia pago parcialmente su deuda.
a) Halle la media de los montos de deuda que tenı́an estas familias a inicios del 2013.
b)Haga un gráfico circular para la variable Pagó 2013.
c)¿Cuál es el valor del monto fijo adicional por gastos administrativos que recargo la municipalidad
a las familias aún morosas el 2014?
d)¿Cuál fue el monto total en soles que percibió el 2013 la municipalidad por el pago de estos
arbitrios?
e)Halle la desviación estándar de los montos de deudas que se contabilizarán para estas familias a
partir del primero de Enero del 2014.
f)¿Se podrı́a decir que hay datos atı́picos en la distribución de montos de deudas al 2013? Si los hay
indique que montos son. Use el criterio de los diagramas de caja.
5.- La siguiente lista contiene los tiempos de horas de permanencia en Intranet de un grupo de 50
alumnos a lo largo de un dı́a, en donde los primeros 20 alumnos (empezando de arriba hacia abajo
y de izquierda a derecha) son hombres y el resto mujeres.
0.43 0.33 1.25 0.02 3.10 0.04 0.35 1.33 0.72 0.09
0.10 0.50 0.70 0.44 0.30 0.06 1.31 0.26 3.30 0.08
0.03 0.04 1.53 1.09 0.12 0.22 0.69 0.18 2.04 2.24
0.09 0.52 5.25 0.08 0.45 0.03 1.69 2.78 0.43 1.10
0.61 2.52 2.16 0.17 1.72 0.35 1.59 0.18 1.49 0.25
d) Halle aproximadamente el porcentaje de alumnos que permanecen en Intranet más que el tiempo
promedio (referido a la media aritmética).
e) Compare gráficamente las distribuciones de tiempos de permanencia entre hombres y mujeres.
6.- Los datos siguientes reportan el número de hojas impresas por cada uno de los empleados de una
empresa durante el último mes de Abril:
11, 13, 22, 23, 24, 25, 26, 28, 33, 33,
34, 35, 35, 35, 35, 35, 36, 38, 39, 41,
42, 44, 45, 46, 49, 50, 53, 54, 55, 55,
56, 57, 58, 60, 61, 61, 63, 63, 63, 65,
70, 71, 72, 75, 77, 80, 87, 92, 121, 128
a) Usando la regla de Sturges halle la distribución de frecuencias correspondiente que incluya a los
porcentajes acumulados.
b) Se desea saber si se pueden detectar empleados crı́ticos; es decir, empleados que hagan ya sea un uso
muy bajo de impresiones o un uso muy alto. En base a un diagrama de cajas (no necesita graficarlo)
¿se pueden ubicar aquı́ empleados de ese tipo? Diga, si los hubiera, cuantas hojas imprimieron ellos
en el mes de Abril.
c) Si cada hoja cuesta 0.2 soles ¿cuál serı́a el coeficiente de asimetrı́a de Pearson para la distribución
de gastos que los empleados han hecho en impresiones?
7.- Un fabricante deportivo realizó un estudio sobre el diseño de un nuevo zapato para correr. Se-
guidamente se enumeran el tipo y la frecuencia de inconformidades y fallas que se encontraron.
Desarrolle un diagrama de Pareto para ilustrar los principales problemas.
8.- Construya una distribución de frecuencias y muestre gráficamente la distribución de los siguientes
registros de consumo de electricidad (en kWh) de 50 hogares en un cierto distrito.
589 493 531 355 469 432 415 468 617 426
300 439 464 430 403 525 478 392 432 459
398 372 488 481 620 484 509 522 488 502
596 567 466 477 580 555 520 525 425 650
384 497 438 501 521 452 508 462 457 577
40
9.- En el reporte bimestral (de 60 dı́as) de las ventas de una empresa se registró la siguiente infor-
mación:
a) Construya en base a esta información una distribución de frecuencias con 5 intervalos para las
ventas bimestrales de la empresa.
b) Obtenga el histograma y polı́gono de la distribución anterior.
c) Suponga que la empresa desea identificar a los vendedores de este periodo que tuvieron las más
altas ventas en la empresa y define a estos como los que obtuvieron en el mes el 20 % de las ventas
de montos más altos ¿a partir de qué valor de ventas a un vendedor se le considerará dentro de este
grupo?
d) Halle aproximadamente el porcentaje de dı́as durante el bimestre en que las ventas oscilan entre
los 10,000 soles y 15,000 soles.
10.- Los puntajes en una prueba de aptitud a los 200 postulantes hombres en una prueba de selección
de personal se tabularon en cinco intervalos de modo que se obtuvo:
De otro lado, los puntajes en la misma prueba para las 150 mujeres postulantes dieron una media de
11.2, desviación estándar de 3 y cuartiles de 6.5, 11 y 16.5. Compare gráficamente estas distribuciones
de puntajes entre hombres y mujeres, analizando la tendencia central, dispersión y asimetrı́a.
12.-En un ascensor hay 4 mujeres y 6 hombres. El peso medio de las mujeres es de 60 kilos con una
desviación estándar de 8 kilos y el peso medio de los hombres es de 80 kilos con una varianza de 25
kilos2 .
a) ¿Cuál es el peso medio de las 10 personas en el ascensor?
b) ¿Cuál es la desviación estándar del peso de las personas en el ascensor?
c) Suponga que cada hombre fue pesado con una balanza mal calibrada que aumentaba 2.5 kilos cada
medición ¿cuál serı́a el coeficiente de variación de las mediciones reales del peso de los hombres?
42
13.- Una mina tiene un campamento donde residen sus operarios. La siguiente es la distribución de
frecuencias del consumo de energı́a eléctrica mensual en kilowatts por hora (KWh) de los hogares
que conforman el campamento.
14.- En un exámen de 0 a 20 puntos se han obtenido los siguientes puntajes estandarizados de los 7
alumnos que asistieron al exámen: -1.04978132, -0.87481777, -0.87481777, 0, 0.34992711, 0.87481777,
1.57467198, donde la mı́nima nota fue 3 y la máxima 18.
a) Halle la media y desviación estándar de las notas en el examen.
b) Si un alumno (Juan) dio esta misma prueba en forma extemporánea y saco 16 ¿qué puesto
obtendrı́a Juan en un ranking con sus 8 compañeros?
c) Suponga que el profesor piensa hacer una “curva” en el exámen subiéndo un punto a los que están
por debajo de primer cuartı́l y por encima del tercer cuartı́l y subiéndo al resto dos puntos ¿Serán
las notas obtenidas luego de esta “curva” más similares que las obtenidas sin ella? Considere aquı́ a
los 8 alumnos, incluyendo a nuestro amigo Juan.
ESTADISTICA APLICADA Luis Valdivieso 43
15.- Los datos siguientes muestran el salario mensual en soles de los 13 trabajadores de cierta división
en una empresa:
3,210 450 780 380 990 1,250 6,288 800 850 820 1,500 1,900 700
a) Halle la media y mediana de estos salarios y comente cuál promedio representa mejor a estos
datos.
b) Con el propósito de incrementar los salarios y hacer de que estos sean más equitativos, la gerencia
de la división tiene 2 propuestas. La primera consiste en incrementarles los salarios en un 10 % y
darles un bono de 100 soles. La segunda consiste en dividir a los salarios en cuartiles para luego
incrementar los sueldos en x %, a los que ganan igual o menos que el cuantil 0.25, en 2 % a los que
ganan más que el cuantil 0.75 y en 15 % al resto. ¿Cuál serı́a el valor de x para que en promedio los
nuevos salarios sean los mismos bajo las dos polı́ticas?
16.- La data chickwts que se encuentra en R ha sido obtenida de un experimento para comparar la
efectividad de varios suplementos alimenticios en la tasa de crecimiento de los pollos (para mayor
información escribir en la consola de R ?chickwts). Las variable de interés es weight, que es el peso
ganado por los pollos, y el factor para comparar es feed. Realice un diagrama de cajas para comparar
la variable weights bajo los 6 niveles de la variable feed. Interprete.
17.- En el archivo Encuesta.csv (colgado en intranet) se encuentran datos de una encuesta donde se
recolectaron las siguientes variables: edad, estado.civil, ingreso (en miles de u.m.), educacion (nivel
educativo), satlab (satisfacción laboral), genero (sexo) y familia (número de integrantes).
Utilizando en lo posible el software R, responda a lo siguiente.
a) Usando la regla de Sturges para el número de intervalos, grafique e interprete el polı́gono de la
distribución de ingresos.
b) Obtenga un gráfico apropiado para exponer la variable estado civil.
c) Calcule aproximadamente, sólo en base al polı́gono anterior, la proporción de personas en esta
encuesta que tienen ingresos entre 250 mil y 550 mil u.m.
d) Realice, en base al diagrama de cajas correspondiente, un análisis comparativo de los ingresos por
cada nivel de satisfacción laboral.
e) La desviación mediana absoluta es una medida de dispersión definida como la mediana de las
desviaciones medianas absolutas de los datos:
siendo Me la mediana de los datos. Construya una función en R para calcular la desviación mediana
absoluta que tenga como único argumento a un data frame correspondiente a la información contenida
en el archivo Encuesta.csv . Su función deberá concretamente calcular la desviación mediana absoluta
de la variable edad de esta base de datos.
f) Calcule las medidas de dispersión dadas en el curso para la variable ingreso y compárela con la
definida en e).
44
http://archive.ics.uci.edu/ml/datasets/Facebook+metrics
contiene información de 500 posts de la página Facebook de una reconocida companı́a de cosméticos.
Esta información fue obtenida del artı́culo de Moro, S., Rita, P, y Vala, B. (2016). Predicting social
media performance metrics and evaluation of the impact on brand building: A data mining approach.
Journal of Business Research, 69(9), 3341-3351. Si bien la base de datos contiene muchas variables,
nosotros estaremos interesados en básicamente las siguientes:
Category : Variable (definida por los administradores de Facebook) que caracteriza el tipo de
campana a la que el post está destinado.
Page total likes: Número de personas que dieron like a la página de la compañı́a en el momento
en que el post fue publicado.
Paid: Si la compania pago a Facebook por hacer propaganda para el post (1 = Si, 0= No)
NOCIONES DE PROBABILIDAD
Ejemplo 2.1 Supongamos estamos en la cola de un banco y hay 6 servidores que nos pudiesen
atender, siendo dos de ellos (digamos los servidores 3 y 5) los más especializados en el trámite
que deseamos hacer. Si el experimento aleatorio consiste en observar qué servidor nos va a tocar,
entonces podrı́amos considerar el espacio muestral Ω = {1, 2, 3, 4, 5, 6}. Un posible evento serı́a el que
nos toque un servidor especializado; vale decir, el evento A = {3, 5} ⊆ Ω. Este evento ocurrirá si al
1
En términos formales, a la colección de todos los eventos se le denomina una σ−álgebra. Esta es una colección de
subconjuntos F de Ω que es cerrado bajo complementos y uniones enumerable de sus elementos. Lo que asumiremos en
nuestro curso es que F = 2Ω ; sin embargo, este conjunto potencia podrı́a ser demasiado grande como para permitir luego
que los eventos posean una medida de incertidumbre consistente. Tal hecho, por fortuna, no nos ocasionará inconveniente
práctico alguno.
45
46
llamarnos nos transfieren a alguno de los dos servidores especializados. En caso contrario el evento
A no ocurrira; pero si su complemento Ac definido como Ac = {1, 2, 4, 6}. Más aún, si definimos el
evento B = {1, 2, 6}, este resulta ser un evento disjunto a A. 2
Es importante comentar que las definiciones que hemos dado de los eventos del ejercicio anterior
fueron como subconjuntos de Ω. En este caso diremos que los eventos han sido definidos por exten-
sión. En ciertas ocasiones ello no es tan aconsejable, ya que el evento pudiera contener un número
muy grande o infinito de elementos, o pudiera ser muy complicado de explicitar todos sus elemen-
tos. En estos caso podrı́amos definir simplemente estos textualmente entre comillas, como por citar
A =”Se nos asigne a un servidor especializado”. En tal situación diremos que el evento se ha definido
por comprensión. Cualquiera de las definiciones anteriores son válidas, lo importante es que traten
siempre de definir sus eventos de interés.
Puesto que los eventos son al final de cuentas conjuntos, toda la teorı́a de probabilidades se basa
en la teorı́a de conjuntos, la cual asumiremos que es conocida por el lector. Si tenemos n eventos
A1 , A2 , . . . , An , traigamos a la mente esta para definir por ejemplo los siguientes eventos:
n
[
Alguno de los eventos ocurra: Ai
i=1
n
\
Todos los eventos ocurran: Ai
i=1
n n
!c
\ [
Ninguno de los eventos ocurra: Aci = Ai
i=1 i=1
n n
!c
[ \
Alguno de los eventos no ocurra: Aci = Ai
i=1 i=1
Dado que uno no tiene la certeza de que un evento A ocurra, será conveniente introducir una
función que nos mida tal incertidumbre. Esta medida se denomina una probabilidad. Ella asigna al
evento A un número P (A) que convendremos estará entre 0 y 1. Este nos mide el grado de factibilidad
de que A ocurra ; mientras más cercano este P (A) a 0, menos seguros estaremos de que A ocurra;
y por el contrario, mientras más cercano este P (A) a 1, más seguros estaremos de que A ocurra.
Seguidamente formalizaremos más este concepto.
P : 2Ω → [0, 1]
(P1) P (Ω) = 1.
donde denotaremos en adelante por A ∪· B a la unión A ∪ B cuando los eventos A y B son disjuntos.
Vale comentar que el axioma aditivo (P 2) puede también extenderse a un número infinito pero
enumerable de eventos disjuntos; es decir, a garantizar que la probabilidad de la unión de todos ellos
sea la suma de sus probabilidades.
Es directo verificar, partiendo sólo de la definición anterior, las siguientes propiedades básicas de
una probabilidad.
1. P (∅) = 0.
2. P (Ac ) = 1 − P (A).
3. P (A − B) = P (A) − P (A ∩ B).
Ejemplo 2.2 Un proceso de control en la producción de cierto dispositivo electrónico consta de dos
procesos de inspección, digamos I y II. La probabilidad de que el dispositivo pase la inspección I es de
0.8; mientras que la probabilidad de que pase la inspección II es de 0.7. Si se sabe que la probabilidad
de que el dispositivo pase por ambas inspecciones es de 0.65. Halle la probabilidad de que el dispositivo
a) pase alguna de las inspecciones.
b) pase sólo una de las inspecciones.
c) no pase ninguna de las inspecciones.
Solución: a) Si definimos los eventos A = “El dispositivo pase por la inspección I” y el evento B =
“El dispositivo pase por la inspección II”, se nos pide P (A ∪ B) = P (A) + P (B) − P (A ∩ B) =
0.8 + 0.7 − 0.65 = 0.85
b) Se pide P (A ∩ B c ∪· Ac ∩ B) = P (A ∩ B c ) + P (Ac ∩ B) = P (A) − P (A ∩ B) + P (B) − P (A ∩ B) =
P (A) + P (B) − P (A ∩ B) = 0.8 + 0.7 − 2(0.65) = 0.2.
c) Se pide P (Ac ∩ B c ) = 1 − P (A ∪ B) = 1 − 0.85 = 0.15. 2
Aparte de las propiedades básicas de probabilidad, serán también útiles las siguientes propiedades
que versan sobre una colección de más dos eventos. La primera se refiere a la extensión de la propiedad
4 en la proposición 2.1 y la segunda se conoce como la desigualdad de Bonferroni.
48
a)
n
X X X X X
P (A1 ∪ A2 ∪ · · · ∪ An ) = P (Ai ) − P (Ai ∩ Aj ) + P (Ai ∩ Aj ∩ Ak ) + · · ·
i=1 1=i<j=n 1=i<j<k=n
. . . + (−1)n+1 P (A1 ∩ · · · ∩ An ).
b)
n
X
P (A1 ∩ A2 ∩ . . . ∩ An ) ≥ P (Ai ) − (n − 1).
i=1
Esta asegura que si el espacio muestral Ω es finito y todos sus elementos tienen la misma facti-
bilidad de ocurrencia, entonces la probabilidad de un evento A ⊂ Ω, se define por:
Esta definición, que muchas veces se lee como “casos favorables entre casos posibles”, está en efecto
bien definida pues cumple las dos propiedades de la definición axiomática; sin embargo, presenta
dos limitaciones: una cuando Ω es un conjunto infinito y otra cuando los elementos de Ω presentan
distintas factibilidades de ocurrencia. Piense, por ejemplo, en el experimento de lanzar una caja
de fósforos y en el evento de que esta caiga sobre uno de sus lados más pequeños. De aplicarse
la definición clásica, podrı́amos pensar equı́vocamente que es tan probable que la caja caiga sobre
uno de sus lados más pequeños como sobre uno de los lados más grandes. Para subsanar este último
inconveniente que presenta la definición clásica, podrı́amos optar alternativamente por una definición
más experimental conocida como la definición frecuencial.
Esta asegura que de repetirse un experimento aleatorio n veces y ocurrir en nA veces el evento
A, entonces su probabilidad viene aproximadamente dada por:
nA
P (A) = .
n
Decimos aproximadamente, pues la probabilidad exacta se obtendrá teóricamente de tomarse n → ∞.
La convergencia a la verdadera probabilidad es conocida en el argot estadı́stico como la ley de los
grandes números. Esta ley usted la puede comprobar por ejemplo con un moneda normal, si lanza
50
esta moneda, digamos 10 veces, supongamos que obtiene 7 sellos y 3 caras. Una estimación frecuencial
de la probabilidad de que la moneda muestre sello será entonces 0.7; sin embargo si usted continua
repitiendo este experimento muchas veces, podrá comprobar que mientras más lanzamientos realice,
la proporción de sellos que obtendrá en los lanzamientos se irá acercando cada vez más a su valor
teórico que es 0.5. Ası́, en el caso de la caja de fósforos, disponemos ahora si de una manera más
adecuada de definir la probabilidad de que la caja caiga sobre uno de sus lados más pequeños; si por
decir de las 100 veces que lanzamos la caja solo en dos ocasiones resulta caer ésta sobre uno de sus
2
lados más pequeños, entonces la probabilidad de este evento será aproximadamente 100 = 0.02 y no
equı́vocamente de un tercio como lo manifiesta la definición clásica.
Si una operación posee k etapas distintas y cada etapa j puede realizarse de nj maneras, entonces
toda la operación puede realizarse de n1 × n2 × . . . × nk maneras.
En adelante será también conveniente distinguir entre un arreglo y un conjunto. La diferencia es que
en el primero el orden entre sus elementos importa; mientras que en el segundo no; esto es, que una
ordenación distinta genera un nuevo arreglo mas no un nuevo conjunto.
Ejemplo 2.3 Supongamos tenemos las letras de la palabra FACI. Con ellas podrı́amos definir sólo
un conjunto, el cual denotaremos como es usual por
{F, A, C, I}
Sin embargo, estas letras generan 24 arreglos, los cuales vienen dados explı́citamente por:
F A C I, F A I C, F C I A, F C A I, F I A C, F I C A, A F C I, A F I C,
A C F I, A C I F, A I F C, A I C F, C F A I, C F I A, C A F I, C A I F,
C I F A, C I A F, I F A C, I F C A, I A F C, I A C F, I C F A, I C A F.
n! = n × n − 1 × n − 2 × . . . × 2 × 1 (0! = 1).
Proposición 2.3 El número de arreglos distintos que se puede formar con n elementos es n!.
Demostración: Basta considerar la formación de arreglos como una operación conformada por n
tareas. La primera corresponde a seleccionar el primer elemento para el arreglo. Ello se puede hacer
de n maneras. La segunda tarea será seleccionar el segundo elemento para el arreglo, lo cual se
puede realizar de n − 1 maneras, pues sólo nos quedan n − 1 elementos disponibles al estar uno de
ellos ya en el arreglo. Si continuamos con este procedimiento para la última tarea nos quedará un
único elemento y por tanto ella podrá realizarse de una sola manera. El principio de múltiplicacı́on
completa la prueba. 2
Una aplicación directa de la proposición anterior al ejemplo 2.3 nos permite comprobar que
efectivamente es posible formar 4! = 24 arreglos con las letras de la palabra FACI. Algo interesante
a explorar en este mismo ejemplo es por citar preguntarnos sobre cuantos arreglos de dos elementos
podrı́an formarse. Si bien no es difı́cil listar todos estos arreglos como abajo se aprecian
F A, F C, F I, A F, A C, A I, C F, C A, C I, I F, I A, I C,
en general ello podrı́a no ser tan simple. El siguiente concepto de permutación nos ayudará al respecto.
Si r ≤ n son dos números naturales, se define la permutación de n en r por:
n!
Prn = .
(n − r)!
Proposición 2.4 El número de arreglos distintos de r elementos que se puede formar con n ele-
mentos viene dado por Prn .
Demostración: La idea es exactamente la misma que en la demostración de la proposición 2.3, sólo que
al llegar a la r−ésima y última tarea, pues los arreglos son ahora de r elementos, esta podrá realizarse
de n − r + 1 maneras. El principio de multiplicación nos dice entonces que la cantidad buscada
vendrá dada por
(n − r)!
n × n − 1 × n − 2 × ... × n − r + 1 = = Prn ,
r!
donde para la primera igualdad hemos multiplicado el numerador y denominado por r! 2
4!
La proposición 2.4 justifica entonces el porque existen P24 = 2! = 12 arreglos de dos elementos
con las letras de la palabra FACI.
Al igual que en el caso anterior podrı́amos ahora estar interesados en conocer cuantos conjuntos de
r elementos se podrı́an formar con n elementos, para lo cual usaremos el concepto de combinatorias.
Si r ≤ n son dos números naturales, se define la combinatoria de n en r por:
n n!
= .
r (n − r)!r!
Proposición 2.5 El número de subconjuntos distintos de r elementos que se pueden formar con n
elementos viene dado por nr .
52
{F, A}, {F, C}, {F, I}, {A, I}, {A, C}, {C, I}.
Es útil comentar que el comando en R que nos permite calcular combinatorias es choose. La combi-
natoria anterior, por ejemplo, viene dada por:
> choose(4,2)
[1] 6
Ejemplo 2.4 Una caja contienen 20 productos en apariencia idénticos, pero 5 de ellos tienen fecha
de expiración vencida. Si usted pide 4 productos de la caja y el encargado los selecciona al azar
Solución: Considere el experimento que consiste en seleccionar los 4 artı́culos de la caja (esto puede
hacerse a la vez o equivalentemente producto por producto, pero sin volver a reemplazarse a la
caja los productos ya extraı́dos). El espacio muestral Ω estará conformado entonces por todas las
muestras posibles que pudieran seleccionarse de la caja, lo cual equivale a encontrar la cantidad de
subconjuntos de 4 elementos que se pudieran formar con estos 20 y por tanto el número de elementos
de Ω, será n(Ω) = 20 20!
4 = 16!4! =
20×19×18×17×16!
16!×4×3×2×1 = 4, 845. Si definimos el evento A de que nos toque
un producto vencido, entonces n(A) se puede obtener usando el principio de multiplicación, ya que
esta operación la podrı́amos dividir en dos tareas. La primera consistente en seleccionar el artı́culo
vencido de los 5 que existen, para lo cual hay 5 maneras y la segunda de seleccionar los restantes 3
productos en la muestra de los no vencidos que son 15. Esto último se puede hacer de 15 3 = 455
maneras. En consecuencia, aplicando la definición clásica (ya que cualquiera de las muestra tiene la
misma chance de salir), la probabilidad pedida en a) será
5 × 455
P (A) = = 0.469556
4, 845
Bajo el mismo razonamiento, si definimos el evento B = “Nos tocan dos productos vencidos”, se
tiene en R que la probabilidad de este evento viene dada por
> choose(5,2)*choose(15,2)/choose(20,4)
[1] 0.2167183
ESTADISTICA APLICADA Luis Valdivieso 53
Ejemplo 2.5 ¿Cuál es la probabilidad de obtener exactamente un par en una mano de poker?
Solución: Este es un problema relativamente complejo, por lo cual será importante descomponer la
operación de selección en tareas más sencillas. Para empezar, el espacio muestra Ω, conformado por
todas las posibles manos (de 5 cartas), tiene n(Ω) = 52 0
5 = 2 598, 960 manos. El evento de interés es
A = “Obtener exactamente un par”. Asumiendo que tenemos una baraja sin comodines, la operación
en mención la podrı́amos entonces subdividir en las siguientes tareas:
Tarea 3: Seleccionar los otros números que acompañen al del par. Esto se puede hacer de
n3 = 12
3 = 220 maneras.
Tarea 4: Seleccionar los palos para los tres números de la tarea 3. Esto se puede hacer de
n4 = 43 maneras.
Este número mide el grado de factibilidad de la ocurrencia de un evento A si se conoce de que el evento
B ya ocurrió. Vale indicar que la función P (. | B) es en efecto un medida de probabilidad en el sentido
axiomático y que esta medida no tiene porque ser igual que P (.), ya que el que sepamos que el evento
B ha ocurrido podrı́a modificar las creencias que se tiene sobre otro evento particular. Consideremos
para ilustrar el caso de una baraja de cartas y el experimento que consiste en seleccionar de ella al
azar una de las cartas. El espacio muestra está aquı́ conformado por todas las 52 cartas de la baraja.
Si definimos los eventos A = ”La carta seleccionada es de corazones” y el evento B = ”La carta
seleccionada es roja”, entonces
P (A ∩ B) 13/52
P (A | B) = = = 0.5.
P (B) 26/52
Note que esta probabilidad la podrı́amos también haber obtenido de forma intuitiva, ya que si nos
informarán que la carta seleccionada es roja, la probabilidad que nosotros proyectarı́amos para que
esta sea de corazones serı́a de 13/26 = 0.5 pues buscarı́amos las cartas de corazones sólo dentro de
las cartas rojas, pues ya sabemos que la carta seleccionada es de todas maneras roja. Note también
que P (A) 6= P (A | B), ya que P (A) es 0.25 al no tener mayor información sobre lo que aconteció en
la selección.
Una aplicación interesante de la probabilidad condicional esta centrada en la propiedad siguiente
conocida como la regla del producto. Ella básicamente extiende la definición que nos dice que
P (A ∩ B) = P (A | B)P (B)
Proposición 2.6 Si A1 , A2 , ..., An son eventos cualesquieras con intersecciones no nulas, entonces
2.5.1. Independencia
A y B c son independientes
Ac y B son independientes
Ac y B c son independientes.
Demostración: Los tres casos son similares por lo que sólo probaremos el primero. Los otros dos
quedan como ejercicio. Si A y B son dos eventos independientes, entonces
Ejemplo 2.6 En un torneo relámpago de fulbito, en el que jugarán todos contra todos y no habrá em-
pates, participarán 3 equipos: A,B y C. Naturalmente el torneo lo ganará quien gane sus dos partidos.
Dado que el equipo A es favorito y no se conoce mucho sobre los otros dos equipos, se plantea que
3
P (AB) = P (AC) = 4 y P (BC) = 12 , donde las notaciones X, XY y XYZ denotan respectivamente
a los eventos X vence a Y y a Z, X vence a Y y X vence a Y, quien a su vez vence a Z. Se plantea
también que P (ABC) = P (ACB), P (BAC) = P (BCA) y P (CAB) = P (CBA).
b) Para la independencia deberı́a de cumplirse que P (AB ∩ AC ∩ BC) = P (AB)P (AC)P (BC),
P (AB ∩ AC) = P (AB)P (AC), P (AB ∩ BC) = P (AB)P (BC) y P (AC ∩ BC) = P (AC)P (BC).
Vemos sin embargo que
2 9 3 3
P (AB ∩ AC) = P (ABC ∪· ACB) = 2p1 = 6= = × = P (AB)P (AC)
3 16 4 4
y por tanto los eventos no son independientes. 2
Supongamos que tenemos tres lotes, dos de 7 artı́culos y uno de 9 artı́culos. Por error en los
lotes de 7 artı́culos se colocaron en cada uno dos artı́culos defectuosos; mientras que en el lote de 9
artı́culos, 3 artı́culos defectuosos. Supongamos ahora que ud. elige al azar uno de los lotes y selecciona
de este tres artı́culos. Defı́nanse los eventos A = “El lote elegido sea uno con 7 artı́culos” y B =
“Se seleccione un artı́culo defectuoso”. Si se nos dijera que hemos elegido un lote de 7 artı́culos, la
probabilidad de eligir un artı́culo defectuoso vendrı́a dado por:
2
5
1 × 2
P (B | A) = 7
= 0.5714
3
¿ Qué es lo que pasarı́a ahora si es que no se nos diera la información A ?, ¿ cómo se modificarı́a, si
es que lo hace, la probabilidad de seleccionarse un artı́culo defectuoso ?. El siguiente teorema, nos
será para esto de gran ayuda.
Proposición 2.8 ( Teorema de probabilidad total) Sean A1 , A2 , . . . , An n eventos disjuntos dos a dos
(Ai ∩ Aj = ∅, ∀i 6= j) que unidos conforman el espacio muestral Ω. Si B es un evento cualesquiera,
entonces
n
X
P (B) = P (B | Ai )P (Ai )
i=1
Proposición 2.9 (Teorema de Bayes) En el contexto del teorema anterior, se cumple que
P (B | Aj )P (Aj )
P (Aj | B) = Pn , ∀j = 1, 2, . . . , n.
i=1 P (B | Ai )P (Ai )
Una manera práctica de resolver problemas que involucren la aplicación de estos teoremas es
mediante un diagrama de árbol. Por ejemplo, si n = 3, un diagrama de árbol viene dado por:
B
A1
@
R Bc
@
B
- A2
A @
A R Bc
@
A
A B
A
AU A3
@
R Bc
@
ESTADISTICA APLICADA Luis Valdivieso 57
Ejemplo 2.7 Supongamos que en el ejemplo anterior Ud., luego de seleccionar al azar a uno de los
lotes, selecciona al azar de éste 3 artı́culos.
a) ¿Con qué probabilidad sólo uno de los artı́culos le resultará defectuoso ?
b) Si Ud. encuentra que dos artı́culos le resultaron defectuosos, ¿ de qué tipo de lote es más probable
que estos hayan sido seleccionados ?
Solución: a) Sean los eventos A = “Se selecciona un lote de 7 artı́culos” y B = “Se encuentra un
(3)×(6)
artı́culo defectuoso”. Se nos pide P (B). Dado que P (B | A) = 0.5714, P (B | Ac ) = 1 9 2 = 0.5357
(3)
2
y P (A) = 3 , el teorema de probabilidad total o el diagrama de árbol siguiente:
0.5714 B
A
@
R Bc
@
2
3
A
A
A
1
3 A 0.5357 B
A
AU Ac
@
R Bc
@
2 1
implican que P (B) = P (B | A)P (A) + P (B | Ac )P (Ac ) = 0.5714 × 3 + 0.5357 × 3 = 0.5595.
b) Sea el evento C = “Se encuentran dos artı́culos defectuosos”. Para responder la pregunta debemos
obtener solo P (A | C), ya que la otra probabilidad a compararse es el complemento de esta. Al igual
que en a), P (C) = P (C | A)P (A) + P (C | Ac )P (Ac ) = 0.1429 × 32 + 0.2143 × 13 = 0.1667 y por tanto
0.1429× 32
P (A | C) = P (C|A)P
P (C)
(A)
= 0.1667 = 0.5715. Ası́, es más probable de que estos artı́culos hayan sido
seleccionados del lote con 7 artı́culos. 2
2.6. Ejercicios
1.- En una ciudad el 40 % de los domicilios tiene conexión a Internet, el 33 % tiene conexión de
TV por cable y el 20 % disfruta de ambos servicios. Si se elige al elegir al azar un hogar, calcule la
probabilidad de que
a) nos encontremos con alguno de estos dos servicios.
b) el hogar tenga conexión a Internet, pero no TV por cable.
2.- Un canal de comunicación tiene tres componentes: una fuente emisora y dos receptoras. El usuario
final de este canal puede acceder a la información proporcionada si, y solo si, la fuente emisora y por
lo menos una de las receptoras están operativas. Para cualquiera de estas receptoras la probabilidad
de que esté operativa conjuntamente con la emisora es de 0.855. Si la probabilidad de que las 3
fuentes estén operativas simultáneamente es 0.7695.
58
3.- En la inspección de control de calidad de cierto tipo de artı́culos se pudieran presentar 3 tipos de
defectos, defectos de tipo I con probabilidad 0.1, defectos de tipo II con probabilidad 0.6 y defectos
de tipo III con probabilidad 0.4. Se sabe que los defectos de tipo I son independientes de los de tipo
II y que de las veces en que se presento un defecto de tipo III, un 7 % ocurrió también un defecto
de tipo I, en un 70 % de tipo II y un 2 % conjuntamente los defectos de tipo I y II. Si usted realiza
una inspección de control:
a) ¿Con qué probabilidad no encontrará ningún defecto ?
b) ¿Con qué probabilidad se presentará sólo uno de los tipos de defectos?
c) Si otra persona realiza independientemente otra inspección de control ¿con qué probabilidad
ninguno de los dos encontrará defecto alguno?
4.- Juan, Maria, Rosa y Pepe han llevado su ropa a una lavanderı́a self-service en la cual existen cuatro
máquinas disponibles A, B, C y D, una de las cuales, la máquina C, tiene la opción de centrifugado
rápido. Si ellos eligen al azar estas máquinas, pues desconocen las caracterı́sticas de estas:
a) Describa explı́citamente un espacio muestral apropiado para este experimento aleatorio.
b) Halle la probabilidad de que Juan, Maria, Rosa y Pepe elijan respectivamente las máquinas B, C,
A y D.
c) ¿Con qué probabilidad a Juan le tocará la máquina con centrifugado rápido?
d) ¿Con qué probabilidad a una de las mujeres le tocará la máquina con centrifugado rápido?
5.- Como gerente de una compañı́a usted ha recibido correos de las compañı́as Balbuena, Prado y
Foster y prepara sendas cartas de respuesta que las entrega a su secretaria para que las edite y remita
por fax a estas compañı́as. Desafortunadamente a usted se le olvido colocar el nombre de la compañı́a
a quién serı́a dirigida cada una de las tres cartas. Si la secretaria, ante esta falta de información,
decide enviar estas cartas al azar a las compañı́as:
a) Describa explı́citamente el espacio muestral asociado a este experimento aleatorio
b) Si se define el evento A = “Sólo una de las cartas de respuesta llega a la compañı́a correcta”describa
este evento como subconjunto del espacio muestral y halle su probabilidad.
c) Si se define el evento B = “La compañı́a Foster recibe la carta respuesta fax que le deberı́a
corresponder a la compañı́a Prado”¿es este un evento disjunto al del evento A en b)? ¿Cuál es la
probabilidad P (AU B)?
6.- Doce artı́culos, de los cuales tres están marcados han sido chocolateados y puestos al azar en 3
cajas de 4 artı́culos cada uno.
a) ¿Con qué probabilidad cada caja contendrá exactamente un artı́culo marcado?
b) ¿Con qué probabilidad quedará alguna caja sin artı́culos marcados?
7.- En el almacén de una aduana se tienen 13 autos, de las cuales, 6 corresponden a un modelo A,
4 a un modelo B y 3 a un modelo C. Si de este almacén se escogen 3 autos al azar y sin reemplazo
para inspección, calcular la probabilidad de que al menos dos autos sean del mismo modelo.
ESTADISTICA APLICADA Luis Valdivieso 59
8.- Una asociación desea organizar 4 congresos, para lo cual elegirá al azar igual cantidad de sedes
en 7 paı́ses, dentro de los cuales hay dos paı́ses de Sudamérica: Perú y Brasil. Cada paı́s podrá ser
sede de sólo uno de los congresos y estos se realizarán en los años 2017, 2018, 2019 y 2020.
a) Describa un espacio muestral asociado a este experimento aleatorio de selección, listando al menos
3 elementos de este espacio e indicando el número de sus elementos.
b) ¿Con qué probabilidad el Perú será elegido para realizar uno de los congresos?
c) ¿Con qué probabilidad Brasil será elegido sede para el 2017 y el Perú sede para el 2020?
d) Si en la primera selección para el 2017 el Perú no fue elegido, ¿qué probabilidad hay de que de
que Sudamérica sea aún sede de uno de los 4 congresos?
e) ¿Con qué probabilidad sólo uno de los paı́ses sudamericanos será elegido para organizar uno de
estos cuatro congresos?
9.- Una persona tiene un reproductor MP4 que utiliza dos pilas AAA. Suponga que en una caja tiene
5 pilas AAA idénticas en apariencia, pero de las cuales 2 están gastadas. Si la persona selecciona dos
pilas al azar de la caja
a) Describa de manera explı́cita el espacio muestral asociado a este experimento aleatorio.
b) Halle la probabilidad de que sólo una de las pilas seleccionadas no este gastada.
c) Halle la probabilidad de que pueda hacer funcionar su reproductor.
10.- Un número binario está compuesto sólo de los dı́gitos 0 y 1 (por ejemplo, 1101, 0101, etc).
Estos números tienen un papel importante en el uso de computadores electrónicos. Supóngase que
un número binario está formado por n dı́gitos. Supóngase que la probabilidad de que aparezca un
dı́gito incorrecto es p y que los errores en dı́gitos diferentes son independientes uno de otro. ¿Cuál es
la probabilidad de formar un número incorrecto ?
11.- Una compañı́a cuenta actualmente con 2 proveedores de cierto insumo. Suponga que a usted
le dicen que para la elección de estos proveedores se presentaron 9 proveedores, quienes ofertaron
el insumo a un precio unitario de 10,8,12,9,15,17,11,13 y 14 nuevos soles. Le informan también de
que en un primer proceso se seleccionaron al azar a 3 de estos proveedores y en el segundo proceso
eliminó de esta lista preliminar al proveedor con el mayor precio ofertado, quedando finalmente los
dos proveedores actuales de la compañı́a.
a) Describa un espacio muestral adecuado para la selección de los proveedores en el primer proceso,
indicando cuantos elementos tiene este espacio muestral y explicitando al menos dos de sus elementos.
b) ¿Con qué probabilidad en el primer proceso de selección se habrá seleccionado al proveedor con
un precio unitario de 14 soles?
c) ¿Con qué probabilidad uno de los proveedores actuales está vendiendo a la compañı́a el insumo a
14 soles la unidad?
d) ¿Con qué probabilidad la compañı́a estará actualmente pagando a lo más 14 soles por algún
insumo?
60
12.- Diez especı́menes de distintos tipos de aleación con supuestamente distintos grados de dureza
han sido enviados a un laboratorio para sus pruebas con un durómetro. Dado que el laboratorio no
dispone del tiempo y presupuesto suficientes para realizar todas las pruebas, decide realizar sólo 5
pruebas, seleccionando al azar igual número de especı́menes una a una del envı́o para su prueba con
el durómetro.
a) Si se definen los eventos A = “El primer especı́men seleccionado es el de menor dureza” y B =
“El segundo especı́men seleccionado es el de mayor dureza” ¿son estos eventos independientes?
b) ¿Con qué probabilidad el especı́men de mayor dureza será seleccionado en la tercera prueba?
c) Halle la probabilidad de que se seleccionen los dos especı́menes con mayor dureza.
13.- Considere un bien para el cual se asume que de un mes a otro, la acción puede independientemente
subir o bajar de precio en un sol con probabilidades respectivas de 0.6 y 0.4. Si al término del mes
anterior el bien tenı́a un precio de 10 soles
a) Halle la probabilidad que dentro de 4 meses el bien culmine con un precio de 14 soles.
b) Defina un espacio muestral apropiado para la evolución de los precios del bien durante 4 meses.
c) Si se definen los eventos A = “ El precio del bien al término de 4 meses es de 10 soles”, B = “ El
precio del bien sólo sube dos veces en los próximos 4 meses” y C = “ El precio del bien disminuirá en
4 meses en un sol con respecto a su precio actual” ¿ son estos eventos disjuntos 2 a 2? ‘? son estos
eventos independientes?
14.- Tres máquinas producen un cierto artı́culo en cantidades muy grandes, de tal manera que
cualquiera de estos artı́culos puede resultar defectuoso independientemente de la máquina que lo
haya producido. La primera máquina produce 2.5 % de artı́culos defectuosos, la segunda 3.1 % y la
tercera 1.8 %. Se seleccionan al azar tres de estos artı́culos, el primero producido en la máquina 1,
el segundo en la máquina 2 y el tercero en la máquina 3.
a) ¿Cuál es la probabilidad de que al menos uno de los artı́culos seleccionados de las dos primeras
máquinas sea defectuoso?
b) ¿Cuál es la probabilidad de que el artı́culo seleccionado de la máquina 3 sea el segundo defectuoso?
c) ¿Cuál es la probabilidad de que solo uno de los artı́culos seleccionados sea defectuoso?
d) Suponga que un dı́a la primera máquina produjo 50 artı́culos, la segunda 80 y la tercera 40 y
estos se enviaron a un almacén, del cual usted seleccionó al azar 3 artı́culos, ¿con qué probabilidad
sólo uno de estos 3 artı́culos será defectuoso?
15.- Una empresa tiene un almacén donde guarda 24 dispositivos, 9 de los cuales son defectuosos.
Para renovar el almacén suponga que se seleccionan al azar y sin reemplazo 10 dispositivos de este y
se decide reemplazar todos los dispositivos defectuosos encontrados en esta muestra por dispositivos
nuevos para finalmente devolverlos al almacén. Si luego de esta operación se seleccionaran al azar y
sin reemplazo 5 dispositivos del almacén, responda a lo siguiente.
a) ¿Con qué probabilidad la empresa adquirirá 4 nuevos dispositivos, finalizada la primera selección?
b) ¿Con qué probabilidad ninguno de los dispositivos en la segunda muestra será defectuoso?
ESTADISTICA APLICADA Luis Valdivieso 61
16.- Un alcoholı́metro, usado por la policı́a para saber si los conductores exceden el lı́mite permitido
de alcohol en la sangre si conducen se sabe satisface: P (A | B) = P (Ac | B c ) = p, donde A es el
evento que el alcoholı́metro indica que el conductor excedió el lı́mite legal y B es el evento de que
el conductor efectivamente consumió más alcohol de lo permitido. Si los Sábados por la noche se
sabe que aproximadamente un 5 % de conductores exceden el lı́mite legal de alcohol en la sangre a)
Describa en palabras el significado de P (B c | A).
b) Determine P (B c | A), si p = 0.95.
c) ¿Cuán grande deberá ser p para que P (B | A) = 0.9?
d) Halle, en términos de p, la probabilidad de que al parar la policı́a un Sábado por la noche a 4
conductores seleccionados al azar, a sólo 2 el alcoholı́metro le de una clasificación correcta.
17.- Suponga que el 20 % de una población sufre cierta enfermedad. En las farmacias se vende
una prueba clı́nica que detecta, con una probabilidad de 0.8, que en efecto una persona tiene la
enfermedad y que por otro lado tiene una probabilidad 0.3 de salir positiva (es decir, indicar que la
persona tiene la enfermedad) cuando en verdad la persona no tiene la enfermedad.
a) Si se elige al azar a una persona de la población y se le aplica la prueba clı́nica, ¿cuál es la
probabilidad de que esta prueba salga positiva?
b) Si se eligen al azar a 5 personas de la población y se les aplica la prueba clı́nica, ¿con qué proba-
bilidad en al menos uno de estos casos la prueba resultará positiva ?
18.- Un sistema de seguridad biométrico, que hace uso de huellas dactilares, erróneamente rechaza, a
una de cada 500 personas autorizadas en un centro de información clasificada. Este sistema, de otro
lado erróneamente admite a una de cada 5,000 personas no autorizadas al centro de información. Si
el 95 % de las personas que buscan ingresar al centro tienen autorización, y un dı́a el sistema rechaza
a una persona, ¿cuál es la probabilidad de que esta persona este realmente autorizada?
19.-Un ingeniero debe diseñar la cimentación de un edificio para esto debe conocer la profundidad
de la base rocosa. Para propósitos del diseño, la profundidad h es dividida en 4 estados: {h ≤
5m}, {5m < h ≤ 10m}, {10m < h ≤ 15m} y {h > 15m}. Un geólogo de manera preliminar asigna
las siguientes probabilidades para los cuatro estados de la siguiente manera:
Para medir la profundidad de la base rocosa se utiliza un cierto instrumento que está sujeto a algún
error. Por experiencias previas se conoce la probabilidad condicional de que el instrumento indique
una cierta medición dado que se conoce el verdadero estado de la profundidad de la base rocosa.
Estas probabilidades se presentan en la siguiente tabla:
62
Verdadero estado
Medición h ≤ 5m 5m < h ≤ 10m 10m < h ≤ 15m h > 15m
h ≤ 5m 0.9 0.05 0.03 0.02
5m < h ≤ 10m 0.07 0.88 0.10 0.06
10m < h ≤ 15m 0.03 0.05 0.81 0.12
h > 15m 0.00 0.02 0.06 0.80
(por ejemplo, la probabilidad que la medición haya sido dado que en verdad es es de 0.90 ó la
probabilidad que la medición haya sido dado que en verdad es es de 0.03).
a) Si la medición fue de 7m, calcule las probabilidades de cada uno de los estados dada esta infor-
mación. Interprete sus resultados.
b) Si se realiza una nueva medición independiente y esta es de 8m calcule las probabilidades de cada
uno de los estados dada esta nueva información. Interprete sus resultados.
20.- Una minera debe de tratar por ley secuencialmente sus aguas residuales por tres procesos de
limpieza independientes I, II y III antes de que estos sean vertidos en un rio. Cada proceso podrı́a
ser calificado como insatisfactorio(A), incompleto(B) o satisfactorio(C), siendo las probabilidades de
estos eventos para cada proceso las siguientes
VARIABLES ALEATORIAS
X:Ω→R
En otras palabras, una v.a. es una aplicación que especifica una manera particular de cuantificar
los elementos del espacio muestral o posibles resultados de un experimento aleatorio. Su nombre se
fundamenta en que el valor que tome la variable no será conocida sino hasta después que se realice
el experimento.
Al conjunto de todos los posibles valores que la v.a X pudiera tomar se le denota por RX y se
le llama el rango de X. Si RX es finito o enumerable, X se denomina una v.a discreta; mientras que
si RX es un intervalo no degenerado (un punto), X se denomina una v.a continua. Existen también
algunas variables en las que X pudiera tomar valores puntuales como infinitos valores dentro de ciertos
intervalos. Tales variables se denominan mixtas y su tratamiento es similar al de la combinación de
los dos casos anteriores, pero lo que no las veremos en estas notas.
Para ilustrar el concepto, retomemos el problema del ejemplo 2.4, en el que extraı́amos al azar y
sin reemplazo, 4 artı́culos de una caja con 5 productos vencidos. Este experimento aleatorio genera
un espacio muestral conformado por 20 4 = 4, 845 elementos, algunos de los cuales se explicitan en
donde por Bi entenderemos a que el i−ésimo producto bueno es seleccionado y por Vi a que el i−ésimo
producto vencido es seleccionado. En este contexto podrı́amos definir muchas variables aleatorias.
Una de ellas es por citar, X =Número de productos vencidos seleccionados. Esta es una v.a discreta,
1
Formalmente deberı́a ser medible en el sentido de que la imagen inversa de ella deberı́a de estar en la sigma-álgebra
F definida sobre Ω; esto es X −1 (] − ∞, a]) = {ω ∈ Ω | X(ω) ∈ F}, para cualquier a ∈ R. Puesto que para efectos
prácticos y los problemas que trabajaremos aquı́ estamos asumiendo F = 2Ω , tal condición no será necesaria.
63
64
pues su rango es RX = {0, 1, 2, 3, 4} y su valor no se podrá conocer sino hasta que realicemos el
experimento. Formalmente X se puede escribir como la función
X: Ω 7−→ R
{B1 , B2 , B3 , B4 } → 0
{B15 , V4 , B6 , B10 } → 1
.. ..
. .
{V2 , V3 , V4 , V5 } → 4.
Definición 3.2 (La función de probabilidad) Si X es una v.a. discreta, la función de probabilidad
de X viene dada por:
PX (x) = P (X = x) = P ({ω ∈ Ω / X(ω) = x}).
P
Se sigue de esta definición que x∈RX PX (x) = 1 y que si x ∈
/ RX , entonces PX (x) = 0.
Ejemplo 3.1 Consideremos nuevamente el ejemplo 2.4 reincorporado al inicio de este capı́tulo. Para
obtener la función de probabilidad de la v.a X =Número de productos vencidos seleccionados, hay
que tomar en cuenta que sólo es necesario evaluar ella en los 5 valores de su rango, pues fuera de
ella es 0. Dado que todas las muestra en Ω tienen la misma factibilidad de ocurrencia, podemos usar
la definición clásica para evaluar esta función. Por ejemplo,
PX (0) = P ({ω ∈ Ω | X(ω) = 0}) = P ( {B1 , B2 , B3 , B4 }, {B1 , B2 , B3 , B5 }, . . . , {B12 , B13 , B14 , B15 } )
15
4 (15!)/(11!4!) 15 × 14 × 13 × 12
= 20 = = = 0.2817.
4
(20!)/(16!4!) 20 × 19 × 18 × 17
En general usando las técnicas de conteo dadas en el capı́tulo anterior, se sigue que en general
5
15
x 4−x
PX (x) = 20
, x = 0, 1, 2, 3, 4.
4
2
En el caso de una v.a. continua, la noción de función de probabilidad carece de sentido ya que la
probabilidad de que X tome exactamente un solo valor de entre los infinitos que pudiera tomar es
siempre nula. Esto sin embargo, no limita la posibilidad de evaluar la probabilidad de que X tome
valores en un intervalo. Para ello se utiliza el siguiente concepto.
Definición 3.3 (La función de densidad) Si X es una v.a. continua, la función de densidad de X
Rb
es una aplicación fX : R → [0, ∞[ tal que P (a ≤ X ≤ b) = a fX (x)dx y satisface que:
Z ∞
Area bajo la gráfica de fX = fX (x)dx = 1.
−∞
ESTADISTICA APLICADA Luis Valdivieso 65
Cabe remarcar que fX no es una probabilidad, sino simplemente un modelo matemático que nos
permite evaluar la probabilidad de que X tome valores en el intervalo [a, b] como el área bajo su
gráfica entre los puntos a y b.
Definición 3.4 (La función de distribución) La función de distribución (acumulada) de una v.a. X
viene dada por:
FX (x) = P (X ≤ x) = P ({ω ∈ S / X(ω) ≤ x}).
c) ( P
PX (u), si X es una v.a. discreta
FX (x) = R xu≤x,u∈RX
−∞ fX (u)du , si X es una v.a. continua.
dFX (x)
d) Si X es una v.a continua, entonces fX (x) = dx .
Ejemplo 3.2 Suponga que para la licitación de la construcción de un pequeño aeropuerto se han
presentado dos postores A y B, los cuáles ofrecerán, sin saber uno la oferta del otro, indistintamente
una inversión de entre 0 y 1 millón de dólares. Halle la función de distribución y densidad de la
oferta ganadora; esto es, de la que ofrezca más inversión.
E((X − µ)2 ) = E(X 2 ) − µ2X . A este número se le llama la varianza de X y a su raiz la desviación
estándar de X. Ambas constituyen medidas de la dispersión de los posibles valores de X.
66
b) V (a + bX) = b2 V (X).
Ejemplo 3.3 Un comerciante desea averiguar el stock óptimo mensual K que deberı́a adquirir de
un bien perecedero. El precio de compra del bien es de a u.m. y el de venta de b u.m. Si a fin de mes,
le sobra cierta cantidad del bien, él lo rematará a c u.m.; mientras que si le falta para satisfacer la
demanda, comprará más del bien a d u.m. (se asume que los precios dados son unitarios y satisfacen
la relación: c < a < d < b). Si la demanda del bien es una v.a. continua X con función de distribución
conocida FX y se tiene un costo fijo mensual de e u.m., determine el valor óptimo de K.
Solución: La función de utilidad mensual del comerciante, que depende del stock K que él adquiere
y de la demanda del bien, viene dada por:
(
bX + c(K − X) − aK − e, si X ≤ K
U ≡ U (X, k) =
bX − aK − d(X − K) − e, si X > K.
ó (
(b − c)X + (c − a)K − e , si X ≤ K
U ≡ U (X, k) =
(b − d)X + (d − a)K − e , si X > K.
El valor esperado de la utilidad mensual del comerciante, que lo denotaremos por g(K), es entonces:
Z ∞ Z K Z ∞
g(K) = E(U (X, k)) = U (x, K)fX (x)dx = U (x, K)fX (x)dx + U (x, K)fX (x)dx
−∞ −∞ K
Z K Z ∞
= ((b − c)x + (c − a)K − e)fX (x)dx + ((b − d)x + (d − a)K − e)fX (x)dx
−∞ K
R∞ RK R∞ RK
Recordando que K fX (x)dx = 1 − −∞ fX (x)dx y que K xfX (x)dx = µX − −∞ xfX (x)dx se tiene
que:
Z K Z K
g(K) = (d − c) xfX (x)dx + (c − d)K fX (x)dx + (d − a)K + (b − d)µX − e (∗).
−∞ −∞
El stock óptimo K ∗ será aquel que maximize la utilidad esperada g(K). Para obtenerlo podrı́amos
reemplazar fX en (*); sin embargo, esta opción resulta poco práctica en los casos que la integración
resulte complicada. Una opción más recomendable será aquella consistente en resolver el problema
de maximización, utilizando el teorema fundamental del cálculo al momento de derivar g(K). La
derivada de g(K) con respecto a K viene dada por:
Z K Z K
0
g (K) = (d−c)KfX (K)+(c−d) fX (x)dx+(c−d)KfX (K)+d−a = (c−d) fX (x)dx+d−a.
−∞ −∞
ESTADISTICA APLICADA Luis Valdivieso 67
00 0
Dado que g (K) = (c − d)fX (K) < 0, la solución de la ecuación g (K) = 0 nos provee del stock
óptimo buscado. Este viene dado por el valor K ∗ que satisface la relación:
d−a
FX (K ∗ ) = .
d−c
2
2 . En-
Proposición 3.3 (Desigualdad de Chevychev) Sea X una v.a. con media µX y varianza σX
tonces para cualquier K > 0 se cumple que:
1
P (|X − µX | ≤ KσX ) ≥ 1 − .
K2
Esta desigualdad, con K = 3, se aplica en el establecimiento de lı́mites de control de calidad. En
efecto, con K = 3 la desigualdad de Chevychev nos garantiza que X se ubicará en mas menos 3
8
desviaciones estándares de su media con una probabilidad de por lo menos 9; en otras palabras,
será poco probable de que X escape del intervalo
Si en un proceso se diera tal situación, entonces el proceso se dice que esta fuera de control y por
tanto debe de revisarse para poder detectar las causas de tan inusual comportamiento.
Ejemplo 3.4 En una lı́nea de producción contı́nua, se ha estimado que la probabilidad de que un
artı́culo resulte defectuoso es p = 0.2. Los artı́culos se empacan en lotes de 5. Si Ud. selecciona al azar
un lote y esta interesado en estudiar la v.a. X = número de artı́culos defectuosos que se encuentran
en el lote, halle la función de probabilidad de X ası́ como su media y desviación estándar.
Solución: El experimento aleatorio que genera esta situación consiste en seleccionar al azar uno de
los lotes producidos para averiguar luego la calidad de sus artı́culos. El espacio muestral S asociado
a este experimento contiene 25 = 32 posibles resultados y está dado explı́citamente por:
S = {(1B, 2B, 3B, 4B, 5B), (1B, 2B, 3B, 4B, 5D), . . . , (1D, 2D, 3D, 4D, 5D)}
= P ({(1B, 2B, 3B, 4B, 5D), (1B, 2B, 3B, 4D, 5B), (1B, 2B, 3D, 4B, 5B), (1B, 2D, 3B, 4B, 5B),
(1D, 2B, 3B, 4B, 5B)}) = P ({(1B, 2B, 3B, 4B, 5D)}∪·{(1B, 2B, 3B, 4D, 5B)}∪·. . .∪·{(1D, 2B, 3B, 4B, 5B)})
(P 2)
= P ({(1B, 2B, 3B, 4B, 5D)}) + P ({(1B, 2B, 3B, 4D, 5B)}) + . . . + P ({(1D, 2B, 3B, 4B, 5B)})
indep.
= P ({1B})P ({2B})P ({3B})P ({4B})P ({5D})+. . .+P ({1D})P ({2B})P ({3B})P ({4B})P ({5D})
= 5(0.2)(0.8)4 .
y consecuentemente que,
5
X
µ = E(X) = xPX (x) = 5(0.2) = 1;
x=0
es decir, esperaremos obtener un artı́culo defectuoso en cada lote que elijamos al azar. Por otro lado,
v
q q u 5
uX p
σX 2 =
= σX E(X 2 ) − µ2X = t x2 PX (x) − 1 = 5(0.2)(0.8) = 0.894427.
x=0
2
Una v.a. X con las caracterı́sticas anteriores se dice que tiene distribución Binomial de parámetros
n = 5 y p = 0.2 y es denotada por X ∼ B(n = 5, p =0.2). A continuación mostramos algunas de las
distribuciones más importantes que utilizaremos recurrentemente en el curso. Comencemos con las
distribuciones de variables discretas.
Existen, como en el caso de la última variable ejemplificada, otras variables cuyas funciones de
probabilidad resultan ser modelos de mucha utilidad para una serie de aplicaciones. Nosotros cita-
remos resumidamente algunos de los modelos de mayor importancia. Para empezar introduciremos
el quizás experimento aleatorio más sencillo llamado de Bernoulli. Este es un experimento con solo
2 posibles resultados: éxito y fracaso y en donde denotaremos por p = P (éxito) a la probabilidad de
éxito.
ESTADISTICA APLICADA Luis Valdivieso 69
2 = np(1 − p).
Valor esperado: µX = np. Varianza: σX
r(1−p) 2 = r(1−p)
Valor esperado: µX = p . Varianza: σX p2
.
NOTA: Si r = 1, X se dice que es una variable aleatoria con distribución geométrica de parámetro
p, y se le denota por X ∼ G(p).
Valor esperado: µX = n M 2 M
N . Varianza: σX = n N (1 −
M N −n
N )( N −1 ).
NOTAS: 1.- En PX se esta usando la convención que ab = 0, si a > b.
M
2.- Si la selección de la muestra fuera con reemplazamiento, entonces X ∼ B(n, p = N ).
70
PROCESO DE POISSON: Un conjunto de eventos discretos se dice que esta generado por un proceso
de Poisson de tasa ω, si para cualquier intervalo I(usualmente de tiempo) de longitud suficientemente
pequeña h > 0, se tiene que:
i) P (ocurrencia de un evento en I) ∼
= wh.
ii) P (ocurrencia de 2 o más eventos en I) ∼
= 0.
iii) La ocurrencia de eventos en intervalos disjuntos del tipo I son independientes.
Ejemplo 3.5 Suponga que las imperfecciones de recubrimiento en un cable se presentan a través de
un proceso de Poisson a razón de 2 por cada 5 metros. Los cables son empacados en rollos de 20
metros cada uno. Para controlar la calidad de estos rollos, se selecciona al azar para inspección un
tramo de 5 metros de cable y se decide desechar (para otros usos) todo rollo que contenga mas de
una imperfección.
a) ¿ Con qué probabilidad este control desechara un rollo que contiene 3 imperfecciones ?
b) Si en un dı́a se han producido 20 rollos ¿ cuantos se esperará sean desechados ?
Solución: a) Sea X1 = número de imperfecciones que contiene el tramo bajo inspección del rollo y
sea X2 = número de imperfecciones que contiene el tramo no inspeccionado del rollo. Se sigue que
X1 y X2 son variables aleatorias independientes con distribución de Poisson, teniendo la primera un
parámetro de λ1 = 52 ×5 = 2 y la segunda un parámetro de λ2 = 25 ×15 = 6. Note también que la v.a.
X = X1 + X2 , que representa el número de imperfecciones en todo el rollo, tiene una distribución de
2
Poisson con parámetro λ = 5 × 20 = 8 . Se nos pide
Notación: X ∼ exp(β).
Función de densidad: (
βe−βx , si x ≥ 0
fX (x) =
0 , en otro caso.
entonces X ∼ Γ(α, ω)
n
3.- Si α = 2 y β = 21 , X se dice que es una variable aleatoria con distribución chi-cuadrado de n
grados de libertad, y se le denota por: X ∼ χ2 (n).
α 2 = αβ
Valor esperado: µX = α+β . Varianza: σX (α+β)2 (α+β+1)
.
NOTA: Si α = β = 1, entonces X ∼ U (]0, 1[).
Notación: X ∼ N (µ, σ 2 ).
Función de densidad:
1 1 2
fX (x) = √ e− 2σ2 (x−µ)
2πσ
2 = σ2.
Valor esperado : µX = µ. Varianza : σX
NOTA: Cuando µ = 0 y σ 2 = 1, a X se le denota por Z y se le llama una variable aleatoria
con distribución normal estándar; vale decir, Z ∼ N (0, 1). Toda v.a. normal X ∼ N (µ, σ 2 ) puede
convertirse en una v.a. normal estándar (estandarizarse) a través de la transformación:
X −µ
Z=
σ
σ2 2 2
Valor esperado: µX = eµ+ 2 2 = e2µ+σ (eσ − 1).
. Varianza: σX
Ejemplo 3.6 Suponga que para el ejemplo 3.5 de los cables, el precio por metro de estos es una
variable aleatoria con distribución normal de media 5 soles y desviación estándar 0.5 soles y una
empresa interesada descuenta por cada imperfección que se de en un rollo 0.5 soles
a) ¿ Cuánto esperará pagar la empresa por cada rollo que adquiera? ¿ Con qué probabilidad la
empresa pagará menos de 90 soles por un rollo sin imperfecciones ?
b) Suponga que existe otra alternativa de control que consiste en determinar la longitud del rollo
apenas se ubique en la inspección una quinta imperfección ¿ Con qué longitud se esperarı́a
salgan los rollos bajo esta polı́tica de control ?
Solución: a) Si P ∼ N (5, 0.25) denota a la variable del precio por metro (sin imperfecciones) que
pagará la empresa, entonces se espera que ella pague por un rollo cualquiera E[20P − 0.5X] =
20E[P ] − 0.5E[X] = 20(5) − 0.5(8) = 96 soles. De otro lado, la probabilidad de que la empresa pague
menos de 90 soles por un rollo sin imperfecciones es P (20P < 90) = P (P < 4.5) = P (Z < 4.5 −5
0.5 )
= P (Z < −1) = 0.15866.
b) Definamos la variable aleatoria continua L = longitud de cable inspeccionado hasta ubicar una
quinta imperfección (en metros). Entonces L tiene una distribución Gamma con parámetros α = 5
y β = 25 . Se nos pide luego E[L] = α
β = 12.5; es decir, se esperarán obtener cables de 12 metros y
medio de longitud. 2
3.6. Distribuciones y R
Todas las distribuciones vistas y muchas otras más se encuentran implementadas en R. Para
ilustrar algunos de los desarrollos supongamos que tengamos la distribución XXX. R ha implementado
básicamente 4 funciones con cualquier distribución, las cuales tienen como sufijo el nombre de la
distribución. Estas son:
qXXX(p, . . . ): Calcula el cuantı́l p ∈ [0, 1] de una v.a X que tiene distribución XXX; esto es,
el valor q tal que P (X ≤ q) = p.
Los puntos suspensivos en los argumentos de estas funciones, son para especificar los parámetros de
la distribución y otras opciones como el cálculo del logaritmo de la función.
Es importante documentarse, cuando se trabaja con una distribución, sobre la parametrización
que R utiliza, ya que ella no es estándar. Ası́ también en caso de no especificarse los parámetros
siempre es bueno saber cual o cuales son los valores que por defecto utiliza R para esta distribución.
Para ilustrar el uso de estas funciones, tomemos como ejemplo la distribución gamma, la cual
recordemos que no tiene una forma explı́cita para su función de distribución, al menos que su paráme-
tros α sea entero. Sea concretamente X una v.a con distribución gamma de parámetros α = 7.5 y
β = 3; es decir, X ∼ Γ(7.5, 3). Entonces la gráfica de la función de densidad de esta v.a se puede
obtener con
x = seq(0,10,by=0.01)
plot(x,dgamma(x,shape=7.5,rate=3),type=’l’)
0.4
dgamma(x, shape = 7.5, rate = 3)
0.3
0.2
0.1
0.0
0 2 4 6 8 10
La probabilidad de que X tome un valor menor o igual que 4 viene dada por ejemplo por
> pgamma(4,shape=7.5,rate=3)
ESTADISTICA APLICADA Luis Valdivieso 75
[1] 0.9349065
> Me = qgamma(0.5,shape=7.5,rate=3)
> Me
[1] 2.38981
Finalmente, si deseamos simular; es decir, recrear de manera artificial 100 valores de la v.a X,
podemos escribir
m = rgamma(100,shape=7.5,rate=3)
> m = rgamma(100,shape=7.5,rate=3)
> m
[1] 2.6625452 0.7689917 1.9509386 4.1744743 1.9735547 2.3865520 2.5124263
[8] 3.5265864 3.3402294 2.0263015 3.5027949 4.4196460 1.3363469 1.8591059
[15] 2.7135067 1.2708783 2.5711275 2.7407072 1.1118715 3.0520331 1.6617308
[22] 2.2574728 3.2765931 1.7374397 1.7587716 1.6213503 1.8458460 1.9939204
[29] 2.2040888 4.7502856 2.5213610 1.3531028 2.9146931 3.1393688 1.1337547
[36] 4.0450105 1.1419313 2.2882722 1.7693570 2.4043660 2.4873355 2.4853267
[43] 3.5090830 3.0595274 2.2183418 1.4812468 1.6009753 2.8598354 3.8990242
[50] 2.8164115 3.0552297 1.4212291 3.0077369 2.1654346 3.6788579 2.5966048
[57] 3.7653787 2.8141862 1.0664568 1.6569692 0.8524715 1.1203978 2.9679778
[64] 2.4124678 2.5499479 1.9701130 3.3493241 4.5065630 2.6929781 3.7927157
[71] 1.3895163 1.1951270 2.6142309 1.9591438 2.2448915 1.5469290 1.6097168
[78] 3.8347860 2.7320566 1.3422471 2.0883957 3.1403752 1.6114541 5.2458691
[85] 4.0222283 1.0934773 2.2559728 1.7023896 2.9762142 2.6192685 2.3024607
[92] 2.0523902 1.9925179 3.2425290 3.2584707 1.0434340 1.8838496 4.3667586
[99] 1.7343816 1.7741992
Para verificar que estos últimos efectivamente proviene de una distribución gamma con los parámetros
dados, podemos pedir el histograma de estos valores y compararlos con la verdadera función de
densidad. Como se aprecia, los datos parecen bien ajustar a la distribución teórica de la cual han
sido simulados.
Histogram of m
0.5
0.4
0.3
Density
0.2
0.1
0.0
1 2 3 4 5
R = P (T > t0 ).
a) Sistema en serie: En este sistema, todas las componentes deben funcionar para que el sistema
funcione. Esquemáticamente el sistema es del tipo:
ESTADISTICA APLICADA Luis Valdivieso 77
b) Sistema en paralelo: En este sistema, basta que alguna de las componentes funcione para que
todo el sistema funcione: Esquemáticamente el sistema es del tipo:
c) Sistemas mixtos: Son sistemas conformados por una combinación de subsistemas en serie y en
paralelo. Esquemáticamente, un sistema de estos podrı́a ser el siguiente:
A fin de obtener las confiabilidades de los sistemas en serie y paralelo, supondremos en adelante un
tiempo de especificación t0 y la siguiente asunción natural: si Ti , i = 1, 2, ..., n denota el tiempo de
vida útil de cada componente i, entonces T1 , T2 , . . . , Tn son variables aleatorias independientes.
Por definición, el tiempo de vida útil del sistema en serie, digamos TS , se relaciona con el tiempo
de vida útil de cada componente como TS = mı́n{T1 , T2 , . . . , Tn }. La confiabilidad de éste sistema
viene luego dada por:
Rs = P (TS > t0 ) = P (mı́n{T1 , T2 , . . . , Tn } > t0 ) = P (T1 > t0 )P (T2 > t0 ) . . . P (Tn > t0 ),
78
o brevemente por:
Rp = 1 − ((1 − R1 )(1 − R2 ) . . . (1 − Rn )),
La función razón de falla nos mide la propensión a falla de la componente a lo largo del tiempo.
Una tı́pica función razón de falla puede tener en la práctica la gráfica siguiente:
Como se aprecia se distinguen aqui tres zonas claramente diferenciadas: una zona de fallas ini-
ciales (Z(t) decreciente), una zona de fallas accidentales (Z(t) constante) y una zona de fallas por
desgaste (Z(t) creciente). Antes de mostrar algunos modelos que ajustan a gráficas como la anterior,
será interesante mostrar una relación que nos permite obtener la función de densidad del tiempo
dFT (t)
de vida útil de la componente en base a su función razón de falla. Como fT (t) = dt = − dR(t)
dt ,
entonces
fT (t) dLn(R(t))
Z(t) = =−
R(t) dt
Rt
y R(t) = e− 0 Z(u)du
. Luego, fT (t) = Z(t)R(t) puede escribirse como:
Rt
fT (t) = Z(t)e− 0 Z(u)du
. (3.1)
El modelo exponencial. Este modelo asume que las fallas de la componente ocurren solo por accidente;
vale decir que:
Z(t) = β = constante > 0, ∀t ≥ 0.
De (1.1) se sigue que el tiempo de vida útil T de una componente bajo este modelo tiene función de
densidad:
fT (t) = βe−βt , ∀t ≥ 0.
Nótese que si α < 1, se estará modelando a una componente que tiene una alta propensión a sufrir
fallas iniciales; mientras que si α > 1, se estará modelando a una componente con alta propensión
80
a sufrir fallas por desgaste. El modelo exponencial resulta un caso particular del modelo de Weibull
de tomarse α = 1.
De (1.1) la función de densidad del tiempo de vida útil T de la componente bajo este modelo es:
α
fT (t) = αβtα−1 e−βt , ∀t ≥ 0.
En otras palabras, T ∼ W (α, β). En este modelo la función de confiabilidad de una componente
viene dada por:
fT (t) α
R(t) = = e−βt .
Z(t)
en donde las primeras 2 componentes: C1 y C2 son idénticas y siguen en su razón de falla un modelo
exponencial de parámetro β = 1; mientras que la componente C3 en lı́nea sigue en su razón de falla
un modelo de Weibull de parámetros α = 2 y β = 1. Considere el tiempo en años.
a) Halle la función de confiabilidad del sistema y su confiabilidad si se especifica que este debe
funcionar medio año.
b) ¿ Qué tiempo se espera este funcionando el sistema ?
Como se especifica una duración de 6 meses, entonces t = 0.5 y la confiabilidad de este sistema es
R(0.5) = 0.658.
b) Si T es el tiempo de vida del sistema, deseamos hallar E[T ]. Para esto necesitaremos la función
de densidad de T , la cual se puede obtener por
0 2 2
fT (t) = −R (t) = 2(1 + 2t)e−(t+t ) − 2(1 + t)e−(2t+t ) .
R∞
Por tanto, E[T ] = 0 tfT (t)dt = 1.47 años. 2
ESTADISTICA APLICADA Luis Valdivieso 81
Ejemplo 3.8 Una tienda ha puesto en remate un lote de 60 pilas no etiquetadas, 12 de las cuales
son alcalinas de alta duración y el resto son pilas convencionales. Suponga que usted adquiere 4 de
estas pilas y las coloca en un dispositivo que necesita utilizarlo durante al menos 18 horas. Suponga
que según especificaciones, las razones de falla (en horas) de las pilas alcalinas siguen un modelo de
Weibull de parámetros α = 2 y β= 0.001 y la pilas convencionales siguen en su razón de falla un
modelo exponencial de parámetro β = 0.05.
a) Si el dispositivo utiliza sus pilas en un sistema en paralelo, ¿ con qué probabilidad el dispositivo
le será de utilidad ?.
b)Si el dispositivo puede funcionar hasta con 3 pilas, ¿ con qué probabilidad el dispositivo le será de
utilidad ?
Solución a) Sea X = número de pilas alcalinas de las 4 adquiridas y sea T Tiempo de vida útil del
sistema. Se sigue que X ∼ H(60, 12, 4) y que la confiabilidad del sistema viene dado por R(18) =
P (T > 18). Por el teorema de probabilidad total esta última probabilidad puede escribirse como:
4
X
R(18) = P (T > 18) = P (T > 18 | X = x)PX (x)
x=0
Por tanto, si R1 = e−0. 001(182 ) = 0.72325 y R2 = e−0.05(18) = 0.40657 denotan respectivamente a las
confiabilidades de las pilas alcalinas y convencionales a las 18 horas, se tiene que:
C012 C448 12 48
3 C1 C3
R(18) = (1 − (1 − R2 )4 ) + (1 − (1 − R1 )(1 − R2 ) )
C460 C460
C212 C248 C 12 C 48 C 12 C 48
+(1 − (1 − R1 )2 (1 − R2 )2 ) 60 + (1 − (1 − R1 )3 (1 − R2 )) 3 601 + (1 − (1 − R1 )4 ) 4 600
C4 C4 C4
= 0.921475
b) Sea Y = número de pilas de las 4 adquiridas que están funcionando pasadas las 18 horas. Se nos
pide la probabilidad de que Y sea al menos 3. Por el teorema de probabilidad total:
4
X
P (Y = 3) = P (Y = 3 | X = x)PX (x)
x=0
= 4(1 − R2 )R23 PX (0) + ((1 − R1 )R23 + 3R1 (1 − R2 )R22 )PX (1) + (2(1 − R1 )R1 R22 + 2R12 (1 − R2 )R2 )PX (2)
donde por ejemplo P (Y = 3 | X = 1) se obtiene al notar que la pila que no esta funcionando pudiera
ser la única alcalina o cualquiera de las otras 3 convencionales. Similarmente
4
X
P (Y = 4) = P (Y = 4 | X = x)PX (x)
x=0
= R24 PX (0) + R1 R23 PX (1) + R12 R22 PX (2) + R13 R2 PX (3) + R14 PX (4) = 0.0484
Luego, P (Y ≥ 3) = P (Y = 3) + P (Y = 4) =0.2683. 2
82
Ejemplo 3.9 Una máquina posee el siguiente modelo para su función razón de falla:
(
1 , si 0 < t ≤ 2
Z(t) = t2
4 , si t > 2
(Considere al tiempo en meses y que un mes tiene 30 dı́as)
a) Halle la función de densidad del tiempo de vida de la máquina.
b) Halle la función de confiabilidad de esta máquina.
c) Un empresario desea alquilar una máquina nueva de este tipo. El precio de alquiler es de $ 10
por dı́a y la ganancia que le brinda la máquina de estar funcionando es de $ 15 por dı́a. En caso
contrario (de no funcionar la máquina) su ganancia se reducirá a solo $ 2 por dı́a. Si el alquiler se
realiza por un tiempo fijo y continuo K ¿ cuál debe ser el valor de K que le permita al empresario
maximizar su utilidad esperada?
Solución: a) Sea T el tiempo de vida útil de la máquina en meses. Por (1.1) se tiene que si t ≤ 2,
u2 t3
2
R2 Rt 2 4
fT (t) = e−t . De otro lado, si t > 2, fT (t) = t4 e−( 0 1du+ 2 4 du) = t4 e−( 3 + 12 ) . En resumen,
(
e−t , si 0 < t ≤ 2
fT (t) = 2 4 t3
t −( 3 + 12 )
4e , si t > 2
fT (t)
b) Por definición R(t) = Z(t) , luego:
(
e−t , si 0 < t ≤ 2
R(t) = 3
−( 43 + t4 )
e , si t > 2
c) La función de utilidad del empresario viene dada por:
(
390T − 240K , si 0 ≤ T ≤ K
U (T, K) =
150K , si T > K.
Por tanto, él esperará obtener de utilidad al alquilar la máquina durante K meses:
Z K Z ∞
g(K) = E[U (T, K] = (390t − 240K)fT (t)dt + 150KfT (t)dt.
0 K
R∞ RK
Recordando que K fT (t)dt = 1 − fT (t)dt, podemos luego escribir que:
0
Z K Z K
g(K) = 390 tfT (t)dt − 390K fT (t)dt + 150K.
0 0
Derivando e igualando a 0, el tiempo de alquiler óptimo viene dado por K ∗ tal que este resuelve:
5
FT (K ∗ ) =
.
13
5
Dado que FT (2) = 1 − e−2 = 0.8646 > 13 , se sigue entonces que K ∗ < 2 y que por tanto
5 ∗
1 − e−K =
.
13
Consecuentemente, el empresario deberá de alquilar la máquina por un periodo de K ∗ =0.4855 meses.
2
ESTADISTICA APLICADA Luis Valdivieso 83
3.8. Ejercicios
1.- El error de medición de un instrumento de calibración (en milı́metros) se supone que es una v.a
continua X con función de densidad:
(
3 x2
8 (1 − 4 ), si |x| < 2
fX (x) =
0, en otro caso.
a) ¿ Con qué probabilidad este instrumento hará una medición con un error superior a los 1.8
milı́metros ?
b) Halle la función de distribución FX de X y realiza un bosquejo de su gráfica.
c) ¿ Qué error de medición se esperará que este instrumento produzca en una medición ?
2.- Suponga que se lanzan dos dados y se defiene la v.a X como el mayor valor obtenido en este
1
lanzamiento. Muestre que la función de probabilidad de esta X tiene la forma PX (x) = 36 (2x − 1).
Halle su valor esperado y desviación estándar, ası́ como la gráfica de su función de distribución.
3.- Un lote de 10 artı́culos contiene exactamente 4 unidades defectuosas. Si usted examina el lote
seleccionando las unidades una por una y sin reemplazo, halle el rango y la función de probabilidad
de la v.a. X = número de revisiones hasta lograr encontrar los 4 artı́culos defectuosos.
4.- Considere nuevamente el problema 3 del capı́tulo anterior y halle la función de probabilidad del
número de defectos que se le pudieran presentar. Además, si se realizarán 10 de estas inspecciones ¿
con qué probabilidad se encontrarán más defectos de tipo I que lo esperado?
5.- El tiempo de espera de una persona (en minutos) en un banco se mide por una variable aleatoria
continua cuya función de distribución es
1
FX (x) = 1 − , x > 1.
xα+1
a) Encuentre el parámetro α > 0 si se sabe que en promedio una persona espera 3 minutos.
b) Si hay 3 personas en el banco, calcule la probabilidad que al menos una se demore más de dos
minutos en ser atendida.
c) Si el costo de atención de una persona depende del tiempo de espera de modo que si el tiempo de
espera es menor a dos minutos el costo es de 5 soles y si el tiempo de espera es mayor a dos minutos
el costo es de 10 soles más 2 soles por cada minuto adicional de espera. Calcule el costo esperado.
6.- Una tienda ha adquirido una remesa de 40 productos perecederos, cuyos tiempos de vida en
dı́as(desde la compra hasta la fecha de expiración) siguen una distribución exponencial de parámetro
común β = 0.02. La tienda pago por todos ellos $ 120. Suponga que estos productos se venden a $
5 cada uno en estado normal y se los remata a $ 2 si pasan de la fecha de expiración.
a) ¿ Con qúe probabilidad un producto estará vencido, pasados 30 dı́as de la compra ?
b) Si se deciden revender todos los productos (juntos) después de 15 dı́as de haberlos comprado, ¿
con qué probabilidad la tienda habrá hecho una inversión rentable ? ¿ Cuánto se espera reciba la
tienda por la reventa ?
84
7.- Supóngase que X, la resistencia a la ruptura de una cuerda (en libras) es una v.a. con distribución
normal de media 100 y varianza 16. Cada 100 pies de esta cuerda (paquete) produce una utilidad de
$ 25, si X > 95. Si X ≤ 95, la cuerda puede utilizarse con un propósito diferente y se obtienen una
utilidad de $ 10 por paquete. Encontrar la utilidad esperada por paquete.
8.- En un sistema hay 2 resistencias que funcionan de manera independiente. Los tiempos de vida de
cada resistencia se suponen que tienen distribución lognormal con parámetros µ = 4 horas y σ 2 = 4.
Halle la probabilidad de que la primera resistencia en fallar tenga una duración de vida útil menor
que las 2,000 horas.
9.- Para controlar la calidad de un lote de 50 unidades, se seleccionan al azar de este 10 unidades. Si
se encuentra a lo más una unidad defectuosa el lote sale al mercado. En caso contrario, se lo manda
a inspeccionar completamente a un costo de 20 soles, saliendo al mercado con 0 % de defectos.
El lote en el mercado se vende a 100 soles y su costo de producción es de 50 soles. Cada unidad
de las 10 inspeccionadas genera un costo de 0.2 soles y si se ubica una unidad defectuosa en estas
inspecciones esta es reemplazada por una unidad buena con un costo adicional de un sol. Suponga
que un lote con 5 unidades defectuosas pasa por este control de calidad y que la empresa productora
garantiza con indemnizar a todo consumidor que adquiera este lote en el mercado con 3 soles por
unidad defectuosa.
a) ¿ Con qué probabilidad el lote saldrá al mercado con 0 % de defectos?
b) ¿ Cuál es el número esperado de defectos que un consumidor esperará encontrar al adquirir este
lote en el mercado ?
c) Halle la utilidad esperada que obtendrá la empresa productora por vender este lote.
10.- Se planea hacer un control para lotes de 25 artı́culos en dos etapas: En la primera se sacan 5
artı́culos al azar del lote. Si se encuentra a lo más un defectuoso el lote pasa el control, si se encuentran
4 o más defectuosos el lote es rechazado mandándose a revisión completa y si se encuentran 2 o 3
artı́culos se pasa a una segunda etapa. En la segunda etapa, se sacan del lote 8 artı́culos (los 5
anteriores ya no se incluyen) y si se encuentran a lo más dos defectuosos, el lote pasa el control;
en caso contrario es rechazado y pasa a revisión total. Suponiendo que los lotes tienen 6 artı́culos
defectuosos (esto es irreal; pero muy ilustrativo):
a) Halle la probabilidad de que un lote sea rechazado en el control.
b) Si un lote es rechazado en el control ¿ con qué probabilidad se lo habrá mandado a revisión total
en la primera etapa ?
c) Suponga ahora, como sucede en la realidad, que no sabemos la cantidad de artı́culos defectuosos
en un lote y que el lote es grande ( ya no con 25 artı́culos). Use una aproximación Binomial para
responder las partes a) y b).
Nota: Suponga para c) que en controles anteriores se han seleccionado hasta la fecha 1,250 artı́culos,
encontrándose en total 105 artı́culos defectuosos (estime con esto p).
ESTADISTICA APLICADA Luis Valdivieso 85
11.- En el control de calidad de los lotes producidos por una industria se tiene que:
i) Cada unidad inspeccionada genera un costo de 10 u.m.
ii) Reemplazar una unidad defectuosa, ubicada en una inspección, por una unidad buena genera
un costo de 25 u.m.
iii) Reemplazar una unidad defectuosa por una unidad buena,luego de vendido el lote, genera
un costo de 60 u.m.
Suponga que se disponen de las siguientes 3 polı́ticas para un lote de 15 unidades:
Polı́tica 1: Inspeccionar todo el lote y reemplazar las unidades defectuosas por buenas antes de
venderlo.
Polı́tica 2: Seleccionar una muestra al azar de 5 unidades y seguir la polı́tica 1 sólo si en la
muestra se ubican 2 o más unidades defectuosas. En caso contrario, el lote se sacará a la venta,
reeemplazando por una unidad buena, de existir alguna unidad defectuosa en la muestra.
Polı́tica 3: Sacar a la venta el lote sin ninguna inspección.
Si hipotéticamente el lote en mención tuviera 4 unidades defectuosas:
a) Halle la probabilidad de se ubiquen todas las unidades defectuosas del lote bajo la polı́tica 2 .
b) Indique la polı́tica de comercialización más conveniente para el lote, en el sentido de que con ella
se minimizen los costos esperados de inspección y reemplazo.
12.- Una fábrica posee tres lı́neas de producción operativas A1 , A2 y A3 , las cuales se estiman tienen
respectivamente una probabilidad de 0.1, 0.08 y 0.012 de producir un artı́culo defectuoso. La mitad
de la producción es realizada por la lı́nea A1 ; mientras que el 60 % de la producción restante lo
realiza la máquina A2 .
a) Si usted adquiere un artı́culo producido por la fábrica, ¿ qué probabilidad hay de que este le
resulte defectuoso ?
b) Si usted adquiere 10 artı́culos producidos por la fábrica, halle la función de probabilidad del
número de artı́culos que le resultaran defectuosos.
c) Suponga que usted adquiere un lote de 9 artı́culos, donde sabe de que estos provienen de una
sola lı́nea de producción. Si usted selecciona al azar una muestra de 4 artı́culos del lote, halle la
probabilidad de que en su muestra encuentre 2 artı́culos defectuosos.
15.- Una empresa adquiere rollos de alambre de cobre de 150 metros de longitud de cierto fabricante
y utiliza el siguiente procedimiento para la inspección de recibo:
Finalmente si se rechaza un rollo, se inspecciona al 100 % y el fabricante debe pagar los costos
de inspección.
Si el número de fallas del alambre de cobre está descrito por una distribución de Poisson con media
de 0.05 fallas por metro y el costo por metro de inspección es de un sol:
a) Halle la probabilidad de rechazar un rollo.
b) ¿ Cuánto esperará gastar por inspección la empresa ?
c) ¿ Cuánto esperará gastar por inspección el fabricante ?
16.- Una obra requiere de una maquinaria especial, la cual se debe rentar a un costo de 50 u.m. por
mes o fracción de mes bajo un contrato que especifica un número fijo de meses de contrato . Este
contrato; sin embargo, posee una cláusula que especifica que si el periodo de obra excede al número
de meses de contrato , los contratistas podrı́an aún contar con la maquinaria pero por un alquiler de
70 u.m. por mes o fracción de mes adicional que se rente. Si la función de probabilidad del número
de meses que al contratista le toma terminar una obra de similares caracterı́sticas es
( x
C 5x! , si x = 1, 2, 3, 4, 5
fX (x) =
0, en otro caso.
a) Halle el valor de C.
b) Halle el número esperado de meses en que se espera se culmine la obra.
c) Halle el costo esperado en alquiler, si el contrato estipula K = 2 meses.
d) Halle el valor óptimo de K en el sentido de que este minimice el costo total esperado de alquiler
de la maquinaria.
ESTADISTICA APLICADA Luis Valdivieso 87
17.- En una empresa se desea determinar el nivel de producción óptimo K ∗ de un solvente quı́mico
para una temporada. Cada litro producido del solvente le cuesta a la empresa 10 soles; mientras que
ella lo vende a 15 soles. Si al final de la temporada le sobra del solvente, la empresa rematará cada
litro de él a 8 soles; mientras que si le falta para cubrir la demanda podrá pedir más a otra empresa
asociada a un costo de 13 soles el litro y satisfacer la demanda. Si se supone que la demanda por
temporada del solvente en miles de litros a la empresa es una variable aleatoria X ∼ B(α = 1, β = 2)
y se tiene un costo fijo de producción de 150 soles.
a) Halle el valor de K ∗ .
b) Suponga que el gerente de la empresa esta pensando en incrementar los precios de venta del
solvente a 18 soles el litro. Si bajo esta medida un estudio revela que la demanda se contraerı́a siendo
ahora X ∼ B(α = 1, β = 3), ¿ recomendarı́a ud. que se incrementen los precios ? Justifique.
18.- Una tienda necesita saber cuantas bolsas K de un tipo de harina especial (de 50kg cada bolsa)
debe comprar en la semana para maximizar su utilidad esperada. Cada bolsa se vende en la tienda
a 120 soles y la tienda lo compra a 85 soles. De no venderse una bolsa en la semana, la harina se
rancia, por lo que la bolsa de esta harina debe rematarse a 50 soles, existiendo siempre compradores
para esta. Si la demanda de bolsas de esta harina es una v.a. discreta X con la siguiente función de
probabilidad:
(
Cx2 , si x = 1, 2, 3, 4, 5
PX (x) =
0, en otro caso.
a) Halle el valor de C.
b) Halle la función de distribución (acumulada) de X para x = 3. Interprete este último valor.
c) Muestre que la función de utilidad semanal para la tienda, como función de la demanda X y del
número de bolsas K que la tienda adquiere, viene dada por:
(
70X − 35K, si X ≤ K
U (X, K) =
35K, si X > K.
19.- Suponga que el monto anual de pérdidas en miles de soles que incurre una fábrica por pago de
indemnizaciones a sus trabajadores es una v.a. continua con distribución de Weibull de parámetros
1
α=2yβ= 2θ2
a) Si la probabilidad de que un año se tenga un monto en indemnizaciones superior a los 5,000 soles
es de 0.25, halle el valor de θ.
b) Considere y suponga que al cabo de 9 meses de iniciado el año los montos por indemnizaciones
suman ya 3,000 soles, ¿con qué probabilidad se terminará el año con un monto en indemnizaciones
superior a los 5,000 soles?
c) Halle la probabilidad de que el monto de indemnizaciones en el año supere a lo que se esperarı́a
de él.
88
20.- Debido a los problemas financieros por los que atraviesa una empresa, se planea vender parte de
su accionariado. Un gran consorcio está interesado en adquirir un porcentaje Y del total de acciones
de esta empresa y los directivos actuales de la empresa postulan que luego de las negociaciones este
porcentaje será de Y = 100X , donde X ∼ B(4, 1).
a) ¿Qué porcentaje se espera sea adquiridos por el consorcio?
b) ¿Con qué probabilidad el consorcio adquirirá la mayorı́a de las acciones de la empresa?
c) Suponga que de lograr el consorcio hacerse dueña de la mayorı́a de las acciones, ella invertirá en
la empresa un monto de 50,000 dólares; y de no ser ası́ su inversión se reducirá a sólo 5,000 dólares
¿Cuánto se espera y con qué desviación estándar sean los montos de inversión del consorcio?
22.- Un ingeniero Industrial debe comprar componentes electrónicas de un mismo tipo. De acuerdo
a sus especificaciones existen en el mercado solo 3 tipos de componentes A1, A2 o A3 que le podrı́an
ser de utilidad. Las componentes que él adquiera las instalará en un sistema como el siguiente:
Las componentes A1, A2 y A3 tienen tiempos de vida (en horas) modelados por distribuciones de
Weibull de parámetro α = 2 y parámetros β iguales a 0.0002, 0.0004 y 0.0005 respectivamente. El
objetivo del sistema es realizar una tarea que demandará 40 horas. Si se logra el objetivo se ganarán
1,800 dólares, pero si no es asi sólo 200 dólares. De otro lado los costos de cada componente del
tipo A1, A2 y A3 son respectivamente 120, 50 y 20 dólares. Según esta información, ¿ qué tipo de
componente le recomendarı́a adquirir al Ingeniero?
ESTADISTICA APLICADA Luis Valdivieso 89
23.- Tres componentes idénticas, cuyas razones de falla siguen un modelo de Weibull de parámetros
α = 2 y β = 1 se instalan en un sistema en serie. Halle la media y varianza del tiempo de vida útil
del sistema.
24.- Un artı́culo está compuesto por 2 componentes en paralelo, en donde cada una sigue en su razón
de falla un modelo exponencial con parámetro β. Un plan de muestreo para aceptación de un lote
de estos artı́culos requiere probar una muestra de 2 artı́culos durante 80 horas. Se acepta el lote si
no falla ningún artı́culo. Si el fabricante desea tener una probabilidad máxima de rechazo del lote de
0.078 ¿ cuál debe ser el tiempo de duración medio de los artı́culos?
25.- En un sistema en paralelo de tres componentes, todas las componentes poseen una función razón
de falla constante de parámetro β = 0.00757 (en horas), siendo el costo de cualquier componente de
$ 20. Si el sistema falla, el costo por mal funcionamiento es de $ 3,500.
a) Halle el costo esperado del sistema en cualquier instante t.
b) ¿ Cuántas componentes deberán quitarse o agregarse en paralelo al sistema a fin de que este
funcione durante 38 horas con un costo esperado óptimo?
c) Calcule el costo esperado óptimo de la parte b).
26.- Suponga que la duración en años de una componente electrónica sigue en su razón de falla
un modelo de Weibull, cuyos parámetros ud. debe de estimar. Para tal efecto, suponga que usted
dispone de la siguiente información obtenida en las pruebas de vida de 50 de estas componentes y
en las cuales se registró el número de componentes aún operativas al final de cada año, durante un
periodo de 8 años:
Año 1 2 3 4 5 6 7 8
Número de componentes operativas 47 39 29 18 11 5 3 1
Usted esta interesado en adquirir algunas de estas componentes para instalarlas en el sistema:
a) Estime los parámetros asociados a la distribución de las componentes. Para ello se le recomienda
que utilize el método de mı́nimos cuadrados. Explique detalladamente el procedimiento seguido.
b) Determine el tiempo de vida esperado para un sistema como el arriba descrito.
c) Si usted instala 7 sistemas, como el de arriba, halle mediante simulación sus tiempos de vida útil.
90
Capı́tulo 4
DISTRIBUCIONES MUESTRALES
b) Teorema del lı́mite central (TLC): Si X1 , X2 , ..., Xn son n v.a’s independientes, donde cada Xi
tiene la misma distribución de valor esperado µ y varianza σ 2 , entonces para n suficientemente
grande (en la práctica n ≥ 30) se cumple que aproximadamente
Pn
Xi − nµ X̄ − µ
Zn = i=1√ = √ ∼ N (0, 1).
nσ σ/ n
91
92
Aquı́, para el cálculo de probabilidades, se recomienda utilizar la llamada corrección por conti-
nuidad: Si a ≤ b son dos números naturales, entonces aproximadamente:
1 1 b + 1 − np a − 1 − np
P (a ≤ X ≤ b) = P (a − ≤ X ≤ b + ) = FZ ( p 2 ) − FZ ( p 2 ).
2 2 np(1 − p) np(1 − p)
De todas las propiedades listadas, el teorema del lı́mite central ocupa un lugar preponderante en
la teorı́a de inferencia estadı́stica. Lo que el teorema plantea es que si uno tiene un conjunto suficien-
temente grande de variables independendientes con una distribución común cualquiera, entonces por
más asimétrica o extraña que sea esta distribución, la suma o el promedio de estas v.a.’s tenderá a
tener una distribución acampanada tipo la de la distribución normal.
Ejemplo 4.1 Suponga que en una linea continua de producción, la probabilidad de que un artı́cu-
lo resulte defectuoso es de p = 0.1. Si estos artı́culos se empacan en lotes de 1,000 unidades, ¿
qué probabilidad existe de que un lote contenga entre 90 y 120 artı́culos defectuosos?
Se puede comprobar que el valor exacto de esta probabilidad es 0.849339. Como se aprecia la apro-
ximación normal ha hecho un gran trabajo. 2
Ejemplo 4.2 Retomando el ejemplo del control de calidad, supongamos que estemos interesados en
estudiar ahora X = Peso de un artı́culo producido en el dı́a. Esta v.a. X puede pensarse, como es
usual, tenga distribución normal de media µ y varianza σ 2 , siendo ambos parámetros desconocidos.
Ahora, al tomarse al azar 50 artı́culos producidos durante el dı́a para luego anotar sus pesos, estamos
realmente tomando una m.a de tamaño 50 de X: X1 , X2 , ..., X50 . Nuestro interés por esta m.a es
variado. Nos podrı́a interesar, por ejemplo, estimar el peso medio de los artı́culos producidos en
el dı́a ( esto es, tener una idea aproximada de µ). Si este es el caso, nos será útil la estadı́stica
P 1 P50
media muestral X̄ = n1 ni=1 Xi = 50 2
i=1 Xi . Por otro lado podrı́a ser de interés estimar σ , por
citar, para medir la confiabilidad de la estimación anterior. En este caso, uno podrı́a considerar la
1 Pn 1 P50
estadı́stica varianza muestral S 2 = n−1 2
i=1 (Xi − X̄) = 49
2
i=1 (Xi − X̄) . Queda claro que tanto
X̄ como S 2 dependen de los elementos de la m.a. y por tanto son también v.a’s ( no conoceremos sus
valores sino hasta después de haber seleccionado los 50 artı́culos y anotado sus pesos). En tal sentido,
el preguntarse acerca de las distribuciones de estas estadı́sticas tiene sentido y su respuesta una gran
importancia práctica . Las siguientes distribuciones nacen precisamente del intento de encontrar las
distribuciones de X̄ , S 2 y de otras v.a’s asociadas.
Una v.a. X tiene distribución chi-cuadrado con n grados de libertad, y se le denota por X ∼ χ2 (n),
si es que X ∼ Γ( n2 , 12 ). Es decir, la distribución chi-cuadrado es un caso particular de una distribución
gamma.
Una v.a. X tiene distribución t de Student con n grados de libertad, y se le denota por X ∼ t(n),
si su función de densidad es:
Γ( n+1
2 )
fX (x) = √ .
x2 n+1
πnΓ( n2 )(1 + n)
2
2 = n
Valor esperado: µX = 0. Varianza : σX n−2 (n > 2).
X̄ − µ
T = √ ∼ t(n − 1).
S/ n
Una v.a. X tiene distribución F de Fisher con n grados de libertad en el numerador y m grados
de libertad en el denominador, y se le denota por X ∼ F (n, m), si su función de densidad es:
n n
Γ( n+m
2 )(n/m) x
2 2
−1
fX (x) = n+m , x > 0.
Γ( n2 )Γ( m
2 )(1 + (n/m)x)
2
m 2 = 2m2 (n+m−2)
Valor esperado: µX = m−2 (m > 2). Varianza σX n(m−2)2 (m−4)
(m > 4).
1
Proposición 4.4 a) Si X ∼ F (n, m), entonces X ∼ F (m, n).
W1 /n
b) Si W1 ∼ χ2 (n) y W2 ∼ χ2 (m) son v.a’s independientes, entonces F = W2 /m ∼ F (n, m). En
particular, si X1 , X2 , ...., Xn es una m.a de una v.a. X ∼ N (µ1 , σ12 ), e Y1 , Y2 , ..., Ym una m.a
de una v.a. Y ∼ N (µ2 , σ22 ), donde X e Y son independientes, entonces
S12 σ22
F = ∼ F (n − 1, m − 1),
S22 σ12
siendo S12 y S22 las varianzas muestrales asociadas a las poblaciones estadı́sticas determinadas
por X e Y , respectivamente.
Nota: La distribución normal estándar, t de Student, chi-cuadrado y F de Fisher poseen todas tablas
en la que se tabulan algunos valores de su función de distribución. Estas tablas, que se incluyen en el
apéndice de este texto, han sido generadas en nuestro caso con R. Por ejemplo la tabla t de Student,
calcula los cuantı́les q para esta distribución; es decir, el valor q en la distribución t de student con n
grados de libertad para el cual la función de distribución acumulada de esta variable toma distintas
probabilidades dadas. El gráfico siguiente, cuyo código en R se ilustra seguidamente, nos muestra
por citar cómo calcular el cuantı́l 0.95 para una distribución t de Student con 7 grados de libertad
ESTADISTICA APLICADA Luis Valdivieso 95
q = qt(0.95,7)
xc = c(-5,seq(-5,q,0.01),q)
yc = c(0,dt(seq(-5,q,0.01),7),0)
curve(dt(x,7),xlim=c(-5,5),main=’Distribución t de Student con 7 gl’,ylab=’Función de densid
polygon(xc,yc,co=’skyblue’)
text(-0.2,0.15,’p = 0.95’)
arrows(3,0.1,q,0)
text(3.2,0.15,’q = 1.894579’)
0.2
p = 0.95
q = 1.894579
0.1
0.0
-4 -2 0 2 4
donde z1− α2 denota al valor de la distribución normal estándar que acumula un área por debajo de
la función de densidad de 1 − α2 .
Es importante destacar que gracias al TLC este IC es aún válido para la media de cualquier
distribución, siempre que n sea lo suficientemente grande y se tenga una estimación de σ 2 .
IC al 100(1 − α) % para µ, cuando σ 2 es desconocida: Se obtiene usando como pivote a T =
X̄−µ
√
S/ n
∼ t(n − 1) y viene dado por
S S
IC = [X̄ − t1− α2 (n-1) √ , X̄ + t1− α2 (n-1) √ ] ,
n n
donde t1− α2 (n-1) denota al valor de la distribución t de Student con n − 1 grados de libertad que
tiene un área por debajo de la función de densidad de 1 − α2 .
(n−1)S 2
IC al 100(1 − α) % para σ 2 : Se obtiene usando como pivote a W = σ2
∼ χ2 (n − 1) y viene
dado por
(n − 1)S 2 (n − 1)S 2
IC = [ , ],
χ21− α (n- 1) χ2α (n- 1)
2 2
donde χ2α (n-1) y χ21− α (n- 1) denotan a los valores en la distribución chi- cuadrado con n − 1 grados
2 2
α
de libertad que tienen áreas por debajo de la función de densidad de 2 y 1 − α2 , respectivamente.
Otro parámetro recurrente en diversas aplicaciones lo constituye la proporción p de elementos en
la población que comparten cierta caracterı́stica común E. A fin de obtener un intervalo de confianza
ESTADISTICA APLICADA Luis Valdivieso 97
ó
2
z1− 2
z1−
α α
P (p2 (1 + 2
) − p(2p̄ + 2
) + p̄2 ≤ 0) = 1 − α.
n n
Esta probabilidad, puede escribirse como:
P ((p − p1 )(p − p2 ) ≤ 0) = 1 − α,
M
Si procedemos a la construcción del IC al 100(1 − α) % para p = N, bajo la misma técnica utilizada
en la sección anterior, obtendremos el siguiente IC:
r r r r
p̄(1 − p̄) N − n p̄(1 − p̄) N − n
IC = [p̄ − z1− α2 , p̄ + z1− α2 ]
n N −1 n N −1
q
N −n
Nótese que este IC para p difiere del anterior sólo por el factor N −1 , al cual se le acostumbra
llamar el factor de corrección para poblaciones finitas. Nótese también que si N → ∞, este factor
tiende a 1 y por tanto uno obtiene el IC anterior para p.
Es posible también realizar un estudio inferencial para poblaciones finitas en el caso de la esti-
mación de la media poblacional de una v.a. X. Si la población es finita, digamos con N elementos,
se puede deducir que un IC aproximado al 100(1 − α) % para µ cuando n es grande es:
r r
σ N −n σ N −n
IC = [X̄ − z1− α2 √ , X̄ + z1− α2 √ ]
n N −1 n N −1
Nuevamente, la diferencia con el IC tradicional radica en el factor de corrección, el cual tiende a 1 si
N → ∞.
Establecidas las fórmulas de los IC aproximados al 100(1−α) % para cualquier media y proporción
poblacional, nos interesará ahora saber qué tamaño de muestra n deberı́a uno considerar para poder
garantizar a un nivel de confianza del 100(1 − α) % un error máximo de estimación e. Esto se
obtiene directamente de los IC obtenidos. En efecto, si queremos estimar µ, su IC correspondiente
al 100(1 − α) % puede escribirse como:
r
σ N −n
P (|X̄ − µ| ≤ z1− α2 √ ) = 1 − α,
n N −1
luego, según las condiciones establecidas, se debe tener que:
r
σ N −n
e = z1− α2 √ ,
n N −1
ESTADISTICA APLICADA Luis Valdivieso 99
y si N → ∞:
(z1− α2 σ)2
n= .
e2
De manera similar, podemos deducir la siguiente fórmula del tamaño de muestra n para la estimación
de p con un error máximo de estimación de e y un nivel de confianza del 100(1 − α) %:
2
z1− α p̄(1 − p̄)N
2
n= 2 2
z1− α p̄(1 − p̄) + e (N − 1)
2
y si N → ∞:
2
z1− α p̄(1 − p̄)
2
n= .
e2
Un aspecto problemático en estas fórmulas lo constituyen tanto σ como p̄, ya uno es un parámetro
poblacional desconocido y el otro no puede calcularse sin haberse tomado la muestra. En la práctica
estas cantidades se estiman mediante un muestreo piloto previo (es decir, una réplica en una escala
menor del muestreo final) o por cantidades similares de otros estudios semejantes. Más aún, en el caso
de la estimación de p, se acostumbra tomar p̄ = 12 . Esta es una regla conservadora, que simplemente
asigna el valor de p̄ que maximiza el tamaño de la muestra de tal manera que uno pueda siempre
garantizar, al margen del verdadero p̄, un error de estimación de a lo más e.
Ejemplo 4.3 La facultad de Ingenierı́a de una Universidad cuenta con 1,200 alumnos y esta intere-
sada en realizar una encuesta con el fin de determinar, entre otras cosas, el número de sus alumnos
que tienen una PC en su casa. El coordinador de la facultad desea estimar este total con un error
máximo no mayor a los 30 alumnos y una confianza del 99 % ¿ A cuantós alumnos de la facultad
se les deberı́a aplicar la encuesta?
Solución: Se desea estimar T = número los alumnos de la facultad que poseen un PC en su casa
con un margen de error no mayor a los 30 alumnos y un nivel de confianza del 99 %. Dado que
la población de alumnos en la facultad es finita ( N = 1, 200) y T = N p, donde p denota a la
porporción de alumnos de la facultad que poseen un PC en su casa, el problema equivale a estimar
30
p con un margen de error no mayor a e = 1,200 = 0.025 y un nivel de confianza del 99 %. Por tanto
se deberá tomar la encuesta a
2
100
4.4. Ejercicios
1.- Dada una muestra aleatoria X1 , X2 , . . . , X400 de una variable aleatoria X con distribución expo-
nencial con parámetro β.
a) Hallar, en términos de β, la probabilidad P (X > 10).
b) Usando el teorema del Lı́mite Central, encuentre un intervalo de confianza al 95 % para la
probabilidad P (X > 10).
c) Evalue el intervalo anterior, si es que la muestra dió una media de 23.6.
2.- Sea X1 , X2 , . . . , Xn una muestra aleatoria de una variable N (0, σ 2 ) y supongamos se toma una
nueva medición Xn+1 de esta v.a.
a) Muestre que la v.a
r
(Xn+1 − X̄) n
T =
S n+1
sigue una distribución t de Student.
b) Si n = 21, ¿con qué probabilidad la varianza de la muestra superará a más del doble del valor de
la varianza de la población?
3.- Ciertas tarjetas de video son automáticamente empaquetadas en grupos de 35 por una máquina.
Con el fin de verificar la exactitud de la máquina, los paquetes se pesan antes de enviarlos a las
tiendas de expendio. Se sabe que el peso de cada tarjeta es una variable aleatoria con media 40
gramos y desviación estándar 2 gramos. Si un paquete se considera que tiene 35 tarjetas cuando su
peso está comprendido entre los 1,365 y 1,435 gramos, hallar:
a) La probabilidad de que un paquete que tiene 34 tarjetas sea considerado como si tuviera 35.
b) La probabilidad de que un paquete que realmente tiene 35 tarjetas no sea considerado como si
tuviese 35.
4.- El número de quejas que semanalmente recibe una sucursal de comida rápida, X, se supone que
es una v.a discreta con la siguiente función de probabilidad:
(
Cx + 0.1 , si x = 0, 1, 2, 3, 4, 5
PX (x) =
0 , en otro caso
5.- La inversión anual (en miles de dólares) de las microempresas de una ciudad se asume es una v.a.
continua con distribución normal de media µ y varianza 1. Si se toma una m.a de tamaño n = 16
de esta v.a ¿con qué probabilidad la mayor inversión anual de las microempresas en la muestra
superará en 20 dólares a la media de la población?
ESTADISTICA APLICADA Luis Valdivieso 101
6.- Para realizar una cierta tarea se tienen dos tipos de máquinas A y B. Las fallas en las máquinas
ocurren de acuerdo a procesos de Poisson independientes con tasas de una falla por mes y 0.8 fallas
por mes, respectivamente. Asuma un mes de 4 semanas.
a) Se ha estimado que en cierto sector de la industria, el 60 % del total de máquinas que se utilizan
para realizar esta tarea son de tipo A y el resto son de tipo B. Si una de estas máquinas, seleccionada
al azar, presentó fallas durante un perı́odo de prueba de una semana ¿cuál es la probabilidad de que
haya sido una máquina del tipo A?
b) Considere el siguiente enunciado: Para un proyecto se alquilan durante un mes 45 máquinas de
tipo A y 50 de tipo B ¿con qué probabilidad, p, el número total de fallas en las máquinas de tipo
A superará al número total de fallas en las máquinas de tipo B? En base a este enunciado se han
propuesto varias “soluciones”, las cuales se listan a continuación. Usted debe de indicar si ellas son
correctas o incorrectas y especı́ficamente si no lo son debe de indicar el porqué. Halle finalmente el
valor que aproximadamente deberı́a de tener p. En el desarrollo Xi , Yi o las mismas variables sin
subı́ndices denotarán respectivamente número de fallas en cada una de las máquinas de tipo A y B,
respectivamente, durante un mes y Z a la variable normal estándar.
p = (X̄ > Ȳ ) = P (X̄ − Ȳ > 0) = P (Z > −1.02), donde se ha utilizado para la segunda
igualdad el TLC y la propiedad reproductiva.
7.- Dada una muestra aleatoria X1 , X2 , ..., Xn de una v.a. X ∼ exp(β) , se puede probar que
Y = 2nβ X̄
8.- Con el fin de medir el nivel de contaminación de nitratos en una laguna se han seleccionado al
azar 10 cuadrı́culas de ella obteniéndose las siguientes mediciones de concentración en miligramos
por litro en cada una de estas cuadrı́culas
37.75, 40.58, 49.08, 41.99, 23.52, 29.53, 24.27, 40.56, 38.57, 30.33
9.- Sea X1 , X2 , ...., Xn1 una m.a de una v.a. X ∼ N (µ1 , σ 2 ) y sea Y1 , Y2 , ..., Yn2 una m.a de una v.a.
Y ∼ N (µ2 , σ 2 ), donde X e Y son independientes.
(n1 −1)S12 +(n2 −1)S22
a) Muestre que W = σ2
∼ χ2 (n1 + n2 − 2).
b) Muestre que
X̄ − Ȳ − (µ1 − µ2 )
T = q ∼ t(n1 + n2 − 2),
Sp n11 + n12
donde s
(n1 − 1)S12 + (n2 − 1)S22
Sp = .
n1 + n2 − 2
c) Utilice la v.a. anterior T como variable pivote para construir un intervalo de confianza al
100(1 − α) % para µ1 − µ2 .
d) Para comparar los gastos medios mensuales de los alumnos de dos universidades particulares
se han seleccionado de manera aleatoria dos muestras de 9 y 10 alumnos respectivamente de cada
universidad, encontrándose los siguientes valores en dólares:
Muestra de la U. A 390 395 380 390 400 380 370 390 380
Muestra de la U. B 400 410 420 380 390 410 400 405 405 400
10.- Con el fin de medir el nivel de contaminación de nitratos en una laguna se han seleccionado al
azar 10 cuadrı́culas de ella obteniéndose las siguientes mediciones de concentración en miligramos
por litro en cada una de estas cuadrı́culas
37.75, 40.58, 49.08, 41.99, 23.52, 29.53, 24.27, 40.56, 38.57, 30.33
11.- Se piensa que la concentración del ingrediente activo de un detergente lı́quido para ropa, es
afectada por el tipo de catalizador utilizado en el proceso de fabricación. Se sabe que la desviación
estándar de esta concentración, σ, es de 3.5 g/l (gramos por litro), sin importar el tipo de catalizador
utilizado. Se toman dos muestras aleatorias, una con cada catalizador y se obtienen los siguientes
datos:
12.- Se desea estimar el gasto total en adquisición de libros, para cada perı́odo, efectuado por los
alumnos de una universidad. A fin de reducir la variabilidad, se decide considerar 3 grupos de acuerdo
al nivel de estudios: Estudios Generales, Pre-grado y Post-grado. Se selecciona una muestra aleatoria
en cada grupo y se halla un estimado del total gastado en adquisición de libros durante un perı́odo
por cada alumno obteniéndose los siguientes resultados:
a) Halle un intervalo de confianza al 95 % para el gasto total en libros efectuado por los alumnos de
Post-grado.
b) Si se desea que el margen de error en la estimación del inciso a) sea de 8,000 u.m, ¿ cuántos
alumnos de Post-grado se deben muestrear ?
c) Halle una estimación puntual del gasto total en adquisición de libros en la universidad.
d) Halle un intervalo de confianza al 95 % para el gasto total en adquisición de libros efectuado por
los alumnos de la universidad.
13.- a) ¿ Qué tamaño de muestra debe de usted considerar a fin de estimar la proporción de defectos
de un lote de 500 unidades de tal manera que el error máximo en su estimación sea de 0.1 con un
nivel de confianza del 95 %?
b) Un circuito tiene una duración T con distribución exponencial de parámetro β = 0.01.
b1) Si se prueban 5 de estas componentes, determine la probabilidad de que el mayor valor
observado supere las 720 horas.
b2) Si se prueban 81 de estas componentes, determine la probabilidad que el tiempo promedio
de todas ellas supere las 720 horas.
14.- Se desea estimar la proporción de votantes p a favor de un candidato para las elecciones del
presidente de un club que cuenta en su padrón electoral con 1,500 socios inscritos. Para esto se ha
decidido realizar una encuesta de opinión entre los socios. Si p̄ representa la proporción muestral
de votantes a favor del candidato que se obtendrá en la encuesta y se desea cometer un error de
estimación
E = |p̄ − p|
de a lo más 0.025 con una confianza del 95 %, ¿ qué tamaño de muestra n deberı́a considerarse en
la encuesta? ¿ Cuál serı́a el tamño de muestra en la encuesta, si ahora se desea un nivel de confianza
del 99 %?
ESTADISTICA APLICADA Luis Valdivieso 105
15.- Una compañı́a eléctrica esta interesada en estimar, mediante muestreo, el total en kilowatts-hora
(kwh) del consumo de electricidad de las viviendas en las dos zonas que conforman una región A:
la zona urbana y la zona industrial. Es de interés también para la compañı́a conocer la proporción
p de viviendas, en cada zona, que cuentan con un medidor de marca AFA, pues la compañı́a esta
muy interesada en reemplazar estos a corto plazo. Dado que los consumos son bastante diferenciados
en ambas zonas se ha previsto hacer estudios independientes en cada uno de ellos. Para tal efec-
to se dispone de los resultados siguientes de un estudio muestral ya realizado a otra región B de
caracterı́sticas muy similares a la región de interés:
16.- Una madererı́a minorista inspecciona los embarques de madera que llegan, a través de camiones
de carga, de sus proveedores. Para los embarques de pino de calidad selecta, de 8 pies (2 por 4),
el supervisor escoge aleatoriamente una gruesa (12 docenas o 144 hojas) de un embarque de varias
docenas de miles de hojas. En la muestra, 18 hojas no pueden venderse como de calidad selecta.
a) Obtenga un intervalo de confianza al 95 % para la proporción de hojas de todo el embarque que
no pueden venderse como de calidad selecta.
b) Si el 20 % o más del embarque no puede venderse como madera de calidad selecta el embarque no
es rentable. ¿ Indica el intervalo de confianza anterior que hay razones para pensar que el embarque
106
no es rentable ?
c) La muestra se toma siempre de la plataforma ubicada en la parte posterior derecha del camión de
carga. Cada plataforma contiene 4 gruesas ubicadas en una misma linea, de modo que la madererı́a
selecciona, las 144 hojas de la muestra por rotación: del primer embarque, las 144 de arriba a la
izquierda; del siguiente embarque, las 144 de arriba a la derecha, y ası́ sucesivamente. ¿ Por qué ésta
no es una muestra aleatoria de hojas ? ¿ No podrı́a un proveedor falto de ética tomar ventajas de
este proceso ? En su opinión, ¿serı́a factible tomar una muestra aleatoria simple en esta situación ?
¿ Cómo tomarı́a la muestra para dificultar que un proveedor falto de ética lo engañe?
17.-El Ingreso mensual de las 400 microempresas de metal-mecánica de una ciudad, se asume que
es una v.a. X normal con media µ y varianza 2, y para reactivar el sector se quiere establecer una
lı́nea de crédito cuyos pagos mensuales sean iguales al 10 % del ingreso de la empresa. Una muestra
de n = 70 microempresarios dió una media de 710 dólares y una desviación estándar de 26 dólares.
a) Construya un IC para µ al 95 % de confianza y determine el rango de pagos esperados de un
microempresario que toma el crédito.
b) ¿ Entre que valores se encontrará a un nivel de confianza del 95 % el total de pagos mensuales
que efectuaran las microempresas, si se asume que se otorgará crédito a todo el sector ?
c) Determine el máximo error de estimación que se pudiera cometer en la estimación en b).
Capı́tulo 5
CONTRASTES DE HIPÓTESIS
5.1. Generalidades
Consideremos una variable aleatoria X cuya función de distribución FX (x) = P (X ≤ x) depende
de un parámetro (o vector de parámetros) θ. A esto lo denotaremos en adelante por X ∼ θ.
Definición 5.1 Una hipótesis (estadı́stica) es cualquier enunciado o conjetura que podamos hacer
con respecto a la v.a. X ∼ θ.
que tenga distribución conocida bajo H0 . Aquı́ S denota a la colección de todas las posibles mues-
tras de tamaño n que pudieran elegirse de la población de X. La estadı́stica de prueba resume la
información contenida en la muestra y ,con la regla de decisión, particiona el espacio muestral S en
dos regiones: la región de aceptación de H0 y la región crı́tica o de rechazo de H0 . Luego, un expe-
rimentador al observar los valores que toma su muestra, evaluar su estadı́stica de prueba y apreciar
en que región cae, tomará finalmente la decisión que corresponda.
107
108
Definición 5.2 Un contraste, o prueba de hipótesis, es una partición del espacio muestral S en dos
regiones: una llamada la región de aceptación de H0 y la otra la región crı́tica o de rechazo de H0 .
Cuando un experimentador toma la decisión de rechazar o de aceptar H0 , él podrı́a cometer dos
tipos de error. Estos errores se miden como sigue
Definición 5.3
Obviamente un buen contraste es aquel en el que α y β son los más pequeños posibles. Desafor-
tunadamente se prueba que α y β están en relación inversamente proporcional. Por tal motivo, se
ha convenido en fijar a α a fin de tratar de encontrar la mejor prueba; es decir, aquella que con este
α dado tenga el β más pequeño o si se quiere la potencia
Φ = P (Rechazar H0 | H0 es falsa) = 1 − β
Definición 5.4 La curva caracterı́stica de operación (curva OC) viene dada por la gráfica de β en
función del valor del parámetro bajo la hipótesis alternativa.
Ejemplo 5.1 Un inspector piensa que las balanzas que se utilizan en los mercados de abastos de
un distrito de la capital están siendo adulteradas. Para tal efecto, se eligieron al azar 25 puestos de
expendio, registrándose en cada uno de ellos el peso de un kilo real en las balanzas de estos puestos.
Asumiendo normalidad:
a) Plantee las hipótesis del caso.
b) Si el inspector decide concluir que las balanzas de los mercados de abastos de este distrito estan
adulteradas de ocurrir que el promedio de pesos en la muestra supera un cierto valor C. Halle C de
tal manera que el nivel de significación de la prueba sea de α = 0.05.
c) ¿ Qué es lo que el inspector determinarı́a si al registrar los pesos encuentra que en promedio estos
dan 1.075 kgs con una desviación estándar de 0.2 kgs? Use α = 0.05.
d) Si la verdadera media del peso del kilo real en las balanzas de los mercados fuera de 1.05 kgs, halle
la probabilidad de cometerse el error de tipo II.
Solución: a) Sea X = Peso de un kilo real en una balanza de un puesto de expendio del distrito.
Asumiendo, como se indica, que X ∼ N (µ, σ 2 ), estaremos interesados en contrastar a nivel α:
H0 : µ = 1 vs H1 : µ > 1.
ESTADISTICA APLICADA Luis Valdivieso 109
Notese que H1 : µ > 1 es aquı́ la hipótesis de trabajo del inspector, pues él piensa que al estar
adulteradas las balanzas, ellas tenderán a registrar un mayor peso del que realmente miden.
b) El inspector plantea una región crı́tica de la forma:
R.C : X̄ > C.
Para que el nivel de significación de la prueba sea de α = 0.05 se debe de cumplir que
C −1
0.05 = P (RechazarH0 | H0 es verdadera) = P (X̄ > C | µ = 1) = P (T0 > ),
S/5
X̄−1
donde T0 = S/5 ∼ t(24) es el estadı́stico de prueba (σ 2 desconocido). Equivalentemente
C −1
0.95 = P (T0 ≤ ),
S/5
C−1
de donde se sigue que S/5 = t0.95 (24) = 1.711 y que
C = 1 + 0.3422 S,
X̄ > 1 + 0.3422 S
y se ha observado en la muestra que X̄ = 1.075 y S = 0.2, entonces esta región crı́tica se satisface
(1.075 > 1.06844). En conclusión se rechazará H0 y el inspector podrá asegurar, con una probabilidad
de equivocarse del 5 %, que las balanzas que se utilizan en los mercados de abastos del distrito si
están siendo adulteradas.
d) Se nos pide β, si es que supiéramos que en verdad (algo que en general no se sabe) la verdadera
media, siendo esta superior al kilo real. Esta viene dada por
(1.06844 − 1.05)5
β = P (Error tipo II) = P (X̄ > 1.06844 | µ = 1.05) = P (T > ) = P (T > 0.461)
0.2
X̄−µ
donde T = √
S/ 25
∼ t(24). Puesto que este valor no se encuentra en la tabla, usaremos como ayuda
R. El cálculo de β se podrı́a obtener alternativamente con:
> 1 - pt(0.461,24)
[1] 0.3244745
> pt(0.461,24,lower.tail=FALSE)
[1] 0.3244745
2
Dada la relevancia de la distribución normal, mostraremos a continuación un resumen de los
distintos contrastes de hipótesis paramétricos sobre la media y la varianza de una y de dos poblaciones
normales independientes. Estos si bien parecen restrictivos, son pruebas asintóticamente válidas para
la medias de una y dos poblaciones cualesquieras en muestras grandes.
110
Hipótesis
Nula Alternativa Estadı́stica de Prueba Región crı́tica
H1 : µ 6= µ0 |Z0 | > z1− α2
X̄−µ
H0 : µ = µ0 vs H1 : µ > µ0 Z0 = √0
σ/ n
∼ N (0, 1) Z0 > z1−α
σ 2 conocido H1 : µ < µ0 Z0 < −z1−α
Ejemplo 5.2 Una operación de montaje en una fábrica manufacturera requiere aproximadamente de
un entrenamiento de un mes para que un nuevo empleado alcance la máxima eficiencia. Se sugirió un
nuevo método para el entrenamiento y se realizó una prueba para comparar el método nuevo con el
procedimiento estándar. Dado que la fábrica tenı́a 2 turnos de trabajo, se entrenaron estos durante
un periodo de cuatro semanas; un turno utilizó el nuevo método y el otro el procedimiento estándar.
Se midió el tiempo (en minutos) que necesitó cada empleado para montar el dispositivo al término del
periodo de entrenamiento. Las mediciones de los 9 empleados que conforman cada turno se muestran
a continuación
Procedimiento
Estándar 32 37 35 28 41 44 35 31 34
Nuevo 35 31 29 25 34 40 27 32
donde debido a problemas, uno de los empleados no pudo completar el entrenamiento con el nuevo
método . Asumiendo normalidad en los tiempos y planteando claramente sus hipótesis y parámetros:
a) ¿ Se podrı́a decir que estos métodos originan diferente variabilidad en los tiempos de montaje de
los empleados ? Use α = 0.05.
b) ¿ Se podrı́a decir que efectivamente el nuevo método resulta mejor que el procedimiento
estándar ? Use α = 0.05.
Solución: a) Sean X e Y las variables aleatorias que denotan al tiempo en minutos que ne-
cesita un empleado para realizar la operación de montaje al término del entrenamiento con el
método estándar y con el nuevo método, respectivamente. Se asume que X ∼ N (µ1 , σ12 ) e
Y ∼ N (µ2 , σ22 ). Estaremos inicialmente interesados en contrastar a nivel α = 0.05:
H0 : µ1 = µ2 vs H1 : µ1 > µ2 .
112
Dado que σ12 y σ22 son desconocidos y por a) podemos asumir σ12 = σ22 , se rechazará H0 a nivel
α =0.05 si se satisface la región crı́tica R.C: T0 > t0.95 (15) =1.753. Evaluando el estadı́stico de
prueba T0 = r 2 X̄−2Ȳq obtenemos que T0 = r 2 X̄−2Ȳq = 1.52 no cae en la región crı́tica.
8S1 +7S2 1 8S1 +7S2
15 9
+ 18 15
1
9
+ 18
Por tanto, no podemos garantizar que el nuevo método resulte mejor que el método tradicional. 2
Ejemplo 5.3 Suponga en el ejemplo previo que antes de entrenarse a los 9 empleados con el método
estándar, se les hubiera medido (en el mismo orden) los tiempos en minutos que necesitaron cada
uno de ellos en montar el dispositivo, encontrándose los siguientes datos:
35 39 35 34 40 47 40 38 36
¿ Podrı́a afirmarse con una probabilidad de equivocarse del 5 % que el entrenamiento es efectivo?
Solución: Se desea comparar los tiempos medios de montaje entre las poblaciones de empleados antes
y despúes del entrenamiento estándar. Dado que se trata de los mismos empleados, estas poblaciones
no son lógicamente independientes. En este sentido, si denotamos por XA y XB a los tiempos de
montaje antes y después del entrenamiento y asumimos que ambas tienen distribución normal con
medias respectivas µ1 y µ2 , estaremos interesados en contrastar a nivel α = 0.05:
H0 : µ1 = µ2 vs H1 : µ1 > µ2 .
Por la nota previa a estos ejemplos, debemos de proceder a construir la siguiente tabla de datos:
XA (Antes) XD (Después) D = XA − XB (Diferencia)
35 32 3
39 37 2
35 35 0
34 28 6
40 41 -1
47 44 3
40 35 5
38 31 7
36 34 2
de la cual obtenemos D̄ = 3 y SD = 2.646. Nuestra toma de decisiones consistirá en rechazar
√
D̄ n
H0 a nivel α = 0.05 si se satisface la región crı́tica R.C: T0 = SD > t0.95 (8) = 1.86. Dado que
T0 = 3.4 > 1.86, sı́ podemos garantizar, con una probabilidad de equivocarnos de α = 0.05, que el
entrenamiento resulta efectivo. 2
H0 : µ = µ0 vs H1 : µ > µ0 .
ESTADISTICA APLICADA Luis Valdivieso 113
σ
β = P ( Aceptar H0 | H0 es f alsa ) = P (X̄ ≤ µ0 + z1−α √ /µ = µ0 + δ)
n
µ0 + z1−α √σn − µ0 − δ √
δ n
= P (Z ≤ ) = FZ (z1−α − )
√σ σ
n
Como se aprecia existen aquı́ 3 cantidades de interés relacionadas para un α fijo: β, n y δ. Dadas 2
de ellas la tercera puede obtenerse analı́ticamente. Permitámonos realizar el siguiente análisis:
X̄−µ0
Si H0 es verdadera, entonces Z0 = √σ ∼ N (0, 1).
n
√
X̄−µ0 −δ δ n
Si H1 es verdadera, entonces Z1 = √σ = Z0 − σ ∼ N (0, 1).
n
De aqui que:
Definición 5.5 Una carta de control es una gráfica conjunta de las curvas caracterı́sticas de opera-
ción para distintos tamaños de muestra n y para un valor fijo de α. En ella las curvas OC utilizan
como parámetro de β a un término d que nos indica en cuantas desviaciones estándares se desvia el
verdadero parámetro del que se especifica en H0 .
δ µ−µ0
En el caso que hemos discutido el parámetro d vienen dado por: d = σ = σ . Ası́, la carta de
control para, por ejemplo un α = 0.05 (se acostumbra también dar para un α = 0.01), viene dada
√
por la yuxtaposición de las gráficas de la función β(d) = FZ (1.645 − d n) para distintos valores de
n. Esta carta de control se aprecia en la figura siguiente:
114
0.6
0.4
3 2 n=1
75 15 5
6 4
9
0.2
50 20
7
30
8
n = 100
40 10
0.0
Al igual que lo desarrollado para el contraste anterior, uno puede deducir, de manera similar,
las siguientes probabilidades de error tipo II para los contrastes a nivel α sobre µ en una v.a.
X ∼ N (µ, σ 2 ) de varianza conocida.
Si se desea contrastar
H0 : µ = µ0 vs H1 : µ < µ0 ,
entonces √
δ n
β = 1 − FZ (−z1−α + ) (donde δ = µ0 − µ > 0)
σ
Si se desea contrastar
H0 : µ = µ0 vs H1 : µ 6= µ0 ,
entonces √ √
δ n δ n
β = FZ (z1− α2 − ) − FZ (−z1− α2 − ) (donde δ = |µ − µ0 | > 0)
σ σ
Nota: Si n es grande estas fórmulas son, por el TLC, válidas aún si X no tiene distribución normal. Si
σ se desconoce, ella puede reemplazarse por alguna estimación o por S. Por otro lado, si n es pequeño
(n < 30), uno deberá utilizar bajo normalidad no Z ∼ N (0, 1) sino T ∼ t(n − 1) e igualmente alguna
estimación de σ ó S.
ESTADISTICA APLICADA Luis Valdivieso 115
Ejemplo 5.4 Unos pasadores de aluminio fabricados para la industria de la aviación tienen un
diámetro aleatorio cuya distribución es normal con media µ = 10 mm y desviación estándar σ = 0.5
mm. En las placas de aluminio se barrenan agujeros cuyos diámetros tienen distribución normal de
media µ mm y desviación estándar de 0.5 mm.
a) ¿ Cuál debe de ser el valor de µ para que la probabilidad de que un pasador no entre en un agujero
sea 0.01 ?
b) Suponga que el ingeniero de control en la producción de los pasadores sospecha de que los diámetros
medios de estos no estan cumpliendo la especificación dada. Si el desea detectar una desviación de
la especificación de 1 mm con una probabilidad de al menos 0.99 y un nivel de significación de α =
0.05 ¿ cuál serı́a el tamaño de muestra que deberı́a utilizar en un contraste tendiente a aclarar sus
sospechas ?
Solución: a) Sea X ∼ N (10, 0.52 ) el diámetro de un pasador y sea Y ∼ N (µ, σ 2 ) el diámetro de una
agujero barrenado (ambos en mm). Se plantea que
µ − 10
0.99 = P (Z ≤ √ ).
2(0.5)
2(µ−10)
Luego de tabla, √
2
= 2.325 y por tanto µ = 11.644 mm.
b) El ingeniero estará interesado en contrastar a nivel α = 0.05:
H0 : µX = 10 vs H1 : µX 6= 10.
y especifı́ca una potencia de al menos 0.99 (o β ≤ 0.01) a fin de detectar una desviación de los 10
mm de δ = 1 mm. Luego se tiene que:
√ √
n n
FZ (1.96 − ) − FZ (−1.96 − ) ≤ 0.01.
0.5 0.5
Dado que el segundo término en esta expresión es pequeño podrı́amos inicialmente considerar sólo el
√
primero y por tanto ubicar un n tal que 1.96 − 0.n5 ≤ −2.325, lo cual nos da que n > 4.59. Tomando
n = 5, vemos que
√ √
n n
FZ (1.96 − ) − FZ (−1.96 − ) = FZ (−2.51) − FZ (−6.432) = 0.006 ≤ 0.01.
0.5 0.5
Luego, el ingeniero podrı́a utilizar una muestra de al menos 5 pasadores. Notese que este tamaño de
muestra es pequeño; sin embargo válido, pues no estamos realizando aquı́ una aproximación normal,
sino considerando que los diámetros de los pasadores tienen distribución normal. 2
116
H0 : p = p0 vs H1 : p > p0 (∗) ,
donde p0 se denomina el AQL (acceptance quality level) o nivel de calidad aceptable del productor
y en H1 se acostumbra escribir p = p1 (p1 > p0 ), donde p1 se denomina el LTPD (limit tolerance
percentage of defects) o la proporción de defectos por lote que un consumidor estarı́a como máximo
dispuesto a tolerar.
Si se rechaza H0 en (*), entonces el lote bajo control deberá ser rechazado por el productor y
mandado a revisión total para la inspección y reemplazo de todas sus unidades defectuosas; mientras
que si no se rechaza H0 el lote podrá salir al mercado para su libre distribución a los consumidores.
En este contexto las probabilidades de cometer los errores tipo I y tipo II pueden interpretarse como:
α = Riesgo del productor = proporción de lotes buenos que serán rechazados por el control
β = Riesgo del consumidor = proporción de lotes malos que serán aceptados por el control.
R.C: X > c.
Definición 5.6 Un plan de muestreo simple consiste en la especificación del número de aceptación
c y del tamaño de muestra n.
Esta expresión en la práctica es poco utilizada ya que por lo general los lotes a inspeccionarse son lo
suficientemente grandes (N grande) como para aproximar la distribución hipergeométrica de X por
una distribución binomial X ∼ B(n, p). En este caso:
c
X n
L(p) = px (1 − p)n−x
x
x=0
ESTADISTICA APLICADA Luis Valdivieso 117
c + 1 − np − 1 − np
L(p) = P (0 ≤ X ≤ c) = FZ ( p 2 ) − FZ ( p 2 ).
np(1 − p) np(1 − p)
Solución: Al ser el lote grande, L(p) = (1 − p)12 + 12p(1 − p)11 y la curva OC del contraste de control:
donde X denota al número de artı́culos defectuosos encontrados en la muestra. De otro lado, el riesgo
del consumidor para un LTPD de 0.15 es:
2
118
La bondad de un plan de muestreo puede medirse también mediante su curva de calidad aceptable
o curva AOQ. Esta nos mide el grado de protección que ofrece el plan a un consumidor una vez
finalizado el control de calidad. Especı́ficamente, si P = proporción de defectos de un lote a la salida
del control, entonces: (
M −X
N , si el lote es aceptado (X ≤ c)
P =
0 , si el lote es rechazado (X > c)
Pc M −x M −X
y AOQ(p) = E(P ) = x=0 ( N )pX (x). Puesto que M se desconoce, podemos aproximar N por
p y escribir:
AOQ(p) = pL(p).
Luego, la curva AOQ viene dada por la gráfica de esta función. Un elemento importante relacionado
con esta curva, y que nos da una medida de calidad puntual del plan, es la calidad lı́mite de salida
o AOQL. Este no es sino el máximo valor que toma la función AOQ.
Ejemplo 5.6 Halle la curva AOQ del problema anterior ası́ como su AOQL.
El valor que maximiza esta función es p∗ =0.1256 y por tanto se sigue que AOQL =
AOQ(0.1256) = 0.068339 ; es decir, un consumidor que adquiere un lote con este plan de control
esperará obtener un 6.8339 % de artı́culos defectuosos en el lote. 2
ESTADISTICA APLICADA Luis Valdivieso 119
donde p̄1 y p̄2 denotan a las proporciones de veces en que ocurre el evento de interés en muestras
grandes de tamaños n1 y n2 de ambas poblaciones.
q+m−1
para despejar y obtener que q0 = m . Si los eventos A1 , . . . , Am fueran independientes, entonces
confianza de al menos 100(1 − α) %, deberemos tomar IC’s al 100(1 − α0 ) % para cada parámetro
1
α
con un α0 = m ó con un α0 = 1 − (1 − α) m si las poblaciones involucradas son independientes.
Ejemplo 5.7 Una empresa ha encuestado a 640 personas sobre sus preferencias hacia 4 presenta-
ciones de un nuevo producto, encontrando que 220, 160, 80 y 180 de ellas preferı́an, respectivamente,
las presentaciones 1,2,3 y 4. De otro lado, se sabe que el costo de producción bajo estas presentacio-
nes varia siendo la menos costosa la presentación 4, la siguiente menos costosa la presentación 3 y
la más costosa la presentación 1.
a) Si antes del estudio los gerentes de la empresa pensaban sacar el producto con la presentación
1 ¿ podrı́a usted asegurarles con una confianza de al menos 95 %, que la proporción de personas
potenciales que adquirirán esta presentación superará al de las otras presentaciones ?
b) Si usted tuviera que recomendar alguna presentación ¿ cuál recomendarı́a? Justifique su elección.
p3 < p2 = p4 = p1 .
Por tanto, se podrı́a recomendar la presentación 4, ya que ella tiene los menores costos de producción
y una alta preferencia. 2
122
El siguiente resultado asintótico será la base para todos los contrastes de hipótesis relacionados
a una distribución multinomial.
k
X (Xi − Ei )2
U= ∼ χ2 (k − 1).
Ei
i=1
Este teorema nos provee de un estadı́stico de prueba adecuado para contrastar a nivel α:
donde los valores p01 , . . . , p0k son conocidos. En efecto, si reemplazamos los p0i en U y este término
resulta ser suficientemente grande, entonces al menos algunas de las frecuencias observadas Xi van a
diferir considerablemente de las frecuencias E(Xi ) = np0i = Ei0 que se esperan de ser H0 verdadera.
En este sentido no es difı́cil apreciar que la siguiente región crı́tica, constituye un regla razonable (y
lo es formalmente) de decisión:
Rechazar H0 a nivel α si
k
X (Xi − E 0 )2
RC: U0 = i
> χ21−α (k − 1).
i=1
Ei0
En el caso discreto L(θ) representa la probabilidad de que una muestra aleatoria cualquiera de X
tome precisamente los valores que ya se han observado de ella. Como lo observado en la muestra es
para nosotros la única información fiable de la que disponemos es lógico pensar que la distribución
de X será más idónea mientras esta probabilidad sea mayor. Al depender esta probabilidad de θ, lo
natural es entonces seleccionar el valor de θ que maximice la probabilidad en mención.
Definición 5.8 En el contexto anterior, sea θ∗ = g(x1 , x2 , . . . , xn ) el valor de θ que maximiza L(θ).
Entonces el estimador de máxima verosimilitud de θ viene dado por θ̂ = g(X1 , X2 , . . . , Xn ).
ESTADISTICA APLICADA Luis Valdivieso 123
Nota: Dado que los valores de θ que maximizan a las funciones L(θ) y K(θ) = LnL(θ) son los
mismos, uno puede maximizar K(θ) en lugar de L(θ). Esta práctica es muy común pues la gran
mayorı́a de distribuciones estudiadas tienen forma exponencial y por tanto la toma de logaritmos
simplifica considerablemente el problema de maximización.
Proposición 5.3 (Propiedad de invarianza) Sea γ = h(θ) un nuevo parámetro definido como una
función del parámetro θ cuyo estimador de máxima verosimilitud es conocido y viene dado por θ̂.
Entonces el estimador de máxima verosimilitud del parámetro γ vienen dado por γ̂ = h(θ̂).
Ejemplo 5.8 Una componente electrónica se asume que sigue en su razón de falla un modelo de
Weibull de parámetros α = 3 y β desconocido, donde el tiempo se mide en años.
a) Halle el estimador de máxima verosimilitud de β y el estimador de máxima verosimilitud de la
función de confiabilidad de la componente.
b) Suponga que se seleccionaron al azar 15 de estas componentes y luego se registraron sus tiempos
de vida útil, obteniéndose en años los siguientes datos: 0.808, 1.060, 0.749, 0.476, 0.498, 0.925,
0.916, 1.021, 0.618, 0.336, 0.710, 0.445, 0.711, 0.757, 0.614. Estime la confiabilidad de esta
componente, si se especifica para ella un tiempo de vida útil de 7 meses.
Solución: a) Sea X ∼ W (4, β) el tiempo de vida útil de la componente en años. Dada una m.a.
X1 , X2 , . . . , Xn de X, junto con sus valores observados x1 , x2 , . . . , xn , se tiene que la función de
verosimilitud de esta m.a. viene dada por:
n
Y Pn
4 4 4
L(β) = fX (x1 ) . . . fX (xn ) = 4βx31 e−βx1 . . . 4βx3n e−βxn = 4 β ( x3i )e−β i=1 xi
n n
i=1
y por tanto
n
X n
X
K(β) = Ln(L(β)) = nLn(4) − nLn(β) − 3 Ln(xi ) − β x4i .
i=1 i=1
00
Derivando, igualando a 0 y verificando que K (β) = − βn2 < 0, obtenemos que el estimador de
máxima verosimilitud de β viene dado por β̂ = Pn n . Más aún, por la propiedad de invarianza,
i=1 Xi4
la estimación de la función de confiabilidad de la componente viene dada por:
4 −( Pn n )t4
R̂(t) = e−β̂t = e i=1
X4
i .
k
X (Xi − Êi )2
V = ∼ χ2 (k − r − 1).
i=1 Êi
Ejemplo 5.9 En una gran tienda una muestra aleatoria de 100 personas comprará cada una un
producto que tiene cuatro marcas: 1, 2 , 3 , 4 y tres presentaciones: 1 , 2 , 3. Considérese las
siguientes 12 variables aleatorias: Xi,j = Número de clientes que comprarán la marca i y con la
presentación j, para i = 1, 2, 3, 4 y j = 1, 2, 3. Asuma que la compra de cada cliente se produce bajo
condiciones similares y con resultados independientes.
P4
a) Si se consideran las variables X.j = i=1 Xi,j , para j = 1, 2, 3, realice una descripción de la
distribución conjunta de estas 3 variables.
b) El gerente de ventas sostiene que la frecuencia de compras para las presentaciones 1 y 3 son
iguales. Si al tomarse los datos, 20 personas compraron la presentación 1 y 30 la presentación 3 ¿
puede desecharse la afirmación del gerente? Para responder utilice un intervalo apropiado al 95 % de
confianza.
Solución: a) El vector aleatorio (X.1 , X.2 , X.3 ) tiene distribución multinomial de parámetros n = 100,
p.1 , p.2 y p.3 , donde p.j denota a la probabilidad de que una persona compre un producto con la
presentación j.
b) Obtengamos un IC al 95 % para p.1 − p.3 . Como n = 100 es grande, este IC viene dado por:
r r
p̄1 (1 − p̄1 ) + p̄3 (1 − p̄3 ) + 2p̄1 p̄3 p̄1 (1 − p̄1 ) + p̄3 (1 − p̄3 ) + 2p̄1 p̄3
[p̄1 − p̄3 −z0.975 , p̄1 − p̄3 +z0.975 ],
100 100
r r
0.2(0.8) + 0.3(0.7) + 2(0.2)(0.3) 0.2(0.8) + 0.3(0.7) + 2(0.2)(0.3)
= [−0.1 − 1.96 , −0.1 + 1.96 ]
100 100
= [−0.2372, 0.0372]
Sea Y una variable aleatoria con función de distribución FY desconocida y supongamos deseamos
contrastar a nivel α:
H0 : FY = F0 vs H1 : FY 6= F0 , (5.1)
ESTADISTICA APLICADA Luis Valdivieso 125
donde F0 es una función de distribución conocida. Para realizar este contraste tomemos una muestra
aleatoria Y1 , Y2 , . . . , Yn de Y y con sus valores observados construyamos la siguiente distribución de
frecuencias con k intervalos1 :
Intervalo Marca de clase Frecuencia observada
ŷi Oi
[a0 , a1 [ ŷ1 O1
[a1 , a2 [ ŷ2 O2
.. .. ..
. . .
[ak−1 , ak ] ŷk Ok
n
donde a0 es el menor valor de los datos observados. En esta distribución cada intervalo tiene un
maximo valor observado−a0
ancho de c = k e ŷi es el punto medio del i-ésimo intervalo.
Si definimos las variables aleatorias Xi = número de elementos de la m.a. de tamaño n de Y que
caen en el i-ésimo intervalo, entonces (X1 , X2 , . . . , Xk ) ∼ M ul(n, p1 , p2 , . . . , pk ), donde
vs
H1 : (X1 , X2 , . . . , Xk ) ∼ M ul(n, p1 , . . . , pk ) con algún pi 6= p0i ,
siendo Êi0 = np̂0i y los p̂0i obtenidos de estimarse r parámetros de F0 por el método de máxima
verosimilitud.
Pk−1
OBSERVACIONES: 1.- Tómese en cuenta que p01 = F0 (a1 ) y p0k = 1 − i=1 p0i , relaciones que
también se cumplen para las probabilidades estimadas.
2.- Estos contrastes pueden sólo realizarse si n es grande y si las frecuencias esperadas son mayores
o iguales a 5. Si esto último no se cumple uno podrı́a juntar dos o más intervalos a fin de satisfacer
tal condición.
3.- El cálculo de las estimaciones por máxima verosimilitud se realiza con las fórmulas de datos
agrupados. Por ejemplo, si F0 es la función de distribución de una v.a. normal con media µ y varianza
n−1 2
σ 2 , se prueba que sus estimadores de máxima verosimilitud son respectivamente Ȳ y n S . Luego,
las estimaciones correspondientes deben calcularse respectivamente con las fórmulas:
k k
1X 1X 2
Ȳ = ŷi Oi y S2 = ŷi Oi − ȳ 2 .
n n
i=1 i=1
Ejemplo 5.10 Un ingeniero de control piensa que la proporción de artı́culos no defectuosos encon-
trados en el muestreo por aceptación de sus lotes tiene una distribución Beta con parámetro β = 1. Si
tomados al azar controles de calidad en 60 de estos lotes se encontraron las siguientes proporciones
de artı́culos no defectuosos:
0.858 0.867 0.812 0.958 0.886 0.861 0.924 0.724 0.928 0.769 0.996 0.599 0.924 0.900 0.964 0.892
0.901 0.521 0.948 0.965 0.903 0.846 0.807 0.985 0.620 0.784 0.950 0.933 0.754 0.566 0.983 0.988
0.839 0.583 0.734 0.879 0.905 0.965 0.835 0.784 0.687 0.870 0.624 0.780 0.869 0.822 0.987 0.856
0.785 0.860 0.924 0.796 0.984 0.862 0.921 0.798 0.872 0.972 0.966 0.958.
¿ Muestran los datos que el ingeniero tiene razón? Use un nivel de significación de α =0.05.
H0 : Y ∼ B(α, 1) vs H1 : Y ∼ B(α, 1)
la función de distribución de Y es
0
, si y < 0
F0 (y) = yα , si 0 ≤ y ≤ 1
1 , si y > 1
ESTADISTICA APLICADA Luis Valdivieso 127
Pn
Tomando logaritmos K(α) = nLn(α)+(α−1) i=1 Ln(yi ). Derivando e igualando a 0, se comprueba
que el valor que maximiza a K(α) es α∗ = − Pn nLn(yi ) . En tal sentido el estimador de máxima
i=1
n
verosimilitud de α es α̂ = − Pn . Este se evaluará mediante la fórmula de datos agrupados
i=1 Ln(Yi )
α̂ = − Pk n , siendo k el número de intervalos en la distribución de frecuencias. Usaremos
i=1 Ln(ŷi )Oi
k = 1 + 3.3log10 (60) = 6.8679 ≡ 7 intervalos.
Para nuestro contraste necesitamos estimar las frecuencias esperadas y con ello obtener la dis-
tribución de frecuencias de los datos con los k = 7 intervalos. De los datos se observa que el menor
valor es 0.521 y el mayor 0.996. Por tanto, el rango es R = 0.996 − 0.521 =0.475 y cada uno de los
7 intervalos tendrá un ancho de c = R = 0.475 = 0.067857 ≡ 0.068 (aquı́ aproximamos siempre por
k 7
exceso al número de decimales de los datos). Haciendo el conteo respectivo, obtenemos entonces la
siguiente distribución de frecuencias:
Intervalo Marca de clase (ŷi ) Frecuencia observada (Oi ) F̂0 (li+ ) Êi0
[0.521, 0.589] 0.555 3 0.04920 2.9520
]0.589, 0.657] 0.623 3 0.09161 2.5448
]0.657, 0.725] 0.691 2 0.16045 4.1300
]0.725, 0.793] 0.759 7 0.26722 6.4064
]0.793, 0.861] 0.827 11 0.42675 9.5716
]0.861, 0.929] 0.895 18 0.65768 13.8556
]0.929, 0.997] 0.963 16 1 20.5395
donde F̂0 (li+ ) denota a la función de distribución estimada en el extremo derecho de cada intervalo
60 60
con α̂ = − P7 Ln(ŷi )Oi
= 10.5449 =5.6899. Dado que las 3 primeras frecuencias estimadas son
i=1
menores a 5, debemos de juntar estos intervalos. Esto significará formalmente un recálculo de la
estimación de α y por tanto de las frecuencias esperadas; sin embargo, para evitar un desborde de
cálculos optaremos (sólo para efectos del curso) a consignar el mismo α̂ y a sumar directamente las
frecuencias esperadas. Este procedimiento modifica mı́nimamente al estadı́stico de prueba. Optando
por tal alternativa obtendremos entonces la siguiente distribución final de frecuencias:
Intervalo Marca de clase (ŷi ) Frecuencia observada (Oi ) F̂0 (li+ ) Êi0
[0.521, 0.725] 0.623 8 0.16045 9.6269
]0.725, 0.793] 0.759 7 0.26722 6.4064
]0.793, 0.861] 0.827 11 0.42675 9.5716
]0.861, 0.929] 0.895 18 0.65768 13.8556
]0.929, 0.997] 0.963 16 1 20.5395
128
5
X (0i − Ê 0 )2
R.C : V0 = i
> χ20.95 (3) = 7.815,
i=1 Êi0
donde en los grados de libertad se ha considerado r = 1 al estar estimándose tan solo un parámetro.
Evaluándose V0 obtenemos V0 = (8−9 .6269)2 + . . . + (16−20.5395)2 = 2.786 y por tanto no se satisface
9.6269 20.5395
la región crı́tica; es decir, se podrı́a decir que el Ingeniero tiene razón. 2
Ejemplo 5.11 Se desea contrastar a nivel α =0.05 la hipótesis de que el número mensual Y de
suicidios en una ciudad es una variable aleatoria con distribución de Poisson, en base a los siguientes
números de suicidios por mes encontrados en un plazo de 5 años.
Solución: Cuando se realiza una prueba de bondad de ajuste sobre una v.a. discreta se trabaja
de manera análoga al caso de una v.a. contı́nua, solo que ahora cada posible valor de la variable
constituye un intervalo por si solo. Veamos:
Para el contraste a nivel α =0.05:
H0 : Y ∼ P(λ) vs H1 : Y ∼ P(λ)
no conocemos λ, por lo que debemos estimarlo a través del método de máxima verosimilitud. Pa-
ra esto, sea Y1 , Y2 , ..., Yn una m.a. de Y y sean y1 , y2 , ..., yn sus valores observados. La función de
P n yi
−λ y −λ yn −nλ
verosimilitud de esta muestra es L(λ) = PY (y1 )....PY (yn ) = e y1λ! 1 ... e ynλ! = e Q
λ i=1
yi ! o me-
Pn Pn
jor K(λ) = Ln(L(λ)) = −nλ + ( i=1 yi )Ln(λ) − i=1 Ln(yi ). Derivando esta última función
P
con respecto a λ e igualando a 0, K 0 (λ) = −n + λ1 ni=1 yi = 0. Como K 00 (λ) < 0, entonces el
estimador de máxima verosimilitud de λ es λ̂ = Ȳ . Este luego de ser estimado con la fórmula
0×33+1×17+2×7+3×3
de datos agrupados nos da λ̂ = 60 = 0.667 y por tanto, las frecuencias espera-
das estimadas de observar (si es que Y fuera Poisson) 0, 1, 2 y 3 o más suicidios por mes son
Ê1 = 60 × 0.513 = 30.78, Ê2 = 60 × 0.342 = 20.52, Ê3 = 60 × 0.114 = 6.84 y Ê4 = 60 × 0.031 =1.86.
Como Ê4 = 1.86 < 5, se deben juntar los dos últimos intervalos. De esta manera obtenemos:
Como V0 =0.096, no se rechaza H0 y se puede entonces suponer que el número mensual Y de suicidios
en la ciudad sigue una distribución de Poisson. 2
Para realizar el contraste debemos tomar una m.a. conjunta de las variables U y V :
(U1 , V1 ), (U2 , V2 ), . . . , (Un , Vn ) y con ella construir la siguiente tabla de contingencia que nos
revela cuantos elementos en la muestra tienen pares especı́ficos de valores de U y de V :
V
1 2 ... j ... s Total
1 O11 O12 ... O1j ... O1s O1.
2 O21 O22 ... O2j ... O2s O2.
.. .. .. .. .. .. .. ..
. . . . . . . .
U i Oi1 Oi2 ... Oij ... Ois Oi.
.. .. .. .. .. .. .. ..
. . . . . . . .
r Or1 Or2 ... Orj ... Ors Or.
Total O.1 O.2 ... O.j ... O.s n
siendo Oij = frecuencia de elementos de la m.a. que tienen valor de U = i y valor de V = j,
P P
Oi. = sj=1 Oij = frecuencia de elementos de la m.a. que tienen valor de U = i y O.j = ri=1 Oij =
frecuencia de elementos de la m.a. que tienen valor de V = j .
No es difı́cil apreciar que (O11 , O12 , . . . , Ors ) ∼ M ul(n, p11 , p12 , . . . , prs ) y de aquı́ que (3.2)
equivalga a un contraste sobre una multinomial; sin embargo antes de plantearlo y tomar una de-
cisión es necesario primero estimar r − 1 de los parámetros p0i. y s − 1 de los parámetros p0.j . Los
estimadores de máxima verosimilitud de estos vienen dados por:
Oi. O.j
p̂0i. = y p̂0.j = .
n n
130
donde
0 Oi. O.j
Êij = np̂0i. p̂0.j =
n
denota a la frecuencia esperada en la celda (i, j) de ser H0 verdadera.
Ejemplo 5.12 Suponga que en el ejemplo 5.7 se obtuvo la siguiente tabla de contingencia:
Presentación
1 2 3 Total
1 5 13 7 25
2 6 15 8 29
Marca 3 4 9 8 21
4 5 13 7 25
Total 20 50 30 100
El gerente de ventas de la tienda sostiene que al abastecerse de cada marca del producto no se necesita
tener en cuenta la presentación. ¿Qué le dicen los datos?. Use un nivel de significación de α =0.05.
Solución: Si definimos las variables aleatorias: U = Marca del producto que compra una persona y
V = Presentación del producto que compra una persona, estaremos interesados en contrastar:
Presentación
1 2 3 Total
1 5 5.0 13 12.5 7 7.5 25
2 6 5.8 15 14.5 8 8.7 29
Marca 3 4 4.2 9 10.5 8 6.3 21
4 5 5.0 13 12.5 7 7.5 25
Total 20 50 30 100
Haciendo los cálculos obtenemos V0 = 0.8697 y por tanto se podrı́a decir que el gerente de ventas
está en lo correcto. 2
ESTADISTICA APLICADA Luis Valdivieso 131
H0 : p1 = p2 = . . . = ps = p vs H1 : ∃i / pi 6= p.
Este contraste podrı́a verse intuitivamente como un caso particular del contraste de independencia
para las variables U y V , que denotan la primera a una condición de éxito o no (presentación de
la caracterı́stica o no) y la otra a la pertenencia a una de las s poblaciones. En tal sentido, se
rechazará H0 a nivel α si
2 X
X s 0 )2
(Oij − Êij
R.C : V0 = 0
> χ21−α (s − 1)
i=1 j=1 Êij
5.7. Ejercicios
1.- Supóngase que X tiene una distribución de Poisson con parámetro λ. Para contrastar:
2.- En una planta generadora de energı́a eléctrica se especifica que la presión en cierta lı́nea debe
ser en promedio de 100 lbs/pulg 2 durante un periodo de 4 horas. Si la presión media es mayor
que 103 lbs/pulg 2 durante un periodo de 4 horas podrı́an surgir complicaciones de gravedad. Si el
ingeniero a cargo de planta piensa que en este periodo la presión esta superando su valor medio
especificado y él desea detectar que podrı́an darse complicaciones de gravedad con una probabilidad
de 0.99, ¿ cuál serı́a el tamaño de muestra que le sugerirı́a tome el ingeniero para probar su conjetura
a un nivel de significación de α =0.01 ? ¿ Qué valor promedio deberı́a encontrar el ingeniero en la
muestra que ud. propone para mostrar que efectivamente él tenı́a razón ? Use como una estimación
de σ 2 a 25.
132
3.- Las especificaciones de construcción en cierta ciudad requieren que las tuberı́as de desague em-
pleadas en áreas residenciales tengan una resistencia media a la ruptura de más de 2,500 psi. Un
fabricante que desea proveer a la ciudad de tubos para desague ha presentado una licitación junto
con la siguiente información: un contratista independiente seleccionó al azar 7 secciones de los tubos
del fabricante y determinóó su resistencia a la ruptura. Los resultados en psi son los siguientes:
4.- Se ha determinado que el consumo de agua potable en una ciudad es una v.a. con distribución
normal de media desconocida y desviación estándar 500 pies3 . La oficina del sector está revisando
la posibilidad de iniciar una campaña educativa en la ciudad para no hacer uso indiscriminado del
agua. La campaña no será iniciada si el promedio de agua consumida es menor que 2,500 pies3 . Ante
la posibilidad de saber si el promedio es menor que 2,500 se toma una muestra de tamaño n y se
pretende contrastar:
H0 : µ = 2, 500 vs H1 : µ < 2, 500.
¿ Cuál debe ser el tamaño de muestra n y la regla de decisión a tomar si se desea que la probabilidad
de cometer el error tipo I sea de 0.05 y que la probabilidad de cometer el error tipo II sea de 0.01
cuando el verdadero consumo medio es de 2,300 pies3 ?
5.- La presión a la que es sometida una placa debe, como es de esperarse para ser normal, ser inferior
a los 30 psi. Para verificarse si esto se esta cumpliendo se toma una m.a. X1 , X2 , . . . , Xn de la v.a.
X que denota a la presión a la que es sometida la placa. Se asume que esta variable es normal con
media µ y varianza conocida σ 2 = 9. Un ingeniero A decidirá que la presión en la placa es normal si
en la muestra:
1
(X1 + Xn ) ≤ C.
2
Otro ingeniero B decidirá mas bien que la presión en la placa es normal si en la muestra X̄ ≤ K.
a) Halle de fijarse un nivel de significación de α =0.05 las constantes C y K.
b) Si luego de tomarse la muestra se obtuvieron las siguientes presiones (en este orden):
6.- El tiempo de vida X, en horas, de un cierto tipo de resistencia tiene una distribución exponencial
con esperanza θ; y el fabricante de las resistencias dice que θ = 1,000. Un comprador duda que θ sea
tan grande y planea probar la tesis nula H0 : θ = 1, 000 comprando una resistencia y determinando
su tiempo de vida X1 . Si X1 es pequeño digamos X1 < A él rechazará H0 .
a) Determine A si desea rechazar H0 al nivel de significación α = 0.05.
b) ¿ Con qué probabilidad la prueba detecta una diferencia de 10 unidades sobre la media indicada
por el fabricante ?
7.- Un empresa produce cables de 100 metros de longitud. Se asume que las fallas en sus cables
se producen a través de un proceso de Poisson y según las especificaciones de control estas deben
darse a una tasa de una por cada 20 metros. Cada cable tiene un costo de producción de 80 soles
y se vende en el mercado a 175 soles. La empresa garantiza restituir todo cable que no cumpla las
especificaciones de control (es decir, que tenga mas de 5 fallas) y más aún indenmizar por este motivo
al consumidor con 50 soles. Para verificarse la calidad de un cable se selecciona de él al azar una
sección de 10 metros de longitud y se concluirá que la tasa de ocurrencia de fallas en él es mayor a la
especificada si es que en esta sección se ubican 3 o más fallas. En este caso el cable será reemplazado
por uno nuevo. En caso contrario el cable pasará el control y se venderá en el mercado.
a) Plantee este problema como un contraste de hipótesis definiendo claramente sus hipótesis y obte-
niendo el nivel de significación del contraste.
b) Si un cable con una tasa de ocurrencia de fallas de ω =0.1 por metro es sometido al control,
¿ qué probabilidad existe de que pase el control ?
c) Halle la utilidad esperada que generará un cable producido con una tasa de ocurrencia de falla de
ω = 0.1 por metro.
8.- Se asegura que la distribución de los tiempos que necesitan los operarios de una compañı́a es
normal con media 15 minutos y desviación estándar de 2 minutos. Para detectar, entre otras cosas,
si es que estos tiempos son más variables se realizará un muestreo de los tiempos obtenidos y se
usará el contraste de hipótesis usual para este tipo de problemas. Además, el tamaño de muestra que
se elegirá debe estar entre 20 y 25 operarios y el nivel de significación debe ser de 0.05.
a) Para un tamaño de muestra n = 20, obtenga la probabilidad de detectar un incremento en la
desviación estándar especificada de 1.45 minutos.
b) Determine el menor tamaño de muestra, dentro de las condiciones requeridas, que asegure una
potencia de por lo menos 90 % para detectar un incremento en la desviación estándar especificada
de 1.2 minutos.
9.- En una fábrica donde se producen tuberı́as de desague se piensa que la adición de un nuevo
compuesto en la producción de cada tuberı́a incrementará su nivel medio de resistencia a la ruptura.
Por tal motivo el gerente de la fábrica lo ha contratado a usted para que realice un contraste con-
ducente a ver si es que esto es cierto o no. Se asume que las distribuciones de las resistencias a la
ruptura sin y con la nueva componente son normales e independientes con varianzas iguales a 144 y
134
100 psi, respectivamente. El gerente le dice además que para realizar este contraste usted tiene un
presupuesto de solo 500 soles y que cada ensayo de medición de la resistencia a la ruptura cuesta
sin la adición del compuesto 7 soles y con la adición del compuesto 11 soles. Además el uso de la
máquina que hace las mediciones genera en total un costo de 80 soles.
a) Halle el número ensayos por tipo de tuberı́as para que su contraste tenga potencia máxima.
b) En base a la cantidad de ensayos obtenidos en a), determine la potencia de este contraste si se
desea detectar que el nivel medio de resistencia de las tuberı́as con el nuevo compuesto supera al
actual en 10 psi. Use un nivel de significación de α =0.05.
c) ¿ Cómo cambiarı́a este problema si es que los costos de ensayo con y sin la adición del compuesto
fueran los mismos ?
10.- Un ingeniero tiene que adquirir para la empresa con la cual trabaja un insumo, que se vende
en latas selladas de litro y medio. Este insumo para que tenga mejor calidad deberı́a de tener mayor
contenido de una sustancia X. Actualmente en el mercado se tienen 2 marcas A y B del insumo. Por
tradición, se ha manifestado siempre que el insumo de marca A es de mejor calidad que el insumo
de marca B, pero el ingeniero debe de probar si esto es o no cierto. En base a un estudio previo, se
puede asumir que el contenido en mililitros de la sustancia X en cada lata del insumo A es una v.a.
X ∼ N (µ1 , 400); mientras que el contenido en mililitros de la sustancia X en cada lata del insumo B
es una v.a. Y ∼ N (µ2 , 100). Para realizar el experimento de comparación de los insumos en cuanto
a sus contenidos de la sustancia, el ingeniero tiene un presupuesto suficiente para adquirir como
máximo 72 latas del insumo (todas las latas tienen el mismo costo).
a) Si él prueba 36 latas al azar del insumo A, encontrando una media de 102.85 mililitros y prueba
36 latas al azar del insumo B, encontrando una media de 94.78 mililitros, ¿ está él en capacidad de
afirmar con una probabilidad de equivocarse de 0.05 que lo que se dice por tradición es correcto ?
b) ¿ Cuál es la probabilidad de que el ingeniero pueda detectar en a) que efectivamente el insumo A
tiene 10 mililitros más de la sustancia X que el insumo B ?
c) El gerente de la empresa, al leer el informe del ingeniero, le indica que debió mejor distribuir
la compra de las 72 latas para que este contraste tenga la máxima potencia. Hallar n1 y n2 que
cumplan este requerimiento, siendo n1 el número de latas del insumo A y n2 del insumo B, donde
n1 + n2 = 72. Use α = 0.05.
d) Para α = 0.05, indique de manera explı́cita en cuánto se incrementarı́a la potencia del contraste
de seguir el consejo del gerente en comparación a la potencia que se encontró en la parte b).
11.- Se prueban 2 fórmulas diferentes de un combustible oxigenado para motor en cuanto al octanaje.
La varianza del octanaje para la fórmula 1 es σ12 = 3, mientras que para la fórmula 2 es σ22 = 2.16. Al
fabricante le han entregado un informe en el cual se afirma que la fórmula 2 produce un rendimiento
mayor en carretera que la fórmula 1, sin embargo, él pide al departamento de ingenierı́a que efectúe
una prueba para comprobar si lo que dice el informe es correcto con un riesgo máximo de 0.05 si no
lo es. Por otra parte no desea correr un riesgo mayor de 0.10 al afirmar que el informe no es correcto
ESTADISTICA APLICADA Luis Valdivieso 135
si realmente el rendimiento promedio por ambas fórmulas difiere en 2 kms/galón. Si las pruebas con
la fórmula 2 cuestan el doble que con la fórmula 1, ¿ cuáles son los tamaños de muestra y los lı́mites
de aceptación que debe utilizar el departamento a fin de minimizar los costos de la prueba ?
12.- Doce inspectores midieron el diámetro de un cojinete usando dos calibradores diferentes. Los
resultados fueron los siguientes:
Inspector Calibrador 1 Calibrador 2
1 0.265 0.264
2 0.265 0.265
3 0.266 0.264
4 0.267 0.266
5 0.267 0.267
6 0.265 0.268
7 0.267 0.264
8 0.267 0.265
9 0.265 0.265
10 0.268 0.267
11 0.268 0.268
12 0.265 0.269
a) ¿ Hay una diferencia significativa en las medias de las poblaciones representadas por las dos
muestras ? Use α = 0.05.
b) Si en el experimento anterior, hubiese sido de interés detectar una diferencia de mediciones
de aproximadamente 0.002064 unidades, ¿ cuál serı́a la potencia del contraste anterior ? Asuma
normalidad en la distribución de ambas mediciones.
13.- Un fabricante de aspiradoras afirma que la intensidad de ruido promedio es de 75.2 db (decibeles).
Los consumidores sospechan que dicha intensidad es mayor. Para tomar una decisión, se tomó una
m.a de 15 de estas máquinas y se midió en cada una la intensidad de ruido, obteniéndose una media
de x̄ = 80 db. Se asume un nivel de significación de α =0.05 y normalidad en la intensidad de ruido
con una desviación estándar supuesta de 3.6 db. Con base en la información recibida de la muestra, ¿
cuál serı́a la decisión a tomar ? ¿ Serı́a suficiente este tamaño de muestra para detectar una diferencia
de 0.5 db a favor de los consumidores con una probabilidad 0.6 ?
14.- En cierto control de la calidad de la producción, los lotes son de 20 unidades, el plan de muestreo
para cada lote se hace con una muestra de 6 unidades y el nivel de calidad aceptable es 15 .
a) Si el productor desea un riesgo de 0.07 , ¿cuál debe ser la polı́tica para descartar un lote ?
b) Considerando la polı́tica anterior, ¿cuál serı́a el riesgo de los consumidores correspondientes a
1
lotes con una proporción de defectuosos igual a 4 ?
c) Si realmente se tuviera la calidad aceptable, ¿qué porcentaje de defectuosos por lote esperarı́a los
consumidores luego de efectuarse este control ?
136
16.- En un plan de muestreo simple con n = 60 para lotes grandes de 250 unidades, se tiene un AQL
de 0.03.
a) Halle el número de aceptación de este plan si se quiere que el productor tenga un riesgo no mayor
a 0.1.
b) Con el valor hallado en a), determine el riesgo del consumidor si es que éste está dispuesto a
tolerar como máximo un 8 % de unidades defectuosas en los lotes que él adquiera.
c) Si inspeccionar cada unidad cuesta 0.25 soles y se va a realizar inspección al 100 % de los lotes
rechazados, ¿ cuánto es lo que esperarı́a gastar por inspección el productor en un lote A que satisface
exactamente su nivel de calidad aceptable ? Siga asumiendo el valor hallado en a).
d) Si para otro lote B, distinto al A de c), la proporción real de defectos difiere en un 2 %, ¿ cómo y
en cuánto se modificarı́a el costo de inspección esperado entre ambos lotes ? Siga asumiendo el valor
hallado en a).
18.- Un plan de muestreo doble requiere seleccionar en un lote una m.a. de tamaño n1 . Si la muestra
0
contiene c1 o menos unidades defectuosas, el lote se acepta; si contiene c1 o más unidades defectuosos
0
(c1 > c1 ) el lote se rechaza; en caso contrario una segunda muestra de tamaño n2 se extrae del lote
y el lote es aceptado a menos que el número total de unidades defectuosas en la muestra combinada
ESTADISTICA APLICADA Luis Valdivieso 137
de tamaño n1 + n2 exceda a c2 .
Se dispone del siguiente plan de muestro doble (para lotes grandes):
Muestras combinadas
19.- Una empresa recibe lotes de 500 artı́culos de cierto fabricante y utiliza el siguiente plan de
muestreo doble para la inspección de recibo:
ii) Si el número total de unidades defectuosas (en ambas muestras) es mayor a 3 se rechaza el lote.
iii) Finalmente si se rechaza el lote, se inspeccionan el 100 % de sus unidades y el fabricante debe
cambiar las unidades defectuosas por unidades buenas y pagar los costos de inspección.
Si los lotes recibidos tienen un 5 % de unidades defectuosas y el costo de inspección de una unidad
es de un sol, halle:
a) la probabilidad de rechazar el lote.
b) cuánto esperará gastar por inspección la empresa y cuánto el fabricante.
20.- Un distribuidor de leche, desea controlar el contenido de grasas de mantequilla de la leche que
compra para distribución. Investigaciones anteriores indican que en condiciones normales la cantidad
de grasa de mantequilla por cuarto, varı́a de acuerdo con una distribución normal. El promedio
por cuarto de grasa de mantequilla varı́a significativamente, pero la desviación estándar permanece
constante en aproximadamente 0.10 onzas por cuarto. Las latas con menos de 1.00 onza de grasa
de mantequilla por cuarto son consideradas, como situadas abajo del estándar de su negocio (es
decir ”defectuosas”). Para controlar la calidad de sus compras, desea encontrar un procedimiento de
muestreo por variables que haga lo siguiente:
138
Aceptar el 95 % de los lotes que tengan solamente 3 latas de cada 200 por abajo del estándar.
Aceptar el 7 % de los lotes cuando tengan 13 latas de cada 200 por abajo del estándar.
Primero se extrae la muestra por variables del lote. Si cumple con el criterio del inciso a) se
acepta el lote.
f3) Genere mediante simulación las muestras necesarias para aplicar el plan de muestreo mixto a 5
lotes con 2.5 % de latas por debajo del estándar, luego determine cuántos lotes se aceptan y
el número promedio de latas muestreadas.
Nota: Si la caracterı́stica de calidad que se desea medir es una variable que sigue una distribución
normal, se puede aplicar un plan de muestreo para aceptación por variables. Para esta prueba,
cuando se tiene una especificación de tipo mı́nimo L, se toma una muestra de tamaño n, se mide
X̄−L
la caracterı́stica de calidad (X) de cada artı́culo y se halla el promedio muestral (X̄ ). Si σ ≥k
se acepta el lote, de lo contrario se rechaza. En este caso, la probabilidad de aceptación de un lote
√
es P ( X̄−L
σ ≥ k), lo que equivale a P (Z ≥ (k − zp ) n), donde zp es el valor de Z ∼ N (0, 1) tal que
P (Z < −zp ) = p y p = P (X < L) es la fracción de no conformidad en el lote
Si se desea hallar un plan de muestreo por variables que tenga un riesgo del productor igual a α
y un riesgo del consumidor igual a β, se utilizan las siguientes fórmulas:
z α + zβ 2 z 1 zβ + z2 z α
n=( ) y k= ,
z1 − z2 zα + z β
ESTADISTICA APLICADA Luis Valdivieso 139
siendo para Z ∼ N (0, 1): z1 tal que P (Z < −z1 ) = AQL, z2 tal que P (Z < −z2 ) = LT P D, zα tal
que P (Z > −zα ) = 1 − α y zβ tal que P (Z > zβ ) = β.
21.- Un empresa, que produce bolsas de frutas secas mixtas, asegura que estas, salvo variaciones
aleatorias, se empacan con un 40 % de unidades conformadas por pasas, un 20 % de unidades
conformadas por pecanas y el resto de unidades conformadas por manı́. Realizada la mezcla, las
bolsas son llenadas con aproximadamente 40 unidades. Suponga que el costo de cada unidad de
pasa, pecana y manı́ es de respectivamente 0.025, 0.5 y 0.01 soles.
a) De ser correctas las especificaciones del productor, determine cuál es el costo que esperará tener
él por cada bolsa de frutas mixtas que saque al mercado.
b) De ser correctas las especificaciones del productor, determine la probabilidad de que en una bolsa
de 40 unidades usted obtenga menos de 3 pecanas y exactamente 12 pasas.
c) Suponga que usted duda de las especificaciones del productor. Para ello adquiere 3 bolsas de frutas
mixtas y encuentra que ellas en total contienen 40 unidades de pasas y 50 de manı́ ¿ Confirman estos
datos sus dudas a un nivel de significación de α =0.05 ?
22.- Un exámen estandarizado de Inglés tiene 4 modalidades A, B, C y D y las personas que lo toman
deben de decidir su preferencia por alguna de estas modalidades.
a) De tener estas modalidades igual preferencia, ¿ qué probabilidad existe de que al examinarse 5
exámenes tomados al azar se encuentre que nunca se elijan las modalidades B y D?
b) Se piensa que las personas que toman el examen, muestran un distinto nivel de preferencia por
las 4 modalidades. Por tal motivo se seleccionó al azar una muestra de 210 exámenes evaluados,
encontrándose que 40, 60, 100 y 10 de estos se dieron respectivamente con las modalidades A, B, C
y D. Muestran estos datos, que a un nivel de significación del 5 %, lo que se pensaba era correcto.
Si esto es ası́, ¿ podrı́a garantizar alguna o algunas modalidades como las más preferidas y alguna o
algunas modalidades como las menos preferidas ?
23.- Un distribuidor de artı́culos deportivos desea comprar grandes lotes de éstos para la venta. En
cada lote pueden venir de clase A, de clase B y de clase C. La clasificación depende del menor número
de defectos que éstos presentan. Ası́, los de la clase A presentan entre 0 y 2 defectos, los de la clase
B, entre 3 y 5 defectos y los de la clase C más de 5 defectos. Cualquiera que sea la composición del
lote, el precio es el mismo por lo que al distribuidor le interesarı́a que:
PA > PB > PC ,
PA > PB > PC ?
140
24.- Una financiera asume que los montos de los ahorros de sus clientes tiene una distribución
lognormal de parámetros µ = 8 y σ 2 = 4. Con la finalidad de comprobar la veracidad de la asunción
se toman al azar 140 cuentas. La distribución de éstas fue como sigue:
A un nivel de significación de α = 0.05, ¿ podrı́a decirse que realmente los números generados son
aleatorios ? Use 5 intervalos.
26.- En el proceso de llenado de sacos de arroz de 50 kilos se asume, como es usual, que el peso
de un saco que pasa por este proceso, X, tiene una distribución normal con una media de 50 kilos.
Un ingeniero piensa que si bien el peso medio de llenado de un saco es de efectivamente 50 kilos,
la distribución de pesos de los sacos llenados con el proceso tiene un cierto grado de asimetrı́a y
por tanto sospecha que el modelo normal que se ha venido asumiendo no es adecuado para esta
distribución . Para estudiarse el problema, se seleccionaron al azar 70 sacos de arroz llenados bajo
el proceso. Luego del pesaje (en kilos) de estos sacos de arroz, se obtuvo la siguiente distribución de
frecuencias:
a) Asumiendo que la distribución de pesos de los sacos de arroz llenados con este proceso es la usual,
estime por máxima verosimilitud la desviación estándar de estos pesos.
27.- Un fabricante piensa que el tiempo de vida útil de un tipo de circuito tiene una distribución
exponencial. Para comprobarlo él ha seleccionado 45 de estos circuitos y luego de someterlos a uso
continuo en condiciones ambientales controladas ha encontrado los siguientes tiempos de vidas en ho-
ras: 56.964220 16.727451 14.419384 11.693030 11.062747 20.731942 12.039204 249.734139 7.070935
24.330959 122.033890 17.056974 21.796482 16.677012 22.347398 30.389092 40.785651 39.138552
53.541172 63.871099 58.777938 62.624475 61.745463 9.925660 27.187030 11.707706 39.823348
133.639951 61.693134 4.860883 21.926937 33.479360 97.816661 79.735347 24.875191 6.419568
32.638556 13.018685 158.881303 62.466969 7.179301 65.765316 36.691724 21.199193 27.071903. A
un nivel de significación α =0.01, ¿ es válida la conjetura del fabricante ?
28.- En un laboratorio se inspecciona según color una etapa de la producción de un fármaco. Para
evitar errores de observación, se han dispuesto turnos de inspección, donde cada cambio de turno se
realiza inmediatamente después de que un controlador ubique 2 unidades del fármaco con un color
que denote problemas de concentración. El ingeniero a cargo de la producción cree que la aparición
de fármacos defectuosos en el proceso se da a través de un proceso de Poisson y que por tanto el
tiempo de observación de cada turno tiene distribución Gamma de parámetro α = 2 y un cierto
parámetro β. Para analizar esto, el ingeniero ha ordenado registrar los tiempos de observación del
proceso para 48 turnos seleccionados al azar, encontrando en minutos: 228.374, 99.733, 230.503,
214.352, 350.384, 88.892, 445.805, 68.282 , 145.961, 370.382, 68.428, 79.606, 308.906, 46.467,
293.379, 129.357, 410.636, 321.654, 453.652, 245.655, 273.724, 127.523 , 330.817, 28.072,
129.220, 120.474, 74.527, 348.326, 172.764, 153.049 , 205.517, 64.548, 100.410, 202.744,
469.416, 207.480, 249.156, 112.023, 287.380, 34.858, 111.865, 34.381, 78.239, 130.892, 302.128,
51.523, 92.375, 136.403. A un nivel de significación de α =0.05, ¿ tiene razón el ingeniero ?
29.- Al usar varias leyes de falla se ha encontrado que la distribución exponencial desempeña un papel
muy importante y que, por tanto, interesa poder decidir si una muestra particular de tiempos para
que se presente la falla proviene de una distribución exponencial. Supóngase que un ingeniero piensa
que la duración de una marca particular de bombillas (en horas) tiene una distribución exponencial
con una media de 124 horas y para ello él ha seleccionado al azar 327 bombillas de esta marca
encontrándose la siguiente distribución de frecuencias de sus duraciones en horas:
142
¿ Muestran estos datos, a un nivel de significación de α =0.05, que la hipótesis del ingeniero es
correcta ?
30.- Un algoritmo de búsqueda de archivos logra localizar el archivo buscado en un tiempo menor al
requerido en el 100 p % de las veces. El algoritmo será puesto a prueba en 5 oportunidades, en cada
una se efectuará la búsqueda de un archivo, y se desea averiguar cuántos se localizarán dentro del
tiempo requerido. Suponga condiciones similares en cada busqueda y también independencia.
a) ¿Qué modelo probabilı́stico serı́a el más adecuado para describir la variable de interés ?
b) Halle el estimador de máxima verosimilitud de p.
c) A partir de una muestra aleatoria de 100 oportunidades, en las que el algoritmo realizó cinco
búsquedas, se obtuvieron los siguientes resultados:
31.- Una encuestadora, a pedido del canal de televisión A, ha realizado un estudio de medición de
la teleaudiencia en el horario de las 8 pm. En este estudio se seleccionaron al azar 225 personas de
ambos sexos, a quienes se les pregunto por el canal que más frecuentemente sintonizaban de Lunes a
Viernes en el horario de las 8 pm. Los resultados de este estudio se muestran en el siguiente gráfico
de barras componentes:
ESTADISTICA APLICADA Luis Valdivieso 143
32.- En un proceso de producción se fabrica cierto artı́culo de veinte en veinte unidades. La ca-
lidad resultante asume uno de tres valores aleatorios (1, 2 y 3 con probabilidades p.1 , p.2 y p.3 ,
respectivamente) y en el proceso se suele necesitar uno de cuatro tipos de ajuste también aleatorios
(1, 2, 3 y 4 con probabilidades p1. , p2. , p3. y p4. respectivamente). Suponga que se escogerán al azar
cien producciones y se registrará el tipo de calidad que resulte, ası́ como el tipo de ajuste que sea
necesario en cada producción de veinte unidades. Se asume condiciones similares e independencia
entre los resultados de las producciones.
Los resultados obtenidos se muestran en la siguiente tabla:
Calidad
Ajuste 1 2 3 T otal
1 13 5 7 25
2 15 6 8 29
3 9 4 8 21
4 13 5 7 25
T otal 50 20 30 100
a) ¿Los tipos de calidad resultantes se dan con igual frecuencia? Use un nivel de significación de α =
0.05.
b) ¿Puede afirmarse que el tipo de calidad y ajuste son independientes? Use un nivel de significación
de α = 0.05.
c) Determine, usando un intervalo de confianza del 95 %, si se puede descartar que la frecuencia con
la cual se produce el tipo de calidad 1 y se necesita realizar un ajuste del tipo 3, es la misma que la
correspondiente al tipo de calidad 2 y ajuste del tipo 1.
33.- Un operador manifiesta con una probabilidad de equivocarse de 0.05 que la proporción de defectos
de las 3 lı́neas de producción de la planta difieren entre si. Ud. ha tomado en un dia una muestra de
50, 35 y 40 productos de cada lı́nea y encontrado 4, 10 y 5 productos defectuosos, respectivamente.
a) ¿ Estará en lo correcto el operador ?
b) En caso de encontrar diferencias significativas, utilice la desigualdad de Bonferroni con el fin de
jerarquizar las proporciones de defectos en las tres lı́neas de producción. Utilice un nivel de confianza
global de al menos 95 %.
144
Capı́tulo 6
DISEÑOS EXPERIMENTALES
Totales Medias
1 Y11 Y12 ... Y1j ... Y1n Y1. Ȳ1.
2 Y21 Y22 ... Y2j ... Y2n Y2. Ȳ2.
.. .. .. .. .. .. .. .. ..
. . . . . . . . .
Tratamientos i Yi1 Yi2 ... Yij ... Yin Yi. Ȳi.
.. .. .. .. .. .. .. .. ..
. . . . . . . . .
a Ya1 Ya2 ... Yaj ... Yan Ya. Ȳa.
Y.. Ȳ..
donde Yij = j-ésimo elemento de la m.a. de Y bajo el i-ésimo tratamiento,
Pn Yi. Pa Y..
Yi. = j=1 Yij , Ȳi. = n , Y.. = i=1 Yi. e Ȳ.. = N .
siendo µ la llamada media total, el cual es un parámetro común a todos los tratamientos, τi el efecto
del i-ésimo tratamiento del factor A sobre Y y ij un término de error aleatorio con distribución
normal de media 0 y varianza σ 2 . Estos últimos errores se asumen independientes entre si.
Uno de los objetivos centrales en el análisis de varianza a una via consiste en determinar si es
que existen o no diferencias significativas en el valor medio de la variable dependiente Y , bajo los a
tratamientos del factor A.
Una cuestión clave para distinguir la naturaleza del modelo radica en determinar el significado
de los efectos de los tratamientos. Estos pueden ser
145
146
En (i) al modelo se le conoce como de efectos fijos y si µi denota el valor medio de Y bajo el i-ésimo
tratamiento, entonces los efectos de los tratamientos son definidos como desviaciones de la media
total: τi = µi − µ, ∀i. Luego, se cumple que
a
X
τi = 0.
i=1
. Este modelo es aplicable cuando uno solo desea comparar Y bajo a tratamientos prefijados de
interés. Obviamente las conclusiones serán válidas solo para los tratamientos comparados.
En (ii) al modelo se le conoce como de efectos aleatorios. Este modelo se emplea cuando uno
tiene una gran población de tratamientos y por tanto resulta poco práctico el compararlos todos. En
este caso se elijen al azar solo a tratamientos de los muchos existentes y luego de comparar Y bajo
tales, uno tiene la posibilidad de extender sus conclusiones a toda la población de tratamientos.
Antes de entrar a mayores detalles, vale indicar que el desarrollo que presentaremos se basará pre-
ferentemente en un contexto experimental; es decir, en un contexto donde existe un factor con a
tratamientos cuyos efectos en la variable respuesta Y deseamos investigar, pues pensamos que estos
tratamientos afectan solo la posición o tendencia central de las a poblaciones de Y asociadas. Existe,
por otro lado, otro contexto muy común en investigación, llamado contexto cuasi-experimental o de
encuesta. En él las poblaciones de Y son naturales (existen antes de tomarse las muestras) y lo que
se desea es ver si es que estas poblaciones son o no en cierta sentido equivalentes. En este caso, se
procede a una adaptación del presente análisis y a una más cuidadosa revisión de los supuestos del
modelo, en particular el concerniente a la homocedasticidad o igualdad de varianzas.
Otra diferencia de fondo en los contextos descritos es que las conclusiones de un estudio cuasi-
experimental son sólo de carácter tentativo ya que no es posible asegurar una relación causa-efecto
entre la caracterı́stica que define a las a poblaciones y la variable dependiente Y . Esta relación podrı́a
ser, por ejemplo, originada por otras variables no consideradas ni controladas en la comparación. Solo
las investigaciones experimentales pueden establecer verdaderas relaciones de causa-efecto.
Sea el contexto experimental o cuasi-experimental, los diseños que desarrollaremos serán comple-
tamente aleatorios. En un contexto cuasi-experimental, esto se logra al tomárse muestras aleatorias
de Y bajo cada tratamiento. En un contexto experimental, tal metodologı́a carece de sentido pues
las poblaciones como tales no existen y en cierta manera son definidas por los tratamientos. En este
caso uno selecciona al azar a las unidades experimentales en un número igual al total de réplicas de
Y para todos los tratamientos y asigna estas unidades a los a tratamientos, aleatorizando el orden
de ejecución del experimento. En pocas palabras esto significa que los tratamientos deben de ser
asignados de manera completamente aleatoria a las unidades experimentales.
ESTADISTICA APLICADA Luis Valdivieso 147
H0 : τ1 = τ2 = ... = τa = 0 vs H1 : ∃i / τi 6= 0
o equivalentemente,
H0 : µ1 = µ2 = ... = µa = µ vs H1 : ∃i / µi 6= µ.
Esta contraste se basa en la descomposición de la variabilidad total de Y , SCT = (N − 1)SY2 , donde
N = an, mediante el siguiente artificio:
a X
X n a X
X n
SCT = (Yij − Ȳ.. )2 = (Yij − Ȳi. + Ȳi. − Ȳ.. )2 .
i=1 j=1 i=1 j=1
Se demuestra que al desarrollarse los cuadrados y operarse los productos cruzados, estos últimos se
cancelan quedándonos la siguiente descomposición fundamental de análisis de varianza:
a X
X n a
X a X
X n
2 2
(Yij − Ȳ.. ) = n (Ȳi. − Ȳ.. ) + (Yij − Ȳi. )2
i=1 j=1 i=1 i=1 j=1
o respectivamente,
SCT = SCT r + SCE (6.2)
OBSERVACIONES: 1.- Para efectos de cálculo pueden utilizarse las siguientes fórmulas simplificadas
de las sumas de cuadrados:
Xa X
n a
2 2 Y..2 1 X 2 Y..2
SCT = (N − 1)SY = Yij − , SCT r = Yi. − y SCE = SCT − SCT r.
N n N
i=1 j=1 i=1
2.- A modo de resumen, es recomendable utilizar la siguiente tabla de análisis de varianza a una via
(tabla ANOVA):
148
3.- Si bien los tamaños de muestra por tratamiento pueden diferir (diseño no balanceado), debe de
considerarse que por la asunción de homocedasticidad en el modelo (varianza común σ 2 de Y bajo
cualquier tratamiento) uno puede garantizar un contraste de máxima potencia sólo si los tamaños
de muestra por tratamiento son iguales (diseño balanceado). En un diseño no balanceado, el análisis
previo es, por fortuna, el mismo con la excepción de que las sumas de cuadrados se evaluan ahora
por:
X ni
a X a
XY2 Y2
Y2
SCT = (N − 1)SY2 = Yij2 − .. , SCT r = i.
− .. y SCE = SCT − SCT r,
N ni N
i=1 j=1 i=1
Pa
siendo ni el tamaño de muestra de Y bajo el i-ésimo tratamiento y N = i=1 ni .
Totales Medias
15 % 7 7 15 11 9 49 9.8
20 % 12 17 12 18 18 77 15.4
Porcentajes 25 % 14 18 18 19 19 88 17.6
30 % 19 25 22 19 23 108 21.6
35 % 7 10 11 15 11 54 10.8
H0 : µ1 = µ2 = µ3 = µ4 = µ5 = µ vs H1 : ∃i / µi 6= µ.
3762
SCT = (72 + ... + 112 ) − = 636.96,
25
ESTADISTICA APLICADA Luis Valdivieso 149
Como se aprecia F0 > 2.87 y por tanto sı́ existen diferencias significativas en la resistencia media a
la tracción según el porcentaje de algodón utilizado en la fibra. Nótese que esta conclusión resulta de
alguna manera exigua, pues no se nos dice donde es que se ubican las diferencias. De esto trataremos
en una próxima sección. 2
Los estimadores puntuales (de mı́nimos cuadrados) de los parámetros en el modelo (4.1) se pueden
probar que vienen dados por:
Es factible también obtener intervalos de confianza al 100(1 − α) % para los parámetros del
modelo. Para ello uno solo tiene que encontrar una variable pivote adecuada para la construcción del
intervalo. Por ejemplo, supongamos que deseamos obtener un intervalo de confianza al 100(1 − α) %
para la diferencia de medias de Y bajo dos tratamientos distintos i y j: µi − µj . Dadas las asunciones
de normalidad, no resulta difı́cil deducir que
Como T posee una distribución conocida (en tablas) que solo depende como parámetro desconocido
de µi − µj , esta constituye nuestra variable pivote. Determinada la variable pivote lo que sigue es
rutinario. Por la simetrı́a en la distribución t, uno debe elegir en la tabla t el valor t1− α2 (N-a) de tal
manera que el área bajo la curva t entre −t1− α2 (N-a) y t1− α2 (N-a) sea de 1 − α. Formalmente,
Reemplazando T y ordenando de tal manera que nuestro parámetro quede en la posición central,
resulta que:
s s
√ 1 1 √ 1 1
P [Ȳi. − Ȳj. −t1− α2 (N-a) M CE + ≤ µi −µj ≤ Ȳi. − Ȳj. +t1− α2 (N-a) M CE + ] = 1−α.
ni nj ni nj
150
respectivamente.
Como se precisó, en este modelo los efectos de los tratamientos τ1 , τ2 , ..., τa constituyen una m.a.
de tamaño a de la v.a. τ ∼ N (0, στ2 ). Aquı́ se desea contrastar a nivel α:
Los cálculos en este modelo y la región crı́tica del contraste son por fortuna los mismos que en el
modelo de efectos fijos; aunque tengase en cuenta que si uno rechaza H0 no solo esta probando que
algunos de los efectos de los a tratamientos sobre la v.a. dependiente Y es no nulo sino, y eso es lo
trascendental, que algunos de los efectos de todos los tratamientos de la población de tratamientos
es no nulo.
Comparaciones planeadas
Estas comparaciones se realizan cuando, antes de la toma de datos, existı́a la intención de com-
parar algunos pares especı́ficos. Estas comparaciones pueden hacerse con una prueba t de Student
modificada, a la cual se denomina LSD (de Least Significance Difference). Se presentan los siguientes
casos:
OBSERVACIONES: 1.- Notese de que la región crı́tica de la prueba anterior a dos colas no es sino
el complemento del intervalo de confianza al 100(1 − α) % para µi − µj .
2.- Si se desean comparar muchos pares de medias a la vez, aparece de inmediato el problema
del incremento en el nivel de significación α. Este problema lo analizaremos cuando veamos las
comparaciones no planeadas.
(B) Contrastes
Un contraste poblacional es por definición cualquier combinación lineal de medias poblacionales:
P P
CP = ci µi que satisface la condición ni ci = 0. Este parámetro poblacional CP se estima
ˆ = P ˆ un estimador que posee, bajo los supuestos en (4.1), las
puntualmente por CP ci Ȳi. , siendo CP
propiedades siguientes:
ˆ ∼ N (CP, σ 2 P ci ).
2
CP ni
ˆ −P ci µi
CP
T = r ∼ t(N − a).
P c2i
M CE n
i
ˆ
CP
T0 = q P c2i
M CE ni
Ejemplo 6.2 Supongamos que en el ejemplo de la resistencia a la tensión se tenı́a el interés adicional
de saber (antes de tomarse los datos) si a un nivel de significación de α = 0.05 existı́an o no
diferencias significativas en la resistencia media a la tensión de la fibra bajo un 35 % de algodón y
bajo un promedio de los dos primeros tratamientos( con 15 y 20 % de algodón).
Formalmente, si CP = 21 µ1 + 21 µ2 − µ5 , se tenı́a interés en contrastar:
H0 : CP = 0 vs H1 : CP 6= 0.
152
Nuestra regla de decisión indica que se rechazará H0 si |T0 | > t0.975 (20) = 2.086. Una directa
evaluación nos da
X c2
ˆ = 9.8 + 15.4 − 10.8 = 1.8
CP y M CE i
= 2.58.
2 2 5
Luego, T0 = 1.121 y consecuentemente no existe evidencia empı́rica suficiente que nos lleve al rechazo
de H0 .
y tienen un sólo grado de libertad. Estas sumas de cuadrados divididas entre la media cuadratica del
error nos proporcionan los F de contrastes que se van a comparar con el valor de tabla F1−α (1, N-a).
Los contrastes cuyos F superen el valor de tabla serán entonces significativos. Es interesante apreciar
que si el diseño es balanceado, entonces estos estadı́stico F coinciden con los cuadrados de los
estadı́sticos respectivos del contraste; vale decir, con T02 .
Existen muchas maneras de elegir los coeficientes de los contrastes ortogonales para un conjunto
dado de tratamientos. Usualmente, algo de la naturaleza del experimento debe sugerir las compara-
ciones que resultan de interés. Por ejemplo, si se desean comparar los efectos de a = 3 tratamientos
en la reducción de la presión arterial, siendo control el tratamiento 1 (un placebo por ejemplo), y
los tratamientos 2 y 3 los fármacos de interés, los contrastes ortogonales apropiados (para un diseño
balanceado) podrı́an ser los siguientes:
Coeficientes
Contraste 1 Contraste 2
1 (placebo) -1 0
1
Tratamiento 2 (fármaco 1) 2 − 12
1 1
3 (fármaco 2) 2 2
Debe observarse que el contraste {c1 , c2 , c3 } = {−1, 21 , 12 } compara el efecto promedio de los dos
fármacos con el efecto del placebo en cuanto a reducir la presión arterial, mientras que el contraste
{d1 , d2 , d3 } = {0, − 12 , 12 } compara los efectos de los dos fármacos de interés en la reducción de la
presión arterial.
ESTADISTICA APLICADA Luis Valdivieso 153
Ejemplo 6.3 Suponga que antes de realizarse el experimento del efecto de los cinco porcentajes de
algodón sobre la resistencia a la tracción de la fibra, el investigador hubiese estado interesado en
realizar los siguientes 4 contrastes (ortogonales) poblacionales a un nivel de significación de α =
0.05:
H0 : µ4 = µ5
µ1 +µ3 µ4 +µ5
H0 : 2 = 2
H0 : µ1 = µ3
µ1 +µ3 +µ4 +µ5
H0 : µ2 = 4
µ1 µ3 µ4 µ5
Las sumas de cuadrados de los cuatro contrastes (CP1 = µ4 − µ5 , CP2 = 2 + 2 − 2 − 2 ,
µ1 µ3 µ4 µ5
CP3 = µ1 − µ3 y CP4 = 4 − µ2 + 4 + 4 + 4 ) pueden resumirse en la siguiente tabla ANOVA:
Comparando F con F0.95 (1, 20) = 4.35, vemos que CP1 y CP3 son significativos; es decir, con un
error de equivocarnos del 5 %, si podemos afimar que existen diferencias en la resistencia media a la
tensión entre fibras con un 30 % y 35 % de algodón y entre fibras con un 15 % y 25 % de algodón. 2
Después de detectar que en un análisis de varianza de efectos fijos no todas las medias son iguales,
podrı́amos estar interesados en detectar cuáles son diferentes. Uno de los muchos procedimientos para
realizar esta tarea, manteniendo bajo control un mismo nivel de significación α, consiste en utilizar
la desigualdad de Bonferroni que expusimos en la sección 3.4. Bajo este procedimiento podrı́amos
construir, como en 4.1.2, IC’s al 100(1 − α0 ) % para todas las a2 de diferencias de medias de Y
bajo pares de tratamientos. Dado que estos IC’s son equivalentes a las regiones de aceptación de la
hipótesis de igualdad de medias de Y bajo los tratamientos comparados, uno podrá garantizar un
nivel de significación global de α o menos en todas las comparaciones, si es que toma para cada IC
α 2α
un valor de α0 = = a(a−1) .
(a2)
Otro método muy popular y de buenos resultados, lo constituye el método de rangos de Duncan.
Este método consiste en comparar todas las a2 diferencias de medias muestrales con un conjunto
de rangos que se encuentran tabulados en una tabla especial (ver apéndice E). Dado que los detalles
154
de un tratamiento formal resultan engorrosos, optaremos por ilustrar el método con los datos del
ejemplo de la subsección 4.1.1. Usaremos un nivel de significación de α = 0.05
Los pasos a seguir se detallan a continuación:
Paso 1. Se ordenan las medias muestrales de menor a mayor . Ası́, en nuestro ejemplo:
Paso 3. Se obtienen en la tabla de Duncan (véase el apéndice E) los valores rα (p; f ), para p = 2, ..., a,
donde α es el nivel de significación fijado previamente y f son los grados de libertad del error (en el
análisis a una via f = N − a). Para nuestro ejemplo, α = 0.05 , f = 20 y de tabla obtenemos:
Paso 4. Se calculan los rangos de ”mı́nima significancia”: Rp = SȲi. × rα (p; f ), para p = 2, ..., a. En
nuestro ejemplo:
Paso 5. Se evaluan las diferencias observadas entre las medias, comenzando por el valor más alto
contra el más pequeño y comparándola con el rango de mı́nima significancia Ra . Después se calcula
la diferencia entre el valor más alto y el segundo más pequeño, y se compara con el rango de mı́nima
significancia Ra−1 . Este procedimiento continúa hasta que todas las medias hayan sido comparadas
con la más grande. A continuación, la diferencia entre la segunda media más grande y la más pequeña
es calculada y comparada con el rango de mı́nima significancia Ra−1 . Este procedimiento continúa
hasta que hayan sido consideradas las diferencias entre todos los a2 = a(a−1)
2 posibles pares. Si una
diferencia observada es mayor que la del rango de mı́nima significancia correspondiente, se concluye
que la pareja de medias en cuestión es significativamente diferente. Para evitar contradicciones,
ninguna diferencia entre una pareja de medias se considera significativa si las dos medias se encuentran
entre dos que no difieren. Finalmente una vez ubicadas las diferencias estaremos en capacidad de
jerarquizar la medias poblacionales de Y bajo todos los tratamientos. En nuestro ejemplo:
ESTADISTICA APLICADA Luis Valdivieso 155
A partir de este análisis se observa que existen diferencias significativas entre todas los pares de
medias a excepción de las del tercer tratamiento y del segundo, y las del quinto tratamiento y el
primero. La conclusión final serı́a que, a un nivel de significación del 5 %, podemos afirmar que:
µ1 = µ5 < µ2 = µ3 < µ4 .
Esto es de vital importancia en la toma de decisiones. Imagı́nese, por ejemplo, que el manufacturero
debe decidir que % de algodón utilizar para obtener fibras de buena calidad (alta resistencia) y
bajos costos de producción (reflejados en un menor uso de algodón por ser una fibra cara). Bajo
estas premisas una buena sugerencia podrı́a ser el recomendarle fibras con un 20 % de algodón.
Cuando existe una fuente no evitable de variabilidad extraña sobre una variable de estudio Y
(aparte del de la variabilidad debido a los tratamientos de un factor A), es posible aún utilizar un
diseño experimental llamado de bloques a fin de reunir información válida para la comparación de
los efectos de los tratamientos del factor A sobre la v.a. dependiente Y . Formalmente, un diseño de
bloques aleatorios consiste en un plan para reunir datos en el que cada uno de los a tratamientos se
mide una sola vez en cada uno de los k bloques existentes, siendo el orden de los tratamientos dentro
de cada bloque aleatorio.
El objetivo de este diseño es el de comparar una v.a. dependiente Y bajo a tratamientos de un
factor A, controlando estadı́sticamente la fuente extraña de variabilidad mediante el uso de bloques.
Al realizarse un diseño de bloques uno obtiene la siguiente información:
Bloques
156
donde µ es la llamada media total, el cual es un parámetro común a todos los tratamientos, τi el
efecto del i-ésimo tratamiento del factor A sobre Y , βj el efecto del j-ésimo bloque sobre Y y ij un
término de error aleatorio de distribución normal con media 0 y varianza σ 2 . Estos últimos errores
se asumen independientes entre si.
El objetivo central del análisis de varianza con un diseño de bloques consiste como siempre en
encontrar si existen o no diferencias significativas en el valor medio de la variable dependiente Y , bajo
los a tratamientos del factor A; pero controlando mediante bloques la fuente extraña de variabilidad.
Formalmente, se desea contrastar a nivel α:
H0 : τ1 = τ2 = ... = τa = 0 vs H1 : ∃i / τi 6= 0.
X k
a X a X
X k
SCT = (Yij − Ȳ.. )2 = (Yij − Ȳi. + Ȳi. − Ȳ.j + Ȳ.j − Ȳ.. + Ȳ.. − Ȳ.. )2 .
i=1 j=1 i=1 j=1
H0 : β1 = β2 = ... = βk = 0 vs H1 : ∃j / βj 6= 0.
y se rechazará H0 (lo cual indicará que el diseño en bloques fue adecuado) si:
OBSERVACIONES: 1.- Para efectos prácticos se pueden utilizar las siguientes fórmulas simplificadas
de las sumas de cuadrados:
a X
X k a k
Y..2 1 X 2 Y..2 1 X 2 Y..2
SCT = (N − 1)SY2 = Y ij 2 − , SCT r = Yi. − y SCb = Y.j − .
N k N a N
i=1 j=1 i=1 j=1
2.- Al igual que en un modelo ANOVA, uno puede utilizar la desigualdad de Bonferroni o la prueba
de rangos de Duncan para detectar a que se deben las discrepancias halladas de rechazarse H0 . Para
un diseño de bloques completamente aleatorizado, se puede deducir que un intervalo de confianza al
100(1 − α) % para la diferencia de medias de Y bajo dos tratamientos, µi − µj , vienen dada por:
r r
√ 2 √ 2
[ Ȳi. − Ȳj. − t1− α2 ((a-1)(k-1)) M CE , Ȳi. − Ȳj. + t1− α2 ((a-1)(k-1)) M CE ].
k k
Tipos de tela
1 2 Totales
1 5 9 14
2 3 8 11
Tratamientos 3 8 13 21
4 4 6 10
Totales 20 36 56
¿ Se puede decir a un nivel de α = 0,05, que los tratamientos producen distintas resistencias a las
manchas en las telas? ¿ Fue apropiado usar un diseño de bloques para esta comparación ?. Asuma
normalidad.
H0 : τ1 = τ2 = τ3 = τ4 = 0 vs H1 : ∃i / τi 6= 0.
Se rechazará H0 si:
R.C : F0 > F0.95 (3, 3) = 9.28.
142 +112 +212 +102 562
De los datos obtenemos que: SCT = 7SY2 = 72, SCT r = 2 − 8 = 37,
202 +362 562
SCb = 4 − 8 = 32 y una tabla ANOVA:
B
1 ... j ... b Total
1 Y111 , Y112 , ..., Y11n ... Y1j1 , Y1j2 , ..., Y1jn ... Y1b1 , Y1b2 , ..., Y1bn Y1..
2 Y211 , Y212 , ..., Y21n ... Y2j1 , Y2j2 , ..., Y2jn ... Y2b1 , Y2b2 , ..., Y2bn Y2..
.. .. .. .. .. .. ..
. . . . . . .
A i Yi11 , Yi12 , ..., Yi1n ... Yij1 , Yij2 , ..., Yijn ... Yib1 , Yib2 , ..., Yibn Yi..
.. .. .. .. .. .. ..
. . . . . . .
a Ya11 , Ya12 , ..., Ya1n ... Yaj1 , Yaj2 , ..., Yajn ... Yab1 , Yab2 , ..., Yabn Ya..
Total Y.1. ... Y.j. ... Y.b. Y...
siendo µ = media global poblacional, τi = Efecto del i-ésimo tratamiento de A sobre Y , βj = Efecto
del j-ésimo tratamiento de B sobre Y , (τ β)ij = Efecto de la interacción entre el i-ésimo tratamiento
de A y el j−ésimo tratamiento de B y ijk = Error aleatorio.
Se asume que los 0ijk s son todos independientes y con distribución normal de media 0 y varianza
común σ 2 y que los efectos de los tratamientos son desviaciones de la media global: Si µi. = media
poblacional de Y bajo el i−ésimo tratamiento y µ.j = media poblacional de Y bajo el j−ésimo
P P
tratamiento, entonces τi = µi. − µ y βj = µ.j − µ. Consecuentemente, ai=1 τi = bj=1 βj = 0. Se
P P
concluye también que ai=1 bj=1 (τ β)ij = 0.
Es vital en el análisis aclarar el papel que desempeña la interacción. Se dice que existe interacción
entre los factores A y B, cuando las diferencias entre las medias o totales de Y bajo los tratamientos
de uno de los factores, no mantiene el mismo patrón bajo los tratamientos del otro factor.
Ejemplo 6.5 Supongamos que estamos estudiando Y = porcentaje de pureza de un metal después
de un proceso de mezclado y pensamos que este porcentaje se ve afectado por el método que se emplea
en el mezclado (factor A) y/o por el operario que esta a cargo del proceso de mezclado (factor B). Se
disponen de dos métodos y dos operarios y se mide el porcentaje de pureza eligiendo al azar una sola
observación por cada método y operario. La información obtenida se presenta en la tabla siguiente:
160
B
1 2 Total
A 1 70 50 120
2 40 20 60
Total 110 70 180
Si graficamos los totales de Y bajo el factor máquinas por cada nivel del factor operarios, obtendremos
la figura siguiente, la cual nos dice de que no existe interacción entre los factores.
Aquı́ podrı́amos pensar fácilmente que el operario 1 muestra una mayor eficiencia e igualmente que
el mejor método es el primero. Sin embargo, si hubiésemos obtenido la siguiente información:
B
1 2 Total
A 1 70 20 90
2 30 60 90
Total 100 80 180
sı́ existe interacción y las conclusiones dadas anteriormente no tienen sentido, ya que por ejemplo,
el método 1 no es superior al método 2 si es que esta cargo el operario 2. 2
(I) H0 : τ1 = τ2 = ... = τa = 0 vs H1 : ∃i / τi 6= 0.
(H1 nos dice de que existen diferencias significativas o efectos significativos en el valor medio de Y
según los tratamientos del factor A)
(II) H0 : β1 = β2 = ... = βb = 0 vs H1 : ∃j / βj 6= 0.
(H1 nos dice de que existen diferencias significativas o efectos significativos en el valor medio de Y
según los tratamientos del factor B)
(H1 nos dice de que existe una interacción significativas entre los tratamientos de los factores A y
B)
Si se rechaza H0 en (III), existirá interacción significativa entre los factores A y B. En este caso,
las conclusiones de las pruebas en (I) y (II) serán relativas y en algunos casos inválidas ya que no
existirá uniformidad en los efectos de los tratamientos de A o B bajo los tratamientos del otro factor.
Las contrastes de hipótesis se basan como antes en descomponer la variabilidad total SCT =
(N − 1)SY2 :
a X
X b X
n a X
X b X
n
2
SCT = (Yijk − Ȳ... ) = (Yijk − Ȳi.. + Ȳi.. − Ȳ.j. + Ȳ.j. − Ȳij. + Ȳij. − Ȳ... + Ȳ... − Ȳ... )2 .
i=1 j=1 k=1 i=1 j=1 k=1
162
Se prueba que al desarrollarse los cuadrados, los productos cruzados se cancelan quedándonos la
siguiente descomposición de variabilidad:
a X
X b X
n a
X b
X
(Yijk − Ȳ... )2 = bn (Ȳi.. − Ȳ... )2 + an (Ȳ.j. − Ȳ... )2
i=1 j=1 k=1 i=1 j=1
a X
X n a X
X b X
n
+n (Ȳij. − Ȳi.. − Ȳ.j. + Ȳ... )2 + (Yijk − Ȳij. )2
i=1 j=1 i=1 j=1 k=1
o respectivamente,
SCT = SCA + SCB + SCAB + SCE
Se puede deducir luego, bajo las asunciones del modelo, las siguientes regiones crı́ticas:
OBSERVACIONES 1.- Para efectos de cálculo pueden utilizarse las siguientes fórmulas de sumas de
cuadrados:
a X
X b X
n a j
Y2 1 X 2 Y...2 1 X 2 Y2
SCT = (N − 1)SY2 = 2
Yijk − ... , SCA = Yi.. − , SCB = Y.j. − ... ,
N bn N an N
i=1 j=1 k=1 i=1 j=1
ESTADISTICA APLICADA Luis Valdivieso 163
a b
1 XX 2 Y2
SCAB = ( Yij. − ... ) − SCA − SCB y SCE = SCT − SCA − SCB − SCAB.
n N
i=1 j=1
2.- Una técnica descriptiva para detectar la presencia de interacción consiste en hacer una gráfica
para las medias muestrales (o totales) de Y con los tratamientos de un factor, bajo los distintos
tratamientos del otro factor (vease el ejemplo anterior). Si las lı́neas divergen del paralelismo se
puede pensar en interacción. Se dice pensar, pues la decisión definitiva sobre si esa interacción es
significativa o no nos las dará la prueba de hipótesis (III).
3.- Se pueden también realizar aqui pruebas de Duncan. En este caso se podrı́a, de existir por decir
interacción, fijar un tratamiento de un factor a fin de comparar las medias poblacionales de Y bajo
todos los tratamientos del otro factor. En el caso de no interacción uno puede aplicar Duncan a cada
factor por separado. Vale aclarar que en estas pruebas debe utilizarse:
r
M CE
SȲi. = ,
m
siendo M CE la media cuadrática de la tabla ANOVA a dos vias y m el tamaño de muestra con el
cual se calcula cada media muestral en comparación.
4.- Hemos asumido hasta el momento que nuestro modelo es de efectos fijos en los dos factores. Sin
embargo, uno podrı́a tener modelos de efectos aleatorios o mixtos. En cada caso el análisis anterior
es el mismo; pero cambian las hipótesis y conclusiones. Estas se plantean ahora como:
M CA
FA = > F1−α (a − 1, (a − 1)(b − 1)).
M CAB
M CB
FB = > F1−α (b − 1, (a − 1)(b − 1)).
M CAB
La prueba de interacción es la misma.
M CA
FA = > F1−α (a − 1, (a − 1)(b − 1)).
M CAB
Se rechazará H0 : σβ2 = 0 en (II) a nivel α si:
M CB
FB = > F1−α (b − 1, ab(n − 1)).
M CE
La prueba de interacción es la misma.
164
Ejemplo 6.6 El voltaje máximo de salida de un tipo particular de baterı́a se piensa que esta influen-
ciado por el material usado en las placas y la temperatura del lugar de instalación. Para estudiarse
esto se han tomado al azar 36 observaciones del voltaje máximo de salida, 4 por tipo de material y
temperatura obteniéndose:
TEMPERATURA oF
50 65 80
1 130, 155, 74, 180 34, 40, 80, 75 20, 70, 82, 58
Tipo de Material 2 150, 188, 159, 126 136, 122, 106, 115 25, 70, 58 45
3 138, 110, 168, 160 174, 120, 150, 139 96, 104, 82, 60
Solución: Sea Y = Voltaje máximo de salida. Asumiremos a falta de aclaración que Y tiene distri-
bución normal. Se disponen de 2 factores A = Material en la placa con 3 niveles o tratamientos y
B = Temperatura del lugar de instalación con también 3 niveles o tratamientos. Sean: τi = Efecto
de usar el material i en Y , βj = Efecto de la temperatura j en Y y (τ β)ij = Efecto de la interacción
entre A y B.
Lo primero que nos será útil es hallar los estadı́sticos de la tabla de datos.
TEMPERATURA (oF)
50 65 80 Totales
1 Y11. = 539 Y12. = 229 Y13. = 230 Y1.. = 998
Material 2 Y21. = 623 Y22. = 479 Y23. = 198 Y2.. = 1,300
3 Y31. = 576 Y32. = 583 Y33. = 342 Y3.. =1,501
Totales Y.1. = 1,738 Y.2. = 1,291 Y.3. = 770 Y... = 3,799
Antes de realizar las pruebas del caso, veamos si existe aparente evidencia de interacción entre los
factores dados. Para ello realizemos un gráfico de lı́neas sobre los totales de voltaje por temperaturas
para cada tipo de material en las placas.
ESTADISTICA APLICADA Luis Valdivieso 165
Dado de que la desviación del paralelismo en esta gráfica es algo considerable se puede sospechar
la presencia de interacción. Realicemos ahora el contraste de interacción
Para ello construyamos nuestra tabla ANOVA comenzando por calcular las sumas de cuadrados:
1 3, 7992
SCA = (9982 + 1, 3002 + 1, 5012 ) − = 10, 683.72 ,
12 36
1 3, 7992
SCB = (1, 7382 + 1, 2912 + 7702 ) − = 39, 118.72
12 36
y
1 3, 7992
SCAB = (5392 + 2292 + ... + 3422 ) − − 10, 683.72 − 39, 118.72 = 9, 613.77.
4 36
Entonces la tabla ANOVA resulta:
Dado que
FAB = 3.56 > F0.95 (4, 27) = 2.73 ,
rechazaremos H0 a un nivel de significación de α = 0.05. Esto quiere decir, tal como lo sospechamos,
que si existe interacción significativa entre los dos factores. En tal sentido, no tiene ya sentido realizar
los contrastes sobre los efectos principales de A y B, pues no existe uniformidad en los efectos de los
tratamientos. 2
6.4. El diseño 2K
Este es un diseño que involucra a K factores y en el cual cada factor posee 2 niveles o tratamientos.
Los diseños 2K son particulamente útiles en las primeras fases de un trabajo experimental, cuando
es probable que existan muchos factores por investigar. A lo largo de este trabajo asumiremos que
los factores son fijos, los diseños completamente aleatorizados y que se satisface la suposición usual
de normalidad y de homocedasticidad.
El modelo estadı́stico del diseño 2K incluye a K efectos principales, K2 interacciones de 2 factores,
K
3 interacciones de 3 factores y asi sucesivamente hasta una interacción de los K factores; es decir, el
166
modelo incluye un total de 2K−1 efectos. Si bien podemos tratar al diseño 2K como un diseño factorial
genérico, este tratamiento resulta poco práctico y lo mejor será intimar con algunas simplificaciones en
el cálculo de las estimaciones de los efectos y de sus sumas de cuadrados. Para guiarnos, consideremos
el diseño más simple de la familia, el diseño 22 .
Supongamos que disponemos de n replicas por cada par de tratamientos (a los cuales denotaremos
con los signos - y +). Denotemos por (1), a, b y ab a los siguientes totales por celda:
Factor B
- + Total
- Y111 . . . Y11n Y121 . . . Y12n Y1.. = (1) + b
Factor A Y11. = (1) Y12. = b
+ Y211 . . . Y21n Y221 . . . Y22n Y2.. = a + ab
Y21. = a Y22. = ab
Total Y,1. = (1) + a Y,2. = b + ab Y...
ab + a − b − (1)
A = Ȳ2.. − Ȳ1.. =
2n
ab + b − a − (1)
B = Ȳ,2. − Ȳ,1. =
2n
ab + (1) − a − b
AB = (Ȳ22. − Ȳ12. ) − (Ȳ21. − Ȳ11. ) = (Ȳ22. − Ȳ21. ) − (Ȳ12. − Ȳ11. ) = ,
2n
Note que los numeradores de estos efectos:
no son otra cosa que un conjunto de contrastes ortogonales sobre los totales. En vista de ello, sus
sumas de cuadrados vienen dados respectivamente por:
2
CA 2
CB 2
CAB
SCA = , SCB = y SCAB = ,
4n 4n 4n
donde hemos utilizado las mismas notaciones que en un análisis de varianza a dos vias, pues es-
tas sumas coinciden, como no es difı́cil probar, con las sumas de cuadrados de la descomposición
fundamental del ANOVA a dos vias.
Antes de apreciar un ejemplo concreto, es importante apuntar el hecho de que cualquiera de los
contrastes dados previamente podrı́an haber sido también obtenidos con la fórmula:
donde el signo (-) aparecerá si es que si incluye al factor en ese contraste y el signo (+) en caso
contrario. Obviamente “1” será reemplazado por (1) en el cálculo final.
ESTADISTICA APLICADA Luis Valdivieso 167
Ejemplo 6.7 Se llevó a cabo un experimento para comparar las resistencias de dos marcas de papeles
faciales M1 y M2 en condiciones tanto secas como húmedas. Se probaron 4 papeles faciales por marca
y condición en un orden completamente aleatorizado. La medición de resistencia se hizo como sigue:
se tensó un papel sobre la boca de una taza de plástico y se la sujetó con una liga. A continuación se
dejó caer una canica sobre el papel tenso. La altura mı́nima, en pulgadas, desde la que se dejo caer
para atravesar el papel es la medición de resistencia. Los datos se muestran en la tabla siguiente:
Condición
En este experimento tenemos como variable dependiente a la resistencia Y y como factores fijos a
A = marca del papel y B = condición del papel. La tabla de datos con sus totales marginales y por
celda viene dada por
Condición
Dado que FAB = 10.78958 > F0.95 (1, 12) = 4.75, se podrá afirmar, con una probabilidad de
equivocarnos del 5 %, de que si existe una interacción significativa entre los dos factores A y B
considerados. 2
En este desarrollo se usa álgebra ordinaria, y se reemplaza 1 por (1) en la expresión final. Además,
en cada conjunto de paréntesis debe usarse el signo negativo si se incluye el factor en este efecto y
el signo positivo en caso contrario. Por ejemplo, en un diseño 24 , el contraste para el efecto de ACD
(que corresponde a una interacción de tercer orden) viene dado por:
Una vez determinados los contrastes para todos los efectos, estos pueden estimarse por:
CAB...K
AB . . . K = .
n2K−1
2
CAB...K
Además, las sumas de cuadrados para todos los factores vienen dados por SCAB . . . K = n2K
,en
donde n corresponde al número de réplicas.
Seguidamente mostramos la tabla ANOVA de un diseño 2K :
ESTADISTICA APLICADA Luis Valdivieso 169
Aquı́, la suma de cuadrados totales se halla con la fórmula usual SCT = (n2K − 1)SY2 y la suma
de cuadrados del error por diferencia. Además, siempre que tenga sentido, los indicadores F se
comparan con los valores de la tabla F de Fisher con los grados de libertad correspondientes a las
medias cuadráticas de las cuales F es su cociente.
Debido a las limitaciones naturales de dinero, tiempo, equipos y otros, el número de réplicas que
pueden efectuarse puede ser restringido. Es frecuente que en muchos experimentos sólo se pueda
efectuar una réplica de Y por cada combinación de los K tratamientos a menos, claro esta, que se
deseen omitir algunos factores originales. Con una sola réplica no es posible calcular una estimación
del error. Una aproximación al análisis de un factorial no replicado consiste en suponer que ciertas
interacciones de orden superior son despreciables y que por tanto sus cuadrados medios pueden
combinarse para la estimación del error. Esta es una aplicación al principio de dispersividad de
efectos; esto es, la mayorı́a de los sistemas son dominados en general por algunos de los efectos
principales e interaciones de bajo orden y la mayorı́a de las interacciones de orden superior son
despreciables.
Aún con un diseño no replicado, la cantidad de datos a tomarse en un diseño 2K pueden ser todavı́a
no manejable. En estos casos se han creado una serie de técnicas avanzadas de fraccionamiento y
170
bloqueo con las cuales un investigador puede analizar efectos principales e interacciones de bajo
orden a costo de sacrificar, o más técnicamente confundir, interacciones de ordenes superiores. Estas
técnicas, que constituyen la base de los métodos modernaos de control de calidad fuera de lı́nea,
pueden consultarse en [4] ó [5].
6.5. Ejercicios
1.- Un campus universitario tiene cuatro facultades. Se quiere estudiar la variable tiempo en minutos
que tarda un alumno en hacer una consulta en la base de datos de la biblioteca de su facultad. Para
ello se ha tomado una muestra aleatoria cuyos resultados son los de la tabla adjunta.
Arquitectura 48, 31, 31, 36, 39, 37, 29, 24, 38, 41
Facultad Ingenierı́a 24,16, 22, 10, 25, 11, 18, 6, 24, 30, 24, 15
Derecho 37, 40, 51, 49, 36, 24, 35, 26, 43, 40, 35, 33, 39, 55, 40
Humanidades 19, 26, 31, 13, 12, 16, 30, 13, 21, 26, 24, 12, 21
a) Realice un diagrama de cajas para comparar los tiempos de consulta por facultad ¿qué le dice
este gráfico?
b) Analice inferencialmente la influencia del factor facultad en la variable de interés. Fije usted para
este caso su nivel de significación.
2.- La estructura financiera de una firma se refiere a la forma en que se dividen los activos de la
empresa por debe y haber, y el apalancamiento financiero al porcentaje de activos financiados por
deuda. En un estudio se afirma que el apalancamiento financiero puede utilizarse para aumentar las
tasas de rendimiento sobre la inversión; es decir que, los accionistas puedan recibir rendimientos más
altos con la misma inversión gracias a su uso. Los siguientes datos muestran las tasas de rendimientos
utilizando tres diferentes niveles de apalancamiento financiero y un nivel de control (deuda cero) de
20 empresas seleccionadas al azar. A un nivel de significación de α = 0.05:
a) ¿ Existen diferencias en las tasas medias de rendimiento bajo los 4 niveles de apalancamiento ?
b) ¿ Se puede decir que las tasas medias de rendimiento en los niveles bajo medio y alto son más
altas que las del nivel de control ? Use, de ser factible, la prueba de rangos de Duncan.
3.- Se realizó un estudio de tránsito sobre los retrasos en las intersecciones con semáforos en las calles
de una ciudad. Se usaron 3 tipos de semáforos: 1) programado, 2) semiactivado y 3) activado. Se
usaron 5 intersecciones para cada tipo de semáforo. La medida de retraso fué el promedio de tiempo
que cada vehı́culo permanece detenido en cada intersección (segundos/vehı́culo). Los datos son:
ESTADISTICA APLICADA Luis Valdivieso 171
a) Defina claramente la variable dependiente y los parámetros de un modelo lineal para este problema.
Estime e interprete el efecto de utilizarse un semáforo activado en el valor medio de la variable
dependiente.
b) A un nivel de significación de α = 0.05, ¿ podrı́a decirse de que si existen diferencias entre las
medias de retraso para los tipos de semáforo ?
c) Mediante el método de Bonferroni, ¿ podrı́a decirse con un nivel de confianza de al menos 95 %
que existe algún tipo de semáforo que ocasione una media de retraso menor al resto ?
d) Aplique, de ser factible, la prueba de rangos de Duncan a un nivel de significación de α = 0.05. ¿
Difieren estos resultados de los obtenidos en c) ? Comente sus resultados.
4.- Si se desean comparar las medias de dos poblaciones normales independientes, ¿ será el análisis
de varianza en este contexto, equivalente a la prueba de comparación de medias vista anteriormente?
Analice esto empı́ricamente aplicándolo al problema 3 con sólo los tipos de semáforo Programado y
Semiactivado. ¿ Es esto en general cierto ?
5.- Con la esperanza de atraer más usuarios, una compañı́a de transportes urbano planea ofrecer
servicios de autobuses a partir de una terminal suburbana hacia el centro de la ciudad. Estos auto-
buses deben reducir el tiempo de traslado. La municipalidad decide realizar un estudio del efecto de
4 diferentes proyectos ( tales como un carril especial para los autobuses y una señalización secuencial
del tráfico) sobre el tiempo de traslado de los autobuses. Se miden los tiempos (en minutos) durante
varios dı́as de la semana durante un viaje, a la hora de mayor afluencia en la mañana, cuando cada
proyecto esta en operación. Los resultados se muestran en la tabla siguiente:
1 27 25 29 26
Proyecto 2 25 28 30 27 24
3 34 29 32 31 36
4 30 33 31
a) Existe evidencia de una diferencia en los tiempos medios de traslado para los 4 proyectos ?
b) ¿ En cuanto estima Ud. el efecto del tercer proyecto en el tiempo de traslado ?
c) Realice la prueba de rangos de Duncan a nivel α = 0.05, para decidir cuál seria a su consideración
el o los mejores proyectos. Haga lo mismo utilizando la desigualdad de Bonferroni.
6.- Una compañı́a textil utiliza 3 telares. Se desea que los telares sean homogéneos con el objeto
de producir telas de resistencia uniforme. El ingeniero de procesos piensa que, puede existir una
variación significativa de la resistencia entre los distintos telares. Para ello realiza un experimento y
obtiene los siguientes datos:
172
Observaciones
1 98 97 99 96
Telar 2 91 90 93 92
3 96 95 97 95
7.- ¿ Cómo afecta el tiempo flexible a la satisfacción de un trabajador por su empleo ?. En un estudio
para este fin se seleccionaron al azar un grupo de trabajadores a 3 tipos de horario de trabajo. Estos
fueron evaluados 4 meses, al término de los cuales se obtuvieron los datos de satisfacción:
Grupo
Tiempo Flexible Entrada Alternada Entrada Fija
Tamaño de la muestra 27 59 24
Media muestral 35.22 31.05 28.71
Desviación estándar muestral 10.22 7.22 9.28
8.- Un ingeniero en electrónica está interesado en el efecto sobre la conductividad de una válvula
electrónica que tienen cinco tipos diferentes de recubrimiento para los tubos de rayos catódicos
utilizados en un dispositivo de visualización de un sistema de telecomunicaciones. Se obtienen los
datos siguientes sobre la conductividad:
Conductividad
c) Utilice la prueba de rangos múltiples de Duncan para analizar las 5 medias de los tipos de
recubrimiento. Utilice α = 0.01.
d) Considere el experimento descrito y suponga que antes de realizarlo, se le pide averiguar si se
produce mejores resultados en la conductividad media al utilizar una combinación en partes iguales
de los recubrimientos tipo 1 y 2 versus los tipos 3, 4 y 5. Si se utiliza α = 0.01, ¿ qué conclusiones
pueden obtenerse ?
e) Si los 5 tipos de recubrimientos se hubieran elegido al azar entre una gran variedad, ¿ cuál hubiera
sido su conclusión ?
9.- En un estudio de Marketing se desea comparar la calidad del servicio de los 4 supermercados A, B,
C y D de una ciudad. Los supermercados A y C pertenecen a un grupo de inversiones I; mientras que
los supermercados B y D a otro gran grupo de inversionistas II. Con este fin se seleccionaron al azar
a 20 sujetos y se les pidió su opinión sobre uno de los 4 supermercados en un orden completamente
aleatorio. Los resultados en una escala de opinión de 0 a 100 se muestran en la tabla siguiente:
A 40 45 50 58 42
Supermercado B 59 70 61 63 69
C 60 52 49 56 55
D 54 52 66 60 68
10.- Juan y Pepe estan en discusión acerca de la metodologı́a a emplearse en comparar el volumen de
ventas promedio diarias (en dólares) de 4 sucursales de una cadena de comida rápida. Ambos tienen
tiempo solo los martes y fines de semana para registrar estos volumenes. Juan ha decidido escoger
una sucursal en cada dia durante todo un mes, encontrándo las siguientes volumenes de ventas para
cada sucursal: En la sucursal 1 para los 5 martes del mes: 200, 310, 275, 228, 290; en la sucursal 2
para los 4 Viernes del mes: 460, 490, 420, 508; en la sucursal 3 para los 4 Sábados del mes: 500, 510,
475, 600; y en la sucursal 4 para los 5 Domingos del mes: 350, 340, 425, 328, 495.
De otro lado, Pepe utilizó un diseño de bloques encontrando los siguientes volúmenes:
174
DIA
Martes Viernes Sabado Domingo
300 2 400 1 500 3 340 4
280 3 410 4 520 1 320 2
320 1 415 2 580 4 360 3
300 4 408 3 560 2 350 1
11.- Se les pidió a 4 agentes inmobiliarios que dieran cada uno la valoración de 6 casas situadas
en un vecindario y los datos se recopilaron usando un diseño de bloques. Las apreciaciones fueron
realizadas en miles de dólares, obteniéndose los resultados de la siguiente tabla:
a) Contrastar la hipóótesis nula de que la valoración media para los 4 agentes es la misma. Utilice
α = 0.01.
b) Si, en base a la muestra, las estimaciones de las valoraciones medias de los agentes 2 y 4 son
respectivamente 90.1667 y 81.3333, ¿ se puede concluir que las valoraciones medias de los agentes 2
y 4 son iguales ? Utilice α = 0.05.
c) Un investigador que no sabı́a cómo se recolectaron los datos consideró al modelo como de una vı́a,
12.- Se realizó, a un nivel de α = 0.05, un estudio de movimientos para determinar el mejor de tres
métodos de montar un mecanismo. Para esto se diseño un experimento de un factor por bloques
aleatorios seleccionando 5 operarios con supuestamente la misma velocidad. El número de montajes
terminados diarios por cada operario y con cada método se dan en la tabla siguiente:
Operarios
1 2 3 4 5
1 3 4 3 5 4
Método 2 9 8 7 9 6
3 5 6 8 7 9
ESTADISTICA APLICADA Luis Valdivieso 175
a) ¿ Se puede concluir que los tres métodos de montaje son significativamente diferentes ?
b) ¿ Fue correcto asumir que los operarios tenı́an en promedio la misma velocidad ?
c) Realice, de ser factible, una prueba de rangos de Duncan e indique explı́citamente las conclusiones
que sacarı́a en esta prueba. Haga lo mismo utilizando la desigualdad de Bonferroni.
d) ¿ Porque cree usted que la aleatorización del método de montaje a cada operario es importante
en esta experimentación ?
Investigador
Mezcla 1 2 3 4 5
1 2340 2355 2362 2350 2348
2 2658 2650 2665 2640 2653
3 2449 2458 2432 2437 2445
4 2403 2410 2418 2397 2405
14.- Se hace una evaluación de la adhesión por difusión de componentes de zircaloy. El principal
objeto es determinar cuál de los tres elementos, nı́quel, hierro o cobre, es el mejor adhesivo. Para ello
se reportó en el informe del experimento que se pegaron varias componentes de zircaloy con cada
uno de los adhesivos y que como existı́a mucha variación en los componentes maquinados de zircaloy
que procedı́an de lingotes diferentes, se usó un diseño de bloques completamente aleatorizados para
agrupar los lingotes en bloques. El informe reporta también la siguiente información de la presión
necesaria en miles de libras por pulgada cuadrada que se necesita para separar las partes:
Lingote
1 2 3 4 5 6 7
Nı́quel 67.0 67.5 76.0 72.7 73.1 65.8 75.6
Adhesivo Hierro 71.9 68.8 82.6 78.1 74.2 70.8 84.9
Cobre 72.2 66.4 74.5 67.3 73.2 68.7 69.0
176
a) Indique de manera explı́cita cómo cree usted que debió de diseñarse la recolección de estos datos
para este estudio comparativo.
b) ¿ Existe evidencia de una diferencia en la presión necesaria para separar las partes con respecto
a los tres agentes adhesivos ? Use α = 0.05.
c) Aplique, de tener sentido, el método de Bonferroni, e interprete las conclusiones que obtenga. Use
α = 0.05.
15.- Una compañı́a de servicios informáticos dispone de tres bases de datos a las que pueden acceder
sus clientes. La compañı́a dispone de cuatro operadores los cuales se encargan de una sola base cada
dı́a. Se desea hacer un estudio para determinar si la base de datos es un factor que explica el tiempo
que demoran los clientes en acceder y verificando al mismo tiempo si se puede considerar al operador
como una causa adicional de variación en el tiempo de acceso. Para este fin se dispone de la siguiente
información correspondiente a los tiempos promedios de acceso de pedidos registrados bajo un diseño
de bloques completamente aleatorizado :
a) Describa la ecuación del modelo subyacente y las hipótesis estadı́sticas que se deben contrastar.
Luego, utilizando un nivel de significación del 5 % y determine cuáles son las conclusiones.
b) Usando un nivel de significación global del 5 % ordenar las bases de datos de acuerdo a su
correspondiente tiempo promedio de acceso. Utilce para ello la prueba de rangos de Duncan y la
desigualdad de Bonferroni indicando, si existiera, la diferencias en los resultados que proveen los dos
métodos.
16.- Una agencia estatal para el medio ambiente prueba dos métodos diferentes para quemar carbón
bituminoso para generar electricidad, en conexión con 4 purificadores diferentes que han sido di-
señados para reducir la contaminación del aire. El interés primordial es la emisión de partı́culas. Se
llevan a cabo cuatro ensayos con cada purificador combinándolos con cada método de combustión.
La emisión de partı́culas se mide en cada ensayo. De los datos resultantes se obtuvieron los resultados
descriptivos siguientes:
ESTADISTICA APLICADA Luis Valdivieso 177
Temperatura
100 125 150
580 1,090 1,392
1 568 1,087 1,380
570 1,085 1,386
550 1,070 1,328
Tipo de vidrio 2 530 1,035 1,312
579 1,000 1,299
546 1,045 867
3 575 1,053 904
599 1,066 889
178
a) ¿ Existe alguna interacción entre los factores ? ¿ Qué es lo que podrı́a decir del efecto de la
temperatura y el tipo de vidrio en la luminosidad ? Utilice α = 0.05.
b) ¿ A qué temperatura deberá operar este proceso para obtener tubos con una mayor luminosidad
? Utilice α = 0.05.
1 2 3
C D B
9.9 13.4 12.7
A B D
10.1 12.9 12.9
B A C
11.4 12.2 11.4
D C A
12.1 12.3 11.9
a) ¿ Proporcionan los datos anteriores suficiente evidencia para indicar una diferencia en la pene-
tración media de la humedad para telas tratadas con los cuatro productos quı́micos ? Use α =
0.05.
b) Un investigador opina que fué innecesario el uso de un diseño de bloques aleatorizado y que
simplemente se pudiesen haber comparado el efecto de los productos quı́micos sobre la resistencia
con un análisis de varianza a una via. ¿ Estarı́a usted de acuerdo con este investigador ? Use un nivel
de significación de α = 0.05.
19.- Un factor importante para determinar qué lugar es más adecuado para un negocio de ventas al
menudeo es la intensidad de tránsito qué pasa por el lugar cada dı́a hábil. Se colocaron contadores en
4 lugares distintos los 5 dı́as de la semana , y se anotó el número de vehı́culos que pasaron por cada
lugar. Los datos, que se obtuvieron a través de un diseño de bloques completamente aleatorizado,
son los siguientes:
Dı́a
ESTADISTICA APLICADA Luis Valdivieso 179
a) De alguna razón por la cual cree usted que se halla tenido que utilizar un diseño de bloques
completamente aleatorizado.
b) ¿ Se podrı́a concluir con una probabilidad de equivocarse del 5 % que existen diferencias en el
número medio de vehı́culos por dı́a en los cuatro lugares ?
c) A un nivel de significación de α = 0.05, podrı́a usted asegurar algún lugar especı́fico adecuado
para un negocio de venta ¿ Porqué ? Use la prueba de rangos de Duncan.
20.- Se desea verificar si las pérdidas, en porcentaje, ocasionados en la operación de baño electrolı́tico
de joyas de oro dependen del tipo de oro usado (en kilates) y de la cantidad empleada en el trata-
miento. Para el experimento se utilizó oro de 24, 22, 18 y 14 kilates, siendo éstos números medidas
nominales. Por lo tanto los niveles de este factor son cualitativos. Además, se escogieron tres niveles
de cantidad tratada: 50, 100 y 150 gramos. Otros factores como el tiempo del baño, solución elec-
trolı́tica, balanza, equipo y operador se mantuvieron constantes durante el experimento. La tabla
siguiente muestra los datos sobre los porcentajes de pérdida.
Con α = 0.05 y suponiéndo que se tenia solo interés en las tres cantidades usadas.
a) ¿ Existe interacción significativa entre los factores considerados en el experimento ? Haga un
gráfico para apreciar esto.
b) ¿ Qué podrı́a decir de la influencia del tipo de Oro y la cantidad usada en los porcentajes medios
de pérdidas ?
c) Si tuviera que estimar el efecto en la pérdida de utilizar oro de 22 dilates, ¿ en cuanto estimarı́a
este efecto? ¿ cuál serı́a su interpretación?
d) Suponiendo se decida utilizar una cantidad de 50 gramos en los baños electrolı́ticos, haga una
prueba de rangos de Duncan para determinar que tipo ( o tipos) de Oro es el que produce las mayores
pérdidas medias.
e) Si las tres cantidades hubiesen sido escogidas al azar, ¿ qué es lo que responderı́a en b) ?
180
21.- Un constructor de casas con fines especulativos, utiliza 3 diseños posibles y asigna cada casa a la
supervisión de uno de 4 ingenieros. Al observar una variación de la utilidad por casa, el constructor
decide investigar el efecto de los factores ”diseño de casa” y ”supervisor” en la utilidad por casa.
El constructor utilizó cada ingeniero como supervisor de cada diseño y realizó 3 casas por cada
combinación ingeniero-diseño. Los datos (en utilidades en miles de dólares por casa) fueron:
Supervisor
Diseño A1 A2 A3 A4
12.8 9.2 11.6 8.7
B1 9.4 7.8 12.9 7.4
10.3 10.9 9.6 8.5
9.2 11.4 8.7 10.3
B2 7.4 9.6 7.5 10.9
8.6 8.3 9.0 11.7
13.7 10.7 10.1 7.3
B3 12.0 10.2 8.7 8.6
14.6 11.1 9.1 6.9
22.- Se efectúa un experimento para investigar el alabeo de placas de cobre. Los dos factores estudia-
dos son la temperatura y el contenido de cobre de las placas. La variable de respuesta es la magnitud
del alabeo. Los datos son los siguientes:
Contenido de cobre
40 60 80 100
50 17, 20 16, 21 24, 22 28, 27
Temperatura 75 12, 9 18, 13 17, 12 27, 31
(oC) 100 16, 12 18, 21 25, 23 30, 23
125 21, 17 23, 21 23, 22 29, 31
a) ¿ Qué es lo que usted podrı́a decir del efecto de estos factores sobre la magnitud del alabeo? ¿
Existe alguna interacción entre los factores? Utilice α = 0.05.
b) Si lo deseable es que el alabeo sea bajo, ¿ qué contenido de cobre es necesario especificar en
ambientes donde el cobre está a temperaturas de 75 y 125 grados centı́grados ? Realice la prueba de
rangos de Duncan a un nivel de α = 0.05, para justificar su respuesta.
ESTADISTICA APLICADA Luis Valdivieso 181
23.- Con el fin de estudiar los efectos que en el tiempo de sobrevivencia (en horas) de animales de
laboratorio tienen 3 drogas A1, A2 y A3 y 4 tratamientos B1, B2, B3 y B4, un laboratorio realizó un
experimento que consistió en seleccionar 48 animales con las mismas caracterı́sticas a los cuales se
les inoculó un agente patógeno. Luego, se dividieron los animales en grupos de 4 y a cada animal de
un mismo grupo se le administró una de las tres drogas y uno de los 4 tratamientos, registrándose
finalmente los siguientes tiempos de sobrevivencia:
Tratamiento
B1 B2 B3 B4
3.1 8.2 4.3 4.5
A1 4.5 11.0 4.5 7.1
4.6 8.8 6.3 6.6
4.3 7.2 7.6 6.2
3.6 9.2 4.4 5.6
Droga A2 2.9 6.1 3.5 10.2
4.0 4.9 3.1 7.1
2.3 12.4 4.0 3.8
2.2 3.0 2.3 3.0
A3 2.1 3.7 2.5 3.6
1.8 3.8 2.4 3.1
2.3 2.9 2.2 3.3
Al realizar un análisis exploratorio de estos datos se encontró que no era posible asumir una varianza
constante en Y para los distintos tratamientos, por lo cual al consultársele a un estadı́stico, él sugi-
1
rió tomar como variable dependiente en este experimento a Y , donde Y es el tiempo de sobrevivencia.
Algunos cálculos con la variable transformada son los siguientes:
24.- Con el fin de precisar las condiciones óptimas de un baño de niquel, son estudiados los efectos
de la concentración de sulfona y la temperatura en el poder de reflexión de un metal niquelado. Los
datos obtenidos de poder de reflexión en este experimento factorial fueron:
Temperatura ( grados F)
Asumiendo que los factores en estudio son fijos y usando un nivel de significación de α = 0.01
a) ¿ Puede concluirse que no existe uniformidad en los efectos de los tratamientos de los dos factores
en estudio sobre el poder de reflexión ?
b) Use la prueba de Duncan y determine para cada concentración la condición de temperatura
óptima.
25.- Un Ingeniero Industrial que trabaja en una embotelladora está interesado en el efecto de dos
tipos de botellas de 32 onzas sobre el tiempo de reparto de cajas de 12 botellas de este producto. Los
dos tipos de botellas son de plástico y de vidrio. Con el fin de analizar esto, él utiliza dos repartidores
para que realicen la tarea que consiste en mover 40 cajas del producto a una distancia de 50 pies
sobre un carrito repartidor, y acomodarlos. Se realizaron 4 réplicas de un diseño factorial 22 ; y los
tiempos que se observaron fueron los que a continuación se detallan:
Operario
1 2
Tipo de Vidrio 5.12, 4.89, 4.98, 5.00 6.65, 6.24, 5.49, 5.55
botella Plástico 4.95, 4.27, 4.43, 4.25 5.28, 4.75, 4.71, 4.91
26.- Se realizó un diseño 24 replicado tres veces para estudiar cómo influyen cuatro factores en la
velocidad de rebobinado de una cinta de cassette. Estos factores son: A = calidad de la cinta; B =
alimentación (red (+), pilas(-)); C = posición del equipo (vertical (+), horizontal (-)) y D = tipo de
equipo (con radio(+), sin radio (-)). Los resultados fueron los siguientes:
Velocidad
A B C D
+ + + + 8.7, 4.9, 8.9
+ + + - 8.3, 8.6, 8.3
+ + - + 12.9, 12.6, 13.5
+ + - - 12.8, 12.4 , 13.5
+ - + + 10.8 , 10.8 , 10.5
+ - + - 10.8, 10.3 , 10.1
+ - - + 14.3, 14.4 , 14.8
+ - - - 12.8, 13.7, 13.1
- + + + 10.7, 11.2, 10.5
- + + - 9, 8.6 , 8.5
- + - + 12.7 , 14 , 13.5
- + - - 14.3 , 15.3, 15.4
- - + + 10.6 , 11 , 10.5
- - + - 10.6, 11, 10.8
- - - + 15.2, 14.2 , 15
- - - - 15.1, 15.7, 16
ANÁLISIS DE REGRESIÓN
Consideremos una v.a. continua Y , que la llamaremos dependiente, y una variable X que la lla-
maremos independiente o predictora. El modelo de regresión lineal simple plantea que Y se relaciona
con X según:
Y = β0 + β1 X + , (7.1)
donde es un error aleatorio que usualmente se asume tiene distribución normal con media 0 y
varianza σ 2 .
Antes de analizar (5.1), es importante distinguir la naturaleza del modelo. El modelo se denomina
de efectos fijos cuando X es una variable no aleatoria y controlada por el investigador. En este caso
el investigador seleccionará valores prefijados x1 , x2 , . . . , xn de X y observará los correspondientes
valores que toma Y ; por decir, y1 , y2 . . . , yn . De otro lado el modelo se denomina de efectos aleatorios,
cuando tanto X como Y son variables aleatorias. En este caso el investigador tomará al azar n
“sujetos” y observará conjuntamente los correspondientes valores que X e Y toman en estos “sujetos”;
por decir: (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ).
De (5.1) obtenemos que:
yx = E[Y | X = x] = β0 + β1 x
El análisis de regresión lineal simple busca una estimación ŷx de yx ; vale decir, una estimación del
valor medio de Y para un x dado. Notese que para esto requerimos tan solo estimar los parámetros
β0 y β1 .
Supongamos que ahora al graficar los pares de datos (x1 , Y1 ), (x2 , Y2 ), . . . , (xn , Yn ) obtenidos por
el investigador 1 , obtenemos la nube de puntos o gráfico de dispersión siguiente:
1
Asumiremos en adelante, para simplicidad, un modelo de efectos fijos.
185
186
Claramente este gráfico da pie a pensar que (5.1) es un modelo válido para estos datos, pues los
puntos se encuentran más o menos alineados y cada Yi puede escribirse como:
Yi = β0 + β1 xi + i , ∀i = 1, 2, . . . , n ,
donde es natural asumir que los errores son independientes. El método de mı́nimos cuadrados consiste
en obtener las estimaciones de β0 y β1 que minimizen las sumas de los cuadrados de todos los errores.
En otras palabras, los estimadores de mı́nimos cuadrados β̂0 y β̂1 vienen dados por la solución al
problema:
n
X n
X
mı́n 2i ≡ mı́n (Yi − β0 − β1 xi )2 .
β0 ,β1 β0 ,β1
i=1 i=1
Esto nos provee de la estimación ŷx buscada, la cual se llama también la recta de mı́nimos cuadrados:
De las asunciones de normalidad e independencia de los errores, se desprenden las siguientes propie-
dades básicas:
2
Proposición 7.1 1) ŷx ∼ N (yx , σ 2 ( n1 + Pn(x−x̄) 2 )).
(x
i=1 i −x̄)
1 Pn n−1
p
2) Si S2 = n−2 i=1 (Yi − β̂0 − β̂1 xi )2 = 2
n−2 (SY − β̂12 Sx2 ), a S = S2 , se le denomina el
error estándar de estimación. Este error es una v.a. independiente de ŷx y se cumple que
(n−2)S2
W = σ2
∼ χ2 (n − 2).
Con base en esta proposición, uno puede construir la variable pivote T = qZ ∼ t(n − 2),
W
n−2
ŷx −yx
donde Z = r
(x−x̄)2
∼ N (0, 1) a fin de construir el siguiente intervalo de confianza al
1
σ + Pn
n (x −x̄)2
i=1 i
100(1 − α) % para yx ; vale decir, para el valor esperado de Y dado un x dado:
ESTADISTICA APLICADA Luis Valdivieso 187
s s
1 (x − x̄)2 1 (x − x̄)2
[ŷx − t1− α2 (n-2)S + Pn 2
ŷx + t1− α2 (n-2)S + Pn 2
]
n i=1 (xi − x̄) n i=1 (xi − x̄)
En algunas circunstancias, estimar el valor medio de Y para un x dado no es tan útil como
predecir el valor especı́fico que Y tomará para un x dado. En este caso, se puede contruir lo que se
denomina un intervalo de confianza al 100(1 − α) % para la predicción de un valor particular de Y
para un x dado. Esta predicción, que la denotaremos por ŷ(x), puede escribirse simplemente como
ŷ(x) = ŷx + , por lo que su intervalo de predicción resulta ser:
s s
1 (x − x̄)2 1 (x − x̄)2
[ŷx − t1− α2 (n-2)S 1 + + Pn 2
ŷx + t 1− α (n-2)S 1 + + Pn 2
]
n i=1 (xi − x̄) n i=1 (xi − x̄)
2
Si graficamos los extremos de ambos intervalos como funciones de x, obtendremos las denomi-
nadas bandas de confianza. Estas bandas son claramente más anchas en la predicción que en la
estimación del valor medio de Y y ambas son más angostas (y por tanto dan mejores estimaciones
y/o predicciones) si x se encuentra más cerca de x̄. Esto nos provee de la siguiente moraleja: ¡ no
deben de hacerse estimaciones o predicciones de Y fuera del rango de valores de los datos de x !
Ejemplo: Un instituto del mar ha realizado un estudio acerca de la cantidad de peces que una flota
recolecta en función de la temperatura de las aguas. Ellos han obtenido en 9 dias, para temperaturas
medias fijas, los siguientes volumenes de recolección en cientos de toneladas métricas:
A la flota le interesarı́a saber si mañana su volumen de pesca será de por lo menos 52 toneladas
métricas a fin de que le sea rentable salir a la mar.
a) Haga su diagrama de dispersión y ajuste la recta de mı́nimos cuadrados.
b) Si el instituto del mar pronostica para mañana un temperatura media de 2.5 ◦ c, ¿ recomendarı́a
o no, con un nivel de confianza del 95 %, que la flota salga a la mar ? ¿ Porqué ?
Solución: a) El diagrama de dispersión siguiente muestra claramente una tendencia lineal inversa.
188
Esta nos estima el volumen medio de pesca para una temperatura dada x.
b) Si bien ŷ2.5 = 69.53727 TN; es decir, que el volumen medio de pesca para un dia con 2.5 ◦ c de
temperatura supera en la estimación fácilmente las 52 TN, no se puede garantizar que el volumen
de pesca para este dia especı́fico lo supere. En tal sentido para tomar la decisión, debemos hallar su
intervaloqde predicción al 95 %. De los datos obtenidos, tenemos que el error estándar de estimación
8(SY2 −(β1 Sx )2 )
es S = 7 = 5.07104 y por tanto, el intervalo buscado es:
s s
1 (2.5 − 2.889)2 1 (2.5 − 2.889)2
[ŷ2.5 − t0.975 (7)S 1 + + , ŷ 2,5 + t0 .975 (7)S 1 + + ]
9 8(3.480)2 9 8(3.480)2
o
[56.88, 82.18575]
Dado que el intervalo supera el volumen de 52 toneladas mı́nimo requerido, si se recomendarı́a salir
a la mar. ¿ Qué hubiese usted concluido si es que el volumen mı́nimo requerido hubiese sido de 65
TN ?
Y = β0 + β1 X1 + β2 X2 + . . . + βk Xk + ,
donde se asume que el error aleatorio tiene distribución normal de media 0 y varianza σ 2 .
Al igual que antes, el modelo de regresión lineal múltiple puede ser de efectos fijos (si las Xj ’s
no son variables aleatorias y las prefija el investigador) aleatorios (si los Xj ’s son también variables
aleatorias que se observan en una muestra de ”sujetos”junto con Y ) o mixtos, que es una combinación
de los dos anteriores. Para simplificar asumiremos en adelante un modelo de efectos fijos y comenta-
remos, solo cuando existan diferencias, el caso del modelo aleatorio. Para estimar el valor medio de
Y dados los valores ~x = (x1 , . . . , xk ) de las variables independientes, vale decir para estimar:
y~x = E[Y | X1 = x1 , . . . , Xk = xk ] = β0 + β1 x1 + β2 x2 + . . . + βk xk ,
~ =
uno deberá observar el correspondiente valor de Y para n valores dados del vector X
(X1 , X2 , . . . , Xk ) (en un modelo aleatorio tanto los valores del vector como de Y se observan simul-
taneamente al tomarse una muestra aleatoria de ”sujetos”). El modelo en términos de esta muestra
se escribe como:
La solución de este problema nos conduce a resolver el siguiente sistema lineal de k + 1 ecuaciones
con k + 1 incognitas:
(Xt X)B̂ = Xt Y
o explı́citamente
B̂ = (Xt X)−1 Xt Y.
Luego, la estimación buscada del valor medio de Y para un ~x dado, al cual también llamaremos el
hiperplano de regresión, vienen dada por:
donde Ŷi = β̂0 + β̂1 xi1 + . . . + βˆk xik es la estimación del valor medio de Y para el i−ésimo ~x dado.
Notese que de la descomposición última se tiene que:
SCR SCE
1= + .
SCT SCT
SCR
Luego R2 = SCT (∈ [0, 1]) representa la proporción de la variabilidad total de Y que es explicada por
el modelo de regresión lineal múltiple. Mientras R2 → 1, mejor será el ajuste de los datos al modelo.
190
2 (1 − R2 )(n − 1)
RA =1− .
n−k−1
Nota: En el caso de un modelo de regresión lineal simple, es común utilizar como medida del ajuste
el coeficiente de correlación de Pearson entre x e Y :
Pn
xi Yi − nx̄Ȳ Sx
rxY = i=1 = β̂1 .
(n − 1)Sx SY SY
Este coeficiente, que sólo toma valores entre -1 y 1, nos indica un mejor ajuste lineal entre x e Y
mientras rxY se encuentre más cerca a estos extremos. El signo positivo o negativo de rxY indicará,
respectivamente, si la relación es inversa o directa. Puede probarse que en el modelo de regresión
lineal simple: R2 = rxY
2 .
Otro criterio práctico para medir el ajuste del modelo, lo constituye la variabilidad de los resi-
duales ei = Yi − Ŷi . Este se mide, como en el caso del modelo simple, a través del error estándar de
estimación S : v
u n r
u 1 X SCE
S = t e2i = .
n−k−1 n−k−1
i=1
Mientras más pequeño sea S , mejor ajuste tendran los datos al modelo.
Si bien R2 , RA
2 y S son indicadores descriptivos para medir el ajuste de los datos al modelo de
regresión lineal, ellos no nos proveen de una decisión definitiva en cuanto a que si el modelo es idóneo
o no para relacionar de manera lineal Y con las variables independientes del estudio.
H0 : β1 = β2 = . . . = βk = 0 vs H1 : ∃j / βj 6= 0.
Si rechazamos H0 , se concluirá que el modelo podrı́a ser útil para estimar el valor medio de Y , pues
algunas de las k variables independientes contribuyen con información significativa para ello. De
ESTADISTICA APLICADA Luis Valdivieso 191
darse esto, es posible aún continuar con el análisis, entendiéndose que el contraste solo nos dice que
nuestro modelo es aceptable, pero no el mejor.
El contraste de hipótesis se basa en la descomposición (5.2), por lo que no es de extrañar se tenga
la siguiente tabla ANOVA
Estas pruebas tratan de ver si una variable independiente xj contribuye o no con información
significativa en la estimación del valor medio de Y en presencia de las otras variables independientes.
El contraste se resume como sigue:
β̂
donde el estadı́stico T0j = √ j tiene bajo H0 una distribución t de Student con n − k − 1
S cj+1,j+1
grados de libertad y cj+1,j+1 es la entrada j + 1, j + 1 de la matriz (Xt X)−1 .
Si por ejemplo se rechaza H0 : βj = 0 en favor de H1 : βj 6= 0 podremos decir con una probabilidad
de equivocarnos de α que la variable xj si contribuye con información significativa en la estimación
del valor medio de Y .
donde por simplificar hemos colocado que las variables de interés son las últimas del modelo, lo cual
obviamente es un caso particular y la prueba puede hacerse sobre cualquier grupo de k − m variables.
El procedimiento para realizar el contraste es intuitivamente el siguiente. Primero ajustamos
el modelo reducido (sin las variables xm+1 , . . . , xk ) y calculamos la suma de cuadrados del error
SCER . Luego ajustamos el modelo completo (con las k variables independientes) y calculamos la
suma de cuadrados del error SCEC . Después comparamos SCER con SCEC calculando la diferencia
192
SCER −SCEC . Si las variables xm+1 , . . . , xk contribuyen al modelo, SCEC será mucho más pequeño
que SCER y por tanto SCER − SCEC será más grande. Cuanto más grande sea la diferencia, más
contundentes serán las pruebas de que el modelo completo produce mejores estimaciones de E[Y ]
que el modelo reducido y que por tanto H0 es falsa. Formalmente, se rechazará H0 en (5.3) a nivel
α si:
SCER −SCEC
k−m
R.C : F1 = SCEC
> F1−α (k − m, n − k − 1).
n−k−1
Ejemplo: El rendimiento de una reacción quı́mica parece depender de la concentración de un cierto
reactivo y de la temperatura de operación. Para estudiar, esto se registraron, los siguientes rendi-
mientos a concentraciones y temperaturas dadas:
Y = Rendimiento 78 84 89 90 92 90 91 92 97 98
x = Concentración 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50
z = Temperatura 135 150 165 180 190 160 165 188 195 195
X =
... .
1x1 z1 1x2 z2 ......1xn zn e Y = Y1 Y2 ..Yn
Luego, el sistema (Xt X)B = Xt Y nos conduce al siguiente sistema de ecuaciones normales:
P P P
nβ0 + ni=1 xi β1 + ni=1 zi β2 = ni=1 Yi
Pn Pn 2
Pn Pn
i=1 xi β0 + i=1 xi β1 + i=1 xi zi β2 = i=1 xi Yi
Pn Pn Pn 2
P n
i=1 zi β0 + i=1 xi zi β1 + i=1 zi β2 = i=1 zi Yi .
P10 P10 2 P10 P10 2
En nuestro caso: i=1 xi = 7.25, i=1 xi = 5.4625, i=1 zi = 1,723, i=1 zi = 300, 669,
P10 P10 2
i=1 Yi = 901 , i=1 Yi = 81, 483 y el sistema de ecuaciones normales queda:
La solución de este sistema nos provee de las estimaciones de mı́nimos cuadrados β̂0 , β̂1 y β̂2 y el
hiperplano (en este caso un plano) de regresión :
Para medir el grado de ajuste de los datos a un modelo lineal, hallemos el coeficiente de de-
terminación y el error estándar de estimación. De los datos tenemos que la suma de cuadrados
Pn
totales SCT = 9SY2 = 2
i=1 Yi − 10Ȳ
2 = 302.8644 y la suma cuadrados de la regresión es
P P
SCR = βˆ1 ( ni=1 xi Yi − 10x̄Ȳ ) + βˆ2 ( ni=1 zi Yi − 10z̄ Ȳ ) = 281.92081. Por tanto R2 = SCR
SCT = 0.93074
q
y el ajuste es muy bueno. Además S = SCTn−3 −SCR
= 1.73119, lo cuál nos indica también al parecer
un muy buen ajuste lineal.
b) Para la significación del modelo, debemos contrastar a nivel α = 0.05
H0 : β1 = β2 = 0 vs H1 : ∃j ∈ {1, 2} / βj 6= 0.
Como F0 = 47.03341 > F0.95 (2, 7) = 4.74, se rechaza H0 y el modelo lineal dado es aceptable.
Para ver si el modelo de regresión múltiple es mejor que el lineal indicado, debemos probar que
la variable predictora x contribuya significativamente con información adicional para la estimación
del valor medio de Y . Es decir contrastar a nivel α = 0.05:
H0 : β1 = 0 vs H1 : β1 6= 0.
Se rechazará H0 si
β̂1
|T01 = √ | > t0.975 (7) = 2.365,
S c22
donde c22 es la entrada 2,2, de la matriz (Xt X)−1 . Realizando los cálculos respectivos, obtenemos
que T01 = −2.854 y consecuentemente se rechaza H0 . Esto es, la concentración si contribuye con
información significativa en la predicción de Y y por tanto es mejor un modelo de regresión lineal
multiple que el simple propuesto.
c) Como el modelo múltiple es mejor, se nos pide
Asimismo realizemos un análisis de regresión de Xj con las variables de control, para calcular luego
los residuales:
k
X
(2) 00 00
ei = Xij − X̂ij = Xij − β̂0 − β̂h Xih , ∀i = 1, 2, . . . , n.
h=1,h6=j
ESTADISTICA APLICADA Luis Valdivieso 195
Al estar estos residuales depurados del efecto de las otras variables de control, el coeficiente de corre-
lación lineal de Pearson entre e(1) y e(2) representa la relación entre Y y Xj que no puede explicarse
por el efecto de las variables restantes. Esta correlación, es justamente la llamada correlación parcial
entre Y y Xj y la denotaremos por rY Xj |X1 ...Xj−1 Xj+1 ...Xk . Se puede probar que
s
2
T0j
|rY Xj |X1 ...Xj−1 Xj+1 ...Xk | = 2 +n−k−1 ,
T0j
Nota: En este capı́tulo y en el anterior, pues algunos enfocan el análisis de varianza como un caso
particular del análisis de regresión (véase el ejercicio 1 al respecto), debe tomarse en cuenta que
el análisis realizado se ha hecho con la asunción de que todos los supuestos teóricos en el modelo
son válidos. Este punto es muy delicado, pues los datos podrı́an indicar algunas inconsistencias
al respecto como por ejemplo, presentar problemas de multicolinealidad (variables independientes
que esten muy correlacionadas entre si), heterocedasticidad (varianza del error σ 2 no constante),
autocorrelación (errores que no son independientes) y no normalidad, entre otros. Para la detección
y corrección de tales problemas es vital realizar un estudio de residuales. Las técnicas descriptivas
estándares sobre residuales se encuentran implementadas en muchos de los paquetes estadı́sticos. El
lector interesado puede consultar [9], [12] ó algún texto econométrico.
7.7. Ejercicios
1.- Se condujo un experimento en un supermercado para estudiar la relación entre la cantidad de
espacio destinado a una determinada marca de café y el volumen de ventas semanales de este café.
La cantidad de espacio destinado en la estanterı́a se varió en exhibidores (“displays”) de 3, 6 y
9 anaqueles aleatoriamente durante 12 semanas, mientras que para las otras marcas de café, se
mantuvieron constantes en exhibidores de 3 anaqueles. Los datos del experimento se encuentran en
la tabla siguiente:
Ventas semanales 526 421 581 630 412 560 434 443 590 570 346 672
Número de anaqueles 6 3 6 9 3 9 6 3 9 6 3 9
a cargo del estudio ha sugerido que los dos factores más importantes que intervienen en el tiempo de
reparto son el número de cajas de cerveza que se entregan y la máxima distancia que debe recorrer
el repartidor. El ingeniero reunió la siguiente información, para 15 repartos elegidos al azar:
x1 10 15 10 20 25 18 12 14 16 22 24 17 13 30 24
x2 30 25 40 18 22 31 26 34 29 37 20 25 27 23 33
y 24 27 29 31 25 33 26 28 31 39 33 30 25 42 40
donde x1 = número de cajas de cerveza x2 = distancia recorrida (en kmts) y = tiempo en minutos.
a) Realize la prueba de adecuación de estos datos a un modelo lineal, y de un indice del grado de
ajuste de los datos al modelo. Use α = 0.05.
b) Ajuste el plano de regresión y estime el tiempo medio de servicio que se requerirá para satsfacer
un pedido 18 cajas de cerveza que se ubica a 35 kmts de distancia.
c) ¿ Contribuyen significativamente cada una de las variables independientes en la estimación del
tiempo medio de servicio ?. Use α = 0.05. Cuál de las dos variables da una mayor contribución ?
Nota: Para su ayuda, si X es la matriz de variables independientes, entonces la matriz (Xt X)−1 viene
dada por:
3.4779 −0.06857 −0.07775
−0.06857 0.002374 0.0009228
−0.07775 0.0009228 0.0021835
3.- Los siguientes datos provienen del número de torsiones necesarias para romper una barra , Y ,
hecha con cierto tipo de aleación y los porcentajes X y Z de los metales A y B que respectivamente,
la integran:
Y 38 40 85 40 60 68 31 35 42 18 34 29
X 1 2 3 1 2 3 1 2 3 1 2 3
Z 5 5 5 10 10 10 15 15 15 20 20 20
a) Ajuste el plano de regresión y haga la prueba de significación del modelo. Halle también R2 para
medir el ajuste. Comente.
b) ¿ Contribuye el porcentaje de metal A empleado en la aleación, con información significativa para
estimar el número medio de torsiones necesarias para romper una barra ? Use α = 0.05. ¿ Es esta
contribución mayor que la del porcentaje del metal B ? Asuma un modelo de efectos fijos.
c) Estime el número medio de torsiones necesarias para romper una barra si se utiliza un 2.5 % de
metal A y un 12 % de metal B en la aleación.
Nota: Si X es la matriz de variables independientes en este problema, la matriz (Xt X)−1 es:
1 −0.25 −0.0333
(Xt X)−1 =
−0.25 0.125 0
−0.0333 0 0.00267
ESTADISTICA APLICADA Luis Valdivieso 197
4.- Un criador de patos esta interesado en determinar la relación entre la utilidad unitaria de sus
ventas en función del tiempo de crianza. Para ello, el ha seleccionado 10 tiempos de crianza y
observado las siguientes utilidades en las ventas de cada uno de 10 patos elegidos al azar bajo los
tiempos considerados de crianza.
5.- El departamento de transporte de una juridicción desea elaborar un modelo que relacione el
precio de licitación (Y ) para un proyecto de construcción de carretera con la longitud de la carretera
(x1 ) por construir o reparar y el número de licitadores (x2 ). Puesto que el departamento cree que
el precio licitado aumenta linealmente con la longitud de la carretera y el número de licitadores, ha
propuesto para el efecto un modelo lineal. Para el análisis se usaron datos recabados sobre el precio
de la licitación, longitud de la carretera y número de licitadores para 32 proyectos seleccionados al
azar, obteniéndose la tabla ANOVA:
el plano de regresión ajustado ŷx1 ,x2 = −1336.7220 + 12.7362x1 + 85.8151x2 y los estadı́sticos para
las pruebas individuales sobre las dos variables independientes T01 = 14.114 y T02 = 9.857.
a) ¿ Es útil el modelo para estimar el precio medio licitado ? Use α = 0.01.
b) De una medida del ajuste de los datos a este modelo.
c) Suponga que en dos licitaciones se presentan el mismo número de licitadores; pero en la segunda
la longitud de la carretera en licitación supera en 5 unidades al de la primera licitación. ¿ Cómo y
en cuánto estimarı́a varie el precio entre una y otra licitación ?
d) Pruebe la hipótesis de que el precio medio licitado aumenta al aumentar el número de licitadores
para proyectos de contrucción de carreteras de la misma longitud. Use α = 0.01.
6.- Al parecer las ventas de un producto en una compañı́a dependen del tamaño de la compañı́a y
del capital invertido en publicidad. Para investigar sobre esta cuestión se tomaron 25 compañı́as y se
midió para cada una de ellas las variables antes indicadas. Al ajustar un modelo de regresión lineal
simple usando sólo el tamaño de la compañı́a se obtuvo como suma de cuadrados para la regresión
0
el valor 15 351, 880. Posteriormente se ajustó un modelo de regresión lineal múltiple y en donde se
consideró además el capital invertido en publicidad. En este caso se obtuvo las siguientes sumas de
198
0 0
cuadrados: Para la regresión = 24 996, 987 y para los errores = 15 771, 404. Al nivel de significación
de α = 0.05:
a) ¿ Se podrı́a decir que el modelo de regresión lineal simple es útil para estimar las ventas medias ?
b) ¿ Se podrı́a decir que el modelo de regresión lineal múltiple contribuye con mayor eficacia que el
modelo de regresión lineal simple para la estimación de las ventas medias ?
7.- Los siguientes datos son acerca de la cantidad de calor desprendido en el fraguado de un cubo de
cemento (en calorı́as por gramo de cemento) y el porcentaje de cuatro sustancias en el cemento, en
relación con el peso total de la mezcla a partir de la cual se preparó el cemento. Los cuatro regresores
son:
X1 : cantidad de aluminato tricálcico
X2 : cantidad de silicato tricálcico
X3 : cantidad de aluminoferrito tetracálcico
X4 : cantidad de silicato dicálcico
La respuesta Y es la cantidad de calor desprendido.
Y X1 X2 X3 X4
78 7 29 6 60
74 1 29 15 52
104 11 56 8 20
95 7 52 6 33
102 3 71 17 6
72 1 31 22 44
93 2 54 18 22
115 21 47 4 26
83 1 40 23 34
113 11 66 9 12
Se realizó la prueba de adecuación de estos datos a un modelo lineal y se obtuvo la siguiente tabla
de análisis de varianza:
1.208528514 −0.003334522 −0.022881139
(Xt X)−1 =
−0.003334522 0.002867689 −0.00032222
−0.022881139 −0.00032222 0.000525801
8.- Se realizaron pruebas de laboratorio para determinar el contenido de asfalto sobre la estabilidad
y la permeabilidad de concreto asfaltado de clasificación abierta. Se prepararon 4 especı́menes de
concreto con cada uno de los siguientes contenidos de asfalto (porcentaje del peso total de la mezcla):
3, 4, 5, 6, 7 y 8. Se determinó la permeabilidad al agua de cada espécimen de concreto haciendo fluir
sobre el espécimen agua al que se le extrajo el aire y midiendo la pérdida de agua. Las mediciones
de permeabilidad para los 24 espécimenes fueron:
a) Haga un gráfico que le permita visualizar la relación entre las dos variables en estudio. ¿ Se podrı́a
pensar en una relación lineal ?
200
b) Se tienen dudas entre plantear un modelo de regresión lineal simple o un modelo cuadrático:
Y = β0 + β1 x + β2 x2 + .
A un nivel de significación de α = 0.05, ¿ hay pruebas suficientes que indiquen que se debe incluir al
término cuadrático ? Para su ayuda se dispone de la siguiente tabla ANOVA del modelo cuadrático:
9.- El gerente de ventas de una compañı́a que vende paquetes de soya a través de una cadena
nacional de supermercados, está interesado en estudiar la relación que tienen el precio al mayoreo
de su producto y la publicidad con las ventas del producto. Para lo anterior, él registró las ventas
anuales Y (en miles de dólares) que su compañı́a obtuvo a diferentes precios al mayoreo (X1 ) (en
dólares) y proporciones X2 de gastos en publicidad en cada una de n = 25 regiones respecto al total
gastado en el año pasado. Un resumen de sus resultados al realizar un análisis de regresión múltiple
es el siguiente:
Los elementos de entradas 2,2 y 3,3 de (Xt X)−1 ; siendo X la matriz de variables independientes, fueron
c22 = 33.2263 y c33 = 0.01462; y finalmente el plano de mı́nimos cuadrados ajustado resultó ser:
10.- En un estudio para relacionar el salario actual de los empleados Y en relación a sus años de
trabajo X y al salario con el cual comenzaron Z. Se registraron estas 3 variables para todos los 474
empleados de un Banco. Los datos obtenidos fueron:
El gerente de la compañı́a le da a ud. esta información resumida y le pide que le realice una análisis
de regresión lineal. El desea estimar el salario medio actual que un empleado con 25 y medio años
de trabajo y un sueldo inicial de 7,500 u.m deberı́a tener.
Sugerencia: Para hallar los estimadores de mı́nimos cuadrados, resuelva las ecuaciones normales
que aparecen en las notas con k = 2 y expreselas en términos de las correlaciones y desviaciones
estándares.
11.- Muchas universidades elaboran modelos de regresión para predecir el promedio de calificaciones
(Y ) de los alumnos de nuevo ingreso. Este promedio puede entonces ayudar a tomar decisiones en
la admisión. Aunque la mayor parte de los modelos emplean muchas variables independientes para
predecir el promedio de calificaciones, para esta aplicación se escogerán las variables x1 = calificación
de expresión oral (percentil) del examen de admisión y x2 = calificación de Matemáticas (percentil)
del examen de admisión.
Se obtuvieron los datos para una muestra aleatoria de 40 ex-candidatos a nuevo ingreso de una
Universidad y al ajustar un modelo de regresión lineal múltiple con ambas variables, se obtuvo la
siguiente tabla ANOVA:
a) Dé una medida del grado de ajuste de los datos al modelo y diga a un nivel de significación de
α = 0.05, si es que este modelo podrı́a ser de utilidad.
b) Un profesor plantea que serı́a mejor emplear un modelo de regresión general de segundo orden
(no lineal):
Y = β0 + β1 x1 + β2 x2 + β3 x21 + β4 x22 + β5 x1 x2 + .
¿ Puede decirse, a un nivel de significacióón de α = 0.05, si es que algunos de los nuevos términos
en el modelo de segundo orden, contribuyen con información significativa en la estimación del valor
medio de Y ? Compare luego de manera descriptiva, cual de los dos modelos propuestos da un mejor
ajuste a los datos e indique si le darı́a o no la razón al profesor.
c) Al realizarse el contraste de significación con α = 0.05 para β5 se obtuvo un estadı́stico de prueba
de T05 = 1.675, puede entonces usted asegurar con una probabilidad de equivocarse del 5 % que la
variable de interacción x1 x2 si contribuye con información significativa en la estimación de Y .
12.- Con la finalidad de estudiar la influencia que pudiera existir entre el porcentaje del pulpa de
madera en la resistencia de bolsas de papel fabricadas, se tomaron 19 observaciones del porcentaje
de pulpa y las correspondientes resistencias medidas en psi.
En un comienzo se ajusto un modelo de regresión lineal entre la variable Y = resistencia y x =
concentración, encontrándose en el análisis una suma de cuadrados de la regresión de 1,044.584.
Posteriormente se ajustó un modelo de segundo orden Y = β0 + β1 x + β2 x2 + encontrándose la
siguiente tabla ANOVA:
a) A un nivel de significación de α = 0.05, ¿ se podrı́a decir que el primer modelo de regresión lineal
simple es de utilidad para estimar la resistencia media ?
b) A un nivel de significación de α = 0.05, ¿ podrı́a asegurarse que el modelo de segundo orden
contribuye con una mayor información significativa (que al modelo de regresión lineal simple) para
la estimación del valor medio de la resistencia ?
ESTADISTICA APLICADA Luis Valdivieso 203
13.- Se realizó un experimento con objeto de investigar el efecto de la presión de extrusión P (en
psi) y la temperatura durante la extrusión T (en grados centigrados) sobre la resistencia Y de un
nuevo tipo de plástico. Se prepararon dos especı́menes de plástico para cada una de 5 combinaciones
de presión y temperatura. A continuación, los especı́menes se ensayaron en orden aleatorio y se
registró la resistencia a la ruptura de cada especı́men. Las variables independientes se codificaron
como sigue a fin de simplificar los cálculos:
P − 200 T − 400
x1 = y x2 = .
10 25
Los n = 10 puntos de datos se listan a continuación:
x1 -2 -2 -1 -1 0 0 1 1 2 2
x2 2 2 -1 -1 -2 -2 -1 -1 2 2
Y 5.2 5.0 0.3 -0.1 -1.2 -1.1 2.2 2.0 6.2 6.1
a) Realice la prueba de significación del modelo yx1 ,x2 = β0 + β1 x1 + β2 x2 y estime, de tener sentido,
cómo y en cuánto se modificarı́a la resistencia media del plástico si la temperatura durante la extrusión
se aumentara en 50 grados y la presión se mantuviera constante. Use α = 0.05.
b) Contraste a un nivel de significación de α = 0.05, la hipótesis nula H0 : β1 = 0 contra la hipótesis
alternativa H1 : β1 6= 0. ¿Qué implicación práctica tiene el resultado de este contraste ?
c) Mida la contribución de la presión de extrusión y la temperatura durante extrusión en la resistencia
del plástico e indique cuál de estas variables da una mayor contribución.
d) A un consumidor, que ha adquirido un especı́men del plástico producido a una presión de extrusión
de 200 psi y a una temperatura durante la extrusión de 450 grados centigrados, se le ha garantizado la
devolución de su dinero si es que la resistencia de su especı́men tiene 4.8 ó menos unidades . ¿ Podrı́a
asegurarse, con un nivel de confianza del 95 %, que no le será devuelto el dinero a este consumidor ?
204
REFERENCIAS
205
206
Apéndice A
Tablas estadı́sticas
207
208
Tabla de cuantiles q de una v.a con distribución t de Student con gl grados de libertad, FT (q) = p
p
gl 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 0.975 0.99 0.995
1 0.3249 0.5095 0.7265 1.0000 1.3764 1.9626 3.0777 6.3138 12.7062 31.8205 63.6567
2 0.2887 0.4447 0.6172 0.8165 1.0607 1.3862 1.8856 2.9200 4.3027 6.9646 9.9248
3 0.2767 0.4242 0.5844 0.7649 0.9785 1.2498 1.6377 2.3534 3.1824 4.5407 5.8409
4 0.2707 0.4142 0.5686 0.7407 0.9410 1.1896 1.5332 2.1318 2.7764 3.7469 4.6041
5 0.2672 0.4082 0.5594 0.7267 0.9195 1.1558 1.4759 2.0150 2.5706 3.3649 4.0321
6 0.2648 0.4043 0.5534 0.7176 0.9057 1.1342 1.4398 1.9432 2.4469 3.1427 3.7074
7 0.2632 0.4015 0.5491 0.7111 0.8960 1.1192 1.4149 1.8946 2.3646 2.9980 3.4995
8 0.2619 0.3995 0.5459 0.7064 0.8889 1.1081 1.3968 1.8595 2.3060 2.8965 3.3554
9 0.2610 0.3979 0.5435 0.7027 0.8834 1.0997 1.3830 1.8331 2.2622 2.8214 3.2498
10 0.2602 0.3966 0.5415 0.6998 0.8791 1.0931 1.3722 1.8125 2.2281 2.7638 3.1693
11 0.2596 0.3956 0.5399 0.6974 0.8755 1.0877 1.3634 1.7959 2.2010 2.7181 3.1058
12 0.2590 0.3947 0.5386 0.6955 0.8726 1.0832 1.3562 1.7823 2.1788 2.6810 3.0545
13 0.2586 0.3940 0.5375 0.6938 0.8702 1.0795 1.3502 1.7709 2.1604 2.6503 3.0123
14 0.2582 0.3933 0.5366 0.6924 0.8681 1.0763 1.3450 1.7613 2.1448 2.6245 2.9768
15 0.2579 0.3928 0.5357 0.6912 0.8662 1.0735 1.3406 1.7531 2.1314 2.6025 2.9467
16 0.2576 0.3923 0.5350 0.6901 0.8647 1.0711 1.3368 1.7459 2.1199 2.5835 2.9208
17 0.2573 0.3919 0.5344 0.6892 0.8633 1.0690 1.3334 1.7396 2.1098 2.5669 2.8982
18 0.2571 0.3915 0.5338 0.6884 0.8620 1.0672 1.3304 1.7341 2.1009 2.5524 2.8784
19 0.2569 0.3912 0.5333 0.6876 0.8610 1.0655 1.3277 1.7291 2.0930 2.5395 2.8609
20 0.2567 0.3909 0.5329 0.6870 0.8600 1.0640 1.3253 1.7247 2.0860 2.5280 2.8453
21 0.2566 0.3906 0.5325 0.6864 0.8591 1.0627 1.3232 1.7207 2.0796 2.5176 2.8314
22 0.2564 0.3904 0.5321 0.6858 0.8583 1.0614 1.3212 1.7171 2.0739 2.5083 2.8188
23 0.2563 0.3902 0.5317 0.6853 0.8575 1.0603 1.3195 1.7139 2.0687 2.4999 2.8073
24 0.2562 0.3900 0.5314 0.6848 0.8569 1.0593 1.3178 1.7109 2.0639 2.4922 2.7969
25 0.2561 0.3898 0.5312 0.6844 0.8562 1.0584 1.3163 1.7081 2.0595 2.4851 2.7874
26 0.2560 0.3896 0.5309 0.6840 0.8557 1.0575 1.3150 1.7056 2.0555 2.4786 2.7787
27 0.2559 0.3894 0.5306 0.6837 0.8551 1.0567 1.3137 1.7033 2.0518 2.4727 2.7707
28 0.2558 0.3893 0.5304 0.6834 0.8546 1.0560 1.3125 1.7011 2.0484 2.4671 2.7633
29 0.2557 0.3892 0.5302 0.6830 0.8542 1.0553 1.3114 1.6991 2.0452 2.4620 2.7564
30 0.2556 0.3890 0.5300 0.6828 0.8538 1.0547 1.3104 1.6973 2.0423 2.4573 2.7500
31 0.2555 0.3889 0.5298 0.6825 0.8534 1.0541 1.3095 1.6955 2.0395 2.4528 2.7440
32 0.2555 0.3888 0.5297 0.6822 0.8530 1.0535 1.3086 1.6939 2.0369 2.4487 2.7385
33 0.2554 0.3887 0.5295 0.6820 0.8526 1.0530 1.3077 1.6924 2.0345 2.4448 2.7333
34 0.2553 0.3886 0.5294 0.6818 0.8523 1.0525 1.3070 1.6909 2.0322 2.4411 2.7284
35 0.2553 0.3885 0.5292 0.6816 0.8520 1.0520 1.3062 1.6896 2.0301 2.4377 2.7238
40 0.2550 0.3881 0.5286 0.6807 0.8507 1.0500 1.3031 1.6839 2.0211 2.4233 2.7045
50 0.2547 0.3875 0.5278 0.6794 0.8489 1.0473 1.2987 1.6759 2.0086 2.4033 2.6778
70 0.2543 0.3869 0.5268 0.6780 0.8468 1.0442 1.2938 1.6669 1.9944 2.3808 2.6479
90 0.2541 0.3866 0.5263 0.6772 0.8456 1.0424 1.2910 1.6620 1.9867 2.3685 2.6316
100 0.2540 0.3864 0.5261 0.6770 0.8452 1.0418 1.2901 1.6602 1.9840 2.3642 2.6259
210
Tabla de cuantiles q de una v.a con distribución chi cuadrado de gl grados de libertad, FW (q) = p
p
gl 0.005 0.01 0.025 0.05 0.1 0.5 0.9 0.95 0.975 0.99 0.995
1 0.000 0.000 0.001 0.004 0.016 0.455 2.706 3.841 5.024 6.635 7.879
2 0.010 0.020 0.051 0.103 0.211 1.386 4.605 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 0.584 2.366 6.251 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 1.064 3.357 7.779 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 1.610 4.351 9.236 11.070 12.833 15.086 16.750
6 0.676 0.872 1.237 1.635 2.204 5.348 10.645 12.592 14.449 16.812 18.548
7 0.989 1.239 1.690 2.167 2.833 6.346 12.017 14.067 16.013 18.475 20.278
8 1.344 1.646 2.180 2.733 3.490 7.344 13.362 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 4.168 8.343 14.684 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 4.865 9.342 15.987 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 5.578 10.341 17.275 19.675 21.920 24.725 26.757
12 3.074 3.571 4.404 5.226 6.304 11.340 18.549 21.026 23.337 26.217 28.300
13 3.565 4.107 5.009 5.892 7.042 12.340 19.812 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 7.790 13.339 21.064 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 8.547 14.339 22.307 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 9.312 15.338 23.542 26.296 28.845 32.000 34.267
17 5.697 6.408 7.564 8.672 10.085 16.338 24.769 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 10.865 17.338 25.989 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 11.651 18.338 27.204 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 12.443 19.337 28.412 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 13.240 20.337 29.615 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 14.041 21.337 30.813 33.924 36.781 40.289 42.796
23 9.260 10.196 11.689 13.091 14.848 22.337 32.007 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.848 15.659 23.337 33.196 36.415 39.364 42.980 45.559
25 10.520 11.524 13.120 14.611 16.473 24.337 34.382 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 17.292 25.336 35.563 38.885 41.923 45.642 48.290
27 11.808 12.879 14.573 16.151 18.114 26.336 36.741 40.113 43.195 46.963 49.645
28 12.461 13.565 15.308 16.928 18.939 27.336 37.916 41.337 44.461 48.278 50.993
29 13.121 14.256 16.047 17.708 19.768 28.336 39.087 42.557 45.722 49.588 52.336
30 13.787 14.953 16.791 18.493 20.599 29.336 40.256 43.773 46.979 50.892 53.672
31 14.458 15.655 17.539 19.281 21.434 30.336 41.422 44.985 48.232 52.191 55.003
32 15.134 16.362 18.291 20.072 22.271 31.336 42.585 46.194 49.480 53.486 56.328
33 15.815 17.074 19.047 20.867 23.110 32.336 43.745 47.400 50.725 54.776 57.648
34 16.501 17.789 19.806 21.664 23.952 33.336 44.903 48.602 51.966 56.061 58.964
35 17.192 18.509 20.569 22.465 24.797 34.336 46.059 49.802 53.203 57.342 60.275
40 20.707 22.164 24.433 26.509 29.051 39.335 51.805 55.758 59.342 63.691 66.766
50 27.991 29.707 32.357 34.764 37.689 49.335 63.167 67.505 71.420 76.154 79.490
70 43.275 45.442 48.758 51.739 55.329 69.334 85.527 90.531 95.023 100.425 104.215
90 59.196 61.754 65.647 69.126 73.291 89.334 107.565 113.145 118.136 124.116 128.299
100 67.328 70.065 74.222 77.929 82.358 99.334 118.498 124.342 129.561 135.807 140.169
ESTADISTICA APLICADA Luis Valdivieso 211